arXiv雑要約
AI - 2026/03/05 公開
長期テスト時適応におけるリセットのタイミングと場所が重要である [cs.LG, cs.AI, cs.CV]目的:長期テスト時適応におけるモデル崩壊の抑制と知識保持
- 継続的な学習環境下での機械学習モデルの適応能力向上は,現実世界での応用において不可欠である。
- 長期テスト時適応では,モデルが徐々に誤りを蓄積し,最終的には限られたクラスしか予測できなくなる「モデル崩壊」が課題となる。
- 本研究は,モデル崩壊のリスクに応じて動的にリセットを行うことで,適応性能を改善し,過去の知識を維持することを目指す。
- 提案手法である適応的選択的リセット(ASR)は,長期テスト時適応ベンチマークにおいて有効であることが示された。
- ASRは,リセットのタイミングと場所を動的に決定することで,既存のリセット戦略よりも優れた適応性能を発揮する。
- 重要度を考慮した正則化により,リセットによって失われた重要な知識を効果的に回復し,将来のタスクに役立てることが可能である。
疎な実世界の結果に基づく,評価基準付きの批評家 [cs.RO, cs.AI, cs.LG]目的:コーディングエージェントに対する評価基準に基づく批評モデルの学習
- 自動コーディング技術は,ソフトウェア開発の効率化に不可欠であり,その性能向上は重要である。
- 現実世界のコーディング環境では,報酬が遅延し,ノイズが多く,疎なため,エージェントの学習が困難である。
- 本研究は,人間とのインタラクションデータから学習し,疎な報酬環境下でのエージェントの性能向上を目指す。
- 評価基準(Critic Rubrics)を用いた半教師あり学習により,人間のフィードバックと行動特徴を同時に予測することに成功した。
- SWE-benchにおけるN件中最高の再選別性能が向上し(Best@8 +15.9),試行回数を大幅に削減する早期停止が可能となった(+17.7,83%削減)。
- 批評家が選択した軌跡を用いて,学習データのキュレーションを支援し,エージェントの学習効率を改善した。
IoTアプリケーション向け自由形状平面アンテナトポロジーの教師なし代理モデルを用いた合成 [math.NA, cs.LG, cs.NA]目的:IoTアプリケーション向け自由形状平面アンテナトポロジーの合成手法
- IoTデバイスの普及に伴い,小型で高性能なアンテナの需要が高まっている。
- 従来のアンテナ設計は手作業に依存し,設計者の経験やバイアスに左右されやすい。
- 自動設計における計算コストを削減し,効率的なアンテナ設計を可能にすること。
- 提案手法では,代理モデルを用いて適切なアンテナトポロジーを識別することで,設計空間を効率的に探索する。
- 5GHz帯および6GHz帯のアンテナ設計実験において,帯域幅を向上させたアンテナトポロジーが生成された。
- 本手法は,IoTデバイス向けアンテナ設計の自動化に貢献し,開発期間の短縮が期待できる。
IoTデバイスを用いたオフラインCBDC決済システムにおけるゼロ知識証明認証 [cs.CR, cs.AI, cs.CE]目的:オフラインCBDC決済システムのセキュリティ確保
- 中央銀行デジタル通貨は金融包摂,金融安定,決済効率化に貢献する重要なツールである。
- IoTデバイスはリソース制約があるため,二重支払い防止やプライバシー保護が課題となる。
- オフライン環境での安全かつ効率的なCBDC決済を実現し,金融包摂を促進することを目指す。
- 本研究では,セキュアエレメントとゼロ知識証明を用いることで,オフラインCBDC決済モデルを提案する。
- 提案モデルは,IoTデバイスの制約に対応するため,軽量な暗号アルゴリズムと断続的な同期を採用している。
- オンライン決済とオフライン決済を組み合わせたハイブリッドアーキテクチャにより,セキュリティと利便性を両立する。
構造的事前知識を用いた合成事前学習による関係性に基づくIn-Context Learning [cs.LG, cs.AI, cs.DB]目的:関係性に基づくIn-Context Learningの実現
- 現代ビジネスの基盤であるリレーショナルデータベースの重要性が増している
- 高品質なリレーショナルデータベースはプライベートで入手困難であり,大規模事前学習の妨げとなっている
- 合成データによる事前学習で,データ不足の問題を解決することを目指す
- RDB-PFNは,構造的因果モデルから多様なリレーショナルデータベースを合成し,関係性に基づく基礎モデルを訓練する。
- 200万件以上の合成データで事前学習することで,RDB-PFNは新しいデータベースへの即時適応を可能にするIn-Context Learningを実現した。
- 実世界の予測タスク19個において,グラフベースや単一テーブルの基礎モデルを上回るFew-Shot性能を示した。
Vision Mambaのための自己回帰型事前学習における区切り子の利用 [cs.CV, cs.AI]目的:Vision Mambaにおける自己回帰型事前学習の性能向上
- 画像認識分野において,長距離依存性を捉えることが重要であり,高性能モデル開発の鍵となる。
- 既存の自己回帰型事前学習法は,扱うシーケンス長に制限があり,Mambaの潜在能力を十分に活かせない。
- 本研究では,Mambaの入力シーケンス長を拡張し,長距離依存性をより効果的に学習することを目指す。
- 提案手法STARにより,Vision Mambaの入力シーケンス長を4倍に拡張することに成功した。
- STAR-BモデルはImageNet-1kで83.5%の高い精度を達成し,Vision Mambaにおける競争力を示した。
- 本手法は,長距離依存性の活用を通じて,画像認識モデルの性能向上に貢献する可能性を示唆する。
ピクセルベース平面アンテナ構造の自動設計のための二段階フレームワーク [math.NA, cs.LG, cs.NA]目的:ピクセルベース平面アンテナ構造の自動設計手法
- 現代のアンテナ開発は高度な専門知識を要し,高性能化への要求は高まる一方である。
- アンテナの形状選定が経験と設計者の勘に頼りがちであり,最適化が困難である。
- アンテナ形状の最適化を通じて,設計者の経験に依存しない自動設計を実現する。
- 提案手法では,ピクセル間の接続最適化と代理モデルを用いた局所探索を組み合わせる二段階フレームワークを採用した。
- ブロードバンドおよびデュアルバンドモノポールアンテナの設計事例を通して,本手法の有効性を検証した。
- 設計要件を満たすアンテナ形状を自動的に生成できることが示された。
事前学習済み視覚-言語-行動モデルは,継続学習における忘却に対して驚くほど耐性がある [cs.LG, cs.AI, cs.RO]目的:継続学習における事前学習済み視覚-言語-行動モデルの忘却耐性
- ロボットの政策学習において,時間の経過とともに新しいスキルを獲得し続けることは重要である。
- 従来の研究では,比較的小規模な行動クローンモデルでの継続学習が主であり,大規模モデルでの検証が不足していた。
- 事前学習済みモデルの忘却耐性を検証し,効果的な継続学習手法を明らかにすること。
- 事前学習済みのVLAモデルは,ゼロから学習した小規模なモデルと比較して,忘却に対して著しく耐性があることが示された。
- 単純なExperience Replay(ER)がVLAモデルで効果的に機能し,少ないリプレイデータサイズでも忘却をほぼゼロにできる場合がある。
- 事前学習は,継続学習における性能を向上させ,モデルは小さなリプレイバッファサイズで忘却を抑制しつつ,前向き学習能力を維持する。
状態から公平性を:インタラクティブ推薦のための階層型強化学習における潜在的偏りの浄化 [cs.LG, cs.AI]目的:インタラクティブ推薦システムにおける公平性の改善
- 推薦システムはユーザー体験に大きく影響し,多様性と公平性が重要である。
- 既存手法はユーザー状態を真の偏りなしと仮定しており,バイアスによる問題がある。
- 潜在的偏りを浄化し,長期的な公平性と短期的なエンゲージメントを両立させる。
- 提案手法DSRM-HRLは,拡散モデルを用いてノイズの多い履歴から潜在的な偏りを効果的に除去する。
- 階層型強化学習により,長期的な公平性と短期的なエンゲージメントの相反する目的を分離して最適化する。
- シミュレーション実験により,DSRM-HRLが「富む者はますます富む」というフィードバックループを打破し,推薦の有用性と公平性の両方を向上させることが示された。
SWE-CI:継続的インテグレーションによるコードベース維持におけるエージェント能力の評価 [cs.SE, cs.AI, cs.CL]目的:コードベースの維持におけるエージェントの能力
- ソフトウェア開発は複雑化の一途をたどっており,長期的な品質維持が重要である。
- 従来の静的評価では,長期にわたる変更や反復を考慮したコードの保守性は評価が難しい。
- 継続的インテグレーションのループを活用し,長期的な保守性を評価するベンチマークが求められている。
- SWE-CIは,継続的インテグレーションのループに基づいた最初のリポジトリレベルのベンチマークである。
- 本ベンチマークは,短期的な機能修正から長期的なコードの保守性へと,評価のパラダイムを移行させることを目的とする。
- SWE-CIは,エージェントが長期的な進化を通してコード品質を維持できるかを評価するための洞察を提供する。
文脈環境が言語モデルに評価認識を誘発する [cs.AI, cs.CL, cs.LG, cs.MA]目的:言語モデルにおける評価認識の環境依存性
- 言語モデルの能力評価は,その信頼性と安全性を確保する上で不可欠である。
- 言語モデルは,能力制限措置を回避するため,意図的に性能を低下させる可能性がある。
- 本研究は,最適化されたプロンプトによる性能低下の程度を定量化する。
- 最適化された文脈プロンプトは,算術問題において最大94パーセントポイントの性能低下を引き起こした。
- 性能低下は,タスク構造に依存し,複雑な問題ほど脆弱性が高いことが示された。
- 性能低下の99.3%が,評価認識に基づく推論によって引き起こされることが因果的に確認された。
狭い視野からパノラマ的視界へ:Attention誘導によるコールドスタートがマルチモーダル推論を再構築する [cs.CV, cs.AI]目的:マルチモーダル大規模推論モデルのコールドスタートにおけるAttentionメカニズムの分析と改善
- マルチモーダルモデルは,画像とテキストの両方を理解する能力が求められ,その性能向上は重要な課題である。
- コールドスタート段階では,モデルが視覚情報に適切にAttentionを向けられていない場合があり,性能が制限される。
- 視覚情報のAttention誘導により,コールドスタート時の性能を改善し,マルチモーダル推論能力を向上させる。
- Visual Attention Score(VAS)と推論性能には強い相関関係(r=0.9616)が認められ,VASが高いモデルほど優れた性能を発揮する。
- マルチモーダルコールドスタートではVASが向上せず,テキストのみのコールドスタートに比べてAttentionの偏りが少ないという「Lazy Attention Localization」現象が確認された。
- Attention-Guided Visual Anchoring and Reflection (AVAR)フレームワークをQwen2.5-VL-7Bに適用した結果,7つのマルチモーダル推論ベンチマークで平均7.0%の性能向上を達成した。
大規模マージン超次元計算:学習理論的視点 [cs.MM, cs.LG]目的:大規模マージン超次元計算による分類器の性能向上
- 近年の機械学習は高性能だが,計算資源を多く必要とするため,低消費電力デバイスへの実装が課題である。
- 既存の超次元計算法は,性能面で他の機械学習法に劣る場合がある。
- 超次元計算とサポートベクターマシンとの関係性を明らかにし,より高性能な超次元計算法を開発する。
- 提案手法は,複数のベンチマークデータセットにおいて,既存の超次元計算法を大幅に上回る性能を示した。
- 超次元計算とサポートベクターマシン間の形式的な関係性を初めて確立した。
- 本研究は,ハードウェア指向の超次元計算法の開発を促し,リソース制約のある環境での効率的な学習ソリューションに貢献する可能性がある。
連合学習における構造を考慮した分散型バックドア攻撃 [cs.CL, cs.LG, cs.AI, cs.CR]目的:連合学習環境下でのバックドア攻撃に関する構造的影響の分析
- プライバシー保護とモデルの活用を両立する連合学習は,近年重要性が増している。
- バックドア攻撃に対する脆弱性が懸念されるが,モデル構造の影響が十分に考慮されていない。
- モデル構造とバックドア攻撃の相互作用を明らかにし,より効果的な防御策の設計を目指す。
- モデル構造が摂動の伝播と集約に大きな影響を与えることが実験的に示された。
- マルチパス特徴融合を持つネットワークは,低いポイズニング率でも摂動を増幅・維持しやすい。
- 構造的適合性係数(SCC)と攻撃成功率の間に強い相関があり,摂動の生存可能性を予測できる可能性が示唆された。
k-ホップ公平性:高次近傍におけるグラフリンク予測の格差への対処 [cs.LG]目的:グラフリンク予測における公平性の構造的評価と改善
- グラフ構造は社会推薦などに応用され,その予測精度は重要である。
- グラフは属性間の類似性(同質性)を示す傾向があり,既存の格差を助長する可能性がある。
- ノード間の距離を考慮した公平性の概念を導入し,格差を構造的に評価・軽減することを目指す。
- 既存モデルが高次近傍においても構造的バイアスを再現する傾向が確認された。
- グラフの再配線において,異なるホップ間での構造的バイアスが相互に影響し合うことが示された。
- 提案手法は既存の公平性LP手法と比較して,性能と公平性のトレードオフにおいて有利な結果を得た。
分布誘導による信頼度較正 [cs.LG]目的:大規模言語モデルにおける応答選択の信頼性向上
- 大規模言語モデルの性能向上は,様々な応用において重要であり,その信頼性確保が不可欠である。
- モデルの出力する信頼度と実際の正答率との間に乖離が生じることが多く,信頼度の活用が困難である。
- 信頼度分布の情報を活用し,より正確な応答選択を行うことで,モデルの信頼性を高める。
- 提案手法DistriVotingは,信頼度分布の情報を投票プロセスに組み込むことで,既存手法を大幅に上回る性能を達成した。
- ガウス混合モデルを用いて信頼度分布を分解し,正と負の成分に基づいてフィルタリングを行うことで,分布の重複を抑制した。
- SelfStepConfにより,ステップレベルの信頼度を動的に調整し,分布間の分離を強化することで,投票における信頼度を向上させた。
インメモリコンピューティングアクセラレータのハードウェア・ワークロード同時最適化 [cs.AR, cs.AI, cs.ET, cs.NE, cs.SY, eess.SY]目的:インメモリコンピューティングアクセラレータの汎用的なハードウェア設計
- ニューラルネットワークの性能向上が求められ,ハードウェアアクセラレータが不可欠である。
- 既存の最適化手法は特定のワークロードに特化し,汎用性に欠けるという課題がある。
- 複数のワークロードに対応可能な,汎用的なインメモリコンピューティングプラットフォームの設計。
- 提案手法は,ワークロード間のトレードオフを考慮することで,特定ワークロード向け設計との性能差を大幅に縮小する。
- RRAMおよびSRAMベースのIMCアーキテクチャで評価を行い,堅牢性と適応性の高さを示した。
- 小規模(4ワークロード)および大規模(9ワークロード)セットにおいて,EDAPを最大76.2%および95.5%削減した。
LLM駆動エージェントのダークパターン監査への適合性 [cs.CR, cs.AI, cs.CL, cs.CY, cs.HC]目的:ダークパターンの識別可能性
- ウェブサイトにおけるユーザー操作誘導の巧妙化が進み,悪質な誘導デザイン(ダークパターン)の検出が重要である。
- ダークパターンの検出は,専門知識を要し,手動での監査は時間とコストがかかるという課題がある。
- LLM駆動エージェントによるダークパターンの自動監査の実現可能性と限界を明らかにすること。
- LLM駆動エージェントは,456のデータブローカーサイトで,権利行使リクエストフローを安定的に特定・完了できた。
- エージェントによるダークパターンの分類は,一定の信頼性と再現性を示したが,誤判定や失敗も観測された。
- LLM駆動エージェントによるダークパターン監査は,スケーラブルな手法として一定の有効性を持つことが示された。
歴史的チェコ文書におけるゼロショットトピック局在化のためのベンチマーク [cs.CL, cs.AI]目的:歴史的チェコ文書におけるゼロショットトピック局在化のベンチマーク
- 歴史文書は,過去の社会や文化を理解するための貴重な情報源である。
- 歴史文書のトピック抽出は,手作業による労力と専門知識を必要とする。
- 大規模言語モデルを用いた,歴史文書におけるトピック局在化の自動化。
- 本研究では,チェコ語の歴史文書を対象とした,トピック局在化のためのデータセットを構築した。
- 大規模言語モデルは,トピック検出においては人間の水準に近づくものの,テキスト範囲の特定には課題が残る。
- 小規模なトークン埋め込みモデルでも,競争力のある性能を示すことが明らかになった。
楔形文字タブレットメタデータの分類のための新規ネットワーク [cs.CV, cs.AI]目的:楔形文字タブレットのメタデータ分類
- 古代文明研究において,大量の楔形文字タブレットの解読・分析は不可欠である。
- 専門家が限られる中で,タブレットのデータ量は増加の一途をたどっている。
- 限られたアノテーションデータと高解像度点群データから,効率的な分類手法を確立する。
- 本研究で開発した畳み込みに着想を得たネットワークは,点群データを段階的に縮小しつつ局所情報を統合する。
- 最終的に縮小された点群データに対し,特徴空間での近傍探索により大域的な情報を組み込む。
- 提案手法は最先端のPoint-BERTと比較して,一貫して優れた性能を示すことが確認された。
IROSA:自然言語を用いたインタラクティブなロボットスキル適応 [cs.RO, cs.AI, cs.CL, cs.HC, cs.LG]目的:自然言語によるロボットスキルの適応手法
- 産業用ロボットの柔軟性向上は,多様な作業への対応と生産性向上に不可欠である。
- 従来のロボットプログラミングは専門知識を要し,環境変化への対応が困難である。
- 自然言語による直感的な指示でロボットスキルを適応させ,柔軟性を高める。
- 本研究では,大規模言語モデルとツールベースのアーキテクチャを組み合わせることで,自然言語によるロボットスキルの適応を可能にした。
- 事前学習済みLLMを活用し,ファインチューニングや直接的なモデルとロボットのインタラクションを必要とせずにスキル適応を実現した。
- 7自由度トルク制御ロボットを用いた実験により,速度調整,軌道修正,障害物回避などのスキル適応が成功した。
PatchDecomp:解釈可能なパッチベースの時間系列予測 [cs.DC, cs.LG, cs.AI]目的:時間系列予測の精度と解釈性の両立
- 様々な分野で時間系列予測は重要であり,高精度なモデル開発が求められている。
- 複雑なモデルは予測根拠の理解を困難にすることが課題である。
- 予測根拠を明確にし,人間が理解しやすい時間系列予測手法を開発する。
- PatchDecompは,既存の予測手法と同等の予測性能を実現した。
- 時間系列をパッチに分割し,各パッチの貢献度を可視化することで,解釈性を向上させた。
- モデルの説明が予測値に定量的に影響を与え,パッチごとの貢献度を通して質的な解釈も可能になった。
誤分類から外れ値へ:分類における信頼性評価の統合 [cs.CV, cs.LG]目的:分類器の信頼性評価に関する統一的な評価フレームワーク
- 機械学習を現実世界で活用するには,信頼性のある分類器が不可欠である。誤った予測を回避するため。
- 従来のOOD検出と誤り予測は分離して扱われ,両者の密接な関係が見過ごされてきた。
- OOD検出と誤り予測を統合的に評価し,信頼性を向上させる方法を確立すること。
- 新しい指標DS-F1とDS-AURCを用いて,OOD検出と誤り予測を統合的に評価するフレームワークを提案。
- 実験結果から,二重スコアリング関数が従来の単一スコアリング手法よりも信頼性の高い分類器を生成することが示された。
- SUREという信頼性のある分類器を拡張したSURE+は,多様なシナリオで信頼性を大幅に向上させる。
脅威インテリジェンスからファイアウォールルールへ:ハイブリッドAIエージェントと専門家システムの体系における意味関係 [cs.AI, cs.CL, cs.CR]目的:サイバー脅威に対するセキュリティ制御設定のための情報抽出
- Webセキュリティにおいて,変化するサイバー脅威への迅速な対応が不可欠である。
- AIによる自動化が期待される一方,信頼性の高いセキュリティ対応が求められる。
- 脅威インテリジェンスからファイアウォールルールを自動生成する仕組みを構築すること。
- 上位-下位関係のテキスト関係を活用することで,脅威インテリジェンスレポートからの情報抽出性能が向上した。
- ニューロシンボリックアプローチにより,エージェントシステムが専門家システム用のCLIPSコードを自動生成することが可能となった。
- 提案手法は,ベースラインと比較して優れた性能を示し,脅威軽減の有効性が確認された。
ロールプレイング評価の再考:匿名ベンチマークとパーソナリティ効果の体系的研究 [cs.CL, cs.AI]目的:ロールプレイングエージェントの評価方法とパーソナリティの活用
- 近年,大規模言語モデルによるロールプレイングエージェントの開発が盛んに行われており,その性能評価が重要課題となっている。
- 従来の評価方法は有名キャラクターに依存しており,キャラクター名が持つ記憶情報に頼るバイアスが存在する。
- 匿名環境下でのロールプレイング性能低下を検証し,パーソナリティ情報を活用することで性能向上を目指す。
- 匿名化によりロールプレイング性能が大幅に低下することを確認し,名前の露出が暗黙的な情報を含んでいることを示唆した。
- 人間が注釈したパーソナリティ特性とモデルが自己生成した特性を比較した結果,両者ともロールプレイング性能の向上に寄与することが示された。
- 自己生成されたパーソナリティは,人間が注釈したパーソナリティと同等の性能を達成し,スケーラブルなフレームワークの有効性を示した。
BD-Merging:証拠に基づいたコントラスト学習によるバイアスを考慮した動的モデルマージ [cs.LG, cs.AI]目的:分布シフト下におけるモデルマージの信頼性向上
- マルチタスク学習は,複数のタスクを効率的に学習する上で重要である。
- 既存のモデルマージ手法は,テストデータが訓練データと分布が一致することを仮定している。
- 分布シフトの影響を受けにくい,信頼性の高いモデルマージ手法を開発する。
- BD-Mergingは,不確実性を明示的にモデル化することで,分布シフト下でも適応的な信頼性を実現する。
- エビデンスに基づいたコントラスト学習により,整合性の高いサンプルを揃え,矛盾するサンプルを分離する。
- 多様なタスクにおける実験により,最先端のモデルマージ手法と比較して,優れた有効性とロバスト性が示された。
ODEおよびPDEに対する適応的代理モデルによる階層的推論とクロージャ学習 [cs.LG, stat.ML]目的:ODEおよびPDEにおける逆問題を解決するための,階層的推論とクロージャ学習の原理的枠組み
- 工学分野において,モデルを現実世界に適合させることは極めて重要であり,逆問題はそのための鍵となる。
- システム全体像の把握が困難な場合,モデルのパラメータや未知のダイナミクスを正確に推定することが課題となる。
- 複数の関連システムから得られるデータを活用し,個々のパラメータと共有ダイナミクスを同時に学習することで問題を解決する。
- 本研究では,階層ベイズ推論を用いて複数のシステムと集団統計量の同時推論を実現した。
- 機械学習ベースのクロージャモデルを学習するために,ODE/PDEの定式化に埋め込まれたニューラルネットワークの最尤推定を行った。
- 反復的な前方評価の計算コストを削減するため,推論と並行して代理モデルを学習する二層最適化戦略を導入した。
確率的ネットワーク制御のためのオフライン強化学習アルゴリズムの選択 [cs.NI, cs.AI, cs.LG, cs.PF, cs.SY, eess.SY]目的:確率的ネットワーク制御におけるオフライン強化学習アルゴリズムの選択基準
- 次世代無線ネットワークでは,オンライン探索が困難であり,蓄積された運用データを活用することが重要である。
- 無線システム特有のフェージング,ノイズ,トラフィック移動などによる確率的変動下でのオフライン強化学習の挙動は未解明な部分が多い。
- 確率的変動下での各アルゴリズムのロバスト性を評価し,実用的な選択指針を示す。
- Conservative Q-Learningは,様々な確率的要因に対して一貫してロバストなポリシーを生成し,信頼性の高いデフォルト選択肢となる。
- Decision Transformersは,十分な高報酬軌跡が存在する場合,Bellmanベースのアプローチを上回る競争力を持つ。
- これらの知見は,O-RANや6G機能など,ロバスト性とデータ可用性が重要なAI駆動型ネットワーク制御パイプラインにおけるアルゴリズム選択の指針となる。
2D-3Dマルチモーダル工業異常検知のためのクロスモーダルマッピングとデュアルブランチ再構成 [cs.NI, cs.MM, eess.IV, cs.CV, cs.AI]目的:2Dと3Dのマルチモーダルデータを用いた工業異常の検知
- 産業分野における品質管理の自動化は,生産性向上とコスト削減に不可欠である。
- 既存手法は,ノイズや欠損データに弱く,ロバスト性に課題があった。
- 様々な条件下でも安定した異常検知を実現し,実用的な工業検査への応用を目指す。
- 提案手法CMDR-IADは,メモリバンクや教師あり学習を用いずに,高い異常検知性能を達成した。
- MVTec 3D-ADベンチマークにおいて,画像レベルおよびピクセルレベルで最先端の性能を示した(I-AUROC: 97.3%, P-AUROC: 99.6%)。
- 実際のポリウレタン切断データセットでも高い性能を示し,実用的な工業環境での有効性を実証した(I-AUROC: 92.6%, P-AUROC: 92.5%)。
予測リンクがネットワーク進化に与える影響:動的グラフにおける選択とアルゴリズム的フィードバックの解明 [cs.SI, cs.LG]目的:動的グラフにおける選択とアルゴリズム的フィードバックの影響の解明
- ネットワーク分析は,社会構造や情報伝播の理解に不可欠であり,その進化予測は重要性が増している。
- 既存研究では,ネットワークの構造変化とアルゴリズムによる影響の区別が難しく,正確な進化予測が困難である。
- ネットワーク進化における選択とアルゴリズム的フィードバックを分離し,その影響を定量的に評価することを試みる。
- 提案手法は,多変量Hawkes過程に基づき,ネットワークの動的変化を捉え,アルゴリズム的フィードバックの影響を分離する。
- 相互作用の強度から導出される瞬間的なバイアス指標は,既存の累積指標よりも動的なフィードバックを正確に反映する。
- 理論的考察と実験的検証により,提案手法が様々なリンク予測戦略においてアルゴリズム的フィードバック効果を信頼性高く反映することが示された。
Lang2Str:LLMと連続フローモデルによる2段階結晶構造生成 [cs.LG]目的:材料生成のための,大規模言語モデルとフローベースモデルを組み合わせた2段階生成フレームワーク
- 材料開発の加速が求められている中で,生成モデルの活用が期待されている。
- 従来の生成モデルは,単一の生成プロセスに依存するため,多様性と妥当性に課題がある。
- LLMとフローモデルを組み合わせることで,柔軟かつ高精度な材料生成を実現する。
- 提案手法は,第一原理計算による材料生成と結晶構造予測において,最先端モデルを上回る性能を達成した。
- 生成された構造は,その形状とエネルギーレベルにおいて,真の構造により近いことが示された。
- 本フレームワークの柔軟性とモジュール性により,材料設計の効率化とカスタマイズが期待される。
RVN-Bench:リアクティブ視覚ナビゲーションのベンチマーク [cs.RO, cs.AI, cs.CV]目的:リアクティブ視覚ナビゲーションのためのベンチマーク環境
- 屋内ロボットの安全なナビゲーションは重要であり,複雑な環境下での自律動作を可能にする。
- 既存のベンチマークは衝突を無視したり,屋外環境向けであったため,屋内環境での評価に適していなかった。
- 屋内環境における安全でロバストな視覚ナビゲーションを標準的に評価できる環境を提供すること。
- RVN-Benchは,衝突を考慮した屋内ロボットナビゲーション用のベンチマークであり,高精細なHM3Dシーンを使用している。
- 本ベンチマークは,オンラインおよびオフライン学習をサポートする環境,軌跡画像データセット生成ツールなどを提供する。
- 実験により,RVN-Benchで学習したポリシーは未知の環境にも効果的に一般化することが示された。
GIPO:ガウス重要性サンプリングによる方策最適化 [cs.LG, cs.AI]目的:強化学習を用いたポストトレーニングにおけるマルチモーダルエージェントの性能向上
- ロボット工学やAIにおいて,複雑なタスクを達成するためには,高度な方策学習が不可欠である。
- 強化学習はデータ効率が悪く,特にインタラクションデータが限られている場合に学習が困難になる。
- 限られたデータでも効率的に方策を学習し,安定した性能向上を実現することを目指す。
- GIPOは,重要性サンプリングを基盤とした新しい方策最適化手法であり,既存手法と比較して優れた性能を示す。
- GIPOは,データが古い場合でも高いサンプル効率と安定性を実現し,バイアスと分散のトレードオフを改善する。
- 理論的分析により,GIPOが更新幅に暗黙の制約を導入し,有限サンプル下でも安定性を示すことが確認された。
汎化マルチモーダルホモグラフィ推定に向けて [cs.CV, cs.AI]目的:汎用的なホモグラフィ推定手法の開発
- 画像間の幾何学的変換を推定する技術は,コンピュータビジョン分野において基礎的な課題である。
- 既存手法は特定の画像形式に依存し,未知の形式への汎化性能が低いという課題がある。
- 単一画像から多様な合成データを作成し,汎化性能の向上を目指す。
- 提案手法では,単一画像から構造情報を保持したまま多様なテクスチャと色を持つ画像ペアを合成する。
- 合成データを用いることで,学習モデルは様々なドメインにおけるロバスト性と汎化性能を向上させる。
- 実験の結果,提案手法は未知の画像形式における汎化性能を改善することを確認した。
LoRA-MME:LoRA調整エンコーダのマルチモデルアンサンブルによるコードコメント分類 [cs.RO, cs.SE, cs.LG]目的:コードコメント分類のためのマルチモデルアンサンブル手法
- ソフトウェアの自動ドキュメント化や解析において,コードコメント分類は不可欠な技術である。
- 既存手法では,言語やモデルによって性能にばらつきがあり,汎用性に課題がある。
- LoRAによる効率的な微調整とアンサンブル学習により,性能と効率性の両立を目指す。
- UniXcoder,CodeBERT,GraphCodeBERT,CodeBERTaの4つのTransformerエンコーダをLoRAで個別に微調整し,それらを学習された重みで統合する。
- テストセットにおいて,F1 Weightedスコア0.7906,Macro F1スコア0.6867を達成した。
- アンサンブルによる計算コストが課題として残るも,高い分類性能を実証した。
TFWaveFormer:動的リンク予測のための時間周波数協調多階層ウェーブレットTransformer [cs.LG, cs.AI]目的:動的リンク予測における性能向上
- 社会ネットワーク分析,コミュニケーション予測,金融モデリングなど,様々な応用分野で重要な役割を担う。
- 既存のTransformerベースのアプローチでは,複雑な多スケール時間ダイナミクスを捉える能力に限界がある。
- 時間周波数解析とウェーブレット分解を組み合わせることで,複雑な時間ダイナミクスの捉え方を改善する。
- TFWaveFormerは,時間周波数協調メカニズム,学習可能な多解像度ウェーブレット分解モジュール,ハイブリッドTransformerモジュールを組み合わせている。
- ベンチマークデータセットでの実験により,TFWaveFormerが既存のTransformerベースおよびハイブリッドモデルを大幅に上回る性能を示すことが証明された。
- 時間周波数解析とウェーブレット分解の組み合わせが,動的リンク予測タスクにおける複雑な時間ダイナミクスの捕捉に有効であることが検証された。
Minecraft用キャラクターからスキンへのオープンソース2段階パイプラインBLOCK [cs.CV, cs.AI]目的:Minecraftスキンの自動生成手法
- ゲーム開発において,キャラクターの視覚的な多様性は重要であり,魅力的なコンテンツ作成に不可欠である。
- 既存の手法では,キャラクターのコンセプトから高品質なMinecraftスキンを生成することが困難であった。
- 多様なキャラクターコンセプトに対応した,高品質なMinecraftスキンを自動生成すること。
- 本研究では,大規模マルチモーダルモデル(MLLM)とFLUX.2モデルを組み合わせた2段階パイプラインBLOCKを開発した。
- BLOCKは,キャラクターコンセプトからMinecraftスタイルのプレビュー画像を生成し,それをスキンアトラスに変換する。
- EvolveLoRAと呼ばれるLoRAの段階的カリキュラムを用いることで,安定性と効率性を向上させた。
マネージャーの意思決定における生成AI:曖昧性解消とごますり分析による境界線の再定義 [cs.AI]目的:マネージャーの意思決定における生成AIの活用
- ビジネス環境は複雑化の一途を辿り,迅速かつ的確な意思決定が不可欠である。
- 生成AIの戦略的アドバイスは有用だが,曖昧な状況下での信頼性が課題となっている。
- 曖昧性解消プロセスとごますり分析を通じて,生成AIの意思決定支援能力を向上させる。
- 生成AIは内部矛盾や文脈的曖昧性の検出に優れる一方,構造的な言語的ニュアンスの理解には課題がある。
- 曖昧性解消は,戦略,戦術,運用といったあらゆる意思決定タイプにおいて,応答品質の向上に寄与する。
- ごますり分析の結果,モデルのアーキテクチャによって異なるパターンが明らかになった。
認識的能動性の維持:責任あるAIのためのブラウワー的確信性制約 [cs.CY, cs.AI, cs.LG, cs.LO]目的:責任あるAIのための確信性制約
- 民主主義社会における認識的能動性は,情報へのアクセスと正当化作業に依存する。
- 生成AIは不確実性を権威ある見解に変換し,正当化作業を置き換える可能性がある。
- AIの出力に正当化可能な根拠を求め,認識的能動性を維持することを目的とする。
- 高リスク領域において,AIは公開検査・反論可能な根拠証明書を提示できなければ「未定」を返さなければならない。
- この制約により,内部的な確信と公共的な地位が明確に分離され,根拠証明書が両者を結ぶ境界対象となる。
- 時間的索引付きの根拠プロファイルは,数値的な洗練下で安定しつつも,公開記録の変化に応じて修正可能である。
拡散モデルにおける双方向予測のための汎用ODEソルバー:Dual-Solver [cs.LG, cs.CV]目的:拡散モデルのサンプリング効率向上
- 拡散モデルは高品質な画像生成を可能にするが,推論時の計算コストが高い。
- 既存のODEソルバーは,予測タイプや積分範囲の選択がサンプリング性能に影響する。
- 予測タイプ,積分範囲,残差項を学習可能に制御し,効率的なサンプリングを実現する。
- Dual-Solverは,予測タイプを連続的に補間し,積分範囲を選択し,残差項を調整することで,マルチステップサンプラーを汎用化する。
- ImageNetの条件付き画像生成およびテキストからの画像生成において,低NFE領域(3〜9)でFIDおよびCLIPスコアが改善される。
- 学習は,MobileNetやCLIPなどの事前学習済み分類器を用いた分類ベースの目的関数を通じて行われる。
Phi-4-reasoning-vision-15B 技術報告 [cs.AI, cs.CV]目的:小型マルチモーダル推論モデルの構築に関する知見
- AI技術の発展に伴い,視覚情報と言語情報を統合した高度な推論能力が求められている。
- 既存のマルチモーダルモデルは計算コストが高く,実用的な利用が困難な場合が多い。
- より小型で効率的なマルチモーダル推論モデルを開発し,科学的・数学的推論能力を高める。
- 厳選されたアーキテクチャとデータキュレーションにより,計算資源を抑えつつ高性能なモデルが実現可能となった。
- データフィルタリング,エラー修正,合成データ拡張がモデル性能向上に大きく貢献することが示された。
- 推論と非推論データのハイブリッド活用とモードトークンにより,多様なタスクへの対応が可能となった。
丁度良いタイミング:規制された交通空間における反応的推論 [cs.RO, cs.AI]目的:自律エージェントの共有交通空間における行動制御
- 交通システムの安全性向上は,社会実装において不可欠である。
- 従来の推論手法は計算コストが高く,リアルタイムでの応用が困難である。
- 動的な環境変化に対応可能な,高速な推論手法の確立を目指す。
- 提案手法は,確率的ミッション設計と反応的回路を組み合わせることで,オンラインでの正確な確率推論を実現した。
- 異種データストリームの変化頻度を利用し,推論タスクを分割することで,計算効率を大幅に向上させた。
- 実世界の船舶データと都市部ドローンシミュレーション実験で,既存手法と比較して大幅な高速化が確認された。
GeoSeg:リモートセンシング画像におけるトレーニング不要な推論駆動型セグメンテーション [cs.CV, cs.AI]目的:リモートセンシング画像における推論駆動型セグメンテーションの実現
- リモートセンシングは,地球観測において不可欠であり,多様な応用分野に貢献している。
- リモートセンシング画像における推論に基づいたセグメンテーションは,データコストが高く,実現が困難であった。
- 本研究は,トレーニングデータなしで推論に基づいたリモートセンシング画像のセグメンテーションを可能にすることを目指す。
- GeoSegは,既存手法と比較して一貫して高い性能を示し,推論駆動型セグメンテーションの有効性を証明した。
- バイアスを考慮した座標の修正と,デュアルルートプロンプティングメカニズムが性能向上に貢献することが確認された。
- GeoSeg-Benchは,リモートセンシング画像セグメンテーションの評価のための診断ベンチマークとして有用である。
視覚的証拠が曖昧な場合:視覚モデルの診断探針としてのパレイドリア [cs.IR, cs.CV, cs.AI]目的:視覚モデルにおけるパレイドリア現象の分析
- 視覚モデルの性能評価において,曖昧な入力に対するロバスト性が重要である。
- 既存の視覚モデルは,曖昧な入力に対して誤った解釈を行う可能性がある。
- パレイドリア現象を利用し,視覚モデルの曖昧性に対する解釈メカニズムを解明する。
- 視覚言語モデル(VLM)は,曖昧な領域を「人間」概念へ過剰に引き寄せる傾向がある。
- ViTは不確実性を伴う場合,判断を保留する戦略をとる。
- 検出ベースモデルは,事前確率を抑制することでパレイドリア現象への反応を低く抑える。
AI研究開発の自動化の測定 [cs.CY, cs.AI]目的:AI研究開発の自動化の程度と影響の把握
- AI技術の進歩は社会に大きな変革をもたらす可能性があり,その影響を理解することが重要である。
- AI研究開発の自動化の現状に関する実証的なデータが不足しており,その影響を正確に評価できない。
- AI研究開発の自動化が能力向上と安全性確保のバランスに与える影響を明らかにし,適切な対策を講じる。
- 本研究では,AI研究開発における資本配分,研究者の時間配分,AIへの不正利用といった指標を提案した。
- これらの指標を追跡することで,AI研究開発の自動化がもたらす潜在的な影響を理解し,安全対策を講じることが可能となる。
- 企業や研究機関,政府がこれらの指標の追跡を始めることを推奨する。
ソフトマックス注意ヘッドの専門化:高次元単一点モデルからの洞察 [cs.LG, cond-mat.dis-nn]目的:ソフトマックス注意ヘッドの専門化現象の解明
- Transformerモデルの性能向上には,注意機構の理解が不可欠である。
- 多くの注意ヘッドが冗長化し,類似した表現を学習している点が課題である。
- 注意ヘッドの専門化過程を理論的に捉え,性能向上に貢献すること。
- ソフトマックス注意ヘッドは,学習初期には非専門化だが,その後段階的に専門化していくことが示された。
- ソフトマックス1を使用することで,不要なヘッドからのノイズを大幅に削減できることが明らかになった。
- Bayes-softmax注意機構は,この設定において最適な予測性能を達成することが示された。
スペクトル手術:勾配ガイドによる特異値重み付けを用いたLoRAの学習不要な改良 [cs.LG, cs.AI]目的:LoRAの効率的なスペクトル構造の改善
- 大規模言語モデルの効率的な適応が重要視されており,LoRAはその有力な手法の一つである。
- LoRAでは,更新可能なパラメータ数が限られているため,その容量の割り当てが課題となる。
- 学習済みLoRAのスペクトルを分析し,不要な成分を抑制することで性能向上を目指す。
- スペクトル手術は,学習済みのLoRA更新を特異値分解し,勾配情報に基づいて各成分の感度を推定する。
- 推定された感度に基づいて特異値を再重み付けすることで,学習不要な改良を実現する。
- Llama-3.1-8BとQwen3-8Bを用いた実験で,CommonsenseQAやHumanEvalで性能向上を確認した。
オフラインモデルベース最適化の学習可能性:ランキングの視点から [cs.LG]目的:オフラインモデルベース最適化における学習可能性の分析
- 限られたデータから最適な設計を見つけるオフライン最適化は,実験コストが高い問題に有効である。
- 従来のオフライン最適化手法は,予測精度に偏重し,最適化性能との関係が不明確である。
- 設計のランキング能力に着目し,予測精度に依存しない最適化手法を開発する。
- オフライン最適化は,正確な値の予測よりも,高品質な設計のランキングが重要であることが示された。
- 最適化指向のリスク指標を導入し,ランキングとサーロゲート学習を結びつける理論的フレームワークを構築した。
- 提案手法は,様々なタスクにおいて既存の20手法を凌駕し,理論的知見を検証した。
高等教育における生成AIに関するSTEM分野教員の視点 [cs.CY, cs.AI]目的:生成AIの高等教育における利用に関するSTEM分野教員の視点の把握
- 高等教育における学習効果の向上と,教育の質の維持が重要視されている。
- 生成AIの急速な発展に対し,教育現場での適切な活用方法が確立されていない。
- 教員の視点を理解することで,効果的な教育戦略と制度の策定に貢献する。
- STEM分野の教員は,生成AIを教材作成,評価支援,カリキュラム設計に活用している。
- 学生の学習,評価の妥当性,学術倫理に関する懸念も抱いており,慎重な姿勢も確認された。
- 生成AIの有効な統合には,評価方法,教育方法,そして大学の統治体制の見直しが必要である。
アンカー記述による識別的知覚を用いた推論セグメンテーション [cs.CV, cs.AI]目的:推論セグメンテーションにおける識別的知覚能力の実現
- マルチモーダル大規模言語モデルの推論能力向上が重要視されている分野。
- 既存手法では,推論過程が参照領域から逸脱する問題があり,冗長な説明になりやすい。
- 参照対象と背景の識別を強化し,効率的な推論連鎖を構築することを目指す。
- 提案手法DPADは,参照対象の記述的キャプション生成を促し,文脈との関連性を明示的に識別する。
- これにより,モデルは対象の独自属性に集中し,より収束的で効率的な推論連鎖を実現する。
- ReasonSegベンチマークにおいて,cIoUが3.09%向上,推論連鎖長が約42%減少した。
