arXiv雑要約

AI - 2026/03/16 公開

クラウドサービス監視のための自動構成推奨に関する包括的フレームワーク [cs.DC, cs.LG]目的：クラウドサービス監視構成の自動推奨
- クラウドサービスの信頼性は顧客満足度と事業継続に不可欠であり，重要性が増している。
- 既存の監視構成プロセスは手動で，断片的であり，カバレッジの欠落や重複アラートが課題である。
- 本研究は，サービス構成のグラフ構造を活用し，最適な監視構成を推奨することで，この課題を解決する。
- 提案フレームワークは，Microsoftの過去データを用いた実験で，適切な監視構成の推奨が可能なことが示された。
- 本手法は，実際の運用サービスに対するユーザー調査においても有効性が確認された。
- これにより，監視の網羅性と運用負荷の軽減に貢献することが期待される。
Link: https://arxiv.org/abs/2603.12268
DART：入力難易度を考慮した早期終了型深層ニューラルネットワークの適応閾値 [cs.AR, cs.AI, cs.LG]目的：早期終了型深層ニューラルネットワークにおける効率的な推論手法
- エッジAIにおける計算資源の制約から，効率的な推論が重要視されている。
- 既存手法は，入力難易度を無視し，閾値を個別最適化している点が課題である。
- 入力難易度を考慮し，閾値を最適化することで，効率と精度の両立を目指す。
- DARTは，AlexNet，ResNet-18，VGG-16において，最大3.3倍の高速化，5.1倍の低消費電力，42%の平均電力削減を達成した。
- LeViTへの適用では，電力と実行時間の改善が見られた一方で，精度低下も確認された。Transformerに特化した早期終了メカニズムの必要性を示唆する。
- DARTは，新しい指標DAESにおいてベースラインを最大14.8%上回り，精度・効率・ロバスト性のトレードオフで優れていることが示された。
Link: https://arxiv.org/abs/2603.12269
タスク固有知識蒸留における中間プローブの使用 [cs.CL, cs.AI]目的：大規模言語モデルからの知識蒸留におけるタスク固有の性能向上
- 大規模言語モデルの知識蒸留は，効率的なモデル学習の重要な手法である。
- 従来の知識蒸留では，教師モデルの出力がノイズを含み，学習信号として最適でない場合がある。
- 中間表現を活用することで，よりクリーンな学習信号を得て，知識蒸留の性能を向上させる。
- 提案手法は，教師モデルの隠れ状態に基づき，軽量なプローブを訓練することで，出力ロジットのノイズを回避する。
- AQuA-RAT，ARC，MMLUなどの推論ベンチマークで一貫した性能向上が確認された。
- 特に，データが限られた状況下で，その効果が顕著に現れた。
Link: https://arxiv.org/abs/2603.12270
大規模言語モデルにおける複数回の文脈内知識更新下の検索バイアスの診断 [cs.CL, cs.AI, cs.LG]目的：大規模言語モデルにおける複数回の知識更新時の検索バイアス
- 知識集約型タスクにおいて，大規模言語モデルの利用が拡大している。
- 単一の更新や競合に焦点が当てられてきたが，複数更新時の挙動は未解明である。
- 知識更新が繰り返される際の検索バイアスの原因と軽減策の解明を目指す。
- 複数回の更新が行われると検索バイアスが強まり，初期状態の精度は高いものの最新状態の精度が大幅に低下する。
- アテンションや隠れ層の類似度，出力ロジットなどの診断分析から，誤りにおいてこれらの信号が平坦化し，最新更新の識別が困難になることが示された。
- 認知心理学に基づいた介入戦略は，バイアスを完全に解消するには至らなかった。
Link: https://arxiv.org/abs/2603.12271
ActTail：大規模言語モデルにおけるグローバル活性化スパース性 [cs.CL, cs.LG]目的：大規模言語モデルの推論加速のための活性化スパース性の最適化
- 大規模言語モデルの計算コストとメモリ使用量は膨大であり，効率化が急務である。
- 既存の活性化スパース手法は一様であり，Transformerの重みの異質性を考慮していない。
- 重みの統計的性質に応じたスパース性の割り当てによって性能劣化を抑制すること。
- ActTailは，重み分布の裾の重さを利用して活性化スパース性を動的に割り当てる。
- 理論的解析により，活性化スパース率と裾の重さの間の関係を明確化し，体系的なスパース性割り当てを可能にした。
- LLaMAとMistralモデルにおいて，一様割り当てと比較して高いスパース性下でもperplexityとタスク性能を向上させた。
Link: https://arxiv.org/abs/2603.12272
ユーザインタラクションからの言語モデルの調整 [cs.CL, cs.AI, cs.LG]目的：言語モデルの調整
- 言語モデルの性能向上は，自然言語処理の発展に不可欠である。
- ユーザとの対話データは豊富だが，有効活用する方法が不足している。
- ユーザの反応からモデルの改善を目指す。
- ユーザとの多岐にわたる対話データから学習することで，言語モデルの調整が可能となる。
- 実世界の対話データを用いて訓練することで，標準的な評価基準においてモデルの性能が向上した。
- 本手法は，明示的なフィードバックなしに，個々のユーザに適応するパーソナライズされたモデルの実現に貢献する。
Link: https://arxiv.org/abs/2603.12273
幾何学に基づいたニューラル計算のための物理学に基づいたカーネルネットワーク：DeLuLuの終焉 [cs.MA, cs.CE, cs.CL, cs.CL, cs.LG]目的：幾何学的に基づいたニューラル計算のための新しいカーネル演算子とネットワークアーキテクチャ
- 深層学習の性能向上には，より効率的で安定した学習方法が不可欠である。
- 従来のニューラルネットワークは，勾配消失や過学習などの問題に悩まされる場合がある。
- カーネル学習と情報幾何学を統合し，勾配の安定性と汎化性能を向上させる。
- yat-productという新しいカーネル演算子が，Mercerカーネル，解析性，Lipschitz連続性，自己正則化の特性を持つことが証明された。
- Neural Matter Networks (NMNs) は，yat-productを唯一の非線形演算子として使用し，MNIST分類において線形ベースラインと同等の性能を示した。
- Aether-GPT2は，yat-productに基づくアテンションとMLPブロックを使用することで，GPT-2と同程度のパラメータ数でより低い検証損失を達成した。
Link: https://arxiv.org/abs/2603.12276
プロンプトインジェクション：役割の混同 [cs.CL, cs.AI, cs.CR]目的：プロンプトインジェクション攻撃に対する脆弱性の原因の解明
- 大規模言語モデルの安全性確保は，その社会実装において不可欠である。
- 言語モデルは安全対策が施されているにも関わらず，プロンプトインジェクション攻撃に依然として脆弱である。
- 言語モデルにおける役割認識のメカニズムを明らかにすることで，プロンプトインジェクション攻撃への対策を可能にすること。
- 言語モデルは，テキストの内容から役割を推測しており，その情報源を考慮しないことが脆弱性の根本原因である。
- 役割を模倣した悪意のあるテキストが，本来持つべき権限を不正に取得することが，攻撃成功の鍵となる。
- 内部的な役割の混同度合いは，生成開始前に攻撃の成功率を予測する上で有効な指標となることが示された。
Link: https://arxiv.org/abs/2603.12277
船舶航跡の文脈を豊かにした自然言語記述 [cs.IR, cs.AI, cs.CL, cs.DB]目的：船舶航跡データの構造化と意味的充実に向けた表現
- 海洋交通の安全確保や効率化のため，船舶航跡データの解析が不可欠である。
- AISデータはノイズが多く，そのままでは人間や機械による解釈が困難である。
- 航跡データの意味密度を高め，複雑さを軽減することで，高度な海洋分析を可能とする。
- 提案手法により，ノイズの多いAISデータを，意味的に豊かな航海エピソードに分割・表現することに成功した。
- 地理的実体や気象条件といった多様な文脈情報を航跡データに付加することで，記述の質を向上させた。
- 生成された自然言語記述は，LLMを用いた高次な海洋推論タスクへの応用が期待される。
Link: https://arxiv.org/abs/2603.12287
ゴミから黄金へ：予測の頑健性に関するデータアーキテクチャ理論 [cs.LG, cs.AI, stat.ML]目的：予測の頑健性が生じるメカニズムの解明
- 機械学習は様々な分野で活用され，その性能向上が求められている。
- 従来の「ガベージイン，ガベージアウト」の原則に反し，ノイズを含むデータでも高性能なモデルが存在する。
- データのアーキテクチャとモデルの能力の相乗効果が頑健性に貢献することを理論的に示す。
- 高次元で共線性を持つエラーを含むデータセットを用いることで，ノイズの影響を克服できることが示された。
- 潜在的な原因からの依存関係である「有益な共線性」が，信頼性と収束効率を高めることが明らかになった。
- データ品質の定義を，アイテムレベルの完璧さからポートフォリオレベルのアーキテクチャへと再定義し，未キュレーションのデータ活用を提案した。
Link: https://arxiv.org/abs/2603.12288
LLMを活用したテキスト豊富なグラフ学習による学術ウェブ上の誤引用検出 [cs.IR, cs.AI]目的：学術ウェブ上の誤引用検出
- 学術ウェブは知識の広大なネットワークであり，引用関係を通じて繋がりを持つ。その信頼性維持は重要である。
- 既存手法は引用文脈とネットワーク全体の関係性を捉えきれず，誤引用検出に限界がある。
- LLMの知識を活用し，効率的かつ大規模な誤引用検出を実現する。
- LAGMiDは，LLMとグラフニューラルネットワークを組み合わせた新しいフレームワークである。
- エビデンスチェーン推論メカニズムにより，多段階の引用追跡と意味的整合性の評価を行う。
- 知識蒸留によりLLM推論コストを削減し，GNNによる構造ベースの一般化を最適化する。
Link: https://arxiv.org/abs/2603.12290
Beagleフレームワークを用いた記号回帰のためのGPU加速遺伝的プログラミング [cs.NE]目的：記号回帰のためのGPU加速遺伝的プログラミングの性能評価
- 複雑な関数を自動的に発見する記号回帰は，科学的データ分析に有用である。
- CPUによる計算は，大規模データセットに対する処理速度が課題となる。
- GPUによる並列処理を活用し，記号回帰の計算速度を向上させる。
- Beagleフレームワークは，既存のGPUプラットフォームで高いスループットを実現する。
- Feynman記号回帰データセットを用いたベンチマークで，CPUベースのStackGPやPySRよりも優れた性能を示した。
- 点対点誤差関数と相関関数という2つの異なる適応度関数を用いた結果も報告されている。
Link: https://arxiv.org/abs/2603.12292
多視点多階層特徴を用いた多目的遺伝的プログラミングによるタンパク質二次構造予測の向上 [cs.LG, cs.NE]目的：タンパク質二次構造予測の精度向上
- タンパク質機能理解や創薬において，タンパク質二次構造予測は不可欠な要素である。
- 配列と構造の関係が複雑であり，高精度なモデル構築が困難である。
- 特徴選択と融合を自動最適化する枠組みにより，予測精度とモデルの複雑さのバランス改善を目指す。
- MOGP-MMFは，既存の手法と比較して，Q8精度と構造的完全性において優れた性能を示す。
- 進化，意味，構造の各視点を取り入れた多視点多階層表現戦略が，タンパク質フォールディングの論理を包括的に捉える。
- 知識伝達メカニズムを組み込んだ多目的GPアルゴリズムにより，多様な非支配解を生成し，柔軟なモデル選択を可能にする。
Link: https://arxiv.org/abs/2603.12293
脳コンピュータインタフェースのための合成データ生成：概要，ベンチマーク，および将来の展望 [cs.LG, cs.AI, eess.SP]目的：脳コンピュータインタフェースにおける合成データ生成に関する研究
- 深層学習の発展は大量データに支えられており，BCI分野でもデータ不足が課題である。
- 脳波などの神経記録は，量が少なく，個人差が大きく，プライバシーの問題もある。
- データ不足を解消し，BCIシステムの性能向上を目指す。
- 既存の脳信号生成アルゴリズムを，知識ベース，特徴ベース，モデルベース，翻訳ベースの4種類に分類した。
- 4つの代表的なBCIパラダイムを用いて，既存の生成手法を客観的に比較評価した。
- 今後のBCIシステムにおける，正確性，データ効率，プライバシー保護の重要性について議論した。
Link: https://arxiv.org/abs/2603.12296
グローバル進化方向制御：交差層一貫性による活性化方向制御の改良 [cs.LG, cs.AI]目的：大規模言語モデルの制御精度の向上
- 大規模言語モデルの活用が広がる中で，効率的な制御手法の確立が重要である。
- 既存手法では，ノイズの影響や層間での意味ドリフトにより，意図しない相関関係を捉えてしまう問題がある。
- ネットワーク表現の進化における幾何学的安定性を利用し，ロバストな意味意図を抽出することを試みる。
- 提案手法GER-steerは，既存手法と比較して，一貫して高い性能を示すことが確認された。
- GER-steerは，層固有の調整なしに，汎用的なモデルアライメントのソリューションを確立する。
- ノイズの影響を低減し，より信頼性の高いモデル制御を実現する。
Link: https://arxiv.org/abs/2603.12298
深層学習におけるMDLベース最適化のための幾何学的駆動 [cs.LG, cs.AI]目的：深層学習の最適化におけるMDL原理の統合
- 深層学習は強力だが，過学習や解釈性の低さが課題。
- モデル選択基準としてのMDLは静的であり，最適化過程での活用が限られる。
- MDLを最適化の駆動因子として組み込み，汎化性能とモデル簡素化を両立する。
- 本研究では，幾何学的な認知多様体を導入し，Ricci flowとMDL Driveによってその進化を制御する。
- 理論的な基礎を確立し，記述長の単調減少，位相移行の有限性，普遍的な臨界現象の存在を証明した。
- 合成データでの実験により，ロバストな汎化性能と自律的なモデル簡素化が確認された。
Link: https://arxiv.org/abs/2603.12304
HCP-DCNet：自己改善型因果理解のための階層的因果素子動的構成ネットワーク [cs.LG, cs.AI]目的：因果理解の向上
- AIの堅牢性には，因果関係の理解が不可欠である。
- 深層学習は因果モデルを欠き，分布の変化に弱い。
- 因果素子の動的構成による自己改善を目指す。
- HCP-DCNetは，連続的な物理動力学と離散的な記号的因果推論を統合する。
- 因果シーンを再利用可能な「因果素子」に分解し，タスク固有の「因果実行グラフ」を動的に構成する。
- シミュレーション実験で，既存のモデルを上回る因果発見，反事実推論，構成的汎化能力を示す。
Link: https://arxiv.org/abs/2603.12305
VQQA：ビデオ評価と品質改善のためのエージェント的アプローチ [cs.AR, cs.CV, cs.AI, cs.LG, cs.MA]目的：ビデオ生成モデルの出力と複雑なユーザー意図との整合性向上
- ビデオ生成技術は急速に進歩しているが，ユーザーの要求に応えることが課題である
- 既存手法は計算コストが高いか，モデル内部へのアクセスが必要である
- ブラックボックスな自然言語インターフェースによる効率的なプロンプト最適化を実現する
- VQQAは，視覚的な質問を動的に生成し，その結果得られるVLMによる批評を意味勾配として利用する
- これにより，従来の評価指標の代わりに，解釈可能で実行可能なフィードバックが得られる
- T2V-CompBenchで+11.57%，VBench2で+8.43%の絶対的な改善が見られ，既存手法を上回る
Link: https://arxiv.org/abs/2603.12310
強化学習カリキュラムの熱力学 [cs.LG, cs.AI]目的：強化学習におけるカリキュラム学習の定式化
- 機械学習の最適化，汎化，表現学習への統計力学の応用が重要である。
- カリキュラム学習の最適な順序決定に理論的な指針が不足している。
- 熱力学的な過剰仕事の最小化に基づいたカリキュラム設計を目指す。
- 報酬パラメータをタスク多様体上の座標として捉える幾何学的枠組みを提案した。
- 最適なカリキュラムは，このタスク空間における測地線に対応することが示された。
- 最大エントロピー強化学習における温度アニーリングのスケジュールを導出する「MEW」アルゴリズムを提案した。
Link: https://arxiv.org/abs/2603.12324
ロールアウトなしの最大エントロピー探索 [cs.LG, cs.AI]目的：強化学習における効率的な探索手法
- 強化学習において，探索はデータ収集のための重要な事前学習目標である。
- 既存の探索手法は，状態訪問頻度の推定に計算コストの高いロールアウトを必要とする。
- ロールアウトを回避し，効率的に最大エントロピー探索問題を解くことを目指す。
- 本研究では，EVE（EigenVector-based Exploration）という新たなアルゴリズムを提案した。
- EVEは，遷移行列の主固有ベクトルを利用することで，ロールアウトや分布推定を必要としない。
- EVEは決定的なグリッドワールド環境において，ロールアウトベースラインと同等の探索性能を達成した。
Link: https://arxiv.org/abs/2603.12325
POMDPを用いたタスク完了時間更新の最適化 [eess.SY, cs.AI, cs.SY]目的：タスク完了時間更新に関する最適制御方針
- プロジェクト管理において，タスク完了時間の管理は不可欠であり，効率的なプロジェクト遂行に影響を与える。
- 関係者への発表完了時間の更新頻度と正確性のバランスが課題であり，過度な更新は信頼性を損なう可能性がある。
- 発表管理の逐次性を考慮した最適化手法を提供し，関係者への信頼維持とプロジェクト効率向上を目指す。
- 提案手法は，発表誤差と更新頻度の両方のコストを考慮した報酬構造に基づき，最適な発表制御方針を導出する。
- シミュレーション結果から，ベースライン戦略と比較して，予測精度を維持または向上させながら，不要な更新を最大75%削減できることが示された。
- 本研究で生成された方針は，信念状態の進化に応じて発表を適応的に管理するフィードバックコントローラとして機能する。
Link: https://arxiv.org/abs/2603.12340
分子特性予測のための汎用大規模言語モデル：専門モデルからの知識蒸留 [cs.SI, q-bio.QM, cs.CL, cs.LG]目的：分子特性予測における汎用大規模言語モデルの性能向上
- 医薬品開発において，分子特性予測は不可欠なプロセスである。
- 大規模言語モデルは汎用性が期待されるが，現状では専門モデルの性能に及ばない。
- 専門モデルの知識を大規模言語モデルに効果的に伝達し，性能を向上させる。
- 提案手法TreeKDは，決定木から得られた予測ルールを自然言語化し，大規模言語モデルに学習させることで，構造的洞察力を付与する。
- ルールの一貫性を考慮したアンサンブル手法により，予測精度をさらに向上させる。
- TDCベンチマークの22種類のADMET特性において，TreeKDは大規模言語モデルの性能を大幅に改善し，専門モデルとの差を縮小した。
Link: https://arxiv.org/abs/2603.12344
予算制約下における発見スコアリング：AI誘導科学的選択の評価のための形式的検証フレームワーク [cs.RO, cs.LG, cs.AI, q-bio.QM, stat.ML]目的：AI誘導科学的選択戦略の予算を考慮した評価
- 科学的発見においてAIの活用が重要性を増しており，実験検証の候補選択にAIが用いられている。
- AI選択戦略を比較するための，予算を考慮した明確な評価枠組みが存在しないという課題がある。
- 提案手法により，偽発見と過剰な抑制を予算レベルごとに適切に評価し，比較可能とする。
- 提案するBSD/DQSは，形式的に検証された指標であり，誤発見率とカバレッジギャップを統合的に評価する。
- HIVデータセットを用いた実験により，単純なRFベースのGreedy-MLが最高のDQSを示し，LLMは既存の機械学習モデルを上回る価値を提供しないことが示された。
- 提案フレームワークは，5つのMoleculeNetベンチマークや，異なるドメイン，パラメータ設定で一般化可能であることが確認された。
Link: https://arxiv.org/abs/2603.12349
移動体通信トラヒックグリッド予測のための空間PDEを意識した選択的状態空間モデル（ネストされたメモリ付き） [cs.LG]目的：移動体通信ネットワークにおけるトラヒック予測
- セルラーネットワークのトラヒック予測は，ネットワーク運用効率向上に不可欠な要素である。
- 従来のセル個別モデルはコストが高く，グローバルモデルは空間的な異質性を捉えにくい。
- 高計算コストを抑えつつ，空間的な異質性を考慮したトラヒック予測手法を確立する。
- 提案手法NeST-S6は，ミランのモバイルトラヒックデータセットにおいて，既存のMamba系ベースラインよりも低い予測誤差を達成した。
- NeST-S6のネストされたメモリは，ドリフトストレステストにおいて平均絶対誤差を48〜65％低減した。
- NeST-S6は，競合するピクセル走査モデルと比較して，フルグリッド再構成の速度を32倍に，MACsを4.3倍に削減し，ピクセルごとのRMSEを61％低減した。
Link: https://arxiv.org/abs/2603.12353
深層ネットワークにおける構造的プルーニングと動的ルーティングのための交互勾配流利便性：統一的な指標 [cs.CV, cs.LG, cs.NE]目的：深層ネットワークの構造的プルーニングと動的ルーティングを評価するための統一的な指標の提案
- 深層学習の効率化は重要であり，計算資源の削減と推論速度の向上に貢献する。
- 従来の指標は，構造的プルーニングにおいて機能経路を適切に維持できず，性能劣化を引き起こす。
- 本研究は，ネットワークの構造的利便性を正確に捉え，性能劣化を防ぐ指標を開発し，効率的な深層学習を実現する。
- 提案手法は，極端な疎性下でネットワークの基盤機能を維持し，構造的崩壊を回避できる。
- ViTにおける疎性ボトルネックを明らかにし，動的シグナルの信号圧縮問題を解決するハイブリッドルーティングフレームワークを設計した。
- ImageNet-1Kで75%の圧縮テストにおいて，従来の指標よりも優れた性能を示し，ImageNet-100では効率的な動的推論を実現した。
Link: https://arxiv.org/abs/2603.12354
シンコーン・ドリフティング生成モデル [cs.RO, cs.LG]目的：シンコーンダイバージェンスによる勾配フローとドリフティング生成ダイナミクスの理論的関連性
- 生成モデルは，現実世界のデータ分布を学習し，新しいサンプルを生成する重要な技術である。
- 既存のドリフティング生成モデルには，識別可能性に関する問題が存在した。
- シンコーンダイバージェンスを用いることで，ドリフティングの理論的根拠を確立し，識別可能性の問題を解決することを目指す。
- シンコーンダイバージェンスは，ドリフティング生成モデルのダイナミクスにおける「クロス・マイナス・セルフ」構造を明確化する。
- シンコーン・ドリフティングは，カーネル温度に対する感度を低減し，生成品質を向上させる。
- FFHQ-ALAEデータセットにおいて，Sinkhorn driftingはFIDとEMDを大幅に改善した。
Link: https://arxiv.org/abs/2603.12366
バランスの取れた思考による効率的な推論 [cs.AI, cs.CL, cs.LG]目的：大規模推論モデルにおける効率的な推論
- 大規模言語モデルの推論能力は重要であり，様々なタスクへの応用が期待されている。
- 過剰な推論や不十分な推論により，計算資源の無駄遣いや精度の低下といった課題が存在する。
- 推論の自信度に基づいて推論経路を調整し，効率性と精度を両立することを目指す。
- ReBalanceは，モデルの追加学習を必要としないフレームワークであり，容易に既存のモデルに組み込むことができる。
- 実験の結果，ReBalanceは出力の冗長性を低減し，精度を向上させることが示された。
- ReBalanceは，数学，質問応答，コーディングといった様々なタスクにおいて有効であることが確認された。
Link: https://arxiv.org/abs/2603.12372
NeuroLoRA：文脈を考慮したニューロモジュレーションによるパラメータ効率の良いマルチタスク適応 [cs.LG, cs.CL]目的：大規模言語モデルのパラメータ効率の良いマルチタスク適応
- 大規模言語モデルの活用範囲拡大には，効率的な適応手法が不可欠である。
- 既存手法では，入力文脈を考慮しない固定的なルーティング機構が課題となっていた。
- 文脈に応じたニューロモジュレーションゲートで，タスク間の干渉を軽減し，適応能力を高める。
- NeuroLoRAは，入力文脈に応じて投影空間を再スケールすることで，既存のFlyLoRAを上回る性能を発揮する。
- コントラスト正交性損失を用いることで，専門家サブスペース間の分離を強化し，タスクの分離と継続学習能力を向上させる。
- MMLU，GSM8K，ScienceQA等の実験で，NeuroLoRAはシングルタスク適応，モデルマージ，継続学習において優れた結果を示す。
Link: https://arxiv.org/abs/2603.12378
SPARROW：ピクセルに基づく動画MLLMにおける空間的精度と時間的参照一貫性の学習 [cs.DC, cs.CV, cs.AI]目的：ピクセルに基づく動画MLLMにおける空間的精度と時間的参照一貫性の向上
- 動画理解は，AIの発展において不可欠であり，多様な応用が期待される分野である。
- 既存の動画MLLMは，時間的な文脈を捉えきれず，空間的なずれやオブジェクトの認識ミスが発生しやすい。
- SPARROWは，時間的に一貫した参照を可能にし，動画内のオブジェクトを正確に追跡・認識することを目的とする。
- SPARROWは，時間的に整列した参照キューを注入するTarget-Specific Tracked Features (TSF)と，ボックスおよびセグメンテーショントークンをデコードする二重プロンプト設計により，空間精度と時間安定性を両立している。
- 3つの既存の動画MLLM (UniPixel, GLUS, VideoGLaMM)に統合した結果，RVOSで最大+8.9 J&F，visual groundingで+5 mIoU，GCGで+5.4 CLAIRの改善が確認された。
- これらの結果は，SPARROWがピクセルに基づく動画理解において，参照安定性，空間的精度，時間的一貫性を大幅に向上させることを示している。
Link: https://arxiv.org/abs/2603.12382
テスト時戦略による，より効率的で正確なエージェント型RAG [cs.IR, cs.AI]目的：エージェント型RAGの効率と正確性の向上
- 複雑な質問への対応が課題であり，RAGシステムの性能向上が求められている。
- 反復的な情報検索や，文脈化の困難さにより，効率と精度が低下することがある。
- 検索パイプラインのテスト時変更により，効率と精度を改善することを目指す。
- 文脈化モジュールにGPT-4.1-miniを利用した結果，EMスコアが5.6%向上した。
- 検索回数は10.5%削減され，検索効率が改善された。
- これらの結果から，提案手法が回答の正確性と検索効率の両面で優れていることが示された。
Link: https://arxiv.org/abs/2603.12396
運動模倣の限界：人間の運動データのみで歩行制御とバイオメカニクスを説明可能か [cs.RO, cs.LG]目的：人間の歩行運動の力学的推定における報酬項としての足と地面の相互作用の影響
- バイオメカニクスやウェアラブルロボティクス分野では，運動模倣学習の重要性が高まっている。
- 運動のみの模倣では，物理的な一貫性が欠如し，力学的に妥当な結果が得られない場合がある。
- 本研究は，運動データに加えて足と地面の相互作用を考慮することで，より現実的な歩行表現を目指す。
- 運動データの模倣のみでは，力学的に妥当な関節力学を再現できないことが示された。
- 足と地面の接触や接触力を報酬項に加えることで，前方歩行シミュレーションにおいて，逆動力学によって計算された関節モーメントに近い予測が可能となった。
- バイオメカニクスやウェアラブルロボトの共同設計において，力学に基づいた報酬設計の必要性が示唆された。
Link: https://arxiv.org/abs/2603.12408
SpectralGuard：状態空間モデルにおけるメモリ崩壊攻撃の検出 [cs.LG, cs.CR]目的：状態空間モデルにおけるメモリ崩壊攻撃の検出手法
- 近年の言語モデルは，長い系列データを効率的に処理するため，状態空間モデルが注目されている。
- 状態空間モデルの再帰的メカニズムは，悪意のある入力によってメモリが失われる脆弱性を抱えている。
- 出力のみの防御では回避可能な，モデル内部の状態を監視することで安全性を確保すること。
- SpectralGuardは，モデルの各層におけるスペクトル安定性をリアルタイムで監視する。
- 非適応攻撃者に対してF1=0.961，最も強力な適応設定下でもF1=0.842の精度を達成し，トークンあたりの遅延は15ms未満。
- 因果介入とクロスアーキテクチャ転送により，スペクトル監視が再帰的な基盤モデルの安全層として機能することが確認された。
Link: https://arxiv.org/abs/2603.12414
基礎モデル時代におけるモデルスティッチングの再検討 [cs.CV, cs.AI, cs.LG]目的：異種ビジョン基礎モデルのスティッチ可能性の検証と，スティッチングによるモデル統合手法の提案
- 大規模なビジョン基礎モデルは多様なタスクで活用され，その性能向上が重要視されている。
- 異なる目的やデータで学習したモデル間の表現の互換性が課題となっていた。
- 異種モデル間のスティッチングの成功条件を明確にし，モデル統合の可能性を探る。
- 従来のスティッチング手法では精度維持が難しかったが，ターゲットモデルの末尾層での特徴量マッチング損失を用いることで，異種モデル間のスティッチングが安定的に可能になった。
- 深いスティッチポイントでは，スティッチングされたモデルが個々の構成モデルを上回る性能を示すことが確認された。
- 複数のビジョン基礎モデルの初期層を共有するVFM Stitch Tree (VST) を提案し，マルチモーダルLLMにおける精度とレイテンシーのトレードオフを制御可能にした。
Link: https://arxiv.org/abs/2603.12433
カーネルファウンドリ：ハードウェアを意識したGPUカーネルの進化最適化 [eess.SY, cs.SY, cs.DC, cs.LG]目的：GPUカーネルのハードウェアを考慮した進化最適化手法
- GPUの性能は深層学習を含む多くの分野で重要であり，その性能向上が求められている。
- GPUカーネルの最適化は，ハードウェアアーキテクチャの理解が必要であり，従来の自動最適化手法では困難な場合がある。
- 大規模言語モデルを活用し，ハードウェアを意識したGPUカーネルの自動最適化を実現する。
- KernelFoundryは，多様な最適化戦略を探索するMAP-Elitesや，カーネルとプロンプトを同時に進化させるメタプロンプト進化などのメカニズムを用いる。
- KernelBench，robust-kbench，カスタムタスクにおいてSYCLカーネルを生成し，平均2.3倍の高速化を達成した。
- 本フレームワークは分散環境で動作し，多様なハードウェアへのリモートアクセスを可能にする。
Link: https://arxiv.org/abs/2603.12440
セキュリティ指標と主要リスク指標のギャップを埋める：脆弱性優先度付けのための経験的フレームワーク [cs.CR, cs.LG]目的：脆弱性優先度付けのためのフレームワーク
- サイバー攻撃の高度化に伴い，リスクに基づいた脆弱性管理が重要になっている。
- CVSSスコアは広く利用されているが，実世界の攻撃データに対する予測精度が低い。
- リスク指標を用いて，脆弱性の影響と露出を考慮した優先度付けを可能にすること。
- 提案するKRIフレームワークは，ROC-AUC 0.927，AUPRC 0.223を達成し，CVSS (0.747, 0.011)を大きく上回った。
- EPSS単独ではAUPRC 0.365を達成したが，KRIは影響と露出を考慮することで，よりリスクに基づいた優先度付けを実現した。
- KRIは，上位500件の脆弱性において，EPSSより8.7%多くのインパクトをカバーし，重大な脆弱性の検出率も高かった。
Link: https://arxiv.org/abs/2603.12450
文脈支援型予測におけるモダリティギャップの克服 [cs.LG]目的：文脈支援型予測の性能向上
- AIシステムの高度化には，専門知識や将来予測の統合が不可欠である。
- 既存研究では，マルチモーダルモデルがユニモーダルモデルを上回らない場合がある。
- データセットの質の向上により，文脈支援型予測の性能向上を目指す。
- 半合成的なデータ拡張手法により，大規模データセットCAF-7Mを構築した。
- このデータセットを用いた事前学習は，実世界の評価において有効であることが示された。
- 文脈の活用が明確に確認され，データセットの質がボトルネックであった可能性が示唆された。
Link: https://arxiv.org/abs/2603.12451
AIを用いたサイバーリスク管理の運用：サイバーインシデントとMITRE ATT&CKテクニック，セキュリティコントロール，メトリクスの関連付け [cs.CL, cs.CR, cs.AI]目的：サイバーインシデントをアドバーサリーテクニックに自動的にマッピングするための新たなフレームワーク
- サイバー攻撃の頻度増加は組織にとって大きな課題であり，特にリソースの限られた中小企業への影響が大きい。
- 中小企業は，社内専門知識，知識，財源の不足により，効果的なサイバーリスク管理が困難である。
- 脅威インテリジェンスと具体的な対策を結び付け，体系的なインシデント対応と証拠に基づいたリスク管理を可能にする。
- 自然言語処理を活用し，サイバーインシデントとMITRE ATT&CKテクニック間の関連性を高めるモデルを開発した。
- 学習済みのモデルは，Spearman相関係数0.7894，Pearson相関係数0.8756を達成し，既存モデルを大幅に上回る性能を示した。
- MAE=0.135，MSE=0.027という予測誤差は，ベースラインモデルと比較して有意に低く，高い精度と一貫性が確認された。
Link: https://arxiv.org/abs/2603.12455
LLMにおける多段階医療推論のためのトポロジー正則化ベンチマーク：近道打破 [cs.CL, cs.AI]目的：LLMにおける多段階医療推論能力の評価
- 医療AIの発展には，正確な診断推論能力が不可欠である。
- 既存のベンチマークは，事実の記憶に偏り，臨床現場で必要な複雑な推論を評価できていない。
- 知識グラフの構造を利用した近道学習を抑制し，真の診断推論を評価するベンチマークを構築する。
- ShatterMed-QAは，10,558問からなる多段階の臨床質問ベンチマークである。
- 多くのLLMは，ShatterMed-QA上で大幅な性能低下を示し，特にドメイン特化型モデルで顕著であった。
- Retrieval-Augmented Generation (RAG)による情報補完により性能が回復し，ベンチマークの妥当性が確認された。
Link: https://arxiv.org/abs/2603.12458
操行可能なカーネルの基底：2次元回転からローレンツ群へ [cs.LG, cs.CV]目的：操行可能な等方畳み込みニューラルネットワークの設計における操行可能なカーネル制約を解く方法
- 深層学習において，データに内在する対称性を活用することで，モデルの効率性と汎化性能を向上させることが重要である。
- 既存の方法では，クレーブシュ・ゴルダン係数の数値計算や解析的な計算が必要であり，計算コストが高いという問題がある。
- より簡潔な手法を用いて，入力と出力の特徴マップの表現を直接扱うことで，この問題を解決することを目的とする。
- 本研究では，2次元回転からローレンツ群まで，様々な対称性群と任意のテンソル型の特徴マップに対して，実数および複素数の基底を明示的に提供する。
- 提案手法は，特定の点での単純な不変条件を満たすカーネルの基底を見つけ，その基底を操行可能性の定義式を用いて任意の点へ「操行」させるという戦略に基づいている。
- これにより，クレーブシュ・ゴルダン係数の計算を回避し，より幅広い層の研究者にとってアクセスしやすい方法を提供する。
Link: https://arxiv.org/abs/2603.12459
TaxBreak：LLM推論における隠れたコストをオーバーヘッド分解で解明 [cs.RO, cs.AR, cs.CY, cs.DC, cs.LG, cs.PF]目的：LLM推論におけるオーバーヘッドの分解と最適化目標の特定
- LLMは対話型アシスタントやエージェントシステムで広く利用されており，その性能は重要な課題である。
- レイテンシが重要な環境では，ホスト側のオーバーヘッドがボトルネックとなり，最適化が困難である。
- ホスト側のオーバーヘッドを詳細に分析し，最適化の方向性を示すことで，LLM推論の効率化を目指す。
- TaxBreakは，ホスト側のオーバーヘッドをフレームワーク翻訳時間，CUDAライブラリ翻訳時間，カーネル起動パス時間の3つの要素に分解する手法である。
- HDBI（Host-Device Balance Index）は，デバイスの実行時間とホスト側のオーケストレーションのバランスを示す指標であり，最適化目標の特定に役立つ。
- MoEモデルはdenseモデルよりも多くのカーネルを起動し，CPUのシングルスレッド性能がボトルネックとなる場合があることが示された。
Link: https://arxiv.org/abs/2603.12465
完璧のパラドックス：AI支援API設計におけるアーキテクトからキュレーターへ [cs.CL, cs.HC, cs.SE, cs.AI, cs.HC]目的：企業向けAPI設計におけるAI支援ワークフローの評価
- API設計は，迅速な機能提供と使いやすさの維持というトレードオフが存在する重要な課題である。
- 既存のAPI設計プロセスでは，高品質なAPIの効率的な作成が困難である。
- AIの活用により，API設計の効率化と品質向上を図り，人間の役割の変化を検討する。
- AIが生成したAPI仕様は，11の使いやすさの指標のうち10個で人間が作成したものよりも優れており，作成時間も87％短縮された。
- しかし，専門家はAIが作成したAPIを人間が作成したものと見間違えることが多く（正答率19％），その完璧さに不安を感じた。
- この「完璧のパラドックス」は，AIの過度な一貫性が，人間の実践的な判断力の欠如を示唆している。
Link: https://arxiv.org/abs/2603.12475
データ量を削減し，収束を加速：目標駆動型データ最適化によるマルチモーダル命令チューニング [cs.DB, cs.CV, cs.LG]目的：マルチモーダル命令チューニングのためのデータ最適化手法
- マルチモーダル学習は，画像とテキストなど多様な情報を統合するため，AIの応用範囲を広げる上で重要である。
- 大規模なデータセットが必要とされるため，計算コストが高く，効率的な学習が困難であるという課題がある。
- 限られた計算資源で，より効率的に高精度なマルチモーダルモデルを学習することを目指す。
- 提案手法GDOは，Uni-10xベースラインと比較して，MVBench，VideoMME，MLVU，LVBenchにおいて，少ないサンプル数で同等の精度を達成した。
- 特にMVBenchとMLVUにおいて精度向上が大きく，LVBenchにおいても改善が見られた。
- 時間的強調の強化は，長編動画の理解能力を向上させる効果が確認された。
Link: https://arxiv.org/abs/2603.12478
ワンステップフローポリシー：高速視覚運動ポリシーのための自己蒸留 [cs.RO, cs.AI]目的：高速かつ高精度なロボット制御のためのワンステップ行動生成手法
- ロボットの高度な制御には，多様な行動選択を可能にする連続的な行動分布が不可欠である。
- 生成フローや拡散モデルは精度が高いが，反復サンプリングによる遅延が課題となっている。
- 本研究は，遅延を解消し，リアルタイム性の高いロボット制御を実現することを目的とする。
- 提案手法OFPは，事前学習された教師なしで高精度なワンステップ行動生成を可能にする。
- 自己整合性損失と自己誘導正則化により，時間的な一貫性と高密度な専門家モードへの予測の集中を実現する。
- 56の多様な操作タスクで，既存の拡散モデルやフローポリシーを凌駕し，100倍以上の高速化を達成した。
Link: https://arxiv.org/abs/2603.12480
時系列データ分析エージェント向けに表現豊かでカスタマイズ可能な評価をAgentFuelで生成する [cs.AI, cs.LG]目的：時系列データ分析エージェントの評価における表現力とカスタマイズ性の向上
- IoTやセキュリティなど多くの分野で，データ分析エージェントの利用が拡大しており，データから洞察を得る手段として重要である。
- 既存の評価指標では，状態の追跡やインシデント固有のクエリに対応できず，実用的な評価が困難であるという課題がある。
- AgentFuelを用いることで，ドメイン専門家が時系列データエージェントの機能をテストするための，カスタマイズされた評価を迅速に作成することを可能にする。
- AgentFuelによる評価は，既存のデータエージェントフレームワークの改善点を明確に示すことが示された。
- AgentFuelを使用することで，エージェントのパフォーマンスが向上する可能性があることが示唆された (GEPAを用いた事例)。
- AgentFuelの評価ベンチマークは，Hugging Face Datasetsで公開されており，利用可能である。
Link: https://arxiv.org/abs/2603.12483
金融AIのための様相論理ニューラルネットワーク [cs.LG]目的：金融AIにおける様相論理ニューラルネットワークの応用
- 金融業界ではAI活用が不可欠であり，高いパフォーマンスが求められる。
- 深層学習は性能が高い一方，解釈性やルール遵守性が課題となる。
- 深層学習と様相論理を融合し，金融規制への適合と信頼性を高める。
- 様相論理ニューラルネットワーク（MLNN）は，必要性，可能性，時間，知識に関する推論を可能にする。
- MLNNは，金融規制，ストレステスト，不正検知といった分野で有効性が示された。
- 取引エージェントのコンプライアンス向上，市場監視における信頼回復，ロボアドバイザーの誤情報を抑制に貢献する。
Link: https://arxiv.org/abs/2603.12487
Mambaにおける系列長汎化の探求：画像再構成による検証 [cs.LG]目的：Mambaの系列長汎化に関する理解
- 系列モデルは自然言語処理をはじめ，様々な分野で重要な役割を担っている。
- Transformerモデルは高性能だが，計算コストが高いという課題がある。
- Mambaの系列長汎化のメカニズムを解明し，性能向上に貢献すること。
- Mambaは学習時に遭遇した系列長の分布に適応し，その範囲外では汎化性能が低下することが判明した。
- 画像再構成タスクを通じて，Mambaの系列処理における行動の変化を詳細に分析した。
- 系列長適応型のMambaを提案し，学習系列長全体での性能改善を実証した。
Link: https://arxiv.org/abs/2603.12499
知識グラフにおける解釈可能な株価変動予測のための時間的ルールに固定された証拠の連鎖 (TRACE) [cs.CE, cs.AI]目的：知識グラフを用いた解釈可能な株価変動予測手法
- 金融市場の予測は投資判断の基礎であり，その精度向上が経済活動に大きく貢献する。
- 既存手法では，予測根拠が不透明であり，市場の変化への適応が難しいという課題がある。
- 経済的な意味を持つ情報に焦点を当て，根拠を明確にした予測手法を開発すること。
- 提案手法TRACEは，S\&P 500ベンチマークにおいて，既存手法を上回る精度，適合率，再現率，F1スコアを達成した。
- ルールに基づいた探索により，経済的に意味のあるパターンに焦点を当て，検索効率を高めている。
- テキスト情報と構造化データの関連性を明確にすることで，予測根拠の透明性と信頼性を向上させている。
Link: https://arxiv.org/abs/2603.12500
単純なPaine：プロンプト評価による軽量なテキスト画像生成の改善 [cs.RO, cs.CV, cs.AI, cs.LG]目的：拡散モデルにおけるテキスト画像生成品質の向上
- テキストから画像を生成する技術は，表現の幅広さから様々な分野で重要性が増している。
- 拡散モデルは確率的な処理を用いるため，同じプロンプトでも結果にばらつきが生じやすい。
- プロンプトと生成される画像の品質の関係を評価し，より良い画像を生成することを目指す。
- 提案手法Na\"ive PAINEは，初期ノイズとプロンプトから画像の品質を予測することで，高品質な画像を効率的に生成する。
- Na\"ive PAINEは，既存の手法と比較して，いくつかのプロンプト群ベンチマークで優れた性能を示す。
- 軽量であるため，既存の拡散モデルパイプラインに容易に組み込むことができる。
Link: https://arxiv.org/abs/2603.12506
決定依存的不確実性下におけるスペクトルリスク最適化のための適応的条件付きフォレストサンプリング [cs.LG, math.OC, stat.CO, stat.ML]目的：決定依存的不確実性下におけるスペクトルリスク最適化手法
- 金融工学等において，リスクを定量的に評価し，最適化することは重要である。
- 決定依存的不確実性下では，分布の近似やシミュレーションの精度が低下しやすい。
- テールリスク推定誤差に敏感な状況下での，ロバストな最適化手法を確立する。
- 提案手法ACFSは，2つのベンチマークにおいて，他の手法よりも低い中央値のスペクトルリスクを達成した。
- 特に，第2ベンチマークにおいて，GP-BOと比較して6.0%から20.0%の中央値ギャップを縮小した。
- ACFSは実行ごとの分散を大幅に削減し，再現性の高い結果が得られることが示された。
Link: https://arxiv.org/abs/2603.12507
ELLA：家庭における幼児期の言語発達のための生成AI搭載ソーシャルロボット [cs.HC, cs.AI]目的：幼児期の言語発達支援
- 言語発達は後の学習能力に影響する。家庭での支援は重要だが，質の高い支援へのアクセスは限られている。
- 従来のロボットはスクリプト化された対話しかできず，幼児との自然なコミュニケーションが難しかった。
- 生成AIを活用し，幼児の発達段階に合わせた対話を通じて言語能力を育むことを目指す。
- ELLAは，インタラクティブな物語，保護者選択の言語目標，スキャフォールドされた対話を通じて言語発達を支援する。
- 家庭でのワークショップや実証実験から，幼児の行動と関わり方を分析し，設計上の示唆を得た。
- 生成AI搭載ソーシャルロボットの設計において，継続的な対話と学習が重要であることが示唆された。
Link: https://arxiv.org/abs/2603.12508