arXiv雑要約

AI - 2026/05/07 公開

近傍誘導型効率的自己回帰集合Transformerによる3次元分子生成 [cs.LG, cs.AI]目的：3次元分子生成のための新しいモデル
- 創薬において，分子構造の最適化は重要な課題である。
- 既存のTransformerモデルでは，分子内の原子の順序依存性がある。
- 原子の順序に依存しない分子生成モデルの開発。
- 提案モデルNEATは，QM9およびGEOM-Drugsデータセットで最先端の生成性能を達成した。
- 既存のベースラインと比較して，生成速度が大幅に向上した。
- NEATは分子グラフを原子の集合として扱い，原子レベルの順序に依存しない分布を学習する。
Link: https://arxiv.org/abs/2512.05844
衝突認識融合：構造化された認知事前知識による大規模言語モデルの論理慣性の緩和 [cs.AI, cs.CL, cs.LG, cs.LO]目的：大規模言語モデルにおける論理慣性の軽減
- 大規模言語モデルの推論能力向上は重要だが，構造変化に対する脆弱性が課題。
- 既存モデルは，矛盾した前提下でも学習済みの推論経路を維持する傾向がある。
- 検証を先に行う構造化された事前知識を導入し，矛盾への対処能力を高める。
- Conflict-Aware Fusionパイプラインは，1.5Bおよび8Bのバックボーンにおいて，全ての主要なストレステストを飽和させた。
- Lean 4カーネルを用いた拡張により，古典的に導出可能な105問で99.0%のカーネル合意率を達成した。
- これにより，正式検証された強化学習トレーニングへの安全なアップグレードパスが確立された。
Link: https://arxiv.org/abs/2512.06393
公共部門AIにおける説明責任のためのニューロシンボリックフレームワーク [cs.CY, cs.AI, cs.LO]目的：公共部門AIの説明責任に関するフレームワーク
- 社会保障制度の自動化が進む中で，公平性と透明性の確保が重要である。
- AIによる判断根拠の説明が，法的根拠と矛盾する場合がある。
- AIの判断が法的に整合的であるかを検証し，説明責任を果たすことを目指す。
- 本研究では，カリフォルニア州のフードスタンプ制度(CalFresh)を対象に，法的根拠に基づいた説明可能性フレームワークを開発した。
- 法的要件を構造化オントロジーとして表現し，ルール抽出パイプラインを用いて検証可能な形式で表現した。
- フレームワークは，法的矛盾を検出し，違反された資格ルールを特定し，自動化された判断の根拠を追跡可能にすることで説明責任を支援する。
Link: https://arxiv.org/abs/2512.12109
言語モデル蒸留のためのクロス・トークナイザー尤度スコアリングアルゴリズム [cs.CL, cs.LG]目的：言語モデルの知識蒸留における，異なるトークナイザーを持つモデル間の尤度スコアリング手法
- 知識蒸留は，大規模言語モデルの効率的な転移学習に不可欠であり，エッジデバイスへの展開を可能にする。
- 教師モデルと生徒モデルでトークナイザーが異なる場合，確率空間の不一致が尤度スコアリングの課題となる。
- 異なるトークナイザー間の尤度スコアリングを可能にし，モデルサイズと性能の最適化を目指す。
- 提案手法は，Byte-Pair Encoding (BPE) アルゴリズムの再帰構造を利用し，クロス・トークナイザー尤度スコアリングの確率的フレームワークを構築する。
- 生徒モデルの語彙が教師モデルの語彙の部分集合である場合，正確な尤度計算と効率的なサンプリングが可能となる。
- Qwen2.5-1.5B モデルの蒸留において，メモリフットプリントを最大12%削減し，性能を最大4%向上させる。
Link: https://arxiv.org/abs/2512.14954
災害対応のための生成的な位置認識：確率的クロスビュー地理位置特定アプローチ [cs.CL, cs.AI, cs.CV]目的：災害時の迅速な位置特定を支援する地理位置特定手法の開発
- 地球温暖化の影響で災害が頻発化・深刻化しており，迅速な災害対応が重要である。
- 災害発生時の正確かつ迅速な位置特定は困難であり，意思決定や資源配分を妨げる課題である。
- 複数の視点からの情報を活用し，位置特定精度と説明可能性を高めることで，災害対応を支援する。
- 提案手法ProbGLCは，既存手法と比較して，位置特定精度において優れた性能を示した(Acc@1kmで0.86，Acc@25kmで0.97)。
- ProbGLCは，確率的分布と局所化スコアにより，モデルの解釈可能性を高めることができる。
- 多様な災害データセットでの実験により，ProbGLCが様々な災害に対応できる可能性が示唆された。
Link: https://arxiv.org/abs/2512.20056
脆弱な知識，堅牢な指示追従：Llama-3.2における幅刈り込みの二分法 [cs.CL, cs.RO, cs.CL, cs.AI, cs.LG]目的：GLU-MLP層の幅刈り込みによる拡張率の低減が，モデルの能力に及ぼす影響の系統的な二分性
- 大規模言語モデルの効率化は，計算コストの削減と実用性の向上に不可欠である。
- モデルの圧縮手法は，多くの場合，性能の低下を伴うという課題がある。
- 指示追従能力を維持しつつ，知識容量を調整する手法の確立を目指す。
- 幅刈り込みにより，知識を必要とするタスクの性能は低下する一方，指示追従能力は大幅に向上することが示された。
- 拡張率は，単なる圧縮指標ではなく，認知能力を選択的に調整する重要なアーキテクチャパラメータであることが明らかになった。
- 知識容量の低下と真実性の向上が負の相関関係にあり，刈り込みが選択的なフィルタとして機能することが示唆された。
Link: https://arxiv.org/abs/2512.22671
強誘電性シナプスを用いたパーソナライズされたスパイクニューラルネットワークによる脳波信号処理 [cs.NE, cs.AI, cs.ET, cs.LG, cs.SY, eess.SY]目的：脳波信号処理のための，強誘電性シナプスを有するスパイクニューラルネットワークのパーソナライズ
- 脳波に基づくブレイン・コンピュータ・インターフェースは，医療・福祉分野への応用が期待されており，その重要性は高い。
- 個人やセッションごとに変動する脳波信号に対応できず，汎用的なモデルの性能が限られている。
- 強誘電性メモリを活用し，リソース制約下でも適応性とパーソナライズされた学習を実現する。
- 強誘電性シナプスを用いたスパイクニューラルネットワークが，現実的なデバイス制約下で良好な運動想像デコーディング性能を示す。
- 混合精度戦略とデバイス特性を考慮した重み更新により，耐久性やエネルギー制約を緩和できる。
- ソフトウェアで学習した重みを転移させ，最終層のみを再学習することで，個人固有の分類精度を向上できる。
Link: https://arxiv.org/abs/2601.00020
文脈に沿って：文脈インライン化によるリポジトリレベルのコード生成 [cs.SE, cs.AI]目的：リポジトリレベルのコード生成
- ソフトウェア開発の効率化に貢献する技術であり，大規模コードベースの理解と生成を可能にする。
- 既存手法は表面的な類似性に依存し，リポジトリレベルの複雑な依存関係を捉えきれない。
- リポジトリ全体の文脈を理解し，高精度なコード生成を実現することを目指す。
- InlineCoderは未完成の関数をコールグラフにインライン化することで，リポジトリ理解の課題を関数レベルのコーディングタスクに転換する。
- アンカーと呼ばれるドラフト補完を生成し，perplexityベースの信頼度推定を用いて双方向のインライン化を行う。
- アップストリームインライン化とダウンストリーム検索により，包括的なリポジトリビューをLLMに提供する。
Link: https://arxiv.org/abs/2601.00376
効率的な多目的最適化のための動的ハイパーパラメータ重要度 [cs.LG]目的：多目的最適化におけるハイパーパラメータ重要度の動的評価と活用
- 機械学習モデルの選択は，精度，公平性，エネルギー消費など，複数の目的を考慮する必要があり，複雑である。
- 従来の多目的最適化手法では，全てのハイパーパラメータを同等に扱い，目的によって重要度が変化することを無視していた。
- 目的のトレードオフに応じて，影響の大きいハイパーパラメータに優先的に最適化を行うことで，探索を加速させる。
- 提案手法は，PyMOOとYAHPO-Gymの多様なタスクにおいて，Paretoフロントの品質を最大24%向上させた。
- 合成データを用いた実験では，従来のHPI統合手法と比較して，最終的な結果を2倍に改善した。
- HyperSHAPを利用し，ParEGOの目的重み付けを活用することで，重要度の低いハイパーパラメータを固定し，探索空間を削減した。
Link: https://arxiv.org/abs/2601.03166
ポストトレーニングにおける教師ありファインチューニングと強化学習の非分離性 [cs.LG, cs.AI, cs.IT, math.IT]目的：大規模言語モデルのポストトレーニングにおける教師ありファインチューニングと強化学習の相互作用
- 大規模言語モデルの性能向上は，様々な学習手法の組み合わせによって進められている。
- 教師ありファインチューニングと強化学習は目的が異なり，互いに影響を及ぼす可能性が指摘されている。
- 本研究は，両者の学習を分離することの理論的な限界を明らかにし，最適な学習順序と期間を導く。
- 教師ありファインチューニング後に強化学習を行う場合，強化学習は教師ありファインチューニングの損失を増加させる。
- 強化学習後に教師ありファインチューニングを行う場合，教師ありファインチューニングは強化学習の報酬を低下させる。
- 実験結果は，教師ありファインチューニングと強化学習を分離すると，従来の性能が低下することを確認した。
Link: https://arxiv.org/abs/2601.07389
SafeRedir：画像生成モデルにおける堅牢なアンラーニングのためのプロンプト埋め込みリダイレクト [cs.CV, cs.AI, cs.CR, cs.LG]目的：画像生成モデルにおける有害な概念の除去
- 画像生成モデルは創造的なコンテンツを生成するが，学習データ由来の不適切な概念を記憶し，安全性の問題を引き起こす。
- 事後フィルタリングでは，安全性確保が難しく，詳細なセマンティック制御が困難である。
- モデルの再学習コストや品質劣化，プロンプトの言い換えへの脆弱性といった既存手法の課題を解決する。
- SafeRedirは，推論時にプロンプト埋め込みをリダイレクトすることで，有害な概念を効果的に除去する軽量なフレームワークである。
- モデル自体を修正することなく，埋め込み空間におけるトークンレベルの介入を通じて安全な領域へ誘導する。
- 複数の実験で，効果的なアンラーニング能力，セマンティック/知覚的な保存，高品質な画像，および敵対的攻撃への耐性を示すことが確認された。
Link: https://arxiv.org/abs/2601.08623
ProFit：SFTにおける確率に基づくトークン選択による高価値シグナル活用 [cs.CL, cs.AI]目的：SFTにおける過学習の抑制
- LLMの性能向上には，人間の意図に沿った調整が不可欠であり，SFTはそのための基礎的な手法である。
- 従来のSFTは単一の正解に焦点を当て，言語の多様性を無視するため，モデルが本質的でない表現に過学習しやすい。
- 確率に基づくトークン選択により，表面的な過学習を抑制し，汎化性能の向上を目指す。
- ProFitは，低確率トークンを戦略的にマスクすることで，SFTにおける過学習を効果的に抑制できることが確認された。
- ProFitは，一般的な推論および数学的ベンチマークにおいて，従来のSFTベースラインを安定的に上回る性能を示した。
- 本研究は，トークンの確率と意味的重要性との間の関係性を明らかにし，より効率的なSFT手法の可能性を示唆する。
Link: https://arxiv.org/abs/2601.09195
torch-sla：PyTorchのための随伴ソルバーと疎テンソル並列化を用いた微分可能な疎線形代数 [cs.DC, cs.AI]目的：微分可能な疎線形代数ライブラリの開発
- 科学的機械学習の基盤技術であり，高性能な数値計算が不可欠である。
- PyTorchには，微分可能な疎線形代数に対する統一的なライブラリが存在しなかった。
- PyTorchにおける疎線形代数計算の効率化と微分可能性の実現を目指す。
- torchslaは，SciPy，Eigen，cuDSS，CuPyを含む5つのバックエンドに対応し，自動的にデバイスと問題サイズに応じて選択される。
- バッチ処理や共有・異なるスパースパターンの処理，ドメイン分解を用いたマルチGPU実行をサポートすることでスケーラビリティを向上させている。
- O(1)-グラフ随伴微分フレームワークと，自動微分可能な分散ハロー交換レイヤーにより，大規模計算を可能にしている。
Link: https://arxiv.org/abs/2601.13994
仮想センサのためのスケーラブルなマルチタスクモデル [cs.LG]目的：仮想センサのマルチタスクモデルの構築
- 重要インフラ等の監視において，高価な物理センサの代替手段として機械学習を活用する重要性が高まっている。
- 既存手法は，各センサごとに専門知識が必要であり，タスク間の相乗効果を活用できていないという課題がある。
- 本研究では，計算効率を維持しつつ，多様な仮想センサの同時予測を可能にするモデルを提案することでこの課題を解決する。
- 提案モデルは，従来の基盤モデルと比較して，最大415倍の計算時間短縮と951倍のメモリ削減を達成した。
- 個々の仮想センサモデルと比較して，同程度の推論速度で予測精度を向上させ，数百個のセンサへの拡張性も実証された。
- 本手法は，大規模センサーネットワークへの実用的な展開を可能にする。
Link: https://arxiv.org/abs/2601.20634
視覚的分解拡散オートエンコーダ：基盤モデルのためのスケーラブルな反事実生成 [cs.LG]目的：基盤モデルにおける反事実生成
- 基盤モデルの性能向上には，頑健性向上が不可欠である。
- 基盤モデルは，見かけ上の相関や「Clever Hans」戦略に脆弱である。
- 基盤モデルのショートカット学習を軽減し，性能を向上させる。
- DiDAEは，凍結された基盤モデルと分解辞書学習を統合した新しいフレームワークである。
- DiDAE-CFKDは，不均衡データセットにおけるダウンストリーム性能を改善する最先端の性能を達成した。
- 既存手法より高速かつ多様な反事実を生成可能である。
Link: https://arxiv.org/abs/2601.21851
データに基づく安全重要AIシステムの運用条件の定義 [cs.AI]目的：安全重要AIシステムの運用条件定義手法
- AIの応用範囲拡大に伴い，安全性が求められる分野での活用が増加している。
- 複雑なシステムにおいて，AIシステムの運用範囲（ODD）の明確な定義が困難である。
- 過去のデータからODDを定義することで，安全性の高いAIシステムを構築することを目指す。
- 提案手法は，多次元カーネルベース表現を用いて，事後的にODDを定義する。
- モンテカルロ法と航空分野での実例により，その有効性が検証された。
- データ駆動型ODDが，元の隠れたODDと類似したデータセットを生成可能であることが示された。
Link: https://arxiv.org/abs/2601.22118
OpenVTON-Bench：制御可能なバーチャル試着評価のための大規模高解像度ベンチマーク [cs.CV, cs.AI]目的：制御可能なバーチャル試着システムの評価基準
- バーチャル試着技術は，オンラインショッピングやパーソナルファッションの分野で重要性が増している。
- 既存の評価指標は，微細なテクスチャや意味の一貫性を定量化するのに不十分である。
- 大規模かつ多様なデータセットと，信頼性の高い評価プロトコルの開発を目的とする。
- OpenVTON-Benchは，約10万組の高解像度画像ペアを含む大規模ベンチマークである。
- 提案された多次元評価プロトコルは，人間の評価と高い一致性を示す（Kendall's τ = 0.833）。
- このベンチマークは，バーチャル試着技術の評価における新たな標準を確立する。
Link: https://arxiv.org/abs/2601.22725
構文およびコンパイルを維持したLLM脆弱性検出器の回避 [cs.CR, cs.AI, cs.LG]目的：LLMベースの脆弱性検出器に対する回避攻撃の堅牢性評価
- ソフトウェア開発におけるセキュリティの重要性が増しており，自動脆弱性検出のニーズが高い。
- 既存の脆弱性検出器は，構文変更やコンパイルを維持した攻撃に対して脆弱である可能性がある。
- 構文・コンパイルを維持した攻撃に対する脆弱性検出器の堅牢性を定量的に評価する。
- 現在のモデルは高い検出率を示すものの，回避攻撃に対する抵抗性は極めて低い。
- 最適化された攻撃文字列は，GPT-4oを含む様々なAPIに対して有効に機能する。
- ベンチマークの精度だけでは，脆弱性検出器のセキュリティを保証できないことが示された。
Link: https://arxiv.org/abs/2602.00305
3Dマルチビュー行動条件付きロボット操作事前学習のためのコントラスト学習：CLAMP [cs.RO, cs.AI, cs.CV, cs.LG]目的：3Dマルチビューデータとロボット行動を用いた，ロボット操作の事前学習フレームワーク
- ロボット操作において，正確な3D空間情報の把握は不可欠であり，その重要性は高い。
- 既存の2D画像表現は3D空間情報を捉えきれず，精密な操作に課題がある。
- 本研究は，3D空間情報を考慮した事前学習により，ロボット操作の性能向上を目指す。
- 提案手法CLAMPは，点群データとロボット行動を組み合わせたコントラスト学習により，3D幾何学的情報と行動パターンの関連性を学習する。
- Diffusion Policyを用いた初期化により，ファインチューニングのサンプル効率と性能を向上させている。
- シミュレーションおよび実世界環境における複数のタスクで，最先端の手法を上回る性能を実証した。
Link: https://arxiv.org/abs/2602.00937
自己回帰的でありながら修正可能：セキュアなコード生成のためのデコーディング時の修正 [cs.SE, cs.AI]目的：セキュアなコード生成におけるデコーディング時の修正手法
- LLMによるコード生成は，ソフトウェア開発の自動化に不可欠であり，生産性向上に貢献する。
- 既存のコード生成モデルは単調なプロセスに限定され，人間のような試行錯誤による修正が困難である。
- モデル自身が内部的に修正を行うことで，遅延なくセキュアなコード生成を可能にすることを目指す。
- Stream of Revisionにより，モデルは自身の生成履歴を遡って編集できるようになり，動的な自己修正が可能となった。
- 実験結果から，Stream of Revisionは脆弱性を大幅に削減し，推論オーバーヘッドを最小限に抑えることが示された。
- 本手法は，外部ツールに依存せず，モデルの潜在能力をリアルタイムで活用する。
Link: https://arxiv.org/abs/2602.01187
動的システムのオペレーター学習のためのマルチスケール・ウェーブレットTransformer [cs.LG]目的：動的システムのオペレーター学習における新しいモデル
- 近年，数値シミュレーターに比べて高速なデータ駆動型代理モデルが求められている。
- 既存の機械学習モデルは，高周波成分を減衰させ，微細な構造の表現を損ねる傾向がある。
- 高周波成分の適切な表現を通じて，長期的安定性を向上させることを目指す。
- マルチスケール・ウェーブレットTransformer(MSWT)を提案し，ウェーブレット変換により周波数成分を分離。
- MSWTは，高周波特徴を保持し，スケール間および周波数帯間の依存関係を捉えるウェーブレットベースの注意機構を採用。
- カオス的動的システムや気候再解析データにおける実験により，大幅な誤差削減とスペクトル忠実度の向上が確認された。
Link: https://arxiv.org/abs/2602.01486
MoLF：パン癌における組織学的画像からの空間遺伝子発現予測のための潜在的フローの混合 [cs.LG]目的：パン癌における空間遺伝子発現予測
- 癌研究において，遺伝子発現と組織構造の関係を理解することは，診断や治療法の開発に不可欠である。
- 既存手法は単一組織に限定され，癌種間の共通原理の活用やデータ不足時の応用が困難である。
- 癌種間の多様性を考慮しつつ，汎用的な予測モデルを構築することで，より精度の高い予測を実現する。
- MoLFは，既存の専門モデルおよび汎用モデルを凌駕し，パン癌ベンチマークにおいて最先端の性能を達成した。
- MoLFは，異なる組織パターンを効率的に分離し，多様な癌種に対応可能なアーキテクチャを実現した。
- 種を越えたデータへのゼロショット汎化能力を示し，基本的な組織分子メカニズムを捉えている可能性を示唆した。
Link: https://arxiv.org/abs/2602.02282
ノルムアンカーがモデル編集の持続性を高める [cs.CL, cs.LG, cs.AI]目的：逐次的な Locate-and-Edit モデル編集における性能劣化
- 大規模言語モデルの編集は，知識の更新やカスタマイズに不可欠であり，その安定性が重要である。
- 編集回数の増加に伴い，モデルの性能が急激に低下する現象が課題となっていた。
- 編集時のノルムの増大を抑制し，モデル編集の持続性と性能を向上させることを目指す。
- 提案手法である Norm-Anchor Scaling (NAS) は，編集可能な範囲を4倍以上に拡大することに成功した。
- NASは，長期的な編集性能を平均72.2%向上させ，単一編集の有効性は維持している。
- NASは，わずか一行の修正と無視できる計算オーバーヘッドで実装可能である。
Link: https://arxiv.org/abs/2602.02543
ラグランジュ関数は拡散モデルを通して安全な強化学習をどのように導くか？ [cs.LG, cs.SY, eess.SY]目的：拡散モデルを用いた安全な強化学習におけるアルゴリズムの提案
- 強化学習は，ロボティクスやゲームなど，様々な分野で重要な役割を担う技術である。
- 従来の強化学習は安全性の確保が難しく，特にオンライン環境での応用が制限されていた。
- 拡散モデルの不安定性を解消し，安全性を考慮した強化学習アルゴリズムを開発すること。
- 提案手法ALGDは，ラグランジュ関数をエネルギー関数として解釈し，局所的に凸なエネルギー地形を構築することで，安定した方策生成と学習を実現した。
- 理論的解析と広範な実験により，ALGDが理論的根拠と実証的な有効性を有することが示された。
- ALGDは，多様な環境において，堅牢かつ安定した性能を発揮することが確認された。
Link: https://arxiv.org/abs/2602.02924
Quant VideoGen：2ビットKVキャッシュ量子化による自己回帰長尺ビデオ生成 [cs.LG]目的：自己回帰型ビデオ拡散モデルにおけるKVキャッシュメモリの削減と，それによる長尺ビデオ生成能力の向上
- ビデオ生成技術は近年急速に進歩しているが，大規模な計算資源が必要となる
- KVキャッシュメモリがビデオ生成のボトルネックとなり，実用的なハードウェアでの展開を阻害している
- KVキャッシュ量子化によりメモリ使用量を削減し，長尺ビデオ生成における一貫性を改善すること
- Quant VideoGen (QVG) は，学習不要なKVキャッシュ量子化フレームワークであり，ビデオの時空間的な冗長性を活用する。
- QVGは，KVキャッシュメモリを最大7.0倍削減し，エンドツーエンドの遅延オーバーヘッドを4%未満に抑えながら，既存手法を凌駕する生成品質を達成した。
- LongCat Video，HY WorldPlay，Self Forcingのベンチマークにおいて，QVGは品質とメモリ効率の新たなパレート最適解を確立した。
Link: https://arxiv.org/abs/2602.02958
スパース性は組合せ的深度：熱帯幾何によるMoE表現力の定量化 [cs.LG]目的：MoEの表現力に関する理論的分析
- 大規模言語モデルの性能向上に，MoEアーキテクチャが不可欠な要素となっている。
- MoEの成功は経験則に依存しており，幾何学的な表現力に関する理論的理解が不足している。
- MoEのスパース性が，表現力の向上にどのように貢献するかを定量的に解明する。
- MoEのTop-$k$ルーティングは，熱帯幾何学における$k$次初等対称多項式と代数的に同型であることが示された。
- スパース性は組合せ的深度と関連し，幾何的容量を二項係数$\binom{N}{k}$によって拡大する。
- MoEアーキテクチャは低次元データにおける容量崩壊に対して，組合せ的レジリエンスを示す。
Link: https://arxiv.org/abs/2602.03204
分散を超えて：稀少事象の増幅と双方向ペアリングによるプロンプト効率の良いRLVR [cs.CL, cs.LG, cs.AI]目的：検証可能な報酬を用いた強化学習(RLVR)におけるプロンプト選択手法の改善
- 大規模言語モデルの推論能力向上は，多様な課題解決において重要である。
- 既存のプロンプト選択は分散に基づくため，最適化が不安定になりやすい。
- 稀少事象の増幅と双方向ペアリングにより，学習効率を向上させる。
- 提案手法は，成功事例と失敗事例を双方向から学習に活用することで，より効率的な学習を実現する。
- Qwen2.5-Math-7Bにおける実験で，既存手法と比較してPass@8が16.8から22.2に，Pass@64が94.0から97.0に向上した。
- 大規模なRLVRと同等の性能を，より少ないプロンプト数で達成できることが示された。
Link: https://arxiv.org/abs/2602.03452
知識グラフ誘導による適応的マルチロボット計画・再計画のためのKGLAMP [cs.RO, cs.AI, cs.ET, cs.MA]目的：異種マルチロボットチームの適応的計画・再計画
- 多様な能力を連携させる長時間のミッションにおいて，マルチロボットシステムの活用が拡大している。
- 既存の計画手法では，正確な記号表現の構築や動的な環境下での計画一貫性の維持が課題である。
- 知識グラフを活用し，環境変化に対応可能な柔軟な計画・再計画手法を確立すること。
- KGLAMPは，知識グラフによってLLMの計画生成を誘導するフレームワークである。
- 知識グラフは，オブジェクト間の関係性やロボットの能力を構造的に表現し，PDDL問題仕様の生成精度を向上させる。
- MAT-THORベンチマークにおいて，既存手法と比較して性能が25.3%以上向上した。
Link: https://arxiv.org/abs/2602.04129
DFPO：LLMのポストトレーニングに向けた分布フローを通じた価値モデリングのスケーリング [cs.LG, cs.CL]目的：LLMのポストトレーニングにおける，ロバスト性と汎化性能の向上
- 現実世界の環境での強化学習は，ノイズの多い教師信号と，特にLLMのポストトレーニングにおけるOOD汎化の悪さにより課題となる。
- 従来の分布強化学習は，複数の分位点を用いてロバスト性を向上させるものの，各分位点を独立に学習するため，状態情報に基づく詳細な条件付けが不足している。
- DFPOは，価値を連続的なフローとしてモデル化することで，より正確なアドバンテージ推定を可能にし，ノイズの多いフィードバック下での学習を安定化させる。
- DFPOは，対話，数学推論，科学的タスクにおいて，PPOやFlowRLなどの既存手法をノイズの多い教師信号下で上回り，学習の安定性と汎化性能を改善する。
- DFPOは，価値フローフィールドを学習することで，孤立した分位点予測よりも豊かな状態情報を捉え，より正確なアドバンテージ推定を実現する。
- 条件付きリスク制御と価値フロー軌跡に沿った一貫性制約を統合することで，ノイズの多いフィードバック下での学習を安定化させる。
Link: https://arxiv.org/abs/2602.05890
最適輸送による表形式異常検知の較正 [cs.LG]目的：表形式データの異常検知における性能向上
- 表形式データは多様性に富み，実世界の問題解決において広く利用されている。
- 既存の異常検知手法は，データ特性への暗黙の仮定に依存し，汎用性に課題がある。
- データセットに依存しない，汎用的な異常検知手法の性能向上を目指す。
- 提案手法CTADは，既存の異常検知器の出力値を，サンプルごとに較正することで性能を向上させる。
- CTADは，最適輸送距離を用いて，テストサンプルが正常データの分布をどれだけ乱すかを評価する。
- 実験の結果，CTADは様々なデータセットと手法において，統計的に有意な性能改善が確認された。
Link: https://arxiv.org/abs/2602.06810
多目的アライメントにおける目的間干渉の解明 [cs.CL, cs.LG]目的：大規模言語モデルにおける多目的アライメント時の目的間干渉の存在とその軽減策
- 言語モデルの能力向上には，多様な目的を同時に最適化する多目的アライメントが不可欠である。
- 多目的アライメントでは，ある目的の性能向上が他の目的の性能低下を引き起こす干渉が頻発する。
- 目的間干渉を定量的に分析し，その影響を軽減する手法を開発すること。
- 目的間の報酬の共分散が正である場合に，その目的の性能が向上することを示す局所的な共分散則を導出した。
- 共分散を維持することで目的間干渉を軽減する，プラグアンドプレイ可能な適応重み調整手法（CTWA）を提案した。
- 非凸なスカラー化最適化がグローバル収束を達成するための条件と，目的間干渉がモデルの幾何学的特性に依存する様子を明らかにした。
Link: https://arxiv.org/abs/2602.06869
SWEコンテキストベンチ：コーディングにおける文脈学習のベンチマーク [cs.SE, cs.AI]目的：コーディングにおける文脈学習の評価
- ソフトウェア開発において，LLMを活用する重要性が増している。
- 既存のベンチマークは独立したタスク評価に偏り，過去の経験の再利用能力を測れていない。
- 過去の経験の再利用による効率向上を定量的に評価するベンチマークの必要性。
- SWE-ContextBenchは，1100件の基本タスクと376件の関連タスクで構成され，GitHubのIssueとPull Requestの関係に基づいている。
- 実験結果から，正確に要約・検索された過去の経験は，特に難しいタスクにおいて，解決精度を向上させ，実行時間とトークンコストを削減することが示された。
- 文脈管理と検索の精度が重要であり，SWE-ContextBenchはコーディングエージェントの文脈学習を研究するための基準となる。
Link: https://arxiv.org/abs/2602.08316
UniComp：プルーニング，量子化，知識蒸留による大規模言語モデル圧縮の統一的評価 [cs.IR, cs.LG]目的：大規模言語モデル圧縮技術の比較評価
- 大規模言語モデルの利用拡大には，計算資源の制約克服が不可欠である。
- 既存研究では，プルーニングと量子化に偏り，能力評価が不十分である。
- 多様な評価軸で圧縮技術を比較し，性能低下の要因を特定する。
- 圧縮手法の評価において，事実記憶は比較的維持される一方，推論能力や多言語対応能力が低下する傾向が確認された。
- 性能維持と信頼性の維持は必ずしも相関せず，性能向上だけでは信頼性を保証できないことが示された。
- プルーニングされたモデルに対してタスク固有のキャリブレーションを施すことで，推論性能が最大50%相対的に向上することが示された。
Link: https://arxiv.org/abs/2602.09130
SQuTR：音声クエリからテキスト検索におけるロバスト性ベンチマーク [cs.RO, cs.IR, cs.AI]目的：音声クエリからテキスト検索のロバスト性評価
- 情報検索において，音声によるクエリは重要なインタラクション手段である。
- 既存の評価データセットは，単純なクエリと限定的なノイズ条件に限られ，実環境での頑健性を測れない。
- 複雑な音響環境下での検索システムのロバスト性を客観的に評価できるベンチマークを提供する。
- SQuTRは，英語と中国語のテキスト検索データセットから37,317件のクエリを集約した大規模データセットである。
- 200人の話者の音声プロファイルと17種類の環境ノイズを合成し，再現可能なロバスト性評価を可能にした。
- 実験結果から，ノイズが増加すると検索性能が低下し，システムによってその低下幅が大きく異なることが示された。
Link: https://arxiv.org/abs/2602.12783
BEAGLE：根拠に基づいた学習者エミュレーションのための行動強制エージェント [cs.AI]目的：オープンエンドな問題解決環境における学習者の行動シミュレーション
- 教育研究において，適応型チューターシステムの訓練や教育介入の検証は重要である。
- プライバシーの問題や大規模な長期研究のコストにより，現実的な学習データの収集が困難である。
- LLMの効率性を重視した偏りを修正し，初心者学習者の不確実な反復的学習を再現すること。
- BEAGLEは，自己調整学習理論を取り入れた神経記号的フレームワークである。
- Pythonプログラミング課題において，既存のベースラインよりも現実的な軌跡を大幅に再現した。
- チューリングテストにおいて，参加者はBEAGLEの軌跡と実際の学生データを区別できなかった。
Link: https://arxiv.org/abs/2602.13280
視覚言語較正による解析的継続学習の発展 [cs.LG]目的：事前学習済みモデルを用いた解析的継続学習における課題克服
- 継続学習は，モデルが新しいタスクを学習する際に，過去の知識を保持することが重要である。
- 解析的継続学習は効率的だが，誤差の蓄積や特徴量の不適合が性能低下の原因となる。
- 表現の硬直性を緩和し，視覚と言語の情報を整合させることで，継続学習の精度向上を目指す。
- 提案手法VILAは，特徴量レベルでの幾何学的較正と，決定レベルでのクロスモーダルな意味的制約を組み合わせる。
- VILAは，８つのベンチマークにおいて既存手法を上回り，特に細粒度分類や長系列データで優れた性能を示す。
- 本手法は，解析的学習の効率性と，高精度な予測の両立を実現する。
Link: https://arxiv.org/abs/2602.13670
暗黙のカリキュラム：検証可能な報酬を用いた強化学習における学習ダイナミクス [cs.LG, cs.AI, math.OC, stat.ML]目的：強化学習における学習ダイナミクスの理論的考察
- 大規模な推論モデルの進歩には強化学習が不可欠である。複雑なタスク遂行能力向上への貢献が大きい。
- 最終的な結果のみに基づく報酬が，長期的推論の障壁をどのように克服するか不明確である。
- 強化学習における学習順序が，学習の効率と安定性に与える影響を解明する。
- 混合難易度での学習は，明示的なスケジュールなしに，易しい問題から難しい問題へと自然なカリキュラムに従うことが示された。
- 難易度のスペクトルが滑らかであれば，学習は安定したリレー状態に入り，易しい問題の勾配が難しい問題の学習を促進する。
- スペクトルが不連続な場合，グロッキング型の相転移が起こり，学習が停滞することが確認された。
Link: https://arxiv.org/abs/2602.14872
分散推定器：回路分割による量子ニューラルネットワークの分散学習 [cs.DC, cs.LG, quant-ph]目的：量子ニューラルネットワークの分散学習手法の開発
- 量子機械学習は，古典計算機では困難な問題を解決する可能性を秘めており，注目を集めている。
- 大規模な量子回路の学習は計算コストが高く，実用的な規模での学習が課題となっている。
- 回路分割による分散学習のオーバーヘッドを定量化し，スケーラビリティを評価することで，実用化に向けた課題を明確にする。
- 回路分割における再構成処理が，クエリごとの処理時間の大部分を占めることが判明した（3カットで中央値53%，95パーセンタイル58%）。
- Irisデータセットでは精度が完全に維持され，MNISTデータセットでもカット構成に関わらず，系統的な精度劣化は見られなかった。
- ガウスノイズやFGSM摂動に対するロバスト性は維持され，いくつかのカット構成ではベースラインよりも優れたロバスト性を示した。
Link: https://arxiv.org/abs/2602.16233
2025年AIエージェント・インデックス：実用化されたエージェントAIシステムの技術的・安全性機能の記録 [cs.CY, cs.AI]目的：エージェントAIシステムの技術的・安全性機能に関する情報
- AI技術は社会実装が進んでおり，その動向把握が不可欠である。
- AIエージェント生態系は複雑で変化が速く，情報公開が不十分である。
- エージェントAIシステムの現状を把握し，安全性に関する課題を明確化する。
- 本研究では，30の最先端AIエージェントに関する情報を収集・記録した。
- エージェント開発者間の情報公開レベルに差があり，安全性に関する情報開示が少ない傾向が見られた。
- 開発の動向，能力，透明性に関する傾向が明らかになった。
Link: https://arxiv.org/abs/2602.17753
マルチ目的嗜好ファインチューニングにおける非推移性への対処： Blackwellへの回帰 [cs.LG]目的：マルチ目的嗜好ファインチューニングにおける非推移性
- 人間の嗜好は複雑であり，複数の目的を考慮する必要性が高まっている。
- 複数の目的を扱う場合，嗜好の非推移性が生じやすく，最適なポリシーの決定を困難にする。
- マルチ目的における非推移性に対処し，安定した学習を可能にする手法を開発すること。
- 本研究では，マルチ目的における非推移性に対応する新しいゲーム理論的な概念「Maximum Entropy Blackwell Winner (MaxEntBW)」を提案した。
- 効率的な計算のために，MaxEntBWを算出するアルゴリズムPROSPERを開発し，スカラー化を必要とせずに複数目的を直接扱える。
- 大規模言語モデルのファインチューニング実験において，PROSPERは既存手法を上回り，7Bおよび3Bパラメータモデルで優れた性能を示した。
Link: https://arxiv.org/abs/2602.19041
ノイズ除去粒子フィルタ：単段階目的による状態推定学習 [cs.RO, cs.AI, cs.LG]目的：状態推定における学習手法
- ロボット工学において，正確な状態推定は自律的な行動を可能にする上で不可欠である。
- 従来の学習ベースの手法は，解釈が難しく，学習コストが高いという課題がある。
- 個々の状態遷移から学習することで，効率的かつ解釈可能な状態推定を目指す。
- 提案手法は，ノイズ除去スコアマッチングを用いて測定モデルを暗黙的に学習する。
- 学習されたデノイザとダイナミクスモデルを用いて，ベイジアンフィルタリング方程式を近似的に解く。
- シミュレーション実験において，提案手法は既存手法と同等の性能を示した。
Link: https://arxiv.org/abs/2602.19651
メタ学習とメタ強化学習 - DeepMindの適応エージェントへの道筋 [cs.AI, cs.LG]目的：メタ学習およびメタ強化学習における主要なアルゴリズムの変遷
- 人間は過去の知識を活用して新しい課題に適応できるが，従来の機械学習モデルはそれが苦手である。
- 従来の機械学習はタスク固有の学習に依存しており，汎化性能が低いという課題がある。
- 様々なタスクから知識を転移し，少ないデータで新しい課題に素早く適応できるモデルを構築すること。
- 本調査では，メタ学習とメタ強化学習をタスクベースで厳密に形式化し，DeepMindの適応エージェントを理解するための基礎を提供する。
- 主要なアルゴリズムを追跡することで，適応エージェントと汎化的なアプローチの本質的な概念を明確にする。
- メタ学習が，タスク固有の訓練への依存を克服し，モデルの適応能力を向上させる可能性を示唆している。
Link: https://arxiv.org/abs/2602.19837
失敗の多様体：言語モデルにおける行動吸引領域 [cs.LG, cs.AI, cs.CR]目的：大規模言語モデルの失敗領域の体系的なマッピング
- AIの安全性確保は重要であり，その理解を深める必要性がある。
- 既存研究では安全な領域に焦点を当て，危険な領域の構造が不明である。
- 言語モデルの安全性を高めるための失敗領域の構造解明を目指す。
- MAP-Elitesを用いて，大規模言語モデルの失敗領域を最大63%網羅的に探索した。
- モデルごとに異なる脆弱性地形を明らかにし，その構造的な特徴を分析した。
- 既存の攻撃手法では得られない，モデルの安全性に関する包括的な地図を生成した。
Link: https://arxiv.org/abs/2602.22291
ArtiFixer：自己回帰拡散モデルによる3D再構成の拡張と改善 [cs.CL, cs.CV, cs.AI, cs.GR, cs.LG]目的：3D再構成における欠損領域の補完と品質向上
- 3D再構成技術は，仮想現実やロボティクスなど幅広い分野で重要性が高まっている。
- 既存の3D再構成手法は，観察されていない領域の再構成に課題があり，不自然な結果となる場合がある。
- 本研究は，自己回帰拡散モデルを用いて，既存手法の課題を克服し，高精度な3D再構成を実現することを目指す。
- 提案手法は，既存の3D再構成手法が失敗するようなシナリオでも，妥当な再構成を生成できる。
- ベンチマークデータセットを用いた評価により，既存の最先端手法を1～3dB PSNRで上回る性能が示された。
- 強力な双方向生成モデルと効率的な自己回帰モデルの組み合わせにより，高品質かつ効率的な3D再構成が可能となった。
Link: https://arxiv.org/abs/2603.00492
LoRAを知識メモリとして捉える：経験的分析 [cs.HC, cs.LG]目的：LoRAに基づく知識メモリの容量と構成可能性の解明
- 事前学習済み大規模言語モデルの性能向上が求められる中で，継続的な知識更新が重要課題となっている。
- 文脈学習や検索拡張生成などの手法は制約があり，効率的な知識更新が困難である。
- LoRAの設計空間を体系的に分析し，知識メモリとしての運用範囲を明らかにすることを目指す。
- LoRAは，文脈依存的な手法とは異なり，モジュール化された知識メモリとして機能することが示された。
- LoRAの知識保存容量や内部化の最適化，複数モジュールの拡張性，長文脈推論における評価が行われた。
- 本研究は，LoRAを検索拡張生成や文脈学習と並ぶ，記憶の相補的な軸として位置づける。
Link: https://arxiv.org/abs/2603.01097
構造的事前知識を用いた合成事前学習による関係性インコンテキスト学習 [cs.DB, eess.SY, cs.SY, math.OC, cs.LG, cs.AI, cs.DB]目的：関係データベースに対する基礎モデルの構築
- 現代ビジネスの根幹を担うデータベースにおいて，テキストや画像と同等の基礎モデルが求められている。
- 高品質なデータベースは非公開かつ構造が異質であり，インターネット規模での事前学習が困難である。
- 構造的事前知識に基づき合成データを用いることで，データ不足の問題を解決し，汎用的なデータベース処理能力を獲得する。
- 200万を超える合成データを用いた事前学習により，RDB-PFNは新たなデータベースに即座に適応するインコンテキスト学習能力を獲得した。
- 19の現実世界のタスクにおいて，RDB-PFNはグラフベースや単一テーブルの基礎モデルを上回る性能を示した。
- RDB-PFNは軽量なアーキテクチャと高速な推論を実現しており，実用的な応用が期待される。
Link: https://arxiv.org/abs/2603.03805
容量を考慮した混合則による効率的なLLMデータ最適化 [cs.LG]目的：大規模言語モデルのデータ混合最適化
- LLMの性能は学習データに大きく依存し，データ混合戦略が重要である。
- 既存手法は計算コストが高いか，大規模モデルへの汎化が難しい。
- 計算効率の良いデータ混合スケーリングパイプラインを開発し，最適化問題を解決する。
- 容量を考慮した混合則CAMELを提案し，モデルサイズと混合の非線形な相互作用をモデル化した。
- 検証損失からベンチマーク精度を予測する法則を導入し，エンドツーエンドの性能予測を実現した。
- 混合最適化コストを50%削減し，ベンチマーク性能を最大3%向上させた。
Link: https://arxiv.org/abs/2603.08022
量子回路ボーンマシンに基づく金融ボラティリティ予測のハイブリッド量子古典フレームワーク [cs.SC, cs.LG, cs.AI, quant-ph]目的：金融ボラティリティ予測のためのハイブリッドフレームワーク
- 金融市場の予測は，リスク管理や投資戦略に不可欠であり，その精度向上は常に求められている。
- 市場データの非線形性や相関性の高さから，従来のモデルでは高精度な予測が困難である。
- 量子計算の力を活用し，古典モデルの予測精度向上を目指す。
- 提案モデルは，SSE Composite指数とCSI 300指数の5分足データにおいて，MSE，RMSE，QLIKEの各指標で古典的なLSTMモデルを大幅に上回る性能を示した。
- トレーニング中に「Drop-Prior」メカニズムを導入することで，LSTMは量子事前分布からの構造化情報を暗黙的に学習することが確認された。
- 量子モジュールをオフにしても高い予測精度を維持することで，古典モデルに量子計算の恩恵をもたらす実用的な経路を示した。
Link: https://arxiv.org/abs/2603.09789
医療における信頼できるAIの推進：メタ研究を通じた学際的なデザイン思考ワークショップの結果 [cs.SI, cs.CY, cs.AI]目的：医療における信頼できるAI推進のための課題と解決策の検討
- 医療分野におけるAI活用は，診断や治療の精度向上に貢献するが，倫理的課題も存在する。
- AI倫理原則を実践に移す上での具体的な課題や，透明性・再現性の確保が不十分である。
- メタ研究のアプローチを用いて，医療AIの信頼性向上に貢献する具体的な方策を提示する。
- メタ研究は，医療AIにおける倫理的要件の複雑さ，共通理解の欠如といった喫緊の課題に対処するための具体的な貢献を提供する。
- ワークショップでは，既存の研究の相互関係を統合し，今後の研究ステップとギャップを特定したアイデアカタログとロードマップが作成された。
- これらの成果は，学際的な取り組みの基盤となり，医療AIの信頼性を高めるための将来の研究を促進することが期待される。
Link: https://arxiv.org/abs/2603.13286
リング型ポリゴン注釈に対するトポロジー保存データ拡張 [cs.CV, cs.AI, cs.LG]目的：リング型ポリゴン注釈におけるトポロジー保存データ拡張手法
- セグメンテーションにおいて，データの幾何学的拡張は広く用いられている。
- 構造化されたドメインでは，変換後にポリゴン注釈の有効性が損なわれる場合がある。
- ポリゴンベースのセグメンテーションにおける注釈の一貫性向上を目指す。
- 提案手法は，一般的な幾何学的変換においてほぼ完璧な環状隣接関係の保存(CAP)を達成する。
- 手法はわずかなオーバーヘッドで既存の事前処理ワークフローに統合可能である。
- 内側の空間を持つ構造において，領域の断片化を防ぐことが可能となる。
Link: https://arxiv.org/abs/2603.14764