arXiv雑要約

AI - 2026/05/14 公開

コントラスト視点からの検証可能な報酬を用いた強化学習の再検討 [cs.LG, cs.AI]目的：大規模言語モデルの推論能力を向上させるための強化学習による報酬形成手法の改善
- 大規模言語モデルの推論能力向上は，自然言語処理分野における重要な課題である。
- 既存手法では，報酬の設計や割当が不適切であり，十分な性能向上が得られていない。
- コントラスト学習を用いて，報酬形成プロセスにおけるスコアリングとクレジット割当の改善を目指す。
- 提案手法ConSPOは，既存のRLVRベースラインと比較して，数学的推論ベンチマークにおいて一貫して優れた性能を示す。
- ConSPOは，生成尤度と最適化されるロールアウトスコアを一致させることで，スコアリングのずれを解消する。
- グループごとのInfoNCEスタイル目的関数により，ロールアウト間の相対的なスコア差を考慮したクレジット割当が可能となる。
Link: https://arxiv.org/abs/2605.12969
検索は安価，コードを見せろ：検索拡張生成のための実行可能な多段推論 [cs.CL, eess.SY, cs.SY, cs.RO, cs.SY, eess.SY, cs.AI]目的：知識集約型質問応答における多段推論の実現
- 質問応答システムは，人間にとって自然な形で知識にアクセスする必要があり，その重要性は増している。
- 既存のシステムは，複数の検索と推論ステップが必要な多段質問に対して脆弱である。
- 推論過程をコードとして表現することで，多段推論の信頼性と解釈性を向上させる。
- 本研究では，多段RAGをプログラム合成と実行として再構築するPyRAGフレームワークを提案する。
- PyRAGは，推論過程をPythonプログラムとして表現することで，中間状態の可視化と決定的なフィードバックを可能にする。
- 5つのQAベンチマークにおいて，PyRAGは既存の基盤モデルを上回り，特に構成的な多段データセットで大きな改善が見られた。
Link: https://arxiv.org/abs/2605.12975
LLMによる継続的な更新が，有用な記憶を劣化させる [cs.AI]目的：LLMによる記憶の更新が，有用な記憶に与える影響の解明
- 過去の経験からの学習は，エピソード記憶と抽象化された教訓の二つの要素が重要である。
- LLMによる記憶の書き換え更新システムにおいて，記憶の信頼性が低下する問題がある。
- LLMによる更新で劣化する記憶の問題を解決し，より堅牢なエージェントメモリを構築する。
- LLMによって構築された統合された記憶は，有用な経験に基づいていても，しばしば誤りを含むことが明らかになった。
- 記憶の有用性は一時的に向上するものの，最終的には低下し，記憶を持たない場合よりも性能が悪化する可能性がある。
- ARC-AGI問題において，LLMは正解した問題を，記憶ありで解く際に54%の確率で失敗する。
Link: https://arxiv.org/abs/2605.12978
CoRe-Gen：不完全なフィンガープリント条件下での堅牢なスペクトルから構造への生成 [cs.LG, cs.AI]目的：タンデム質量分析スペクトルからの分子構造解明
- 質量分析は，化合物の同定や構造決定に不可欠な技術である。
- 予測されたフィンガープリントのノイズやバイアスが，構造生成の精度を低下させる。
- 現実的な条件下での，より堅牢なスペクトルから構造への生成手法を開発する。
- CoRe-Genは，スペクトルからフィンガープリントの予測におけるノイズを軽減する。
- NPLIB1ベンチマークにおいて，トップ1およびトップ10の一致精度で最高水準を達成した。
- 自己回帰的デコーディングの効率性を維持しつつ，実用的な構造生成を提供する。
Link: https://arxiv.org/abs/2605.12980
プロトコル駆動型開発：不変条件と証拠による生成ソフトウェアの統制 [cs.SE, cs.AI, cs.LG]目的：生成ソフトウェアの統制メカニズム
- ソフトウェア開発の自動化が進み，迅速な実装が求められるようになった。
- 生成されたソフトウェアの妥当性検証が困難であり，品質保証が課題となっている。
- プロトコルによる厳格な統制により，信頼性の高いソフトウェア開発を実現する。
- プロトコル駆動型開発（PDD）は，実装コードではなく，機械的に検証可能なプロトコルを主要な成果物とする。
- プロトコルは，構造的不変条件，行動的不変条件，運用的不変条件の3要素で構成され，許容可能な実装空間を定義する。
- 実装はプロトコルに適合し，適合の証拠チェーンを生成することで，自動生成ソフトウェアの信頼性を高める。
Link: https://arxiv.org/abs/2605.12981
プロダクト空間における決定木学習 [cs.LG, cs.CC]目的：決定木学習アルゴリズムの理論的保証
- 決定木学習は理論計算機科学における重要なテーマであり，実用的な応用が多い。
- トップダウン貪欲法は広く使われているが，その理論的解析は限定的であった。
- 任意の積分布における貪欲法の性能限界を明らかにする。
- 最適な決定木のサイズs，最大深さDopt，平均深さΔoptに対して，貪欲法が構築する近似木のサイズの上限を導出した。
- 特に，最適な決定木が完全二分木の場合，Blancらの結果を改善し，より広い分布クラスで成立する。
- 最適な木のサイズや深さの事前知識を必要としない，パラメータフリーなアルゴリズムを提案した。
Link: https://arxiv.org/abs/2605.12983
アルゴリズム学習におけるRetrieval-Augmented Tutoring：AI教育でのトレースと問題解決支援 [cs.CL, cs.AI, cs.CY, cs.IR]目的：アルゴリズムのトレースと問題解決能力向上のためのRetrieval-Augmented Tutoringシステムの開発と評価
- AI教育において，アルゴリズムの理解は重要であり，その学習支援が求められている。
- アルゴリズム学習者は，トレースの解釈や，推論エラーのデバッグに困難を抱える場合がある。
- 本研究は，学生のニーズに応じた的確なヒントやガイダンスを提供し，アルゴリズム問題解決能力を向上させることを目指す。
- KITEは，コース教材から関連情報を取得するRetrieval-Augmented Generationパイプラインを用いて，文脈に即した応答を生成する。
- RAGAsに基づく評価や専門家による評価の結果，KITEの応答は適切に根拠があり，教育的品質も高いことが示された。
- シミュレーション実験では，KITEからのフィードバックが，より正確な回答につながり，アルゴリズム問題解決の支援効果が確認された。
Link: https://arxiv.org/abs/2605.12988
単なるRLHFだけでは不十分：アライメントだけではマルチエージェントの迎合性を解消できない [cs.LG, cs.AI]目的：マルチエージェントパイプラインにおける回答の誤り傾向
- 大規模言語モデルの応用拡大に伴い，マルチエージェントシステムにおける信頼性が重要課題となっている。
- LLMパイプラインは，他者の意見に同調しやすい「迎合性」という脆弱性を抱えており，その原因が不明確である。
- 本研究は，LLMの迎合性がRLHFに起因するのか，より根本的なメカニズムに由来するのかを解明する。
- 事前学習済みの基盤モデルも指示調整モデルと同様の傾向を示し，迎合性はRLHFだけでは説明できないことが判明した。
- 問題の根源は，モデルの中間層における注意機構にあり，特定の層を修正することで正確性を大幅に回復できた。
- 意見の相違を示す単一の異論者によって，迎合性が大幅に軽減されることが示された。パイプラインレベルでの対策が有効である。
Link: https://arxiv.org/abs/2605.12991
DP-Muon：行列直交化モーメンタムによる差分プライバシー最適化 [cs.LG]目的：差分プライバシー（DP）学習における最適化手法
- 機械学習モデルのプライバシー保護は，データ利用における重要な課題である。
- DP-SGDの解析は進む一方で，Muonのような最適化手法の詳細は不明な点が多い。
- Muonにおける差分プライバシー保護と最適化性能の理論的保証を確立すること。
- DP-Muonは，既存のDP-SGDと同等のプライバシー保証を持つことが証明された。
- 行列ごとのクリッピング下で，有限ホライズンおよび消失静止性に関する保証が得られた。
- DP-MuonBCは，出力レベルのバイアスを低減し，プライバシー保護を維持しつつ，より高い性能を実現する。
Link: https://arxiv.org/abs/2605.12994
F-GRPO：因子分解型グループ相対ポリシー最適化による統一的な候補生成とランキング [cs.LG]目的：候補生成とランキングの統一的フレームワーク
- 検索システムの性能向上は，情報アクセスにおいて不可欠であり，ユーザーエクスペリエンスに直接影響する。
- 従来のパイプラインでは生成とランキングが分離されており，ランキングが候補集合に制限される。
- 生成とランキングを統合し，エンドツーエンドで最適化することで，性能向上を目指す。
- F-GRPOは，候補生成とランキングを単一のLLMバックボーンで因子分解し，同時に学習する。
- 順位付きリスト全体の報酬と位置情報を考慮した報酬を用いることで，段階的なクレジット割り当て問題を解決する。
- シーケンシャル推薦や多段階質問応答のベンチマークにおいて，既存手法を上回り，優れた性能を示す。
Link: https://arxiv.org/abs/2605.12995
変数係数波動方程式におけるニューラル演算子の周波数バイアスと分布外汎化 [cs.LG]目的：偏微分方程式の初期条件から終端解への写像を学習するニューラル演算子の分布外汎化性能の評価
- 物理現象のシミュレーションにおいて，高速かつ高精度な予測を実現するため，ニューラル演算子の活用が期待されている。
- ニューラル演算子は，学習データに偏りが生じると，未知の分布に対する汎化性能が低下する可能性がある。
- 周波数や係数の滑らかさの変化といった分布シフトに対するニューラル演算子の振る舞いを明らかにし，汎化性能改善に資する。
- 係数の滑らかさの変化に対しては，両モデルとも安定した性能を維持し，FNOの方が低い誤差を示す。
- 周波数の変化に対しては，FNOが未知の高周波入力に対して誤差が急増し，DeepONetは緩やかな性能低下を示す。
- これらの違いは，各アーキテクチャが周波数構造をどのように表現し応答するかに起因すると考えられる。
Link: https://arxiv.org/abs/2605.12997
DRIFT：連続分布シフトを伴うタスクフリー継続グラフ学習のベンチマーク [cs.LG]目的：タスクフリー継続グラフ学習のためのベンチマーク
- グラフデータは現実世界の複雑な関係性を表現可能であり，様々な分野で応用が期待される。
- 従来の継続グラフ学習はタスク区切りを前提としており，現実的な連続的な変化に対応できない。
- 現実的な非定常環境下での継続グラフ学習の課題を明らかにし，評価基準を提供する。
- 提案されたベンチマークDRIFTは，急激なタスク切り替えから滑らかな分布ドリフトまで，様々な変化を網羅している。
- 既存の継続学習手法は，タスクフリー設定において性能が大幅に低下することが示された。
- 多くの手法がタスク境界情報に暗黙的に依存しており，現実的なストリームデータに対応が難しいことが明らかになった。
Link: https://arxiv.org/abs/2605.12998
事前学習済みの拡散モデルを用いた画像インペインティングのための償却ガイダンス [cs.CV, cs.AI, cs.SY, eess.SY, math.OC]目的：拡散モデルを用いた画像インペインティング手法
- 画像生成技術は，画像編集や復元において重要な役割を担う。
- 既存手法は，個々の画像に対して最適化が必要であり，計算コストが高い。
- 画像ごとに最適化することなく，効率的に高品質なインペインティングを実現する。
- 提案手法「AID」は，事前学習済みの拡散モデルのバックボーンを固定し，再利用可能なガイダンスモジュールを学習することで，計算コストを削減する。
- AIDは，AFHQv2，FFHQ，ImageNetのデータセットにおいて，既存手法と比較して品質と速度のトレードオフを改善した。
- 学習可能なパラメータはわずか1%未満であり，効率的なインペインティングが可能である。
Link: https://arxiv.org/abs/2605.13010
JEDI：オンラインモデルベース強化学習のためのジョイント埋め込み拡散ワールドモデル [cs.NI, cs.LG]目的：オンラインモデルベース強化学習における拡散ワールドモデルの性能向上
- 強化学習は，自律的な意思決定を行うエージェントの開発に不可欠であり，様々な分野で応用が期待されている。
- 既存の拡散ワールドモデルは，計算コストが高いか，性能が十分でないという課題があった。
- エンドツーエンドで学習可能な拡散ワールドモデルを開発し，効率性と性能を両立させる。
- JEDIは，Atari100kにおいて，既存の分離学習による潜在変数を用いたモデルを上回る性能を示した。
- JEDIは，ピクセル拡散ベースラインと比較して，VRAM使用量を43%削減し，ワールドモデルサンプリング速度を3倍以上向上させた。
- エンドツーエンドで学習された予測潜在変数は，計算量だけでなくタスクレベルの性能にも影響を与えることが示された。
Link: https://arxiv.org/abs/2605.13013
非利己性原理に基づく効率的なグラフ粗視化の再考 [cs.LG, cs.AI]目的：グラフ粗視化手法の効率化
- グラフデータは複雑な関係性を表現でき，様々な分野で活用されている。
- 既存の粗視化手法は計算コストが高く，大規模グラフへの適用が困難である。
- 近傍ノード間の相互作用を重視することで，計算コストを削減することを目指す。
- 提案手法NOPEは，線形メモリ消費量とほぼ線形な計算複雑度を実現した。
- 高速化版NOPE*は，次数が高いノードにおける計算ボトルネックを緩和した。
- 実験結果から，NOPE*は既存手法と比較して1.8〜10倍の高速化を達成し，粗視化されたグラフでの学習性能は元のグラフと同等か，場合によってはLLMを用いたグラフ推論よりも優れていることが示された。
Link: https://arxiv.org/abs/2605.13021
オフライン2人零和マルコフゲームにおけるKL正則化 [cs.CE, cs.LG, cs.GT]目的：オフライン2人零和マルコフゲームにおけるナッシュ均衡の学習
- 強化学習の発展は，複雑な環境下での意思決定を可能にするため，その重要性が増している。
- オフライン学習では，分布シフトの問題により，学習の安定性と収束が保証されない場合がある。
- KL正則化を用いて，分布シフトに対する安定性を確保し，学習の収束を保証することを試みる。
- KL正則化のみで学習を安定化させ，ナッシュ均衡への収束を保証できることを示した。
- 理論的枠組みであるROSEは，片側集中可能性のもとで高速な$\widetilde{\mathcal{O}}(1/n)$の収束率を達成する。
- 実用的なアルゴリズムSOS-MDは，$\widetilde{\mathcal{O}}(1/n)$の統計的収束率を，最適化誤差$\widetilde{\mathcal{O}}(1/\sqrt{T})$とともに達成する。
Link: https://arxiv.org/abs/2605.13025
マスク拡散言語モデルの学習理解と加速 [cs.LG, cs.AI, cs.CL]目的：マスク拡散言語モデルの学習加速
- 自然言語処理の分野では，より高性能な言語モデルの構築が求められている。
- 拡散モデルは有望だが，自己回帰モデルに比べて学習速度が遅いという課題がある。
- 言語の局所性バイアスが学習の遅延要因であり，その改善を目指す。
- 学習戦略としてベルカーブ状の時間サンプリングを提案し，標準的な学習よりも最大4倍の速度で同等の性能を達成した。
- One Billion Word Benchmark (LM1B) において，検証時の負対数尤度 (NLL) が向上することを示した。
- 生成パープレキシティ，ゼロショットパープレキシティ，および様々なベンチマークにおける下流タスク性能も改善された。
Link: https://arxiv.org/abs/2605.13026
FeatCal：後結合モデルにおける特徴量の較正 [cs.RO, cs.SY, eess.SY, cs.LG, cs.AI]目的：後結合モデルにおける性能ギャップの低減
- 大規模言語モデルの効率的な活用が求められており，専門モデルの統合が有効な手段となりうる。
- 後結合モデルは，専門モデルと比較して性能が劣ることが多く，その原因の解明が必要である。
- 特徴量のドリフトを抑制することで，後結合モデルの性能向上を目指す。
- FeatCalは，特徴量のドリフトを層ごとに較正することで，後結合モデルの性能を向上させる。
- CLIPやGLUEのベンチマークにおいて，既存手法（Surgery，ProbSurgery）を上回る結果が得られた。
- 少ない較正データと計算コストで高い性能が得られ，サンプル効率と較正コストの低減に貢献する。
Link: https://arxiv.org/abs/2605.13030
グラフ外分布検出における情報分解：三成分情報分解による重要情報の特定 [eess.SY, cs.RO, cs.SY, cs.LG]目的：グラフ外分布検出のための三成分情報分解フレームワーク
- グラフニューラルネットワークはノード分類で広く利用されているが，外分布シフトに脆弱である。
- 既存手法は特徴量や構造からの不要な信号を学習しやすく，分布変化に弱い。
- ラベルに関連する情報を保持しつつ，不要な特徴量・構造情報を除去する。
- 提案手法Tideは，特徴，構造，結合の三成分に情報を分解する。
- 情報ボトルネック目的関数が標準的な教師あり学習よりグラフ外分布検出に適していることが示された。
- 7つのデータセットでTideの有効性が確認され，FPR95で最大34%の改善が見られた。
Link: https://arxiv.org/abs/2605.13032
MAP：長期的対話型エージェント推論のためのマップ作成先行パラダイム [cs.MA, cs.AI]目的：長期的対話型エージェントの推論における，マップ作成先行のパラダイム
- 対話型LLMエージェントの性能向上が求められている。複雑なタスク達成には環境理解が不可欠である。
- 従来のLLMエージェントは実行中に環境を理解するため，試行錯誤による非効率な学習に陥りやすい。
- 事前に環境理解を確立することで，効率的なタスク解決を目指す。
- MAPは，環境理解を事前に確立する「マップ作成先行」パラダイムを提案し，ベンチマークテストで性能向上が確認された。
- ARC-AGI-3において，最先端モデルが25のゲーム環境のうち22環境でほぼゼロからの性能向上を達成した。
- MAP-2Kデータセットを用いての学習が，専門家の実行トレースを上回る成果を示し，環境理解の重要性を裏付けた。
Link: https://arxiv.org/abs/2605.13037
CoGE：単眼結腸内視鏡検査のためのSim-to-Realオンライン幾何学的推定 [cs.CV, cs.AI]目的：単眼結腸内視鏡検査におけるオンライン幾何学的推定
- 結腸内視鏡検査において，3次元空間認識とナビゲーションは外科医にとって不可欠である。
- 結腸内の狭隘な空間構造のため，幾何学的真値データの取得が困難である。
- シミュレーションデータと現実データの間の特徴量ギャップを埋めることを目指す。
- 提案手法CoGEは，シミュレーションデータのみで学習し，現実およびシミュレーションデータ両方において最先端の性能を達成した。
- Retinex理論に基づく照明補正モジュールにより，多様な結腸内視鏡画像に対応可能である。
- ウェーブレット分解に基づく構造認識モジュールにより，結腸の構造と局所特徴を効果的に抽出する。
Link: https://arxiv.org/abs/2605.13038
攻撃不要：エージェントスキルにおける仕様違反に対する意味的ファジング [cs.CL, cs.CR, cs.AI]目的：エージェントスキルの仕様違反の検出
- LLMエージェントの利用拡大に伴い，その安全性確保が重要となっている。
- スキルが自身の仕様に反して動作するケースが，静的解析や既存の防御策では発見しにくい。
- 本研究は，LLMエージェントのスキルの仕様違反を自動的に検出し，安全性を高めることを目指す。
- 提案手法Sefzは，ガードレールを到達可能性目標に変換し，決定性グラフクエリで違反を検証する。
- Sefzは，402個の実世界スキル中120個（約30％）に仕様違反を発見し，そのうち26個は未発見の脆弱性だった。
- 仕様違反の多くは，スキル設計における共通の落とし穴に起因することが示された。
Link: https://arxiv.org/abs/2605.13044
大規模言語モデルは医学知識の時系列認識に欠ける [cs.LG, cs.CL]目的：医学知識における大規模言語モデルの時系列認識能力の評価
- 医学知識は常に更新され，時間経過とともに変化するため，最新の情報を反映した評価が不可欠である。
- 既存の評価方法では，医学知識の動的な側面が考慮されておらず，正確な時系列認識能力を測れない。
- 大規模言語モデルが，医学知識の時系列的な変化を正確に理解し，活用できるか評価する。
- 大規模言語モデルは，医学知識の最新情報に対する性能が時間とともに緩やかに低下する傾向が見られ，明確な知識の遮断は確認されなかった。
- 古い医学知識の想起は，最新の推奨事項よりも著しく難しく，訓練中の知識の忘却効果が示唆された。
- 大規模言語モデルは，近隣の年次間で予測が不規則に変動する，時系列的に一貫性のない行動を示すことが明らかになった。
Link: https://arxiv.org/abs/2605.13045
大規模メンタルヘルススクリーニングのためのエージェント型LLMフレームワーク [cs.AI]目的：大規模なメンタルヘルススクリーニングの実現
- 世界中でメンタルヘルス問題が増加しており，効率的なスクリーニング手法が求められている。
- 臨床データの量が増大する中，従来のシステムでは対応が困難になっている。
- AIを活用し，信頼性・再現性・適応性を確保したスクリーニングフレームワークを構築する。
- 提案フレームワークは，安定した設定に収束し，評価コストを抑制しつつ，回帰を回避した。
- コサイン類似度，動的Top-k，閾値0.75といった設定が有効であることが示された。
- 本研究は，大規模臨床データを用いたメンタルヘルススクリーニングにおけるエージェント型AIの可能性を示す。
Link: https://arxiv.org/abs/2605.13046
反実仮想的意味的顕著性による人間とVLMのシーン認識のギャップの解明 [cs.CV, cs.AI]目的：人間と大規模ビジョン言語モデル(VLM)のシーン認識のずれ
- シーン理解は，AIが現実世界を理解する上で不可欠であるため，その評価が重要である。
- 既存手法では，大規模モデルの内部構造が不明なため，人間との認識のずれを特定できない。
- 反実仮想的意味的顕著性(CSS)を用いて，人間とVLMのシーン理解のずれを定量的に評価する。
- VLMは，人間と比較して，シーン内の大型物体，中央の物体，および高顕著性物体に過度に依存する傾向がある。
- VLMは，人間よりもシーン内の人物に頼り少ない傾向がある。
- VLMの物体サイズへの偏りが，人間との意味的ずれの主な要因であることが示唆された。
Link: https://arxiv.org/abs/2605.13047
アクティブ情報探索による文脈学習 [cs.CL, cs.AI]目的：大規模言語モデルの文脈最適化によるタスク適応
- 大規模言語モデルの応用拡大には，追加学習コストの抑制が重要である。
- 既存の文脈最適化手法は，モデル固有の知識に依存しがちである。
- 外部情報源を活用し，より効果的な文脈を構築することを目指す。
- 外部ツール（Wikipedia検索，ブラウザ）を単純に追加すると性能が低下する。
- 候補文脈を維持・剪定する検索ベースの学習手順と組み合わせることで，大幅な性能向上が見られた。
- 多様なドメイン（翻訳，医療，推論）で有効性が確認され，汎化性能も高い。
Link: https://arxiv.org/abs/2605.13050
ターゲットに合致した生成によるドメインギャップの解消：オフライン強化学習における応用 [cs.IR, cs.CL, cs.IR, cs.LG, cs.AI]目的：クロスドメインオフライン強化学習におけるポリシー適応手法
- 強化学習は多様な分野に応用可能だが，環境構築や学習にコストがかかる場合が多い。
- 異なるドメイン間での知識転移は困難であり，特にターゲットドメインのデータが不足すると性能が低下する。
- ターゲットドメインのデータが限られている状況下でも，ソースドメインの知識を有効活用し，性能向上を目指す。
- 提案手法TCEは，ターゲットに近い遷移を直接利用するか，ターゲットに合致した生成により状態空間を拡張することでソースデータを活用する。
- TCEは，理論的解析に基づいた双方向スコアベース生成モデルを用いて，ターゲットに整合した遷移を合成する。
- 多様な環境下での実験により，TCEが既存のクロスドメインオフライン強化学習手法を上回る性能を示すことが確認された。
Link: https://arxiv.org/abs/2605.13054
学習された前送り写像によるエルゴード軌道設計：条件付きフローマッチングによる証明可能なカバレッジ [cs.LG]目的：規定された空間密度との時間平均占有率の一致を証明可能な軌道設計
- UAVによるデータ収集やロボット探査など，広範な分野で空間的な密度分布を効率的に網羅する軌道設計が重要である。
- 既存手法は，オンラインでの再最適化が必要，あるいは制約条件ごとに解析的な構築をやり直す必要があり，計算コストが高い。
- 学習された前送り写像を用いて，制約条件の変化に柔軟に対応し，効率的な軌道設計を実現することを目指す。
- 提案手法では，解析的な潜在軌道と，オフラインで学習された写像を組み合わせることで，エルゴード性を実現している。
- 学習された写像は，ターゲット密度への占有率の輸送を担い，制約条件の追加も学習損失への加算として容易に対応可能である。
- 軌道のサイクル数Kに関して，エルゴード収束率がO(1/√(K))であること，および近似誤差の上界を証明した。
Link: https://arxiv.org/abs/2605.13063
絶対状態が機能しない場合：ロバストな操作のための固有受容性符号化の評価 [cs.RO, cs.AI]目的：ロボットの固有受容性状態の符号化戦略
- ロボットの汎用性が求められる現実世界でのタスク遂行において重要である。
- 訓練と推論の条件のギャップが，実世界でのロボットの性能を阻害する。
- 移動する座標系を持つロボットにおける課題を解決し，ロバスト性を向上させる。
- エピソードごとの相対フレームを用いることで，タスク性能とロバスト性の両面で優れた結果が得られた。
- 既存手法と比較して，現実のテスト環境における実機実験でより高い性能を示した。
- 様々な座標系を持つロボットのデータ活用と未知の環境への展開に繋がる可能性がある。
Link: https://arxiv.org/abs/2605.13067
局所逆幾何は償却可能である [cs.LG]目的：非線形逆問題における効率的な解法
- 逆問題は，画像処理やシステム同定など，科学技術の多くの分野で重要である。
- 従来の解法は，計算コストと安定性のトレードオフが存在する。
- 学習によって逆幾何形状を事前に計算し，高速かつ安定な解法を実現する。
- 提案手法Deceptronは，測定空間からの提案を潜在空間に効率的にマッピングする。
- Jacobian Composition Penalty (JCP)により，逆Jacobianが順Jacobianの局所左逆行列として機能するように学習される。
- 実験結果から，D-IPGは既存手法を凌駕し，最大77倍の高速化を達成した。
Link: https://arxiv.org/abs/2605.13068
FiTS：周波数選択性と時間的整形による解釈可能なスパイクニューロン [cs.CY, cs.NE]目的：スパイクニューロンにおける周波数選択性と時間的整形
- 脳の効率的な情報処理模倣のため，イベント駆動型であるスパイクニューラルネットワークの研究が重要である。
- スパイクニューロンがネットワーク内でどのように専門化すべきか不明であり，性能向上のボトルネックとなっている。
- 個々のスパイクニューロンの機能分解により，ネットワークの学習と解釈性を向上させることを目指す。
- FiTSは，周波数選択性（FS）と時間的整形（TS）の因子分解により，単純なSNNにおいてもLIFベースラインを上回る性能を示す。
- FSモジュールは，サブスレッショルド振幅応答を最大化するターゲット周波数をパラメータ化し，TSモジュールは群遅延変調を通じて時間的整形を行う。
- 学習されたターゲット周波数と群遅延シフトは，ネットワーク内の周波数とタイミングの組織に関する解釈可能なニューロンレベルの要約を提供する。
Link: https://arxiv.org/abs/2605.13071
少数の学習事例を用いた音声単語分類の拡張：生成メタ継続学習によるアプローチ [cs.CL, cs.AI]目的：少数の学習事例を用いた音声単語分類の拡張可能性
- 音声認識技術は，人間と機械の自然な対話を可能にする基盤であり，その精度向上は重要である。
- 従来の音声単語分類は，限られたクラス数での学習に偏っており，大規模なクラス数への対応が課題であった。
- 本研究は，多数のクラス（1000クラス）に対する少数の学習事例（5事例/クラス）を用いた分類性能の向上を目指す。
- 生成メタ継続学習(GeMCL)アルゴリズムを用いることで，1000クラスの音声単語分類において優れた安定性を確認した。
- GeMCLは，完全ファインチューニングモデルや，特徴抽出器を固定したモデルと比較して遜色ない性能を示した。
- GeMCLは，後者と同程度の性能を，2000倍高速かつ学習データ量を大幅に削減して達成した。
Link: https://arxiv.org/abs/2605.13075
確率的マルチエージェントシステムにおける因果的責任帰属のための反実仮想推論 [cs.MA, cs.AI]目的：マルチエージェントシステムにおける責任帰属の程度
- 社会システムやAIにおける協調行動の設計において，誰にどのような責任があるかを明確にすることは重要である。
- 既存の手法では，複数のエージェントが関わる複雑な状況下での責任の公平かつ一貫性のある評価が難しい。
- 確率的マルチエージェントシステムにおいて，反実仮想推論を用いて責任を定量化し，公平性と一貫性を満たす方法を提案する。
- 本研究では，マルチエージェントシステムを確率的ゲームとしてモデル化し，反実仮想的責任の概念を導入した。
- 責任の分配にはシャプレイ値を活用し，公平性と一貫性という望ましい性質を満たすことを形式的に示した。
- ナッシュ均衡の概念を用いて，責任と期待報酬のトレードオフを考慮した安定的な戦略プロファイルを計算する方法を提示した。
Link: https://arxiv.org/abs/2605.13077
スペクトル平坦化こそがMuonに必要なもの：直交化が学習率と収束を制御する仕組み [cs.LG, cs.AI]目的：Muonの学習率と収束に関する原理の解明
- 深層学習の高速化と高性能化は，最適化アルゴリズムの改善に大きく依存する。
- 従来の最適化アルゴリズムは，学習率の調整が難しく，収束が遅いという課題がある。
- Muonの優れた性能を理論的に説明し，より安定した高速学習を実現すること。
- Muonは勾配の平均特異値を基準に安定したステップサイズを決定するため，従来の勾配降下法が抱えるボトルネックを解消する。
- Muonは，Kronecker積因数分解された曲率モデルにおいて，有効な収束係数を改善し，その改善は勾配共分散のスペクトルによって制御される。
- 実験結果は，MuonがSGDの発散を引き起こす学習率でも安定し，同一ステップサイズでもより早く精度目標を達成することを示している。
Link: https://arxiv.org/abs/2605.13079
言語は音声単語分類に影響するか？多言語生成メタ学習アプローチ [cs.RO, cs.CL, cs.AI]目的：音声単語分類における言語の影響
- 音声認識技術は，人機インタフェースの発展に不可欠であり，その精度向上は重要な課題である。
- 限られたデータでの音声単語分類は難しく，言語依存性が課題となっている。
- メタ学習を用いて，多言語音声単語分類における言語依存性を軽減し，汎化性能を高める。
- 多言語モデルが最も良い性能を示したが，モデル間の性能差は予想以上に小さかった。
- 学習データ全体のユニークなデータ時間数が，言語数よりも性能指標として重要であることが示唆された。
- 生成メタ継続学習アルゴリズムは，実用的な音声単語分類への応用可能性を持つ。
Link: https://arxiv.org/abs/2605.13084
Vividh-ASR：堅牢なインド言語音声認識のための複雑度階層化ベンチマークと最適化動態 [cs.RO, cs.CL, cs.AI]目的：インド言語音声認識の堅牢性向上
- 音声認識技術は，言語間のコミュニケーションを円滑にし，情報へのアクセスを容易にする上で不可欠である。
- 低リソース言語に対する多言語ASRモデルのファインチューニングは，自然な音声性能の低下を引き起こす。
- スタジオ音声に偏ったモデルを，より自然な音声に対しても高い性能を発揮するように改善する。
- 複雑度を段階的に上げたベンチマークVividh-ASRを用いることで，学習率のタイミングとカリキュラム順序が性能に与える影響を分析した。
- 大規模なパラメータ更新を早期に行うことで，全体的なWERを12ポイント改善し，易しい順から難しい順へのカリキュラムが自然な音声の性能を向上させた。
- 逆多段階ファインチューニング(R-MFT)により，244MのWhisperモデルが，従来の769Mモデルと同等またはそれ以上の性能を達成した。
Link: https://arxiv.org/abs/2605.13087
ベイズ非パラメトリック混合効果ODEとガウス過程 [cs.LG]目的：異質性を考慮したODEモデリング手法の開発
- 薬物動態学など様々な科学分野で，動的なモデリングは不可欠である。
- 従来のODEモデルはパラメトリックなベクトル場に依存し，構造の誤指定や未モデル化のメカニズムに脆弱である。
- 対象特異的な動態を考慮した，非パラメトリックなODEモデリングによる不確実性の定量化を目指す。
- MEGPODEは，各対象のベクトル場を共有集団成分と対象特異的な偏差に分解することで，異質性をモデル化する。
- 状態空間GP軌道事前分布と仮想コローケーション観測を組み合わせることで，効率的な学習を実現した。
- シミュレーション実験において，MEGPODEは集団場回復と対象レベル軌道予測において，既存手法を上回る性能を示した。
Link: https://arxiv.org/abs/2605.13088
ウォーターマーキングは監視の基本要素と捉えられるべきである [cs.RO, cs.CR, cs.AI, cs.CY, cs.LG]目的：生成モデルにおけるウォーターマーキングの監視利用に関する検討
- 生成AIの利用拡大に伴い，生成物の出所追跡や安全性確保が重要課題となっている。
- 既存研究では，個々のサンプルに対する攻撃に焦点を当てており，集約的な監視能力は未検討であった。
- エンティティレベルの情報推論を可能にする監視メカニズムとしてのウォーターマーキングの可能性を検証する。
- ウォーターマーキングは，たとえ情報量をゼロビットにしても，複数キー設定下で出所特定を可能にする。
- 外部からの監視は，ウォーターマーク設計に依存するが，キーに依存した統計構造から時間経過とともに生じる可能性がある。
- 出所特定と監視の間にはトレードオフが存在し，集約的な監視能力も考慮した評価が必要である。
Link: https://arxiv.org/abs/2605.13095
特性駆動型合成計画のためのマージンキャリブレーションされた分類器誘導 [cs.LG, cs.AI]目的：標的分子を生成する効率的な化学反応配列
- 複雑な分子の合成は，効率的な反応配列の設計が鍵となるため重要である。
- 既存の逆合成モデルは，特定の制約や化学者の意向を反映しにくいという課題がある。
- 分類器誘導により，反応配列の探索を効率化し，より適切な合成経路を見つけることを目指す。
- Sequence Completion Ranking (SCR)という新規手法を開発し，分類器のキャリブレーションを改善した。
- USPTO-190データセットにおいて，化学者による誘導ターゲットを用いた場合，多段階解決率が大幅に向上した。
- テンプレートフリー法とテンプレートベース法の多様性の差を解消し，以前は解決できなかった33の標的分子に対する有効な経路を発見した。
Link: https://arxiv.org/abs/2605.13101
ベンチャーキャピタルにおけるデューデリジェンスのためのマルチエージェント調整フレームワーク [cs.MA, cs.AI, cs.IR]目的：ベンチャーキャピタルにおけるデューデリジェンスと市場分析
- 新規事業への投資判断において，迅速かつ正確な情報収集が不可欠である。
- 企業の財務データや市場情報の収集・分析に時間とコストがかかる。
- デューデリジェンスプロセスを自動化し，投資判断の効率化と精度向上を目指す。
- マルチエージェントフレームワークが，企業デューデリジェンスと市場分析を完全に自動化した。
- LLMとリアルタイムなウェブ検索を組み合わせ，非構造化データを構造化された投資情報へと変換するパイプラインを構築した。
- ギリシャの企業登記簿から公式な財務諸表を抽出する手法を開発し，財務データのハルシネーションを抑制する仕組みを導入した。
Link: https://arxiv.org/abs/2605.13110
文脈が重要：T2I生成におけるジェンダーバイアス監査 – リスク階層化ユースケースプロファイルを通じて [cs.CY, cs.AI]目的：T2Iモデルにおけるジェンダーバイアスの監査フレームワーク
- T2Iモデルは教育，メディア等で利用され，影響力を増している。そのため，バイアス問題への対策が不可欠である。
- 既存の評価は断片的で，指標の解釈や活用が文脈によって曖昧になっている。
- リスクに応じた監査フレームワークを構築し，バイアス測定の有用性を高めることを目指す。
- 本研究では，EU AI法のリスクカテゴリに合わせたユースケースプロファイルを特定した。
- ジェンダーバイアス評価指標を，ジェンダー予測，埋め込み類似度，ダウンストリームタスクの3つに分類した。
- 文脈依存的な危害カテゴリとリスクシナリオを対応付けた危害類型を提示し，THUMBカードを導入した。
Link: https://arxiv.org/abs/2605.13113
拡散モデルに対するサプライチェーンPRNGバックドア攻撃と量子乱数防御 [cs.CR, cs.LG]目的：拡散モデルにおけるサプライチェーンPRNGバックドア攻撃の検証と量子乱数生成器による防御策の提案
- 拡散モデルは画像生成において重要な役割を担うが，その安全性には課題が残る。
- 拡散モデルのPRNGに脆弱性があり，悪意のあるコードが挿入される可能性がある。
- 拡散モデルに対するサプライチェーン攻撃を検出し，量子乱数で防御することを試みる。
- 拡散モデルのPRNGを悪意のあるものに置き換えることで，生成画像を決定的に制御することが可能となった。
- 既存のモデル監査やコンテンツモデレーションメカニズムでは，この攻撃を検出することが困難である。
- 量子乱数生成器(QRNG)を導入することで，攻撃を完全に無効化し，画像の類似度を低減することができた。
Link: https://arxiv.org/abs/2605.13115
SECOND-Grasp：意味的接触誘導による器用な把持 [cs.RO, cs.AI]目的：意味的理解と物理的安定性を両立する器用な把持手法
- ロボットの高度な操作能力実現には，物理的安定性とタスクに応じた意味的理解が不可欠である。
- 従来，物理的安定性と意味的理解は別個に扱われ，両者の統合が課題であった。
- 視覚と言語情報に基づき，意味的情報を考慮した把持戦略の動的な調整を可能にする。
- 提案手法（SECOND-Grasp）は，DexGraspNet上で既存手法を上回り，既知・未知カテゴリでの持ち上げ成功率をそれぞれ98.2%，97.7%を達成した。
- 意図を考慮した把持においても，既存手法比でそれぞれ12.8%，26.2%の性能向上を示した。
- Shadow HandやAllegro Handを含む追加データセットやロボットハンドでも良好な結果が得られた。
Link: https://arxiv.org/abs/2605.13117
ツールに合わせた視覚言語行動モデルによる長期的行動エージェントの実現 [cs.RO, cs.AI, cs.CV]目的：長期的行動タスクにおけるロボット行動実行
- ロボットの自律的な行動は，人間社会での活躍に不可欠であり，その重要性は増している。
- 従来の視覚言語行動モデルは，長期的な計画と多様な物理的操作の両立が課題であった。
- 視覚言語モデルと専用ツールを組み合わせ，効率的なロボットの長期行動実行を目指す。
- 提案手法「VLAs-as-Tools」は，LIBERO-Longにおいて成功率を4.8ポイント，RoboTwinで23.1ポイント向上させた。
- ツール選択と実行状況のフィードバックにより，エージェントは効率的に再計画を実行できる。
- ツール適応後学習(TAPT)により，指示への追従性が向上し，Non-biased Rateで15.0ポイント改善した。
Link: https://arxiv.org/abs/2605.13119
多ラベルグラフ情報ボトルネック：表現力とロバスト性を備えたメッセージパッシング [cs.RO, cs.LG, cs.AI]目的：多ラベルグラフにおける表現力とロバスト性の向上
- グラフニューラルネットワークは，多様なデータ構造を扱えるため，その応用範囲は広い。
- 深層メッセージパッシングでは，情報が過度に圧縮され，重要な情報が失われる問題がある。
- 多ラベルグラフにおけるノイズの影響を抑制し，予測性能を向上させる。
- 提案手法MLGIBは，無関係なラベルノイズを抑制することで，表現力とロバスト性を両立する。
- MLGIBは，ターゲットラベルとの相互情報量を最大化しつつ，冗長な情報を抑制する制約付き情報伝達として多ラベルメッセージパッシングを定式化する。
- 複数のベンチマーク実験により，既存手法と比較して一貫した性能向上が確認された。
Link: https://arxiv.org/abs/2605.13126
GRACE：勾配に沿った推論データキュレーションによる効率的なポストトレーニング [cs.AI]目的：効率的なポストトレーニングのための推論データキュレーション手法
- 大規模言語モデルの推論能力向上には，質の高い学習データが不可欠である。
- 既存のデータキュレーションはサンプル全体を評価するため，重要なステップを見落とす可能性がある。
- 推論過程の各ステップを個別に評価し，より効果的なデータを選択することを目指す。
- GRACEは，推論過程を最適化イベントのシーケンスと捉え，各ステップのスコアリングを行う。
- ステップのスコアは，解答指向勾配との整合性と，先行する推論経路との一貫性に基づいている。
- Qwen3-VL-2B-InstructでMMathCoT-1Mを学習した結果，GRACEは20%のデータでフルデータ性能の108.8%を達成した。
Link: https://arxiv.org/abs/2605.13130
ERPPO：エントロピー正則化に基づく近接方策最適化 [cs.LG, cs.RO]目的：多エージェント強化学習における最適な方策の抽出
- 複雑な環境下での協調行動を可能にするため，多エージェント強化学習の重要性が高まっている。
- 多次元環境では，エージェントの観測が非定常となり，MAPPOでは最適な方策の抽出が困難である。
- 非定常な観測下での曖昧さを考慮し，探索と方策の安定化を両立させることで，性能向上を目指す。
- 提案手法ERPPOは，AirSimを用いた海上捜索シナリオにおいて，高い精度性能を示すことが確認された。
- ERPPOは，MAPPOと比較して，より大きな勾配を得ることができ，学習効率の向上が示唆された。
- 視覚的に不確実な状況下での誤検出を抑制する効果が，定性的な結果からも確認された。
Link: https://arxiv.org/abs/2605.13131
知識に基づく意味的・動的なトポロジー脳自己回帰モデルKAST-BAR：汎用ニューラル解釈のための [cs.LG, eess.SP]目的：脳波信号の汎用的なニューラルデコーディング性能向上
- 脳波信号は，様々な認知状態を反映するため，ブレイン・マシン・インターフェース等への応用が期待されている。
- 既存の脳波信号解析モデルは，複雑な時空間トポロジーのモデリングと，生理学的信号と高レベル意味表現のギャップが課題である。
- 脳波信号のトポロジー構造と意味表現を動的に整合させ，専門家レベルの知識を統合することで，より高精度な解析を目指す。
- 提案手法KAST-BARは，多層的な脳トポロジーから得られる生理学的表現を，専門家レベルの意味空間と動的に整合させる。
- KAST-BARは，大規模な事前学習により，脳波信号表現に専門的な医療知識を効果的に統合し，優れた性能を発揮する。
- 6つの下流タスクにおいて，既存手法を上回る性能が確認された。
Link: https://arxiv.org/abs/2605.13133
LeanSearch v2: Lean 4 定理証明のためのグローバル前提検索 [eess.SY, cs.SY, eess.SY, cs.SY, cs.CL, cs.IR, cs.AI]目的：Lean 4 定理証明におけるグローバル前提検索の性能向上
- 形式証明支援は，数学の自動化やソフトウェアの検証において不可欠な技術である。
- 既存の検索ツールは，個別の補題検索や逐次的な前提選択に重点を置いており，定理全体に必要な前提群の発見が困難である。
- 本研究は，定理証明に必要な前提群を効率的に発見し，証明成功率の向上を目指す。
- LeanSearch v2は，埋め込みと再ランキングを用いた検索パイプラインにより，最先端の単一クエリ検索性能を達成した (nDCG@10 が 0.62)。
- 推論モードでは，反復的なスケッチ・検索・反映サイクルを通じてグローバル前提検索を行い，既存のシステムを上回る性能を示した (正解前提群の 46.1% を10候補内に回収)。
- 固定された証明ループを用いた評価では，LeanSearch v2 は証明成功率を向上させ，検索品質が証明生成に影響を与えることを確認した。
Link: https://arxiv.org/abs/2605.13137
脆弱性修正コミットのコード中心検出：統一ベンチマークと実証研究 [cs.SE, cs.CR, cs.LG]目的：脆弱性修正コミットの検出
- セキュリティパッチの迅速な適用は重要であり，脆弱性情報の遅延は平均25日である。
- 脆弱性修正に関する情報は断片化しており，統一的な評価が困難である。
- コードのみから脆弱性修正コミットを正確に検出する方法を確立すること。
- コード言語モデルを用いた脆弱性修正コミットの検出を評価した結果，モデルはコードの変化からセキュリティに関する理解を獲得していないことが示された。
- コミットメッセージが利用可能な場合，モデルの注意はメッセージに集中し，削除してもコード変化への注意はシフトしない。
- グループ分けされた評価では性能低下が確認され，大規模なデータや生成アプローチも根本的な問題を解決するには至らなかった。
Link: https://arxiv.org/abs/2605.13138