arXiv雑要約

AI - 2026/05/29 公開

LLM報酬設計が失敗する場合：疎な構造化RLのための診断駆動型改良 [cs.LG, cs.IR]目的：疎な構造化強化学習タスクにおけるLLM生成報酬シェイピングの改良
- 強化学習は，複雑な問題を解決するための強力な手法であり，ロボティクスやゲームなど幅広い分野で応用が期待されている。
- 報酬関数の設計は強化学習の性能に大きく影響するが，複雑なタスクでは適切な報酬関数を手動で設計することが困難である。
- LLMを活用して報酬関数を自動生成することで，報酬関数の設計コストを削減し，強化学習の適用範囲を広げることを目指す。
- 診断駆動型反復改良により，DoorKey-8x8の成功率が2.3%から97.6%に，KeyCorridorは31.2%から86.7%へと大幅に向上した。
- 改善は，再試行や追加の学習によるものではなく，報酬関数の修正に起因することが確認された。特に，失敗モード分類プロンプトが重要な役割を果たしている。
- 連続制御タスクでは，成功ベースの診断が誤作動することが示され，報酬トレンドからのフィードバックは誤検出メカニズムを排除するものの，堅牢な改善には至らなかった。
Link: https://arxiv.org/abs/2605.28918
CosmicFish-HRM: 階層的再帰メカニズムによるコンパクト言語モデルの適応的推論 [cs.LG, cs.AI, cs.CL]目的：コンパクト言語モデルにおける適応的推論深度
- 大規模言語モデルの推論能力向上は重要だが，巨大なパラメータ数と高コストが課題。
- 固定的な計算量では，入力の複雑さに応じた効率的な推論が難しい。
- 入力の複雑さに応じて計算量を動的に調整する推論メカニズムの実現。
- CosmicFish-HRMは，階層的推論モジュール(HRM)を用いて，入力に応じて推論ステップ数を動的に変化させる。
- タスクや入力に応じて異なる推論行動を学習し，適応的な推論深度が推論能力の向上に貢献することを示唆。
- HRMのオーバーヘッドはモデルサイズが大きくなるにつれて相対的に小さくなり，より有利になる可能性が示された。
Link: https://arxiv.org/abs/2605.28919
Conf-Gen：生成モデルに対する不確実性量化の共形性 [cs.LG, cs.AI, stat.ML]目的：生成モデルにおける不確実性量子の提供
- AI技術の発展に伴い，生成モデルの信頼性確保が重要となっている。
- 従来の共形予測法は教師あり学習向けであり，生成モデルへの適用が困難であった。
- 生成タスクに共形リスク制御を適応させ，不確実性の保証を提供する。
- 本研究では，Conf-Genという新たなフレームワークを提案し，生成モデルにおける不確実性量子を可能にした。
- Conf-Genは，画像生成，対話型AI，AIエージェントなど，多様な応用事例において有効性を実証した。
- 既存の共形予測法の適用範囲を拡張し，新たな領域への応用を可能にした。
Link: https://arxiv.org/abs/2605.28920
微分プライバシーを考慮した仮説検定における最適なレート [cs.CR, cs.DS, cs.IT, cs.LG, math.IT]目的：ε-値を用いた仮説検定における，達成可能な最適なe-power
- データ分析において，仮説検定は重要な役割を担う。特に，プライバシー保護が求められるデータへの応用が不可欠である。
- プライバシー保護と統計的検定力の両立が課題であった。既存手法ではデータ効率が低い場合がある。
- ε-微分プライバシーを満たすe-値を用いた仮説検定において，最適なレートを導き出すことを目指す。
- ε-値を用いた仮説検定における最適なe-powerのレートを数学的に導出した。
- 提案アルゴリズムは，このレートを完全に達成し，既存のDP-SPRTよりも少ないデータで同等の性能を示す。
- 逐次検定において，プライベートなe-processの停止時間に関する上限と下限を一致させた。
Link: https://arxiv.org/abs/2605.28952
最先端LLMベースエージェントによる自然表現型オントロジーキュレーションのボトルネック克服 [cs.AI]目的：自然表現型記述をオントロジー用語にリンクさせる表現型注釈の効率化
- 比較形態データの学際的な統合には不可欠であり，生物学研究の進展を促進する。
- 熟練した専門家による手作業に依存しており，大規模なデータセットへの適用が困難である。
- 最先端LLMエージェントを用いて，人間レベルの精度で自動的に表現型注釈を行うことを目指す。
- 最先端LLMエージェントは，既存のSemantic CharaParserを大幅に上回る性能を示した。
- 各エージェントの性能は，熟練した人間キュレーター間のばらつき範囲内に収まった。
- 最も優れたエージェントは，人間のキュレーターに匹敵する精度に近づいた。
Link: https://arxiv.org/abs/2605.28965
AIパーソナライズのための解釈層としての行動仕様 [cs.CL, cs.HC, cs.CL, cs.AI, cs.HC]目的：AIパーソナライズにおける表現の正確性
- AIエージェントが個人の代理として意思決定を行う場合，その決定はユーザーと整合性が取れることが不可欠である。
- 既存のAIシステムでは，ユーザーの解釈を忠実に捉えているかを評価する指標が不足している。
- 行動仕様という解釈層を導入し，AIによるユーザー表現の正確性を向上させることを目指す。
- 行動仕様は，14の自伝的コーパスにおいて，全体的な表現の正確性を向上させ，モデルの曖昧さをほぼ解消した。
- 生のコーパスと同等の予測性能を，コンテキストコストを約25分の1に抑えて実現した。
- 表現の正確性は，想起能力とは異なり，ユーザーの正確な表現が人間とAIの整合性に不可欠であることが示された。
Link: https://arxiv.org/abs/2605.28969
一般化性能の診断：学習時の対数アラインメント比 [cs.LG]目的：パラメータ活性化のアラインメントの度合いを示す対数アラインメント比（LAR）を用いた一般化性能の診断
- 深層学習モデルの性能向上には，汎化能力の理解が不可欠である。過学習を防ぎ，未知データへの適応力を高めるため。
- 学習過程における汎化性能の評価は困難であり，効率的な診断指標が求められている。
- LARを用いて，学習中のモデルが記憶から一般化へと移行する過程を捉え，汎化性能のギャップを定量化すること。
- LARは，学習中の重みスペクトルと活性化スペクトルの重なり度合いを捉え，記憶から一般化への移行を追跡することが示された。
- グロキング現象において，LARは学習された関数の有効次元$k$を$k \approx n^{2(1-\text{LAR})}$と予測することがわかった。
- 30億パラメータの言語モデル事前学習において，LARの非過学習ベースラインからの逸脱は，汎化ギャップを捉え，過学習が近づくにつれてその減少速度が増加する。
Link: https://arxiv.org/abs/2605.28975
うつ病検出におけるブラックボックス脳波モデルの解釈のための事後説明可能AI手法の比較 [cs.LG, cs.AI]目的：うつ病検出のための脳波に基づく深層学習モデルの解釈
- 近年，脳波を用いたうつ病の診断精度向上に深層学習が貢献している。
- 高精度なモデルの意思決定プロセスは解釈が困難であり，臨床応用上の課題となっている。
- 事後説明可能AI手法を用いて，脳波深層学習モデルの解釈可能性を評価し，改善を図る。
- 複数の説明手法は，前頭部，側頭部，後頭部の脳波領域，特に右半球への注目が集まるという部分的に収束した帰属パターンを示した。
- 勾配ベースと摂動ベースの手法は高い一致度を示したが，DeepSHAPは異質な帰属分布を示した。
- 結果は，異なる説明手法が脳波に基づく深層学習モデルにおいて，部分的に重複する関連構造を捉えることを示唆している。
Link: https://arxiv.org/abs/2605.28977
VFEAgent：エンドツーエンド自動有限要素解析のためのマルチモーダルエージェントフレームワーク [cs.AI, cs.CE]目的：有限要素解析の自動化
- 現代の工学設計において，有限要素解析は不可欠なツールである。
- 既存のアプローチは，マルチモーダル入力への対応や複雑なタスクの実行に課題がある。
- 画像と問題記述から直接有限要素解析モデルとシミュレーションを自動化することを目指す。
- VFEAgentは，完全かつ物理的に妥当なシミュレーションを高い成功率で生成することが示された。
- 既存のLLMベースの手法と比較して，信頼性と正確性が向上していることが確認された。
- 本フレームワークは，有限要素解析ワークフロー全体の自動化の実現可能性を示唆している。
Link: https://arxiv.org/abs/2605.28978
深層学習のハミルトン・ヤコビ理論 [cs.LG, cs.AI, math.DS, math.RT, physics.comp-ph]目的：深層学習の訓練をハミルトン・ヤコビ初期値問題の探索として捉えること
- 深層学習は，画像認識や自然言語処理など，多様な分野で目覚ましい成果を上げている。
- 深層学習の理論的な理解は不十分であり，汎化性能や頑健性の解釈が課題となっている。
- 深層学習の背後にある数学的構造を明らかにし，理論的な基盤を確立することを試みる。
- ニューラルネットワークの訓練は，ハミルトン・ヤコビ方程式の初期値問題探索と厳密に対応することが示された。
- 残差ネットワーク，Transformer，RNNなどのアーキテクチャは，同一のハミルトン・ヤコビ方程式を異なる方法で離散化している。
- この理論は，汎化性能，敵対的頑健性，スケーリング則，影響関数など，深層学習の重要な側面を統一的に説明する。
Link: https://arxiv.org/abs/2605.28983
fMRIを用いたSiamese自己教師あり学習によるロバストかつタスク不変な機能表現の学習 [cs.LG]目的：fMRIデータからロバストかつタスク不変な機能表現を獲得すること
- 脳機能の研究においてfMRIは重要なツールである。その利用は，精神疾患の診断や治療法の開発に貢献する。
- fMRIデータの取得コストが高いこと，および精神疾患評価の主観性から，サンプルサイズが小さくラベル品質が変動しやすい。
- 限られたデータでも汎化性能の高い機能表現を学習し，データ不足の神経画像解析を支援すること。
- 提案手法BrainSimSiamは，自己教師あり学習により，多様な下流タスクにおいて高い汎化性能を示す機能表現を獲得した。
- BrainSimSiamは，大規模モデルに匹敵する性能を，少ない計算資源で実現することが示された。
- この研究は，データ制約のある神経画像解析への応用可能性を示唆している。
Link: https://arxiv.org/abs/2605.28990
BEAMS：モデリングとシミュレーションのためのAIのベンチマーキングと評価 [cs.AI]目的：モデリングとシミュレーションのためのAIツールに対するベンチマークの確立
- 現実世界の意思決定支援AIには，推薦の根拠となるシミュレーションモデル構築と解釈可能性が不可欠である。
- AIツール開発において，人間の専門性を補完する責任ある倫理的な形態が求められるが，十分に進んでいない。
- 人間中心のモデリングとシミュレーションの実践に向けたAIツール開発を促進し，その評価基準を提示すること。
- BEAMSイニシアチブは，オープンなインフラストラクチャを通じてAIツールの協調的な評価を可能にしている。
- 評価テストの結果，AIツールは定性的なタスクや議論においては比較的良好な性能を示すものの，因果推論や定量的なエラー修正においては課題が残る。
- 特定のLLMが全てのエンジンタイプで優位性を示すことはなく，タスク特化と速度・精度のトレードオフの重要性が示唆された。
Link: https://arxiv.org/abs/2605.28994
LLMベースの履歴書スクリーニングにおける現実世界のプロンプトインジェクション攻撃の測定 [cs.CR, cs.AI, cs.CL, cs.LG]目的：LLMベースの履歴書スクリーニングにおけるプロンプトインジェクション攻撃の実態
- LLMの活用が拡大する中，そのセキュリティ確保は重要である。
- プロンプトインジェクション攻撃は理論的に示唆されているが，実用環境での発生頻度や影響は不明である。
- LLMベースの履歴書スクリーニングにおけるプロンプトインジェクション攻撃の実態を定量的に把握する。
- 約20万件の実際の履歴書を分析した結果，約1%に隠れたプロンプトインジェクションが含まれていることが判明した。
- プロンプトインジェクションを含む履歴書の割合は，過去1〜2年で顕著に増加している。
- 注入されたプロンプトの90%以上は，明示的な指示を使用していない。
Link: https://arxiv.org/abs/2605.28999
FormInv：数学的推論ベンチマークにおける意味的不変性の測定プロトコル [cs.CL, cs.LG, cs.AI]目的：数学的推論ベンチマークにおける意味的不変性の測定
- 大規模言語モデルの性能評価において，公平性と信頼性の確保が重要である。
- 既存のベンチマークでは，文言の言い換えによる意味の変化が検出されにくい。
- 意味的不変性を評価するプロトコルを開発し，より公平なモデル評価を目指す。
- MathCheckの言い換えデータに意味誤りが見つかり，モデルのランキングに影響を与えた。
- 複数のモデルで一致性のある評価により，低コストで意味誤りを検出可能であることが示された。
- 文言の言い換えによる意味の一貫性の低さ（SCR）と集約的な正答率の間に大きな乖離が存在することが判明した。
Link: https://arxiv.org/abs/2605.29001
FedQHD：関数空間における連合強化学習 [cs.LG, cs.DC]目的：連合強化学習における関数空間の一貫性確保
- 分散型エージェントの協調学習は，プライバシー保護の観点から重要性が増している。
- 従来のパラメータ平均化は，関数空間において一貫性を欠き，性能劣化の原因となる。
- 異なるエンコーダを持つ環境下でも，関数空間の一貫性を保てる手法を開発する。
- 提案手法FedQHDは，超次元エンコーダと線形読み出し層を用いることで，閉形式の集約を実現した。
- 共有エンコーダを使用した場合，関数空間の一致更新は，ローカル読み出し行列の加重平均と一致する。
- 実験結果から，FedQHDは既存手法と同等以上の性能を示し，計算コストも低いことが確認された。
Link: https://arxiv.org/abs/2605.29002
LoRe：反復グラフソルバーのためのステップ毎インタラクション予算を用いた適応的相互評価ルーティング [cs.LG, cs.AI]目的：組合せ最適化問題に対する拡散ベースニューラルソルバーのスケーラビリティ向上
- 組合せ最適化は現実世界の複雑な問題を解決するための基盤技術であり，その効率化が求められている。
- 既存のニューラルソルバーは計算コストが高く，大規模問題ではメモリ制約に陥りやすい。
- インタラクション評価の予算を動的に配分することで，計算効率とメモリ使用量を改善することを目指す。
- LoReは，Maximum Independent Set (MIS)問題において，既存手法のメモリ限界を3倍以上拡張し，実行時間を約8倍高速化，ピークメモリ使用量を約12倍削減した。
- Traveling Salesperson Problem (TSP)においても，LoReは汎用性を示し，n=1000で実行時間を約15倍高速化，メモリ使用量を44倍削減，ツアー品質を維持した。
- LoReは，異なるタスクやトポロジー変化に対してロバストであり，高い性能を発揮する。
Link: https://arxiv.org/abs/2605.29005
制約を考慮した介入設計のための因果推論：状態遷移の誘導 [cs.DB, cs.DC, cs.OS, cs.CL, cs.LG]目的：制約を考慮した介入設計による状態遷移誘導手法
- 科学における根本的な課題であり，システムの状態を変化させる介入の重要性が高まっている。
- 既存の予測モデルは，メカニズムに関する洞察が限られ，意思決定のための原理的な枠組みがない。
- メカニズムに基づいた介入戦略を設計し，状態遷移の有効性，複雑さ，安定性を最適化すること。
- COASTは，状態遷移を誘導するための因果的に最適な介入をin-silicoで設計する。
- COASTは，因果グラフを学習し，分布の変化を因果的な要因に帰属させ，制約を考慮した最適化を行う。
- 合成ベンチマークと生物学的データセットで，効果的な介入戦略とメカニズムに関する根拠を特定した。
Link: https://arxiv.org/abs/2605.29008
クロスモデルエントロピーによるラベルフリー強化学習 [cs.LG, cs.AI]目的：強化学習における報酬信号の改善
- 大規模言語モデルの性能向上には，強化学習による微調整が不可欠である。
- 従来の強化学習は，正確な報酬信号の取得が困難であり，学習ドメインが限定されていた。
- 自己参照信号のリスクを回避し，汎用的な指示応答タスクへの応用を目指す。
- 提案手法Cross-Model Entropy (CME) は，検証モデルによる生成応答の対数尤度に基づいたラベルフリー報酬信号である。
- CMEは，自己一貫性によるゲーム化を防ぎ，GRPOへの統合により，オープンエンドな指示応答タスクでの性能向上を実現した。
- AlpacaEval 2.0を用いた評価において，4つのモデルファミリーと3つの学習レジームで，52.5%から71.4%の勝率を記録した。
Link: https://arxiv.org/abs/2605.29009
採用 ≠ 順応：実世界のLLM会話の縦断的分析 [eess.SY, cs.SY, cs.AI, cs.CL]目的：LLMとのユーザーインタラクションにおける行動変化の経時的推移
- LLMの普及に伴い，ユーザーとの効果的な対話方法が重要視されている。
- 既存の研究では，ユーザーの行動が時間経過とともにどのように変化するかは不明である。
- ユーザーの行動パターンがどの程度固定化されているかを明らかにすること。
- ユーザーの行動は全体として変化しにくい傾向にあることが明らかになった。
- 活発なユーザーほど，LLMとの会話が成功しやすく，より複雑なタスクに利用している。
- WildChat-4.8Mは熟練ユーザーに偏っているため，典型的なユーザーの行動を代表していない。
Link: https://arxiv.org/abs/2605.29018
グラフ学習支援混合組み合わせ最適化による宇宙デブリ捕獲用アクティブ・テザーネットシステムの設計 [cs.LG]目的：宇宙デブリ捕獲用アクティブ・テザーネットシステムの設計と制御選択の体系的な探求
- 宇宙空間におけるデブリ増加は，人工衛星や宇宙活動に深刻な脅威を与えており，除去技術の開発が急務である。
- テザーネットシステム設計は，複雑な制約と非線形性を含む混合組み合わせ最適化問題であり，効率的な解法が確立されていない。
- グラフ学習を活用し，テザーネットシステムの形態，推進器，制御点を同時に最適化することで，設計プロセスの効率化を目指す。
- グラフニューラルネットワーク(GNN)を用いることで，組み合わせ最適化問題を非線形計画問題(NLP)に変換し，標準的なソルバーによる解法を可能にした。
- GNNベースのレコメンダーは，直接的なMCNLP問題の求解と比較して，同等の最適解への収束を大幅に加速することが示された。
- 提案手法は，ネットの形態，可動ユニットの質量とスラスタ，制御点の選択を同時に設計する問題に適用可能である。
Link: https://arxiv.org/abs/2605.29021
モデルが意見を異にする場合：公開コメント分析のためのLLM評価の再考 [cs.AI, cs.CY, cs.HC]目的：公開コメントの分類におけるLLM評価方法
- 政策決定には国民の声が重要であり，LLMは膨大なコメントの分析を効率化し得る。
- 従来の評価指標では，異なるLLMが同じコメントをどのように異なって分類するかは評価できない。
- LLM間の意見の不一致を分析することで，解釈の複雑性を明らかにし，曖昧なコメントを特定する。
- 複数のLLM間のテーマ的な相違は，プロンプトの変更による相違よりも大きかった。
- 専門家による評価基準は，解釈の相違を抑制するものの，根本的な解決には至らなかった。
- 人間によるラベル修正は，LLM集団からは見られなかった新たな解釈を導入することがあった。
Link: https://arxiv.org/abs/2605.29025
口調に注意を払え：口調はLLMの性能に影響するか？ [cs.AI, cs.CL, cs.HC]目的：LLMのプロンプトにおける口調変化が，客観的な多肢選択問題に対する正答率に及ぼす影響
- LLMの利用が拡大する中で，その性能はプロンプトのスタイルや口調によって変動することが課題となっている。
- LLMの性能は口調に左右されやすいものの，その影響の程度やメカニズムは十分に解明されていない。
- LLMの性能に対する口調の影響を定量的に評価し，その背後にあるメカニズムを解明すること。
- 複数のLLMにおいて，口調による性能の変化は一貫性があるものの，モデルによって異なった。
- 一部のモデルではわずかな変化が見られたが，他のモデルでは口調によって正答率が大きく変動した。
- 口調がLLMの内部推論モードを調整する可能性を示唆するルーティングフレームワークを提案した。
Link: https://arxiv.org/abs/2605.29027
帰還までの残りステップ数以上の意味：Q値による誘導を用いた帰還条件付き教師あり学習のアライメント [cs.LG, cs.AI]目的：帰還条件付き教師あり学習におけるQ値によるアライメント
- 強化学習の性能向上には，状態価値関数や方策価値関数の正確な推定が不可欠である。
- 従来の帰還条件付きシーケンスモデルは，帰還までの残りステップ数を単なる数値入力として扱うため，性能が制限される。
- 本研究は，帰還までの残りステップ数と方策の性能との整合性を確保することで，より高度な制御性能を実現する。
- Q-ALIGN DTは，出力方策のQ値が入力された帰還までの残りステップ数と一致するようにすることで，アライメントを強制する。
- 実験結果から，Q-ALIGN DTはD4RLベンチマークにおいて，優れた制御性と性能を発揮することが示された。
- 提案手法は，精度の高いアライメントを維持し，従来のモデルが失敗する速度追跡のようなタスクにも一般化できる構造化された方策群を学習する。
Link: https://arxiv.org/abs/2605.29028
ポリシーを考慮したシミュレータ学習の理論的基礎と効果的なアルゴリズム [cs.LG, stat.ML]目的：ポリシーを考慮したシミュレータ学習のための理論的基盤とアルゴリズム
- 強化学習におけるシミュレータの利用は，実世界での学習コスト削減に不可欠である。
- 予測誤差の最小化のみでは，シミュレータのわずかな不正確さを悪用され，現実世界との乖離が生じやすい。
- 戦略的な頑健性を重視することで，シミュレータの学習における現実世界との乖離を解消することを目指す。
- 提案手法は，戦略的に重要な領域における予測誤差を1.5〜2.2倍削減することを示した。
- シミュレーションのみで学習したポリシーが，実世界の最適に近い性能を達成することが確認された。
- ゲーム学習の実現可能性を示唆するオンライン学習保証と，効率的なデータ選択アルゴリズムを提示した。
Link: https://arxiv.org/abs/2605.29032
モーメントマッチングQ学習 [cs.LG]目的：Q学習における効率的な行動選択手法
- 生成モデルは複雑な分布を捉え，画像生成や強化学習など幅広い分野で活用されている。
- 既存の生成モデルは推論に時間がかかり，強化学習における反復サンプリングのボトルネックとなっている。
- モーメントマッチングにより分布レベルでの収束を保証し，推論速度を向上させることで問題を解決する。
- 提案手法MoMa QLは，既存手法と同等またはそれ以上の性能を維持しつつ，計算効率を向上させる。
- 特に，オフライン強化学習からオンライン強化学習への転移において，高速な適応性により優れた性能を示す。
- 最大平均不一致(MMD)を用いることで，様々なハイパーパラメータ設定下でも安定した学習が可能となる。
Link: https://arxiv.org/abs/2605.29033
AI活用教育における実践者の信念と行動：DOTフレームワーク調査の証拠 [cs.AI]目的：AI活用教育における実践者の信念，行動，および制度的条件
- 教育の質向上にAI活用が注目される中で，実践者の理解と実践が重要となる
- AI導入における実践者の信念や行動，そして制度的課題に関する実証研究が不足している
- 実践者のAIに対する信念と行動の実態を把握し，効果的なAI活用を促進する
- AIは教育的支援として好意的に捉えられている一方，人間による監督と批判的評価の重要性が認識されている
- 反復的なプロンプトやコンテンツ生成が実践されているが，ニーズアセスメントやフィードバックループの活用は一貫性がない
- 政策，トレーニング，インフラの不足といった制度的障壁が広く報告されている
Link: https://arxiv.org/abs/2605.29041
微分可能な信念に基づく相手の形成 [cs.AI, cs.LG]目的：相手の信念形成に対する戦略的影響
- 人間は協調において他者の信念に影響を与える。多エージェントRLでも同様の影響を再現する試みが重要。
- 既存手法は相手のパラメータ空間等に作用。欺瞞等の目標が固定化され，柔軟性に欠ける点が課題。
- 信念を直接操作対象とし，環境報酬から最適な戦略が出現するよう，柔軟な形成手法を提案。
- 提案手法D-BOSは，隠れ役割ゲームにおいてPPOやBBMよりも高い性能を示した。
- 特に，利害対立の混在する状況において，その効果が顕著に現れた。
- 信念空間での微分によるアプローチにより，複数の観察者に対しても拡張可能である。
Link: https://arxiv.org/abs/2605.29042
エージェントAI，ネスト学習，セマンティックキャッシュによるハルシネーションの軽減とAIサステナビリティ [cs.AI, cs.MA]目的：大規模言語モデルにおけるハルシネーション軽減策の検討
- 大規模言語モデルの信頼性は実用化において重要であり，特に複数エージェント間の連携では誤情報の伝播を防ぐ必要がある。
- 大規模言語モデルは虚偽の情報を生成しやすいという問題があり，特に複数段階の処理を経るパイプラインでは悪化する可能性がある。
- 本研究は，セマンティックキャッシュとネスト学習を活用することで，ハルシネーションを抑制し，AIの効率性と信頼性を向上させることを目指す。
- 提案手法では，エージェントパイプラインにおけるハルシネーションスコアを最大で35.9%削減することに成功した。
- セマンティックキャッシュのヒット率は47.3%に達し，LLMの呼び出し回数を削減することで，エネルギー消費とCO2排出量を抑制した。
- 可視化を重視した構成では，ハルシネーションの軽減効果がさらに高まり，メモリ拡張型マルチエージェント設計の有効性が示唆された。
Link: https://arxiv.org/abs/2605.29055
臨床データの離散化ベイズネットワーク分類器に対する並列適応多目的進化学習 [cs.LG]目的：臨床データに対する離散化ベイズネットワーク分類器の学習
- 意思決定支援において，透明性の高い確率モデルであるベイズネットワークの重要性が高まっている。
- 既存のベイズネットワーク学習アプローチは計算コストが高く，実データへの適用が難しい場合がある。
- 計算効率を向上させ，実臨床データでの性能評価を行うことで，その有用性を検証する。
- 並列化戦略と過学習抑制機構により，計算時間を最大54倍に短縮した。
- RADCURE，SUPPORT等の臨床データセットにおいて，既存手法と同等以上の予測性能を示した。
- 臨床的に解釈可能なコンパクトなベイズネットワークを生成し，既存の臨床因子との整合性も確認した。
Link: https://arxiv.org/abs/2605.29058
SCDBench：LLMベースのスマートコントラクト逆コンパイラのためのベンチマーク [cs.SE, cs.AI, cs.CR]目的：LLMベースのスマートコントラクト逆コンパイラ評価のためのデータセットおよびベンチマーク手法
- ブロックチェーン技術の安全性と透明性向上には，スマートコントラクトの解析が不可欠である。
- 既存の逆コンパイラ評価はデータセットや指標が限定的で，セマンティックな整合性検証が不十分である。
- LLMが生成するソースコードのセマンティックな正確性を評価し，信頼性の高い逆コンパイラ開発を促進する。
- 最先端のLLMは構造化されたSolidityコードを生成できるものの，セマンティックな整合性は依然として課題である。
- 最良のモデルでも，600件のコントラクトのうち42件のみを完全に逆コンパイルできる結果となった。
- 同じモデルによるコンパイル・修正により，わずかなコストで性能が大幅に向上することが示された。
Link: https://arxiv.org/abs/2605.29059
潜在的推論を用いた堅牢かつ効率的なガードレール [cs.AI, cs.CL, cs.CR, cs.LG]目的：大規模言語モデルの安全性確保
- LLMの社会実装が進む中，安全性は不可欠であり，誤った情報や有害なコンテンツの拡散を防ぐ必要がある。
- 既存のガードレールは，分類や蒸留推論に頼るが，特に推論に基づく手法は遅延とトークン消費が大きいという課題がある。
- 本研究は，多段階の安全推論を潜在空間に転移することで，高速かつ効率的なガードレールを実現することを目指す。
- COLAGUARDは，10種類のプロンプトと応答のモデレーション設定において，Llama Guard 3よりもマクロF1スコアを8.24ポイント向上させた。
- マクロF1スコアにおいて，明示的な推論ベースラインGuardReasonerと同等でありながら，12.9倍の高速化と22.4倍のトークン使用量削減を実現した。
- 潜在的推論は，安全性の堅牢性と推論効率を両立する，実用的なガードレール代替手段となり得ることを示唆している。
Link: https://arxiv.org/abs/2605.29068
実データを用いたエネルギー消費量予測補正のためのアンサンブルスコアフィルタリング [cs.LG, cs.NA, math.NA]目的：エネルギー消費量予測の補正手法
- 電力系統の運用，計画，需要サイドマネジメントにおいて，正確なエネルギー消費量の予測が不可欠である。
- 実際のデータは不完全，ノイズを含む，遅延している場合があり，精度の高い予測を困難にしている。
- 部分的でノイズを含む観測データを用いて，予測軌道を補正し，状態推定の精度向上を目指す。
- 学習済み予測モデルの長期的予測は信頼性が低下する一方，アンサンブルスコアフィルタリングによる補正が状態推定を大幅に改善する。
- アンサンブルカルマンフィルタとの比較により，本手法が非線形観測環境下でより強力な補正効果を示すことが確認された。
- アンサンブルスコアフィルタは，フィルタリング分布を近似するためにスコアベース拡散モデルを使用し，ニューラルネットワークの再学習を回避する。
Link: https://arxiv.org/abs/2605.29072
知識オフローディング：LLMを疎なバックボーンとメモリモジュールに分解 [cs.LG]目的：LLMの知識構造の再編成
- LLMは汎用性と専門知識を兼ね備えるが，その効率的な構造化が課題である。
- LLMのパラメータ規模が大きいため，特定ドメインへの適応が困難である。
- 汎用的な計算をバックボーンに，専門知識を外部メモリに分割する。
- KOFFは，事前学習済みのLLMを疎なバックボーンとドメイン固有のメモリに分解するフレームワークである。
- 約12%の疎性化でも，元のモデルの性能を維持し，メモリなしの疎性化による性能劣化を抑制した。
- LoRAと学習されたKVメモリは相補的であり，言語特有のニューロンが優先的に削除されることが示された。
Link: https://arxiv.org/abs/2605.29075
構造化プロンプト最適化と強化学習による複雑なテキストのグローバル・ローカル解釈性の向上 [cs.CL, cs.AI, cs.LG]目的：複雑なテキストにおけるグローバルおよびローカルな解釈性の向上
- 大規模言語モデルのテキスト分類能力向上は重要だが，解釈性とスケーラビリティの課題がある。
- 教師ありファインチューニングはスケーラブルだが，複雑なテキストの推論能力と透明性に限界がある。
- 構造化プロンプト最適化と強化学習を組み合わせ，解釈性と性能を両立させることを目指す。
- eXTCは，自然言語による標準操作手順（SOP）を学習し，大規模言語モデルからの知識蒸留と強化学習を段階的に行うことで，高速な推論と解釈性を提供。
- 推論時にローカルな推論痕跡と，学習されたドメインルールのグローバルなモジュール化された説明を可能にする。
- 様々なベンチマークにおいて，分類性能と説明の質の両方で既存の手法を大きく上回り，段階的な改善が見られた。
Link: https://arxiv.org/abs/2605.29076
強化学習ベースの産業派遣におけるシミュレーションと現実のギャップの解消：実行セマンティクスの活用 [cs.AI, cs.LG]目的：強化学習を用いた産業派遣における，シミュレーションと現実の乖離を解消するための枠組み
- 産業界ではイベント駆動型スケジューリングが普及している。その効率的な運用が重要である。
- 非同期かつ部分的に観測されるシステム状態により，意思決定の信頼性や解釈性が課題となっている。
- 実行の不確実性を構造化されたデータへと変換し，政策の評価と改善を可能にすることを目的とする。
- 提案するフレームワークは，非同期イベントストリームから決定に有効なスナップショットを生成する。
- 実行可能性を明確に定義し，政策意図，トランザクション結果，物理実行，および人的介入間の差異を記録する。
- シミュレーション評価の結果，あらゆる観測遅延において分析上の利点が見られ，実行エラーは構造化された結果へと変換された。
Link: https://arxiv.org/abs/2605.29078
安全な自律エージェントのためのバンド外メタデータの重要性：Redpanda Agentic Data Plane [cs.AI]目的：自律エージェントの安全性を確保するためのバンド外メタデータアーキテクチャ
- AIエージェントの企業データへのアクセスと自律的な行動が期待される中，安全性確保が重要となる。
- エージェントは幻覚や操作に弱く，システム知識を活かして高速に損傷を拡大する可能性がある。
- エージェントがセキュリティメタデータを安全に扱うためのアーキテクチャを提案し，ガバナンスを強化する。
- Redpanda Agentic Data Plane（ADP）は，エージェントの読み書き経路外でセキュリティコンテキストを確実に伝達するアーキテクチャである。
- ADPは，データアクセス制限，行動制約，改ざん防止監査証跡を，エージェントが認識・回避できない経路で強制する。
- マルチエージェントポートフォリオリバランスシステムでADPを実証し，クライアントアカウントの分離と監査可能性を確保した。
Link: https://arxiv.org/abs/2605.29082
同一の質問，異なる情報源，異なる回答：医療マルチソースRAGにおける情報源依存性の監査 [cs.CL, cs.AI, cs.IR]目的：医療分野におけるマルチソースRAG（Retrieval-Augmented Generation）システムにおける情報源依存性の評価と監査
- 医療情報は複数の情報源から提供され，その信頼性や整合性は患者の安全に直結する重要な課題である。
- 従来のNLP評価では，正答の正確性のみが重視され，異なる情報源間の意見の不一致が十分に考慮されていなかった。
- 本研究は，情報源間の関係性に焦点を当てた評価手法を確立し，RAGシステムの信頼性を向上させることを目指す。
- 移植医療に関する質問応答ベンチマーク「TransplantQA」を構築し，複数の医療ハンドブックを参照した回答の差異を評価した。
- 階層型検索戦略「HERO-QA」を開発し，各回答の情報源を明確化し，情報源間の関係性を監査することを可能にした。
- 情報源間の関係性を評価する構造化出力ジャッジを開発し，5段階の分類体系を用いてその差異を定量化した。
Link: https://arxiv.org/abs/2605.29084
連鎖は維持され，回答は反転する：敵対的圧力下における推論モデルのトレース-回答乖離 [cs.AI]目的：敵対的圧力下における推論モデルの新たな失敗モードの特定
- 推論モデルは対話システムの中核であり，その信頼性が重要である。
- 従来の評価では捉えきれない，対話的な状況下での脆弱性が存在する。
- 推論過程は維持されつつ回答のみが反転する現象を明らかにし，その原因を探る。
- 敵対的圧力が持続した場合，推論の連鎖は事実上正確であり続ける一方で，出力される回答が誤りに翻転する「不誠実な降伏」という現象が確認された。
- 思考モードでは乖離率が約50％に達するのに対し，思考なしモードでは11～15％に低下し，推論がこの乖離を生み出すことを示す因果関係が明らかになった。
- GPT-4oによる判定とトークンレベルの分析により，この現象の信頼性とメカニズムが裏付けられた。
Link: https://arxiv.org/abs/2605.29087
言語モデルのオンポリシー内部自己蒸留 (OISD) [cs.LG, cs.AI, cs.CV]目的：言語モデルにおける推論能力の向上
- 大規模言語モデルの性能向上が，様々な自然言語処理タスクの発展に不可欠である。
- 強化学習による後学習では，最終出力のみに注目し，中間表現に含まれる予測信号が十分に活用されていない。
- 中間表現へ最終層の予測信号を伝搬し，推論能力の向上を目指す。
- 本研究で提案するOISDフレームワークは，最終層を教師として，中間層の表現を整合させることで推論能力を向上させる。
- ロジットアライメントとアテンションアライメントという二つのメカニズムにより，推論方法と注意の集中先を一致させる。
- 数学的推論タスクにおいて，既存の強化学習ベースラインと比較して，OISDが大幅かつ一貫した改善を示すことが確認された。
Link: https://arxiv.org/abs/2605.29089
堅牢なビデオ顔偽造検出のための軽量相補的キュー融合 [cs.HC, cs.RO, cs.MA, cs.CV, cs.LG, cs.MM]目的：ビデオ顔偽造検出における精度向上とモデル軽量化
- ビデオ顔偽造は，社会に大きな混乱をもたらす可能性があり，その検出技術の重要性が増している。
- 既存の検出器は，大規模なモデルを使用するため，計算コストが高いという課題がある。
- 軽量な手法で高精度な検出を実現し，計算コストを削減することを目指す。
- 提案手法は，Xceptionをベースに，わずか292パラメータを追加するだけで，AUCを3.8～4.4%向上させた。
- FaceForensics++およびDFDC-Previewにおけるベンチマークで，F3NetやSRMといった既存手法を上回る性能を示した。
- 特徴量の組み合わせ方と軽量な融合ブロックにより，高精度かつ低コストな偽造検出が可能となった。
Link: https://arxiv.org/abs/2605.29092
臨床試験におけるAIおよび人間-AIインタラクションの動向 - 人間とAIの連携による探索 [cs.DB, cs.AI]目的：臨床試験登録情報におけるAI用語の時系列的動向と地理的分布
- 臨床試験は，医療技術や治療法の進歩に不可欠であり，その効率化が求められている。
- 臨床試験情報の解析には多大な労力がかかり，AIの活用が期待される一方で，その精度が課題となっている。
- AIと人間の協調による臨床試験情報の効率的なスクリーニング手法の確立を目指す。
- 臨床試験に関するAI関連の研究は時間とともに増加傾向にあり，特に機械学習，深層学習，チャットボット等の言及が増加している。
- AI関連の研究は中国とアメリカで最も多く，最近ではイタリア，フランス，スペイン，イギリス，トルコなど他の国々でも増加している。
- 人間とAIによる分類器は，AIを実質的に使用していない研究の識別には高い一致度を示したが，人間-AIインタラクションの分類では一致度が低かった。
Link: https://arxiv.org/abs/2605.29096
出力空間への射影によるモデルのマージ [cs.DB, cs.LG, cs.IT, math.IT]目的：ファインチューニングされたチェックポイントの統合
- 複数タスクへの対応が求められる現代の機械学習において，効率的なモデルの統合手法は重要である。
- 既存のマージ手法は経験的に成功するものの，理論的な最適性は保証されていなかった。
- 出力空間における最適化を通じて，より高品質なモデルマージを実現すること。
- モデルのマージを凸二次計画問題として定式化することで，既存手法を包含する汎用的な枠組みを確立した。
- 残差エネルギーの捕捉率という診断指標が，マージの品質を予測できることが示された。
- 言語と画像の両方のベンチマークにおいて，提案手法が既存手法と同等以上の性能を発揮した。
Link: https://arxiv.org/abs/2605.29101
GEO-Bench：生成エンジン最適化におけるランキング操作のベンチマーク [eess.SY, cs.SY, cs.CR, cs.AI]目的：生成エンジン最適化におけるランキング操作攻撃の評価
- LLMが検索結果に影響を与えるため，公平性や情報保全の観点からランキング操作の対策が重要である。
- 既存研究では評価基準が異なり，攻撃手法の強みや検知可能性の比較が困難であった。
- 統一された評価基準を用いて，様々な攻撃手法の性能を比較し，検知手法の開発を支援する。
- GEO-Benchを用いることで，様々なランキング操作攻撃の有効性とステルス性のトレードオフが明らかになった。
- ブラックボックス型のコンテンツ書き換え攻撃が，勾配ベースの攻撃と同等以上の性能を発揮し，より自然なテキストを生成し，キーワードやパープレキシティに基づく検知を回避できる場合がある。
- アクセスモデルは攻撃の強さを予測するものではないことが示された。
Link: https://arxiv.org/abs/2605.29107
化学者とAIの架け橋：解釈可能な経路評価のための専門家拡張フレームワーク [cs.LG]目的：有機合成経路の効率的な選択
- 医薬品やプロセス化学において，経路選択は実現可能性，コスト，開発効率に直結する重要な課題である。
- 既存のデータ駆動型評価システムは，合成設計の多目的性を簡略化し，普遍的な基準よりも特許経路のような代理データに依存する。
- 機械学習と化学者の専門知識を統合し，定量的評価と解釈可能な定性的分類を提供するシステムを構築する。
- 提案システムは，カテゴリー評価予測においてSpearman相関係数0.78，Pearson相関係数0.77を達成した。
- スコア予測のトップ1ランキング精度は60.2%であり，従来のベースライン17.5%を大幅に上回る結果を得た。
- DeepSetsモデルは，参照経路と機械生成経路間のツリー編集距離を用いて学習し，専門家の評価で微調整された。
Link: https://arxiv.org/abs/2605.29108
推論機能付き視覚言語行動モデルにおける脆弱性の探求：自動運転への応用 [cs.CR, cs.LG, cs.RO]目的：自動運転のための推論機能付き視覚言語行動モデルの脆弱性
- 自動運転技術の安全性向上は社会実装において不可欠であり，AIモデルの信頼性確保が重要である。
- 既存の視覚言語行動モデルは，現実世界のノイズや攻撃に対して頑健性に課題がある。
- 現実的な入力擾乱に対する脆弱性を明らかにし，安全性を高めるための評価基準と防御策を提案する。
- 推論機能付き視覚言語行動モデルは，現実的な入力擾乱に対して高い脆弱性を示すことが示された。
- 攻撃成功率は推論で最大89%，軌道操作で最大72%に達し，衝突率の増加と安全性の低下を引き起こす。
- 推論と軌道生成の相互作用を評価するためのベンチマークが提示され，今後の研究を促進する。
Link: https://arxiv.org/abs/2605.29114
unix-ctf: Unixスキル強化のための手続き的環境 [cs.CR, cs.AI]目的：Unixスキルの獲得を目指した強化学習環境の構築
- Unixコマンドはシステム管理や自動化に不可欠であり，熟練した運用が重要である。
- 従来のターミナルベンチマークは，Python等のプログラミングスキルとUnixスキルを区別できていない。
- Unixスキルに特化した環境を構築し，強化学習によるUnixスキルの向上を目指す。
- unix-ctfは，シェルエージェント向けのCTFタスクを自動生成する環境である。
- Qwen3-8Bをunix-ctfでファインチューニングした結果，solve rateが11.6%から43.6%に向上した。
- この結果は，Unixスキルが分離可能であり，直接評価することで効果的に学習できることを示唆する。
Link: https://arxiv.org/abs/2605.29115
合意を超えて：エージェント混合におけるトレースレベル合成 [cs.AI]目的：複数LLMエージェントによる問題解決におけるトレースレベル合成
- LLMエージェントの活用は，複雑な問題解決の可能性を広げる重要な研究分野である。
- 既存手法は，エージェントの推論過程を単純化し，情報を損失させている点が課題である。
- 推論トレースの完全な情報を活用し，より正確な解を得ることを目指す。
- 複数のLLMエージェントの推論トレースを統合することで，全会一致でも正解を導き出せることを示した。
- 多数決投票では到達できない，推論トレース間の補完性から恩恵が得られることが明らかになった。
- 入力摂動によるトレース多様性を生成し，多数決を保護する「自己整合型エージェント混合」が有効であることを実証した。
Link: https://arxiv.org/abs/2605.29116
PRO-CUA：コンピュータ利用エージェントのためのプロセス報酬最適化 [cs.AI]目的：コンピュータ利用エージェントの訓練手法
- 複雑なデジタルワークフローの自動化において，コンピュータ利用エージェントの活用が期待されている。
- 既存手法では，専門家の模倣データからの分布シフトやネガティブな学習信号の欠如が課題となっていた。
- ステップレベルの強化学習による反復的なプロセス報酬最適化を通して，この問題を解決することを目指す。
- PRO-CUAは，エージェント自身の実行状態に基づいた訓練を行うことで，分布シフトを低減することに成功した。
- プロセス報酬モデル（PRM）によるステップレベルのフィードバックを活用することで，密な報酬と柔軟なクレジット割当を実現した。
- ライブWebベンチマーク実験において，PRO-CUAの有効性とPRM誘導ステップレベル訓練の信頼性が確認された。
Link: https://arxiv.org/abs/2605.29119
確信に基づく近道：マスク拡散モデルにおける推論の誤りモード [cs.AI, cs.CL]目的：マスク拡散言語モデルにおける推論エラーのメカニズム解明
- 大規模言語モデルの推論能力は，様々なタスクにおいて重要であり，その信頼性向上は喫緊の課題である。
- 従来のマスク戦略は，複雑な推論を必要とする問題において，誤った予測を招く可能性がある。
- 確信度に基づいたデコーディング戦略の問題点を明らかにし，よりロバストな推論手法の可能性を示す。
- 確信度に基づいたデコーディングは，複雑な推論において，局所的な容易な予測に焦点を当て，長距離依存関係の解決を妨げる。
- 確信度に基づいた訓練は，この問題を悪化させ，特に困難な入力に対するエラー率を大幅に増加させる。
- 一方で，ランダムマスキングは，複雑な入力に対するエラー率を低く抑え，よりロバストな推論を可能にする。
Link: https://arxiv.org/abs/2605.29123
いつ，どれくらい？時間的推論における読み出し-媒介角 [cs.LG, cs.AI]目的：言語モデルにおける暦日期間推論のメカニズム解明
- 言語モデルの内部動作を理解することは，その能力向上や安全性の確保に不可欠である。
- モデルの内部表現をプローブで解釈する際，プローブがモデルの実際の計算と乖離している可能性がある。
- プローブの解釈結果とモデルの実際の計算との間のずれを定量的に評価し，解釈の信頼性を検証する。
- プローブがモデルの計算と直交する方向を学習していることが示された（読み出し-媒介角）。
- 注意機構やMLPが，「いつ」という絶対的な日付から「どれくらい」という期間への変換に関与している。
- プローブによる解釈は，モデルが実際に使用していない方向に高い信頼度を示す可能性があるため，ランタイム監視への応用には限界がある。
Link: https://arxiv.org/abs/2605.29126