arXiv雑要約

AI - 2026/05/19 公開

ガバナンス型マルチエージェントランタイムにおける検証ゲート付き完了：バウンデッドアーキテクチャのケーススタディ [cs.SE, cs.AI]目的：ガバナンス型マルチエージェントランタイムにおける検証ゲート付き完了のパターン
- マルチエージェントシステムは，複雑なワークフローと持続的な状態を持つようになり，その制御が重要になっている。
- エージェントによる完了の主張を検証するメカニズムが不足しており，信頼性の高い運用が困難である。
- 完了の主張を検証ゲートで制御し，監査可能性を確保することで，システムの信頼性を高める。
- 検証ゲート付き完了のパターンにおいて，既知の結果に対する検証成功率は99.5%であった。
- シャドーポリシー検証では，ルール合致率は98.58%であり，誤った成功は認められなかった。
- 検証ゲートとパケット化された記録により，完了決定が検査可能かつフェイルクローズであることが示された。
Link: https://arxiv.org/abs/2605.17998
複数UAV通信範囲における接続維持のための共有バックボーンPPO [cs.AI]目的：複数UAVの通信範囲における接続維持
- UAV群による広範囲な通信網構築が，災害時等のインフラ維持に不可欠である。
- UAV間の通信接続維持は困難であり，通信範囲の最適化が課題である。
- 効率的な学習と性能向上により，接続維持性能の改善を目指す。
- 提案手法である共有バックボーンPPOは，標準PPOと比較して優れた性能を示す。
- グラフ情報集約モジュールを組み込むことで，エージェント間の通信状況に適応可能となった。
- 訓練されたUAV群は，より高度な協調性を示すことが確認された。
Link: https://arxiv.org/abs/2605.17999
Spiker-LL：スパイクニューラルネットワークにおける適応的局所学習を可能にするエネルギー効率FPGAアクセラレータ [cs.CL, cs.NE, cs.AI]目的：スパイクニューラルネットワークにおける適応的局所学習の実現
- エッジデバイスにおける適応的知能の実現は，計算資源とエネルギー消費の制約から困難である。
- スパイクニューラルネットワークは有望だが，デバイス上での学習にはハードウェアとアルゴリズムの協調設計が必要である。
- 本研究は，省エネルギーで効率的な局所学習を可能にするFPGAアクセラレータの開発を目指す。
- SPIKER-LLは，オープンソースのSpiker+推論アーキテクチャを拡張し，STSF局所学習ルールを効率的にサポートする。
- MNIST，F-MNIST，DIGITSデータセットにおいて，最大93%の精度，サブミリ秒の遅延時間，1回の推論あたり0.1mJ以下のエネルギー消費を実現した。
- DSPブロックを使用せず，エッジFPGAへの展開に適した高いスケーラビリティを持つ。
Link: https://arxiv.org/abs/2605.18003
RL4RLA：カリキュラム設計とグラフベース探索によるランダム線形代数アルゴリズムの発見を機械学習に教授する [cs.LG]目的：ランダム線形代数アルゴリズムの自動発見
- 科学計算や機械学習において，ランダム線形代数アルゴリズムの重要性は高まっている。
- 高性能なランダム線形代数アルゴリズムの発見は，専門知識が必要で自動化が困難である。
- 強化学習を用いて，解釈可能で検証可能な線形代数アルゴリズムを自動的に発見すること。
- RL4RLAは，最先端の手法であるスケッチ＆プレコンディショナ，ランダム化カッツマルツ法，ニュートンスケッチなどを再発見した。
- 提案手法は，精度，速度，安定性のトレードオフを考慮したアルゴリズムの生成を可能にした。
- 数値カリキュラムとモンテカルログラフ探索により，探索効率を向上させている。
Link: https://arxiv.org/abs/2605.18004
費用感受性回帰によるスケーラブルな意思決定重視学習 [cs.LG, stat.ML]目的：費用感受性回帰による意思決定重視学習のスケーラビリティ向上
- 現実の組合せ最適化問題では不確実なパラメータが存在し，文脈情報と過去データから予測が求められる。
- 既存の意思決定重視学習は，訓練時に組合せ最適化問題を繰り返し解く必要があり，計算コストが高くスケーリングが困難である。
- 本研究では，学習問題を費用感受性多出力回帰問題として再構築し，効率的な学習を実現することを目的とする。
- 学習問題を費用感受性多出力回帰として定式化し，コスト非依存正規化，意思決定を考慮した非対称ペナルティ，インスタンスベースのコストを導入した。
- これらの損失関数コンポーネントは，訓練データインスタンスごとにゼロまたは一つの求解で済むため，計算効率が大幅に向上する。
- 実験により，提案手法が最新技術と同等のタスク品質を達成しつつ，大幅な効率化とスケーリングが可能であることが示された。
Link: https://arxiv.org/abs/2605.18005
ドメインシフト下における不確実性信頼性：フォトプレチスモグラフィーによるデータ駆動型血圧推定に関する調査 [cs.CL, cs.LG, stat.ML]目的：フォトプレチスモグラフィー信号からの深層学習ベースの血圧推定における予測性能と不確実性信頼性の評価
- 医療のような安全性重視の分野では不確実性定量化が不可欠であり，その信頼性評価は重要である。
- 現実的な分布外（OOD）条件下での不確実性評価が十分に行われていないという課題が存在する。
- ドメインシフト下における不確実性信頼性を高め，信頼性の高いカフレス血圧推定を目指す。
- アンサンブル学習（DE）は，ドメインシフト下においてモンテカルロドロップアウト（MCD）よりも優れた予測ロバスト性を示すことが明らかになった。
- 再校正されたガウス負の対数尤度（GNLL）ベースの手法が，最も良好な不確実性較正を実現する（例：GNLL+DE+CPが収縮期血圧，GNLL+DE+TSが拡張期血圧）。
- Conformal PredictionとTemperature Scalingは一貫して改善効果をもたらし，Isotonic Regressionもいくつかのケースで競争力がある。
Link: https://arxiv.org/abs/2605.18008
セマンティックを考慮したサンプリングによる生成データセット蒸留 [cs.CV, cs.AI, cs.LG]目的：データセット蒸留におけるセマンティック情報の保持
- 深層学習の性能向上には大規模データが不可欠だが，計算コストやストレージが課題となる。
- 既存の蒸留手法はデータ分布や訓練統計に重点を置き，セマンティック情報の保持が不十分である。
- セマンティック情報を考慮し，コンパクトかつ識別力と多様性を備えた蒸留データセットを構築する。
- 本研究では，CLIPを活用し，セマンティック空間におけるクラス関連性，分離度，多様性を定量化するスコアリング関数を設計した。
- 既存の蒸留手法で生成した画像プールに対し，まず識別力のあるサンプルをフィルタリングし，信頼性の高い候補セットを形成する。
- 次に，動的に多様性を考慮した選択を行い，冗長性を削減しながらセマンティックカバレッジを維持する2段階戦略を開発した。
Link: https://arxiv.org/abs/2605.18012
TinySAM 2：効率的なTrack Anythingモデルのための極限的なメモリ圧縮 [cs.CV, cs.AI]目的：動画セグメンテーションのための軽量モデルの開発
- 動画セグメンテーションは，自動運転やロボティクスなど，様々な応用分野で重要な役割を担う技術である。
- SAM 2は高性能だが，複雑な計算特性から実用的な展開にハードルが存在する。
- SAM 2の課題であるパラメータ数，計算負荷，導入コストを削減し，効率的な動画セグメンテーションを実現する。
- TinySAM 2は，SAM 2.1の性能の90%を，わずか7%のメモリトークンと3%の学習データで達成する。
- 空間的および時間的なトークン圧縮により，メモリストレージと計算コストを大幅に削減した。
- RepViTを軽量な画像エンコーダーとして採用し，モデルパラメータをさらに削減することに成功した。
Link: https://arxiv.org/abs/2605.18013
LogRouter：大規模データシステムにおけるログ質問応答のための適応型二段階LLMルーティング [cs.LG, cs.DB, cs.SE]目的：自己ホスト環境におけるログ質問応答システムの開発
- 大規模データシステムでは，ログ分析が重要であり，迅速かつ正確な情報抽出が求められる。
- リソースに制約のある環境において，全てのクエリを大規模言語モデルに通すことはコストがかかる。
- コストを抑えつつ，ログ質問応答の精度と効率を向上させることを目指す。
- LogRouterは，PySpark，GPUアクセラレーション，デュアルインデックスストレージなどを組み合わせたエンドツーエンドのシステムである。
- 二段階のコストを考慮したルーティングにより，クエリを最適な実行パスに割り当てることで，平均精度88.4%を達成した。
- ルーティングによって，固定32Bモデルと比較して平均待ち時間を55%削減し，精度を維持した。
Link: https://arxiv.org/abs/2605.18015
視覚と言語表現の整合：ビデオにおける詳細な物体理解のために [cs.CV, cs.AI, cs.HC]目的：ビデオにおける詳細な物体理解のための視覚と言語表現の整合
- マルチモーダルな情報処理において，視覚と言語の理解を統合することは重要である。
- 既存手法では，明示的な視覚的プロンプトが必要であり，柔軟性に欠ける。
- テキストによる指示のみで詳細な物体理解を可能にする視覚と言語表現の整合を目指す。
- SWIMは，訓練時にマスクによる監督を用いて，クロスモーダルアテンションを誘導する新しい戦略である。
- 属性語は視覚モダリティで局所的な活性化を示す一方，物体名が拡散したパターンを示すという乖離が明らかになった。
- SWIMはNL-Referデータセットを用いてクロスアテンションマップの空間的一貫性を強制し，性能を向上させる。
Link: https://arxiv.org/abs/2605.18018
ユーティリティ制約付き確率的集約による連合学習：合理的な参加を促進する [cs.LG]目的：合理的なクライアントの参加を維持し，グローバルモデルの性能を最大化すること
- 分散データを用いた機械学習の重要性が増しており，プライバシー保護が課題となる。
- 既存の連合学習はクライアントの自律性を考慮せず，参加意欲の低下を招く可能性がある。
- クライアントのユーティリティを考慮し，参加を持続可能なものにする方法を提案する。
- 提案手法FedUCAは，クライアントの参加可能性を優先することで，高いクライアント維持率を達成する。
- その結果，グローバルモデルの性能が大幅に向上することが実験的に示された。
- 本研究は，連合学習におけるクライアントの合理的な行動を考慮することの重要性を示す。
Link: https://arxiv.org/abs/2605.18020
記憶と汎化の共存の解明：ラベルノイズを含む算術タスクにおける事例研究 [cs.LG, cs.AI, stat.ML]目的：過剰パラメータモデルにおける記憶と汎化の共存メカニズム
- 深層学習モデルの性能向上は目覚ましいが，その内部メカニズムは未だ不明な点が多い。
- ラベルノイズの存在は，モデルの汎化性能を阻害する大きな要因の一つである。
- ラベルノイズ下での記憶と汎化の共存メカニズムを解明し，汎化性能を向上させること。
- 過剰パラメータモデルは，適切な最適化とモデル構成により，ノイズの多いラベルを記憶しつつも高い汎化性能を示す。
- モデル内部には汎化構造が形成されるものの，ノイズラベルへの適合により出力での表現が抑制される。
- 周波数に基づく手法を用いて内部構造を抽出することで，80%のラベルノイズ下でも高いテスト精度を達成可能である。
Link: https://arxiv.org/abs/2605.18022
ロバストなマルチエージェント強化学習のための相互作用破壊敵対的学習フレームワーク [cs.LG, cs.AI, cs.MA]目的：マルチエージェント強化学習におけるロバスト性の向上
- 複数エージェントが協調して問題を解決する技術であり，現実世界の複雑な課題への応用が期待される。
- エージェント間の相互作用が外部からの擾乱によって阻害されると，協調性が脆弱になるという課題がある。
- エージェントの観測や行動を擾乱する攻撃を生成し，それに対するロバスト性を学習することで解決を目指す。
- 本研究で提案するIBALフレームワークは，既存のロバストMARL手法と比較して，多様な攻撃設定下でロバスト性を向上させる。
- エージェントが欠損する状況下でも，より高い性能を示すことが確認された。
- 情報理論的な視点から，協調を阻害する攻撃を構築し，エージェントを訓練することで，信頼性の高い性能を実現する。
Link: https://arxiv.org/abs/2605.18024
TeleCom-Bench：大規模言語モデルは産業用通信アプリケーションにどれほど近づいているか [cs.AI]目的：大規模言語モデルの産業用通信アプリケーションへの適用可能性評価
- 通信分野は社会基盤を支える重要な分野であり，高度化と効率化が求められている。
- 既存のベンチマークは基礎知識や単一スキルに偏っており，実環境でのワークフロー評価が不十分である。
- 本研究は，実環境の通信ワークフローに基づいた包括的な評価ベンチマークを構築し，課題を明確化する。
- TeleCom-Benchは，通信の基礎知識，プロトコル，ネットワーク構造に加え，製品知識を含む多次元知識理解を評価する。
- 評価の結果，大規模言語モデルは意図解釈やエンティティ抽出といった言語処理タスクでは高い精度を示す一方で，解決策の生成といった手順実行タスクでは大幅に性能が低下した。
- この結果は，現状の大規模言語モデルが診断はできるが，現場エンジニアとしての機能は不十分であることを示唆している。
Link: https://arxiv.org/abs/2605.18025
FedSDR：修正を用いた連合自己蒸留 [cs.RO, cs.LG, cs.AI]目的：大規模言語モデルの連合ファインチューニングにおける統計的異質性への対処
- 大規模言語モデルの活用は拡大する一方であり，その性能向上が不可欠である。
- 連合学習では，クライアント間のデータ分布の不一致が深刻な課題となっている。
- データ分布の不一致を解消し，事実に基づいた正確なモデル構築を目指す。
- 連合自己蒸留（FedSD）が強力な戦略として確立され，従来のアルゴリズムを上回る性能を示した。
- 自己蒸留による幻覚や冗長性の増加という「書き換えのパラドックス」が明らかになった。
- FedSDRは，平滑化ブランチと修正ブランチを組み合わせることで，事実に基づいた整合性の高いモデルを構築する。
Link: https://arxiv.org/abs/2605.18028
PROTEA：マルチエージェントLLMワークフローのオフライン評価と反復改善 [cs.CL, cs.AI, cs.HC, cs.SE]目的：マルチエージェントLLMワークフローのデバッグと改善のための手法
- LLMの活用範囲拡大に伴い，複雑なタスクを複数のLLMに分割する手法が注目されている。
- マルチエージェントシステムでは，エラー原因の特定や改善が困難である。
- ワークフローのボトルネックを特定し，プロンプトを効率的に修正することで改善を目指す。
- PROTEAは，ワークフローのノード出力を評価し，ボトルネックを特定するインターフェースを提供する。
- 最終回答を参考に，ノードレベルでの期待値を生成し，出力と比較することで評価を行う。
- ドキュメント検査の精度は64.3%から83.9%へ，レコメンデーションのHit@5は0.30から0.38へ向上した。
Link: https://arxiv.org/abs/2605.18032
ゼロ次ハード閾値化における分散削減の新たな知見：勾配誤差と拡張性の矛盾の緩和 [cs.AI, cs.LG]目的：ゼロ次勾配を用いた$\ell_0$制約最適化問題に対する分散削減
- 機械学習において，$\ell_0$制約最適化は重要であり，その効率的なアルゴリズムが求められている。
- 既存のゼロ次ハード閾値化アルゴリズムは，勾配のずれとハード閾値化の拡張性の矛盾により，適用範囲に制限がある。
- 本研究は，分散削減に着目することで，この矛盾を緩和し，アルゴリズムの適用範囲を拡大することを目的とする。
- 本研究で提案するアルゴリズムは，ゼロ次勾配のランダム方向数に関する制約を解消し，SZOHTと比較して収束率を向上させた。
- 分散削減の新たな視点から，ゼロ次勾配とハード閾値化の間の固有の対立を緩和することが示された。
- リッジ回帰問題やブラックボックス敵対的攻撃への応用を通して，提案手法の実用性が確認された。
Link: https://arxiv.org/abs/2605.18035
XAIにおける信頼性の校正：一般ユーザーへのモデル限界の提示の影響 [cs.HC, cs.AI]目的：説明可能なAI(XAI)の安全な展開のための信頼性の校正
- AIの社会実装が進む中で，AIシステムの信頼性は不可欠であり，特に説明可能性が重要となる。
- ユーザーのAIシステムへの信頼と実際の性能との乖離は，誤った意思決定を招く可能性がある。
- モデルの限界をユーザーに提示することで，信頼性の校正を改善し，適切なAI利用を促進する。
- ケースごとの信頼性評価において，モデルの限界に関する情報開示が信頼性の校正に効果的であることが示された。
- 短期的な経験だけでは，徐々に信頼性が校正されるとは限らないことが明らかになった。
- 提示された事例のパッケージが，実験的な操作よりも分散の大部分を説明する要因であった。
Link: https://arxiv.org/abs/2605.18036
信頼性に基づいたロボットの自律性：不確実性は実際に役立つのか？ [cs.IR, cs.MM, cs.RO, cs.AI]目的：ロボットの自律性判断における不確実性の役割に関する評価
- ロボットの自律性は，人間の介入なしに多様な環境で動作するために不可欠である。
- 既存の自律性判断指標は，不確実性が行動選択に与える影響を直接評価できない。
- 不確実性がロボットの行動判断を改善できる条件を明らかにすること。
- データセットに依存する能力閾値以下では，不確実性に基づくエラーランク付けは不安定である。
- 能力閾値以上では，不確実性の推定手法（ソフトマックスヒューリスティクス，MC Dropout，アンサンブル）は同様の結果を示す。
- 行動の選択閾値が実行結果に大きく影響し，時間的な環境変化に対してはランキングの質は安定する。
Link: https://arxiv.org/abs/2605.18045
DocOS：GUIエージェントにおける積極的なドキュメント駆動型アクションに向けて [cs.RO, cs.AI]目的：GUI環境における長尾タスク解決のための，ドキュメントを活用したエージェントの能力向上
- GUIエージェントは自動化の鍵であり，多様なデバイス操作を可能にする。継続的な発展が求められている。
- 既存のエージェントは事前学習に依存し，明示的な手順知識を必要とするタスクへの対応が困難である。
- ドキュメント検索による問題解決能力を付与し，エージェントの自己進化を促すことを目指す。
- 本研究では，エージェントが自律的にドキュメントを検索し，手順を理解してGUIアクションに変換する「積極的なドキュメント駆動型アクション」という新しいパラダイムを提案した。
- DocOSというベンチマークを提案し，ドキュメントを活用した問題解決能力を評価できる環境を構築した。
- 実験の結果，情報検索の信頼性と，検索された手順のアクションへの正確な変換が課題であることが示された。
Link: https://arxiv.org/abs/2605.18048
保護はほぼ全てである：構造的保護がKVキャッシュ退避におけるスコアリングを支配する [cs.LG, cs.CL, cs.CR, cs.PF]目的：グローバルな上限付きデコード時間ハーネス下におけるKVキャッシュ退避ポリシーの性能
- 大規模言語モデルの効率的な推論には，キャッシュの適切な管理が不可欠である。
- 従来のキャッシュ退避ポリシーは，プロンプト境界における脆弱性を抱えており，性能が著しく低下する。
- プロンプト境界における構造的保護によって性能低下を防ぎ，効率的なキャッシュ利用を実現すること。
- 構造的保護を導入することで，純粋なTransformerモデルにおける性能が大幅に向上し，F1スコアが0.064から0.69～0.90に回復した。
- 簡略化されたスコア分離変種は，保護によりLRUと同等の性能を示し，さらに注意ポリシーはLRUをわずかに上回った。
- NIAH-32Kレジーム転送実験では，デコード時とプリフィル時で保護の効果に差は見られず，一貫した性能向上が確認された。
Link: https://arxiv.org/abs/2605.18053
グラフを用いた潜在拡散アラインメントによる基礎モデル表現と空間遺伝子発現予測 [cs.LG, cs.AI]目的：空間遺伝子発現予測のための基礎モデル表現
- 空間トランスクリプトーム解析は，遺伝子発現の空間的分布を理解する上で不可欠である。
- 既存手法は，遺伝子間の協調性や空間的分布といった生物学的構造を考慮していない。
- 遺伝子発現と空間的相互作用の同時モデリングにおける次元の呪いを克服する。
- FLAGは，空間的グラフエンコーダと遺伝子基礎モデルのアラインメントを統合し，構造的な分布モデリングを可能にする。
- 従来の精度指標（PCC/MSE）で高い競争力を示し，遺伝子間の関係と遺伝子-空間の関係の構造的忠実度を大幅に向上させた。
- 新たに開発した構造評価指標（GSC，SSC）により，モデルの性能を厳密に評価した。
Link: https://arxiv.org/abs/2605.18055
MixCountデータセット：オープンボキャブラリ物体計数のデータギャップの解消 [cs.CV, cs.LG]目的：混合物体環境における物体計数のためのデータセットとベンチマーク
- 物体計数は基礎的な画像処理技術であり，産業検査や製品選別など，実世界での応用が期待されている。
- 既存の物体計数データセットはアノテーションコストが高く，ノイズも多い。合成データでは多様性と現実感に課題がある。
- 本研究では，大量の合成データを用いて，混合物体環境における物体計数モデルの性能向上を目指す。
- MixCountデータセットは，現在の物体計数モデルの苦手とする混合物体環境を対象としたベンチマークとトレーニングデータを提供する。
- 提案手法による合成データで学習することで，実世界のベンチマークFSC-147とPairTallyでそれぞれMAEが20.14％，18.3％減少した。
- これにより，ラベル付きデータのボトルネックを解消し，高精度な物体計数モデルの開発に貢献する。
Link: https://arxiv.org/abs/2605.18063
過剰な情報圧縮の軽減による時空間残差誤差伝播の改善 [cs.OS, cs.DC, cs.CL, cs.LG, cs.AI]目的：再帰モデルにおける時空間残差誤差伝播の軽減
- 時系列データ予測において，不確実性を定量的に評価することは重要である。そのためには，残差誤差の正確なモデル化が不可欠である。
- 既存の深層学習モデルは，時間変動する同時相関は捉えつつも，誤差の時間的依存性や空間相関を無視する傾向がある。
- 本研究は，時空間的制約を克服し，誤差相関を考慮した自己回帰予測を可能にするモジュールを提案することで，予測精度を向上させる。
- 提案手法Tegerは，離散フォルマン曲率に基づき，情報ボトルネックとなるエッジを強化する空間曲率を意識したグラフ再配線機構を導入する。
- TegerはLSTM，Transformer，xLSTMといった様々なバックボーンに適用可能であり，4つの現実世界の時空間データセットでCRPSの改善が確認された。
- 理論的分析により，Tegerが過剰な情報圧縮の緩和，スペクトル結合性の向上，有効抵抗の低減，共分散キャリブレーション境界の改善に貢献することが示された。
Link: https://arxiv.org/abs/2605.18068
A-ProS：マルチモデルフィードバックによる信頼性の高い自律プログラミングへ [cs.SE, cs.AI]目的：自律プログラミングエージェントの信頼性向上
- ソフトウェア開発における自動化の重要性が増しており，LLMを活用したコード生成が注目されている。
- LLMによるコード生成は高いポテンシャルを持つものの，実行フィードバックを用いた反復改善が十分ではない。
- マルチモデルフィードバックを用いて，自律プログラミングエージェントのコード生成とデバッグの精度向上を目指す。
- A-ProSはChatGPT (GPT-4, GPT-5) をコード生成器とし，Codestral-2508，Llama-3.3-70B，DeepSeek-R1をデバッグ批評家として組み合わせた。
- GPT-5を用いたワークフローでは，初期の正解数が39から3回の反復で85-90に，GPT-4では15から31-38に改善された。
- 状態を持つ反復改善は，状態を持たないアプローチより8.5-10.6% の改善を示し，繰り返しエラーを最大3.5倍削減した。
Link: https://arxiv.org/abs/2605.18073
LLMによる誘導通信を用いた協調型マルチエージェント強化学習 [cs.RO, cs.AI, cs.LG, cs.MA]目的：協調型マルチエージェント強化学習におけるコミュニケーション戦略
- マルチエージェントシステムにおいて，効率的な協調は重要な課題であり，性能向上に不可欠である。
- 既存手法では，情報伝達の効率が悪く，十分な状態情報を共有できない場合がある。
- LLMを活用し，状態の正確かつ均一な再構築を可能にするコミュニケーションプロトコルの設計。
- LMACは，LLMの推論能力を活用し，エージェント間で状態を正確に再構築できるコミュニケーションプロトコルを設計する。
- LMACは，明示的な状態認識基準を用いてプロトコルを反復的に改善し，状態復元精度を高め，エージェント間の知識格差を縮小する。
- 多様なMARLベンチマーク実験により，LMACはエージェント間での状態再構築を改善し，既存のコミュニケーション手法と比較して大幅な性能向上を示す。
Link: https://arxiv.org/abs/2605.18077
相手環境を考慮した基点侵入による多エージェント方策勾配法の均衡選択 [cs.LG]目的：多エージェント方策勾配法における均衡選択のメカニズム
- 複数エージェント間の協調行動は，社会システムや経済モデルにおいて重要な課題である。
- 方策勾配法は局所的な均衡に収束するが，どの均衡に到達するかは不明確である。
- 外部基準に基づく目標均衡集合への侵入確率を高める均衡選択メカニズムを解明する。
- 有限展開Meta-MAPGの更新は，通常の方策勾配，自己学習，そして他者学習の修正に分解されることが示された。
- 他者学習の修正が主要な均衡選択メカニズムであり，局所的な整合条件の下で目標均衡集合への侵入確率が増加する。
- 修正の減衰により，元のゲームの零更新点をシフトさせながら，通常の勾配法の収束性を維持できる。
Link: https://arxiv.org/abs/2605.18078
要約Chain-of-Thoughtを用いた低精度Softmax Transformerの表現力 [cs.LG, cs.CC, cs.CL]目的：低精度Softmax Transformerの表現力に関する解析
- Transformerは自然言語処理の基盤技術であり，その表現力の理解は重要である。
- 既存の研究では，現実のモデルとは異なる設定での表現力が示されており，ギャップが存在する。
- 現実的な設定下でTransformerの表現力を評価し，限界を明らかにすることを目的とする。
- 標準的なTransformerデコーダーにおいて，活性化と注意重みの丸め処理が表現力に与える影響を解析した。
- Chain-of-Thought (CoT)を用いたハードマックスTransformerがチューリングマシンをシミュレート可能であることを示した。
- 要約CoTがより効率的にチューリングマシンをシミュレートし，モデルサイズが空間制約に対して対数的にスケールすることを示した。
Link: https://arxiv.org/abs/2605.18079
pyforce-1.0.0：マルチ物理問題のデータ駆動型モデル次数縮小のためのPythonフレームワーク [cs.LG]目的：マルチ物理問題に対するデータ駆動型モデル次数縮小手法
- 原子力工学等の分野で，複雑なモデルの計算コスト削減が重要である。
- 既存手法では，計算負荷が高く，効率的なモデル次数縮小が課題である。
- 本研究は，データ駆動型アプローチにより，効率的なモデル次数縮小を実現する。
- pyforce 1.0.0は，pyvistaをバックエンドとして再実装し，可視化機能を向上させた。
- NumPy配列の利用により，パッケージの使いやすさと互換性を高めた。
- VTK形式で出力する任意のソルバーとの連携が可能となり，適用範囲が広がった。
Link: https://arxiv.org/abs/2605.18082
構成的幾何経路問題の解決学習 [cs.CL, cs.DC, cs.SI, cs.CE, cs.AI]目的：構成的幾何経路問題に対する解法
- 現実世界の経路最適化問題に対応するため，多様な幾何形状を統一的に扱える枠組みが求められている。
- 従来の経路問題では，点，線，領域など形状が限定されていた。複雑な形状の経路最適化が困難であった。
- 多様な形状の経路問題に対して，効率的かつ汎化性能の高い解法を確立することを目的とする。
- 提案手法DiConは，微分アテンションとコントラスト学習を組み合わせることで，探索空間の絞り込みとロバストな表現学習を実現した。
- 微分アテンション機構により，競争力の低い行動の確率を抑制し，効率的な探索を可能にした。
- コントラスト学習により，タスクの幾何学的特徴を考慮した表現を獲得し，汎化性能を向上させた。
Link: https://arxiv.org/abs/2605.18094
SENSE：持続可能な環境のための衛星ベースエネルギー合成 [cs.CV, cs.AI]目的：都市建物エネルギーモデルの生成
- 都市の持続可能性向上には，建物エネルギー消費量の正確な把握が不可欠である。
- 既存研究は予測型が多く，都市計画の生成的側面を反映できていない。
- 衛星画像と建物エネルギーデータを統合し，エネルギー効率的な都市計画を支援する。
- SENSEは，道路ネットワークと都市密度を条件として，現実的な衛星画像と建物エネルギー消費量を同時に生成する。
- 4都市での実験により，SENSEは高い視覚的忠実度と物理的整合性を持つことが示された。
- 少ないラベル付きデータで十分な合成データを生成し，下流タスクの予測性能を最大10％向上させた。
Link: https://arxiv.org/abs/2605.18101
マルチモーダルLLMにおける安全性幾何学的崩壊と適応ドリフト補正 [cs.AI, cs.CR]目的：マルチモーダルLLMの安全性ギャップとその改善策に関する研究
- LLMは急速に進化し，社会への影響が拡大しているため，安全性確保が重要である。
- マルチモーダルLLMは，テキスト以外の入力に対して安全性能力が低下する問題がある。
- 本研究は，この安全性低下の原因を特定し，リアルタイムでの改善策を提供する。
- マルチモーダル入力は，安全性判断に利用できる表現空間を圧縮し，安全性幾何学的崩壊を引き起こす。
- ドリフト補正を行うことで，安全性判断能力を回復させ，モデルの自己修復能力が確認された。
- ReGapという推論時補正手法を提案し，マルチモーダルLLMの安全性を向上させることが示された。
Link: https://arxiv.org/abs/2605.18104
TaskGround：完全シーン家事推論のための構造化実行可能タスク推論 [cs.CL, cs.AI, cs.CV, cs.RO]目的：完全シーン家事推論における実行可能タスク構造の推論
- 家庭用ロボットの普及には，複雑な家庭環境でのタスク遂行能力が不可欠である。
- 完全な家庭シーンはタスクに関係ない情報が多く，直接プロンプトすると非効率になりやすい。
- プライバシーや計算資源の制約下で，コンパクトなモデルでも実用的な家事遂行を可能にすること。
- TaskGroundは，シーンをタスク関連部分に絞り込み，実行可能なタスク構造を推論するフレームワークである。
- FullHomeデータセットを用いて評価した結果，TaskGroundは既存モデルのタスク成功率を大幅に向上させた。
- 特に，Qwen3.5-9Bの性能をGPT-5に匹敵させつつ，入力トークンコストを最大18倍削減することに成功した。
Link: https://arxiv.org/abs/2605.18109
多変量時系列異常検知のための空間的・時間的関連性の事前観察敵対的学習 [cs.AI]目的：多変量時系列異常検知における空間的・時間的関連性の学習
- 時系列データ分析は，様々な分野で重要な役割を担い，異常検知はその中でも特に重要な課題である。
- 既存手法では，空間構造の過度な一般化により，異常を誤って再構成し，検知率が低下する問題がある。
- 空間構造の事前知識とデータ駆動型観測のずれを敵対的に学習し，高精度な異常検知と局所化を目指す。
- 本研究で提案するフレームワークは，時間的な異常検知と空間的な局所化の両方において，最先端の性能を達成した。
- 敵対的学習により，モデルは時間的な変化に対する感度を高めるとともに，異常を特定のチャネルに局所化することが可能となった。
- 新たな合成ベンチマークを構築し，チャネルごとの詳細なアノテーションを用いて，異常局所化能力を体系的に評価した。
Link: https://arxiv.org/abs/2605.18128
この3Dアセットは誰が生成したか？生成3Dモデルのソース帰属学習 [cs.CV, cs.AI]目的：生成3Dモデルのソース帰属
- ゲーム，ロボティクス，没入型コンテンツ作成において生成3Dモデルの利用が拡大しており，著作権保護や品質管理が重要になっている。
- 3Dアセットの生成元を特定することは困難であり，特に分散した特徴や現実的な制約下では信頼性が低い。
- 生成3Dモデルが残す安定的な指紋を特定し，信頼できる3Dコンテンツの出所を追跡することを目指す。
- 本研究では，22種類の代表的な3D生成モデルを対象としたソース帰属ベンチマークを構築し，安定した指紋としてクロスビュー不整合と幾何学的構造のアーティファクトを特定した。
- 提案手法である階層型マルチビューマルチモーダルTransformerは，外観，幾何学，周波数領域の特徴を融合し，高い精度を達成した（完全教師あり下で97.22%）。
- 少ないデータ（1%の訓練データ）でも77.17%の精度を達成し，現代の3D生成モデルが追跡可能な指紋を残すことを示した。
Link: https://arxiv.org/abs/2605.18132
ブラックボックス型チャットボット環境におけるプロンプトインジェクションを介したプライバシー漏洩チェーンの実証研究 [cs.CR, cs.AI, cs.HC, cs.IR]目的：プロンプトインジェクションによるプライバシー漏洩チェーン
- 大規模言語モデル活用が進む中，チャットボットのセキュリティとプライバシー保護は重要な課題となっている。
- 外部コンテンツ利用時の脆弱性により，意図しない情報漏洩のリスクが存在する。
- ブラックボックス環境下での攻撃手法を分析し，プライバシー漏洩の可能性を評価する。
- プロンプトインジェクションによって，チャットボットの動作を悪意のある目的に誘導できることが示された。
- 新たなプロンプトインジェクション技術「模範提示」が，既存手法よりも高い攻撃成功率を示すことが確認された。
- 模擬的な個人情報を用いた実験により，データ窃取の実現可能性が実証された。
Link: https://arxiv.org/abs/2605.18133
生成AIと生産性格差：教育における人間とAIの相補性 [cs.HC, cs.AI]目的：生成AI利用における生産性への影響の不均一性と，その要因の解明
- 知識創造・処理・応用において生成AIの重要性が増しており，その影響を理解する必要がある。
- 生成AIの生産性効果が利用者によって大きく異なり，その原因が不明である。
- AI活用能力（AIC）に着目し，AI導入による格差を是正する方策を探る。
- 生成AIへのアクセスは，平均的にタスクパフォーマンスを向上させた。
- パフォーマンスの向上は，学業成績や事前知識ではなく，AI相互作用能力（AIC）に強く関連していた。
- 概念マップによる支援は結果のばらつきを軽減し，標準化されたワークフローがAI利用の不平等を緩和する可能性を示唆した。
Link: https://arxiv.org/abs/2605.18143
ナノ医科学におけるエビデンスに基づくフロンティアマッピングと自律的仮説生成 [cs.AI]目的：ナノ医科学分野における研究方向性の選択を支援するための，エビデンスに基づいた知識発見
- ナノ医科学は多岐にわたる分野を包含し，学際的な研究が求められるが，その知識体系は体系化が課題である。
- 既存のAI研究は物性予測や製剤最適化に偏っており，研究方向性の選択を支援する機能は不足している。
- 文献マップとグラフ解析を用いて，低密度領域を発見し，AIが仮説を生成・評価することで研究を加速する。
- pArticleMapは，過去の文献を基に将来の研究テーマを予測するのではなく，未開拓の領域を特定し，エビデンスに基づいた仮説を生成する。
- 再現性検証の結果，pArticleMapは将来的に重要となる文献群を特定する能力が示され，タスクレベルでの仮説回収率は10.8%を達成した。
- 専門家との意見の一致は限定的であったが，AIによるスコアリングは研究支援の有用なシグナルとなり得ることを示唆している。
Link: https://arxiv.org/abs/2605.18144
信用リスク予測のための基盤モデル：ゲームチェンジャーとなりうるか [cs.LG]目的：信用リスク予測における基盤モデルの有効性評価
- 信用リスク管理は金融機関の健全性を維持する上で不可欠であり，精度の高い予測が重要である。
- 既存のモデルは改善の余地があり，特に中小企業融資などの小規模データセットでの課題が残る。
- 本研究は，小規模データセットにおける信用リスク予測の精度向上を目指す。
- 表形式データの基盤モデルは，多くのデータセットとタスクにおいて優れた性能を示した。
- データセットの規模が縮小するほど，予測性能の向上が顕著であった。
- ハイパーパラメータ調整なしで高い性能を発揮し，容易な利用と計算コストの削減に貢献する。
Link: https://arxiv.org/abs/2605.18147
ノイズの中の囁き：代理による概念覚醒のためのマルチエージェントフレームワーク [cs.HC, cs.AI]目的：拡散モデルにおける概念覚醒手法の提案
- テキストから画像を生成する拡散モデルの安全性確保は重要である。不適切なコンテンツ生成のリスクを低減する必要がある。
- 既存の概念削除手法は概念を完全には除去できず，覚醒攻撃に脆弱であるという課題がある。
- ブラックボックス環境下で概念を効果的に覚醒させ，既存手法の限界を克服することを試みる。
- 提案手法ConceptAgentは，拡散モデルのノイズ状態から概念を覚醒させ，モデルパラメータや勾配にアクセスせずに実現する。
- 実験により，ConceptAgentがブラックボックス環境下で消去された概念を正確かつ制御可能に覚醒させることが示された。
- 本研究は，現在の概念削除手法の根本的な限界と，拡散モデルにおけるセマンティック制御の動的な性質に関する新たな知見を提供する。
Link: https://arxiv.org/abs/2605.18150
ビジョン推論変換器：マルチモーダル大規模言語モデルにおける視覚的一貫性の維持 [cs.CV, cs.AI]目的：マルチモーダル大規模言語モデルにおける視覚的一貫性維持の改善
- 近年，画像とテキストの情報を統合する手法が発展し，大規模言語モデルの性能が向上している。
- 視覚情報はテキストトークンと同等に扱われ，視覚モダリティの独自性が薄れているという課題がある。
- 生成の長さが長くなるにつれて，視覚情報への依存度が低下し，視覚と言語の整合性が損なわれる問題を解決する。
- 提案手法VIFは，視覚表現とモデルの出力空間の間に直接的な橋渡しをする軽量なモジュールである。
- VIFは推論のデコーディング段階を通して視覚的意味を継続的に注入し，生成中にモデルが視覚内容に強く結び付けられるようにする。
- 14のベンチマークタスクにおいて，多様なアーキテクチャでVIFがモデル性能を一貫して向上させることが示された。
Link: https://arxiv.org/abs/2605.18160
視覚言語モデルにおける幾何学的論理整合性による自己進化型空間推論 [cs.CV, cs.AI]目的：視覚言語モデルの空間推論能力の向上
- 視覚言語モデルは急速に発展しているが，空間推論は依然として課題である。
- 既存モデルは，わずかな入力変化で予測が大きく変動し，頑健性に欠ける。
- 幾何学的論理整合性を強化することで，空間推論の頑健性を高めることを目指す。
- 提案手法SAGEは，幾何学的・言語的双対演算を通じて論理整合性を強制する自己進化型フレームワークである。
- SAGEは，GRPO訓練において双対整合性を補助報酬として組み込み，一貫性のある回答を促す。
- 実験の結果，既存手法と比較して性能が向上し，未知データへの汎化能力が改善された。
Link: https://arxiv.org/abs/2605.18162
TRACE: 交差層からのエビデンスに基づく軌道修正による幻覚低減 [cs.AI, cs.CL]目的：大規模言語モデルにおける幻覚低減
- 大規模言語モデルの普及に伴い，その生成する情報の信頼性が重要課題となっている。
- 既存手法では，特定の層のみに焦点を当てたり，単一の修正方法に依存したりする傾向がある。
- モデル内部のエビデンスを用いて，入力ごとに最適な修正方法を決定し，幻覚を低減すること。
- 提案手法TRACEは，追加学習や外部知識なしに，モデル内部の交差層エビデンスから修正層と演算子を決定する。
- 15モデル，8モデルファミリー，3評価指標において，TRACEは一貫して性能を向上させ，平均でMC1が+12.26点，MC2スタイルで+8.65点の改善を示した。
- 最大でMC1が+47.20点，MC2スタイルで+43.38点の改善が見られ，回帰は認められなかった。
Link: https://arxiv.org/abs/2605.18163
弾力的なdLLM：拡散LLMの位地保持コンテキスト圧縮と拡張 [cs.LG]目的：拡散LLMにおけるコンテキスト処理の効率化と拡張
- 大規模言語モデルの性能向上には，長い文脈を効率的に処理する能力が不可欠である。
- 拡散LLMは並列処理が可能だが，マスクされたトークン数の多さから計算コストが高い。
- マスクトークンの冗長性を解消し，文脈情報を保持したまま効率的な処理を実現する。
- マスクトークンの圧縮と終端認識型拡張により，dLLMのデコード速度が向上した。
- 入力長制限下で，文脈フォールディングのような長文脈処理を自然に拡張できることが示された。
- ブロック型dLLMにおいては，終端マスクトークンによる生成品質の向上が確認された。
Link: https://arxiv.org/abs/2605.18165
見えないものを可視化：生成的な視覚的根拠付けがMLLMによる普遍的な脳波理解を可能にする [cs.DC, cs.AI]目的：脳波データの視覚的根拠付けによる，MLLMを用いた脳波理解の向上
- 脳活動の解明は，精神疾患の診断や治療法の開発に不可欠であり，その重要性は高い。
- 脳波データは視覚情報との関連性が弱く，テキストのみでのアライメントでは情報損失が生じやすい。
- 脳波データから画像を生成し，視覚的情報をMLLMに提供することで，より高精度な脳波理解を目指す。
- 生成モデルを用いて脳波から画像を生成するGVGフレームワークを提案し，視覚的根拠付けが脳波理解に有効であることを示した。
- 軽量なGVG-X-Omniは，17億パラメータのテキストアライメントベースラインと同等の性能を，わずか1700万パラメータの調整で達成した。
- 画像とテキストのトリモーダルアライメントをGVG-Janusに拡張し，脳波理解と画像生成の両方で一貫した改善効果を確認した。
Link: https://arxiv.org/abs/2605.18172
リングマスターLMO：非同期線形最小化オラクルモーメンタム法 [cs.LG, cs.DC, math.OC, stat.ML]目的：非制約確率的非凸最適化における線形最小化オラクルに基づくモーメンタム法の非同期化
- ニューラルネットワークの訓練において，AdamWに匹敵する性能を持つMuon等の手法が注目されている。
- Muonを含む線形最小化オラクルに基づく手法は，同期処理を前提としているため，分散システムにおける非効率性が課題である。
- 異種分散環境下での訓練効率を向上させるため，遅延を考慮した非同期線形最小化オラクル法を提案する。
- リングマスターLMOは，古い勾配を適切に棄却することで，異種環境下での最適な時間複雑度を達成する。
- 提案手法は，一般的なLMOに基づく更新に拡張されており，遅延閾値の適応的な調整により，パラメータに依存しない収束性を示す。
- 確率的二次計画問題やNanoChatの事前学習実験により，リングマスターLMOの優位性が確認された。
Link: https://arxiv.org/abs/2605.18174
MARS：EgoVis 2026 CASTLEチャレンジ技術報告 [cs.CV, cs.AI]目的：マルチモーダルな情報源からの証拠選択による質問応答システム
- 近年，個人の視点からの動画を用いた研究が盛んであり，現実世界の理解を深める上で重要である。
- 既存のベンチマークは単一の動画に限定されており，複数日間の活動や多様な情報を統合した推論が課題となっていた。
- 複数視点，記録，画像など多様な情報源を統合し，長期間の活動における質問応答能力を向上させる。
- 提案システムMARSは，動画やトランスクリプト，視線，心拍数，写真，熱画像といったマルチモーダルな情報源を活用する。
- 長い動画はキャプションや要約に変換され，計算資源の制約を克服しつつ，重要な情報を保持する。
- GPT-5.4を用いた意思決定エージェントが，証拠の必要性に応じて情報源の選択と回答生成を繰り返すことで高い性能を実現した。
Link: https://arxiv.org/abs/2605.18176
スケーラブルな環境が汎化可能なエージェントを促進する [cs.AI, cs.CL]目的：汎化性能を持つエージェントの実現
- AIエージェントの応用範囲拡大には，未知の状況への適応能力が不可欠である。
- 既存手法では，固定された環境下での学習に偏り，環境変化に弱いという課題がある。
- 環境の多様性を拡大し，エージェントの汎化性能を向上させることを目指す。
- 汎化性能の向上には，経験の蓄積やタスクの多様化だけでなく，実行可能なルールセットの分布拡大が重要である。
- 環境スケーリングを，軌跡スケーリング，タスクスケーリングと区別する分類法を提案し，課題を明確化した。
- プログラム生成と生成世界モデルという2つの環境構築パラダイムを比較し，環境スケーリングと状態保持学習の組み合わせを議論した。
Link: https://arxiv.org/abs/2605.18181
固定カメラをアクティブ3Dシーングラフ生成のための共通事前マップとして [cs.RO, cs.AI, cs.CV]目的：アクティブ3Dシーングラフ生成における共通事前マップの活用
- ロボットの自律性を高める上で，幾何学的・意味的文脈の事前知識は不可欠である。
- 既存手法では，ロボット搭載カメラのみに依存し，環境全体の理解が不十分な場合がある。
- 固定カメラからの情報を活用し，初期段階でのシーン理解を向上させ，探索効率を高める。
- 固定カメラからの情報を共通事前マップとして利用することで，初期段階でのオブジェクト検出率が最大79%向上した。
- ロボット搭載カメラと固定カメラを同一パイプラインで処理することで，ハードウェアの制約を克服した。
- 事前知識の活用により，その後のアクティブ探索の効率が大幅に向上することが示された。
Link: https://arxiv.org/abs/2605.18184
UTOPYA：物理情報に基づいた異常検知と時系列予測のためのマルチモーダル深層学習フレームワーク [cs.MA, cs.LG]目的：バッチプロセスにおける異常検知，時系列予測，および相分類の同時解決
- バッチプロセスにおける効率的な異常検知は，プラントの安全性と生産性の向上に不可欠である。
- 従来の異常検知手法は，過渡現象への対応，故障ラベルの不足，単一のデータモダリティへの依存といった課題を抱える。
- 本研究は，複数のデータモダリティを統合し，物理情報に基づく正則化を導入することで，これらの課題を克服することを目指す。
- UTOPYAは，マルチモーダルバッチ蒸留データセットにおいて，0.832および0.874のウィンドウレベルAUROCを達成し，既存のベースライン手法を大幅に上回った。
- FiLM条件付けによる静的コンテキストが，マルチモーダル異常検知性能を向上させる上で重要な役割を果たすことが示された。
- インスタンス正規化やMixupといった一般的な手法が，データ不足の状況下では汎化性能を低下させる可能性があることが明らかになった。
Link: https://arxiv.org/abs/2605.18188