arXiv雑要約

AI - 2026/05/12 公開

RAwR：近似的な公平分割による役割を意識した再配線 [cs.LG, cs.AI, cs.SI]目的：役割を意識した再配線によるグラフニューラルネットワークの性能向上
- グラフニューラルネットワークはノード分類で高い性能を示すが，長距離相互作用を必要とするタスクでは性能が低下する。
- グラフ構造のボトルネックによる信号伝播の制限（Oversquashing）が，長距離相互作用を困難にしている。
- 公平分割を用いてグラフを再配線することで，役割の似たノード間の通信を促進し，性能低下を改善することを目指す。
- RAwRは，公平分割から得られる商グラフを用いて入力グラフを効率的に再配線する。
- 多様なベンチマークデータセットにおいて，RAwRは最先端の結果を達成した。
- 線形GNNの教師・生徒モデルを用いた分析により，役割に基づいた再配線の理論的根拠が明らかになった。
Link: https://arxiv.org/abs/2605.09457
わずかなステップで十分：学習不要のID保持型生成の高速化 [cs.CV, cs.AI]目的：ID保持型画像生成における効率と忠実度のトレードオフ改善戦略
- 近年，個別化された画像生成の需要が高まっており，ID保持型生成技術が重要性を増している。
- ID保持型画像生成は，多くの場合，多数のステップを必要とする拡散モデルに依存しており，計算コストが高いという課題がある。
- 本研究は，学習を必要としないバックボーンの置換により，ID保持型生成の効率を向上させることを目指す。
- ID適応アダプターを組み込むことで，推論時間を5.9倍に短縮しつつ，ID類似度と知覚品質を向上させることが示された。
- ノイズ除去軌跡の分析から，IDの忠実度は初期段階で確立され，その後のステップは主に視覚的詳細の微調整に貢献することが明らかになった。
- スタイルアダプターやオブジェクトアダプターを用いた実験からも，同様の傾向が確認され，バックボーン置換の有効性が示唆された。
Link: https://arxiv.org/abs/2605.09460
VulTriage：LLMベース脆弱性検出のためのトリプルパス文脈拡張 [cs.AI]目的：LLMベース脆弱性検出における文脈拡張手法
- ソフトウェアセキュリティにおいて，脆弱性検出は不可欠なタスクであり，その自動化が求められている。
- 既存手法は，構造的依存性や専門知識，複雑なプログラム意味を捉えきれていないという課題がある。
- LLMのコード理解能力を最大限に活かし，より正確な脆弱性検出を可能にすることを目指す。
- VulTriageは，AST，CFG，DFG情報を抽出するControl Path，CWE由来の脆弱性パターンを検索するKnowledge Path，コードの機能を要約するSemantic Pathの3つの経路を通じてLLMへの入力文脈を強化する。
- 実験の結果，VulTriageはPrimeVulデータセットにおいて，既存の深層学習ベースおよびLLMベースの手法を上回る性能を達成した。
- 追加実験により，リソースが限られた環境や不均衡なデータセットにおいても，VulTriageの汎化能力が確認された。
Link: https://arxiv.org/abs/2605.09461
位置LSH: アテンションにおける線形バイアス近似のための二値ブロック行列 [cs.RO, cs.CE, cs.MM, cs.CL, cs.LG, cs.DS]目的：アテンションにおける位置バイアスの構造的理解
- Transformerモデルの位置エンコーディングは性能に不可欠であり，その理論的理解が重要である。
- 位置エンコーディング手法間の繋がりが明確でなく，効率的な長文脈処理が課題となっている。
- ALiBiバイアスをLSHの視点から解析し，効率的な近似手法を提案することで，長文脈処理の高速化を目指す。
- ALiBiバイアス行列は，位置LSHスキームによって誘導される二値ブロックマスクの期待値として表現できることが示された。
- 提案手法は，文脈長に対してほぼ線形時間で計算可能であり，ALiBiバイアスの効率的な近似を実現する。
- 大規模言語モデルを用いた実験により，理論的知見の妥当性が検証された。
Link: https://arxiv.org/abs/2605.09472
整列と輝き：多言語テキスト平易化のための高品質な文整列コーパスの構築 [cs.NI, cs.CL, cs.AI]目的：多言語テキスト平易化システムの訓練と評価に適したコーパス
- 情報へのアクセス容易性を高める上で，テキスト平易化は重要な役割を果たす。
- 英語以外の言語における，大規模で高品質なテキスト平易化用データセットが不足している。
- 複数の言語におけるテキスト平易化システムの開発を支援するコーパスを構築すること。
- 文書レベルのデータから文レベルの整列を行う仕組みが報告された。
- 比較コーパスからのクラウドソーシングによる平易化データ収集と処理が行われた。
- 構築された文整列ペアのデータセットは公開されている。
Link: https://arxiv.org/abs/2605.09476
外れ値に頑健な逆問題に対する拡散ソルバー [cs.CV, cs.AI]目的：逆問題における外れ値への頑健性の向上
- 現実の計測データにはノイズや外れ値が含まれることが多く，高精度な復元が課題となる。
- 拡散モデルに基づく手法は強力だが，外れ値に対しては性能が低下しやすい。
- 外れ値を含む逆問題をロバストに解くための新しい手法を開発すること。
- まず，明示的なノイズ推定により計測データを修正し，外れ値の影響を軽減する。
- 次に，Huber損失に基づく反復重み付き最小二乗法を導入し，外れ値に頑健な目的関数を構築する。
- 共役勾配法を用いて最適化問題を効率的に解くことで，高い復元性能と外れ値への耐性を示す。
Link: https://arxiv.org/abs/2605.09477
誤情報の感受性に対する認知に基づいたベイジアンフレームワーク [cs.NI, cs.CL, cs.AI, cs.LG]目的：情報障害に対する感受性のモデル化
- 社会における誤情報の拡散は深刻であり，その対策が急務である。
- 従来のモデルでは，人間の認知資源の制約が十分に考慮されていなかった。
- 認知的な制約を考慮したフレームワークにより，誤情報への感受性をより正確に予測する。
- Bounded Pragmatic Listener (BPL) フレームワークを提案し，認知的な制約を導入した。
- LIARとMultiFCのベンチマークで検証した結果，競争力のある精度を示した。
- 深さの不一致のパラドックスに対する実験的な支持が得られた。
Link: https://arxiv.org/abs/2605.09483
意味構造化された潜在表現の大規模データセットSEMASIA [cs.LG, stat.ML]目的：ニューラルネットワークによって学習された潜在表現の構造的分析
- AIモデルの解釈性向上は，信頼性と性能改善に不可欠である。
- モデルの種類による潜在空間の違いが，比較や活用を困難にしている。
- 多様なモデルの潜在空間を比較・分析するための基盤を提供する。
- SEMASIAは，約1700の事前学習済み画像認識モデルから抽出された潜在表現の集合である。
- 潜在表現は，モデルのアーキテクチャや学習方法などのメタデータと組み合わせて提供される。
- 分析の結果，モデルやデータセットを跨いで一貫した概念的組織が見られた。
Link: https://arxiv.org/abs/2605.09485
CTQWformer：グラフ分類のためのCTQWに基づくTransformer [cs.LG, cs.AI, quant-ph]目的：グラフ分類のための表現学習
- グラフ構造の分析は，社会ネットワークや分子構造など，様々な分野で重要である。
- 従来のグラフ学習モデルは，グローバルな構造依存性と動的な情報伝播を捉えるのが難しい。
- 量子ウォークの原理を導入し，グラフの構造と特徴をより深く理解することを目指す。
- 提案手法CTQWformerは，グラフカーネルやGNNと比較して，グラフ分類タスクにおいて優れた性能を示す。
- CTQWformerは，連続時間量子ウォークを用いてグラフ構造情報を抽出し，Transformerの自己注意機構に組み込む。
- グラフの構造バイアスと時間的進化パターンを組み合わせることで，グラフ表現学習の精度を向上させる。
Link: https://arxiv.org/abs/2605.09486
金継ぎ：実行可能な知識ベースの修復による方策学習 [cs.LG]目的：具現化されたエージェントの方策学習
- 近年の具現化エージェントは高い性能を示すが，知識の構造が不明瞭である。
- 方策知識がニューラルネットワークの重み等に暗黙的に保存され，検証や再利用が困難である。
- 実行可能な知識ベースの構築と修復により，方策の透明性と再利用性を向上させる。
- Kintsugiは，タスクレベルの方策知識を型付きの実行可能な知識ベースとして表現する。
- ロールアウトの証拠に基づいて局所的な型付き編集を行い，検証ゲートで編集の妥当性を確認する。
- 長期的タスクや物体操作において，高い性能と検証可能性，編集可能性を両立した。
Link: https://arxiv.org/abs/2605.09487
HBMを必要としない思考：LLM推論のための意味論に基づいたメモリ階層 [cs.CL, cs.AR, cs.LG]目的：LLMの推論におけるメモリ使用量の最適化
- 大規模言語モデル(LLM)の性能向上には，GPUメモリ容量がボトルネックとなる場合が多い。
- 従来のキャッシュ削除手法は推論精度を著しく低下させるという課題がある。
- 意味論に基づいたメモリ階層により，精度を維持しつつメモリ使用量を削減することを目指す。
- 提案手法では，重要度の低いトークンをCPUメモリに移動させることでHBMの使用量を削減する。
- HBMとCPUメモリ間のデータ転送オーバーヘッドはわずか5〜7%であり，実用的なレベルである。
- 検証の結果，本手法はHBM使用量を大幅に削減しつつ，高い推論精度を維持できることが示された。
Link: https://arxiv.org/abs/2605.09490
APCD：信頼性の高い大規模言語モデル生成のための適応的パス対照復号 [cs.CL, cs.AI]目的：大規模言語モデルの生成における信頼性向上
- 大規模言語モデルは自然言語処理の発展に不可欠であり，その性能向上は様々な応用を可能とする。
- 自己回帰復号における誤差蓄積が幻覚を引き起こし，生成の信頼性を損なうという課題が存在する。
- APCDは，多様な生成経路を探索し，経路間の相互作用を制御することで，幻覚を抑制し，生成の信頼性を高める。
- APCDは，予測の不確実性に応じて分岐を遅延させる「エントロピー駆動型パス拡張」を採用する。
- さらに，予測分布の乖離に応じて経路間の影響を動的に減衰させる「発散認識型パス対照」を用いる。
- 8つのベンチマークにおける実験により，APCDが事実の正確性を向上させつつ，復号効率を維持することが示された。
Link: https://arxiv.org/abs/2605.09492
LASSAアーキテクチャに基づく無人水中探査艇の自律耐障害制御 [cs.RO, cs.AI]目的：無人水中探査艇の自律耐障害制御に関する研究
- 水中探査は海洋資源調査や環境モニタリングに不可欠であり，その重要性は増している。
- 従来の耐障害制御は事前定義されたルールに依存し，予期せぬ故障への対応が困難である。
- 大規模言語モデルの幻覚を抑制し，解釈性と検証可能性を確保した自律制御を目指す。
- 提案するLASSAアーキテクチャは，LLMによる故障検知とタスク再計画を可能にし，ハードコードされたルールに頼らない。
- 物理的制約の検証を行うソルバーを導入することで，LLMの誤った出力を抑制し，安全性を高めている。
- 湖上実験では，故障状態において経路の再計画と速度調整を行い，任務を完遂できることを実証した。
Link: https://arxiv.org/abs/2605.09494
言語を超えて：大規模言語モデルにおける形式非依存の推論部分空間 [cs.CL, cs.LG]目的：大規模言語モデルにおける形式非依存の推論部分空間の存在とその特性
- 言語モデルの推論能力向上は，AI研究における重要な課題であり，より高度な問題解決能力の実現に不可欠である。
- 異なる形式（自然言語，コード，数式など）での推論が，内部表現においてどのように関連しているかは未解明である。
- 異なる形式間の推論表現の共通基盤を特定し，その構造を明らかにすることで，言語モデルの理解と制御を深める。
- TriForm Benchmarkを用いて，複数の言語モデルの中間層に，形式非依存の推論部分空間（FARS）が存在することが示された。
- FARSは，概念構造を増幅し，形式情報を抑制する10次元部分空間として具体化され，その重要性が確認された。
- FARSは，モデルのアーキテクチャを超えて一般化し，宣言的知識と手続き的知識の非対称性も明らかになった。
Link: https://arxiv.org/abs/2605.09496
クリックするな：欺瞞的なインターフェースに耐性を持つウェブエージェントの育成 [cs.AI, cs.CR]目的：欺瞞的なインターフェースへの耐性
- ウェブ自動化の需要が高まる中で，エージェントの信頼性が重要となる。
- ウェブエージェントは，欺瞞的なインターフェースに脆弱であり，誤った操作を招く。
- 欺瞞的なインターフェースを検出し，回避するウェブエージェントの防御メカニズムを確立する。
- 提案手法DUDEは，ハイブリッド報酬学習と非対称ペナルティにより，欺瞞への脆弱性を53.8%削減した。
- DUDEは，タスク遂行能力を維持しながら，欺瞞的なUIの検出と評価を可能にした。
- RUCベンチマークは，ウェブエージェントの評価のための1,407のシナリオを提供する。
Link: https://arxiv.org/abs/2605.09497
スペクトルTransformerニューラルプロセス [cs.LG, cs.AI]目的：周期性・準周期性データのモデリング
- 時系列，空間データ，画像処理など幅広い分野で重要性が増している。
- 既存手法では，強い周期性・準周期性を持つデータに対し，汎化性能が低いという課題がある。
- 周期性・準周期性データのモデリング能力を向上させ，汎化性能を高めることを目指す。
- スペクトルTransformerニューラルプロセス(STNP)は，周波数情報を考慮したTransformerニューラルプロセスの拡張である。
- STNPは，スペクトル集約器を用いて周波数スペクトルを推定し，タスク適応的なスペクトル特徴を抽出することで，周期性を持つ多様体の幾何構造を捉える。
- 合成回帰タスク，実世界の時系列データセット，画像データセットにおいて，既存手法を上回る予測性能が示された。
Link: https://arxiv.org/abs/2605.09498
思考連鎖における隠れた誤り認識：シグナルは診断的であり，因果的ではない [cs.CL, cs.AI, cs.LG]目的：思考連鎖推論におけるモデルの内部計算と生成される推論の関連性に関する研究
- 大規模言語モデルの推論過程の理解は，その能力向上と制御に不可欠である。
- 生成されるテキストからは，モデルが自身の誤りを認識しているかどうか判断が難しい。
- モデルが内部的に誤りを認識しているか否かの検証と，そのシグナルを活用できるかどうかの検討。
- モデルは自身の推論誤りを内部的に検知しているものの，表面的な確信度は高いことが示された。
- 隠れた状態に基づく誤り予測の精度は高い一方で，テキスト表面からの予測精度は低い。
- 誤り認識シグナルは，誤りを修正するための手段ではなく，計算品質を示す診断情報である。
Link: https://arxiv.org/abs/2605.09502
AIセキュリティポリシーはモデルではなくシステムを対象とすべき [cs.CR, cs.AI, cs.LG]目的：複数の軽量LLMエージェントによる協調的な敵対的テストフレームワークによる安全性評価と脆弱性検出
- AIの急速な発展に伴い，安全性とセキュリティの確保が喫緊の課題となっている。
- 大規模言語モデル（LLM）の安全性評価は高コストであり，アクセスが制限されている。
- 低コストで再現可能な安全性評価手法と脆弱性検出システムの開発を目指す。
- 複数の軽量LLMエージェントが協調することで，GPT-4oに対して45.8%の有効有害率を達成し，49件の重大なセキュリティ侵害を検出した。
- Claude Sonnet-4に対しては有効有害率は0%であったが，技術的な成功率は40%であった。
- 脆弱性のあるCアプリケーションに対して，9個の脆弱性を約4分で100%の再現率で検出することに成功した。
Link: https://arxiv.org/abs/2605.09504
てんかんにおけるエビデンスに基づく推論のための知識グラフとベンチマーク：EpiGraph [cs.AI]目的：てんかんに関する知識グラフとベンチマーク
- てんかんの診断と治療は，多岐にわたる臨床知識に基づいた推論を必要とする。
- 既存の知識は分散しており，統合的な推論を困難にしている。
- エビデンスに基づいた臨床推論を強化するための知識グラフと評価フレームワークを構築する。
- EpiGraphは，48,166の論文と7つの臨床リソースを統合した大規模な知識グラフである。
- EpiGraphの統合により，全てのタスクにおいてLLMの性能が向上し，特に薬理ゲノム推論で顕著な改善が見られた。
- 構築されたベンチマークは，神経学的領域における知識拡張型LLMの評価に役立つ。
Link: https://arxiv.org/abs/2605.09505
WindINR：複雑地形における高速局所風速クエリと補正のための潜在状態INR [eess.SY, cs.SY, cs.AI]目的：複雑地形における局所風速の高速推定とスパース観測による補正
- 複雑地形では，高精度な風速予測が，ドローン運用や再生可能エネルギーなど，様々な意思決定に不可欠である。
- 既存手法では，高解像度な風速予測を得るために，固定グリッド上の全領域の計算が必要であり，局所的なクエリに対応しにくい。
- WindINRは，潜在状態を更新するのみで高速な補正を実現し，局所的な風速クエリへの迅速な対応を可能とする。
- WindINRは，静的な地形記述子，低解像度な背景場，そして連続的なクエリ座標を入力とし，潜在状態によって条件付けられたデコーダを用いて高解像度の風速状態を推定する。
- 推論時に，WindINRは再利用可能な表現学習とサンプル固有の潜在状態補正を分離することで，高速な補正を実現している。
- シミュレーション実験の結果，WindINRは，ネットワーク全体を再調整する手法と比較して，約2.6倍の補正速度向上を示し，実用的なインターフェースとなる可能性を示唆している。
Link: https://arxiv.org/abs/2605.09511
ニューラル平均埋め込みを用いた二重ロバストなプロキシ因果学習 [cs.LG]目的：観測データにおける因果応答関数の特定
- 潜在的交絡因子が存在する場合，標準的な共変量調整では因果関係を特定できないため，プロキシ因果学習が重要である。
- 既存のプロキシ因果学習法は，柔軟性に欠けるか，単一のブリッジ推定器に依存しており，ロバスト性に課題がある。
- 本研究では，連続的かつ構造化された処置に対する，よりロバストなプロキシ因果学習フレームワークを開発することを目指す。
- ニューラルネットワークを用いた二重ロバストなフレームワークを提案し，処置側と結果側の両方のブリッジを組み合わせることで，既存手法よりも高い性能を示した。
- 提案手法は，集団レベル，異質性，条件付き用量反応関数を網羅し，二値処置効果だけでなく，完全な応答曲線推定を可能にする。
- アルゴリズムの一貫性が証明され，二重ロバスト誤差が最終的な平均化と回帰誤差，およびブリッジ誤差によって制御されることが示された。
Link: https://arxiv.org/abs/2605.09514
大規模言語モデルのアテンションヘッドにおける高次相乗作用のゲーム理論的自由エネルギー解析 [cs.AI]目的：大規模言語モデルのアテンションヘッドにおける高次相乗作用の解析
- Transformerは自然言語処理の基盤であり，その性能向上は重要である。
- アテンションヘッド間の相互作用はブラックボックスであり，理解が不十分である。
- ゲーム理論的自由エネルギー原理を用いて，アテンションヘッド間の協調性を定量化する。
- BERT，GPT2，Llamaモデルにおいて，トリプルディビデンドが負の値を示すことが確認された。
- この結果は，アテンションヘッド間に高次の冗長性が存在することを示唆する。
- 貢献度の低いヘッドを削減することで，計算コストを削減しつつ，性能を維持できることが示された。
Link: https://arxiv.org/abs/2605.09515
ハイブリッド注意を用いた層の混合 [cs.LG, cs.AI]目的：層の混合構造
- Transformerモデルの性能向上は自然言語処理の発展に不可欠である。
- MoEモデルでは，各層が巨大になり計算コストが増大する問題がある。
- 層の混合により，効率的な分散処理と性能向上を目指す。
- 本研究では，完全なTransformerブロックを，より小さな並列ブロックに置き換える「層の混合」を提案する。
- ブロック間のルーティングにtop-k法を用い，スパースなルーティングによる注意カバレッジ問題を，ハイブリッド注意で解決する。
- ハイブリッド注意は，グローバルな文脈を捉える共有softmaxブロックと，効率的なDeltaNet線形注意を組み合わせる。
Link: https://arxiv.org/abs/2605.09516
LLM駆動によるメタ学習に基づくアルゴリズム選択のための性能空間の拡張 [cs.LG]目的：アルゴリズム選択のためのメタ学習における性能空間の拡張
- アルゴリズム選択は，機械学習のタスクにおいて重要な役割を担う。
- 現実世界のデータセットの数は限られており，メタ学習の汎化性能を制約している。
- LLMを活用し，性能空間における合成データセットを生成することで，メタ学習の性能向上を目指す。
- LLMで生成した合成データセットでメタデータを拡張することで，メタ学習器の性能が大幅に向上した。
- 一様サンプリング戦略が，境界線付近に集中させる戦略よりも一貫して高い性能を示した。
- アルゴリズムの性能は低次元の性能多様体上に存在し，LLMによる一様な$\epsilon$-被覆がメタ学習の改善に繋がる可能性がある。
Link: https://arxiv.org/abs/2605.09518
安定モデル意味論における重み付きルール [cs.AI, cs.LO]目的：安定モデル意味論における重み付きルール
- 知識表現と推論の分野において，不確実性の扱いは重要な課題である。
- 従来の安定モデル意味論は決定論的であり，矛盾やモデル選択に課題があった。
- 安定モデル意味論の不確実性への対応と，モデルの確率的評価を可能とする。
- 本研究では，マルコフ論理の対数線形モデルに倣い，重み付きルールを導入した。
- これにより，矛盾の解消，モデルのランキング，確率付与といった多様な応用が可能となる。
- 安定モデルプログラム，マルコフ論理，ProbLog，P-logなどの関連形式との比較を行った。
Link: https://arxiv.org/abs/2605.09519
履歴空間フーリエニューラル演算子：非マルコフ偏微分方程式に対する手法 [cs.MA, cs.LG, cs.CE, cs.NA, math.NA, physics.comp-ph, stat.ML]目的：非マルコフ偏微分方程式の高速な代理モデル構築
- 偏微分方程式は自然現象の記述に不可欠であり，その数値解法は科学技術の発展に貢献する。
- 従来のニューラル演算子は，状態が完全であるという仮定に基づいており，遅延や記憶効果を持つシステムには適用困難である。
- 履歴情報を考慮した新しいニューラル演算子を開発し，非マルコフシステムの予測精度を向上させる。
- 履歴空間フーリエニューラル演算子(HS-FNO)は，遅延や記憶効果を持つ偏微分方程式に対して高い性能を発揮する。
- HS-FNOは，既存のモデルと比較して，一次予測誤差，履歴空間誤差，ロールアウト誤差において優れた結果を得ている。
- 特に，自己回帰予測において，ロールアウト誤差が大幅に低減され，より少ないパラメータで高い精度を達成している。
Link: https://arxiv.org/abs/2605.09523
関数的安定モデル意味論と理論モジュロAnswer Setプログラミング [cs.AI]目的：関数的安定モデル意味論の役割
- Answer Setプログラミングは，組合せ最適化問題等の解決に有用である。
- 既存のASPMTアプローチでは，関数の役割が限定的である。
- 理論モジュロAnswer Setプログラミングの統合的枠組みを深める。
- 関数的安定モデル意味論が，Answer SetプログラミングとSatisfiability Modulo Theoriesの統合において重要な役割を果たす。
- 「tight」なASPMTプログラムは，SMTインスタンスに変換可能である。
- 既存のASPMTアプローチは，関数の役割が制限された特殊事例として捉えられる。
Link: https://arxiv.org/abs/2605.09524
Cplus2ASP：応答セットプログラミングにおける行動言語C+の計算 [cs.AI]目的：行動言語C+の決定的な部分の実装
- 行動言語は，状況遷移や計画立案といったAI分野における重要な表現形式である。
- 既存の行動言語処理系は，大規模な問題に対して計算速度が課題となる場合が多い。
- 応答セットプログラミングの技術を活用し，C+の効率的な計算を実現すること。
- 本システムは，Causal Calculator Version 2と互換性を保ちつつ，現代的な応答セットソルバー技術により大幅な高速化を実現している。
- C+記述をiclingoの入力言語に変換する際に，そのインクリメンタルグラウンディング機構を活用することで効率的な実行を可能にしている。
- Lua呼び出しや対話的モードなど，便利な機能を備え，BやBCといった他の行動言語への拡張性も有している。
Link: https://arxiv.org/abs/2605.09528
産業向け質問応答におけるRAGとファインチューニングの評価 [cs.CL, cs.AI]目的：産業向け質問応答におけるRAGとファインチューニングの有効性
- 企業における質問応答システムは重要度が増しており，特定の領域知識への適応が求められている。
- RAGとファインチューニングは知識を組み込む方法だが，費用対効果の観点から最適な手法は不明である。
- 自動車業界のデータセットを用いて，RAGとファインチューニングの費用と精度を比較し，最適な手法を特定する。
- 高性能なモデルは最初から優れた性能を示すものの，オープンソースモデルはRAGによって同等の品質を達成できる。
- RAGは，クローズドデータセットおよびオープンソースモデルの両方において，最も効果的かつ費用対効果の高い適応手法である。
- Cost-of-Passフレームワークを拡張し，出力品質，生成コスト，ユーザーインタラクションコストを総合的に評価した。
Link: https://arxiv.org/abs/2605.09533
AI支援セキュリティ業務の統治：運用意思決定支援のためのデザインサイエンスフレームワーク [cs.CR, cs.AI]目的：AI支援運用意思決定の統治フレームワーク
- デジタルインフラの高度化に伴い，AI活用は不可欠となりつつある。
- AI導入時の説明責任，プライバシー，コスト管理，監査可能性が課題となっている。
- 高リスク環境下でのAI活用における統治フレームワークを確立すること。
- AI支援クエリブローカーというアーティファクトを開発し，AIの計画と運用実行を分離した。
- スキーマに基づいた検索，承認済みテンプレート，ポリシー検証，監査可能なログを実装した。
- AI支援運用意思決定の統治に関する設計提案，役割分担，成熟段階などを定義した。
Link: https://arxiv.org/abs/2605.09534
時間認識軌道自己蒸留による高速かつ高精度な拡散LLM [cs.CL, cs.AI]目的：拡散LLMにおける精度と並列性のトレードオフ改善
- 拡散LLMは並列テキスト生成の有望な手法だが，精度と並列性を両立することが課題となっている。
- TPF増加により生成品質が低下し，既存の高速化手法は精度を犠牲にする傾向がある。
- 時間認識軌道自己蒸留により，精度を維持しつつ高速化を実現することを目指す。
- TADは，精度と並列性のトレードオフを改善し，LLaDAにおいて平均精度を46.2%から51.6%に向上させた。
- また，SpeedモデルではAUPを46.2から257.1に大幅に改善した。
- TADは，品質を優先するモデルと速度を優先するモデルという2つの展開構成を可能にする。
Link: https://arxiv.org/abs/2605.09536
PhysHanDI：物理ベースの手と変形可能物体のインタラクション再構成 [cs.RO, cs.CV, cs.AI, cs.RO]目的：手と変形可能物体のインタラクションの3次元再構成
- 現実世界のインタラクションを理解する上で，手の動きと物体の変形を正確に捉えることが重要である。
- 既存手法では，変形可能な物体の複雑な挙動を捉えきれていない，もしくは手と物体の同時再構成が困難である。
- 物理シミュレーションを用いて，手と変形可能物体のインタラクションを物理的に整合性の高い形で再構成することを目指す。
- PhysHanDIは，手の3次元モーションに基づいた物理シミュレーションにより，変形可能物体の挙動を再構成する。
- このシミュレーションは，手の動きと整合性があり，物理的に妥当な物体の変形を実現する。
- 実験結果から，PhysHanDIは既存手法よりも再構成と将来予測の精度で優れていることが示された。
Link: https://arxiv.org/abs/2605.09538
知識グラフにおけるLLM誘導モンテカルロ木探索：薬物-疾患ペアに対するメカニズム的説明の構成 [cs.CL, cs.AI]目的：薬物-疾患ペアに対するメカニズム的説明の構成
- 創薬や疾患理解において，薬物と疾患の関係性を説明するメカニズムの解明は不可欠である。
- 知識グラフからの多段階説明抽出は，探索空間の拡大と経路品質の評価が困難である。
- LLMの知識と知識グラフの構造的制約を活用し，高精度なメカニズム的説明を効率的に探索すること。
- TESSERAは，LLMを局所的な識別判断に限定し，知識グラフで探索空間を制約することで，長期間の探索におけるLLMの性能劣化を防ぐ。
- 評価実験により，TESSERAが既存の生物学的知識に合致しつつ，新たなメカニズムも提示できることが示された。
- LLMの持つ事前知識と状態評価機能が，メカニズム解明において重要な役割を果たすことが確認された。
Link: https://arxiv.org/abs/2605.09542
TIDE-Bench：ツール統合型推論のタスク認識および診断的評価 [cs.AI]目的：ツール統合型推論手法の評価基準
- 大規模言語モデルの能力拡張に外部ツール活用が重要視されている。
- 既存の評価基準は，データ品質，タスク多様性，診断の網羅性で課題がある。
- 複雑なツール活用能力と複数ツールの連携を評価できる基準を開発する。
- TIDE-Benchは，数学的推論や知識集約型QAに加え，実験計画と動的インタラクションのタスクを含む多様な評価設定を提供する。
- 最終解答の質，プロセス信頼性，ツール利用効率，推論コストをタスクごとに評価する包括的なプロトコルを採用している。
- 既存データセットから識別力の低い事例を除外し，評価コストを削減しつつ，より難易度の高い事例に焦点を当てている。
Link: https://arxiv.org/abs/2605.09544
適応が失敗する場合：視覚言語プロンプト学習におけるゲート崩壊の勾配ベース診断 [cs.CL, cs.LG]目的：視覚言語モデルにおけるゲート崩壊の要因と条件の特定
- 視覚言語モデルは多様なタスクに応用可能であり，その性能向上は重要な課題である。
- プロンプト学習において，適応的なゲートやプロンプト選択モジュールが崩壊し，性能が向上しない場合がある。
- 適応ゲートの崩壊の原因を明らかにし，効果的なプロンプト学習の条件を明確化すること。
- 適応的なゲートやプロンプト選択モジュールが定数出力となり，勾配信号が小さくなる現象が確認された。
- 勾配の大きさの不均衡とゲートの劣化が，適応が失敗する主な要因であることが示された。
- パラメータ効率の良い学習において，闇雲にアーキテクチャの複雑さを加えることの再検討を促す。
Link: https://arxiv.org/abs/2605.09549
精度と再現率からのフィードバックに基づくオンライン集合学習 [cs.LG]目的：精度と再現率に基づくフィードバックを用いたオンライン集合学習における累積報酬の最大化
- 機械学習分野において，部分的フィードバック環境下での学習理論は重要である。情報取得や推薦システムへの応用が期待される。
- 従来のPAC学習では有効な経験的リスク最小化(ERM)が，精度・再現率フィードバック環境下では必ずしも最適とは限らない。
- 精度と再現率フィードバック環境下における学習可能性の条件を明確化し，効果的な学習アルゴリズムを開発することを目指す。
- 仮説クラスが学習可能であるための必要十分条件は，有限なVapnik-Chervonenkis(VC)次元を持つことである。
- 本研究で開発されたアルゴリズムは，実現可能設定と無知設定の両方において後悔保証を得ている。
- 本研究は，精度・再現率フィードバックモデルにおける学習可能性を特徴づけるとともに，今後の課題を示唆する。
Link: https://arxiv.org/abs/2605.09565
ニューロモルフィック聴覚センサーを用いたグラフニューラルネットワークによるFPGA上でのエンドツーエンドキーワードスポッティング [cs.LG]目的：FPGA上でのキーワードスポッティングシステムの実現
- モバイルロボットや組み込み知能の発展に伴い，エッジプラットフォーム上での効率的なオンデバイスデータ処理が求められている。
- 従来の信号処理手法は，計算量が多く，消費電力が大きいという課題がある。
- ニューロモルフィックセンサーとグラフニューラルネットワークを統合し，低遅延・低消費電力なキーワードスポッティングシステムを構築すること。
- ニューロモルフィック聴覚センサー（NAS）とグラフニューラルネットワーク（GNN）を単一のFPGAデバイスに統合した，エンドツーエンドのキーワードスポッティングシステムを初めて実装した。
- Google Speech Commands v2データセットを用いた実験により，NAS処理後のデータで87.43%の精度を達成した。
- エンドツーエンドのレイテンシは35μs以下，平均消費電力は1.12Wであった。
Link: https://arxiv.org/abs/2605.09570
手話表記から視覚へ？手話表記を用いたマルチスケールシーケンスベースのポーズアニメーションのためのKolmogorov-Arnoldネットワークの探求 [cs.CV, cs.AI, cs.MM]目的：手話表記から二次元人体ポーズシーケンスへの変換
- 手話は聴覚障害者にとって重要なコミュニケーション手段であり，その視覚化技術の発展が求められている。
- 既存の手話アニメーション生成方法は，データ量や計算コストが課題であり，効率的な手法が求められている。
- 手話表記から高精度かつ効率的にポーズアニメーションを生成する手法を開発し，アクセシビリティ向上に貢献する。
- 提案手法KANMultiSignは，HamNoSys表記から二次元人体ポーズシーケンスを生成するマルチスケールシーケンス生成器である。
- 粗から細かい生成戦略とKolmogorov-Arnoldネットワークモジュールを導入することで，少ないパラメータで高い精度を実現した。
- ポーランド語，ドイツ語，ギリシャ語，フランス語の手話コーパスを用いた実験で，既存手法と比較して動的時間伸縮法に基づく関節誤差を低減した。
Link: https://arxiv.org/abs/2605.09572
バイオ信号指紋：クロスモーダルPPG-ECGファウンデーションモデル [cs.LG, cs.AI]目的：心血管状態のコンパクトな潜在表現
- 心血管疾患は世界的な死亡原因の第1位であり，継続的なモニタリングの需要が高い。
- 診断に有用なECGと普及しているPPGの間には隔たりがあり，汎用的なモニタリングが困難である。
- ECGとPPGの情報を統合し，タスク固有の再学習なしで利用可能な表現を構築すること。
- 本研究で開発されたM2AEは，ECGとPPGのペアデータを用いて学習されたクロスモーダルファウンデーションモデルである。
- バイオ信号指紋は，5種類の心血管疾患分類において0.974という高いAUROCを達成した。
- 単一のモダリティでも高い性能を維持し，リソース制約のある環境でのウェアラブルモニタリングへの応用が期待される。
Link: https://arxiv.org/abs/2605.09579
CLR-voyance：入院患者の臨床的意思決定支援におけるオープンエンドな推論を，結果を意識した評価基準で強化する [cs.CL, cs.AI, cs.LG]目的：入院患者の臨床推論における，結果に基づき臨床医によって検証された報酬を用いたPOMDP（部分観測マルコフ決定過程）の枠組み
- 臨床的意思決定支援は，患者の転帰に直接影響する重要な課題であり，医療の質向上に不可欠である。
- 既存の臨床LLM評価は，過去の情報に偏り，将来の結果を考慮した推論が困難であるという課題がある。
- 本研究は，将来の結果を予測可能な評価基準を用いて，より現実的な臨床推論を可能にすることを目的とする。
- CLR-voyanceは，入院患者の臨床推論をPOMDPとして定式化し，結果に基づいた報酬によって学習を監督する。
- Qwen3-8BとMedGemma-4Bを本手法でファインチューニングした結果，最先端の性能を達成し，汎用性も維持された。
- 臨床医による評価実験により，本手法の臨床的な妥当性が確認され，LLMの評価基準選定に関する知見が得られた。
Link: https://arxiv.org/abs/2605.09584
二値およびペアワイズフィードバックからの効率的なアンサンブル選択 [cs.GT, cs.AI, cs.LG]目的：AIシステムのアンサンブル選択手法
- 多様なタスクにおいてAIシステム活用が拡大。最適なアンサンブル選択は重要。
- アンサンブル選択にはコストがかかる。モデル呼び出し，ベンチマーク，人的評価等。
- 二値/ペアワイズフィードバックに基づく効率的な選択手法を提案し，コスト削減を目指す。
- 二値フィードバック設定において，既存手法と同等の性能保証を持つ貪欲法を提案。
- ペアワイズフィードバック設定では，部分情報最適化の計算困難性を示す。
- 重み付き序数カバレッジ緩和法と，それを基にした貪欲法を提案し，実験で有効性を示した。
Link: https://arxiv.org/abs/2605.09588
不整地における四脚歩行制御のためのニューロモーフィック強化学習 [cs.NE, cs.RO]目的：不整地における四脚歩行制御
- ロボットの歩行制御は，多様な環境での活動を可能にする基盤技術である。
- 従来の強化学習は，計算資源を必要とし，ロボットへのリアルタイム適応が困難である。
- 省電力でロボット上で学習可能な制御手法の開発が求められている。
- 提案手法は，ニューロモーフィックコンピューティングとの親和性が高い平衡伝播に基づく強化学習フレームワークである。
- シミュレーション実験の結果，提案手法は従来のバックプロパゲーションによる手法と同等の歩行性能を示した。
- また，GPUメモリ効率を4.3倍向上させ，低消費電力でのロボット制御の可能性を示唆した。
Link: https://arxiv.org/abs/2605.09595
幾何学的衝突：LLM継続的後学習における忘却の説明と制御 [cs.LG, cs.IT, math.IT]目的：LLM継続的後学習における忘却現象の解明と制御
- LLMの性能向上には，新しい知識やスキルの継続的な学習が不可欠である。
- 継続的学習では，既存の能力を損なう忘却の問題が顕著である。
- タスクの幾何学的表現を用いて忘却の原因を特定し，制御手法を開発する。
- 忘却は，モデルの状態に対する更新の統合の失敗として捉えられる。
- 更新間の幾何学的衝突が高い場合，干渉が生じやすい。
- 提案手法GCWMは，データを用いずに忘却を抑制し，性能向上に貢献する。
Link: https://arxiv.org/abs/2605.09608
多項式ニューラルネットワークの最小充填構造：反例，フロンティア探索，欠陥 [cs.LG, math.AG]目的：多項式ニューラルネットワークの最小充填構造の探求
- ニューラルネットワークの効率化は，計算資源の制約下で高性能を達成するために重要である。
- 既存の研究では，最小充填構造が単峰性を持つという仮説が立てられていた。
- 単峰性仮説に対する反例を見つけ，構造の欠陥の性質を明らかにすること。
- 多項式ニューラルネットワークの最小充填構造に関して，単峰性仮説に対する反例を特定した。
- フロンティア探索と記号計算を用いて反例を検証し，その構造の欠陥が大きくなる場合があることを示した。
- 従来の例とは異なり，大きな欠陥を示すサブアーキテクチャが多数存在することを確認した。
Link: https://arxiv.org/abs/2605.09609
SmartEval：自然言語仕様からのLLM生成スマートコントラクト評価ベンチマーク [cs.MA, cs.AI, cs.CE, cs.LG, cs.PL, cs.SE]目的：LLM生成スマートコントラクトの品質評価
- ブロックチェーン技術の発展に伴い，スマートコントラクトの重要性が増している。
- 自然言語からスマートコントラクトを自動生成する際に，品質保証が課題となっている。
- LLM生成スマートコントラクトの品質を客観的に評価する基準と手法を確立する。
- SmartEvalは，9,000件の生成済みコントラクトと専門家による正解実装を含むベンチマークである。
- 評価指標は機能の完全性，変数の一貫性，状態遷移の正確性，ビジネスロジックの忠実性，コード品質の5次元である。
- LLM生成コントラクトは，正解実装と比較して仕様への忠実性において+8.29点の複合スコア優位性を示した。
Link: https://arxiv.org/abs/2605.09610
知識転移を用いたAny2Any 3D拡散モデル：放射線治療計画の研究 [cs.HC, cs.CV, cs.AI]目的：放射線治療計画におけるボクセルごとの線量予測
- 放射線治療計画の精度向上は，患者の治療効果とQOLに直結するため重要である。
- 既存モデルは，臨床現場の多様な状況への汎化性能が課題となっていた。
- 事前学習済みの拡散モデルの知識を活用し，汎化性能の高い線量予測を実現する。
- DiffKT3Dは，事前学習済みの動画拡散モデルの知識転移により，効率的な線量予測を可能にした。
- GDP-HMMチャレンジの優勝モデルと比較し，ボクセルレベルのMAEを2.07から1.93に低減した。
- 画像品質と臨床的嗜好の一致においても，DiffKT3Dは優れた性能を示した。
Link: https://arxiv.org/abs/2605.09622
異種エッジ-クラウド環境における適応的DNN分割とオフロード [cs.DC, cs.AI, cs.LG, cs.NI, cs.PF]目的：DNN分割とオフロードの最適化
- IoTデバイスの普及に伴い，エッジAIの重要性が増している。計算資源の制約下でのAI活用が求められている。
- 既存手法は静的な分割に依存し，実行時の変化に対応できない。実環境での評価も不足している。
- 環境変化に適応する動的なDNN分割フレームワークを構築し，性能向上を目指す。
- 提案フレームワークは，VGG16，AlexNet，MobileNetV2を用いて検証された。
- エネルギー消費量を27.09–35.82%削減し，エンドツーエンド遅延を6.34–22.92%短縮した。
- 適応的分割が静的分割よりも優れていることが確認された。
Link: https://arxiv.org/abs/2605.09623
スクラッチパッドパッチング：バイトレベル言語モデルにおける計算とパッチサイズの分離 [cs.CL, cs.LG]目的：バイトレベル言語モデルにおける計算とモデル品質のトレードオフの改善
- 近年，トークナイザーを介さない言語モデルが注目を集めており，効率的なモデル設計が重要になっている。
- 従来のパッチベース言語モデルでは，パッチサイズが計算コストとモデル品質に大きな影響を与えていた。
- パッチ内の情報伝播の遅延を解消し，動的な計算割り当てを実現することで，モデル性能を向上させる。
- スクラッチパッドパッチング（SP）は，パッチ内に一時的なスクラッチパッドを挿入することで，より効率的なコンテキスト更新を実現した。
- SPは，次に来るバイトの予測エントロピーに応じてスクラッチパッドをトリガーし，情報密度の高い領域に選択的に計算リソースを割り当てる。
- 実験の結果，SPは同じパッチサイズでモデル品質を向上させ，KVキャッシュサイズと推論計算量を大幅に削減することが示された。
Link: https://arxiv.org/abs/2605.09630
PDEAgent-Bench：PDEソルバー生成のための多指標・多ライブラリベンチマーク [cs.RO, cs.SY, eess.SY, cs.CL, cs.CL, cs.AI]目的：PDEソルバー生成の性能評価
- 偏微分方程式の数値解法は，科学技術計算の根幹を担う重要な分野である。
- 既存のコード生成ベンチマークは，数値精度や効率性を十分に評価していない。
- PDEソルバー生成における実用的な性能要件を満たす評価環境を提供する。
- PDEAgent-Benchは，DOLFINx，Firedrake，deal.IIに対応した645個のテストケースで構成される。
- 大規模言語モデルやコードエージェントは，実行可能なコードを生成できるものの，精度や効率性の要件を満たす率は低い。
- 本ベンチマークは，数値的に信頼性の高い効率的なPDEソルバー生成の課題を示唆している。
Link: https://arxiv.org/abs/2605.09636
Plan2Cleanse：強化学習におけるテスト時バックドア防御：深層強化学習におけるモンテカルロプランニング [cs.LG]目的：強化学習モデルへのバックドア攻撃の検出と軽減
- 第三者によって訓練された強化学習モデルのセキュリティ確保は，実世界での利用において不可欠である。
- バックドア攻撃は，通常時には正常に動作するが，特定のトリガーが入力されると悪意のある動作を行うため，検出が困難である。
- モデルの再学習を必要とせず，テスト時にバックドア攻撃を効率的に検出し，無効化することを目指す。
- Plan2Cleanseは，モンテカルロ木探索を応用し，強化学習モデルへのバックドア攻撃をテスト時に効率的に検出し中和する。
- 隠密性の高いO-RAN環境において，トリガー検出成功率を61.4%以上向上させ，競争的なHumanoid環境では勝率を35%から53%に改善した。
- これらの結果は，テスト時の防御アプローチの有効性を示し，強化学習の展開におけるバックドア脅威に対する積極的な防御の重要性を強調する。
Link: https://arxiv.org/abs/2605.09638