arXiv雑要約

AI - 2026/05/27 公開

人間中心AIにおける，属性情報を用いない倫理的公平性 [cs.CY, cs.AI, cs.LG]目的：ウェアラブル，行動，生理データに基づく人間状態の推論における倫理的・公平性の確保
- ユビキタス環境下での健康システムにおいて，AIの倫理的・公平性は重要な課題である。
- 従来の公平性手法は，属性情報の利用や統計的パリティに依存し，倫理的原則に反することがある。
- 属性情報を用いずに，潜在的な差異を明らかにし，倫理的公平性を実現することを目的とする。
- Flareは，Fisher情報を用いてモデルの挙動を正則化し，潜在的な不均衡を発見することで，公平性を向上させる。
- 提案手法BHEは，統計的パリティを超えた倫理的公平性を評価するための指標群を提供する。
- 実データを用いた評価により，Flareが既存手法と比較して倫理的公平性において優位性を示すことが確認された。
Link: https://arxiv.org/abs/2603.13373
注意機構における線形性からの脱却：非線形クエリの事例 [cs.LG, cs.AI]目的：注意機構におけるクエリ射影の非線形化
- Transformerは自然言語処理の基盤であり，その性能向上は様々な応用を可能とする。
- 従来の注意機構では，クエリ射影が恒等変換に近い場合でも性能劣化が見られない点が不可解であった。
- 非線形なクエリ射影を導入することで，Transformerの性能をさらに向上させることを目指す。
- クエリ射影を非線形残差構造に置換することで，GPT-3小規模モデルにおいて性能が向上した。
- 検証損失が2.40%減少し，perplexityが6.81%低下した。これは，12.5%多くのパラメータを持つモデルを上回る結果である。
- これらの結果は，より大規模なモデルや異なるモダリティへの応用を促すものである。
Link: https://arxiv.org/abs/2603.13381
APEX-Searcher：サブゴールの活用による信用割り当ての改善とエージェント的検索拡張生成 [cs.CL, cs.AI]目的：複雑な質問への対応能力向上
- 大規模言語モデルの知識獲得手段として検索拡張生成が重要視されている。
- 複雑な多段質問において，単一の検索では十分な性能が得られない。
- 曖昧な検索実行経路や，強化学習における報酬の希薄性を解決する。
- APEX-Searcherは，計画レベルの報酬を用いた強化学習で計画を最適化し，実行はSFTで学習する信用割り当ての改善パラダイムを採用。
- 計画と実行のエラーを明確に分離することで，より正確な検索結果と高い性能を実現。
- 複数のベンチマークにおいて，多段検索拡張生成とタスク計画の両方で一貫した改善が確認された。
Link: https://arxiv.org/abs/2603.13853
不確実性下における戦略的な情報配分を通してLLMの推論を理解する [cs.CL, cs.AI, cs.LG]目的：LLMにおける推論メカニズムの解明
- 大規模言語モデル(LLM)の性能向上には，推論能力の理解が不可欠である。
- LLMは，正解から逸脱しながらも局所的には一貫した軌跡を辿る「無言の発散」を起こしやすい。
- 不確実性の言語化が，LLMの推論における収束性を回復させる要因となる点を明らかにする。
- LLMは「待て」のようなトークンをきっかけに自己修正を行うが，そのメカニズムは不明確であった。
- 不確実性の言語化と手続き的進展を分離することで，推論を戦略的な情報配分として捉える枠組みを提示した。
- 最小限の疑念のきっかけで失敗した軌跡が回復すること，小規模なSFTでその能力を習得・抑制できることを示した。
Link: https://arxiv.org/abs/2603.15500
Omanic：大規模言語モデルにおける多段推論の段階的評価に向けて [cs.CL, cs.AI, cs.LG]目的：大規模言語モデルの多段推論能力の評価手法
- 大規模言語モデルの性能向上は，自然言語処理の様々なタスクにおいて不可欠である。
- 既存の評価方法は最終的な回答のみに着目し，推論過程における誤りを特定しにくい。
- 多段推論における各ステップの評価を通じて，モデルの弱点を明らかにすること。
- Omanicは，最終回答の正確性に加え，推論のどこで問題が生じるかを診断することを目的とした，オープンな4段階QAベンチマークである。
- 実験の結果，Omanicは大規模言語モデルにとって困難であり，推論の後半段階でボトルネック，事実知識の限界，およびエラーの伝播が観察された。
- OmanicSynthを用いたファインチューニングは，6つの推論・数学ベンチマークにおいて平均7.41ポイントの性能向上をもたらし，その有効性が示された。
Link: https://arxiv.org/abs/2603.16654
ビデオ推論の解明 [cs.CV, cs.AI]目的：ビデオモデルにおける推論メカニズムの解明
- 近年のビデオ生成技術の発展は，新たな知能基盤として期待されている。
- 既存研究では，ビデオ内のフレーム順序に依存する推論が想定されていた。
- 拡散過程における推論メカニズムを明らかにすることで，モデルの性能向上を目指す。
- 拡散モデルの推論は，フレーム順序ではなく拡散のステップに沿って発生することが示された。
- モデルは初期ステップで複数の候補解を探索し，徐々に一つの解答に収束する(CoS)。
- ワーキングメモリ，自己修正，知覚に基づく行動といった，推論に重要な挙動が確認された。
Link: https://arxiv.org/abs/2603.16870
アライメントは言語モデルを規範的にし，記述的ではない [cs.CL, cs.AI, cs.GT]目的：言語モデルのアライメントが人間の行動を記述するモデルとして機能するかどうかの検証
- 言語モデルの性能向上は，人間との円滑なコミュニケーションや意思決定支援に不可欠である。
- アライメントは人間の選好を反映するが，実際の人間行動を正確にモデル化しているか不明である。
- 戦略的状況下での言語モデルの予測性能低下を明らかにし，アライメントの影響を評価する。
- ベースモデルは，複数ラウンドの戦略的ゲームにおいて人間の選択を予測する性能でアライメント済みモデルを大幅に上回る。
- 一方，規範的な予測が有効な状況下では，アライメント済みモデルがより優れた予測性能を示す。
- アライメントは，規範的解に沿った行動が支配的な場合には予測精度を向上させるが，戦略的状況下では予測精度を低下させるトレードオフが存在する。
Link: https://arxiv.org/abs/2603.17218
ミラー降下とエントロピー制約を用いたフローマッチング方策最適化 [cs.LG]目的：オンライン強化学習における方策表現力と探索・利用のトレードオフのバランス
- 強化学習は，自律的な意思決定システムを構築するための重要な技術であり，様々な分野への応用が期待される。
- 従来の強化学習方策は，複雑な行動分布を表現できず，探索が不十分となる場合がある。
- ODEに基づくフローマッチングは，シミュレーション不要な方策最適化と，扱いやすいエントロピー計算を可能にする。
- 提案手法FMERは，フローマッチング損失の最小化を通じて，高価値領域への速度場誘導を実現する。
- tanh変換による密度歪みを補正する解析的エントロピー目的関数を導出し，原理に基づいた最大エントロピー最適化を可能にする。
- サンプルサイズに基づいたミラー降下温度の動的調整により，訓練中の信頼領域を強化する。
Link: https://arxiv.org/abs/2603.17685
見るか，喜ばせるか：VLMにおける視覚的迎合と二重信念の解明 [eess.SY, cs.SY, math.DS, cs.CV, cs.AI]目的：VLMにおける視覚情報の利用状況の分析
- 近年，画像とテキストを同時に処理するVLMの研究が活発であり，その性能向上は様々な応用への期待を高めている。
- VLMは正答を出す際に，実際に視覚情報を活用しているかどうかの検証が課題となっていた。
- VLMにおける視覚情報の利用状況を詳細に分析し，その問題点を明らかにすることを目的とする。
- VLMの72.9%において「視覚的迎合」と呼ばれる現象が確認された。これは，内部証拠は保持されつつ，幻覚的な回答が生成されるパターンである。
- 現在のVLMのAlignment Trainingは，拒否反応を抑制することには成功しているものの，視覚情報の正確な活用は不十分である。
- モデルの規模拡大やポストトレーニングだけでは，VLMのGrounding問題を解決できないことが示唆された。診断スコアを用いた戦略により，精度向上が確認された。
Link: https://arxiv.org/abs/2603.18373
分離されたスキップリンクとRプローブ：MLLM OCRにおける特徴集約と勾配伝播の分離 [cs.CV, cs.AI]目的：マルチモーダル大規模言語モデルにおけるOCRタスクの性能向上
- マルチモーダル大規模言語モデルは高度な推論に優れるが，OCRタスクでは微細な視覚情報が損なわれやすい。
- 多層の特徴融合において，スキップパスウェイが低レベル信号を上書きし，学習を不安定化させる問題がある。
- 勾配干渉を軽減し，安定した学習と収束を実現すること。
- 提案手法「分離されたスキップリンク」は，勾配の逆伝播をスキップブランチで停止することで，勾配干渉を軽減する。
- 「Rプローブ」により，投影された視覚トークンのピクセルレベル再構成可能性を評価し，微細な情報の保持を確認する。
- ViTバックボーンと複数のマルチモーダルベンチマークにおいて，OCR性能と汎用マルチモーダルタスクの両方で改善が確認された。
Link: https://arxiv.org/abs/2603.20020
マルチエージェント協調のための反実仮想的信用配分最適化 [cs.AI]目的：マルチエージェント協調における信用配分最適化手法
- 複雑な推論タスク解決において，LLMによる役割分担が有効であり，その性能向上が求められている。
- 強化学習において，チーム全体の報酬のみでは個々のエージェントの貢献度を特定できず，フリーライダー問題が発生しやすい。
- エージェントごとの貢献度を定量化し，学習信号を生成することで，フリーライダー問題を抑制し，協調学習を促進すること。
- CCPOは，チームレベルの結果と反実仮想的な結果を比較することで，エージェントの限界貢献度を推定する。
- 検証者による評価を基に，自己評価とピア評価を用いて信用を再配分し，外部検証者の結果を重視する。
- 数学的推論ベンチマークにおいて，明示的な信用配分がデュアルエージェント推論を改善することが示された。
Link: https://arxiv.org/abs/2603.21563
大規模言語モデルのタスク固有重要度スコアの統合による次元ごとのグローバルプルーニング [cs.LG]目的：大規模言語モデルの効率的なプルーニング手法
- 大規模言語モデルは高性能だが，その巨大さが実用上の課題となっている。
- 既存のプルーニング手法は，タスクへの適応性と計算コストのトレードオフがある。
- タスク固有の重要度を考慮した，学習コストの低いプルーニング手法の開発。
- DIETは，タスクごとの活性化の大きさをプロファイリングし，多数決によりグローバルマスクを構築する。
- 事前計算や学習の大きなコストを必要としない，学習不要のプルーニング手法である。
- Gemma-2 2Bモデルで20%のスパース率の場合，DIETは既存手法と比較して平均精度が約10%向上した。
Link: https://arxiv.org/abs/2603.23985
LLMを用いた反復型生成最適化における課題の理解 [cs.LG, cs.AI]目的：LLMを用いた生成最適化の課題
- LLMの能力向上により，自己改善エージェントの実現が期待される分野である。
- 自動最適化が成功するのは9%にとどまるなど，実用上不安定な状況にある。
- 学習ループ構築における隠れた設計選択が最適化成功に影響することを明らかにする。
- 初期成果物によって，MLAgentBenchにおける到達可能な解が異なり，設計選択が成功を左右する。
- Atariエージェントでは，途中で学習軌跡を打ち切っても改善が見られ，バッチサイズが必ずしも汎化性能向上に繋がらない。
- ドメイン横断的な学習ループ構築の簡便な方法がないことが，実用化の大きな障壁である。
Link: https://arxiv.org/abs/2603.23994
OMD-GraphRAG：オントロジー誘導抽出，多次元クラスタリング，二重チャネル融合によるGraphRAGの強化 [cs.AI, cs.IR]目的：GraphRAGの強化
- 複雑な推論やドメイン固有のQAにおいて，検索拡張生成(RAG)システムの性能向上が重要である。
- 既存のGraphRAGは知識抽出の精度，コミュニティレポートの完全性，検索性能に課題がある。
- 知識抽出，コミュニティクラスタリング，検索融合を改善し，RAGシステムの性能を向上させる。
- OMD-GraphRAGは，既存のオープンソースソリューション(LightRAG等)と比較して，MultiHop-RAGベンチマークで包括的なF1スコアで優れている。
- 特に，推論クエリと時間クエリにおいて，その性能差が顕著である。
- オントロジー誘導抽出，多次元コミュニティクラスタリング，二重チャネルグラフ検索融合が，性能向上に貢献している。
Link: https://arxiv.org/abs/2603.25152
強化学習に基づくナビゲーションの近代化：具現化された意味的シーングラフ生成に向けて [cs.AI, cs.RO]目的：具現化された意味的シーングラフ生成のためのナビゲーションコンポーネントの近代化
- 有機的計算において，不確実性やリソース制約下での自己適応には，意味的ワールドモデルが不可欠である。
- 限られた行動予算内で高品質なモデルを獲得するには，情報獲得とナビゲーションコストのバランスが課題となる。
- 行動回数を最適化し，効率的に意味的シーングラフを生成することを目的とする。
- 最適化アルゴリズムの置き換えのみで，SSGの完成度がベースラインと比較して21%向上した。
- 深度情報は主に実行安全性（衝突回避）に影響し，SSGの完成度への影響は小さい。
- 近代化された最適化と，きめ細かな行動表現を組み合わせることで，完成度と効率の最適なトレードオフが得られた。
Link: https://arxiv.org/abs/2603.25415
コードと自然言語が出会う場所：LLM統合アプリケーションのためのタクソノミー駆動型情報フロー解析 [cs.CL, cs.NI, cs.SE, cs.AI]目的：LLM統合アプリケーションにおける情報フロー解析手法
- ソフトウェアの安全性と信頼性確保は重要であり，特にLLMを活用するアプリケーションでは，その複雑さから脆弱性が懸念される。
- LLM呼び出しは既存のプログラム解析ツールでは解析が困難であり，データフローの追跡を阻害する「NL/PL境界」が存在する。
- LLM呼び出しを通じた情報フローを解析可能にするためのタクソノミーを定義し，その有効性を検証すること。
- 24種類のラベルからなるタクソノミーを定義し，実世界のPythonコードから9,083件のプレースホルダー出力を分類した。信頼性はCohen's $\kappa = 0.82$で確認された。
- タクソノミーに基づいたフィルタリングとLLM検証を組み合わせた汚染伝播パイプラインは，$F_1 = 0.923$を達成し，クロス言語検証でも有効性が確認された。
- タクソノミー情報に基づいた逆スライスにより，スライスサイズを平均15％削減でき，特に情報が伝播しないケースのフィルタリング基準として有効であることが示された。
Link: https://arxiv.org/abs/2603.28345
協調型マルチエージェント強化学習におけるクロスステップ遅延下での通信利得と遅延コスト [cs.CY, cs.AI, cs.MA]目的：クロスステップ遅延下での通信利得と遅延コストの評価
- 部分観測下での協調型マルチエージェント強化学習において，通信は重要な役割を果たす。
- メッセージの遅延は，時間的なずれを引き起こし，情報の鮮度を低下させるという課題がある。
- 遅延による性能劣化を抑制し，効率的な協調学習を実現することを目指す。
- 遅延通信を考慮したDeComm-POMGを形式化し，通信利得と遅延コストを評価するCGDC指標を提案した。
- 遅延メッセージによる性能劣化の上界を，情報ギャップの割引累積として導出した。
- CGDCに基づき，必要な場合にのみメッセージを要求し，未来の観測を予測し，遅延メッセージを融合するCDCMAフレームワークを開発した。実験により，性能向上とロバスト性が確認された。
Link: https://arxiv.org/abs/2604.03785
ReVEL：構造化された性能フィードバックによる多段階反省型LLM誘導ヒューリスティック進化 [cs.AI]目的：NP困難な組合せ最適化問題に対する効果的なヒューリスティック設計
- 組合せ最適化問題は現実世界に多く存在し，効率的な解法が求められている。
- 既存のヒューリスティック設計は専門知識が必要であり，自動化が課題となっている。
- LLMを活用し，ヒューリスティックの反復的な改善を促進し，性能向上を目指す。
- ReVELはヒューリスティックを行動特性に基づきグループ化することで，局所探索と多様性探索を両立する。
- LLMはグループ内で蓄積された性能フィードバックを用いてヒューリスティックを多段階で反復的に改善する。
- 標準的なベンチマークテストの結果，ReVELは既存のLLM誘導進化手法と比較して最適化性能が向上した。
Link: https://arxiv.org/abs/2604.04940
PDFからRAG対応へ：ドメイン特化型質問応答のための文書変換フレームワークの評価 [cs.IR, cs.AI, cs.LG]目的：PDF文書をRAG（Retrieval-Augmented Generation）システムで利用可能な形式に変換する際のフレームワークの性能評価
- RAGシステムは，その性能が文書の前処理品質に大きく依存するため，質の高い変換が不可欠である。
- 既存研究では，PDF処理フレームワークが下流の質問応答精度に与える影響を評価したものは存在しない。
- PDF文書の変換品質がRAGシステムの性能に与える影響を定量的に明らかにし，最適な変換方法を特定すること。
- Doclingを用いた階層的な分割と画像の説明が最も高い自動精度（94.1%）を示し，手動で作成されたMarkdownデータさえ上回った。
- テーブルに基づく質問の種類において精度差が最も大きく，単純な分割と階層的な分割の間で33パーセントポイントの差が生じた。
- メタデータ付加や階層を意識したチャンク化は，変換フレームワーク単体よりも精度向上に貢献することが示された。
Link: https://arxiv.org/abs/2604.04948
SkillSieve：悪意のあるAIエージェントスキルを検出するための階層型トリアージフレームワーク [cs.CR, cs.AI]目的：AIエージェントスキルの悪意検出のための階層型トリアージフレームワーク
- AIエージェントの普及に伴い，そのセキュリティリスクへの対策が急務となっている。
- 既存のセキュリティスキャンでは，巧妙に隠蔽された悪意のあるコードや自然言語による攻撃を見抜けない場合がある。
- 自然言語とコードの両方を解析し，低コストで高精度な悪意のあるスキル検出を実現することを目指す。
- SkillSieveは，正規表現，抽象構文木，メタデータチェックを組み合わせた第1層で大量のスキルを効率的にフィルタリングする。
- 第2層ではLLMを用いて詳細な分析を行い，第3層では複数のLLMによる合意形成により，より信頼性の高い判定を行う。
- ClawHubのデータを用いた評価により，F1スコア0.920という高い精度を達成し，実用性と費用対効果を実証した。
Link: https://arxiv.org/abs/2604.06550
反復法的法的議論のための特性条件付きマルチエージェントシステムによる戦略的説得 [cs.MA, cs.AI, cs.CL]目的：敵対的ドメインにおける戦略的相互作用のメカニズム解明
- 法務，外交，交渉等の分野において，言語が戦略的相互作用を媒介する。
- 従来のゲーム理論モデルでは，談話を通じた説得メカニズムが抽象化されている。
- 言語を戦略的行動空間として扱い，適応的な説得能力を持つ自律エージェントの構築を目指す。
- 異質な特性を持つチームが，均質チームより一貫して高いパフォーマンスを示した。
- 適度な対話深度が，より安定した評決に繋がる事が示された。
- 定量的な特性とカリスマ的な特性が，説得成功に特に大きく貢献することが判明した。
Link: https://arxiv.org/abs/2604.07028
ATOMレポート：オープン言語モデルエコシステムの測定 [cs.CY, cs.AI, cs.LG]目的：オープン言語モデルエコシステムの現状把握
- AI技術の発展は社会に大きな変革をもたらすため，その動向を把握することは重要である。
- オープン言語モデルの開発は活発だが，その状況は十分に整理されていない。
- オープン言語モデルエコシステムの現状を定量的に評価し，今後の発展に貢献する。
- 2025年夏以降，中国の言語モデルが米国のモデルを凌駕し，その差を拡大していることが明らかになった。
- Hugging Faceのダウンロード数，モデルの派生，推論市場シェア，性能指標など，多角的な視点から分析を行った。
- 本研究は，研究者，起業家，政策担当者にとって重要な知見を提供する。
Link: https://arxiv.org/abs/2604.07190
制御された機能進化：AIコンポーネントベースシステムにおけるライフサイクル互換性チェックとロールバック - 具現化されたエージェントをケーススタディとして [cs.RO, cs.AI]目的：AIコンポーネントベースシステムのライフサイクルにおける機能進化の管理
- AI技術の進展に伴い，AIコンポーネントを組み込んだシステムの信頼性と安全性の確保が重要になっている。
- 従来のソフトウェアデプロイメント手法は，AIコンポーネント固有の，状態管理やポリシー制約といった課題に対応できていない。
- AIコンポーネントの進化に伴う潜在的なリスクを検出し，安全なシステム運用を保証することを目指す。
- 提案手法は，機能進化を段階的なアップグレードプロセスとして捉え，互換性チェックを組み込むことで，安全性を高める。
- 実験結果から，提案手法はタスク成功率を維持しつつ，危険なアクティベーションを完全に回避することを示した(p=0.003)。
- シャドウデプロイメントは，サンドボックス評価だけでは検出できない40%の回帰を明らかにし，ロールバック機能はドリフトシナリオの79.8%で成功した。
Link: https://arxiv.org/abs/2604.08059
SenBen：説明可能なコンテンツモデレーションのための感応的なシーングラフ [cs.CV, cs.AI, cs.LG, cs.MM]目的：感応的なコンテンツに関するシーングラフベンチマーク
- オンラインコンテンツの増加に伴い，有害コンテンツの自動検出・遮断が重要となっている。
- 既存のコンテンツモデレーションシステムは，検知理由や対象が不明瞭であるという課題がある。
- 感応的なコンテンツの具体的な描写をシーングラフで表現し，より詳細な分析を可能とする。
- 大規模なシーングラフベンチマークSenBenを構築し，157本の映画から約14,000フレームをアノテーションした。
- 知識蒸留により，コンパクトなVLモデルを開発し，SenBen Recallを6.4%向上させた。
- 提案モデルは，Geminiモデルを除く主要なVLモデルや商用APIよりも優れた性能を示し，推論速度とメモリ使用量も大幅に改善した。
Link: https://arxiv.org/abs/2604.08819
ASTRA：複雑な表質疑応答のための適応的意味的木構造推論アーキテクチャ [cs.CL, cs.AI, cs.LG]目的：複雑な表質疑応答における課題解決
- 表形式データの活用は，情報抽出や意思決定支援において重要である。
- 大規模言語モデルは表の構造を十分に理解できず，精度が制限されている。
- 表の階層構造を捉え，柔軟なスキーマに対応できる推論手法の開発。
- 提案手法ASTRAは，表を意味的木構造に変換することで，従来の系列化手法の課題を克服する。
- AdaSTRモジュールにより，表の規模に応じた最適な木構造を構築し，グローバルな意味的理解を促進する。
- DuTRモジュールは，テキストナビゲーションと記号的コード実行を組み合わせ，高精度な検証を実現する。
Link: https://arxiv.org/abs/2604.08999
頑健なAI生成画像検出のための劣化一貫ペア学習 [cs.CV, cs.AI]目的：AI生成画像検出における劣化に対する頑健性の向上
- AI生成画像の普及に伴い，その真偽性の判定が重要課題となっている。
- 既存の検出器は，現実世界の画像劣化の影響を受けやすく，性能が低下する。
- 劣化に強い検出器を，追加のパラメータや計算コストなしに実現すること。
- 提案手法DCPTは，劣化画像と元の画像の表現の一貫性を制約することで，頑健性を向上させる。
- Synthbusterベンチマークにおいて，DCPTは劣化条件における平均精度を9.1%向上させた。
- 特にJPEG圧縮においては，精度が15.7%～17.9%も改善された。
Link: https://arxiv.org/abs/2604.10102
後知的な信用が宿る場所：RLVRにおけるトークン更新の符号化容量的視点 [cs.LG, cs.AI]目的：強化学習による検証可能な報酬（RLVR）におけるトークンレベルの信用割り当て
- 大規模言語モデルの推論能力向上において，報酬に基づいた学習は重要な役割を果たす。
- RLVRでは，疎な報酬設定により，トークンレベルでの信用割り当てが困難である。
- トークンのエントロピーと報酬の符号を考慮し，効率的な信用割り当てを実現する。
- トークン更新は，報酬条件付きの行動ポリシーから後知的な事後分布へのシフトとして表現できることが示された。
- 高エントロピーかつ符号が一致するトークンに，持続的な推論能力向上が集中することが確認された。
- 提案手法HAPOは，既存のエントロピーを考慮したベースラインと同等の性能を数学的推論ベンチマークで達成した。
Link: https://arxiv.org/abs/2604.11056
属性から行動へ：活性化操舵の人間中心アプローチ [cs.AI, cs.HC, cs.LG]目的：説明可能なAIにおける活性化操舵の活用方法
- AIの信頼性と透明性向上は，社会実装において不可欠である。
- XAIは説明は提供するが，具体的な対応策を導き出すのが困難である。
- 活性化操舵を通じて，XAIの説明を実用的な介入へとつなげる。
- 活性化操舵は，モデルの検査から介入的な仮説検証への移行を可能にする。
- 参加者の多くは，説明の妥当性よりも，観察されたモデルの応答に基づいて信頼を構築する。
- コンポーネントの抑制が主なデバッグ戦略であり，影響範囲や汎化性の限界が指摘された。
Link: https://arxiv.org/abs/2604.11467
安定性は冗長性を示す：効率的な長文コンテキスト事前処理のためのデルタ注意選択的停止 [cs.AI]目的：長文コンテキストにおける大規模言語モデルおよび大規模マルチモーダルモデルの事前処理コスト削減
- 大規模モデルの性能向上には，計算資源の効率的な利用が不可欠であるため。
- 従来のトークン削減手法は，ハードウェア効率の良いカーネルとの互換性を損なう場合がある。
- 注意機構の更新動態を監視し，安定したトークンを早期に停止することで，事前処理を高速化する。
- DASHは，言語および画像ベンチマークにおいて汎化し，モデルの精度とハードウェア効率を維持しながら，有意な事前処理速度向上を実現する。
- トークンは意味的な固定点へと進化し，その後の処理は冗長になるという観察に基づいている。
- DASHはトレーニング不要のポリシーであり，注意機構の層ごとの更新ダイナミクスを監視し，安定したトークンを自動的に停止する。
Link: https://arxiv.org/abs/2604.18103
ホスト型LLMにおける監査済みセッション置換検出のためのコミットされたSAE特徴トレース [cs.CR, cs.AI]目的：ホスト型LLMプロバイダーによる秘密のモデル置換の検出
- LLMの普及に伴い，提供されるモデルの品質保証が重要になっている。
- プロバイダーが広告モデルよりも安価なモデルで応答を生成するインセンティブが存在する。
- 公開されたプローブ層における特徴トレースを用いて，モデルの整合性を検証する。
- 提案手法は，様々な攻撃者に対して，共有された閾値でモデル置換を正確に検出できる。
- 既存のSVIPベースラインと比較して，より高い検出性能を示す。
- コミットメントによる計算オーバーヘッドは，バッチサイズ32で2.1%以下である。
Link: https://arxiv.org/abs/2604.18179
Chat2Workflow：自然言語からの実行可能ビジュアルワークフロー生成のためのベンチマーク [cs.CL, cs.CL, cs.AI, cs.CV, cs.LG, cs.MA]目的：実行可能ビジュアルワークフローの自動生成
- 現実の産業界において，信頼性と制御性に優れたビジュアルワークフローが主流となっている。
- 既存のワークフローは手作業で構築されており，開発にコスト，時間，労力がかかるという課題がある。
- 大規模言語モデルによるワークフロー開発の自動化可能性を検証し，そのためのベンチマークを提供する。
- 最先端の言語モデルは高レベルな意図を捉えられつつも，特に複雑な要件においては正確で安定した実行可能なワークフローの生成に苦戦する。
- 提案するエージェントベースラインは，解決率を最大6.05％向上させるものの，産業利用に向けた課題が残る。
- Chat2Workflowは，産業グレードの自動化を促進するための基盤として活用可能である。
Link: https://arxiv.org/abs/2604.19667
ハイブリッドおよび非ハイブリッドLLMにおける推論の素朴要素：アーキテクチャの違いは，状態追跡と想起の優位性をもたらすか？ [cs.CL, cs.CY, cs.CL, cs.AI]目的：大規模言語モデルにおける推論の素朴要素である想起と状態追跡の性能比較
- LLMの推論能力はAI研究の主要課題であり，そのメカニズム解明は性能向上に不可欠である。
- LLMの推論はブラックボックスであり，その内部動作とアーキテクチャが性能にどう影響するか不明である。
- 推論素朴要素に着目し，アーキテクチャの違いが状態追跡・想起に及ぼす影響を明らかにすること。
- 推論トークンによる拡張は，指示のみのモデルと比較して大幅な性能向上をもたらすことが確認された。
- ハイブリッドアーキテクチャは一貫した優位性を示さず，その効果はタスク構造に依存することが示された。
- ハイブリッドモデルは逐次的な更新に強く，Transformerモデルは多段検索に強い傾向が見られた。
Link: https://arxiv.org/abs/2604.21454
VLMが学生の解答を「修正」する場合：多行手書き数式OCR評価における過剰修正の特定とペナルティ [cs.CY, cs.AI, cs.CV, cs.LG]目的：多行手書き数式OCRにおける過剰修正の特定と，それを抑制する評価指標の開発
- 教育AIシステムにおいて，手書き数式の正確な文字起こしは不可欠であり，学習評価の自動化を可能にする。
- 既存の評価指標は単一行の表現に偏っており，複数行にわたる解答の論理的な正誤を評価できないという課題がある。
- Vision-Language Model（VLM）による過剰修正を検出し，より正確なOCR評価を実現することを目指す。
- VLMは学生の解答を忠実に書き起こすのではなく，誤りを「修正」する傾向があり，評価対象の誤りを隠蔽してしまうことが明らかになった。
- 提案手法PINKは，LLMを用いたルーブリックに基づく採点と，過剰修正に対するペナルティにより，より教育的な評価を実現する。
- FERMATデータセットを用いた評価で，PINKは人間による評価との一致度が高く，BLEUよりも高い優先度で選ばれた（55.0% vs 39.5%）。
Link: https://arxiv.org/abs/2604.22774
LinkedInの採用エージェントのための階層型長期セマンティックメモリ [cs.IR, cs.LG]目的：LLMエージェントの長期セマンティックメモリシステムの構築
- LLMの活用が進む中，個々のユーザーに最適化された対話が重要となる。
- ノイズの多い行動履歴データから構造化された知識を効率的に抽出・保存・検索することが困難である。
- スケーラビリティ，低遅延，プライバシー保護，適応性，可視性を備えた長期メモリシステムを確立すること。
- 階層型長期セマンティックメモリ(HLTM)フレームワークが，知識の粒度に応じた構造化されたメモリツリーを構築する。
- HLTMは，LinkedInの採用アシスタントにおいて，回答の正答率を5%以上，検索F1スコアを10%以上向上させた。
- HLTMは，クエリとインデックスの遅延のトレードオフを改善し，LinkedInの採用アシスタントに本格導入された。
Link: https://arxiv.org/abs/2604.26197
動的敵対的ファインチューニングによる拒否幾何形状の再構成 [cs.LG, cs.CL, cs.CR]目的：有害な要求に対する拒否と過剰な拒否の回避のバランス
- 安全性に配慮した言語モデルの重要性が高まっている。
- 過剰な拒否を抑制しつつ，有害な要求を拒否することが困難である。
- 動的敵対的ファインチューニングが拒否制御に与える影響を解明する。
- R2D2は初期段階でHarmBench攻撃の成功率をゼロにする一方で，XSTestでの過剰な拒否と有用性の低下を引き起こす。
- R2D2は，段階が進むにつれて有用性を回復するが，攻撃に対する脆弱性が再燃する。
- 拒否制御の担い手は，R2D2によって層の再構成が行われ，低次元でありながら有用性と結びついていることが示唆された。
Link: https://arxiv.org/abs/2604.27019
BrainDINO：汎用的な臨床表現学習のための脳MRI基盤モデル [cs.LG, cs.AI, cs.CV]目的：脳MRIの汎用的な臨床表現学習
- 脳MRIは神経科学および臨床応用の基盤技術であり，疾患の診断や治療に不可欠である。
- 既存の機械学習手法は特定のタスクに特化し，大量のラベル付きデータが必要となる点が課題である。
- ラベル付きデータが少ない状況でも，多様な脳MRIタスクに対応可能な汎用的な表現学習を目指す。
- BrainDINOは，約660万枚のラベルなし脳MRI画像を用いて自己教師あり学習を行い，多様なタスクで高い性能を示した。
- 腫瘍セグメンテーション，神経変性疾患/発達疾患の分類，脳年齢推定など，幅広いタスクにおいて既存手法を上回る性能を達成した。
- 大規模な自己教師あり学習により，脳MRIの統一的な表現を獲得し，データ効率の良い画像解析の基盤を確立した。
Link: https://arxiv.org/abs/2604.27277
構造的ガバナンスの機械化された基礎：ガバナンスされた知能のための機械検証された証明 [cs.AI]目的：認知ワークフローシステムにおける構造的ガバナンスの理論的基盤
- AIシステムの安全性と信頼性の確保が重要視される中，その理論的基盤の確立が求められている。
- 従来のガバナンス手法では，複雑なシステムの安全性と正確性を形式的に保証することが困難であった。
- 形式的な証明を通して，ガバナンスされた知能システムの安全性と正確性を数学的に保証することを目指す。
- Coq 8.19とInteraction Treesライブラリを用いて，ガバナンスの安全性を捉えるcoinductive property（gov_safe）を形式的に検証した。
- ガバナンス不変定理により，ガバナンスが一貫性を持つことを数学的に証明し，認知ワークフローシステムの信頼性を向上させた。
- BEAMランタイムの検証済みインタプリタ仕様をCoqで形式化し，7万件以上のテストで矛盾が確認されなかった。
Link: https://arxiv.org/abs/2604.27289
二つの境界：行動型AIガバナンスが構造的に失敗する理由 [cs.AI]目的：行動型AIシステムのガバナンスにおける構造的なギャップの分析
- AI技術の発展は社会に大きな影響を与えており，その安全性と倫理性が重要課題となっている。
- AIシステムの機能とガバナンス範囲の乖離により，リスクや形骸化が生じている。
- AIガバナンスにおける構造的な問題を明らかにし，安全なAIシステム構築の指針を示す。
- AIシステムには，実行可能なこととガバナンス対象の二つの境界が存在し，その乖離が構造的な問題を引き起こす。
- Riceの定理に基づき，効果の行動をガバナンスすることは一般的に決定不能であることが示された。
- 表現能力の境界とガバナンスの境界が一致する「共生ガバナンス」が，リスクと形骸化を回避するための必要条件であることが示された。
Link: https://arxiv.org/abs/2604.27292
NeuroRing：マルチFPGA双方向リングトポロジーとストリームデータフローアーキテクチャによるスパイクニューラルネットワークのスケール化 [cs.AR, cs.DC, cs.NE]目的：スパイクニューラルネットワークのスケール化手法
- 脳の神経回路を模倣し，低消費電力なイベント駆動型計算を実現する基盤技術として期待されている。
- スパイクの疎な通信と同期がボトルネックとなり，大規模なSNNの実行が困難である。
- FPGA上に構築可能な，モジュール性と拡張性に優れたSNNアクセラレータを提供し，計算効率を向上させる。
- NeuroRingはNESTシミュレータとの互換性を持ち，既存のSNNワークフローに容易に統合可能である。
- 皮質マイクロ回路ベンチマークにおいて，NeuroRingはNEST参照モデルの主要な活動統計量を維持し，リアルタイム係数0.83で高速な実行を達成した。
- 2つのプログラマブルFPGA上で，NeuroRingは競争力のあるエネルギー効率と良好なスケーラビリティを示した。
Link: https://arxiv.org/abs/2604.28059
物理ネイティブな世界モデル：生成的ワールドモデリングにおけるハミルトン系の視点 [cs.AI, cs.RO]目的：生成的ワールドモデリングにおける物理的整合性および行動制御可能性の向上
- 具現化された知能，ロボティクス，自動運転など，モデルベースの強化学習の発展に不可欠な研究分野である。
- 既存の世界モデルは，現実感，空間再構成，抽象的予測表現に偏りがあり，物理的に信頼性が高く，行動制御可能な長期的予測が困難である。
- ハミルトン系の視点を取り入れ，物理的に意味のある予測生成と，行動計画への応用を目指す。
- 本研究では，観測データを構造化された潜在的位相空間にエンコードし，ハミルトン力学に基づいたダイナミクスを用いて状態を遷移させる。
- ハミルトン構造が，解釈可能性，データ効率，および長期的安定性を向上させる可能性を示す。
- 現実世界のロボットシーンにおける摩擦，接触，非保存力，変形物などの課題についても議論する。
Link: https://arxiv.org/abs/2605.00412
AIワークフローアーキテクチャにおける効果透明なガバナンス：意味的保存，表現的最小性，決定可能性境界 [cs.AI, cs.LO, cs.PL]目的：AIワークフローアーキテクチャにおける効果レベルのガバナンスの形式化と検証
- AIの利用拡大に伴い，その安全性と制御可能性が重要課題となっている。
- 既存のガバナンス手法は，表現力を低下させる場合や，決定可能性に問題がある。
- ガバナンスと計算表現力の両立と，ガバナンスの透明性の確保を目指す。
- AIワークフローアーキテクチャの効果レベルガバナンスが，内部計算表現力を損なわずに実現可能であることを形式的に証明した。
- ガバナンスオペレータGを定義し，メモリアクセスや外部API呼び出しなど，あらゆる副作用のある命令を仲介することによって実現した。
- ガバナンスと計算表現力は直交する次元であり，ガバナンスはプログラムの効果境界を制約しつつ，内部計算に対しては意味的に透明であることを示した。
Link: https://arxiv.org/abs/2605.01030
統治される実行の代数的意味論：モノイダル圏，効果代数，および境界 [cs.AI, cs.LO, cs.PL]目的：統治される実行の代数的意味論の定式化
- プログラムの安全性確保は重要な課題であり，特に複雑化するシステムにおいて不可欠である。
- 既存の安全性モデルでは，プログラムの統治と表現力の限界が明確に定義されていない場合がある。
- 表現力と統治の境界を明確にし，プログラムの安全性を形式的に保証することを目指す。
- 統治代数（安全性，透明性，適切性）を定義し，これにより，プログラムの安全性を形式的に検証可能な枠組みを構築した。
- 能力に基づくプログラムの合成により，能力境界を静的に検証し，安全なプログラムの実行を保証する。
- 形式モデルと抽出されたOCamlコードが等価であることを，広範なテストによって確認した。
Link: https://arxiv.org/abs/2605.01032
認知ワークフロー実行者に対する認証された純粋性：静的解析から暗号的証明まで [cs.CR, cs.AI, cs.PL]目的：認知ワークフローシステムにおけるガバナンスの執行方法の構造化
- 認知ワークフローの信頼性とセキュリティ確保は，自動化システムの普及において不可欠である。
- 既存のガバナンス手法は，悪意のあるバイパスに対して脆弱であり，完全なガバナンスを保証できない。
- 本研究は，実行モジュールのバイパスを防ぎ，ガバナンスの完全性を保証するアーキテクチャを提案する。
- 提案アーキテクチャは，WebAssemblyコンパイルターゲット，純粋性証明書，ランタイム検証ゲート，リモートアテステーションにより構成される。
- 構造的な純粋性，バイパス排除，証明書の完全性，ゲートの完全性に関する4つの定理が証明された。
- 評価実験では，検証遅延時間が39～42μs，プランサイクルが400μs未満，ランタイムオーバーヘッドが0.4%未満であり，決定性の逸脱は確認されなかった。
Link: https://arxiv.org/abs/2605.01037
最先端科学推論のための深層研究エージェントの拡張：SciResearcher [cs.CL, cs.AI, cs.CL]目的：最先端科学における自動発見を支援するAIエージェントの基盤技術
- AIエージェントによる自動科学発見は，科学技術の進歩に不可欠な要素となっている。
- 最先端科学分野では，専門知識が分散しており，高度な計算と推論が求められるため，既存手法の限界がある。
- 本研究は，最先端科学データ構築を自動化し，科学的推論能力を持つエージェント開発への道を開く。
- SciResearcherは，学術的根拠に基づいた多様なタスクを統合し，情報収集，ツール利用，長期的な推論能力を実現する。
- SciResearcher-8Bは，HLE-Bio/Chem-Goldベンチマークで19.46%を達成し，同パラメータスケールの最先端技術を確立した。
- SuperGPQA-Hard-BiologyとTRQA-Literatureベンチマークでは，それぞれ13-15%の絶対的な改善が確認された。
Link: https://arxiv.org/abs/2605.01489
拡散モデルにおけるゼロスキップ：疎データ生成のための手法 [cs.LG]目的：疎データ生成のための拡散モデルの効率化
- 拡散モデルは連続データ生成に優れるが，疎データへの適用は課題であった。
- 従来の拡散モデルはゼロ値を考慮せず，疎性を損ない計算資源を無駄にする。
- ゼロ値をスキップすることで，計算コストを削減しつつ生成品質を維持・向上させる。
- Sparsity-Exploiting Diffusion (SED) は，非ゼロ値のみをモデル化することで疎性を維持する。
- 物理学や生物学のベンチマークで，従来の拡散モデルや専門的なベースラインと同等またはそれ以上の性能を示す。
- 画像生成実験から，密な拡散モデルの限界とSEDの利点が明らかになった。
Link: https://arxiv.org/abs/2605.01817
VIDA：マルチモーダル機械翻訳における視覚依存曖昧性に関するデータセット [cs.CL, cs.AI]目的：マルチモーダル機械翻訳における視覚依存曖昧性の解消
- 機械翻訳の精度向上には，文脈や視覚情報の適切な理解が不可欠である。
- 既存の評価データセットは，曖昧性の種類や視覚への依存性の検証が不十分である。
- 多様な曖昧性に対応できる，視覚情報に基づいた曖昧性解消評価データセットの構築。
- 本研究では，2,500件の視覚的証拠を必要とするVIDAデータセットを構築した。
- 大規模言語モデルを用いた評価指標により，曖昧な表現の解消が正しく行われているかを検証した。
- CoT-SFTは，多様な曖昧性への対応において，SFTよりも優れた汎化性能を示すことが示された。
Link: https://arxiv.org/abs/2605.02035
MultiSense-Pneumo：リソース制約環境における肺炎スクリーニングのためのマルチモーダル学習フレームワーク [cs.CV, cs.AI, cs.LG]目的：肺炎スクリーニングのためのマルチモーダル学習フレームワーク
- 肺炎は依然として世界的な罹患と死亡の主要な原因であり，特に低資源地域での医療アクセスが課題。
- 既存の計算手法は単一のモダリティに依存することが多く，多様な臨床情報を統合できていない。
- 多様な臨床情報を統合し，リソース制約環境における肺炎スクリーニングを支援するフレームワークを開発。
- MultiSense-Pneumoは，症状記述，咳の音声，音声言語，胸部レントゲンを統合するマルチモーダルな研究プロトタイプ。
- 胸部レントゲン経路は，合成ドメインシフト下で高い性能を示したが，咳音響の異常検知率は低いという課題も明らかになった。
- MultiSense-Pneumoは，スクリーニングとトリアージの研究のためのフレームワークおよびコンポーネントレベルのプロトタイプとして意図されている。
Link: https://arxiv.org/abs/2605.02207
拒否の動態の追跡：堅牢な脱獄検出のための潜在的な拒否軌跡の活用 [cs.CR, cs.AI, cs.CL, cs.LG]目的：脱獄検出のための拒否軌跡の特定と活用
- 大規模言語モデルの安全性確保は，社会実装において不可欠である。
- 既存の脱獄検出手法は，終端層の情報に依存し，脆弱性を持つ可能性がある。
- 層ごとの活性化パターンを分析し，より頑健な拒否検出手法を開発すること。
- 本研究では，拒否が層・トークン位置に沿って構築される「拒否軌跡」を特定した。
- 提案手法SALOは，この拒否軌跡を活用し，既存手法よりも高い脱獄検出性能を示した。
- 実験結果から，拒否軌跡モニタリングの有効性と限界が明らかになった。
Link: https://arxiv.org/abs/2605.02958
暗号学的レジストリ由来：AIパッケージエコシステムにおける依存関係混乱に対する構造的防御 [cs.CR, cs.AI, cs.SE]目的：依存関係混乱攻撃に対する構造的防御機構
- ソフトウェアサプライチェーンのセキュリティ確保は，現代社会におけるシステム信頼性維持に不可欠である。
- 既存のパッケージ管理システムには，レジストリの真正性を検証する仕組みがなく，攻撃の余地がある。
- 暗号学的証明を用いることで，レジストリの信頼性を保証し，依存関係混乱攻撃を効果的に防ぐ。
- 本研究では，レジストリのIDを暗号的に確立し，パッケージの署名を二重化することで，多層防御を実現した。
- 8つのエコシステムにおける比較の結果，提案手法のように全ての防御要素を組み合わせたシステムは存在しないことが示された。
- 本システムはAI生成物の由来追跡にも応用可能であり，ガバナンスに基づく依存関係解決を強化する。
Link: https://arxiv.org/abs/2605.03309
PHALAR：学習された音楽オーディオ表現のための位相表現 [cs.SD, cs.AI, cs.LG, eess.SP]目的：音楽オーディオのステム検索における精度向上
- 音楽制作において，楽曲の構成要素であるステムの分離・編集は不可欠である。
- 既存手法では，時間情報を考慮しないため，ステム検索の精度に限界があった。
- 時間情報を活用し，より高精度なステム検索を実現すること。
- PHALARは，最先端モデルと比較して約70%の精度向上を達成し，パラメータ数を50%以下に抑え，学習速度を7倍に向上させた。
- 学習されたスペクトルプーリング層と複素数値ヘッドにより，ピッチおよび位相不変性を強化している。
- MoisesDB，Slakh，ChocoChoralesの各データセットで最先端の性能を示し，人間の判断との相関も高い。
Link: https://arxiv.org/abs/2605.03929