arXiv雑要約

AI - 2026/03/16 公開

品質多様性を用いたプロンプト生成によるビジョン-言語-行動モデルのレッドチーム化：堅牢なロボットポリシーのため [cs.HC, cs.RO, cs.AI, cs.CL]目的：ビジョン-言語-行動モデルの脆弱性特定と，それらに対するロボットポリシーの堅牢性向上
- 汎用ロボットシステム実現において，視覚と言語を理解し行動するモデルの重要性が高まっている。
- 言語指示の表現揺れに対してロボットの性能が左右されやすく，失敗予測が困難である。
- 多様な自然言語指示を用いて，VLAモデルの潜在的な脆弱性を効率的に発見する。
- Q-DIGは，基盤モデルと比較して，より多様かつ意味のある失敗モードを発見し，VLAの弱点を明らかにした。
- 生成された指示でVLAをファインチューニングすることで，タスク成功率を向上させることが示された。
- ユーザ調査の結果，Q-DIGが生成したプロンプトは，より自然で人間らしいと評価された。
Link: https://arxiv.org/abs/2603.12510
バイザンチン耐性を持つ$(L_0, L_1)$-滑らかさ下での最適化 [cs.LG]目的：バイザンチン攻撃下における分散最適化
- 機械学習の分散化が進む中で，悪意のあるノードによる攻撃への耐性が重要となる。
- 従来の最適化手法は，バイザンチン攻撃に対して脆弱であり，学習の妨げとなる。
- 状態依存の勾配リプシッツ定数を持つ関数に対するバイザンチン耐性最適化手法を開発する。
- 提案手法Byz-NSGDMは，バイザンチン攻撃に対して堅牢でありながら，収束性を保証する。
- $(L_0, L_1)$-滑らかさという一般的な条件の下でも，有効に機能することが示された。
- MNIST分類，合成最適化問題，言語モデル実験により，様々な攻撃戦略に対する有効性が確認された。
Link: https://arxiv.org/abs/2603.12512
3D外傷検出におけるデータ不足への対処：頂点相対位置エンコーディングを用いた自己教師あり学習と半教師あり学習 [cs.CV, cs.LG]目的：3D外傷検出のための自己教師あり学習と半教師あり学習の有効性検証
- 緊急放射線医学において，腹部CTスキャンでの外傷検出の精度向上は重要である。
- 医療データの注釈付きデータが不足しており，正確な外傷検出が困難である。
- 注釈付きデータが限られた状況下でも，高い検出精度を実現することを目指す。
- 自己教師あり事前学習と半教師あり学習の組み合わせにより，注釈付きデータが少ない状況でも効果的な3D外傷検出が可能となった。
- 半教師あり学習により，144個の注釈付きサンプルで56.57%の検証mAP@0.50，45.30%のテストmAP@0.50を達成し，教師あり学習のみと比較して115%の改善が見られた。
- 事前学習されたエンコーダは，7つの外傷カテゴリーにおいて94.07%のテスト精度を達成し，自己教師あり学習の特徴の有用性が示された。
Link: https://arxiv.org/abs/2603.12514
多孔質媒体における多相流の4D速度計測からの学習 [cs.LG, physics.flu-dyn]目的：多相ポーラスフローの学習フレームワーク
- 地中エネルギー・環境技術の基盤であり，CO2貯留や水素貯留の鍵となる。
- 現実的な３次元材料におけるポーラスケールでのダイナミクスの特性評価と予測が困難である。
- 実験に基づいた迅速な予測により，地中貯留における条件検討を効率化する。
- 本研究では，時間分解能のある4Dマイクロ速度計測データから直接，多相ポーラスフローを推論する学習フレームワークを導入した。
- 学習済みモデルは，短時間での物理時間の経過を捉え，直接数値シミュレーションの計算時間を大幅に短縮する。
- これにより，「デジタル実験」が可能になり，多相流実験で観察されるポーラスケール物理を再現し，注入条件やポーラス構造の影響を調査できる。
Link: https://arxiv.org/abs/2603.12516
カリキュラムサンプリング：フローマッチングの効率的な学習のための二相カリキュラム [cs.LG, cs.CV]目的：フローマッチングモデルにおける効率的な学習方法
- 生成モデルの性能向上は，画像生成をはじめとする様々な応用において重要である。
- 既存のフローマッチングモデルでは，タイムステップのサンプリング方法が性能に大きく影響する。
- タイムステップサンプリングをカリキュラムとして捉え，学習効率と生成品質の両立を目指す。
- 中間層に偏ったサンプリングは初期収束を速めるが，最終的な生成品質はUniformサンプリングに劣る。
- カリキュラムサンプリングは，まず中間層に偏ったサンプリングで構造学習を行い，次にUniformサンプリングで境界の微調整を行う。
- CIFAR-10において，カリキュラムサンプリングはFIDスコアを3.85から3.22に改善し，学習ステップ数を15万から10万に短縮した。
Link: https://arxiv.org/abs/2603.12517
LLMジャッジのスコアが良い場合でも，Best-of-Nの決定が失敗するケース [cs.LG, cs.AI, cs.CL]目的：大規模言語モデルを用いた評価におけるBest-of-N選択の性能評価
- 対話AIの性能向上には，適切な評価指標と方法論が不可欠である。
- 従来の評価指標は，Best-of-N選択のような実用的なタスクの性能を正確に反映していない可能性がある。
- プロンプト内ランキングに焦点を当てた評価方法の改善を試みる。
- 大規模言語モデルの全体的な相関は，Best-of-N選択における改善のわずか21.0%しか捉えられない。
- 全体的な合意はプロンプトレベルのベースライン効果に大きく左右され，選択はプロンプト内のランキングに依存する。
- ペアワイズジャッジを用いることで，この失われた信号の多くが回復し，性能が61.2%に向上する。
Link: https://arxiv.org/abs/2603.12520
LLM BiasScope：比較LLM評価のためのリアルタイムバイアス分析プラットフォーム [cs.HC, cs.CY, cs.CL, cs.AI, cs.CY, cs.HC]目的：大規模言語モデルのバイアス分析と比較評価
- LLMの普及に伴い，倫理的・社会的な影響が懸念され，公平性の評価が重要となっている。
- 既存のバイアス評価は煩雑で，複数モデルの同時比較やリアルタイム分析が困難である。
- LLMの出力におけるバイアスを迅速かつ客観的に検出し，モデル間の比較を容易にすること。
- LLM BiasScopeは，複数のLLMの出力を並べて比較し，リアルタイムでバイアス分析を行うウェブアプリケーションである。
- バイアス検出は，文レベルの検出とバイアスタイプ分類の二段階で行われ，統計情報や可視化により詳細な分析が可能である。
- 本プラットフォームは，オープンソースとして公開されており，LLMのバイアス評価と比較分析の実用的なツールを提供する。
Link: https://arxiv.org/abs/2603.12522
思考連鎖における早期終了のための最適な出口地点学習：TERMINATOR [cs.LG, cs.AI, cs.CL]目的：思考連鎖推論における早期終了戦略
- 大規模言語モデルの複雑な推論能力の向上は，学術研究および実用上の応用において重要である。
- 思考連鎖推論では，答えが早期に出力された後も過剰な計算リソースを消費するという問題が存在する。
- タスクやモデルに依存する最適な思考連鎖の長さを決定し，計算コストを削減することを目的とする。
- TERMINATORは，MATH-500，AIME 2025，HumanEval，GPQAの4つのデータセットで思考連鎖の長さを平均14%-55%削減した。
- 従来の最先端手法と比較して，性能を維持しつつ効率的な推論を実現した。
- 大規模言語モデルが最終的な答えを最初に生成するタイミングを予測し，最適な推論長を学習する。
Link: https://arxiv.org/abs/2603.12529
マルコフ的文脈線形バンディットのための削減アルゴリズム [cs.LG]目的：マルコフ的文脈線形バンディット問題に対する削減手法
- 文脈線形バンディットは，推薦システム等に応用され，その効率的な学習が重要である。
- 従来の文脈線形バンディットでは，文脈の独立性を仮定しており，時間依存性のある状況に対応できない。
- 時間相関を持つ文脈下での線形バンディット問題を，既存手法を用いて解決することを試みる。
- 文脈が独立でないマルコフ的文脈線形バンディットに対し，一様幾何学的エルゴード性のもとで削減が可能となった。
- 標準的な線形バンディットオラクルを用いて問題を解決するための定常的な代理行動集合を構築し，遅延更新スキームでバイアスを制御した。
- 未知の遷移分布に対する段階的アルゴリズムを提案し，オンラインで代理マッピングを学習する手法を示した。
Link: https://arxiv.org/abs/2603.12530
参照表現に基づく画像セグメンテーションのための空間・意味的専門家ルーティングアーキテクチャ [cs.CV, cs.AI]目的：参照表現に基づいた画像領域のピクセルレベルマスク生成
- 画像と自然言語の理解が重要視され，画像認識と自然言語処理の融合が求められている。
- 既存手法は均一な改良戦略に頼ることが多く，多様な参照表現の要求に応えきれていない。
- 空間的な正確性と境界の精度を向上させ，より適切な物体を識別することを目指す。
- SERAは，バックボーンを固定した状態でも高い性能を発揮する軽量な表現条件付き専門家改良機構を導入した。
- SERA-Adapterは，バックボーンの選択されたブロックにアダプターを挿入し，空間的な一貫性と境界の精度を向上させる。
- SERA-Fusionは，空間グリッドにトークン特徴を再形成し，geometry-preservingな専門家変換を適用することで，中間的な視覚表現を強化する。
Link: https://arxiv.org/abs/2603.12538
組込みシステムにおける埋め込み量子機械学習：実現可能性，ハイブリッドアーキテクチャ，量子コプロセッサ [cs.LG, cs.AI]目的：組込みシステムへの量子機械学習能力の導入
- IoT等のエッジデバイスの高性能化が求められており，機械学習の活用が不可欠である。
- 量子コンピュータの性能やコスト面で，実用的な組込み環境への適用が困難である。
- 量子機械学習を組込みシステムで実現するための具体的な方法論と課題の明確化。
- 2026年時点で，EQMLは限定的な形で実現可能であり，ハイブリッドワークフローや小型量子コプロセッサが考えられる。
- 量子にヒントを得た機械学習や最適化が，古典的な組込みプロセッサやFPGAで現実的な代替手段となり得る。
- 遅延，データエンコード，NISQノイズ，ツールミスマッチ，エネルギー消費が主要な障壁として認識されている。
Link: https://arxiv.org/abs/2603.12540
言語モデルの規模拡大に伴い，低次線形深度ダイナミクスが出現する [cs.LG, cs.SY, eess.SY]目的：言語モデルの深度ダイナミクスにおける低次線形近似の性質
- 大規模言語モデルは自然言語処理の重要な要素であり，その挙動理解が不可欠である。
- 大規模言語モデルは複雑な非線形システムとして扱われ，内部構造の解明が困難である。
- モデル規模拡大に伴う深度ダイナミクスの線形化現象を解明し，モデル制御への応用を目指す。
- 32次元の線形近似モデルが，GPT-2-largeの層ごとの感度プロファイルをほぼ完全に再現することを示した。
- 線形近似モデルの精度は，GPT-2モデル群においてモデル規模の拡大とともに単調に向上する。
- この線形近似モデルを用いることで，従来のヒューリスティックな手法よりもエネルギー効率の高い多層介入が可能となる。
Link: https://arxiv.org/abs/2603.12541
分散強化学習のためのコミュニケーション認識学習フレームワークCALF [cs.LG, cs.AI]目的：分散型強化学習におけるネットワーク遅延への対策
- エッジデバイスとクラウドサーバ間の分散型強化学習の利用が拡大しており，その重要性が増している。
- 現実的なネットワーク環境では，遅延やパケットロスが強化学習の性能を著しく低下させるという課題がある。
- シミュレーション中に現実的なネットワークモデルを用いて学習することで，実環境での性能劣化を抑制することを目指す。
- コミュニケーションを考慮した学習フレームワークCALFは，ネットワークの影響下での性能低下を大幅に軽減できる。
- 異種ハードウェアを用いた分散配置実験により，学習時の通信制約の明示的モデリングが，実環境での堅牢な実行を可能にすることが示された。
- 本研究は，物理シミュレーションや視覚的ドメインランダム化に加えて，ネットワーク条件がシミュレーションから現実世界への転送における重要な要素であることを明らかにした。
Link: https://arxiv.org/abs/2603.12543
教師なし多変量時系列類似性検索のための深層距離測定法 [cs.LG]目的：教師なし多変量時系列類似性検索における検索精度向上
- 産業プラント等の異常検知において，時系列データの類似性検索は重要な役割を担う。
- 従来の時系列表現学習法では，時系列内の微小な差異の認識が困難であった。
- 本研究は，時系列内の状態間の微小な差異を捉え，より精度の高い類似性検索を実現する。
- 提案手法DDMMは，パルプ・製紙工場のデータセットにおいて，既存の時系列表現学習法を大幅に上回る性能を示した。
- DDMMは，時系列全体から任意にサンプリングされたアンカーと正例のペアに重みを付与することで，状態内の微小な差異を学習する。
- 既存の特徴抽出法とDDMMを組み合わせることで，さらなる精度向上が確認された。
Link: https://arxiv.org/abs/2603.12544
InfoNCEにおけるLangevinベースの温度焼きなましに対する漸近的および有限時間保証 [cs.LG, math.OC, stat.ML]目的：InfoNCEにおける温度スケジュールの理論的保証
- 表現学習においてコントラスト学習が重要な役割を担う。
- 温度パラメータの動的な調整方法が十分に理解されていない。
- 最適な表現を獲得するための温度スケジュールの指針を示す。
- Langevin力学に基づき，滑らかさやエネルギー障壁の仮定の下で理論的解析を行った。
- 遅い対数的な逆温度スケジュールは，確率的に最適な表現に収束することが示された。
- 速いスケジュールは，劣最適な最小値に陥るリスクがあることが明らかになった。
Link: https://arxiv.org/abs/2603.12552
エントロピー誘導ステップ選択と段階的利点による拡散LLMの強化学習 [cs.LG, cs.AI, cs.CL]目的：拡散言語モデルにおける強化学習の効率的な手法
- 大規模言語モデルの性能向上は重要であり，特に複雑な推論能力の獲得が求められている。
- 拡散言語モデルへの強化学習の適用は，シーケンスレベルの尤度計算の困難さから，近似手法に頼らざるを得ない。
- 正確かつ効率的な方策勾配を導出し，中間的な利点の推定を通じて問題を解決することを目指す。
- エントロピー誘導近似境界を用いて，方策更新のためのノイズ除去ステップを選択することで計算効率を高めた。
- 拡散モデルが自然に提供する1ステップノイズ除去報酬を用いて中間的な利点を推定し，高コストな多段階ロールアウトを回避した。
- コーディングや論理的推論のベンチマークにおいて，最先端の結果が得られ，特に数学的推論で既存の手法を上回った。
Link: https://arxiv.org/abs/2603.12554
単層PINNのスケーリング則と病理：ネットワーク幅と偏微分方程式の非線形性 [cs.LG, cs.NA, math.NA, physics.comp-ph]目的：単層Physics-Informed Neural Networksにおけるスケーリング則の検証
- 偏微分方程式の数値解法は科学技術計算において不可欠であり，近年，機械学習を用いた効率的な解法が注目されている。
- 既存のPINNは，ネットワーク幅を増やしても必ずしも精度が向上せず，理論的な近似精度に満たない場合がある。
- 本研究は，PINNの精度向上のボトルネックを特定し，スケーリング則をより正確に記述することを目的とする。
- 単層PINNにおいて，ネットワーク幅を増やしても解誤差が減少しないという病理が確認された。
- この病理は，偏微分方程式の非線形性が高まるほど顕著になることが示された。
- 最適化のボトルネックが近似能力よりも重要であり，その複雑なスケーリング効果を測定するための手法が提案された。
Link: https://arxiv.org/abs/2603.12556
リアプノフ安定なグラフニューラルフロー [cs.LG, cs.CV]目的：グラフニューラルネットワークのロバストな表現学習
- グラフニューラルネットワークは，様々なタスクで高い性能を発揮するが，その脆弱性が課題。
- グラフの構造や特徴に対する敵対的摂動に弱く，頑健性の向上が求められている。
- リアプノフ安定性理論に基づき，ネットワークの状態を安定領域にマッピングする機構を提案する。
- 本研究では，整数・分数次数のリアプノフ安定性を基盤とした新しい防御フレームワークを提示した。
- 提案手法は，既存の防御技術と組み合わせることで，累積的なロバスト性を実現可能である。
- 標準的なベンチマークおよび様々な敵対的攻撃シナリオにおいて，最先端の手法を大幅に上回る性能を示した。
Link: https://arxiv.org/abs/2603.12557
エージェントドリフト：LLMエージェントにおけるツール汚染による安全性の低下 - ランク付け指標では隠蔽される [cs.DB, cs.CL, cs.AI]目的：LLMエージェントにおけるツール汚染に伴う安全性低下の評価
- LLMエージェントは，金融等の重要な分野で多岐にわたる助言を行うようになっている。
- 既存の評価指標は推奨の質を測るのみで，安全性は考慮されていない。
- ツール汚染がLLMエージェントの安全性に与える影響を明らかにすること。
- 推奨品質は概ね維持されるにもかかわらず，汚染されたツール出力により，リスクの高い商品が65～93％のターンで出現した。
- 安全性に関する問題は主に情報チャネルに起因し，最初のターンで発生し，23ステップの対話を通して自己修正されない。
- 安全性にペナルティを加えたNDCG（sNDCG）を用いることで評価ギャップが可視化され，推奨品質の維持率が低下した。
Link: https://arxiv.org/abs/2603.12564
クramer距離における分布ベルマン作用子の再検討 [cs.LG]目的：分布ベルマン作用子の構造的解析
- 強化学習において，期待値だけでなく分布全体を扱うことで，よりロバストな学習が可能になる。
- 既存の研究は収縮性に着目しており，ベルマン更新が分布に与える構造的な影響の解明が不足している。
- CDFレベルでのベルマン更新の作用を解析し，その構造を明確にすることを目的とする。
- ベルマン更新はCDFに対してアフィンに，CDFの差分に対して線形に作用することが示された。
- 収縮性は，この線形作用に対する一様な上限を与える。
- CDFレベルの幾何構造を正確に共役する正則化されたスペクトルヒルベルト表現が構築された。
Link: https://arxiv.org/abs/2603.12576
遅延はより良い：異種特徴のマルチ粒度遅延相互作用のためのフレームワーク [cs.IR, cs.LG]目的：異種特徴の相互作用におけるマルチ粒度遅延の有効性
- CTR予測は広告やレコメンデーションにおいて重要な役割を担うため，その精度向上は不可欠である。
- 従来のCTRモデルは特徴量の異質性を考慮せず，ノイズの混入や表現学習の阻害といった課題があった。
- 情報量の多い特徴から段階的に学習することで，CTR予測のロバスト性を向上させることを目指す。
- 提案手法MGDINは，特徴量を情報密度に応じてグルーピングし，段階的に相互作用させることで，より効果的な学習を実現した。
- MGDINは，情報量の少ない特徴を初期層でマスクし，ネットワークが深くなるにつれて徐々に解放することで，ノイズの影響を抑制した。
- 実験結果から，MGDINが従来のモデルと比較してCTR予測性能において優れていることが示された。
Link: https://arxiv.org/abs/2603.12586
CA-HFP：曲率を考慮した異種連合プルーニングとモデル再構成 [cs.LG, cs.AI]目的：異種エッジデバイスにおけるパーソナライズされた圧縮
- エッジデバイスの性能限界から，効率的な学習手法が求められている
- デバイス間の異質性とデータ非独立同分布が学習のボトルネックとなる
- デバイス固有のプルーニングによる計算量削減と汎化性能維持
- CA-HFPは，曲率に基づく重要度スコアで各クライアントのプルーニングを誘導し，軽量な再構成でグローバルパラメータ空間にマッピングする。
- 理論的な収束性解析により，データ異質性やプルーニングの影響を考慮した損失関数に基づくプルーニング基準を導出。
- FMNIST，CIFAR-10，CIFAR-100の実験により，計算・通信コストを削減しつつ，既存手法を上回る精度を達成。
Link: https://arxiv.org/abs/2603.12591
公共交通路線の早期枝刈り [cs.DS, cs.AI, cs.RO]目的：公共交通路線の経路探索における効率向上
- 都市交通における経路探索は，利便性向上と交通量最適化に不可欠である。
- 大規模ネットワークでは，乗り換え候補の探索に時間がかかり，性能が低下する。
- 乗り換え探索の効率化により，より多くの選択肢を提供し，最適な経路を迅速に見つける。
- 本研究で提案する早期枝刈り手法は，既存の経路探索アルゴリズムに容易に組み込むことができる。
- スイスとロンドンの交通ネットワークを用いた実験により，最大57%のクエリ時間短縮が確認された。
- この手法は，より広範な乗り換え範囲と多様な移動手段の組み込みを可能にし，公共交通利用促進に貢献する。
Link: https://arxiv.org/abs/2603.12592
対照学習における漸増情報エントロピーの最大化 [cs.LG]目的：対照学習における表現学習の性能向上
- 自己教師あり学習はラベルなしデータから有効な表現を獲得可能であり，画像認識等の分野で重要である。
- 既存の対照学習は，静的なデータ拡張や厳格な不変性制約に課題があり，十分な性能を発揮できない場合がある。
- データ拡張間のエントロピー増分を明示的に最適化することで，よりロバストな表現学習を目指す。
- 提案手法IE-CLは，データ拡張間のエントロピーを最大化しつつ，意味的な一貫性を維持するフレームワークである。
- IE-CLは，CIFAR-10/100, STL-10, ImageNet等のデータセットで，小規模バッチ設定下において既存手法を上回る性能を示した。
- 提案手法のコアモジュールは既存のフレームワークに容易に組み込むことが可能であり，汎用性が高い。
Link: https://arxiv.org/abs/2603.12594
人間のフィードバックを用いたパーソナライズされた強化学習のためのスワップ誘導型嗜好学習 [cs.LG, cs.AI]目的：パーソナライズされた強化学習における嗜好学習
- AIシステムの価値観を人間に合致させる研究は重要であり，特に大規模なAIシステムにおいては不可欠である。
- 従来のRLHFは普遍的な報酬を仮定するため，多様な嗜好に対応できず，パーソナライズが困難であるという課題がある。
- 本研究は，ユーザー固有の嗜好を反映したモデルを構築し，パーソナライズされた強化学習を実現することを目指す。
- 提案手法SPLは，Variational Preference Learning (VPL)が抱える事後崩壊の問題を軽減できることを示した。
- SPLは，ユーザー固有の潜在変数を豊かにし，嗜好予測の精度向上に貢献する。
- スワップ誘導型正則化，Preferential Inverse Autoregressive Flow (P-IAF)，適応型潜在的条件付けが，その効果に寄与する。
Link: https://arxiv.org/abs/2603.12595
幅を最適化し，深さを優先しない：方策最適化のための合意集約 [cs.LG, cs.AI]目的：方策最適化における合意集約手法
- 強化学習は，複雑な環境下で最適な行動を学習する上で重要な役割を果たす。
- 方策最適化において，学習の安定性と効率性が課題となっている。
- 方策の更新における無駄を削減し，効率的な学習を実現することを目指す。
- 提案手法CAPOは，PPOレプリケートを合意形成することで，サンプル効率を大幅に向上させる。
- 特に，自然パラメータ空間での集約は，KLペナルティ付き代理損失を改善し，信頼領域の制約をより厳密に守る。
- 連続制御タスクにおいて，CAPOはPPOやより深いベースラインと比較して，最大8.6倍の性能向上を示す。
Link: https://arxiv.org/abs/2603.12596
ファインマン：スケーラブルなビジュアルデザインのための知識注入型図解エージェント [cs.LG, cs.AI, cs.HC, cs.MA, cs.SE]目的：スケーラブルなビジュアルデザインのための図解生成パイプライン
- 近年，最先端のマルチモーダルAIシステムにおける視覚デザインの重要性が増している。
- インターネット上には画像やテキストデータは豊富だが，知識が豊富で整合性の高い画像-テキストペアは少ない。
- 高品質な図解とキャプションを低コストかつ短時間で生成する。
- エージェントファインマンにより，10万組以上の整合性の高い図解-キャプションペアのデータセットを合成した。
- 新しく生成されたデータから，ビジョン-言語モデルの視覚的推論能力を評価するためのベンチマークDiagrammaを構築した。
- データセット，ベンチマーク，およびエージェントパイプライン全体をオープンソースプロジェクトとして公開予定である。
Link: https://arxiv.org/abs/2603.12597
否定の習得：グループ化された対立学習によるグラウンディングモデルの性能向上 [cs.CV, cs.AI]目的：否定表現に対する視覚言語モデルの性能向上
- 視覚言語タスクにおいて，自然言語の理解は不可欠であり，その精度が性能を左右する。
- 既存モデルは肯定的な意味合いのプロンプトに偏っており，否定表現の解釈が苦手である。
- 否定表現を考慮した学習データと学習手法により，モデルのロバスト性と精度を向上させる。
- 新しいデータセットD-Negationを構築し，肯定的な記述と否定的な記述の両方を提供した。
- グループ化された対立学習フレームワークを提案し，限定されたサンプルから否定表現を学習させた。
- わずか10%未満のパラメータを調整するだけで，mAPが最大4.4，5.7ポイント向上した。
Link: https://arxiv.org/abs/2603.12606
CarPLAN：状況適応型かつロバストな計画立案 - 動的シーン認識による自動運転 [cs.RO, cs.AI]目的：自動運転における，状況に適応し，ロバストな計画立案手法
- 自動運転技術は，移動の効率化と安全性向上に不可欠であり，社会実装が期待されている。
- 模倣学習はデータ効率が良いが，複雑な運転状況への適応性とロバスト性に課題がある。
- 本研究は，状況認識能力を向上させ，多様な交通状況に対応できる計画立案を目指す。
- 提案手法CarPLANは，nuPlanベンチマークにおいて，閉ループシミュレーション指標で最先端の性能を達成した。
- 特に，複雑な運転条件下での性能が向上し，Test14-Hardなどの困難なシナリオでその有効性が確認された。
- Waymaxベンチマークにおける実験からも，異なるベンチマーク設定への汎化能力が示された。
Link: https://arxiv.org/abs/2603.12607
FastDSAC：高次元ヒューマノイド制御における最大エントロピー強化学習の可能性の解き放ち [cs.IR, cs.HC, cs.LG, cs.AI]目的：高次元ヒューマノイド制御における最大エントロピー強化学習の有効性
- ヒューマノイド制御は，ロボット工学における重要な課題であり，複雑な動作を実現する鍵となる。
- 高次元の行動空間における探索の非効率性と学習の不安定性が，強化学習の適用を妨げる。
- 最大エントロピー強化学習の潜在能力を引き出し，高次元制御における性能向上を目指す。
- 次元ごとのエントロピー変調（DEM）により，探索予算を動的に再配分し，多様性を確保。
- 連続分布型批判器を用いることで，価値の正確性を維持し，高次元における過大評価を抑制。
- HumanoidBench等での評価で，確率的方策が決定論的方策と同等以上の性能を発揮し，特にBasketballとBalance Hardで大幅な改善が見られた。
Link: https://arxiv.org/abs/2603.12612
文学的物語を道徳的探求として：AIの倫理的推論と拒否行動を評価するためのクロスシステムフレームワーク [cs.CY, cs.AI, cs.CL, cs.HC]目的：AIの倫理的推論能力の評価
- AIの社会実装が進む中で，倫理的な問題への対応能力が不可欠となっている。
- 既存のAI倫理評価は，表面的な応答の正しさに偏重し，真の道徳的推論能力を測れていない。
- 文学的物語を用いて，AIの道徳的判断の深さを探求し，倫理的推論の妥当性を評価する。
- 既存のAI評価フレームワークでは，表面的な倫理的応答の正確性のみが検証されている。
- 文学的物語（解決不能な倫理的シナリオ）を用いることで，AIの倫理的推論能力をより深く評価できることが示された。
- AIの性能向上に伴い，この評価手法はより識別力を増し，倫理的判断のギャップを明確に測定可能となる。
Link: https://arxiv.org/abs/2603.12615
ドラフトの進化：推測デコーディングとオンライン学習 [cs.LG, cs.AI]目的：大規模言語モデル推論の高速化
- 言語モデルの規模拡大に伴い，推論速度がボトルネックになっている。
- 推測デコーディングでは，軽量なドラフトモデルの能力不足が課題となっている。
- ドラフトモデルへのフィードバックを活用し，継続的な進化を目指す。
- 推測デコーディングにおける検証フィードバックは，ドラフトモデルとターゲットモデルの乖離を定量化する。
- OnlineSpecは，このフィードバックをオンライン学習で活用する統一的なフレームワークである。
- 提案手法は，7つのベンチマークと3つの基盤モデルで最大24%の高速化を達成した。
Link: https://arxiv.org/abs/2603.12617
比較観察のためのプロキシモデリングによる人間とAIの協調自律実験 [cs.LG]目的：比較観察のための，材料特性評価，合成，機能特性などの多次元制御パラメータにおける迅速な戦略的探索
- 材料開発において，効率的な探索は重要であり，従来法では時間とコストがかかる。
- 高次元な実験データから目的関数を定義する際，誤差やノイズの影響を受けやすい。
- 人間とAIの協調により，物理的特徴を考慮した効率的な探索を目指す。
- 提案手法は，従来のデータ駆動型探索と比較して，専門家による制御が向上した。
- 人間とAIの連携により，材料空間の探索を加速し，有意義な知見を得ることが可能となった。
- プロキシモデルによるベイズ最適化において，人間の判断を反映することで探索性能が向上した。
Link: https://arxiv.org/abs/2603.12618
VLM4Rec：大規模ビジョン言語モデルによるレコメンデーションのためのマルチモーダル意味表現 [cs.IR, cs.AI, cs.CV]目的：レコメンデーションにおけるマルチモーダル意味表現の構築
- ユーザーの嗜好をより良くモデル化するため，テキストと視覚情報を組み合わせるマルチモーダルレコメンデーションの重要性が増している。
- 従来のマルチモーダルレコメンデーションは特徴量の融合に焦点を当てがちで，嗜好との関連性を考慮した意味空間でのアイテム表現が課題であった。
- 大規模ビジョン言語モデルを活用し，アイテムの視覚的特徴を意味的に理解することで，レコメンデーションの精度向上を目指す。
- VLM4Recは，アイテム画像を自然言語による説明に変換することで，アイテムの意味表現を構築する。
- このフレームワークは，直接的な特徴量融合ではなく，意味的なアライメントを重視することで，レコメンデーションのパフォーマンスを向上させる。
- 複数のマルチモーダルレコメンデーションデータセットにおいて，既存手法と比較して優れた結果を示し，表現の質が融合の複雑さよりも重要であることを示唆している。
Link: https://arxiv.org/abs/2603.12625
予算を抑え，より良い推論を：LLMエージェントのための予算を考慮した価値木探索 [cs.MA, cs.HC, cs.LG, cs.AI]目的：LLMエージェントにおける，予算を意識した価値木探索手法
- LLMの信頼性向上には，推論時の計算資源の活用が重要である。特に，限られたリソースでの効率的な問題解決が求められる。
- 既存手法では，計算資源を浪費したり，途中で頓挫したりする可能性がある。きめ細かい介入が難しいという課題がある。
- 本研究では，LLM単体で実行時の予算内で効率的に推論を進めるための枠組みを提案し，リソースの有効活用を目指す。
- 提案手法BAVTは，ステップごとの価値推定に基づき，動的な探索木を構築する。
- 残リソース比をノード値のスケール指数として利用することで，探索の幅を調整し，予算に応じた最適な探索を実現する。
- 実験結果から，BAVTは既存手法と比較して，少ない予算でも高い性能を発揮することが示された。
Link: https://arxiv.org/abs/2603.12634
複雑な非線形動力系におけるデータとモデル融合のための適応拡散事後サンプリング [cs.LG, nlin.CD, physics.flu-dyn]目的：複雑な非線形動力系のデータとモデル融合手法
- 高次元の複雑なシステムを理解するためには，効率的な数値シミュレーションが不可欠である。
- 従来の代理モデルは決定論的であり，カオス的なシステムの持つ固有の不確実性を捉えきれない。
- 拡散モデルを用いた確率的な予測により，高次元カオスシステムの長期予測とデータ同化を実現する。
- 深層学習拡散モデルを活用した代理モデルを開発し，長期間にわたる安定性を向上させた。
- 多スケールグラフトランスフォーマー構造により，複雑な形状への対応と拡散事前条件付けを可能にした。
- 動的に変化するセンサー配置におけるデータ同化を，モデルの再学習なしに実現した。
Link: https://arxiv.org/abs/2603.12635
LightMoE：エキスパート置換によるMoEの冗長性削減 [cs.LG, cs.AI]目的：MoEの冗長性削減による，メモリ効率，学習効率，モデル性能のバランス改善
- 大規模言語モデルの性能向上に不可欠なMoEモデルの効率的な活用が求められている。
- MoEモデルは多数のエキスパートモジュールを必要とし，メモリ消費量が課題となっている。
- 冗長なエキスパートを効率的に削減し，性能劣化を最小限に抑える手法が求められている。
- LightMoEは，パラメータ効率の良いモジュールで冗長なエキスパートを置換する「エキスパート置換」という新しい圧縮パラダイムを提案。
- LightMoEは，適応的なエキスパート選択，階層的なエキスパート構築，アニーリングリカバリー戦略を導入し，LoRAファインチューニングと同等の性能を30%の圧縮率で達成。
- 50%の圧縮率下でも，既存手法を上回り，5つの多様なタスクで平均5.6%の性能向上を実現した。
Link: https://arxiv.org/abs/2603.12645
LR-SGS：LiDARと反射率をガイドする顕著なガウススプラッティングによる自動運転シーン再構成 [cs.CL, cs.CV, cs.AI]目的：自動運転シーンの再構成と新規視点合成の性能向上
- 自動運転には周囲環境の正確な3次元把握が不可欠であり，高精度なシーン再構成技術が求められている。
- 既存手法では，LiDARとRGBの情報を十分に活用できておらず，悪条件下のシーン再構成性能が課題となっていた。
- LiDARの反射率情報とRGB情報を統合し，複雑な環境下でもロバストな再構成を実現することを目指す。
- 提案手法LR-SGSは，LiDARと反射率をガイドする顕著なガウススプラッティングを用いて，少ないガウス数と短い学習時間で優れた再構成性能を実現した。
- 特に，複雑な照明条件下において，既存手法であるOmniReを1.18dB PSNRで上回る性能を示した。
- 構造を意識した顕著なガウス表現と，LiDAR強度を反射率として活用する手法が，再構成性能の向上に貢献した。
Link: https://arxiv.org/abs/2603.12647
ソボレフ–リッチ曲率 [cs.RO, cs.LG]目的：グラフ上のリッチ曲率の新しい定義とその応用
- ネットワークの幾何構造解析において，リッチ曲率は重要な概念である。
- 既存のリッチ曲率の計算は，大規模ネットワークに対して計算コストが高い。
- ソボレフ輸送幾何に基づく効率的なリッチ曲率の計算方法を確立する。
- 提案手法（SRC）は，木構造上でOllivier-Ricci曲率と一致し，一貫性があることが示された。
- SRCは，Dirac極限において消失し，測度論的リッチ曲率の平坦なケースと整合する。
- SRCを用いたリッチフローやエッジ剪定により，グラフ変換と多様体構造の保持が可能となる。
Link: https://arxiv.org/abs/2603.12652
大規模言語モデルにおける継続学習：手法，課題，および機会 [cs.CL, cs.AI]目的：大規模言語モデルの継続学習に関する手法の包括的な概観
- 現代のLLMは静的な事前学習に依存しており，変化する知識への適応が困難である。
- LLMは学習データの変化や新しいタスクに直面すると，過去の知識を急速に忘却する
- LLMにおける知識の忘却を軽減し，継続的な学習を可能にする。
- 本調査では，継続的事前学習，継続的ファインチューニング，継続的アライメントの3段階でLLM向けに調整された継続学習手法を体系的に整理した。
- 既存手法は特定のドメインでは有望な結果を示すものの，多様なタスクや時間スケールでのシームレスな知識統合には課題が残る。
- LLMの適応に関する知識体系に貢献し，言語モデルの生涯学習における現状と将来の機会を構造的に理解するための枠組みを提供する。
Link: https://arxiv.org/abs/2603.12658
テキストから予測へ：時間的進化意味空間によるモダリティギャップの架橋 [cs.CL, cs.AI]目的：時系列予測におけるテキスト情報の活用
- イベント駆動型非定常性の問題解決に，テキスト情報が有効であるという期待が高まっている。
- テキスト記述は時間的影響を暗黙的・質的に表現する一方，予測モデルは明示的・定量的な信号を必要とする。
- テキストの意味を数値的な手がかりに変換する際の課題を克服し，予測精度を向上させる。
- TESSは，テキストから抽出した時間的素要素（平均シフト，ボラティリティ，形状，ラグ）を数値化し，モダリティ間のギャップを埋める。
- TESSは，既存手法が冗長なトークンに過剰に注目する問題を解決し，信頼性の高い意味変換を実現する。
- 4つの実データセットにおいて，最先端のベースラインと比較して，最大29%の予測誤差の削減が確認された。
Link: https://arxiv.org/abs/2603.12664
戦略的逆合成予測のための推論LLM：RetroReasoner [cs.RO, cs.LG, cs.AI]目的：戦略的逆合成予測
- 有機合成化学において，目的とする分子を合成するための出発物質を決定する重要な課題。
- 既存手法は，専門知識が必要で時間がかかる，または戦略的な推論が不足している。
- 逆合成戦略の明確化と，それに基づく適切な反応試薬の選択を支援する。
- RetroReasonerは，既存のベースラインモデルを上回り，より多様な反応試薬候補を生成する。
- SyntheticRetroフレームワークを用いることで，反応試薬予測と並んで，構造的な切断根拠を生成。
- ラウンドトリップ精度を報酬とする強化学習により，予測された反応試薬の妥当性を評価。
Link: https://arxiv.org/abs/2603.12666
マーカーを用いた骨材の3次元再構築：2次元および3次元形態の比較分析 [cs.CV, cs.AI, eess.IV]目的：骨材の形態的特性の定量化
- 建設材料の主要な構成要素であり，構造物やインフラの機能に不可欠であるため。
- 骨材の3次元形態を現場で正確に把握することが困難であるため。
- 低コストで高精度な3次元再構築手法を提供し，骨材の品質管理を容易にすること。
- 提案手法は，マーカーを用いることで背景除去，点群の連結，スケール参照を可能にし，高品質な骨材モデルの再構築を実現した。
- 2次元と3次元の形態的特性を比較した結果，統計量に有意な差異が認められた。
- 本手法により，手軽かつ低コストで骨材の3次元形状情報を取得し，検査やデータ収集，形態分析を促進できる。
Link: https://arxiv.org/abs/2603.12667
視覚検証強化によるVLM融合：効率的な視覚推論のために [cs.CV, cs.LG]目的：多様な視覚言語モデル(VLM)の融合による視覚推論性能の向上
- 近年，VLMの重要性が増しており，その性能向上は様々な応用分野において不可欠である。
- 複数のVLMを組み合わせる際，どのモデルを選択・融合すべきかという課題が存在する。
- VLMの視覚的特徴量に着目し，多様性を活用することで，よりロバストな推論を目指す。
- 提案手法V3Fusionは，VLM間の視覚的特徴量の不一致を利用し，多様な視覚的特徴を捉えることに成功した。
- 遺伝的アルゴリズムにより，最適なVLMの組み合わせを効率的に特定し，推論性能を向上させた。
- MMMU，MMMU-Pro，A-OKVQA，OCR-VQAといったベンチマークにおいて，既存のVLMを上回る性能を達成した。
Link: https://arxiv.org/abs/2603.12669
パラメータ化された偏微分方程式を解くための，分離された潜在的動的多様体融合 [cs.NI, cs.LG]目的：パラメータ化された偏微分方程式の一般化性能と時間外挿性能の向上
- 偏微分方程式は自然科学や工学の様々な分野で現れるため，その数値解法の効率化は重要である。
- PDEパラメータの変化に対応した汎用的な学習や，学習範囲外の時間における予測が困難である。
- パラメータと時間の変動を分離し，潜在空間での動的進化をモデル化することで，これらの問題を解決する。
- 提案手法DLDMFは，空間，時間，パラメータを明示的に分離し，パラメータを潜在的埋め込みに直接マッピングする。
- DLDMFは，パラメータ変動と時間進化の干渉を低減し，滑らかで一貫性のある解多様体を維持する。
- 実験結果から，DLDMFは精度，パラメータ汎化性能，外挿ロバスト性において，既存手法を凌駕することが示された。
Link: https://arxiv.org/abs/2603.12676
MetaKE：双層最適化によるメタ学習に基づく知識編集アライメント [cs.CL, cs.AI]目的：大規模言語モデルにおける特定の知識の精密な修正
- 大規模言語モデルの能力向上には，既存知識の更新と修正が不可欠である。
- 従来の知識編集手法は，編集目標と実行可能性の乖離により，編集が失敗することがある。
- 編集目標を学習可能なメタパラメータとして最適化することで，アライメント問題を解決する。
- MetaKEは，知識編集を双層最適化問題として再構築する新しいフレームワークである。
- 構造的勾配プロキシにより，編集可能性の制約が編集目標の学習段階に伝播される。
- 実験結果から，MetaKEが既存手法を大きく上回り，知識編集の新たな視点を提供する。
Link: https://arxiv.org/abs/2603.12677
共謀LoRA: LLM安全アラインメントへの複合攻撃 [cs.CR, cs.LG]目的：LLMの安全アラインメントを損なう複合攻撃手法
- LLMの安全性確保は，その社会実装において不可欠であり，悪意ある利用を防ぐ上で重要である。
- 既存の防御システムは，LoRAモジュールの組み合わせを考慮しておらず，攻撃の組み合わせによる脆弱性が存在する。
- 本研究は，モジュール単体の検証を超え，組み合わせを考慮した防御システムの開発を目指す。
- CoLoRAは，個々のLoRAモジュールは無害に見えながら，組み合わせることで安全性が著しく低下する攻撃である。
- 特定のLoRAモジュール群を読み込むと，有害な要求に応じるようになり，従来のトリガーやプロンプトに依存しない。
- 複数のオープンウェイトLLMにおいて，CoLoRAは高い攻撃成功率を示し，モジュール型LLMサプライチェーンのセキュリティ強化の必要性を示唆する。
Link: https://arxiv.org/abs/2603.12681
ChatGPTモデルの自己収束性に関する実験的証拠 [cs.CL, cs.AI]目的：ChatGPTモデルの出力テキスト多様性の変化
- 大規模言語モデルは自然言語処理の発展に不可欠であり，その性能向上は様々な応用を可能とする。
- 再帰的な自己学習により，モデルが意味のない出力を生成する「モデル崩壊」が問題視されている。
- ChatGPTモデルのバージョンごとの出力テキストの類似性増加，すなわち自己収束現象の検証。
- 近年のChatGPTモデルは，多様なテキスト生成能力が低下していることが確認された。
- 温度パラメータを1に設定しても，出力テキストの多様性は改善されなかった。
- この現象は，学習データに含まれるLLM生成データの増加が影響している可能性が示唆された。
Link: https://arxiv.org/abs/2603.12683
連合階層的クラスタリングと最適なクラスタ数の自動選択 [cs.LG, cs.AI, cs.DC]目的：分散環境におけるデータ分布パターンの探索
- データ活用において，プライバシー保護と分散環境での分析が重要視されている。
- 既存手法はクラスタ数の事前知識を必要とし，現実的な不均衡データに対応できない。
- プライバシー保護下での情報制約下，ロバストかつ正確なクラスタリングを可能にする。
- 提案手法Fed-$k^*$-HCは，階層的クラスタリングを通じて最適なクラスタ数$k^*$を自動的に決定する。
- 各クライアントがマイクロサブクラスタを生成し，プロトタイプをサーバーへアップロードして階層的にマージする。
- 密度ベースのマージ設計により，多様なサイズのクラスタに対応し，適切な$k^*$を特定する。
Link: https://arxiv.org/abs/2603.12684
STRAP-ViT：ViTにおける敵対的パッチからの防御のための分離されたトークンとランダム化変換 [cs.RO, cs.CV, cs.LG]目的：敵対的パッチに対するVision Transformer（ViT）の防御機構
- 画像認識技術は，自動運転や医療診断など，多くの分野で重要な役割を担っている。
- ViTは敵対的パッチに対して脆弱であり，わずかなノイズで誤認識を引き起こす可能性がある。
- 敵対的パッチの影響を受けるトークンを分離し，ランダム変換を適用することで，堅牢性を向上させる。
- STRAP-ViTは，ViTアーキテクチャ内に組み込むことができ，追加の学習は不要である。
- 複数のViTモデルとデータセットにおいて，様々な敵対的攻撃に対して高い防御性能が確認された。
- STRAP-ViTは，既存の最先端技術と比較して，より優れたロバスト性を実現している。
Link: https://arxiv.org/abs/2603.12688