arXiv雑要約

AI - 2026/03/12 公開

FAR-Dex：少数ショットデータ拡張と適応残差ポリシー洗練による器用な操作 [cs.RO, cs.CY, cs.RO, cs.AI]目的：器用な操作におけるロバストかつ正確なアーム・ハンド協調
- ロボットにおける人間のような器用な操作の実現は長年の課題であり，その複雑さから実用化が遅れている。
- 高品質なデモンストレーションデータの不足と，高次元のアクション空間の複雑さが課題である。
- 少数ショットでのデータ拡張と残差学習により，データ効率と操作精度を向上させる。
- FAR-Dexは，シミュレーション環境で生成される多様な軌道データを利用し，ポリシー学習の基盤を構築する。
- 適応残差モジュールを導入することで，観測特徴と多段階軌道セグメントを組み合わせ，操作の精度とロバスト性を向上させる。
- シミュレーションおよび実環境実験において，既存手法と比較してデータ品質が13.4%向上し，タスク成功率が7%向上した。
Link: https://arxiv.org/abs/2603.10451
擁壁の時空間変形予測：マルチ解像度ConvLSTMスタッキングアンサンブルによる誤差蓄積の軽減 [cs.LG]目的：擁壁変形の時空間予測手法
- 土木構造物の安全確保は重要であり，地盤変形の予測精度向上が不可欠である。
- 長期的な変形予測において，誤差が蓄積し予測精度が低下する課題がある。
- マルチ解像度データを用いることで，誤差蓄積を抑制し予測精度を向上させる。
- 提案手法は，数値シミュレーションと実測データ両方において，単独のConvLSTMモデルよりも優れた予測性能を示した。
- 特に長期にわたる多段階予測において，誤差の伝播を軽減し，汎化性能を向上させる効果が確認された。
- 異なる時間分解能のデータを組み合わせるアンサンブル戦略が，AIを活用した土質予測の安定性と精度向上に貢献する可能性が示唆された。
Link: https://arxiv.org/abs/2603.10453
多様なNavier-Stokes方程式のマルチタスク学習のための統一的PINNフレームワーク [cs.CV, cs.AI]目的：多様なNavier-Stokes方程式のマルチタスク学習
- 流体現象の予測精度向上は，工学設計や科学研究において不可欠である。
- 従来のPINNは単一流れに特化しており，複数流れの同時解析には課題が残る。
- 異なる流れの物理法則の共有と個別特徴の抽出，負の転移の抑制，学習の安定化を目指す。
- UniPINNは，共有・特化構造，クロスフローアテンション機構，動的重み配分戦略を統合した。
- ３種類の流れ場実験で，UniPINNは優れた予測精度とバランスの取れた性能を示した。
- 異種流れ場間における負の転移を効果的に軽減することに成功した。
Link: https://arxiv.org/abs/2603.10466
ニュース推薦のためのユーザー興味の段階的進化のモデリング [cs.IR, cs.AI]目的：ユーザー興味の段階的進化のモデリング
- パーソナライズされたニュース推薦は，ユーザーの興味が常に変化するため重要である。
- 既存手法は静的な相互作用グラフに依存しており，長期的な嗜好と短期的な興味の変化を捉えきれない。
- 長期・短期の両方の興味を捉え，より適切なニュース推薦を実現すること。
- 提案手法は，グローバルな長期嗜好とローカルな短期動向を統合的に学習する。
- LSTMと自己注意機構を用いて，短期的な興味の漸進的な進化と長距離的な時間的依存関係をモデル化する。
- 大規模データセットでの実験により，提案手法が既存手法を上回り，より新鮮で関連性の高い推薦を実現することが示された。
Link: https://arxiv.org/abs/2603.10471
検索者の選好に合わせた大規模言語モデルの調整 [cs.CL, cs.AI]目的：検索者の選好に合致した大規模言語モデルの構築
- 検索エンジンは情報探索の基盤であり，その性能向上が重要である。
- 多様なユーザーニーズに対応しつつ，安全性と信頼性を確保することが課題である。
- ノイズのある検索結果への耐性，ユーザー選好との整合性を高めることを目指す。
- SearchLLMは，オープンエンドな生成検索に対応した初のLLMである。
- 階層的・多次元の報酬システムにより，事実に基づいた回答，品質，形式の遵守に加え，ノイズへの耐性やユーザーニーズとの整合性を最適化する。
- RedNoteへの導入とA/Bテストの結果，Valid Consumption Rateが1.03%向上，Re-search Rateが2.81%減少した。
Link: https://arxiv.org/abs/2603.10473
筋相乗性事前知識が予測性筋骨格歩行シミュレーションの生体力学的忠実性を向上させる [cs.LG, cs.NE, cs.RO]目的：予測性筋骨格歩行シミュレーションにおける生体力学的忠実性の向上
- 歩行は高次元の神経筋制御によるものであり，シミュレーションは困難である。リアルな歩行再現が求められている。
- 既存のシミュレーションでは，生理学的に不自然な関節運動や力の発生が見られることがある。
- 筋相乗性という神経生理学的な構造を組み込むことで，シミュレーションの精度と汎化性能を高める。
- 筋相乗性を制約することで，生理学的に不自然な膝の運動を抑制し，膝関節モーメントを実験範囲内に維持することができた。
- シミュレーションで得られた垂直方向の地面反力は，人間の測定値と高い相関を示し，筋肉の活動タイミングも個人差の範囲内に収まった。
- 実験データが限られた状況でも，神経生理学的な構造を強化学習に組み込むことで，歩行シミュレーションの精度と汎化性能を向上させることが示された。
Link: https://arxiv.org/abs/2603.10474
交渉の学習：LLMにおける集団的価値観の一致のためのマルチエージェント熟慮 [cs.CL, cs.AI]目的：大規模言語モデルにおける集団的価値観の一致
- LLMの性能向上は重要だが，価値観の整合性は未解決の課題である。
- 複数主体の状況下では，対立する価値観が生じやすく，交渉能力が求められる。
- 対立する価値観を持つLLM間の交渉を通じて，価値観の一致と紛争解決能力の向上を目指す。
- 提案手法により，単一エージェントベースラインと同等の集団的価値観への適合性を達成した。
- さらに，一般的な言語能力を損なうことなく，紛争解決性能を大幅に向上させた。
- 交渉主導型の熟慮訓練は，価値観の対立シナリオにおける集団的意思決定を支援するLLM開発への実用的な道を提供する。
Link: https://arxiv.org/abs/2603.10476
本質次元推定のための普遍的最近傍探索器 [cs.CL, cs.LG]目的：データの本質次元の推定
- 機械学習や画像処理において，高次元データの自由度を理解する上で重要である。
- 既存手法は幾何学的・分布的仮定に依存し，仮定が満たされない場合，性能が著しく低下する。
- 分布に依存しない普遍的な本質次元推定手法を開発し，その有効性を検証すること。
- 本研究では，最近傍距離比に基づく新しい本質次元推定器を提案した。
- 提案手法は計算が単純でありながら，最先端の結果を達成している。
- 理論解析により，提案推定器がデータの生成分布に依存せず真の本質次元に収束することが証明された。
Link: https://arxiv.org/abs/2603.10493
VERI-DPO：主張検証と直接選好最適化による臨床要約の根拠に基づいたアライメント [cs.CL, cs.LG]目的：臨床要約における根拠に基づいたアライメントの実現
- 医療現場では，患者情報に基づいた正確かつ有用な要約が不可欠である。
- 既存のLLMによる臨床要約では，根拠のない記述や情報の省略が課題となっている。
- 主張検証とDPOを活用し，要約の忠実性と品質向上を目指す。
- VERI-DPOは，主張検証を用いて選好を抽出し，DPOによって要約モデルを蒸留する。
- 検証器を用いて主張と根拠のペアを評価し，矛盾を考慮した選好ペアを生成する。
- 検証器で抽出された選好によって，矛盾の少ない候補を選び，根拠のない主張の割合を大幅に削減した。
Link: https://arxiv.org/abs/2603.10494
新たなテンソルネットワーク：管状テンソルトレインとその応用 [cs.CY, math.NA, cs.LG, cs.NA]目的：管状テンソルトレイン分解によるテンソル表現
- ビッグデータ解析において，高次元データの効率的な表現が重要である。
- 既存のテンソル分解手法では，データサイズ増加に伴い計算コストが増大する。
- 本研究は，高次元データの効率的な表現と計算コスト削減を目指す。
- 管状テンソルトレイン（TTT）分解を提案し，T-SVDとテンソルトレイン（TT）の利点を組み合わせた。
- TTTは，管状ランクが限定される場合，モード数に対して線形にスケールするストレージコストを実現する。
- 画像圧縮，動画圧縮，テンソル補完，ハイパースペクトル画像処理への応用を示し，実用的な性能を確認した。
Link: https://arxiv.org/abs/2603.10503
生成AIの能力の無防備な露出がディープフェイク検出を損なう [cs.CR, cs.AI, cs.CV]目的：生成AIの能力の露出とディープフェイク検出の脆弱性
- AI技術の進化は社会に大きな変革をもたらす一方，悪用のリスクも伴う。
- ディープフェイク技術の巧妙化により，検出が困難になっている。
- 生成AIが持つ能力を悪用したディープフェイクの検出回避手法を解明する。
- 生成AIの推論能力と画像改良能力が，ディープフェイク検出を容易に回避しうることを示した。
- 生成AIが示す「信頼性」の基準を悪用することで，高画質で検出を回避したディープフェイクを生成できた。
- 商用チャットボットサービスは，そのリアリズムと操作性から，より大きなセキュリティリスクをもたらす。
Link: https://arxiv.org/abs/2603.10504
リソース制約下のAmazonsチェス決定フレームワーク：大規模言語モデルとグラフ注意機構の統合 [cs.CL, cs.AI, cs.LG, cs.NE]目的：リソース制約環境下におけるゲームAIの意思決定性能向上
- AI技術は意思決定，戦略立案，適応学習の厳密なテストベッドを提供する。
- 従来の深層学習は，大規模データセットと計算資源を必要とするため，リソース制約環境下で課題となる。
- 本研究は，グラフベース学習と大規模言語モデルを統合し，リソース制約下での高性能AIを開発する。
- 提案フレームワークは，グラフ注意機構がLLMの出力ノイズを除去する構造フィルタとして機能することを示した。
- 10x10のAmazons盤面において，既存手法と比較して意思決定精度が15%～56%向上した。
- GPT-4o-miniを上回る勝率45.0%（N=30ノード），66.5%（N=50ノード）を達成し，汎用基盤モデルからの高性能ゲームAI進化の実現可能性を示した。
Link: https://arxiv.org/abs/2603.10512
IHチャレンジ：最先端LLMにおける指示階層を改善するための訓練データセット [cs.AI, cs.CL, cs.CR, cs.LG]目的：LLMにおける指示階層の訓練
- LLMの安全性の確保は重要であり，特に悪意のあるプロンプトへの対策が求められている。
- 指示の衝突時にLLMがどのように優先順位をつけるか（指示階層）の評価と訓練が困難である。
- LLMの指示階層のロバスト性を向上させ，安全性を高めることを目指す。
- IHチャレンジデータセットを用いてGPT-5-Miniをファインチューニングすることで，指示階層のロバスト性が平均+10.0%向上した。
- 有害な応答が6.6%から0.7%に減少し，一般的な安全性評価における有用性も向上した。
- 内部的な静的エージェント型プロンプトインジェクション評価において飽和し，能力の低下は最小限に抑えられた。
Link: https://arxiv.org/abs/2603.10521
非定常的老化下におけるバッテリー劣化予測のためのワールドモデル [cs.LG, cs.SY, eess.SY]目的：バッテリー劣化予測
- バッテリーは現代社会のエネルギー源として不可欠であり，その信頼性確保は重要である。
- 既存のデータ駆動型アプローチは，劣化ダイナミクスを時間的に伝播させる機構に乏しい。
- 将来のサイクルにおけるバッテリーの健全性(SOH)軌跡を予測するワールドモデルを構築すること。
- 反復的なロールアウトは，同じエンコーダーを用いた直接回帰と比較して，軌跡予測誤差を半分に削減した。
- SPM制約は，SOHと抵抗の関係が最も適用される劣化膝の予測を改善した。
- SPM制約は全体的な精度を変化させることなく，予測性能を向上させた。
Link: https://arxiv.org/abs/2603.10527
UAV-MARL：緊急性と動的な医療物資配送のためのマルチエージェント強化学習 [cs.LG, cs.AI]目的：緊急性の高い医療物資配送におけるUAV群の協調制御
- 災害時や資源不足時において，迅速かつ柔軟な医療物資輸送が重要視されている。
- UAV群の効果的な運用には，優先順位付けや資源配分，動的なスケジューリングが課題となる。
- 不確実な状況下でUAV群を効率的に制御し，医療物資の迅速な配送を可能にすること。
- 提案手法は，UAVが医療ニーズを把握しつつ，通信・位置情報の制約下で協調的に行動する。
- PPOを用いた実験により，非同期学習やActor-Critic法と比較して優れた協調性能が確認された。
- 本研究は，強化学習がUAVを活用した医療物流のスケーラビリティと適応性を高める可能性を示す。
Link: https://arxiv.org/abs/2603.10528
長さインフレーションへの対処：強化学習のためのグループ相対報酬リスケール [cs.HC, cs.LG, cs.CL]目的：強化学習における長さインフレーションの抑制
- 大規模言語モデルの能力向上に強化学習は不可欠だが，その応用には課題がある。
- 報酬最大化のために，モデルが冗長性や非効率な推論を用いる長さインフレーションが発生する。
- 汎用性と損失のない長さ制御を実現し，最適化のショートカットを防ぐことを目指す。
- 提案手法GR³は，長さ制御を乗法的リスケールとして捉え，汎用的なゲート機構を確立する。
- グループ相対正則化とアドバンテージ認識キャリブレーションにより，損失のない最適化を実現する。
- RLHFおよびRLVR設定において，GRPOと同等の性能を維持しつつ，長さインフレーションを大幅に抑制する。
Link: https://arxiv.org/abs/2603.10535
動的二値走査とリアルタイムSNN分類を備えたイベント駆動型電子皮膚システム [cs.NE]目的：イベント駆動型電子皮膚システムの開発
- ロボット工学やヒューマンコンピュータインタラクションにおいて，触覚センシングの重要性が高まっている。
- 従来の触覚センシングはデータ量が多く，処理負荷が高いという課題があった。
- イベント駆動型アプローチにより，データ量を削減し，効率的な触覚処理を実現する。
- 提案システムは，二値走査戦略によりスキャン回数を12.8倍削減し，データ圧縮率を38.2倍向上させた。
- スパースなデータストリームをFPGA上の畳み込みSNNで処理することで，CNNと比較して計算量と重みストレージを削減した。
- リアルタイム手書き数字認識において92.11%の高い分類精度を維持し，効率的な知覚パイプラインを実証した。
Link: https://arxiv.org/abs/2603.10537
人間らしいプロンプトによる評価：筋骨格CTセグメンテーションのためのファウンデーションモデルのモデル感受性評価 [cs.AR, cs.CV, cs.AI]目的：筋骨格CTセグメンテーションにおけるファウンデーションモデルの性能比較と最適モデルの特定
- 医療画像セグメンテーションは，診断や治療計画において不可欠であり，高精度な自動化技術が求められている。
- ファウンデーションモデルの数が増加する中で，データセットや評価指標の違いにより，モデル間の直接比較が困難になっている。
- 臨床タスクに適したモデルを選択するための指針を提供し，人間の判断に左右されないロバストなモデルを評価する。
- ファウンデーションモデルのセグメンテーション性能は，モデルやプロンプト戦略によって大きく変動することが示された。
- 2DではSAM，SAM2.1，3DではnnInteractive，Med-SAM2がパレート最適モデルとして特定された。
- 人間のプロンプトを用いることでセグメンテーション性能が低下し，参照ラベルからの理想的なプロンプトによる性能評価が過大評価される可能性があることが示唆された。
Link: https://arxiv.org/abs/2603.10541
SCORE：層の積み重ねを収縮的再帰的深さで置き換える [cs.LG, cs.AI]目的：深層ニューラルネットワークにおける層の積み重ねに代わる離散的再帰的アプローチ
- 深層学習は，画像認識や自然言語処理など，様々な分野で目覚ましい成果を上げている。
- 深層ネットワークの学習は，勾配消失や爆発といった問題に直面しやすく，最適化が困難になりやすい。
- 本研究は，層の積み重ねに代わる新しいアーキテクチャを提案し，学習の安定性と効率性を向上させることを目指す。
- SCOREは，従来の層の積み重ねとは異なり，単一の共有ニューラルブロックを反復的に適用することで深さを実現する。
- 実験の結果，SCOREはグラフニューラルネットワーク，多層パーセプトロン，Transformerベースの言語モデルなど，様々なアーキテクチャにおいて，収束速度を向上させ，学習を高速化することが示された。
- SCOREは，重みを共有することでパラメータ数を削減し，軽量かつ効果的な深層ネットワークの構築を可能にする。
Link: https://arxiv.org/abs/2603.10544
強化学習によるクラスタスケジューラの重み調整 [cs.LG]目的：クラスタスケジューラにおける重み調整手法
- 大規模クラスタの効率的な資源配分は，クラスタ利用率とジョブ性能を向上させる上で重要である。
- 従来の重み付けは均一的であり，ワークロード特性を考慮しないため，最適とは言えない場合がある。
- 強化学習を用いて，ワークロードに適応した最適な重み付けを自動的に学習することを目指す。
- 提案手法は，固定重みと比較して平均で33％，ベースラインと比較して12％性能が向上した。
- パーセンテージ改善報酬，フレームスタッキング，ドメイン情報の制限により，多段階パラメータ調整と汎化性能を高めた。
- 様々なワークロードとクラスタ構成で学習を行い，未知の環境下でも良好な結果が得られた。
Link: https://arxiv.org/abs/2603.10545
アクティブ赤外線サーモグラフィーにおける視覚・テキスト情報を用いた認知欠陥解析 [cs.CL, cs.CV, cs.AI, eess.SP]目的：アクティブ赤外線サーモグラフィーと視覚言語モデルを用いた炭素繊維強化プラスチックの認知欠陥解析手法
- 炭素繊維強化プラスチックの非破壊検査は，航空宇宙産業等で重要であり，高精度な欠陥検出が求められる。
- AIを用いた検査には大量の学習データが必要であり，データ収集に時間とコストがかかるという課題がある。
- 事前学習済みの視覚言語モデルを活用し，学習データなしでの欠陥検出と局在化を目指す。
- 提案手法では，赤外線サーモグラフィーと視覚言語モデルを組み合わせることで，学習データなしでの欠陥検出を実現した。
- 赤外線サーモグラフィーと視覚言語モデル間のドメインギャップを埋めるAIRT-VLMアダプターを導入し，欠陥の視認性を向上させた。
- 実験結果から，AIRT-VLMアダプターは従来の次元削減手法と比較して10dB以上のS/N比向上を達成し，IoU値70%の欠陥検出を可能にした。
Link: https://arxiv.org/abs/2603.10549
米中クロスマーケットのリターン予測に対する二部グラフアプローチ [cs.LG, q-fin.CP]目的：米中クロスマーケットのリターン予測
- グローバル化が進む中，国際的な資産間の連動性を理解することは投資戦略上重要である。
- 既存の研究では，クロスマーケット予測の経済構造を十分に考慮したモデルが不足している。
- 二部グラフを用いて，米中株式市場間の構造的な依存関係を捉え，予測精度向上を目指す。
- 米国の終値リターンは中国の始値リターンを予測する上で重要な情報源となることが示された。
- 中国の終値リターンから米国の始値リターンを予測する効果は限定的であるという方向性非対称性が確認された。
- 構造化された機械学習フレームワークは，クロスマーケットの依存関係を可解釈的に捉える上で有効である。
Link: https://arxiv.org/abs/2603.10559
MI-BCIデータ拡張のためのリーマン幾何学を保存する変分オートエンコーダ [cs.LG]目的：運動イメージ脳コンピュータインタフェースのための合成脳波共分散行列の生成
- 脳波を用いたブレインコンピュータインタフェースは，運動機能障害を持つ人々の生活の質を向上させる可能性を秘めている。
- 運動イメージ脳波データの不足は，高性能なブレインコンピュータインタフェースの開発における重要な課題である。
- 本研究は，脳波データの幾何学的構造を保持しつつ，高品質な合成データを生成する手法を確立することを目的とする。
- 提案手法であるRGP-VAEは，有効かつ代表的な脳波共分散行列を生成することが確認された。
- RGP-VAEは，被験者不変な潜在空間を学習し，信号のプライバシー保護やデータ拡張への応用が期待される。
- 生成された合成データはMI-BCIにおいて実用性があり，分類器との組み合わせによって効果が変化することが示された。
Link: https://arxiv.org/abs/2603.10563
報酬不要な自己微調整エージェントによる適応型RANスライシング制御 [cs.AI, cs.NI]目的：動的なRANスライシング制御における，効率性，品質，安定性の多目的最適化
- ネットワークの自律化・適応化は，通信システムの性能向上に不可欠である。
- 生成AIモデルの連続制御への応用には，文脈長の制限や報酬信号の欠如が課題となる。
- エージェントが自身の経験をパラメータに組み込むことで，報酬なしでの連続制御を実現する。
- 提案手法は，標準的な強化学習や既存のLLMベースエージェントよりもサンプル効率，安定性，多目的最適化において優れた性能を示す。
- 自己改善型の生成エージェントが，連続制御タスクにおいて潜在能力を発揮することが示された。
- 本研究は，将来のAIネイティブなネットワークインフラの実現に向けた道を拓く。
Link: https://arxiv.org/abs/2603.10564
Transformerにおける暗黙的な統計的推論：文脈内での尤度比検定の近似 [cs.CL, cs.RO, cs.LG]目的：Transformerにおける文脈内学習の統計的基盤の解明
- Transformerは自然言語処理の分野で目覚ましい成果を上げており，その応用範囲は広い。
- 文脈内学習のメカニズムは未だ解明されておらず，モデルの内部動作がブラックボックス化している。
- 文脈内学習における統計的推論の過程を明確にし，モデルの意思決定メカニズムを理解すること。
- Transformerは，文脈からベイズ最適統計量をある単調変換を経て近似することが示された。
- 線形タスクでは投票様アンサンブル，非線形タスクではより深い逐次計算を用いることが明らかになった。
- 文脈内学習は単純な類似度マッチングではなく，タスク適応型統計的推定器の構築から生じると示唆された。
Link: https://arxiv.org/abs/2603.10573
CUAAudit：自律的なコンピュータ利用エージェントの監査としてのビジョン言語モデルのメタ評価 [cs.AI, cs.HC]目的：自律的なコンピュータ利用エージェントのタスク完了の評価
- 人間とコンピュータのインタラクションが進化し，エージェントによる自律的なタスク実行の重要性が増している。
- 既存の評価方法は脆く，コストがかかり，現実世界の利用状況と一致しない問題がある。
- ビジョン言語モデルを監査員として利用し，エージェントのタスク完了を評価する新たなアプローチを検証する。
- 最先端のビジョン言語モデルは高い精度と校正性能を示す一方，複雑な環境下では性能が低下する。
- モデル間の判断の不一致が認められ，現在のモデルベースの監査アプローチの限界が明らかになった。
- 現実世界での自律的なコンピュータ利用エージェントの展開において，評価者の信頼性，不確実性，ばらつきを考慮する必要がある。
Link: https://arxiv.org/abs/2603.10577
HAPEns：表形式データに対するハードウェアを意識した事後アンサンブル [cs.LG]目的：表形式データにおける予測性能とハードウェア効率のバランス
- 機械学習において，予測精度向上のためにアンサンブル学習が広く用いられている。
- アンサンブル規模が大きくなると，ハードウェアへの負荷が増大するという課題がある。
- 予測性能とリソース消費のトレードオフを最適化するアンサンブル手法を提案する。
- HAPEnsは，83個の表形式分類データセットにおいて，既存手法と比較して優れた性能を示す。
- 特に，予測性能とデプロイメントコストのバランスにおいて，HAPEnsは優位性を示す。
- メモリ使用量が，リソース効率の重要な指標であることが明らかになった。
Link: https://arxiv.org/abs/2603.10582
LLMのAlignmentは本当に多様性を必要とするか？倫理的推論のためのRLVR手法適応に関する実証研究 [cs.AI, cs.CL, cs.LG]目的：LLMのAlignmentにおける多様性の必要性に関する実証的検証
- LLMのAlignmentは，安全性や倫理性を担保する上で不可欠であり，その手法開発が重要視されている。
- 既存のAlignment手法では，多様な正解が存在する倫理的推論のようなタスクへの適用が課題となっていた。
- 本研究は，倫理的推論タスクにおいて，多様性重視のアプローチが有効かを検証し，Alignment手法の改善を目指す。
- 分布マッチング手法は，Alignmentタスクにおいて，報酬最大化手法と比較して有意な優位性を示さなかった。
- 倫理的推論は，数学的推論と比較して，高報酬応答の分布がより集中していることが示された。
- Alignmentタスクは，必ずしも多様性を保持するアルゴリズムを必要とせず，標準的な報酬最大化RLVR手法でも効果的に対応可能である。
Link: https://arxiv.org/abs/2603.10588
勾配フロー漂流：KDE近似ダイバージェンスのWasserstein勾配フローによる生成モデリング [cs.LG, cs.AI]目的：生成モデリングの新しい枠組み
- 生成モデルは，複雑なデータ分布を学習し，新たなサンプルを生成する上で重要である。
- 既存の生成モデルは，モード崩壊やぼやけといった課題を抱えている場合がある。
- KDE近似を用いたWasserstein勾配フローにより，これらの課題を克服し，より安定した生成を可能にすること。
- 本研究では，Drifting ModelとKDE近似下でのKLダイバージェンスのWasserstein勾配フローの等価性が数学的に証明された。
- この枠組みは，MMDベースの生成器を含む，より広範な生成モデルを包含する。
- 逆KLダイバージェンスとカイ二乗ダイバージェンスを組み合わせることで，モード崩壊とモードぼやけを同時に回避する戦略が提案された。
Link: https://arxiv.org/abs/2603.10592
予測に基づく復元：可変長軌跡予測のための漸進的逆学習 [cs.RO, cs.AI]目的：可変長軌跡予測における予測精度向上
- 自動運転の安全性向上には，周囲の状況を正確に予測する能力が不可欠である。
- 既存手法は固定長データに最適化されており，現実の不完全なデータへの対応が課題である。
- 不完全な軌跡データから，漸進的に完全な軌跡を復元することで予測精度を向上させる。
- 提案手法PRFは，過去の情報を段階的に活用することで，不完全な軌跡からの予測精度を高める。
- RDMとRPMから構成される逆学習ユニットをカスケード接続し，特徴量の整合性を高めている。
- Argoverse 2およびArgoverse 1データセットでの実験により，PRFの有効性が実証された。
Link: https://arxiv.org/abs/2603.10597
JAXにおける自己スケーリング・ブロイデン準ニュートン法群 [cs.MS, cs.LG]目的：JAXにおける自己スケーリング・ブロイデン準ニュートン法群の実装
- 機械学習の効率的な最適化は，大規模モデルの学習に不可欠である。
- 既存の最適化手法は，問題によっては収束が遅い，または不安定になる場合がある。
- JAXコミュニティがこれらの最適化手法を容易に利用できるようにすること。
- JAXとOptimistixライブラリに適合した，BFGS，DFP，Broyden法およびその自己スケーリング変種の実装を提示する。
- 強Wolfe条件を満たすZoomラインサーチも実装されている。
- 本実装は新規な貢献を主張する研究論文ではなく，JAXコミュニティへの貢献を目的とした技術的なドキュメントである。
Link: https://arxiv.org/abs/2603.10599
軌跡情報に基づく記憶生成による自己改善型エージェントシステム [cs.AI, cs.DB, cs.IR]目的：エージェントの実行経験からの学習と将来のパフォーマンス向上
- LLM搭載エージェントの普及に伴い，自律的な学習と改善が重要課題となっている。
- 既存のエージェントは，非効率なパターンを繰り返したり，過去の成功戦略を活かせなかったりする。
- 実行軌跡から学習を抽出し，文脈に応じた記憶検索を通じてエージェントの改善を目指す。
- 提案手法は，エージェントの推論パターンを解析し，成功・失敗・非効率な決定要因を特定する。
- 抽出された学習内容は，戦略，回復，最適化の３種類のガイダンスとして生成され，適切なタイミングでエージェントに提供される。
- AppWorldベンチマークにおいて，タスク完了率が最大14.3%向上し，特に複雑なタスクで顕著な効果が確認された。
Link: https://arxiv.org/abs/2603.10600
条件付き期待報酬を用いた強化学習 [cs.LG, cs.AI, cs.CL]目的：大規模言語モデルの推論能力向上
- 大規模言語モデルの推論能力は，様々な分野での応用において重要である。
- 従来のRLVRは，ドメイン固有の検証規則に依存するため，汎用性に欠ける。
- CERは，言語モデル自身を検証器として利用し，汎用的な推論タスクに対応する。
- CERは，参照回答を条件とした生成回答の尤度期待値として定義され，ソフトな報酬信号を提供する。
- 実験結果から，CERは数学と一般的な推論タスクの両方で有効であることが示された。
- CERは，柔軟かつ一般的な検証メカニズムとして機能する。
Link: https://arxiv.org/abs/2603.10624
ニューラルネットワークにおけるアクティブパスを用いたバックドアの検出と除去：侵入検知への応用 [cs.CL, cs.CR, cs.AI, cs.LG]目的：ニューラルネットワークのバックドア検出と除去
- 機械学習の安全性確保は重要であり，悪意のある改ざんからシステムを保護する必要がある。
- バックドア攻撃は検知が難しく，正常な入力データに潜んで影響を及ぼす可能性がある。
- アクティブパスを利用し，バックドアトリガーを特定・除去することで安全性を向上させる。
- 本研究では，ニューラルネットワークの活性パスに基づき，バックドアトリガーの検出と除去を可能にする新しい手法を提案した。
- 提案手法は，侵入検知用機械学習モデルにバックドアを埋め込む実験により有効性が確認された。
- このアプローチは，バックドアの仕組みを説明可能であり，より信頼性の高いシステム構築に貢献する。
Link: https://arxiv.org/abs/2603.10641
シンボリック時空間動作抽象の漸進的学習によるスケジューリングと動作計画の相互運用 [cs.RO, cs.AI]目的：マルチオブジェクトナビゲーションにおけるスケジューリングと動作計画問題の解決
- ロボットの自律的な動作計画において，高レベルなタスクと低レベルな動作計画の統合が不可欠である。
- 既存手法では，リソース，時間，動作の制約下でタスクを安全かつ効率的に実行する際の課題が残されている。
- スケジューラーと動作計画器を連携させ，動作可能な計画を効率的に生成する手法を開発する。
- 提案手法は，既存のスケジューラーと動作計画器を組み合わせ，漸進的学習ループを通じて計画を生成する。
- 動作計画器からの空間的衝突や時間調整に関するシンボリックなフィードバックが，スケジューラーの計画改善に貢献する。
- 物流やジョブショップのベンチマークテストにおいて，複雑な時空間制約下でも有効な計画生成が可能であることが示された。
Link: https://arxiv.org/abs/2603.10651
ビデオ推論モデルは外に出る準備ができているか [cs.CV, cs.AI]目的：現実環境におけるビデオ推論モデルの頑健性向上
- 現実世界の応用では，天候や遮蔽などの影響が避けられないため，モデルの頑健性が重要である。
- 既存のモデルは，現実世界のノイズに対する頑健性が低く，評価環境との乖離が見られる。
- 本研究は，空間時間的な摂動下での一貫性報酬をモデル化することで，モデルの頑健性を高めることを目指す。
- 提案手法ROVAは，モデルの能力に応じてサンプル難易度を再評価し，頑健性を考慮した一貫性報酬を用いることで，性能低下を効果的に抑制する。
- PVRBench，UrbanVideo，VisBenchなどのベンチマークにおいて，既存モデルは現実的な摂動下で最大35%の精度低下を示すのに対し，ROVAは24%以上の精度向上を達成する。
- ROVAによる性能向上は，クリーンなベンチマークにも一貫して見られ，汎用性も確認された。
Link: https://arxiv.org/abs/2603.10652
FAME：ニューラルネットワークに対する形式的な抽象的最小限の説明 [cs.RO, cs.AI, cs.LG]目的：ニューラルネットワークの説明の形式化と最小化
- AIの信頼性向上には，モデルの意思決定根拠を説明可能にすることが不可欠である。
- 既存の説明手法は，大規模ネットワークへの適用が困難であったり，説明が冗長になりやすい。
- 大規模ネットワークでも効率的に最小限の説明を生成し，説明の信頼性を保証すること。
- FAMEは，抽象解釈に基づき，従来のVERIX+よりも説明サイズと実行時間において優れていることが示された。
- 専用の摂動領域設計により，探索順序に依存せず，効率的に説明を縮小することが可能となった。
- 最悪の場合における抽象的最小限の説明と真の最小限の説明との距離を測定する評価手法が提案された。
Link: https://arxiv.org/abs/2603.10661
時空間注意グラフニューラルネットワーク：注意による因果関係の説明 [cs.IR, cs.RO, cs.LG, cs.CE]目的：産業制御システムにおける異常検知のための時空間注意グラフニューラルネットワーク
- 重要インフラを支える産業制御システムは，サイバー攻撃の標的となりやすい。
- 機械学習による異常検知は理論上有効だが，説明不足や誤検知が多い点が課題。
- システムの時系列変化と関係性を考慮し，説明可能な異常検知を目指す。
- 提案手法は，センサー，コントローラー，ネットワークをノードとする動的グラフ構造を学習する。
- 注意メカニズムにより，異常検知の根拠となる関係性を可視化し，因果関係の推測を支援する。
- 共形予測を用いることで，誤検知率の抑制と環境変化への対応を実現した。
Link: https://arxiv.org/abs/2603.10676
自己進化型深層臨床研究による臨床医の認知の模倣 [cs.AI, cs.CL]目的：臨床診断における認知過程の模倣
- 医療現場における正確かつ効率的な診断は，患者の予後を大きく左右するため，極めて重要である。
- 既存のAIシステムは，診断を静的な予測として扱う傾向があり，臨床医の動的な知識獲得や改善のプロセスを反映していない。
- 本研究は，AIシステムが臨床経験を自律的に学習し，診断精度を継続的に向上させるための枠組みを構築する。
- 開発されたDxEvolveは，MIMIC-CDMベンチマークにおいて，ベースラインモデルと比較して平均11.2%の診断精度向上を達成した。
- 読者調査サブセットにおいては，90.4%の精度で，臨床医の基準（88.8%）に匹敵する結果が得られた。
- 独立した外部データセットでも，10.2%（元のデータセットに含まれるカテゴリー）および17.1%（含まれないカテゴリー）の精度向上を示した。
Link: https://arxiv.org/abs/2603.10677
パラメトリック Shallow Recurrent Decoder Network を用いた核融合の代理モデル：磁気流体力学への応用 [cs.LG]目的：核融合システムにおける磁気流体力学状態再構成のためのデータ駆動型フレームワーク
- 核融合炉設計・運転において磁気流体力学は重要であり，プラズマ閉じ込めやエネルギー変換に不可欠である。
- 磁気流体力学モデルの数値解法は計算コストが高く，リアルタイム制御や多角的な解析が困難である。
- 本研究は，計算コストを削減し，リアルタイムな状態推定を可能にする代理モデルの構築を目指す。
- SHREDは，訓練データに含まれない磁場強度に対しても，高い精度で磁気流体力学状態を再構成できることが示された。
- 特異値分解（SVD）による次元削減とSHREDを組み合わせることで，効率的な代理モデル化が可能になった。
- ３つの温度センサーからの計測値のみを入力として，速度，圧力，温度の全場を再構成できることが確認された。
Link: https://arxiv.org/abs/2603.10678
プラットフォームに依存しないマルチモーダルデジタルヒューマンモデリングフレームワーク：ゲームベースのインタラクションにおける神経生理学的センシング [cs.HC, cs.AI]目的：プラットフォームに依存しないデジタルヒューマンモデリングフレームワーク
- AI，ウェアラブル生体センシング技術の進展が，アクセシビリティやインクルージョン研究を促進している。
- 既存のAIを活用したDHMアプローチは，特定のプラットフォームに依存し，再現性や倫理的再利用が課題である。
- センシング，インタラクションモデリング，推論準備を分離し，AI対応のマルチモーダル相互作用研究を支援する。
- OpenBCI Galeaヘッドセットを統合し，EEG，EMG，EOG，PPG，慣性データなど多様な神経生理学的データを同時収集可能である。
- 計算タスクプリミティブとタイムスタンプ付きイベントマーカーを使用し，異種センサーとプラットフォーム間の一貫性を保ったデータアライメントを実現した。
- 本フレームワークは，アクセシビリティ指向のインタラクションデザインや適応システム研究など，AIを活用したDHMとHCI研究のインフラとして活用できる。
Link: https://arxiv.org/abs/2603.10680
コントラクトと征服：ブラックボックスモデルに対する敵対的サンプルを確実に計算する方法 [cs.LG, cs.AI]目的：深層ニューラルネットワークに対する敵対的サンプルの確実な計算
- 深層学習モデルの信頼性評価は，セキュリティや安全性確保において重要である。
- 既存手法では，敵対的サンプルの存在が保証されず，探索に時間がかかる場合がある。
- ブラックボックスモデルに対し，効率的に敵対的サンプルを確実に生成する手法を開発する。
- 提案手法「コントラクトと征服」は，蒸留データセットの拡張と探索空間の精密な収縮に基づいている。
- この手法は，固定された反復回数内でブラックボックスモデルに対する敵対的サンプルを生成することを保証する。
- ImageNetデータセットを用いた実験で，既存の最先端手法を上回る性能を示した。
Link: https://arxiv.org/abs/2603.10689
クロスサイロ連合学習における検証可能な集約のための，バックドアの再利用：一時的な内在的証明 [cs.CR, cs.AI]目的：クロスサイロ連合学習における集約の完全性保証
- 連合学習は分散データを活用するが，データの機密性・完全性の確保が重要。
- 既存の検証可能集約は計算コストが高く，大規模モデルへの適用が困難。
- 内在的証明を利用し，軽量かつスケーラブルな集約の完全性保証を実現。
- 悪意のあるサーバーによる更新の改ざん・削除を高精度に検出可能。
- ResNet-18において，従来の暗号化ベースラインと比較して1000倍以上の高速化を達成。
- クライアントの匿名性を保ちつつ，信頼された第三者なしで信号衝突を防止。
Link: https://arxiv.org/abs/2603.10692
RandMark：視覚基盤モデルのランダムウォーターマーキングについて [cs.CV, cs.AI]目的：視覚基盤モデルの所有権検証
- 大規模データで学習されるため，多様な画像処理タスクで高性能を発揮する。
- データ収集と学習コストが高く，モデルの不正利用を防ぐ仕組みが課題である。
- モデルの所有権を検証し，知的財産権を保護する手法を開発すること。
- 提案手法では，内部表現にデジタルウォーターマークを埋め込み，所有権を検証する。
- ランダムな埋め込みにより，機能コピーでの検出が可能であり，誤検出率も低い。
- 理論的および実験的に，非ウォーターマークモデルの誤検出率と，ウォーターマークモデルの誤認識率が低いことを示す。
Link: https://arxiv.org/abs/2603.10695
EvoSchema：スキーマ進化に対するテキストSQL変換の堅牢性に向けて [cs.DB, cs.AI, cs.CL, cs.LG]目的：テキストSQL変換システムのスキーマ進化に対する堅牢性の評価と向上
- データベースは要件変化に対応するため頻繁にスキーマが進化する。システムの安定運用に不可欠な課題である。
- 既存研究では，スキーマ進化の影響を十分に評価・制御する方法が不足しており，複雑なスキーマ変更に対応できない。
- 本研究では，スキーマ進化の現実的な影響を評価し，より堅牢なテキストSQL変換システムの設計を支援する。
- EvoSchemaは，カラムレベルとテーブルレベルの10種類のスキーマ変更を網羅する新たな分類法を導入し，データベーススキーマの動的な性質をシミュレートする。
- 評価の結果，テーブルレベルの変更がモデル性能に与える影響は，カラムレベルの変更よりも大きいことが明らかになった。
- EvoSchemaで学習させたモデルは，同一の質問に対してスキーマの違いを識別し，誤ったパターン学習を抑制することで，高い堅牢性を示す。
Link: https://arxiv.org/abs/2603.10697
エージェントによる検索オーケストレーションのためのメモリ層としての構造化リンクトデータ [cs.IR, cs.AI]目的：構造化リンクトデータを用いた検索精度の向上
- 知識獲得において，知識グラフが持つ構造化メタデータと関連性の活用が重要視されている。
- 従来の検索拡張生成（RAG）システムは，ドキュメントを構造化せずに扱うため，情報の潜在能力を最大限に引き出せていない。
- 構造化リンクトデータによって検索精度と回答品質を向上させ，エージェント型RAGシステムの性能を高めることを目指す。
- Schema.orgマークアップのみでは改善効果は限定的であったが，エージェント向けに最適化されたエンティティページ形式が大幅な精度向上を実現した。
- 標準的なRAGにおいて29.6%，エージェント型RAGパイプラインにおいては29.8%の精度向上が確認された。
- ナビゲーション機能が強化されたEnhanced+形式は最高スコアを達成したが，基本的な強化形式からの有意な差は見られなかった。
Link: https://arxiv.org/abs/2603.10700
AlphaFlowTSE：条件付きAlphaFlowによるワンステップターゲット話者分離 [cs.SD, cs.AI]目的：マルチ話者混合音からのターゲット音声復元
- 音響環境下での音声処理技術の重要性が増しており，特に複数の話者の音声を分離する技術が求められている。
- 既存手法では，音声分離に複数ステップの処理が必要となり，リアルタイム処理が困難となる場合がある。
- 本研究は，ワンステップで高精度なターゲット話者分離を実現し，リアルタイム処理の実現を目指す。
- 提案手法AlphaFlowTSEは，Jacobian-vector product (JVP)を用いないAlphaFlow目的関数を用いて学習することで，ワンステップでのターゲット音声生成を可能にした。
- 混合比予測などの補助的な処理を排除し，混合音からターゲット音声への軌跡に沿った平均速度輸送を学習することで，訓練の安定化を実現した。
- Libri2MixとREAL-Tを用いた実験により，AlphaFlowTSEがターゲット話者との類似性を向上させ，実際の混合音に対する汎化性能を示すことが確認された。
Link: https://arxiv.org/abs/2603.10701
音声アンチスプーフィングモデルの確率的検証 [cs.CL, cs.HC, cs.ET, cs.RO, cs.SY, eess.SY, cs.RO, cs.SD, cs.AI]目的：音声アンチスプーフィングモデルの頑健性評価
- 音声合成技術の高度化により，悪意のある利用のリスクが増大しているため，セキュリティ確保が重要である。
- 既存の検知手法は，形式的な頑健性の保証がなく，未知の生成技術への汎化性能が課題である。
- 未知の音声合成技術や入力変化に対する頑健性を検証する手法を確立することを目指す。
- 提案手法PV-VASMは，テキスト読み上げ（TTS），音声クローニング（VC）下での誤分類確率を推定する。
- モデルに依存せず，未知の合成技術や入力摂動に対する頑健性検証が可能である。
- 理論的な誤差確率の上限を導出し，多様な実験設定で有効性を実証した。
Link: https://arxiv.org/abs/2603.10713
多様体上の一段階生成のためのリーマン平均フロー [cs.RO, cs.RO, cs.LG]目的：多様体上での生成モデリングにおける一段階サンプリング手法
- 生成モデルは，現実世界の複雑なデータを扱う上で不可欠な技術である。
- 既存手法では，サンプリングに確率微分方程式の数値積分が必要であり，計算コストが高い。
- 多様体上の生成において，数値積分を回避し，効率的な一段階サンプリングを実現すること。
- 提案手法であるリーマン平均フロー(RMF)は，平均速度場を平行移動によって定義し，平均速度と瞬時速度を結びつける恒等式を導出した。
- RMFは，ログマップによる接空間表現を用いることで，軌跡シミュレーションや複雑な幾何学的計算を回避する。
- 球面，トーラス，SO(3)上での実験により，RMFが既存手法と同等以上の性能を持つことが示された。
Link: https://arxiv.org/abs/2603.10718
サンプルと探索：高次元学習拡張k-中央値クラスタリングのための効果的なアルゴリズム [cs.DS, cs.LG]目的：学習拡張k-中央値クラスタリングにおける計算効率の向上
- 機械学習とデータマイニングの発展に伴い，大規模データの効率的なクラスタリングが重要視されている。
- 従来のk-中央値クラスタリングは，高次元データにおいて計算コストが指数関数的に増加する課題を抱えている。
- 本研究では，効率的なサンプリング手法を用いたアルゴリズムを提案し，高次元データにおける計算コストの削減を目指す。
- 提案手法は，既存のアルゴリズムと比較して時間計算量を大幅に改善し，高次元空間への依存度を低減することを示した。
- 実験結果は，提案手法が実用上計算量を削減し，クラスタリングコストを低減できることを示唆している。
- 特に，エラーレートαを持つ予測器を用いた学習拡張k-中央値クラスタリングにおいて有効であることが確認された。
Link: https://arxiv.org/abs/2603.10721