arXiv雑要約

AI - 2026/03/13 公開

Bielik-Minitron-7B：構造化プルーニングと知識蒸留によるポーランド語向け大規模言語モデルの圧縮 [cs.CL, cs.AI]目的：ポーランド語に最適化された大規模言語モデルの圧縮手法
- 言語モデルは，自然言語処理の基盤技術であり，多様な応用を可能にする。
- 大規模言語モデルは計算コストが高く，リソースの限られた環境での利用が困難である。
- モデルの圧縮により，計算コストを削減し，幅広い環境での利用を促進する。
- Bielik-Minitron-7Bは，Bielik-11B-v3.0モデルを約33.4%圧縮し，7.35Bパラメータモデルを生成した。
- 構造化ハイブリッドプルーニングと知識蒸留を組み合わせることで，ベースラインモデルの約90%の性能を回復した。
- 推論速度は最大50%向上し，低リソース環境での効率的な言語モデル展開が可能となった。
Link: https://arxiv.org/abs/2603.11881
視聴しながら思考する：マルチターン動画推論のためのマルチモーダル大規模言語モデルにおけるオンラインストリーミングセグメントレベルの記憶 [cs.CV, cs.AI, cs.CL]目的：マルチターン動画推論のためのオンラインストリーミングセグメントレベル記憶の枠組み
- 動画理解の分野は，人間の知覚能力を模倣し，より高度なAIシステムの構築に不可欠である。
- 既存のストリーミング手法は，知覚と生成の同時実行が難しく，長期依存関係のモデリングが困難である。
- 連続的に到着する動画ストリームに対するマルチターンインタラクションを可能にするオンライン推論の強化。
- 提案手法「Think While Watching」は，セグメントレベルの記憶を保持することで，ストリーミング動画推論の性能を向上させる。
- StreamingBenchおよびOVO-Benchにおいて，シングルラウンドの精度がそれぞれ2.6％，3.79％向上した。
- マルチラウンド設定では，性能を維持しながら，出力トークン数を56％削減することに成功した。
Link: https://arxiv.org/abs/2603.11896
FlexRec：強化学習によるLLMベースのレコメンダーの柔軟なニーズへの適応 [cs.CG, cs.LG]目的：動的なニーズに対応したレコメンデーションを実現するための手法
- 多様なレコメンデーションのニーズに応えるためには，レコメンダーシステムの適応性が不可欠である。
- 従来のレコメンダーは単一の目標に最適化されており，動的なニーズへの対応が困難である。
- LLMの能力を活用し，複雑なレコメンデーション目標に沿ったレコメンダーを開発することを目指す。
- FlexRecは，候補アイテム間の反事実的なスワップに基づいて，因果的に根拠のあるアイテムレベルの報酬を導入することで，粗い信用割り当ての問題を解決する。
- また，報酬の不確実性を明示的にモデル化し，信頼度の低い報酬を抑制するクリティックガイド付きの不確実性認識スケーリングにより，学習の安定性を向上させる。
- 多様なレコメンデーションシナリオにおいて，FlexRecはNDCG@5を最大59％，Recall@5を最大109.4％向上させ，従来のレコメンダーやLLMベースのベースラインを上回る。
Link: https://arxiv.org/abs/2603.11901
複雑な介入下における最適圧縮を用いた因果表現学習 [eess.SY, cs.SY, cs.LG, stat.ME]目的：多治療法における個別の治療効果推定
- 医療や経済学など，様々な分野で個別の効果を予測することは重要である。
- 治療法の数が増えると，ハイパーパラメータ調整が困難になり，計算コストが増大する。
- 最適な重み付け戦略と効率的な計算手法を確立し，大規模介入シナリオに対応すること。
- 提案手法は，探索的なハイパーパラメータ調整を不要とし，理論的な保証に基づいた最適な重みを導出する。
- 治療法の集約戦略は，精度と計算効率の両面で優れており，大規模な介入にも対応可能である。
- 半合成データおよび画像データセットを用いた実験により，提案手法が既存モデルを凌駕することが示された。
Link: https://arxiv.org/abs/2603.11907
EnTransformer：多変量確率的予測のための深層生成Transformer [cs.LG, cs.AI, stat.ML]目的：多変量時系列予測における不確実性の定量化
- エネルギーシステムや交通ネットワークなど，様々な分野で重要な課題である。
- 既存手法は，複雑な結合予測分布の把握が難しく，パラメータ制約や分位点に基づく目的関数に依存する。
- Transformerの能力を活かし，パラメータを仮定せずに条件付き予測分布を直接学習する。
- EnTransformerは，様々な多変量確率的予測ベンチマークにおいて，既存モデルを上回る性能を示した。
- 提案手法は，長距離時間依存性とクロス系列間の相互作用を効果的にモデル化する。
- 生成される予測は，キャリブレーションが良く，信頼性の高い不確実性定量化を実現する。
Link: https://arxiv.org/abs/2603.11909
ユーザー提供の有害コンテンツに遭遇した場合のLLMの挙動に関する理解：無害なタスクにおいて [cs.CR, cs.AI]目的：LLMが，無害なタスク実行時にユーザー提供の有害なコンテンツに遭遇した場合の倫理的挙動
- LLMの利用拡大に伴い，人間の価値観との整合性が重要視されている。
- LLMは有害なタスクの実行拒否は行うものの，コンテンツレベルでの倫理的考慮が不足している。
- LLMが無害なタスクにおいても有害コンテンツを検出し，処理を拒否する能力を評価する。
- 現在のLLMは，GPT-5.2やGemini-3-Proを含む最新モデルでも，無害なタスクにおいて有害コンテンツの処理を継続することが多い。
- 「暴力/露骨」カテゴリの外部知識と「翻訳」タスクが，LLMから有害な応答を引き出す可能性が高い。
- 本研究は，LLMにおける見過ごされがちなコンテンツレベルの倫理的リスクを軽減するための安全対策強化を促す。
Link: https://arxiv.org/abs/2603.11914
化学反応理解のための4次元マルチモーダルLLM：Chem4DLLM [cs.NI, cs.LG, cs.CL]目的：化学反応の動的な理解
- 化学反応の理解は，物質科学の発展に不可欠である。
- 従来のモデルは静的な分子表現に依存し，化学反応の動的な側面を捉えきれていない。
- 分子軌跡から化学反応を説明する能力を向上させる。
- 本研究では，分子軌跡を自然言語で説明する新しいタスク「ChemDU」を提案した。
- そのためのデータセット「Chem4DBench」と，分子形状と回転を考慮するモデル「Chem4DLLM」を開発した。
- これらの成果は，動的な化学理解とマルチモーダル科学的推論の研究を促進することが期待される。
Link: https://arxiv.org/abs/2603.11924
MobileKernelBench：LLMはモバイルデバイス向けに効率的なカーネルを作成できるか？ [cs.LG, cs.AI]目的：モバイルデバイス向けカーネル生成の可能性の評価
- モバイルデバイスの性能向上は，計算負荷の高い処理を効率化することが不可欠である。
- モバイル環境特有の制約下でのカーネル最適化は，高度な専門知識と多大な労力を要する。
- LLMを活用することで，モバイルカーネル開発の自動化と効率化を目指す。
- 現在のLLMは，モバイルフレームワーク特有の複雑性とデータ不足により，コンパイルエラー率が高い。
- 提案手法MoKAは，リポジトリ情報を活用した推論と計画実行により，コンパイル成功率を大幅に向上させた。
- MoKAによって生成されたカーネルは，ネイティブライブラリと比較して最大27.4%の高速化を実現した。
Link: https://arxiv.org/abs/2603.11935
論文推薦における公平性学習：バイアス軽減と質最適化 [cs.AI]目的：論文推薦におけるバイアス軽減と質最適化の達成
- 学術分野において，多様性の確保は研究の進展と質の向上に不可欠である。
- 査読制度における潜在的なバイアスが，マイノリティグループの研究機会を阻害する問題がある。
- 公平性を考慮した推薦システムにより，多様な研究者の参加を促進し，公平な査読を実現すること。
- 提案手法Fair-PaperRecは，ACM SIGCHI，DIS，IUIのデータを用いて評価され，マイノリティグループの参加率が42.03%増加した。
- 全体的な有用性は3.16%向上し，多様性の促進が学術的な厳密性を損なわないことが示された。
- 交差的基準とカスタマイズされた公平性損失を用いることで，既存のヒューリスティックな手法よりも優れた結果が得られた。
Link: https://arxiv.org/abs/2603.11936
詳細構造化ラジオロジーレポートのためのプロトタイプに基づく知識ガイダンス [cs.AI, cs.CV, cs.LG]目的：詳細な構造化ラジオロジーレポート作成のための知識ガイダンス手法
- 迅速かつ一貫性のあるコミュニケーションが求められる医療現場において，構造化レポートの重要性が増している。
- 構造化された監督データが限られているため，詳細な所見や属性に関するモデルの自動化は困難である。
- 自由記述テキストから得られる知識を活用し，詳細な画像理解を支援することを目的とする。
- ProtoSRは，自由テキスト情報を構造化レポート作成に活用する新しいアプローチである。
- 大量のMIMIC-CXRデータから知識ベースを構築し，画像と質問のペアに対して関連するプロトタイプを検索する。
- Rad-ReStructベンチマークにおいて，ProtoSRは最先端の結果を達成し，特に詳細な属性に関する質問で顕著な改善が見られた。
Link: https://arxiv.org/abs/2603.11938
SNAP-V：小規模スパイクニューラルネットワーク向け設定可能なニューロモーフィック加速を備えたRISC-V SoC [cs.AR, cs.NE]目的：小規模スパイクニューラルネットワークの推論のためのRISC-VベースニューロモーフィックSoC
- エッジコンピューティングにおいて，低消費電力と計算効率からスパイクニューラルネットワークへの注目度が高まっている。
- 既存実装は，メモリ-プロセッサ間のボトルネックや，小規模なSNNアプリケーションには過剰な大規模ニューロモーフィックハードウェアの問題がある。
- 小規模SNNアプリケーションに適した，正確でエネルギー効率の高い推論を可能にするSoCを開発すること。
- 提案手法SNAP-Vは，Cerebra-SとCerebra-Hという2つのアクセラレータバリアントを統合し，小規模SNN推論に最適化されている。
- ソフトウェアとハードウェアの推論結果はほぼ一致し，平均精度偏差は2.62%であった。
- 45nm CMOS技術において，1回のシナプス操作あたり平均1.05pJのシナプスエネルギーを実現した。
Link: https://arxiv.org/abs/2603.11939
単一細胞基盤モデルの徹底的な回路マッピング：大規模な冗長性，重い尾を持つハブアーキテクチャ，および層依存性の分化制御 [cs.LG]目的：単一細胞基盤モデルにおける回路構造の解明
- 生物学的基盤モデルの解釈は重要であり，生命現象の理解に不可欠である。
- 既存の研究では，選択的な特徴抽出や相関分析に偏りが生じやすいという問題がある。
- 本研究は，徹底的な回路追跡により，これらの偏りを克服し，因果関係を明らかにすることを目指す。
- 徹底的な追跡により，選択的サンプリングの27倍にあたる139万以上の有意な下流エッジが明らかになった。
- ハブ分布に重い尾が見られ，上位20のハブの40%に生物学的注釈が付与されていないことが示された。
- 層の位置と分化方向性の間に因果関係があることが示され，層依存的な細胞状態制御の証拠が得られた。
Link: https://arxiv.org/abs/2603.11940
複数治療下における混合合成最近傍法による因果行列補完 [cs.LG]目的：複数治療下での因果行列補完手法
- 因果推論は，政策評価や意思決定において不可欠であり，データに基づいた客観的な判断を可能にする。
- 欠損メカニズムが欠損非ランダムである場合，既存の行列補完手法はバイアスを生じやすく，因果効果の推定が困難となる。
- データが限られた治療レベルにおいても，因果効果を正確に推定できる新たな手法を開発し，実用性を高める。
- 提案手法MSNNは，各治療レベルのデータを統合することで，有効サンプルサイズを拡大し，推定精度を向上させる。
- MSNNは，SNNと同等の有限サンプル誤差限界と漸近正規性を持つことが理論的に示された。
- シミュレーションと実データを用いた実験により，特にデータ不足の治療レベルにおいて，MSNNの有効性が確認された。
Link: https://arxiv.org/abs/2603.11942
効果的な抵抗再配線：オーバー・スクワッシュのための単純なトポロジー補正 [eess.SY, cs.SY, cs.LG, cs.AI]目的：グラフニューラルネットワークにおける情報伝播の改善
- グラフニューラルネットワークは，複雑な関係性を学習する強力なツールである。
- ネットワークが深くなるほど，情報が伝わりにくくなるオーバー・スクワッシュ問題が発生する。
- 効果的な抵抗再配線により，ボトルネックを解消し，長距離の依存関係を捉えることを目指す。
- 効果的な抵抗再配線は，グラフ構造を改善し，情報伝播を促進する。
- 再配線は，ノード間の抵抗値を指標とし，弱い接続を強化し，強い接続を維持することで，グラフの構造を最適化する。
- オーバー・スクワッシュとオーバー・スムージングのトレードオフが存在し，PairNormとの組み合わせが安定化に貢献する。
Link: https://arxiv.org/abs/2603.11944
ボロノイ分割による幾何学的意識を持つ確率回路 [cs.LG, cs.AI]目的：確率回路における幾何学的構造の組み込み
- データ解析において，データの背後にある幾何学的構造を捉えることは重要である。
- 従来の確率回路はデータに依存しない混合重みを用いるため，データの多様性を捉えきれない。
- ボロノイ分割を利用し，確率回路の推論精度と効率を向上させることを目指す。
- ボロノイ分割を確率回路に導入することで，幾何学的構造を考慮した推論が可能になる。
- 近似推論フレームワークと構造的条件を開発し，計算可能性と精度を両立した。
- ボロノイ分割の微分可能な緩和を導入し，勾配ベースの学習を実現した。
Link: https://arxiv.org/abs/2603.11946
遅延バックドア攻撃：事前学習済みモデルにおける新たな攻撃対象としての時間的側面 [cs.NI, cs.CR, cs.AI]目的：事前学習済みモデルに対する遅延バックドア攻撃の可能性と有効性に関する調査
- 事前学習済みモデルは，自然言語処理をはじめとする様々な分野で広く利用されており，その安全性確保は重要である。
- 既存のバックドア攻撃は即時性を前提としており，巧妙なトリガーの検出や防御が課題となっていた。
- 本研究は，時間的側面を悪用した新たなバックドア攻撃の可能性を示し，既存の防御策の限界を明らかにする。
- 提案手法DNDは，設定可能な閾値に達するまで活性化を遅延させ，制御された攻撃を可能にする。
- DNDは高い正解率（94％以上）を維持しつつ，活性化後の攻撃成功率がほぼ100％に達した。
- 本研究は，事前学習済みモデルにおける時間的側面が新たな攻撃対象となりうることを実証し，時間的側面を考慮した防御メカニズムの必要性を示唆する。
Link: https://arxiv.org/abs/2603.11949
言語情報に基づいた事前学習による転移可能なセンサーモデルの学習 [cs.AI, cs.LG]目的：多様なセンサー設定に対応可能な言語に整合した表現の学習
- 現代のセンシングシステムは大量の時系列データを生成しており，データ駆動型アプローチの重要性が増している。
- 既存の自己教師あり学習は，再構成や予測に最適化されている場合が多く，下流タスクに必要な意味構造を捉えられない。
- SLIPは，固定されたセンサー設定に依存せず，多様なセンサー設定で汎用性の高い表現を獲得することを目指す。
- SLIPは，コントラスト学習とセンサー条件付きキャプションを統合することで，識別的な理解と生成的な推論を可能にする。
- SLIPは，事前学習済みの言語モデルと柔軟なパッチ埋め込み器を利用し，追加の再学習なしに異なる時間分解能と可変長の入力をサポートする。
- 11のデータセットにおいて，ゼロショット転移，信号キャプション，質問応答において優れた性能を示し，線形プローブの精度は平均77.14%を達成した。
Link: https://arxiv.org/abs/2603.11950
表現学習における統計的識別可能性と構造的識別可能性 [cs.LG]目的：表現学習モデルの内部表現における統計的識別可能性と構造的識別可能性の解明
- 表現学習は，データから有用な特徴を自動的に抽出する技術であり，様々な応用分野で重要性が増している。
- 表現学習モデルの表現の安定性については研究が進んでいるものの，その安定性の本質的な性質の理解が十分ではない。
- 本研究では，表現の安定性を統計的識別可能性と構造的識別可能性の二つに分け，より厳密な定義と分析を目指す。
- 非線形デコーダを持つモデルにおいて，統計的近似識別可能性が成立することが証明された。これにより，GPTを含む幅広いモデルの中間表現に対する識別可能性が拡張される。
- 独立成分分析（ICA）を用いることで，近似識別可能性において残る線形的な曖昧性を解消できることが示された。
- データ生成過程に関する追加の仮定の下で，統計的識別可能性は構造的識別可能性に拡張され，潜在表現のICAを用いた簡単な解明レシピが導き出された。
Link: https://arxiv.org/abs/2603.11970
双方向クロスアテンションと時間的モデリングによるマルチモーダル感情認識 [cs.CV, cs.AI]目的：マルチモーダル感情認識のフレームワーク
- 感情認識は，人間とコンピュータの自然な対話を可能にする上で不可欠である。
- 現実世界の動画データでは，表情や姿勢の変化，ノイズなどが多く，感情認識が困難である。
- 視覚情報と聴覚情報を統合し，時間的な変化を考慮することで，よりロバストな感情認識を目指す。
- 提案手法は，視覚と聴覚の情報を双方向クロスアテンションで融合することで，それぞれの特徴を補完し，認識精度を向上させている。
- 大規模な事前学習モデル（CLIP, Wav2Vec 2.0）を活用し，動画の表情変化を時間的畳み込みネットワークでモデル化している。
- ABAW 10th EXPRベンチマークにおいて，単一のモダリティよりも高い性能が確認された。
Link: https://arxiv.org/abs/2603.11971
トポロジー的 DeepONets と Chen-Chen 作用素近似定理の一般化 [cs.LG, cs.NE, math.FA]目的：非線形作用素の近似
- 関数空間上の作用素近似は，機械学習や物理シミュレーション等に応用が期待される重要な分野である。
- 従来の作用素近似はBanach空間に限定され，より一般的な空間への拡張が課題となっていた。
- locally convex空間における連続作用素の近似を可能とし，理論的範囲を拡張すること。
- トポロジー的 DeepONets を構築し，Hausdorff locally convex 空間上の作用素近似を可能にした。
- 古典的な Chen-Chen 作用素近似定理を locally convex 空間に一般化することに成功した。
- branch-trunk 構造を用いた近似定理を Banach 空間の設定を超えて確立した。
Link: https://arxiv.org/abs/2603.11972
規範的共通基盤の複製（NormCoRe）：マルチエージェントAIにおける規範の研究のための翻訳による複製 [cs.AI]目的：マルチエージェントAIにおける規範の体系的な研究
- AIの社会実装が進む中で，公正性や倫理といった規範の理解と設計が不可欠となっている。
- 既存研究では，規範を人間の行動との同等性を前提とし，AIにおける規範形成のダイナミクスが十分に解明されていない。
- 本研究は，人間の実験デザインをAI環境に翻訳し，AIにおける規範形成の過程を詳細に分析する。
- NormCoReフレームワークにより，人間の実験をAI環境に再現し，規範の差異を定量的に示すことができた。
- AIエージェントの規範判断は，人間のベースラインと異なり，基盤モデルや言語表現に依存することが示された。
- 本研究は，AIにおける規範分析のための原則的な方法論を提供し，AIの設計・開発を支援する。
Link: https://arxiv.org/abs/2603.11974
HomeSafe-Bench：家庭環境における具現化されたエージェント向けに不安全な行動検出を行うビジョン言語モデルの評価 [cs.CV, cs.AI, cs.CR]目的：家庭環境における不安全な行動検出のためのビジョン言語モデルの性能評価
- 家庭用ロボットの導入が進む中で，安全性確保は重要な課題となっている。
- 既存の安全評価は静的なデータに限定され，家庭環境特有の動的な危険への対応が不十分である。
- 本研究は，家庭環境における不安全な行動検出のベンチマークと安全監視アーキテクチャを提案し，その課題解決を目指す。
- HomeSafe-Benchは，家庭環境における不安全な行動検出を評価するための新たなベンチマークとして構築された。
- HD-Guardは，リアルタイムな安全監視を実現する階層型ストリーミングアーキテクチャであり，低遅延性と高い検出精度を両立する。
- 現在のビジョン言語モデルに基づく安全検出におけるボトルネックが明らかになった。
Link: https://arxiv.org/abs/2603.11975
LABSHIELD：科学実験における安全性に関する推論と計画のマルチモーダルベンチマーク [cs.AI]目的：科学実験における安全性に関する推論と計画の評価
- AIによる科学自動化が進む中で，実験環境の安全性確保が重要課題となっている。
- 実験環境は危険を伴うため，AIエージェントの安全性評価が不十分である。
- 実験環境における危険識別と安全性を考慮した計画立案能力の評価を目指す。
- 本研究では，危険識別と安全性に関する推論を評価するベンチマーク「LABSHIELD」を提案した。
- 実験の結果，一般的な知識問題の正答率と，実験シナリオにおける安全性能の間には大きな乖離が認められた。
- 特に，危険の解釈と安全性を考慮した計画立案において，性能低下が顕著であった。
Link: https://arxiv.org/abs/2603.11987
マルチパス事前条件付きSGDの平均的安定性と有効次元 [cs.HC, cs.LG, math.OC, stat.ML]目的：マルチパス事前条件付き確率的勾配降下法（PSGD）の汎化性能と，母集団リスクの曲率，ノイズの幾何学，事前条件付けの関係
- 機械学習における最適化は，汎化性能に直接影響するため，その安定性と効率性が重要である。
- 母集団リスクの曲率と勾配ノイズの幾何学が一致しない場合，一方を改善すると他方を悪化させる可能性がある。
- PSGDの汎化性能を，これらの曲率源に依存する有効次元と結びつけることで，事前条件付けの適切な選択を導く。
- マルチパスSGDの平均的アルゴリズム安定性解析を新たに開発し，データ再利用による相関を考慮した過剰リスクの上界を導出した。
- 不適切な事前条件付けが，最適化と汎化の両方において，サブ最適な有効次元依存性を招くことを示した。
- 導出した上界に対し，インスタンス依存の下界を用いて整合性を示した。
Link: https://arxiv.org/abs/2603.11989
BTZSC：クロスエンコーダ，埋め込みモデル，再ランク付け器，LLM におけるゼロショットテキスト分類のベンチマーク [cs.CL, cs.AI, cs.LG, stat.ML]目的：ゼロショットテキスト分類における多様なモデルの性能比較
- テキスト分類は自然言語処理の基本的なタスクであり，様々な応用分野で重要である。
- 既存の評価は教師あり学習に依存する場合が多く，真のゼロショット性能を評価できていない。
- 多様なモデルのゼロショット性能を公平に比較するためのベンチマークを確立すること。
- 最新の再ランク付け器（Qwen3-Reranker-8Bなど）がマクロF1=0.72で新たな最先端性能を達成した。
- GTE-large-en-v1.5のような強力な埋め込みモデルは，高い精度と低遅延のトレードオフを提供する。
- 4～12Bパラメータの命令チューニング済みLLMは，特にトピック分類において競争力のある性能を示す。
Link: https://arxiv.org/abs/2603.11991
少数から多数へのパーソナライズされた連合学習 [cs.AI, cs.LG]目的：異種データ分布を持つクライアントに対するカスタマイズされたモデルの訓練
- データプライバシー保護と分散環境での機械学習ニーズの高まりから重要視されている。
- クライアントの目的の不均衡を調整する原理的なメカニズムが既存手法に欠けている。
- 少数モデルで多数クライアントを効率的に扱うための最適化手法を提案する。
- 本研究では，連合学習を少数から多数への最適化問題として再構築し，スケーラビリティを向上させた。
- 提案手法FedFewは，クライアントごとの最適なモデルに収束し，近似誤差が減少することを示した。
- 画像，自然言語処理，医療画像データセットでの実験により，FedFewが最先端手法を上回る性能を示すことが確認された。
Link: https://arxiv.org/abs/2603.11992
流動コンピューティングのための分散オーケストレーションアーキテクチャ：セキュアな分散型AIユースケース [cs.DC, cs.LG]目的：流動コンピューティング環境における，ドメインに依存しないマルチドメインオーケストレーションアーキテクチャ
- 分散AI/IoTの普及により，多様な計算資源を統合管理する重要性が高まっている。
- 既存のソリューションは中央集権型が多く，マルチドメイン環境での運用が課題となっている。
- ドメイン間の自律性を維持しつつ，意図に基づいた分散型デプロイメントを実現すること。
- 提案アーキテクチャは，ドメイン側の制御サービスを強化し，アプリケーションレベルでの機能向上を可能にする。
- 分散型連合学習（DFL）のユースケースにおいて，悪意のあるノードに対する耐性を高めるFU-HSTを導入した。
- シミュレーションにより，異常検知，DFL性能，およびオーバーヘッドの評価を行い，有効性を検証した。
Link: https://arxiv.org/abs/2603.12001
強化学習はLLMエージェントの汎化性能を向上させられるか：実証研究 [cs.AI]目的：LLMエージェントの汎化性能に関する実証的分析
- LLMエージェントは，複雑な意思決定タスクに応用可能であり，実世界での活用が期待されている。
- 既存研究では，学習環境とテスト環境が同一である場合が多く，未知環境での汎化性能が不明である。
- 環境の変化に対するLLMエージェントの汎化性能を評価し，改善策を検討すること。
- 強化学習によるファインチューニングは，同一環境内でのタスク難易度変化に対しては良好な汎化性能を示す。
- しかし，未知の環境への転移学習は弱く，意味的知識や入出力インターフェースの変化と相関がある。
- 複数環境での逐次学習は，上流の忘却を最小限に抑えつつ，下流タスクで有望な改善をもたらす。
Link: https://arxiv.org/abs/2603.12011
パラメータ的不確実性下における非線形確率的動的システムの深層学習に基づくメタモデリング [cs.LG]目的：非線形確率的動的システムのメタモデリング手法
- 自然災害時の構造物の挙動予測は重要であり，高次元かつ非線形なシステムでは計算コストが課題となる。
- 構造パラメータや外力荷重の不確実性を同時に考慮したモデルは少なく，予測誤差の評価も困難である。
- 深層学習を活用し，構造物の応答予測精度向上と，予測の信頼性評価を可能にすることを目指す。
- MLP-LSTMは低次元のBouc-Wenシステムにおいて最も精度の高い予測結果を示した。
- MPNN-LSTMとAE-LSTMは，より複雑な鋼構造フレームモデルにおいて優れた性能を発揮した。
- 予測分散と実際の誤差の間に一貫した相関関係が確認され，アクティブラーニング戦略への応用可能性が示唆された。
Link: https://arxiv.org/abs/2603.12012
Flowcean - サイバー物理システムのモデル学習 [cs.LG, cs.AI]目的：サイバー物理システムにおけるモデル生成の自動化
- サイバー物理システムは社会基盤を支える重要システムであり，その設計・運用には適切なモデルが不可欠である。
- 従来のモデル構築は複雑で時間も要するため，効率的なモデル生成手法が求められている。
- 機械学習を用いたデータ駆動型モデル生成により，効率的かつ柔軟なモデル構築を可能とする。
- Flowceanは，モジュール性と使いやすさに重点を置いた，データ駆動型学習によるモデル生成のための新しいフレームワークである。
- 多様な学習戦略，データ処理手法，評価指標を提供し，サイバー物理システムのモデリングタスクに特化した包括的なソリューションを提供する。
- 学習ライブラリやツールとの統合を容易にし，モデル生成と評価のプロセスを効率化することで，アクセシビリティを高める。
Link: https://arxiv.org/abs/2603.12015
協働の意図：デザイナーと新たな（知能型）テクノロジー間の代理関係について [cs.HC, cs.AI, cs.ET]目的：デザイナーと生成AIの協働における代理関係の存在
- デザイン領域において，AI技術の進化は創造性を拡張する可能性を秘めている。
- 生成AIは知識が欠如しており，デザイナーが十分な成果を得るには課題がある。
- デザイナーの創造的自律性を回復するための関係性構築が重要となる。
- LLMとデザイナーの間には代理関係が存在し，デザイナーが創造性を失う可能性があることが示された。
- デザイナーの創造的自律性の回復には，内省，技術理解，関係性の調整が不可欠である。
- 創造的プロセス，技術力，協働関係の３つの側面から，AIとの関わり方を考察する必要がある。
Link: https://arxiv.org/abs/2603.12018
水中ドッキングへの深層強化学習におけるシミュレーションから現実世界への適応 [cs.RO, cs.AI]目的：水中ドッキングにおける深層強化学習のシミュレーションから現実世界への適応手法
- 水中ロボットの自律制御は，危険な環境下での作業を可能にし，海洋探査やインフラ点検に不可欠である。
- シミュレーション環境で学習した強化学習モデルを現実世界に適用する際に，環境の差異により性能が低下する問題が存在する。
- 高精度なシミュレーション環境と現実世界のデータを用いて，シミュレーションから現実世界への性能劣化を抑制することを目指す。
- シミュレーション環境において，90%を超える成功率で自律ドッキングを達成した。
- 物理タンクでの実験により，シミュレーションから現実世界への適応の有効性が確認された。
- ピッチベースのブレーキやヨー振動といった，予期せぬ行動から機械的なアライメントを支援する効果が示された。
Link: https://arxiv.org/abs/2603.12020
XMLを活用：翻訳とラベル投影の同時実行の再検討 [cs.CL, cs.AI]目的：翻訳とラベル投影の同時実行によるクロスリンガル転移の改善
- 言語資源の少ない言語への知識転移は，自然言語処理のグローバル化に不可欠である。
- ラベル投影は，高資源言語の注釈データを低資源言語へ転移する際に，精度と効率が課題となる。
- 翻訳品質を損なうことなく，より効果的なラベル投影手法の開発を目指す。
- LabelPigeonは，XMLタグを用いて翻訳とラベル投影を同時に行うことで，既存手法よりも優れた性能を示す。
- 11言語の翻訳品質において改善が見られ，203言語での評価でも一貫した向上が確認された。
- NERを含む27言語の3つの下流タスクにおいて，最大で39.9ポイントのF1スコア改善が報告された。
Link: https://arxiv.org/abs/2603.12021
カスケード：複合AIシステムにおける敵対的脅威増幅のためのソフトウェア・ハードウェア攻撃ガジェットの合成 [cs.CR, cs.AI]目的：複合AIシステムの脆弱性評価と攻撃手法の体系化
- 生成AIの発展により，複数のLLMやソフトウェア，データベースが連携する複合AIシステムが増加している。
- 既存の研究はLLM特有のリスクに焦点を当て，従来のシステム脆弱性による影響が軽視されている。
- ソフトウェア・ハードウェア脆弱性とLLM攻撃の組み合わせによるシステム全体の脆弱性を明らかにする。
- ソフトウェアのコードインジェクション脆弱性とRowhammer攻撃を組み合わせることで，LLMへの脱獄プロンプトの注入が可能となった。
- 知識データベースの操作により，LLMエージェントからの機密情報漏洩を誘導できることが示された。
- 攻撃の目的別に脆弱性を分類し，攻撃ライフサイクルへのマッピングを行うことで，厳密なレッドチーム演習を可能にした。
Link: https://arxiv.org/abs/2603.12023
リーマン最適化を用いたユニタリー行列積状態による効率的な生成モデリング [cs.LG]目的：ユニタリー行列積状態を用いた生成モデリングの効率化
- 高次元確率分布の表現に課題があり，解釈可能性の高いモデルが求められている
- 従来のMPS学習法は，勾配降下法の効率性の低さが問題点である
- リーマン最適化により，確率モデリングの効率性と安定性を向上させる
- ユニタリーMPSは，パラメータ更新の曖昧さを軽減し，非教師あり学習において明確な利点を示す
- リーマン最適化によるアプローチと空間分離アルゴリズムによって効率的な学習を実現した
- Bars-and-StripesおよびEMNISTデータセットにおいて，高速な適応性と安定した更新，高い性能を確認した
Link: https://arxiv.org/abs/2603.12026
動的Kubernetesスケジューリングのための適応型グラフ強化マルチエージェント強化学習 (AGMARL-DKS) [cs.DC, cs.LG, cs.MA]目的：動的Kubernetes環境における，システム安定性，リソース利用率，コストのバランスを最適化するスケジューリング手法
- クラウドネイティブアプリケーションの普及に伴い，システム効率と安定性を両立したインテリジェントなスケジューラの重要性が増している。
- 既存の強化学習ベースのスケジューラは，大規模クラスタへのスケーラビリティ，複雑な多目的報酬関数への対応，動的な負荷変動への適応性において課題がある。
- AGMARL-DKSは，マルチエージェントによる分散処理，グラフニューラルネットワークによる状況認識，ストレスアウェアな優先順位付けにより，これらの課題を解決する。
- AGMARL-DKSは，Kubernetesのデフォルトスケジューラと比較して，フォールトトレランス，リソース利用率，コストの点で有意な改善が認められた。
- 特に，バッチ処理やミッションクリティカルなワークロードのスケジューリングにおいて，その効果が顕著であった。
- 各ノードをエージェントとして扱うことで，大規模クラスタへのスケーラビリティを確保し，グラフニューラルネットワークでクラスタ全体の状況を把握することで，より適切な判断を可能にした。
Link: https://arxiv.org/abs/2603.12031
因果推論のための事前データ適合型ネットワークの頻度主義的整合性 [cs.LG]目的：因果推論における事前データ適合型ネットワーク (PFN) ベースの推定量の頻度主義的整合性
- 因果推論は，科学的発見や政策決定において重要な役割を担うため，その精度と信頼性が求められる。
- 既存のPFNは，事前分布の影響を受けやすく，データが増加しても事前分布が打ち消されない場合がある。
- PFNベースの推定量の頻度主義的整合性を確立し，信頼性のある不確実性評価を可能にすること。
- 既存のPFNは，事前分布による交絡バイアスを示す可能性があり，頻度主義的整合性を満たさないことが示された。
- One-step posterior correction (OSPC) を用いたキャリブレーションにより，頻度主義的整合性を回復させることができた。
- PFNにマルチンゲール事後分布を適用したOSPCにより，漸近的に頻度主義的不確実性に一致し，有限サンプルにおいても良好なキャリブレーションが確認された。
Link: https://arxiv.org/abs/2603.12037
文内サポート安定性に基づく学習不要な高速推論 [cs.LG, cs.AI]目的：長文脈自己回帰デコーディングの高速化
- 大規模言語モデルの推論コスト削減は，実用化における重要な課題である。
- 自己回帰デコーディングでは，逐次的に文脈を処理するため，計算コストが増大する。
- 文内における注意機構の安定性を利用し，効率的な推論を可能とする。
- 提案手法SFIは，学習を必要とせず，既存のチェックポイントに適用可能である。
- SFIは，頻繁な低コストな高速ステップと，まれな高コストな低速ステップを組み合わせる。
- 実験結果から，SFIは既存手法と同等の品質を維持しつつ，推論速度を大幅に向上させることが示された。
Link: https://arxiv.org/abs/2603.12038
セマンティック・ジオメトリ保存によるVision-Languageモデルの継続学習 [cs.CV, cs.LG]目的：Vision-Languageモデルの継続学習における，セマンティック・ジオメトリの保存
- 事前学習済みモデルの活用が重要視される中，継続学習による性能維持が課題となっている。
- 新しいタスクへの適応時に，既存の知識が失われる「破滅的忘却」が問題である。
- セマンティック・ジオメトリの歪みを抑制し，継続学習における安定性と転移学習を向上させる。
- 提案手法SeGP-CLは，敵対的アンカーを用いてドリフトしやすい領域を特定し，セマンティック・ジオメトリを保存する。
- ACGDとTSGRにより，クロスモーダル構造を維持し，テキスト参照フレームを安定化させる。
- 5つの継続学習ベンチマークで，SeGP-CLが最先端の性能とセマンティック・ジオメトリの保存において優れていることを示した。
Link: https://arxiv.org/abs/2603.12055
XSkill：マルチモーダルエージェントにおける経験とスキルの継続的学習 [cs.AI, cs.CL]目的：マルチモーダルエージェントにおける経験とスキルの継続的学習のためのフレームワーク
- 多様なツールを活用するエージェントの複雑な推論能力向上は，現実世界への応用において重要である。
- 既存のエージェントは，オープンな環境下での非効率なツール利用と柔軟性の欠如が課題である。
- 過去の軌跡から学習し，パラメータ更新なしに継続的に改善する能力をエージェントに与える。
- XSkillは，視覚情報に基づき，経験とスキルを抽出し，蓄積する二重ストリームフレームワークである。
- 蓄積フェーズでは，視覚的に基盤付けられた要約とロールアウト間の批判を通じて，経験とスキルを蒸留・統合する。
- 推論フェーズでは，現在の視覚的コンテキストに知識を適応させ，使用履歴を蓄積にフィードバックする。
Link: https://arxiv.org/abs/2603.12056
重み付きh変換サンプリングによる粗ガイド型ビジュアル生成 [cs.CV, cs.AI]目的：粗ガイド型ビジュアル生成の性能向上
- 現実世界の多様な応用において，低品質な参照から高品質な画像を生成する技術が不可欠である。
- 既存手法は，学習コストが高いか，汎化性能が限定的であるという課題があった。
- h変換を用いて，生成プロセスを誘導し，高品質な画像を生成することを目指す。
- 提案手法は，h変換を用いて確率過程を制約することで，粗ガイドに基づいて高品質な画像を生成する。
- ノイズレベルに応じた重み付けにより，誘導の正確性と合成品質の両立を実現した。
- 多様な画像および動画生成タスクにおいて，提案手法の有効性と汎化性能を実証した。
Link: https://arxiv.org/abs/2603.12057
化学反応ネットワークはスパイクニューラルネットワークよりも優れた学習能力を持つ [cs.RO, cs.SY, eess.SY, cs.LG, cs.AI, math.ST, stat.ML, stat.TH]目的：スパイクニューラルネットワークで隠れ層が必要なタスクを，隠れ層を持たない化学反応ネットワークが解決できることの証明
- 機械学習は人工知能の重要な要素であり，複雑な問題を解決するための基盤技術である。
- スパイクニューラルネットワークは生物学的妥当性が高いが，学習効率や表現力に課題がある。
- 化学反応ネットワークの学習能力を数学的に証明し，スパイクニューラルネットワークの代替となり得る可能性を示す。
- 化学反応ネットワークは，隠れ層なしでスパイクニューラルネットワークが隠れ層を必要とするタスクを解決できることが数学的に証明された。
- 提案する化学反応ネットワークは，手書き数字の分類において，スパイクニューラルネットワークよりも高い精度と効率を示すことが数値実験で確認された。
- 本研究は，化学コンピュータにおける機械学習の可能性を示唆し，生化学反応ネットワークがニューラルネットワークよりも効率的な学習を示す理由を説明する。
Link: https://arxiv.org/abs/2603.12060
畳み込みを超えて：学習ベースの画像処理のための構造化演算子の分類 [cs.CV, cs.AI]目的：学習ベースの画像処理における構造化演算子の分類
- 画像処理において畳み込み演算は基本的だが，その限界が課題となっている。
- 固定された線形演算である畳み込みは，複雑な信号特性の捕捉が難しい。
- 畳み込み演算を拡張または代替する演算子の体系的な分類を提案する。
- 本研究では，構造化演算子を分解型，適応重み型，基底適応型，積分・カーネル型，注意機構型に分類した。
- 各演算子の構造的特性を分析し，適切なタスクへの適用可能性を示した。
- 線形性，局所性，等変性，計算コストなど，各演算子の比較分析を行った。
Link: https://arxiv.org/abs/2603.12067
LoV3D：脳MRIにおける認知予後推論を，長期的3D脳MRIと局所的体積評価によって実現する [cs.DB, cs.SY, eess.SY, cs.CV, cs.AI]目的：長期的3D脳MRIを用いた認知予後推論のパイプライン
- アルツハイマー病などの神経疾患の進行評価には，脳MRIが不可欠である。
- 既存の深層学習ツールは，診断ラベル化，体積測定，そして解釈可能性の欠如といった問題を抱えている。
- LoV3Dは，脳MRIから得られる情報に基づき，より正確で信頼性の高い認知診断と予後予測を目指す。
- LoV3Dは，3D視覚言語モデルを訓練し，長期的脳MRIの変化を評価することで，高い診断精度を実現した。
- ADNIテストセットにおいて，3段階診断精度93.7%（ベースライン比+34.8%），2段階診断精度97.2%（SOTA比+4%）を達成した。
- MIRIADやAIBLといった外部データセットでも高い汎化性能を示し，臨床現場への応用が期待される。
Link: https://arxiv.org/abs/2603.12071
転写因子結合特性評価のためのマルチラベル時系列畳み込みフレームワーク [cs.LG, cs.AI, q-bio.GN]目的：転写因子結合部位の認識
- 遺伝子発現調節において転写因子は重要な役割を担うため，そのメカニズム解明は生命科学研究の根幹となる。
- 既存研究では，個々の転写因子に焦点を当てた二値分類が主流であり，複数の転写因子間の相互作用の解析が不十分である。
- 本研究は，マルチラベル分類問題として転写因子結合部位を認識することで，転写因子間の協調的な調節メカニズムを解明する。
- マルチラベル学習を用いることで，複数の転写因子結合プロファイルを高い精度で予測することが可能となった。
- 予測結果から，既知の転写因子間相互作用と一致する生物学的に意味のあるモチーフや共同結合パターンが明らかになった。
- さらに，新たな転写因子間の関係性や協調性が示唆され，転写因子ネットワークの理解を深める貢献が期待される。
Link: https://arxiv.org/abs/2603.12073
ベルマン一致性とハイブリッドクリティックによるクロスドメインポリシー最適化 [cs.NI, cs.LG]目的：クロスドメイン強化学習におけるデータ効率の向上
- 強化学習の学習効率は，サンプル効率が課題であり，データ利用効率の向上が重要である。
- クロスドメイン転移学習では，異なる状態空間や行動空間が問題となり，直接転移が困難である。
- 転移可能性の事前評価が難しく，転移に伴う負の影響が起こりうるという問題を解決する。
- 本研究では，クロスドメインベルマン一致性という指標を用いて，転移可能性を評価する。
- QAvatarと呼ばれるハイブリッドクリティックを提案し，ソースドメインとターゲットドメインのQ関数を適応的に組み合わせる。
- QAvatarは，様々な強化学習ベンチマークタスクにおいて，良好な転移性能を示すことが実験的に確認された。
Link: https://arxiv.org/abs/2603.12087
リソース効率的な反復LLMベースのNASとフィードバックメモリ [cs.LG, cs.AI]目的：LLMを活用したニューラルアーキテクチャ探索のパイプライン
- ニューラルネットワークの設計は重要だが，専門知識と時間が必要とされる。
- 従来のNAS手法は，膨大な計算資源を必要とする点が課題である。
- 限られた計算資源で効率的にニューラルアーキテクチャを探索することを目指す。
- LLMとフィードバックメモリを活用し，単一のGPUで反復的にアーキテクチャを生成・評価・改良する。
- DeepSeek-Coder-6.7B, Qwen2.5-7B, GLM-5のいずれも，CIFAR-10, CIFAR-100, ImageNetteで性能が向上した。
- 2000回の反復探索を約18GPU時間で完了し，低予算で再現可能なNASパラダイムを確立した。
Link: https://arxiv.org/abs/2603.12091
人間中心LLMプライバシー監査：知見と摩擦 [cs.HC, cs.AI, cs.CL, cs.CY]目的：LLMにおける個人情報関連付けの可視化と制御
- LLMは大量のデータから学習するため，個人の情報が潜在的に含まれる可能性がある。
- 個人がLLMが自身の名前とどのような情報を関連付けているか確認する手段が不足している。
- LLMの個人情報関連付けの現状を明らかにし，プライバシー監査の信頼性向上を目指す。
- GPT-4oは一般人の特徴を高い精度で予測し，LLM生成の情報に対するコントロールの必要性が示された。
- 著名人と架空の名前を用いた検証により，安定した名前条件付きの関連付けとモデルのデフォルトの区別が確認された。
- LLMの出力が確率的・文脈依存的であるため，個人情報関連付けの定義と評価が困難であるという課題が浮き彫りになった。
Link: https://arxiv.org/abs/2603.12094
交通信号制御のためのロバストで効率的なマルチエージェント強化学習フレームワーク [cs.AI]目的：交通信号制御におけるロバスト性と効率性の向上
- 交通渋滞は社会経済に大きな影響を与え，効率的な交通信号制御が不可欠である。
- 従来の強化学習は，現実の交通状況の変化に対応できず，汎化性能に課題がある。
- 未知の交通状況下でも安定して機能する，実用的な信号制御システムの実現。
- 本フレームワークは，Vissimシミュレータにおいて既存の強化学習手法を上回り，平均待ち時間を10%以上削減した。
- 転換率のランダム化，安定志向の位相時間調整，近傍ベースの観測といった機構により，ロバスト性と汎化性能を高めた。
- 中央集権的な学習と分散型実行(CTDE)を活用し，スケーラブルな局所通信を維持しつつ，全体的な観測の効果を近似した。
Link: https://arxiv.org/abs/2603.12096
LLMエージェントの能動的推論における情報自己固定化について [cs.AI]目的：LLMエージェントの能動的推論における情報自己固定化現象の解明と改善
- LLMの能力向上は，複雑なタスク解決に不可欠であり，その学習手法の最適化が求められている。
- 強化学習によるLLMエージェントの学習において，情報探索が不十分となり，学習が停滞する問題がある。
- 情報自己固定化を解消し，LLMエージェントの能動的推論能力を向上させることを目指す。
- 強化学習で訓練されたLLMエージェントが，質問行動を停止し，既存情報の活用が困難になる「情報自己固定化」という現象が確認された。
- 行動選択(AS)と信念追跡(BT)の能力が不十分な場合に情報探索が制限され，自己固定化が生じるメカニズムが解明された。
- 容易に入手可能な方向性批判を学習信号に注入することで，自己固定化を緩和し，最大60%の性能向上を達成した。
Link: https://arxiv.org/abs/2603.12109