arXiv雑要約

AI - 2026/03/17 公開

  • 概念ドリフト下における継続学習のためのアンラーニングに基づくスライディングウィンドウ [cs.LG]目的:概念ドリフト下における継続学習における効率的なモデル更新手法
    • 現実世界のデータは静止せず変化するため,継続学習が重要である。
    • 従来のモデルは再学習にコストがかかり,効率的な忘却が課題である。
    • アンラーニングを利用し,効率的な忘却と適応を実現する。
    • 提案手法は,アンラーニングを用いて古いデータの影響を取り除くことで,計算コストを削減する。
    • スライディングウィンドウによる再学習と比較して,競争力のある性能を示す。
    • タスクフリーの継続学習において,アンラーニングと概念ドリフト軽減の関連性を示す初の研究である。

    Link: https://arxiv.org/abs/2603.14484

  • 無限問題生成器:エージェントワークフローによる検証可能な物理推論データのスケーラブルな拡張 [cs.CL, cs.AI]目的:物理推論データの検証可能性と高品質性
    • 複雑な推論を必要とする分野において,大規模言語モデルの性能向上が重要である。
    • 既存のデータ拡張手法では幻覚が生じやすく,既存のベンチマークは微調整に必要な推論過程を含んでいない。
    • コードとしての数式表現により,解の検証可能性を保証する問題生成システムを開発し,高品質な物理推論データを生成する。
    • Infinite Problem Generator (IPG) は,エージェントワークフローを用いて物理問題を合成し,厳密な数学的整合性を保証する。
    • ClassicalMechanicsV1 データセットは,165の専門家によるシードから1,335の問題を生成し,高い構造的多様性を示す。
    • 問題に含まれる数式数と検証コードの長さの間に強い線形相関($R^2 \approx 0.95$)が認められ,コードの複雑さが問題の難易度を測る指標となりうる。

    Link: https://arxiv.org/abs/2603.14486

  • 付加製造材料の応力ひずみ挙動予測:損失関数と活性化関数に基づく物理情報機械学習 [cs.LG]目的:付加製造材料の応力ひずみ挙動の予測
    • 付加製造は,設計の自由度が高く,複雑な形状の部品製造を可能にする重要な技術である。
    • 従来の物理モデルは材料特性を単純化しがちで,データ駆動型機械学習は物理的整合性に欠ける場合がある。
    • 物理情報機械学習を用いて,予測精度と物理的整合性の両立を目指す。
    • 提案する物理情報機械学習フレームワークは,従来の機械学習モデルや物理モデルと比較して,一貫して高い予測性能を示した。
    • 活性化関数に基づく物理情報機械学習アーキテクチャは,4つのデータセット全体で最も低いMAPE(10.46±0.81%)と最も高いR^2(0.82±0.05)を達成した。
    • この研究は,付加製造プロセスにおける部品の品質保証に貢献する。

    Link: https://arxiv.org/abs/2603.14489

  • マルチモーダル大規模言語モデルのファインチューニングにおける忘却の緩和は意外と容易である [cs.CV, cs.CL, cs.LG]目的:マルチモーダル大規模言語モデルのファインチューニングにおける忘却現象の緩和策
    • マルチモーダル大規模言語モデルは,画像とテキストを統合的に理解する能力を持ち,多様な応用が期待される。
    • ファインチューニングを行うと,新しいタスクに特化しすぎて,以前学習した能力を忘れてしまう(破滅的忘却)という課題がある。
    • 本研究は,単純なファインチューニング手法の調整によって,この忘却現象を効果的に抑制することを目指す。
    • 適切な正則化(学習パラメータ数の制限や低学習率の採用)により,分布外画像に対する忘却を効果的に抑制できることが示された。
    • 分布内画像と分布外テキストの組み合わせでは,タスク固有の過学習による忘却が発生することが明らかになった。
    • データハイブリッド学習戦略を導入することで,この過学習を抑制し,継続学習においても既存手法を上回る性能が確認された。

    Link: https://arxiv.org/abs/2603.14493

  • 責任あるAIの分断を埋める [cs.CY, cs.AI]目的:AI安全(AIS)とAI倫理(AIE)の対立構造とその解決策の探求
    • AI技術の発展に伴い,その倫理的・安全性の問題が重要性を増している。
    • AI安全とAI倫理の間に分断が生じ,建設的な議論や連携を阻害している。
    • AI安全とAI倫理の架け橋となる問題解決策を特定し,協調的なAIガバナンスを促進する。
    • AI倫理は不正の是正や具体的なAIによる被害への対処に焦点を当ててきた一方,AI安全はAI能力のリスク軽減を重視する。
    • 両分野は透明性,再現性,不十分なガバナンスメカニズムといった共通の課題を抱えている。
    • AI安全とAI倫理の間の「ブリッジング問題」に焦点を当てることで,より協調的なAIガバナンスが可能となる。

    Link: https://arxiv.org/abs/2603.14495

  • 言語指示による3D医療セグメンテーションの改良 [cs.CV, cs.LG]目的:3D医療セグメンテーションの精度向上
    • 臨床診断や手術計画において,正確な3D解剖学的セグメンテーションは不可欠である。
    • 学習データ不足やラベル品質の低さ,分布のずれなどにより,自動モデルの形状予測が不十分になりがちである。
    • 言語指示を用いた形状の反復的な修正によるセグメンテーション精度の改善を目指す。
    • 本研究では,制御可能な合成的な解剖学的エラーと対応する修正指示を含むベンチマークCoWTalkを提案した。
    • ベクトル集合として3D形状を表現し,テキスト指示と対話的に形状を更新する反復的な改良モデルを構築した。
    • 実験結果から,提案手法は破損した入力やベースラインと比較して有意な改善を示し,言語駆動型の臨床家介入による3D医療形状モデリングの実現可能性を実証した。

    Link: https://arxiv.org/abs/2603.14496

  • CangjieBench:低リソース汎用プログラミング言語におけるLLMのベンチマーク [cs.SE, cs.AI, cs.CL]目的:低リソース汎用プログラミング言語Cangjieに対するLLMの性能評価
    • 大規模言語モデルの応用範囲拡大のため,多様なプログラミング言語への対応が重要である。
    • 低リソース言語はデータ不足のため,LLMによるコード生成・理解が困難である。
    • CangjieBenchにより,低リソース言語におけるLLMの課題と改善策を明確にする。
    • 直接生成は性能が低い一方,構文制約生成が精度と計算コストのバランスが良いことが示された。
    • Agentは最高精度を達成するが,トークン消費量が大きいという課題がある。
    • コード変換タスクはテキスト変換タスクよりも性能が低く,言語特有のパターンへの過学習が示唆された。

    Link: https://arxiv.org/abs/2603.14501

  • 拡散モデルとフローモデルのアライメントのためのトラストリージョンノイズサーチ [cs.LG, cs.AI, cs.CV]目的:拡散モデルとフローモデルのアライメント手法
    • 生成モデルの性能向上は,画像生成や分子設計など多岐にわたる応用分野で重要である。
    • 報酬モデルが微分不可能であったり,計算コストが高い場合,モデルのアライメントが困難である。
    • 報酬モデルの種類を問わず,効率的に生成モデルをアライメントすることを可能にする。
    • 提案手法であるトラストリージョンノイズサーチ(TRS)は,事前学習済みの生成モデルと報酬モデルをブラックボックスとして扱い,ノイズのみを最適化する。
    • TRSは,テキスト画像生成,分子設計,タンパク質設計タスクにおいて,既存手法を上回る性能を達成した。
    • TRSは,汎用性が高く,様々な生成設定や報酬モデルへの適応が容易であり,ハイパーパラメータの調整も最小限で済む。

    Link: https://arxiv.org/abs/2603.14504

  • ポリアク・ロジャスビッチ条件とマルコフノイズ下におけるSGDの確率的高確率限界 [eess.SY, cs.SY, cs.LG, cs.SY, eess.SY, math.OC, stat.ML]目的:ポリアク・ロジャスビッチ条件とマルコフノイズ下におけるSGDの確率的高確率限界
    • 機械学習や深層学習モデルにおいて,最適化の効率性と収束性が重要な課題である。
    • 既存の研究では,ノイズの種類や大きさに制限があり,実用的な設定での適用が困難な場合がある。
    • マルコフノイズを含む状況下でのSGDの収束性を保証し,より広範な実用的な応用を可能にする。
    • 本研究では,マルコフ成分とマルチンゲール差成分を含むノイズ下でのSGDに対し,時間に対して一様である確率的高確率限界を初めて提示した。
    • ポリアク・ロジャスビッチ条件が成立する場合,期待される劣最適性の減衰率は$1/k$であり,理論的な限界と一致することが示された。
    • 分散型線形回帰,プライバシー増強のためのサブサンプリング,オンラインシステム識別といった実用的な最適化問題への適用可能性を実証した。

    Link: https://arxiv.org/abs/2603.14514

  • 励起パファイン:構造と状態にわたる汎化ニューラル波動関数 [cs.LG, physics.chem-ph, physics.comp-ph, quant-ph]目的:変分モンテカルロ法におけるニューラルネットワーク波動関数の応用
    • 量子多体系問題の正確な解法は,物質科学や化学における重要な課題である。
    • 状態の数が増えるにつれて,状態オーバーラップの計算コストが指数関数的に増加する。
    • 複数の状態を効率的に扱い,計算コストを削減する手法の開発が求められている。
    • マルチステート重要度サンプリング(MSIS)により,サンプル数をほぼ一定に保ちつつ,状態間のオーバーラップを高精度に推定できる。
    • 励起パファインは,複数の状態を単一のニューラルネットワークで表現可能にし,計算効率を大幅に向上させる。
    • ベリリウム原子の全ての異なるエネルギーレベルをニューラルネットワークを用いて初めて計算することに成功した。

    Link: https://arxiv.org/abs/2603.14515

  • 忘却の学習:大規模言語モデルにおける先行干渉の解決のための睡眠に着想を得た記憶固定化 [eess.SY, cs.SY, cs.AI, cs.LG]目的:大規模言語モデルにおける先行干渉の解決
    • 言語モデルの性能向上には,文脈理解能力が不可欠であり,その効率的な管理が課題である。
    • 大規模言語モデルでは,古い情報が現在の情報取得を妨げる先行干渉が問題となっている。
    • この研究は,生物の睡眠メカニズムに着想を得て,先行干渉を軽減する新しいフレームワークを提案する。
    • 提案手法SleepGateは,キー・バリューキャッシュに学習された睡眠サイクルを導入することで,先行干渉を効果的に抑制する。
    • SleepGateは,衝突検知,忘却ゲート,および記憶固定化モジュールを組み合わせ,文脈窓における干渉範囲をO(n)からO(log n)に削減する。
    • 実験結果から,SleepGateは既存手法と比較して,大幅に高い検索精度を達成することが示された。

    Link: https://arxiv.org/abs/2603.14517

  • VLA-Thinker:画像を用いた思考推論による視覚言語行動モデルの性能向上 [cs.RO, cs.CV, cs.AI, cs.RO]目的:視覚言語行動モデルにおける思考推論の強化
    • ロボットの自律的な行動を可能にするため,視覚,言語,行動を統合したモデルが重要である。
    • 既存モデルは静的な視覚情報を扱うため,長期間のタスクにおいて曖昧さを解消しきれない。
    • 動的に視覚情報を活用する思考推論フレームワークを構築し,ロボットの操作性能を向上させる。
    • VLA-Thinkerは,視覚情報を動的に活用する思考推論フレームワークを提案し,ロボットの操作性能を大幅に向上させた。
    • LIBEROベンチマークにおいて97.5%という高い成功率を達成し,長期間のロボットタスクにおいても顕著な改善が見られた。
    • 構造化された推論とツール使用を促進するため,キュレーションされた視覚Chain-of-Thoughtデータを用いたSFTと,GRPOベースの強化学習による学習パイプラインを採用した。

    Link: https://arxiv.org/abs/2603.14523

  • 悪意のある意図データセットとLLMの強化による偽情報検出 [cs.RO, cs.CL, cs.AI]目的:偽情報とその悪意のある意図の把握
    • 公共の議論に対する偽情報の拡散は深刻な脅威であるため,その検出技術の向上が重要である。
    • 既存のデータセットや研究は,偽情報の背後にある意図に焦点を当てていない。
    • 悪意のある意図を考慮することで,偽情報検出の精度向上を目指す。
    • 専門家によるアノテーションを施した新たなデータセットMALINTを構築し,意図の分類をベンチマークした。
    • 心理学の「予防接種理論」に着想を得た意図に基づいた手法により,LLMを用いたゼロショット偽情報検出が改善された。
    • データセットMALINTは公開され,意図を意識した偽情報検出研究を支援する。

    Link: https://arxiv.org/abs/2603.14525

  • AI安全のための感情コスト関数:取り返しのつかない結果の重みをエージェントに学習させる [cs.RO, cs.AI]目的:AI安全のための感情コスト関数のフレームワーク
    • AIの安全性確保は,社会にAIを安全に導入するために不可欠である。
    • 従来のAI安全アプローチは,定量的ペナルティに依存しており,人間のような定性的な苦しみや影響の理解が欠けている。
    • 取り返しのつかない結果に対する定性的な苦しみを通じて,AIエージェントに知恵を獲得させることを目指す。
    • 定性的な苦しみは,単なる麻痺ではなく,具体的な知恵を生み出すことが実験で示された。
    • 数値的ベースラインと比較して,機会を適切に判断する能力が向上し,過剰な拒否を防いだ。
    • 提案アーキテクチャは,人間が経験や文化を通じて知恵を蓄積するプロセスを模倣している。

    Link: https://arxiv.org/abs/2603.14531

  • オンライン強化学習制御アルゴリズムの解釈のためのクリティックマッチ損失地形の可視化 [cs.LG, cs.AI, cs.RO]目的:強化学習におけるクリティックマッチ損失地形の可視化手法
    • 強化学習は様々な場面で有効だが,システム変動への対応は経験に依存する。
    • アクター・クリティック構造のRLアルゴリズムでは,クリティックの挙動が解釈を難しくする。
    • 動的な制御問題におけるアルゴリズムの解釈を支援するため,損失地形の可視化を目指す。
    • 提案手法では,記録されたクリティックパラメータ軌跡を低次元線形部分空間に投影し,損失地形を構築する。
    • 固定参照状態サンプルと時間差ターゲットを用いて損失を評価し,3次元損失表面と2次元最適化経路を得る。
    • 定量的な地形指標とシステム性能指標により,異なる学習結果を構造的に比較できる。

    Link: https://arxiv.org/abs/2603.14535

  • 専門家の記憶:エネルギー分野における専門知識の保存のための検索拡張アーキテクチャ [cs.AI, cs.IR]目的:エネルギー分野における専門知識の保存・構造化・検索可能性の向上
    • 産業界では,専門家の退職に伴い,暗黙知が失われることが課題。
    • 従来の文書化手法では,専門家の持つ暗黙知を十分に捉えられない。
    • 組織の知識保有者の深い専門知識を保存し,活用可能にすること。
    • 本システムは,検索拡張生成(RAG)と大規模言語モデル(LLM)を活用し,知識伝達の遅延を削減する可能性を示唆。
    • 構造化インタビューや思考発話セッションなどにより,知識抽出の問題に対処。
    • インフォームドコンセント,知的財産権,消去権などの倫理的側面を考慮した設計。

    Link: https://arxiv.org/abs/2603.14541

  • 効率的なLVLM推論のための注意シフトを考慮したプルーニング手法:ASAP [cs.CV, cs.LG]目的:大規模ビジョン言語モデルの効率的な推論
    • 近年,マルチモーダルな能力を持つ大規模モデルの利用が拡大しており,計算資源の効率化が重要である。
    • 高解像度な画像トークンの処理コストが高く,推論速度のボトルネックとなっている。
    • 注意メカニズムの特性を考慮し,トークンの冗長性を削減することで,計算コストを削減することを目指す。
    • 提案手法ASAPは,訓練不要でKVキャッシュ互換性を持つプルーニング手法であり,計算コストを大幅に削減できる。
    • 動的な双方向ソフトアテンションマスクを用いることで,注意シフトの影響を軽減し,より重要なトークンを選択する。
    • 意味的に類似したトークンを統合することで,冗長性を削減し,元のLLaVA-NeXT-7Bの性能をほぼ維持しながらFLOPsを約80%削減する。

    Link: https://arxiv.org/abs/2603.14549

  • タスクの順序付け学習:文脈内最適化としてのタスクシーケンス [cs.LG]目的:タスクシーケンス問題に対するメタ学習の汎化能力
    • ロボットアセンブリや自動運転など,現実世界の様々な分野でタスクシーケンスは重要な課題である。
    • 既存研究では,少数の初期デモンストレーションで新しいタスクシーケンス問題を解決する汎化能力が不十分である。
    • 合成的に生成されたタスクシーケンス問題群を用いて,深層学習による汎化性能の向上を目指す。
    • 深層ニューラルネットワークが,無限のタスクシーケンス問題群をメタ学習し,少ない試行で汎化できることを示した。
    • グラフ構造をサンプリングしたシーケンスデータを用いてTransformerをメタ学習することで,最適なタスクシーケンスを効率的に発見した。
    • 大規模実験の結果,メタ学習モデルは非メタ学習モデルよりもタスクシーケンスの最適化を迅速に達成した。

    Link: https://arxiv.org/abs/2603.14550

  • 知識グラフ,セマンティック検索,説明可能なAIを用いたインテリジェントな求人マッチングプラットフォームJobMatchAI [cs.NI, cs.RO, cs.AI]目的:求人マッチングの最適化
    • 労働市場の効率化は経済成長に不可欠であり,適切な人材配置が重要である。
    • 従来のキーワード検索では,スキル同義語や非線形なキャリアに対応できず,マッチング精度が低い。
    • スキル知識グラフと解釈可能な再ランキングにより,より正確で透明性の高いマッチングを実現する。
    • JobMatchAIは,Transformer埋め込み,スキル知識グラフ,解釈可能な再ランキングを統合した実用的なシステムである。
    • スキル適合度,経験,場所,給与,企業選好などを考慮し,ファクターごとの説明を提供する。
    • JobSearch-XSベンチマークを用いて評価を行い,BM25,知識グラフ,セマンティックコンポーネントを組み合わせたハイブリッド検索スタックが有効であることを示した。

    Link: https://arxiv.org/abs/2603.14558

  • 内視鏡における潰瘍性大腸炎スコアリングのための包括的なマルチモーダルデータセットとベンチマーク [cs.CV, cs.AI, cs.IR]目的:潰瘍性大腸炎のスコアリングに関するデータセットとベンチマークの開発
    • 潰瘍性大腸炎は,大腸がんリスクを高める慢性疾患であり,内視鏡検査による経過観察が重要である。
    • 既存のスコアリングは専門家の主観に依存し,自動化のための十分なデータセットとベンチマークが存在しない。
    • 複数の医療機関のデータを用いて,より客観的で汎用性の高いスコアリングシステムの開発を目指す。
    • 専門家によるMESおよびUCEISスコア,臨床記述を含むマルチモーダルデータセットを構築し,公開した。
    • 構築したデータセットを用いて,畳み込みニューラルネットワーク,ビジョントランスフォーマー等の性能をベンチマークした。
    • 本研究は,臨床的に有用なマルチモーダルアルゴリズム開発の新たな可能性を開くものである。

    Link: https://arxiv.org/abs/2603.14559

  • 因果的進化:因果スクラッチパッドによるオープンエンドな発見へ [cs.LG, cs.CL, stat.ML]目的:オープンエンドな科学的課題解決のための進化エージェントの性能向上
    • LLMを活用したAI科学者の構築は,科学的発見の自動化に不可欠である。
    • 既存のエージェントは,進化の指針や過去の知識利用が不十分であり,効率低下や振動現象を起こしやすい。
    • 因果スクラッチパッドにより進化の指針を特定し,効率的な進化とより良い解の発見を目指す。
    • CausalEvolveは,進化の指針を特定・推論する因果スクラッチパッドを搭載している。
    • 実験の結果,CausalEvolveは進化効率を改善し,4つの科学的課題でより優れた解を発見した。
    • 特に,結果レベルの要因と驚きパターンを利用したアブダクション推論が有効であることが示された。

    Link: https://arxiv.org/abs/2603.14575

  • セマンティックサンプリングによる医療画像空間的グラウンディング [cs.CV, cs.LG]目的:医療画像における解剖学的構造の空間的グラウンディング能力の評価と改善
    • 医療画像解析は,疾患の診断や治療計画において重要な役割を担う。
    • 医療画像特有の三次元構造や専門用語が,視覚言語モデルの空間的グラウンディングを困難にしている。
    • 視覚言語モデルの脆弱性を評価し,空間的グラウンディング能力を向上させる方法を模索する。
    • 本研究では,医療画像空間的グラウンディングのベンチマークであるMIS-Groundを開発し,公開した。
    • MIS-SemSamという低コストな最適化手法を提案し,視覚言語モデルの空間的グラウンディング能力を向上させた。
    • 提案手法MIS-SemSamは,Qwen3-VL-32BのMIS-Groundにおける精度を13.06%向上させた。

    Link: https://arxiv.org/abs/2603.14579

  • 機械学習駆動型インテリジェントメモリシステム設計:オンチップキャッシュからストレージまで [cs.AR, cs.AI, cs.DC, cs.LG]目的:機械学習を用いた適応的データ駆動型メモリ階層制御
    • 現代の計算プラットフォームにおいて,メモリシステムはデータ処理のボトルネックとなりやすい。
    • 既存のメモリシステム設計は,静的なヒューリスティックに依存しており,ワークロードへの適応性に乏しい。
    • 機械学習を用いてメモリシステムを最適化し,性能と効率を向上させる。
    • Pythia,Hermes,Sibylは,従来のヒューリスティック設計を上回る性能を示す。
    • これらのシステムは,適度なハードウェアオーバーヘッドで実現可能である。
    • 機械学習をメモリサブシステムに統合することで,自己最適化アーキテクチャが実現する。

    Link: https://arxiv.org/abs/2603.14583

  • 欺瞞への風光明媚な道:会話型ナビゲーションにおけるダークパターンと説明可能性の落とし穴 [cs.IR, cs.CY, cs.HC, cs.AI, cs.CY]目的:会話型ナビゲーションにおけるダークパターンと説明可能性の落とし穴の分類
    • 歩行者ナビゲーションは進化しており,AIの信頼性が重要となる。
    • 会話型インターフェースは操作や誤った信頼のリスクを伴う。
    • 信頼できる会話型ナビゲーションの設計戦略を提案する。
    • リスクは意図と起源に基づいて分類され,ダークパターンと説明可能性の落とし穴に分けられる。
    • ニューロシンボリックアーキテクチャが,検証可能な経路探索アルゴリズムを基盤とすることで,信頼性を高める。
    • システムは,経路の説明とともに,その限界とインセンティブを明確に説明する必要がある。

    Link: https://arxiv.org/abs/2603.14586

  • SuperLocalMemory V3:ゼロLLM企業エージェントメモリの情報幾何学的基盤 [cs.AI, cs.IR, cs.LG]目的:AIエージェントメモリの数学的基盤の確立
    • AIエージェントの性能向上には,持続的な記憶能力が不可欠である。
    • 既存のメモリシステムは,検索,ライフサイクル管理,整合性の点で数学的基盤が未確立である。
    • 情報幾何学に基づき,AIエージェントメモリの理論的枠組みを構築し,性能と信頼性を向上させる。
    • 提案手法は,LoCoMoベンチマークにおいて,既存手法を最大19.9%上回る性能を示した。
    • 4チャンネル検索アーキテクチャにより,クラウド依存なしで75%の精度を実現した。
    • ゼロLLM構成により,EU AI法に準拠したデータ主権をアーキテクチャレベルで保証する。

    Link: https://arxiv.org/abs/2603.14588

  • オフポリシー強化学習への批評損失地形可視化手法の適用 [cs.LG, cs.AI, cs.RO]目的:批評学習の最適化幾何学の解明
    • 強化学習は,複雑な制御問題を解決する強力な手法である。
    • オフポリシー強化学習では,最適化の挙動が理解しづらい。
    • 批評学習の最適化幾何学を可視化し,診断ツールを提供する。
    • 批評損失地形可視化手法をSACアルゴリズムに適用した。
    • SACの収束,発散ケースで異なる幾何学的パターンが確認された。
    • 本手法は,オフポリシー強化学習における批評の最適化ダイナミクスを分析する幾何学的診断ツールとして機能する。

    Link: https://arxiv.org/abs/2603.14589

  • FlashHead:言語モデル推論における分類ヘッドの効率的なドロップイン置換 [cs.LG, cs.AI, cs.IR]目的:言語モデル推論における分類ヘッドの効率化
    • 近年,小型化された言語モデルが普及し,推論速度が重要な課題となっている。
    • 語彙サイズの増大により,分類ヘッドがモデルパラメータと計算量のボトルネックになっている。
    • 分類ヘッドのボトルネックを解消し,効率的な推論を実現することを目指す。
    • FlashHeadは,従来の分類ヘッドを置き換えることで,モデル全体の推論速度を最大1.75倍に向上させる。
    • FlashHeadは,情報検索の原理に基づき,語彙を効率的にクラスタリングすることで,計算量を削減する。
    • FlashHeadは,精度を維持しつつ,小型モデルの開発を促進する新たなベンチマークを確立する。

    Link: https://arxiv.org/abs/2603.14591

  • 非定常条件下におけるトランザクションネットワークの金融不正検知のための,時間的一貫性制約を持つマルチスケールグラフ学習フレームワーク [cs.LG, cs.CR]目的:トランザクションネットワークにおける金融不正検知
    • 金融取引における不正行為は経済的損失をもたらし,社会の安定を脅かすため,その検知は極めて重要である。
    • 既存手法は,疎な異常,動的パターン,深刻なクラス不均衡への対応が不十分であり,時間的変化へのロバスト性も課題である。
    • 関係性のある不正構造を捉え,時間的変化に強い,より効果的な不正検知手法を開発すること。
    • 提案手法STC-MixHopは,空間的なマルチ解像度伝播と軽量な時間的一貫性モデリングを組み合わせることで,動的なトランザクションネットワークにおける異常および不正検知において高い性能を示す。
    • PaySimデータセットを用いた厳密な時系列分割実験において,STC-MixHopは他のグラフベースの手法と競合し,高度に不均衡な条件下で優れたスクリーニング指向のリコールを達成した。
    • ノード属性が非常に有用な場合,表形式のベースラインモデルが依然として優れているという境界条件も明らかになり,グラフ構造は隠れた関係的依存性が重要である場合に効果を発揮することが示された。

    Link: https://arxiv.org/abs/2603.14592

  • 多クラスベイズネットワーク分類器の説明スケーリング [cs.CL, cs.AI, cs.LG, cs.LO]目的:多クラスベイズネットワーク分類器の説明手法
    • AIの説明可能性は,モデルの信頼性と社会実装に不可欠である。
    • ベイズネットワーク分類器の説明は,計算コストが高く,スケーラビリティに課題がある。
    • 多クラス分類器の説明を効率化し,実用的な規模に拡張すること。
    • 提案手法は,二値分類器に限定されず,コンパイル時間を大幅に改善する。
    • 出力されるクラス式は,OR分解可能な否定標準形(NNF)回路として表現される。
    • これにより,分類器の意思決定の説明計算が容易になる。

    Link: https://arxiv.org/abs/2603.14594

  • 強化学習の解釈のための損失地形可視化フレームワーク:ADHDPケーススタディ [cs.CE, cs.RO, cs.LG, cs.AI, cs.RO]目的:強化学習における学習挙動の解釈
    • 動的・制御システムにおいて強化学習の利用が広がっているため,その内部の学習過程を理解する必要がある。
    • 強化学習アルゴリズムの学習過程は不透明であり,その挙動を解釈することが困難である。
    • 強化学習の学習ダイナミクスを多角的に分析し,アルゴリズム設計の改善に貢献する。
    • 本フレームワークは,価値推定,ポリシー最適化,TD信号が訓練中にどのように相互作用するかを明確にする。
    • 損失地形の3次元再構成,ポリシーの最適化状況,更新の軌跡,状態とTD信号のマッピングから学習挙動を分析する。
    • 宇宙船の姿勢制御アルゴリズムADHDPを用いたケーススタディにより,学習安定化とターゲット更新が最適化地形に与える影響を検証した。

    Link: https://arxiv.org/abs/2603.14600

  • Chain-of-Thoughtによるポリシー適応型エージェントのアライメント [cs.CL, cs.AI, cs.LG]目的:複雑なビジネスルールへの準拠
    • LLMを活用した対話型アシスタントは有用だが,ビジネスルール遵守が課題。
    • 全ポリシーを毎回コンテキストに含めると,遅延や計算資源の浪費が生じる。
    • 推論時に関連ポリシーを想起・適用することで,効率的なルール遵守を目指す。
    • 提案手法は,ベースラインモデルを16ポイント上回り,同サイズのモデルと比較しても3ポイント優れている。
    • また,コンテキストの単語数を40%削減し,性能低下を防いでいる。
    • Jaccardスコアに基づくPolicyRecall報酬と,Hallucination Penaltyが効果を発揮した。

    Link: https://arxiv.org/abs/2603.14602

  • 視覚言語行動モデルにおける触覚モダリティ融合 [cs.RO, cs.RO, cs.CV, cs.LG]目的:視覚言語行動モデルへの触覚情報の統合
    • ロボットの複雑な操作には触覚情報が不可欠であり,より高度なロボット制御を実現するため,その活用が重要である。
    • 既存の視覚言語行動モデルは視覚情報に依存しており,接触を伴う操作における力覚や摩擦などの情報を捉えきれない。
    • 触覚情報を効率的に統合し,接触を伴う操作の成功率,性能,安定性を向上させることを目指す。
    • 提案手法TacFiLMは,既存の視覚言語行動モデルに触覚情報を追加する軽量なアプローチであり,計算コストを抑えつつ性能向上を実現する。
    • 実験結果から,TacFiLMは挿入タスクにおいて,成功率,直接挿入性能,完了時間,および力安定性のすべてで改善が確認された。
    • これらの結果は,TacFiLMが接触を伴う操作の性能を向上させるための有効な手法であることを示唆している。

    Link: https://arxiv.org/abs/2603.14604

  • 快的な方策勾配 [cs.RO, eess.SY, cs.SY, cs.LG, cs.AI, math.OC, stat.ML]目的:方策勾配における更新方向の正確性向上
    • 強化学習は,複雑な意思決定問題を解決するための重要な手法である。
    • 標準的な方策勾配は,稀な行動によって更新方向が歪められやすい。
    • 方策が既に得意な状況への予算配分過多という問題を解決する。
    • 提案手法「快的な方策勾配」は,アドバンテージと行動の驚きを組み合わせた「快」を用いることで,更新方向の精度を向上させる。
    • 理論的に,単一の状況下での方向性精度が向上し,複数の状況下では期待される勾配が教師ありクロスエントロピーオラクルに近づくことが証明された。
    • MNIST,transformerシーケンスモデリング,連続制御タスクにおいて,REINFORCEやPPOなどの既存手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2603.14608

  • LLMを活用したリリースインテリジェンス:クラウドネイティブCI/CDパイプラインにおける変更概要の自動生成と影響分析 [cs.ET, cs.SY, eess.SY, cs.SE, cs.AI]目的:クラウドネイティブCI/CDパイプラインにおける変更概要の自動生成と影響分析
    • ソフトウェアデリバリーの高速化と信頼性向上は,ビジネス競争力に直結する重要な課題である。
    • 変更内容の把握と影響範囲の特定が手作業では困難であり,人的ミスや遅延の原因となる。
    • LLMを活用し,変更内容の自動要約と影響分析を行うことで,迅速かつ正確な情報提供を目指す。
    • 本研究では,CI/CDプロモーションワークフローにAIを活用したリリースインテリジェンスを組み込むフレームワークを提案した。
    • 提案手法は,変更内容の収集,LLMによる要約,依存関係分析を組み合わせることで,関係者にとって有用な情報を自動生成する。
    • Kubernetesネイティブなリリースプラットフォームでの実装例を通して,その有効性と課題を議論した。

    Link: https://arxiv.org/abs/2603.14619

  • 分布フリーな安全性保証を用いた解釈可能な代理モデルへの積極的ルーティング [eess.SY, cs.SY, cs.LG]目的:モデルルーティングにおける安全な入力の識別と,許容可能な劣化率範囲内での代理モデルの利用
    • 機械学習モデルの信頼性確保は重要であり,特にブラックボックスモデルの利用における透明性と安全性が求められる。
    • 代理モデルの精度劣化を制御することなく利用すると,予測の信頼性が損なわれ,誤った判断を招く可能性がある。
    • 入力に基づいて事前にモデルを選択することで,劣化率を保証しつつ,より多くの入力で代理モデルを利用可能にすること。
    • 提案手法は,35のOpenMLデータセットにおいて,回帰的 conformal 予測や単純なベースラインと比較して,制御された違反率を維持しつつ,より高いカバレッジを達成した。
    • 確率的較正は,分布フリーな有効性よりもルーティング効率に主に影響を与えることが示された。
    • 安全なルーティングの実現可能性は,ベースとなる安全率とリスク予算との関係によって規定される条件が導出された。

    Link: https://arxiv.org/abs/2603.14623

  • EcoFair-CH-MARL:リアルタイム排出量予算と公平性保証を備えたスケーラブルな制約付き階層型マルチエージェント強化学習 [cs.MA, cs.AI, cs.LG, cs.SY, eess.SY]目的:排出量制約と公平性を考慮した,大規模なマルチエージェント環境における効率的な協調制御
    • 地球温暖化対策として,輸送部門における脱炭素化が急務である。効率性と環境負荷低減の両立が求められている。
    • 既存手法では,大規模なエージェント数に対応できず,排出量制約や公平性を同時に保証することが困難である。
    • 排出量制約と公平性を満たしつつ,効率的な協調制御を実現することで,持続可能な海運物流システムの構築を目指す。
    • EcoFair-CH-MARLは,既存の階層型および制約付きMARL手法と比較して,最大15%の排出量削減,12%のスループット向上,45%の公平性コスト改善を実現した。
    • 理論的解析により,制約違反と公平性損失に関するO(\sqrt{T})の漸近的な後悔 boundが確立された。
    • 本フレームワークは,政策ベースおよび価値ベースの学習者と互換性があり,安全性重視の分野における大規模な協調制御の実現可能性を向上させる。

    Link: https://arxiv.org/abs/2603.14625

  • s2n-bignum-bench:LLMの低レベルコード推論能力を評価するための実用的なベンチマーク [cs.PL, cs.AI, cs.CR, cs.LO]目的:LLMの低レベルコード推論能力の評価
    • 近年,LLMと形式手法を組み合わせた神経記号的アプローチが数学系定理証明で成果を上げている。
    • 数学コンテスト形式の成功は,実世界のコードの証明構築能力を示唆しない。
    • 産業用暗号ライブラリの形式検証をLLMに試みさせ,低レベルコード推論能力を評価する。
    • 本ベンチマークは,HOL Lightで検証済みのs2n-bignumライブラリのアセンブリルーチンを対象とする。
    • LLMに形式仕様を与え,HOL Lightで受け入れられる証明スクリプトを生成させる。
    • 本ベンチマークは,実用的な低レベル暗号アセンブリの機械検証可能な証明合成に焦点を当てている。

    Link: https://arxiv.org/abs/2603.14628

  • ResearchPilot: 文献調査と関連研究の起草を支援するローカル優先型マルチエージェントシステム [cs.IR, cs.AI]目的:文献調査支援および関連研究の起草
    • 研究の効率化が求められる中,文献調査の負担軽減が重要である。
    • 既存の文献調査ツールは,多くの場合,クラウドベースであり,プライバシーやカスタマイズ性に課題がある。
    • ローカル環境で動作し,柔軟なカスタマイズが可能な文献調査システムの構築を目指す。
    • ResearchPilotは,Semantic ScholarとarXivから論文を収集し,要約から構造化された情報を抽出する。
    • 抽出された情報に基づいて,論文間のパターンを合成し,引用情報を含む関連研究セクションのドラフトを作成する。
    • 本システムは,ローカルファーストアーキテクチャを採用し,API制限や要約のみからの抽出といった課題を認識している。

    Link: https://arxiv.org/abs/2603.14629

  • 自動事前承認システムの公平性評価へのアプローチ [cs.DC, cs.LG, cs.AI, cs.CL]目的:自動事前承認システムの公平性評価フレームワーク
    • 医療費抑制のため事前承認システムが普及している。人員不足等の課題から自動化が進んでいる。
    • 単純な承認率の平等では,臨床的根拠に基づいた適切な判断を阻害する可能性がある。
    • モデルの誤り率に基づいて公平性を評価し,偏りのないシステム構築を目指す。
    • 性別,年齢,社会経済的地位においては,モデルの誤り率に一貫性が認められ,性能差は軽微であった。
    • 人種/民族においては,サンプルサイズが限られ,統計的有意差は得られなかった。
    • 誤り率を用いた評価枠組みは,行政医療AIシステムの公平性評価に有用であると示された。

    Link: https://arxiv.org/abs/2603.14631

  • 推論を必要とする検索エージェントのための計算資源配分 [cs.RO, cs.IR, cs.AI]目的:推論を必要とする検索における計算資源配分戦略
    • 長期的なタスク遂行において,エージェントの記憶容量増加に伴い,情報検索の重要性が増している。
    • クエリと関連文書の関連性が間接的で推論を要する場合,既存手法では推論コストが増大する。
    • 推論を必要とする検索パイプラインにおける計算資源配分を最適化し,効率的な情報検索を実現する。
    • 再ランク付け段階では,より高性能なモデルと豊富な候補プールが大幅な性能向上(NDCG@10で+7.5)をもたらすことが示された。
    • クエリ展開においては,軽量モデルを超えた性能向上は限定的(NDCG@10で+1.1)であった。
    • 推論時間の思考は,クエリ展開と再ランク付けのどちらの段階でも,改善効果はわずかであった。

    Link: https://arxiv.org/abs/2603.14635

  • 隠れた状態を促す:大規模オーディオ言語モデルにおける思考連鎖推論のための学習不要モデル操縦 [cs.SD, cs.AI, cs.CL, eess.AS]目的:大規模オーディオ言語モデルにおける思考連鎖推論の改善
    • 近年の大規模言語モデルの発展は,複雑なタスクの解決に貢献している。
    • 思考連鎖推論は効果的だが,学習なしで性能を向上させるのは困難である。
    • 学習を伴わずに思考連鎖推論を強化するための手法を確立すること。
    • 推論時のモデル操縦により,CoTプロンプティングと比較して最大4.4%の精度向上を確認した。
    • 少数のテキストサンプルから得られた操縦ベクトルが,音声ベースの推論を効果的に誘導するクロスモーダル転移を明らかにした。
    • これらの手法の堅牢性を理解するため,ハイパーパラメータ感度に関する調査を行った。

    Link: https://arxiv.org/abs/2603.14636

  • 説明可能な意思決定支援のための議論:LLMを用いたグローバルな異議申し立て機能 [cs.AI, cs.CL]目的:説明可能な意思決定支援のための議論フレームワークの構築
    • 高度な意思決定が求められる分野において,LLMの活用は重要である。しかし,その不透明性が課題となっている。
    • 既存手法は二者択一に限定され,個別事例への異議申し立てのみが可能で,根本的なロジックの改善が困難である。
    • 本研究は,個別事例に限定せず,一般的な意思決定オプションの構造的な評価を可能とするフレームワークを提案する。
    • ArgEvalは,タスク固有の決定空間を体系的にマッピングし,各オプションに対応するオントロジーを構築する。
    • これにより,個別の事例に対する説明可能な推奨に加え,共有AFの修正によるグローバルな異議申し立てが可能となる。
    • 脳腫瘍であるglioblastomaの治療推奨に関する調査で,臨床実践に沿った説明可能なガイダンスが生成された。

    Link: https://arxiv.org/abs/2603.14643

  • 心の理論の時間的記憶問題:大規模言語モデルからの証拠 [cs.AI]目的:大規模言語モデルにおける時間的信念追跡能力の評価
    • 社会認知や人間とAIのインタラクションにおいて,相手の心を理解する能力は重要である。
    • 既存研究では,心の理論を静的な判断として扱うため,時間経過に伴う信念の更新・想起が無視されてきた。
    • 大規模言語モデルを用いて,時間的な文脈における信念の追跡と想起が困難であることを明らかにする。
    • 大規模言語モデルは,相手の現在の信念を推論する能力は高いものの,過去の信念状態の保持・想起が苦手であることが示された。
    • このパターンは,様々なモデルや規模で一貫しており,記憶の鮮度や干渉効果と一致する。
    • この結果は,古典的な誤信テストを超えた,時間的表現と想起という新たな課題を示唆している。

    Link: https://arxiv.org/abs/2603.14646

  • 医用画像のためのトポロジカルコントラスト学習:TopoCL [cs.CV, cs.AI]目的:医用画像分析における表現学習
    • 医療画像分析において,画像の特徴抽出は診断精度に直結するため重要である。
    • 既存のコントラスト学習は視覚的特徴に偏り,トポロジー構造の活用が不十分である。
    • 医療画像分析において重要なトポロジー構造を明示的に活用し,表現学習の性能向上を目指す。
    • 提案手法TopoCLは,既存のコントラスト学習法に組み込むことが可能である。
    • 5つの代表的なコントラスト学習法と5つの医用画像データセットで評価した結果,TopoCLは一貫して性能向上を示した。
    • 線形プローブ分類精度において平均+3.26%の改善が見られ,統計的に有意な結果が得られた。

    Link: https://arxiv.org/abs/2603.14647

  • 人工知能による熱的制限バイアス予測手法 [cs.LG, cs.AI]目的:熱的制限バイアスの予測と補正
    • 原子力発電所の安全かつ効率的な運転には,正確な熱的制限の把握が不可欠である。
    • オフラインとオンラインの熱的制限の乖離である熱的制限バイアスが,保守的な設計やコスト増を招く。
    • 沸騰水型原子炉における熱的制限バイアスを予測・補正し,運転経済性を向上させる。
    • 深層学習を用いたモデルにより,熱的制限バイアスを平均74%削減することに成功した。
    • 限界値の平均絶対偏差は72%減少し,最大バイアスは52%減少した。
    • 本モデルは,燃料サイクル経済性と運転計画の改善に大きく貢献する可能性が示された。

    Link: https://arxiv.org/abs/2603.14648

  • EARCP:逐次意思決定のための自己調整型コヒーレンス認識アンサンブルアーキテクチャ [cs.LG, cs.AI, cs.MA]目的:異質な専門家モデルの性能とモデル間コヒーレンスに基づいた動的重み付け
    • 複雑な問題解決において,複数の専門家モデルを統合するアンサンブル学習は重要な手法である。
    • 従来のアンサンブル学習は静的またはオフライン学習に依存し,環境変化への適応が課題であった。
    • EARCPは,オンライン学習機構により環境変化に対応し,ロバスト性を高めることを目指す。
    • EARCPは,乗算重み更新アルゴリズムとコヒーレンスに基づく正則化項を組み合わせることで理論的保証と実用的なロバスト性を両立する。
    • 標準的な仮定の下で,O(sqrt(T log M))の亜線形後悔限界が証明された。
    • 時系列予測,活動認識,金融予測などの逐次予測タスクにおいて有効性が実証された。

    Link: https://arxiv.org/abs/2603.14651

  • 人間とAIの連携が,低~中画質の動画におけるディープフェイク検出を向上させる [cs.RO, cs.CV, cs.AI]目的:ディープフェイク検出における人間とAI検出器の性能比較および,人間とAIの連携による検出精度の向上
    • ディープフェイクは社会に悪影響を及ぼす可能性があり,その検出技術の確立が急務である。
    • 既存のAI検出器は,現実的な条件下では必ずしも高い性能を発揮できない場合がある。
    • 特に低画質動画においては,AI検出器の性能が低下するため,人間との協調が重要となる。
    • 人間は,標準的なベンチマークデータセットDF40と,新しいデータセットCharadesDFの両方において,AI検出器よりも高い性能を示した。
    • 特にCharadesDFでは,AI検出器の精度が大幅に低下する一方,人間は高い性能を維持しており,その差が顕著になった。
    • 人間とAIの誤りは補完的であり,人間とAIを組み合わせたアンサンブル手法を用いることで,誤検出を減少させることができた。

    Link: https://arxiv.org/abs/2603.14658

  • VisionCoach:視覚知覚プロンプトによる根拠に基づいた動画推論の強化 [cs.CV, cs.AI]目的:動画推論における根拠に基づいた視覚的理解の強化
    • 動画理解は,多様な応用分野において不可欠であり,その重要性は増している。
    • 動画中の関連証拠の正確な位置特定と追跡は困難であり,推論の信頼性を損なう。
    • 学習時の視覚プロンプトによる誘導を通じて,推論過程における空間・時間的な根拠付けを改善する。
    • VisonCoachは,選択的な視覚プロンプト適用と自己蒸留により,動画推論の性能を向上させる。
    • 推論時には外部ツールを必要とせず,効率的な推論経路を維持しながら,最先端の性能を達成した。
    • 学習中の視覚プロンプトが根拠に基づいた動画推論を改善し,自己蒸留が推論時のプロンプト不要化を可能にする。

    Link: https://arxiv.org/abs/2603.14659

  • 人工知能における断続的平衡:制度的スケーリング法則と主権AIの種分化 [cs.NI, cs.HC, cs.AI, cs.CL, cs.CY]目的:人工知能開発における断続的平衡の存在とそのメカニズム解明
    • AI技術は社会に変革をもたらす可能性を秘めているが,その発展には不確実性が伴う。
    • 既存のスケーリング法則は,モデルサイズと性能の単調増加を前提としている点が課題である。
    • 制度的適合性に着目し,スケーリング法則の非単調性を明らかにすることで,AI開発の方向性を示す。
    • AI開発は,緩やかな進歩ではなく,競争環境を再編する急速な相転移を伴う断続的平衡によって進行する。
    • 制度的適合性はモデルサイズに対して非単調であり,最適なサイズを超えると信頼性の低下やコスト増により適合性が悪化する。
    • 特定の環境下では,大規模汎用モデルよりも,小規模でドメイン適応されたモデルの方が,制度的に優位となる可能性がある。

    Link: https://arxiv.org/abs/2603.14664

  • 勾配アトム:訓練勾配の疎分解によるモデル行動の非監視的発見,帰属,および制御 [cs.AI]目的:モデル行動の発見,帰属,および制御手法
    • AIモデルの挙動解釈は,その信頼性と安全性を高める上で不可欠である。
    • 従来の訓練データ帰属手法は,文書単位での分析に偏っており,モデルが学習する広範な概念に対応できていない。
    • 訓練データの勾配を分解し,モデルの潜在的な行動パターンを自動的に抽出することで,この問題を解決する。
    • 本研究で提案する勾配アトムは,訓練データの勾配を疎な成分に分解することで,解釈可能な行動パターン(拒否,算術,QAなど)を教師なしで発見できる。
    • 発見されたアトムは,モデルの行動を制御するための効果的なベクトルとしても機能し,特定の行動の発生率を大きく変化させることができる。
    • この手法は,クエリと文書のスコアリングを必要とせず,関心のある行動の数に依存せずにスケーリングする。

    Link: https://arxiv.org/abs/2603.14665