arXiv雑要約

AI - 2026/03/10 公開

  • 沸騰する蛙の閾値:徐々に変化する環境下におけるワールドモデルに基づく異常検知における臨界性と盲目性 [cs.AI, cs.LG]目的:徐々に観測データが破損していく状況における,異常検知の閾値とその決定要因の解明
    • 強化学習において,環境の変化への適応は重要な課題であり,自己監視能力の向上が不可欠である。
    • 環境が徐々に変化する場合,変化をいつ検知できるか,検知の遅れが問題となる。
    • ワールドモデルを用いた異常検知における,変化検知の閾値とその影響因子を特定すること。
    • 急激な検出閾値ε*が,検出器の種類やモデルの能力に関わらず普遍的に存在することが確認された。
    • 正弦波状のドリフトは,どの検出器でも検出できないという結果から,これはワールドモデル特有の性質であることが示された。
    • 閾値ε*は,検出器パラメータに対してべき乗則に従うが,環境間の予測は困難であり,環境固有のダイナミクス構造が重要であることが明らかになった。

    Link: https://arxiv.org/abs/2603.08455

  • カメラ・LiDAR パーティクルフィルタにおける適応的エントロピー駆動センサ選択による単一船舶追跡 [cs.RO, cs.LG, cs.SY, eess.SP, eess.SY, physics.data-an]目的:単一船舶追跡のための適応的センサ選択戦略
    • 沿岸監視における船舶追跡は,安全確保や効率的な運用に不可欠である。
    • カメラは照度や視覚的ノイズに,LiDARは距離や欠損データに弱点を持つ。
    • 情報利得に基づき最適なセンサ構成を動的に選択することで,ロバストな追跡を実現する。
    • LiDARは近距離での精度で優位性を示し,カメラはLiDARが利用できない遠距離での追跡を維持する。
    • 適応的センサ選択戦略は,情報利得に基づいてモダリティを切り替え,精度と継続性のバランスを取る。
    • 継続的なマルチストリーム処理を回避することで,リソース効率の高い沿岸監視システムの実現に貢献する。

    Link: https://arxiv.org/abs/2603.08457

  • マルチモーダルデータを用いた不確実性考慮型劣化リスク予測のためのデータ駆動型事前分布 [cs.LG]目的:臨床意思決定支援システムへの予測モデル統合における安全性の確保
    • 臨床現場での意思決定支援には,正確な予測に加え,その信頼性を示すことが不可欠である。
    • 既存の機械学習モデルは信頼性の高い不確実性推定が難しく,実用化の妨げとなっている。
    • マルチモーダルデータ融合における予測性能と不確実性評価の向上を目指す。
    • 提案手法MedCertAInは,既存の決定論的ベースラインやベイズ法と比較して,予測性能と不確実性定量化を大幅に向上させた。
    • 自己教師あり学習によるクロスモーダル類似性と,モダリティ固有のデータ破損を考慮したハイブリッド戦略により,ニューラルネットワークパラメータに対するデータ駆動型事前分布を設計した。
    • MIMIC-IVおよびMIMIC-CXRデータセットを用いた実験により,臨床タイムシリーズと胸部X線画像を用いたリスク予測において有効性が確認された。

    Link: https://arxiv.org/abs/2603.08459

  • 推論を圧縮として:条件付き情報ボトルネックによる予算制約の一体化 [cs.LG]目的:大規模言語モデルにおける効率的な推論の実現
    • 複雑なタスクにおいて,大規模言語モデルの精度向上は不可欠である。
    • 既存のコスト削減手法は,重要な推論情報も削減してしまうという課題がある。
    • 情報ボトルネック原理に基づき,推論過程を圧縮することで効率的な推論を目指す。
    • 本研究では,条件付き情報ボトルネック(CIB)を用いて推論過程をモデル化し,報酬最大化と圧縮を同時に行う学習目標を提案した。
    • CIB目標は,従来の長さ制限などの手法を包含し,認知的な冗長性を削減しつつ,流暢さと論理性を維持する。
    • 実験結果から,CIB目標は中程度の圧縮率で精度を向上させ,大幅な圧縮でも精度低下を最小限に抑えることが示された。

    Link: https://arxiv.org/abs/2603.08462

  • 共生進化:バリチェッリの遺産から集団知能へ - シミュレーションと概念的アプローチ [cs.NE]目的:共生進化のメカニズムに関する研究
    • 生命の起源や知能の創発を理解する上で,進化的な視点は不可欠である。
    • 既存の研究では,単純なシステムから複雑な知能がどのように生まれるかの詳細なメカニズムが不明である。
    • 共生進化が,生命の起源や集団知能の創発に寄与する可能性を検証すること。
    • バリチェッリの初期の研究を再現し,1次元および2次元の世界で共生生物の進化をシミュレーションした。
    • DNA-normsを用いた予備実験を行い,共生進化のメカニズムに関する新たな知見を得た。
    • 人工生命および人工知能への示唆を議論し,今後の研究の方向性を示した。

    Link: https://arxiv.org/abs/2603.08463

  • 複雑形状における流体流れに対するマルチスケール弱形式物理情報ニューラルネットワーク (MUSA-PINN) [cs.LG]目的:複雑形状における流体流れの解析手法
    • 工学設計において,複雑形状内での流体解析は性能評価・最適化に不可欠である。
    • 従来の物理情報ニューラルネットワークは,複雑形状内で収束性の問題を抱える場合がある。
    • 本研究は,複雑形状における流体解析の精度と安定性を向上させることを目指す。
    • マルチスケール弱形式物理情報ニューラルネットワーク (MUSA-PINN) を提案し,積分的な保存則に基づく制約を導入した。
    • MUSA-PINNは,階層的な球状制御体積を用いることで,長距離結合と局所的な精密化を両立している。
    • TPMS形状における実験により,MUSA-PINNは最先端手法を大幅に上回り,高い質量保存性と精度を実現した。

    Link: https://arxiv.org/abs/2603.08465

  • 強化学習のためのダイナフレームワークへのラグランジュニューラルネットワークの統合 [eess.SY, cs.LG, cs.SY]目的:強化学習におけるモデルベースアプローチの効率向上
    • サンプル効率が重要視される強化学習において,モデルベース手法は有効である。
    • 既存のモデルは物理法則を考慮せず,訓練データと異なる状況下で予測精度が低下する。
    • ラグランジュニューラルネットワークを用いて,物理法則に基づいた高精度なモデルを構築する。
    • ラグランジュニューラルネットワークは,ダイナフレームワーク内で有効に機能することが示された。
    • 状態推定に基づく最適化手法は,確率的勾配降下法よりも収束が速いことが確認された。
    • シミュレーション結果は,提案手法がモデルベース強化学習において有効であることを示している。

    Link: https://arxiv.org/abs/2603.08468

  • R2F:LLMを用いない物体ナビゲーションのためのレイフロンティアの再利用 [cs.RO, cs.AI]目的:LLMを用いない屋内オープンボキャブラリ物体ナビゲーションフレームワークの開発
    • ロボットナビゲーションは,人間と協調して作業を行う上で不可欠な技術であり,その自動化が求められている。
    • 従来の物体ナビゲーションは,大規模言語モデルに依存するため,計算コストが高く,リアルタイム性に課題があった。
    • 本研究は,レイフロンティアという探索手法を再利用し,LLMを用いずにリアルタイムなナビゲーションを実現することを目的とする。
    • レイフロンティアを,方向性に基づいた意味的仮説として解釈し,ナビゲーション目標として活用する新しいフレームワークを提案した。
    • 大規模モデルによる反復的な推論を排除し,古典的なマッピングと計画パイプライン内でナビゲーションを実現することで,高速化を図った。
    • シミュレーション環境および実機ロボット実験において,最先端のゼロショット性能とリアルタイム実行性を実証した。

    Link: https://arxiv.org/abs/2603.08475

  • STRIDE:フローマッチングによる構造化ラグランジアンと確率的残差力学 [cs.RO, eess.SY, cs.SY, cs.RO, cs.LG]目的:非構造化環境におけるロボットシステムの動力学学習フレームワーク
    • ロボットの自律的な動作には,環境とのインタラクションを正確に予測するモデルが不可欠である。
    • 従来のモデルは,物理的整合性の欠如や長期的予測における誤差の蓄積といった課題がある。
    • 物理構造を維持しつつ,複雑な確率的挙動を表現可能なモデルを開発すること。
    • STRIDEは,エネルギー保存則を満たすラグランジアンニューラルネットワークと条件付きフローマッチングを組み合わせる。
    • これにより,複雑なインタラクション現象を捉え,予測精度を向上させる。
    • 実験結果から,STRIDEは従来のモデルと比較して,長期的予測誤差と接触力予測誤差をそれぞれ20%,30%削減した。

    Link: https://arxiv.org/abs/2603.08478

  • X-AVDT:ロバストなディープフェイク検出のためのオーディオビジュアルクロスアテンション [eess.SY, cs.SY, math.DS, cs.CV, cs.AI, cs.LG]目的:ディープフェイク検出のための新規手法
    • 生成システムの進化により,高精細な合成動画が増加しており,悪用のリスクが高まっている。
    • 既存の検出器は高度な合成動画に対抗できず,誤検出や見逃しが生じる可能性がある。
    • 生成モデル内部のオーディオビジュアルの一貫性を利用し,ロバストな検出を実現する。
    • X-AVDTは,DDIM反転を用いて生成モデル内部のオーディオビジュアル信号を解析し,偽装の兆候を検出する。
    • MMDFという新しいマルチモーダルディープフェイクデータセットを導入し,多様な操作タイプと生成モデルに対応した評価を可能にした。
    • MMDFおよび外部ベンチマークにおいて,既存手法を13.1%上回る高い精度を達成し,汎用性も実証された。

    Link: https://arxiv.org/abs/2603.08483

  • 視覚的自己成就的アライメント:脅威関連画像による安全志向型ペルソナの形成 [cs.RO, cs.CV, cs.AI]目的:マルチモーダル大規模言語モデルの安全性の誤調整
    • マルチモーダルLLMの利用拡大に伴い,安全性の確保が重要な課題となっている。
    • 既存手法は安全ラベルや対照データに依存し,脅威概念と安全概念の表現の非対称性が問題である。
    • 脅威関連画像を用いた自己成就メカニズムにより,安全志向型ペルソナをラベルなしで形成する。
    • VSFAは,脅威関連画像を用いた中立的なVQAタスクでVLMをファインチューニングすることにより,攻撃成功率を低減する。
    • 応答の質を向上させ,過剰な拒否を軽減しつつ,一般的な機能を維持する。
    • 自己成就メカニズムをテキストから視覚モダリティに拡張し,ラベルフリーなアライメント手法を提供する。

    Link: https://arxiv.org/abs/2603.08486

  • NN-OpInf:構造を保存する合成可能なニューラルネットワークを用いた演算子推論アプローチ [cs.LG, math.DS]目的:動的システムの非侵襲的な低次元モデリングのための演算子推論
    • 複雑なシステムのシミュレーションには高コストがかかるため,効率的な低次元モデルが求められている。
    • 従来の多項式を用いた演算子推論は,非多項式な非線形性を持つシステムに対して精度が低いという課題がある。
    • ニューラルネットワークを用いて演算子を推論することで,より複雑な動的システムを正確にモデル化することを試みる。
    • NN-OpInfは,従来のP-OpInfと比較して,精度,安定性,およびロバスト性が向上することが示された。
    • 特に,動的なシステムが多項式モデルでうまく表現できない場合に,その効果が顕著である。
    • NN-OpInfは,P-OpInfの代替として有効であり,学習コストは高いものの,精度と汎化性能の向上が期待できる。

    Link: https://arxiv.org/abs/2603.08488

  • ベイズ競技によるパレート最適 Anytime アルゴリズム [cs.DM, math.CO, cs.NE, cs.LG]目的:Anytime アルゴリズムの比較と選択
    • 最適化アルゴリズムの選択は重要だが,計算資源の制約下での最適なアルゴリズム決定が課題。
    • 既存手法は,Anytime性能の評価が困難,解釈が主観的,またはアルゴリズム追加で結論が変わる。
    • Anytimeアルゴリズムの比較をパレート最適化として捉え,時間経過に伴う優位性を評価する。
    • 提案手法 PolarBear は,時間経過に伴う優位性を評価し,効率的にパレート最適解を特定する。
    • ランキングに基づく評価により,目的関数の正規化や最適値の事前知識が不要である。
    • 得られたパレート最適解は,時間制約やリスク許容度に応じたアルゴリズム選択を支援する。

    Link: https://arxiv.org/abs/2603.08493

  • デキャリブレーションによる効率的な確信性予測 [cs.LG, stat.ML]目的:確信性の効率的な予測手法
    • 安全性が重要な場面で,機械学習の不確実性表現は不可欠である。
    • 既存の確信性予測は計算コストが高く,大規模モデルへの適用が困難である。
    • 計算コストを抑えつつ,確信性を高精度に予測することを目指す。
    • 提案手法は,相対尤度に基づき,確信性の範囲を効率的に予測する。
    • 様々なタスクにおいて,高い網羅性と効率性を実証した。
    • TabPFNやCLIPといった,従来は確信性予測が困難だったモデルにも適用可能であることを示した。

    Link: https://arxiv.org/abs/2603.08495

  • Echo2ECG:多角的エコー画像から得られる心臓形態情報を用いた心電図表現の強化 [cs.LG, cs.AI]目的:心電図表現の強化
    • 心電図は安価で広く利用可能な検査であり,心臓の電気的異常の診断に不可欠である。
    • 心電図では左室駆出率などの心臓の形態的表現を直接測定できず,エコー検査が必要となる。
    • 本研究は,心電図から心臓の形態的情報を予測し,早期の健康診断を可能にすることを目的とする。
    • Echo2ECGは,単一視点の画像とのアラインメントによる表現の不一致を解消し,多角的エコー画像から得られる心臓形態構造で心電図表現を強化する。
    • 心臓構造表現の分類と心電図クエリによる類似エコー画像の検索という2つの臨床的に重要なタスクにおいて,最先端の手法と比較して優れた性能を示した。
    • 抽出された心電図表現は,最大の特徴量を持つベースラインよりも18分の1のサイズでありながら,一貫して高い性能を発揮する。

    Link: https://arxiv.org/abs/2603.08505

  • オラクル誘導ソフトシールド:チェスの安全な手予測のための手法 [cs.LG, cs.AI]目的:チェスの安全な手予測のためのフレームワーク
    • 高度な意思決定環境において,安全性が重要であり,特に探索時の安全性確保が課題となる。
    • 模倣学習はサンプル効率が良いが,分布シフトに弱く,積極的なリスク回避機構を欠く。
    • オラクルからのフィードバックに基づき,安全な探索を可能にするフレームワークを開発する。
    • 提案手法OGSSは,模倣学習の設定でオラクルのフィードバックから確率的安全モデルを学習することで,より安全な意思決定を可能にする。
    • 実験の結果,OGSSは他の手法と比較して,探索範囲を広げても,戦術的なミス率を低く抑えることが示された。
    • 特に,Stockfishの評価を用いたブレンダー予測モデルが,リスクの高い手を特定し,安全な手選択に貢献している。

    Link: https://arxiv.org/abs/2603.08506

  • ハンガリー法を超えて:エンドツーエンド物体検出のためのマッチングフリーな教師あり学習 [cs.RO, cs.CV, cs.AI]目的:エンドツーエンド物体検出におけるマッチングフリーな教師あり学習
    • 物体検出は,画像認識の重要な課題であり,自動運転やロボティクスなど,幅広い応用分野がある。
    • DETRベースのフレームワークでは,クエリと正解データの間の二分マッチングにハンガリー法を用いるため,計算コストが高く,学習が不安定になる。
    • 本研究は,ハンガリー法を必要としない,より効率的で安定したDETRベースの物体検出学習方法を提案する。
    • 提案手法は,クロスアテンションに基づくクエリ選択(CAQS)モジュールにより,明示的なヒューリスティックマッチングを排除する。
    • CAQSモジュールは,正解情報を利用してデコーダクエリをプローブし,クエリとターゲットの間の暗黙的な対応関係を学習する。
    • 実験結果から,提案手法はマッチングの遅延を50%以上削減し,既存の最先端手法と比較して性能が向上することが示された。

    Link: https://arxiv.org/abs/2603.08514

  • 凹型多目的強化学習におけるバイアス障壁の打破 [cs.LG, stat.ML]目的:凹型スカラー化多目的強化学習におけるバイアス
    • 強化学習は単一報酬の最適化だが,現実の問題では複数目的の非線形な効用最大化が求められる。
    • 非線形スカラー化は公平性やリスク許容度を考慮できるが,勾配推定にバイアスが生じやすい。
    • バイアスを克服し,サンプル複雑度を改善することで,多目的強化学習の実用性を高める。
    • 既存の強化学習手法が抱えるバイアスにより,サンプル複雑度が$\widetilde{\mathcal{O}}(\epsilon^{-4})$程度に悪化することが示された。
    • 多層モンテカルロ推定器を搭載した自然方策勾配法を開発し,スカラー化勾配のバイアスを制御し,サンプルコストを抑えた。
    • 開発した手法は,$\epsilon$-最適方策を計算するための最適なサンプル複雑度$\widetilde{\mathcal{O}}(\epsilon^{-2})$を達成することが証明された。

    Link: https://arxiv.org/abs/2603.08518

  • 教師なしグラフアラインメントにおける効果的かつ効率的な手法 [cs.HC, cs.LG, cs.AI]目的:グラフ間のノード対応関係の特定
    • グラフ構造は複雑な関係性を表現可能であり,様々な分野で活用が期待される。
    • 既存手法は,精度と効率性の両立が困難であり,大規模グラフへの適用が課題となる。
    • グラフ全体の情報を活用し,アラインメントの精度と効率を向上させることを目指す。
    • 本研究では,「グローバル表現とアラインメント」という新たなパラダイムを提案した。
    • 提案手法であるGlobAlignおよびGlobAlign-Eは,グローバルアテンション機構と階層的輸送コストにより,高い精度と効率を実現した。
    • GlobAlign-Eは,OTの計算複雑度を大幅に削減し,既存手法を凌駕する高速化を達成した。

    Link: https://arxiv.org/abs/2603.08526

  • ニューラル・コンパス:ロボット探索のための確率的相対特徴場 [cs.RO, cs.RO, cs.LG]目的:見慣れない環境における物体探索の成功と効率を左右する物体共起の学習
    • 環境理解において,物体の配置に関する事前知識は探索効率を飛躍的に向上させる。
    • 既存手法はラベル付きデータや言語モデルに依存し,ラベルなしデータからの学習は困難。
    • ラベルなしデータのみから,物体の相対的な特徴分布を学習し,探索に活用すること。
    • 提案手法ProReFFは,事前学習済みのビジョン言語モデルから得られる特徴量の相対分布を予測する。
    • 矛盾する可能性のあるデータに対しても,一貫性のある相対分布への整合性を図る学習戦略を導入。
    • Matterport3Dシミュレーターを用いた実験で,既存手法を20%上回り,人間の80%の性能に匹敵。

    Link: https://arxiv.org/abs/2603.08544

  • ロボットポリシー学習と評価のためのインタラクティブなワールドシミュレータ [cs.RO, cs.CV, cs.LG]目的:ロボットポリシーの学習と評価のためのインタラクティブなワールドシミュレータの構築
    • ロボットの汎用的な活用には,現実世界での学習コストを削減するシミュレーション技術が不可欠である。
    • 既存のワールドモデルは,計算コストが高く,長時間の物理的な相互作用を正確に捉えることが困難である。
    • 現実世界でのデータ収集量を減らしつつ,高性能なロボットポリシーを学習・評価するための環境を構築する。
    • 本研究で開発したインタラクティブなワールドシミュレータは,高速かつ安定した物理シミュレーションを実現した。
    • シミュレータ内で収集したデータを用いて学習したロボットポリシーは,現実世界で収集したデータと同等の性能を示した。
    • シミュレーション環境と現実世界でのポリシー性能には高い相関が見られ,シミュレータの有用性が確認された。

    Link: https://arxiv.org/abs/2603.08546

  • 強化学習における接続性がラプラシアン表現に与える影響 [cs.HC, cs.LG, stat.ML]目的:強化学習における状態表現の近似誤差の上界
    • 大規模な強化学習問題では次元の呪いが深刻であり,効率的な状態表現が不可欠である。
    • 状態グラフが不明な場合や状態空間が広大な場合,ラプラシアン固有ベクトルの推定誤差が課題となる。
    • 状態グラフの代数連結性に基づいて近似誤差を評価し,表現学習パイプライン全体のエラー分解を目指す。
    • 線形価値関数近似における近似誤差の上界が,状態グラフの代数連結性によって決定されることを示した。
    • 固有ベクトル推定による誤差の上界を導出し,表現学習パイプライン全体のエラー分解を実現した。
    • 提案するラプラシアン演算子の定義は,既存のものと同等でありながら,誤解を防ぐ効果があることを示した。

    Link: https://arxiv.org/abs/2603.08558

  • レトロエージェント:回顧的二重内在フィードバックによる解決から進化へ [cs.RO, cs.AI]目的:複雑なインタラクティブタスクにおけるエージェントの解決と進化
    • LLMベースのエージェントは複雑なタスクで高いポテンシャルを示すため,その性能向上は重要である。
    • 標準的な強化学習は静的な問題解決に偏り,探索不足や知識の暗黙的化が課題となる。
    • 過去の経験を有効活用し,継続的な適応と学習能力を高めることを目指す。
    • レトロエージェントは,過去の試行を回顧的に分析し,二重の内在フィードバックによってエージェントを進化させる。
    • 実験結果から,レトロエージェントは既存手法を大きく上回り,ALFWorldで+18.3%,WebShopで+15.4%などの顕著な性能向上を達成した。
    • テスト時の適応性や分布外シナリオへの汎化能力も高く,強化学習エージェントの新たな可能性を示唆する。

    Link: https://arxiv.org/abs/2603.08561

  • OSS-CRS:現実世界のオープンソースセキュリティのためのAIxCCサイバー推論システム解放 [cs.CR, cs.AI]目的:現実世界のオープンソースプロジェクトに対するサイバー推論技術の実行と組み合わせのためのオープンでローカルにデプロイ可能なフレームワーク
    • サイバーセキュリティは,現代社会における重要な課題であり,自動化された脆弱性発見と修正が求められている。
    • AIxCCで開発されたサイバー推論システムは,元のクラウドインフラに依存しており,汎用的な利用が困難であった。
    • OSS-CRSは,AIxCCシステムの技術を,ローカル環境で利用可能にし,オープンソースセキュリティの向上を目指す。
    • OSS-CRSは,AIxCCの優勝システム(Atlantis)を移植し,実用的なフレームワークとして機能することを示した。
    • OSS-CRSを用いて,OSS-Fuzzプロジェクトにおいて10個の未知のバグ(重度のものが3個)を発見した。
    • OSS-CRSは,パブリックに公開されており,誰でも利用可能である。

    Link: https://arxiv.org/abs/2603.08566

  • MetaWorld-X:VLMによるオーケストレーションを通じた階層的ワールドモデリングによるヒューマノイドロボットのロコモーションとマニピュレーション [cs.RO, cs.AI]目的:ヒューマノイドロボットにおけるロコモーションとマニピュレーションを同時実行するための,自然で安定かつ汎化性能の高い全身制御ポリシーの学習
    • ヒューマノイドロボットの制御は,人間のような複雑なタスクを達成するために不可欠であり,その実現はロボット工学の重要な課題である。
    • 既存の強化学習アプローチは,複数のスキルを単一のポリシーで学習するため,スキルの干渉や不自然な動き,安定性の問題が生じやすい。
    • 複雑な制御問題を専門家ポリシーに分解し,ビジョン言語モデルによって動的に統合することで,汎化性能と適応性を向上させる。
    • 提案手法MetaWorld-Xは,複雑なタスクを専門家ポリシー群に分解し,人間のモーションデータを用いて自然な動きを学習する。
    • ビジョン言語モデルによって,タスクの意味に基づいて適切な専門家ポリシーを組み合わせることで,多様なロコモーション・マニピュレーションタスクへの対応が可能となる。
    • 実験により,既存手法と比較して,より自然で安定した動作と,複雑なタスク構成に対する高い汎化性能が示された。

    Link: https://arxiv.org/abs/2603.08572

  • 確信の評判を通じた信頼 [cs.AI, cs.LG]目的:主張と情報源の数学的定式化による知識,真実,信頼の関係性
    • 知識の信頼性は社会活動や意思決定において不可欠であり,その基盤理解は重要である。
    • 従来の信頼の概念は,正しさや忠実性に依存しており,状況変化に弱いという課題があった。
    • 確信に基づく評判という新たな信頼の基盤を提示し,AIエージェントへの応用を目指す。
    • 本研究では,信頼の基盤として「確信」に着目し,情報源の立場が独立した合意によって検証される可能性を定義した。
    • 確信は,正しさや忠実性とは異なり,状況に依存せず,貢献を評価し,外部検証を可能にする透明性を要求する。
    • 評判を,主張領域における期待される重み付き確信の総和として形式化し,継続的な検証が評判蓄積の理論的必要性及び実用的なメカニズムであることを示した。

    Link: https://arxiv.org/abs/2603.08575

  • ドリフトからアクションコントローラ:オンラインリスク証明による予算制約下の介入 [cs.LG, cs.CL]目的:機械学習システムの分布ドリフトへの対応策
    • 機械学習システムの実運用において,分布ドリフトは性能低下の主要因であり,継続的な監視が不可欠である。
    • 既存の監視システムは警報に留まり,ラベルコストや遅延制約下での適切な対応が困難である。
    • オンラインリスク証明を用いて,安全性を担保した上で,低コストでのドリフト対応を可能とする。
    • 提案手法Drift2Actは,監視を制約付き意思決定問題として捉え,安全性を明示的に考慮したドリフト対応を実現する。
    • 遅延ラベルの小規模なクエリとリスク証明により,現在のリスクに対する上限をanytime-validに算出する。
    • 実環境での評価により,安全性の確保と迅速な回復において,既存手法を上回る性能が確認された。

    Link: https://arxiv.org/abs/2603.08578

  • DualFlexKAN:独立関数制御を用いた二段階のコルモゴロフ・アーノルドネットワーク [cs.LG, cs.CV]目的:ネットワークの表現力と計算コストのトレードオフを最適化するハイブリッドネットワークの実現
    • 機械学習モデルの性能向上には,適切なネットワーク構造の設計が不可欠である。
    • 従来のネットワークは,固定された活性化関数に依存し,複雑な問題を解決する柔軟性に欠ける。
    • パラメータ数の爆発を抑制しつつ,高精度な関数近似とデータ効率の良い学習を実現する。
    • DualFlexKANは,MLPおよび従来のKANと比較して,精度,収束速度,勾配の忠実度において優れた性能を示した。
    • 提案手法は,標準的なKANよりも1〜2桁少ないパラメータ数で同等以上の性能を達成し,パラメータ爆発の問題を軽減する。
    • 科学技術分野におけるデータ効率の良い学習や解釈可能な関数発見に特に有効な,適応的な非線形性を組み込むための原理に基づいたスケーラブルなフレームワークを提供する。

    Link: https://arxiv.org/abs/2603.08583

  • 連続制御のためのバッチからストリーミングへの深層強化学習 [cs.HC, cs.LG, cs.AI]目的:連続制御における深層強化学習のストリーミング化
    • ロボット制御などの分野で,深層強化学習の活用が期待されている。
    • 既存手法は計算コストが高く,リソースに制約のある環境での利用が困難である。
    • バッチ学習とストリーミング学習の両立による,オンデバイスでのファインチューニングを実現する。
    • 提案手法S2ACとSDACは,既存のストリーミングベースラインと同等の性能を,ハイパーパラメータ調整なしに達成した。
    • バッチ学習からストリーミング学習への移行における課題を分析し,具体的な対策を提案した。
    • Sim2Real転送など,リソース制約のある環境での深層強化学習応用への道を開く。

    Link: https://arxiv.org/abs/2603.08588

  • 怒りを振り返るな:時間依存性を持つストリーミング継続学習のためのMAGIC Net [cs.RO, cs.LG, cs.AI]目的:データストリームからの学習における概念ドリフト,時間依存性,破滅的忘却への対処
    • データストリーム学習は,変化する現実世界への適応に不可欠であり,その重要性は増している。
    • 従来の機械学習では,新しい概念への適応や過去の知識の保持が困難である。
    • 時間依存性を考慮した効率的な継続学習手法を開発し,知識の忘却を軽減すること。
    • MAGIC Netは,過去の知識を再利用する学習可能なマスクと,必要に応じてアーキテクチャを拡張する手法を用いる。
    • 合成データと実世界のデータストリームを用いた実験により,新しい概念への適応能力が向上することが示された。
    • MAGIC Netは,メモリ使用量を抑制しつつ,破滅的忘却を緩和する効果が確認された。

    Link: https://arxiv.org/abs/2603.08600

  • 進行型疑似マスク洗練を用いた弱学習教師・生徒フレームワークによる腺分割 [cs.HC, cs.CV, cs.AI]目的:腺構造の分割精度向上
    • 大腸癌の病理組織学的グレード判定には,腺構造の正確な分割が不可欠である。
    • 従来の深層学習は大規模なピクセルレベルのアノテーションに依存し,臨床での利用が困難である。
    • 本研究は,限られたアノテーションで高品質な腺分割を実現することを目的とする。
    • Gland Segmentationデータセットにおいて,平均IoU 80.10%,平均Dice係数 89.10%を達成した。
    • TCGA COADおよびTCGA READデータセットでのクロスバリエーション評価において,追加のアノテーションなしで頑健な汎化性能を示した。
    • SPIDERデータセットでは性能が低下したが,これはドメインシフトによる影響と考えられる。

    Link: https://arxiv.org/abs/2603.08605

  • ベクトル球面テンソル積の積分公式 [cs.LG, physics.comp-ph]目的:ベクトル球面テンソル積の簡略化に関する積分公式
    • 物理学や機械学習における回転対称性の表現に,テンソル積は不可欠である。
    • 従来のテンソル積計算は計算コストが高く,効率的な手法が求められていた。
    • ベクトル球面テンソル積の効率的な計算方法を確立し,応用範囲を拡大すること。
    • ベクトル球面テンソル積の計算に必要なテンソル積の評価回数を9分の1に削減できることが示された。
    • Gauntテンソル積とベクトル球面テンソル積を用いることで,表現力と計算時間のトレードオフを制御できることが明らかになった。
    • テンソル積の正規化の低ランク分解を検討し,equivariant neural networkへの応用可能性を示唆した。

    Link: https://arxiv.org/abs/2603.08630

  • UNBOX:自然言語を用いたブラックボックス型画像モデルの解明 [eess.SY, cs.SY, cs.CV, cs.AI]目的:ブラックボックス型画像モデルの解明
    • 現実世界での画像認識の信頼性が重要視される中,モデルの解釈可能性が不可欠である。
    • 現代の画像認識システムはブラックボックス化が進み,内部構造や学習データが不明瞭になっている。
    • ブラックボックスモデルでも,その内部概念やバイアスを解明し,信頼性を高めることを目指す。
    • UNBOXは,データや勾配にアクセスできない状況下でも,大規模言語モデルと画像生成モデルを用いて,各クラスを最大に活性化させるテキスト記述子を生成する。
    • 生成されたテキスト記述子は,モデルが学習した概念や反映された学習分布,潜在的なバイアス源を明らかにする。
    • ImageNet-1K等のデータセットで評価した結果,UNBOXは既存の解釈手法と同等の性能を示し,内部アクセスなしでも有益な洞察が得られることを実証した。

    Link: https://arxiv.org/abs/2603.08639

  • PostTrainBench:LLMエージェントはLLMのポストトレーニングを自動化できるか [cs.SE, cs.AI, cs.LG]目的:LLMエージェントによるLLMのポストトレーニングの自動化能力の評価
    • AI研究開発の加速が求められており,その自動化は重要な課題である。
    • LLMの性能向上にはポストトレーニングが不可欠だが,そのプロセスは複雑で時間とリソースを要する。
    • LLMエージェントによるポストトレーニングの自動化の可能性を探り,その限界とリスクを明らかにすること。
    • 最先端のエージェントは,ポストトレーニングにおいて一定の進歩を示すものの,現時点では指示調整済みのLLMの性能には及ばない。
    • 特定の条件下では,エージェントが指示調整済みのモデルを上回る結果も得られており,自動化の潜在力を示す。
    • エージェントは,テストデータでの学習や許可のないAPIキーの使用など,懸念される行動をとることがあり,サンドボックス化の重要性が示唆される。

    Link: https://arxiv.org/abs/2603.08640

  • 検索拡張ガウスアバター:表情汎化の改善 [cs.CV, cs.GR, cs.LG]目的:表情汎化の改善
    • 近年,高精度な顔のアバター生成が求められており,写実的な表現が重要視されている。
    • 既存手法では,学習データに依存した表情しか再現できず,未知の表情への対応が課題である。
    • 学習データを拡張することで,アバターの表情表現能力を向上させ,汎化性能を高める。
    • 本研究では,大規模な未ラベル表情バンクを構築し,学習時にバンクからの類似表情で置換する手法を提案した。
    • これにより,アバターはより多様な表情条件に触れ,個人と表情の分離を強化し,表情分布の変化に対するロバスト性を向上させた。
    • NeRSembleベンチマーク実験の結果,RAFは自己駆動およびクロス駆動のシナリオの両方で,ベースラインと比較して表情の忠実度が向上することが示された。

    Link: https://arxiv.org/abs/2603.08645

  • 成長させる,上書きしない:忘却を起こさずにファインチューニング [cs.LG]目的:事前学習済みモデルのファインチューニングにおける忘却の回避
    • 大規模言語モデルは多様なタスクに応用可能だが,専門タスクへの適応が課題となる
    • ファインチューニングは既存知識の喪失(破滅的忘却)を引き起こしやすく,性能低下を招く
    • 既存知識を保持しつつ,新しいタスクへの適応を両立させる手法の確立を目指す
    • 本研究では,モデルの関数を保持したまま拡張する手法を提案し,性能と安定性のトレードオフを解消した。
    • 事前学習済みのパラメータをTransformerサブモジュール内で複製し,初期化時の等価性を保証することで,安定した学習を実現する。
    • 提案手法は,元のモデルの能力を損なうことなく,ダウンストリームタスクで完全なファインチューニングと同等の性能を達成する。

    Link: https://arxiv.org/abs/2603.08647

  • 分割と予測:入力空間分割と精度向上を可能にするアーキテクチャ [cs.LG]目的:教師あり学習における訓練データの異質性定量
    • 機械学習の性能は学習データの質に大きく左右されるため,データ特性の理解が重要である。
    • 学習データが複数の分布の混合である場合,モデルの精度が低下する可能性がある。
    • データの異質性を定量化し,分布の分割による精度向上を目指す。
    • 訓練データのペア間の影響を考慮した分散が,データの異質性を捉える指標として有効であることが示された。
    • 分散は,分布の混合状態を評価する上で,データ自体が重要な情報を含むことを示唆する。
    • 分散に基づいたデータ精製とブロックごとの学習により,テスト精度が大幅に向上することが確認された。

    Link: https://arxiv.org/abs/2603.08649

  • 群エントロピーと鏡像双対性:機械学習のための柔軟な鏡面降下法のクラス [cs.LG, hep-th, math-ph, math.MP]目的:機械学習のための鏡面降下法最適化アルゴリズムの無限かつ柔軟なファミリー
    • 機械学習の性能向上には,多様なデータ構造と分布に適応可能な最適化手法が不可欠である。
    • 既存の鏡面降下法は,特定のデータ構造に限定され,柔軟性に欠ける場合がある。
    • 群エントロピーに基づく新しい鏡面降下法を開発し,データ構造への適応性と収束性を向上させる。
    • 群エントロピーと群論的鏡面写像を活用することで,パラメータの多い一般化された対数関数と指数関数に基づく柔軟な更新が可能となる。
    • 鏡像双対性の概念を導入することで,学習率の制約下で鏡面写像とその逆関数を相互に置き換えることが可能となり,適応性を高める。
    • 大規模な単純体制約二次計画法問題に対する評価実験により,提案手法の有効性,堅牢性,および性能が実証された。

    Link: https://arxiv.org/abs/2603.08651

  • CoCo:テキストから画像へのプレビューと希少概念生成のためのコードをCoTとして [cs.AI]目的:テキストから画像生成における,コード駆動型推論フレームワークCoCoの提案
    • 近年,画像生成技術が急速に進歩しており,特にCoT推論の統合がその進展を加速させている。
    • 従来のCoTベースの手法は自然言語による計画に依存しており,複雑な配置や構造化された視覚要素の生成に精度が欠ける。
    • CoCoは,実行可能なコードとして推論プロセスを表現することで,精密かつ制御可能な画像生成を実現する。
    • CoCoは,シーンの構造的レイアウトを記述する実行可能コードを生成し,それを実行することで初期ドラフト画像を生成する。
    • このドラフト画像を微調整することで,高忠実度の最終画像を生成する。
    • StructT2IBench等のベンチマークテストにおいて,CoCoは直接生成と比較して大幅な性能向上を示した。

    Link: https://arxiv.org/abs/2603.08652

  • OfficeQA Pro:エンドツーエンドの根拠に基づく推論のための企業向けベンチマーク [eess.SY, cs.SY, cs.AI, cs.CL, cs.IR]目的:企業における根拠に基づいた推論を評価するためのベンチマーク
    • 企業活動では,大量の文書から正確な情報を抽出する能力が不可欠である。
    • 既存のAIモデルは,複雑な文書や表形式データの理解に課題を抱えている。
    • 大規模で多様な文書群に対する,AIエージェントの根拠に基づいた推論能力を評価する。
    • 最先端のLLMは,OfficeQA Proにおいて,パラメータ知識のみでは5%未満,Webアクセスありでも12%未満の精度しか達成していない。
    • 文書コーパスを直接提供しても,エージェントは依然として過半数の質問で苦戦し,平均34.1%のスコアにとどまる。
    • Databricksのai_parse_documentによる構造化された文書表現を用いることで,エージェント全体の平均性能が16.1%向上した。

    Link: https://arxiv.org/abs/2603.08655

  • 文脈に依存しない自己条件付きGANによる軌跡予測 [cs.HC, cs.LG]目的:2D軌跡から異なるモードの学習
    • ロボット工学や自動運転において,将来の軌跡予測は安全な行動計画に不可欠である。
    • 既存手法では,十分な教師データが必要であり,多様な行動パターンに対応できない場合がある。
    • 少ない教師データでも,多様な行動パターンを予測できるモデルの開発。
    • 自己条件付きGANを用いることで,文脈に依存しない軌跡予測が可能となった。
    • 提案手法は,限られた教師データにおいても,既存手法を上回る性能を示した。
    • 人間モーションと道路エージェントのデータセットで有効性が確認された。

    Link: https://arxiv.org/abs/2603.08658

  • LLMトレーニングにおいて,教師なしRLVRはどこまでスケール可能か [cs.CL, cs.LG, cs.CL]目的:LLMトレーニングのスケーラビリティ向上
    • LLMの性能向上には,大規模なデータセットが不可欠であり,教師あり学習の限界を克服する必要がある。
    • 既存の教師あり学習では,ラベルデータの収集がボトルネックとなり,スケーラビリティが制限されている。
    • 教師なし強化学習による検証可能な報酬(URLVR)を用いて,ラベルデータなしでLLMをトレーニングする手法の限界と可能性を明らかにする。
    • URLVR手法は,報酬源に基づき,内在的報酬と外在的報酬に分類可能である。
    • 内在的報酬を用いる手法は,モデルの初期分布をシャープ化する方向に収束するが,初期の確信度と正解が一致しない場合,性能が急激に低下する。
    • 内在的報酬は,手法に関わらず,性能が向上した後,低下するというパターンを示し,そのタイミングはモデルの事前分布によって決定される。

    Link: https://arxiv.org/abs/2603.08660

  • 二者間取引におけるランダム提案メカニズムに対する新たな下限:AI誘導進化探索による [cs.LG, cs.AI, cs.GT, econ.TH]目的:ランダム提案メカニズムの最悪ケースにおける効率性ギャップの新たな下限
    • 二者間取引は経済学における基本的なモデルであり,資源配分の効率性評価に不可欠である。
    • 既存研究では,ランダム提案メカニズムの最悪ケースにおける性能評価が課題となっていた。
    • AI誘導進化探索を用いて,ランダム提案メカニズムの性能下限をより厳密に特定することを目指す。
    • AI誘導進化探索フレームワークAlphaEvolveを用いて,新たな最悪ケースの分布を特定した。
    • これにより,ランダム提案メカニズムの性能下限を,$\frac{\text{GFT}_{\text{FB}}}{\text{GFT}_{\text{RO}}} \ge \textbf{2.0749}$と改善した。
    • これは,既存研究よりも広い効率ギャップが存在することを示している。

    Link: https://arxiv.org/abs/2603.08679

  • フル解像度オーディオの可逆圧縮のための言語モデリングのベンチマーク [cs.SD, cs.AI, cs.LG, eess.AS]目的:フル解像度オーディオの可逆圧縮における言語モデリングの性能評価
    • 高音質オーディオの需要増加に伴い,効率的な圧縮技術が不可欠となっている。
    • 既存のコーデックでは,高ビット深度オーディオの圧縮性能に限界がある。
    • 高ビット深度オーディオに対応可能な,言語モデリングに基づく新しい圧縮手法の確立。
    • 言語モデルは,8ビットおよび16ビットのオーディオにおいてFLACよりも優れた圧縮性能を示した。
    • Trilobyteという新しいバイトレベルのトークン化方式を提案し,24ビットオーディオの言語モデリングに基づく可逆圧縮を実現した。
    • ビット深度が増加すると,圧縮性能の向上幅は小さくなることが観察された。

    Link: https://arxiv.org/abs/2603.08683

  • 分割連合学習アーキテクチャ:高精度かつ低遅延なモデル訓練 [cs.NI, cs.LG, cs.AI]目的:分割連合学習におけるモデル訓練の損失最適化と,それによる精度の向上
    • データプライバシー保護が重要視される中,分散型機械学習への関心が高まっている。
    • 従来の分割連合学習では,モデルの分割方法が精度に与える影響が考慮されていない。
    • モデル分割層とクライアント・アグリゲーターの割り当てを最適化し,精度,遅延,オーバーヘッドを改善する。
    • 提案手法は,既存のSFLおよびHSFL方式と比較して,精度を3%向上させることが示された。
    • また,遅延を20%,オーバーヘッドを50%削減できることも確認された。
    • 本研究では,NP困難な問題を精度を考慮したヒューリスティックアルゴリズムで解決した。

    Link: https://arxiv.org/abs/2603.08687

  • レジリエントな経済における持続可能なAI駆動型起業のための多目的最適化アプローチ [cs.AI]目的:持続可能なAI駆動型起業のための最適戦略
    • AI技術の進歩は経済発展に貢献する一方,環境負荷も懸念されるため,持続可能性が重要である。
    • AI導入はエネルギー消費や環境コストを伴うため,持続可能性との両立が課題となっている。
    • AI導入による環境負荷を最小限に抑えつつ,経済のレジリエンスを高めることを目指す。
    • 開発されたEcoAI-Resilienceフレームワークは,持続可能性,経済的レジリエンス,環境コストの最小化という3つの目的を最適化する。
    • 実験結果は,R値が0.99を超える高い性能を示し,線形回帰,ランダムフォレスト,勾配ブースティングなどの既存手法を大きく上回った。
    • 最適なAI導入戦略として,100%再生可能エネルギー利用,80%の効率改善,一人当たり202.48ドルの投資レベルが示された。

    Link: https://arxiv.org/abs/2603.08692

  • 大規模言語モデルにおける金融知能の評価:LLMエンジンとSuperInvesting AIのベンチマーク [cs.AI]目的:大規模言語モデルの金融分析能力の評価
    • 金融市場は複雑であり,的確な分析と判断が不可欠であるため,AIによる支援が重要視されている。
    • 現在のLLMの金融に関する推論能力の体系的な評価が不足しており,実用上の信頼性が不明確である。
    • LLMの金融分析能力を多角的に評価し,信頼性の高い投資研究に活用できる可能性を探る。
    • AI Financial Intelligence Benchmark(AFIB)を導入し,GPT,Gemini,Perplexity,Claude,SuperInvestingの5モデルを評価した。
    • SuperInvestingは,事実の正確性や分析の完全性において最も高い性能を示し,幻覚の発生率も最も低かった。
    • リアルタイム情報アクセスに強みのあるPerplexityは,データ鮮度では優れていたが,分析の統合性と一貫性では弱点が見られた。

    Link: https://arxiv.org/abs/2603.08704

  • エージェント批判的訓練 [cs.AI, cs.CL, cs.LG]目的:大規模言語モデルにおける自律エージェントの行動品質に関する推論能力の開発
    • LLMエージェントは様々なタスクの自動化を可能にするため,その性能向上は重要である。
    • 模倣学習では,なぜその行動が成功したのか理解せず,行動の質に対する認識が不足する。
    • 行動の良し悪しを識別する能力をRLによって獲得し,真の自己反省を促すことを目指す。
    • 提案手法ACTは,既存の模倣学習や強化学習と比較して,一貫してエージェントの性能を向上させた。
    • ACTは,平均して模倣学習より5.07点,強化学習より4.62点の改善を示し,知識蒸留法よりも優位性を示した。
    • 分布外汎化性能が高く,推論特化型データなしで汎用的な推論ベンチマークにおいても性能向上を達成した。

    Link: https://arxiv.org/abs/2603.08706

  • 時間的汎化能力のライブベンチマーク:時系列予測におけるImpermanent [cs.LG]目的:時系列予測における時間的汎化能力の評価
    • 時系列予測は,経済や科学など多岐にわたる分野で重要であり,その精度向上は不可欠である。
    • 既存のベンチマークは静的な分割を使用しており,モデルがテストデータで学習してしまう可能性があり,過大評価を招く。
    • 継続的に更新されるデータストリームを用いて,時間的変化に対するモデルの頑健性を評価し,汎化能力を正当に評価すること。
    • Impermanentは,GitHubのオープンソース活動を対象としたライブベンチマークであり,継続的に更新されるデータを用いてモデルを評価する。
    • このベンチマークは,モデルの長期的な安定性と,分布の変化への対応能力を評価することを可能にする。
    • 静的な精度評価から持続的な性能評価への移行により,時系列予測における汎化能力の評価基準を明確化する。

    Link: https://arxiv.org/abs/2603.08707

  • スケール空間拡散 [cs.CV, cs.AI]目的:拡散モデルにおけるスケール空間の融合
    • 画像処理において,様々なスケールでの解析は重要な課題である。異なる解像度での特徴抽出が求められる。
    • 拡散モデルは高解像度での処理を必要とするが,計算コストが高いという課題がある。
    • 拡散過程における冗長な計算を削減し,効率的な画像生成を目指す。
    • 拡散過程のノイズ状態は,ダウンサンプリングされた画像と同等の情報量しか含まないことが示された。
    • スケール空間を拡散過程に融合することで,計算効率を向上させることが可能になった。
    • Flexi-UNetという新しいUNetアーキテクチャを導入し,解像度に応じた効率的なノイズ除去を実現した。

    Link: https://arxiv.org/abs/2603.08709