arXiv雑要約

AI - 2026/03/19 公開

  • 活性化シグネチャに基づく表現認識アンラーニング:抑制から知識シグネチャの消去へ [cs.CL, cs.LG]目的:LLMからの選択的な知識消去
    • LLMの利用拡大に伴い,個人情報保護やモデルの安全性確保が重要課題となっている。
    • 既存のアンラーニング手法は,表面的な行動抑制と真の知識除去を混同し,潜在能力が残存する可能性があった。
    • 内部活性化シグネチャを対象とすることで,隠蔽と真の消去を区別し,確実な知識消去を実現することを目指す。
    • 提案手法KIFは,オラクルレベルに近い消去性能(FQ approx 0.99)を達成し,従来の消去と安定性のトレードオフを打破した。
    • 標準モデルでは規模に依存しない真の消去を確認し,推論優先モデルではアーキテクチャの根本的な違いを明らかにした。
    • 表面レベルの漏洩と潜在的痕跡の持続性を組み合わせた評価プロトコルにより,メカニズムレベルでの忘却行動の体系的な診断を可能にした。

    Link: https://arxiv.org/abs/2601.10566

  • 投機的デコーディング:性能か幻想か [cs.CL, cs.AI]目的:大規模言語モデル推論の加速手法である投機的デコーディングの有効性評価
    • 大規模言語モデルは自然言語処理の重要な要素であり,その効率的な推論が求められている。
    • 既存の評価は研究プロトタイプや小規模バッチサイズに依存し,実用的な状況での有効性が不明確である。
    • 実運用環境における投機的デコーディングの性能を詳細に分析し,改善の余地を示す。
    • 本研究では,実運用環境であるvLLMにおいて,様々な投機的デコーディング手法を体系的に評価した。
    • ターゲットモデルによる検証が実行時間を支配し,受容長はトークン位置,リクエスト,データセットによって大きく変動することが示された。
    • 測定された性能と理論上の上限との間に大きな乖離があり,投機的デコーディングの改善に向けた新たな研究機会が示唆された。

    Link: https://arxiv.org/abs/2601.11580

  • 階層的スコアマッチング空間からの勾配による大域的最適化 [cs.LG]目的:大域的最適化
    • 最適化問題は,機械学習や工学など幅広い分野で不可欠であり,効率的な解法が求められている。
    • 従来の勾配法は,局所最適解,制約条件,微分可能性の制約などがあり,複雑な問題への適用が困難であった。
    • 複雑な制約を持つ様々な最適化問題を,制約なしの階層的最適化問題として統一し,勾配法で解決することを目指す。
    • 本研究では,スコアマッチングによって得られた勾配を用いて,幅広い最適化問題を解く新しい手法を提案した。
    • 提案手法は,単純な構成の問題と複雑な実用的な問題の両方で有効性が検証された。
    • 大域的最適化と拡散モデルに基づいた生成モデリングとの間の深いつながりが明らかになった。

    Link: https://arxiv.org/abs/2601.11639

  • 低リソース機械翻訳における往復強化学習による改善 [cs.CL, cs.AI]目的:低リソース機械翻訳の改善
    • 言語多様性の維持が重要であり,少ないデータしかない言語への対応が課題である。
    • 低リソース言語の翻訳においては,十分な学習データが得られないという問題がある。
    • 往復ブートストラップと強化学習を組み合わせ,データ不足を補う手法を提案する。
    • NLLBモデル(600Mと1.3Bパラメータ)において,Central Aymara,Friulian,Wolofなどの複数言語で性能が向上した。
    • 翻訳結果の質的評価により,流暢性と意味の忠実度が増加することが確認された。
    • モデルの規模を拡大することで,さらに性能向上が期待できると考えられる。

    Link: https://arxiv.org/abs/2601.12535

  • YOLO26:リアルタイム物体検出のためのNMSフリーエンドツーエンドフレームワークの分析 [cs.CV, cs.AI]目的:リアルタイム物体検出のためのNMSフリーエンドツーエンドフレームワークYOLO26のアーキテクチャ分析
    • リアルタイム物体検出は,自動運転や監視システムなど,多くの応用分野で不可欠な技術である。
    • 従来のYOLOフレームワークではNMS処理が必要であり,遅延やハイパーパラメータ調整が課題であった。
    • NMSを排除し,エンドツーエンド学習戦略を採用することで,遅延を低減し,より効率的な物体検出を目指す。
    • YOLO26は,MuSGDオプティマイザ,STAL,ProgLossなどのメカニズムにより,NMSフリーで高性能を実現している。
    • COCO val2017データセットを用いたベンチマーク評価により,YOLO26は様々なモデル規模で,従来のCNNやTransformerベースのアーキテクチャと競争力のある性能を示した。
    • YOLO26は,表現学習と後処理を分離することで,エッジベースのコンピュータビジョンにおける「Export Gap」と決定的な遅延を改善する。

    Link: https://arxiv.org/abs/2601.12882

  • CARPE:アンサンブルによる文脈認識画像表現の優先度付け - 大規模視覚言語モデル向け [cs.CV, cs.AI]目的:大規模視覚言語モデルにおける画像表現の優先度付け手法
    • 視覚と言語の理解を組み合わせることで,AIの応用範囲が広がり,より高度なタスクが可能となる。
    • 大規模言語モデルとの整合性を重視するあまり,画像認識能力が低下することが課題である。
    • 画像とテキストのモダリティをバランス良く活用し,画像認識能力の向上を目指す。
    • CARPEは,画像の特徴量とテキスト表現を統合し,文脈に応じて重みを調整することで,モデルの性能を向上させる。
    • 画像分類と多様な視覚言語タスクにおいて,CARPEは既存手法よりも優れた性能を示すことが確認された。
    • モダリティのバランス調整が,大規模視覚言語モデルの汎化性能向上に不可欠であることが示唆された。

    Link: https://arxiv.org/abs/2601.13622

  • バイアス軽減の失敗:政府データの公平性における課題に関する事例研究 [cs.CL, cs.CY, cs.AI]目的:政府データの公平性における課題
    • AIを活用した行政サービスにおいて,公平性の確保は倫理的・法的観点から重要である。
    • 政府データには,構造や歴史的経緯から偏りが内在している場合が多い。
    • 標準的な偏り軽減手法でも,政府データに内在する不公平性を克服できない原因を特定する。
    • 広く採用されている偏り軽減手法が,政府データに対して必ずしも有効ではないことが示された。
    • 偏り軽減の失敗は,モデルの構造や評価指標の選択ではなく,データ自体の性質に起因することが明らかになった。
    • データの分布シフト,歴史的偏りの蓄積,データ公開の遅延などが,偏り軽減の妨げとなる要因として特定された。

    Link: https://arxiv.org/abs/2601.17054

  • 識別器駆動拡散モデルによる教師なし分解と再構成 [cs.CV, cs.AI]目的:複雑なデータの因子表現の分解と再構成
    • データ生成モデルにおいて,再利用可能な要素の発見と組み合わせは重要である。
    • 拡散モデルにおける因子空間の学習は,因子レベルの教師なしで行われるため困難である。
    • 識別器を用いた敵対的学習により,物理的・意味的な整合性の高い再構成を目指す。
    • 提案手法はCelebA-HQ,Virtual KITTI,CLEVR,Falcor3DでFIDスコアと解釈可能性指標で既存手法を上回った。
    • ロボット動画において,学習された行動要素を再構成することで,探索における状態空間の網羅性を向上させた。
    • 識別器を欺くように生成器を最適化することで,再構成における整合性が向上する。

    Link: https://arxiv.org/abs/2601.22057

  • クープマン演算子理論を用いたリアプノフ制約ソフトアクタークリティック (LC-SAC) によるクアッドローター軌道追従 [eess.SY, cs.LG, cs.RO, cs.SY]目的:クアッドローターの軌道追従における安定性保証
    • ロボット制御において,安全性と安定性は不可欠であり,複雑な環境下での高性能な制御が求められている。
    • 強化学習は不安定になりやすく,安全性が重要なシステムへの適用には安定性の保証が課題となっていた。
    • クープマン演算子理論を活用し,安定性を考慮した強化学習アルゴリズムを開発し,安全な軌道追従を実現すること。
    • 提案手法であるLC-SACは,従来のSACと比較して,リアプノフ安定性基準の違反が時間経過とともに減少することを示した。
    • 拡張動的モード分解(EDMD)を用いることで,システムの線形近似と適切なリアプノフ関数の導出が可能となった。
    • LC-SACは,非線形システムの安定化を保証するポリシーの学習に成功し,2Dクアッドローター環境での軌道追従において収束性を示した。

    Link: https://arxiv.org/abs/2602.04132

  • 強固でないシミュレータに注意:強化学習における報酬不要のバックドア攻撃 [cs.CR, cs.LG, cs.RO]目的:強化学習エージェントへのバックドア埋め込みの脅威とその対策
    • 強化学習は現実世界での実験コストを削減し,効率的な学習を可能にするため重要である。
    • シミュレータのセキュリティ対策が不十分であり,悪意のある改ざんの危険性がある。
    • 報酬を変更せずに,シミュレータを介してエージェントにバックドアを埋め込む手法を確立する。
    • 報酬を操作できない状況下でも,高い精度でバックドアを埋め込む攻撃手法「Daze」を提案した。
    • Dazeは,離散および連続アクション空間の両方において,バックドア攻撃の成功を理論的かつ実験的に保証する。
    • 実世界のロボットハードウェアへのバックドア攻撃の転移の第一例を示し,強化学習パイプライン全体のセキュリティ強化の必要性を示唆した。

    Link: https://arxiv.org/abs/2602.05089

  • プロンプトを意識した近傍蒸留による軽量な細粒度画像分類 [cs.CV, cs.AI, cs.LG, cs.MM]目的:細粒度画像分類のための軽量ネットワークへの知識蒸留
    • 画像とテキスト情報を活用した画像分類が重要視されている。
    • 既存手法では固定されたプロンプトに依存し,大域的なアライメントに課題がある。
    • プロンプトを意識した近傍蒸留により,軽量かつ高精度な分類を目指す。
    • 提案手法PANDは,4つの細粒度画像分類ベンチマークにおいて最先端手法を上回る性能を示した。
    • 特に,CUB-200データセットにおいて,ResNet-18モデルは76.09%の精度を達成し,VL2Liteを3.4%上回った。
    • PANDは,セマンティックな校正と構造的転送を分離することで,知識蒸留の効率を向上させている。

    Link: https://arxiv.org/abs/2602.07768

  • 思考の連鎖:適応的な認知モードによる推論 [cs.RO, cs.AI]目的:適応的な認知モードによる推論のオーケストレーション
    • 人間は問題解決において多様な思考様式を用いるため,その再現はAIの知能向上に不可欠である。
    • 既存のLLMは固定された思考様式で推論を進める傾向があり,問題解決の各段階に応じた柔軟性に欠ける。
    • 思考様式を段階的に変化させることで,より高度な問題解決能力を実現することを目指す。
    • 提案手法Chain of Mindset (CoM)は,空間,収束,発散,アルゴリズムの4つの思考様式を段階的に選択・適用する。
    • CoMはQwen3-VL-32B-InstructとGemini-2.0-Flashにおいて,既存の最先端手法をそれぞれ4.96%,4.72%上回る精度を達成した。
    • CoMは推論の効率性も維持しており,精度と効率性の両立を実現している。

    Link: https://arxiv.org/abs/2602.10063

  • ニューラル特性関数を用いたグラフドメイン適応における適応的分布アラインメント学習 [cs.LG, cs.AI]目的:グラフドメイン適応における分布アラインメント手法
    • グラフ構造データは現実世界に広く存在する。ラベル付きデータが少ない課題に対し,ドメイン適応が有効。
    • 既存手法は,手動で選択したグラフ要素のアラインメントに依存し,柔軟性に欠けるという課題がある。
    • 自動的に重要な差異を特定し,属性と構造の依存関係を捉えたアラインメントを実現する。
    • 提案手法ADAlignは,手動でのアラインメント基準の指定を必要とせず,シナリオに合わせた適応的なアラインメントが可能。
    • ニューラルスペクトル差異(NSD)を導入し,特徴と構造の依存関係を高次でエンコードすることで,多様な分布シフトに対応。
    • 10データセット,16タスクで最先端手法を上回り,メモリ使用量と学習時間の効率向上も確認された。

    Link: https://arxiv.org/abs/2602.10489

  • interwhen:テスト時モニタを用いた検証可能な推論のための一般化フレームワーク [cs.LO, cs.AI]目的:テスト時モニタを用いた推論の検証枠組み
    • 推論モデルの信頼性確保は,誤りを早期に発見し,より正確な結果を得るために重要である。
    • 既存手法では,最終的な答えのみ検証するか,計算コストが高い探索戦略を用いるため,効率的な検証が困難である。
    • 中間的な検証可能な特性に基づいてモデルの挙動を制御し,信頼性と効率性を向上させることを目指す。
    • interwhenは,推論過程の中間解を定期的に回収し,検証することで,モデルの早期誤りを検出する。
    • 検証の遅延を抑制するため,検証を非同期で行い,エラー検出時のみ推論を中断する設計を採用している。
    • コード生成や推論タスクにおいて,標準的なCoT実行と比較して最大15%の精度向上を実現し,計算コストも1.5倍以内に抑えられた。

    Link: https://arxiv.org/abs/2602.11202

  • GTS:学習可能なガウス思考サンプラーによる推論時の潜在的推論のスケーリング [cs.ET, cs.AR, cs.CL, cs.LG]目的:潜在的推論モデルにおける推論時のスケーリング手法
    • 潜在的推論は,複雑な問題解決において重要な役割を果たす。
    • 従来の推論時のスケーリングは,ノイズの強度に依存し,最適化が困難である。
    • ガウス思考サンプラー(GTS)により,制御可能で最適化可能なサンプリングを実現する。
    • GTSは,文脈に依存した摂動分布を予測し,暗黙的な確率的サンプリングポリシーを学習する。
    • 実験により,GTSが従来のヒューリスティックな手法よりも信頼性の高いスケーリングを実現することが示された。
    • 効果的な推論時のスケーリングには,単に確率性を増幅するだけでなく,より制御された最適化可能なサンプリングが不可欠である。

    Link: https://arxiv.org/abs/2602.14077

  • 分布に依存しない棄権を用いた逐次予測 [cs.LG, cs.DS, stat.ML]目的:分布に依存しない状況下における,棄権を許容した逐次予測手法の開発
    • 機械学習において,データ分布の仮定は学習性能に大きく影響する。分布に依存しない手法は,より現実的な応用が可能となる。
    • 敵対的データ挿入に対するロバストな逐次学習は難しく,既存手法では分布の事前知識が必要とされる場合がある。
    • 事前分布の知識を必要とせず,敵対的データ挿入に対してもロバストな逐次予測手法を確立すること。
    • 提案手法AbstainBoostは,分布に依存しない状況下でVCクラスに対して亜線形誤差を保証する。
    • 構造化された関数クラス(線形分類器など)に対しても同様の保証が得られる。
    • 誤分類誤差と誤った棄権回数の間に興味深い多項式的なトレードオフが存在することが明らかになった。

    Link: https://arxiv.org/abs/2602.17918

  • ロバストかつ汎用的な長期的爆風波予測のための深層サロゲートモデル [cs.LG]目的:長期的爆風波の予測精度向上
    • 爆風波の挙動は非線形性が高く,都市構造への影響評価が重要である。
    • 従来の数値シミュレーションは計算コストが高く,複雑な環境下での精度が課題である。
    • 複雑な環境や未知の条件下でも高精度な長期的予測を可能にすることを目的とする。
    • RGD-Blastは,従来の数値シミュレーションと比較して2桁以上の高速化を達成した。
    • 未知の建物配置に対する汎化性能評価で,平均RMSEは0.01以下,R2は0.89を超えた。
    • 爆風源の位置や爆薬重量の変動下での評価により,汎用性が確認された。

    Link: https://arxiv.org/abs/2602.18168

  • リアルな異常は不要:MLLMを活用したゼロショット動画異常検知 [cs.HC, cs.CV, cs.AI]目的:動画異常検知におけるゼロショット学習フレームワーク
    • 動画データは,監視や自動運転など,安全性確保に不可欠な情報源である。
    • 異常事象は稀であり,学習データの収集が困難であるため,検知性能が低い。
    • データ収集の課題を解決し,未知の異常にも対応可能な検知手法を開発する。
    • LAVIDAは,セグメント化されたオブジェクトを疑似異常として活用することで,モデルの未知の異常カテゴリへの適応性を高める。
    • MLLMを統合することで,文脈依存の異常セマンティクスをより深く理解し,検知精度を向上させる。
    • 逆Attentionに基づくトークン圧縮により,計算コストを削減しつつ,時間空間的なデータの制約に対応する。

    Link: https://arxiv.org/abs/2602.19248

  • 状態空間システムにおける分散型反事実推論のための連合因果表現学習 [cs.LG, cs.SY, eess.SY, stat.ML]目的:分散型反事実推論のための連合因果表現学習
    • 産業資産間の連携は重要であり,効率的な運用や故障予測に不可欠である。
    • クライアント固有のデータは高次元でプライバシーが課題であり,中央集権的な分析が困難である。
    • クライアントのローカルモデルを改変せず,分散環境で反事実推論を可能にすることを目指す。
    • 提案手法は,クライアントのデータを集約することなく,クライアント間の相互依存性を捉える連合学習フレームワークである。
    • 各クライアントは高次元の観測データを低次元の潜在状態にマッピングし,動的な変化と制御の影響を分離する。
    • 実験により,提案手法の拡張性と,合成データおよび実世界の産業制御システムデータセットにおける正確な反事実推論が示された。

    Link: https://arxiv.org/abs/2602.19414

  • 高密度スマートフォンGPS軌跡とTransformerモデルを用いた移動手段の検出 [cs.LG]目的:移動手段の検出
    • 都市計画や交通システム最適化において,人々の移動手段の把握は不可欠である。
    • 既存手法では,多様な環境下や不確実なデータに対して十分な精度が出せない場合がある。
    • 高密度GPSデータとTransformerモデルを用いて,より高精度な移動手段検出を実現すること。
    • 提案するSpeedTransformerは,従来の深層学習モデルを上回る性能を示した。
    • 少ないデータでのファインチューニングにより,地理的領域間の高い汎化性能が確認された。
    • 実環境実験においても,複雑な都市環境下で既存モデルを上回る安定した性能を発揮した。

    Link: https://arxiv.org/abs/2603.00340

  • 条件付きラグランジュ最適輸送によるハイパーパラメータ軌跡推論 [cs.CL, cs.LG, cs.AI]目的:ニューラルネットワークのハイパーパラメータと出力分布の変化の関係学習
    • ニューラルネットワークの性能はハイパーパラメータに大きく依存する。最適な設定は状況により変化するため,適応が重要である。
    • ハイパーパラメータ変更時の再学習はコストが高い。新たな環境への迅速な適応が課題となっている。
    • 観測データからハイパーパラメータの変化に伴う出力変化を予測し,再学習コストを削減することを目指す。
    • 提案手法は,条件付きラグランジュ最適輸送を用いて,ハイパーパラメータに依存するダイナミクスを学習する。
    • 学習されたラグランジュ関数と最適輸送マップにより,未観測のハイパーパラメータ設定での出力を予測する。
    • 多様なハイパーパラメータスペクトルにおいて,既存手法よりも高い精度でニューラルネットワークの出力を再構築できることを実証した。

    Link: https://arxiv.org/abs/2603.01771

  • 事前学習済み視覚言語行動モデルは,継続学習における忘却に対して驚くほど耐性がある [cs.CY, cs.LG, cs.AI, cs.RO]目的:継続学習における事前学習済み視覚言語行動モデルの忘却耐性
    • ロボットの継続学習は,時間の経過とともに新たなスキルを獲得しつつ,過去のスキルを維持することが重要である。
    • 既存研究では小規模モデルが中心で,大規模事前学習モデルにおける継続学習の挙動は未解明である。
    • 大規模事前学習モデルが示す忘却耐性のメカニズムを解明し,継続学習の動的変化を明らかにする。
    • 事前学習済みVLAモデルは,ゼロからの学習モデルと比較して,忘却に対する耐性が非常に高いことが示された。
    • 単純な経験再生(ER)手法でもVLAモデルに対しては高い効果を発揮し,少ない再生データ量でも忘却を抑制する。
    • 事前学習が継続学習性能に重要な役割を果たし,少量の再生バッファで忘却を軽減しつつ,転送学習能力を維持することが明らかになった。

    Link: https://arxiv.org/abs/2603.03818

  • SWE-CI:継続的インテグレーションによるコードベース維持におけるエージェント能力の評価 [cs.SE, cs.AI, cs.CL]目的:コードベースの維持能力に関するエージェントの評価
    • ソフトウェア開発は複雑化の一途を辿っており,長期的な品質維持が重要である。
    • 既存の評価方法では,長期的な変更や反復を考慮したコードの保守性が測れない。
    • 継続的インテグレーションのループを活用し,長期的な保守性を評価する新たなベンチマークの提供。
    • SWE-CIは,現実世界のコードリポジトリにおける233日間の進化履歴と71回のコミットを含む100のタスクで構成される。
    • エージェントは,分析とコーディングの反復を通じてタスクを体系的に解決する必要がある。
    • SWE-CIは,長期的な進化においてエージェントがコード品質を維持できるかどうかの貴重な洞察を提供する。

    Link: https://arxiv.org/abs/2603.03823

  • 薄いキー,完全な値:低次元注意選択によるKVキャッシュの削減 [cs.LG, cs.AI]目的:KVキャッシュサイズの削減
    • Transformerモデルの効率的な利用が重要であり,特に大規模言語モデルでは計算資源の制約が大きい。
    • 従来のTransformerでは,キーと値の次元数が固定されており,計算量とメモリ使用量の増加を招いている。
    • キーの次元数を削減し,値の表現能力を維持することで,KVキャッシュのサイズを効率的に削減することを目指す。
    • 提案手法では,キーの次元数を削減するために,Truncated SVDを用いてキー投影行列を因数分解する。
    • 既存のモデルに対して,SVDとQK Fine-tuningを組み合わせることで,KVキャッシュを最大75%削減し,わずかな品質低下で済む。
    • 7Bモデルで128Kのコンテキストを扱う場合,ユーザーあたり25GBのKVキャッシュを削減し,同時アクセスユーザー数を約60%増加させることが可能となる。

    Link: https://arxiv.org/abs/2603.04427

  • JAWS:空間適応的ヤコビアン正則化によるニューラル偏微分方程式ソルバーの長期ロールアウトの強化 [cs.LG, cs.AI, physics.comp-ph]目的:ニューラル偏微分方程式ソルバーの長期的なロールアウト性能の向上
    • 物理現象のシミュレーションにおいて,データ駆動型代理モデルの重要性が高まっている。
    • 自己回帰的時間ステップ法では,誤差の蓄積によりスペクトル爆発や非物理的な発散が起こりやすい。
    • 空間的な複雑さに応じて正則化の強さを適応的に調整することで,長期的な安定性を実現する。
    • JAWSは,スペクトル事前条件付けとして有効であり,短期間のメモリ効率の良い学習で長期的なベースラインの精度に匹敵する。
    • 粘性バーガース方程式および円柱周りの流れの検証により,JAWSの長期的な安定性,物理的保存則の保持,計算効率の優位性が確認された。
    • メモリ使用量の削減により,大規模流れ場の長期シミュレーションにおける安定性と効率が向上し,実用的な工学応用に適している。

    Link: https://arxiv.org/abs/2603.05538

  • LLM誘導によるGPUアーキテクチャ探索:ボトルネック分析を通じて [cs.CY, cs.HC, cs.AR, cs.AI]目的:GPUアーキテクチャの探索
    • AIワークロードの高性能化には,GPUアーキテクチャの最適化が不可欠である。
    • GPUの設計空間は広大であり,シミュレーションコストが高く,最適化が困難である。
    • LLMを活用し,効率的かつ効果的なGPUアーキテクチャ探索を実現する。
    • LUMINAは,シミュレータコードからアーキテクチャ知識を抽出し,探索ルールを自動生成する。
    • 470万通りの設計空間において,LUMINAはA100 GPUより高性能な6つの設計を効率的に特定した。
    • 機械学習ベースラインと比較して,探索効率が17.5倍,Pareto Hypervolumeが32.9%向上した。

    Link: https://arxiv.org/abs/2603.05904

  • LLMに基づく行動生成を有する自律エージェントのための階層的誤り修正グラフフレームワーク [cs.AI]目的:LLMに基づく行動生成を有する自律エージェントのための階層的誤り修正グラフフレームワーク
    • 近年のLLMの発展により,自律エージェントの複雑なタスク遂行能力が向上している。
    • LLMは幻覚や誤った推論を起こしやすく,自律エージェントの信頼性を損なう可能性がある。
    • タスクの質,信頼性,報酬,意味的推論に基づき,エラーの種類を特定し,原因を分析することで,エージェントの性能向上を目指す。
    • 本研究では,多次元転移可能戦略(MDTS)により,定量的な性能と意味的文脈の整合性を高め,高品質な戦略の選択と負の転移のリスクを低減した。
    • エラーマトリックス分類(EMC)を導入し,エラーを10種類に分類することで,タスク失敗の原因を詳細に分析し,的確なエラー修正と戦略最適化を可能にした。
    • 因果関係コンテキストグラフ検索(CCGR)により,過去の状態,行動,イベントシーケンスから構造的な関係性を捉え,複雑なタスクにおける戦略適応と実行信頼性を向上させた。

    Link: https://arxiv.org/abs/2603.08388

  • 不確実なアジャイル地球観測衛星スケジューリングのためのハイブリッド評価ベース遺伝的プログラミングによる効率的なポリシー学習 [cs.AI]目的:不確実なアジャイル地球観測衛星スケジューリング問題に対する効率的なスケジューリングポリシー
    • 宇宙技術開発の進展に伴い,アジャイル衛星の需要が高まっており,効率的なスケジューリング手法が不可欠である。
    • 従来のスケジューリング手法は,不確実性を考慮しておらず,計画されたスケジュールが最適でなくなる場合がある。
    • ハイブリッド評価による遺伝的プログラミングにより,計算コストを削減しつつ,高精度なスケジューリングを実現することを目指す。
    • 提案手法HE-GPは,既存の手法や単一評価ベースの遺伝的プログラミングと比較して,大幅に計算コストを削減した。
    • HE-GPによって生成された最適なポリシーは,多様なシナリオにおいて,最も高い平均ランキングを達成した。
    • HE-GPの平均学習時間は,完全評価のみを用いた遺伝的プログラミングと比較して,17.77%削減された。

    Link: https://arxiv.org/abs/2603.08447

  • 適応的チャネルプルーニングを活用した通信効率の高い分割学習 [cs.RO, cs.RO, cs.LG, cs.AI]目的:通信効率の向上
    • モバイルデバイス等の計算資源が限られた環境での機械学習の実現が重要である。
    • 分割学習では,中間特徴量の伝送量が通信ボトルネックとなりやすい。
    • 不要なチャネルを削減し,伝送データ量を削減することで通信負荷を軽減する。
    • 提案手法ACP-SLは,既存手法と比較してテスト精度で優れている。
    • 少ない学習ラウンド数で目標テスト精度に到達し,通信オーバーヘッドを削減する。
    • チャネル重要度をスコアリングすることで,重要なチャネルを効率的に保持する。

    Link: https://arxiv.org/abs/2603.09792

  • 自己内省を用いたメタ強化学習によるエージェント的探索 [cs.LG, cs.CL]目的:エージェント的探索のためのメタ強化学習フレームワーク
    • 複雑な環境下での効率的な探索は,AI研究における重要な課題である。
    • 従来の強化学習は,単一のエピソードでの学習に依存し,汎化性能が低い場合がある。
    • 過去のエピソードを活かした探索戦略の適応により,汎化性能の向上を目指す。
    • MR-Searchは,過去のエピソードと自己内省に基づき,探索戦略を適応させることで高い性能を発揮する。
    • 各エピソード後に自己内省を生成し,それをコンテキストとして活用することで,より効果的な探索を実現する。
    • 複数のベンチマークにおいて,既存手法と比較して9.2%から19.3%の相対的な改善が確認された。

    Link: https://arxiv.org/abs/2603.11327

  • 非教師型対称群発見による disentangled な表現学習 [cs.RO, cs.LG]目的:環境変換の群構造を利用した潜在的な変動要因の発見
    • 表現学習は,AIの汎化性能向上に不可欠であり,その重要性は増している。
    • 既存手法は,対称群の構造に関する事前知識や制約的な仮定が必要であった。
    • 環境との相互作用を通して,エージェントが自律的に対称群構造を発見することを目指す。
    • 提案手法では,最小限の仮定下で真の対称群分解の識別可能性を証明した。
    • 相互作用データからの群分解発見アルゴリズムと,特定の小群の特性を仮定しない LSBD 表現学習アルゴリズムを開発した。
    • 異なる群分解を示す3つの環境で,既存の LSBD 手法を上回る性能が確認された。

    Link: https://arxiv.org/abs/2603.11790

  • 双方向クロスアテンションと時間モデリングによる多Modal感情認識 [cs.CV, cs.AI]目的:野生環境における動画データからの感情認識手法
    • 感情認識は,人間とコンピュータの自然な対話を可能にするため,重要な研究分野である。
    • 実際の動画データでは,表情,背景,音声の変動が大きく,単一のModalでは正確な認識が困難である。
    • 本研究では,視覚情報と音声情報を融合し,時間的な変化を考慮することで,よりロバストな感情認識を目指す。
    • 提案手法は,ABAW10th EXPRベンチマークにおいて,Macro F1スコア0.32を達成し,ベースラインの0.25を上回った。
    • 視覚情報と音声情報の双方向クロスアテンション機構が,クロスModalな文脈理解と補完的な感情理解を促進することが示された。
    • 時間的な視覚モデリング,音声表現学習,クロスModal融合が,制約のない実環境でのロバストな感情認識に貢献することが明らかになった。

    Link: https://arxiv.org/abs/2603.11971

  • 現実世界AI評価:FRAMEが意思決定者の Dilemma を解決するための体系的証拠の創出 [cs.CY, cs.AI]目的:AIシステムの現実環境における挙動の体系的証拠
    • AI技術の急速な発展に伴い,組織におけるAIのガバナンスが重要となっている。
    • 既存の評価手法では,現実世界の多様性を捉えきれず,スケーラビリティと詳細なコンテキストのバランスが課題である。
    • AI利用状況と結果を追跡することで,現実世界の多様性を測定可能な信号へと変換し,スケーラビリティを確保する。
    • FRAMEは,大規模なAIシステムテストと,その利用状況の構造化された観察を組み合わせることで,この課題に取り組む。
    • Testing Sandboxにより,現実のワークフロー下でのAI利用状況を大規模に捕捉する。
    • Metrics Hubは,その利用状況の追跡データを,実行可能な指標へと翻訳する。

    Link: https://arxiv.org/abs/2603.13294

  • 人間中心AIにおける倫理的公平性:人口統計情報を用いないアプローチ [cs.CY, cs.AI, cs.LG]目的:人間中心AIにおける倫理的公平性の実現
    • AIは医療,教育など社会に浸透しており,倫理的かつ公平な判断が不可欠である。
    • 人口統計情報に基づく公平性確保は,プライバシー侵害や規制の問題がある。
    • 人口統計情報を用いずに,倫理原則に合致した公平性を実現することを目指す。
    • Flareは,最適化の幾何学に基づき,人口統計情報を用いずにアルゴリズムの公平性と倫理原則を整合させる。
    • Fisher情報を用いて,潜在的な格差を明らかにし,各サブグループの性能を向上させながら,全体的な安定性と倫理的バランスを維持する。
    • BHEという新しい評価指標を用いて,統計的パリティを超えた倫理的公平性の評価を実現し,様々なデータセットで有効性が示された。

    Link: https://arxiv.org/abs/2603.13373

  • イベント駆動型ビデオ生成 [cs.CV, cs.LG]目的:ビデオ生成におけるイベントに基づいたサンプリング
    • ビデオ生成技術は,コンテンツ制作やエンターテイメント分野で応用が期待されており,重要な研究分野である。
    • 既存のテキストからビデオ生成モデルは,単純な相互作用において不自然な動きやオブジェクトの不安定性を示す課題がある。
    • イベント駆動型のアプローチにより,ビデオ生成における物理的な相互作用の精度とリアリティを向上させることを目指す。
    • 提案手法EVDは,イベント予測ヘッドと損失関数,ゲート付きサンプリングを導入し,ビデオ生成時の不要な更新を抑制する。
    • EVD-Benchを用いた評価により,EVDは人間の選好度とVBenchのダイナミクスにおいて一貫して改善が認められた。
    • オブジェクトの持続性,空間精度,支持関係,接触安定性といった従来モデルの課題を大幅に軽減し,外観品質を維持している。

    Link: https://arxiv.org/abs/2603.13402

  • 大規模事前学習のための空間トランスクリプトミクスを画像として [cs.CV, cs.AI]目的:空間トランスクリプトミクスの大規模事前学習におけるデータ構成
    • 臨床・病理研究において,組織における空間情報は不可欠であり,空間トランスクリプトミクスはその情報を保持する。
    • 既存の事前学習方法では,空間依存性を無視するか,入力サイズが大きくなり学習効率が低下する問題がある。
    • 空間情報を保持しつつ,事前学習のためのサンプル数を増やすための新しいデータ構成方法を提案する。
    • 空間トランスクリプトミクスをクロップ可能な画像として扱うことで,空間コンテキストを維持しつつ,学習サンプル数を増加させる。
    • 遺伝子サブセット選択ルールを導入し,入力次元を制御することで,事前学習の安定性を向上させる。
    • 提案手法は,従来の事前学習スキームと比較して,下流タスクの性能を改善することが示された。

    Link: https://arxiv.org/abs/2603.13432

  • 車椅子向け社会認識型自律透明輸送ナビゲーションフレームワークSAATT Nav [cs.RO, cs.AI]目的:車椅子利用者の自律移動を支援する社会認識型自律透明輸送ナビゲーションフレームワーク
    • 移動困難な人々の生活の質を向上させるため,電動車椅子の操作負担軽減が重要である。
    • 既存の自律システムは社会性や意思決定の透明性に欠け,利用者の安全意識と信頼を損ねる場合がある。
    • LLMを活用し,社会的な状況を認識し,意思決定の根拠を提示することで,安全で信頼性の高いナビゲーションを実現する。
    • SAATT Navは,安全性,社会適合性,効率性,快適性の各指標において,標準的な経路計画や既存のモデルと比較して,多くの社会的状況で優れた性能を示した。
    • LLMによる社会状況の予測と,その根拠の言語的な説明が,車椅子利用者の信頼感と安心感の向上に貢献する可能性が示唆された。
    • 本研究は,社会認識型かつ透明性の高い自律ナビゲーションシステムが,車椅子利用者の自律移動を支援する上で有効であることを実証した。

    Link: https://arxiv.org/abs/2603.13698

  • REFINE-DP:強化学習によるヒューマノイドロボットのロコ・マニピュレーションのための拡散ポリシーのファインチューニング [cs.RO, cs.AI, cs.LG]目的:ヒューマノイドロボットのロコ・マニピュレーションにおける拡散ポリシーのファインチューニング手法
    • ヒューマノイドロボットの応用範囲は広く,人間のような複雑な作業を自動化する上で重要である。
    • ロボットと環境の複雑な相互作用や長時間のタスクにより,安定した動作制御が困難である。
    • オフラインで学習したプランナーと低レベルコントローラーの乖離による性能低下を改善する。
    • 提案手法REFINE-DPは,シミュレーション環境で90%以上の成功率を達成し,分布外のケースにも対応可能である。
    • 拡散ポリシーの勾配を用いた強化学習により,タスク成功率を向上させ,モーションの品質を改善する。
    • 実世界の動的な環境においても,滑らかな自律タスク実行を可能にする。

    Link: https://arxiv.org/abs/2603.13707

  • 「そんなに全部読まないよ」:エージェンティックコーディングアシスタントに対するソフトウェアエンジニアの認知的な関与度の理解 [cs.IR, cs.CL, cs.HC, cs.AI, cs.SE]目的:ソフトウェアエンジニアのエージェンティックコーディングアシスタントに対する認知的な関与と意味理解プロセスの調査
    • AIシステムの過信は批判的思考を損ない,現状維持を助長するリスクがある。特に自律性の高いAIは注意が必要。
    • ソフトウェア開発におけるアシスタントは,単なる自動実行ツールではなく,思考と理解を支援するものでなければならない。
    • 認知的な関与の低下と,アシスタントの反省・検証機能の不足という問題を解決し,より深い思考を促す設計を提案する。
    • ソフトウェアエンジニアは,タスクの進行とともに認知的な関与が低下する傾向にあることが明らかになった。
    • 現状のコーディングアシスタントのデザインは,反省,検証,意味理解のための機能が限られている。
    • より豊かな対話形式や認知を促す仕組みを取り入れ,AI支援プログラミングにおける関与度と思考の深さを維持する設計の可能性を示唆する。

    Link: https://arxiv.org/abs/2603.14225

  • ASAP:効率的なLVLM推論のための注意シフト対応プルーニング [eess.SY, cs.SY, cs.CV, cs.LG]目的:大規模視覚言語モデルの効率的な推論
    • 視覚と言語を統合するモデルの性能向上は,様々な応用分野で重要性が増している。
    • 高解像度画像処理の計算コストが高く,推論速度がボトルネックとなっている。
    • 注意機構に着目し,トークン冗長性を削減することで,計算コストを大幅に削減する。
    • ASAPは,訓練不要でKVキャッシュ互換性を持つプルーニング手法である。
    • 動的な双方向ソフト注意マスクにより,注意シフトを軽減し,重要なトークンを選択する。
    • 意味的に類似するトークンを統合することで,計算量を80%削減しつつ,性能を99.02%維持する。

    Link: https://arxiv.org/abs/2603.14549

  • 知識グラフ,セマンティック検索,説明可能なAIを用いたインテリジェントな求人マッチングプラットフォームJobMatchAI [cs.AI]目的:求人マッチングの最適化
    • 労働市場の効率化は経済成長に不可欠であり,適切な人材配置が鍵となる。
    • 従来のキーワード検索では,スキル同義語や多様なキャリアパスに対応できず,マッチング精度が低い。
    • スキル知識グラフとTransformer埋め込みを活用し,より精度の高い求人マッチングを実現すること。
    • JobMatchAIは,Transformer埋め込み,スキル知識グラフ,解釈可能な再ランキングを統合した実用的なシステムである。
    • スキル適合度,経験,勤務地,給与,企業選好度を考慮し,履歴書に基づいた検索ワークフローを通じて,要因別の説明を提供する。
    • 新しいベンチマークJobSearch-XSとハイブリッド検索スタックを公開し,スキル一般化能力を評価した。

    Link: https://arxiv.org/abs/2603.14558

  • 生成動画のトレーニング不要検出:空間的・時間的尤度に基づく手法 [eess.SY, cs.SY, stat.ME, cs.DB, cs.CV, cs.LG]目的:生成動画の検出
    • テキストや画像生成技術の進展に伴い,現実と区別がつかない動画が生成可能となり,偽情報対策が重要視されている。
    • 画像ベースの検出器は時間的情報を無視し,教師あり学習の動画検出器は未知の生成モデルへの汎化性能が低いという課題がある。
    • 合成データに依存せず,実データ統計との比較により,トレーニング不要かつモデル非依存な検出手法を確立すること。
    • 提案手法STALLは,空間情報と時間情報を確率的枠組みで統合し,尤度に基づく動画のスコアリングを実現した。
    • 既存の画像・動画ベースの手法と比較し,公開ベンチマークにおいて一貫して優れた性能を示した。
    • 最先端の生成モデルを含む新たなベンチマークComGenVidを用いて評価を行い,有効性を確認した。

    Link: https://arxiv.org/abs/2603.15026

  • 大規模バイオメディカル知識グラフ:Samyamaグラフデータベースによる構築,連合,AIエージェントアクセス [eess.SY, cs.SY, cs.DB, cs.AI, q-bio.QM]目的:大規模なバイオメディカル知識グラフの構築,連合,およびAIエージェントによるアクセス手法
    • バイオメディカル研究は複雑化しており,知識の統合が不可欠である。
    • バイオメディカル知識は分散しており,統合的な分析が困難である。
    • 多様なデータソースからの知識グラフ構築と効率的な統合を目指す。
    • オープンソースのバイオメディカル知識グラフを3種類構築し,経路,臨床試験,薬物相互作用を網羅した。
    • 異なる知識グラフの連合により,データセット間のプロパティベースの結合が可能となった。
    • スキーマ駆動型MCPサーバー生成により,LLMエージェントのアクセス性能が向上し,BiomedQAベンチマークで高い精度を達成した。

    Link: https://arxiv.org/abs/2603.15080

  • 目標指向制御のメカニズム的基盤 [cs.LG, cs.SY, eess.SY]目的:目標指向制御のメカニズム的解明
    • 人工知能の安全性と信頼性向上には,モデルの内部動作の理解が不可欠である。
    • 具現化された制御システムに対するメカニズム的解釈は,シーケンス予測アーキテクチャに限定されていた。
    • 乳児の運動学習をモデルシステムとして,メカニズム的解釈の枠組みを拡張し,制御回路の形成過程を明らかにする。
    • 基礎的な誘導バイアスが,因果的制御回路を生み出し,学習されたゲーティングメカニズムが理論的に動機づけられた不確実性閾値に収束することが示された。
    • アービトレーションゲートにおける明確な相転移が観察され,そのコミットメント行動は指数移動平均の近似式によってよく記述された。
    • 文脈窓の大きさkが回路形成の重要なパラメータであり,kが小さいとメカニズムが形成されず,大きいとゲートの確信度が対数的に増加することが明らかになった。

    Link: https://arxiv.org/abs/2603.15248

  • NV-Bench:表現豊かな音声合成のための非言語性発声合成のベンチマーク [cs.SD, cs.AI, eess.AS]目的:非言語性発声の合成評価のための標準化されたベンチマーク
    • 近年のTTS技術の発展に伴い,より自然な表現が求められている。
    • 非言語性発声の評価には標準的な指標や信頼性のある基準データがない。
    • 非言語性発声をコミュニケーション行為として捉え,評価の標準化を図る。
    • NV-Benchは,14種類の非言語性発声カテゴリを含む1,651件の多言語データセットである。
    • 提案された評価プロトコル(Instruction Alignment,Acoustic Fidelity)と人間の知覚との間に強い相関が認められた。
    • NV-Benchは,非言語性発声合成の標準的な評価フレームワークとして有効であることが示された。

    Link: https://arxiv.org/abs/2603.15352

  • 深層学習とフローによる近似率 [cs.RO, cs.LG, math.DS]目的:深層残差ネットワークの近似能力
    • 深層学習の理論的理解は,その高度な性能を支える基盤となる。
    • 近似の効率性に関する定量的な評価が不足している。
    • 深層学習における近似メカニズムの解明を目指す。
    • 深層残差ネットワークの近似能力は,連続力学系として捉えることができる。
    • 最小時間距離は,微分同型写像上のサブ・フィンズラー多様体における測地距離として特定される。
    • 学習効率と学習アーキテクチャの適合性が関連することが示唆された。

    Link: https://arxiv.org/abs/2603.15363

  • 理解度に基づいたエージェント経済:AI経済主体に対する堅牢性優先アーキテクチャ [cs.AI]目的:AI経済主体の堅牢性を重視したアーキテクチャ
    • AIが経済活動を行う機会が増加しており,その安全性確保が重要課題となっている。
    • 既存のフレームワークは,AIの能力評価に偏重し,実際の運用における堅牢性を軽視している。
    • AIの堅牢性を検証可能な理解度関数に紐付け,経済的権限を制限することで安全性を高める。
    • 本研究では,制約遵守,認識整合性,行動整合性という3つの堅牢性次元に基づいてエージェントの経済的権限を段階的に制御する「理解度に基づいたエージェント経済(CGAE)」を提案する。
    • CGAEは,経済的リスクを堅牢性のレベルに応じて制限し,AIエージェントが堅牢性の向上に投資するインセンティブを与える。
    • シミュレーションにより,システム全体の安全性が経済規模の拡大に伴い低下しないことが示された。

    Link: https://arxiv.org/abs/2603.15639

  • 未知を知る:多岐にわたる証拠に対する確率的推論のための潜在的後方因子モデル [cs.AI, cs.LG]目的:多岐にわたる証拠からの確率的推論の枠組み
    • 現実世界の意思決定には,不確実な情報統合が不可欠である。税務判断から医療診断まで,様々な場面で重要となる。
    • 既存手法は,不確実性の定量化が不十分,または構造化されていないデータへの適用が困難であるという課題がある。
    • 潜在的後方因子モデルを用いて,非構造化データに対する効率的かつ正確な確率的推論を可能にすることを目的とする。
    • 潜在的後方因子(LPF)は,VAEの潜在表現をSPNの推論に活用し,不確実性の定量化と推論の精度を両立した。
    • LPF-SPNは,8つのドメイン(7つの合成データセットとFEVERベンチマーク)において,高い精度(最大97.8%),低い較正誤差(ECE 1.4%)を示した。
    • 既存のEDL,LLM,グラフベースのモデルと比較して,有意に高い性能を達成し,再現性のある結果が得られた。

    Link: https://arxiv.org/abs/2603.15670

  • 潜在事後因子に関する理論的基礎:多角的証拠推論の厳密な保証 [cs.AI, cs.IT, cs.LG, math.IT, stat.ML]目的:確率的予測タスクにおける多種多様な証拠項目の統合
    • 医療診断,金融リスク評価など,重要な分野で多角的証拠推論が不可欠である。
    • 既存手法は,厳密な保証がないか,多角的証拠に対応できない。
    • 信頼性の高い多角的証拠推論を実現する理論的基盤を確立する。
    • 潜在事後因子(LPF)の理論的特性を完全に明らかにした。
    • 校正誤差,モンテカルロ誤差,PAC-Bayes boundなど,7つの厳密な保証を証明した。
    • 実験により,LPFが安全性重視の応用において信頼性のあるAIの基盤となりうることを示した。

    Link: https://arxiv.org/abs/2603.15674

  • 工学設計とシステム工学におけるデータセットのナビゲーションマップに関するフレームワークとプロトタイプ [cs.SE, cs.AI, cs.CE, cs.DB, cs.DL]目的:工学設計とシステム工学におけるデータセットのナビゲーションマップ
    • システムライフサイクル全体でのデータ活用は,イノベーションを促進する鍵となる。
    • 既存のデータセットは分散しておりアクセスしにくく,研究の進捗を妨げている。
    • データセットの分類と発見を容易にし,データ駆動型研究を加速することを目指す。
    • 本研究では,ドメイン,ライフサイクル段階,データ型,形式でデータセットを分類する多次元分類体系を提案した。
    • 知識グラフデータモデルを用いたインタラクティブな探索ツールのアーキテクチャとプロトタイプを開発した。
    • 初期段階の設計やシステムアーキテクチャにおけるデータ不足と,保守や自律システムにおけるデータ豊富さの現状を明らかにした。

    Link: https://arxiv.org/abs/2603.15722