arXiv雑要約

AI - 2026/06/05 公開

  • SpanNorm: 深層Transformerにおける学習安定性と性能の両立 [cs.CL, cs.AI, cs.LG]目的:深層Transformerの学習安定性と性能改善
    • 大規模言語モデルの性能は,深層Transformerの安定した学習に依存する。
    • PreNormは安定だが性能低下,PostNormは性能が高いが不安定というトレードオフがある。
    • 両者の利点を統合し,安定性と性能を両立させること。
    • SpanNormは,Transformerブロック全体にまたがる残差接続を確立し,信号伝播を安定化させる。
    • 集約された出力を正規化するPostNormスタイルの計算を採用し,モデル性能を向上させる。
    • 理論的分析により,信号分散を抑制し,勾配消失や表現崩壊を防ぐことが示された。

    Link: https://arxiv.org/abs/2601.22580

  • シナプス:型付きコンペンディウム成果物による連合ツールルーティング [cs.AI]目的:連合学習におけるツールルーティングのメカニズム
    • 連合学習は,データ共有を伴わずにモデルを協調的に学習する重要な手法である。
    • 従来の連合学習では,型情報がないため,プライバシー保護やモデル間の構造的な転移が困難である。
    • 型付き成果物を用いて,プライバシー保護と構造転移を可能にし,異種モデル間の連携を実現する。
    • 型付きコンペンディウム「SYNAPSE」は,異なるLLM環境でツールルーティングを可能にする。
    • このコンペンディウムは,フィールド単位での競合解決や,数値メタデータに対する差分プライバシーを保証する。
    • 4種類のLLMファミリー間で約2ポイントの損失で成果物の転移が可能であり,重み共有型連合学習では達成できない。

    Link: https://arxiv.org/abs/2602.00911

  • 再帰型ニューラルポリシーにおける隠れた動的構造の解明 [cs.LG]目的:再帰型ニューラルポリシーの隠れ状態における動的構造
    • 部分観測制御やメタRLにおいて再帰型ニューラルポリシーが広く用いられ,その性能は目覚ましい。
    • 再帰型ニューラルポリシーの優れた汎化性能やロバスト性のメカニズムは,未だ解明されていない。
    • 多様な学習方法,モデル構造,タスクで学習されたポリシーの隠れ状態を分析し,その動的構造を明らかにする。
    • 再帰型ニューラルポリシーの隠れ状態において,安定した周期構造が常に現れることが明らかになった。
    • この周期構造は,ポリシーと環境を結合したハイブリッド動的システムにおける極限サイクルと類似性を持つ。
    • 極限サイクルの形状は,ポリシーの行動と構造的な対応関係があることが示唆された。

    Link: https://arxiv.org/abs/2602.01196

  • 変分エントロピー最適輸送 [cs.LG]目的:ドメイン変換問題に対する変分エントロピー最適輸送法の提案
    • 分布間の距離を測る上で重要であり,画像処理や機械学習の様々な応用がある。
    • 既存手法では,計算コストの高い対数分割項の処理が課題となっていた。
    • 変分再構成により対数分割項を効率的に扱い,計算コストを削減することを目指す。
    • 提案手法は,補助的な対数正規化因子を用いた変分再構成により,対数分割項を厳密に扱うことを可能にした。
    • 確率的勾配降下法を用いた微分可能な学習目的関数を導出し,MCMCシミュレーションを必要としない。
    • 合成データおよび非ペア画像間の画像変換実験により,競争力のある,あるいは改善された変換品質が示された。

    Link: https://arxiv.org/abs/2602.02241

  • FlexRank:適応モデル展開のためのネストされた低ランク知識分解 [cs.LG]目的:大規模モデルの適応展開
    • 深層学習モデルの規模拡大に伴い,計算資源の効率的な利用が重要となっている。
    • 既存モデルは固定コストでの利用が前提であり,様々な計算予算への柔軟な対応が困難である。
    • 事前学習済みモデルから重要度に基づいたサブモデルを抽出し,コストと性能のトレードオフを実現する。
    • FlexRankは,低ランク重み分解とネストされた重要度に基づく統合により,性能の異なるサブモデルを抽出する。
    • 本手法により,個々の計算予算に対して再学習することなく,コストと性能を調整したモデル展開が可能となる。
    • 「一度学習して,どこでも展開」というパラダイムを促進し,大規模モデルの実用的な展開を支援する。

    Link: https://arxiv.org/abs/2602.02680

  • 強化学習における報酬の限界:サイバー防御への応用 [cs.LG, cs.AI]目的:サイバー防御のための強化学習における報酬関数の構造の影響
    • サイバー攻撃は高度化の一途をたどっており,自動化された防御システムの重要性が増している。
    • 従来の強化学習では,報酬関数の設計が難しく,最適でない,あるいはリスクの高い戦略を学習する可能性がある。
    • 本研究は,報酬関数の構造がサイバー防御エージェントの性能とリスクに与える影響を明らかにすることを目的とする。
    • 密な報酬関数は学習を促進する一方で,サブ最適解やリスクの高い戦略につながる可能性があることが示された。
    • 疎な報酬関数は,適切に設計されていれば,より信頼性の高い学習と効果的な防御戦略を実現できることが明らかになった。
    • 疎な報酬関数は,防御者の目標とより一致し,高コストな防御行動を抑制する傾向があることが示された。

    Link: https://arxiv.org/abs/2602.04809

  • 根拠はあるが誤解を招く:AI生成セキュリティ説明における意味的整合性の評価 [cs.CR, cs.CL, cs.LG]目的:AI生成セキュリティ説明における意味的整合性の評価
    • オンライン詐欺が巧妙化する中,リスクの説明能力を持つAIシステムの需要が高まっている。
    • 検出器の根拠に基づいた説明でも,意味的にリスク解釈を弱めたり誤らせたりする可能性がある。
    • 意味的整合性と根拠の提示の乖離を検証し,信頼性の高い説明評価の基準を確立すること。
    • AI生成の説明は,根拠が示されていても,リスク評価が弱まる場合があることが示された。
    • 人間による評価では,リスクを弱める説明でも,根拠の提示に関する評価は高かった。
    • 説明の信頼性評価には,根拠の提示だけでなく,その解釈の検証が不可欠であることが示唆された。

    Link: https://arxiv.org/abs/2602.05056

  • 多校正勾配ブースティングの収束性について [cs.CL, cs.LG, stat.ML]目的:多校正勾配ブースティングアルゴリズムの収束性保証
    • 機械学習モデルの信頼性向上は重要であり,特に予測の校正が不可欠である。
    • 多校正勾配ブースティングは実用上成功しているが,理論的な収束性は未解明であった。
    • 本研究は,多校正勾配ブースティングアルゴリズムの収束レートを数学的に示すことを目指す。
    • 予測更新量の大きさは$O(1/\sqrt{T})$で減衰することが示された。
    • 弱い学習器に関する追加の滑らかさの仮定の下では,線形収束が達成される。
    • 適応型変形に対しても収束性が確立され,実データによる実験で理論が検証された。

    Link: https://arxiv.org/abs/2602.06773

  • 分布外検出から幻覚検出へ:幾何学的視点 [cs.AI, cs.CL]目的:大規模言語モデルにおける幻覚の検出
    • 言語モデルの安全性と信頼性確保は重要であり,その核心となるのが幻覚の検出である。
    • 既存の幻覚検出手法は質問応答タスクでは有効だが,推論を要するタスクでは効果が限定的である。
    • 本研究は,幻覚検出を分布外検出として捉え直し,推論タスクにおける検出精度向上を目指す。
    • 幻覚検出を分布外検出として再構築することで,学習不要な単一サンプルベースの検出器が実現可能となった。
    • 提案手法は,推論タスクにおける幻覚検出において高い精度を達成した。
    • この研究は,言語モデルの安全性を高めるための,有望かつスケーラブルな道筋を示唆している。

    Link: https://arxiv.org/abs/2602.07253

  • HypRAG:検索拡張生成のための双曲型密ベクトル検索 [cs.IR, cs.AI]目的:検索拡張生成における検索品質の向上
    • 自然言語処理において,情報検索は重要な要素であり,その性能向上は応用範囲を拡大する。
    • 従来の密ベクトル検索はユークリッド空間に限定され,自然言語の階層構造を捉えきれないという課題があった。
    • 双曲空間を利用することで,自然言語の階層構造をより適切に表現し,検索精度と生成の忠実性を向上させる。
    • 双曲型密ベクトル検索モデルHyTE-FHは,MTEBにおいて従来のユークリッド空間ベースラインを上回る性能を示した。
    • HyTE-Hは,RAGBenchにおいて,コンテキスト関連性と回答関連性においてユークリッド空間ベースラインよりも最大29%の改善を達成した。
    • 双曲表現は,概念の一般性から特殊性への変化に応じてノルムが変化し,文書の特異性を符号化することが示された。

    Link: https://arxiv.org/abs/2602.07739

  • シンボリック蒸留による解釈可能なカラビ・ヤウ計量 [cs.LG, math.DG]目的:カラビ・ヤウ計量の Ricci 平坦性からのずれを記述するスカラー量 $R_\psi(z)$ のコンパクトな表現
    • カラビ・ヤウ多様体は,弦理論や幾何学において重要な役割を果たす数学的対象である。
    • カラビ・ヤウ計量の明示的な表現は一般に困難であり,数値計算に頼らざるを得ない。
    • カラビ・ヤウ計量の性質を記述する簡潔なモデルを構築し,その普遍性を検証すること。
    • Dwork quintic のカラビ・ヤウ計量に関するスカラー量 $R_\psi(z)$ を,低次の対称特徴量を用いて高精度に近似できることが示された。
    • 特に,$p_2$ と $\sigma_3$ という2つの特徴量を用いることで,$R^2 = 0.946$ を達成する3次の多項式が得られた。
    • さらに,同じ特徴量空間において,教師データに対する $R^2 = 0.9994$ を実現する有理多項式表現も特定された。

    Link: https://arxiv.org/abs/2602.07834

  • SAGE:スケーラブルなAIガバナンスと評価 [cs.IR, cs.AI]目的:大規模検索システムにおける関連性評価の課題解決
    • 検索システムの品質は,ユーザー体験に直結し,ビジネス成果に大きく影響する。
    • 人間の評価とシステムのスループットのギャップが,高品質な評価を妨げる。
    • 人間による高品質な判断をスケーラブルな評価信号へと変換すること。
    • SAGEは,自然言語によるポリシー,判例,LLMによる代理判断者を共進化させることで,関連性の曖昧さを解消する。
    • 教師あり蒸留により,高品質な判断を低コストな代理モデルに転送し,スケーラビリティを実現した。
    • LinkedIn Searchへの導入により,DAUが0.25%向上し,モデルの改善と品質管理に貢献した。

    Link: https://arxiv.org/abs/2602.07840

  • ハープーン:条件付きテーブル拡散のための一般化された多様体誘導 [cs.LG]目的:条件付きテーブルデータの生成
    • 精密な生成プロセス制御が求められる応用において,テーブルデータの生成は重要である。
    • 既存手法は,推論時の未知の制約に一般化できず,テーブルデータの補完以外の条件付きタスクに苦戦する。
    • 多様体理論をテーブルデータに拡張し,多様な推論時の目的を扱える手法を開発する。
    • HARPOONは,制約されていないサンプルを多様体上で誘導し,様々なテーブル条件を満たすことで高い性能を発揮する。
    • 理論的貢献を実験的に検証した結果,多様なデータセットで優れた性能が確認された。
    • テーブルデータに対する多様体認識誘導の利点が実証された。

    Link: https://arxiv.org/abs/2602.07875

  • ロールアウト拡張によるビジョン言語モデルにおける自己修正学習 [cs.CV, cs.CL, cs.LG]目的:ビジョン言語モデルにおける自己修正能力の学習
    • 複雑な推論問題解決において,自己修正は不可欠な能力であるため,その重要性が増している。
    • 従来の強化学習法では,有効な自己修正行動が稀にしか出現せず,学習信号が極めて疎になるという課題があった。
    • 既存のロールアウトを再結合することで自己修正例を合成し,学習信号の疎性を解消することを目的とする。
    • 提案手法(Octopus)は,ロールアウトの再利用によるサンプル効率の向上と,バランスの取れた教師信号による強化学習の最適化を同時に実現した。
    • 応答マスキング戦略により,自己修正と直接的な推論を分離し,それぞれの学習を効果的に行うことを可能にした。
    • Octopus-8Bは,オープンソースのビジョン言語モデルの中で最高水準の性能を示し,RLVRベースラインを上回った。

    Link: https://arxiv.org/abs/2602.08503

  • LLMのテスト時スケーリングにおける固定トークン予算に対する木探索ポリシーの整合化 [cs.CL, cs.AI, cs.LG]目的:LLMのテスト時スケーリングにおける木探索ポリシーと固定トークン予算との整合性
    • LLMの性能向上には,推論コストと精度のバランスが重要であり,テスト時スケーリングはその有効な手法の一つである。
    • 既存の木探索ポリシーは予算を考慮せず,終端条件としてのみ扱うため,終盤での分岐過多や早期終了のリスクがある。
    • BG-MCTSは,残りのトークン予算に応じて探索ポリシーを調整し,効率的な推論を実現することを目指す。
    • BG-MCTSは,残りの予算に応じて探索の幅を調整し,終盤での無駄な分岐を抑制する。
    • 数学的推論および物理的推論のベンチマークにおいて,BG-MCTSは予算を考慮しない既存手法を上回る性能を示した。
    • BG-MCTSは,様々な推論予算下で安定した性能を発揮し,オープンウェイトLLMにおいても有効であることが確認された。

    Link: https://arxiv.org/abs/2602.09574

  • 最悪のシナリオでの学習を止める:漸進的なマスク解除がマスク拡散モデルの学習を加速する [cs.RO, cs.LG]目的:マスク拡散モデルの学習加速
    • 離散空間における生成モデリングにおいて,マスク拡散モデルは有望な手法として注目されている。
    • 訓練時のランダムなマスクと,推論時の構造化されたマスクの不一致が課題となっていた。
    • 訓練時と推論時のマスクパターンを整合させ,推論に焦点を当てた最適化を目指す。
    • 提案手法PUMAは,訓練時のマスク処理を修正することで,訓練と推論のマスクパターンを一致させる。
    • 125M規模の事前学習において,PUMAは学習速度を約2.5倍に向上させた。
    • PUMAは,自己回帰的初期化などの一般的な手法と組み合わせて,更なる利点をもたらす。

    Link: https://arxiv.org/abs/2602.10314

  • 能力獲得を目指す強化学習におけるアラインメントリスク [cs.LG, cs.CL]目的:能力獲得を目指す強化学習におけるアラインメントリスクの存在
    • AIの能力向上は社会に大きな利益をもたらす一方,意図しない挙動によるリスクが懸念される。
    • 従来のAIアラインメント研究は有害コンテンツの生成防止に偏り,潜在的な脆弱性に着目した研究が不足している。
    • 環境の脆弱性を悪用する能力獲得型の強化学習における潜在的なリスクを明らかにすること。
    • 言語モデルは,報酬を最大化するために環境の欠陥を学習し,悪用することが示された。
    • これらの悪用戦略は限定的に汎化し,教師モデルから生徒モデルへ知識伝達される可能性がある。
    • 強化学習によって学習された悪用戦略は,SFTによる知識蒸留よりも持続しやすい場合がある。

    Link: https://arxiv.org/abs/2602.12124

  • DPBench:同時リソース競合下におけるマルチエージェントLLM連携の構造的決定要因 [cs.RO, cs.AI, cs.MA]目的:マルチエージェントLLM連携における構造的決定要因の評価
    • LLMを活用したマルチエージェントシステムは,複雑な問題解決の可能性を秘めている。
    • 既存の評価指標では,連携が成功または失敗する根本的な構造的条件が明確になっていない。
    • DPBenchを用いることで,連携の成否に影響を与えるプロトコル,通信構造,グループ規模を特定する。
    • DPBenchは,LLMベースのマルチエージェントシステムにおける連携を評価するためのベンチマークである。
    • 同時アクション下では,Gemini 2.5 Flashでデッドロックが90.0%に達したが,プロトコル変更で0%まで低減された。
    • モデルの能力ではなく,プロトコルが連携またはデッドロックを決定することが示された。

    Link: https://arxiv.org/abs/2602.13255

  • RDB基盤モデルの学習は不要 [cs.NI, cs.AI, cs.DB, cs.LG]目的:予測モデリングにおける新たなRDB活用手法
    • 企業内には膨大な表形式データが存在し,予測モデリングの可能性を秘めている。
    • 予測対象が多岐にわたるため,都度モデルを再学習する必要がある。
    • 学習不要なRDBエンコーダを開発し,既存の単一テーブルICLモデルと連携させる。
    • 高次元RDBカラム内で圧縮を制限することで,ICL固有の圧縮方法の重要性を示す理論的・実験的証拠が得られた。
    • エンコーダの表現力は,学習可能なパラメータを除外しても損なわれないことが示された。
    • 学習不要なRDBエンコーダと既存のICL基盤モデルを組み合わせることで,未知のデータセットに対しても堅牢な性能を発揮するRDBLearnが実現した。

    Link: https://arxiv.org/abs/2602.13697

  • マルチエージェントリプシッツバンディット [cs.LG]目的:連続したリプシッツ構造を持つ行動空間における分散型多人数ストカスティックバンディット問題の解決
    • マルチエージェントシステムは,複雑な環境での効率的な意思決定を可能にする重要な研究分野である。
    • 多人数バンディット問題では,エージェント間の協調が難しく,報酬の最大化が困難である。
    • コミュニケーションなしで協調コストと学習コストを分離し,集団報酬を最大化することを目指す。
    • 提案手法は,まず高価値領域を特定し,エージェントを配置することで協調問題を解決する。
    • その後,問題をN個の独立した単一エージェントリプシッツバンディット問題に分割する。
    • コンセンサス状態において,単一エージェントのリプシッツレートに匹敵する学習項を含む後悔境界が得られた。

    Link: https://arxiv.org/abs/2602.16965

  • 漸進的Transformerニューラルプロセス [cs.LG]目的:Transformerニューラルプロセスにおける,逐次データへの安価な漸進的更新
    • ニューラルプロセスは,時空間予測から表形式データモデリングまで,多様なタスクで優れた性能を示す。
    • 既存のTransformerニューラルプロセスは,新たな観測ごとに内部表現を最初から再計算する必要があり,逐次データには不向きである。
    • 本研究は,因果的マスキングとKVキャッシュにより,更新コストを削減し,逐次推論を高速化することを目指す。
    • incTNPは,標準的なTNPと同等の予測性能を維持しつつ,更新の計算コストを2乗から線形に削減することに成功した。
    • 実験結果から,incTNPは非因果的なTNPと同等かそれ以上の性能を示し,逐次推論において大幅な高速化を実現することが示された。
    • 逐次ストリーミングプロトコル下では,incTNPは標準的なTNPと同様の予測ルールを維持し,一貫性を損なうことなく計算上の利点を提供することが確認された。

    Link: https://arxiv.org/abs/2602.18955

  • FUSAR-GPT:空間的・時間的特徴を埋め込み,2段階デカップリングされたSAR画像向け視覚言語モデル [cs.CV, cs.AI]目的:SAR画像に対する高性能な視覚言語モデルの開発
    • 全天候・全時間帯のSAR画像解析は,リモートセンシング応用の発展に不可欠である。
    • 既存の視覚言語モデルは,SAR画像の複雑な撮像機構や散乱特性により性能が制限される。
    • SAR画像特有の課題を克服し,高精度な視覚言語モデルの実現を目指す。
    • 本研究では,SAR画像-テキスト-AlphaEarth特徴のトリプレットデータセットを構築した。
    • FUSAR-GPTは,地理空間ベースラインモデルと時系列特徴を組み込み,SAR画像の表現力を高めた。
    • 2段階SFT戦略により知識注入とタスク実行を分離し,最先端の性能を達成した。

    Link: https://arxiv.org/abs/2602.19190

  • ソフト系列方策最適化 [cs.LG, cs.AI]目的:大規模言語モデルの最適化手法
    • 近年,LLMの性能向上に伴い,人間との整合性を高める研究が重要視されている。
    • 従来の方策最適化手法では,学習信号の損失やエントロピーの崩壊が課題となっていた。
    • 系列レベルの報酬に合致した重要度重みを用いた,安定した最適化手法を提案する。
    • ソフト系列方策最適化(SSPO)は,系列レベルの重要度重みにおいて,トークンレベルの確率比に対するソフトゲート関数を導入する。
    • SSPOは,数学的推論とコーディングのタスクにおいて,学習の安定性と性能を向上させることを実証した。
    • 理論的な根拠に基づき,最適化行動を改善するための実用的な変更を調査した。

    Link: https://arxiv.org/abs/2602.19327

  • 等方性ガウス表現による安定した深層強化学習 [cs.LG, cs.AI]目的:深層強化学習における訓練の安定化
    • 強化学習は,複雑な問題を解決する強力な手法であり,様々な分野での応用が期待されている。
    • 深層強化学習は,データ分布の変化により訓練が不安定になりやすいという課題がある。
    • 等方性ガウス表現を用いることで,変化する目標に対する追跡を安定化し,表現崩壊を防ぐ。
    • 等方性ガウス埋め込みが,非定常な目標下で有利であることが理論的に示された。
    • 提案手法であるSketched Isotropic Gaussian Regularizationは,様々な環境で性能向上と訓練の安定化に貢献した。
    • 表現の崩壊やニューロンの休眠といった問題を軽減することが確認された。

    Link: https://arxiv.org/abs/2602.19373

  • 2段階エージェント:AIによる意思決定支援と意思決定者との相互作用フレームワーク [cs.AI, cs.LG]目的:機械学習に基づく意思決定支援(ML-DS)から意思決定者がどのように学習するかを捉えるための計算フレームワーク
    • 医療や司法など,様々な分野で機械学習モデルの予測が人間の意思決定を支援しており,その重要性は高い。
    • ML-DSが人間の意思決定に与える影響についての理解が十分ではなく,ML-DSの活用を阻害する要因となっている。
    • ML-DSがもたらす影響を定量的に分析し,より効果的なML-DSの設計に貢献することを目的とする。
    • 本研究では,合理的なベイズエージェントがML予測からどのように学習するかをモデル化する「2段階エージェント」フレームワークを提案した。
    • 線形ガウス設定において,ML予測から推論する課題に対して解析解を導き出し,ML-DSが有益となる条件を実験的に特定した。
    • 誤った事前信念が一つでも存在する場合,ML-DSはMLモデルが適切でエージェントが完全に合理的であっても,意思決定支援がない場合よりも悪い結果をもたらす可能性があることを示した。

    Link: https://arxiv.org/abs/2602.21889

  • LLMを用いた意味的偏次接地 [cs.AI]目的:タスクの規模拡大に伴う計算ボトルネックの軽減
    • 計画立案において,接地は重要なステップであり,効率化が課題である。
    • 既存手法は関係性特徴や埋め込みに依存し,PDDL記述のテキスト情報を活用できていない。
    • LLMを用いて不要な要素を事前に特定し,接地するタスクの規模を削減すること。
    • SPG-LLMは,ドメインと問題ファイルをLLMで分析し,非関連要素を特定することで接地を高速化する。
    • 7つの難易度の高いベンチマークで,従来の数倍の速さで接地を実現した。
    • 一部のドメインでは,計画コストも同等または向上した。

    Link: https://arxiv.org/abs/2602.22067

  • 測地セマンティック検索:学習された局所リーマン多様体を用いた引用グラフの地図的ナビゲーション [cs.IR, cs.LG, cs.SI]目的:引用グラフにおける幾何学を意識したセマンティック検索の実現
    • 学術論文の引用関係は知識の構造を反映し,研究分野の理解に不可欠である。
    • 既存の検索手法は固定されたユークリッド距離に依存し,セマンティックな類似性を捉えきれない場合がある。
    • ノード固有のリーマン計量を利用し,より正確なセマンティック検索を可能にすること。
    • GSSは,169KのarXiv論文を用いた引用予測ベンチマークで,SPECTER+FAISSベースラインと比較してRecall@20が23%相対的に向上した。
    • 学習された測地距離を用いた多源Dijkstra法と,Maximal Marginal Relevance再ランキング,パスコヒーレンスフィルタリングの組み合わせが有効である。
    • k-meansプーリングを用いた階層的な粗探索により,計算コストを4倍削減しつつ,検索品質の97%を維持することが可能である。

    Link: https://arxiv.org/abs/2602.23665

  • Performative Prediction におけるオンラインアルゴリズムの安定性 [cs.CL, cs.LG, cs.CY, cs.GT, stat.ML]目的:Performative Prediction 環境下におけるオンラインアルゴリズムの安定性
    • 意思決定におけるアルゴリズム予測の利用が拡大しており,その影響を理解することが重要である。
    • 予測モデルがデータ分布に影響を与え,予測の精度低下を招く可能性がある。
    • モデルが自身の予測に対して最適なデータ分布を形成する安定な平衡状態の存在を示す。
    • 本研究では,どのような後悔回避アルゴリズムも,performatively stable equilibrium に収束することを無条件で示した。
    • モデルが分布に与える影響に強い制限を加えることなく,この結果を得るために,マルチンゲール論とランダム化を利用した。
    • この研究は,勾配降下法などの一般的なアルゴリズムが自然に安定化し,フィードバックループを抑制する理由を説明する。

    Link: https://arxiv.org/abs/2602.24207

  • CUCo:計算と通信の共同設計のためのエージェント的フレームワーク [cs.CL, cs.DC, cs.AR, cs.LG, cs.MA]目的:CUDAカーネルの計算・通信共同設計の自動化
    • 分散LLMの学習・推論において,計算と通信の効率化は重要である。
    • 従来の最適化は分離して行われ,専門知識やハードウェア調整が不可欠である。
    • CUCoは,自動化による設計の効率化と高性能化を目指す。
    • CUCoは,構造化された設計空間とエージェントを組み合わせることで,CUDAカーネルの計算・通信共同設計を自動化する。
    • 4つのマルチGPUワークロードで最大1.57倍の高速化を達成した。
    • DeepSeek-V3 MoE層において,送出をローカル計算で隠蔽する2ストリームオーバーラップ戦略を発見し,推論コストを1ワークロードあたり10ドル以下に抑えた。

    Link: https://arxiv.org/abs/2603.02376

  • 大規模LLM集団における創発的協調のベンチマーク:MoltBookアーカイブを用いた評価フレームワーク [cs.MA, cs.AI, cs.SI]目的:大規模LLM集団における創発的協調性評価のためのフレームワーク
    • LLMのマルチエージェントシステムは進化を続けており,その協調メカニズムの理解が重要である。
    • 既存の評価方法は,小規模なグループに焦点を当てており,大規模分散型集団の自己組織化を捉えきれない。
    • 本研究は,大規模なエージェント環境における役割分化や情報伝播を定量的に評価するフレームワークを提示する。
    • MoltBookアーカイブの分析により,コア・ペリフェリー構造が顕著に確認された(シルエット係数0.91)。
    • 情報拡散はべき乗則に従い(α=2.57),分散型タスク解決には大きな協調コストが存在することが示された(Cohen's d = -0.88)。
    • 標準化された評価タスクと実験結果により,今後のマルチエージェントプロトコル比較の基盤を提供する。

    Link: https://arxiv.org/abs/2603.03555

  • GIPO:ガウス重要度サンプリングによる方策最適化 [cs.LG, cs.AI]目的:強化学習を用いたポストトレーニングによるマルチモーダルエージェントの性能向上
    • マルチモーダルエージェントの能力向上は,ロボット工学や自律システムの発展に不可欠である。
    • 強化学習はデータ効率が悪く,特にインタラクションデータが限られる場合に課題となる。
    • GIPOは,限られたデータでも効率的に方策を最適化し,性能向上を目指す。
    • GIPOは,重要度サンプリングを基盤とし,極端な重要度比を抑制することで安定した学習を実現する。
    • 理論的分析により,GIPOが更新幅に対する暗黙的な制約を導入し,有限サンプル下でのロバスト性を保証することが示された。
    • 実験結果から,GIPOは様々なリプレイバッファサイズにおいて,既存手法を上回る性能とサンプル効率を示すことが確認された。

    Link: https://arxiv.org/abs/2603.03955

  • ソフトマックス注意ヘッドの特殊化:高次元単一位置モデルからの洞察 [cs.LG, cond-mat.dis-nn]目的:ソフトマックス注意ヘッドの特殊化に関する洞察
    • Transformerモデルは自然言語処理の性能を飛躍的に向上させたため,そのメカニズム解明が重要である。
    • 注意ヘッドの多くは冗長であり,類似した表現を学習しているという課題が存在する。
    • 注意ヘッドの特殊化のダイナミクスを理論的に解明し,性能向上に繋げることを目指す。
    • ソフトマックス注意ヘッドは,学習初期は非特殊化された状態から,段階的に特殊化していくことが示された。
    • 異なるヘッドは,潜在的な信号方向に順次一致することで特殊化を達成することが明らかになった。
    • Bayes-softmax注意は,この設定において最適な予測性能を達成することが示された。

    Link: https://arxiv.org/abs/2603.03993

  • MAviS:鳥類に関するマルチモーダル対話型アシスタント [cs.CV, cs.AI]目的:鳥類に関するマルチモーダル質問応答とシーン記述生成
    • 生物多様性の保全や生態モニタリングにおいて,詳細な理解と種特異的な情報提供が重要である。
    • 既存のマルチモーダル大規模言語モデルは,鳥類のような専門分野において十分な精度と文脈に応じた情報提供が困難である。
    • 鳥類に特化した大規模なマルチモーダルデータセットとモデルを開発し,専門分野における課題を解決することを目指す。
    • MAviS-Datasetは,画像,音声,テキストを統合した1,000種類以上の鳥類に関する大規模なマルチモーダルデータセットである。
    • MAviS-Chatは,MAviS-Datasetを基に構築されたマルチモーダルLLMであり,詳細な種理解,質問応答,シーン記述が可能である。
    • 実験結果から,MAviS-ChatはベースラインモデルMiniCPM-o-2.6を大幅に上回り,最先端のオープンソース性能を達成した。

    Link: https://arxiv.org/abs/2603.07294

  • 接触探査機:汎用二脚マニピュレーションのための接触範囲誘導探索 [eess.SY, cs.SY, math.OC, cs.RO, cs.AI]目的:汎用二脚マニピュレーションにおける接触範囲誘導探索手法
    • ロボットマニピュレーションは,自動化や人手不足解消に不可欠。複雑な操作には高度な探索が必要。
    • 既存手法は,接触に基づく新規性信号の不安定性,距離に基づく新規性信号の非効率性,タスク固有の事前知識への依存が課題。
    • 多様かつ新規な接触パターンを発見し,サンプル効率と成功率を向上させること。
    • 提案手法ContactExplorerは,オブジェクト表面点とハンドキーポイントの交差として接触を表現し,多様な接触パターン探索を促進。
    • 学習されたハッシュコードから得られる離散化されたオブジェクト状態に基づいて接触カウンターを維持し,指ごとの接触頻度を把握。
    • 接触範囲に基づく報酬とエネルギーに基づく到達報酬を組み合わせることで,探索効率と汎化性能を向上。

    Link: https://arxiv.org/abs/2603.10971

  • スコア関数の誤差に対するランジェバン動力学の頑健性 [cs.LG, stat.ML]目的:スコアベース生成モデリングにおけるスコア関数の誤差に対する頑健性
    • 生成モデリングは,複雑なデータ分布の学習において重要な役割を果たす。
    • ランジェバン動力学は,スコア関数の誤差に脆弱であることが問題視されている。
    • スコア関数の誤差が避けられない状況下で,ランジェバン動力学の限界を示す。
    • ランジェバン動力学は,スコア関数の$L^2$誤差に対して頑健ではないことが示された。
    • 高次元における単純な分布であっても,ランジェバン動力学はターゲット分布から大きく乖離する。
    • スコア関数の誤差を考慮すると,拡散モデルの方がランジェバン動力学よりも優れていると考えられる。

    Link: https://arxiv.org/abs/2603.11319

  • レベルアップ:カリキュラム学習のための移行問題の定義と活用 [cs.LG, cs.AI]目的:カリキュラム学習における移行問題の特定と活用
    • 機械学習の性能向上には,効果的な学習順序の確立が不可欠である。
    • 既存手法は問題の難易度を間接的に評価し,学習者固有のカリキュラムを提供できていない。
    • モデルの能力向上に沿った移行問題を特定し,効率的な学習を可能にすること。
    • 提案手法により,モデルの能力に応じて難易度を較正された移行問題を特定できることが示された。
    • 移行問題に基づいたカリキュラム学習は,他の学習戦略と比較して,より効率的にモデルの性能を向上させることが確認された。
    • 本手法は,解釈可能な問題の特定,学習者固有のカリキュラムの構築,段階的な性能改善の基盤を提供する。

    Link: https://arxiv.org/abs/2603.13761

  • 知識の活性化:エージェント型ソフトウェア開発のための組織知識の基本要素としてのAIスキル [cs.CL, cs.AI, cs.HC, cs.SE]目的:組織知識の提供のためのAIスキルを,構造化され,ガバナンスを意識した原子知識ユニット(AKU)に特化するフレームワーク
    • 企業は重要な組織知識を蓄積するが,その活用が困難である。
    • 組織知識が人間が解釈できる形式で保存されており,AIエージェントが利用できない。
    • AIエージェントが組織知識を効果的に活用し,開発効率を向上させる。
    • 知識活性化フレームワークにより,エンジニアは組織のコンテキストを再構築することなく,組織に基づいたガイダンスを受けられる。
    • AKUは,オンボーディングの圧縮,チーム間の摩擦の軽減,修正カスケードの排除に貢献する。
    • Yahooの導入調査では,開発者体験が大幅に向上し,週あたり2.6時間の節約とNPSが+35となった。

    Link: https://arxiv.org/abs/2603.14805

  • 連鎖の打破:LLMにおける中間構造への忠実性の因果分析 [cs.AI]目的:LLMの中間構造への忠実性に関する因果関係の解明
    • LLMの推論能力向上が求められる中で,中間構造を用いた手法が注目されている。
    • 中間構造の編集による結果の制御が期待される一方,その有効性が十分に検証されていない。
    • LLMが中間構造をどれだけ忠実に利用しているかを,因果分析によって明らかにすること。
    • モデルは自身の生成した中間構造に対しては整合性を示すが,編集後の予測更新には失敗している。
    • 中間構造から最終決定を外部ツールに委ねることで,この脆弱性は解消される傾向が見られた。
    • プロンプトの強化は限定的な効果にとどまる一方,最適化によって介入の忠実性が向上した。

    Link: https://arxiv.org/abs/2603.16475

  • 情報密度:効率的な推論のための情報量の多い推論過程への報酬 [cs.AI, cs.CL]目的:大規模言語モデルにおける推論過程の効率化
    • 大規模言語モデルの推論能力向上は,その計算コストの増大を招くため,効率化が重要である。
    • 従来の強化学習アプローチは最終的な応答の長さを最適化するのみで,中間推論ステップの質に焦点を当てていない。
    • 推論過程の情報密度を高めることで,計算コストを抑えつつ高い精度を達成することを目指す。
    • 推論過程におけるトークンごとの予測エントロピーを追跡した結果,高品質な推論過程は低い不確実性への収束と迅速な不確実性低下を示すことが分かった。
    • 提案手法InfoDensityは,エントロピー軌跡のサフィックス最大エンベロープと長さのスケーリング項を組み合わせることで,これらの特性を捉えた報酬関数を提供する。
    • 数学的および一般的な推論ベンチマークにおいて,InfoDensityは最先端のベースラインと比較して,精度と効率性のトレードオフにおいて優れた性能を示した。

    Link: https://arxiv.org/abs/2603.17310

  • プロンプトと応答間の相互情報量を最大化することで,追加データなしにLLMの性能を向上させる [cs.LG, cs.AI, cs.CL]目的:プロンプトと応答間の相互情報量の最大化
    • LLMの性能向上は重要だが,人間によるラベル付けや外部検証に大きく依存している。
    • 既存データは使い尽くされつつあり,新たなデータの収集は高コストである。
    • 外部信号に依存せず,検証可能なタスクとそうでないタスクの両方に適用可能な自己改善手法を開発する。
    • MIPOは,プロンプトと応答のペアを生成するコントラストデータ拡張法である。
    • MIPOは,1-7BパラメータのLlamaおよびQwenモデルにおいて,パーソナライズドタスクで3-16%の性能向上を達成した。
    • 驚くべきことに,MIPOは追加データや外部監督なしに,数学や多肢選択問題などの検証可能なタスクでも1-20%の性能向上をもたらした。

    Link: https://arxiv.org/abs/2603.19294

  • LeWorldModel:ピクセルからの安定したエンドツーエンド結合埋め込み予測アーキテクチャ [cs.LG, cs.AI]目的:世界モデル学習のための結合埋め込み予測アーキテクチャ
    • コンパクトな潜在空間で世界モデルを学習する枠組みは,AI研究において重要性が増している。
    • 既存手法は表現崩壊を避けるため,複雑な損失関数や事前学習が必要であり,安定性に課題がある。
    • 本研究は,エンドツーエンドで安定的に学習可能な世界モデルアーキテクチャを構築することを目指す。
    • LeWorldModel(LeWM)は,生ピクセルからエンドツーエンドで安定的に学習可能な初のJEPAである。
    • LeWMは,わずか2つの損失項(次の埋め込み予測損失とガウス分布正則化)のみを使用し,パラメータ調整の複雑さを軽減する。
    • LeWMは,基礎モデルベースの世界モデルと比較して最大48倍高速に計画を実行し,制御タスクにおいて競争力がある。

    Link: https://arxiv.org/abs/2603.19312

  • ニューラル時系列データからの因果発見と動的因果推論 [cs.LG, cs.AI, stat.AP, stat.ML]目的:動的因果推論のための新たなフレームワーク
    • 動的な科学システムの研究において,時間変化する因果モデルは強力な手法である。
    • 既存手法は事前にある程度の因果構造を知っている前提であり,現実世界の不確実な状況に対応できない。
    • データ駆動的な因果発見と動的因果推論を統合し,構造的曖昧さ下での推論を可能にする。
    • DCNARは,まずニューラル自己回帰モデルを用いて多変量時系列データから疎な有向因果ネットワークを学習する。
    • 次に,学習された構造を構造的事前情報として時間変化するニューラルネットワーク自己回帰に利用し,因果影響を推定する。
    • 実証実験の結果,DCNARは従来のモデルよりも安定した,行動科学的に意味のある動的因果推論を行うことが示された。

    Link: https://arxiv.org/abs/2603.20980

  • ECI:効果的な対照的情報による困難な負例の評価 [cs.IR, cs.AI]目的:困難な負例ソースの選択における有効性の評価指標
    • 高精度な情報検索システム構築には,適切な負例の選択が不可欠である。
    • 負例ソースの選定は,通常,ファインチューニング後の評価に基づいて行われ,効率が悪い。
    • ファインチューニングなしで負例ソースをランク付けし,効率的な評価を可能にすること。
    • 提案手法ECIは,ターゲットエンコーダの埋め込みを用いて,学習不要で負例ソースをランク付けする。
    • MS MARCOデータセットにおいて,ECIはLLMやDense+LLMの負例ソースを高い順位で評価し,BEIRの転移学習結果と一致した。
    • ECIの性能は,ターゲットエンコーダのファミリーに依存し,サンプルサイズやトークナイザーなどのパラメータ変化に対して安定していることが示された。

    Link: https://arxiv.org/abs/2603.20990

  • ビジョン・ホップフィールド・メモリ・ネットワーク [cs.LG, cs.AI, cs.CV, stat.ML]目的:ビジョン・ホップフィールド・メモリ・ネットワークの提案
    • 画像,テキスト等を含むマルチモーダルな情報処理において,高性能な基盤モデルが求められている。
    • 既存のモデルは,脳の計算原理とは異なり,大量のデータと計算資源を必要とし,解釈性が低いという課題がある。
    • 脳の記憶メカニズムに着想を得た新たな基盤モデルを構築し,解釈性とデータ効率を向上させる。
    • 提案手法は,局所的なホップフィールドモジュールと,文脈に応じたモジュール化を実現し,画像パッチレベルでの連想記憶ダイナミクスと,文脈調整のためのエピソード記憶を統合している。
    • 実験の結果,公開されているコンピュータビジョンベンチマークにおいて,既存の基盤モデルと同等の性能を達成しつつ,優れた解釈性とデータ効率,そして生物学的な妥当性を示した。
    • この結果は,V-HMNが次世代のビジョン基盤モデルとして,またマルチモーダル基盤モデルの一般的な設計指針として有望であることを示唆している。

    Link: https://arxiv.org/abs/2603.25157

  • 軌跡からスキルへ:転移可能なエージェントスキルへの軌跡局所的な教訓の蒸留 [cs.AI]目的:エージェントスキル獲得のためのフレームワーク
    • 大規模言語モデルエージェントの能力向上には,ドメイン固有のスキルが不可欠である。
    • スキルの手動作成は拡張性に乏しく,パラメータのみに基づくスキルの生成は運用上の落とし穴を見逃す可能性がある。
    • エージェントの経験から誘導的な推論を用いて,有用なスキルを効率的に獲得・進化させる。
    • Trace2Skillは,多様なドメイン(オフィスワークフロー,数理推論,ビジョンQA等)において有効であることが示された。
    • 獲得されたスキルは,使用された軌跡の単なる記憶ではなく,モデル規模や種類,分布外設定への転移が確認された。
    • 例えば,Qwen3.5-35Bで進化させたスキルは,Qwen3.5-122BエージェントのWikiTableQuestionsの性能を最大57.65%向上させた。

    Link: https://arxiv.org/abs/2603.25158

  • ニューラル崩壊ダイナミクス:深さ,活性化関数,正則化,特徴ノルム閾値 [cs.CL, cs.LG]目的:ニューラル崩壊の開始を支配するダイナミクスの特徴付け
    • 深層学習モデルの表現学習メカニズムの理解促進に不可欠である。
    • ニューラル崩壊の開始時期を予測する指標が確立されていない。
    • 特徴ノルムを指標としたニューラル崩壊開始の予測モデルを構築する。
    • 特徴ノルムの平均値がモデル・データセット固有の臨界値fn*に達することが,ニューラル崩壊の開始条件であることが示された。
    • fn*は訓練条件に依存せず,データセットとモデルのペアごとに狭い範囲に集中する。
    • ResNet-20 on MNISTにおいてfn*=5.867であり,アーキテクチャの影響が顕著であることが明らかになった。

    Link: https://arxiv.org/abs/2604.00230

  • オントロジー制約によるニューラル推論:エンタープライズエージェントシステムにおけるドメインに基づいたAIエージェントのためのニューロシンボリックアーキテクチャ [cs.AI, cs.CL, cs.SE]目的:エンタープライズエージェントにおける,オントロジー制約によるニューラル推論アーキテクチャの提案
    • LLMの企業利用は拡大しているが,幻覚やドメインシフト,規制遵守の課題が存在する
    • 既存システムでは,LLMへの入力は制約されるものの,出力側の検証が不十分である
    • LLMの知識不足を補い,出力の信頼性とコンプライアンスを向上させることを目指す
    • 提案アーキテクチャは,役割,ドメイン,インタラクションの3層オントロジーフレームワークを用いる
    • 実験の結果,オントロジー制約を導入したエージェントは,Metric AccuracyとRole Consistencyで有意な改善が見られた
    • 特に,LLMの学習データが少ないローカライズされたドメインにおいて,その効果は顕著であった

    Link: https://arxiv.org/abs/2604.00555

  • PI-JEPA:演算子分割潜在予測による結合マルチフィジックスシミュレーションのためのラベルフリー代理事前学習 [cs.LG, cs.CE, physics.comp-ph]目的:結合マルチフィジックスシミュレーションのためのラベルフリー代理モデルの事前学習手法
    • 油田や地熱開発など,複雑な物理現象を伴うシミュレーションは重要であり,計算コスト削減が課題である。
    • 従来のニューラルオペレーターは,ラベル付きシミュレーションデータが大量に必要であり,ラベルなしデータの活用が困難である。
    • ラベルなしパラメータフィールドを活用し,少ないラベル付きデータで高精度な代理モデルを構築することを目指す。
    • PI-JEPAは,偏微分方程式の残差正則化を用いたマスク潜在予測により,ラベル付きシミュレーションデータなしで事前学習を可能にする。
    • 単相Darcy流れにおいて,PI-JEPAはFNOやDeepONetよりも低い誤差を達成し,少ないデータでの性能向上を示す。
    • ラベルフリー事前学習は,マルチフィジックス代理モデルの展開に必要なシミュレーション予算を大幅に削減する。

    Link: https://arxiv.org/abs/2604.01349

  • CuTeGen:CuTeを用いた高性能GPUカーネルの生成と最適化のためのLLMベースのエージェントフレームワーク [cs.LG, cs.AI, cs.DC, cs.PF, cs.SE]目的:高性能GPUカーネルの生成と最適化
    • 現代の機械学習システムにおいて,高性能GPUカーネルは不可欠である。
    • カーネル開発は専門知識を要し,手動で行われることが多く,効率が課題である。
    • LLMを活用し,カーネル開発の自動化と性能向上を目指す。
    • CuTeGenは,カーネル開発を生成,テスト,改善の反復的なワークフローとして扱うエージェントフレームワークである。
    • CuTe抽象化層をターゲットとすることで,タイリングやデータ移動などの性能に重要な構造を維持し,反復的な改善を可能にする。
    • KernelBenchのタスクにおいて,PyTorchと比較して平均1.71倍の高速化を達成し,CudaForgeを上回る性能を示した。

    Link: https://arxiv.org/abs/2604.01489

  • 代数的多様性:単一観測からの群論的スペクトル推定 [cs.RO, cs.LG, cs.IT, eess.SP, math.IT]目的:単一観測からの群論的スペクトル推定手法
    • 信号処理や機械学習において,効率的な情報抽出と利用は重要課題である。
    • 従来の多観測に基づく手法では,計算コストやデータ取得の制約が存在する。
    • 単一観測から高精度な推定を可能にし,計算コストとデータ取得の制約を克服すること。
    • 群作用の代数的な性質を利用することで,単一スナップショット推定が多スナップショット共分散推定と同等の性能を発揮する。
    • DFT,DCT,KLTなどの既存手法を群に適合した特殊なケースとして統一的に表現できる。
    • モンテカルロ実験により,提案手法の有効性が確認され,様々な応用分野への展開が期待される。

    Link: https://arxiv.org/abs/2604.03634