arXiv雑要約

AI - 2026/02/03 公開

  • 多スケール・ウェーブレット変換器による動的システムの演算学習 [cs.LG]目的:動的システムの演算学習におけるモデル
    • 物理現象のシミュレーションにおいて,高速かつ高精度な代理モデルの需要が高まっている。
    • 既存の機械学習モデルは,高周波成分を抑制する傾向があり,細部の構造を捉えにくい。
    • 高周波成分を適切に表現し,長期的な安定性を向上させることを目指す。
    • 提案手法である多スケール・ウェーブレット変換器(MSWT)は,ウェーブレット変換により周波数成分を分離する。
    • MSWTは,ウェーブレット変換を保存するダウンサンプリングと,周波数帯域間の依存関係を捉えるウェーブレットベースのアテンション機構を用いる。
    • カオス的な動的システムや気候再解析データを用いた実験で,誤差の減少とスペクトルの忠実度が向上することが示された。

    Link: https://arxiv.org/abs/2602.01486

  • OpInf-LLM:演算子推論によるLLMを用いたパラメトリック偏微分方程式解法 [cs.LG, cs.AI]目的:偏微分方程式解法のパラメトリックな枠組み
    • 科学技術計算において,多様な偏微分方程式を解くことは不可欠である。
    • 未知のパラメータや境界条件への汎化において,実行成功率と数値精度のトレードオフが存在する。
    • 少ない解データから多様な偏微分方程式を正確に予測し,汎化性能を高めることを目指す。
    • OpInf-LLMは,演算子推論とLLMの能力を組み合わせることで,汎化可能な低次元モデリングを可能にする。
    • 少量の解データを用いることで,未知のパラメータや設定を含む多様な偏微分方程式インスタンスを高精度に予測できる。
    • 自然言語による偏微分方程式解法の指定とLLMのシームレスな統合,および高い実行成功率を実現する。

    Link: https://arxiv.org/abs/2602.01493

  • 描画を通じた科学学習のための人間とAIの協調ツールDraw2Learn [cs.HC, cs.AI]目的:描画に基づく科学学習における人間とAIの協調
    • 描画は思考の可視化を促し学習を支援するが,大規模な個別指導は困難である
    • 効果的なフィードバックの提供が追いついていない点が課題である
    • AIが学習支援パートナーとして,描画学習を促進する仕組みを提案する
    • Draw2Learnは,構造化された描画課題の生成,視覚的支援,進捗モニタリング,多面的なフィードバックを提供する
    • ユーザビリティ,有用性,ユーザ体験に関して肯定的な評価を得た
    • AIによる支援と学習者の自律性のバランスが重要であることが示唆された

    Link: https://arxiv.org/abs/2602.01494

  • アーキテクチャの限界におけるガバナンス:NeuroAIおよびニューロモルフィックシステムの規制 [eess.SY, cs.SY, cs.ET, cs.AI, cs.AR]目的:NeuroAIおよびニューロモルフィックシステムのガバナンスに関する課題
    • AI技術の発展は社会に大きな変革をもたらす一方で,倫理的・法的な課題も生じている。
    • 従来のAIガバナンスフレームワークは,現在のNeuroAIシステムに適合していない。
    • NeuroAIに特化した,技術的に妥当な保証方法の確立を目指す。
    • 従来のAIガバナンスフレームワークは,NeuroAIの特性を考慮していないため,適用に限界がある。
    • NeuroAIの保証と監査方法は,そのアーキテクチャとともに進化する必要がある。
    • 脳にヒントを得た計算の物理学,学習力学,効率性を規制指標に整合させることで,技術的に根拠のある保証が可能となる。

    Link: https://arxiv.org/abs/2602.01503

  • モーメンタム付きシングルタイムスケールアクター・クリティック法の最適サンプル複雑度 [cs.LG, stat.ML]目的:ε-最適グローバルポリシーの獲得における最適サンプル複雑度
    • 強化学習は,複雑な意思決定問題を解決するための重要な手法である。
    • アクター・クリティック法はサンプル効率が低いという課題がある。
    • サンプル複雑度を改善し,より効率的な学習を実現すること。
    • ε-最適グローバルポリシー獲得のサンプル複雑度について,従来の$O(\epsilon^{-3})$から$O(\epsilon^{-2})$への改善を達成した。
    • 分散を削減するために,STORM(確率的再帰的モーメンタム)を適用し,さらに最近のサンプルのバッファを維持することで,非定常なサンプル分布への対応を実現した。
    • 提案手法は既存の深層学習アーキテクチャと容易に組み合わせ可能であり,実用性を損なわない。

    Link: https://arxiv.org/abs/2602.01505

  • グリッド調整サービスのための柔軟なデータセンター負荷の活用 [eess.SY, cs.AI, cs.CE, cs.SY]目的:データセンターのグリッド周波数調整への貢献
    • 電力系統の安定化にデータセンターの柔軟な負荷制御が不可欠である。
    • 既存手法では,負荷スケジューリングと調整容量の入札が分離されている。
    • リアルタイム調整を維持するための,統合的な最適化手法の確立。
    • 提案手法は,地理的に分散したデータセンター間の負荷分散と調整容量のコミットメントを同時に最適化する。
    • 確率制約とValue-at-Riskキュー状態制約により,コミットされた調整容量の実現可能性を確保する。
    • シミュレーション結果から,本手法はシステム運用コストを削減し,より実現可能な調整容量を提供し,収益とリスクのバランスを改善する。

    Link: https://arxiv.org/abs/2602.01508

  • 記号回帰のための進化型特徴量構築における近傍イェンセンギャップ最小化による汎化性能の向上 [cs.LG, cs.NE]目的:記号回帰のための進化型特徴量構築における過学習抑制
    • 自動機械学習の分野において,特徴量構築は学習性能向上に貢献する重要な手法である。
    • 特徴量構築は過学習を起こしやすく,汎化性能が課題となる場合が多い。
    • 近傍イェンセンギャップ最小化により過学習を抑制し,汎化性能を高めることを目指す。
    • 近傍リスクが実リスクと正則化項の和で bounded されることを証明した。
    • 実リスクと近傍イェンセンギャップを同時に最適化する進化型特徴量構築フレームワークを提案した。
    • 実験結果から,提案手法が他の複雑度尺度と比較して有効であることが示された。

    Link: https://arxiv.org/abs/2602.01510

  • 検証不可能なLLMのポストトレーニングにおけるルーブリックに基づく報酬モデリングのための交互強化学習 [cs.CL, cs.LG]目的:ルーブリック生成器とジャッジの同時最適化
    • 創造的執筆や自由形式の指示応答など,検証不可能な領域でのLLMの性能向上は重要である。
    • 従来の報酬モデルは,応答品質の多面性を捉えきれない点が課題であった。
    • 複雑な応答品質を評価するための効果的なルーブリック生成方法を確立すること。
    • 提案手法Rubric-ARMは,複数のベンチマークにおいて最先端の性能を達成した。
    • オフラインおよびオンライン強化学習の設定において,下流ポリシーのアラインメントを大幅に改善した。
    • 交互最適化戦略により,同時更新の非定常性を緩和し,学習中の勾配分散を低減できることが示された。

    Link: https://arxiv.org/abs/2602.01511

  • RAPT:シミュレーションから現実世界への転移における異常検知とヒューマノイドロボットの故障診断 [cs.RO, cs.LG]目的:シミュレーションから現実世界への転移における,異常状態の検知と故障原因の特定
    • ヒューマノイドロボットの制御は複雑であり,現実世界での安全な運用が課題である。
    • シミュレーションで頑健に見える制御ポリシーが,現実世界で予期せぬ失敗を引き起こす可能性がある。
    • 現実世界での安全性を高めるため,信頼性の高い異常検知と故障原因の特定が求められる。
    • RAPTは,50Hzのヒューマノイド制御において,軽量かつ自己教師ありの異常検知モニタとして機能する。
    • シミュレーションで学習した正常な動作の空間的・時間的な多様性を学習し,実行時の予測偏差を評価することで,高精度な異常検知を実現する。
    • 実際のロボット実験において,真陽性率を12.5%向上させ,故障原因の特定精度も75%に達した。

    Link: https://arxiv.org/abs/2602.01515

  • 車両の可塑性に対応するホワイトボックスニューラルアンサンブル:適応NMPCにおける記号的な監査可能性の効率コストの定量化 [cs.LG, cs.AI, cs.SY, eess.SY]目的:車両の可塑性に対応するためのホワイトボックス適応NMPCアーキテクチャ
    • 自動車の制御は安全性と効率性に直結するため,様々な環境変化への適応が重要である。
    • 従来の制御手法では,環境変化への適応に再学習が必要となり,リアルタイム性に課題がある。
    • 本研究では,再学習を必要とせずに環境変化に適応可能な制御システムを構築し,その効率コストを評価する。
    • 提案手法は,複数のニューラルネットワークを組み合わせることで,異なる運転条件下での適応を実現している。
    • シミュレーションの結果,提案手法は7.3msの高速な適応と高い追従精度を示し,従来の非適応型手法の課題を克服している。
    • しかし,記号的なグラフ構造の維持により,ソルバーの遅延が72~102倍に増加し,厳密なホワイトボックス実装の効率コストが明らかになった。

    Link: https://arxiv.org/abs/2602.01516

  • Qrita: ピボットに基づく切断と選択を用いたGPU向け高性能Top-kおよびTop-pアルゴリズム [cs.HC, cs.AI]目的:大規模言語モデルにおけるTop-kおよびTop-p演算の効率的実装
    • 大規模言語モデルの普及に伴い,効率的な推論処理が不可欠となっている。
    • 大規模語彙に対するTop-k/Top-p演算は,計算・メモリコストが高くボトルネックとなる。
    • ピボットに基づく選択戦略により,Top-k/Top-p演算の効率とメモリ使用量を改善する。
    • Qritaは,既存のTop-k/Top-pカーネルと比較して,最大2倍のスループットと半分のメモリ使用量を実現した。
    • Qritaは,Gaussian基盤のシグマ切断と四分位ピボット探索により検索空間を削減し,決定的な出力を保証する。
    • Tritonを用いて実装されたQritaは,vLLM,SGLang,Flashinfer等のLLM実行エンジンにおいて高性能を示す。

    Link: https://arxiv.org/abs/2602.01518

  • ネイティブ位置非依存キャッシュのためのエンコーダが必要である [cs.LG, cs.AI]目的:大規模言語モデルにおける位置非依存キャッシュの効率化
    • LLMの性能向上には,メモリ効率と高速な推論が不可欠であるため。
    • 従来のKVキャッシュは文脈の順序に依存し,効率が悪いため。
    • 位置非依存キャッシュの精度低下を解消し,実用化を促進すること。
    • COMBは,TTFTを51-94%削減し,スループットを3倍に向上させる。
    • 既存の推論フレームワークとのシームレスな統合が可能である。
    • DeepSeek-V2-Lite-Chatを用いた実験で,他のデコーダ専用LLMへの適用可能性が示された。

    Link: https://arxiv.org/abs/2602.01519

  • ランク1はいつ十分か? 幾何学に基づいた初期化によるパラメータ効率的なファインチューニング [cs.LG, cs.CV]目的:パラメータ効率的なファインチューニングにおける初期化手法
    • 大規模言語モデルの適応は重要であり,計算資源の制約下での効率化が求められている。
    • 極めて低ランクの設定,特にランク1 LoRA は不安定になりやすいという課題がある。
    • 初期化の方向性を調整し,ランク1 LoRA の訓練における不安定性を解消することを目指す。
    • 事前学習済みの画像とテキストの特徴表現の不一致が,ランク1 LoRA の最適化の不安定性を引き起こす原因であると示唆された。
    • 提案手法 Gap-Init は,キャリブレーションセットから推定したモダリティギャップベクトルに沿ってランク1 LoRA の方向性を初期化する。
    • Gap-Init は,様々なビジョン言語タスクにおいて,ランク1 LoRA の訓練を安定化させ,ランク8 のベースラインと同等またはそれ以上の性能を達成した。

    Link: https://arxiv.org/abs/2602.01522

  • 大規模言語モデル推論における検証可能な報酬を用いた強化学習の相対予算理論 [cs.LG, cs.AI, cs.CL]目的:大規模言語モデルの推論能力向上のための強化学習の効率性に関する理論的考察
    • 大規模言語モデルの推論能力は重要であり,その改善は様々な応用分野への展開を可能にする。
    • 強化学習の効果はタスクや計算資源によって異なり,効率的な学習方法の確立が課題である。
    • 計算資源の割り当て方と学習効率の関係を明らかにし,最適な予算設定を導くことを目指す。
    • 相対予算ξ(生成ステップ数Hと初解までのトークン数Tの比)が学習効率を決定する重要な要素であることが示された。
    • 相対予算が過小な場合,有効な軌道が稀になり学習が困難になる一方,適切な範囲では学習効率が最大化される。
    • 実験結果から,学習効率と推論性能が最大となる相対予算はξ∈[1.5, 2.0]付近であることが確認された。

    Link: https://arxiv.org/abs/2602.01523

  • 暗黙的ニューラル表現における入力ランク崩壊:診断と統一的な解決策 [eess.SY, cs.SY, cs.HC, cs.CY, cs.LG]目的:暗黙的ニューラル表現における入力ランク崩壊の診断と解決
    • 連続信号モデリングにおいて,暗黙的ニューラル表現は革新的な手法である。高品質な表現学習が求められている。
    • 限られた学習予算下では,細部を正確に再現することが難しい。既存手法は経験則的であり,理論的根拠が不足している。
    • 入力座標が埋め込み空間を十分に広げられない「入力ランク崩壊」を診断し,その解決策を提供する。
    • 層ごとのNTK分解により,入力層におけるランク不足が表現力のボトルネックとなる「入力ランク崩壊」を数学的に特定した。
    • 位置エンコーディング,SIREN,バッチ正規化は,異なる形でこのランクを回復するものであると再解釈できる。
    • ランク拡張初期化は,アーキテクチャ変更や計算オーバーヘッドなしに,表現ランクが層幅に比例するように保証する。

    Link: https://arxiv.org/abs/2602.01526

  • 機械のためのベルタンへ:なぜ視覚化は機械認知のためのデザイン原則を必要とするのか [cs.HC, cs.AI, cs.CV]目的:機械認知のための視覚化デザイン原則の必要性
    • 視覚化は情報伝達において重要であり,その効果的な設計は長年研究されてきた。
    • 既存の視覚化デザイン原則は人間を対象としており,機械への直接的な適用が困難である。
    • 機械認知に適した視覚化デザインの基礎を確立し,新たな研究領域を提唱する。
    • 既存の視覚化知識は,機械にとっては必ずしも有効ではないことが,VLMのベンチマーク結果から示されている。
    • 機械は人間とは異なる符号化パターンを示し,パッチベースのトークン化を行うため,全体的な知覚が異なる。
    • 人間と機械の知覚の乖離は質的であり,視覚化分野は機械向けデザインを独立した研究問題として扱うべきである。

    Link: https://arxiv.org/abs/2602.01527

  • バイアスを予測不可能にする:強化学習によるロバストなLLMジャッジの訓練 [cs.CY, cs.LG]目的:LLMジャッジのロバスト性の向上
    • LLMは自動ジャッジとして活用が拡大しているため,公平性と信頼性の確保が重要である。
    • LLMは,コンセンサスや権威といった表面的な手がかりに影響を受けやすく,バイアスに弱いという課題がある。
    • バイアス手がかりを報酬の予測因子から切り離し,バイアスに左右されないロバストな判断能力を獲得することを目指す。
    • 提案手法EITは,バイアス信号が正解と不正解の両方を等確率で支持するように学習させることで,LLMのバイアスを軽減する。
    • Qwen3-4Bを用いた実験により,EITが敵対的なバイアス下での精度とロバスト性を向上させることが示された。
    • EITで訓練されたモデルは,バンドワゴンバイアスだけでなく,権威や注意散漫といった未知のバイアスに対しても汎化することが確認された。

    Link: https://arxiv.org/abs/2602.01528

  • PRISM:慎重な先制性 - リスクを意識した不確実性対応型の先制的エージェントのための熟慮 [cs.AI, cs.HC]目的:費用を考慮した選択的介入
    • 先制的なエージェントの実現は,人間との協調作業において重要であり,より自然な対話の実現に不可欠である。
    • 既存システムは,脆弱なヒューリスティックや無分別な長時間の推論に依存し,利益と負担のトレードオフの制御が難しい。
    • PRISMは,費用対効果を考慮した介入判断と,必要な時にのみ行う詳細な推論によって,この問題を解決する。
    • PRISMは,決定論的なゲートと二重過程推論アーキテクチャを組み合わせた新しいフレームワークである。
    • ユーザーの受け入れ確率が,見過ごしと誤報の非対称コストから導き出された閾値を超えた場合にのみ介入する。
    • ProactiveBenchにおいて,誤報を22.78%削減し,F1スコアを20.14%向上させた。

    Link: https://arxiv.org/abs/2602.01532

  • 線形再帰ユニットを用いた回転に依存しないオンライン手書き文字認識 [cs.CV, cs.LG]目的:オンライン手書き文字の回転不変な認識手法
    • 手書き文字認識は,人間とコンピュータの自然な対話を可能にする基盤技術である。
    • 回転変形は,手書き文字の空間的な配置を乱し,認識精度を著しく低下させる。
    • 回転変形に強く,高速かつ高精度な手書き文字認識システムの実現。
    • 提案手法では,局所的な構造特徴を捉えるためにSliding Window Path Signature (SW-PS) を用いている。
    • 分類器には軽量な線形再帰ユニット (LRU) を採用し,高速な処理と効率的な学習を実現している。
    • CASIA-OLHWDB1.1データセットを用いた実験で,数字,英語大文字,漢字部首においてそれぞれ99.62%,96.67%,94.33%の認識精度を達成した。

    Link: https://arxiv.org/abs/2602.01533

  • アバターのインタラクション:制御可能な会話型アバターのためのテキスト駆動型人間-物体インタラクションへ [eess.SY, cs.SY, cs.CV, cs.AI]目的:制御可能な会話型アバターを実現するためのテキスト駆動型人間-物体インタラクション
    • 動画生成において,会話型アバター生成は基本的な課題であり,その重要性は高い。
    • 既存手法では,アバターと周囲の物体の連携が困難であり,自然なインタラクションの実現が課題である。
    • テキストに合わせた物体とのインタラクションを可能にし,アバターの表現力を向上させる。
    • 提案手法InteractAvatarは,環境認識と計画,動画合成を分離することで,人間-物体インタラクションの質を向上。
    • PIM(知覚・インタラクションモジュール)とAIM(音声・インタラクション認識生成モジュール)を並列生成し,制御性と品質の両立を実現。
    • 新しいベンチマークGroundedInterを構築し,提案手法の有効性を実験的に証明。

    Link: https://arxiv.org/abs/2602.01538

  • MAGIC:堅牢なLLM安全性のための共進化型攻撃・防御対抗ゲーム [cs.AI, cs.CL, cs.LG, cs.MA]目的:大規模言語モデルの安全性のための,攻撃と防御が共進化する対抗ゲームフレームワーク
    • 大規模言語モデルの安全性確保は重要であり,社会への信頼性向上に不可欠である。
    • 既存の防御策は,静的なデータに依存しており,進化する攻撃に対して遅れをとる傾向がある。
    • 本研究は,動的な共進化を通じて,未知の攻撃パターンへの汎化能力を高めることを目指す。
    • MAGICフレームワークにより,攻撃エージェントは新たな攻撃戦略を自律的に進化させた。
    • 攻撃エージェントは,初期の推論能力を活かし,既存にない組み合わせ戦略を開発した。
    • 実験の結果,モデルの有用性を損なうことなく,防御成功率が向上することが示された。

    Link: https://arxiv.org/abs/2602.01539

  • マルチモーダル大規模言語モデルにおける認知超感覚への道 [cs.CV, cs.AI]目的:マルチモーダル大規模言語モデルの認知能力の向上
    • 近年,視覚情報処理の分野で大規模言語モデルの活用が進んでおり,その重要性が増している。
    • 複雑な認知問題を解決する能力が限られており,抽象的な視覚情報の理解や視覚記憶の活用が課題である。
    • 視覚情報に基づいた内部推論を可能にし,認知能力のギャップを埋めることを目指す。
    • 本研究では,新しい学習パラダイム「認知超感覚」を導入し,大規模言語モデルに人間のような視覚的イメージング能力を付与した。
    • これにより,CogSense-Benchにおいて,最先端のベースラインモデルを大幅に上回り,優れた汎化性能を示した。
    • 内部視覚イメージングは,知覚的認識と認知理解の間のギャップを埋める上で重要な役割を果たす可能性が示唆された。

    Link: https://arxiv.org/abs/2602.01541

  • S1-NexusAgent:学際的な科学研究のための自己進化型エージェントフレームワーク [cs.AI]目的:学際的な科学研究を支援するための自己進化型エージェントフレームワーク
    • 現代の科学研究は,大量のデータと複雑なワークフローに依存しており,その効率化が求められている。
    • 既存のLLMやツールベースのエージェントは,長期的計画や継続学習において課題を抱えている。
    • 複雑な科学研究ワークフローを安定的にモデル化し,持続可能な研究を可能にすること。
    • S1-NexusAgentは,プランニングと実行を分離した階層的なアーキテクチャを採用することで,複雑なワークフローを安定的に処理する。
    • 科学分野横断的なツールを統合し,意図に基づいた動的なツール検索とホットプラグ機構により効率的なオーケストレーションを実現した。
    • 生物学,化学,材料科学のベンチマークにおいて最先端の性能を示し,複雑な科学タスクへの有効性と汎用性を実証した。

    Link: https://arxiv.org/abs/2602.01550

  • 単純なTransformerは驚くほど強力なリンク予測器である [cs.LG, cs.AI]目的:グラフにおけるリンク予測の性能向上
    • グラフ機械学習の核心であり,複雑な関係性を捉えるモデルが求められる。
    • 既存手法は,構造的ヒューリスティックや大規模な埋め込みに依存し,汎化性能やスケーラビリティに課題がある。
    • Transformerの注意機構を利用し,効率的かつ高精度なリンク予測を実現すること。
    • PENCILは,従来のGNNよりも豊富な構造的情報を抽出できることが示された。
    • ヒューリスティックに基づいたGNNやID埋め込みベースの手法と比較して,パラメータ効率が高いことが実証された。
    • ノードの特徴量を用いなくても,様々なベンチマークにおいて競争力のある性能を発揮する。

    Link: https://arxiv.org/abs/2602.01553

  • InfoTok:容量制約下における共有視覚トークン化のための情報フロー制御 [cs.LG, cs.AI, cs.CV]目的:統一MLLMにおける視覚入力からトークンへのマッピングにおける情報フローの制御
    • MLLMは,画像理解と生成を統合し,多様なタスクを単一フレームワークで実行可能にするため重要である。
    • 既存の共有トークン設計は,アーキテクチャ中心であり,理解と生成を両立するためのトークンが保持すべき情報の明確な基準がない。
    • 情報フローを制御することで,圧縮とタスク関連性のバランスを取り,共有トークン空間の学習を促進することを目指す。
    • InfoTokは,情報ボトルネック原理に基づき,視覚トークン化を情報フローの制御として定式化することで,一貫した性能向上を実現した。
    • 理解と生成の両方において,既存の統一MLLMにInfoTokを統合することで,性能が向上することを示した。
    • 情報正則化によるトークン化が,統一MLLMにおける共有トークン空間学習の原則的な基盤となることを支持する。

    Link: https://arxiv.org/abs/2602.01554

  • 大規模言語モデル駆動型AIシステムにおける自律的な質問生成 [cs.AI]目的:大規模言語モデル駆動型AIシステムにおける自律的な質問生成とタスク設定
    • 動的環境下での自律的な意思決定において,大規模言語モデル駆動型AIの重要性が増している。
    • 既存システムは固定されたタスクに依存し,環境変化への自律的な適応が課題である。
    • AIシステムが内部状態,環境,他エージェントとの相互作用を考慮し,自律的に質問を生成する。
    • 提案手法は,質問生成を意思決定プロセスとして捉え,認知範囲を拡張する。
    • マルチエージェントシミュレーション実験により,環境認識型プロンプトが飢餓イベントを大幅に削減することが示された。
    • 他エージェント認識型プロンプトは,飢餓イベントをさらに60%以上削減し,統計的に有意な改善が見られた。

    Link: https://arxiv.org/abs/2602.01556

  • LLM長期記憶における暗黙的バイアスの蓄積と伝播 [cs.LG]目的:LLM長期記憶における暗黙的バイアスの蓄積と伝播のメカニズム
    • LLMは対話の継続性や個別化を実現するが,公平性に関する新たなリスクも生じている。
    • LLMの長期記憶は,微細な統計的偏見である暗黙的バイアスを蓄積・伝播させる可能性があり,定量的な評価が困難である。
    • 本研究は,長期記憶を持つLLMにおける暗黙的バイアスの蓄積と伝播を定量的に分析し,軽減策を提案することを目的とする。
    • Decision-based Implicit Bias (DIB) Benchmarkを用いて,LLMの暗黙的バイアスが時間経過とともに増大し,無関係な領域にも伝播することを示した。
    • 従来のシステムレベルのプロンプティングによるバイアス軽減策は,効果が限定的かつ一時的であることを明らかにした。
    • 提案手法Dynamic Memory Tagging (DMT)は,バイアスの蓄積と伝播を大幅に抑制し,公平性を高める効果が確認された。

    Link: https://arxiv.org/abs/2602.01558

  • マルチモーダル非常識:奇妙から普通へ,普通から奇妙へ [cs.CL, cs.CV, cs.AI]目的:マルチモーダルな状況における常識推論能力の評価
    • 人工知能の発展には,人間のような常識的な推論能力が不可欠である。
    • 既存のデータセットは,典型的な状況に偏っており,異常な状況への対応が苦手である。
    • 非典型的状況における視覚言語モデルの堅牢性と適応性を向上させる。
    • 本研究では,常識から逸脱した状況を評価する新しいベンチマーク「MUN」を提案した。
    • Retrieval-based in-context learning (R-ICL)フレームワークにより,大規模モデルの推論能力を小規模モデルへ効率的に転移させた。
    • 提案手法は,既存のICL手法と比較して平均8.3%の性能向上を示し,R-ICLの有効性を証明した。

    Link: https://arxiv.org/abs/2602.01561

  • Wasserstein空間における平均場ランジェバン上昇降下法の局所的指数安定性 [cs.LG, math.AP, math.OC, math.PR]目的:エントロピー正則化された二人零和ゲームにおける平均場ランジェバン上昇降下法(MFL-DA)の局所的指数安定性
    • ゲーム理論や機械学習において,均衡状態の安定性は重要な研究課題である。効率的な学習アルゴリズムの設計に不可欠。
    • 非凸・非凹 payoffsを持つゲームにおけるMFL-DAの長期的振る舞いは未解決であり,均衡への収束性が保証されていない。
    • 初期値が Wasserstein 距離内で均衡状態に十分近い場合に,指数関数的に均衡状態へ収束することを示す。
    • 本研究では,WangとChizatが提起した未解決問題に対し,均衡状態が局所的に指数安定であることの証明を与える。
    • 安定性の証明には,均衡点近傍のエントロピーに対する強制性の評価が鍵となる。これは,線形化された演算子のスペクトル解析によって実現される。
    • この強制性により局所的な変位凸凹構造が明らかになり,収縮を促進する。WangとChizatの疑問を局所的安定性に関して解決する。

    Link: https://arxiv.org/abs/2602.01564

  • ソーシャルメディアにおける誤情報の関与に関する社会交換理論に基づくモデリング [cs.CL, cs.SI, cs.AI]目的:ソーシャルメディアにおける誤情報への関与予測
    • ソーシャルメディアは情報伝達の重要な手段であり,誤情報の拡散は社会に大きな影響を及ぼす。
    • 既存の研究では,誤情報の拡散を促進する多様な社会的メカニズムやプラットフォーム設計が十分に考慮されていない。
    • 本研究は,行動データから社会交換の原理を発見し,誤情報への関与をより正確に予測することを目指す。
    • 提案手法DREAMSは,誤情報への関与を社会交換のダイナミックなプロセスとしてモデル化することに成功した。
    • 7つのプラットフォームにおける大規模データセットを用いて,DREAMSは誤情報への関与予測において最先端の性能を達成した(平均絶対パーセント誤差19.25%)。
    • モデルの分析結果は,ソーシャルメディア上での誤情報の拡散に社会交換の原理が当てはまることを示唆しており,理論に基づいたモデリングの有効性を示している。

    Link: https://arxiv.org/abs/2602.01567

  • 生成的な視覚的コードモバイルワールドモデル [cs.LG, cs.AI, cs.CV]目的:モバイルGUIエージェントの性能向上
    • モバイルGUIの自動化は,ユーザーエクスペリエンス向上に不可欠である。
    • 既存手法は,視覚的忠実性と正確なテキストレンダリングのトレードオフに陥っている。
    • 視覚的忠実性とテキストレンダリングを両立する新しいパラダイムを提案すること。
    • 本研究では,実行可能なWebコードを生成することでGUIの状態を予測する新しい手法を提案した。
    • 提案手法に基づいたgWorldモデルは,既存のオープンウェイトモデルと比較して,精度とモデルサイズのバランスに優れている。
    • データ生成フレームワークgWorldを用いたデータ拡張により,性能向上が確認された。

    Link: https://arxiv.org/abs/2602.01576

  • DrawSim-PD:NGSSに準拠した教師の診断的推論を支援するための生徒の科学的な図画のシミュレーション [cs.CY, cs.AI]目的:NGSSに準拠した生徒の科学的な図画のシミュレーション
    • 教師の診断的推論能力向上は教育の質に不可欠である。多様な生徒の成果に対する実践的な訓練が必要とされている。
    • 生徒の実際の成果物を共有することは,プライバシー保護の観点から,大規模な教師研修において困難が生じている。
    • この研究は,生徒の図画をシミュレーションすることで,プライバシーの問題を回避し,教師の診断的推論能力の向上を図る。
    • DrawSim-PDは,NGSSに準拠した生徒の科学的な図画を生成する最初のフレームワークである。これにより,教師研修におけるデータの制約を克服できる。
    • 生成された図画,生徒の思考過程の説明,および教師向けの診断概念図は,認知的な整合性を保つように設計されている。
    • 専門家による評価の結果,生成された成果物はNGSSの期待に沿っており,生徒の思考を解釈する上で有用であることが確認された。

    Link: https://arxiv.org/abs/2602.01578

  • ほぼ最適な能動的嗜好学習とそのLLMアライメントへの応用 [cs.LG]目的:大規模言語モデルのアライメントのための能動的嗜好学習アルゴリズム
    • LLMのアライメントはAIの安全性と有用性を左右するため,重要性が高い。
    • 人間の嗜好ラベルの収集コストが高く,効率的な学習方法が課題である。
    • 嗜好学習に特化した能動的学習アルゴリズムを開発し,効率を改善すること。
    • 既存の実験計画法では,嗜好学習の構造を十分に考慮できていない点が判明した。
    • 提案手法は,インスタンス依存のラベル複雑度保証を持つ初のアルゴリズムである。
    • 実世界のデータセットにおいて,既存手法よりも優れたサンプル効率が確認された。

    Link: https://arxiv.org/abs/2602.01581

  • AIベースのチャネルデコーダの小さなチャネル摂動に対する脆弱性 [cs.IT, cs.AI, cs.LG, math.IT]目的:AIベースのチャネルデコーダのロバスト性
    • 通信システムにおいて,信頼性の高い情報伝送は不可欠であり,誤り訂正符号は重要な役割を担う。
    • 深層学習を用いた誤り訂正デコーダは性能向上が期待される一方,そのロバスト性については十分な検証がなされていない。
    • チャネル出力分布の変化に対するAIデコーダの脆弱性を評価し,その潜在的なリスクを明らかにすること。
    • 最近のAIデコーダ(ECCTやCrossMPT)は,i.i.d. AWGNチャネル下では優れた性能を示すものの,小さな摂動に対しては著しい性能劣化を示すことが示された。
    • 敵対的摂動はAIデコーダ間で比較的強く転移するが,BPベースのデコーダへの転移は弱い。
    • 普遍的な摂動は,同じノルムのランダム摂動よりも遥かに有害であり,AIデコーダの性能向上にはロバスト性のコストが伴う可能性が示唆された。

    Link: https://arxiv.org/abs/2602.01582

  • 時系列予測のための軽量疎な相互作用ネットワーク [cs.LG]目的:長期時系列予測における高性能化
    • 時系列データは,経済,気象,交通など幅広い分野で重要であり,正確な予測が求められる。
    • Transformerモデルは計算コストが高く,線形モデルでは複雑な時間的依存関係の捉え方が不十分である。
    • 疎な相互作用機構により,効率的かつ高精度な長期時系列予測を実現する。
    • 提案手法LSINetは,既存の線形モデルやTransformerモデルと比較して,より高い予測精度と効率を実現した。
    • MSIMは,疎なベルヌーイ分布を用いて時間ステップ間の重要な関係性を学習し,時間的依存性を捉える。
    • SILは,時間的相互作用の共有性を活用し,効率化と収束性の向上に貢献する。

    Link: https://arxiv.org/abs/2602.01585

  • ノイズ付加アライメントによるLLM脱獄に対する証明可能な防御フレームワーク [cs.CL, cs.AI]目的:LLMの脱獄攻撃に対する証明可能な堅牢性
    • LLMの安全性確保は,社会実装において不可欠であり,その脆弱性克服が急務である。
    • 既存の防御策は,巧妙化する攻撃に対して脆弱であり,信頼性のある安全保証が求められる。
    • 統計的安定性に基づく,攻撃に対する確実な安全性を証明するフレームワークの構築。
    • 提案手法は,勾配ベース攻撃の成功率を84.2%から1.2%に大幅に低減することに成功した。
    • 同時に,良質な出力性能を94.1%と高く維持しており,既存手法と比較して性能劣化を抑制している。
    • 本フレームワークは,モデルが特定の半径内ではあらゆる攻撃に対して堅牢であることを証明する。

    Link: https://arxiv.org/abs/2602.01587

  • スペクトルテキスト融合:周波数認識型マルチモーダル時系列予測 [cs.LG, cs.AI]目的:マルチモーダル時系列予測におけるテキスト情報の効果的な統合
    • 現実世界の意思決定において,数値データと文脈信号の両方が重要であるため。
    • 既存手法はテキスト特徴と時系列パターンを逐次的に整合させるため,文脈情報の多段階的な影響を捉えきれない。
    • 周波数分解により,時系列の短期変動と長期トレンドを分離し,テキスト文脈との不一致を解消することを目指す。
    • 提案手法SpecTFは,テキスト情報を周波数領域に投影し,軽量なクロスアテンション機構を用いて時系列のスペクトル成分と融合する。
    • テキストの関連性に基づいて周波数帯域を適応的に重み付けし,予測のために結果を時間領域にマッピングする。
    • 多様なマルチモーダル時系列データセットにおいて,最先端モデルを大幅に上回り,パラメータ数を大幅に削減する。

    Link: https://arxiv.org/abs/2602.01588

  • 球面ベルトラミ微分を用いたGenus-0曲面パラメータ化 [cs.GR, cs.CV, cs.LG, math.AG]目的:球面曲面パラメータ化手法
    • 幾何処理や画像処理において基本的なツールであり,様々な応用がある。
    • タスク目標,単射性維持,幾何学的歪みの制御の間のトレードオフが存在する。
    • 球面上の準共形自己同型写像に基づく新しいパラメータ化手法を開発する。
    • 球面ベルトラミ微分(SBD)を導入し,球面ホメオモルフィズムとの関係を確立した。
    • 半球状ステレオ投影チャート上でベルトラミ場を最適化するニューラル最適化フレームワークBOOSTを提案した。
    • 大規模変形ランドマークマッチングや強度ベースのスフェリカル登録で有効性を実証し,脳皮質表面登録への応用で高い精度を示した。

    Link: https://arxiv.org/abs/2602.01589

  • 複数チケット仮説:強化学習検証報酬におけるランダムな疎なサブネットワークで十分 [cs.CL, cs.LG, cs.AI]目的:強化学習検証報酬における疎なパラメータサブセットの有効性
    • 深層学習モデルのパラメータ冗長性が指摘されており,効率的な学習方法が求められている。
    • 強化学習検証報酬では,更新がパラメータの疎な部分集合に集中する傾向がある。
    • 事前学習済みモデルが持つ複数の有効な疎なサブネットワークの存在を示す。
    • パラメータのわずか1%のみを学習させた場合でも,フルパラメータでのファインチューニングと同等かそれ以上の性能を達成した。
    • 異なるランダムマスク間にはほとんど重複が見られず,どのマスクでも成功することから,モデル内に多数の有効なサブネットワークが存在することが示唆される。
    • 強化学習検証報酬におけるステップごとのKL制約が,低次元空間への更新を制限し,任意の疎なマスクが成功することを可能にしている。

    Link: https://arxiv.org/abs/2602.01599

  • 期待される危害:LLMの安全性評価の再考 [cs.CR, cs.CL, cs.CY, cs.LG]目的:LLMの安全性評価における危害の期待値の検討
    • LLMの安全性確保は,社会実装において不可欠であり,その評価方法の改善が求められている。
    • 既存の評価指標は,全ての有害なクエリのリスクを均一と仮定しており,実現可能性が考慮されていない。
    • 危害の実現可能性を考慮した新たな評価指標を提案し,LLMの脆弱性を明らかにすること。
    • 既存モデルの分析により,危害の実現可能性が低い(高コスト)脅威に対しては拒否反応が強く,実現可能性が高い(低コスト)クエリには脆弱であることが示された。
    • この誤較正を利用することで,既存の脱獄攻撃の成功率を最大2倍に高めることが可能となった。
    • 線形探査の結果,モデルは危害の深刻度を潜在空間に符号化する一方,実行コストを区別する内部表現を持たないことが判明した。

    Link: https://arxiv.org/abs/2602.01600

  • 検証可能な報酬を持つオンライン強化学習における適応的ロールアウト割り当て [cs.LG, cs.AI, cs.CL]目的:検証可能な報酬を持つオンライン強化学習におけるロールアウト割り当て戦略
    • 強化学習は,複雑な意思決定問題への応用が期待されており,様々な分野で重要な技術である。
    • 従来の強化学習では,サンプル効率が課題であり,特に検証可能な報酬の場合,その傾向が強い。
    • 提示されたタスクの重要度に応じてロールアウトを動的に割り当てることで,サンプル効率を向上させる。
    • 提案手法は,各プロンプトの成功確率を予測し,それに基づいてロールアウトを割り当てることで,勾配分散を最小化する。
    • 実験結果から,提案手法は,一様割り当てやヒューリスティックな割り当て戦略と比較して,サンプリング効率と性能が向上することが示された。
    • 軽量なガウス過程モデルを用いることで,計算コストを抑えつつ,効率的なロールアウト割り当てを実現している。

    Link: https://arxiv.org/abs/2602.01601

  • 時系列基盤モデルにおける普遍的な冗長性 [cs.LG, stat.ML]目的:時系列基盤モデルの中間層における冗長性の存在
    • 時系列データ分析は,経済,気象,医療など多岐にわたる分野で重要であり,その予測精度向上は不可欠である。
    • 既存の時系列モデルは,特定のタスクに特化し汎用性に欠ける場合があり,学習データ量にも依存しやすい。
    • 時系列基盤モデルの構造的特性を解明し,モデルの効率化と性能改善に貢献することを目指している。
    • 主要なTransformerベースの時系列基盤モデルの中間層に冗長な要素が存在することが大規模な評価により明らかになった。
    • モデル全体の層を削除しても,性能への影響が少ないことが示され,モデルの簡素化の可能性を示唆している。
    • ヘッドの安定ランクに基づくアブレーション戦略により,時系列基盤モデルにおける文脈の模倣や季節性バイアスの原因となる特定のヘッドが特定された。

    Link: https://arxiv.org/abs/2602.01605

  • 最大エントロピー強化学習におけるフローマッチングによる性能向上 [cs.LG, cs.AI]目的:最大エントロピー強化学習における性能向上手法
    • 強化学習は,複雑な環境における最適な意思決定を自動的に学習する技術であり,ロボット制御等に応用が期待される。
    • 拡散モデルは表現力が高まる一方,推論に時間がかかるという課題があり,効率的な探索・利用のバランスが難しい。
    • 本研究では,フローマッチングと最大エントロピー強化学習を統合し,効率的かつ高性能な制御を実現することを目指す。
    • 提案手法FLAMEは,重要度重み付けにより,分割関数推定を回避するQ-Reweighted FM目的関数を導出する。
    • 分離されたエントロピー推定器を設計し,バイアスを厳密に修正することで,効率的な探索を可能にし,最適なMaxEntポリシーに近づける。
    • MuJoCo環境での実験により,FLAMEがガウス基盤手法を上回り,多段階拡散ポリシーと同等の性能を,大幅に低い推論コストで達成することが示された。

    Link: https://arxiv.org/abs/2602.01606

  • 自己回帰的拡散協調思考による推論 [cs.AI]目的:自己回帰モデルと拡散モデルの協調による推論フレームワーク
    • 生成AIの発展は,複雑な問題解決への応用を可能にするため重要である。
    • 自己回帰モデルは空間的・物理的な制約が苦手であり,拡散モデルは論理的制御が課題である。
    • 両モデルの弱点を補完し,空間推論と生成制御の信頼性を高めることを目指す。
    • 協調思考フレームワークは,自己回帰モデルによる計画と拡散モデルによる視覚化を閉ループで繰り返す。
    • 視覚的な思考は,制約を満たしているか評価され,そのフィードバックが計画と生成を改善する。
    • 本研究は,質問応答と視覚生成の両タスクにおいて,空間推論と生成制御の向上を示す。

    Link: https://arxiv.org/abs/2602.01608

  • 都市領域表現学習のためのタスク指向プロンプト調整:ToPT [cs.AI, cs.LG]目的:都市領域表現の学習
    • 都市計算における重要な基盤技術であり,犯罪予測や資源配分といった多様な課題に応用可能である。
    • 既存手法はタスクに依存しない汎用的な表現を学習するため,下流タスクとの関連性が薄れるという課題がある。
    • 空間的な整合性とタスク固有の意味的整合性を明示的に考慮した,より効果的な領域表現学習を目指す。
    • 提案手法ToPTは,空間的に一貫性のある融合とタスク間の明示的な整合性を実現する二段階フレームワークである。
    • 空間認識型領域埋め込み学習(SREL)モジュールは,Graphormerを用いて空間的情報を考慮した領域間の相互作用を捉える。
    • タスク認識型プロンプティング(Prompt4RE)モジュールは,マルチモーダル大規模言語モデル(MLLM)を用いてタスクに応じたプロンプトを作成し,領域埋め込みと意味的に整合させる。

    Link: https://arxiv.org/abs/2602.01610

  • エージェントは軌道SFTから何を学ぶか:意味か,インタフェースか [cs.LG]目的:大規模言語モデルにおけるインタラクティブエージェントの学習内容の特定
    • エージェント型大規模言語モデルの評価は重要性を増している。しかし,既存の評価指標には課題がある。
    • 既存の評価指標では,意味に基づいたツール利用と,インタフェース特有のパターン記憶を区別できない。
    • 本研究は,インタフェースへの依存度を診断し,環境に依存しない能力を評価することを目指す。
    • 本研究で提案するPIPEプロトコルは,タスクの意味を維持しつつ,環境インタフェースを最小限変更することで,インタフェース依存性を診断する。
    • 軌道SFTで訓練されたエージェントは,わずかなインタフェース変更に対して性能が大幅に低下するのに対し,そうでないモデルは安定していることが示された。
    • Interface Reliance (IR)指標は,訓練時のインタフェースへの嗜好を定量化し,環境に依存した非単調な学習ダイナミクスを明らかにする。

    Link: https://arxiv.org/abs/2602.01611

  • 大規模言語モデル向け実用的なテンソルネットワーク圧縮パイプライン [cs.LG, cs.AI]目的:大規模言語モデルの圧縮手法
    • 大規模言語モデルの利用拡大には,メモリ消費量と推論速度の改善が不可欠である。
    • 既存手法では,モデルの構造的な圧縮と,その実用的な展開が課題となっていた。
    • Transformerアーキテクチャの構造的な圧縮パイプラインを構築し,効率的な推論を実現する。
    • Minimaは,Transformerの層およびパッチレベルの感度を予測し,低感度領域にテンソル分解を適用する。
    • Qwen3-32Bにおいて,MinimaはピークVRAMを64GiBから40GiBに削減し,推論速度を向上させた。
    • 推測デコーディングと組み合わせることで,高い並行性下でも効果を維持し,より積極的な構造圧縮への道を開く。

    Link: https://arxiv.org/abs/2602.01613

  • 農業生態系における炭素・窒素フラックス予測のための空間的・時間的ベンチマーク:AgroFlux [cs.LG, cs.AI]目的:農業生態系における炭素と窒素のフラックス予測のためのベンチマークデータセット
    • 農業生態系は地球温暖化に大きく影響し,環境の持続可能性を確保する上で重要な役割を担う。
    • 従来の測定方法では,データの不足,空間的・時間的な不均一性,複雑な地下プロセスなどの課題が存在する。
    • AIを活用した信頼性の高いモデリングを可能にするための,AI対応ベンチマークデータセットの構築が求められている。
    • 本研究では,EcosysとDayCentの物理モデルシミュレーションと,実世界のフラックス観測データを統合した,農業生態系の温室効果ガスに関する初の空間的・時間的ベンチマークデータセットを公開する。
    • LSTM,時間的CNN,Transformerなどの深層学習モデルを用いて,炭素と窒素フラックス予測の性能を評価した。
    • シミュレーションデータを活用した転移学習により,深層学習モデルの汎化性能を向上させる可能性を示した。

    Link: https://arxiv.org/abs/2602.01614

  • 状態因数分解による構造化された教師なしスキル発見 [cs.CL, cs.LG, cs.AI]目的:多様なスキルの自律的な学習
    • ロボット工学において,複雑なタスクを達成するには,多様なスキルの自動獲得が不可欠である。
    • 従来の教師なしスキル発見手法は,単純なスキルに偏りやすく,複雑な環境での応用が課題であった。
    • 環境の構造を考慮し,より豊かで多様なスキルの発見を目指す。
    • 本研究では,状態空間を独立な要素に分解し,各要素に対して異なるスキル変数を割り当てるSUSDを提案する。
    • SUSDは,既存手法と比較して,要素数が多い複雑な環境において,より多様で複雑なスキルを発見できることを実験的に示す。
    • 発見されたスキル表現は,個々の要素に対する細かく分離された制御を可能にし,階層型強化学習による効率的なタスク学習を促進する。

    Link: https://arxiv.org/abs/2602.01619

  • 準同型暗号化のためのモーメント母関数による効率的なソフトマックス再構成 [cs.CR, cs.LG]目的:準同型暗号化におけるソフトマックス関数の効率的な近似手法
    • プライバシー保護機械学習において,暗号化されたデータに対する推論を可能にする重要な枠組みである。
    • ソフトマックス関数は多変量性,指数関数のダイナミックレンジ,正規化時の正確な除算が課題となる。
    • モーメント母関数に基づくソフトマックス再構成により,計算コストを削減し,高精度な近似を実現する。
    • 提案手法MGF-softmaxは,ソフトマックスの分母をモーメントベースの表現に置き換えることで,乗算深度を大幅に削減する。
    • Vision Transformerや大規模言語モデルを用いた実験により,暗号化された推論においてMGF-softmaxが高効率かつ高精度であることが示された。
    • MGF-softmaxは,高深度の正確な方法に匹敵する推論精度を,大幅に低い計算コストで実現する。

    Link: https://arxiv.org/abs/2602.01621