arXiv雑要約

AI - 2026/02/05 公開

  • ミューオン解析と拡張:深層分析 [cs.LG, cs.AI, cs.CL]目的:ミューオン最適化手法のメカニズム解明と,適応的最適化手法との関係性の考察
    • 深層学習の性能向上には,効率的かつ安定な最適化手法が不可欠である。
    • ミューオンの内部メカニズムやAdamとの関連性が十分に解明されていない。
    • スペクトル視点からミューオンを解析し,その性能限界を明らかにすること。
    • RMS正規化による勾配更新が,モーメンタムによる更新よりも安定した最適化を実現することが示された。
    • スペクトル圧縮はモーメンタム更新を安定化させるが,ミューオン更新はAdamを一貫して上回る性能を示さなかった。
    • ミューオンは効果的なスペクトル正規化として理解できるが,汎用的な最適化手法ではないと考えられる。

    Link: https://arxiv.org/abs/2602.04669

  • 態度を誇張し,ネットワークを無視する:LLMにおける誤情報感受性シミュレーションの偏り [cs.SI, cs.AI, cs.CL]目的:誤情報に対する感受性のパターン再現能力の検証
    • 社会科学研究においてLLMが人間の判断の代替として利用される機会が増加している。
    • LLMが人間の誤情報感受性パターンを正確に再現できるか不明確である点が課題である。
    • LLMシミュレーションにおける人間の判断からのずれを特定することを目指す。
    • LLMによるシミュレーションは,広範な分布傾向を捉え,人間の回答との間に穏やかな相関性を示す。
    • しかし,LLMは信念と共有の関連性を一貫して誇張する傾向がある。
    • シミュレーション結果に基づく線形モデルは,人間の回答に基づくモデルと比較して,態度的・行動的特徴に過剰な重みを置く。

    Link: https://arxiv.org/abs/2602.04674

  • グラフ上の一般化されたシュレーディンガーブリッジ [cs.LG]目的:グラフ上における実行可能な制御連続時間マルコフ連鎖(CTMC)ポリシーの学習
    • 様々な分野で重要な課題であり,トポロジーや運用制約を考慮した意思決定が求められる。
    • 既存手法は表現力に乏しく,制約の多い仮定に依存し,疎なトポロジーや大規模グラフに対応できない。
    • 任意のグラフ上で,状態コストを考慮した動的な輸送を効率的に学習し,スケーラビリティを高める。
    • GSBoGは,複雑な実世界のグラフトポロジーにおいて,正確かつトポロジーを尊重するポリシーを確実に学習できる。
    • 中間状態コストを最適化することで,アプリケーション固有の要件に対応できる汎用性の高いフレームワークである。
    • GSBoGは,グローバルソルバーに依存せず,スケーラビリティを向上させる軌跡レベルのポリシー学習を実現している。

    Link: https://arxiv.org/abs/2602.04675

  • REDistill:ロバスト性・効率性の両立を目指すロバスト推定蒸留 [cs.LG, cs.CV]目的:ロバスト性と効率性のバランスをとるための蒸留手法
    • 深層学習モデルの高性能化には,モデルの規模拡大が不可欠だが,計算コストが大きい。
    • 教師モデルからの知識伝達において,教師の予測がノイズを含む場合がある。
    • 教師モデルの信頼性の低い出力を抑制し,知識蒸留の汎化性能を向上させる。
    • REDistillは,標準的な知識蒸留の目的関数をロバスト統計に基づいたパワーダイバージェンス損失に置き換える。
    • これにより,教師のノイズを適切に処理し,ロジット間の情報関係を維持する。
    • CIFAR-100およびImageNet-1kにおける実験で,様々な教師・生徒モデル構成において,REDistillは常に生徒の精度を向上させた。

    Link: https://arxiv.org/abs/2602.04677

  • 専門家の不確実性を考慮:確率時系列予測のための多専門家ラベル分布アプローチ [cs.LG, cs.AI]目的:確率時系列予測における多専門家ラベル分布
    • 現実世界の応用では,高い予測精度と解釈可能な不確実性の定量化が重要である。
    • 従来の点予測は時系列データの不確実性を捉えきれない場合が多い。
    • 計算効率と解釈可能性のバランスを取りながら,不確実性の定量化を改善する。
    • 提案手法は,混合エキスパートアーキテクチャと分布学習能力により,これらの課題に対処する。
    • 多専門家LDLは優れた全体的な性能を示し,パターン認識型LDL-MoEはコンポーネントごとの分析により解釈性を高める。
    • 予測精度と解釈可能性のバランスを実現し,実用的な予測応用に適している。

    Link: https://arxiv.org/abs/2602.04678

  • 微細な音声生成と編集のためのAudio ControlNet [cs.SD, cs.AI, cs.CL, cs.MM]目的:微細なテキストから音声への生成制御
    • 近年の音声技術の発展は,多様な応用を可能にする上で不可欠である。
    • 既存のモデルは高音質な音声を生成するものの,音量や音高などの詳細な制御が困難である。
    • 本研究は,既存モデルを再学習することなく,詳細な音声制御を実現することを目的とする。
    • 提案手法であるT2A-Adapterは,わずか38Mの追加パラメータで,AudioSet-Strongにおいて最先端の性能を達成した。
    • T2A-Adapterは,イベントレベルおよびセグメントレベルのF1スコアの両方で優れた制御能力を示した。
    • さらに,指示された時間位置で音声イベントの削除と挿入を可能にするT2A-Editorを提案し,音声編集への応用を示した。

    Link: https://arxiv.org/abs/2602.04680

  • 全球海洋における物理的予測因子からの植物プランクトンバイオマス動態の静的・自己回帰的ニューラルエミュレーション [cs.LG]目的:全球海洋における植物プランクトンバイオマスの動態予測
    • 植物プランクトンは海洋生態系と地球規模の物質循環の基盤であり,その理解は重要である。
    • 既存の数値モデルは,パラメータ化の限界や観測データの不足により,植物プランクトンの動態を正確にシミュレートできていない。
    • 本研究では,深層学習モデルを用いて,植物プランクトンバイオマスの時空間分布を予測し,モデルの改善を目指す。
    • UNetアーキテクチャは,他のモデル(CNN,ConvLSTM,4CastNet)と比較して,植物プランクトンバイオマスの季節変動と年変動をより正確に再現できることが示された。
    • UNetは,1~2ヶ月の環境データ入力で良好な性能を示すが,低周波変動の振幅を過小評価する傾向がある。
    • 自己回帰的UNetは短期予測(最大5ヶ月)において有効であるが,長期予測では性能が低下する。

    Link: https://arxiv.org/abs/2602.04689

  • DRMOT:RGBD参照マルチオブジェクトトラッキングのためのデータセットとフレームワーク [cs.IR, cs.CV, cs.AI]目的:RGB,深度,言語モダリティを融合した3D空間認識トラッキングの実現
    • ロボティクスや自動運転などの対話型AIシステムにおいて,言語による指示に基づく対象物追跡が重要である。
    • 既存のRMOTモデルは2D RGBデータのみに依存しており,複雑な空間意味を持つ対象の検出や,遮蔽下でのID維持が困難である。
    • RGBD情報を活用することで,空間的な意味理解と,よりロバストな対象物追跡を目指す。
    • DRSetというRGBD参照マルチオブジェクトトラッキングのデータセットを構築し,モデルの空間的・意味的根拠付けと追跡能力を評価する。
    • MLLM(マルチモーダル大規模言語モデル)をガイドとした深度参照トラッキングフレームワークDRTrackを提案した。
    • DRSetデータセットでの実験により,提案手法が効果的であることが示された。

    Link: https://arxiv.org/abs/2602.04692

  • グラフにおける畳み込みの限界理解と回避に向けて [cs.CL, cs.CL, cs.LG]目的:グラフニューラルネットワークの性能を制限する要因の理論的分析と,それらを克服するためのフレームワークの提案
    • グラフ構造データに対する機械学習は,様々な分野で応用が期待されており,その重要性は高まっている。
    • 既存のグラフニューラルネットワークは,表現力の限界や過剰平滑化といった問題に直面している。
    • 本研究は,グラフニューラルネットワークの性能低下の根本的な原因を解明し,その対策を提示することを目的とする。
    • メッセージパッシングの反復による特徴量の成分の偏り(SCA,CD)が,ノード表現のランク崩壊を引き起こすことが示された。
    • 複数の計算グラフやエッジ関係を利用することで,SCAを回避可能であることが理論的に証明された。
    • パーソナライズドPageRankに基づいたMPNN変種により,無限回のメッセージパッシングが可能となり,初期ノードの特徴を維持できることが示された。

    Link: https://arxiv.org/abs/2602.04709

  • RAGにおけるスパースアテンションを用いたコーパス知識ポイズニング攻撃への対処 [cs.IR, cs.AI]目的:RAGシステムに対するコーパス知識ポイズニング攻撃の防御
    • 大規模言語モデル(LLM)の応答精度向上とハルシネーション低減に,RAGが重要な役割を担う。
    • RAGシステムは,攻撃者が悪意のある文書を混入させることで,意図しない応答を誘導される脆弱性を持つ。
    • 本研究は,RAGにおけるクロスドキュメント間の有害な相互作用を抑制し,攻撃成功率を低減することを目指す。
    • 提案手法であるSDAGは,標準的な因果アテンション機構と比較して,攻撃成功率を大幅に低下させる。
    • SDAGは,推論時のアテンションマスクへのわずかな変更で実装可能であり,ファインチューニングやアーキテクチャ変更は不要である。
    • SDAGを既存のRAG防御手法と組み合わせることで,より高い防御性能が実現されることが示された。

    Link: https://arxiv.org/abs/2602.04711

  • SAR-RAG:意味検索,検索,MLLM生成によるATR視覚質疑応答 [cs.CV, cs.AI, eess.IV]目的:合成開口レーダー(SAR)画像の自動標的認識(ATR)における視覚的コンテキストに基づく画像検索による生成の支援
    • SARは,国防や安全保障において軍用車両の位置を検知・監視する重要なリモートセンシング技術である。
    • SAR画像は,車両が画像上で区別しにくく,種類,特徴,計測の識別が課題であった。
    • 類似事例のデータベース検索を通じて,SAR画像のATR精度向上を目指す。
    • 提案手法SAR-RAGは,MLLMと意味埋め込みベクトルデータベースを組み合わせ,コンテキスト検索を可能にした。
    • 過去のSAR画像事例を参照することで,類似車両カテゴリ間の比較を行い,ATR予測精度を向上させた。
    • 検索・検索メトリクス,カテゴリ分類精度,車両寸法の数値回帰において,SAR-RAGの有効性が確認された。

    Link: https://arxiv.org/abs/2602.04712

  • テキスト画像生成のための適応的プロンプト抽出 [cs.HC, cs.AI, cs.CV]目的:テキスト画像生成におけるユーザーの意図との整合性向上
    • 画像生成技術は創造性を拡張するが,意図通りの画像を生成するには高度なプロンプト設計が必要である。
    • ユーザーは曖昧な入力やモデルの癖に苦戦し,意図した画像を生成できない場合が多い。
    • ユーザーの負担を軽減しつつ,対話的に意図を明確化することで,高品質な画像生成を実現する。
    • 適応的プロンプト抽出(APE)は,視覚的な質問を通じてユーザーのプロンプトを洗練させ,少ない記述労力で意図を反映する。
    • APEは,情報理論的枠組みに基づき,潜在的な意図を解釈可能な特徴要件として表現し,効果的なプロンプトを生成する。
    • IDEA-BenchとDesignBenchでの評価により,APEがより高い整合性と効率を達成することが示された。ユーザー調査でも高い整合性が確認された。

    Link: https://arxiv.org/abs/2602.04713

  • 複数地平線時系列予測における拘束付き棄権 [cs.LG]目的:複数地平線時系列予測における棄権学習戦略
    • 医療や金融など,誤予測のコストが高い分野で正確な予測が不可欠である。
    • 従来の棄権戦略は,単一の予測に焦点を当てており,複数地平線予測の相関性を考慮していない。
    • 複数地平線予測に適した棄権学習の枠組みを構築し,最適な棄権戦略を提案すること。
    • 複数地平線予測における3つの自然な棄権概念を定式化し,理論的分析を行った。
    • 提案手法は,既存のベースラインと比較して,24のデータセットで有意に高い性能を示した。
    • 本研究により,複数地平線予測における棄権学習の新たな可能性が示唆された。

    Link: https://arxiv.org/abs/2602.04714

  • ニューラルネットワークから空間アクセラレータへの進化マッピング [cs.CL, cs.NE]目的:ニューラルネットワークの空間アクセラレータへの自動マッピング手法
    • 低遅延・低消費電力な推論処理の需要が高まる中,空間アクセラレータが注目されている。
    • 空間アクセラレータの性能を最大限に引き出すには,専門的な知識に基づいた計算グラフのマッピングが必要である。
    • ハードウェア知識がなくても効率的にワークロードを展開できる自動マッピング手法を開発する。
    • Intel Loihi 2を用いた実験で,提案手法はデフォルトのヒューリスティクスと比較して総遅延を最大35%削減した。
    • 提案手法はマルチチップシステムへの拡張性も示し,明示的なエネルギー効率最適化なしで最大40%のエネルギー効率向上を達成した。
    • 本研究は,ニューロモーフィックアクセラレータのハードウェア・イン・ザ・ループマッピングを可能にする最初の進化型フレームワークを提供する。

    Link: https://arxiv.org/abs/2602.04717

  • 直交性正則化による介入可能かつ解釈可能な特徴の特定 [cs.LG, cs.AI, cs.CL]目的:言語モデルの特徴の識別
    • 近年,大規模言語モデルの性能向上に貢献する手法として注目されている。
    • 特徴間の干渉や重ね合わせが,解釈性や介入可能性を阻害する課題がある。
    • 直交性を促進することで,モジュール性の高い表現を獲得し,介入を容易にすること。
    • 固定された疎なオートエンコーダを用いた言語モデルのファインチューニングにより,ほぼ直交する特徴に分解することができた。
    • 直交性ペナルティを導入することで,特徴の分解の一意性が保証され,説明可能性が向上した。
    • 直交性ペナルティを強めるほど,特徴の説明間の距離が拡大し,孤立した介入が可能になった。

    Link: https://arxiv.org/abs/2602.04718

  • PPGに基づくカフレス血圧推定手法のベンチマークと性能向上 [cs.LG, eess.SP]目的:PPGに基づくカフレス血圧推定モデルのベンチマークと性能向上
    • 心血管疾患の早期発見と予防は,健康寿命の延伸に不可欠である。
    • 既存のPPGベース血圧推定モデルは,臨床的精度基準を満たしていない場合が多い。
    • 標準化された環境下でのベンチマークと,モデルの改良による精度向上を目指す。
    • 既存の血圧推定モデルはいずれもAAMI/ISO 81060-2の基準を満たさなかった。
    • 年齢,性別,BMI等の患者属性情報を追加することで,モデルの性能が全体的に向上した。
    • MInceptionモデルでは,患者属性情報を加えたことで誤差が23%減少し,AAMI/ISO基準に匹敵する精度を達成した。

    Link: https://arxiv.org/abs/2602.04725

  • エージェントAIによるソフトウェアエンジニアリング支援:ドキュメント検索とテストシナリオ生成のデモンストレーション [cs.SE, cs.AI]目的:ソフトウェアエンジニアリングタスクの支援
    • ソフトウェア開発の効率化と品質向上が常に求められているため。
    • 要求仕様からテストシナリオの自動生成は,手作業による負担が大きく,効率が悪い。
    • エージェントAIを用いて,これらのタスクを自動化し,開発効率の向上を目指す。
    • 詳細な要求仕様からテストシナリオを自動生成するエージェントAIソリューションを開発した。
    • ソフトウェアエンジニアリングドキュメントの検索,質問応答,変更追跡,要約を行うエージェントAIソリューションを開発した。
    • 各ユースケースに特化したLLMベースのエージェントが,関連するサブタスクをすべて実行する。

    Link: https://arxiv.org/abs/2602.04726

  • ファインチューニングを減らし,検索性能を向上:合成データとモデルマージによるLLMのバイオメディカル検索への適応の再考 [cs.CL, cs.CL, cs.LG]目的:バイオメディカル検索のためのLLM適応手法
    • LLMの知識更新と幻覚抑制にRAGが不可欠であり,その検索性能が重要視されている。
    • 汎用LLMを専門領域,特にバイオメディカル分野の検索に効果的に適応する技術が未熟である。
    • 合成データ,検索プロンプト最適化,モデルマージを通じて,LLMを高性能な専門領域検索モデルに変える。
    • Synthesize-Train-Merge (STM)フレームワークにより,タスク固有の専門モデルの性能が最大23.5%向上した。
    • STMにより生成されたマージモデルは,単一の専門モデルや強力なベースラインよりも優れた性能を示した。
    • 汎用LLMの能力を維持しつつ,専門タスクで優れた性能を発揮する,効率的な適応経路を示した。

    Link: https://arxiv.org/abs/2602.04731

  • DMFlow:フローマッチングによる無秩序材料の生成 [cs.LG, cond-mat.mtrl-sci]目的:無秩序材料の生成手法
    • 技術進歩には特性を調整した材料設計が不可欠である。材料開発において重要な役割を果たす。
    • 既存の深層生成モデルは主に規則的な結晶に焦点を当てており,無秩序材料への対応が遅れている。
    • この研究は,規則的,置換的,位置的無秩序結晶を統一的に生成するフレームワークを構築し,無秩序材料の設計を支援する。
    • DMFlowは,無秩序結晶に特化した生成フレームワークであり,物理的に妥当な無秩序度を保証する。
    • グラフニューラルネットワークを用いてベクトル場を学習し,結晶構造予測と新規生成タスクで最先端手法を上回る性能を示した。
    • 無秩序材料の探索を促進するため,構造データベースを公開し,AI駆動型の材料発見の基盤を提供する。

    Link: https://arxiv.org/abs/2602.04734

  • データから行動へ:学習前の予期せぬモデル行動の予測 [cs.LG, cs.AI, cs.CL, cs.CY, cs.IR]目的:予期せぬモデル行動の予測
    • 大規模言語モデルの安全性が重要視される中,学習データに潜むリスクの早期発見が不可欠である。
    • 既存手法では,ファインチューニング前に潜在的なリスクを特定することが難しく,評価コストが高い。
    • 学習前にデータ由来の潜在的リスクを予測し,安全性を確保することを目指す。
    • 提案手法Data2BehaviorとMDFは,モデルのパラメータ更新なしに潜在的なバイアスや安全リスクを予測可能である。
    • MDFは,ファインチューニングに必要なGPUリソースの約20%で信頼性の高い予測を実現する。
    • QwenやGemmaを用いた実験により,MDFが予期せぬ行動を予測し,学習前の脆弱性を明らかにできることが確認された。

    Link: https://arxiv.org/abs/2602.04735

  • 強化学習エージェントにおける合理性の測定と理論 [cs.LG]目的:強化学習エージェントの合理性評価指標とその理論
    • 強化学習は,自律的な意思決定を行うシステム構築に不可欠な技術である。
    • 環境変化への適応性,特に訓練環境と実環境の差異が課題となっている。
    • 環境変化や一般化性能が合理性に与える影響を定量的に評価する。
    • 本研究では,合理性のリスクギャップを,環境シフトとアルゴリズムの一般化性能の2つに分解した。
    • 合理性のリスクギャップは,遷移カーネル間のWasserstein距離や価値関数クラスのRademacher複雑さによって上限が示された。
    • 正則化やドメインランダム化が合理性の向上に貢献すること,環境シフトがそれを損なうことが実験的に確認された。

    Link: https://arxiv.org/abs/2602.04737

  • マルチモーダルLLMにおけるアライメントのずれ:8回のモデルリリースに対する,段階的長期評価 [cs.CL, cs.AI, cs.HC]目的:マルチモーダルLLMの安全性評価
    • LLMの利用拡大に伴い,社会への影響も大きくなるため,安全性評価が不可欠である。
    • 敵対的プロンプトに対する安全性は十分に検証されておらず,脆弱性が懸念されている。
    • LLMの更新による安全性変化を長期的に追跡し,安全性向上に貢献する。
    • GPTとClaudeモデルは世代が進むにつれて攻撃成功率が増加傾向にある。
    • Pixtralモデルは一貫して最も脆弱であり,Claudeモデルは高い拒否率により最も安全である。
    • プロンプトのモダリティによる影響が時間とともに変化し,モデル固有のパターンが見られる。

    Link: https://arxiv.org/abs/2602.04739

  • 多目的局所探索における多様性の影響:有界アーカイブの考察 [cs.CY, cs.CL, eess.SY, cs.SY, cs.NE]目的:多目的最適化問題に対するメタヒューリスティクスの性能向上
    • 多目的最適化は,現実世界の複雑な問題を解決する上で不可欠な手法である。
    • 有効な解の数が指数関数的に増加し,パレート最適解の探索が困難になる。
    • 解空間における多様性を向上させ,パレート最適解全体を効率的に探索すること。
    • 提案手法であるHamming距離アーカイブアルゴリズムは,既存のAdaptive Grid ArchivingやHypervolume Archivingを上回る性能を示した。
    • この結果は,メタヒューリスティクスの効率改善に貢献する可能性を示唆している。
    • 解空間の多様性に着目した新たなアプローチが有効であることが確認された。

    Link: https://arxiv.org/abs/2602.04745

  • LLMを用いた非公式な政治議論における立場検出の精度向上:文脈情報の活用 [cs.CL, cs.AI]目的:非公式な政治議論における立場検出の精度向上
    • 政治的意見の分析は,世論の理解や民主主義社会の健全な発展に不可欠である。
    • オンライン議論は皮肉や曖昧な表現が多く,文脈依存性が高いため,正確な立場検出が困難である。
    • LLMにユーザーの過去投稿から生成されたプロファイル情報を付与することで,立場検出の精度改善を目指す。
    • 文脈情報(ユーザープロファイル)をLLMに与えることで,立場検出の精度が大幅に向上した。
    • 精度向上率は17.5%から38.5%に達し,最高で74%の精度となり,既存手法を上回った。
    • プロファイルのサイズや投稿選択戦略が性能に影響し,政治関連コンテンツの選択が効果的であることが示された。

    Link: https://arxiv.org/abs/2602.04750

  • コントラスト共分散を用いたクエリ・キー特徴量の相互作用の分解 [cs.LG]目的:クエリ・キー空間における低ランクな解釈可能な成分の分解
    • Transformerモデルにおける注意機構の理解は,モデルの挙動解明に不可欠である。
    • 注意機構が特定のトークンに注目する理由を理解するためのツールが不足している。
    • クエリ・キー空間の分解を通じて,注意スコアの根底にある特徴を特定すること。
    • コントラスト共分散法により,クエリ・キー空間を低ランク成分に分解することが可能となった。
    • これらの低ランク部分空間においてクエリとキーの特徴量が整列することで,高い注意スコアが生じる。
    • 大規模言語モデルにおいて,カテゴリー的意味特徴やバインディング特徴に対応する解釈可能なクエリ・キー部分空間を特定できた。

    Link: https://arxiv.org/abs/2602.04752

  • 産業界と学術界における敵対的機械学習に関する比較的研究:ユーザースタディのアプローチ [cs.CR, cs.AI]目的:産業界と学術界における敵対的機械学習の脆弱性に対する認識と教育戦略
    • 機械学習の急速な発展に伴い,そのセキュリティ上の課題が顕在化している。
    • 敵対的機械学習に対する教育が十分ではなく,脅威への認識も低い。
    • 機械学習教育にセキュリティ教育を統合する必要性を示す。
    • 専門家への調査で,サイバーセキュリティ教育と敵対的機械学習の脅威に対する懸念の間に相関関係が見られた。
    • 自然言語処理と生成AIを用いたCTFチャレンジを通して,訓練データへのポイズニング攻撃の実効性が確認された。
    • CTF形式の学習が,学生の敵対的機械学習に対する関心を高める効果があることが示された。

    Link: https://arxiv.org/abs/2602.04753

  • 沈黙は金: LLMは時間的QAなどを通して,回答を控えることを学習できるか? [cs.CL, cs.AI]目的:LLMにおける回答を控える能力の学習
    • 大規模言語モデルの信頼性は重要であり,誤情報の拡散を防ぐ必要がある。
    • LLMは不確実性を認識せず,誤った情報を流暢に生成しがちである。
    • 時間的QAにおいて,LLMが時間情報を無視する問題を解決する。
    • 強化学習を用いることで,Qwen2.5-1.5B-InstructはTimeQA-EasyとHardにおいてGPT-4oをそれぞれ3.46%と5.80%上回る正解率を達成した。
    • 強化学習は,回答不能な質問に対する真陽性率を,純粋な教師あり学習モデルよりも20%向上させた。
    • 教師あり学習は過信を引き起こす一方,強化学習は予測精度を向上させるものの,同様のリスクを伴うことが示された。

    Link: https://arxiv.org/abs/2602.04755

  • 多源降水データの融合のための二重TransUNet深層学習フレームワーク:季節および極端な降水量の推定精度向上 [eess.SY, cs.SY, cs.LG]目的:多源降水製品の融合と,季節および極端な降水量の推定精度向上
    • 水文気候モニタリングにおいて多源降水製品の利用が広範だが,空間的な偏りと極端現象への対応が課題である。
    • 降水量の空間的な偏りが大きく,特に極端な降水量の予測精度が十分でないという問題が存在する。
    • 複数の降水製品と物理量予測因子を統合し,極端現象の検出精度向上を目指す。
    • 提案手法は,季節ごとの降水量予測において高い性能(R = 0.75; RMSE = 2.70 mm/day)を示した。
    • 重降水量(>25 mm/day)に関して,東中国の多くの地域で均等脅威スコアが向上し,2021年7月の鄭州豪雨の空間パターンをより良く再現した。
    • 青海チベット高原での独立評価により,データ不足地域への適用可能性が確認された。

    Link: https://arxiv.org/abs/2602.04757

  • 勾配変動を用いたバンディット凸最適化における次元依存性の改善 [cs.CY, cs.HC, cs.LG, stat.ML]目的:バンディット凸最適化における勾配変動分析の改良
    • ゲーム理論や最適化との深い関連性から,勾配変動オンライン学習への注目が集まっている。
    • バンディットフィードバック下での研究が不足しており,次元依存性の改善が課題であった。
    • バンディット環境下における勾配変動の分析を改良し,次元依存性を改善すること。
    • 凸関数および強凸関数に対し,既存の結果(Chiang et al., 2013)よりも次元依存性を改善した。
    • 改良された分析は,勾配分散や小損失後悔といった,問題に依存した有利な保証を示唆する。
    • 双点設定を超えて,超矩形領域における一次バンディット線形最適化に対する初の勾配変動境界を達成した。

    Link: https://arxiv.org/abs/2602.04761

  • 不確実性下における能動的非対称マルチエージェントマルチモーダル学習 [cs.LG, cs.AI]目的:不確実性下でのマルチモーダル協調学習手法
    • 近年,マルチエージェントシステムは多様なセンサを持つようになり,より豊かな知覚が可能になった。
    • 既存手法は,均質的なセンサを仮定し,不確実性を暗黙的に扱うため,センサ故障時の頑健性に限界がある。
    • 本研究は,不確実性を考慮したモダリティレベルの協調学習により,センサ故障時の頑健性を向上させる。
    • 提案手法A2MAMLは,各モダリティの不確実性を予測し,信頼性の高いエージェント・モダリティペアを選択する。
    • ベイズ逆分散重み付けにより情報を集約することで,きめ細かいモダリティレベルの融合を実現する。
    • 事故検出の実験において,A2MAMLは既存手法と比較して最大18.7%高い検出率を達成した。

    Link: https://arxiv.org/abs/2602.04763

  • 大規模グラフ基盤モデル [cs.CL, cs.LG, cs.AI]目的:大規模グラフにおける基盤モデルの構築方法
    • グラフ構造データは多くの重要アプリケーションの基盤であり,その活用は不可欠である。
    • 汎用的な実世界グラフへの基盤モデルの拡張は,規模と異質性の問題から困難である。
    • 本研究は,大規模異質グラフに対応可能な実用的な基盤モデル構築を目指す。
    • GraphBFF Transformerを用いることで,スケーリング則が確認され,モデル規模やデータ量の増加に伴い損失が予測通り減少することが示された。
    • 14億パラメータのGraphBFF Transformerを10億サンプルで事前学習した結果,未学習グラフにおける多様なタスクで高いゼロショット性能と少ない学習での性能が確認された。
    • 本フレームワークは,大規模グラフ学習における実用的かつ原理的な基盤となり得る可能性を示唆している。

    Link: https://arxiv.org/abs/2602.04768

  • NeuroCanvas:VLLMを活用した多チャンネル脳波の画像化による堅牢な発作検出 [cs.LG]目的:脳波の多チャンネル信号を画像として再構成するNeuroCanvasフレームワークの開発
    • 臨床介入において,正確かつ迅速な発作検出は極めて重要であり,患者の予後を左右する。
    • 長期脳波記録の手動解析は労力と時間を要し,臨床現場における負担が大きい。
    • 多チャンネル脳波の異質性と計算効率の低さを克服し,実用的な発作検出システムを構築する。
    • 提案手法NeuroCanvasは,複数の発作検出データセットにおいて,F1スコアが平均20%向上した。
    • 推論遅延は88%削減され,リアルタイム処理と省資源化を実現した。
    • NeuroCanvasは,臨床現場での発作検出におけるスケーラブルで効果的なソリューションとなりうる。

    Link: https://arxiv.org/abs/2602.04769

  • ドリフトによる生成モデリング [cs.LG, cs.CV]目的:生成モデリングにおける分布学習
    • 画像生成などの分野で,高品質なデータ生成が求められている。
    • 既存手法では,生成に複数ステップを要し,計算コストが高い。
    • 1ステップで高品質な画像を生成できる新たな手法を確立する。
    • 提案手法「Drifting Models」は,学習中に分布を進化させ,1ステップ推論を可能にする。
    • ImageNet 256x256解像度で最先端の結果を達成し,FIDスコアは潜在空間で1.54,ピクセル空間で1.61。
    • 本研究は,高品質な1ステップ生成の新たな可能性を開くことが期待される。

    Link: https://arxiv.org/abs/2602.04770

  • 区間ベースAUC (iAUC): 不確実性認識分類へのROC分析の拡張 [cs.LG]目的:不確実性認識分類のためのROC分析フレームワーク
    • 高リスク予測において,信頼性のある意思決定には不確実性の定量化が不可欠である。
    • 従来のROC曲線やAUCは点数予測を対象とし,予測不確実性がランキング性能に与える影響を捉えられない。
    • 区間値予測に対する不確実性を考慮した評価方法を開発し,ランキングの信頼性を向上させる。
    • 提案フレームワークはROC平面を3つの領域に分解し,ランキングの正誤と不確実性を明確に区別する。
    • 区間が重なるケースでは予測を保留することで,棄権率と識別信頼性のトレードオフを最適化できる。
    • 提案する$AUC_L$と$AUC_U$は,理論的な最適AUC ($AUC^*$) の下限と上限を特徴付け,達成可能な識別能力の限界を示す。

    Link: https://arxiv.org/abs/2602.04775

  • マルチモーダル拡散モデルの動的レジーム [cs.LG]目的:マルチモーダル生成を支配する相互作用の時間スケールの階層構造
    • 高次元データの生成において,拡散モデルは優れた性能を示すが,その理論的メカニズムは未解明な点が多い。
    • マルチモーダル生成におけるモード間の同期ずれなどの問題が存在する。
    • 同期ずれの発生原因を説明し,安定したマルチモーダル生成を実現するための条件を導出する。
    • マルチモーダル生成は,同時解決ではなく,相互作用の時間スケールのスペクトル階層によって制御されることが示された。
    • 「同期ギャップ」と呼ばれる,固有モードが異なる速度で安定化する時間窓の存在が理論的に予測された。
    • 結合強度はスペクトルフィルタとして機能し,生成プロセスに時間階層を課すことが示された。

    Link: https://arxiv.org/abs/2602.04780

  • 風力発電団地クラスタデータに基づく短期的風速予測のための,多スライス補償モデルを用いたルジャンドルメモリユニット [cs.LG]目的:風力発電団地クラスタの短期的風速予測における精度向上
    • 電力系統の安定運転には,風力発電団地を統合する際の短期的風速予測が不可欠である。
    • 風力発電団地間の空間的・時間的相関を十分に活用した予測手法が課題であった。
    • クラスタデータの相関に基づき,予測精度とロバスト性を高めることを目指す。
    • 提案手法は,ルジャンドルメモリユニット(LMU)とクラスタデータに基づく補償パラメータ(CPK)を組み合わせた多スライスLMU(MSLMU)を用いる。
    • データ前処理,予測,多スライス補償の3つのブロックから構成されるWMF-CPK-MSLMUアンサンブルモデルは,既存モデルと比較して優れた性能を示す。
    • CPKはMSLMUの隠れノードを活性化させ,空間相関を最大限に活用し,欠損データに対しても空間的に補完を行う。

    Link: https://arxiv.org/abs/2602.04782

  • 独立パッチから協調的注意へ:ビジョンTransformerにおける情報フローの制御 [cs.LG]目的:ビジョンTransformerにおける情報フロー制御のメカニズム
    • 画像認識においてTransformerは強力だが,内部動作の解釈が困難である。
    • Transformer内部の情報フローが不明確で,制御が難しいという課題がある。
    • Transformerの情報伝達を可視化し,制御可能な情報フローを構築する。
    • 注意メカニズムに情報ボトルネックを導入することで,情報量を明示的に制御可能となった。
    • ImageNet-100を用いた実験で,分類性能と情報ルーティングの変化が確認された。
    • 局所パッチ処理から大域的表現への移行における初期の注意ヘッドの役割が示唆された。

    Link: https://arxiv.org/abs/2602.04784

  • チーム,そしてトリミング:高品質表形式データ生成のためのアセンブリラインLLMフレームワーク [cs.LG, cs.AI]目的:高品質な表形式データの生成
    • 現実世界の機械学習応用において,表形式データは不可欠である。データ収集のコストが高い。
    • 既存の表形式データセットは,クラス不均衡,選択バイアス,低忠実度などの欠陥を抱えている。
    • 大規模言語モデルを活用し,高品質な表形式データを効率的に生成し,データ収集の困難さを解消する。
    • 提案手法T$^2$は,専門化されたLLMチームによる協調生成と厳格な品質管理パイプラインにより高品質なデータを生成する。
    • T$^2$は,表形式データ生成を製造プロセスとして捉え,各段階で品質を評価・改善する。
    • シミュレーションデータと実データを用いた実験により,T$^2$が最先端手法を上回る性能を示すことが確認された。

    Link: https://arxiv.org/abs/2602.04785

  • 最大体積非負行列分解 [cs.LG, cs.NA, eess.SP, math.NA, stat.ML]目的:非負行列分解における,H行列の体積最大化
    • データ埋め込み技術として,非負行列分解は広く利用されており,高次元データの解析に不可欠である。
    • 標準的な非負行列分解では,解の一意性や解釈性が課題となる場合がある。
    • 解釈性と安定性を向上させるため,H行列の体積を最大化する手法を提案し,その特性を明らかにする。
    • 最大体積非負行列分解は,ノイズが存在する場合でも識別可能であり,疎な分解を効果的に抽出できる。
    • 最小体積非負行列分解とは異なり,ランク不足な解を生成しないことが示された。
    • 提案手法の正規化変形は,標準的な非負行列分解および直交非負行列分解の中間的な解を提供し,優れた性能を示す。

    Link: https://arxiv.org/abs/2602.04795

  • Skin Tokens: 統一的な自己回帰リギングのための学習されたコンパクトな表現 [cs.CL, cs.GR, cs.AI]目的:スキニング重みの学習されたコンパクトかつ離散的な表現
    • 3Dコンテンツ制作において,アニメーション制作のボトルネックとなっているリギングの効率化が重要である。
    • 既存のリギング手法は,スキニングを非効率な回帰問題として扱っており,骨格生成との連携が弱いという課題がある。
    • スキニングの表現方法を改善し,骨格とスキニング変形間の複雑な依存関係を学習する。
    • SkinTokens表現は,最先端の手法と比較してスキニング精度を98%-133%向上させた。
    • TokenRigフレームワークは,強化学習によって骨格予測を17%-22%向上させた。
    • 本研究は,高忠実度で堅牢な,スケーラブルなリギングソリューションを提供する。

    Link: https://arxiv.org/abs/2602.04805

  • 損傷回避学習のための感受性アーキテクチャの進化:生物学的インスピレーションに基づくモデル [cs.LG]目的:損傷回避学習のための適応的な内部リスク信号である計算感受性トレースの生成
    • ロボットやAIが物理環境で長期的に活動するためには,損傷を回避する能力が不可欠である。
    • 従来の損傷回避手法は,手動設計に依存しており,複雑な環境への適応が困難である。
    • 進化と強化学習を組み合わせ,効率的な学習を可能にする感受性アーキテクチャを自動的に発見すること。
    • 進化によって生成された感受性アーキテクチャは,手動設計されたベースラインよりも効率性と加齢に対するロバスト性が大幅に向上した。
    • CATに基づいたアーキテクチャは,高リスク行動を23%削減し,加齢に伴う行動適応を可能にした。
    • 計算感受性トレース,進化,予測不一致が,学習において本質的な要素であることが検証された。

    Link: https://arxiv.org/abs/2602.04807

  • サイバー防御における強化学習の報酬を超えて [cs.LG, cs.AI]目的:サイバー防御における強化学習の報酬関数の構造とその影響の評価
    • サイバー攻撃は深刻化の一途を辿っており,自動化された防御システムの重要性が増している。
    • 強化学習エージェントの報酬設計は難しく,不適切な報酬がサブオプティマルな戦略を生む可能性がある。
    • より安全で効果的なサイバー防御エージェントを育成するための報酬設計の指針を示す。
    • 密な報酬関数は学習を促進する一方,リスクの高い戦略に傾倒する可能性が示唆された。
    • スパースな報酬関数は,目標と整合性が高く頻繁に遭遇できる場合,学習の信頼性と防御性能を向上させる。
    • スパース報酬は,防御者の目標に沿った戦略を導き,高コストな防御行動を抑制する効果がある。

    Link: https://arxiv.org/abs/2602.04809

  • SE-Bench:知識の内部化による自己進化のベンチマーク [cs.CL, cs.AI, cs.LG]目的:自己進化の基礎能力の厳密な測定
    • 継続学習はAIの自律性と汎用性を高める上で重要である。
    • 既存の評価方法では,事前知識と問題の複雑さが分離できず,真の自己進化能力の測定が困難である。
    • NumPyライブラリを擬似的に新規パッケージとして扱い,知識の内部化能力を評価する環境を構築する。
    • 参照ドキュメントを用いた学習は知識の定着を阻害し,Closed-Book Trainingが有効であることが示された。
    • 標準的な強化学習では,PPOクリッピングや負の勾配により知識の完全な内部化が困難であることが判明した。
    • 自己対戦とSFTを組み合わせることで,ノイズの多い自己生成タスクから学習し,知識の内部化が可能であることが示された。

    Link: https://arxiv.org/abs/2602.04811

  • 堅牢で汎用的な異種法的リンク予測 [cs.LG, cs.IR]目的:異種法的引用ネットワークにおけるリンク予測の精度向上
    • 法曹界における情報検索や判例調査の効率化に貢献する分野である。
    • 既存手法では,データの多様性や言語の壁により汎用性が低い場合がある。
    • エッジドロップアウトや特徴量連結,多言語ノード特徴量を用いた予測精度の向上を目指す。
    • エッジドロップアウトと特徴量連結により,エラー率を最大45%削減できた。
    • 多言語ノード特徴量と非対称デコーダを用いることで,ニュージーランドのデータへの予測を一般化できた。
    • 異なる法体系間での誘導的転移学習の性能も向上した。

    Link: https://arxiv.org/abs/2602.04812

  • 医療・医学における能動的AI:LLMベースエージェントの経験的評価のための七次元分類 [cs.AI, cs.CY]目的:LLMベースエージェントの能力評価のための分類体系
    • 医療現場におけるAI活用は,診断や治療の質向上,業務効率化に貢献し得るため重要である。
    • 既存研究は,AIの個別機能に偏っており,医療現場での総合的な評価枠組みが不足している。
    • LLMベースエージェントの能力を七次元から評価し,医療応用における課題を明確化する。
    • 49の研究を分析し,認知能力,知識管理,インタラクション,適応学習,安全性,フレームワーク,タスクの七次元分類を適用した。
    • 外部知識統合は高度に実装されている一方,イベントトリガーやドリフト検知はほとんど実装されていないことが判明した。
    • マルチエージェント設計が主流である一方,オーケストレーション層は部分的な実装にとどまり,治療計画等のアクション指向タスクには課題が残る。

    Link: https://arxiv.org/abs/2602.04813

  • ネoplastic tubular adenomasの分類のためのXtraLight-MedMamba [cs.CV, cs.LG]目的:ネoplastic tubular adenomasの分類
    • 大腸癌は罹患率と死亡率が高い癌であり,早期発見が重要である。
    • 低悪性度異形成の判定は主観的であり,正確なリスク評価が困難である。
    • 病理画像の深層学習による,微細な形態学的パターンを識別し,悪性化リスクを予測する。
    • XtraLight-MedMambaは,約32,000パラメータで97.18%の精度と0.9767のF1スコアを達成した。
    • Transformerベースや従来のMambaアーキテクチャよりも,パラメータ数が大幅に少なく,高い性能を示した。
    • 本研究は,大腸内視鏡検査における低悪性度ポリープのリスク層別化に貢献する可能性がある。

    Link: https://arxiv.org/abs/2602.04819

  • 信頼性と説明可能性の高い爪疾患分類:敵対的学習とGrad-CAM可視化の活用 [cs.CV, cs.AI, cs.LG]目的:爪疾患の自動分類モデル
    • 高齢化が進む中で,爪疾患は増加傾向にあり,早期発見・診断が健康管理上重要である。
    • 爪疾患の種類間における視覚的な差異が小さく,正確な診断が困難である。
    • 深層学習モデルによる爪疾患の自動分類の精度向上と,その根拠の解明を目指す。
    • InceptionV3モデルが95.57%の精度で最も高い性能を示し,DenseNet201が94.79%で続いた。
    • 敵対的学習を用いることで,モデルの頑健性を高め,ノイズ画像に対する誤診を防ぐ効果が確認された。
    • SHAPを用いて予測に重要な特徴を可視化し,モデルの判断根拠を説明可能にした。

    Link: https://arxiv.org/abs/2602.04820

  • 不確実性認識型適合予測とワールドモデル強化学習による安全な都市交通制御 [cs.LG, cs.AI]目的:都市交通における安全な制御手法の開発
    • 都市交通管理は,効率化と安全性の両立が重要であり,高度な予測と制御が求められている。
    • 従来のシステムでは,予測の不確実性を考慮した安全性の保証が難しかった。
    • 予測の不確実性を定量化し,それに基づいて安全性を保証する制御手法を確立する。
    • STREAM-RLは,不確実性を考慮した予測,異常検知,安全な行動決定を統合したフレームワークである。
    • 実際の交通データを用いた実験で,91.4%の網羅効率と95.2%の安全率を達成した。
    • 推論遅延は23msであり,リアルタイム制御に適していることが示された。

    Link: https://arxiv.org/abs/2602.04821

  • 確率的な要素ではなく競争:勾配降下がネットワークの容量をタスクに適合させる仕組みの理解 [cs.LG, cs.AI, cs.CV, cs.NE]目的:ニューラルネットワークにおける勾配降下法の学習ダイナミクス
    • ニューラルネットワークは実証的に成功を収めているが,理論的な理解が遅れている。
    • 訓練中に,ネットワークの理論的な容量がタスクに適合する有効容量にどのように縮小されるかが不明である。
    • 勾配降下法が容量を縮小するメカニズムを,ReLUネットワークのニューロンレベルで解明する。
    • 相互整列,アンロック,競争という3つのダイナミクス原理が,同等なニューロンの結合や低ノルム重みのプルーニングを可能にする。
    • 特定のニューロンの初期状態が,より高い重みノルムを獲得する理由を説明し,ロッタリーチケット仮説のメカニズムを解明する。
    • 訓練後,ネットワーク容量を削減できるのは,これらの原理によるものである。

    Link: https://arxiv.org/abs/2602.04832

  • AI能力は指数関数的に増加しているか?競合仮説 [cs.AI]目的:AI能力の増加に関する仮説の検証
    • AI技術の進歩は,安全性や労働市場に影響を及ぼすため,その動向を正確に把握することが重要である。
    • 既存の研究ではAI能力が指数関数的に増加していると主張されているが,その根拠に疑問が残る点がある。
    • AI能力の増加パターンを再評価し,指数関数的増加の脆弱性を指摘することを目的とする。
    • 既存のMETR報告のデータに基づき,シグモイド曲線への当てはめを行った結果,AI能力の転換点は既に過去であることを示した。
    • AI能力を基礎能力と推論能力に分解した複雑なモデルを提案し,近いうちに転換点を迎えるという仮説を支持する。
    • 本研究は厳密な予測を行うものではなく,指数関数的増加予測の不確実性を強調することを目的とする。

    Link: https://arxiv.org/abs/2602.04836