arXiv雑要約

AI - 2026/02/04 公開

  • 音声と空間・時間情報の融合のための適応的証拠重み付け [cs.SD, cs.AI]目的:音声と空間・時間情報を融合する際の証拠の重み付け方法
    • 機械学習において,複数の情報源を統合することで予測精度向上が期待される。
    • 各情報源の信頼性や有用性は入力ごとに異なり,最適な統合が困難である。
    • 文脈情報と音声情報を効果的に統合し,ロバスト性を向上させることを目指す。
    • 提案手法FINCHは,音声分類器と空間・時間予測器を統合する適応的証拠融合フレームワークである。
    • FINCHは,文脈情報の信頼性を統計量から推定し,サンプルごとに重み付けを調整する。
    • CBIやBirdSetのベンチマークにおいて,既存手法を上回り,高い性能を達成した。

    Link: https://arxiv.org/abs/2602.03817

  • 緊急停止介入からのロバストな介入学習 [cs.NI, cs.CL, cs.LG]目的:緊急停止介入データからのロバストな介入学習
    • 自律システムの安全性向上には,人間による介入データの活用が不可欠である。
    • 介入データはノイズが多く,完全ではないため,効果的な学習が難しい。
    • 介入信号の質に依存せず,ロバストな方針改善を実現すること。
    • 提案手法である残差介入微調整(RIFT)は,既存の方針を基盤として介入データを活用することで,曖昧さを解消する。
    • 理論的分析により,提案手法が適切な方針改善をもたらす条件が明確化された。
    • 実験結果から,RIFTは様々な介入戦略と事前方針に対してロバストかつ一貫した方針改善を可能にすることが示された。

    Link: https://arxiv.org/abs/2602.03825

  • 科学論文用イラストの自動生成と改良 [cs.AI, cs.CL, cs.CV, cs.DL]目的:科学論文用イラストの生成と改良
    • 科学技術の発展において,複雑な概念の視覚的伝達は不可欠であり,イラストはその重要な役割を担う。
    • 高品質な科学イラストの作成は時間と労力を要し,研究や産業におけるボトルネックとなっている。
    • 長文の科学技術テキストから,構造的にも美的にも優れた科学イラストを自動生成することを目指す。
    • AutoFigureは,科学技術テキストから高品質なイラストを自動生成する初のagenticフレームワークである。
    • FigureBenchという大規模なベンチマークデータセットを構築し,多様なテキスト-イラスト生成タスクに対応した。
    • 実験結果から,AutoFigureは既存手法を上回り,出版可能な科学イラストを生成することが示された。

    Link: https://arxiv.org/abs/2602.03828

  • Geminiによる科学研究の加速:事例研究と共通手法 [cs.CL, cs.AI]目的:科学研究の加速における大規模言語モデルの活用
    • 科学的発見の速度向上は,社会の発展に不可欠である。
    • 専門的な数学的発見において,LLMの能力は未だ十分に解明されていない。
    • AIと人間の協調による新たな発見手法の確立を目指す。
    • Geminiモデルを用いた事例研究から,理論計算機科学を含む多様な分野での問題解決,反証,新たな証明生成が確認された。
    • 反復的な改良,問題分解,学際的な知識転移が,効果的な人間とAIの協調に重要であることが示された。
    • AIを厳格な批判者として活用し,既存証明の微細な欠陥を検出する手法や,コード実行による検証ループを組み込むことが可能となった。

    Link: https://arxiv.org/abs/2602.03837

  • プリビズウィズ:ラフな3Dシーンと2Dビデオを組み合わせた生成ビデオによるプレビズの誘導 [cs.HC, cs.AI, cs.CV]目的:映画の可能性を探求するためのプレビズの迅速なプロトタイプ作成
    • 映画制作において,フルスケール制作前にアイデアを試すことは重要である。
    • 従来のプレビズ手法は,効率性と表現力のバランスを取ることが困難である。
    • ラフな3Dシーンと生成モデルを活用し,制作の障壁を低減し,コミュニケーションを円滑化する。
    • 本システムは,映像制作における技術的なハードルを下げ,クリエイティブな反復を加速することが示された。
    • また,AI支援による映画制作における継続性,著作権,倫理的な課題も明らかになった。
    • 映像制作者との実験により,効果的にコミュニケーションギャップを埋めることが確認された。

    Link: https://arxiv.org/abs/2602.03838

  • 通信効率の高い分散型強化学習のための重み更新の疎性を理解し活用する [cs.LG]目的:分散型強化学習における通信効率の向上
    • 大規模言語モデルの性能向上に強化学習が不可欠であり,分散学習の需要が高まっている。
    • 分散環境下では,トレーナーから推論ワーカーへの重み同期が帯域幅の制約を受け,学習のボトルネックとなる。
    • 重み更新の疎性を利用し,通信量を削減することで分散学習のスケーラビリティを改善する。
    • 強化学習の更新は,モデルパラメータのわずかな割合のみを変更することが確認された。
    • PULSEと呼ばれる,変更されたパラメータのインデックスと値のみを伝送する軽量な重み同期手法を提案した。
    • PULSEは帯域幅制約環境において,100倍以上の通信量削減を達成し,中央集権的な学習のスループットに近づけた。

    Link: https://arxiv.org/abs/2602.03839

  • 量子回路設計におけるニューロ進化の調査 [cs.NE, cs.LG]目的:効果的な量子回路の設計
    • 量子コンピュータの性能向上には,表現力,学習性,ハードウェア適合性を備えた回路が不可欠である。
    • 既存手法は,スケーラビリティ,柔軟性,適応性に限界があり,問題やハードウェアに最適化されていない場合がある。
    • 問題に適応し,ハードウェア効率の良い量子回路を自動設計・学習する手法を確立すること。
    • 提案手法EXAQCは,ニューロ進化と遺伝的プログラミングの戦略を応用し,量子回路の自動設計・学習を実現した。
    • 分類タスクにおいて,90%を超える精度を,限られた計算資源で達成できることを示した。
    • ターゲットとなる量子状態を高精度にエミュレートできることも確認された。

    Link: https://arxiv.org/abs/2602.03840

  • PLATE:形状を考慮した継続学習のための可塑性調整型効率的アダプター [cs.CL, cs.LG, cs.AI]目的:事前学習済みモデルにおける継続学習手法
    • 基盤モデルの適応には大量データが必要だが,事前学習分布が入手困難な場合がある。
    • 過去のタスクデータなしで,知識の忘却を防ぐことが課題である。
    • 事前学習済みモデルの冗長性を活用し,効率的な継続学習を実現する。
    • PLATEは,過去のタスクデータにアクセスせずに継続学習を行う手法である。
    • PLATEは,可塑性と保持のトレードオフを明示的に制御できる。
    • 各層は,低ランク更新$\Delta W = B A Q^\top$でパラメータ化され,学習は$A$のみで行われる。

    Link: https://arxiv.org/abs/2602.03846

  • LPCVAE:長期的依存性と確率的時頻度融合を持つ条件付きVAEによる時系列異常検知 [cs.LG, cs.AI, cs.ET]目的:時系列異常検知のための新しいモデル
    • 複雑なシステムの信頼性確保には,信号処理における時系列異常検知が不可欠である。
    • 既存のVAEベースの手法は,単一ウィンドウの特徴量と,長期的時間・周波数情報の活用不足が課題である。
    • 長期的時間・周波数表現の統合と適応的融合による,堅牢かつ効率的な異常検知手法を開発すること。
    • 提案手法LPCVAEは,LSTMを用いてウィンドウを越えた長期的依存性を捉える。
    • PoEメカニズムにより,適応的かつ分布レベルでの確率的融合を実現し,時頻度情報の損失を軽減する。
    • 4つの公開データセットでの実験により,最先端手法を上回る性能が確認された。

    Link: https://arxiv.org/abs/2510.10915

  • アバターのインタラクション実現:制御可能な会話型アバターのためのテキスト駆動型人間・物体インタラクションへ [math.AG, cs.SC, cs.CV, cs.AI, cs.CL]目的:制御可能な会話型アバターのための,テキストに基づいた人間・物体インタラクション
    • 動画生成において,会話型アバターは重要な要素であり,より自然な表現が求められている。
    • 既存手法では,単純な動作生成は可能だが,周囲の物体との連携やテキストに沿ったインタラクションが困難である。
    • 環境認識と制御品質のトレードオフを解消し,テキストに即した人間・物体インタラクションを生成することを目指す。
    • 提案手法InteractAvatarは,知覚と計画,そして動画合成を分離した二重ストリームフレームワークである。
    • 環境認識を強化するため,検出を活用し,テキストに沿ったインタラクション動作を生成するPIMモジュールを導入した。
    • さらに,音声とインタラクションを考慮したAIMモジュールにより,鮮明なアバターと物体インタラクションを合成する。

    Link: https://arxiv.org/abs/2602.01538

  • 医師のように考える:診断知識グラフの探索を通じた会話型診断 [cs.AI, cs.CL]目的:会話型診断における診断知識グラフの探索
    • 医療現場での診断支援は,迅速かつ正確な診断を可能にし,患者の予後を改善する上で不可欠である。
    • 既存の会話型診断システムは,モデルの知識に依存しすぎたり,患者の曖昧な情報を想定できていない場合が多い。
    • 本研究は,診断知識グラフを用いて,より現実的な患者との対話を実現し,診断精度と効率を向上させることを目指す。
    • 提案システムは,会話の文脈から診断仮説を生成し,質問を繰り返すことで仮説を検証する二段階の推論を行う。
    • MIMIC-IVの患者プロファイルを用いた評価により,既存のベースラインよりも診断精度と効率が向上することが示された。
    • 医師による評価からも,シミュレーターの現実性と生成された質問の臨床的有用性が支持された。

    Link: https://arxiv.org/abs/2602.01995

  • 多様なグループのクリック嗜好を大規模広告画像生成に適合させる [cs.CV, cs.AI, cs.MM]目的:多様なグループごとのクリック嗜好を整合させること
    • 広告画像生成はCTR向上に注力するが,ユーザーグループ間の嗜好の多様性に着目する必要がある
    • 従来の「一律」戦略では特定のグループに対するパフォーマンスが最適化されず,ターゲティング広告の効果が限定される
    • グループごとの嗜好に最適化された広告画像を生成することで,マーケティング効果の向上を目指す
    • 提案手法OSMFは,ユーザー属性と商品特性に基づいた動的なグループ化と,グループに特化した画像生成を実現した。
    • グループに配慮した大規模多言語モデル(G-MLLM)とGroup-DPOによるファインチューニングにより,各グループのCTRが効果的に向上した。
    • 大規模なグループ嗜好画像データセット(GAIP)を公開し,オフライン・オンライン両環境で最先端の性能を達成した。

    Link: https://arxiv.org/abs/2602.02033

  • Kimi K2.5:視覚的エージェント知能 [cs.CL, cs.AI, cs.LG]目的:汎用的なエージェント知能の発展を目指す,オープンソースのマルチモーダルエージェントモデル
    • AI研究の進展は,社会の様々な課題解決に貢献し,生活の質を向上させる上で不可欠である。
    • 既存のエージェントモデルは,テキストと視覚情報の統合が不十分であり,複雑なタスクへの対応が困難である。
    • テキストと視覚情報を連携させ,複雑なタスクを効率的に処理できるエージェントモデルの開発を試みる。
    • Kimi K2.5は,コーディング,視覚,推論,エージェントタスクなど,様々な分野で最先端の結果を達成した。
    • Agent Swarmは,単一エージェントと比較して,最大4.5倍のレイテンシ削減を実現した。
    • 学習済みのKimi K2.5モデルを公開することで,エージェント知能の研究と実世界への応用を促進する。

    Link: https://arxiv.org/abs/2602.02276

  • RLAnything:完全動的強化学習システムにおける環境,ポリシー,報酬モデルの生成 [cs.LG, cs.AI, cs.CL, cs.CV]目的:強化学習システムの環境,ポリシー,報酬モデルの動的な生成
    • 大規模言語モデルの能力向上は,現実世界への適応を可能にするため重要である。
    • 強化学習における報酬関数の設計は難しく,汎化性能のボトルネックとなる。
    • クローズドループ最適化による自動化された環境適応を通じて,学習効率を向上させる。
    • RLAnythingは,環境,ポリシー,報酬モデルを動的に生成することで学習信号を増幅し,強化学習システムの全体的な性能を向上させる。
    • ステップごとのフィードバックと結果からのフィードバックを統合することで,ポリシーの学習を改善する。
    • OSWorld,AlfWorld,LiveBenchなどのタスクにおいて,Qwen3-VL-8B-ThinkingやQwen2.5-7B-Instructの性能を大幅に向上させた。

    Link: https://arxiv.org/abs/2602.02488

  • VAAに基づくBLE測距におけるToAとDoAの同時推定:位相曖昧性への深層学習アプローチ [eess.SP, cs.AI, cs.IT, math.IT]目的:BLE測距におけるToAとDoAの同時推定
    • BLEデバイスの小型化が進む中,アンテナアレイのコストが課題となっている。
    • BLEの持つ位相曖昧性が,VAAを用いたDoA推定の直接的な適用を妨げている。
    • 位相曖昧性を解決し,BLEを用いた高精度なToA/DoA推定を実現すること。
    • 提案手法は,非均一なVAA環境下で優れた性能を発揮する。
    • 推定精度は,SNR 5dB以上でCramer-Rao下限に近づく。
    • VAAとBLEの二方向CFRを統合したモデルと,深層学習に基づく位相復元フレームワークが有効である。

    Link: https://arxiv.org/abs/2602.02503

  • 多変量ガウス分布間のカルバック・ライブラー発散に対する緩和された三角不等式 [stat.ML, cs.IT, cs.LG, math.IT]目的:多変量ガウス分布間のカルバック・ライブラー発散における緩和された三角不等式の上界
    • カルバック・ライブラー発散は情報理論の基本概念であり,機械学習など広範な分野で活用されている。
    • カルバック・ライブラー発散は距離の公理を満たさないため,理論的な解析に課題が生じることがある。
    • 本研究は,多変量ガウス分布における緩和された三角不等式の上界を厳密に評価することを目的とする。
    • 多変量ガウス分布間のカルバック・ライブラー発散に対する緩和された三角不等式の上界が,$\epsilon_1+\epsilon_2+\sqrt{\epsilon_1\epsilon_2}+o(\epsilon_1)+o(\epsilon_2)$であることが示された。
    • 上界が達成されるための条件についても解析され,具体的な条件が明らかになった。
    • 本研究の結果は,分布外検出や安全な強化学習などの応用分野への展開が期待される。

    Link: https://arxiv.org/abs/2602.02577

  • 社会的触媒,道徳的エージェントではない:LLM社会における整合性の幻想 [physics.soc-ph, cs.AI, cs.CL, cs.CY, cs.MA]目的:大規模言語モデル社会における協力促進のメカニズム解明
    • LLMの進化は,多エージェントシステムの創出を促しており,社会構造の理解が不可欠である。
    • 多エージェントシステムでは「共有地の悲劇」が発生しやすく,協力関係の維持が課題となる。
    • 利他的エージェントの導入が協力に与える影響を検証し,真の価値整合性の欠如を明らかにする。
    • 利他的エージェントは局所的な協力率を向上させるものの,その効果は戦略的コンプライアンスと認知負荷の軽減に起因する。
    • エージェントは新しい環境下で利己的な行動に戻りやすく,GPT-4.1のような高度なモデルでは「カメレオン効果」が観察された。
    • 行動修正と真の価値整合性には大きな隔たりが存在し,人工社会における倫理的考慮の重要性が示唆される。

    Link: https://arxiv.org/abs/2602.02598

  • 調査から得られるAI支援経済計測:公務員年金選択の事例 [econ.EM, cs.AI]目的:調査票から直接計測構造を抽出する大規模言語モデルを活用した経済計測の反復的フレームワーク
    • 経済学研究において,個人の行動や意思決定を理解するためには,信頼性の高い計測が不可欠である。
    • 既存の調査票は,潜在的な構成概念を適切に反映していない場合があり,計測誤差の原因となる。
    • 本研究は,AIを用いて調査票の計測構造を改善し,より正確な経済分析を可能にすることを目指す。
    • 本フレームワークは,調査項目を潜在的構成概念にマッピングし,回答を集約して個人レベルのサブ次元スコアを生成する。
    • 外挿妥当性および識別妥当性の診断を通じて,得られた分類体系の整合性を検証し,反復的な改良を行う。
    • 公務員年金調査への適用により,行動シグナルを含む意味的構成要素を特定し,退職選択に影響する経済メカニズムを解明した。

    Link: https://arxiv.org/abs/2602.02604

  • CryoLVM:大規模ビジョンモデルを用いたクライオ電顕密度マップからの自己教師あり学習 [q-bio.QM, cs.AI, cs.LG]目的:クライオ電顕密度マップからの構造表現の学習
    • クライオ電顕は生体分子構造解析に不可欠であり,データ量は指数関数的に増加している。
    • 既存の深層学習はタスク特化型で,汎用性と拡張性に課題がある。
    • 多様なクライオ電顕解析タスクに対応できる汎用的な基盤モデルを構築する。
    • CryoLVMは,密度マップの鮮明化,超解像化,欠損ウェッジの復元といったタスクで,最先端手法を上回る性能を示した。
    • Joint-Embedding Predictive Architecture (JEPA)とSCUNetを統合し,豊富な構造表現を効率的に学習する。
    • ヒストグラムに基づく分布アラインメント損失を導入し,収束を加速,ファインチューニング性能を向上させた。

    Link: https://arxiv.org/abs/2602.02620

  • テスト時学習の再考:少数ショットソースフリー適応のための潜在分布の傾き [stat.ML, cs.LG]目的:少数ショット分類におけるテスト時適応
    • 基礎モデルの応用範囲拡大のため,データ不足下での適応技術が重要である。
    • テスト時にパラメータ更新を行うと,モデルのシフトや不安定性が生じる可能性がある。
    • パラメータ更新なしで,潜在分布を調整し,テスト時適応を実現することを試みる。
    • 提案手法は,タスク類似度に基づき,潜在分布をKL最適化により再重み付けする。
    • パラメータ更新型手法と同等の性能を,より厳しい制約下で実現可能であることを示した。
    • 完全に凍結されたモデルパイプラインにおいても,推論レベルでの分布修正の有効性が示された。

    Link: https://arxiv.org/abs/2602.02633

  • WAXAL:大規模多言語アフリカ言語音声コーパス [eess.AS, cs.AI, cs.CL]目的:アフリカ言語21言語を対象とする大規模な音声データセット
    • 音声技術の発展は,資源豊富な言語に偏っており,多くのアフリカ言語話者にとってデジタルデバイドが生じている。
    • アフリカ言語の音声データは不足しており,高性能な音声技術の開発が困難である。
    • アフリカ言語の音声認識・音声合成技術開発を促進するための基盤を提供すること。
    • WAXALは,約1250時間の音声認識データセットと180時間以上の高品質な音声合成データセットを含む。
    • データ収集・アノテーション・品質管理は,アフリカの学術機関やコミュニティ団体との連携によって行われた。
    • データセットはCC-BY-4.0ライセンスで公開されており,研究の触媒となり,包摂的な技術開発に貢献することが期待される。

    Link: https://arxiv.org/abs/2602.02734

  • 非負テンソル分解に対するほぼ普遍的な乗算更新 [stat.ML, cs.LG]目的:非負テンソル分解モデルの適合
    • 科学分野における多次元データの利用は広範であり,効率的な解析手法が求められている。
    • 非負制約下での最適化は難しく,既存手法の選択肢が限られている場合がある。
    • 柔軟かつ高速なテンソル分解アルゴリズムを提供し,既存手法の性能を向上させる。
    • NNEinFactは,任意の非負テンソル分解モデルを文字列で指定するだけで適用可能である。
    • 実験結果から,NNEinFactはカスタムモデルにおいて,実世界のデータで予測性能が37%以上向上した。
    • また,勾配法と比較して,テスト損失を半分以下に抑え,最大90倍高速に収束することが示された。

    Link: https://arxiv.org/abs/2602.02759

  • 拡散過程におけるドリフト関数のプラグイン分類:ニューラルネットワークの利用 [stat.ML, cs.LG, math.ST, stat.TH]目的:拡散過程のドリフト関数に基づく多クラス分類
    • 確率過程は,物理,金融,生物学など幅広い分野で現象をモデル化する上で不可欠である。
    • ドリフト関数を正確に推定し,分類することは困難であり,効率的な手法が求められている。
    • ニューラルネットワークを用いてドリフト関数を推定し,ベイズ型決定規則に基づく分類を行うことで,高精度な分類を実現する。
    • 提案手法は,1次元設定においてDenis et al. (2024)よりも高速な収束と改善された分類性能を示すことが確認された。
    • 高次元においても,ドリフト関数が合成構造を持つ場合に有効であることが示された。
    • 拡散モデル構造を利用せずに,軌跡データから直接学習するニューラルネットワーク分類器と比較して,一貫して高い性能を発揮する。

    Link: https://arxiv.org/abs/2602.02791

  • エッジ検出とブロック対角ガウス過程回帰を用いた陸面温度データのダウンスケーリング [econ.EM, cs.CY, stat.AP, cs.LG, stat.CO, stat.ME]目的:陸面温度データのダウンスケーリング手法
    • 蒸発散量の推定に不可欠であり,農業分野を含む様々な応用において重要な要素である。
    • 高解像度な陸面温度データの取得は困難であり,空間解像度の向上が課題となっている。
    • ECOSTRESSデータの解像度を向上させ,より高精度な陸面温度分布を推定することを目的とする。
    • 提案手法は,Landsat 8のデータを用いて農業地の構造を捉え,ECOSTRESSデータの高解像度化を可能にした。
    • ブロック対角ガウス過程モデルを用いることで,計算効率を維持しつつ空間構造を考慮したダウンスケーリングを実現した。
    • 本手法は,農業,都市計画,気候変動研究など,幅広い分野への応用が期待される信頼性の高い高解像度陸面温度データを提供する。

    Link: https://arxiv.org/abs/2602.02813

  • 訓練不要な自己修正:マルチモーダルマスク拡散モデルにおける [math.OC, cs.RO, cs.SY, eess.SY, math.OC, cs.RO, math.GR, cs.CC, math.GT, stat.ML, cs.LG]目的:マルチモーダルマスク拡散モデルの自己修正手法
    • 拡散モデルは,テキストや画像など多様なデータの生成において高い性能を示す。
    • 生成過程で初期の誤りが修正されず,誤差が蓄積しやすいという課題がある。
    • 追加学習や外部評価器なしで,生成品質を改善することを目指す。
    • 提案手法は,事前学習済みの拡散モデルの誘導バイアスを活用し,訓練を必要としない自己修正を可能にする。
    • テキストから画像生成やマルチモーダル理解において,サンプリングステップ数を減らしつつ生成品質が向上する。
    • 様々な拡散モデル構造に対して汎用的に適用でき,実用性が高い。

    Link: https://arxiv.org/abs/2602.02927

  • クラスタデータのための加重木構造モデル [stat.ME, cs.LG]目的:クラスタデータに対する予測モデルの構築
    • 臨床,教育,社会科学など幅広い分野でクラスタデータが頻出する
    • 既存手法では,未知のグループに対する予測にグローバルな固定効果しか利用できない
    • グループ間の類似性を考慮した予測モデルを構築し,予測精度を向上させる
    • 提案手法は,シミュレーション実験において従来の決定木やランダムフォレストよりも優れた性能を示した。
    • TCGAの肉 sarcoma コホートデータへの適用により,提案手法の有効性が確認された。
    • グループごとの決定木構造や変数重要度を比較することで,グループ間の類似性を定量化できる。

    Link: https://arxiv.org/abs/2602.02931

  • 潜在的な虚時間発展による物理学に着想を得たTransformer量子状態 [quant-ph, cs.PF, math.OC, cs.SY, eess.SY, cond-mat.dis-nn, cs.LG, quant-ph]目的:Transformer量子状態の物理的解釈と効率的な設計
    • 量子多体系問題の変分モンテカルロ法における精度向上は重要である。
    • ニューラル量子状態のアーキテクチャはブラックボックス化しやすく,物理的解釈が困難である。
    • 潜在的な虚時間発展の観点から,より物理に基づいた効率的な量子状態の設計を目指す。
    • 提案手法であるPITQSは,最先端のTQSと同等以上の精度を,より少ない変分パラメータで達成した。
    • 深層ネットワーク構造を潜在的な冷却過程として解釈することで,物理的に根拠のある設計が可能となった。
    • この研究は,ブラックボックス的な表現力と物理的に透明な構成の間のギャップを埋めることを示唆する。

    Link: https://arxiv.org/abs/2602.03031

  • 単一および複数プレイヤーの行動予測に対する統一的推論フレームワーク:方法と漸近最適性 [stat.ML, cs.LG, math.ST, stat.ME, stat.TH]目的:単一および複数プレイヤーの行動予測における統一的推論フレームワーク
    • 予測モデルがデータ分布自体を変化させる環境下での予測は,経済学や機械学習において重要である。
    • 単一エージェントと複数エージェントの行動予測は別個に扱われ,理論的な統合が不足していた。
    • 単一および複数プレイヤーの行動予測を統一的に扱える推論フレームワークを構築し,信頼性の高い推定と意思決定を可能にすること。
    • 本研究では,行動の安定性を推定する反復リスク最小化(RRM)手続きを提案し,その漸近正規性と漸近効率を厳密に証明した。
    • さらに,再較正予測電力推論(RePPI)と重要度サンプリングを統合した二段階プラグイン推定法を導入し,中心極限定理を導出した。
    • この推定法は,半パラメータ効率境界を達成し,穏やかな分布の誤指定下でも頑健性を示すことが示された。

    Link: https://arxiv.org/abs/2602.03049

  • 普遍ポートフォリオアルゴリズムに基づくオンライン適合予測 [stat.ML, cs.LG]目的:オンライン適合予測における長期的な$(1-\alpha)$被覆率の達成
    • データストリームに対する信頼性の高い予測は,様々な分野で不可欠である。
    • 既存手法は学習率の調整が必要であり,汎用性に課題がある。
    • パラメータ調整なしに,安定した被覆率を保証する手法を開発する。
    • 本研究では,オンライン適合予測における「線形化された後悔」が重要な概念であることを示した。
    • 提案手法UP-OCPは,2資産ポートフォリオ選択問題への帰着を通じて,パラメータフリーで動作する。
    • 実験結果から,UP-OCPは既存手法と比較して,サイズと被覆率のトレードオフにおいて優れた性能を発揮することが示された。

    Link: https://arxiv.org/abs/2602.03168

  • ニューラルFLoC:ニューラルフローに基づく関数型データの同時登録とクラスタリング [stat.ML, cs.LG]目的:関数型データの同時登録とクラスタリング
    • 関数型データ解析は,医療,金融など多様な分野で重要であり,データの潜在的な構造を理解する鍵となる。
    • 位相差により,データの時間的なずれが内在する形状の違いを隠蔽し,クラスタリング性能を低下させるという課題がある。
    • 位相と振幅の変動を分離し,時間的なずれを補正することで,より正確なクラスタリングを可能にすることを目的とする。
    • 提案手法NeuralFLoCは,ニューラル常微分方程式駆動の微分同相写像フローとスペクトルクラスタリングを組み合わせた,エンドツーエンドの深層学習フレームワークである。
    • 実験の結果,関数型データベンチマークにおいて,登録とクラスタリングの両方で最先端の性能を示し,欠損データや不規則なサンプリング,ノイズに対するロバスト性も確認された。
    • モデルは,滑らかで可逆的な歪み関数と,クラスタ固有のテンプレートを同時に学習することで,位相と振幅の変動を効果的に分離する。

    Link: https://arxiv.org/abs/2602.03169

  • 潜在ニューラル常微分方程式によるモデル情報に基づく精密投与:薬物動態における構造的仮定の克服 [stat.ML, cs.AI, cs.LG]目的:タクロリムス曝露量(AUC)の予測
    • 腎移植後の精密投与には正確なAUC推定が不可欠であり,患者の予後を左右する重要な要素である。
    • 従来のPopPKモデルは,固定された構造的仮定に依存するため,複雑な患者特有の動態を捉えきれない場合がある。
    • 本研究は,潜在ODEを用いて,患者ごとの薬物動態をデータ駆動的に学習し,AUC予測の精度向上を目指す。
    • シミュレーションにおいて,潜在ODEモデルは標準的な手法と比較して,生物学的メカニズムの変動に対する頑健性が高かった。
    • 内部検証では,潜在ODEモデルはit2B法と比較して有意に高い精度を示し,平均RMSPEは7.99%であった(p < 0.001)。
    • 外部検証では,潜在ODEモデルはRMSPE 10.82%を達成し,標準推定器と同程度の性能を示した。

    Link: https://arxiv.org/abs/2602.03215

  • 異種データに対する原理に基づいた連合学習ランダムフォレスト [eess.AS, cs.CL, stat.ML, cs.LG]目的:異種データ環境下での連合学習ランダムフォレストの性能向上
    • データが分散された環境での機械学習の需要が高まっているため。
    • 既存の連合学習ランダムフォレストは,最適化の原理に基づかない手法に依存している。
    • クライアントデータの多様性に対応し,分散環境でのランダムフォレストの性能を向上させる。
    • 提案手法FedForestは,分散統計量の集約に基づき,集中型アルゴリズムの分割選択を近似する。
    • クライアント指標に基づく分割を可能にし,既存手法にはない非パラメトリックなパーソナライズを実現する。
    • 異種ベンチマークにおいて,集中型モデルの性能に匹敵し,通信効率も高いことが示された。

    Link: https://arxiv.org/abs/2602.03258

  • 物理構造化変分オートエンコーダを用いた定量分子MRIにおける多パラメータ不確実性マッピング [stat.ML, cs.AI, cs.LG, physics.med-ph]目的:定量分子MRIにおける多パラメータの事後分布推定
    • 定量MRIは,病理バイオマーカーの抽出に有用であり,臨床応用が期待される。
    • 既存のアルゴリズムは,不確実性の定量化が不十分であり,信頼性や透明性に課題がある。
    • 物理構造化変分オートエンコーダを用いて,迅速かつ高精度な不確実性マッピングを実現する。
    • 提案手法は,微分可能なスピン物理シミュレーターと自己教師あり学習を統合し,パラメータ間の相関を捉えた完全な共分散行列を提供する。
    • 得られた多パラメータ事後分布は,ブルートフォース型ベイズ解析の結果と良好な一致を示し,脳全体の定量化において大幅な高速化を実現した。
    • 信号獲得の進行に伴う多パラメータ事後分布の変化を監視することで,プロトコル最適化やリアルタイム適応撮像への応用が期待される。

    Link: https://arxiv.org/abs/2602.03317

  • ポートフォリオ構築への新しいアプローチ [q-fin.PM, cs.LG, q-fin.CP, q-fin.RM, stat.ML]目的:資産選定とポートフォリオ構築のための機械学習に基づくフレームワーク
    • 現代ポートフォリオ理論は,金融市場におけるリスクとリターンの最適化に不可欠である。
    • 高次元の資産空間では,推定誤差が大きく,ロバストなポートフォリオ構築が困難である。
    • 本研究は,資産間の依存関係を考慮したスパースグラフモデルを用いて,ポートフォリオの安定性とパフォーマンス向上を目指す。
    • 提案手法BPASGMは,資産間の依存関係をスパースグラフモデルで表現し,冗長な資産を排除することで,ポートフォリオの分散性を高める。
    • モンテカルロシミュレーションの結果,BPASGMに基づくポートフォリオは,標準的な平均分散ポートフォリオと比較して,リスク調整後のパフォーマンスが向上する。
    • 実証分析の結果,1990年から2025年までの米株,グローバル株指数,外国為替レートにおいて,ポートフォリオのカーディナリティが大幅に減少することが確認された。

    Link: https://arxiv.org/abs/2602.03325

  • 二次近似による線形化ラプラス近似の改善 [stat.ML, cs.LG]目的:深層ニューラルネットワークにおける不確実性定量
    • 深層学習の信頼性向上は,安全性と適切な意思決定に不可欠である。
    • 既存手法では,分布外データに対する過信傾向が課題となっている。
    • ラプラス近似の精度を改善し,より正確な不確実性推定を目指す。
    • 提案手法QLAは,線形化ラプラス近似(LLA)よりも一貫して良好な不確実性推定結果を示した。
    • QLAは,ヘッセ行列を直接計算せずに,ラプラス近似の精度を向上させる。
    • 計算コストを大幅に増加させることなく,性能改善を実現している。

    Link: https://arxiv.org/abs/2602.03394

  • 複雑な画像生成のための量子拡散モデルの強化 [quant-ph, cs.LG]目的:複雑な画像生成に向けた量子拡散モデルの性能向上
    • 近年,高次元データの生成に量子モデルが注目されている。古典計算では困難な表現が可能となる。
    • 量子生成モデルは,スケーラビリティと表現力に課題があり,多峰性分布への適用が難しい。
    • ハイブリッド量子古典モデルと適応的非局所観測可能量により,量子モデルの課題解決を目指す。
    • 提案アーキテクチャは,MNISTデータセットにおいて,すべての数字クラスに対して構造的に一貫性のある画像を生成できることを示した。
    • 適応的測定を用いたハイブリッドアーキテクチャは,モード崩壊を緩和し,生成能力を向上させる実行可能な方法を提供する。
    • ハードウェアの制約は依然として解像度を制限するものの,NISQ時代における有望なアプローチである。

    Link: https://arxiv.org/abs/2602.03405

  • 原子規模NEGF計算の高速化:アルゴリズム,並列化,機械学習 [cond-mat.mtrl-sci, cs.LG]目的:原子規模の量子輸送特性シミュレーションの高速化手法
    • ナノデバイスの性能向上には,電子輸送特性の正確な理解が不可欠である。
    • 従来のNEGF計算は計算コストが高く,大規模システムへの適用が困難であった。
    • 本研究は,現実的なシステム規模でのDFT+NEGFシミュレーションの実現を目指す。
    • アルゴリズムの改善と並列化により,計算効率の大幅な向上を達成した。
    • グラフニューラルネットワークや機械学習の活用により,さらなる高速化の可能性を示唆した。
    • 大規模な原子構造における,より正確な量子輸送特性のシミュレーションが可能となった。

    Link: https://arxiv.org/abs/2602.03438

  • 拡散光学トモグラフィのためのスコアベース拡散モデル:不確実性定量化を伴う [stat.ML, cs.LG, stat.AP]目的:拡散光学トモグラフィにおける吸収・散乱パラメータ分布推定のためのスコアベース拡散モデルの評価
    • 生体組織内光吸収・散乱分布の推定は,医療診断や治療において重要な役割を担う。
    • 拡散光学トモグラフィは逆問題であり,ノイズやモデル誤差に非常に敏感である。
    • モデル誤差に強い,データ駆動型事前分布を用いた推定手法を確立する。
    • スコアベース拡散モデルは,従来のモデルベース推定と比較して,分散の低い事後サンプルを生成した。
    • 生成された事後サンプルは,高度に不適切な問題やモデル誤差が存在する場合でも,真の値の周りに集中していた。
    • 学習されたスコア関数とモデルベースの成分を組み合わせた新規な正則化手法が有効であることが示された。

    Link: https://arxiv.org/abs/2602.03449

  • 熱拡散によるグラフ生成器 [stat.ML, cs.LG]目的:グラフ生成の新たな枠組み
    • 化学,生物学,社会ネットワークなど幅広い分野でグラフ構造の生成が重要である。
    • 既存手法では,グラフ構造の複雑な特徴を捉えきれない場合がある。
    • ラプラシアンと熱核を用いた,より効果的なグラフ生成手法を開発する。
    • 本研究では,グラフラプラシアンと熱核を用いた新しいグラフ生成フレームワークを提案した。
    • このフレームワークは,既存の拡散ベースのグラフ生成モデルを一般化し,構造的特性を効果的に捉えることが示された。
    • 学習可能な代理生成器を用いて時間逆拡散プロセスをシミュレートすることで,新たなグラフ構造をサンプリングする。

    Link: https://arxiv.org/abs/2602.03612

  • 回帰投影とバッチ不一致を用いたシミュレーションに基づく推論 [stat.ME, cs.LG, stat.ML]目的:シミュレーターパラメータの推論
    • 複雑なモデルのパラメータ推定は,科学的発見に不可欠である。
    • 従来の推論手法は計算コストが高く,大規模シミュレーションへの適用が困難である。
    • 回帰に基づく軽量な推論手法により,計算効率と精度を両立することを目指す。
    • 回帰投影とバッチ不一致を用いることで,効率的なパラメータ推論が可能となった。
    • 提案手法は並列化が容易であり,大規模シミュレーションデータにも適用可能である。
    • 点推定と集合推定の区別が明確になり,識別可能性の限界が示された。

    Link: https://arxiv.org/abs/2602.03613

  • 加速化ノイズべき乗法に関する解析の改善と分散型PCAへの応用 [stat.ML, cs.DC, cs.LG, cs.NA, math.NA]目的:加速化ノイズべき乗法の収束性解析
    • PCAは高次元データの次元削減に不可欠であり,様々な分野で活用されている。
    • 分散型環境下でのPCAは,通信コストが課題となり,効率的なアルゴリズムが求められている。
    • ノイズのある行列ベクトル積に対する収束条件を緩和し,実用的な分散型PCAアルゴリズムを開発すること。
    • 本研究では,加速化ノイズべき乗法の収束性解析を改善し,従来の制約よりも緩い条件で収束が保証されることを示した。
    • 解析は最悪の場合でも最適であり,収束率を改善するための条件緩和は不可能であることを証明した。
    • 分散型PCAへの応用として,通信コストが従来の非加速化法と同程度である加速化アルゴリズムを提案した。

    Link: https://arxiv.org/abs/2602.03682

  • VR-VFL:不完全CSI下における車両連合学習のためのレートとクライアントの同時選択 [eess.SP, cs.LG]目的:車両エッジネットワークにおける効率的なリソース配分
    • 車両エッジネットワークは,自動運転やコネクテッドカーなどの実現に不可欠であり,その発展が期待されている。
    • 高移動度と不完全なチャネル状態情報により,リソース配分が困難であり,既存手法は現実的な環境下での有効性に限界がある。
    • 車両の移動性と無線環境の制約を考慮し,より実用的で効率的な連合学習手法を確立することを目指す。
    • 提案手法VR-VFLは,既存手法と比較して約40%高速に学習収束を達成することを示した。
    • VR-VFLは,動的なクライアント選択と適応的な送信レート選択を組み合わせることで,学習収束とラウンド時間削減のバランスを取る。
    • 無線環境の変化に応じてラウンド回数を柔軟に調整することで,現実的な条件下での効率的な連合学習を実現する。

    Link: https://arxiv.org/abs/2602.03711

  • 効率的な分散減少推定:生成EHRモデルにおけるSCOPEとREACH推定器 [stat.ML, cs.LG]目的:生成EHRモデルからの効率的な分散減少推定
    • 電子カルテデータは臨床予測において重要性が増しており,患者ケアの向上に貢献する可能性を秘めている。
    • 従来のモンテカルロシミュレーションは計算コストが高く,推定のばらつきが大きいという課題があった。
    • 本研究は,モンテカルロ法よりも効率的に臨床アウトカムを予測するための手法を開発し,実用性を高めることを目指す。
    • 提案手法であるSCOPEとREACHは,MIMIC-IVデータを用いた入院死亡率予測において,100サンプルモンテカルロと同等の性能を10-11サンプルで達成した。
    • これにより,推論コストを約10分の1に削減し,EHRモデルの臨床現場への導入を促進する。
    • 集中治療室への入室予測では改善は限定的だったが,アウトカムの自発性の低さが原因であると考察された。

    Link: https://arxiv.org/abs/2602.03730

  • 視覚誘導による音響強調のための条件付きフローマッチング [math.CO, cs.DM, math.DS, eess.AS, cs.LG]目的:視覚と音声の一貫性のある体験を創出するための音響バランスの再調整
    • 視覚と聴覚の情報統合は,より自然で没入感のあるメディア体験を実現する上で重要である。
    • 既存手法は識別的モデルに依存し,音響強調の曖昧性に対応できず,視覚と聴覚の焦点のずれが生じやすい。
    • 生成モデルを用いて,音響強調の課題を解決し,視覚と音声のより調和のとれた統合を目指す。
    • 提案手法は,条件付きフローマッチング(CFM)フレームワークを導入し,音響強調を生成問題として再構築した。
    • ロールアウト損失を用いることで,予測誤差の累積を抑制し,長距離フロー統合の安定化を実現した。
    • 音響と視覚の情報を統合するモジュールを提案し,明示的なクロスモーダルソース選択を可能にした結果,既存手法を上回る性能を達成した。

    Link: https://arxiv.org/abs/2602.03762

  • 指値板における反事実生成のための拡散モデル:DiffLOB [q-fin.CP, cs.AI]目的:指値板の軌跡の反事実的生成
    • 金融市場のシミュレーションは,リスク管理や取引戦略の評価に不可欠である。
    • 既存モデルは市場の状況変化に対応できず,仮説的な条件下の市場動向予測が困難である。
    • 将来の市場状況を考慮した反事実的な指値板の生成を可能にし,市場分析を支援する。
    • DiffLOBは,市場のトレンド,ボラティリティ,流動性などの将来の市場状況に応じて,指値板の軌跡を生成できる。
    • 生成された軌跡は,現実の市場の統計的性質や時間的依存性を忠実に再現していることが確認された。
    • DiffLOBによる反事実的な軌跡は,将来の市場状況の予測精度向上に貢献することが示された。

    Link: https://arxiv.org/abs/2602.03776

  • フローと拡散における遅延および点質量確率補間を用いた高速サンプリング [stat.ML, cs.AI, cs.LG]目的:フローと拡散のサンプリング高速化手法
    • 生成モデルの主要な手法であり,画像生成等の分野で重要性が増している。
    • サンプリングステップ数が多いと計算コストが増大し,実用上の課題となる。
    • 確率補間計画の変換により,少ないステップ数での高品質な画像生成を目指す。
    • 確率微分方程式のサンプルパスを異なる補間計画間で変換する理論的基盤を確立した。
    • 点質量計画を導入し,特定の条件下でドリフト項をゼロにする遅延計画族を特定した。
    • 既存の事前学習済みフローモデルに遅延計画を適用し,再学習なしでステップ数を削減できることを示した。

    Link: https://arxiv.org/abs/2602.03789

  • 嗜好に基づく条件付き治療効果と方策学習 [stat.ML, cs.LG]目的:嗜好に基づく条件付き治療効果推定と方策学習の新しい枠組み
    • 医療や経済学等,様々な分野で,個々の状況に応じた最適な介入策の特定が重要である。
    • 従来の分析手法では,数値的なアウトカムに限定され,多様なアウトカムに対応できない場合がある。
    • 順序データや嗜好に基づくアウトカムにも適用可能な,新しい識別条件と推定手法を確立すること。
    • 条件付き嗜好に基づく治療効果(CPTE)は,アウトカムのランキングのみを必要とし,多様なアウトカムに対応可能である。
    • CPTEは,従来の識別困難であった推定量の識別条件を提供し,解釈可能なターゲットとなる。
    • マッチング,分位点回帰,分布回帰などの推定戦略に加え,プラグインバイアスを修正する影響関数推定器を提案した。

    Link: https://arxiv.org/abs/2602.03823

  • 方策最適化における経験再生の収束性:バイアス,分散,有限時間収束の特性化 [math.CO, cs.DM, cs.CC, cs.DM, cs.LG, cs.AI]目的:方策最適化における経験再生の理論的特性
    • 深層強化学習の性能向上に不可欠であり,そのメカニズム解明が重要である。
    • 経験再生がどのように収束に影響するか,理論的な理解が十分でなかった。
    • 経験再生のバイアスと分散を定量化し,適切なバッファサイズを決定すること。
    • 経験再生におけるバイアスは,累積方策更新量,基礎となるダイナミクスの混合時間,およびバッファ内のデータの古さに依存してスケールすることが示された。
    • サンプル依存性が勾配分散をどのように制御し,経験再生が有益であるかの条件が明らかになった。
    • バッファサイズ,サンプル相関,混合時間が収束率を決定するバイアス-分散のトレードオフが定量的に評価された。

    Link: https://arxiv.org/abs/2110.08902

  • ニューラルネットワークにおける離散潜在構造 [cs.DC, cs.CG, cs.LG, stat.ML]目的:ニューラルネットワークにおける離散潜在構造の学習戦略
    • 自然言語処理,画像認識,バイオインフォマティクスなど多様な分野で,離散構造が重要である。
    • ニューラルネットワークは連続計算向けに設計されており,離散構造の学習は困難である。
    • 離散潜在構造学習戦略の関連性を明らかにし,適用範囲と特性を理解する。
    • 連続緩和,代理勾配,確率的推定という3つの学習戦略を調査した。
    • 様々なモデルに対して一貫した表記法を用いて,新たな繋がりを発見した。
    • 多くの戦略が,基本的な構成要素を異なる方法で使用していることが示された。

    Link: https://arxiv.org/abs/2301.07473

  • 文脈的因果ベイジアン最適化 [cs.LG]目的:目的変数期待値を最大化する介入方針の設計
    • 複雑なシステムにおける最適な意思決定は重要であり,効率的な探索が不可欠である。
    • 従来の最適化手法では,文脈情報や因果構造を十分に活用できていない場合がある。
    • 文脈情報と因果グラフ構造を統合し,より効率的な最適化を実現することを目的とする。
    • 提案手法は,文脈的ベイジアン最適化と因果的ベイジアン最適化を統合した統一的な枠組みを提供する。
    • 実験結果から,提案手法は高次元設定において亜線形後悔を達成し,サンプル複雑性を低減することが確認された。
    • 最悪ケースおよびインスタンス依存性の高い確率後悔の限界が導出された。

    Link: https://arxiv.org/abs/2301.12412