arXiv雑要約

AI - 2026/02/03 公開

  • タンパク質言語モデルにおける繰り返し制御 [q-bio.BM, cs.AI]目的:タンパク質言語モデルにおける病的な繰り返し生成の抑制
    • タンパク質設計や構造予測において,タンパク質言語モデルの重要性が増している。
    • タンパク質言語モデルは,生成時に繰り返しパターンに陥りやすく,信頼性を損なう。
    • 繰り返し生成を抑制し,タンパク質の構造と機能を両立させる手法を確立する。
    • 本研究では,繰り返し生成を定量的に評価する指標を提案し,それが構造の信頼性に与える悪影響を示した。
    • Utility-Controlled Contrastive Steering (UCCS) という,構造的有用性を制御したデータセットを用いて生成を誘導する手法を提案した。
    • 提案手法は,既存手法と比較して繰り返しを大幅に低減しつつ,AlphaFoldの信頼度スコアを維持することを示した。

    Link: https://arxiv.org/abs/2602.00782

  • ゼロフローエンコーダ [stat.ML, cs.LG]目的:表現学習のためのフローに基づくフレームワーク
    • 生成モデリングにおいてフローに基づく手法は目覚ましい成功を収めており,複雑なデータ分布の詳細な構造を捉える上で重要である。
    • 既存研究では,生成タスク以外の,きめ細かい構造的詳細を明らかにするフローの能力が十分に活用されていない。
    • この研究は,データから十分な情報を抽出し,マルコフブランケットや潜在表現を学習することを目指す。
    • 提案手法は,独立結合を用いた整流化フローにおいて,t=0.5でフローがゼロとなる条件(ゼロフロー基準)を導出した。
    • ゼロフロー基準は条件付き独立性を保証し,データから十分な情報を抽出することを可能にする。
    • この基準を損失関数に変換することで,シミュレーション不要でマルコフブランケットや潜在表現を学習できる。

    Link: https://arxiv.org/abs/2602.00797

  • ファウンデーションモデル規模におけるヘッセ行列スペクトル解析 [stat.ML, cs.LG]目的:ファウンデーションモデルのヘッセ行列スペクトルに関する大規模解析
    • 大規模言語モデルの性能向上には,最適化の理解が不可欠であり,ヘッセ行列はその鍵となる。
    • ヘッセ行列の計算は計算コストが高く,従来は小規模モデルや近似に頼るしかなかった。
    • 大規模モデルにおけるヘッセ行列の正確なスペクトル解析を可能にし,既存の近似の妥当性を検証する。
    • 大規模言語モデル(最大1000億パラメータ)に対して,大規模なスペクトル密度推定を初めて実現した。
    • ヘッセ行列への直接アクセスにより,広く用いられるブロック対角近似が,大きな誤差を示す可能性があることが示された。
    • ヘッセ行列スペクトルの計算は,第一階の学習と比較して,わずかなオーバーヘッドで実現可能であることが示された。

    Link: https://arxiv.org/abs/2602.00816

  • 安全性と有効性のトレードオフ:データポイズニングに対する堅牢性 [stat.ML, cs.LG]目的:データポイズニング攻撃に対する安全性の限界と有効性の関係性
    • 機械学習モデルのセキュリティ確保は重要であり,特に悪意のある攻撃からの防御が不可欠である。
    • 既存の防御手法では,巧妙に隠蔽されたバックドア攻撃やデータポイズニング攻撃を検知・防御することが困難である。
    • 入力空間の幾何学的特性に基づき,データポイズニング攻撃の検知可能性と安全性のトレードオフを定量的に示す。
    • 汚染されたラベルによるポイズニング攻撃は,入力ヘッセ行列にランク1のスパイクを誘発し,攻撃の有効性と相関する。
    • 非線形カーネルを用いることで,攻撃の有効性が維持されつつ,スペクトル的に検知不能な「ニアクローン領域」が存在することが示された。
    • 入力勾配の正則化は,ポイズニングの影響を抑制するが,データ適合能力を低下させ,安全性と有効性のトレードオフを生む。

    Link: https://arxiv.org/abs/2602.00822

  • ソボレフ空間における有害な過学習 [stat.ML, cs.LG]目的:過パラメータ化された機械学習における良性過学習に関する最近の研究に触発され,ノイズの多い訓練データに完全に適合するソボレフ空間 $W^{k, p}(\mathbb{R}^d)$ の関数の一般化性能
    • 機械学習の理論において,モデルの汎化性能を理解することは不可欠である。特に,過パラメータ化されたモデルにおける過学習現象の解明が重要視されている。
    • 従来の理論では,過学習は一般化誤差の増加を引き起こすとされていたが,近年では,過学習が必ずしも一般化性能を損なわない「良性過学習」の存在が示唆されている。
    • 本研究は,ソボレフ空間における過学習の有害な側面を明らかにし,良性過学習が成立しない条件を特定することを目指す。
    • ノイズを含む訓練データに完全に適合する関数(補間子)が,サンプルサイズが無限大に近づいても,ある正の定数以下の一般化誤差を持つことが示された。
    • この結果は,$p \in [1, \infty)$ の任意の $p$ に対して成立し,カーネル法を用いた $p = 2$ のヒルベルト空間の場合よりも一般的な結果である。
    • この証明では,ソボレフ不等式を用いて,訓練データの有害な近傍を幾何学的に特定するアプローチが用いられている。

    Link: https://arxiv.org/abs/2602.00825

  • 分数ランジェバンアルゴリズムのためのスコアベースメトロポリス・ハスティングス法 [stat.ML, cs.LG]目的:分数ランジェバンアルゴリズムにおけるサンプリングの精度向上
    • 重い裾を持つ分布のサンプリングは,統計物理,機械学習等で重要。
    • 提案密度の評価が困難な場合,従来のメトロポリス・ハスティングス法は適用困難。
    • 分数ランジェバン法における有限時間誤差と裾振る舞いの制御を改善する。
    • MAFLAは,分数提案スコア勾配のプロキシを用いてスコアバランスマッチングにより受容関数を学習する。
    • 組み合わせ最適化問題を含む一連のタスクにおいて,MAFLAは調整されていない分数ランジェバン動力学と比較して,有限時間サンプリング精度を大幅に向上させる。
    • MAFLAは,分数ランジェバン法の調整メカニズムとして,スコアベースのアプローチを採用している。

    Link: https://arxiv.org/abs/2602.00835

  • 分布ロバスト正則化による多変量時系列データの欠損値補完 [stat.ML, cs.LG, stat.AP]目的:多変量時系列データの欠損値補完手法
    • 時系列データは,金融,医療,環境など広範な分野で重要であり,欠損値処理は分析精度に直結する。
    • 欠損値補完は,観測データと真のデータ分布の不一致の影響を受けやすく,特に非定常性や系統的な欠損下で課題となる。
    • 分布の不一致に強いロバストな補完手法を開発し,欠損値処理の精度と信頼性を向上させる。
    • 提案手法DRIOは,再構成誤差の最小化と,最悪ケース分布との間のdivergenceの最小化を同時に行う。
    • DRIOは,Wassersteinの曖昧性集合内で,無限次元の最適化問題をサンプル軌跡に対する敵対的探索に帰着させる。
    • 様々な実データセットでの実験により,DRIOは欠損パターンに関わらず,再構成精度と分布整合性の両面で既存手法を上回ることが示された。

    Link: https://arxiv.org/abs/2602.00844

  • アテンション近似のための準線形時間量子アルゴリズム [quant-ph, cs.DS, cs.LG]目的:アテンションモジュールの近似手法
    • 現代のTransformerや大規模言語モデルの基盤技術であり,高性能化に不可欠である。
    • アテンション行列の計算量はn^2であり,大規模データに対する計算コストが課題となっている。
    • 量子データ構造を用いて,アテンション行列の行を準線形時間で近似し,計算効率を向上させる。
    • 提案手法は,クエリ,キー,値行列に対する行クエリのみを用いてアテンション行列の近似を可能にする。
    • 前処理時間は$\widetilde{O}\left( \epsilon^{-1} n^{0.5} \left( s_\lambda^{2.5} + s_\lambda^{1.5} d + \alpha^{0.5} d \right) \right)$であり,各行クエリの応答時間は$\widetilde{O}(s_\lambda^2 + s_\lambda d)$である。
    • 本研究は,nに関して準線形時間でアテンション行列の行を近似する初の量子データ構造を提供する。

    Link: https://arxiv.org/abs/2602.00874

  • 暗黙的ハミルトニアンを持つ最適制御問題に対するヤコビアンフリー逆伝播の収束性 [math.OC, cs.LG, cs.NA, math.NA]目的:暗黙的ハミルトニアンを持つ最適制御問題におけるヤコビアンフリー逆伝播(JFB)の収束性
    • 最適制御は,ロボット工学や経済学など,多くの分野で重要な役割を担う
    • 暗黙的ハミルトニアンを持つ問題では,最適な制御則が閉形式で得られない
    • JFBを用いた学習手法の理論的根拠と実証的証拠を提供すること
    • 本研究では,確率的ミニバッチ設定におけるJFBの収束性を理論的に保証した。
    • その結果,得られた更新は期待される最適制御目的の停留点に収束することが示された。
    • マルチエージェント最適消費問題や群制御など,より高次元の問題への適用可能性も確認された。

    Link: https://arxiv.org/abs/2602.00921

  • 汚染された多項ロジスティックエキスパート混合モデルにおけるミニマックス推定レートの改善 [math.ST, cs.LG, stat.TH]目的:汚染されたエキスパート混合モデルのパラメータ推定レートの解析
    • 転移学習において,事前学習済みモデルと適応モデルを組み合わせる手法の理論的基盤を確立する必要がある。
    • 分類設定における汚染されたMoEモデルの理論的解析が不足している。
    • 分類問題におけるパラメータ推定レートのミニマックス最適性を保証すること。
    • 均質および異質構造を持つ多項ロジスティックエキスパート混合モデルにおけるパラメータ推定の収束レートを特徴付けた。
    • 真のパラメータがサンプルサイズとともに変化する場合でも,一様収束レートを確立した。
    • エキスパートの異質性が,パラメータ推定レートを向上させ,サンプル効率を高めることを示した。

    Link: https://arxiv.org/abs/2602.00939

  • FinEvo:孤立したバックテストから多エージェント金融戦略進化のための生態学的市場ゲームへ [physics.soc-ph, cs.AI, cs.GT, cs.MA]目的:多エージェント金融戦略の進化ダイナミクスに関する研究
    • 金融市場は複雑であり,戦略間の相互作用が価格形成に影響するため,生態学的視点が重要である。
    • 従来のバックテストは市場環境の変化や戦略間の相互作用を考慮せず,戦略の持続性や消滅を説明できない。
    • 多エージェント金融戦略の進化を,生態学的ゲーム形式で分析するためのフレームワークを提供する。
    • FinEvoは,再現性の確保と,文脈依存の結果の開示において,安定性と表現力を両立している。
    • 戦略は,競合相手に応じて優位になる,崩壊する,または提携を形成するなど,静的なバックテストでは見えないパターンを示す。
    • FinEvoは,金融市場におけるロバスト性,適応,創発的ダイナミクスを分析するための統一されたプロトコルを提供する。

    Link: https://arxiv.org/abs/2602.00948

  • 予測集合に基づく最適意思決定 [stat.ML, cs.LG]目的:予測集合を用いた下流タスクにおける意思決定の最適化
    • 機械学習の信頼性確保は重要であり,未知のデータへの対応が求められている。
    • 予測集合は存在するが,その最適な活用法は未だ明確ではない。
    • 予測集合の保証範囲内で,リスクを最小化する意思決定手法を確立する。
    • 提案手法は,予測集合の保証範囲を考慮した最悪ケースのリスクを最小化する。
    • 最適な予測集合の構築法を導出し,有限サンプルでの分布フリーなカバレッジを維持する。
    • 医療診断や安全に関わる意思決定において,既存手法よりも誤りを減らすことが示された。

    Link: https://arxiv.org/abs/2602.00989

  • 脳波における個人間・個人内変動:体系的サーベイ [q-bio.NC, cs.AI, cs.HC]目的:脳波変動の定量化とモデル化に関する研究の体系的レビュー
    • 脳科学,臨床神経生理学,ブレイン・コンピュータ・インターフェースの基盤技術である。
    • 信頼性,再現性,応用展開が,顕著な個人間・個人内変動によって制限されている。
    • 脳波変動を管理可能な制約として捉え,精密神経科学と堅牢な神経技術に活用することを目指す。
    • 個人間変動は,個人内変動よりも一般的に大きいが,いずれも推論やモデルの汎化に影響を与える。
    • アルファ帯域の指標や個人のアルファピーク周波数は比較的信頼性が高い一方,高周波や接続性に基づく指標は信頼性のばらつきが大きい。
    • 変動源として生物学的要因,状態関連要因,技術的要因,分析的要因が挙げられ,研究設計や報告における推奨事項が提示された。

    Link: https://arxiv.org/abs/2602.01019

  • 大規模言語モデルを用いた行動パラメータの較正 [cond-mat.stat-mech, cs.SI, physics.soc-ph, econ.GN, cs.AI, q-fin.EC]目的:行動パラメータの測定範囲,較正関数,および限界
    • 資産価格モデルにおいて行動パラメータは重要だが,信頼性の高い測定が困難であった。
    • 既存の測定手法では,行動パラメータの正確な把握が難しく,モデルの精度が制限されていた。
    • 大規模言語モデルを用いて行動パラメータを較正し,より現実的な資産価格モデルを構築すること。
    • 大規模言語モデルは,損失回避,群集行動,外挿など,行動パラメータを測定する較正された測定器として機能することが示された。
    • プロファイルに基づく較正により,損失回避,群集行動,外挿,アンカリングなどのパラメータが理論的に整合性のある方向にシフトした。
    • 較正されたパラメータをエージェントベースの資産価格モデルに組み込むと,経験的な証拠と一致する短期的なモメンタムと長期的な反転パターンが生成された。

    Link: https://arxiv.org/abs/2602.01022

  • 量子学習の万華鏡:古典概念に対する量子学習の調査 [quant-ph, cs.LG]目的:古典概念の量子学習に関する調査
    • 機械学習の分野において,効率的な学習アルゴリズムの探求は重要である。
    • 古典的な学習理論では解明されていない複雑な問題が存在する。
    • 量子学習が古典学習と比較してどのような優位性を持つかを明らかにすること。
    • 本研究では,PAC学習フレームワークにおける量子エンコードされた古典概念の学習に関する様々な結果をまとめた。
    • 異なるラベルオラクルへのクエリアクセス下での古典学習と量子学習のクエリ,サンプル,時間計算量の分離に焦点を当てた。
    • 現在の理解の限界を明らかにし,今後の研究課題として23の問題を提示した。

    Link: https://arxiv.org/abs/2602.01054

  • ナビエ・ストークス方程式における渦の伸張と拡散モデルにおける情報消散:偏微分方程式的視点からの再構成 [math.AP, cs.AI, physics.flu-dyn]目的:ナビエ・ストークス方程式における渦の伸張と拡散モデルにおける情報消散のメカニズム解明
    • 流体現象の理解は,気象,海洋,航空力学など広範な分野で不可欠である。
    • 従来の解析では,時間逆方向のラプラシアンが不安定化を引き起こし,解析が困難である。
    • スコア関数を用いた時間逆方向のダイナミクスを確立し,情報消散のメカニズムを解明する。
    • 逆時間形式化により,時間反転に伴うラプラシアンをドリフト項として吸収し,ラグランジュ的な記述を可能にした。
    • 軸対称渦伸張場を用いた離散ラグランジュフローにより,スコア関数をニューラルネットワークで学習した。
    • 圧縮方向では初期位置の情報が急速に失われる一方,伸張方向では比較的良好に保存されることが示された。

    Link: https://arxiv.org/abs/2602.01071

  • 高性能ハーフヘウスラー熱電材料の信頼性ある発見のためのロバストな機械学習フレームワーク [cond-mat.mtrl-sci, cs.LG]目的:高性能ハーフヘウスラー熱電材料の探索を目的とする機械学習フレームワーク
    • 環境問題への対応は喫緊の課題であり,熱電材料はその解決策の一つとして期待されている。
    • 機械学習モデルは高い予測精度を示す一方で,実験データへの汎化性能が低いという課題がある。
    • 本研究は,機械学習モデルの汎化性能を向上させ,信頼性の高い材料探索を実現することを目的とする。
    • 主成分分析に基づいた厳密なデータ分割手法を導入することで,訓練データとテストデータの偏りを解消した。
    • ベイズ最適化とk-best特徴量フィルタリングを組み合わせ,Random Forest,XGBoost,Neural Networksの各アーキテクチャで性能を向上させた。
    • SHAP分析とSISSO回帰により,Aサイトドーパント濃度とAサイト蒸発熱がzTの主要な決定要因であることを明らかにした。

    Link: https://arxiv.org/abs/2602.01149

  • 量子学習におけるプライバシーと安定性の同値性:汎化性の保証とともに [math.OC, cs.SY, eess.SY, quant-ph, cs.IT, cs.LG, math.IT]目的:量子学習アルゴリズムの汎化性能の分析
    • データ活用において,プライバシー保護と有効な学習の両立が重要課題となっている。
    • 差分プライバシーを量子学習に適用する際の理論的な限界が明確でなかった。
    • 差分プライバシーが汎化誤差に与える影響を定量的に評価すること。
    • 差分プライバシーとアルゴリズムの安定性の間に密接な関係があることが示された。
    • 差分プライバシーのパラメータが,学習アルゴリズムの出力と訓練データ間の相互情報量に制約を与えることが明らかになった。
    • 差分プライバシーを満たす量子学習アルゴリズムの期待汎化誤差の上界が,プライバシーによって誘導される安定項の平方根で抑えられることが証明された。

    Link: https://arxiv.org/abs/2602.01177

  • AIと塑性:包括的サーベイ [cond-mat.mtrl-sci, cs.AI, cs.LG]目的:AIと塑性の融合に関する包括的な分類
    • 材料科学の発展には,新たな解析手法が不可欠であり,AIはその重要な役割を担う。
    • 材料の塑性挙動予測は複雑であり,従来のモデルでは十分な精度が得られない場合がある。
    • AI技術を活用することで,材料の塑性挙動をより正確に予測し,材料設計を効率化することを目指す。
    • 本サーベイでは,材料の塑性挙動の発見,代替モデルの構築,エミュレーションに用いられる最先端のAI手法を概観した。
    • 材料科学とAI手法の両面から考察を行い,モデルアーキテクチャ,データ要件,予測性能に関する重要な側面を明確にした。
    • 材料コミュニティの研究者や実務家に対し,AIを活用した材料塑性の発展に向けた明確な道筋を示す。

    Link: https://arxiv.org/abs/2602.01215

  • 知識に基づくワークフローへ: 機械的・熱力学的特性のための原子論シミュレーションにおけるセマンティックアプローチ [eess.IV, cs.MM, math.OC, cs.SY, eess.SY, q-bio.NC, cs.HC, cond-mat.mtrl-sci, cs.AI, cs.SE]目的:機械的・熱力学的特性評価のための原子論シミュレーションワークフローの再利用性と透明性の向上
    • 材料設計において,機械的・熱力学的特性の正確な予測は不可欠である。
    • 従来のシミュレーションは,メタデータ不足と再現性の低さという課題を抱えている。
    • FAIR原則に基づいたセマンティックなワークフローを構築し,シミュレーションデータの再利用性を高める。
    • 本研究では,アプリケーションオントロジーに沿ったメタデータ注釈を取り入れた原子論シミュレーションワークフローを開発した。
    • これにより,自動的なプロベナンス(来歴)の記録とFAIR原則準拠のデータ出力が可能となった。
    • 構築したワークフローは,異なる原子間ポテンシャルや材料間での再利用性が確認され,構造-特性関係の検証にも成功した。

    Link: https://arxiv.org/abs/2602.01358

  • 反復ブレグマン射影におけるロバストな準線形収束率 [math.OC, cs.LG]目的:反復ブレグマン射影の収束率の解析
    • 最適化問題の解決において,線形計画問題を近似的に解く手法の重要性が高まっている。
    • エントロピー正則化を用いた手法では,正則化パラメータに依存した収束率が課題となっていた。
    • 正則化パラメータへの依存を抑えた,ロバストな収束率を理論的に保証することを目指す。
    • エントロピー正則化されたKL射影の双対目的関数が,$O(1/k)$ の速度で減少し,その定数は正則化パラメータ$\gamma$に線形に依存することを示した。
    • この結果は,エントロピー最適輸送の保証を,線形制約を持つ他の問題にも拡張するものである。
    • グラフ上のWasserstein-1距離に対するflow-Sinkhornアルゴリズムにおいて,$O(p/\epsilon^{4})$の演算で$\epsilon$-加法精度を達成することを示した。

    Link: https://arxiv.org/abs/2602.01372

  • 乱流渦のダイナミクス機械学習のための大規模高レイノルズ数流れデータセットWAKESET [physics.flu-dyn, cs.LG]目的:乱流渦のダイナミクスに関する機械学習モデルの学習に利用可能な,大規模かつ高レイノルズ数の流れデータセット
    • 流体解析は工学の根幹であり,航空宇宙,海洋,エネルギーなど広範な分野で不可欠である。
    • 実用的な流れ場は高乱流であり,大規模な計算資源が必要となるため,機械学習の適用が困難である。
    • 高レイノルズ数乱流データセットを提供することで,機械学習モデルの汎化性能向上を目指す。
    • 本研究では,水中回収状況における自律型水中機と大型無人水中機の相互作用を捉えた大規模CFDデータセットWAKESETを構築した。
    • WAKESETは1,091件の高精度なRANSシミュレーションを含み,速度や旋回角の変化に対応した4,364インスタンスから構成される。
    • WAKESETは,流れ場予測,代替モデル構築,水中自律航行における機械学習モデルの開発とベンチマークに有用である。

    Link: https://arxiv.org/abs/2602.01379

  • 拡散逆サンプリングによる音声と背景雑音の分離:SSNAPS [eess.AS, cs.LG, cs.SD]目的:実世界の環境雑音下における単一マイクロホン音声分離・強調
    • 日常生活における音声通話や録音の品質向上は重要であり,雑音環境下での分離技術が不可欠である。
    • 従来の音声分離技術は,教師あり学習に依存する場合が多く,多様な雑音環境への適応が課題であった。
    • 本研究では,教師なし学習によるロバストな音声分離・雑音分離を目指し,汎用的な手法を提案する。
    • 提案手法SSNAPSは,拡散モデルを用いた逆サンプリングにより,音声と背景雑音を分離する。
    • 実験の結果,SSNAPSは完全に教師なしでありながら,主要な教師あり学習ベースラインを上回る性能を示した。
    • 分離された雑音成分は高品質であり,音響シーン検出などの下流タスクへの応用も可能である。

    Link: https://arxiv.org/abs/2602.01394

  • オンライン社会厚生関数に基づく資源配分 [stat.ML, cs.LG]目的:有限資源のオンライン学習と推論のための社会厚生関数に基づく枠組み
    • 社会全体の幸福度を最大化する資源配分は,倫理的かつ実用的に重要である。
    • 個人の効用が確率的であり,時間経過とともに変化するため,最適な配分が困難である。
    • 単調性に着目し,個人の効用からの信頼区間を社会厚生関数に適用し,効率的な資源配分を実現する。
    • 提案アルゴリズムSWF-UCBは,多様な社会厚生関数に対してほぼ最適な後悔 $\tilde{O}(n+\sqrt{nkT})$ を達成する。
    • Weighted Power Mean,Kolm,Giniといった異なる社会厚生関数族に対して,専用のオラクルアルゴリズムを設計した。
    • 実験により,$\sqrt{T}$ スケーリングが確認され,資源数kと社会厚生関数のパラメータ間の相互作用が明らかになった。

    Link: https://arxiv.org/abs/2602.01400

  • 重要度重み付き変分推論:リパラメータ化トリックを用いない手法 [stat.ML, cs.LG]目的:重要度重み付き変分推論におけるREINFORCE勾配推定法の理論的解析と,それに基づくより効率的な勾配推定法の提案
    • 変分推論は,複雑な確率分布を近似する強力な手法であり,機械学習や統計モデリングにおいて広く利用されている。
    • 従来の変分推論はリパラメータ化トリックに依存するため,適用範囲が制限される場合がある。REINFORCE推定法は柔軟だが,理論的根拠が不足している。
    • REINFORCE推定法の理論的課題を解決し,より安定した学習を可能にする新しい勾配推定法を開発すること。
    • 重要度重み付き変分推論における既存のVIMCO勾配推定法は,サンプル数が増加するにつれて信号対雑音比が低下するという問題を指摘した。
    • 新しい勾配推定法VIMCO-★を提案し,既存手法の信号対雑音比低下の問題を解決することを示した。サンプル数に応じて信号対雑音比が$\sqrt{N}$に比例して増加する。
    • 提案手法は,リパラメータ化トリックが適用困難な難しい設定において,既存のVIMCO実装よりも優れた性能を発揮することを実証した。

    Link: https://arxiv.org/abs/2602.01412

  • 決定指向学習のための適応的最適輸送事前分布によるロバストな汎化 [stat.ML, cs.LG, stat.AP]目的:少数ショット学習におけるロバストな汎化
    • 機械学習において,限られたデータでの学習は重要であり,実用的な応用を広げる鍵となる。
    • 少数ショット学習では,分布シフトへの頑健性が課題であり,既存手法の適応性に限界がある。
    • クラス適応的な事前分布を学習し,ロバストな決定を効率的に行うこと。
    • 提案手法PG-DROは,階層的最適輸送によりベースデータからクラス適応的な事前分布を学習する。
    • Sinkhorn DROの定式化にこれらを取り込むことで,少数ショット情報を効果的に統合し,ロバストな意思決定を実現する。
    • 実験により,PG-DROが少数ショットシナリオでより強力な汎化性能を示すことが示された。

    Link: https://arxiv.org/abs/2602.01427

  • REINFORCE方策勾配推定器における非一様なノイズ対信号比 [math.OC, cs.SY, eess.SY, math.OC, cs.LG]目的:方策勾配推定器のノイズ対信号比の解析
    • 強化学習は,複雑な制御問題を解決する強力な手法であり,その重要性は増している。
    • 方策勾配法は学習が進むにつれて不安定になったり,学習速度が低下したりする問題がある。
    • 方策勾配推定器のノイズ対信号比を解析し,学習の不安定要因を特定することを目的とする。
    • 線形システムおよび多項式システムにおいて,REINFORCE推定器のノイズ対信号比を正確に特性化することに成功した。
    • 一般的な非線形システムに対しても,分散の上限を導出し,ノイズ対信号比の変動を直接調査することを可能にした。
    • 実験結果から,ノイズ対信号比は方策パラメータ全体で非一様であり,最適化が進むにつれて増加する傾向があることが示された。

    Link: https://arxiv.org/abs/2602.01460

  • シグモイドゲーティング関数を用いた多項ロジスティック専門家混合モデルの再考 [stat.ML, cs.LG]目的:多項ロジスティック専門家混合モデルにおけるシグモイドゲーティング関数の分析
    • 専門家混合モデルは,複雑な関数を近似し,大規模なモデルを効率的に学習するための強力な手法である。
    • シグモイドゲーティング関数の利点は分類タスク下では確立されておらず,モデルの収束性も保証されていない。
    • シグモイドゲーティング関数の理論的特性を解明し,モデルの収束性を保証するとともに,サンプル効率を改善すること。
    • シグモイドゲートは,パラメータと専門家の推定において,ソフトマックスゲートよりも低いサンプル複雑度を示すことが明らかになった。
    • シグモイドゲートに温度パラメータを導入すると,ゲーティングパラメータとの相互作用により,サンプル複雑度が指数関数的に増加することが判明した。
    • ゲーティング関数の内積スコアをユークリッドスコアに置き換えることで,その相互作用を解消し,サンプル複雑度を多項式オーダーに大幅に改善することができた。

    Link: https://arxiv.org/abs/2602.01466

  • 密度情報を活用した疑似カウントによる較正されたエビデンシャル深層学習 [math.CO, cs.DM, stat.ML, cs.LG]目的:不確実性に基づいた分類のための新しいパラメータ化手法
    • 深層学習モデルの予測における不確実性の定量化は,安全性や信頼性が求められる応用において重要である。
    • 既存のエビデンシャル深層学習は,認識的不確実性と偶然的不確実性を混同し,分布外の入力に対して過信しやすい。
    • 分布外のデータに対する過信を抑制し,不確実性の較正を改善することを目的とする。
    • 提案手法DIP-EDLは,ラベル分布と周辺共変量密度を分離推定することで,エビデンスを保存しながら分布外データに対する予測を抑制する。
    • 理論的に,DIP-EDLは漸近的な集中性を持つことが証明された。
    • 実験的に,DIP-EDLは解釈性を高め,分布シフト下でのロバスト性と不確実性較正を改善することが示された。

    Link: https://arxiv.org/abs/2602.01477

  • 回旋溝パターンにおけるコミュニティレベルモデリング:堅牢かつ解剖学的情報に基づいた個別化脳マッピング [q-bio.NC, cs.AI, cs.CV]目的:回旋溝パターンのコミュニティレベルモデリング
    • 脳の形態は個人差が大きいが,解剖学的ランドマークは安定しており,皮質組織の精密な特徴づけに重要である。
    • 既存手法は各回旋溝を独立にモデル化するため,高次構造の捉え方が弱く,位置変動に敏感である。
    • コミュニティレベルでのモデリングにより,解剖学的に妥当な,より堅牢な個別化脳マッピングを実現すること。
    • 提案手法は,表面トポロジーと構造的結合に基づいた二重プロファイル表現を用いて,一貫性のある回旋溝コミュニティを特定する。
    • 1000件を超えるHuman Connectome Projectのデータを用いた評価で,提案手法は既存手法と比較して,形態学的変動の低減,モジュール組織の強化,半球の一貫性向上,優れたアライメントを示した。
    • これらの結果は,コミュニティレベルモデリングが,個別化皮質特徴付けと信頼性の高い交差対象対応のための堅牢かつ解剖学的に根ざしたフレームワークを提供する。

    Link: https://arxiv.org/abs/2602.01482

  • MarkCleaner:知覚できない微小幾何学的摂動による高忠実度ウォーターマーク除去 [eess.IV, cs.AI, cs.CR, cs.CV]目的:ウォーターマーク除去の有効性と視覚的忠実度
    • 画像に埋め込まれたウォーターマークは,著作権保護や改ざん検出に重要である。
    • 従来のウォーターマーク除去手法は,画像の品質を損なうか,ウォーターマークを完全に除去できない。
    • 微小幾何学的摂動によるウォーターマーク除去という新しいアプローチで,高品質な画像復元を目指す。
    • MarkCleanerは,微小幾何学的摂動を考慮した学習により,セマンティックな内容を維持しつつウォーターマークを除去する。
    • このフレームワークは,空間表現を学習するマスクガイデッドエンコーダと,幾何学的摂動を明示的にパラメータ化する2D Gaussian Splattingデコーダを採用している。
    • 実験結果から,MarkCleanerはウォーターマーク除去の有効性と視覚的忠実度において優れた性能を発揮し,リアルタイム推論が可能であることが示された。

    Link: https://arxiv.org/abs/2602.01513

  • 非線形GRPOによるLLMの推論認識型メタアライメント [stat.ML, cs.LG]目的:大規模言語モデルの多様な人間の選好へのアライメント
    • LLMの性能向上には,人間の価値観との整合が不可欠である。
    • 複数基準へのアライメントは基準間の競合が生じやすく,困難である。
    • 推論時の計算コストを抑えつつ,複数基準へのアライメントを実現する。
    • 本研究では,推論時に限られた計算資源でLLMを複数基準へアライメントするIAMAを提案する。
    • IAMAは,異なる推論時アライメントアルゴリズムを通じてLLMを効果的にアライメントできるよう,基盤モデルを訓練する。
    • 非線形最適化問題を解決するため,確率測度の空間で最適解に収束する非線形GRPOを提案する。

    Link: https://arxiv.org/abs/2602.01603

  • 滑らかなクエリに対するミニマックス最適差分プライバシー合成データ [math.ST, cs.IT, cs.LG, math.IT, stat.ML, stat.TH]目的:滑らかなクエリに対する差分プライバシー合成データの生成
    • 個人情報保護とデータ分析の利便性を両立させる技術であり,統計データの共有・活用を促進する。
    • 汎用的なプライバシー保護手法は,実用的な統計量の精度が低い場合がある。
    • クエリの滑らかさを利用することで,より高精度な合成データ生成を目指す。
    • 提案アルゴリズムは,次数$k$までの微分を持つ滑らかなクエリに対し,誤差率$n^{-\min \{1, \frac{k}{d}\}}$を達成する。
    • この結果は,$k=d$において相転移が起こることを示し,既存手法よりも改善された誤差率を確立する。
    • 次数$k$の滑らかなクエリに対する差分プライバシー合成データの有用性のミニマックス下限を初めて確立した。

    Link: https://arxiv.org/abs/2602.01607

  • HuPER:人間に着想を得た音韻知覚フレームワーク [eess.AS, cs.AI]目的:音韻知覚のモデル化
    • 言語理解の根幹であり,音声認識やコミュニケーションロボット等に応用が期待される分野である。
    • 既存モデルは大量の学習データが必要であり,未知言語への汎化性能が課題であった。
    • 少ない学習データで高精度な音韻知覚を可能にし,未知言語への適応能力を高める。
    • HuPERは,わずか100時間の学習データで5つの英語ベンチマークにおいて最先端の音韻誤り率を達成した。
    • また,95の未知言語へのゼロショット転移においても高い性能を示した。
    • 多様な音響条件に対応した適応的な多経路音韻知覚を可能にする最初のフレームワークである。

    Link: https://arxiv.org/abs/2602.01634

  • LLMの戦略的予測能力:完全前向きベンチャー・トーナメントからの証拠 [econ.GN, cs.AI, q-fin.EC]目的:戦略的予測の精度
    • 事業戦略において,将来を予測する能力は不可欠である。
    • 従来の予測手法は,不確実性の高い状況下で限界がある。
    • LLMが人間の専門家を上回る予測能力を持つか検証する。
    • 最新のLLMは,実際の資金調達結果との相関関係において,人間の評価者を大きく上回った。
    • 特にGemini 2.5 Proは0.74という高い相関を示し,ベンチャーペアの約80%を正しく順位付けした。
    • 人間の集合知や人間とAIのハイブリッドチームでも,最高のLLMの性能を超えることはなかった。

    Link: https://arxiv.org/abs/2602.01684

  • ST-BCP:非適合性スコア変換による後方適合予測の信頼区間boundのtightening [stat.ML, cs.LG]目的:後方適合予測における信頼区間boundのtightening
    • 不確実性の評価は,機械学習モデルの信頼性を高める上で不可欠である。
    • 既存の後方適合予測は,Markovの不等式により信頼区間boundの推定にずれが生じやすい。
    • 非適合性スコアの変換により,このずれを縮小し,より正確な信頼区間boundを得る。
    • 提案手法ST-BCPは,データに依存した非適合性スコアの変換を導入することで,既存手法よりも信頼区間boundのずれを大幅に減少させる。
    • 実験結果から,ST-BCPは一般的なベンチマークにおいて,平均的なずれを4.20%から1.12%に低減することを示した。
    • 開発した変換は,baselineであるidentity変換と比較して,より優れた性能を発揮することが証明された。

    Link: https://arxiv.org/abs/2602.01733

  • パラメータ化された偏微分方程式に対する物理情報に基づいたチェビシェフ多項式ニューラル演算子 [physics.flu-dyn, cs.LG]目的:パラメータ化された偏微分方程式の解作用素の近似
    • 物理現象のシミュレーションにおいて,偏微分方程式は不可欠であり,その効率的な解法が求められている。
    • 既存のニューラルネットワークは,物理法則との整合性が不十分であり,学習の安定性に課題がある。
    • チェビシェフ多項式を用いることで,物理法則に基づいた安定した学習と高精度な解法を実現する。
    • 提案手法であるCPNOは,従来のMLPと比較して,精度,収束速度,ハイパーパラメータに対するロバスト性が向上した。
    • CPNOは,チェビシェフスペクトル基底を用いることで,不安定な単項式展開の問題を克服し,安定した勾配の流れを実現する。
    • transonic airfoil flowの実験を通して,複雑な形状を持つ問題への適用可能性が示された。

    Link: https://arxiv.org/abs/2602.01737

  • 複数情報源からの逐次的意思決定:グループロバストマルコフ決定過程 [stat.ME, cs.LG, math.OC, stat.ML]目的:異種データを含む複数サイトのオフラインデータセットからのロバストな逐次的意思決定ポリシーの学習
    • 医療現場など,複数のサイトからデータを収集する状況は一般的であり,共通構造を持ちながらも異質性を示すデータに対処する必要がある
    • 既存手法では,異種データソース間での不確実性を考慮したロバストな意思決定が困難であり,汎化性能が低い場合がある
    • サイト間の構造を維持しつつ,計算可能な範囲でロバストな計画を可能にするための,新しいフレームワークを提案する
    • 本研究では,共通の特徴マップを持つグループ線形構造を持つ分布ロバストMDPを導入し,特徴ごとの不確実性集合を用いてロバストなベルマン再帰を維持する。
    • 悲観的価値反復に基づくオフラインアルゴリズムを開発し,リッジ回帰,最悪の場合の集約,データ依存的な悲観主義ペナルティを含む。
    • サイトの類似性に基づいたクラスタリング拡張を提案することで,サンプル効率を改善し,ロバストな部分カバレッジ仮定の下で最適性の限界を示す。

    Link: https://arxiv.org/abs/2602.01825

  • RIR-Former:座標誘導Transformerによる室インパルス応答の連続再構成 [eess.AS, cs.LG]目的:室インパルス応答の連続再構成手法
    • 音響信号処理において,室インパルス応答は重要な役割を果たす。その正確な測定は,様々な応用において不可欠である。
    • 空間的に高密度な室インパルス応答の測定は,現実的には困難を伴う場合が多い。
    • 任意の空間位置における室インパルス応答を高精度に再構成することを可能とする。
    • RIR-Formerは,Transformerを基盤とし,座標情報を効果的に組み込むことで,既存手法よりも優れた性能を発揮する。
    • 特に,正規化平均二乗誤差(NMSE)とコサイン距離(CD)の評価において,様々な欠損率とアレイ構成下で一貫して高い性能を示す。
    • 本研究は,複雑なアレイ形状,動的な音響シーン,実環境への拡張に向けた将来の研究の可能性を示唆する。

    Link: https://arxiv.org/abs/2602.01861

  • トランスフォーマーを測度理論的連想記憶として:統計的視点とミニマックス最適性 [stat.ML, cs.LG]目的:確率測度のレベルにおける連想記憶の再構築
    • 近年,長大な文脈を扱えるトランスフォーマーは,様々な分野で目覚ましい成果を上げている。
    • 既存の研究では,トランスフォーマーの記憶メカニズムの理論的理解が十分ではない。
    • 分布としての文脈からの想起と予測のマップを学習するトランスフォーマーの理論的限界を解明する。
    • 学習されたソフトマックスアテンションは,入力密度のスペクトル仮定の下で,想起と予測のマップを学習することが示された。
    • 得られた学習率は,対応するミニマックス下界と一致し,収束オーダーの鋭さが証明された。
    • このフレームワークは,理論的に保証された汎化性能を持つ,任意の長さの分布文脈から想起するトランスフォーマー設計の指針を提供する。

    Link: https://arxiv.org/abs/2602.01863

  • 遠方オフセットからの事前情報を近傍オフセットへ伝播:牽引ストリーマーデータの近傍オフセットを段階的に復元する自己教師あり拡散フレームワーク [math.CO, cs.DM, physics.geo-ph, cs.LG]目的:牽引ストリーマー地震探査における近傍オフセットデータの復元
    • 海洋地震探査において,正確なデータは地層構造の解析や資源探査に不可欠である。
    • 近傍オフセットデータの欠損は,データ処理の精度を低下させる大きな問題である。
    • 既存手法の課題を克服し,近傍オフセットデータを高精度に復元することを目指す。
    • 自己教師あり拡散モデルを用いることで,近傍オフセットデータの参照データなしでの復元を可能にした。
    • 合成データおよび実測データを用いた検証により,従来の parabolic Radon transform よりも優れた性能を示した。
    • 復元された波形は,遠方オフセットデータのみの学習にもかかわらず,現実的な振幅とオフセットの関係を維持した。

    Link: https://arxiv.org/abs/2602.01909

  • 共形校正を用いた分位点回帰森林による信頼性の高いリアルタイムVaR推定 [stat.ML, cs.AI, cs.LG, q-fin.RM]目的:リアルタイムVaR推定の実現
    • 市場の変動が激しく,リアルタイムなリスク監視の重要性が高まっている。
    • オンラインでのVaR推定は,その正確性と信頼性の確保が困難である。
    • 共形校正を導入し,OSOAフレームワークにおけるリアルタイムVaRの信頼性を高める。
    • 分位点回帰森林をオフラインで学習させ,リスク要因との関係を捉えることで,リアルタイムなVaR推定を可能にした。
    • 共形校正により,オンラインVaR推定値の信頼性を担保し,カバレッジの有効性を理論的に証明した。
    • 数値実験の結果,提案手法が実践的であり,効果的であることが確認された。

    Link: https://arxiv.org/abs/2602.01912

  • 欠損データによるプライバシー増強 [stat.ML, cs.LG]目的:プライバシー増強のメカニズムとしての欠損データに関する分析
    • 医療や金融など,機密性の高い分野では,個人情報を保護しながらデータ分析が不可欠である。
    • 欠損データは,分析可能な情報量を減らし,モデルの性能を低下させる要因とされてきた。
    • 欠損データが,プライバシー保護の観点から見て,逆にプライバシーを強化する可能性を検証する。
    • 欠損データは,プライバシーを向上させるメカニズムとして機能することが示された。
    • 差分プライバシーの枠組みにおいて,不完全なデータがプライバシー増強をもたらすことが初めて証明された。
    • 従来の欠損データに対する認識を覆し,新たなプライバシー保護戦略の可能性を示す。

    Link: https://arxiv.org/abs/2602.01928

  • FluxNet:保存則と境界制約を満たす偏微分方程式サロゲートモデルのための容量制約型局所輸送演算子の学習 [cond-mat.mtrl-sci, cs.CE, cs.LG, physics.comp-ph]目的:偏微分方程式のデータ駆動シミュレーションのための保守的かつ境界制約を満たすサロゲートモデルの学習
    • 偏微分方程式は自然科学や工学の基礎であり,様々な現象のモデル化に不可欠である。
    • 従来のデータ駆動型シミュレーションでは,保存則や境界制約を厳密に満たすことが困難であった。
    • 離散速度輸送表現に着想を得て,保存則を満たす局所輸送演算子を学習することで,この問題を解決する。
    • FluxNetは,セル間の近傍交換を通じて状態を更新する局所輸送演算子を学習することで,離散的な保存則を構造的に保証する。
    • 浅水方程式と交通流の実験では,強力なベースラインと比較して,ロールアウトの安定性と物理的な整合性が向上した。
    • 相分離スピンダル分解においては,大規模な時間ステップと長距離輸送を可能にし,シミュレーションを高速化しながら微細構造の進化を保存した。

    Link: https://arxiv.org/abs/2602.01941

  • ヒルベルト空間における確率的補間 [stat.ML, cs.LG]目的:無限次元ヒルベルト空間における確率的補間の厳密な枠組み
    • 拡散モデルは関数値データに拡張されたが,確率的補間は有限次元に限定されてきた。
    • 無限次元空間での確率的補間の理論的基盤が確立されていなかった。
    • 任意の関数分布間の生成ブリッジを可能にし,科学的発見を促進すること。
    • 本研究は,無限次元ヒルベルト空間における確率的補間に関する理論的基盤を提供した。
    • 特に複雑なPDEベースのベンチマークにおいて,条件付き生成の有効性を示した。
    • 提案手法は,最先端の結果を達成し,汎用的な生成ツールとしての可能性を示した。

    Link: https://arxiv.org/abs/2602.01988

  • WADEPre:多重スケール学習を用いた極端降水予測のためのウェーブレット分解モデル [eess.SP, cs.HC, physics.ao-ph, cs.AI]目的:極端降水予測のためのウェーブレット分解モデル
    • 降水強度の分布は極端な値を示すため,正確な予測は困難である。
    • 従来の画素単位の損失関数最適化では,平均回帰バイアスが生じやすく,極端な値を正確に捉えられない。
    • ウェーブレット変換を用いて多重スケールで降水現象を捉え,予測精度向上を目指す。
    • WADEPreは,離散ウェーブレット変換を用いて,降水を近似成分と詳細成分に分解する。
    • 近似ネットワークは安定した低周波成分をモデル化し,詳細ネットワークは高周波成分を空間的に局所化して捉える。
    • SEVIRと上海レーダーデータセットを用いた実験で,WADEPreが最先端の性能を達成し,極端な閾値の捕捉と構造の忠実性を向上させることが示された。

    Link: https://arxiv.org/abs/2602.02096

  • パラメータ依存確率的動力学系に対する学習不要なスコアベース拡散 [stat.ML, cs.LG, cs.NA, math.NA]目的:パラメータ依存確率的微分方程式のシミュレーション手法
    • パラメータ変化に対するシミュレーションは計算コストが高く,効率的な手法が求められている。
    • 既存手法は学習コストが高いか,連続的なパラメータ依存性を扱えないという課題がある。
    • パラメータ空間と状態空間の両方において,効率的な補間を可能とする手法を開発する。
    • 提案手法は,離散的なパラメータ値でサンプリングされた軌跡データを用いて条件付きスコア関数を近似する。
    • 学習済みの生成モデルは,再学習なしに任意のパラメータ値でサンプル軌跡を生成できる。
    • 数値例を通して,パラメータ変化に対する条件付き分布の正確な近似が示された。

    Link: https://arxiv.org/abs/2602.02113

  • ガウス分布を超えた学習:高次統計を制御可能なデータモデルにおけるニューラルネットワークの学習力学 [stat.ML, cs.LG]目的:ニューラルネットワークの学習力学に関する研究
    • 機械学習において,データ分布は学習性能に大きく影響する。そのため,その理解は重要である。
    • 従来のデータモデルはガウス分布に依存し,高次統計を考慮した学習メカニズムが不明確であった。
    • 高次統計を制御可能なデータモデルを用いて,ニューラルネットワークの学習過程を解明することを試みる。
    • 学習実験の結果,ニューラルネットワークは平均や共分散といった低次統計から,徐々に高次キュムラントを学習していく様子が確認された。
    • 生成モデルをFashion-MNISTデータセットで事前学習し,生成されたサンプルを用いた実験でも同様の結果が得られ,データモデルの有用性が示された。
    • 本研究は,簡略化されたデータ仮定と現実的なデータ複雑性の間を取り持ち,機械学習における分布効果の研究に貢献する。

    Link: https://arxiv.org/abs/2602.02153

  • 3フレームRGBスキャンエンコーディングを用いたリアルタイム2D LiDAR物体検出 [eess.SP, cs.CV, cs.LG, cs.RO]目的:屋内サービスロボット向けリアルタイム2D LiDAR物体検出パイプライン
    • 屋内ロボットの自律的な動作には,周囲環境の正確な認識が不可欠である。
    • 従来のRGBカメラによる認識はプライバシー侵害のリスクがあり,計算コストも高い。
    • LiDARのみを用いて,軽量かつ高精度な物体検出を実現することで,これらの課題を解決する。
    • 提案手法は,3フレームのLiDARスキャンをRGBチャネルとしてエンコードすることで,コンパクトな入力画像を生成する。
    • Webots上での評価により,4つの物体クラスで98.4%のmAP@0.5(0.778 mAP@0.5:0.95)を達成した。
    • Raspberry Pi 5上でリアルタイム動作し,平均エンドツーエンドレイテンシは47.8msであった。

    Link: https://arxiv.org/abs/2602.02167

  • 確率測度のPCA:疎・密サンプリング領域 [stat.ML, cs.LG]目的:確率測度に対するPCAの収束レート
    • 確率的モデリングにおいて,データの多様性を捉え,次元削減を行う上で重要である。
    • 複数測度に対するPCAの収束レートに関する理論的保証が不足していた。
    • 測度数とサンプル数に応じた最適なサンプリング戦略を明らかにすること。
    • 測度数$n$と各測度あたりのサンプル数$m$に対し,$n^{-1/2} + m^{-\alpha}$の収束レートが導出された。
    • 疎サンプリング(小さい$m$)から密サンプリング(大きい$m$)への収束挙動の変化が示された。
    • 密領域における収束レートが,経験共分散誤差に対するミニマックス最適性を持つことが証明された。

    Link: https://arxiv.org/abs/2602.02190