arXiv雑要約

AI - 2026/01/30 公開

  • 自由エネルギー最小化からのニューラルポリシー構成 [math.OC, cs.AI, cs.SY, eess.SY, nlin.AO]目的:獲得した技能の構成による行動計画と実行
    • 自然な知能の重要な特徴であり,ロボット工学やAIにおける自律的な行動開発に不可欠である。
    • タスク構造がゲーティングにどのように影響するか,またそれがニューラル回路でどのように実現されるかの原理的な説明が不足している。
    • タスク目標,動的計算,回路レベルのメカニズムを結びつける統一的なフレームワークを提供し,ゲーティングのメカニズムを解明する。
    • GateModは,タスクの構造とゲーティングの創発を理論的に結びつけた解釈可能なモデルであり,様々な設定で既存モデルを上回る性能を示した。
    • 自由エネルギーの最小化という規範的な枠組みGateFrameと,それに収束する連続時間ダイナミクスGateFlowを導出した。
    • GateFlowから,既知の樹状突起やニューラル処理モチーフと一致するソフト競争的な再帰回路GateNetを構築した。

    Link: https://arxiv.org/abs/2512.04745

  • 拡散微分リサンプリング [stat.ML, cs.LG, math.ST, stat.TH]目的:逐次モンテカルロ法における微分可能なリサンプリング手法
    • 状態空間モデルのベイズ推定は,ロボティクスや金融など広範な分野で重要である。
    • 逐次モンテカルロ法は計算コストが高く,微分可能性が課題となっていた。
    • アンサンブルスコア拡散モデルに基づく,微分可能なリサンプリング手法を提案する。
    • 提案手法は一貫したリサンプリング分布を理論的に保証する。
    • 複数のフィルタリングおよびパラメータ推定ベンチマークで,既存の微分可能リサンプリング手法を上回る性能を示す。
    • 高次元画像観測を用いた複雑なダイナミクス・デコーダモデルの学習においても,競争力のある性能を達成する。

    Link: https://arxiv.org/abs/2512.10401

  • シミュレーションベース推論における拡散モデル:チュートリアルレビュー [stat.ML, cs.LG, stat.ME]目的:シミュレーションベース推論のための拡散モデルに関する最近の研究動向
    • 複雑なモデルのパラメータ推定は科学的発見に不可欠であり,その効率化が求められている。
    • 従来の推論手法は計算コストが高く,高次元パラメータ空間での適用が困難な場合がある。
    • 拡散モデルを活用し,シミュレーションベース推論の効率と精度を向上させる方法をまとめる。
    • 拡散モデルは,シミュレーションデータと実データから潜在パラメータを高速かつ正確に推定できる強力な手法として注目されている。
    • ガイダンス,スコア合成,フローマッチング,整合性モデル,同時モデリングなどの概念が,新たな可能性を創出している。
    • ノイズスケジュール,パラメータ化,サンプラーが,効率と統計的精度に影響を与えることが示された。

    Link: https://arxiv.org/abs/2512.20685

  • マウスから電車まで:グラフデータに対する償却ベイズ推論 [quant-ph, cs.DC, stat.ML, cs.LG]目的:グラフデータに対するベイズ推論手法
    • 生物学,社会ネットワーク,交通など広範な分野でグラフ構造データが活用されており,その分析が不可欠である。
    • グラフデータの特性上,置換不変性,スケーラビリティ,長距離依存性の捕捉が難しく,パラメータ推定が困難である。
    • 生成ニューラルネットワークを用いた償却ベイズ推論をグラフデータに適用し,効率的なパラメータ推論を実現すること。
    • 提案手法は,ノード,エッジ,グラフレベルのパラメータ推論を可能にする。
    • 合成データおよび生物学,物流の現実世界のデータセットにおいて,高い復元性と較正性を示すことが確認された。
    • 様々なニューラルネットワークアーキテクチャを評価し,グラフエンコーダとニューラル事後推定器の組み合わせが有効であることを示した。

    Link: https://arxiv.org/abs/2601.02241

  • PFT:機械学習型原子間ポテンシャルにおけるフォノン微調整 [cond-mat.mtrl-sci, cs.LG]目的:機械学習型原子間ポテンシャルにおけるフォノンの精度向上
    • 材料物性予測において,高次のポテンシャルエネルギー面微分が重要である。
    • 標準的な損失関数によるMLIPでは,曲率誤差が生じ,振動特性予測が劣化する。
    • MLIPのエネルギーヘッセ行列とDFT計算によるフォノン計算から得られる力定数を一致させ,曲率誤差を低減する。
    • PFTは,MDR Phononベンチマークにおいて,Nequix MPのフォノンの熱力学特性の平均精度を55%向上させた。
    • Materials Projectのデータで学習したモデルの中で,最高水準の精度を達成した。
    • PFTは,第二階微分だけでなく,第三階微分を含む熱伝導率予測の精度向上にも貢献する。

    Link: https://arxiv.org/abs/2601.07742

  • 非定常確率的最適化におけるモーメンタムSGDの証明可能な劣最適性について [eess.AS, cs.MM, cs.RO, stat.ML, cs.LG, math.OC]目的:非定常確率的最適化におけるSGDおよびそのモーメンタム変種(Polyak Heavy-BallおよびNesterov)の追跡性能
    • 機械学習の応用拡大に伴い,時間とともに変化する最適解を追跡するアルゴリズムの重要性が増している。
    • モーメンタム法は高速化に有効だが,分布の変化に対して不安定になる場合があることが知られている。
    • モーメンタム法が劣る状況を理論的に解明し,SGDの優位性を示すことを目指す。
    • 本研究では,追跡誤差を一時的,ノイズ,ドリフトの影響に分解し,モーメンタムパラメータが1に近づくにつれてドリフトが増幅されることを示した。
    • ミニマックス下界を用いて,モーメンタムによる追跡遅延が情報理論的な限界であることを証明した。
    • 動的な環境下で,モーメンタム法の不安定性の原因を理論的に明らかにし,SGDが優位となる条件を特定した。

    Link: https://arxiv.org/abs/2601.12238

  • 定常拡散の効率的な学習:シュタイン型不一致を用いた手法 [stat.ML, cs.LG, math.ST, stat.TH]目的:定常拡散のパラメータ推定
    • 確率過程のモデリングは,物理現象やデータ生成過程の理解に不可欠である。
    • 拡散モデルの学習において,定常性を保証しつつ効率的な学習を行うことは課題である。
    • シュタイン型不一致を利用し,計算コストを削減しつつ定常拡散学習の精度向上を目指す。
    • 提案手法であるSKDSは,KDSと同等の精度を達成しつつ計算コストを大幅に削減できることが示された。
    • SKDSは,幅広いパラメータ化において凸性を持ち,実用的な近似版は高い確率で準凸性を示す。
    • 学習された拡散モデルの定常分布が,目標分布と一致することが理論的に保証されている。

    Link: https://arxiv.org/abs/2601.16597

  • 微分可能な整数線形計画法は微分可能ではない:単なる技術的問題ではない [math.OC, cs.LG]目的:微分可能な整数線形計画法の誤りに関する検証
    • 最適化問題解決において,整数線形計画法は重要な役割を担う。
    • 既存手法では,微分可能性の検証が不十分な場合がある。
    • Gengらの論文における誤りを指摘し,その影響を明らかにする。
    • Gengらの論文で示された定理5における微分可能性の主張が誤りであることが示された。
    • この誤りは,期待値レベルでの連続性とは異なり,確率的勾配降下法においてサロゲート損失がほとんど全ての実現において不連続であることに起因する。
    • この誤りは,後続の研究にも受け継がれている可能性がある。

    Link: https://arxiv.org/abs/2601.17800

  • 非凸最適化のためのMuonオプティマイザの収束率改善 [quant-ph, cs.DC, math.OC, cs.LG]目的:非凸最適化におけるMuonオプティマイザの収束率向上
    • 機械学習の発展に伴い,非凸最適化問題の効率的な解法が不可欠となっている。
    • 既存のMuonオプティマイザの収束性保証は限定的であり,実用的な設定をカバーできていない。
    • より広範な問題設定下で,Muonオプティマイザの収束性を理論的に保証すること。
    • 本研究では,Muonオプティマイザの収束率に関するより厳密な保証を確立した。
    • 既存の結果と比較して,より速い収束率を達成し,より広い範囲の問題設定を扱えることを示した。
    • これらの知見は,Muonオプティマイザのより正確な理論的特性評価に貢献し,他の直交化された一階最適化手法にも応用可能である。

    Link: https://arxiv.org/abs/2601.19400

  • MK-SGC-SC:非教師型話者分離のためのスペクトルクラスタリングにおける多重カーネル誘導疎グラフ構築 [eess.AS, cs.LG, cs.SD]目的:非教師型話者分離のための,多重カーネル誘導疎グラフ構築手法
    • 音声処理分野において,話者分離は音声データの利用価値を高める上で重要である。
    • 非教師型話者分離は,事前学習データが不要である一方,精度向上が困難である。
    • 話者埋め込み間の多重カーネル類似度に基づき,疎グラフを構築することで,分離精度を向上させる。
    • 提案手法は,DIHARD-III,AMI,VoxConverseコーパスにおいて,非教師型話者分離で最先端の性能を達成した。
    • 複数の多項式カーネルと1次の逆コサインカーネルを用いることで,話者埋め込み間の類似度を効率的に計測する。
    • 疎グラフ構築により,局所的な類似性を強調し,より正確な話者クラスタリングを実現する。

    Link: https://arxiv.org/abs/2601.19946

  • 統計的保証を用いたLLM性能の効率的な評価 [stat.ML, cs.LG]目的:LLM性能評価における効率化手法
    • LLMの急速な発展に伴い,その性能評価の重要性が増している。
    • LLMの網羅的な評価は計算コストが高く,現実的な制約がある。
    • 限られた評価予算内で,信頼性の高い性能指標を得ることを目指す。
    • 提案手法FAQは,過去の情報を活用し,効率的な質問選択を行うことで,サンプルサイズを最大5倍に向上させる。
    • FAQは,既存手法と同等の信頼区間幅を,より少ない質問数で実現可能である。
    • 本研究で利用したソースコードとデータセットは公開されており,再現性と今後の研究を支援する。

    Link: https://arxiv.org/abs/2601.20251

  • 重尾雑音下における確率的サブ空間正規化確率的勾配降下法の収束解析 [math.OC, cs.LG, stat.ML]目的:重尾雑音下における確率的サブ空間正規化確率的勾配降下法の収束性
    • 機械学習の発展に伴い,大規模データに対する最適化手法の効率性が重要視されている。
    • 非凸最適化問題において,確率的サブ空間法の高確率収束性の解析は未解決の課題であった。
    • 重尾雑音に対するロバストな確率的サブ空間正規化法を提案し,収束性を保証すること。
    • 確率的サブ空間SGDは,サブガウス雑音下で高確率収束境界を持つことが示された。
    • 提案手法である確率的サブ空間正規化SGDは,重尾雑音に対しても期待値と高確率の両方で収束性が保証された。
    • 確率的サブ空間正規化SGDは,全次元正規化SGDよりも優れたオラクル複雑度を達成できることが示された。

    Link: https://arxiv.org/abs/2601.20399

  • 効率的な学習画像圧縮のための二階微分曲率の活用:理論と実証的証拠 [eess.IV, cs.LG]目的:学習画像圧縮モデルの効率性と性能向上
    • 画像圧縮は,データ伝送と保存において不可欠であり,その効率化は重要である。
    • 従来の最適化手法では,レートと歪みのトレードオフによる勾配の競合が発生し,収束が遅い。
    • 二階微分を用いた最適化により,勾配の競合を解消し,より安定した収束を目指す。
    • SOAPと呼ばれる二階微分準ニュートン最適化手法を用いることで,学習効率と最終的な性能が大幅に向上した。
    • ニュートン事前条件付けにより,R-D目的関数に固有のステップ内およびステップ間の更新競合が本質的に解決されることが示された。
    • 二階微分で学習されたモデルは,活性化や潜在変数の外れ値が少なく,量子化後のロバスト性が向上する。

    Link: https://arxiv.org/abs/2601.20769