arXiv雑要約

AI - 2026/05/15 公開

  • 交差型ランダム効果を持つ一般化混合効果モデルに対するスケーラブルなクルロフ部分空間法 [stat.ME, cs.LG, stat.ML]目的:交差型ランダム効果を持つ一般化混合効果モデルの計算効率化
    • 階層構造データや高次元カテゴリ変数を扱う混合効果モデルは,様々な分野で広く利用されている。
    • 高次元の交差型ランダム効果を持つ場合,既存のCholesky分解に基づく計算が非常に遅くなるという課題がある。
    • クルロフ部分空間法を用いて,混合効果モデルの計算ボトルネックを解消し,高速化と安定性の向上を目指す。
    • 提案手法は,Cholesky分解に基づく計算と比較して,最大10,000倍の高速化を実現した。
    • 事前条件付き確率的Lanczos求積法および共役勾配法の収束性と精度に関する新たな理論的結果が得られた。
    • 予測分散の計算に対するスケーラブルな手法を開発し,数値的な安定性も向上した。

    Link: https://arxiv.org/abs/2505.09552

  • 線形混合モデルにおけるスケーラブルな部分集合選択 [math.AT, cs.DM, math.CT, stat.ML, cs.LG, stat.CO, stat.ME]目的:線形混合モデルにおける部分集合選択
    • 個別化医療など,多様なデータを扱う上で線形混合モデルは不可欠である。
    • 既存手法は,予測変数の数が多くなると計算量が膨大になり,適用が困難である。
    • 数千の予測変数を持つデータセットでも高速に動作する部分集合選択手法を開発する。
    • 本研究では,新しい$\ell_0$正則化法を提案し,線形混合モデルにおけるスケーラブルな部分集合選択を可能にした。
    • 座標降下法と局所探索法を開発し,それぞれ収束性の保証と汎用性の向上を実現した。
    • シミュレーションデータと実データを用いた実験により,提案手法の優れた性能を実証した。

    Link: https://arxiv.org/abs/2506.20425

  • 状態空間システムによる確率的ダイナミクス学習 [math.CO, cs.CG, cs.DM, stat.ML, cs.LG, math.DS, math.ST, stat.TH]目的:貯留槽計算における記憶の減衰とエコー状態特性の理論的基盤
    • 時系列学習は,予測や制御など様々な分野で重要であり,高性能な学習手法が求められている。
    • 既存手法では,安定性や記憶の保持が厳密な条件に依存し,実用上の課題となっていた。
    • 厳密な収縮性条件なしに,貯留槽計算の経験的な成功を説明する理論的枠組みを構築すること。
    • 確定的な場合と確率的な場合の両方において,記憶の減衰と解の安定性が一般的に成立することが示された。
    • 確率的なケースでは,確率分布空間上でのアトラクタダイナミクスに基づいた新しい視点が提案された。
    • これにより,決定論的および確率的両方のレジームにおける時間データ生成モデリングの基盤が築かれた。

    Link: https://arxiv.org/abs/2508.07876

  • 不変性原理による因果グラフの識別可能性について [stat.ML, cs.LG]目的:因果グラフの識別可能性
    • 因果推論は,科学的発見や意思決定において重要であり,データから因果関係を導き出すことは不可欠である。
    • 観測データのみからは因果グラフを一意に決定することが一般的に難しいという問題がある。
    • 本研究は,少数の環境からのデータのみを用いて因果グラフを一意に識別する方法を確立することを目的とする。
    • 構造因果モデルの分布と,ノイズ統計が異なる少数の環境からのデータがあれば,因果グラフの一意な識別が可能となる。
    • これは,定数個の環境と非線形メカニズムを用いて因果グラフ全体を復元することを保証する初の成果である。
    • ノイズ項のガウス性が制約となるが,この要件を緩和する可能性も示唆されている。

    Link: https://arxiv.org/abs/2510.13583

  • 局所グラフ構造による多様体次元推定 [stat.ML, cs.LG, stat.AP]目的:多様体次元推定手法の開発
    • 機械学習やデータ解析において,データの内在する次元を把握することは重要である。
    • 従来の推定手法は,局所的な平坦性を仮定しており,曲率を持つ多様体に対しては課題があった。
    • 局所的なグラフ構造に着目し,曲率を考慮した新たな次元推定法の開発を目指す。
    • 提案手法であるQEとTLSは,合成データおよび実データにおいて,既存手法と遜色なく,場合によってはそれを上回る性能を示した。
    • 多様体の局所的なPCA座標に対する回帰によって,多様体の局所グラフ構造を捉えることを可能にした。
    • 曲率調整主成分分析(CA-PCA)の考え方に基づき,よりロバストな次元推定を実現した。

    Link: https://arxiv.org/abs/2510.15141

  • 生成ベイジアン最適化:生成モデルを探索関数として [stat.ML, cs.LG]目的:バッチベイジアン最適化のための候補解探索手法
    • 最適化問題は科学技術の多くの分野で不可欠であり,効率的な手法が求められている。
    • 従来のベイジアン最適化は,高次元や組み合わせ最適化問題において計算コストが高いという課題がある。
    • 生成モデルを活用することで,大規模バッチでの最適化や複雑な設計空間への対応を目指す。
    • 生成モデルをノイズの少ない報酬値で直接学習し,期待報酬に比例する提案分布を生成する。
    • この手法は,報酬に基づくフィードバックだけでなく,一般的な報酬信号や損失関数にも適用可能である。
    • 理論的に,特定の条件下で生成モデルが最適解に漸近的に近づくことが示された。

    Link: https://arxiv.org/abs/2510.25240

  • カーネル空間における凸クラスタリングのための新しいフレームワーク:有限サンプル境界,一貫性,およびパフォーマンスに関する洞察 [math.CO, cs.SC, math.AC, math.AG, stat.ML, cs.LG]目的:カーネル空間における凸クラスタリングのための新しいフレームワーク
    • クラスタリングは,データ内のパターン発見に不可欠であり,様々な分野で応用されている。
    • 従来の凸クラスタリングは,線形分離不可能なデータに対しては性能が低下する。
    • 複雑なデータ分布を持つデータに対するクラスタリング性能の向上を目指す。
    • 提案手法では,データをカーネル空間に射影することで,非線形・非凸なデータ構造への対応を可能にした。
    • 理論的な解析により,アルゴリズムの収束性と有限サンプル境界が証明された。
    • 合成データおよび実データでの実験により,最先端のクラスタリング手法と比較して優れた性能が示された。

    Link: https://arxiv.org/abs/2511.05159

  • 圧力依存性速度則学習のためのKolmogorov-Arnold化学反応ニューラルネットワーク [physics.chem-ph, cs.LG]目的:圧力依存性速度則の学習
    • 化学反応機構の理解と予測は,燃焼や化学プロセスの最適化に不可欠である。
    • 従来のCRNNでは,圧力依存性や混合効果を表現できず,近似的な手法に頼らざるを得ない。
    • KA-CRNNは,データから直接圧力効果を推定し,より正確な速度則を学習することを目指す。
    • KA-CRNNは,第三体濃度を考慮したKolmogorov-Arnold活性化関数を用いることで,従来のCRNNの解釈性と物理的制約を維持しつつ,圧力依存性を表現可能にした。
    • 2つの検証研究において,KA-CRNNは,温度,圧力,混合ガス組成の範囲で,圧力依存性および衝突効果を正確に再現し,既存の補間手法を凌駕した。
    • 本フレームワークは,複雑な反応システムにおける拡張された反応挙動のデータ駆動型発見のための基盤を確立し,物理制約に基づいた化学モデル推論を促進する。

    Link: https://arxiv.org/abs/2511.07686

  • 非圧縮性流体の物理・等式制約に基づくニューラルネットワークによる教師なしシミュレーション [physics.flu-dyn, cs.LG]目的:非圧縮性流体の数値シミュレーション手法の開発
    • 流体シミュレーションは,工学や気象予測など広範な分野で不可欠な技術である。
    • 従来の数値シミュレーション手法は計算コストが高く,複雑な形状への適用が難しい場合がある。
    • 教師なし学習による効率的な流体シミュレーション手法を確立し,計算コストの削減を目指す。
    • 物理情報ニューラルネットワーク(PINN)の性能限界を克服するため,物理・等式制約ニューラルネットワーク(PECANN)フレームワークを導入した。
    • 圧力ポアソン方程式に基づく目的関数と,条件適応型拡張ラグランジュ法(CA-ALM)を用いることで,厳密な制約条件の充足を実現した。
    • ラベル付きデータや教師あり事前学習なしで,リッド駆動キャビティ流,ベルトラミ流,円柱周りの流れなどのシミュレーションに成功し,自発的な渦放出も捉えた。

    Link: https://arxiv.org/abs/2511.18820

  • 量子エントロピー推定のための量子ニューラルネットワーク性能保証 [quant-ph, cs.IT, cs.LG, math.IT]目的:量子エントロピーおよびダイバージェンスの推定における量子ニューラル推定器(QNE)の性能保証
    • 量子物理学,情報理論,機械学習において,量子エントロピーの正確な推定は不可欠である。
    • 従来のQNEの性能は,ハイパーパラメータの調整に大きく依存し,その最適化が困難であった。
    • QNEの誤差リスクの上限を導出し,ハイパーパラメータ調整の指針を提供することを目指す。
    • 提案手法により,次元$d$,精度$\epsilon$に対するQNEのコピー複雑度が$O(|\Theta(\mathcal{U})|d/\epsilon^2)$であることが示された。
    • 密度演算子が置換不変である場合,次元依存性を$O(|\Theta(\mathcal{U})|\mathrm{polylog}(d)/\epsilon^2)$まで改善できる。
    • 本研究は,QNEの実用的な実装を促進し,ハイパーパラメータチューニングを効率化する。

    Link: https://arxiv.org/abs/2511.19289

  • Spheresデータセット:音楽ソース分離と情報検索のための多トラックオーケストラ録音 [eess.AS, cs.LG, cs.SD]目的:音楽ソース分離と関連する音楽情報検索タスクにおける機械学習研究の進展
    • オーケストラ音楽は複雑な音響構造を持ち,自動処理技術の進歩が求められている。
    • 既存のデータセットでは,オーケストラ演奏の多角的・高精度な録音データが不足していた。
    • オーケストラ音楽における楽器分離や空間音響処理のためのベンチマークデータセットを提供する。
    • Spheresデータセットは,コブリ・アンサンブルによるオーケストラ録音約1時間以上で構成される。
    • 23個のマイクを用いて録音し,楽器間のブリーディングを制御したリアルなステレオミックスと分離ステムを提供。
    • 各楽器の位置におけるルームインパルス応答も推定され,録音空間の音響特性に関する情報も提供する。

    Link: https://arxiv.org/abs/2511.21247

  • フローマッチングサンプラーの隠れたバイアスについて [stat.ML, cs.LG, math.PR]目的:フローマッチングサンプラーにおける有限サンプルプラグイン推定のバイアス
    • 生成モデルの性能向上は,様々な応用分野において重要な課題である。
    • フローマッチングはサンプルサイズが限られている場合,バイアスが生じやすい。
    • 有限サンプル環境下におけるフローマッチングのバイアスを明らかにし,改善策を探る。
    • ターゲット分布を有限サンプルで近似すると,統計的なターゲットが変化する。
    • 経験的最小化解は,各条件付きフローが勾配場であっても,一般的に勾配場ではない。
    • 基底分布のテール形状が,運動エネルギーの上限に影響を与えることが示された。

    Link: https://arxiv.org/abs/2512.16768

  • NeuroMambaLLM:MambaとLLM推論を用いた自閉症脳のfMRI機能的結合の動的グラフ学習 [math.AG, cs.SC, eess.IV, cs.LG]目的:自閉症脳におけるfMRI機能的結合の動的グラフ学習
    • 脳機能解明は,精神疾患の病態理解や新たな治療法の開発に不可欠である。
    • 従来のfMRI分析では,静的な機能的結合に焦点を当て,時間的な脳活動の変動を捉えきれていない。
    • 動的な脳活動と高次な推論能力を統合し,自閉症の診断と病態理解に貢献すること。
    • 提案手法NeuroMambaLLMは,生のBOLD信号から動的に機能的結合を学習し,ノイズを除去し,長距離の依存関係を捉える。
    • 学習された動的な脳表現をLLMに投影し,少量パラメータの適応モジュール(LoRA)で効率的にLLMを調整する。
    • LLMは,診断分類と言語ベースの推論を行い,臨床的に意味のあるテキストレポートを生成可能となった。

    Link: https://arxiv.org/abs/2602.13770

  • ニューラルネットワークを用いた形状汎関数の範囲の数値的探求 [math.OC, cs.AI]目的:ブラシュケ・サンタロー図の探求に関する数値的枠組み
    • 形状解析は,幾何学や物理学における多様な問題に応用されており,その重要性は高い。
    • 形状汎関数の関係性を網羅的に理解することは困難であり,効率的な探索手法が求められていた。
    • ニューラルネットワークと相互作用粒子系を用いることで,形状汎関数の関係性を効率的に探求すること。
    • 本研究で開発された数値的枠組みは,ブラシュケ・サンタロー図を効率的に探索することが可能となった。
    • ゲージ関数に基づいたニューラルネットワークを用いることで,凸集合の凸性を維持した形状最適化が実現した。
    • 体積,周長,慣性モーメントなど,幾何学的な汎関数と偏微分方程式型の汎関数に対して有効性が確認された。

    Link: https://arxiv.org/abs/2602.14881

  • 重い裾を持つ分布に対するスコアベース生成モデルの一般化 [stat.ML, cs.LG]目的:重い裾を持つ分布へのスコアベース生成モデルの適用可能性向上
    • 生成モデルは多様なデータ分布に対応可能であり,その応用範囲は広い。
    • 重い裾を持つ分布に対する生成モデルは,生成品質や理論的根拠に課題があった。
    • 重い裾を持つ分布に対する理論的保証のある生成モデルを構築すること。
    • 早期停止と適切な初期化により,拡散モデルを任意の分布に拡張できることを理論的に示した。
    • 正規化フローを用いた生成について,穏やかな条件下で収束が保証されることを示した。
    • 正規化フローによる裾部の捕捉とSGMによる詳細な構造の復元を組み合わせた生成フレームワークを提案した。

    Link: https://arxiv.org/abs/2603.00772

  • 複雑な正規化フローは,ほぼ情報 Kähler-Ricci フローとなりうる [math.DG, cs.LG]目的:複雑な正規化フローと非線形なKähler-Ricciフロー間の関連性
    • 複雑多様体上の確率的モデリングは,データ解析において重要な役割を果たす。
    • 複雑な正規化フローの理論的基盤が十分に確立されていない。
    • 統計的挙動と幾何学的特徴を結びつけることで,理解を深める。
    • 複雑な正規化フローにおける対数行列式が,微分と条件下で Ricci 曲率項と一致することが示された。
    • 正規化フロー下の対数密度が,拡張された Jacobian とベイズ的視点の下で空間 Fisher 情報計量と関連付けられた。
    • この枠組みを通して,統計的挙動と幾何学的特徴の繋がりが示唆され,Kähler-Ricciフローの変分を復元できる。

    Link: https://arxiv.org/abs/2604.17954

  • 物理情報ニューラルネットワークを用いたベイズPDE制約逆問題における関数事前分布に基づくアプローチ [q-fin.TR, cs.CY, q-fin.GN, physics.geo-ph, cs.LG, physics.comp-ph, stat.ML]目的:物理情報ニューラルネットワークにおけるベイズ逆問題への関数事前分布の導入
    • PDE制約逆問題は科学技術の様々な分野で重要であり,高精度な解法が求められている。
    • 従来のベイズ的逆問題では,事前分布がニューラルネットワークの重み空間で定義され,物理的な解釈が困難であった。
    • 物理的に意味のある事前知識を関数空間で表現し,ベイズ的逆問題に組み込むことを目指す。
    • 提案手法であるfpBPINNとfParVI-PINNは,それぞれ事後分布を高精度に推定することが示された。
    • FPI-BPINNは柔軟性,fParVI-PINNは精度において異なる利点を持つことが明らかになった。
    • 関数事前分布を導入することで,物理的に解釈可能なベイズ的逆問題の解法が実現可能となった。

    Link: https://arxiv.org/abs/2605.07060