arXiv雑要約

AI - 2026/05/12 公開

  • 平均場スタイン変分勾配流の定量的局所収束 [stat.ML, cs.LG, math.AP, math.OC]目的:スタイン変分勾配降下法における終点イテレーションの定量的局所収束
    • 確率モデルのサンプリングは,機械学習や統計物理において基本的な課題である。
    • SVGDの収束速度は未解明であり,効率的なサンプリングのボトルネックとなっていた。
    • 特定条件下におけるSVGDの収束率を理論的に導出し,その妥当性を検証すること。
    • リース型カーネルを用いる条件下で,初期密度と目標分布の$L^2$ノルムに基づく明示的な多項式収束率が得られた。
    • 導出された収束率は特定の条件下で鋭く,次元やカーネルの正則性パラメータに依存することが示された。
    • クーロン特異点を持つカーネルの場合,既存の研究で確立された大域的指数収束結果も再現された。

    Link: https://arxiv.org/abs/2605.09456

  • GNNベースの分子動力学シミュレータにおける構造のみからの初期化と分布外汎化の実現 [physics.chem-ph, cs.LG, physics.comp-ph]目的:GNNベースの分子動力学シミュレータにおける構造のみからの初期化と分布外汎化
    • 複雑な系の動力学を効率的にモデル化する機械学習シミュレータの重要性が高まっている。
    • 従来のGNNシミュレータは時間的文脈に依存するため,単一の静的構成からの初期化が困難である。
    • 本研究は,分布外の構造に対しても安定かつ正確な初期化を可能にすることを目的とする。
    • 物理ベースの最適化フレームワークにより,推論時に物理的な整合性を維持し,分布外汎化性能を向上させた。
    • 微分可能なGNNベースのバロスタットを導入し,系の寸法と圧力を正確に追跡することで,OOD汎化を支援した。
    • これらの手法を組み合わせることで,ロールアウトの安定性を大幅に改善し,信頼性の高い分布外汎化を実現した。

    Link: https://arxiv.org/abs/2605.09495

  • 経験ベイズ1ビット行列補完 [stat.ML, cs.LG, stat.ME]目的:1ビット行列補完における予測精度向上
    • 推薦システム等に応用され,欠損値予測の重要性が増している。
    • 既存手法では,予測精度と信頼性の両立が課題となっていた。
    • 経験ベイズ法により,精度・信頼性・計算効率の改善を目指す。
    • 提案手法は,Efron-Morris推定量に着想を得て,特異値をゼロへ収縮させる。
    • シミュレーションと実データ分析により,既存手法を上回る性能が確認された。
    • 予測精度,信頼性,計算効率のバランスが優れていることが示された。

    Link: https://arxiv.org/abs/2605.09509

  • ミューオンの位相:ミューオンがSignSGDを覆うとき [math.OC, cs.SY, eess.SY, math.OC, cs.LG, stat.ML]目的:大規模な確率的最適化手法であるミューオンとその関連スペクトルオプティマイザの学習挙動の解明
    • 深層学習の高速化・大規模化において,確率的勾配降下法(SGD)の改良が重要視されている。
    • Adamなどの既存手法は,学習率の調整が難しく,汎化性能が低い場合がある。
    • ミューオンとSignSGDの学習挙動の違いを明らかにすることで,より適切な最適化手法の選択を支援する。
    • SignSVDは,大規模バッチサイズにおいてデータ共分散スペクトルに関する平方根事前条件付けを行うことが示された。
    • SignSGDは,一般的な共分散に対して事前条件付けを行わず,学習率や収束特性に違いが生じることが明らかになった。
    • 共分散のべき乗則モデルにおいて,SignSGDとSignSVDの性能がトレードオフとなる3つの位相が確認された。

    Link: https://arxiv.org/abs/2605.09552

  • 都市補正拡散モデル [stat.ML, cs.LG, stat.CO]目的:スコアベース拡散モデルにおけるサンプリングバイアスの低減
    • 拡散モデルは画像生成等の分野で注目されており,高品質なサンプル生成が求められている。
    • 従来の拡散モデルのサンプリング法は,時間離散化やスコア関数の近似によりバイアスが生じやすい。
    • 本研究では,メトロポリス・ヘイスティングス法を用いた補正により,サンプリング精度を向上させる。
    • 提案手法は,2つのコインベルヌーイ工場アルゴリズムに基づき,拡散モデルにおけるLangevin補正を正確に調整する。
    • シンプソンの法則に基づく効率的な近似法も提案し,ステップサイズに関して5/2の精度を達成した。
    • 合成データセットと画像データセットの両方において,サンプル品質が向上し,FIDスコアが改善された。

    Link: https://arxiv.org/abs/2605.09654

  • 実校正された合成優先データエンジン [eess.IV, cs.CV, cs.GR, cs.LG]目的:データ不足領域におけるコンピュータビジョンシステムの性能向上
    • データ収集が困難な分野で,高品質な学習データの確保が重要となっている。
    • 合成データによる拡張は,データセット全体の品質とフィードバック不足により不安定になりがちである。
    • 実データと合成データの組み合わせによるデータ拡張の信頼性を高めることを目指す。
    • 合成データを,少量の人的アノテーションコストで実データ拡張に利用することで,性能向上が確認された。
    • 合成データのみでの学習は,実データのみでの学習に比べて大幅に性能が劣るという結果が出た。
    • セグメンテーション診断においても,同様のドメインギャップのパターンが確認された。

    Link: https://arxiv.org/abs/2605.09699

  • 正規化フローによる確率的多規模モデルの学習 [stat.ME, cs.CL, stat.ML, cs.LG, math.PR, math.ST, stat.TH]目的:確率的多規模モデルの学習手法
    • 物理,工学,生物学等多くの分野で多規模確率的ダイナミクスが重要視される。
    • 高速過程が観測できない状況下での統計的学習が困難である。
    • 観測された低次元の遅変数の軌跡から有効な確率的ダイナミクスを学習すること。
    • 本研究では,正規化フローを用いて高速過程の不変分布をパラメータ化する新しい学習フレームワークを提案した。
    • 確率的平均化によるモデル次数削減を行い,遅変数の軌跡のみから多規模確率的SDEを学習する。
    • ベイズ変分推論により,モデルパラメータの不確実性を定量化するためのスケーラブルな手法を開発した。

    Link: https://arxiv.org/abs/2605.09718

  • TD3B:アロステリック結合体生成のための遷移指向離散拡散 [econ.TH, cs.SI, q-bio.BM, cs.LG]目的:アロステリック結合体の設計
    • タンパク質機能は配位子によって制御され,医薬品開発において重要である。
    • 既存の構造ベース設計法は動的な効果やアゴニスト/アンタゴニストの区別が困難である。
    • アゴニストまたはアンタゴニストとしての活性を持つ結合体を設計すること。
    • TD3Bは,方向性制御目的を通して,指定されたアゴニストまたはアンタゴニスト特性を持つ結合体を生成する。
    • ターゲットを意識したDirection Oracleとソフトバインディング親和性ゲートを組み合わせることで,結合親和性に依存せず,アゴニストとアンタゴニストを生成する。
    • 既存手法と比較して,よりターゲットを絞ったアゴニスト・アンタゴニスト生成が可能であることが示された。

    Link: https://arxiv.org/abs/2605.09810

  • 信頼性の高いAIによる事前分布を用いたベイズ推論の高速化 [physics.soc-ph, cs.SY, eess.SY, stat.ML, cs.LG]目的:AIによって生成された事前分布の信頼性向上
    • データ不足の状況下で,統計的推論に役立つ事前情報として,予測システムの信念を活用することの重要性
    • 予測モデルに由来する事前分布は,誤りを事後分布に伝播させるリスクを伴う
    • 予測モデルによって生成された法則を修正することで,AI由来の誤りの伝播を軽減し,信頼性の高い事前分布を構築すること
    • 提案手法は,AIによって生成されたデータの法則を修正し,事前分布の信頼性を向上させる。
    • 修正されたAI事前分布は,従来の事前分布と比較して,バイアスを大幅に低減し,信用区間のカバレッジを改善する。
    • 皮膚疾患の分類タスクへの適用により,予測性能の向上が確認された。

    Link: https://arxiv.org/abs/2605.09834

  • 弱教師あり多校正のための統一的アプローチ [stat.ML, cs.LG]目的:弱教師あり学習における多校正誤差の推定と,その校正手法
    • 機械学習モデルの信頼性を高めるため,予測確率の正確な校正が重要である。
    • 弱教師あり学習では,正確なラベルが不足するため,多校正の評価と改善が困難である。
    • 弱教師あり環境下で,多校正誤差を推定し,モデルの信頼性を向上させることを目指す。
    • 汚染行列リスク書き換えと証人ベースの校正制約を組み合わせることで,弱教師あり学習における多校正を推定・修正する統一的フレームワークを提案した。
    • 弱教師あり学習用の汎用的な後処理再校正アルゴリズムである弱ラベル多校正ブースト(WLMC)を新たに提案した。
    • 複数の弱教師あり学習設定で実験を行い,多校正の挙動を評価し,弱教師あり学習における不確実性推定に関する知見を得た。

    Link: https://arxiv.org/abs/2605.09857

  • 機械的解釈可能性によるジェットタグ識別器の解剖 [quant-ph, cs.CC, hep-ph, cs.LG, hep-ex]目的:ジェット識別における計算回路の特定とその内部表現の物理的意味の解明
    • 高エネルギー物理学において,ジェットはクォークやグルーオンの生成物であり,その識別は重要な課題である。
    • 深層学習モデルは高性能だが,その内部動作は不透明であり,物理的な解釈が困難である。
    • ジェット識別器の内部表現を理解し,物理法則との関連性を明らかにすること。
    • 粒子トランスフォーマーアーキテクチャにおいて,6つのヘッドを持つスパースな回路が,モデル性能の大部分を回復することを確認した。
    • この回路は,ソース・リレー・読み出しという明確な構造を持ち,特定のジェット構造を効率的に識別している。
    • 残留ストリームがエネルギー相関子基底と優先的に整合しており,特に2-prongのサブ構造を強くエンコードしていることが明らかになった。

    Link: https://arxiv.org/abs/2605.09881

  • 観測可能なWasserstein距離 [eess.IV, cs.MM, math.MG, cs.LG]目的:Wasserstein距離の下限の導出
    • 大規模データにおける距離計算は,機械学習や統計解析において不可欠である。
    • 従来のWasserstein距離の計算は,高次元・非ユークリッド空間では計算量が膨大になる。
    • 計算効率を保ちつつ,Wasserstein距離を近似的に評価する手法を開発する。
    • 1-Lipschitz観測可能関数を用いて確率測度を実数線に射影し,そのWasserstein距離を計算する枠組みを提案した。
    • 観測可能関数を制限する階層構造を定義し,距離空間におけるCramér-Woldデバイスに対応する理論的結果を得た。
    • この階層構造は,Wasserstein距離の下限の精度と計算効率のトレードオフを調整可能にする。

    Link: https://arxiv.org/abs/2605.09916

  • 総変分正則化がニューラルELDと古典的手法間のギャップを埋める - 地震波走時トモグラフィ [physics.geo-ph, cs.LG, cs.NA, math.NA]目的:地震波走時トモグラフィにおける速度構造復元
    • 地下構造探査において,正確な速度モデルの構築は,資源探査や地震ハザード評価に不可欠である。
    • 従来の走時トモグラフィでは,メッシュ解像度と安定性のトレードオフが存在し,適切な正則化項の選択が難しい。
    • 本研究は,ニューラルネットワークと総変分正則化を組み合わせることで,古典的手法を凌駕する精度での速度構造復元を目指す。
    • MIMIR-TGV$^2$は,ガウスモデルにおいて古典的なFMM-LSMRベースラインと同等の性能を示し,層状モデルと断層モデルでは有意に優れた性能を発揮した。
    • TV正則化をTGV$^2$に置き換えることで性能が低下し,スケジュール調整のみではTVの階段状バイアスを解消できないことが示された。
    • 物理情報に基づいたニューラルネットワーク反転において,ネットワークアーキテクチャよりも正則化項の選択が重要であることが示唆された。

    Link: https://arxiv.org/abs/2605.09960

  • Yeti:タンパク質構造の再構成とマルチモーダル生成のためのコンパクトな構造トークナイザー [q-bio.BM, cs.AI]目的:タンパク質構造の離散表現
    • タンパク質の配列,構造,機能注釈を統合的に扱うマルチモーダルモデルは,創薬などに貢献が期待されている。
    • 既存のトークナイザーは再構成能力を優先しており,生成能力が十分ではない。
    • Yetiは,マルチモーダル学習のためのコンパクトで表現力豊かな構造トークナイザーを目指している。
    • Yetiは,既存モデルと比較して,コードブックの利用率とトークンの多様性が高く,再構成精度も優れている。
    • Yetiを用いてゼロからマルチモーダルモデルを訓練した結果,タンパク質配列と構造の同時生成において,より大規模なモデルに匹敵する性能を示した。
    • Yetiは,マルチモーダルモデルの訓練に適したコンパクトかつ表現力豊かなタンパク質構造トークナイザーであることが示された。

    Link: https://arxiv.org/abs/2605.09981

  • 帯域幅制限下における連合学習言語モデル:蒸留率と適合性保証 [stat.ML, cs.CL, cs.LG]目的:帯域幅制限下における言語モデルの連合学習における統計的保証の評価
    • 臨床ネットワーク等,分散データ環境での言語モデル利用が重要視されている。
    • 既存研究では,帯域幅を統計的パラメータとして考慮したものが少ない。
    • 帯域幅制限下で実現可能な統計的保証の上限を理論的に解明することを目指す。
    • Federated Probe-Logit Distillation (FPLD) のKL一致率が,ノード数,サンプルサイズ,量子化予算などに依存して明確に算出された。
    • Federated Conformal RAG (FC-RAG) において,ノードごとの検索帯域幅が統計的パラメータとして組み込まれた分布フリーなマージナルカバレッジ境界が得られた。
    • 理論的枠組みと合成実験により,帯域幅と精度のトレードオフが実言語モデルでも確認された。

    Link: https://arxiv.org/abs/2605.09986

  • ウォーターシュタイン射影による分布からの差分プライバシーサンプリング [stat.ML, cs.CR, cs.LG]目的:差分プライバシー制約下での分布からのサンプリング
    • データ分析におけるプライバシー保護は,個人情報保護の観点から不可欠である。
    • 既存手法は,サポートの幾何学的構造を捉えきれていない,またはサポートが異なる場合に適用できない。
    • ウォーターシュタイン距離をユーティリティ指標とする新たなDPサンプリングフレームワークを開発し,問題を解決する。
    • 本研究では,ウォーターシュタイン射影に基づく最適なメカニズムであるウォーターシュタイン射影メカニズム(WPM)を提案した。
    • 提案メカニズムを効率的に近似計算するアルゴリズムを開発し,その収束性を保証した。
    • ウォーターシュタイン距離を用いることで,既存の密度比に基づく手法の限界を克服し,より実用的なDPサンプリングを実現した。

    Link: https://arxiv.org/abs/2605.10015

  • 逆問題に対する生成正則化の安定性ベンチマーク [math.CO, cs.DM, math.MG, eess.IV, cs.LG]目的:逆問題に対する生成正則化の安定性評価
    • 科学・医療画像処理において,再構成技術の安定性と信頼性は不可欠である。
    • 生成モデルは,不完全な条件やデータに対する安定性が課題となる場合がある。
    • 様々な条件下での生成モデルの性能限界を明らかにする。
    • 生成モデルは,特定の条件下で最先端の再構成性能を示す。
    • しかし,一部の設定やアプリケーションでは,性能が低下する場合や問題が生じる可能性がある。
    • 本研究は,生成モデルの適用範囲に関する洞察を提供する。

    Link: https://arxiv.org/abs/2605.10076

  • PoDAR:生成モデリングのための電力分離オーディオ表現 [eess.AS, cs.AI, cs.LG, cs.SD]目的:生成モデリングにおける電力と意味内容の分離
    • 音声生成モデルの性能向上は,技術進歩の鍵であり,高品質な音声合成への期待が高まる。
    • 潜在空間のモデリングが困難であり,生成モデルの収束速度や最終的な性能を制限する要因となる。
    • 信号の電力と意味内容を分離し,潜在空間のモデリングを容易にすることで,性能向上を目指す。
    • PoDARは,ランダムな電力拡張と潜在的な一貫性目的を利用して,電力と意味内容を分離する。
    • Stable Audio 1.0 VAEとF5-TTSジェネレーターに適用した結果,収束が約2倍に加速された。
    • LibriSpeech-PCデータセットにおいて,スピーカー類似度が0.055向上,UTMOSが0.22向上した。

    Link: https://arxiv.org/abs/2605.10084

  • PFN-TS:文脈的バンディット問題に対する事前データ適合型ネットワークを用いたトムソンサンプリング [math.CO, cs.DM, stat.ML, cs.LG]目的:文脈的バンディット問題におけるトムソンサンプリングの効率化
    • 機械学習における強化学習の重要性が高まっており,特に文脈的バンディット問題は現実世界の意思決定に応用可能である。
    • 既存のトムソンサンプリング手法は,計算コストが高く,大規模なデータセットでは効率が悪化する。
    • 事前データ適合型ネットワークを活用し,計算量を削減しつつ,トムソンサンプリングの性能を向上させることを目指す。
    • 提案手法PFN-TSは,PFNの予測分布から平均報酬サンプルを生成するサブサンプリングを用いた中心極限定理を活用する。
    • PFN-TSは,合成データおよびOpenMLベンチマークにおいて,既存手法を上回る平均ランクを達成した。
    • オフラインのモバイルヘルス評価においても,PFN-TSは最も高いポリシー値を推定した。

    Link: https://arxiv.org/abs/2605.10137

  • サイクルを持つ線形非ガウス因果モデルの粗視化 [stat.ML, cs.AI, cs.LG]目的:高次元因果構造の低次元化による要約
    • 因果推論は,科学的発見や意思決定において重要な役割を果たす。
    • 既存手法は高次元・低次元構造が無環であることを仮定し,適用範囲が限られる。
    • サイクルを含む高次元モデルから,低次元の因果グラフを効率的に推定すること。
    • 線形非ガウス設定において,高次元の非環状性の仮定を緩和可能であることを示した。
    • 低次元DAGの識別可能性は,既存の結果と一貫性がある。
    • 提案手法は,高次元の等価類を効率的に学習し,サンプル複雑性に関して明確な上限を持つ。

    Link: https://arxiv.org/abs/2605.10163

  • 共同疎コーディングと時間的ダイナミクスが文脈再構成を支援する [q-bio.NC, cs.LG, cs.NE]目的:文脈移行時の過去の表現の維持メカニズムの解明
    • 適応的行動において,脳は過去の経験を維持しつつ文脈を変化させる必要があり,そのメカニズムは重要である。
    • 従来のシステムでは,新たな知識を獲得する際に過去の知識を忘却する「破滅的忘却」が課題となっている。
    • 本研究は,文脈移行時に過去の表現を維持し,柔軟な適応を可能にするメカニズムを明らかにすることを目指す。
    • 共同疎コーディングは文脈間の干渉を低減し,時間的ダイナミクスは文脈の分離を強化することが示された。
    • スパイクニューラルネットワークのようなシステムは,これらの特性により,補助的なヒューリスティクスなしに長期学習における保持率が向上した。
    • これらの結果は,脳が過去の知識を維持しながら新しい文脈に柔軟に適応する方法のメカニズム的枠組みを提供する。

    Link: https://arxiv.org/abs/2605.10178

  • 因果分布学習への拡張型Wasserstein-GANアプローチ:密度非依存推定とミニマックス最適性 [math.ST, cs.LG, stat.ML, stat.TH]目的:因果効果分布推定
    • 政策決定やリスク管理において,介入後の結果分布の把握は不可欠である。
    • 既存手法は統計的リスクと乖離し,理論的な保証が不足している場合がある。
    • 介入分布のWassersteinリスク最小化とミニマックス最適性の確立を目指す。
    • GANICEは,各治療・共変量状態に対する介入分布を明確化する。
    • GANICEは,拡張型Wasserstein距離とセルワイズ批評家を用いて,Wassersteinリスクを最小化する。
    • GANICEは,Besov空間理論に基づき,ミニマックス最適性を証明する。

    Link: https://arxiv.org/abs/2605.10206

  • 区分線形関数と浅いCNN損失に対する定常性検定のパラメータ化複雑性 [math.OC, cs.CC, cs.LG]目的:区分線形関数の特定の点における近似一次定常性の検定のパラメータ化複雑性
    • 非滑らかな最適化において,定常性検定は基本的なタスクであり,その計算効率は重要である。
    • 区分線形関数に対する定常性検定は,最悪の場合計算困難であることが示されている。
    • 固定次元における計算可能性の限界を明らかにし,効率的なアルゴリズムの可能性を探る。
    • 固定次元においては,計算可能な範囲と困難な範囲が明確に区分され,計算量の評価ができた。
    • 指数時間仮説の下で,ある計算量を超えるアルゴリズムは存在しないことが証明された。
    • この結果は,区分線形関数の局所的最小性検定や,浅いReLU CNNの学習損失にも適用できる。

    Link: https://arxiv.org/abs/2605.10219

  • 恒星年齢圧縮が天の川銀河厚円盤形成史の解釈を変える [astro-ph.GA, cs.LG]目的:天の川銀河厚円盤の形成史に関する解釈の変化
    • 銀河考古学は,天の川銀河の形成と進化の歴史を解明する上で重要な研究分野である。
    • 恒星の年齢は直接観測できないため,年齢推定に系統的な誤差が生じる可能性がある。
    • 観測データの質が年齢推定に与える影響を評価し,厚円盤形成史の解釈を検証すること。
    • 分光学的年齢と地震学的年齢の比較により,厚円盤の急速形成を示唆する過去の研究結果が弱まることが示された。
    • 年齢圧縮は,急形成を支持する観測値を生み出すだけであり,本来の急激な形成を必要としないことが示唆された。
    • 恒星年齢の定義自体が,天の川銀河の形成史の解釈に大きく影響する可能性がある。

    Link: https://arxiv.org/abs/2605.10220

  • ニューラル特徴マップによるスケーラブルなガウス過程推論 [stat.ML, cs.LG]目的:表現力豊かなカーネルの構築
    • ガウス過程は,機械学習における強力な非線形モデリング手法であり,不確実性の定量化に有用である。
    • 従来のガウス過程推論は,計算コストが高く,大規模データへの適用が困難であるという課題がある。
    • ニューラル特徴マップを用いることで,効率的かつスケーラブルなガウス過程推論を実現し,その課題を克服することを目指す。
    • ニューラル特徴マップは,暗黙のRKHSから導出されるグラム行列の最適な低ランク近似として解釈できることが示された。
    • 提案手法は,従来のガウス過程推論と比較して,精度と計算効率の両面で優れていることがベンチマークデータセットで確認された。
    • 生成されたカーネルのスペクトル特性を解析し,過剰平滑化に対処するための積特徴マップカーネルを導入した。

    Link: https://arxiv.org/abs/2605.10285

  • 任意データ拡張を用いたランダム特徴回帰の汎化誤差の特性評価 [stat.ML, cs.LG, math.ST, stat.TH]目的:比例的領域におけるデータ拡張が教師あり回帰手法に及ぼす正則化効果
    • 機械学習において,データ拡張は汎化性能向上に不可欠であり,その理論的理解が重要である。
    • データ拡張の効果は,特徴マップの誤指定やネットワーク構造に依存し,厳密な評価が困難である。
    • 真のデータ分布と拡張スキームの統計量のみから,テスト誤差を厳密に特徴づけることを目指す。
    • 提案手法により,テスト誤差を真のデータ分布とデータ拡張スキームの統計量で表現する厳密な限界が導き出された。
    • 特徴マップが誤指定されていても,またはネットワークの大部分が固定化されていても,結果は有効である。
    • ガウス分布データに対する漸近的特性評価が,提案手法の精度を検証した結果,良好な一致が見られた。

    Link: https://arxiv.org/abs/2605.10290

  • 生成AIが個人起業を促進するが,トップは依然としてチームが優位 [econ.GN, cs.AI, cs.ET, q-fin.EC, stat.AP]目的:生成AIによる起業参入の変化とその影響
    • 起業は経済成長とイノベーションの重要な原動力であり,社会に新たな価値をもたらす。
    • 従来の起業には高い障壁があり,特に質の高い成果を生み出すにはチームの協力が不可欠である。
    • 生成AIが個人での起業を容易にする一方で,その成果の質に差が生じている現状を解明する。
    • ChatGPT-3.5の公開後,Product Huntでの起業家による製品ローンチ数が大幅に増加した。
    • 特に,従来チームベースのベンチャーが多かったカテゴリーで,個人起業家の割合が顕著に増加した。
    • しかし,この増加は実験的な参入が多く,高品質な成果の上位層におけるチームベースの優位性は変わっていない。

    Link: https://arxiv.org/abs/2605.10291

  • 量子回路解析における自動推測と推論のためのニューロシンボリックフレームワークSCALAR [physics.comp-ph, cs.DC, physics.chem-ph, quant-ph, cs.AI, cs.SC]目的:量子回路解析における自動推測の生成
    • 量子コンピュータの発展には,効率的なアルゴリズム設計と検証が不可欠である。
    • 既存手法では,量子回路の特性を解析し,最適化パラメータを特定することが困難である。
    • グラフ不変量と最適QAOAパラメータの関係を推測し,回路の最適化に貢献すること。
    • SCALARは,MQLibベンチマークデータセットの82個のMaxCutインスタンスに対して有効に推測を生成した。
    • 異なるグラフ構造(規則,Erdos-Renyi,Barabasi-Albert,Watts-Strogatz)を持つ2,000個のランダム生成グラフにも適用された。
    • グラフ構造的特徴と最適化ランドスケープ特性の間の相関が,不変量ベースの記述子を通じて特定された。

    Link: https://arxiv.org/abs/2605.10327

  • 時系列予測のためのエキスパート損失統合によるMoEの高速学習 [stat.ML, cs.LG, stat.ME]目的:時系列予測におけるMoEの効率的な学習手法
    • 時系列予測は経済,観光,エネルギーなど,幅広い分野で重要であり,高精度な予測が求められる。
    • 従来のMoEは学習コストが高く,特に大規模なデータや複雑なモデルでは学習が困難となる場合がある。
    • エキスパート損失を統合することで,より効率的な学習と高精度な予測を両立させることを目指す。
    • 提案手法は,経済,観光,エネルギーの様々な周波数を持つデータセットにおいて,統計的手法やTransformer,WaveNetなどの最先端ニューラルネットワークモデルを上回る予測精度と計算効率を示した。
    • エキスパート固有の損失情報を学習プロセスに直接組み込むことで,エキスパートの専門性を高め,予測性能を向上させている。
    • 部分的なオンライン学習戦略と組み合わせることで,モデル全体の再学習の必要性をなくし,計算コストを大幅に削減している。

    Link: https://arxiv.org/abs/2605.10330

  • 非線形偏微分方程式を解くための多忠実度ガウス過程回帰 [eess.IV, cs.CE, cs.ET, physics.comp-ph, cs.DC, physics.chem-ph, stat.ML, cs.LG]目的:非線形偏微分方程式の解法
    • 物理現象のシミュレーションにおいて,高精度な解を得ることは重要である。
    • 従来の数値解法では,計算コストが高くなる場合がある。
    • 多忠実度データを利用し,計算コストを抑えつつ高精度な解を得ることを目指す。
    • 低忠実度シミュレーションから得られた経験的カーネルに基づいて,微分可能な非定常カーネルを適合させる。
    • 多忠実度フレームワークを用いて,高忠実度カーネルと対応する平均を導出する。
    • 提案手法を Burgers 方程式に適用し,その性能を検証した。

    Link: https://arxiv.org/abs/2605.10383

  • 構造化入力に対する誘導拡散を用いたブラックボックス最適化の遺憾分析 [stat.ML, cs.LG]目的:構造化入力に対する誘導拡散を用いたブラックボックス最適化における遺憾
    • 分子や結晶などの構造設計問題において,最適化は重要である。効率的な探索手法が求められている。
    • 既存の遺憾解析は,現代的な拡散BOパイプラインの前提条件を満たさない場合が多い。
    • 事前学習済み拡散モデルを利用したBOにおける遺憾を解析し,理論的な保証を提供する。
    • 誘導拡散BOの遺憾解析のための,確率質量の上昇に着目した新たなフレームワークを開発した。
    • このフレームワークは,指数的な収束と多項式的な加速が同一メカニズムから生じることを説明する。
    • 有限候補プールからの探索指数を推定する診断法と,証明済みのサンプラーを提案した。

    Link: https://arxiv.org/abs/2605.10385

  • 広幅ネットワークにおける鋭い特徴学習の移行とベイズ最適スケーリング則 [stat.ML, cs.LG]目的:広幅ネットワークにおける特徴学習の限界とスケーリング則
    • 機械学習の性能向上には,モデルの表現能力と汎化能力のバランスが重要である。
    • 高次元データにおける特徴学習のスケーリング則は未だ十分に解明されていない。
    • 教師モデルから生徒モデルへの知識伝達における,特徴学習の効率的なスケーリング則を明らかにする。
    • データ量が増加するにつれて,教師モデルの特徴は段階的に学習可能となり,各特徴の重なりが不連続に変化する。
    • この段階的な特徴獲得に基づき,「有効幅」$k_c$が定義され,データ量$n$に対するベイズ最適汎化誤差$\varepsilon^{\rm BO}$のスケーリング則が導出された。
    • 有効幅$k_c$近傍で学習させた生徒モデルは,理論的なスケーリング則に沿った性能を示すことが実証された。

    Link: https://arxiv.org/abs/2605.10395

  • 有限群は常に公正な有限表示を持つ [math.GR, cs.AI]目的:有限群の公正な有限表示の存在
    • 群論において,群の表示は群の構造を理解するための重要なツールである。
    • 有限群の表示は,必ずしも最小限である必要はなく,効率的な表示を見つけることが課題である。
    • 全ての有限群が公正な有限表示を持つかの未解決問題に解答を与える。
    • 全ての有限群が,関係式を一つでも削除すると無限群になるような有限表示を持つことが証明された。
    • この結果は,Kourovka Notebook に記載された未解決問題(問題21.10)を肯定的に解決する。

    Link: https://arxiv.org/abs/2605.10402

  • 物理的なプローブによる分子表現における化学環境崩壊の露呈と緩和 [astro-ph.IM, cs.SY, eess.SY, physics.chem-ph, cs.AI]目的:分子表現における化学環境崩壊の露呈と緩和
    • 分子構造と物性の関係理解に不可欠であり,創薬や材料設計への応用が期待される。
    • 分子表現学習において,化学環境の多様性を捉えきれないという課題が存在する。
    • 実験データと計算データを統合し,化学環境崩壊を緩和する新しいフレームワークを開発する。
    • CLAIMは,分子のトポロジー情報とNMRスペクトルを整合させることで,失われた化学分解能を回復させる。
    • CLAIMは,柔軟性や互変異性を持つシステムに対してもロバストであり,13C NMR予測の精度を向上させる。
    • CLAIMは,立体異性体の識別やADMET予測,蛍光推定といった他の分子特性予測にも応用可能である。

    Link: https://arxiv.org/abs/2605.10429

  • 偏光符号化量子ビットを用いた空洞増強集団量子処理 [quant-ph, cs.AI]目的:偏光符号化量子ビットによる集団量子処理のための空洞増強光学的アーキテクチャ
    • 量子計算は,従来の計算機では困難な問題を解決する可能性を秘めており,重要性が増している。
    • 大規模量子計算を実現するには,量子ビットの安定性や制御性に課題が存在する。
    • 安定性と制御性を向上させ,実用的な量子計算プラットフォームを構築することを目指す。
    • 空洞増強アーキテクチャにより,安定した共振基盤とプログラム可能な偏光変換を実現した。
    • 偏光選択的非線形相互作用により,制御位相ゲートを生成し,汎用ゲートセットを可能にした。
    • センチメートルスケールの空洞で,実験的にアクセス可能な固体非線形媒体を用いて,条件付き位相を達成できることが示された。

    Link: https://arxiv.org/abs/2605.10473

  • アフィン・トレーシング:確率的線形ソルバーの新たなパラダイム [math.OC, cs.SY, eess.SY, stat.ML, math.OC, cs.DM, cond-mat.stat-mech, cs.CL, cs.MA, physics.soc-ph, stat.ML, cs.LG, cs.NA, math.NA]目的:確率的線形ソルバーの理論的基盤の再構築と,実装の自動化
    • 線形システムの解法は,科学技術計算の根幹であり,その高速化と精度向上が重要である。
    • 既存の確率的線形ソルバーの実装は複雑で,柔軟性に欠けるという課題があった。
    • アフィン・トレーシングにより,確率的線形ソルバーの実装を自動化し,利用を促進することを目指す。
    • ベイズ型確率的線形ソルバーは,非定常アフィン確率的反復法の一種であることが示された。
    • 現実的なアフィン確率的反復法は,適切にキャリブレーションされていることが証明された。
    • アフィン・トレーシングにより,標準的なアフィン反復法の実装から自動的に確率的線形ソルバーを生成できることが示された。

    Link: https://arxiv.org/abs/2605.10566

  • 重力波事象とマルチメッセンジャー観測における対応関係探索のためのエージェントフレームワーク [math.OC, cs.MS, math.DG, astro-ph.IM, cs.AI]目的:重力波事象と電磁波事象の対応関係探索
    • 重力波天文学は,天体物理学,高密度物質,重力,宇宙論の研究に新たな道を開く。
    • 次世代検出器の登場によりイベント数が増加し,既存のデータ解析手法では対応が困難になりつつある。
    • 大規模言語モデルを活用し,対応関係探索を自動化することで,効率的なマルチメッセンジャー研究を可能にする。
    • 本研究で開発したGW-Eyesは,ドメイン固有のツールを統合し,重力波と電磁波の候補事象間の対応関係を自律的に探索する。
    • GW-Eyesは自然言語による対話機能を備え,カタログ管理やスカイマップの可視化など,専門家の補助業務を支援する。
    • 大規模言語モデルの複雑な意思決定能力とトレーサブルな推論プロセスを活用することで,マルチメッセンジャー天文学に新たな視点を提供する。

    Link: https://arxiv.org/abs/2605.10584

  • 事前学習済みネットワークによる因果的感受性分析のアモルタイズ化 [stat.ML, cs.LG]目的:観測されていない交絡が存在する場合における因果効果推定値の上界・下界の算出
    • 因果推論において,交絡因子の影響を考慮することは,正確な因果効果を特定するために不可欠である。
    • 既存の因果的感受性分析は,データやクエリの変更ごとに再計算が必要であり,計算コストが高い。
    • 事前学習済みネットワークを利用し,計算時間を大幅に削減し,効率的な分析を実現することを目指す。
    • 提案手法は,一般化された介入モデルに対応可能な事前データ構築法を開発し,因果効果の最大化/最小化と感度モデル違反のトレードオフにより学習ラベルを生成する。
    • 標準的な凸性・線形性の条件下では,提案手法は解のパレート最適解を完全に回復することが示された。
    • 実験結果から,提案手法は既存手法と比較して,テスト時の計算速度が大幅に向上することが確認された。

    Link: https://arxiv.org/abs/2605.10590

  • ニューラルODEにおける証明可能な普遍性を持つ固定点制約 [cond-mat.dis-nn, cs.LG]目的:ニューラルODEにおける固定点制約の実現
    • 微分方程式の近似において,ニューラルODEは強力な表現力を持つ。
    • 特定の条件下の微分方程式を正確に表現することが課題であった。
    • ニューラルODEが,事前に設定された固定点を正確に表現することを可能にする。
    • 本研究では,ニューラルODEが任意の速度場を,事前に固定された固定点を持つように近似できる技術を提案する。
    • 勾配降下法による学習において,仮説クラス内での制約を厳密に保ちつつ,ニューラルODEの表現力を損なわない。
    • 速度場内の局所的な制約下でのニューラルODEの普遍性を厳密に証明し,固定点を効率的に設定する方法を提供する。

    Link: https://arxiv.org/abs/2605.10613

  • 品質の代償:混合品質データを用いたスパース復元の十分条件 [eess.SP, cs.RO, stat.ML, cs.IT, cs.LG, math.IT, math.ST, stat.TH]目的:混合品質データを用いたスパース復元に関するサンプルサイズの条件
    • 現代のデータ収集では,ノイズレベルが異なる複数の情報源からのデータが一般的である。
    • 高品質データはコストがかかるため,低品質データの活用が課題となっている。
    • 混合品質データ下でのスパース復元に必要なデータ量を理論的に決定すること。
    • 情報理論的側面から,高品質サンプル1つを代替するために必要な低品質サンプルの数を決定する「品質の代償」という線形トレードオフが十分条件となる。
    • 復元アルゴリズム(LASSO)の解析により,復元閾値が均一ノイズの場合と同等であり,データの不均一性に対するロバスト性を示す。
    • データ品質の変化に対する情報理論的閾値とアルゴリズム的閾値の適応における根本的な違いを明らかにする。

    Link: https://arxiv.org/abs/2605.10713

  • マルチモーダル大規模言語モデルによるリモートセンシング活動検知の時空間理解 [physics.soc-ph, cs.SI, math.OC, cs.MA, cs.RO, cs.SY, eess.SY, eess.IV, cs.AI, cs.CV]目的:リモートセンシング活動検知における時空間理解
    • 災害監視や都市計画など,社会課題解決にリモートセンシング技術の活用が不可欠である。
    • 既存手法では,衛星画像から活動を正確に認識し,その時系列変化を理解することが困難である。
    • 言語モデルを活用し,リモートセンシング画像の時空間的変化を理解する新たな手法を確立する。
    • SMART-HC-VQAデータセットを構築し,Sentinel-2画像を用いた視覚的質問応答を可能にした。
    • 画像ペアの組み合わせによるデータ拡張により,時系列比較のためのデータ量を大幅に増加させた。
    • LLaVA-NeXT Mistral-7Bを基盤としたマルチ画像MLLMフレームワークを実装し,メタデータ由来のVQA事例で学習させた。

    Link: https://arxiv.org/abs/2605.10739

  • 広くて浅いモデルにおける勾配降下のグローバル収束性:有界非線形性について [math.OC, cs.LG]目的:広くて浅いモデルにおける勾配降下のグローバル最適化
    • ニューラルネットワークの学習において,勾配降下法が非凸な損失関数のグローバル最小化に成功する点が重要である。
    • ReLUやシグモイド活性化関数に限られた既存研究では,モデルの多様性に十分に対応できていない点が課題である。
    • 多頭アテンション層や二層シグモイドネットワークを含む幅広いモデルに対して,グローバル最適化を保証する理論を構築することを目指す。
    • 非グローバル最小値は勾配降下法のダイナミクスにおいて不安定であることが証明された。
    • パラメータの初期分布がfull supportを持つ場合,勾配降下法はグローバル最小値に収束することが示された。
    • 有界非線形性を持つモデルやベクトル出力重みを持つモデルに対して,不安定性の構築が拡張された。

    Link: https://arxiv.org/abs/2605.10775

  • 固定点ニューラル最適輸送:陰関数微分なし [math.CO, cs.DM, math.OC, cs.LG]目的:最適輸送のニューラル表現
    • 最適輸送は,確率分布間の距離を測る上で重要であり,機械学習の様々な分野に応用される。
    • 既存手法は,敵対的学習や複数ネットワーク構造を用いるため,学習が不安定になりやすい。
    • 敵対的学習や陰関数微分を必要としない,安定した最適輸送のニューラルフレームワークを構築する。
    • 本研究では,単一の潜在関数で最適輸送を表現し,c変換を固定点問題として定式化することで,安定した学習を実現した。
    • 固定点計算の内部微分を必要とせず,効率的な訓練が可能であり,確率勾配降下法の収束性も証明された。
    • 高次元ガウス分布,物理データセット,画像変換タスクにおける実験で,高い輸送精度と安定性,そして計算効率が示された。

    Link: https://arxiv.org/abs/2605.10792

  • 線形結合記憶における事実想起:鋭敏な漸近的挙動とメカニズムに関する洞察 [stat.ML, cond-mat.dis-nn, cond-mat.stat-mech, cs.LG]目的:線形結合記憶における事実想起の限界とそのメカニズムの解明
    • 大規模言語モデルの性能向上に伴い,ニューラルネットワークにおける情報記憶と想起の限界理解が重要である。
    • 入力と出力の関連付けにおける厳密な分離条件が,記憶容量の正確な特性化を困難にしている。
    • 記憶容量の厳密な理論的上限を導き出し,最適な学習則のメカニズムを明らかにする。
    • 線形結合記憶において,記憶可能な連想の数は,p_c log p_c / d^2 = 1 / 2 であることが示された。
    • 入力と出力の独立な競合モデルを導入し,元のモデルと同等の記憶容量を持つことを理論的に証明した。
    • 最適な学習則は,広範囲な変動ではなく,競合する出力によって設定された極値閾値を超えることで正解のスコアを高める。

    Link: https://arxiv.org/abs/2605.10795

  • デフレートされたQ値反復の切り替え幾何学的解析 [math.OC, cs.AI]目的:割引マルコフ決定過程制御におけるランク1デフレートされたQ値反復の解析
    • 強化学習は,ロボット工学やゲームAIなど,様々な分野で重要な役割を担っている。
    • Q値反復は,最適な方策を見つけるための基本的な手法であるが,収束速度が遅い場合がある。
    • デフレートにより収束速度の解析を精密化し,より効率的な学習手法を開発すること。
    • 本研究では,デフレートされたQ値反復の収束性を解析するため,ジョイントスペクトル半径の枠組みを導入した。
    • 標準的なQ値反復モデルのジョイントスペクトル半径は割引率$\gamma$と等しいのに対し,デフレートされたQ値反復ではより小さい値となる場合があることが示された。
    • デフレートは,意思決定問題自体を変更するのではなく,冗長な成分を除去することで収束幾何学の記述を精密化する効果を持つ。

    Link: https://arxiv.org/abs/2605.10811

  • 吸引子-血管連関理論:スマートフォン光電気脈波を用いたカフレス血圧推定の形式的基礎付けと経験的検証 [physics.med-ph, cs.AI, cs.LG]目的:カフレス血圧推定の理論的基盤と実証
    • 高血圧は世界的に蔓延する疾患であり,早期発見と継続的なモニタリングが重要である。
    • 従来の血圧測定にはカフが必要であり,装着の煩雑さや負担が大きいという課題がある。
    • スマートフォンを用いて,簡便かつ高精度なカフレス血圧推定を実現することを目指す。
    • 吸引子-血管連関理論(AVCT)は,心臓の吸引子形状が血圧情報を含有することを示し,その理論的根拠を形式的に証明した。
    • 光電気脈波(PPG)と拍動通過時間(PTT),心臓安定性指数(CSI)を用いてモデルを構築し,厳格な交差検証によりAAMI基準を満たす血圧推定を達成した。
    • スマートフォンのみのPPGデータでECG+PPGモデルと同等の性能を実現し,臨床グレードの血圧トラッキングが可能であることを示した。

    Link: https://arxiv.org/abs/2605.10871

  • クリフォード量子回路合成のための等変性強化学習 [quant-ph, cs.LG]目的:クリフォード量子回路の最適合成手法
    • 量子コンピュータの実現に向け,量子回路の効率的な合成が重要である。
    • 大規模量子回路の合成は計算コストが高く,実用的な手法が求められている。
    • 量子ビット数の多い回路に対しても適用可能な合成手法の開発。
    • 提案手法は,6量子ビット回路において最適な解の近くの回路を高速に発見できる。
    • 10量子ビットの訓練後,30量子ビットまでの未知の回路に対しても有効に機能する。
    • 既存の合成ツールと比較して,平均的な2量子ビットゲート数を削減できる。

    Link: https://arxiv.org/abs/2605.10910

  • 低温領域における平均場Transformerの集中現象の定量化 [math.AP, cs.LG, math.DS]目的:Transformerにおけるトークン分布の集中現象の定量的評価
    • Transformerは現代の巨大言語モデルの主要な構成要素であり,その理論的理解は重要である。
    • Transformer内部のトークン分布の挙動は複雑であり,その集中メカニズムは未解明な部分が多い。
    • 低温領域におけるトークン分布の時間発展を解析し,集中する先を特定することを目的とする。
    • Transformerのトークン分布は,key, query, value行列によって誘導される写像のpush-forwardに急速に集中する。
    • Wasserstein距離は,温度パラメータと推論時間に応じて$\sqrt{{\log(\beta+1)}/{\beta}}\exp(Ct)+\exp(-ct)$としてスケールする。
    • 実験結果は,理論的予測を裏付け,有限の温度ではvalue行列のスペクトルによって支配される終末相が存在することを示唆する。

    Link: https://arxiv.org/abs/2605.10931

  • テキストを通じたリンク予測によるエンティティ表現の誘導 [cs.CL, cs.AI, cs.LG]目的:テキストからエンティティ表現を誘導する手法
    • ナレッジグラフは情報検索や推薦システム等,Webアプリケーションにおいて不可欠である。
    • ナレッジグラフは不完全であることが多く,その補完が課題となっている。
    • 学習済み表現の汎用性を高め,転移学習における再学習コストを削減する。
    • リンク予測を目的としたエンティティ表現の評価プロトコルを提案し,未学習エンティティへの汎化性能を検証した。
    • 事前学習済み言語モデルを用いたアーキテクチャが,既存手法と比較してリンク予測で平均22%のMRR向上を示した。
    • エンティティ分類および情報検索タスクにおいても,ファインチューニングなしで高い性能向上を達成し,汎用性の高さを実証した。

    Link: https://arxiv.org/abs/2010.03496

  • 多人数確率的ゲームにおける戦略的価値と協力:サイドペイメントによる学習 [cs.GT, cs.AI]目的:多人数確率的ゲームにおける戦略的価値と協力の実現
    • 経済学や人工知能において,多人数間の協力的な行動を理解することは重要である。
    • ゲーム理論では,協力的な行動を促すためのメカニズム設計が難しい場合がある。
    • サイドペイメントを用いることで,協力が合理的になる条件を分析し,その価値を評価する。
    • ハーシャニ・シャプレイ値の拡張として,HS-SとCoco-Sという2つの価値概念が導入された。
    • 二者ゲームにおいてはHS-SとCoco-Sは一致するが,3者以上では不一致が生じることが示された。
    • Coco-Sの固定点存在と一意性,および新しいマルコフ一貫性公理による特徴付けが証明された。

    Link: https://arxiv.org/abs/2303.05307