arXiv雑要約

AI - 2026/05/29 公開

  • 強化学習を用いた社会環境シミュレーションによる望ましい気候軌道の構築 [math.CO, cs.DM, physics.soc-ph, cs.AI]目的:気候変動対策における強化学習の応用可能性
    • 気候変動は喫緊の課題であり,効果的な政策が求められている。
    • 従来の政策分析手法は,不確実性の高い状況下での意思決定に課題がある。
    • 社会経済的相互作用を考慮したシミュレーションによる解決策の探索。
    • 複数の強化学習エージェントが協調することで,炭素排出量削減と経済成長の両立が可能となった。
    • エージェント間の競争を導入すると,望ましい気候軌道は実現されにくくなることが示された。
    • アルゴリズムの失敗原因を可視化することで,より現実的な競争モデルの構築に貢献する。

    Link: https://arxiv.org/abs/2410.07287

  • ノイズを考慮した差分プライバシーに基づく変分推論 [stat.ML, cs.CR, cs.LG]目的:差分プライバシーを考慮した変分推論手法
    • 統計的推論において,プライバシー保護は重要である。しかし,プライバシー保護と精度維持はトレードオフの関係にある。
    • 既存の差分プライバシー手法は,単純な確率モデルに限定されており,高次元モデルへの適用が困難である。
    • 高次元かつ非共役モデルにも適用可能な,ノイズを考慮した変分推論手法を開発し,精度向上を目指す。
    • 提案手法は,既存手法が適用可能な範囲では同等の性能を示す。
    • 高次元ベイズ線形回帰において正確なカバレッジが得られた。
    • UCI Adultデータセットを用いたベイズロジスティック回帰において,校正された予測確率が得られた。

    Link: https://arxiv.org/abs/2410.19371

  • ニューラルネットワークと(仮想)拡張定式化 [math.CO, cs.CC, cs.DM, cs.LG, math.OC]目的:ニューラルネットワークのサイズに関する下限の証明
    • 現代機械学習の基礎であるニューラルネットワークの理論的理解が不可欠である。
    • ニューラルネットワークのサイズが問題の複雑さにどのように依存するか不明確である。
    • 多面体の拡張複雑性を用いて,ニューラルネットワークのサイズの下限を導出することを目指す。
    • 区分線形活性化関数を持つニューラルネットワークのサイズの下限を,多面体の拡張複雑性で評価できることが示された。
    • 単調または入力凸なニューラルネットワークに対し,指数時間的な下限が導かれた。
    • 一般的なニューラルネットワークに対する下限導出のため,仮想拡張複雑性という概念が導入された。

    Link: https://arxiv.org/abs/2411.03006

  • 生存期間分析モデル評価におけるC指標への固執を避ける [stat.ME, cs.LG]目的:生存期間分析モデルの評価方法
    • 医療分野等において,生存期間の予測は重要な課題である。その精度評価はモデルの選択や改善に不可欠。
    • 既存の評価指標は,モデルの目的と整合性が取れていない場合や,検閲に関する仮定が不明確なまま使用されることが多い。
    • 評価指標とモデルの仮定との整合性を重視し,適切な評価方法を提示することで,誤解を招くモデル比較を防ぐ。
    • 生存期間分析の評価は,標準的な回帰や分類とは異なり,検閲の影響を考慮する必要がある。
    • C指標のような一致度に基づく指標は過剰に使用されており,その妥当性に疑問が呈されている。
    • 適切な評価指標の選択には,モデルの目的と仮定との整合性が重要であり,ダブルヘリックスラダーという概念が提案されている。

    Link: https://arxiv.org/abs/2506.02075

  • 正則化された深層行列分解の損失地形の完全な解析 [math.OC, cs.LG]目的:正則化深層行列分解問題の損失地形の研究
    • 深層学習は様々な分野で活用されているため,その最適化の基盤を理解することは重要である。
    • 深層行列分解の最適化に関する理論的な理解が十分ではないという課題が存在する。
    • 深層行列分解問題における臨界点の性質を明らかにすることで,その最適化を解明する。
    • 臨界点のすべての種類を閉じた形で特徴付けた。
    • 臨界点が局所最小値,大域最小値,厳密な鞍点,または非厳密な鞍点であるための精密な条件を確立した。
    • すべての臨界点が局所最小値または厳密な鞍点となるための必要十分条件を導出した。

    Link: https://arxiv.org/abs/2506.20344

  • サブ線形から線形へ:有限幅ネットワークにおける局所収束 - 局所ポリアク-ロヤシェヴィッツ領域による [stat.ML, cs.LG]目的:有限幅フィードフォワードネットワークにおける勾配降下法の局所線形収束
    • 深層学習の理論的理解は,モデルの性能向上と信頼性確保に不可欠である。
    • 勾配降下法の収束レートは,初期値周辺の領域の形状と関数の性質に大きく依存する。
    • ニューラルタンジェントカーネルの条件と局所的性質から,線形収束の条件を導き出す。
    • 初期化時にニューラルタンジェントカーネルが正で,かつ局所的準凸領域上でリプシッツ安定性を持つ場合,局所ポリアク-ロヤシェヴィッツ不等式が成立する。
    • 固定ステップ幅反復が局所的準凸領域内に留まるという仮定の下,線形収束が保証される。
    • バイナリMNISTやCIFAR-10の実験により,理論的結果の妥当性が確認された。

    Link: https://arxiv.org/abs/2507.21429

  • リスク回避型公平多クラス分類 [stat.ML, cs.LG, math.OC]目的:リスク回避型の多クラス分類手法
    • 機械学習は様々な分野で活用されているが,データの質が低い場合やラベルが不確かな場合に性能が低下しやすい。
    • 従来の分類手法は,データのノイズやラベルの信頼性の低さに対する頑健性に課題がある。
    • 本研究は,不確実なデータに対してもロバストで,公平性を考慮した多クラス分類手法を提案することを目的とする。
    • 本研究で提案する手法は,コherentリスク尺度とシステムリスクの理論に基づいている。
    • 数値実験の結果,提案手法は,信頼性の低い学習データに対してもロバストであり,期待分類誤差を最小化する手法よりも未知のデータに対する性能が向上することが示された。
    • また,システムリスク尺度の適用により,分類における公平性の確保が可能であることが確認された。

    Link: https://arxiv.org/abs/2509.05771

  • SADA:半教師あり学習における複数ブラックボックス予測の安全かつ適応的な集約 [quant-ph, cs.NI, eess.SP, cs.RO, stat.ML, cs.LG, stat.ME]目的:半教師あり学習における複数ブラックボックス予測の安全かつ適応的な集約手法
    • ラベル付きデータが少ない状況で,大量のラベルなしデータを活用する有用な手法である。
    • ブラックボックス予測の品質が不確実な場合,誤った集約により性能が低下する可能性がある。
    • 予測の品質に関わらず性能低下を防ぎ,最適な予測を達成することを目指す。
    • 提案手法は,ラベル付きデータのみを使用した場合よりも性能が低下しないことが保証される。
    • 予測のいずれか一つが正解である場合,収束速度の向上や効率的な学習が可能となる。
    • シミュレーションと実データ分析により,提案手法の有効性が示された。

    Link: https://arxiv.org/abs/2509.21707

  • SpeedCP:高速カーネルベース条件付き適合予測 [stat.ME, cs.LG]目的:条件付き適合予測のための効率的なアルゴリズム
    • 不確実性推定は機械学習モデルの信頼性向上に不可欠であり,リスク管理等の応用を可能にする。
    • 既存の条件付き適合予測は理論的には魅力的だが,計算コストが高く実用化が困難である。
    • 計算コストを削減し,実用的な条件付き適合予測を実現することを目的とする。
    • 提案手法は,既存手法に比べて40倍高速であり,計算効率が大幅に向上する。
    • 区間長の改善率が30%であり,予測区間の精度も向上する。
    • ハイパーパラメータの自動調整により,滑らかさとデータ適応的な校正を両立している。

    Link: https://arxiv.org/abs/2509.24100

  • AtomWorld:大規模言語モデルにおける結晶材料の空間推論を評価するためのベンチマーク [cond-mat.mtrl-sci, cs.AI, cs.CL]目的:大規模言語モデルの結晶材料における構造修飾能力の評価
    • 材料科学研究において,原子構造の構築・操作は不可欠であり,自動化が遅れている。
    • 既存の科学ベンチマークは知覚的・知識ベースのタスクに偏っており,モデル構築タスクが少ない。
    • 大規模言語モデルの空間推論能力を定量的に評価し,その限界を示すこと。
    • AtomWorldは,10種類の基本的なアクションと4つのモデリングカテゴリを含むベンチマークである。
    • Claude Opus 4.6が最も優れた性能を示したが,モデリングの複雑性が増すと成功率は顕著に低下した。
    • 特に,複雑な空間関係を伴う操作(回転など)の成功率は低く,材料構造モデリングにおけるLLMの限界を示唆する。

    Link: https://arxiv.org/abs/2510.04704

  • ダイソン拡散による置換不変スペクトル学習 [quant-ph, cs.CC, stat.ML, cs.LG, math.PR]目的:グラフのスペクトル学習における性能向上
    • グラフ構造の解析は,化学,社会科学,機械学習など,幅広い分野で重要である。
    • 既存のグラフ拡散モデルは,特定のグラフ群の識別やスペクトルの区別に課題がある。
    • 学習アーキテクチャへの誘導バイアスの組み込み方を変え,スペクトル特性をより正確に捉える。
    • ダイソン拡散モデルは,グラフのスペクトルを正確に学習し,既存のモデルを上回る性能を示す。
    • このモデルは,ランダム行列理論を活用し,拡散過程のスペクトル特性を解析的に抽出する。
    • 学習問題はリー代数レベルで置換不変となり,効率的な学習を実現する。

    Link: https://arxiv.org/abs/2510.08535

  • 生成モデルにおける分布制約への較正 [stat.ML, cs.LG, q-bio.BM]目的:生成モデルの較正
    • 生成モデルの応用範囲は広く,その性能は様々な分野で重要視されている。
    • 生成モデルはしばしば誤較正を起こし,生成されるデータの統計的特性が期待と異なる。
    • 分布制約を満たす最も近いモデルを探索し,生成モデルの較正誤差を低減すること。
    • 提案手法は,多数の同時制約と最大90億パラメータのモデルにおいて,較正誤差を大幅に削減できることを示した。
    • 緩和損失と報酬損失という2つの代替目的関数を導入し,制約を近似的に扱うことで,実用的な較正を可能にした。
    • タンパク質設計,画像生成,言語モデリングといった多様な応用分野での有効性が確認された。

    Link: https://arxiv.org/abs/2510.10020

  • ワンステージ学習における敵対的ロバスト性 [stat.ML, cs.LG]目的:敵対的摂動に対するロバスト性の向上
    • 機械学習モデルの信頼性は重要であり,特に安全性が求められる応用分野では不可欠である。
    • 敵対的摂動は,モデルの予測を容易に誤らせるため,セキュリティ上の脅威となる。
    • 本研究は,予測と割り当てを同時に学習するワンステージL2Dにおける敵対的ロバスト性を高める。
    • 提案手法は,コストを考慮した敵対的サーロゲート損失を導入し,分類と回帰の両方においてロバスト性を改善する。
    • 理論的な保証として,$\mathcal{H}$, $(\mathcal{R }, \mathcal{F})$, Bayes consistencyが確立された。
    • ベンチマークデータセットにおける実験により,提案手法がクリーンな性能を維持しつつ,敵対的攻撃に対するロバスト性を向上させることが確認された。

    Link: https://arxiv.org/abs/2510.10988

  • デカップルドバンディットのためのPerturbed Leader追従法:両方の利点と実用性 [stat.ML, cs.LG]目的:デカップルド多腕バンディット問題における学習戦略
    • 機械学習における意思決定問題の基礎であり,資源配分や推薦システム等に応用可能である。
    • 既存手法は計算コストが高く,特に大規模問題への適用が困難であるという課題があった。
    • 計算効率を向上させつつ,理論的な性能保証を持つ学習戦略を開発すること。
    • 提案手法は,確率的環境下で定数レグレット,敵対的環境下で$O(\sqrt{KT})$レグレットを達成するBOBW保証を持つ。
    • 凸最適化やリサンプリングを必要とせず,従来のFTPLバンディットポリシーよりも計算コストを大幅に削減できる。
    • 実験結果は,提案手法が実行時間を短縮し,両方の環境下で優れたレグレット性能を示すことを確認した。

    Link: https://arxiv.org/abs/2510.12152

  • 特異点のない動力学的invariantに基づく量子制御 [quant-ph, cs.LG, cs.SY, eess.SY]目的:量子状態の準備
    • 量子技術の基盤であり,計算,通信,センシング等の応用において重要性が増している。
    • 非マルコフ過程における環境の記憶効果やモデルの不確実性が,高精度な制御を困難にしている。
    • 任意のノイズ条件下で有限次元の量子状態準備を可能にする,invariantに基づくプロトコルを開発する。
    • 提案手法は,有限次元制御問題を単一量子ビットの問題に変換し,閉システムでの完全状態準備とノイズ最小化を二段階で実現する。
    • 既知のノイズに対する制御合成と,マスター方程式記述を必要としないノイズ非依存的なロバスト性の維持が可能である。
    • 数値シミュレーションにより,多様なターゲットに対し,滑らかでハードウェアに実装可能な制御場を用いた高精度な状態準備が示された。

    Link: https://arxiv.org/abs/2510.15340

  • ノイズと部分的な測定のみからの画像逆問題におけるベイズモデル選択とモデル誤指定の検定 [eess.IV, cs.LG, stat.ME, stat.ML]目的:ベイズモデルの評価手法
    • 画像再構成や復元においてベイズ統計モデルが不可欠であり,その性能評価は重要である。
    • 真の画像データがない状況下でのモデル評価は,計算コストが高く,困難である。
    • 計算コストを抑え,機械学習モデルにも対応可能な評価手法を確立する。
    • 本研究では,ベイズクロスバリデーションとデータ分裂を組み合わせた新規手法を提案した。
    • 提案手法は,拡散法やプラグアンドプレイサンプラーを含む,あらゆるベイズ画像サンプラーと互換性がある。
    • 様々なスコアリングルールとモデル誤指定の条件下で,高い選択と検出精度を低い計算コストで実現した。

    Link: https://arxiv.org/abs/2510.27663

  • 高次元確率的共同補充問題の解法のための計算手法 [math.OC, cs.LG]目的:高次元確率的共同補充問題の解法
    • サプライチェーン管理において,在庫補充は重要な課題であり,効率的な在庫管理が企業の収益に直結する。
    • 高次元問題では,従来の解法では計算量が膨大になり,現実的な時間で最適解を得ることが困難である。
    • 深層学習を用いたシミュレーションベースの計算手法により,高次元確率的共同補充問題を効率的に解くことを目指す。
    • 連続時間インパルス制御問題への近似と,BSDE,確率的目標問題との関連性に着目した新たな計算手法を開発した。
    • 深層ニューラルネットワークを活用し,インパルス制御問題を解き,それに基づいた在庫管理ポリシーを提案した。
    • 提案手法は,既存のベンチマークと同等またはそれ以上の性能を示し,50次元までの問題に対して計算可能であることを確認した。

    Link: https://arxiv.org/abs/2511.11830

  • ニューラル波動関数のトポロジカル秩序 [cond-mat.mes-hall, cond-mat.str-el, cs.AI]目的:トポロジカル秩序状態の発見と解析
    • 物質の新しい量子相であり,基礎物理学の理解を深める上で重要である。
    • 強い相関により,従来の平均場近似では理論的な解析が困難である。
    • ニューラルネットワークを用いて,そのような状態を効率的に探索し,精度良く記述すること。
    • 注意機構を用いた深層ニューラルネットワークが,事前知識なしに分数チェルン絶縁体状態を発見した。
    • 翻訳不変系において,単一の波動関数からトポロジカルな縮退度を効率的に抽出する手法を開発した。
    • ニューラルネットワークによる変分モンテカルロ法が,強く相関したトポロジカル相の発見に有用であることを示した。

    Link: https://arxiv.org/abs/2512.01863

  • 拡散微分リサンプリング [stat.ML, cs.LG, math.ST, stat.TH]目的:微分可能なリサンプリング手法の開発
    • 逐次モンテカルロ法は,不確実なシステムの状態推定に不可欠である。
    • 従来の逐次モンテカルロ法は,微分不可能なため,勾配に基づく学習が困難であった。
    • 拡散モデルを利用して,微分可能で効率的なリサンプリング手法を開発する。
    • 本研究では,学習不要な拡散モデルの代替を用いて,即座に微分可能な新しいリサンプリング手法を提案した。
    • 理論的に,提案手法が一貫したリサンプリング分布を提供することが示された。
    • 実験的に,提案手法は複数のフィルタリングとパラメータ推定ベンチマークで最先端の微分可能なリサンプリング手法を上回ることが示された。

    Link: https://arxiv.org/abs/2512.10401

  • インタラクティブVR実験に基づいたメンタルローテーションの深層学習モデル [q-bio.NC, cs.LG]目的:人間のメンタルローテーションのメカニズムのモデル化
    • メンタルローテーションは,人間の空間認知能力や世界モデルの構築において基礎的な役割を果たす。
    • 既存のメンタルローテーション研究では,人間の認知プロセスを詳細に捉えきれていない場合がある。
    • 深層学習とVR実験を組み合わせ,人間のメンタルローテーションをより正確にモデル化することを試みる。
    • 提案モデルは,画像から3次元空間表現を生成し,記号的なオブジェクト記述を導き出すことで,メンタルローテーションをシミュレーションする。
    • 実験結果は,モデルが人間のパフォーマンス,反応時間,行動をうまく捉えられていることを示唆する。
    • 各コンポーネントの重要性を示すアブレーションスタディにより,モデルの設計の妥当性が確認された。

    Link: https://arxiv.org/abs/2512.13517

  • 非滑らかな下モジュラ・凹関数におけるオフライン/オンラインMin-Max問題解決:零次オーダーアプローチ [math.OC, cs.LG, cs.NA, math.NA]目的:非滑らか下モジュラ・凹関数のMin-Max問題に対する零次オーダー手法の性能
    • 機械学習等の最適化問題において,非滑らかな関数への対応が不可欠である。
    • 下モジュラ・凹関数のMin-Max問題は計算が困難であり,効率的な解法が求められている。
    • 零次オーダー手法を用いて,この問題に対する効率的な解法を確立すること。
    • オフライン設定において,提案アルゴリズムは$\epsilon$-サドルポイントへ収束することが期待値で示された。
    • オンライン設定においては,アルゴリズムは$O(\sqrt{N\bar{P}_N})$のオンラインデュアリティギャップを達成することが示された。
    • 数値例を通して,理論的な結果の妥当性が確認された。

    Link: https://arxiv.org/abs/2601.21243

  • 集約モデルこそが重要度推定を改善する [stat.ML, cs.LG]目的:特徴量の重要度推定の精度向上
    • 機械学習モデルを科学的発見の道具とするための重要度推定の重要性が高まっている
    • モデルの表現力が高まると,データやアルゴリズムの変動により重要度推定が不安定になる
    • モデルレベルでの集約が,重要度推定における主要な誤差項を低減し,精度を向上させる
    • 理論的分析により,集約方法の選択はモデルの過剰リスクに強く依存することが示された
    • 先行研究とは異なり,モデルレベルでの集約が,特に表現力の高いモデルにおいて,より正確な重要度推定を提供する
    • 古典的なベンチマークとUK Biobankの大規模プロテオミクス研究で検証された

    Link: https://arxiv.org/abs/2602.11760

  • ニューラルネットワークポテンシャルを用いた高速分子動力学:蒸留型多時間ステップ法と非保存力 [physics.chem-ph, cs.LG]目的:分子動力学シミュレーションの高速化
    • 物質の構造やダイナミクス理解に不可欠であり,創薬や材料開発等,幅広い分野で応用が拡大している。
    • 高精度なシミュレーションは計算コストが大きく,大規模システムや長時間のシミュレーションが困難である。
    • ニューラルネットワークポテンシャルと蒸留型多時間ステップ法を組み合わせることで,計算効率を向上させ,シミュレーションの適用範囲を拡大する。
    • DMTS-NCスキームは,従来の保守的な手法と比較して,安定性と効率性が向上し,15-30%の速度向上を達成した。
    • 調整を必要とせず,実装が容易であり,システムの物理的な共鳴限界まで利用可能で,精度を維持しながら最大の効率を提供する。
    • 水素質量再配分や高水素摩擦を組み合わせることで,タイムステップを最大10fsまで拡張し,安定性と精度を維持した。

    Link: https://arxiv.org/abs/2602.14975

  • 異性化軸ベクトルによる不斉性相互作用設計の普遍化 [q-bio.BM, cs.LG]目的:Dペプチド結合体設計における不斉性普遍化
    • タンパク質設計は創薬において重要であり,特に新規ペプチド結合体の開発は困難な課題である。
    • Dペプチド結合体は有望だが,機械学習を用いた設計手法はLペプチドに偏っており,Dペプチドの設計は未開拓である。
    • 本研究は,不斉性を考慮した設計手法を開発し,Dペプチド結合体の設計を可能にすることを目的とする。
    • 軸ベクトルを導入することで,L-LデータからD-L設計への不斉性普遍化を実現した。
    • 潜在拡散モデルに実装し,既存ツールを上回るDペプチド結合体設計を達成した。
    • 設計したDペプチド結合体は,計算機シミュレーションと実験の両方で有効性が確認された。

    Link: https://arxiv.org/abs/2602.20176

  • 専門家への助言条件付きの学習による先延ばし [stat.ML, cs.LG]目的:学習による先延ばしにおける,助言の取得戦略
    • 複雑なタスクにおいて,人間は専門家へ判断を委ねることで効率化を図る。
    • 従来の学習による先延ばしは,専門家が利用する情報が固定されていると仮定する。
    • 助言を取得できる状況下での,最適な先延ばし戦略を確立すること。
    • 提案手法は,ルーティングと助言を同時に学習する複合的なモデルを採用し,理論的な一貫性を保証する。
    • 実験結果から,提案手法は標準的な学習による先延ばしを上回り,コストに応じて助言取得戦略を適応させることを確認した。
    • 分離型代理モデルの不整合と,提案手法の有効性を合成ベンチマークで検証した。

    Link: https://arxiv.org/abs/2603.14324

  • LUMINA:エネルギー調和プロトコルを用いたマルチベンダーマンモグラフィベンチマーク [eess.IV, cs.CV, cs.DB, cs.LG]目的:マルチベンダーマンモグラフィデータセットの構築と,エネルギー調和プロトコルの提案
    • マンモグラフィAIの信頼性向上には,多様なベンダーや撮影条件に対応したデータが不可欠である。
    • 既存のベンチマークデータセットは,ベンダーの多様性や臨床的注釈の点で十分ではない。
    • ベンダーやエネルギーによるドメインシフトの影響を軽減し,AIの汎化性能を高める。
    • LUMINAは,6種類の撮影システムと高・低エネルギーの画像を含む1824枚のマンモグラフィ画像を提供する。
    • エネルギー調和プロトコルは,アーキテクチャに依存せず性能を向上させ,Grad-CAMによる可視化も改善した。
    • EfficientNet-B0は診断で93.54%のAUC,Swin-Tは密度予測で89.43%のmacro-AUCを達成した。

    Link: https://arxiv.org/abs/2603.14644

  • ベイエス・ヒルベルト空間における流路回復の測定 [stat.ML, cs.LG, math.PR]目的:確率測度の流れの回復
    • 確率過程のモデリングは,物理学,工学,金融など幅広い分野で不可欠である。
    • 限られた数の観測データからの確率測度の正確な回復は,逆問題として困難である。
    • ベイエス・ヒルベルト空間を用いて,観測データからの確率測度の流れを安定的に回復すること。
    • ベイエス・ヒルベルト空間における経路を,各時間における重み付きノイマン問題を解くことで実現する。
    • 移動センサーの配置が,状態空間における回復可能性に影響を与えることが示された。
    • 有限次元への削減を通じて,陽なグラム行列条件を用いて回復可能性を評価できる。

    Link: https://arxiv.org/abs/2603.20329

  • AI加速の地球的コスト,第2部:10番目の惑星境界と6.5年間のカウントダウン [physics.soc-ph, cs.AI, cs.CY, physics.pop-ph]目的:AI加速に伴う地球への影響の評価
    • 地球環境の安定維持は人類の生存基盤であり,その限界を理解することが重要である。
    • AIの急速な発展に伴う熱の蓄積が,地球の生態系に深刻な影響を及ぼす可能性が懸念されている。
    • AIの規模拡大が地球規模の熱平衡を崩壊させる可能性を評価し,持続可能なAI開発への道筋を示す。
    • 大規模言語モデル(LLM)の急激な発展は,人間の認知能力を代替する可能性を示唆している。
    • AIによる熱の蓄積が地球の熱平衡を崩壊させるまでの時間が6.5年以内であると予測された。
    • AIの規模拡大を管理することで,他の惑星境界の安定化に貢献し,人類の生存を守ることができる可能性がある。

    Link: https://arxiv.org/abs/2604.04956

  • MEC:機械学習支援汎化エントロピー較正法による半教師あり平均推定 [stat.ML, cs.LG]目的:半教師あり平均推定における信頼性の高い不確実性定量化
    • 質の高いラベル取得は高コストだが,ラベルなし共変量は豊富であり,半教師あり推論の重要性が高まっている。
    • 予測力駆動推論(PPI)はモデルの誤指定により効率が低下し,ラベル再利用によるカバレッジ歪みが生じる可能性がある。
    • MECは,サンプル重み付けにより標本分布への適合性を高め,PPIの効率性とカバレッジを改善することを目指す。
    • MECは,クロスフィッティングと較正重み付けを用いて,PPIの改良版を提案する。
    • MECは,既存のPPI変種よりも弱い仮定下で半パラメトリック効率限界を達成する。
    • シミュレーションと実データ分析の結果,MECは公称カバレッジとより狭い信頼区間を示す。

    Link: https://arxiv.org/abs/2604.05446

  • 多専門家学習における拡張行動代理の限界を超えて [stat.ML, cs.LG]目的:学習遅延システムの性能向上
    • 複雑なタスクにおいて,専門家を活用することで精度向上や効率化が期待される。
    • 既存の学習遅延システムは,最適化の病理を抱え,専門家数が増えると性能が不安定になる。
    • 新しい学習遅延システムを提案し,専門家数増加時の安定性と性能維持を目指す。
    • 提案手法は,クラスと専門家を分離した新しい代理損失関数を用いることで,最適化の課題を克服した。
    • 理論的に,専門家数が増加してもリスクの上界が変化しないことを証明した。
    • 合成データおよび画像データセットでの実験により,提案手法が既存手法よりも安定し,性能が優れていることを示した。

    Link: https://arxiv.org/abs/2604.09414

  • 完全非マルコフ過程に対する最適確率制御のためのオフモデル学習と重要度サンプリング [stat.ML, cs.LG, math.PR]目的:完全非マルコフ過程における最適確率制御問題の学習方法
    • 経路依存や粗いボラティリティヘッジなど,現実の金融問題に適用可能な制御理論の基礎研究。
    • モデルパラメータが未知で,状態が過去の履歴に依存する非マルコフ過程の制御は困難である。
    • オフモデル学習と重要度サンプリングにより,パラメータ不確実性下での適応的な学習を可能にする。
    • 提案手法は,参照法則で生成された固定データセットと重要度サンプリングにより,オフモデル学習を実現する。
    • パラメータが固定の場合,深層ニューラルネットワークによる動的計画法の近似誤差に関して非漸近的な誤差限界を確立した。
    • 適応学習においては,モンテカルロ近似誤差とモデルリスク誤差を分離する定量的な評価を得た。

    Link: https://arxiv.org/abs/2604.13147

  • 二段階カーネルリッジ回帰による連続治療効果の推定 [stat.ME, cs.LG, stat.ML]目的:連続治療効果の推定
    • 医療や経済学など,因果推論は重要な課題であり,介入の効果を正確に評価する必要がある。
    • 治療割り当ては交絡因子に依存する場合が多く,単純な回帰分析ではバイアスが生じやすい。
    • 交絡を修正し,より正確な治療効果を推定する手法の開発。
    • 提案手法は,応答変数を治療と交絡因子の関数としてモデル化する二段階のカーネルリッジ回帰を用いる。
    • 第一段階で学習したモデルを用いて疑似アウトカムを生成し,分布シフトを補正することで,より正確な治療効果を推定する。
    • この推定器は,カーネルのスペクトル減衰やオーバーラップの程度といった未知のパラメータに対して適応性を示す。

    Link: https://arxiv.org/abs/2604.13410

  • 話者認識における説明可能なAI:潜在表現の理解可能性向上 [eess.AS, cs.AI, eess.SP]目的:話者認識における潜在表現の構造解明
    • 話者認識は,セキュリティや対話システムなど,幅広い分野で重要な技術である。
    • 深層学習モデルの判断根拠が不明瞭であり,信頼性や改善が困難である。
    • 潜在表現における階層的なクラスタリング現象を分析し,解釈可能性を高めることを目指す。
    • 話者認識ネットワークの潜在表現に対して,SLINKとHDBSCANという2つのクラスタリングアルゴリズムを適用し,階層的なクラスタリング現象を分析した。
    • 新しいアルゴリズムHCCMを提案し,階層クラスタを事前に定義された意味クラスにマッチングすることで,潜在表現に意味的な解釈を与えた。
    • クラスタと意味クラスの適合度を定量化する新しい指標Liebigスコアを開発し,マッチングを制限する要因の特定に貢献した。

    Link: https://arxiv.org/abs/2604.23354

  • インテリジェントエネルギー管理に向けたバッテリー状態予測のための深層学習モデル [eess.SP, cs.LG]目的:バッテリー状態予測モデルの開発と実装
    • 電気自動車や大規模蓄電システムなど,バッテリーの信頼性・安全性・効率的な運用は重要である。
    • バッテリーの劣化予測は難しく,リアルタイムでの健康状態監視やエネルギー管理に課題がある。
    • バッテリーの劣化動向を正確にモデル化し,最適なエネルギー資源配分を支援する。
    • 深層学習モデルがバッテリーの将来の状態と性能を予測するための計算フレームワークを提案した。
    • 大規模な訓練データセットと高度なニューラルネットワークアーキテクチャを統合することで,バッテリーの劣化を正確にモデル化できることを示した。
    • 提案手法は,予測的メンテナンスと効率的なエネルギー資源配分を可能にし,持続可能なエネルギー管理に貢献する可能性を示唆する。

    Link: https://arxiv.org/abs/2605.00898

  • 極端多クラスの教師ありコントラスト表現学習に対する洗練された一般化誤差解析 [stat.ML, cs.LG]目的:極端多クラスの教師ありコントラスト表現学習における一般化誤差の理論的解析
    • 機械学習の分野において,表現学習は性能向上に不可欠であり,コントラスト表現学習はその有力な手法の一つである。
    • 既存の研究では,データの独立性を仮定しているが,実際の応用ではラベル付きデータの有限集合からコントラスト対を構築するため,データ間に依存関係が生じる。
    • 極端多クラス環境下で,クラス分布の偏りが大きい場合でも,より現実的なサンプル複雑度を導出することを目的とする。
    • 本研究では,既存研究の解析を改善し,クラス分布に関わらずクラス数$R$に依存するサンプル複雑度の限界を証明した。
    • クラス間のリスク集中を捉える新しい推定器を提案することで,特に長尾分布を持つ極端多クラス学習において,より鋭い限界を達成した。
    • 提案手法のサンプル複雑度は,タプルあたりのサンプル数$k$に比例する$\mathcal{O}(k)$となる。

    Link: https://arxiv.org/abs/2605.07596

  • ベイジアン不確実性定量のための自己教師ありラプラス近似 [stat.ML, cs.AI, cs.LG, stat.CO]目的:ベイジアン予測分布の近似
    • モデルの予測精度向上には,予測における不確実性の定量が不可欠である。
    • 従来のベイジアン推論はパラメータ分布に焦点を当て,予測分布の直接的な近似が課題であった。
    • 自己予測データを用いた再学習により,計算効率の高い不確実性定量を目指す。
    • 提案手法SSLAは,古典的なラプラス近似よりも予測キャリブレーション性能が優れている。
    • SSLAは,様々な回帰タスクにおいて,シミュレーションデータと実データで有効性が確認された。
    • SSLAのモジュール構造により,事前分布の選択に対する感度分析が可能である。

    Link: https://arxiv.org/abs/2605.12208

  • 変動する専門家を持つオンライン学習-遅延 [stat.ML, cs.LG]目的:多クラス分類における,オンライン学習-遅延アルゴリズムの性能保証
    • 機械学習の応用範囲拡大のため,予測モデルと外部専門家を組み合わせた手法が重要視されている。
    • 実環境では,データが逐次的に到着し,専門家の可用性や分布が時間とともに変化する課題がある。
    • 変動する専門家環境下での効率的なオンライン学習-遅延手法を確立し,性能を理論的に保証すること。
    • 提案手法は,一般的な条件下で$O((n+n_e)T^{2/3})$のレグレット上界を達成する。
    • 低ノイズ条件においては,$O((n+n_e)\sqrt{T})$というより優れたレグレット上界が得られる。
    • 合成データと実データを用いた実験により,提案手法が変動する専門家環境下で有効であることが示された。

    Link: https://arxiv.org/abs/2605.12340

  • PACE:幾何学的知識に基づいた単一細胞軌道推論のためのブリッジ輸送 [q-bio.GN, cs.LG]目的:単一細胞の時間経過データからの軌道推論
    • 単一細胞解析は,細胞の振る舞いを理解する上で不可欠であり,疾患研究や発生生物学への応用が期待される。
    • 時間経過データの解析において,細胞間の対応関係や連続的な軌跡が直接観察できないという課題がある。
    • 非同期な発生過程や潜在的な擬似時間を考慮し,より正確な軌道推論を実現することを目指す。
    • PACEは,時間経過データから幾何学的に整合した連続的な輸送ダイナミクスを復元する。
    • 実験データと制御データセットにおいて,既存手法と比較して再構成性能が向上し,MMD,Wasserstein距離が平均23.7%減少した。
    • RNA速度アラインメントの精度も向上し,細胞対の明示的な情報や系統追跡なしに,高い性能を示した。

    Link: https://arxiv.org/abs/2605.18587

  • 多変量呼吸不全予測の予備的評価:胸部X線画像はEHR信号だけでは改善されないパフォーマンス向上に貢献するか? [math.CO, cs.MS, eess.IV, cs.AI, cs.LG]目的:呼吸不全の早期予測における多変量モデルの性能向上
    • 集中治療における呼吸不全の早期発見は,迅速な臨床介入に不可欠である。
    • 既存のEHRベースのモデルは生理学的変化をモニタリングするが,胸部X線画像に現れる肺病態を捉えきれない。
    • 胸部X線画像情報を統合することで,呼吸不全予測の精度を向上させることを目指す。
    • 本研究で開発されたゲート付き多変量モデルは,EHRのみのモデルと比較して高い識別能を示した(REMEDIS: 0.860,MedInsight: 0.858 vs. 0.752)。
    • 医師の予測と比較して,多変量モデルは感度を大幅に向上させつつ,特異度を維持した。
    • 多変量モデルは,EHRのみのモデルと比較して特異度と陽性的中率を高め,選択された患者においてリスク評価の精度を高める可能性を示唆した。

    Link: https://arxiv.org/abs/2605.26255

  • 極端な事象に対する因果推論:尾部を抑制するな [math.CO, cs.DM, math.NT, stat.ML, cs.LG]目的:連続的な処置に対する結果の反応を推定すること
    • 金融,気候変動など,高リスクな状況において極端な事象の予測は重要である。
    • 従来の因果推論手法は,安定性を高めるために極端な事象を抑制してしまう。
    • 尾部形状と処置ごとのテールリスク指標を推定し,極端な事象の予測精度向上を目指す。
    • 提案手法は,従来の回帰手法と比較して,深尾リスク指標の平均絶対誤差を大幅に削減した。
    • 特にサンプル数が少ない状況下において,その改善効果は顕著であった。
    • 保険金請求データ分析において,外挿拒否メカニズムが機能し,信頼性の高い予測を可能にした。

    Link: https://arxiv.org/abs/2605.27474

  • 時系列生成のための三角参照シュレーディンガー橋 [stat.ML, cs.LG, math.PR]目的:時系列生成のためのTR-SBTSモデルの構築
    • 時系列データのモデリングは,金融,気象,医療など,様々な分野で不可欠である。
    • 既存の時系列モデルは,複雑なデータ構造や非ガウス分布への対応に課題がある。
    • 潜在的なボラティリティレベルを持つ三角参照を用いて,よりロバストな時系列生成を目指す。
    • TR-SBTSは,ブラウン運動参照を階層的な潜在ボラティリティレベルに沿った凍結拡散参照に置き換えることで,SBTSフレームワークを拡張した。
    • このモデルは,状態空間上の単一のエントロピー射影として構成され,時間と潜在レベルに沿って制約が課される。
    • 実験により,TR-SBTSの有効性が確認された。

    Link: https://arxiv.org/abs/2605.27478

  • 大規模言語モデルの提供が生物多様性に与える影響の特性評価と理解 [q-bio.OT, cs.AI, cs.CY]目的:大規模言語モデル提供による生物多様性への影響の評価
    • AI技術の発展は環境負荷を増大させ,持続可能な社会への移行を阻害する恐れがあるため。
    • LLM提供による環境影響評価は,二酸化炭素や水資源に焦点が当たり,生物多様性への影響は軽視されてきた。
    • LLM提供に伴う生物多様性への影響を定量化し,品質を考慮したトレードオフを明らかにすること。
    • BIRDSフレームワークにより,リクエストレベルでの機能単位に基づき,LLM提供における生物多様性への影響を定量化できることが示された。
    • 実験の結果,生物多様性への影響は規模とともに蓄積し,品質を考慮した提供方法の選択が重要であることが明らかになった。
    • 品質正規化生物多様性影響(QNBI)を用いることで,生態学的影響と応答品質を同時に分析できることが示された。

    Link: https://arxiv.org/abs/2605.27480

  • オフポリシー評価による保険価格最適化 [stat.ML, cs.LG, q-fin.RM, stat.AP]目的:保険価格最適化
    • 保険は経済活動の根幹であり,適切な価格設定は安定的な運営に不可欠である。
    • 従来の価格設定は公平性を重視するが,顧客の価格感受性を考慮していない点が課題である。
    • 顧客の価格感受性を考慮した,より収益性の高い価格設定手法を確立することを目指す。
    • オフポリシー評価と確率的制御のツールを用いて,保険価格を意思決定問題として定式化した。
    • カーネル化逆確率スコア推定器により,古典的な推定器よりも分散を低減できることを示した。
    • データ共有Lassoとニューラルネットワークを用いた最適な価格設定ルールの算出アプローチを提案・検証した。

    Link: https://arxiv.org/abs/2605.28327

  • 確率的ブロックモデルにおける効率的な推論とモデル選択のための最尤法と最適輸送の統合 [stat.ML, cs.LG, math.ST, stat.TH]目的:確率的ブロックモデルにおける推論とモデル選択
    • 複雑なネットワーク構造を解析する上で重要な手法であり,コミュニティ検出などに応用される。
    • 最尤法では,疎な輸送計画が得られず,モデル選択が困難になるという課題がある。
    • 疎なクラスタープロポーションを促進し,有限サンプルにおける信頼性の高いモデル選択を目指す。
    • 最適輸送の視点から最尤法を解釈することで,正確なクラスタリングが可能になることが示された。
    • 無制約のsrGW推定器は,漸近的に接続行列と潜在的クラスター割り当てを復元することが証明された。
    • 正則化された定式化を用いることで,モデルパラメータの復元とクラスター数の選択を同時に行うことが可能になった。

    Link: https://arxiv.org/abs/2605.28488

  • 嗜好形状化期待ハイパーボリュームおよびR2改善:厳密計算と単調性 [math.OC, cs.AI, cs.NE]目的:ベイズ多目的最適化における嗜好形状化期待改善基準
    • 多目的最適化は,複数の目的関数を同時に最適化する手法であり,現実の問題解決に不可欠である。
    • 期待改善基準の厳密計算は計算コストが高く,大規模問題への適用が困難である。
    • 厳密計算を可能とする嗜好変換と,その幾何学的性質の解明を目指す。
    • ハイパーボリューム指標とR2指標の幾何学的差異を明確化し,どの嗜好変換が厳密計算,パレート適合性,単調性を維持するかを明らかにした。
    • 積分R2改善が,一般的に目的空間における加重ハイパーボリュームと等価ではないことを証明した。これは次元の制約によるものである。
    • 積分R2改善は,スカラー化空間における体積,すなわち現行スカラー化エンベロープと基準エンベロープ間のチェビシェフ影の測度として表せることを示した。

    Link: https://arxiv.org/abs/2605.28746