arXiv雑要約

AI - 2026/05/12 公開

  • 高エントロピー合金のエネルギー予測のための結晶フラクショナルグラフニューラルネットワーク [physics.comp-ph, cond-mat.mtrl-sci, cs.AI]目的:高エントロピー合金のエネルギー予測
    • 高エントロピー合金は,複雑な原子配置に起因する優れた機械的・熱的特性を持つため注目されている。
    • 従来の材料設計では,組成の複雑さからエネルギー予測が困難であった。
    • 本研究は,原子環境と組成情報を統合することで,より正確なエネルギー予測を目指す。
    • 本モデルは,第一原理計算と同等のRMSEを達成し,低エネルギー構造に対しても高い精度を維持する。
    • 結晶グラフニューラルネットワークとフラクショナルニューラルネットワークを組み合わせることで,局所的な原子相互作用と全体的な組成情報を効果的に活用する。
    • 大規模な結晶セルへの対応が課題として残るが,より複雑な系への適用を目指し,今後の研究で改善を図る。

    Link: https://arxiv.org/abs/2605.08103

  • 人間行動認識のためのモジュール型検索拡張汎化 [eess.SP, cs.CV, cs.LG]目的:人間行動認識における汎化性能の向上
    • 活動認識は,健康管理やヒューマンコンピュータインタラクション等,多様な応用分野で重要性が増している。
    • IMUデータを用いた活動認識は,学習データ不足や知識の静的利用が課題であり,実用化の妨げとなっている。
    • 本研究は,学習データが少ない状況下でも頑健な認識を可能にするための手法を提案する。
    • 提案手法MoRAは,既存の活動認識モデルに容易に組み込むことができ,推論効率を維持しつつ認識性能を向上させる。
    • MoRAは,検索結果の情報冗長性や融合戦略の硬直性を解消するため,不確かさ適応型融合ユニットを導入している。
    • 10種類の現実世界のデータセットを用いた実験により,MoRAが既存のIMUベースの活動認識モデルの性能を大幅に向上させることが示された。

    Link: https://arxiv.org/abs/2605.08117

  • 科学実験におけるソース安定性の予測:重水素中性子実験における事例研究 [physics.ins-det, cs.AI, cs.LG]目的:科学実験におけるソース安定性予測手法の開発
    • 高精度な科学実験において,安定した実験環境の維持は不可欠である。
    • 気体トリチウムソースのような不安定要素の変動を,従来の検出方法では捉えきれない場合がある。
    • 深層学習モデルを用いて,ソース安定化までの時間を予測し,実験効率を向上させる。
    • LSTM,N-BEATS,TFTなど複数の時系列予測モデルを実験データに適用した結果,N-BEATSが最も高い予測精度と再現性を示した。
    • スパースな不安定事象からの学習と,長期間の予測という,時系列予測における課題を克服する可能性を示した。
    • 本研究は,深層学習が大規模物理実験の最適化に貢献し,計画的な実験運用を可能にすることを示唆する。

    Link: https://arxiv.org/abs/2605.08140

  • レーダー探査データからの地形パラメータのニューラル事後推定 [eess.SP, cs.CY, eess.SP, astro-ph.IM, cs.LG]目的:地形パラメータ推定手法
    • 惑星探査において,地下構造の解明は重要な課題である。
    • 従来の解析手法は近似に依存し,パラメータ間の相関やノイズの影響を無視しがちである。
    • レーダー探査データのより正確な解析と,パラメータの不確実性の評価を目指す。
    • 本研究では,GPUを用いたシミュレータとニューラルネットワークに基づく密度推定器を組み合わせることで,地形パラメータの事後推定を実現した。
    • 提案手法はシミュレーションデータにおいて高い精度を示し,火星の実際のレーダープロファイルにも適用可能であることが確認された。
    • 参照面の変動に対する事後分布の頑健性を体系的に評価する枠組みを構築した。

    Link: https://arxiv.org/abs/2605.08179

  • 閉ループ神経刺激のためのTMS EEG信号品質改善:ソースドメインノイズ除去による手法 [eess.SP, cs.AI]目的:TMS EEG信号品質の向上
    • TMS-EEGは,皮質活動の理解と臨床応用を拡大する可能性を持つ。
    • TMS-EEG信号には人工物が含まれており,信号品質が課題となっている。
    • 信号品質を向上させ,信頼性の高いデータ分析を実現すること。
    • 提案された前処理ワークフローの堅牢性が確認された。
    • 信号品質の向上とTMS誘発電位の保持に対するソースベースのノイズ除去手法の有効性が示された。
    • 本研究は,研究および臨床応用の両方におけるデータ信頼性の向上に貢献する。

    Link: https://arxiv.org/abs/2605.08184

  • 自己回帰モデルにおけるテスト時適応のためのエントロピー最小化の再考 [eess.AS, cs.AI, cs.LG]目的:自己回帰モデルに対するテスト時適応におけるエントロピー最小化の理論的枠組み
    • 音声認識等の生成モデルにおいて,未知のデータへの適応は重要課題である。
    • 既存手法は経験則に頼る部分が多く,統一的な数学的根拠に乏しい。
    • 自己回帰モデルに特化したエントロピー最小化の厳密な定式化を提示し,問題を解決する。
    • エントロピー最小化の目的関数が,トークンレベルのポリシー勾配損失とエントロピー損失に自然に分解されることを示した。
    • 既存手法が,この統一的な定式化の部分的な実現であると解釈できることを明らかにした。
    • Whisper ASRを用いた実験で,20以上の多様なドメインにおいて性能が向上した。

    Link: https://arxiv.org/abs/2605.08186

  • 空力圧力計測に基づく解釈可能な損傷検出への取り組み [eess.SP, cs.LG]目的:空力圧力計測を用いた損傷検出手法の開発
    • 風力タービンの大型化に伴い,構造健全性監視の重要性が増している。
    • 従来の構造監視はコストや信頼性の面で課題があった。
    • 空力圧力計測に基づき,透明性・堅牢性を高めた損傷検出を目指す。
    • 空力圧力計測データのみで,損傷の検出と重症度分類が可能であることが示された。
    • 損傷が動的応答と空力圧力分布に与える影響を解釈するための物理に基づく知見と説明可能な機械学習手法を導入した。
    • これにより,データ駆動型監視における透明性,堅牢性,物理的一貫性を向上させることを目指している。

    Link: https://arxiv.org/abs/2605.08187

  • ウェアラブル心電図信号におけるハイブリッドTransformerを用いたドメイン適応性不整脈分類 [eess.SP, cs.LG]目的:ウェアラブル心電図信号を用いた不整脈の分類
    • 心血管疾患は世界的な死因の第一位であり,継続的なモニタリングが重要である。
    • 臨床用ECGデータで訓練されたモデルをウェアラブルデバイスに適用する際,ドメインシフトにより性能が低下する。
    • ドメインシフトの影響を軽減し,ウェアラブルデバイスデータでの汎化性能を向上させる。
    • 提案モデルは,連続心電図信号と7つの心拍変動指標を同時に処理することで,高い分類性能を実現した。
    • MMDを用いてドメイン間の特徴分布を揃えることで,ドメイン適応性を高めた。
    • 未知のドメインデータに対するF1-macroスコアは95%と高く,汎化性能が確認された。

    Link: https://arxiv.org/abs/2605.08199

  • どこからどこへのチャネルゲインをクロス環境Transformer推定器で学習 [eess.SP, cs.IT, cs.LG, math.IT]目的:チャネルゲインマップ推定手法
    • 無線通信システムの効率的な運用に不可欠であり,資源配分や干渉制御,自律走行車の経路計画等に応用される。
    • 従来の無線マップ推定法と比較して,6次元入力空間への関数であるため推定が困難である。
    • 複数の環境で収集した測定値から共通の空間構造を暗黙的に学習し,新たな環境での測定回数を削減する。
    • 提案手法は,既存手法と比較して,少ない測定回数(実験では5分の1)でチャネルゲインマップ推定を可能にする。
    • Transformerと特徴マップを組み合わせることで,CGMEの不変性(例:相互性)を効率的に学習する。
    • 数値実験により,提案推定器の有効性が確認された。

    Link: https://arxiv.org/abs/2605.08211

  • グレー スケール拡散と柔軟なSパラメータ条件付けによる多層サブピクセル解像度RF受動部品の逆設計 [eess.SP, cs.LG]目的:SパラメータからのRF受動部品の逆設計
    • RF受動部品は無線通信システムの基本要素であり,高性能化が不可欠である。
    • 従来の逆設計手法は,単層のバイナリ金属化構造に限られ,複雑な設計に対応できない。
    • 本研究は,多層構造と高精度な金属化を可能にし,複雑なRF受動部品の設計を支援する。
    • 提案手法は,64x64ピクセルで離散化された8x8mm基板上で,1~20GHzの範囲でサブピクセル解像度のグレー スケール金属化による2層銅レイアウトを生成する。
    • 生成された設計候補は数秒で得られ,予測されたSパラメータは目標値に対し,0.77 ± 1.28 dBの加重平均絶対誤差で一致する。
    • 実際にRO4003Cで2つの設計を試作し,製造ルールに違反するヘアピンフィルタの代替案や,Sパラメータのみから設計されたコームラインバンドパスフィルタの有効性を示した。

    Link: https://arxiv.org/abs/2605.08233

  • イギリス国民栄養調査データを用いた食事パターンの発見のための説明可能な教師なし学習から教師あり学習へのフレームワーク [q-bio.QM, cs.AI, cs.LG]目的:食事パターン発見のための説明可能な機械学習フレームワーク
    • 国民の健康増進のためには,食生活の改善が不可欠であり,食事パターン分析はそのための重要な手段である。
    • 臨床的な食事評価は詳細な情報を提供するものの,その高次元性から迅速なカウンセリングへの展開が困難である。
    • 食事パターンを自動的に発見し,解釈可能性を高めることで,栄養指導の効率化を目指す。
    • K-means法による解析の結果,4つの解釈可能な食事パターンが特定された。
    • 高脂肪・高肉食と高ナトリウム,高食物繊維・果物・野菜,高遊離糖・スナックと砂糖入り飲料,乳製品・穀物・カルシウム豊富な飽和脂肪のパターンが明らかになった。
    • 教師あり学習によるクラスタ分類の再現性は高く,栄養士による個別化された食事指導への応用が期待される。

    Link: https://arxiv.org/abs/2605.08242

  • SLayerGen:あらゆる空間群および層群に対する結晶生成モデル [cond-mat.mtrl-sci, cs.AI]目的:空間群または層群に対して不変制約のある結晶の生成
    • 材料探索の加速は,社会の発展に不可欠であり,計算科学による効率化が求められている。
    • 従来の結晶生成モデルは,周期構造を持つバルク材料に偏っており,2次元材料など非周期性を持つ材料への適用が困難であった。
    • 層群を考慮した結晶生成モデルを開発し,2次元材料などの新しい材料の設計を支援する。
    • SLayerGenは,粗い構造から細かい構造へと段階的に結晶格子を生成し,空間群や層群の対称性を考慮した原子配置を行う。
    • 損失関数の不整合を修正することで,六方晶系における生成精度を向上させた。
    • バルク材料生成モデルと比較して,SLayerGenは非周期性材料の生成において優れた性能を示した。

    Link: https://arxiv.org/abs/2605.08262

  • 量子化モデル交換による分散型新規性検出 [stat.ML, cs.IT, cs.LG, eess.SP, math.IT, stat.ME]目的:分散環境における新規性検出の枠組み
    • プライバシー保護や通信コストの制約下でのデータ分析の重要性が高まっている。
    • データの共有が困難な状況下では,グローバルな誤検出率制御が課題となる。
    • 量子化モデル交換により,効率的な分散型新規性検出と誤検出率制御を実現する。
    • 提案手法は,量子化された代替モデルの交換によって,ローカルに学習された非適合性スコア関数の低精度表現を共有する。
    • この手法は,条件付き交換可能性を維持し,グローバルな誤検出率制御のための厳密な有限サンプル保証を提供する。
    • シミュレーション実験の結果,提案手法は競争力のある統計的検出力を維持しつつ,通信コストを大幅に削減できることが示された。

    Link: https://arxiv.org/abs/2605.08263

  • cGANベースラインによる画像品質向上とベンチマークのためのPoint-of-Care超音波ペアデータセット [eess.IV, cs.AI, cs.CV]目的:Point-of-Care超音波(POCUS)画像の品質向上
    • 迅速かつ低コストなPOCUSは,医療現場での診断ニーズが高まっている。
    • POCUSの画像品質は,高額な診断用超音波装置に比べて劣ることが課題である。
    • 低価格帯POCUS画像の品質を,深層学習を用いて向上させることを目指す。
    • 提案手法により,SSIMが0.29から0.54へ,PSNRが19.16dBから22.41dBへと改善した。
    • 参照不要指標においても画像品質が向上し,NIQEとPIQEスコアがそれぞれ低下した。
    • 本研究は,低価格帯POCUSと高画質超音波画像のペアデータセットを公開し,POCUSの診断価値向上に貢献する。

    Link: https://arxiv.org/abs/2605.08282

  • 全身mmWaveスキャンによる非侵襲的体組成評価 [eess.IV, cs.LG]目的:体組成評価の実現
    • 個別化医療において,BMI等より詳細な体組成情報は重要である。
    • CTやMRI等の既存手法は,日常的な利用には不向きである。
    • mmWaveスキャンを用いて,簡便な体組成評価を実現する。
    • mmWaveスキャンから,体脂肪率と皮下脂肪量を推定可能であることを示した。
    • 推定された皮下脂肪量と体脂肪率の平均絶対誤差は,それぞれ1.0Lと3.2%であった。
    • mmWaveスキャンが,幅広い環境での日常的な体組成評価に役立つ可能性を示唆する。

    Link: https://arxiv.org/abs/2605.08306

  • FQPDR:プライバシー保護のための糖尿病性網膜症早期検出のための連合量子ニューラルネットワーク [eess.IV, cs.AI, cs.LG]目的:糖尿病性網膜症のプライバシー保護早期検出
    • 糖尿病性網膜症は失明の原因となりうるため,早期発見が重要である。
    • 微小な異常の検出が難しく,特に初期の糖尿病性網膜症の診断は困難である。
    • 患者データ共有リスクを回避しつつ,早期発見の精度向上を目指す。
    • 提案手法FQPDRは,限られたデータと少ない学習パラメータで良好な性能を示した。
    • FQPDRは既存の非連合学習および連合学習手法と比較して有望な結果を示唆する。
    • Kaggleデータセットでの評価により,軽量な学習モデルの堅牢性が確認された。

    Link: https://arxiv.org/abs/2605.08324

  • CAMAL:セグメンテーションマスクを用いた注意機構の整合性と信頼性の向上 [eess.IV, cs.AI, cs.LG]目的:視覚モデルにおける注意機構の整合性と信頼性の改善
    • 画像認識の精度向上には,モデルが画像中の重要な領域に注意を向けることが不可欠である。
    • 既存手法では,注意機構が必ずしも正しく機能せず,解釈可能性が低い場合がある。
    • セグメンテーションマスクを活用し,注意機構の空間的な正確性と因果的意味を向上させる。
    • CAMALは,深層学習および深層強化学習の両方の学習パラダイムにおいて,注意機構の整合性と信頼性を一貫して向上させた。
    • 特に,注意機構の整合性に関して統計的に有意な改善が見られ,信頼性は最近の研究と比較して35%以上向上した。
    • 注意機構の整合性と信頼性の向上は,解釈可能性を高め,汎化性能を維持または向上させた。

    Link: https://arxiv.org/abs/2605.08325

  • 量子近似最適化のための層別パラメータ調整による最適FALQON [quant-ph, cs.AI]目的:量子近似最適化のためのFALQONの最適化手法
    • 量子コンピュータは,古典コンピュータでは困難な問題を解決する可能性を秘めている。
    • ノイズ中間規模量子(NISQ)デバイスにおける最適化は,パラメータ設定の難しさから課題が多い。
    • FALQONの層別パラメータを最適化し,収束速度と解の質を向上させる。
    • 提案手法Optimal FALQONは,標準的なFALQONと比較して,成功確率,評価効率,コストにおいて統計的に有意な改善が見られた。
    • 3次正則グラフ12個の頂点を持つ全94種類の非同型グラフにおいて,その有効性が確認された。
    • QAOAをOptimal FALQONのパラメータで初期化することで,固定初期化よりも優れたウォームスタート性能が得られた。

    Link: https://arxiv.org/abs/2605.08332

  • 時間伸縮型再帰ニューラルネットワークを用いた死んだ燃料水分予測の転移学習 [stat.AP, cs.LG]目的:死んだ燃料水分量の予測
    • 森林火災の予測において,燃料水分量は重要な要素である。
    • 燃料水分量の種類によっては,観測データが不足している場合がある。
    • 既存のデータを用いて,他の燃料水分量の予測精度を向上させる。
    • 時間伸縮により,再帰ニューラルネットワークの学習済みのダイナミクスを転移させる手法を提案した。
    • 10h燃料のデータで事前学習したRNNを,1h,100h,1000h燃料の水分量予測に適用した。
    • オクラホマ州の現地研究データを用いて検証し,良好な予測結果が得られた。

    Link: https://arxiv.org/abs/2605.08379

  • 潜在ホークスネットワーク復元のための観測時間について [math.ST, cs.IT, cs.LG, math.IT, stat.ML, stat.TH]目的:潜在ホークスネットワークの復元に必要な最小観測時間
    • 工学,社会,自然界における相互作用システムのダイナミクス理解に不可欠である
    • イベントベースの観測データからのネットワーク推論は理論的根拠が乏しい
    • エンティティ数dに対する観測時間の理論的限界を明らかにすること
    • 疎な弱結合を持つ定常ホークス過程において,観測時間log dが復元に十分かつ必要条件であることが示された。
    • 二段階推定器(クリッピングとビニングによるスクリーニング,最小二乗法による改良)を構築し,ポアソンクラスター表現を用いた濃度不等式を適用した。
    • Fanoの不等式とJacodのGirsanov公式を組み合わせ,適切なサブクラスのネットワークに対して下限を導出した。

    Link: https://arxiv.org/abs/2605.08400

  • 活性多重予測駆動推論 [physics.med-ph, cs.HC, math.OC, cs.SY, eess.SY, stat.ML, cs.LG, stat.ME]目的:医療AIの展開後モニタリングにおける,統計的に妥当でラベル効率の良い手法の開発
    • 医療AIの導入は進むが,実運用での継続的な評価には高品質なラベルデータが必要不可欠である。
    • 医師によるラベル作成はコストが高く,十分な量のラベルデータを確保することが課題である。
    • 複数の予測モデルを活用し,コストと精度に応じてモデルを選択することで,ラベルコストを削減すること。
    • 提案手法AM-PPIは,各インスタンスを適切なコストの予測モデルサブセットにルーティングし,残差不確実性に比例してゴールドスタンダードラベルをサンプリングする。
    • AM-PPIは,複数の予測モデルを活用するASIを一般化し,予測モデルのグローバルな割り当てからインスタンスごとの適応ルーティングへと拡張する。
    • 合成データと3つの医療モニタリングタスクにおいて,AM-PPIはルーティングが重要な予算内で,単一予測モデルASIよりも10〜40%狭い信頼区間を達成した。

    Link: https://arxiv.org/abs/2605.08429

  • シンコーン処置効果:因果最適輸送の尺度 [math.OC, cs.SY, eess.SY, stat.ML, cs.LG, math.ST, stat.ME, stat.TH]目的:反実仮想分布間の乖離を測る尺度
    • 因果推論において,処置効果をより詳細に把握する重要性が高まっている。
    • 従来の平均処置効果では,分布全体の差を捉えきれないという課題がある。
    • 分布レベルでの処置効果を捉え,統計的推論を可能にすることを目標とする。
    • シンコーン処置効果は,反実仮想分布間の乖離を捉えるためのエントロピー最適輸送尺度として導入された。
    • この尺度は,反実仮想平均埋め込みの滑らかな変換として表現され,一階および二階の経路微分可能性が示された。
    • これにより,偏りの少ない推定量と,分布処置効果の仮説検定が可能となり,実験によってその実用性が確認された。

    Link: https://arxiv.org/abs/2605.08485

  • 一様安定性のための統一されたLyapunov-IQCフレームワーク:滑らかな二次加速最適化アルゴリズム [math.OC, cs.LG]目的:滑らかで二次加速された一次最適化アルゴリズムの一様安定性の確立
    • 最適化アルゴリズムの安定性は,機械学習モデルの収束性や汎化性能に直接影響するため重要である。
    • 従来の安定性解析では,ランダムサンプリング下での反復差の制御に依存し,加速法への拡張が困難であった。
    • 本研究は,Lyapunov関数とロバスト制御理論に基づく統一的フレームワークにより,加速法の一様安定性の検証を可能にする。
    • 本研究では,滑らかな二次NAGに対する一様安定性境界をLyapunov関数を用いて導出した。
    • 一次加速最適化アルゴリズムを,線形ダイナミカルシステムと勾配演算子の間のLure型フィードバック接続としてモデル化した。
    • 一様安定性は,有限次元線形行列不等式(LMI)を満たす二次Lyapunov関数の存在によって検証され,半定値計画法(SDP)で解ける。

    Link: https://arxiv.org/abs/2605.08488

  • スライスされた内積グロモフ・ワッサースタイン距離 [q-bio.QM, cs.MS, q-bio.BM, stat.ML, cs.LG, math.OC]目的:異質データの幾何学的構造のマッチング
    • 高次元データに対する統計的・計算的なスケーラビリティが課題である。
    • ワッサースタイン距離と異なり,1次元では閉じた形の解が得られない。
    • 内積コストを持つグロモフ・ワッサースタイン距離のスライス化を実現する。
    • 提案手法は自然な回転不変性を持つスライスされた内積グロモフ・ワッサースタイン距離を提供する。
    • その構造的・計算的特性に関する包括的な研究を行った。
    • テキストデータクラスタリングや言語モデル表現比較への応用も示された。

    Link: https://arxiv.org/abs/2605.08546

  • 高次元多成分ICAにおける学習性と競合 [stat.ML, cs.LG]目的:高次元多成分ICAにおける学習過程の理論的解析
    • 非教師型表現学習の基盤技術であり,多様な応用が期待されている。
    • 高次元における多成分ICAの理論的解明は長年の課題であった。
    • 初期値依存性に着目し,学習性と競合のメカニズムを解明する。
    • 高次元ICAにおいて,学習推定値と真の成分の分布が決定的なプロセスに収束することが示された。
    • 初期値の重複が直交性制約による競合を引き起こし,学習の遅延や収束性に影響することが明らかになった。
    • ステップサイズ,データモーメント,初期化条件が学習境界や競合条件を決定することが示された。

    Link: https://arxiv.org/abs/2605.08552

  • ヒルベルト空間上の凸Lipschitz関数の有限サンプルからの構造保存再構成 [math.FA, cs.LG, cs.NA, cs.NE, math.NA, math.OC]目的:凸関数の再構成手法
    • 応用分析において,凸関数は価値関数,リスク尺度,損失関数等として広く利用され,重要性が高い。
    • 有限の点評価のみから関数を推定するため,精度と効率性の課題が存在する。
    • 有限サンプルから,凸性とLipschitz連続性を維持しつつ高精度な再構成を可能にすること。
    • コンパクト凸集合上のL-Lipschitz凸関数に対し,任意の精度で再構成可能な明示的な公式を構築した。
    • 再構成は,有限個の線形測定とReLU-MLPによって実現可能である。
    • 本研究に基づき,自動的に凸かつLipschitzな性質を持つ新しいニューラルネットワーク構造(CNF)を提案した。

    Link: https://arxiv.org/abs/2605.08559

  • CONTRA:正規化フロー変換による適合予測領域 [stat.ML, cs.LG]目的:多次元出力に対する信頼性のある予測領域の生成
    • 教師あり・教師なし学習において,密度推定と信頼性のある予測領域が重要である。
    • 従来の適合予測は,多次元出力において,一次元の非適合性スコアに依存するため,性能が制限される。
    • 正規化フローの潜在空間を利用し,中心からの距離に基づく非適合性スコアを定義することで,この問題を解決する。
    • CONTRAは,潜在空間の高密度領域を出力空間のシャープな予測領域にマッピングすることで,従来の予測領域よりも優れた性能を示す。
    • 残差に対する単純な正規化フローを学習させることで,他の予測モデルにも適用可能である。
    • 実験により,CONTRAとその拡張は,保証されたカバレッジ確率を維持し,様々なデータセットで既存手法を上回ることが示された。

    Link: https://arxiv.org/abs/2605.08561

  • ネットワーク上の大規模言語モデル:リソース制約下における協調的知能 [physics.soc-ph, cs.SI, eess.SP, cs.DC, cs.LG, cs.MA]目的:リソース制約下における協調的知能の実現
    • 社会の様々な分野で大規模言語モデルの利用が拡大しており,その重要性は増している。
    • クラウドベースのLLMサービスだけでは,接続性や遅延,データ所在地などの制約に対応できない。
    • デバイスとクラウドを連携させ,複数LLMの協調により,これらの課題を克服することを目指す。
    • 本研究では,デバイスとクラウド間の垂直的な協調と,複数エージェント間の水平的な協調という2つの次元を提案した。
    • これらの協調を組み合わせることで,多様なリソース制約下で高品質な応答を実現できるハイブリッドな構成が可能となる。
    • ルーティングポリシーの学習や,LLM間の協調能力の開発といった,協調学習についても検討を行った。

    Link: https://arxiv.org/abs/2605.08626

  • 実験プラズマ装置における診断再構成と解析のためのエネルギーベースモデル [physics.plasm-ph, cs.LG]目的:実験プラズマデータの確率分布学習
    • プラズマ物理学は非線形現象が多く,複雑な解析が課題である。
    • 従来の解析手法では,プラズマ装置の状態空間の探索が困難である。
    • エネルギーベースモデルを用いて,診断データの再構成と解析を効率化する。
    • エネルギーベースモデルは,実験プラズマ装置の診断データを再構成し,その精度を向上させることを示した。
    • このモデルは,プローブ位置の逆問題を解決し,データ内の対称性を明らかにした。
    • 機械条件に基づいた条件付きサンプリングにより,診断信号の傾向を推測することが可能となった。

    Link: https://arxiv.org/abs/2605.08645

  • コア・ヘイロー分解:大規模固定点問題の分散化 [stat.ML, cs.AI, cs.LG, cs.NA, math.NA]目的:大規模固定点方程式の分解による解法
    • 機械学習や最適化において,大規模な問題を効率的に解くことは重要である。
    • 従来の分散化手法では,局所的な更新のみに依存し,構造的な偏りが生じやすい。
    • コア・ヘイロー分解は,この偏りを解消し,中央集権的な性能に匹敵する分散解法を提供する。
    • コア・ヘイロー分解は,各エージェントが自身のコアを更新し,重複するヘイローから読み出すことで,元の固定点問題を忠実に実装する。
    • 厳密な分解が引き起こす構造的な偏りを,ベルマン閉包条件とブロックごとの偏り下限を通じて理論的に明らかにした。
    • 広範な実験により,コア・ヘイロー分解が分散化の利点を維持しながら,ほぼ中央集権的な性能を達成することを示した。

    Link: https://arxiv.org/abs/2605.08681

  • カノニカル拡散によるモード分離の測定と分解 [eess.IV, cs.ET, cs.MM, stat.ML, cs.LG, math.PR]目的:分布の分離度合いの定量化
    • 高次元データにおける分布の幾何学的性質の理解は,機械学習や統計物理学において重要である。
    • 既存の手法では,拡散や分散といった性質とモード分離を区別することが困難であった。
    • 密度に内在する確率過程を通じてモード分離を定量的に測定し,その構造を解析することを目指す。
    • 提案手法であるSSA(二乗自己相関の合計)は,互いに遮断されたクラスター間の障壁の存在に敏感であり,モード分離を捉えることができた。
    • DA(主要な自己相関方向)は,分散ではなくメタ安定性に基づいて方向を決定し,安定した構造を捉えることができた。
    • SDXL画像生成やアラニンジペプチドの分子動力学シミュレーションへの適用により,既存手法では捉えきれなかった構造が明らかになった。

    Link: https://arxiv.org/abs/2605.08777

  • Transformerの学習理論:ソフトマックスの分割単位による局所から大域への近似 [stat.ML, cs.LG]目的:Transformerネットワークの学習理論
    • 深層学習モデルの理論的理解は,性能向上と信頼性確保に不可欠である。
    • Transformerの汎化性能は理論的に理解が十分とは言えず,過学習のリスクがある。
    • Transformerの近似能力と汎化性能を数学的に保証することを目指す。
    • Transformerは,ソフトマックス分割単位を用いて局所近似を大域的な近似に集約する。
    • 2層のエンコーダーブロックを持つTransformerは,$\alpha$-H\"older連続関数に対して$\mathcal{O}(\varepsilon^{-d/\alpha})$パラメータで一様$\varepsilon$-近似誤差を達成する。
    • 実証リスク最小化の汎化誤差は,$\mathcal{O}\big(n^{-\frac{2\alpha}{2\alpha+d}} \log n\big)$の近ミニマックス最適境界を持つ。

    Link: https://arxiv.org/abs/2605.08811

  • ローカルLMO:局所線形最小化オラクルによる制約付き勾配最適化 [math.OC, cs.LG, stat.ML]目的:制約付き最適化問題における,新たな射影不要な勾配型手法の開発
    • 最適化問題は,機械学習,工学,経済学など幅広い分野で基盤となる技術である。
    • 既存手法では,制約条件の取り扱いが難しく,特に大規模問題において計算コストが高い場合がある。
    • 局所的な線形最小化オラクルを用いることで,計算効率を向上させ,既存手法の限界を克服する。
    • 提案手法Local LMOは,制約条件を満たす範囲内での局所的な線形最小化を繰り返し行うことで,最適解に近づく。
    • Local LMOは,制約集合が有界である必要がなく,既存のFrank-Wolfe法よりも広い範囲で理論的な収束性が保証される。
    • 滑らかで強凸な関数に対しては線形収束率を,凸関数に対しては標準的な劣線形収束率を達成することを示した。

    Link: https://arxiv.org/abs/2605.08850

  • ノイズのない逆最適化におけるタイトな一般化限界 [eess.SP, cs.AR, stat.ML, cs.LG, math.OC]目的:意思決定者の目的関数のパラメータ推定
    • 行動経済学や機械学習において,人間の意思決定をモデル化する上で重要である。
    • 観測データから目的関数を正確に推定することが困難であり,過学習のリスクがある。
    • データ量に対する一般化性能の理論的限界を明確にすること。
    • ノイズのない逆最適化において,誘起された行動集合に対する高確率でO(d/T)の一般化限界が導出された。
    • 特定の条件下では,この限界は最良腕識別結果と同等の保証を提供する。
    • 提案されたO(d/T)のレートは,考慮された一貫性のある推定器に対してタイトであることが示され,瞬時および累積リグレットの両方に対して拡張された。

    Link: https://arxiv.org/abs/2605.08866

  • Rennala MVR:モーメンタムに基づく分散減少による並列確率的最適化の時間計算量の改善 [math.OC, cs.DC, cs.LG, stat.ML]目的:並列確率的最適化の時間計算量改善
    • 大規模機械学習は,ハードウェアやネットワークの変動により,計算機クラスターにおいて性能のばらつきが生じる。
    • 最適化アルゴリズムにおいては,反復回数ではなく時間計算量が重要となる。
    • 異質環境下において,分散減少が時間計算量を改善するかを検証し,Rennala MVRを提案する。
    • Rennala MVRは,平均二乗滑らかさの仮定の下で,特定のパラメータ領域において時間計算量を改善する。
    • 理論的分析に加え,確率的二次関数のベンチマーク実験で,Rennala SGDに対する改善が確認された。
    • ニューラルネットワーク実験では,実用的な不正確な変種を用いても,Rennala SGDと同様の経験的な利が得られた。

    Link: https://arxiv.org/abs/2605.08871

  • CrystalREPA:汎用MLIPからの物理的制約を結晶生成モデルへ転移 [eess.IV, cs.RO, cond-mat.mtrl-sci, cs.LG, physics.chem-ph, physics.comp-ph]目的:結晶生成モデルの性能向上
    • 結晶材料の設計は,新機能材料開発の鍵であり,計算科学的アプローチの重要性が増している。
    • 既存の結晶生成モデルは,結晶の安定性を保証する物理的制約を十分に学習できていないという課題がある。
    • 汎用MLIPが持つ安定性に関する知識を結晶生成モデルへ効率的に転移し,生成結晶の品質を向上させる。
    • CrystalREPAは,生成モデルのエンコーダの隠れ状態と,事前学習済みのMLIP表現を整合させることで,原子レベルの安定性情報を転移する。
    • 3つの生成フレームワーク,10種類のMLIP,2つのベンチマークデータセットにおいて,熱力学的安定性,構造妥当性,構造忠実度が向上した。
    • MLIPの転移効果は,従来の精度評価指標よりも,原子レベル表現空間の識別力によってより良く予測されることが示された。

    Link: https://arxiv.org/abs/2605.08960

  • サーベイを考慮した機械学習:範囲レビューに基づく妥当な集団健康推論のためのガイドライン [stat.ML, cs.LG]目的:集団健康推論の妥当性確保のためのガイドライン
    • 公衆衛生分野において,大規模健康調査データは重要な情報源である。
    • 従来の機械学習手法は,調査設計を無視し,推論にバイアスを生じさせることがある。
    • サーベイ設計を考慮した機械学習手法を確立し,妥当な集団レベルの推論を可能にすること。
    • 本研究では,サーベイを考慮した機械学習(SaML)の9段階ガイドラインを提案した。
    • SaMLは,重み付けモデル学習,設計に基づくクロスバリデーション,サーベイ調整された性能評価など,既存の研究をまとめたものである。
    • また,ハイパーパラメータチューニングとデプロイメントにおける課題を特定し,タスク固有のガイダンスを提供した。

    Link: https://arxiv.org/abs/2605.08963

  • 鉄系触媒系の電子構造微視記述子と構造-性能関係予測のための解釈可能な機械学習フレームワーク [physics.chem-ph, cond-mat.mtrl-sci, cs.LG]目的:鉄系触媒における電子構造微視記述子と構造-性能関係の予測
    • エネルギー多消費型プロセスの触媒開発は重要であり,効率化が求められている。
    • 触媒開発は試行錯誤に依存し,再現性や設計空間と性能の関連性の解明が課題である。
    • 機械学習を用いて触媒性能に影響する微視記述子を特定し,効率的な触媒探索を目指す。
    • 提示されたフレームワークは,SHAP値を用いた特徴量の重要度分析により,複雑な構造-性能関係を解明した。
    • 熱力学的安定性と幾何学的因子が電子バンドギャップの主要な決定要因であることが示された。
    • 非線形モデルは従来の線形モデルを凌駕し,触媒スクリーニングの加速化に貢献する可能性を示した。

    Link: https://arxiv.org/abs/2605.08994

  • 任意の次元における純粋量子状態の学習(ほぼ)後悔なし [quant-ph, cs.CC, quant-ph, cs.LG]目的:未知の純粋量子状態の学習
    • 量子状態の精密な推定は,量子情報処理や量子シミュレーションにおいて不可欠である。
    • 高次元量子状態のトモグラフィは,測定回数の増加に伴う状態への擾乱が課題となる。
    • 状態への擾乱を最小限に抑えつつ,効率的に量子状態を学習することを目指す。
    • 本研究では,任意の有限次元の純粋状態に対して,累積後悔が\(\mathcal{O}(d^3\log^2 T)\)で収束するアルゴリズムを提案する。
    • 推定のオンライン不忠実度は\(\mathcal{O}(d^3\log(T)/t)\)であり,少ない測定回数でも高い精度を実現可能である。
    • この結果は,この手法が量子ビットに特有のものではなく,より高次元の量子状態にも適用できることを示唆する。

    Link: https://arxiv.org/abs/2605.09019

  • 非線形GENERIC情報ニューラルネットワーク(N-GINN):非二次的な散逸ポテンシャルによるGENERICダイナミクスの学習 [physics.comp-ph, cs.LG]目的:非線形GENERIC形式で支配されるシステムの進化方程式の発見
    • 非平衡系の複雑な現象を記述する上で,熱力学的に整合性のあるモデル構築が不可欠である。
    • 既存手法では,非二次的な散逸ポテンシャルを持つシステムのダイナミクスを捉えきれない場合がある。
    • より広範な熱力学的に整合性のあるダイナミクスを,データから正確に推論すること。
    • 提案手法N-GINNは,ハミルトニアンフローと一般化勾配フローの重ね合わせに基づき,複雑なシステムを記述する。
    • N-GINNは,凸の散逸ポテンシャルを用いることで,熱力学第一法則と第二法則を厳密に遵守するモデルを構築する。
    • 調和振動子,理想的な化学モーター,ペルジナ型粘弾性モデルの検証により,提案手法の有効性が示された。

    Link: https://arxiv.org/abs/2605.09058

  • 効率的な電力需給調整価格予測のための市場ルールに基づいたニューラルネットワーク [q-fin.CP, cs.LG]目的:電力需給調整価格の予測手法
    • エネルギー取引において,需給調整は不可欠であり,正確な価格予測が重要となる。
    • リアルタイム予測は,非線形な市場ルール,多様な入力信号,データ欠損により困難である。
    • 市場ルールをニューラルネットワークに組み込み,高精度かつ効率的な予測を実現すること。
    • 本研究で提案するモデルは,既存の深層学習モデルと同等の予測性能を示す。
    • 提案モデルは,学習パラメータ数と学習時間を大幅に削減できる。
    • 市場ルールとニューラルネットワークの組み合わせが,エネルギー取引における持続可能な予測に有効である。

    Link: https://arxiv.org/abs/2605.09061

  • サブネットワーク・ラプラス近似の最適性:新たな結果と手法 [stat.ML, cs.LG]目的:深層ニューラルネットワークにおける不確実性定量のためのサブネットワーク・ラプラス近似手法の理論的解析と改善
    • 深層学習モデルの信頼性向上には,モデルの予測における不確実性の正確な評価が不可欠である。
    • 大規模なヘッセ行列の逆行列計算が必要なラプラス近似は計算コストが高く,実用上の制約がある。
    • 既存のサブネットワーク近似手法は最適性保証がなく,本研究ではそれを克服する手法を提案する。
    • サブネットワーク・ラプラス近似は,完全なラプラス近似よりも予測分散を過小評価することが理論的に示された。
    • 提案手法であるGradient-LaplaceとGreedy-Laplaceは,既存の手法よりも最適性に関して優れた理論的保証を持つ。
    • 多様な実験設定において,提案手法は既存のベンチマークと比較して良好な性能を示した。

    Link: https://arxiv.org/abs/2605.09075

  • 量子転移学習は,低データ環境下で優れた頑健性を示す [quant-ph, cs.LG]目的:低データ環境下における転移学習の頑健性
    • 機械学習は様々な分野で活用されており,その性能向上が重要である。
    • 転移学習では,データが少ない場合に性能が低下しやすいという課題がある。
    • 量子モデルが,古典モデルと比較して,低データ環境下でより頑健に動作することを示す。
    • 古典モデルはピーク時の性能が高いものの,データ量が減少すると性能劣化が大きいことが示された。
    • 量子モデルは,データ量の変化に対してより安定した性能を維持し,頑健性とデータ効率に優れることが明らかになった。
    • 本研究は,リソースが限られた転移学習において,量子モデルが有効な選択肢となりうることを実証した。

    Link: https://arxiv.org/abs/2605.09118

  • 選択後微分:多様体上の下位レベル解集合を持つ双水準最適化の解法 [econ.EM, cs.SY, eess.SY, math.OC, cs.AI]目的:非分離多様体を持つ下位レベル問題における双水準最適化
    • 機械学習モデルの性能向上には,最適化問題の解決が不可欠である。特に,大規模言語モデルの学習では複雑な最適化が必要となる。
    • 下位レベル問題の解が多様体上に存在する場合,上層レベルの目的関数が非微分的になる可能性があり,最適化が困難となる。
    • 多様体上の解集合を持つ双水準最適化問題に対し,微分可能性を保証する条件を明らかにし,効率的な解法を開発することを目指す。
    • 下位レベル解集合が単一点でなくても,楽観的な選択の一意性があれば微分可能であることが示された。これにより,古典的な結果を拡張するハイパー勾配公式が得られた。
    • 選択された最小値の非退化性が,ハイパー目的関数の局所的な滑らかさを保証することが示された。一方,一意性の失敗は,多くの非微分点を生み出す可能性がある。
    • 提案手法HG-MSは,大規模言語モデルのソースリウェイトにおいて,他の手法を上回る性能を示し,実用的な有効性が確認された。

    Link: https://arxiv.org/abs/2605.09209

  • Transformerにおける運動論および「中央部喪失」現象 [math.AP, cs.LG, math.PR]目的:Transformerの因果的自己注意ダイナミクスに関する解析
    • Transformerは自然言語処理の基盤技術であり,その性能向上は重要である。
    • Transformerは長文入力において「中央部喪失」現象を起こし,性能を低下させる。
    • 「中央部喪失」現象の理論的解明と,そのメカニズムの理解を目指す。
    • Transformerの自己注意メカニズムを相互作用粒子系として捉え,数理的な解析を行った。
    • iidなトークン分布の下で,相関方程式を厳密に解き,経験的に観測されるU字型のプロファイルを理論的に説明した。
    • これにより,「中央部喪失」現象は,ある条件下で生じる固有の性質であることが示された。

    Link: https://arxiv.org/abs/2605.09213

  • 強化学習測定モデル [physics.med-ph, cs.SY, eess.SY, math.AC, cs.SC, stat.ME, cs.HC, cs.LG, stat.CO, stat.ML]目的:インタラクティブなアセスメントにおける行動データに基づいた測定
    • 学習者の行動過程を詳細に分析し,教育効果の改善に貢献する学術分野である。
    • 従来の測定モデルは,順序データに対応できず,学習過程の理解が不十分である。
    • 大規模なデータに対しても効率的に測定可能で,解釈可能な測定モデルを構築すること。
    • RLMMは,従来のMDP-MMと比較して,より高い推定精度と大幅な計算時間短縮を実現した。
    • AQUALABのゲームログにおいて,推定された個人パラメーターは,累積報酬,タスク完了,行動効率と正の相関関係が認められた。
    • RLMMは,より大規模で現実的な環境において,意思決定に基づいた潜在特性を解釈可能に測定可能である。

    Link: https://arxiv.org/abs/2605.09305

  • ニューラル情報因果性 [quant-ph, cs.AI]目的:表現学習における情報因果性(IC)の定式化と,クエリ漏洩,精度漏洩,エピソード固有の記憶の診断
    • 表現学習は,機械学習の重要な分野であり,データから有用な特徴を自動的に抽出することを可能とする。
    • 従来の表現学習では,クエリ分離の重要性が十分に考慮されておらず,情報漏洩のリスクが存在する。
    • 本研究は,クエリ分離を考慮した新しいフレームワークを提案し,情報漏洩を診断するための指標を提供する。
    • クエリ分離計算は,表現をメッセージとして機能させ,中間インターフェースを通してのみデコーダーが応答可能にする。
    • 提案されたニューラルICフレームワークは,ランダムアクセス通信実験を誘導し,インターフェースの物理的制約を考慮する。
    • シミュレーションにより,見かけ上の違反は,クエリ分離の欠如や容量の過小評価によって説明できることが確認された。

    Link: https://arxiv.org/abs/2605.09316

  • 線形システムの相互情報最適密度制御と参照洗練化された一般化シュレーディンガー橋 [math.OC, cs.LG, cs.SY, eess.SY]目的:線形システムの相互情報最適密度制御における問題設定と解法
    • 制御システムの性能向上と確率的入力の活用が重要視されている。
    • 相互情報最適制御は確率的政策を誘導し,安全性が求められる状況下での応用が課題となる。
    • 状態不確実性を直接制御することで,安全性を確保しつつ性能を向上させることを目指す。
    • 相互情報最適密度制御問題に対し,交互最適化アルゴリズムを提案し,各ステップの閉形式解を導出した。
    • 提案手法は,離散時間線形システムに関連する一般化シュレーディンガー橋問題の最適化と一致することが示された。
    • ガウス密度制約を導入することで,状態不確実性を制御し,安全性が向上する可能性がある。

    Link: https://arxiv.org/abs/2605.09349

  • ゼロショット音声合成におけるメトリック誘導離散フローマッチングのための運動最適スケジュールとモーメント補正 [eess.AS, cs.AI, cs.LG]目的:メトリック誘導離散フローマッチングにおける運動最適スケジュールとモーメント補正
    • 近年,離散的な生成モデルが注目を集めており,その中でもフローマッチングは高い性能を示す。
    • 従来のフローマッチングは,ハイパーパラメータ調整が必要であり,また数値計算の誤差が課題となっていた。
    • 本研究では,これらの課題を解決し,ゼロショット音声合成の性能向上を目指す。
    • 提案手法であるGibbsTTSは,制御された比較において,客観的な自然さおよび主観的な評価において,既存のベースラインモデルを上回る性能を示した。
    • GibbsTTSは,最先端の音声合成システムと比較しても,高い話者類似度を示し,4つのテストセットのうち3つで最高の類似度スコアを達成した。
    • 運動最適スケジュールとモーメント補正により,ハイパーパラメータ調整なしに,効率的かつ高精度な生成が可能となった。

    Link: https://arxiv.org/abs/2605.09386

  • 単一指数バンディットの最適後悔 [stat.ML, cs.LG]目的:単一指数バンディット問題における最適後悔の達成
    • 高次元データからの一次元投影による報酬予測は,線形モデルを超える柔軟性を持つため重要である。
    • 非単調な報酬関数を持つ単一指数バンディット問題では,最適な後悔の保証が確立されていなかった。
    • 本研究は,一般的な単一指数バンディット問題に対する最適後悔の解明を目指す。
    • 提案手法ZoomSIB-UCBは,正規化されたStein推定子を用いて投影方向を推定し,その後,離散化とUCBを用いて問題を一次元バンディットに帰着させる。
    • その結果,後悔が$\tilde{\mathcal{O}}(T^{2/3})$となり,先行研究を大幅に改善し,追加の仮定も必要としない。
    • また,$\tilde{\Omega}(T^{2/3})$の整合的ミニマックス下限を証明し,上限が本質的にタイトであることを示した。

    Link: https://arxiv.org/abs/2605.09454