arXiv雑要約

AI - 2026/06/16 公開

  • 機械学習とSHAPを用いたHPGe γ線スペクトルのピークに基づく核種同定 [physics.data-an, cs.LG, nucl-ex]目的:HPGe γ線スペクトルの核種同定における機械学習の応用
    • 原子力発電や環境モニタリングにおいて,放射性物質の正確な同定と定量は不可欠である。
    • 従来の核種同定は専門家の手作業に依存し,時間と労力を要する。
    • 機械学習を用いて核種同定を自動化し,専門家の作業を支援することを目的とする。
    • 機械学習モデルは,F1スコア0.97を達成し,従来のソフトウェア(F1スコア0.84)を上回った。
    • モデルは,65種類の核種ライブラリに対して,物理的に妥当なピークに基づいて予測を行うことが示された。
    • SHAP値解析により,モデルの予測に重要な特徴量が明らかになった。

    Link: https://arxiv.org/abs/2606.14874

  • 未知の分布シフト下における分類のための監査型確信予測 [math.OC, cs.MS, stat.ML, cs.LG]目的:未知の分布シフト下で展開された事前学習済み分類モデルに対する不確実性定量化
    • 機械学習モデルの信頼性確保は,実世界での応用において不可欠である。
    • 分布シフトにより,事前学習済みモデルの性能が低下する可能性がある。
    • モデルが失敗しやすい入力を特定し,確信予測の精度を向上させる。
    • 提案手法ACPは,ターゲット集団からの少量のラベル付きデータを利用して,監査モデルを学習する。
    • ACPは,周辺カバレッジを保証しつつ,既存手法よりも高い条件付きカバレッジを実証した。
    • 2つの統合戦略を開発し,それぞれ周辺カバレッジとグループ条件付きカバレッジを保証する理論的保証を確立した。

    Link: https://arxiv.org/abs/2606.14909

  • データ科学における表現コスト:基礎と深層ニューラルネットワークの準バナッハ空間 [math.FA, cs.LG, math.OC, stat.ML]目的:データ適合法のパラメータ空間正則化を通じた表現コストの分析
    • データ科学は,複雑なデータから知識を抽出する上で不可欠であり,その基盤理解が重要である。
    • 既存の研究では,データ適合法の表現コストに関する統一的な理論的枠組みが不足していた。
    • 深層ニューラルネットワークの表現コストを厳密に評価し,その誘導される関数空間を特定すること。
    • 表現コストを抽象的に定義し,あらゆるパラメータモデルの誘導される関数空間を明らかにした。
    • 深層ReLUネットワークの誘導関数空間が,深さLに対するp準バナッハ空間(p=2/L)となることを示した。
    • 深さL>2の場合,深層ニューラルネットワークの誘導バイアスは通常のノルムでは捉えられないことが示唆された。

    Link: https://arxiv.org/abs/2606.14954

  • 選択的ラベルを持つアルゴリズム的フロンティアの識別と推論 [math.OC, cs.SY, eess.SY, math.OC, cs.SY, eess.SY, econ.EM, cs.LG]目的:公平性と精度フロンティアの識別と統計的推論
    • 機械学習の応用拡大に伴い,公平性と精度の両立が重要課題となっている。
    • 特定の個人のみが結果を観測できる状況下では,公平性評価が困難である。
    • 選択的なラベル観測下における公平性と精度のフロンティアを特定し,統計的推論を可能にすること。
    • 選択プロセスが制限されていない場合でも,特定の損失測定法を用いることで,公平性-精度フロンティアの識別可能領域を特徴付けた。
    • 観測変数条件付きの交絡因子不存在を仮定することで,点識別と偏りのない機械学習推定量を提案し,その漸近分布を導出した。
    • これにより,公平性-精度フロンティアに対する統計的推論が可能となる。

    Link: https://arxiv.org/abs/2606.14977

  • 基盤機械学習原子間ポテンシャルからの潜在的な静電場の抽出 [physics.comp-ph, cond-mat.mtrl-sci, cs.LG, physics.chem-ph]目的:基盤機械学習原子間ポテンシャルに潜在する静電場の抽出方法
    • 材料科学や化学において,原子レベルでのシミュレーションは重要な役割を果たす。
    • 既存の機械学習原子間ポテンシャルは計算コストが高く,静電場を明示的に扱えない場合がある。
    • 基盤モデルに潜む静電気的応答を抽出し,効率的かつ正確なモデルを構築すること。
    • Latent Ewald Summation (LES)を用いることで,既存の基盤モデルから静電場を抽出可能となった。
    • 抽出された静電場は,Born有効電荷テンソルや赤外スペクトルの計算に利用できる。
    • 教師モデルのDFTレベルやデータセットが,静電場および分光学的精度に大きく影響することが示された。

    Link: https://arxiv.org/abs/2606.15001

  • スペクトルビニングとサブドメインごとの条件付き拡散による超音速境界層の多重スケール再構築 [physics.flu-dyn, cs.LG]目的:超音速クエット流れにおける近壁状態の推定
    • 超音速流れの制御や設計において,境界層の正確な把握は不可欠である。
    • 境界層の直接数値シミュレーションは計算コストが高く,広範囲な条件での解析が困難である。
    • 限られた上壁の観測データから,高精度な境界層全体を再構築する手法が求められている。
    • 提案手法は,M=6, 7, 8における速度,密度,圧力,温度場を上壁境界条件から再構築可能であることを示した。
    • サブドメイン分割とオーバーラップインペインティングにより,サブドメイン間の連続性を保ちつつ,小スケール変動も再現された。
    • Bounded Binned Spectral (BSP) lossにより,高波数成分を維持しつつ数値安定性を確保し,スペクトル忠実度を向上させた。

    Link: https://arxiv.org/abs/2606.15023

  • EChO-Agent:音声推論のための証拠連鎖オーケストレーションエージェント [quant-ph, cs.SY, eess.SY, physics.soc-ph, cs.SI, eess.AS, cs.AI, cs.SD]目的:複雑な音声質問応答における推論プロセスの明確化と検証可能性向上
    • 音声に関する質問応答は,情報検索や理解において重要性が増している分野である。
    • 既存のモデルは,質問に関連する音声セグメントに焦点を当てず,推論過程が不明確である。
    • 質問と音声の関連性を高め,セグメントの理解・統合・自己検証を可能にする手法が求められている。
    • EChO-Agentは,計画,ツール実行,証拠統合,回答検証のワークフローとして複雑な音声QAを再構成する。
    • MMARベンチマークにおける実験により,EChO-Agentがベースラインと比較して精度と評価スコアの両方を向上させることが示された。
    • 証拠統合が,性能向上における重要な要素であることが,消去実験によって明らかになった。

    Link: https://arxiv.org/abs/2606.15141

  • ソーシャルネットワークにおけるAI感染 [econ.TH, cs.AI]目的:集団知識の安定性を形成する上での人工知能とソーシャルコミュニケーションネットワークの相互作用
    • 情報伝達においてソーシャルネットワークの役割は重要であり,AIはその構造に大きな影響を与える。
    • AI生成コンテンツが誤情報を拡散させ,その修正が困難になる可能性がある。
    • AIが引き起こす誤情報の拡散と増幅を抑制するための安定化条件を特定すること。
    • AIとネットワークの相互作用により,情報が歪められ拡散される「AI感染」が起こり得る。
    • システムの長期的な挙動は,安定性を示す2次元表現で捉えられ,そのスペクトル半径が安定/不安定を決定する。
    • システムの安定化に必要なフィルタリングの最小限度と,ネットワーク構造が情報リスクに及ぼす影響が明らかになった。

    Link: https://arxiv.org/abs/2606.15206

  • 誤り訂正に基づく量子・古典ハイブリッドモデルによる時系列予測 [quant-ph, cs.LG]目的:時系列予測における量子モデルと古典モデルの誤り訂正に基づくハイブリッドモデル
    • 時系列予測は,経済,気象,金融など幅広い分野で重要な役割を担う。
    • 古典モデルだけでは,複雑な時系列データのパターンを完全に捉えきれない場合がある。
    • 量子モデルの特性を活用し,古典モデルの弱点を補完することで予測精度を向上させる。
    • 本研究で提案する量子・古典ハイブリッドモデルは,従来の古典モデルや古典ハイブリッドモデルと比較して,多くの問題において優れた予測性能を示した。
    • 量子モデルが量子現象を活用してパターンを抽出し,古典モデルが量子モデルの誤りから残りのパターンを捉えることで,相補的な能力が実現された。
    • これにより,確立されたハイブリッド化スキームに量子モデルを導入するための道が開かれた。

    Link: https://arxiv.org/abs/2606.15213

  • オフラインモデルベース最適化における適合候補認定 [stat.ML, cs.LG]目的:オフラインモデルベース最適化における候補の適合性保証
    • 機械学習による最適化は,複雑な問題を解決するための強力な手段である。
    • オフラインモデルベース最適化では,未知の領域における候補の信頼性評価が課題である。
    • 候補が目標値を満たす確率を統計的に保証する手法の確立を目指す。
    • 提案手法であるConformal Candidate Certification (CCC)は,候補ごとに信頼区間を付与し,目標値を超えるもののみを採用する。
    • CCCは,エントロピー正則化されたモデルから得られる重要度に基づき,密度比推定を必要としない。
    • シミュレーション実験では,CCCは高いカバレッジと適合率を両立し,既存手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2606.15217

  • Earth Mover's Distanceを用いたSI適合インターコネクト設計最適化のための代理モデル支援フレームワーク [eess.SP, cs.CE, cs.LG]目的:SI適合なPCB設計のための最適化手法
    • 高速データ伝送の需要増加に伴い,信号品質の維持が重要課題となっている。
    • 従来の最適化手法は計算コストが高く,設計空間の探索が困難である。
    • AIを活用し,計算効率と説明可能性を高めた設計手法を確立する。
    • 本研究では,Earth Mover's Distance (EMD)を用いて,信号波形の類似度を定量的に評価するフレームワークを提案した。
    • 代理モデルと決定木を用いることで,効率的かつ解釈可能なSI適合な設計領域の特定を実現した。
    • シミュレーション結果から,提案手法が従来の最適化戦略と比較して優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2606.15234

  • 最適制御のための二重ネットワークPINN:質量-バネ-ダンパーシステムに関する再現性のあるベンチマーク [math.OC, cs.LG]目的:質量-バネ-ダンパーシステムの最適制御に関する二重ネットワーク物理情報ニューラルネットワーク(PINN)の透明性と再現性のあるベンチマーク研究
    • 最適制御は,工学や経済学など,様々な分野において重要な役割を果たす制御理論の基盤である。
    • 従来の最適制御手法は,複雑な問題に対して計算コストが高く,実装が難しい場合がある。
    • PINNを用いた最適制御は,微分方程式を直接学習することで,計算コストを削減し,実装を容易にすることを目指す。
    • PINNは,古典的な最適コストを有効桁数4桁で再現し,終端状態制約を正確に満たした。
    • 状態および制御における点ごとの誤差は,2つの古典的な参照値のばらつき範囲内であった。
    • 本研究は,PINNベースの最適制御の導入障壁を下げることを目的とし,実装例を公開した。

    Link: https://arxiv.org/abs/2606.15271

  • 患者レベルの監督を用いたPPG汎用表現学習への取り組み [eess.SP, cs.AI, cs.LG]目的:PPGの汎用表現学習
    • ウェアラブル健康モニタリングや臨床意思決定支援において中心的な役割を担うPPGの重要性が高まっている。
    • 既存手法は信号レベルの目的に焦点を当て,患者の健康コンテキストを考慮しないため,汎化性能が課題となっている。
    • 患者レベルの臨床的意味合いをPPG表現に組み込み,よりロバストで転移可能な表現学習を実現することを目指す。
    • 臨床情報を活用した事前学習(CAP)により,PPG表現の臨床的根拠が強化され,多様な下流タスクで優れた性能を発揮する。
    • 特に呼吸数予測において,最先端のベースラインと比較して最大87.6%の相対的な改善が確認された。
    • 全タスクにおいて平均で26.7%の相対的な性能向上が見られ,学習された表現の解釈可能性も検証された。

    Link: https://arxiv.org/abs/2606.15284

  • 室温ポーラリトン凝縮体を利用した生成モデリング [cond-mat.dis-nn, cs.LG, physics.optics, quant-ph]目的:生成モデリングにおける効率的な確率的非線形変換の実現
    • 機械学習の発展に伴い,計算資源の効率化が重要となっている。
    • 従来のデジタル手法では,確率的非線形変換の実現に限界がある。
    • ポーラリトン凝縮体を用いて,物理的な確率的変換層を構築し,その性能を検証する。
    • 室温ポーラリトン凝縮体は,生成敵対ネットワーク(GAN)における物理的確率的変換として機能することが示された。
    • ポーラリトンGANは,デジタルサンプリングやレーザーシステムと比較して,Inception Score,数字の保持精度,構造的類似性において改善が見られた。
    • 空間的に相関した出力変動は,敵対的訓練を自然に正則化し,出力の多様性を向上させることが示された。

    Link: https://arxiv.org/abs/2606.15344

  • 内在的計算機能主義とシミュレーションされた意識 [q-bio.NC, cs.AI]目的:意識の計算的構成に関する考察
    • 意識研究は,人間の知性を理解する上で不可欠であり,AI開発にも応用が期待される分野である。
    • シミュレーションされた意識が真に意識を持つのかという懐疑的な見解が存在する。
    • 内在的計算機能主義に基づき,シミュレーションされた意識の可能性を理論的に検討する。
    • 内在的計算機能主義(ICF)において,意識はシステムの物理的実現に依存し,外部からの解釈に左右されない。
    • 従来の計算機能主義の限界を克服するため,内部メカニズムや介入,共同読み出しを含む,メカニズムを豊かにしたカノニカル構造を定義した。
    • 内在的因果計算的実現(ICCR)の関係を確立し,意識に関わる特性がICCRを満たすシステムであれば,生物学的,人工的,またはシミュレーションされたものであっても,同じ意識特性を実現すると結論付けた。

    Link: https://arxiv.org/abs/2606.15348

  • ShipNet:リアルタイム船舶水力学のための幾何学的深層学習サロゲート [physics.flu-dyn, cs.LG]目的:船舶水力学性能の高速近似モデル
    • 船舶設計において,正確な水力性能予測は不可欠であり,効率的な設計が求められている。
    • 高精度な数値流体力学計算は計算コストが高く,大規模なパラメータ探索の妨げとなっている。
    • 幾何学的深層学習を用いることで,高速かつ精度の高い水力性能予測を実現し,設計プロセスの効率化を図る。
    • ShipNetは,船体形状と速度から船体表面の圧力分布と遠方自由水面波パターンを高精度に予測可能である。
    • テストセットにおいて,船体圧力はR^2=0.98,波場はR^2=0.91という高い精度を達成した。
    • 推論時間はケースあたり約0.15秒であり,従来の数値流体力学計算と比較して550倍以上の高速化を実現している。

    Link: https://arxiv.org/abs/2606.15356

  • 構造化仮説空間における有限資源に基づく偽発見率制御 [stat.ML, cs.LG, stat.ME]目的:大規模仮説検定における偽発見率の制御
    • 科学的発見は,多数の仮説検定に依存する。そのため,偽発見を制御しつつ真の発見を特定することは重要。
    • 参照データ(帰無分布)の取得は資源を要し,有限データによる不確実性が残る点が課題である。
    • 仮説空間の構造を考慮した,有限データ下での偽発見率制御手法を開発すること。
    • 本研究では,有限の帰無分布サンプル数と任意の仮説空間構造に対応可能な偽発見率制御の枠組みを提示した。
    • 構造の誤指定に頑健な2つの決定ルールを提案し,正確なFDR制御と統計的検定力の間のトレードオフを明らかにした。
    • RKHSフレームワークの利用により,有限データ不確実性の直接的な解析と,帰無分布サンプルの効率的な割り当て戦略を提案した。

    Link: https://arxiv.org/abs/2606.15393

  • 正定値行列のための逆望遠鏡座標系:幾何学,計算,生成モデリング [stat.ML, cs.LG]目的:正定値行列の幾何学的表現,効率的な計算手法,および生成モデリングの実現
    • 正定値行列は,統計学,機械学習,画像処理など幅広い分野で基本となる重要な数学的対象である。
    • 既存の座標系では,行列の対数行列や逆行列の計算が複雑になり,計算コストが高いという問題があった。
    • 逆望遠鏡座標系を用いることで,行列と逆行列の計算を効率化し,生成モデリングを容易にすることを目的とする。
    • 提案された逆望遠鏡座標系は,行列の対数行列式のみに依存するヤコビアンを持つなど,既存の座標系にはない重要な性質を持つ。
    • 変換された空間では,行列とその逆行列に関する多くの計算をO(p^2)の計算量で実行でき,行列形式での結果のレンダリングにのみO(p^3)のコストが発生する。
    • 決定式が1の2つの行列は,変換空間で単位決定式を持つ直線で結ぶことができ,生成モデリングに有用である。

    Link: https://arxiv.org/abs/2606.15442

  • 線形回路における物理学習の強制性と局所的収束 [math.OC, cs.LG]目的:物理学習手法における局所的収束の解析
    • 物理的ネットワークは,グローバルな情報伝達を物理現象に依存して行うため,複雑な計算タスクに適している。
    • 既存手法では,線形回路における局所的収束の理論的保証が十分でなかった。
    • 線形回路における物理学習手法の収束条件を明らかにし,学習の安定性を高める。
    • 平衡伝播(EP),結合学習(CL),および新しい手法である随伴結合学習(AL)の局所的収束が,小さな nudging の下で証明された。
    • ネットワークの接続構造に基づくランク条件である強制性条件が,パラメータが解多様体に指数的に収束するための必要条件であることが示された。
    • 強制性が破綻する凧型回路が存在するものの,Sard の定理により,そのような特異点は一般的に発生しないことが示された。

    Link: https://arxiv.org/abs/2606.15443

  • 平衡伝播と結合学習に対する保存則 [math.OC, cs.LG]目的:平衡伝播と結合学習におけるパラメータの保存量の解析
    • 深層学習の安定性と収束性は重要な課題であり,物理学習法の理論的理解が求められている。
    • 既存の物理学習法では,学習の安定性や収束性が保証されない場合がある。
    • 平衡伝播と結合学習の学習ダイナミクスを制限する保存則を明らかにすることで,収束性の改善を目指す。
    • 連続時間・微小撹乱限界において,平衡伝播と結合学習がパラメータの質量のような量を保存することが証明された。
    • この保存則は,線形回路において重要な設定で信頼性の高い収束を可能にする学習ダイナミクスを制約する。
    • この保存則の実用的な意味について議論された。

    Link: https://arxiv.org/abs/2606.15444

  • 依存潜在モデルのための構造化非パラメトリック変分推論 [stat.ML, cs.LG]目的:潜在変数の複雑な依存関係のモデリング
    • 現代AIの根幹であり,大規模な確率モデルの学習に不可欠である。
    • 従来の変分推論は平均場近似に依存し,潜在変数の依存関係を捉えきれない。
    • 潜在変数の依存構造を柔軟かつ正確に近似する手法を開発する。
    • SN-VIは,多変量スプライン技術を用いて,潜在変数の複雑な依存関係を捉えることができる。
    • 理論的な保証が確立されており,変分目的の下限および事後推定の一貫性が証明されている。
    • シミュレーション研究と実データへの適用により,SN-VIの有効性が確認された。

    Link: https://arxiv.org/abs/2606.15458

  • 離散リッチフローによる質問応答タスクのための検索拡張生成ランキング手法の向上:Ricci-Filtration [physics.ins-det, cs.ET, stat.ML, cs.LG]目的:質問応答タスクにおける検索拡張生成ランキング手法の性能向上
    • 大規模言語モデルの性能は,適切な情報検索に大きく依存する。
    • 検索された文書のノイズが,生成される回答の質を低下させる場合がある。
    • 文書の幾何学的構造に基づき,ノイズとなる文書を除去することで回答精度向上を目指す。
    • 提案手法Ricci-Filtrationは,クエリと文書をノード,埋め込み間の関係を辺とするネットワークとしてモデル化する。
    • 離散リッチフローを用いて文書の幾何学的構造を評価し,クエリとの関連性が低いノイズとなる文書をフィルタリングする。
    • 実験結果から,Ricci-Filtrationは既存のランキング手法と比較して,精度,適合率,再現率,F1スコアにおいて優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2606.15482

  • メモリ制約下におけるLLMサービングにおけるサービス起因の輻輳 [cond-mat.mtrl-sci, cs.RO, math.OC, cs.AI, cs.LG, stat.ML]目的:メモリ制約下LLM推論における輻輳のメカニズム解明と,高スループット維持のためのスケジューリング設計原則の導出
    • 大規模言語モデル(LLM)の利用拡大に伴い,効率的な推論サービスが重要となっている。
    • LLM推論時のGPUメモリ使用量は増加傾向にあり,高並行処理環境下ではメモリ不足が課題となる。
    • サービス自体がメモリ圧力を生み出すという現象を分析し,安定したサービングを実現する。
    • サービス中のLLM推論において,リクエストの逐次的なメモリ消費が輻輳を引き起こすことが明らかになった。
    • 均一なワークロード下では,安定した状態は存在せず,システムは安定した振幅を持つ周期的なメモリ退避状態に陥ることが示された。
    • ワークロードの多様性が,推論完了の非同期化を促進し,メモリ制約下での安定化に貢献することが理論的に証明された。

    Link: https://arxiv.org/abs/2606.15555

  • グラフアラインメントにおける凸緩和の相転移 [stat.ML, cs.LG, math.PR, math.SP, math.ST, stat.TH]目的:相関を持つGOE行列に対するグラフアラインメント問題における隠れた頂点順列の復元
    • グラフアラインメントは,ネットワーク構造の比較やデータ間の対応付けなど,様々な分野で重要である。
    • 最大尤度推定法は最適だが,計算量が膨大であり,現実的な規模の問題には適用が困難である。
    • 凸緩和を用いることで,計算可能性を保ちつつ,高精度な順列復元を目指す。
    • 相関パラメータが$\sigma = o(n^{-1/2}/\log^4 n)$を満たす場合,緩和解が真の順列行列の周りに集中することが示された。
    • この結果により,単純な後処理によってほぼすべての頂点を復元できることが明らかになった。
    • 分析を通じて,緩和解の誤差が$\sigma$の変化に応じて$o(n)$から$\Omega(n)$へと相転移することが明確に示された。

    Link: https://arxiv.org/abs/2606.15581

  • 二項ロジスティック混合における情報ギャップと実現可能性を考慮した推論 [stat.ML, cs.LG, math.ST, stat.TH]目的:二項ロジスティック混合における混合検出とラベル復元の間の情報ギャップ
    • 統計モデリングにおいて,混合モデルは複雑なデータ分布を表現する上で重要な役割を果たす。
    • 混合モデルの成分数を適切に決定することは困難であり,過小評価または過大評価が生じやすい。
    • 混合検出が可能であっても,ラベルの復元が保証されないという問題に対処すること。
    • ベイズ情報量規準(BIC)では混合構造は検出できるが,ラベルの復元は保証されないという情報ギャップが存在する。
    • このギャップは,成分分離度において観測データに基づく証拠と,各観測点におけるラベル復元情報が異なる順序を持つことに起因する。
    • 提案手法は,誤った成分数の選択を回避し,ラベル確率の較正を改善することで,この問題に対処する。

    Link: https://arxiv.org/abs/2606.15665

  • テンソルトレインランダムベクトルによる確率的トレース推定 [stat.ML, cs.LG, cs.NA, math.NA]目的:大規模行列のトレース近似手法
    • 機械学習や科学計算において,大規模行列のトレースは重要な計算量
    • テンソル構造を持つ場合,既存手法では計算コストやサンプル数が課題
    • テンソルトレインベクトルを用いて,効率的なトレース推定を目指す
    • テンソルトレインベクトルは,適切なランク選択により,古典的な推定器と同等の次元に依存しない保証を提供する。
    • ランク$r \geq d-1$のテンソルトレインベクトルを用いた中央値平均法は,非構造化ガウスベクトルに基づく推定器と同等の精度と信頼性を持つ。
    • テンソルトレインベクトルを用いたスケッチは,Nystr\"{o}m++フレームワークにおいて,$\mathcal{O}(\varepsilon^{-1})$のサンプル複雑度を達成可能である。

    Link: https://arxiv.org/abs/2606.15679

  • Schattor:深層学習最適化のための Schatten ファミリー手法 [math.OC, cs.LG]目的:深層学習最適化における新しい手法の提案
    • 深層学習は,画像認識や自然言語処理など幅広い分野で利用されており,その性能向上は重要である。
    • 従来の最適化手法では,パラメータ構造の複雑さやノイズの多い勾配,非凸な地形への対応が課題であった。
    • Schatten ノルムに基づく新しい最適化手法を開発し,SGD や Muon のような既存手法を統合することを目指す。
    • Schattor は,Schatten ノルムに基づいた適応的な第一階手法のファミリーであり,SGD と Muon を統一的に扱う。
    • 確率的行列最適化問題において,Schattor ファミリー手法に対して,次元に依存しない停留性保証が確立された。
    • 多ブロック拡張を開発し,ブロックごとの最適化の進捗を適応的に調整することで,より一般的な設定下での停留性保証を証明した。

    Link: https://arxiv.org/abs/2606.15702

  • ウィグナー・ビル分布スライススペクトルに基づく早期異常発生検出:送電網テストケース [eess.SP, cs.LG, math.SP]目的:送電網の高電圧波形における異常発生の逐次検出
    • 電力系統の安定運用には,リアルタイムでの異常検知が不可欠である。
    • 既存手法では,誤検知が多く,早期の正確な異常検出が課題である。
    • 誤検知を抑制しつつ,送電網波形の異常をオンラインで検知すること。
    • FFT-BNDが最も高い感度を示したが,WVDS-BNDは最も低い誤報動作点を提供した。
    • WVDS-BNDは記録レベルの前兆誤報を0.69%に削減し,高い選択性を示した。
    • WVDSはクロス項情報を保持することで,コストの高い誤報を低減する効果が示された。

    Link: https://arxiv.org/abs/2606.15856

  • 償却型平均シフト相互作用粒子 [stat.CO, cs.LG, stat.ML]目的:逆問題に対するベイズ推論における積分評価の効率化
    • 逆問題のベイズ推論は,事後期待値などの積分を必要とし,その精度が重要である。
    • 従来のモンテカルロ法は,サンプル数が増加しても収束速度が遅いという課題がある。
    • 本研究は,少ないサンプル数で高精度な積分評価を実現する手法を提案する。
    • 償却型平均シフト相互作用粒子は,観測データと少数の事後サンプルから重み付きノードを効率的に生成する。
    • 学習は,パラメータと観測データのペア,および事後分布からのサンプルのみを必要とし,密度やスコアの評価は不要である。
    • 様々な事後分布に対して,モンテカルロ法よりも高精度な積分評価が可能であり,高次元問題にも対応できる。

    Link: https://arxiv.org/abs/2606.15871

  • 単変量関数データに対するバイアーキタイプ分析:マクロ経済金融時系列への応用 [stat.ME, cs.LG, stat.AP]目的:単変量関数データにおけるバイアーキタイプ分析の適用
    • 金融経済の分析において,時系列データの構造理解は重要である。多様な変動パターンを把握することが求められる。
    • 従来のクラスタリング手法では,パターン解釈が難しく,データの複雑さを捉えきれない場合がある。
    • データの背後にある代表的なパターンを抽出し,人間が理解しやすい形で提示することを目指す。
    • バイアーキタイプ分析により,事例(国)と時間軸の両方で典型的な構造を同時に識別できることが示された。
    • 分析の結果,ヨーロッパの国債利回りデータにおいて,危機前,ユーロ危機,危機後の3つの明確な時間的区分が特定された。
    • ドイツ,ギリシャ,ハンガリーが国ごとのアーキタイプとして識別され,代表的なパターンが明らかになった。

    Link: https://arxiv.org/abs/2606.15881

  • 構造化された非交換可能データのためのスペクトル適応的適合予測 [stat.ML, cs.LG]目的:構造化データに対する適合予測の改善
    • 時系列データ等の現実のデータは,独立性が仮定できない場合が多い。
    • 従来の適合予測は,データの交換可能性を前提としており,構造化データには適用が難しい。
    • 構造的依存性を考慮した,より正確な予測区間の提供。
    • 提案手法は,局所的なスペクトル類似度を用いた重み付き適合分位数を形成し,目標不適合率をオンラインで更新する。
    • シミュレーションおよび実データ分析の結果,固定スペクトル重み付けよりも改善が確認された。
    • スペクトル重み付けのモニタリングには,有効サンプルサイズ診断が重要である。

    Link: https://arxiv.org/abs/2606.15950

  • p-PSO: 一般化線形モデルにおける混合因子を持つD-最適設計のためのペナルティ付き粒子群最適化手法 [stat.ME, cs.LG]目的:一般化線形モデルにおけるD-最適設計の探索
    • 実験計画法は,効率的なデータ収集と信頼性の高い結論を得る上で重要である。
    • 未知パラメータへの依存性や閉じた形の解がないため,D-最適設計は困難である。
    • 離散因子と連続因子を扱うD-最適設計問題に対する効率的な手法を開発する。
    • 提案手法p-PSOは,制約付き最適化問題に対する汎用的なペナルティ定式化を導入した。
    • この定式化は,既存の粒子群最適化アルゴリズムを直接利用可能にし,他の制約付き最適化問題にも拡張可能である。
    • 実験結果は,p-PSOが効率的であり,優れた性能を示すことを示している。

    Link: https://arxiv.org/abs/2606.15962

  • PromptShift-CRC:プロンプトとドメインの変化に対応したファウンデーションモデルのリスク制御 [stat.ML, cs.LG]目的:プロンプトおよびドメインの変化下におけるファウンデーションモデルのリスク制御手法
    • ファウンデーションモデルは多様な用途に利用され,その信頼性確保が重要となっている。
    • プロンプトやドメインの変化により,従来の校正データとの乖離が生じ,予測性能が低下する可能性がある。
    • 変化に対応したリスク制御により,予測の信頼性を維持し,安全な利用を可能にすることを目的とする。
    • PromptShift-CRCは,プロンプトと応答を埋め込み,校正データプールの変化度合いを測定する。
    • 関連性の高い校正例に重みを付け,観測された違反後にオンラインでリスクレベルを更新する。
    • 合成ベンチマークにおいて,PromptShift-CRCは適応型ベースラインの中で最適なカバレッジを示した。

    Link: https://arxiv.org/abs/2606.15964

  • 量子計算実験からの基底状態観測量の学習 [quant-ph, cond-mat.mtrl-sci, cs.LG]目的:量子計算実験から得られたデータを用いた基底状態の観測量の学習
    • 量子計算の発展は,古典計算では困難な複雑な物理現象のシミュレーションを可能にする。
    • 大規模量子計算における基底状態の準備は,技術的な制約から困難であり,学習データの取得を妨げる。
    • 実験データから基底状態の性質を学習することで,量子計算の能力を最大限に引き出す道筋を示す。
    • 2次元Heisenberg XXZモデルにおいて,最大115量子ビットのシステムで実験データを学習した。
    • 学習されたニューラルネットワークは,未知のパラメータを持つハミルトニアンに対しても,観測量を高精度に予測できた。
    • 量子データからの学習が,大規模な相互作用系において古典近似法を超える可能性を示唆した。

    Link: https://arxiv.org/abs/2606.15983

  • 格子QCDにおける分散低減のための生成汎関数学習 [hep-lat, cs.LG]目的:格子QCD計算におけるボソン演算子の任意N点相関関数の分散低減
    • 量子色力学は素粒子の標準模型における強い相互作用を記述する重要な理論である。
    • 格子QCD計算では相関関数の計算において統計的ノイズが大きな課題となる。
    • 機械学習を用いて生成汎関数を近似することで,ノイズを低減し計算精度を向上させる。
    • 機械学習による正規化フローを利用し,相関関数計算の分散を大幅に低減する方法を開発した。
    • 本手法により,相関関数を推定する際のノイズを系統的に低減できることが示された。
    • グルーボール相関関数とWilsonループの計算において,最長で3桁の分散低減を達成した。

    Link: https://arxiv.org/abs/2606.15986

  • タスク誘導型クロスサブジェクト潜在的アライメント:マルチエンコーダーデコーダー変分オートエンコーダー [q-bio.NC, cs.AI]目的:クロスサブジェクト潜在的アライメントの実現
    • 脳神経活動のアライメントは,共通の計算原理や汎化可能なデコーダーの発見に繋がる重要な研究分野である。
    • 従来の脳神経活動アライメント手法は,被験者間での共通刺激を必要とし,自然なパラダイムへの適用が制限されるという課題がある。
    • 本研究では,共通の刺激なしでクロスサブジェクトアライメントを実現し,汎化性能を向上させることを目指す。
    • MED-VAEは,事前学習済みのANNによって提供される共通の枠組みを利用し,共通の潜在空間を構築することで,クロスサブジェクトアライメントを達成した。
    • MED-VAEは,従来の一般的な手法と比較して,より優れた意味構造を持つ共通潜在空間を作成し,未知の刺激に対しても高い汎化性能を維持した。
    • 共通潜在空間からの再構成により,刺激駆動信号が維持され,クロスサブジェクトニューラル予測が可能となり,画像デコーディングにおいて優れた性能を示した。

    Link: https://arxiv.org/abs/2606.15989

  • 多重線形回帰における解釈性の限界 [econ.GN, cs.CY, q-fin.EC, cond-mat.dis-nn, cs.LG, physics.data-an, stat.ML]目的:多重線形回帰における解釈性の限界に関する理論的考察
    • 物理科学においては,予測だけでなく基盤メカニズムの理解が重要であるため,機械学習モデルの解釈性が求められる。
    • 入力特徴量間に強い相関がある場合,回帰係数がデータセット間で大きく変動し,解釈が困難になるという問題がある。
    • 特徴量相関行列の固有モード解析により,多重共線性下での解釈性喪失メカニズムを理論的に解明し,その対策を検討する。
    • 多重共線性が回帰係数の変動を増幅し,物理的に類似した特徴量間で振動的なパターンを生み出すことが示された。
    • リッジ回帰は不安定な固有モードを抑制するが,それでも回帰係数の解釈には注意が必要である。
    • 物理学データセットに加え,様々な公開データセットで同様の結果が確認され,多重共線性下での線形回帰の解釈の難しさが明らかになった。

    Link: https://arxiv.org/abs/2606.16013

  • 機械学習による加工表面粗さ逆設計 [cond-mat.other, cs.LG]目的:加工表面粗さを設計目標とした,機械学習に基づく逆設計手法
    • 製造業におけるデータ駆動型アプローチの重要性が増しており,複雑な関係性を解明する上で不可欠である。
    • データセットの制約や,逆設計パラダイムの頑健性の問題が課題となっている。
    • 機械学習を用いて,表面粗さを目標値とする加工プロセスの逆設計問題を解決する。
    • 深層ニューラルネットワークとランダムフォレストの2つの機械学習モデルを,高精度なシミュレーションデータで学習した。
    • ベイズ最適化法を導入することで,多対一の対応関係から生じる問題を克服し,最適な加工条件を特定した。
    • 提案手法は,参照結果と比較して平均相対誤差5%以下という高い精度を示し,その堅牢性と信頼性を実証した。

    Link: https://arxiv.org/abs/2606.16032

  • GPTに基づくCLAS12検出器ヒットの高速シミュレーション:条件付き自己回帰生成による [physics.ins-det, cs.LG, hep-ex, nucl-ex, physics.data-an]目的:CLAS12実験におけるカロリメータの高速代替モデル
    • 素粒子物理実験の発展に伴い,高精度な検出器シミュレーションの需要が高まっている。
    • 従来のモンテカルロ法では,計算資源の限界が課題となっていた。
    • 深層生成モデルを用いて,高速かつ忠実なシミュレーションを実現する。
    • 本研究では,GPTスタイルの自己回帰トランスフォーマーをカロリメータの代替モデルとして適用した。
    • モデルは入射運動量に基づいて,9層のカロリメータヒットをストリップ,ADC,TDCトークン列として生成する。
    • 生成されたヒット数,空間分布,エネルギー沈着,エネルギー運動量応答は実験結果と一致し,1秒あたり700イベント以上の推論速度を実現した。

    Link: https://arxiv.org/abs/2606.16035

  • アニオンを用いた量子機械学習の強化 [quant-ph, cs.LG]目的:量子機械学習における学習性能の向上
    • 量子コンピュータと量子機械学習は,量子現象を計算資源として活用することで発展してきた。
    • 素粒子の交換統計が,量子機械学習において十分に検討されていない。
    • 素粒子の交換統計を学習モデルに取り込み,学習性能の向上を目指す。
    • ボソン,フェルミオン,アニオンの交換統計を統一的に扱う量子カーネルフレームワークを提案した。
    • アニオンカーネルは,特徴空間においてボソンやフェルミオンカーネルでは到達できない方向へアクセス可能である。
    • 学習ベンチマークにおいて,アニオンカーネルは他のカーネルよりも優れた性能を示した。

    Link: https://arxiv.org/abs/2606.16090

  • 信頼性に基づく第一原理フィードバックフレームワーク:閉ループ材料発見のためのInvDesMobility [cond-mat.mtrl-sci, cs.AI]目的:閉ループ材料発見のための信頼性ゲート付き第一原理フィードバックフレームワーク
    • 材料設計において,目標とする機能を実現する構造の探索が重要である。計算コストの高い第一原理計算を効率的に活用する必要がある。
    • 複合特性(例えばキャリア移動度)の予測では,最終的なスカラー値だけでは中間量や計算過程の信頼性が不明確になりがちである。
    • 信頼性評価に基づき,第一原理計算の結果をフィードバックループに組み込むことで,材料発見の効率と信頼性を向上させることを目指す。
    • InvDesMobilityフレームワークは,自動DFT,証拠の階層化,構造生成,獲得ランキング,監査可能なリリースを統合している。
    • 516の2DMatPedia候補から280のQC合格材料と573の保持されたキャリア方向シードチャネルが得られた。
    • 総構造数240万個をスクリーニングし,DFT検証には102件の候補が提出され,信頼性ゲート付き生成チャネルは41の組成で86件保持された。

    Link: https://arxiv.org/abs/2606.16133

  • シミュレーション不要な潜在的SDEにおける近似誤差の解消 [stat.ML, cs.LG]目的:ノイズのある観測データからの動的システムの復元
    • 脳科学や物理学など,科学分野において動的システムの復元は重要な課題である。
    • 従来の変分推論は計算コストと精度にトレードオフがあり,高精度なシミュレーションが困難である。
    • 本研究は,シミュレーション不要な変分推論の近似誤差を解消し,より正確な動的システムの学習を目指す。
    • Helmholtz-SDEは,既存のシミュレーション不要な変分推論よりも忠実にダイナミクスを復元できる。
    • 特に,事後不確実性が高い場合に,その効果が顕著である。
    • 実行時間の大幅な短縮化とともに,シミュレーションに基づく変分推論と同等の性能を達成した。

    Link: https://arxiv.org/abs/2606.16138

  • 波長多重化によるパッシブ回折ネットワークを用いた2次元ビームステアリング [physics.optics, cs.CV, cs.NE, physics.app-ph]目的:波長アドレス可能な回折光学ネットワーク
    • 光通信やイメージングなど,ビームステアリング技術は幅広い分野で重要である。
    • 従来のビームステアリングは機械的走査や電子制御が必要で,小型化や高速化に課題があった。
    • 波長を制御パラメータとして用いることで,小型・高速な2次元ビームステアリングを実現する。
    • 提案手法では,波長を変化させることで25x25の独立したビーム位置を制御可能であることを数値的に示した。
    • テラヘルツ波および可視光領域での実験により,3次元加工されたパッシブ回折層を用いた波長多重化ビームステアリングを実証した。
    • 本研究は,光通信,ルーティング,イメージング,センシングなどへの応用が期待される。

    Link: https://arxiv.org/abs/2606.16261

  • 計量グラフ上の生成モデリング:ニューラル最適輸送によるアプローチ [stat.ML, cs.LG, stat.ME]目的:コンパクトな計量グラフ上で連続的にサポートされた確率分布に対する深層生成モデリングフレームワーク
    • グラフ構造データの解析は,ネットワーク科学,機械学習など多くの分野で重要性を増している。
    • 既存の生成モデルは,複雑なグラフ構造を持つデータに対する表現力やスケーラビリティに課題がある。
    • ニューラル最適輸送を用いて,グラフ構造を保持しつつ高品質な生成を可能とする手法を開発すること。
    • 提案手法は,グラフを滑らかな空間に埋め込み,ニューラル半双対パラメータ化によるエントロピー付き Kantorovich 問題を解く。
    • 実験の結果,提案手法は離散グラフ最適輸送に基づくヒューリスティックなベースラインと同等またはそれ以上の性能を示す。
    • マンハッタンの Uber ピックアップデータに対する大規模な実験により,提案手法のスケーラビリティが実証された。

    Link: https://arxiv.org/abs/2606.16273

  • 医療画像分類器の局所感度分析のための入力依存フィッシャー情報 [math.OC, cs.SY, eess.SY, q-bio.PE, math.OC, cs.SY, eess.SY, eess.IV, cs.AI, cs.IT, math.IT]目的:医療画像分類器の局所的な感度分析手法
    • 医療画像診断における深層学習の利用が拡大しており,その信頼性確保が重要視されている。
    • 深層学習モデルはブラックボックス性が高く,予測根拠の説明が困難である。
    • モデルの予測分布の変化に対する入力の局所的な影響を定量化する手法を開発する。
    • 提案手法では,入力依存フィッシャー情報行列(iFIM)を用いて,入力画像の微小な摂動に対する分類器の予測分布の変化を特徴づける。
    • iFIMの高感度成分は,予測確信度および分類性能の変化と強く相関することが示された。
    • 本手法は,既存の解釈可能性手法を補完し,医療画像における局所的な決定感度を分析するための原理的なツールとなりうる。

    Link: https://arxiv.org/abs/2606.16362

  • MultiMolecule:バイオ分子配列モデルワークフローのためのモジュール型エコシステム [q-bio.QM, cs.LG, q-bio.BM, q-bio.GN]目的:バイオ分子配列モデルの再利用を促進するための,モジュール型エコシステム
    • バイオ分子配列モデルは生物学研究において不可欠であり,予測精度向上が重要である。
    • モデルの再現性確保が難しく,異なるアッセイへの適応や比較が困難である。
    • モデルの再現性と適応性を向上させ,標準化された評価を可能にすること。
    • MultiMoleculeは,多様なRNA,DNA,タンパク質配列モデルを,検証済みの実装として提供する。
    • 53のモデルファミリー実装と112の標準化されたチェックポイントが含まれるリソースを公開している。
    • 標準化されたコンポーネントは,ソースコード,参照チェック,ドキュメントと紐づけられ,モデルの挙動を詳細に検証できる。

    Link: https://arxiv.org/abs/2606.16540

  • 噴霧形成のための形状条件付き潜在的代理モデル [physics.flu-dyn, cs.AI, cs.LG, physics.comp-ph]目的:噴霧ノズルの形状と時間変化する二相崩壊の関係性の予測
    • 噴霧ノズルの設計において,流体挙動の正確な予測が性能向上に不可欠である。
    • 高精度なシミュレーションは計算コストが高く,反復設計探索の妨げとなっている。
    • AMRのセル密度分布に着目し,計算コストを削減しつつ高精度な予測を可能とする。
    • 提案手法は,AMRセル密度分布を潜在空間にエンコードすることで,ノズル形状と時間変化する界面のダイナミクスを捉える。
    • 推論時間は0.045秒と短く,Basilisk CFDと比較して6万倍以上の高速化を実現した。
    • AMRの改良構造が,形状条件付き代理モデリングのためのコンパクトかつ学習可能な表現として機能する可能性を示唆する。

    Link: https://arxiv.org/abs/2606.16587

  • 無線システムにおけるCSI圧縮のための文脈認識マルコフVAE [eess.SP, cs.IT, cs.LG, math.IT]目的:無線システムにおけるCSI圧縮
    • 無線通信において,CSIは通信品質を左右する重要な情報である。
    • CSIのデータ量は膨大であり,限られたフィードバック資源での効率的な伝送が課題である。
    • CSIの時間的相関を利用し,効率的な圧縮を実現することを目的とする。
    • 提案手法は,既存の無記憶および弱系列ベースラインと比較して,CSI再構成性能を向上させる。
    • 特に,低~中程度の圧縮率において,その効果が顕著に現れる。
    • これは,潜在的な時間的モデリングが,限られたフィードバック制約下でのCSI圧縮に有効であることを示唆する。

    Link: https://arxiv.org/abs/2606.16607

  • 拡散フローマッチング:次元改善されたKL boundとWasserstein保証 [stat.ML, cs.LG]目的:拡散フローマッチングの収束性保証
    • 生成モデルは,画像生成等の分野で重要な役割を果たしており,その理論的基盤の確立が求められている。
    • 拡散フローマッチングは強力な手法だが,その収束性に関する理論的な理解はまだ不十分である。
    • 拡散フローマッチングの離散化誤差に対する収束性をより厳密に評価し,次元への依存性を改善すること。
    • KL divergenceと2-Wasserstein距離における収束性保証を,Brownian motionに基づく拡散フローマッチングに対して導出した。
    • 既存研究よりも次元依存性において改善されたKL収束boundを得た。これは最小限の条件での最先端の結果である。
    • 2-Wasserstein距離についても,追加の条件の下でKLケースと同様の次元依存性を持つ収束性保証を得た。

    Link: https://arxiv.org/abs/2606.16610

  • ニューラルODEを用いたハイブリッド生物物理ニューロンモデルの学習 [q-bio.NC, cs.LG]目的:生物物理ニューロンモデルにおける未知の電流や誤ったチャネル動態の回復
    • 脳機能解明には,神経活動の測定と細胞レベルのメカニズムを結びつける生物物理ニューロンモデルが不可欠である。
    • イオンチャネルの特性が不明確,またはモデルの簡略化により,モデルと実際の生物学的現象との乖離が生じやすい。
    • 未知の動態を柔軟に学習しつつ,モデルの解釈可能性を維持することで,この乖離を埋めることを目指す。
    • 提案手法は,2400のイオンチャネルモデルのゲーティング特性を再現し,単一の電流クランプ記録から未知のゲーティング動態を復元することに成功した。
    • 学習されたモデルは,現実的な入力条件下やパラメータの誤指定下においても,分布外の刺激レジームに対して一般化することが示された。
    • 皮質ニューロンの多コンパートメントモデルを,学習された軸電流を持つ単一コンパートメントのハイブリッドモデルに簡約し,計算コストを大幅に削減した。

    Link: https://arxiv.org/abs/2606.16693