arXiv雑要約
AI - 2026/04/21 公開
SegWithU:単一前方パスのリスク認識型医用画像セグメンテーションにおける不確実性を摂動エネルギーとして [cs.CV, cs.AI, cs.LG]目的:医用画像セグメンテーションにおける不確実性の推定
- 医用画像セグメンテーションは,定量化や臨床意思決定支援に不可欠であり,信頼性の高い不確実性推定が重要である。
- 既存の不確実性推定手法は,推論回数が多く効率が悪いか,または特徴空間に制約がある。
- 本研究は,効率的かつ信頼性の高い不確実性推定手法を開発し,リスク認識型セグメンテーションを実現する。
- SegWithUは,既存の単一前方パスベースラインよりも優れた性能を示し,ACDC, BraTS2024, LiTSにおいて高いAUROC/AURCを達成した。
- SegWithUは,凍結された事前学習済みセグメンテーションバックボーンに軽量な不確実性ヘッドを追加することで,不確実性を摂動エネルギーとしてモデル化している。
- これらの結果は,摂動に基づく不確実性モデリングが,信頼性のある医用画像セグメンテーションへの効果的なアプローチであることを示唆している。
VoodooNet: 高次元ランダム射影による解析的基底状態の達成 [cs.LG, cs.AI]目的:解析的基底状態の達成
- 機械学習の性能向上は,AI技術の発展と社会への応用において重要である。
- 従来の深層学習は,勾配降下法に依存し,計算コストが高いという課題がある。
- 高次元射影による新たな手法で,学習コストを削減し,リアルタイムAIを実現する。
- VoodooNetは,MNISTにおいて98.10%の分類精度を達成した。
- Fashion-MNISTにおいても86.63%の精度を示し,10エポックのSGDベースラインを上回った。
- 次元数と精度の関係には,ほぼ対数的なスケーリング則が認められた。
未来を漏洩させる世界:未来予測エージェントのために進化を活用する [cs.AI]目的:未来予測におけるエージェントの性能向上
- 不確実な未来に対する意思決定は重要であり,迅速かつ正確な予測が求められる。
- 既存手法は最終結果に依存しており,予測過程の早期段階での改善が困難である。
- 予測エージェントが時間経過に伴い自己改善し,結果を知る前に予測精度を向上させる。
- Milkywayは,基盤モデルを固定し,予測プロセスを継続的に改善するハーネスを更新する。
- 同じ未解決問題に対する繰り返し予測を通じて内部フィードバックを活用し,ハーネスに再利用可能なガイダンスを書き込む。
- FutureXとFutureWorldにおいて,既存手法を凌駕し,それぞれ44.07から60.90,62.22から77.96へとスコアを向上させた。
cuNNQS-SCI:ニューラルネットワーク量子状態を用いた高性能配置間相互作用選択のための完全GPU加速フレームワーク [cs.DC, cs.AI, cs.CE]目的:ニューラルネットワーク量子状態(NNQS)を用いた配置間相互作用(SCI)選択の高性能化
- 複雑な多体系のシュレーディンガー方程式を正確に解くことは,化学や物理学における根源的な課題である。
- NNQS-SCIは高精度だが,CPU-GPU混在アーキテクチャが大規模システムへの適用を妨げていた。
- CPU依存性のボトルネックを解消し,GPUのみで大規模計算を可能にすることを目標とする。
- cuNNQS-SCIは,分散型グローバル重複排除アルゴリズムとGPU特化のCUDAカーネルにより,計算効率を大幅に向上させた。
- NVIDIA A100クラスタ(64 GPU)において,最適化されたNNQS-SCIと比較して最大2.32倍の高速化を実現した。
- 強スケーリングテストでは90%以上の並列効率を維持し,優れた分散性能を示した。
グラフ,大規模言語モデル,エージェントの統合:推論と検索 [cs.CL, cs.AR, cs.AI]目的:グラフLLM統合の設計選択に関する概観
- 近年,推論,検索,構造化された意思決定において,グラフ表現と大規模言語モデルの統合が重要視されている。
- グラフLLM統合が,どのような状況で,なぜ,どのように適切なのかが不明確である。
- タスク要件,データ特性,推論の複雑さに応じた最適なグラフLLMアプローチの選択を支援する。
- 本調査では,サイバーセキュリティ,ヘルスケア,材料科学など様々な分野における代表的な研究をマッピングした。
- 各手法の強み,限界,最適な適用シナリオを明らかにした。
- グラフLLM統合の目的,グラフの様相,統合戦略に基づいた分類を行った。
ニューロシンボリックなリポジトリレベルのコード局所化 [cs.SE, cs.AI]目的:コード局所化におけるキーワード依存性の克服と構造的推論能力の向上
- 自動ソフトウェアエンジニアリングの基盤技術であり,ソフトウェアの保守性向上に不可欠である。
- 既存の研究はキーワードに過度に依存しており,真の構造的理解に基づく局所化が困難である。
- キーワードに依存しない,構造的推論に基づくコード局所化手法を開発し,その有効性を検証する。
- 既存の最先端手法は,キーワードに頼らず構造的推論を必要とする新しいベンチマークにおいて,著しく性能が低下することが示された。
- 提案手法LogicLocは,大規模言語モデルとDatalogを組み合わせることで,精度の高いコード局所化を実現し,KA-LogicQueryベンチマークで優れた性能を示した。
- LogicLocは,トークン消費量と実行時間を大幅に削減しつつ,既存手法と同等以上の性能を維持した。
大規模言語モデルの内在的解釈可能性:設計原則とアーキテクチャの調査 [cs.CL, cs.AI, cs.LG]目的:大規模言語モデルにおける内在的解釈可能性の現状と課題
- 自然言語処理の発展に伴い,大規模言語モデルの利用が拡大している。
- モデルの内部構造が不透明であり,信頼性や安全性の確保が課題となっている。
- モデル構造自体に透明性を持たせる内在的解釈可能性の確立を目指す。
- 内在的解釈可能性のアプローチを,機能的透明性,概念的整合性など5つの設計パラダイムに分類した。
- 既存研究を体系的に整理し,大規模言語モデルの解釈可能性向上に向けた課題を明確にした。
- 今後の研究方向性を提示し,この分野の発展に貢献する。
AIの政治経済との対峙:説明責任追求における欺瞞の回避 [cs.CY, cs.AI]目的:AIの政治経済における欺瞞の構造とその影響
- AI技術は社会構造を大きく変革する可能性を秘めており,その影響を理解することが不可欠である。
- AI開発における説明責任の追求が困難であり,表面的な対策に終始する傾向がある。
- AIの政治経済的側面を明らかにし,真の公正性と説明責任を確立するための視点を提供する。
- AI開発は,資金提供者や開発者の権力と富を維持・拡大する世界構築の試みである。
- 学術界やメディアを欺瞞する「欺瞞」が存在し,AI開発の権力構造と搾取を隠蔽している。
- AIにおける真の公平性と説明責任の実現には,欺瞞を見抜き,AIの物質的な政治経済と向き合うことが必要である。
分子特性の文脈内予測のための表形式ファウンデーションモデル [cs.LG, physics.chem-ph]目的:分子特性予測の精度向上
- 医薬品開発,触媒,プロセス設計において,分子特性予測は不可欠な要素である。
- 実際の応用では,データセットの規模が小さく,予測精度が課題となる場合が多い。
- 小規模データセットでも高精度な予測を可能にする手法の確立を目指す。
- 表形式ファウンデーションモデル(TFM)は,タスク固有のトレーニングを必要とせず,文脈内学習により予測を行う。
- 標準的な医薬品ベンチマークと化学工学データセットにおいて,TFMは優れた予測性能と計算コストの削減を実現した。
- TFMとCheMeleon埋め込みの組み合わせは,MoleculeACEタスクで最大100%の勝率を達成し,RDKit2dやMordred記述子は強力な代替手段となった。
VEFX-Bench:汎用的な動画編集と視覚効果の包括的ベンチマーク [cs.CV, cs.AI, cs.CL]目的:動画編集と視覚効果の品質評価のためのデータセットおよびベンチマーク
- AI技術の発展に伴い,動画制作の効率化が求められている。高品質な動画編集は重要である。
- 既存の動画編集評価リソースは規模が小さく,編集結果や品質評価が不足している。
- 人間による評価に匹敵する,動画編集に特化した品質評価モデルの構築を目指す。
- VEFX-Datasetは,9種類の主要な編集カテゴリと32のサブカテゴリにわたる5,049の動画編集例を含む大規模なアノテーションデータセットである。
- VEFX-Rewardは,動画編集の品質評価に特化した報酬モデルであり,人間の判断との相関性が高いことが示された。
- VEFX-Benchは,動画編集システムの比較のための標準化されたベンチマークであり,既存モデルの課題を明らかにした。
ベイズニューラルネットワーク:導入と概観 [stat.ML, cs.LG]目的:ベイズニューラルネットワークの導入と研究動向
- 機械学習は画像認識,音声認識,自然言語処理など多様な分野で高度な成果を上げている。
- 従来のニューラルネットワークは予測における不確実性の評価が困難である。
- ベイズニューラルネットワークは不確実性の定量化を可能にし,より信頼性の高い予測を目指す。
- 本稿ではベイズニューラルネットワークの基本的な概念と主要な研究を紹介する。
- 様々な近似推論手法を比較し,今後の研究における改善点を示す。
- ベイズニューラルネットワークは,予測の信頼性向上に貢献する可能性を秘めている。
PyEPO:線形・整数計画法のための予測・最適化ライブラリ [math.OC, cs.LG]目的:線形・整数計画法における予測・最適化手法の実装
- 現実の問題ではパラメータが未知である場合が多く,効率的な最適化が重要である。
- 従来の予測・最適化アプローチは段階的であり,最適化が難しい場合がある。
- PyEPOは,線形・整数計画問題に対するエンドツーエンドな予測・最適化を可能にする。
- PyEPOは,PyTorchを基盤とした線形・整数計画問題のための初の汎用ツールである。
- 様々なアルゴリズム(サロゲート決定損失,ブラックボックスソルバーなど)を実装している。
- 最短経路問題,ナップサック問題,巡回セールスマン問題等で実験を行い,有効性を示した。
多視点アプローチ:多重インスタンス学習と一類分類を用いた低悪性度神経膠腫のバイオマーカー予測 [eess.IV, cs.LG, q-bio.QM]目的:低悪性度神経膠腫のバイオマーカー予測
- 低悪性度神経膠腫の診断と治療において,バイオマーカー検出は不可欠である。
- 従来のバイオマーカー検出法は,高価な遺伝子検査に依存し,専門家による解析が必要で,解析者間でのばらつきが生じやすい。
- ヘマトキシリン・エオジン染色画像のみからバイオマーカーを予測し,診断・治療の効率化と新たな分子メカニズムの発見を目指す。
- Multi-Beholderは,TCGA-LGGデータセットでAUC 0.973,Xiangyaコホートで0.820という高い性能を示した。
- 本パイプラインは,バイオマーカーの状態と組織形態学的特徴との間の定量的な相関関係を発見することを可能にする。
- 分子治療の適用範囲を拡大するとともに,分子機能と低悪性度神経膠腫の進行における新たなメカニズムの解明に貢献する。
金属有機構造体におけるプロトン伝導性の機械学習による予測 [math.CO, cs.DM, math.OC, cond-mat.mtrl-sci, cs.LG, physics.app-ph]目的:金属有機構造体のプロトン伝導性予測
- 燃料電池の固体電解質材料としての金属有機構造体の重要性が高まっている。
- プロトン伝導性を示す金属有機構造体の数は限られており,メカニズム解明が遅れている。
- 機械学習を用いてプロトン伝導性を予測し,効率的な材料設計を目指す。
- 記述子ベースおよびTransformerベースのモデルを構築し,プロトン伝導性を予測した。
- Transformerベースの転移学習モデル(Freeze)が最も高い性能を示し,平均絶対誤差は0.91であった。
- 特徴量の重要度分析により,プロトン伝導性に影響する要因を明らかにした。
FedExProxのより厳密な性能理論 [math.OC, cs.LG, stat.ML]目的:分散最適化手法FedExProxの性能評価
- 分散機械学習の普及に伴い,効率的な最適化手法の重要性が増している。
- 既存のFedExProxの理論的保証は,単純な勾配降下法と大差ないという問題がある。
- より厳密な分析によりFedExProxの優位性を示し,その潜在能力を明らかにする。
- 非強凸二次関数の場合,FedExProxは勾配降下法よりも線形収束率が向上することが示された。
- 計算コストと通信コストを考慮した結果,FedExProxは勾配降下法を凌駕することが理論的に証明された。
- Polyak-Lojasiewicz条件を満たす関数に対しても,FedExProxの分析が拡張され,より広い範囲の関数に適用可能となった。
医療画像解析における分布シフトへの対処:サーベイ [eess.IV, cs.CV, cs.LG]目的:医療画像解析における分布シフトへの対処戦略
- 医療診断や個別化医療において,医療画像解析は不可欠な役割を担う技術である。
- 異なる病院や患者群のデータで学習されたモデルの性能が低下する分布シフトが課題となっている。
- 分布シフト下でもロバストな性能を発揮する深層学習モデルの適応性を高める方法を探求する。
- 本研究では,既存手法を,データアクセス制限やプライバシー保護等の臨床的制約と技術的パラダイムとの関連性に着目して分類した。
- 手法をJoint Training,Federated Learning,Fine-tuning,Domain Generalizationの4つに整理し,それぞれが特定の医療シナリオに適応することを示した。
- ドメイン情報が減少するにつれて性能向上が制約されること,不確実性モデリングへの焦点移行が確認された。
SMILE-UHURAチャレンジ:超高解像度7T MRI血管造影画像における微小血管セグメンテーション [eess.IV, cs.AI, cs.CV]目的:微小血管セグメンテーションアルゴリズムの性能評価と改善
- 脳血管は栄養と酸素を供給する重要なネットワークであり,その異常は重篤な疾患を引き起こす。
- 7T MRIの高解像度画像は微小血管の可視化を可能にしたが,アノテーション付きデータセットの不足が課題であった。
- 公開データセットを提供し,機械学習によるセグメンテーションアルゴリズム開発を促進すること。
- 提出された深層学習手法は,提供されたトレーニングデータセットで信頼性の高いセグメンテーション性能を達成した。
- テストデータセットにおけるDice係数は最大0.838±0.066,別の7T ToF MRAデータセットでは0.716±0.125に達した。
- 平均性能は最大0.804±0.15であり,微小血管セグメンテーションの進歩が示された。
バッチ適応型因果注釈 [stat.ML, cs.LG]目的:介入効果の推定における効率的ラベル取得戦略
- 政策や意思決定において,介入の効果を正確に評価することは重要である。
- データは欠損していたり,測定誤差を含んでいる場合が多く,正確な評価を困難にしている。
- ラベル付けコストを削減しつつ,因果推論の精度を向上させることを目指す。
- 提案手法は,最適なバッチサンプリング確率を閉形式で導出し,欠損値のある因果推論における二重ロバスト推定量の漸近分散を最小化する。
- シミュレーションと実データ(ホームレス支援介入を含む)において,既存手法と比較して平均二乗誤差が大幅に低下し,少ないラベル数でAIPW推定値を再現できる。
- 実用上,361個のランダムサンプルで得られる信頼区間を,90個の最適化されたサンプルで実現し,ラベル付け予算を75%削減可能である。
置換を用いたスケーラブルなNyström法に基づくカーネル二標本検定 [stat.ML, cs.LG, math.ST, stat.ME, stat.TH]目的:二標本検定における検定力評価
- 統計学や機械学習において,データ分布の比較は広範な科学的応用に不可欠である。
- 大規模データに対するノンパラメトリック検定では,計算コストが課題となることが多い。
- 効率的なアルゴリズムを設計し,統計的保証を維持することで,この問題を解決する。
- 提案手法は,Nyström近似によりMMDの計算効率を向上させ,大規模データへの適用を可能にする。
- 分離度の高い分布に対して,提案検定の検定力に関する有限標本限界が導出された。
- 導出された分離レートは,この設定における既知のミニマックス最適レートと一致する。
O値の導入:混同行列に基づく分類性能指標の普遍的標準化 [stat.ML, cs.LG, stat.ME]目的:分類性能指標の普遍的な標準化手法
- 機械学習の応用拡大に伴い,分類性能の客観的評価が不可欠となっている。
- 既存の指標は尺度や不均衡データへの感度が異なり,比較が困難である。
- 不均衡率が異なるテストセット間での性能比較を可能にすること。
- 本研究では,混同行列に基づく分類性能指標を[0,1]の範囲に標準化するOPS関数を提案した。
- OPS関数で得られるO値は,性能の相対的な順位を示すパーセンタイル値として解釈できる。
- 実データ実験により,多様な指標に対して提案手法の有用性と頑健性が確認された。
最適輸送のためのソボレフ勾配上昇法:重心最適化と収束解析 [math.OC, cs.LG, stat.ML]目的:Wasserstein重心の新しい制約なし凹型双対定式
- 最適輸送は,確率分布間の距離を測る理論であり,機械学習等の応用が期待されている。
- 既存手法は計算コストが高く,大規模データへの適用が困難な場合がある。
- ソボレフ勾配上昇法により,効率的な重心計算と理論的保証を実現する。
- 本研究で提案するSGAは,既存の最適輸送重心ソルバーと比較して,優れた経験的性能を示す。
- SGAでは,収束保証に必要な計算コストの高い$c$-凹性射影演算子を省略できる。
- SGAの収束レートは,ユークリッド空間における非滑らかな凸関数の最小化における古典的な劣勾配降下法と同等である。
マルコフ決定過程における方策テスト [stat.ML, cs.LG, math.ST, stat.TH]目的:割引マルコフ決定過程における方策テスト問題
- 強化学習の応用範囲拡大のため,効率的な方策評価が重要である。
- 方策の価値を判断するには多数のサンプルが必要であり,効率性が課題となる。
- サンプル数を最小限に抑えつつ,方策の価値が閾値を超えるか判定する。
- 新しいアルゴリズムを提案し,非凸制約問題を解決するための手法を確立した。
- 下界問題を再構成することで,目的関数は非凸だが制約は凸の問題へと変換した。
- この再構成により,マルコフ決定過程における他の探索タスクへの応用も示唆された。
UniSim:生体分子の時間粗視化ダイナミクスを統合的にシミュレートするシミュレータ [q-bio.BM, cs.LG]目的:生体分子の時間粗視化ダイナミクスシミュレーションの統合的アプローチ
- 分子動力学シミュレーションは,分子システムの原子レベルでの挙動理解に不可欠である。
- 従来の分子動力学法は精度と効率のトレードオフに悩まされており,汎用性に課題がある。
- UniSimは,異なる分子ドメイン間の知識を統合し,汎用性の高いシミュレーションを可能にする。
- UniSimは,大規模かつ多様な分子データから統一的な原子表現モデルを学習する。
- 確率的補間フレームワークと力誘導モジュールにより,異なる化学環境への迅速な適応を実現する。
- 小分子,ペプチド,タンパク質において,高い競争力を持つ性能を示す。
LLaMA-XR:LLaMAとQLoRAファインチューニングを用いた放射線レポート生成の新しいフレームワーク [eess.IV, cs.AI, cs.CV]目的:放射線レポートの自動生成
- 放射線科医の負担軽減と診断精度の向上に貢献する可能性があり,医療分野において重要である。
- 医学用語の複雑さや文脈理解の必要性から,正確かつ臨床的に意味のあるレポート生成が困難である。
- 既存モデルの精度と文脈関連性の維持という課題を克服し,効率的なレポート生成を目指す。
- LLaMA-XRは,LLaMA 3.1,DenseNet-121ベースの画像埋め込み,およびQLoRAファインチューニングを統合し,高いコヒーレンスと臨床的精度を実現した。
- パラメータ利用の最適化とメモリオーバーヘッドの削減により,計算効率を維持しつつ,迅速なレポート生成を可能にした。
- IU X-rayベンチマークデータセットを用いた実験で,最先端の手法を上回り,ROUGE-Lスコア0.433,METEORスコア0.336を達成した。
治療,エビデンス,模倣,そしてチャット [stat.OT, cs.AI]目的:医療における意思決定支援の可能性に関する検討
- 医療現場における効率性と質の向上が喫緊の課題であり,意思決定支援の重要性が増している。
- 既存の意思決定支援システムは,複雑な医療情報を十分に活用できていない場合がある。
- 大規模言語モデルを用いて,より高度で倫理的な意思決定支援システムを構築することを目指す。
- 大規模言語モデルは,医療意思決定の支援において潜在的な能力を持つことが示唆された。
- 治療問題とチャット問題の違いが明確にされ,模倣の限界とエビデンスに基づいた医療の重要性が強調された。
- 実験の倫理や観察に基づく推論の仮定など,大規模言語モデルのトレーニングにおける主要な課題が指摘された。
大規模ランダム行列のLarge Rank摂動の固有値の漸近的振る舞い [physics.soc-ph, cs.SI, q-bio.PE, math-ph, cs.LG, math.MP, math.PR]目的:大規模ランダム行列のLarge Rank摂動の固有値の漸近的挙動
- 深層学習ネットワークの理論的基盤構築に不可欠であり,その性能解析に重要である。
- 深層学習ネットワークの重み行列のスペクトル解析は困難であり,理論的な理解が遅れている。
- Large Rank摂動を持つ行列の固有値分布を解析し,プルーニング技術の理論的根拠を与える。
- 本研究では,Large Rankの行列Sに対する漸近解析を開発した。
- Sが多数の離れた固有値を持つ場合でも,固有値分布を厳密に評価できることを示した。
- この結果は,Random Matrix Theoryに基づいた新しいプルーニング技術の理論的裏付けとなる。
RWAトークン化された米国債の解読:機能分解とアドレスロールの推論 [q-fin.CP, cs.CE, cs.LG]目的:米国債を裏付けとするRWAトークンのトランザクションレベルの行動分析
- 現実資産のトークン化は,透明性,アクセス性,金融包摂を高める上で重要性を増している。
- RWA市場は急速に拡大しているが,トランザクションレベルでの実証的分析は限られている。
- 現在のRWA採用における包摂性の範囲と限界を明らかにし,透明性の高いWeb3金融を促進すること。
- RWAトークンのコントラクトコールを解析し,発行,償還,送金,ブリッジングといった金融プリミティブを特定した。
- 機関投資家と個人投資者の行動パターンを区別し,RWAの利用における包摂性の現状を明らかにした。
- カーバチャーを考慮した表現学習モデルにより,アドレスレベルでの経済的役割の推論精度を向上させた。
ブドウ葉の窒素評価における特徴選択と機械学習の統合 [eess.IV, cs.CV, cs.LG]目的:ブドウ葉の窒素濃度評価のための,特徴選択と機械学習の統合
- ワイン用ブドウの品質は窒素栄養に大きく依存し,適切な施肥管理が重要である。
- 土壌中の窒素は空間的・時間的に変動するため,正確な葉の窒素濃度推定が課題である。
- 圃場における分光画像を用いて,ブドウ品種ごとの窒素評価モデルを構築し,その精度向上を目指す。
- 品種ごとに重要な分光バンドを選択することで,冗長性を低減し,コンパクトかつ生理学的に意味のあるバンドの組み合わせを得た。
- 葉レベルでは,シャルドネとピノ・ノワールで高い予測精度が得られた(シャルドネ:R^2 = 0.82,RMSE = 0.19 %DW)。
- キャノピーレベルでも良好な予測性能を示し,シャルドネ,コンコード,シラーでそれぞれR^2値が0.65,0.72,0.70であった。
多重ガウス関数を用いた残基レベルのタンパク質動力学学習 [q-bio.BM, cs.LG]目的:タンパク質動力学の記述
- 生命機能の解明には,静的な構造だけでなく,タンパク質の動的な挙動の理解が不可欠である。
- 分子動力学シミュレーションは高コストであり,大規模なタンパク質系への適用が困難である。
- 静的構造から直接タンパク質動力学を予測する効率的な手法を開発し,計算コストを削減する。
- DynaProtは,残基ごとの柔軟性(RMSF)の予測において高い精度を示した。
- DynaProtは,少ないパラメータ数で,高速なアンサンブル生成を可能にする共分散行列の再構成を達成した。
- 本研究は,既存手法に代わる,スケーラブルなタンパク質動力学予測の可能性を示唆する。
CWT増強振動センシングとYOLOを用いた空間的故障局所化 [eess.SP, cs.AI, cs.CV, cs.LG, eess.IV]目的:ベアリング故障監視のための空間的局所化による振動センシングフレームワーク
- 産業機械の安定稼働には,ベアリング等の部品の異常検知が不可欠である。
- 従来の振動解析では,微弱かつ非定常な故障信号の検出が困難であった。
- CWTとYOLOを活用し,非定常環境下での振動センシング能力向上を目指す。
- 提案手法は,CWRU,PU,IMSデータセットにおいて,従来のモデルやSTFTよりも高い故障検知性能を示した。
- YOLOv9, YOLOv10, YOLOv11を用いた結果,最高で99.4%,97.8%,99.5%のmAP値を達成した。
- 時間周波数スペクトログラム上の空間的局所化により,故障特性とエネルギー分布の関係がより明確になった。
TGLF-WINN:核融合における乱流輸送モデリングのためのデータ効率の良い深層学習サロゲート [physics.plasm-ph, cs.LG]目的:核融合プラズマの乱流輸送を予測する高速かつ高精度なサロゲートモデルの開発
- 核融合プラズマ制御において,輸送現象の正確な予測は炉の性能向上に不可欠である。
- 既存の深層学習サロゲートモデルは,高い精度を得るために大量の学習データを必要とする。
- 少ない学習データでも高精度な予測を実現し,計算コストを削減することを目指す。
- 特徴エンジニアリングと波数分解に基づく正則化により,従来のニューラルネットワークモデルよりも高い精度を達成した。
- 特に,データが少ない状況下では,精度劣化を大幅に抑制することに成功した。
- ベイズ活性学習を導入することで,学習データ量を25%削減しつつ,従来のモデルと同等の精度を維持した。
ニューラルネットワークにおける勾配降下法を用いた継続学習の理論 [quant-ph, cs.CC, stat.ML, cs.IT, cs.LG, math.IT]目的:継続学習における忘却率の上限
- 人工知能の重要な目標であり,モデルが過去の知識を保持しつつ新しいタスクに適応する能力が求められる。
- 既存の研究では,継続学習における忘却のメカニズムの理解が十分でなく,理論的な保証が不足している。
- ニューラルネットワークと勾配降下法を用いた継続学習において,忘却の度合いを定量的に評価し,理論的な限界を明らかにする。
- 1層の二次ニューラルネットワークにおける勾配降下法のダイナミクスを解析し,反復回数,サンプルサイズ,タスク数,隠れ層の幅などのパラメータと忘却率の関係を明確化した。
- アルゴリズム的安定性フレームワークを活用し,汎化ギャップを抑え,テスト時の忘却に関する保証を得た。
- 継続学習における忘却の理論的な保証を初めて提示し,主要なパラメータが忘却ダイナミクスに及ぼす影響を明らかにした。
連続時間・離散空間における結合隠れマルコフモデルの効率的な推論 [eess.AS, cs.CL, stat.ML, cs.LG]目的:結合隠れマルコフモデルにおける効率的な推論手法
- 複雑なシステムのモデリングにおいて,相互作用するマルコフ連鎖は強力なツールである。
- 高次元設定では推論が困難であり,離散時間での観測データの組み込みが課題となる。
- 観測データを利用した効率的な推論を可能にする手法を提案し,問題を解決する。
- 提案手法であるLatent Interacting Particle Systemsは,各マルコフ連鎖の生成行列をパラメータ化する。
- 未来情報を予測するlook-ahead関数(twist potential)の効率的なパラメータ化を導入した。
- SIRモデルや山火事の拡散モデルといった実データを用いた実験で有効性が示された。
機械学習強化モンテカルロ法による組合せ最適化における優位性の実証 [cond-mat.dis-nn, cond-mat.stat-mech, cs.AI, cs.LG, physics.comp-ph]目的:組合せ最適化問題における機械学習強化モンテカルロ法の性能評価
- 組合せ最適化は,現実的な応用と最適化手法開発の中核をなす重要な研究分野である。
- 機械学習の支援によるアプローチは比較的新しく,既存の古典的手法を安定して上回る結果は得られていない。
- 本研究は,機械学習とモンテカルロ法を組み合わせることで,古典的手法を超える最適化手法を確立する。
- 機械学習強化グローバルアニーリング法は,シミュレーテッドアニーリングよりも優れた性能を示した。
- 特に,問題の難易度やシステムサイズに依存せず,ハイパーパラメータ調整なしに高い有効性を維持した。
- これらの結果は,機械学習支援最適化が,組合せ最適化において古典的手法を凌駕する可能性を示唆する。
深層学習によるヘストンモデルの較正:統一的フレームワーク [math.AP, cs.LG]目的:ヘストンモデルの較正精度と計算効率の向上
- 金融派生商品の価格付けにおいて,ヘストンモデルは広く利用されている。
- ヘストンモデルの較正は,非線形性や高次元パラメータ空間により計算負荷が高く,局所最適解に陥りやすい。
- 深層学習を用いて,ヘストンモデルの較正の効率と精度を改善すること。
- 提案手法は,オプション価格を近似するPANと,価格誤差を修正するCCNという2つのニューラルネットワークを統合している。
- 実際のS&P500オプションデータを用いた実験により,従来の較正手法と比較して,複数の誤差尺度で優れていることが示された。
- 本フレームワークは,リアルタイムの金融モデル較正に対する実用的かつ堅牢な解決策を提供する。
EGMOF:拡散・トランスフォーマーハイブリッドアーキテクチャを用いた金属有機構造体の効率的生成 [econ.GN, cs.CY, q-fin.EC, cond-mat.mtrl-sci, cs.AI, cs.LG]目的:金属有機構造体の効率的な生成手法
- 材料設計において,望ましい特性を持つ材料を見出すことは,化学空間の広大さと特性データの不足から困難である。
- 既存の生成モデルは,大規模なデータセットを必要とし,新しい特性に対応するには再学習が必須となる。
- 少ないデータでも,再学習を最小限に抑えつつ,多様な特性を持つ金属有機構造体を生成すること。
- EGMOFは,記述子を介したモジュール型ワークフローにより,これらの課題を克服し,高い有効性とヒット率を実現した。
- 水素吸着データセットにおいて,既存手法と比較して有効性で最大39%,ヒット率で最大29%の改善が見られた。
- CoREMOF,QMOFなど29の多様な特性データセットに対する条件付き生成にも成功し,汎用性の高さを示した。
意識の生成機構:階層間因果関係からの考察 [q-bio.NC, cs.NE]目的:意識の生成を決定する内部因果メカニズム
- 意識は物理システムに不可欠な要素であり,その起源の解明は科学の根源的な課題である。
- 従来の物理学では意識の起源を説明できず,因果関係の理論的考察が重要視されている。
- 階層間因果関係に着目し,意識生成のメカニズムをモデル化することで,その解明を目指す。
- 意識の生成は,外部からの介入ではなく,システム内部の因果メカニズムによって決定されると考えられる。
- 高レベルからの原因が低レベルに伝達される仕組みを明示的に実装する手法を提案した。
- 異なる階層で異なる力学法則を持つ「二重法則モデル」を提唱し,機能的意識の生成とその因果関係について考察した。
有効な1天体重力波形の近似を高速生成するためのオートエンコーダモデル [gr-qc, astro-ph.IM, cs.LG]目的:重力波形の高速生成手法の開発
- 重力波検出器の感度向上により,観測イベント数が飛躍的に増加すると予想される。
- 広範なパラメータ空間における波形計算は,計算資源の制約により困難である。
- 計算時間を短縮し,パラメータ推定を迅速化することで,多重信奉者フォローアップを支援する。
- 本研究では,SEOBNRv4波形の近似にオートエンコーダモデルを適用し,高速な波形生成を実現した。
- GPU上で1000個の波形を約0.1秒で生成可能であり,従来のSEOBNRv4実装より4桁高速である。
- テストデータセットにおける平均ミスマッチは10のマイナス2乗程度であり,生成波形の精度も確認された。
限られたオーバーラップ下における因果推論への感度アプローチ [stat.ML, cs.LG, stat.ME]目的:限られたオーバーラップ下での因果推論における感度分析
- 観察データ分析は実験が困難な場合に重要であり,政策評価などで活用される。
- 介入群と対照群のオーバーラップが少ない場合,推定精度が低下し,結果の信頼性が損なわれる。
- オーバーラップが少ない領域における推定の不確実性を評価し,頑健な結論を導くことを目指す。
- 提案手法は,標準的なトリミング手法が導入するバイアスの最悪の場合の信頼区間を算出する。
- この感度分析フレームワークを用いることで,限られたオーバーラップ領域における不確実性を定量化し,誤った結論を回避できる。
- オーバーラップの少ない状況下でも,結果の解釈に際して考慮すべき不確実性の範囲を提示する。
モーメントに基づく曖昧性集合下での分布ロバストな後悔最適制御 [math.CO, cs.DM, math.NT, math.OC, cs.LG, cs.SY, eess.SY]目的:曖昧性集合における分布全体にわたる最悪ケースにおける期待後悔の最小化
- 不確実性下での意思決定において,ロバストな制御戦略の設計は極めて重要である。
- 確率分布が不明確な場合,従来の最適制御法は性能劣化を引き起こす可能性がある。
- 確率分布の平均と共分散に基づく曖昧性集合を用いて,ロバストな制御を可能にする。
- 提案手法は,曖昧性集合内の分布に対する最悪ケース期待後悔を最小化する因果アフィン制御ポリシーを設計する。
- 得られたミニマックス最適制御問題は,実行可能な凸計画問題として再定式化可能であり,正則化された名目上の線形二次確率制御問題と解釈できる。
- この凸再定式化の双対性に基づき,任意の精度で最適なコントローラを計算するためのスケーラブルな射影サブ勾配法を開発した。
最適化のための確率的制御手法 [math.OC, cs.LG, cs.NA, math.NA, math.PR]目的:最適化問題における確率的制御枠組み
- 複雑な最適化問題への適用が期待されており,様々な分野で重要な役割を果たす。
- 非凸かつ非微分可能な関数を含む最適化問題は,解析的に解くことが困難である。
- 確率的制御理論を用いて,そのような難解な最適化問題を数値的に解決することを目指す。
- ユークリッド空間においては,動的計画法とCole-Hopf変換,Feynman-Kac公式を用いて解析解を得る。
- 確率測度の空間においては,平均場制御問題とN粒子系による近似を用いて最適化を行う。
- 正則化パラメータをゼロに近づけることで,制御問題の値が元の目的関数の大域的最小値に収束する。
ReStyle-TTS:ゼロショット音声合成における相対的かつ連続的なスタイル制御 [eess.AS, cs.AI, cs.SD]目的:ゼロショット音声合成における連続的かつ参照相対的なスタイル制御
- 音声合成技術は,コミュニケーションの円滑化や情報伝達の効率化に不可欠である。
- 既存のゼロショットTTSは参照音声のスタイルに強く依存し,意図したスタイルでの合成が困難である。
- 参照音声のスタイルに左右されず,連続的なスタイル制御を可能にすることを目的とする。
- ReStyle-TTSは,参照音声への依存を軽減するDecoupled Classifier-Free Guidance (DCFG)を導入した。
- LoRAとOrthogonal LoRA Fusionにより,連続的かつ分離された複数属性のスタイル制御を実現した。
- 実験により,ReStyle-TTSがピッチ,エネルギー,感情などのスタイルを制御可能であることが示された。
Wasserstein-p 中心極限定理のレート:局所的依存からマルコフ連鎖へ [math.PR, cs.LG, stat.ML]目的:多変量依存データのWasserstein-p距離における中心極限定理のレート
- 機械学習やオペレーションズリサーチにおいて,漸近近似のレートは重要な役割を担う。
- 依存データに対する中心極限定理のレートは,既存研究において十分な改善の余地があった。
- 局所的依存系列や幾何学的にエルゴードなマルコフ連鎖における最適なレートを確立すること。
- Wasserstein-1距離において,初の最適な$\mathcal{O}(n^{-1/2})$レートを確立した。
- 穏やかなモーメントの仮定の下,Wasserstein-p距離($p\ge 2$)における初の中心極限定理のレートを導出した。
- 局所的依存系列に対する最適なWasserstein-1レートを応用し,多変量U統計量に対する最適なレートを得た。
多ポート散乱器負荷予測のためのクラスタリング後予測フレームワークの調整 [eess.SP, cs.LG]目的:多ポート散乱器における複数負荷値の予測
- 通信・計測システムの設計上,インピーダンスと散乱特性間の複雑な依存関係を考慮した負荷予測は重要である。
- 多ポート散乱器の負荷予測は,高次元性と複雑な依存関係により困難を伴うという課題がある。
- 本研究は,高次元性および複雑な依存関係による負荷予測の課題解決を目指す。
- 提案手法であるクラスタリング後予測フレームワークは,勾配ブースティング(GB)を用いた場合にRMSEを最大46%削減することに成功した。
- この改善は,様々なクラスタリングおよび回帰手法において一貫して確認された。
- 現実的なシナリオにおける性能評価に適した,複数の対立する目的を持つ指標のトレードオフを定量的に分析するための新しい指標RUIが導入された。
古典から量子へ:3次元および量子系における相転移の教師なし発見のためのプロメテウスの拡張 [cond-mat.dis-nn, cond-mat.stat-mech, cs.LG]目的:相転移の教師なし発見
- 物性物理学において,相転移の理解は物質の振る舞いを予測する上で不可欠である。
- 高次元や量子系における相転移の検出は,解析的な解が得られないため困難である。
- 教師なし学習を用いて,複雑な系における相転移を高精度に検出することを目指す。
- 3次元イジング模型において,臨界温度を文献値の0.01%以内の精度で検出し,臨界指数も70%以上の精度で抽出した。
- 量子系においては,Q-VAEを用いて横場イジング模型の量子臨界点を2%の精度で検出することに成功した。
- 無秩序TFIMにおいて,動的スケーリング則からトンネル指数を0.48±0.08と評価し,理論予測と一致することを示した。
機械学習天気エミュレータを用いた高速な放射強制応答の検証 [physics.ao-ph, cs.LG]目的:高速な放射強制応答の定量化
- 地球温暖化対策には,気候システムの応答メカニズムの理解が不可欠である。
- 従来の地球システムモデルは計算コストが高く,迅速な応答評価が困難である。
- 機械学習エミュレータを活用し,計算コストを削減して高速な応答を評価する。
- 過去の気象データで学習した機械学習エミュレータは,地球システムモデルと同程度の応答を示す。
- 二酸化炭素濃度の変化に対する降水量の応答を,再学習なしに定量的に評価できる。
- 地球システムモデルと機械学習エミュレータの連携による,気候変動予測の効率化が期待される。
フラストレーションを持つJ1-J2ハイゼンベルク模型における中間相秩序の教師なし発見 [cond-mat.str-el, cond-mat.dis-nn, cs.LG, quant-ph]目的:J1-J2ハイゼンベルク模型の中間相秩序の構造
- 量子磁性研究は,物性物理学において重要な課題であり,新奇な量子現象の解明に繋がる。
- フラストレーションを持つ系の相転移機構は複雑であり,正確な相図の決定が困難である。
- 機械学習を用いて,大規模系における相転移の検出手法を確立することを目指す。
- Prometheusフレームワークを用いて,$J_2/J_1$の範囲における相図を系統的に探索した結果,S(π,π)とS(π,0)が主要な秩序パラメータとして検出された。
- 縮約密度行列に基づく手法により,Néel相からストライプ相へのクロスオーバー($J_2/J_1 \approx 0.5$--0.6付近)を捉えることに成功した。
- 本研究は,波動関数の完全なアクセスが困難な強相関系への機械学習の適用可能性を示唆する。
高強度荷電粒子ビームにおけるビーム-プラズマ集団振動:誘電応答理論,ラングミュア波分散,そしてPrometheusによる教師なし検出 [physics.plasm-ph, cond-mat.stat-mech, cs.LG, physics.acc-ph]目的:高エネルギー(10-100 MeV)におけるビーム-プラズマ集団振動の理論的・計算的枠組み
- 高強度ビームは,加速器物理やプラズマ物理において重要な研究対象である。
- ビーム中の集団振動は,ビームの品質低下や損失を引き起こす可能性がある。
- 集団振動のメカニズムを解明し,その抑制策を開発することが課題である。
- ビーム密度が臨界密度を超えると,減衰しないラングミュア波モードが存在することが示された。
- プラズマ周波数は,分布形状に依存せずf-sum ruleによって決定されることが確認された。
- Prometheusを用いた検証により,集団振動の開始とコーン異常がPICシミュレーションで再現された。
非単調損失における共形リスク制御:理論と有限サンプル保証 [stat.ML, cs.LG]目的:非単調損失関数下における共形リスク制御の理論的保証と有限サンプル性能
- 機械学習モデルの信頼性確保が重要視される中,リスク制御は不可欠な手法である。
- 従来の共形リスク制御は,損失関数が単調減少することを仮定しており,現実の応用場面との乖離がある。
- 有限グリッドでのパラメータ選択時における共形リスク制御の妥当性を検証し,適切な条件を導出する。
- 損失関数が非単調な場合,キャリブレーションサンプルサイズとグリッド解像度の関係が重要であることが示された。
- 有界損失における過剰リスクの上界が,グリッドサイズ$m$とサンプルサイズ$n$を用いて$\sqrt{\log(m)/n}$のオーダーで導出された。
- 実データ実験により,有限サンプル不確実性を考慮した手法が,単調変換に基づく手法よりも安定したリスク制御を実現することが示された。
差分プライバシーを用いた確証的予測 [math.OC, cs.SY, eess.SY, cond-mat.str-el, cond-mat.stat-mech, cs.MS, quant-ph, econ.GN, cs.HC, q-fin.EC, stat.ML, cs.LG]目的:不確実性量化のための確証的予測における差分プライバシーの効率的な適用
- 機械学習モデルの信頼性評価は重要であり,不確実性の明示的な定量化が求められている。
- 従来のプライバシー保護手法は,予測精度の低下を引き起こす場合がある。
- 差分プライバシーを維持しつつ,統計的に効率的な確証的予測を可能にすること。
- 差分確証的予測(differential CP)を導入し,データ分割による効率低下を回避した。
- 提案手法DPCPは,モデル学習とプライベートな分位点機構を組み合わせ,エンドツーエンドのプライバシーを保証する。
- DPCPは,既存のプライベートな分割確証的予測アプローチよりも,より狭い予測集合を生成可能であることが示された。
