arXiv雑要約
AI - 2025/12/22 公開
地震データ処理における文脈学習 [cs.CV, cs.LG]目的:地震データ処理における文脈学習の有効性検証
- 地震探査は資源探査や地殻構造解明に不可欠であり,高品質な地下画像構築が重要である。
- 従来の地震データ処理はノイズの影響を受けやすく,パラメータ調整に専門知識と手間がかかる。
- 空間的な一貫性を保ちつつ,ユーザー制御可能な地震データ処理手法を開発すること。
- ContextSeisNetは,U-Netと比較して合成データにおいて定量的に優れており,隣接するギャザー間の空間的なコヒーレンスが向上している。
- 実際の地震データにおいて,ContextSeisNetは従来のRadon処理やU-Netと比較して,より優れた空間的な一貫性を示した。
- ContextSeisNetはU-Netよりも少ないデータ量で同等の性能を達成しており,高いデータ効率を示す。
目的地よりも過程:スローシンキングにおける視覚的忠実性の重要性 [cs.CV, cs.CL, cs.LG]目的:視覚言語モデルにおける推論過程の視覚的忠実性
- マルチモーダルな推論能力の向上は,画像と言語を組み合わせた高度なAIシステムにとって不可欠である。
- 既存の評価指標では,推論過程の妥当性と最終的な正答率を分離して評価できない。
- 推論過程における視覚的根拠の確認と,不正確な過程の自動修正を目指す。
- 推論過程を認識と推論のステップに分解し,既存の視覚言語モデルを用いてステップごとの忠実性を評価するフレームワークを提案。
- このフレームワークに基づき,視覚的に不忠実な認識ステップを検出・再生成する軽量な自己反省メカニズムを開発。
- 複数のモデルで,最終的な正答率を維持しつつ,不忠実な認識率を低減できることを確認。
ノンファイナンスの特徴を用いた信用リスク推定:イスタンブールの合成データからのエビデンス [cs.LG, q-fin.ST, stat.AP]目的:ノンファイナンスの特徴が信用リスク推定に与える影響の検証
- 金融包摂は起業を促進し,所得の不安定性を低減し,富の格差を是正するために重要である。
- イスタンブールの金融サービス未利用者は,非公式な取引が多く,信用情報が不足しているという課題がある。
- 本研究は,信用履歴のない層に対する信用リスク評価の可能性を探る。
- 代替データを用いることで,AUC(曲線下面積)が約1.3%向上した。
- バランスF1スコアも約14%向上し,0.84から0.95へと改善された。
- 行動特性の限られたセットでも,信用情報機関レベルの識別能力に近づける可能性があることが示された。
フィンチ:スプレッドシート中心の企業ワークフローにおける金融・会計のベンチマーク [cs.AI, cs.CE, cs.IR, cs.MA]目的:金融・会計におけるAIエージェントの評価
- 企業活動において,金融・会計業務は不可欠であり,その効率化は重要である。
- 従来のAI評価は現実の企業ワークフローの複雑さを反映していなかった。
- 現実の企業環境における金融・会計業務の複雑さをAI評価に組み込む。
- 本研究では,現実の企業データに基づいた金融・会計のベンチマーク「フィンチ」を開発した。
- 最先端のAIシステム(GPT 5.1など)を用いた評価の結果,ワークフローの完了率は低いことが示された。
- 実際の企業ワークフローがAIエージェントにとって依然として課題が多いことを明らかにした。
非解決推論(NRR):文脈的同一性と曖昧性保持のための計算フレームワーク [cs.CL, cs.AI, cs.LG]目的:文脈的同一性と曖昧性保持を可能にする計算フレームワーク
- AIの性能向上には,より高度な推論能力が不可欠であり,曖昧性の適切な処理はその鍵となる。
- 既存のAIシステムは,曖昧性を早期に解消してしまうため,多義的な解釈を維持できず,柔軟な思考を欠いている。
- 曖昧性を積極的に保持し,多様な解釈を許容することで,創造性や文脈依存推論を可能にすることを目指す。
- 本研究で提案するNRRフレームワークは,同一性の概念を拡張し,文脈依存的な表現と並行解釈保持を実現した。
- 実験の結果,合成タスクにおいてNRRモデルは,標準的なアーキテクチャと比較して,分布外の精度で大幅な改善を示した。
- 曖昧性解消が常に有用であるという従来の前提に異議を唱え,AIシステムの高度な曖昧性処理能力の基盤を提供する。
SportsGPT:LLM駆動による解釈可能なスポーツモーション評価とトレーニング指導フレームワーク [cs.CV, cs.AI]目的:スポーツモーションの解釈可能な評価とトレーニング指導
- スポーツ科学分野において,運動能力の客観的評価と個別最適化された指導が重要視されている。
- 既存システムは得点化や可視化に偏り,詳細なパフォーマンス診断や具体的な指導が不足している。
- LLMを活用し,運動データに基づいた専門的な診断と指導を自動化することを目指す。
- 提案手法MotionDTWは,従来のアルゴリズムと比較して,時間的誤差が少なく,IoUスコアが高いことが示された。
- KISMAMとSportsRAGのアブレーションスタディにより,SportsGPTが汎用LLMよりも診断精度と専門性が高いことが確認された。
- SportsGPTは,モーションデータから専門的なトレーニング指導を生成する閉ループシステムを実現した。
AIを受け入れる:システム性能研究の加速 [cs.SE, cs.AI]目的:AIを活用したシステム性能研究の加速
- システム性能の向上は,現代の計算機システムにおいて不可欠であり,その重要性は増している。
- 従来のシステム性能研究は,人的労力に依存しており,効率的な改善が困難な場合がある。
- AIによる自動化を通じて,システム性能研究の効率性と効果を向上させることを目指す。
- AI駆動の研究(ADRS)によって生成された解が,人間の専門家による最先端設計と同等またはそれ以上の性能を示すことが,10のケーススタディで実証された。
- ADRSを効果的に活用するためのベストプラクティス(プロンプトの記述レベル,フィードバック量,堅牢な評価など)が特定された。
- ADRSの適用に関する課題と今後の研究方向性を示し,問題設定と戦略的監督への研究者の注力シフトを促す。
意味の錯覚:RAGシステムにおける埋め込みに基づく幻覚検出の限界に関する確証 [cs.LG, cs.AI, cs.CL]目的:RAGシステムにおける幻覚検出の限界とその原因の特定
- 大規模言語モデルの信頼性は重要であり,特に根拠に基づいた応答生成が求められる。
- RAGシステムは幻覚を起こしやすく,既存の検出手法は安全性が重要となる場面で信頼性に課題がある。
- 確証的予測を用いて,幻覚検出における埋め込みベースの手法の限界を定量的に示す。
- 合成データ(Natural Questions)では,埋め込みベースの手法は高い網羅性と低い偽陽性率を実現する。
- しかし,実際の幻覚データ(HaluEval)では,同様の手法は壊滅的な失敗を示す(100%の偽陽性率)。
- GPT-4を用いた評価では,より低い偽陽性率(7%)が示され,表層的な意味だけでは困難な課題であることが示唆された。
VLA-AN:複雑な環境における空中ナビゲーションのための効率的でオンボードなビジョン・言語・行動フレームワーク [cs.RO, cs.AI]目的:複雑な環境下での自律ドローンナビゲーションのための,効率的かつオンボードなビジョン・言語・行動フレームワーク
- ドローンによる自律飛行は,物流,監視,災害対応など幅広い分野での応用が期待されている。
- 既存のモデルは,データドメインの乖離,時間的推論の不足,安全性の問題,オンボード展開の制約といった課題を抱えている。
- 本研究は,これらの課題を克服し,軽量な空中ロボットにおける完全な閉ループ自律性を実現することを目指す。
- 3D Gaussian Splatting (3D-GS) を活用した高精度なデータセットを構築し,ドメインギャップを効果的に解消した。
- シーン理解,基本的な飛行スキル,複雑なナビゲーション能力を段階的に強化する,プログレッシブな3段階トレーニングフレームワークを導入した。
- 軽量でリアルタイムな行動モジュールを設計し,幾何学的な安全補正と組み合わせることで,高速かつ安全なコマンド生成を実現した。
様式化された合成データ拡張が,破損に対するロバスト性をさらに向上させる [cs.DC, cs.CV, cs.LG]目的:深層視覚モデルの破損に対する脆弱性への対処
- 画像認識技術は,自動運転や医療診断など,多岐にわたる分野で不可欠である。
- 現実世界の画像はノイズや劣化の影響を受けやすく,モデルのロバスト性が課題となる。
- 合成データとスタイル変換を組み合わせることで,ロバスト性の向上を目指す。
- スタイル変換を適用した合成データは,FID指標では品質が低下するものの,モデルの学習に効果的であることが示された。
- スタイリゼーションと合成データは互いに補完し合い,TrivialAugment等の手法と組み合わせることで相乗効果が期待できる。
- CIFAR-10-C, CIFAR-100-C, TinyImageNet-Cにおいて,最先端のロバスト性能を達成した。
mimic-video:汎用的なロボット制御のためのビデオ・アクションモデル(VLAsを超えて) [cs.RO, cs.AI, cs.CV, cs.LG]目的:ロボット制御におけるビデオ・アクションモデルの汎化性能向上
- ロボットの自律的な動作には,視覚情報と自然言語による指示の理解が不可欠である。
- 既存の視覚言語行動モデルは,静的なデータで事前学習されており,物理的ダイナミクスの理解が不十分である。
- 本研究は,ビデオデータを用いて意味と視覚的ダイナミクスを同時に学習し,その課題を解決する。
- 提案手法mimic-videoは,大規模なインターネットビデオモデルとフローマッチングに基づく行動デコーダを組み合わせる。
- シミュレーションおよび実世界のロボット操作タスクにおいて,最先端の性能を達成した。
- サンプル効率を10倍,収束速度を2倍改善し,従来のVLAアーキテクチャを上回った。
Sigma-MoE-Tiny 技術報告 [cs.CL, cs.OS, cs.CL, cs.AI]目的:スパースな専門家混合モデルの性能評価
- 大規模言語モデルの効率的なスケーリングが重要視されているため。
- 極端なスパース性を持つMoEモデルでは,専門家間の負荷分散が課題となる。
- 低層における負荷分散の不安定性を解消し,学習の安定化を図る。
- Sigma-MoE-Tinyは,既存のオープンソースモデルと比較して高いスパース性を実現した。
- わずか0.5Bのパラメータを活性化させることで,同規模またはそれ以上のモデルと同等の性能を達成した。
- プログレッシブスパース化スケジュールにより,負荷分散と学習安定性のバランスを取った。
経験的メタアルゴリズム研究の最良事例:COSEAL研究ネットワークからのガイドライン [cs.DB, cs.AI]目的:経験的メタアルゴリズム研究における最良事例の収集と確立
- アルゴリズム選択等のメタアルゴリズム研究は,計算機科学の発展に不可欠である。
- 実験設定の自由度が高いため,結果の信頼性や再現性が課題となっている。
- メタアルゴリズム研究における実験サイクル全体の標準化と品質向上を目指す。
- 本研究は,COSEALコミュニティにおけるメタアルゴリズム研究の各分野における最良事例を統合した。
- 研究課題の策定から実験設計,実行,結果分析,そして発表に至るまでの実験サイクル全体を網羅している。
- 本ガイドラインは,メタアルゴリズム研究の現状を把握し,研究者や実務家への指針となる。
生成アートにおけるパラメータ探索のためのフレームワーク [cs.AI, cs.HC, cs.SE]目的:生成アートにおけるパラメータ空間の探索
- 生成アートは創造性を拡張するが,パラメータ調整が困難である。
- パラメータ空間が広大で,魅力的な結果が得られる領域が限られている。
- 手動探索の効率を上げ,新たな表現の可能性を発見すること。
- ParamExplorerは,人間や自動フィードバックに基づいてパラメータ空間を探索するフレームワークである。
- 強化学習に着想を得た探索戦略(エージェント)を実装し評価した。
- 既存のp5jsプロジェクトへの統合が容易である。
予測プロセスマイニングにおける再現性:SPICE - 深層学習ライブラリ [cs.LG, cs.AI]目的:予測プロセスマイニングの再現性向上
- ビジネスプロセスの監視とKPI予測は,業務効率化に不可欠である。
- 既存手法は再現性が低く,公平な比較が困難である。
- 再現性と堅牢な比較を可能にするフレームワークを開発する。
- SPICEは,PyTorchで実装された深層学習ベースのPPM手法を再現するPythonフレームワークである。
- SPICEは,既存手法の結果と公平な指標を用いて11のデータセットで比較検証された。
- SPICEは,過去および将来のモデリングアプローチの比較を容易にする。
AI駆動による骨密度評価:老化法則を導くバイオマーカー [eess.SY, cs.SY, cs.CC, physics.med-ph, cs.AI, cs.CV]目的:骨密度をバイオマーカーとして評価するためのAI駆動統計手法の開発
- 世界的な高齢化が進む中で,生物学的年齢の指標への関心が高まっている。
- 骨密度の年齢に伴う低下パターンは議論の余地があり,信頼性の高い老化指標とならない。
- 骨密度の低下パターンを明確化し,老化過程の信頼できる指標を確立すること。
- AI駆動統計手法により,椎骨の小梁骨における骨質量分布が非ガウス型,単峰性,歪んだ分布を示すことが明らかになった。
- 骨質量分布の統計的モードを骨密度指標とする「小梁骨密度(TBD)」を新たに定義した。
- TBD評価により,年齢に伴う骨密度の低下が性別や年齢層を問わず,一貫した指数関数的低下を示すことが示された。
差分プライバシーに基づくベイズ検定 [stat.ML, cs.CR, cs.LG]目的:機密データを用いた科学的仮説検定のためのフレームワーク
- プライバシー保護が重要視される現代において,データ利用とプライバシー保護の両立が求められている。
- 従来の仮説検定はP値に依存しており,解釈の曖昧さや証拠の定量化が困難であるという課題があった。
- ベイズ検定における差分プライバシーを確立し,解釈可能性を維持しつつ計算効率を高めることを目指す。
- 提案手法は,原理に基づいたデータ生成メカニズムの下で自然に生じる差分プライバシーを持つベイズ仮説検定フレームワークを提供する。
- 広く使用されている検定統計量に基づく差分プライバシーベイズファクターに焦点を当てることで,完全なデータ生成メカニズムのモデル化の必要性を回避し,計算上の利点をもたらす。
- 提案されたフレームワークの下でのベイズファクターの一貫性に関する結果を確立するための十分条件が示された。
SCAFFLSA:連合型線形確率的近似とTD学習における異質性の抑制 [stat.ML, cs.LG, math.OC]目的:連合型線形確率的近似(FedLSA)アルゴリズムのサンプルおよび通信複雑性
- 分散環境での機械学習需要の高まりから,連合学習の効率的な手法が求められている。
- エージェント間の異質性が存在する場合,FedLSAの通信複雑性がボトルネックとなる。
- エージェントの異質性に起因する通信複雑性を低減し,学習効率を向上させる。
- 提案手法SCAFFLSAは,制御変量を用いてクライアントのドリフトを補正することで,通信複雑性を対数的に削減する。
- SCAFFLSAは,既存手法Scaffnewと比較して,サンプル複雑性がエージェント数に反比例し,線形加速を実現する。
- この線形加速は,新たな理論的根拠によって裏付けられており,連合型TD学習においても同様の改善が確認された。
継続ガウス過程におけるモデルサイズの調整:どの程度の大きさが適切か? [stat.ML, cs.LG]目的:継続学習におけるガウス過程のモデルサイズの自動調整法
- 機械学習の性能向上には適切なモデルサイズが不可欠である。計算資源の効率的な利用も重要。
- データセット全体のサイズが事前に不明な継続学習では,最適なモデルサイズを決定することが困難である。
- データ特性を見ることなくモデルサイズを調整し,常に最適な性能を維持することを目指す。
- 提案手法は,様々なデータセットにおいてハイパーパラメータ調整の必要なく良好な性能を示すことが確認された。
- 既存手法と比較して,調整の手間が少ないことが示された。
- モデルサイズを自動調整することで,計算コストを抑えつつ高い性能を維持できることが示唆された。
格子ゲージ理論のための非摂動的自明化フロー [hep-lat, cond-mat.stat-mech, cs.LG, hep-th]目的:格子ゲージ理論における連続正規化フローの構築
- 素粒子物理学の基礎理論である量子色力学の非摂動的な解法が求められている。
- 格子ゲージ理論は計算コストが高く,大規模計算が困難であるという課題がある。
- フローを用いることで計算効率を向上させ,より正確な結果を得ることを目指す。
- 行列リー群に対する連続正規化フローのアーキテクチャを提案し,格子ゲージ理論への応用可能性を示した。
- 二次元格子ゲージ理論において,良好な性能が確認された。
- 今後の格子計算における有用なツールとなる潜在力があることが示唆された。
可逆・不可逆モジュールを組み合わせたネットワークによる動的PET画像予測 [eess.IV, cs.LG]目的:動的PET画像の予測手法
- PET画像は生体内トレーサー分布と生化学反応を可視化し,臨床応用が広い。
- 長時間スキャンは患者や医療従事者に負担となる点が課題である。
- 早期フレームから動的PET画像を予測し,スキャン時間短縮を目指す。
- 提案手法は,シミュレーションデータにおいて,動力学的パラメータの予測性能と高品質なPET画像再構成が可能であった。
- 臨床データ実験では,良好な汎化性能を示し,臨床応用への期待が持てる。
- 可逆・不可逆モジュールを組み合わせた深層学習フレームワークが,動的PET画像予測に有効である。
変数重要度に対する標的学習 [stat.ML, cs.LG, stat.ME]目的:変数重要度の推定におけるロバスト性の向上
- 機械学習モデルの解釈可能性は重要であり,変数重要度はそのための主要な指標である。
- 従来の変数重要度の推定は,サンプルサイズが小さい場合に不安定になりやすいという課題がある。
- 標的学習フレームワークを用いることで,有限サンプル下での推定精度を向上させることを目指す。
- 提案手法は,従来の推定方法と同等の漸近的効率を維持しつつ,計算コストも同程度である。
- 特に,有限サンプルサイズにおいて,変数重要度の推定精度が向上することが示された。
- 数値実験により,提案手法の有効性と理論的結果の妥当性が確認された。
連合平均化と連合リチャードソン・ロンベルグの精密な分析 [stat.ML, cs.LG, math.OC]目的:連合学習におけるアルゴリズムの収束性およびバイアス解析
- データプライバシー保護の重要性が高まる中,分散データを用いた機械学習の需要が増加している。
- 連合学習は,クライアントのデータ分散により,モデルの収束性や汎化性能に課題が残る。
- バイアスの原因を特定し,リチャードソン・ロンベルグ外挿法を用いてその軽減を目指す。
- 連合平均化アルゴリズムの反復が定常分布に収束することを示し,そのバイアスと分散を解析した。
- バイアスは,確率的勾配ノイズとクライアントの異質性という2つの要素に分解されることが判明した。
- リチャードソン・ロンベルグ外挿法に基づく新しいアルゴリズムが,このバイアスを軽減する効果が示された。
種分布モデリングにおける空間・時間モデルの偏りのない交差検証の基礎 [stat.AP, cs.LG]目的:種分布モデリングのための空間・時間モデルの交差検証手法の確立
- 生物多様性保全や生態系管理において,種の分布予測は不可欠な情報である。
- 従来の交差検証法では,空間的相関や時間的依存性を考慮せず,過剰に楽観的な結果となる場合がある。
- 空間的相関を考慮した交差検証手法を確立し,より信頼性の高いモデル評価を実現すること。
- ランダム交差検証はAUCを最大0.16過大評価し,MAEも空間ブロック法に比べて80%高くなることが示された。
- 空間的相関範囲におけるブロック処理により,このバイアスを大幅に軽減できることが明らかになった。
- 学習戦略によって評価結果が異なり,強い空間的相関下ではLAST FOLDが,弱い空間的相関下ではRETRAINが高いテストAUCを達成した。
階層的背景知識と潜在変数を用いた制約に基づく因果探索 [stat.ML, cs.LG, math.ST, stat.TH]目的:制約に基づく因果探索における階層的背景知識の利用
- 因果推論は科学的発見や意思決定において重要な役割を担うため,その精度向上は不可欠である。
- 従来の因果探索手法は,観測されない変数やデータセットの重複といった現実的な問題に対応しきれない場合がある。
- 階層的背景知識を活用することで,潜在変数や重複データセットが存在する状況下での因果探索の精度と効率を向上させる。
- 本研究では,階層的FCI (tFCI) アルゴリズムの特性に関する新たな知見が得られた。
- IODアルゴリズムを拡張した階層的IOD (tIOD) アルゴリズムを提案し,その健全性と完全性について理論的に証明された。
- tIODアルゴリズムは,従来のIODアルゴリズムと比較して,より効率的かつ情報量の多い結果を提供する可能性があることが示された。
原型分析に関するサーベイ [stat.ME, cs.LG, stat.ML]目的:原型分析の理論と応用に関する包括的な概観
- 高次元データの構造理解は,科学における重要な課題である。
- 原型分析の最適化問題は非凸であり,解を見つけるのが難しい。
- 原型分析の限界と今後の研究方向性を示すことが目的である。
- 原型分析は,観測データを少数の原型(archetype)の混合として近似する手法である。
- 本サーベイは,原型分析の様々な応用分野とモデリングのベストプラクティスを概説する。
- 今後の研究方向性として,最適化問題の解決や理論的な発展が挙げられる。
確率的微分方程式学習のための確率的占有カーネル(SOCK)法 [stat.ML, cs.LG]目的:多変量確率的微分方程式の学習
- 確率的微分方程式は,物理学,生物学,金融など幅広い分野で現象を記述する上で重要である。
- 確率的微分方程式の学習は,尤度計算の困難さやモデルの同定問題など,多くの課題を抱えている。
- 再現カーネルヒルベルト空間に基づき,占有カーネルを用いて効率的に確率的微分方程式の学習を行う。
- 本研究では,ベクトル値占有カーネルと演算子値占有カーネルを導入することで,ドリフト項と拡散項を効果的に推定する手法を提案した。
- 再構成誤差に基づく目的関数を最適化することで,困難な尤度計算を回避し,高い予測精度を維持しながら効率的な学習を実現した。
- シミュレーションデータおよびアルツハイマー病患者のイメージングデータを用いて,提案手法の有効性を検証した。
因果データ融合におけるクラスタリングと枝刈り [stat.ML, cs.LG, stat.ME]目的:因果データ融合のための前処理手法
- 因果推論は,政策評価や意思決定に不可欠であり,様々な分野で重要性が増している。
- 複雑な因果グラフでは,計算量が膨大になり,因果効果の特定が困難になる場合がある。
- 因果グラフの規模を削減しつつ,重要な特徴を維持することで,効率的な因果推論を実現する。
- 提案手法は,複数のデータソースにおける枝刈りおよびクラスタリングの適用条件を一般化している。
- 縮小されたグラフに基づいて因果効果の識別可能性を判断し,識別可能な場合には識別関数を得るための十分条件を提示している。
- 疫学や社会科学の例を通して,提案手法の実用性を示している。
生理学的境界条件の推論のためのマルチフィデリティおよび次元削減ニューラルエミュレータの性能について [eess.AS, cs.CL, cs.HC, stat.ML, cs.CE, cs.LG, math.ST, q-bio.QM, stat.TH]目的:心血管モデリングにおける逆問題解決のための計算コスト削減手法
- 心血管モデリングは医療応用において重要だが,高精度なシミュレーションに莫大な計算資源を要する。
- 高精度シミュレーションの計算コストが大きく,ベイズパラメータ推定におけるサンプリングが困難である。
- 低フィデリティ近似を活用し,計算コストを削減することで効率的な逆問題解決を目指す。
- 高精度モデルの代替として,低フィデリティ近似モデルや,高低フィデリティ間のずれをモデル化する手法を比較検討した。
- ずれのモデリングには,全結合ニューラルネットワークや非線形次元削減技術,正規化フローなどが用いられた。
- 解析的なテストケースと心血管モデルを用いた検証により,提案手法の精度と計算効率が確認された。
力測定を超えて:安定した分子動力学シミュレーションのためのMLFFの事前学習 [physics.chem-ph, cs.LG]目的:安定した分子動力学シミュレーションの実現
- 分子動力学シミュレーションは,物質のダイナミクス理解に不可欠。
- 高精度な力場の計算はコストが高く,シミュレーションのボトルネックとなる。
- 大規模データでの事前学習が,安定性向上に寄与するかを検証する。
- 事前学習を行ったGemNet-Tモデルは,ゼロから学習したモデルに比べて,3倍の長さの軌道を維持できることが示された。
- 事前学習により,より構造化された潜在表現と,滑らかな力応答が得られる。
- 力場の平均絶対誤差(MAE)だけでは,MDシミュレーションの安定性を十分に評価できないことが示唆された。
分布シフト下における不確実性の定量化 [stat.ML, cs.LG]目的:分布シフト下での不確実性推定
- 機械学習の信頼性向上は,実用化において不可欠である。
- 学習データとテストデータ間の分布のずれが,不確実性推定の精度を低下させる。
- 分布シフトを考慮した不確実性推定手法を開発し,予測の信頼性を高める。
- 本研究では,分布シフトを明示的に考慮したベイズ推論フレームワークを提案した。
- 提案手法は,入力が訓練分布から離れるほど不確実性を高める適応的な事前分布を用いる。
- 合成データおよび実データでの評価により,分布シフト下で大幅に改善された不確実性推定が確認された。
SpecCLIP:恒星の分光測定データの整合性と翻訳 [physics.soc-ph, cs.CE, econ.GN, q-fin.EC, astro-ph.IM, astro-ph.SR, cs.AI, cs.LG]目的:恒星分光分析のための基盤モデルフレームワーク
- 恒星の物理的・化学的性質を理解する上で,分光データは不可欠である。
- 異なる観測機器で得られた分光データ間には,系統的な差異が存在する。
- 異なる機器間でのデータ整合性を確立し,汎用的な分光分析を実現する。
- SpecCLIPは,異なる機器で取得された分光データを整合的に関連付けることが可能となった。
- このモデルを微調整することで,恒星パラメータ推定や元素存在量決定の精度が向上した。
- 類似性検索やクロススペクトル予測により,異常検知への応用も期待される。
古典的な機械学習から創発的な基盤モデルへ:がん研究のためのマルチモーダルデータ統合に関するレビュー [q-bio.QM, cs.AI]目的:がん研究におけるマルチモーダルデータ統合戦略の包括的なレビュー
- がん研究は,ゲノミクス,画像,臨床データなど多様なデータ統合により進展しており,個別化医療の実現が期待される。
- 異種データセットからの有用な知見抽出は依然として困難であり,解析手法の高度化が求められている。
- 本研究は,従来の機械学習から基盤モデルへの移行を体系的に整理し,今後の大規模AIモデル開発の基礎を築く。
- 従来の機械学習に加え,近年注目される基盤モデルがマルチモーダルデータ統合に新たな可能性をもたらす。
- がんサブタイプ分類,バイオマーカー探索,治療指針,予後予測など,様々な応用分野における進展が確認された。
- 公開されているマルチモーダルリポジトリやデータ統合ツール・手法の現状が明らかにされた。
自動機械学習パイプライン:機械学習分子間ポテンシャル学習のための大規模言語モデル支援自動データセット生成 [cond-mat.mtrl-sci, cs.LG]目的:機械学習分子間ポテンシャル開発における自動化
- 分子シミュレーションにおいて,量子計算の高コストを回避し,高精度な結果を得る手段として重要である。
- 信頼性の高い分子間ポテンシャルを開発するには,高品質なデータセットの作成とモデルの適切な学習が必要であり,手間がかかる。
- 大規模言語モデルを活用し,データセット生成からモデル検証までの全工程を自動化することで,開発の効率化を目指す。
- 本研究で開発した自動機械学習パイプライン(AMLP)は,電子構造コードの選択,入力準備,出力変換を支援する。
- アクリジン多形体に関する検証では,基礎モデルの微調整により,エネルギー誤差が約1.7meV/原子,力が約7.0meV/Åという高精度な結果が得られた。
- 得られた分子間ポテンシャルは,DFT計算の幾何構造を亜Åレベルの精度で再現し,分子動力学シミュレーションにおいても安定性を示した。
一般化された無限次元Alpha-Procrustesに基づく幾何学 [quant-ph, cs.NI, cs.SY, eess.SY, q-bio.QM, cs.ET, physics.bio-ph, q-bio.GN, stat.ML, cs.LG, math.FA, math.OC]目的:対称正定値行列に対するAlpha-Procrustes型リーマン計量の拡張
- 機械学習や統計推論において,データ間の幾何学的な比較が重要であるため。
- 従来の距離測度は,高次元データや次元の異なるデータセット間での比較に課題があった。
- 汎化されたBures-Wasserstein距離などの導入により,高次元での幾何学的安定性を向上させる。
- 本研究では,unitized Hilbert-Schmidt演算子と拡張されたMahalanobisノルムに基づく形式化を導入した。
- これにより,GBW距離やLog-Hilbert-Schmidt距離の無限次元への頑健な一般化が可能となった。
- 実験結果は,提案された汎化された距離測度が,様々な次元とスケールのデータセット間での比較において優れた性能を示すことを示した。
非滑らかな最適化のためのセーフガード付き確率的ポリアクステップサイズ:小さな(準)勾配なしで堅牢な性能 [math.OC, cs.LG, stat.ML]目的:非滑らかな凸最適化における収束性保証
- 機械学習の分野では,深層学習を含む大規模な最適化問題が頻繁に発生する。
- 従来の確率的勾配降下法は,非滑らかな問題に対して不安定になりやすい。
- セーフガード付き確率的ポリアクステップサイズを用いて,より安定した収束を目指す。
- 提案手法は,強条件なしに非滑らかな凸最適化における厳密な収束性を保証する。
- ベンチマークテストの結果,セーフガードが収束近傍に及ぼす影響は理論予測と一致した。
- 深層学習の実験では,既存の適応的ベースラインと同等の性能を示し,勾配消失の問題を回避した。
V-Rex:動的KVキャッシュ検索によるリアルタイム動画LLMアクセラレーション [quant-ph, cs.AR, cs.DC, cs.ET, eess.IV, cs.AI, cs.AR, cs.CV, cs.MM]目的:ストリーミング動画LLMの推論加速
- 動画キャプションや対話エージェントなど,リアルタイムなマルチモーダル処理へのLLM利用が拡大している。
- 連続する動画入力によりKVキャッシュが肥大化し,計算量やデータ転送量が増加,精度低下を招く。
- アルゴリズムとハードウェアの両面からボトルネックを解消し,エッジデバイスでのリアルタイム推論を実現する。
- V-Rexは,動的KVキャッシュ検索アルゴリズムReSVとハードウェアアクセラレータDREを組み合わせたシステムである。
- ReSVは,動画フレーム間のトークンクラスタリングによりKVキャッシュのメモリ使用量を削減する。
- エッジ環境において,AGX Orin GPUと比較して1.9~19.7倍の高速化と3.1~18.5倍のエネルギー効率改善を達成した。
