arXiv雑要約
AI - 2025/12/18 公開
FrontierCS:進化する知能に対する進化し続ける課題 [cs.LG, cs.SE]目的:進化する知能を評価するための,コンピュータ科学分野における156のオープンエンドな問題群
- AIの発展に伴い,既存のベンチマークでは評価しきれない,より高度な問題解決能力が求められている。
- 従来のベンチマークは最適な解が既知であるタスクに偏っており,未知解の問題に対する評価が困難であった。
- 最適な解が未知数でありながら客観的評価が可能な問題群を提供し,AIの最先端能力を測度化すること。
- FrontierCSは,アルゴリズム問題と研究問題という2つのトラックで構成され,専門家による評価体制が整っている。
- 実験の結果,最先端の推論モデルは人間の専門家と比較して性能が劣り,推論予算の増加だけではその差を埋められないことが示された。
- モデルは必ずしも高品質なアルゴリズムやシステム設計を発見するのではなく,動作するコードの生成に過度に最適化される傾向がある。
DREXを用いた効率的な早期終了推論のための動的再バッチ処理 [cs.DC, cs.LG]目的:大規模言語モデルにおける早期終了推論の効率化
- 近年の大規模言語モデルの発展により,推論速度の向上が喫緊の課題となっている。
- 従来のバッチ処理手法は,早期終了推論に対応しておらず,性能を最大限に引き出せない。
- 各リクエストの早期終了状況に応じた動的再バッチ処理により,推論効率を向上させる。
- 提案手法DREXは,従来のベースラインと比較して,2~12%のスループット向上を達成した。
- DREXは,不本意な早期終了を完全に排除し,出力品質を維持する保証を提供する。
- コピーフリーな再バッチ処理バッファと,早期終了・SLAを考慮したスケジューラにより,効率的な推論を実現している。
膀胱がん複合治療における学習モデルパラメータダイナミクス:疎な生物学的データからの解析 [cs.LG, q-bio.CB]目的:膀胱がん複合治療における,細胞間相互作用の時間変化の学習
- がん治療において,腫瘍と免疫細胞の相互作用を理解することは,治療効果を高める上で重要である。
- 実験データが限られており,腫瘍量の経時的な変化もわずかしか得られない場合が多い。
- 限られたデータから,生物学的プロセスの時間変化を捉え,より正確な予測を可能にすること。
- 物理情報ニューラルネットワークを用いて,観測データがない時点における細胞集団の軌跡を予測した。
- 予測された細胞集団の軌跡は,生物学的な説明と整合性があることが示された。
- 本手法は,外部からの介入を受ける生物学的システムにおける,時間変化する相互作用の学習フレームワークを提供する。
Artism:AI駆動による二重エンジンシステム - 美術生成と批評 [cs.AI]目的:美術の進化における潜在的な軌跡の探求
- 美術史研究や創作活動において,新たな視点や発展の可能性を模索することは重要である。
- 従来の美術批評は一方向的であり,双方向的な対話や反省的実践が不足している。
- AIを活用した批評的ループを構築し,美術の分析と創造における新たな可能性を開拓すること。
- 本研究では,深層学習とマルチエージェント協調による多次元シミュレーションを実現するArtismという二重エンジンシステムを提案した。
- AIDA(人工アーティストソーシャルネットワーク)とIsmism Machine(批評分析システム)という二つの要素を相互に接続し,美術史的発展と概念的革新パターンを探索する。
- この手法は,AI駆動による批評的ループという一般的な方法論を提供し,美術の計算分析における新たな可能性を示唆する。
予測的コンセプトデコーダ:スケーラブルなエンドツーエンド解釈支援ツールの学習 [cs.AI, cs.CL, cs.LG]目的:ニューラルネットワークの内部活性化の解釈
- AIの信頼性向上には,モデルの判断根拠を理解することが不可欠である。
- 活性化空間の複雑さから,ニューラルネットワークの内部構造を解釈することが困難である。
- 活性化からモデルの振る舞いを予測する解釈支援ツールを開発し,解釈性を高める。
- 提案手法である予測的コンセプトデコーダは,大規模データにおける自己解釈スコアとダウンストリームタスクの性能を向上させた。
- 本手法は,脱獄攻撃,秘密のヒント,埋め込まれた潜在的概念を検出し,ユーザー属性を正確に抽出できる。
- 活性化を疎なコンセプトリストに圧縮し,自然言語質問に答えることで,エンドツーエンドの解釈を可能にする。
空間記憶の更新によるビデオ生成:Spatia [cs.CV, cs.AI]目的:ビデオ生成における空間的一貫性の維持
- ビデオ生成技術は,現実世界の描写や新たなコンテンツ創出において重要な役割を担う。
- 既存モデルでは,長期間にわたる空間的・時間的一貫性の維持が困難である。
- 3D点群を空間記憶として活用し,一貫性のあるビデオ生成を目指す。
- Spatiaは,3D点群を空間記憶として明示的に保持し,ビデオクリップを反復的に生成する。
- 視覚SLAMを通じて空間記憶を継続的に更新することで,空間的一貫性を向上させている。
- カメラ制御や3D編集といった応用が可能となり,大規模なメモリ駆動型ビデオ生成の基盤を提供する。
グリーンウォッシングにおけるアルゴリズム的刑事責任:インド,米国,欧州連合の比較 [cs.CY, cs.AI, cs.CR]目的:AIを活用したグリーンウォッシングに対する刑事責任の法的比較分析
- 企業の持続可能性に関する透明性確保は重要であり,環境開示の信頼性が求められる。
- 現在の法体系は,AIによる欺瞞的な主張に対して人間の意図を立証する必要があり,対応が困難である。
- AI生成による虚偽表示に対する刑事責任を明確化し,法的責任のあり方を検討する。
- AIによるグリーンウォッシングに対応するため,厳格責任モデルの導入が有効である可能性が示された。
- AIの説明責任を確保するためのガバナンスフレームワークとアルゴリズムデューデリジェンス義務の必要性が明らかになった。
- EUの企業持続可能性デューデリジェンス指令は,国際的なモデルとして注目される。
PyFi:敵対的エージェントによるピラミッド型金融画像理解フレームワーク [quant-ph, cs.ET, q-fin.CP, cs.AI, cs.CV]目的:金融画像に関するVLMsの段階的な,易から難への推論能力
- 金融分野における画像理解は,投資判断やリスク管理に不可欠であり,その重要性は高い。
- 既存のVLMは,複雑な金融画像を理解し,高度な推論を行う能力に課題が残されている。
- 金融画像理解の能力を段階的に評価・向上させるためのフレームワークとデータセットを構築する。
- PyFiフレームワークとPyFi-600Kデータセットを提案し,VLMの金融画像理解能力を段階的に評価できるようにした。
- 敵対的エージェントを用いたデータ生成により,大規模な金融画像質疑応答データセットを効率的に構築した。
- Qwen2.5-VLモデルをPyFiデータセットでファインチューニングした結果,複雑な金融質問への回答精度が大幅に向上した。
VERAFI:神経記号的ポリシー生成による検証可能な金融エージェント [q-fin.CP, cs.AI]目的:検証可能な金融知能の実現
- 金融分野において,AIの信頼性と正確性は極めて重要であり,投資判断やリスク管理に不可欠である。
- 従来の金融AIシステムは,計算ミスや規制違反といった問題点を抱えており,信頼性に欠ける。
- 本研究は,神経記号的アプローチを用いて,金融AIシステムの正確性と信頼性を向上させることを目指す。
- VERAFIは,従来の検索・再ランキング手法と比較して,事実の正確性において81%の相対的な改善を達成した。
- 神経記号的ポリシー層は,純粋なエージェント処理と比較して4.3%の精度向上に貢献し,数学的・論理的エラーを効果的に削減した。
- VERAFIは,金融ドメインの専門知識を推論プロセスに統合することで,規制遵守やリスク管理に対応できる実用的な金融AIの実現に貢献する。
脂質欠乏型透明細胞腎細胞癌における分子,病理,放射線学的表現型の多重スケールクロスモーダルマッピング [q-bio.QM, cs.AI]目的:脂質欠乏型透明細胞腎細胞癌の術前同定
- 透明細胞腎細胞癌は予後が多様であり,従来のTNM分類では限界があるため,多角的解析の必要性が高まっている。
- 脂質欠乏型透明細胞腎細胞癌は,早期段階でも予後不良と関連しており,その早期発見が課題である。
- 分子情報を病理・放射線学的データに統合し,非侵襲的な分子表現型決定を目指す。
- 分子シグネチャを病理・放射線学的表現型にマッピングする階層的枠組みを確立し,これらのモダリティ間を結びつけた。
- PathoDCCDおよびRadioDCCDにより,分子サブタイプを再現性良く予測し,臨床リスク層別化が可能となった。
- この多重スケールパラダイムは,術前の非侵襲的分子表現型決定に役立ち,予後の悪い患者群の特定に貢献する。
複雑システムにおける因果媒介分析の拡張:根本原因分析のためのフレームワーク [stat.ME, cs.AI, econ.EM]目的:複雑システムにおける因果媒介効果の定量化
- 現代の運用システムは複雑化の一途を辿り,その理解と改善が不可欠である。
- 従来の媒介分析は,大規模で高次元な因果グラフには適用が困難である。
- 複雑なシステムにおける介入の影響経路を明らかにし,根本原因の特定を支援する。
- 本研究では,大規模な因果グラフに対応可能な,スケーラブルな媒介分析フレームワークを提案した。
- 総効果を解釈可能な直接効果と間接効果に体系的に分解する手法を開発した。
- フルフィルメントセンターの物流におけるケーススタディを通じて,その実用性を実証した。
倍率を意識した知識蒸留 (MAD): ギガピクセル全スライド画像の統一表現学習のための自己教師ありフレームワーク [eess.IV, cs.AI, cs.CV, cs.LG]目的:ギガピクセル全スライド画像における統一表現学習
- 病理診断の効率化と精度向上に貢献するため,デジタルパソロジーの重要性が高まっている。
- 従来の自己教師あり学習では,異なる倍率の画像を独立した視点として扱っており,解像度変化に対する安定した表現学習が困難であった。
- 本研究は,倍率間の対応関係を利用し,解像度に依存しないロバストな表現学習を実現することを目的とする。
- 低倍率のコンテキストと高倍率の詳細を対応付ける知識蒸留 (MAD) により,解像度変化に安定した表現学習が可能となった。
- 10倍の埋め込みを用いて学習した線形分類器は,未知の40倍タイルに対して96.7%の性能を維持し,解像度不変性の高い表現学習を実証した。
- セグメンテーション結果は倍率間で一貫性を保ち,解剖学的境界を維持し,ノイズを最小限に抑えることが確認された。
高度卵巣癌の診断的腹腔鏡下における腹膜癌播種評価のための人工知能 [eess.IV, cs.AI, cs.CV]目的:高度卵巣癌の診断的腹腔鏡下における腹膜癌播種評価を支援する人工知能モデルの開発
- 高度卵巣癌は進行期に発見されることが多く,腹膜癌播種の評価は治療方針を決定する上で重要である。
- 従来の腹膜癌播種評価 (Fagottiスコア) は主観的で,術者依存性が高く,客観的な評価が課題である。
- 腹腔鏡動画から自動的にFagottiスコアを推定し,手術適応を判断するための人工知能モデルを構築すること。
- 開発データセットにおいて,解剖学的構造のセグメンテーションはDiceスコア70±3%,腹膜癌播種のセグメンテーションは56±3%を達成した。
- 動画レベルでの解剖学的部位の分類はF1スコア74±3%と73±4%を示し,Fagottiスコアの予測は正規化RMSEが1.39±0.18と1.15±0.08であった。
- 手術適応の予測は開発データセット (n=101) でF1スコア80±8%,独立検証データセット (n=50) で80±2%という良好な結果を示した。
超高磁場における深層学習による水抑制なしMRSI:同時定量代謝,感受率,ミエリン水イメージング [math.AG, cs.SC, eess.SP, cs.SY, eess.SY, eess.IV, cs.LG]目的:脳内代謝,感受率,ミエリン水の同時定量イメージング
- 脳疾患の診断や治療効果評価において,脳内代謝や組織特性の正確な把握が重要である。
- 従来のMRSIでは水信号の抑制が必要であり,代謝物質の測定精度や撮影時間の制約となっていた。
- 水信号抑制なしMRSIの課題を克服し,高精度な脳内代謝情報と組織特性の定量評価を実現すること。
- 深層学習ネットワークWALINET+が,シミュレーションおよび生体データにおいて高い精度で水や脂質の除去に成功した。
- 水抑制ありMRSIと比較して,クレアチンやグルタミン酸などの代謝物質において高いS/N比が得られた。
- QSMとMWFはGRE画像と良好な一致を示し,同時取得が可能であることが示された。
不穏多過程多腕バンディット:自己駆動顕微鏡への応用 [stat.AP, cs.AI, cs.SY, eess.SY]目的:高内容スクリーニング顕微鏡における効率的な画像取得戦略
- 生細胞イメージングデータは膨大であり,その解析効率向上が重要である。
- 従来の画像取得方法は静的または経験則に依存し,動的な生物学的過程に対応できていない。
- 生物学的システムの非均質性を考慮した,動的な画像取得戦略を確立することを目指す。
- 提案手法(RMPMAB)は,シミュレーションにおいて累積後悔を37%以上削減することを示した。
- 生細胞イメージング実験では,生物学的に重要なイベントを93%多く捉えることができた。
- RMPMABは,確率的決定理論と自律顕微鏡制御を統合し,学際的な科学研究の加速に貢献する。
ニューラルネットワークベイズアルゴリズム実行を用いた効率的なナッジ付き弾性バンド法 [q-fin.PM, cs.CE, cond-mat.mtrl-sci, cs.LG]目的:触媒や生体分子設計などの科学的課題における準安定状態間の最小エネルギー経路の発見
- 触媒や生体分子の設計において,安定な経路の特定は不可欠であり,物質科学の発展に貢献する。
- 従来のナッジ付き弾性バンド法は計算コストが高く,複雑な系への適用が困難であるという課題がある。
- ニューラルネットワークを活用し,エネルギー地形と最小エネルギー経路を同時に学習することで,計算コストを削減する。
- 本研究で提案するNN-BAXは,従来のNEB法と比較して,エネルギーと力の評価回数を1~2桁削減することに成功した。
- 最小エネルギー経路の精度をほとんど損なうことなく,100次元以上の系への拡張性も実証された。
- この手法は,科学的に重要な系における最小エネルギー経路の発見における計算障壁を取り除く可能性を示唆する。
少数の弱教師ありデータを用いた眼底画像における視神経円板およびカップのセグメンテーションのためのメタ学習器 [eess.IV, cs.AI, cs.CV]目的:緑内障診断のための視神経円板(OD)と視神経カップ(OC)のセグメンテーション
- 緑内障は世界的に失明原因上位であり,早期発見と正確な診断が重要である。
- 眼底画像のセグメンテーションには大量の注釈付きデータが必要であり,その取得は困難である。
- 少量のデータで高精度なセグメンテーションを実現し,注釈コストを削減することを目指す。
- 提案手法であるEfficient Omni ProtoSeg (EO-ProtoSeg)は,REFUGEデータセットにおいて,わずか1枚の疎なラベル付き画像のみで,ODのIoUスコア88.15%,OCのIoUスコア71.17%を達成した。
- EO-ProtoSegは,既存の少射学習および半教師あり学習手法と比較して,より少ないラベル付き画像で優れた性能を示した。
- EO-ProtoSegは,軽量でありながら,教師なしドメイン適応法と同等の性能を発揮し,再学習を必要としない。
投資判断のための世界株価指数長期予測に対する適応重み遺伝的アルゴリズム最適化SVR [eess.SP, cs.NI, q-fin.CP, cs.LG]目的:世界株価指数の堅牢な長期予測
- 長期的な投資判断において,正確な株価予測は不可欠である。
- 長期予測は不確実性が高く,短期予測に比べて困難である。
- 既存手法の課題を克服し,長期予測の精度と効率を向上させる。
- 提案手法IGA-SVRは,LSTMと比較してMAPEを19.87%削減し,OGA-SVRと比較して50.03%削減した。
- IGA-SVRは,LSTMと比較して実行時間が約20分の1と,計算効率も高い。
- 遺伝的アルゴリズムにより,SVRの最適ハイパーパラメータが選択され,長期的な傾向と近年のトレンドの両方を考慮した学習が可能となった。
SAGIN対応UAV移動管理のためのQoSを考慮した階層型強化学習 [eess.SP, cs.AI]目的:SAGIN環境下におけるUAVの移動管理に関する制約付き多目的最適化
- UAV利用の拡大に伴い,安定した通信環境の確保が重要になっている。
- 単一のネットワークでは,UAVの移動に伴う通信品質の変動に対応が困難である。
- 異種ネットワークの特性を考慮し,UAVの通信品質を最適化する手法が求められている。
- 提案手法は,既存のベンチマークと比較してスループット,リンク切り替え頻度,QoS充足率において大幅な性能向上を示した。
- 階層型強化学習フレームワークにより,複雑な問題を効率的に解決できることを示した。
- 提案アルゴリズムは,多UAV環境にも拡張可能であり,汎用性の高いポリシー学習を実現した。
ColliderML:高輝度物理ベンチマークデータセットの初公開 [math.OC, cs.SY, eess.SY, hep-ex, cs.LG, physics.data-an, physics.ins-det]目的:高輝度大型ハドロン衝突型加速器条件における陽子-陽子衝突のオープンデータセット
- 素粒子物理学では,実験データを用いた機械学習の重要性が増している。
- 検出器レベルのデータは限られており,機械学習研究のボトルネックとなっている。
- 機械学習研究用の,大規模で高品質な検出器レベルデータセットを提供する。
- ColliderMLは,100万イベントを収録した標準模型および標準模型を超えたプロセスのデータセットである。
- データセットは,現代的な計算手法,リアルなパイルアップ,検証済みの検出器ジオメトリを用いて生成された。
- 本データセットは,Hugging Faceプラットフォームで公開されており,機械学習研究に貢献する。
オンライン分割局所的深度:半教師あり型応用に向けて [stat.ML, cs.LG]目的:半教師あり型予測におけるオンライン応用
- データ解析において,データ構造の理解は重要であり,異常検知や分類の精度向上に不可欠である。
- 大規模データセットに対する局所的深度の計算は,計算コストが高く,効率的な手法が求められている。
- オンライン環境下での効率的な局所的深度計算を可能にし,実用的な応用を促進すること。
- 本研究では,分割局所的深度(PaLD)アルゴリズムをオンライン環境に適応させたオンラインPaLDを提案した。
- 事前に参照データセットからコヒージョンネットワークを構築することで,新たなデータ点への拡張を効率的に行う。
- 医療データセットを用いたオンライン異常検知と半教師あり型分類への応用例を示し,有効性を検証した。
MuVacASにおける深層強化学習と深層学習代理モデルによる自律的な圧力制御 [physics.acc-ph, cs.LG]目的:MuVacASにおける自律的な圧力制御手法の開発
- 核融合開発には極限状態に耐えうる材料が必要であり,その試験設備の開発が重要である。
- MuVacASのような試験装置では,高真空環境下でのガス圧力の精密な制御が課題となる。
- 本研究は,データ駆動型アプローチによりMuVacASの圧力制御を自動化し,安定的な運転を実現する。
- 深層学習代理モデルがアルゴン注入システムの動的特性を高精度に再現することに成功した。
- 深層強化学習エージェントが,動的な外乱下でも厳格な運転範囲内でガス圧力を維持できる制御ポリシーを獲得した。
- この手法は,次世代加速器施設のインテリジェントな自律制御システム実現に向けた重要な一歩となる。
フォトニクス強化グラフ畳み込みネットワーク [physics.optics, cond-mat.dis-nn, cs.LG, quant-ph]目的:フォトニクスによるグラフ畳み込みネットワークの性能向上
- 機械学習の高速化と低消費電力化が求められており,フォトニクスはその有力な手段となる。
- 既存の機械学習モデルはデジタル処理に依存しており,フォトニクスの潜在能力を十分に活かせていない。
- 光の伝搬を利用した位置埋め込みにより,グラフ構造情報を効率的に表現し,グラフMLの性能を向上させる。
- 提案手法は,Long Range Graph Benchmarkデータセットにおいて,従来のGCNよりも回帰タスクで平均絶対誤差を6.3%低減した。
- また,分類タスクでは平均精度を2.3%向上させ,グラフ構造情報を効果的に利用できることを示した。
- 高速なフォトニクスハードウェア実装により,位置埋め込みのデジタルシミュレーションを回避し,高速な特徴量生成が可能となる。
最適な学習点近傍における学習ダイナミクスの教師・生徒視点 [eess.SP, cs.NI, math.OC, cs.SY, eess.SY, stat.ML, cs.LG]目的:ニューラルネットワークの学習におけるヘッセ行列の特性
- 深層学習の性能向上には,勾配降下法の効率的な学習が不可欠である。
- ヘッセ行列のスペクトル解析は困難であり,学習性能との関係が不明確である。
- 教師・生徒ネットワークのヘッセ行列のスペクトルを解析し,学習性能を予測する。
- 最適な学習点近傍では,ヘッセ行列の最小固有値が長期的な学習性能を決定する。
- 線形ネットワークでは,ヘッセ行列のスペクトルがscaled chi-square分布とMarchenko-Pastur分布の畳み込みに従うことが解析的に示された。
- 多項式活性化関数を用いたネットワークでは,ヘッセ行列のランクが有効なパラメータ数と解釈できる。
Liイオン電池カソードのSOC依存熱分解反応速度をKA-CRNNsで学習 [physics.chem-ph, cs.LG]目的:Liイオン電池カソードのSOC依存熱分解反応速度の連続的な学習
- Liイオン電池の安全性確保は重要であり,熱暴走の予測は不可欠である。
- 既存モデルは特定のSOCでのパラメータしか推定できず,連続的なSOC依存性を捉えられていない。
- 本研究は,KA-CRNNsを用いてSOC依存熱分解反応速度を連続的に予測することを目的とする。
- Kolmogorov-Arnold化学反応ニューラルネットワーク(KA-CRNN)を適用し,SOC依存性のある熱分解反応パラメータを学習した。
- NCA,NM,NMAカソードに対してモデルを構築し,全SOC範囲でのDSC熱発生特性を再現することに成功した。
- 酸素放出や相転移といったSOC依存メカニズムに関する解釈可能な知見が得られた。
機械学習における関数表現性からの量子優位性の展望 [quant-ph, cs.LG, stat.ML]目的:機械学習における量子優位性獲得の可能性
- 機械学習は社会の様々な分野で活用が拡大しており,高性能化が求められている。
- 量子機械学習は有望視される一方,古典計算によるシミュレーションが可能な場合がある。
- 量子計算モデルの古典シミュレーション可能性を明確にすること。
- 量子回路の構造と学習可能な関数の数学的性質を結びつけるフレームワークを提示した。
- 回路の深さや非クリフォードゲートの数が,古典シミュレーションの効率性に影響を与えることを示した。
- 既存のシミュレーション方法に共通する古典化の経路を明らかにし,量子優位性獲得の可能性を示唆した。
高次元偏最小二乗法:スペクトル解析と基本的な限界 [stat.ML, cs.LG]目的:高次元データセット間の共通潜在成分の抽出
- データ統合は,様々な分野で不可欠であり,複雑なデータから有用な情報を得る鍵となる。
- 高次元データにおける偏最小二乗法(PLS)の理論的理解は未だ十分ではなく,その挙動には不明確な点が多い。
- 高次元PLSの理論的限界を明らかにすることで,より適切なデータ解析手法の選択に貢献する。
- 提案手法により,高次元PLS-SVDの再構成性能を定量的に説明することができた。
- PLS-SVDは,各データセットに個別に主成分分析を適用するよりも,共通潜在空間の検出において漸近的に優れていることが示された。
- 本研究は,高次元PLS-SVDの利点と基本的な限界を明確にする包括的な理論的理解を提供する。
テンソルフロー・リーモプト:リーマン多様体上の最適化ライブラリ [cs.SI, math.OC, physics.soc-ph, q-bio.PE, cs.MS, cs.CG, cs.LG]目的:リーマン多様体上の機械学習のためのPythonライブラリ
- 機械学習の応用範囲拡大のため,ユークリッド空間に限定されない幾何学的なアプローチが重要である。
- 既存の機械学習フレームワークでは,非ユークリッド空間での最適化が困難であった。
- リーマン多様体上の効率的な最適化計算を実現し,機械学習パイプラインを支援する。
- テンソルフロー・リーモプトは,多様体制約パラメータを持つニューラルネットワーク層などを実装している。
- リーマン多様体上での幾何学的演算や確率的最適化アルゴリズムを提供することで,非ユークリッド空間での学習を可能にする。
- TensorFlow Extendedとの統合を前提とし,研究開発から実運用まで幅広い用途に対応する。
専門家アドバイスとランダム化リトルストン次元を用いた最適予測 [cs.LG]目的:オンライン学習におけるランダム化学習者の最適期待誤り限界の特定
- 機械学習の分野において,オンライン学習はデータが逐次的に提示される状況下での学習理論として重要である。
- 決定論的学習者に対する誤り限界は確立されているが,ランダム化学習者に対する明確な限界が未解決であった。
- ランダム化リトルストン次元を用いて,ランダム化学習者の最適誤り限界を理論的に導き出す。
- ランダム化学習者の最適期待誤り限界は,そのランダム化リトルストン次元に等しいことが示された。
- リトルストン次元dを持つクラスに対する最適ランダム化誤り限界は,k + Θ(√kd + d)である。
- 専門家アドバイスを用いた予測問題において,ランダム化学習のための最適学習則が提示され,その期待誤り限界が決定論的限界の半分であることが示された。
SketchOGD: メモリ効率の良い継続学習 [cs.LG, cs.AI, stat.ML]目的:継続学習における破滅的忘却の軽減
- 機械学習の応用範囲拡大に伴い,継続学習の重要性が高まっている。
- 過去のタスクを忘れてしまう「破滅的忘却」が,継続学習の大きな課題となっている。
- 過去の情報を効率的に保持し,長期間の継続学習を可能にすることを目的とする。
- 提案手法SketchOGDは,勾配情報を圧縮する行列スケッチングを用いることで,メモリ効率を大幅に向上させた。
- 既存のメモリ効率化手法と比較して,SketchOGDはオンラインで動作し,実装が容易で,理論的な解析も可能である。
- 実験結果から,SketchOGDは固定されたメモリ予算内で,現在のOGDの最先端手法よりも優れた性能を示すことが分かった。
変動的継続テスト時適応 [cs.RO, eess.SY, cs.SY, math.OC, cs.LG, stat.ML]目的:継続テスト時適応における誤差蓄積の軽減
- テスト時のドメインシフトへの対応は,現実世界の様々な応用において重要である。
- ラベルなしサンプルのみを使用するため,モデル更新の不確実性が高く,誤差蓄積が問題となる。
- ベイズ推論を用いて不確実性を定量化し,誤差蓄積を抑制することを目指す。
- 提案手法VCoTTAは,事前分布を組み込むことで,モデル更新の安定性を向上させる。
- 平均教師モデル戦略と変分推論を組み合わせることで,テスト時の適応を効果的に行う。
- 3つのデータセットで,誤差蓄積の軽減効果が確認された。
エグゼンプラーフリー継続学習のための表現増強解析学習 [cs.LG, cs.CV]目的:エグゼンプラーフリー継続学習における破滅的忘却の軽減
- 継続学習は,機械学習モデルが新しいタスクを学習する際に,過去の知識を保持することが重要である。
- エグゼンプラーフリー継続学習では,過去のデータを保持できないため,忘却が深刻な問題となる。
- 表現増強解析学習は,表現力向上とバックボーン知識の活用により,忘却問題を解決する。
- REALは,自己教師あり学習と教師あり学習を組み合わせたデュアルストリーム事前学習により,表現力を向上させる。
- 特徴融合バッファーを用いて,バックボーンの特徴量を活用し,分類器の学習を支援する。
- CIFAR-100,ImageNet-100,ImageNet-1kのベンチマークで,最先端の性能を達成した。
ニューラルネットワークにおける過剰パラメータ化と敵対的頑健性:概要と実験的分析 [cs.LG]目的:ニューラルネットワークの敵対的頑健性に関する考察
- 深層学習モデルの性能向上に不可欠な過剰パラメータ化の理解が求められる。
- 過剰パラメータ化が敵対的攻撃に対する脆弱性を招く可能性が指摘されている。
- 過剰パラメータ化されたネットワークの頑健性を評価手法と共に検証する。
- 過剰パラメータ化されたネットワークは,そうでないネットワークよりも敵対的攻撃に対して頑健であることが示された。
- 攻撃アルゴリズムの信頼性評価も行い,結果の妥当性を裏付けた。
- 既存研究の矛盾する知見は,攻撃手法の不適切さに起因する可能性がある。
ニューロシンボリック学習における不均衡:特徴付けと緩和戦略 [cs.LG, stat.ML]目的:ニューロシンボリック学習における学習不均衡の特徴付けと緩和
- ニューロシンボリック学習は,記号的推論とニューラルネットワークを組み合わせ,複雑な問題を解決する可能性を秘めている。
- 従来の学習方法では,クラス間の誤り率の差(学習不均衡)が性能低下の原因となる場合がある。
- 本研究は,ニューロシンボリック学習特有の学習不均衡を分析し,その緩和策を提案することを目的とする。
- 記号的コンポーネント$\sigma$が学習不均衡に大きく影響することが理論的に示された。これは,既存研究とは異なる重要な知見である。
- 隠れた正解ラベルの周辺分布を推定する手法と,それを制約として利用するアルゴリズムが提案された。
- 提案手法は,ニューロシンボリック学習および長尾学習の既存手法と比較して,最大14%の性能向上を示した。
TrafficGamer:安全性重視のシナリオに対するゲーム理論オラクルを用いた信頼性と柔軟性を備えた交通シミュレーション [cs.AI, cs.MA]目的:安全性重視の交通シナリオに対する交通シミュレーション手法
- 自動運転システムの安全性確保は重要である。実世界の稀な危険な状況への対応が課題となっている。
- 実データからは危険な状況を網羅的に学習できない。複数車両の予測モデル化も複雑である。
- 安全性重視のシナリオを効率的にシミュレーションし,自動運転システムの安全性を向上させる。
- TrafficGamerは,交通状況を多エージェントゲームとして捉え,現実世界の交通分布と整合性のとれたシミュレーションを実現する。
- 他の手法と比較して,安全性重視のシナリオにおける均衡を効率的に捉え,多様性と実用性を確保する。
- リスク感度制約の設定により,均衡の厳密さを動的に調整可能な柔軟なシミュレーションを提供する。
リアルワールドEHRと病理検査データを用いたUTIリスク層別化のための説明可能なAI [cs.LG, cs.AI]目的:UTIリスク層の識別
- 電子健康記録(EHR)は臨床的知見を得る上で大きな可能性を秘めている。
- EHRデータは不均質性,欠落,時間軸のずれ,ラベル付きデータの少なさ等の課題がある。
- 臨床専門家の知見に基づき,UTIリスク推定フレームワークを開発し,リスク層を識別する。
- ペアワイズXGBoostモデルを用いてUTIリスクカテゴリを識別し,説明可能なAI技術で主要な予測因子を特定した。
- リスクグループ間で臨床的および人口統計学的予測因子に違いが見られた。
- 本研究はAI駆動型インサイトがUTI臨床意思決定を支援する可能性を示唆するが,さらなる検証が必要である。
WaveGNN:グラフニューラルネットワークとTransformerを統合した臨床時系列の減衰を考慮した分類 [cs.LG, cs.AI]目的:不規則な臨床時系列データの分類手法
- 臨床データは不規則な間隔で記録され,医療診断や予後予測に不可欠である。
- 既存手法はデータの補完や変換に依存し,バイアスや解釈性の低下を招く。
- 不規則な時系列データに対し,補完や変換を行わず,正確な学習を実現する。
- WaveGNNは,既存の最先端手法と比較して,複数のベンチマークデータセットで安定した性能を示した。
- WaveGNNによって学習されたグラフ構造は,既知の生理学的構造と一致し,解釈性を高めた。
- WaveGNNは,臨床的判断を支援する可能性を示唆している。
大規模システムにおけるスケーラブルな時系列異常因果関係の発見:バイナリ異常フラグデータによる計算効率の達成 [cs.LG, stat.ML]目的:大規模システムにおける異常因果関係の発見
- システム監視は,故障診断に不可欠であり,その重要性は増している。
- 大規模システムでは,監視変数の組み合わせが膨大で,因果関係の学習に計算コストがかかる。
- バイナリ異常フラグデータに特化した因果関係学習手法により,計算効率と精度を向上させる。
- 提案手法\textsc{AnomalyCD}は,異常データに配慮した因果関係テストやデータ圧縮などの戦略を用いることで,計算コストを削減した。
- CERNの実験データと公開データセットを用いた評価により,バイナリ異常データにおいて計算効率と精度の向上が確認された。
- 時系列因果関係グラフの構築において,計算オーバーヘッドの顕著な削減と,適度な精度向上が示された。
焦点化スパースガウス過程によるスケーラブルなベイズ最適化 [cs.LG, stat.ML]目的:ベイズ最適化のスケーラビリティ向上
- 探索問題において,目的関数の評価コストが高い場合に有効な手法である。
- ガウス過程の計算コストが高く,高次元・大規模な問題への適用が困難である。
- スパースガウス過程を活用し,関連領域への表現力を集中させることで効率化を図る。
- 提案手法FocalBOは,ロボット形態設計や585次元の筋骨格系制御において,最先端の性能を達成した。
- 焦点化ガウス過程は,局所的な予測精度を高める新しい変分損失関数を用いる。
- FocalBOは,より小さな探索空間に対して階層的に焦点化ガウス過程の獲得関数を最適化する。
考古学における機械学習の応用:レビュー [cs.LG]目的:考古学における機械学習応用の現状と課題
- 考古学では,大量かつ多様なデータ分析が重要であり,機械学習はその強力な手法となる。
- 考古学における機械学習の応用は増加しているものの,その全体像と課題は十分に把握されていない。
- 考古学研究における機械学習の適切な活用を促進するための指針を提示すること。
- 1997年から2022年までの135論文を分析した結果,2019年以降に発表数が増加傾向にあることが確認された。
- 構造検出や遺物分類が主要な応用分野であり,教師あり学習モデルが中心的に利用されている。
- 機械学習の導入にあたっては,研究目的とデータの特性に合わせた明確な方法論の確立が重要である。
浅い多項式ニューラルネットワークの幾何学と最適化 [cs.LG, math.AG]目的:浅い多項式ニューラルネットワークにおける幅と最適化の関係性
- 深層学習の理論的理解は,モデルの性能向上と応用範囲拡大に不可欠である。
- ニューラルネットワークの最適化は,非凸性や局所解の存在により困難を伴う。
- 教師あり学習におけるデータ分布が最適化に与える影響の定量化と理解。
- 教師・生徒問題は,データ分布に誘導された非標準的な内積に関する低ランクテンソル近似と解釈できる。
- 教師データ識別子は,学習データ分布の関数としての最適化の質的挙動を符号化する。
- 2次活性化ネットワークを持つ教師・生徒問題において,臨界点とヘッセ行列の符号に関する Eckart-Young の定理の変形が示された。
安定性に基づいたサブネットワーク探索によるワンサイクル構造化プルーニング [eess.SY, cs.SY, cs.CV, cs.AI, cs.LG]目的:構造化プルーニングのための効率的な手法
- 深層学習モデルの軽量化は,計算資源の制約下での利用を可能にする上で重要である。
- 既存の構造化プルーニングは,多段階の学習が必要で計算コストが高いという課題がある。
- 初期化時のプルーニングの性能劣化を改善し,効率的な学習を実現すること。
- 本研究では,事前学習,プルーニング,ファインチューニングを単一の学習サイクルに統合する手法を提案した。
- ノルムベースのグループサリエンシー基準と構造化スパース正則化を用いて,最適なサブネットワークを早期に特定する。
- 提案手法は,CIFAR-10,CIFAR-100,ImageNetにおいて最先端の精度を達成し,学習コストにおいても高い効率性を示した。
重み評価:前処理なしのランダム化ブロックKaczmarzアルゴリズムと正則化 [cs.LG, cs.NA, math.NA, math.OC, stat.ML]目的:線形最小二乗法における効率的なデータサンプリング手法の開発
- 機械学習や科学計算において,データ量は増大の一途を辿っており,効率的なアルゴリズムが不可欠である。
- 既存のランダム化ブロックKaczmarz法は,収束のため複雑な前処理を必要とすることが課題となっていた。
- 前処理不要な均一サンプリング下での収束性を解析し,正則化による性能改善を目指す。
- 均一サンプリング下では,RBKの反復計算は重み付き最小二乗解にモンテカルロ的に収束することが示された。
- 重み付き最小二乗解のバイアスや反復計算の分散が大きくなる問題に対し,正則化を加えることで制御可能となった。
- 提案手法ReBlocKは,自然勾配最適化を含む実験において,RBKやミニバッチ確率的勾配降下法を上回る性能を示した。
連続バンディットを用いた変分量子最適化 [cs.LG, quant-ph]目的:変分量子アルゴリズムにおけるパラメータ最適化手法
- 量子コンピュータの発展に伴い,実用的な問題を解くためのアルゴリズム研究が重要である。
- 従来の勾配法は,バレン高原問題により最適化が困難になる場合がある。
- 連続バンディット法を適用し,勾配法では困難な最適化を達成することを目指す。
- 変分量子アルゴリズムを連続空間を持つアーム特定問題として定式化した。
- 連続空間における純粋探索のための情報理論的な下限を初めて導出した。
- 提案手法をPQCおよびQAOAに適用し,既存手法を大幅に上回る性能を示した。
生成事前分布を用いた効率的な最適化:粗い学習可能性によるアプローチ [cs.LG, cs.DS, stat.ML]目的:生成事前分布を用いた最適化におけるサンプル効率の向上
- 組み合わせ最適化問題等において,目的関数評価のみで解を探索する手法は重要である。
- 深層生成モデルを事前分布として利用する場合,サンプル複雑度に関する理論的保証が不足している。
- 深層生成モデルの粗い学習可能性を仮定することで,サンプル効率の良い最適化手法を開発する。
- 提案手法は,Metropolis-Hastings補正を用いることで,多項式個のサンプルで目的分布を近似的に求めることを保証する。
- 最大最尤推定が粗い学習可能性に必要なカバレッジ特性を自然に誘導することを理論的に示す。
- 大規模言語モデルが,ゼロ次フィードバックに適応し,組み合わせ最適化問題を解決できることを実験的に示す。
車両衝突ダイナミクスの3D時空間予測のための剛体・変形分解AIフレームワーク [cs.CE, cs.AI]目的:車両衝突ダイナミクスの剛体・変形分解フレームワーク
- 自動車の安全性向上は社会的な要請であり,衝突シミュレーションの精度が不可欠である。
- 暗黙的ニューラル表現はスペクトルバイアスを持ち,高精度な衝突予測を妨げる。
- 剛体・変形分解により,スペクトルバイアスを軽減し,予測精度を向上させる。
- 本研究で提案するフレームワークは,剛体運動誤差を29.8%削減することに成功した。
- 剛体アンカーの安定化により,高周波構造の座屈分解能が向上し,全体的な補間誤差が17.2%減少した。
- 分解により最適化面が滑らかになり,角度外挿における分布シフトへのロバスト性が向上し,誤差が46.6%減少した。
PyGraph:PyTorchにおけるCUDAグラフの堅牢なコンパイラサポート [cs.LG]目的:機械学習ワークロードにおけるCUDAグラフの適用範囲と利点を最大化すること
- GPU性能が向上するにつれ,カーネルのCPU側起動遅延がボトルネックとなることが課題となっている。
- CUDAグラフは効率的だが,正しく効率的に展開するには困難が伴う。
- 機械学習ワークロードにおけるCUDAグラフの導入を容易にし,性能向上を図る。
- PyGraphは,PyTorch2と比較してCUDAグラフの利点を2倍以上に向上させる。
- 自動コード変換,パラメータコピーオーバーヘッドの削減,コスト便益分析に基づく選択的導入により実現。
- TorchBench,HuggingFace,TIMMの25の機械学習ワークロードで効果を確認。
段階的合成計画のためのユーザー調整可能な機械学習フレームワーク [cs.CE, cs.LG]目的:段階的合成計画のための機械学習フレームワーク
- 複雑な分子の効率的な合成経路設計は,医薬品開発や材料科学において重要である。
- 従来の合成計画ツールは,計算コストや予測精度に課題が残されていた。
- ユーザーがコストや環境負荷を考慮した合成経路を設計できるよう支援する。
- MHNpathは,最新のホップフィールドネットワークと新規比較指標により,反応テンプレートの優先順位付けを効率的に行う。
- PaRoutesデータセットを用いた評価では,解決率は85.4%,実験的に検証された「ゴールドスタンダード」経路の再現率は69.2%を達成した。
- ケーススタディでは,ドロナビノール等の複雑な分子に対し,より短く,安価で,環境負荷の低い合成経路を生成できることが示された。
模倣学習による器用な操作:サーベイ論文 [cs.CL, cs.RO, cs.LG]目的:器用な操作手法の模倣学習に関する調査
- ロボットの高度な作業能力実現に不可欠であり,複雑な環境下での応用が期待される。
- 従来のモデルベース手法では,複雑な接触力や高次元性により汎化が困難である。
- 模倣学習を通して,専門家の技術を効率的にロボットに習得させることを目指す。
- 本サーベイ論文では,模倣学習に基づく器用な操作手法の概要と近年の進展をまとめた。
- 模倣学習は,明示的なモデル化や大規模な試行錯誤を回避し,きめ細かい協調動作を習得できる。
- 今後の研究の方向性についても考察し,この急速に発展する分野への包括的な入門を提供する。
曲線表現ブレグマンダイバージェンスとその応用 [cs.IT, cs.LG, math.IT]目的:曲線表現ブレグマンダイバージェンスの定義と応用
- 機械学習や情報理論において,距離尺度や類似度尺度の重要性は高い。
- 従来のブレグマンダイバージェンスは線形空間に限定され,非線形空間への拡張が課題であった。
- 非線形部分空間におけるブレグマンダイバージェンスを定義し,その応用可能性を示す。
- 曲線表現ブレグマンダイバージェンスは,非線形パラメータ部分空間に制限されたブレグマンダイバージェンスとして定義される。
- 有限重み付きパラメータ集合の重心は,完全なブレグマンダイバージェンスに対する重心の部分空間へのブレグマン投影に相当することが示された。
- α-ダイバージェンスが曲線表現ブレグマンダイバージェンスであることが証明され,効率的な交差計算手法が提案された。
