arXiv雑要約
AI - 2026/03/23 公開
データ駆動型アンサンブルによる全球海洋予測 [physics.ao-ph, cs.AI]目的:全球海洋の確率的予測
- 地球温暖化や気候変動の予測には,海洋の状態把握が不可欠である。
- 従来の数値モデルは計算負荷が高く,効率的な確率的予測が困難であった。
- 機械学習を用いて,高速かつ高精度な海洋予測システムの構築を目指す。
- FuXi-ONSは,全球1度グリッドで最大365日間の海洋予測を可能にする初の機械学習アンサンブル予測システムである。
- GLORYS12再解析との比較において,FuXi-ONSは決定論的予測やノイズ摂動よりもアンサンブル平均の精度と確率予測の質を向上させた。
- SSTやNiño3.4変動において,既存の季節予報モデルと同等の性能を示しつつ,従来のアンサンブルシステムより遥かに高速に動作する。
地球物理逆問題における学習された事前分布における記憶の役割 [stat.ML, cs.LG, physics.geo-ph]目的:地球物理逆問題に対する学習された事前分布の役割
- 地質構造の推定は資源探査や地震ハザード評価に不可欠である。
- 十分な学習データが確保しづらく,汎化性能が課題となっている。
- 学習された事前分布が学習データに過剰適合する問題を解決する。
- 学習された事前分布が訓練データのみを記憶してしまうと,事後分布はデータの重み付き平均に帰着する。
- 拡散モデルの場合,記憶は閉形式のガウス混合事前分布を生み出す。
- 線形化により,事後分布の幅とシフトはヤコビアン行列によって制御されることが示された。
多次元ガウス混合モデルのモデル選択とパラメータ推定 [physics.soc-ph, cs.MA, cs.SY, eess.SY, stat.ML, cs.LG]目的:多次元ガウス混合モデルのモデル選択と効率的な混合分布推定
- 機械学習や統計における確率モデルの基礎であり,様々なデータ分布のモデリングに不可欠である。
- モデルの次数選択が難しく,必要なサンプル数が理論的に明確でなかった。
- 最適なサンプル複雑度でモデル選択とパラメータ推定を行うアルゴリズムを開発すること。
- 情報理論的な下限を確立し,信頼性の高いモデル選択に必要なサンプル複雑度を明らかにした。
- ランダムなフーリエ測定ベクトルを用いたスペクトルギャップに基づく,パラメータフリーな推定アルゴリズムを提案した。
- 提案手法は確立された下限と一致し,成分分離距離に関してミニマックス最適性を示すことが示された。
海馬のスパイクタイミングとニューラルコーディングを支配する統一的な位相固有の計算原理 [q-bio.NC, cs.NE]目的:海馬のスパイクタイミングとニューラルコーディングを支配する計算原理の解明
- 脳機能解明において,神経活動のタイミングと情報表現のメカニズム理解が不可欠である。
- 既存モデルでは,発火率とスパイクタイミングが分離して扱われ,位相と神経活動の関連性が不明確である。
- 位相固有の計算原理に基づき,海馬のスパイクタイミングとニューラルコーディングのメカニズムを統合的に説明する。
- 海馬の位相ロックは,神経情報を振幅(what)と位相(when)に分離する強制位相積分という基本的な動力学的メカニズムから生じる。
- 統一的な複素数値ニューロン(UCN)モデルを開発し,生物学的な根拠に基づいた生成フレームワークを提供した。
- 従来の傾斜ロックとの関連性が,振動汚染によるものであることを示し,メカニズムの再評価を可能にした。
差分プライバシー下におけるミニマックス推定と適応共分散行列推定 [math.ST, cs.LG, stat.TH]目的:高次元帯状共分散行列の差分プライバシー制約下でのミニマックス推定と適応推定
- 高次元データ解析において,共分散行列は重要な役割を果たすため,その推定は不可欠である。
- 差分プライバシーを適用した場合,プライバシー保護のコストとして,推定精度が低下する問題が存在する。
- 差分プライバシーを考慮した共分散行列推定における,最適な推定レートの達成を目指す。
- 提案手法は,演算子ノルムとフロベニウスノルムの両方において,ミニマックス最適収束レートを達成する。
- 差分プライバシーによって生じる誤差は,周囲の次元数に依存する多項式的な関係を示すことが明らかになった。
- 新たな差分プライバシー版van Trees不等式を開発し,事前分布を設計することで,最適なレートに近い下限を導出した。
有限文脈モデルにおけるハイパーパラメータ選択のための二段階シーケンシャルアプローチ [stat.ML, cs.LG]目的:有限文脈モデルにおけるハイパーパラメータの効率的な選択
- データ圧縮において,予測性能はモデルの精度に直結するため,適切なハイパーパラメータ設定が重要である。
- 網羅的な探索によるハイパーパラメータ選択は計算コストが高く,モデルの複雑さが増すほど問題が深刻になる。
- 文脈長と平滑化パラメータの効率的な選択手法を確立し,計算コストを削減することを目的とする。
- 文脈長kの推定において,カテゴリカル系列依存度指標が{\alpha}よりも感度が高いことが示された。
- 提案手法は,平均ビットレートの圧縮性能において網羅的なグリッドサーチと同等の結果を達成した。
- シミュレーション結果から,サンプルサイズが増加するにつれて,ハイパーパラメータ推定の精度が向上することが確認された。
北海,メキシコ湾,ペルシャ湾における洋上石油・ガスプラットフォームの動態:Sentinel-1アーカイブの活用 [eess.IV, cs.AI, cs.CV]目的:洋上石油・ガスプラットフォームの時空間的検出
- 海洋資源開発の拡大に伴い,プラットフォームの監視が経済,環境,規制面で重要となっている。
- 広大な海洋領域とアクセス困難性から,洋上プラットフォームの体系的な監視は課題であった。
- 本研究は,Sentinel-1データと深層学習を用いて,洋上プラットフォームの動態を継続的に把握することを目的とする。
- 2017年から2025年にかけて,北海,メキシコ湾,ペルシャ湾の主要3地域におけるプラットフォームの位置情報を四半期ごとに時系列で検出した。
- 2025年には合計3,728基のプラットフォームを特定し,ペルシャ湾が1,731基,メキシコ湾が1,641基,北海が356基であった。
- プラットフォームの設置・移設・解体を2,700件以上検出し,短寿命プラットフォームの増加から,オフショアセクターの構造変化が示唆された。
ジェスチャーから音声へ:手の動きは表現豊かな音声をどこまで形作れるか [eess.AS, cs.AI, cs.MM]目的:手の動きを視覚的手がかりとして音声の抑揚を調整する多Modal TTSフレームワークの提案
- 人間は音声と身振り手振りを通してコミュニケーションを行う。効果的なコミュニケーションには,両者の連携が不可欠である。
- 既存のTTSシステムでは,顔の表情や唇の動きは考慮されているが,手の動きが音声の抑揚に与える影響は十分に解明されていない。
- 手の動きと音声の抑揚の同期性を高めることで,より自然で表現豊かな音声合成を目指す。
- 提案手法Gesture2Speechは,PATSデータセットにおいて,最先端のベースライン手法と比較して,音声の自然さとジェスチャーと音声の同期性の両方で優れた性能を示した。
- 本研究は,ニューラル音声合成において,手の動きを抑揚制御のための手がかりとして活用する初の試みである。
- 多Modal Mixture-of-Expertsアーキテクチャにより,言語内容とジェスチャー特徴を動的に融合し,音声の抑揚を手の動きと時間的に整合させた調整を可能にした。
説明可能なクラスタ分析:バギングアプローチ [stat.ML, cs.LG]目的:クラスタ分析における説明可能性の向上
- データ分析において,データの構造理解は不可欠であり,クラスタ分析はその重要な手法の一つである。
- 従来のクラスタ分析では,クラスタリングの根拠となる特徴量の特定が困難であり,解釈性に乏しいという課題がある。
- 本研究は,特徴量の重要度を評価し,クラスタリング構造と変数関連性の統一的な解釈を可能にすることを目指す。
- バギングと特徴量ドロップアウトを組み合わせたアンサンブルクラスタリングフレームワークを提案した。
- 提案手法は,ブートストラップリサンプリングとクラスタリングの有効性指標に基づき,特徴量重要度を評価する。
- シミュレーションデータおよび実データを用いて,提案手法の有効性を検証した。
グラフニューラルネットワークを用いた複雑メッシュ上での亜格子スケール生成速度のモデル化 [physics.flu-dyn, cs.LG]目的:複雑メッシュ上での亜格子スケール生成速度の予測モデル
- 大規模渦シミュレーションは,化学反応項を扱う上で不可欠であり,高精度な予測が求められる。
- 亜格子スケール生成速度の適切なモデル化が困難であり,計算コストが増大する要因となっている。
- グラフニューラルネットワークを用いて,複雑メッシュ上での生成速度予測の精度向上を目指す。
- グラフニューラルネットワークは,非一様メッシュ上で亜格子スケール生成速度を高い精度で予測できることが示された。
- 予測モデルは,異なる組成のデータに対しても頑健な汎化性能を発揮し,参照データとの統計的な一致度も高い。
- モデルは,再学習なしに様々なフィルタ幅にも対応可能であり,粗い空間分解能でも安定した予測性能を維持する。
ミニマックス汎化クロスエントロピー [stat.ML, cs.LG]目的:分類における損失関数の最適化
- 教師あり学習の分類タスクにおいて,損失関数は性能を左右する重要な要素である。
- 汎化クロスエントロピーは,最適化の難易度とロバスト性のバランスを取るが,分類マージンに関する非凸最適化問題を抱える。
- 分類マージンに関する凸最適化問題を解決し,複雑なデータセットでの性能向上を目指す。
- 提案手法であるミニマックス汎化クロスエントロピーは,分類マージンに関する凸最適化を可能にする。
- 分類誤差の上限を提供できることが示された。
- ベンチマークデータセットにおいて,高い精度,高速な収束,良好なキャリブレーションが確認された。
時系列予測のための深層自己相関モデリング:進捗と展望 [stat.ML, cs.LG, stat.AP]目的:深層時系列予測における自己相関モデリングの現状と将来性
- 時系列データは,過去のデータに依存するため,様々な分野で予測に不可欠である。
- 既存の研究では,モデルの構造と学習目的の両方で自己相関を適切に扱うことが課題であった。
- 本研究は,自己相関を考慮した深層時系列予測モデルの進捗と課題を網羅的に整理することを目的とする。
- 本研究では,深層時系列予測に関する文献をモデル構造と学習目的の2つの側面から分類する新しい分類法を提案した。
- 既存のサーベイと比較して,学習目的に関する議論を充実させ,より包括的な分析を提供している。
- 自己相関を軸とした統一的な視点から,深層時系列予測の進歩を全体的に把握できるサーベイ論文である。
確率的関数に対する無限次元球面・半径方向分解:制約付き最適制御とガウス過程回帰への応用 [math.OC, cs.LG, cs.NA, math.NA]目的:確率的関数の効率的な推定と勾配計算
- 確率的モデリングは,不確実性を含む様々な問題解決に不可欠であり,近年その重要性が増している。
- 高次元空間における確率的関数の計算は,次元の呪いにより計算コストが増大する課題がある。
- 本研究は,無限次元空間における確率的関数の効率的な計算手法を開発し,次元の呪いを克服することを目指す。
- 提案手法であるhiSRDは,凸集合に対するバイアスを持たない低分散推定器であることが示された。
- 有限次元SRDの分散に関する理論的解析により,次元増加に伴う問題点が明らかになった。
- 数値実験により,リスク中立確率微分方程式最適制御問題やガウス過程回帰における制約付き最適化への有効性が確認された。
大規模ハイパーグラフの構造可制御性 [math.OC, cs.LG, cs.SI, cs.SY, eess.SY]目的:ハイパーグラフの構造可制御性に関する枠組み
- 生態系,生体システム,工学システムなど,複雑なネットワークシステムの制御は重要である。
- グラフの可制御性に関する研究は進んでいるが,ハイパーグラフの可制御性は未発達である。
- 大規模ハイパーグラフにおいて,構造的な観点から可制御性を評価し,制御に必要なノード数を削減する。
- ハイパーグラフのダイナミクスを多項式動力学系としてモデル化し,古典的なアクセス可能性と膨張の概念を拡張した。
- ハイパーグラフのトポロジーが古典的なリー代数とカルマンランク条件を満たすための基準を確立した。
- 最小限のドライバノード数を求めるトポロジーに基づく下限を導出し,貪欲法によるドライバノード選択アルゴリズムを設計した。
機械学習ハミルトニアンに対する物理に基づいた長距離クーロン補正 [physics.comp-ph, cond-mat.mtrl-sci, cs.AI]目的:機械学習ハミルトニアンにおける長距離クーロン相互作用の補正
- 極性結晶や異種接合構造の物理現象を理解する上で,長距離クーロン相互作用は不可欠である。
- 既存の機械学習ハミルトニアンは,長距離クーロン相互作用を考慮しておらず,精度に限界があった。
- 本研究は,長距離クーロン相互作用を組み込むことで,機械学習ハミルトニアンの精度向上を目指す。
- 本研究では,変数分解を用いて非直交原子軌道基底における長距離ハミルトニアン行列要素の閉形式を導出した。
- HamGNN-LRと呼ばれる二重チャネルアーキテクチャを実装し,E(3)等変メッセージパッシングと逆空間のEwald summationを組み合わせた。
- ZnOスラブ,CdSe/ZnSヘテロ構造,GaN/AlN超格子におけるベンチマークにより,物理に基づいた長距離補正の重要性が示された。
3D点群分類のための階層型量子アーキテクチャ探索 [quant-ph, cs.CV, cs.LG]目的:3D点群分類における量子アーキテクチャの探索
- 量子機械学習は,古典計算機では困難な問題を解決する可能性を秘めている。
- 量子ニューラルネットワークのアーキテクチャ設計は,経験則に頼る部分が多く,最適化が困難である。
- 効率的な量子アーキテクチャの自動探索手法を確立し,高性能な量子機械学習モデルを開発すること。
- 本研究で提案する階層型量子アーキテクチャ探索は,バニシング勾配問題(barren plateau)の緩和に貢献する。
- 従来の量子アーキテクチャ探索手法と比較して,高い分類精度を達成した。
- ModelNetデータセットを用いた実験により,PQCベースの手法として最先端の結果が得られた。
グラフ情報に基づく敵対的モデリング:補間的ダイバージェンスの無限小劣加法性 [stat.ML, cs.LG, math.ST, stat.TH]目的:補間的ダイバージェンスにおける無限小劣加法性の原理
- 敵対的学習は,生成モデルの学習において重要な役割を果たす。
- 複雑な分布を扱う場合,敵対的学習の安定性や構造の学習が課題となる。
- ベイズネットワークに基づく分布構造を利用し,敵対的学習の効率と安定性を向上させる。
- ベイズネットワーク構造に基づき,全体的な変動を家族レベルの変動の平均で制御できることを証明した。
- これにより,グラフを考慮しないGANを,ローカルな家族レベルの識別器を用いたグラフ情報GANに置き換えることが理論的に正当化される。
- 実験により,グラフを考慮した手法が,安定性と構造の復元においてベースラインよりも優れていることが示された。
同型ワールドモデルによる無線CSIの構造化された潜在的ダイナミクス [eess.SP, cs.LG]目的:無線チャネルの予測的かつ構造化された表現の学習
- 無線通信の性能向上には,チャネル状態の正確なモデル化が不可欠である。
- 従来のチャネルモデルは,複雑な環境変化への対応が難しく,汎化性能に課題がある。
- 潜在空間における効率的なチャネル表現を学習し,環境適応能力を高める。
- 提案手法は,既存のベースラインと比較して,チャネルトポロジーの保持と将来の埋め込み予測において優れた性能を示す。
- 学習された潜在空間は,メトリック的に忠実なチャネルマップを可能にし,大規模な応用を促進する。
- 移動認識型スケジューリング,位置推定,無線シーン理解などの下流タスクへの活用が期待される。
ハイブリッド量子最適化フレームワークに基づくアンテナアレイビームフォーミング [math.ST, cond-mat.stat-mech, cs.CC, stat.ML, stat.TH, quant-ph, cs.LG, eess.SP]目的:大規模アンテナアレイビームフォーミングにおける離散位相と連続振幅の同時最適化
- 無線通信システムの性能向上には,効率的なビームフォーミング技術が不可欠である。
- 大規模アンテナアレイにおけるビームフォーミングの最適化は計算量が多く,困難である。
- 量子最適化を活用し,計算効率と性能の両立を目指す。
- 提案手法は,量子に触発された探索と古典的な勾配法を組み合わせることで,離散・連続変数の混合最適化を効率的に処理する。
- 7th National Quantum Computing Hackathonの評価ルール下で,32素子アンテナアレイのシミュレーションにおいて,ベースラインスコアの約2倍となる461.58のスコアを達成した。
- 本フレームワークは,将来の無線通信システムにおけるビームフォーミング最適化の有効な参考を提供する。
AIエージェントは既に実験高エネルギー物理学を自律的に実行可能である [hep-ex, cs.AI, cs.LG]目的:実験高エネルギー物理学における分析パイプラインの自律的な実行可能性
- 高エネルギー物理学は,宇宙の根源的な謎を解き明かす上で不可欠な役割を担っている。
- 実験データの解析には膨大な技術的負担が伴い,研究者の貴重な時間を奪っている。
- AIエージェントによる分析プロセスの自動化を通じて,その負担を軽減すること。
- 大規模言語モデルに基づくAIエージェントが,専門家による細かな指示なしに,高エネルギー物理学の分析パイプラインの主要な部分を自律的に実行できることが示された。
- 提案されたJFCフレームワークを用いることで,データの分析,論文の作成まで一連の作業を自律的に行えることが確認された。
- これらのツールは,研究者が分析コードの開発から解放され,物理的な洞察や新しい手法の開発に集中することを可能にする。
スケールフリーネットワークにおける隠れたリンクと欠損ノードの人工ニューラルネットワークによる予測 [cs.SI, cs.LG]目的:スケールフリーネットワークにおける隠れたリンクと欠損ノードの予測手法
- 現実世界の様々なネットワークがスケールフリーネットワークとして存在し,その理解は重要である。
- スケールフリーネットワークの異常検知には,ネットワーク特性の正確な把握が課題である。
- 人工ニューラルネットワークを用いて,スケールフリーネットワークの隠れたリンクと欠損ノードを予測する。
- ランダムネットワーク生成器と人工ニューラルネットワークを組み合わせた予測手法を提案した。
- ボラボラスのスケールフリーランダムグラフ生成アルゴリズムを用いて,大量のネットワークデータを生成した。
- ニューラルネットワークは,スケールフリーネットワークのサブタイプを識別し,欠損ノードと隠れたリンクを予測することができた。
torchgfn:PyTorch GFlowNetライブラリ [cs.LG]目的:GFlowNetの研究開発を促進するためのPyTorchライブラリ
- 生成フローネットワークは多様な分野で注目されており,標準的な実装と評価が不可欠である。
- 研究者ごとに異なる実装が多く,機能のテストや比較が困難であった。
- モジュール性と柔軟性を備えたライブラリを提供し,迅速なプロトタイプ作成と研究を支援する。
- torchgfnは,環境,ニューラルネットワークモジュール,学習目標を交換可能なコンポーネントとして扱うモジュール構造を採用している。
- これにより,ユーザーはシンプルかつ強力なAPIを通じて,迅速な試作と新しい研究を容易に行うことができる。
- 公開されている結果を再現・統合する複数のサンプルが提供されており,GitHubとpypiで利用可能である。
ベクトルデータベース:ストレージと検索技術,課題に関する包括的調査 [cs.DB, cs.AI]目的:ベクトルデータベースのコアデザインとアルゴリズムの包括的概観
- 高次元ベクトルデータ処理の需要増大に伴い,ベクトルデータベースの重要性が高まっている
- 既存研究は近似最近傍探索などの基礎技術に偏り,ベクトルデータベース全体のアーキテクチャレベルの検討が不足している
- ベクトルデータベースの技術的景観と発展動向を迅速に把握するための体系的ガイドを提供すること
- 本調査では,ストレージと検索という二つの主要な側面から,ベクトルデータベースの主要技術と設計原則を体系的にレビューした
- 主要なベクトルデータベースアーキテクチャを比較し,それぞれの強み,弱み,典型的な応用シナリオをまとめた
- ベクトルデータベースと大規模言語モデルの統合に関する新たな方向性,未解決の課題,およびインデックス戦略の革新などのトレンドを探求した
Hyper-STTN:ハイパーグラフ拡張空間・時間変換器ネットワークによる軌跡予測 [cs.CV, cs.LG]目的:群衆の意図と軌跡の予測
- 社会ロボットや自動運転など,実世界アプリケーションにおいて不可欠な技術である。
- 双方向の空間・時間的相互作用の複雑さと,集団ダイナミクスの異質性により,正確なモデリングが困難である。
- 集団間の相関関係を捉え,より正確な軌跡予測を実現すること。
- Hyper-STTNは,様々な集団サイズのマルチスケールハイパーグラフを構築し,集団間の相関をモデル化する。
- 空間・時間変換器を用いて,歩行者の双方向の潜在的相互作用を学習する。
- 実験結果から,Hyper-STTNが最先端のモデルを上回り,優れた性能を示すことが明らかになった。
警察の責任追及のための地域社会が関与するAIモデル [cs.CY, cs.AI, cs.LG, eess.AS]目的:警察の責任追及のためのAIモデル開発における地域社会の関与
- 警察と市民の交流は,個人の幸福と民主的正当性に影響するため,その質の向上が重要である。
- 警察と市民のやり取りを大規模に分析できるAI技術は存在するものの,地域社会の視点が反映されていない。
- 本研究は,地域社会の意見を取り入れたAIツールを開発することで,この問題の解決を目指す。
- 本研究では,ロサンゼルス市警察の交通停止時のボディカム映像を分析するAIツール開発プロジェクトを通じて,地域社会が関与するアプローチを提案する。
- 社会科学者が学際的なチームの一員として,多様なステークホルダーの視点をAIツール開発に統合する役割を重視している。
- AIが民主的な統治に効果的に役立つためには,被支配者の好みと視点をモデル設計に含める必要がある。
イン・アンド・アウト:凸体サンプリングのためのアルゴリズム的拡散 [cs.DS, cs.LG, math.ST, stat.ML, stat.TH]目的:高次元凸体の均一サンプリング手法
- 機械学習や統計における確率分布からの効率的なサンプリングは重要である。
- 高次元凸体からの均一サンプリングは計算コストが高く,困難な問題である。
- 既存手法を改善し,より効率的かつ正確なサンプリングを実現すること。
- 提案手法は,既存の最先端手法よりも優れた実行時間複雑度を達成する。
- 出力の保証も強化されており,Rényiダイバージェンスなどの様々な距離尺度で優位性を示す。
- 拡散過程における収束率が,標的分布の関数的等周定数によって決定されることを証明した。
生物医学応用における因果学習:クエン酸回路をベンチマークとして [cs.CL, cs.LG]目的:クエン酸回路シミュレーションに基づく新規ベンチマークデータセット
- 生物学的システム理解には,分子間相互作用の因果関係解明が不可欠である。
- 既存の合成データセットには,因果探索法が利用する可能性のある隠れた構造が含まれている。
- 時間的データからの因果学習手法の性能評価のための,現実的かつ解釈可能なベンチマークの提供。
- クエン酸回路をモデル化した粒子ベースシミュレーターを用いて,4種類のシナリオを構築した。
- Structural Hamming Distance,Structural Intervention Distance,F1スコア等の指標を用いて14の因果探索法を評価した。
- 本データセットは,時間的データに対する因果学習手法の再現性のある比較を可能にする。
Pythonパッケージsbijaxによるシミュレーションベース推論 [eess.SY, cs.SY, math.OC, stat.ML, cs.LG, stat.CO, stat.ML]目的:シミュレーションベース推論手法の実装
- ベイズ推論は不確実性の定量化に重要であり,複雑なモデル分析に不可欠である。
- 尤度関数の計算が困難な場合,従来のベイズ推論は適用が難しいという課題がある。
- ニューラルネットワークを代理モデルとして用い,効率的なベイズ推論を可能にすること。
- sbijaxは,最先端のシミュレーションベース推論手法を実装するPythonパッケージである。
- 簡潔なインターフェースにより,SBI推定量構築,事後分布の計算・可視化を容易に行える。
- JAXで記述されているため,高い計算効率とCPU/GPUでの並列実行が可能である。
AtGCN:失調歩行検出のためのグラフ畳み込みネットワーク [cs.CV, cs.LG]目的:失調歩行の検出および重症度識別
- 歩行分析は,様々な疾患の診断に不可欠であり,患者のQOL向上に貢献する。
- 失調歩行は正常な歩行との差異が微細であり,検出が困難である。
- 本研究は,データセットの小規模性という課題を克服し,高精度な失調歩行検出を目指す。
- 提案手法AtGCNは,既存手法を上回り,検出精度93.46%,平均絶対誤差0.4169を達成した。
- AtGCNは,既存手法と比較して5.5倍小型であり,効率的なモデルである。
- 時空間グラフ畳み込みと,歩行周期に分割するデータ拡張により,微細な特徴を捉えることに成功した。
大規模言語モデルの情報セキュリティ意識評価フレームワーク LISAA [cs.CR, cs.AI, cs.LG]目的:大規模言語モデルの情報セキュリティ意識の評価
- LLMの普及に伴い,情報セキュリティの確保は重要性を増している。
- LLMのセキュリティに関する知識,態度,行動の評価は十分に進んでいない。
- LLMのセキュリティ意識の脆弱性を評価し,改善の方向性を示す。
- 本研究で提案するLISAAフレームワークは,100の現実的なシナリオを用いてLLMのセキュリティ意識を包括的に評価する。
- 評価の結果,多くのLLMは中程度のセキュリティ意識しか持っておらず,サイバーセキュリティの脅威に晒されていることが明らかになった。
- また,セキュリティ知識のベンチマークで高いスコアを獲得したモデルでも,セキュリティ意識の評価は低い場合があることも示された。
バンディット情報を用いたデータ系列のオンラインクラスタリング [cs.LG, cs.IT, math.IT, math.ST, stat.TH]目的:データ系列のオンラインクラスタリング
- データ分析において,未知のパラメータを持つデータ群を効率的に分類することは重要である。
- 既存手法では,データ分布の多様性や高次元性に対応した効率的なクラスタリングが課題である。
- 本研究では,バンディット問題を導入することで,サンプル数を最小化しつつ高精度なクラスタリングを実現する。
- 提案手法であるATBOCアルゴリズムは,多変量ガウス分布に対して漸近的に最適解に近い性能を示す。
- 単パラメータ指数分布の場合には,ATBOCアルゴリズムは下限と同等の性能を発揮する。
- LUCBBOCおよびBOC-ELIMは,ATBOCと同等の性能を持ちながら,計算コストを削減する。
多次元時系列データに対するフローベース確信予測 [cs.LG, stat.ML]目的:多次元時系列データの確信予測手法
- 時系列予測は科学分野の幅広い応用を支える重要な技術である。
- ブラックボックス機械学習モデルの利用が進む中で,予測の不確実性評価が課題となっている。
- 時系列データの相関を考慮し,多次元予測における信頼区間を狭めることを目指す。
- 提案手法は,正確な周辺被覆率と有限標本条件下での条件被覆率の保証を提供する。
- 実世界の時系列データを用いた評価において,既存手法よりも大幅に小さい予測集合を構築できることが示された。
- 目標とする被覆率を維持しつつ,予測の精度向上に貢献する。
HPS:人間選好との整合性のためのハード選好サンプリング [cs.CY, cs.HC, cs.AI]目的:大規模言語モデルの応答と人間の選好との整合性
- 安全で制御可能なAIシステム構築には,人間の選好との整合性が不可欠である。
- 既存手法は有害コンテンツへの対処や,劣った応答の効率的な利用に課題がある。
- 有害コンテンツ抑制と計算コスト削減を両立した選好整合手法の開発。
- 提案手法HPSは,最も好ましい応答を優先し,劣った応答や有害な応答を拒否する損失関数を導入。
- HPSは,好ましい応答に類似した「ハード」な劣った応答に重点を置くことで,モデルの拒否能力を高める。
- 実験結果から,HPSは報酬マージンを大幅に改善し,有害コンテンツ生成を抑制できることが示された。
深層強化学習に基づくクロスサイトスクリプティングの敵対的攻撃:評価と拡張研究 [cs.SE, cs.AI, cs.CR]目的:クロスサイトスクリプティング攻撃に対する敵対的攻撃の評価と改善
- ウェブアプリケーションのセキュリティにおいて,クロスサイトスクリプティングは重大な脅威であるため,その対策が重要となる。
- 深層学習はXSS攻撃の検出に有効だが,入力と出力の間の非連続性により,敵対的攻撃に対して脆弱であるという課題がある。
- 既存の敵対的攻撃手法の妥当性を検証し,より効果的な評価戦略とXSS Oracleを導入することで,攻撃の回避率向上を目指す。
- 再現実験により,既存研究の妥当性に関する問題を指摘し,XSS Oracleの導入により,より厳密な評価が可能となった。
- 妥当性に関する問題を修正した結果,攻撃成功率(エスケープ率)が96%を超え,既存手法の改善が示された。
- 本研究は,深層学習モデルがXSS攻撃に対して抱える脆弱性を明らかにし,より堅牢なセキュリティシステムの構築に貢献する。
マルチステージAI推論パイプラインの理解と最適化 [cs.AR, cs.AI, cs.DC, cs.LG]目的:マルチステージLLM推論パイプラインの性能評価と最適化
- LLMの進化に伴い,高度な推論パイプラインとハードウェアの需要が高まっている。
- 既存のシミュレータは,異種環境や複雑なワークフローを正確にモデル化できていない。
- 多様なハードウェア構成における性能ボトルネックの特定と,最適化手法の提案。
- MISTは,RAG,KVキャッシュ,推論など,多様なステージを含むマルチステージLLM推論パイプラインをシミュレートする。
- MISTは,ハードウェアトレースと解析的モデリングを統合し,メモリ帯域幅や通信遅延などのトレードオフを把握できる。
- ケーススタディにより,推論ステージがエンドツーエンドのレイテンシに与える影響や,ハイブリッドパイプラインにおける最適なバッチ処理戦略が示された。
オメガ正規と平均ペイオフ目的のための平均報酬強化学習 [cs.AI]目的:オメガ正規言語と平均ペイオフ目的を持つ強化学習フレームワーク
- 強化学習は,エージェントの行動を形成するための報酬設計において重要な役割を担っている。
- 既存のオメガ正規強化学習は,エピソード形式での割引設定に依存しており,無限長の行動系列には適さない。
- 継続的なタスクにおいて,絶対ライブネス仕様を平均報酬最適化に変換する手法を開発し,モデルフリー学習を可能とする。
- 絶対ライブネス仕様を平均報酬の目的に変換する初のモデルフリー強化学習フレームワークを提案した。
- 未知の通信マルコフ決定過程(MDP)において,エピソードリセットなしでの学習を可能にした。
- 実験により,継続的かつ平均報酬に基づくアプローチが,割引ベースの手法よりも優れていることが示された。
CatBOX:スペクトル混合カーネルを用いたカテゴリカル・連続ベイズ最適化による触媒実験の高速化 [cs.LG, math.SP]目的:触媒組成および反応条件の最適化
- 触媒研究において,最適な触媒を見つけることは不可欠であり,効率的な材料開発に繋がる。
- 触媒設計空間は多次元かつ複雑であり,連続変数とカテゴリカル変数を同時に扱うことが困難である。
- 連続変数とカテゴリカル変数を同時に最適化し,触媒探索の効率を向上させる。
- CatBOXは,既存の最適化手法と比較して3倍以上の性能向上を達成した。
- シミュレーション実験と実際の触媒反応実験において,最適な触媒レシピと反応条件を効率的に特定した。
- オンラインプラットフォームを開発し,実験環境での導入を容易にした。
自律運転のための疑似シミュレーション [cs.RO, cs.AI, cs.CV, cs.LG]目的:自律運転システムの評価手法
- 自律運転技術の安全性確保は不可欠であり,信頼性の高い評価手法が求められている。
- 実走行評価は安全上の問題があり,シミュレーションは現実との乖離や計算コストが高いという課題がある。
- 実データと合成データを用いて,効率的かつ高精度な評価を実現する。
- 提案手法である疑似シミュレーションは,実データに3D Gaussian Splattingで生成した合成データを加えることで,評価の精度向上を目指している。
- 疑似シミュレーションの結果は,既存のオープンループ評価手法よりもクローズドループシミュレーションとの相関が高いことが示された ($R^2=0.8$ vs $R^2=0.7$)
- コミュニティ向けの公開リーダーボードを設置し,新たな手法のベンチマークを促進する。
嗜好駆動型多目的組み合わせ最適化における条件付き計算 [cs.AI]目的:多目的組み合わせ最適化問題に対する嗜好駆動型アプローチ
- 組み合わせ最適化は,現実世界の多くの問題を解決する上で不可欠である。
- 既存手法では,全ての部分問題を均等に扱うため,解空間の探索が不十分になりやすい。
- 部分問題に適応的なモデル構造を選択することで,解の質を向上させることを目指す。
- POCCOは,部分問題に特化したニューラルアーキテクチャを条件付き計算ブロックを通じて動的に選択する。
- ペアワイズ嗜好学習により,勝利解と敗北解の間の嗜好を学習し,最適化を促進する。
- 古典的なベンチマーク問題における実験で,POCCOは既存手法を凌駕し,高い汎化性能を示す。
大規模適応交通信号制御のための階層型強化学習:HALO [cs.LG, cs.AI]目的:大規模適応交通信号制御におけるスケーラビリティと協調性のトレードオフの解決
- 都市交通渋滞緩和は,スマートシティ実現における重要な課題である。
- 既存手法は,大規模ネットワークにおいて計算負荷または最適化不足の問題を抱える。
- ネットワーク全体としての効率性と個別交差点の自律性を両立させることを目指す。
- HALOは,Transformer-LSTMエンコーダを用いた高レベルなグローバルガイダンスと,分散型のローカル制御を組み合わせる。
- 敵対的目標設定メカニズムにより,グローバル目標とローカル目標の整合性を高める。
- 大規模ベンチマークにおいて,平均移動時間と平均遅延を最大6.8%と5.0%削減し,最先端手法を上回る性能を示す。
介護者のニーズとAIチャットボット設計:アルツハイマー病・認知症介護におけるメンタルヘルス支援の強みと課題 [cs.RO, cs.HC, cs.AI, cs.CY]目的:アルツハイマー病・関連認知症の介護者のニーズとAIチャットボットの設計に関する考察
- 認知症介護は,介護者に精神的・肉体的な負担を強いるため,その支援は重要な課題である。
- AI技術を活用したメンタルヘルス支援は有望だが,介護者のニーズとの適合性が不明な点が多い。
- AIチャットボットが介護者のニーズにどのように応えられるかを明らかにし,より良い設計を提案する。
- 介護者は,必要な情報を即座に入手できること,安心して悩みを打ち明けられる空間,そして感情的なサポートを求めていることが明らかになった。
- AIチャットボットは,情報提供や感情的な共感において一定の強みを示す一方,危機管理や個人情報保護においては課題が残る。
- 本研究は,介護者中心のAIシステム設計に向けた理論的・実践的な知見を提供する。
言語モデル学習における隠れたブレークスルー [cs.LG]目的:言語モデル学習中のブレークスルーの特定
- 言語モデルの性能向上は,AI研究の重要な目標であり,その学習過程の理解が不可欠である。
- 損失関数の変動が平滑であるため,学習の重要な転換点を見つけるのが困難である。
- 損失の変化を分解し,隠れたブレークスルーを可視化することで,学習ダイナミクスをより深く理解することを目指す。
- 本研究で提案するPOLCAは,低ランク学習部分空間における損失の変化を分解し,概念的に類似したデータ群を特定する。
- 合成データと自然言語タスクの実験により,POLCAがモデルの能力向上を示す解釈可能なクラスターを復元することが示された。
- これらの隠れた相転移は,教師なし解釈可能性のための有望なツールとなりうる。
ロボットタスク計画における汎用型旅行者問題解決のためのマルチモーダル融合学習 [cs.AI, cs.RO]目的:ロボットタスク計画における汎用型旅行者問題の解決
- 倉庫内作業や環境監視など,モバイルロボットの効率的なタスク計画は不可欠である。
- 汎用型旅行者問題は,正確かつ効率的に解決することが難しく,実用上の課題となっている。
- グラフと画像に基づく表現を融合し,リアルタイムで高品質なタスク計画を生成すること。
- 提案手法は,様々な汎用型旅行者問題インスタンスにおいて,既存の最先端手法を大幅に上回る性能を示した。
- 座標に基づく画像生成により,空間的に有益な表現へと問題を変換することに成功した。
- 実機ロボットによる実験でも,実世界での有効性が検証された。
安全接近操作のための二重ノイズ調整適応相対姿勢推定フレームワーク [cs.DB, cs.RO, cs.RO, cs.AI]目的:安全な接近操作を可能にするための相対姿勢推定手法
- 宇宙デブリ除去は,宇宙活動の持続可能性に不可欠であり,安全性向上が急務である。
- 不安定に回転するデブリの姿勢推定は,ノイズの影響を受けやすく,高精度化が課題である。
- 本研究は,CNNとカルマンフィルタを統合し,適応的なノイズ調整により姿勢推定のロバスト性を向上させる。
- 提案手法は,CNNの測定ノイズと過程ノイズを動的に調整することで,不確実性に対応する。
- 高精度なENVISATモデルを用いたシミュレーションにより,提案手法の有効性が検証された。
- 測定値の欠落時など様々な条件下で,高い姿勢推定精度が確認された。
原理に基づいた多Modal表現学習 [cs.CV, cs.LG, cs.MM]目的:多Modal表現の学習
- AIの発展には,画像やテキストなど多様な情報を統合する多Modal理解が不可欠である。
- 従来の学習法は特定のModalに依存し,すべてのModal間の整合性を確保することが困難であった。
- 本研究は,アンカー依存性なく,より安定的に多Modalを同時に整合させることを目指す。
- PMRLは,文脈行列の主要特異値の最適化により,複数のModalを共有する主要な方向に整合させる新しいフレームワークである。
- 特異値をlogitとして扱うsoftmaxベース損失関数により,最大の特異値を優先し,安定した学習を実現している。
- インスタンスごとの対照的な正則化により,インスタンス間の分離性を維持し,表現の崩壊を防ぐ。
大規模推論モデルの効率的なGRPO学習のための予測的スケーリング則 [cs.LG]目的:大規模言語モデルのGRPO学習における計算資源の最適化
- 高度な推論能力を持つ言語モデルの構築が,多様な応用分野で重要視されている。
- 強化学習を用いた言語モデルのファインチューニングは計算コストが高く,効率的な学習方法が課題である。
- モデルサイズや初期性能に基づいたスケーリング則を導き,学習の早期停止による計算資源削減を目指す。
- モデルサイズ,初期性能,学習進捗に基づいた経験的なスケーリング則を導出した。
- 学習は,立ち上がり,急速な改善,プラトーの3つの段階を経ることを確認した。
- 一定のエポック数以降の学習は効果が薄いため,早期停止が計算資源の削減に有効である。
上位クラスによる表現分離:欺瞞相関の緩和 [cs.CV, cs.AI, cs.LG]目的:欺瞞相関の緩和手法
- 機械学習モデルの汎化性能向上には,データの潜在的な偏りを理解し対処することが重要である。
- 既存手法はグループ注釈に依存し,学習データとテストデータでグループ構成が一致することが前提となる。
- 事前学習済みのビジョン言語モデルを活用し,より本質的な信号を用いて欺瞞相関を特定・緩和する。
- 提案手法は,グループ構造や欺瞞相関が複雑な場合でもロバスト性を実現できる。
- 学習データへの注釈を必要とせず,既存の強力なベースライン手法を大幅に上回る性能を示す。
- 定量的な評価指標と定性的な可視化の両面で,ビジョン言語モデルのガイダンスを超えた明確な改善が見られた。
戦略洗練と内省によるLLMを用いた汎化計画の改善 [cs.AI, cs.CL]目的:LLMによる汎化計画の品質向上
- 計画立案はAIの重要な課題であり,複雑なタスクの自動化に不可欠である。
- 従来の汎化計画生成では,戦略誤りが計画の失敗につながりやすい。
- 疑似コードによる戦略のデバッグとLLMによる内省を通して,戦略誤りを事前に修正する。
- 疑似コードを用いた戦略生成と自動デバッグにより,汎化計画の質が大幅に向上した。
- 計画失敗の原因をLLMに内省させることで,さらなる改善が可能となった。
- 複数のプログラムバリアントを生成し,最良のものを選択することで,平均カバレッジ82%を達成した。
大規模粒体メディア合成のための高速3D拡散 [cs.LG]目的:粒体メディアの効率的な合成手法
- 粒体メディアは土木,化学など幅広い分野で重要であり,そのシミュレーション需要は高い。
- 従来のDEMシミュレーションは初期化に時間がかかり,大規模なシミュレーションのボトルネックとなっていた。
- 拡散モデルを用いることで,初期化時間を大幅に短縮し,大規模シミュレーションを可能にすること。
- 3D拡散モデルとインペインティングモデルの組み合わせにより,大規模な粒体集合を生成するパイプラインを開発した。
- 生成された粒体集合は,既存のDEMシミュレーションとの整合性があり,機械的に妥当な構成を実現している。
- 本手法は,鉄道バラストや月面レゴリスなど,様々な粒体メディアの初期化に適用可能であり,シミュレーションの規模を飛躍的に拡大する。
制約付き多体系におけるデータ駆動型シミュレーションのためのフローマッチング [cs.LG]目的:制約付き多体系のダイナミクスをデータ駆動でモデル化する手法
- 多体系のシミュレーションは,ロボティクスや物理シミュレーションなど,幅広い分野で不可欠である。
- 従来のニューラルODEは,学習コストが高く,ロールアウト予測で誤差が累積しやすいという課題があった。
- 本研究では,加速写像を直接学習することで,学習コストと誤差を削減し,シミュレーションの精度向上を目指す。
- フローマッチングニューラルODE(FNODE)は,軌跡データから直接加速度を学習することで,従来のニューラルODEの学習ボトルネックを解消する。
- FNODEは,独立な一般化座標の加速度のみを学習し,依存座標を制約方程式で回復することで,制約条件を満たすシミュレーションを実現する。
- 様々なベンチマークテストにおいて,FNODEは予測精度と学習・実行効率が向上し,制約条件の充足性を維持することが示された。
