arXiv雑要約
AI - 2026/06/11 公開
時間グラフ学習によるサッカーにおけるインポゼッション時の試合フェーズの意図に基づいた識別 [cs.LG]目的:サッカーの試合におけるインポゼッション時のフェーズ識別
- サッカー戦術理解には,試合フェーズの識別が不可欠である。選手の空間配置だけでなく,戦術意図を把握する必要がある。
- インポゼッション時のフェーズは直接観察が難しく,空間的パターンだけでは捉えきれないという課題がある。
- 本研究は,時系列データから戦術意図に基づいたインポゼッション時の試合フェーズを識別するデータ駆動型フレームワークを構築する。
- 提案手法であるT-GANは,意図レベルで0.87,侵攻関連フェーズで0.76,得点フェーズで0.79という高いF1スコアを達成した。
- シーケンスレベルでは,事後処理により意図のIoT-D F1スコアが0.68から0.79へ,フェーズが0.61から0.71へと向上し,時間的な一貫性が改善された。
- カウンターアタックの識別において,グラフベースの関係モデリングが特に有効であり,ワイドおよび中盤のポジショナルグループがフェーズ識別に大きく貢献することが示唆された。
経験が熟練を生む:自己進化型スキルメモリによる汎用的な医療エージェント推論の実現 [cs.AI, cs.CL]目的:医療エージェントの汎用的な推論能力向上
- 医療現場では,静的な質疑応答だけでなく,対話的な臨床意思決定支援が求められている。
- 既存のメモリ機構は,冗長でノイズが多く,管理が難しい過去の記録を保持しがちである。
- 有用な記憶を識別し,長期的な臨床推論に必要なコンパクトで信頼性の高い経験を蓄積すること。
- SkeMexは,モデルの重みを更新することなく,スキルベースのメモリを通じて医療エージェントを改善する。
- SkeMexは,有用な対話軌跡を再利用可能な手続き的知識としてエンコードする構造化されたスキルに蒸留する。
- 環境からのフィードバックに基づいてコンテキスト依存的な有用性を推定し,価値に基づいた検索とリポジトリの管理を行う。
WeaveBench:ハイブリッドインターフェースを持つコンピュータ利用エージェントのための,長期的かつ現実世界のベンチマーク [cs.AI]目的:コンピュータ利用エージェントの評価
- 近年,GUI,CLI,コード編集などを組み合わせたエージェントの重要性が増している。
- 既存のベンチマークでは,インターフェース間の連携が十分に評価されていない。
- 現実世界のタスクにおけるインターフェース連携能力を評価できるベンチマークの提供。
- WeaveBenchは,8つの現実世界のドメインにわたる114のタスクを含む,長期的かつハイブリッドなインターフェースベンチマークである。
- 最良のPassRateは41.2%にとどまり,ベンチマークは飽和状態から程遠いことが示された。
- 軌跡を考慮した判定により,結果のみの評価ではエージェントの性能が過大評価されることが明らかになった。
重み誘起層別グラム計量の学習力学が階層構造を明らかにする [cs.LG, cond-mat.dis-nn]目的:学習データ空間上での勾配降下法の集団力学
- 深層学習の理論的理解は,その汎化性能や学習メカニズムの解明に不可欠である。
- 従来の学習解析は,重み空間における勾配降下法に焦点を当てており,学習データ空間での振る舞いが不明瞭であった。
- 本研究は,学習データ空間上での集団力学を記述することで,深層学習の学習過程をより詳細に理解することを目指す。
- 単一の隠れ層を持つReLUネットワークにおいて,活性化ダイナミクスを記述する閉じた方程式が得られた。
- より深いネットワークでは,層ごとのカーネル構造が維持される一方で,層間情報伝達には重み誘起グラム演算子の階層構造が必要となる。
- これらのグラム演算子は,共役場ダイナミクスを記述する逆引き込み再帰の最初の自明な例である。
潜在フロー内部:音声分離基盤モデルにおける注意機構ダイナミクスの因果解明 [cs.DB, cs.CL, cs.RO, cs.SD, cs.AI]目的:音声分離基盤モデルにおける注意機構ダイナミクス
- 音声分離技術は,多様な音響環境下で有用な情報を抽出するために不可欠である。
- 基盤モデルの注意機構の動作原理は必ずしも明確ではなく,解釈可能性に課題がある。
- 注意機構のダイナミクスを解明し,効率的な推論手法を開発することを目指す。
- Flow-matching Transformerの注意機構を,因果介入原理を用いて解析した。
- テキスト条件付けが,セマンティックな同一性の付加的注入と,音響構造のクロスアテンションの二経路で行われることが明らかになった。
- 層選択的注意キャッシュ(LSAC)により,計算量を約25%削減し,品質劣化を最小限に抑えることができた。
メタプレート:反実仮想推論に基づくRAG-LLMツールによる個別化食品推薦と高血糖予防 [cs.IR, cs.AI, cs.HC]目的:個別化された食事推薦による食後高血糖の軽減
- 食後高血糖は代謝性疾患の主要なリスク因子であり,健康管理において重要である。
- 既存の食事指導は,静的で非現実的,かつ個別化が不十分であることが課題である。
- 継続血糖モニタリングと機械学習を活用し,実行可能な個別化された食事指導を提供することを目指す。
- メタプレートは,個人の血糖値,生理学的信号,食事情報を統合し,食後血糖値を目標範囲内に維持する食事構成を提案する。
- LLMを活用したRAG層により,USDA食品データベースを基にした人間が理解しやすい食事推奨を生成し,解釈可能性を向上させている。
- 専門家による評価の結果,食事の現実性,適切な量,推奨の可能性が向上し,臨床的に妥当でない出力から実行可能な推奨へと変化した。
BiWM:双方向自己回帰を用いたオープンソースインタラクティブビデオワールドモデルの発展 [cs.CV, cs.AI]目的:インタラクティブビデオワールドモデルにおける双方向自己回帰パラダイムの実現
- ビデオワールドモデルは,現実世界のシミュレーションやAI研究において重要な役割を担う。
- 既存の因果的パイプラインは,品質面で双方向モデルに劣ることが課題である。
- 本研究は,双方向自己回帰パラダイムに基づくフレームワークを開発し,その問題を解決する。
- BiWMは,双方向自己回帰パラダイムを用いたインタラクティブビデオワールドモデルのための初のフルスタックフレームワークである。
- 従来のminWMと比較して,訓練段階を2段階に削減し,収束までのステップ数を大幅に短縮した。
- GANや前方KL目的関数を用いることで,DMDのモード探索による劣化を抑制し,シーンダイナミクスを維持する。
LLMおよびVLMの幻覚検出のための密度リッジ選択的予測:キャリブレーションラベル不足下 [cs.LG, cs.AI, cs.CV]目的:LLMおよびVLMの幻覚検出のための新しい手法
- 大規模言語モデルの利用拡大に伴い,生成される情報の信頼性確保が重要となっている。
- 幻覚検出において,キャリブレーションラベルの不足が性能低下の大きな要因となっている。
- 密度リッジを利用することで,ラベル不足下でも高性能な幻覚検出を実現することを目指す。
- 提案手法は,6つのQAベンチマークにおいて,既存手法と比較してAUROCが5~20ポイント向上した。
- 特に,キャリブレーションラベル不足下での性能劣化が抑制された点が特徴である。
- 隠れ状態生成軌跡の運動学的特徴マップに基づき,応答多様体の密度リッジを算出する点が新しい。
心房細動リスクスコアPre-AF 13:退院記録から抽出された解釈可能なスコア [cs.RO, cs.LG, cs.CL]目的:心血管疾患患者における心房細動リスクの予測モデルの構築
- 心房細動は最も一般的な不整脈であり,予後を大きく左右する重要な疾患である。
- 既存のリスクスコアは,高血圧や高齢など,心血管疾患患者に共通の因子に依存し,層別化が困難である。
- 日常的に収集される電子カルテデータを用いて,中期的(24ヶ月)な心房細動リスクを予測する。
- 構築した機械学習モデルは,既存の臨床リスクスコアと比較して,心房細動リスクの予測において優れた性能を示した。
- 特徴量の重要度分析により,年齢と左心房容量が主要な予測因子であることが示された。
- 13の特徴量から構成されるPre-AF 13は,心血管疾患患者における心房細動リスクを層別化し,リスクを7%から36%まで識別した。
堅牢な証拠に基づく著者特定のための抽出された表現を通じた手法 [cs.AI]目的:LLM生成文の出所モデルの特定
- LLM利用が拡大し,生成文の信頼性確保が重要になっている
- プロンプトの多様性が高く,モデル固有の痕跡が弱いため特定が困難である
- 隠れた著者情報を読み取り,多角的なプロンプトからの証拠を蓄積する
- READERは,凍結されたプロキシLLMを読者として活用し,LLM生成文を活性化空間にマッピングする。
- プロキシLLMを複数用いることで,より強力なLLMは線形的に解読可能な著者構造を露呈することが示された。
- Agent500データセットにおいて,単一の応答で31.0-42.4%,50応答で70.0-84.0%のトップ1精度を達成した。
K-強制:プッシュフォワード言語モデリングによる次Kトークン同時デコード [cs.LG, cs.AI, cs.CL]目的:次Kトークン同時デコードの実現
- 大規模言語モデルの推論速度は重要であり,実用的な利用を左右する。
- 自己回帰的言語モデルは逐次デコードのため,メモリ制約を受けやすく効率が悪い。
- 高負荷バッチサービング環境下での推論高速化が求められている。
- K-強制は既存の自己回帰モデルを蒸留し,ノイズから複数のトークンを同時に生成する。
- k=4トークンを一度に生成した場合,約2.4-3.5倍の高速化が確認された。
- 生成品質への影響は軽微であり,実用的な高速化手法となり得る。
LLM強化学習における一様トークンレベル信頼領域の限界克服 [cs.LG, cs.AI]目的:LLMの推論能力改善のための強化学習手法
- LLMの性能向上には,強化学習が不可欠であり,特に推論能力の改善が重要視されている。
- 既存の強化学習手法は,トークンごとに一律の閾値を適用するため,系列生成の特性を活かせていない。
- 系列生成における位置依存性と累積的な誤差を考慮した,より安定した学習手法を確立すること。
- 提案手法CPPOは,位置重み付き閾値と累積的なprefix budgetを導入することで,学習の安定性を向上させる。
- CPPOは,初期段階のわずかなずれが後の段階で大きな誤差につながる問題を抑制する。
- 実験結果から,CPPOは様々なモデル規模において,推論精度を大幅に向上させることが示された。
Workflow-GYM:現実世界の専門分野におけるコンピュータ利用型エージェントタスクの長期的評価に向けて [cs.DC, cs.DL, cs.CY, cs.AI]目的:プロフェッショナル分野におけるコンピュータ利用型エージェントタスクの長期的評価のためのベンチマーク
- AIエージェントは複雑な現実世界のタスクに対応できるようになったが,その能力を評価する基準が不足している。
- 既存のGUIベンチマークは汎用ソフトウェアや単純なタスクに偏っており,専門分野のソフトウェアを自律的に操作できるかは不明である。
- 専門分野に特化したソフトウェア環境での,長期的かつ高価値なワークフローの自動化能力を評価し,課題を明らかにする。
- 最先端モデルでも,Workflow-GYMにおける成功率はわずか30%を超え,プロフェッショナルな長期的GUIワークフローが依然として困難であることを示している。
- 現在のエージェントは,ワークフローの一貫性を維持するのに苦労しており,段階の省略やエラーの伝播,目的の逸脱,専門ソフトウェアの理解不足が見られる。
- 今回の研究は,現在のエージェントシステムの限界を明らかにし,次世代GUIエージェント研究の方向性を示唆する重要な知見を提供する。
複雑な行動のモデリング:ビジョン言語モデルにおける多重人格構成と動的切り替え [cs.CL, cs.AI]目的:ビジョン言語モデルにおける複雑な人格条件下の行動理解と制御
- 社会とのインタラクションが増える中で,モデルの行動理解と制御が重要である。
- 既存のプロンプトベース手法は,マルチモーダル環境への転移に限界がある。
- 多重人格の動的かつ複雑な性質を明らかにし,ロバストな手法開発の必要性を示す。
- 人格誘導は画像キャプションの性能を向上させる一方で,視覚的質疑応答のような正確な推論を要するタスクの性能を損なう場合がある。
- 複数特性の構成と動的切り替えにおいて,バランス効果と残余効果が観察され,モデルの行動は過去と現在の制約によって共同調整されることが示唆された。
- 本研究は,ビジョン言語モデルにおける人格モデリングの複雑さを明らかにし,より洗練された手法開発の必要性を強調する。
RoboNaldo:モーション誘導カリキュラム強化学習による高精度・安定・強力なヒューマノイドサッカーシュート [cs.RO, cs.AI]目的:ヒューマノイドサッカーシュートの精度向上
- サッカーのような複雑なスポーツは,ロボット工学における全身体制御の重要な応用分野である。
- 従来の強化学習では,安定した動作を学習することが難しく,特に高出力な動作では困難が顕著である。
- モーション誘導カリキュラム学習を用いて,安定性と精度を両立したサッカーシュートの実現を目指す。
- 提案手法RoboNaldoは,シミュレーション実験において,既存手法と比較してフリーキックの射撃誤差を48.6%低減,シュート速度を2.96倍向上させた。
- 実機Unitree G1を用いた実験では,3mの距離からフリーキックと移動球に対して,それぞれ平均射撃誤差0.73m,0.86mを達成した。
- ポストコンタクト時のボール速度は13.10m/sに達し,プロのオープンプレー射撃速度の59-71%に相当する。
オンラインプラットフォームにおけるデータ駆動型動的アソートメント:両面市場の学習 [cs.LG, math.OC, math.PR, stat.AP, stat.ML]目的:オンラインプラットフォームにおける動的アソートメント最適化
- オンラインプラットフォームは現代経済において重要な役割を担うため,その効率的な運用が求められる。
- 顧客と売り手の選択モデルパラメータが不明な場合,最適なアソートメント決定は困難である。
- 顧客と売り手双方の選択パラメータを学習しながら,プラットフォームの収益を最大化すること。
- 提案アルゴリズムは,顧客と売り手の選択パラメータをデータから学習し,動的にアソートメントを最適化する。
- その最悪ケースにおける後悔(収益損失)は,時間に対して多項式的に増加することが示された。
- この増加率は,最適なアルゴリズムの下限と同等であり,アルゴリズムの効率性が証明された。
機械学習に基づく流体噴射パラメータの多点最適化によるノズル性能向上 [physics.flu-dyn, cs.LG]目的:ノズル性能向上のための流体噴射パラメータ最適化
- 航空宇宙機の加速性能向上に不可欠な過膨張単一膨張傾斜ノズルの効率改善が求められている。
- 複数運転条件下での最適パラメータ特定は困難であり,計算コストが高いことが課題である。
- 機械学習を活用し,計算コストを削減したノズル性能最適化手法を確立することを目指す。
- 事前知識に基づく予測戦略と学習済みニューラルネットワークにより,ノズルの流れ場を迅速に計算可能にした。
- 従来の最適化手法と比較して,勾配計算時間を大幅に短縮し,平均推力係数を1.14%向上させた。
- 学習データベース構築時間を含めても,従来の最適化手法より時間コストを削減することに成功した。
円データに対する射影ランダムフォレストと適合予測 [stat.ML, cs.LG, stat.ME]目的:円データの回帰問題における適合予測
- 円データは,角度や方向など,様々な分野で現れるため,その分析は重要である。
- 既存の回帰モデルは直線的なデータ向けであり,円データへの適用には課題があった。
- 円データに対する予測集合の生成と,その有効性の保証を目的とする。
- 提案手法である射影ランダムフォレストは,既存手法と比較して,より効率的な予測集合を生成した。
- 特に,予測集合の平均的な弧長は,既存手法よりも短縮された。
- 本手法は,データ交換可能性の仮定の下で,有限標本でのカバレッジ保証を持つ。
遠隔センシングによる成果を用いたプログラム評価 [econ.EM, cs.LG, math.ST, stat.AP, stat.ME, stat.ML, stat.TH]目的:遠隔センシング変数による経済的成果の因果推論
- 発展途上国等のデータ収集が困難な地域において,経済状況を把握する手段として重要である。
- 経済的成果の測定にはノイズや誤差が伴うことが多く,正確な因果関係の特定が難しい。
- 遠隔センシング変数を活用し,実験データと観察データから因果効果を非パラメトリックに識別する。
- 経済的成果の変化が,遠隔センシング変数に影響を与えるという仮定の下で,因果パラメータを推定する公式を提案した。
- 実験データと観察データを組み合わせることで,よりロバストな推定が可能となる。
- 遠隔センシング変数の処理アルゴリズムに制限を設けず,漸近的な推論を行う手法を開発した。
分散型エネルギー資源の導入に関する階層的確率的適合性予測 [stat.AP, cs.LG, stat.ML]目的:分散型エネルギー資源の導入予測における不確実性の定量化
- 電力系統管理において,分散型エネルギー資源の急速な増加に対応する必要がある
- 従来の予測手法では,分散型エネルギー資源の導入に関する不確実性や空間的なばらつきへの対応が困難である
- 電力系統の階層構造を考慮し,信頼性の高い意思決定を支援する予測手法を開発する
- 提案手法は,マルコフ・ホークス過程と適合性予測アルゴリズムを組み合わせることで,階層的な電力系統構造における統計的保証を確保する。
- 理論的な妥当性が検証され,インディアナポリスの太陽光パネル設置データを用いた実験評価で,既存手法と比較して予測精度と不確実性較正において優れた性能を示した。
- 本研究は,分散型エネルギー資源の導入予測における不確実性の考慮方法に新たな知見をもたらす。
ベイズ回帰,ツリーアンサンブル,シャプレイ値の統合による疫学データの線形性を超えた発見と推論 [math.OC, cs.SI, math.CO, cs.CG, stat.ML, cs.LG]目的:疫学データにおけるリスク因子と保護因子の発見
- 疫学研究における機械学習の重要性が高まっており,仮説に基づかない分析が可能となる。
- 機械学習は非線形性と相互作用を捉えるのが得意だが,信頼性の高い推論が課題である。
- シャプレイ値の不確実性定量化の欠如を解消し,統計的推論を可能にすること。
- RuleSHAPは,ベイズスパース回帰モデル,ツリーベースのルール生成器,シャプレイ値による寄与度算出を組み合わせることで,この課題に対処する。
- 本フレームワークにより,非線形性や相互作用効果の検出と,個人レベルでの不確実性定量化が可能となる。
- 高コレステロールや高血圧の疫学コホートデータへの適用により,年齢,性別,民族,BMI,血糖値などの特徴間の相互作用効果が明らかになった。
重み付きランダムドット積グラフ [stat.ML, cs.LG, math.CO, math.PR]目的:複雑な関係性のパターン分析
- 現代の統計研究やデータサイエンスにおいて,関係性パターンのモデル化は不可欠である。
- 従来のモデルでは,エッジの重みに多様性がある場合に対応が難しいという課題があった。
- エッジの重み分布の差異を識別し,より高精度なグラフモデルを提供する。
- 提案する非パラメトリックWRDPGモデルは,エッジの重みの分布のモーメントを識別できる。
- ノードの潜在的な位置の推定器の一貫性と漸近正規性が統計的に保証された。
- WRDPGに従ったグラフの生成フレームワークが提供され,様々なネットワーク分析への応用が可能となった。
PCS-UQ:予測可能性・計算可能性・安定性フレームワークによる不確実性定量化 [stat.ML, cs.LG, math.ST, stat.ME, stat.TH]目的:機械学習における信頼性の高い不確実性定量化手法の開発
- 機械学習が重要な意思決定に関わる場面が増加しており,その信頼性が不可欠である。
- 既存の不確実性定量化手法では,現実世界の複雑なデータに対する汎化性能が課題である。
- 予測可能性・計算可能性・安定性の原則に基づき,より信頼性の高い不確実性定量化を実現する。
- PCS-UQは,17個の実世界回帰データセットにおいて,目標とする網羅率を維持しつつ,既存の conformal prediction 法を上回る区間幅を達成した。
- PCS-UQは,一貫したサブグループ網羅率を達成し, oracle-selected conformal prediction 法を上回る性能を示した。
- 6つの分類データセットにおいて,予測セットサイズを20%削減し,計算効率の高いバリアントによって深層学習への拡張も実現した。
CP4SBI:シミュレーションベース推論における信用区間の局所的適合性較正 [math.OC, cs.DM, stat.ML, cs.LG]目的:シミュレーションベース推論における信用区間の局所ベイズ確信水準
- 複雑なモデルの推定において,尤度計算が困難な場合,シミュレーションベース推論が重要となる。
- シミュレーションベース推論で得られる事後分布近似は,しばしば誤った較正度を示し,信用区間が真のパラメータを覆い切らない。
- 信用区間の局所的なベイズ確信水準を保証し,不確実性評価の質を向上させる。
- 提案手法CP4SBIは,回帰木やCDFベースの較正により,様々なスコアリング関数に対して局所的な被覆保証を提供する。
- ニューラル事後分布推定器(正規化フロー,スコア拡散モデリング)を用いたベンチマーク実験で,不確実性評価の改善が示された。
- モデルに依存しない適合性較正フレームワークであり,幅広いSBI手法に適用可能である。
逆共形リスク制御による意思決定のロバスト性調整 [stat.ML, cs.LG]目的:意思決定におけるロバスト性の調整手法
- 不確実性下での意思決定において,ロバスト性は重要な課題である。
- 従来のロバスト最適化では,ロバスト性の水準が恣意的に設定されがちである。
- 本研究は,誤カバレッジとリグレットのパレート最適解を導き出すことで,ロバスト性の選択を支援する。
- 提案手法は,分布に依存せず,有限サンプルで誤カバレッジとリグレットの両方に対する保証を提供する。
- 意思決定者は,コストとリスクの好みに応じて,ロバスト性の水準を信頼性高く評価・調整できる。
- 本手法は実装が容易であり,幅広い最適化問題に適用可能である。
ランダムフォレストにおける局所的に重要な符号付き特徴量と相互作用の証明可能な復元 [physics.soc-ph, cs.MA, quant-ph, cs.CC, cs.CE, cs.DM, math-ph, math.MP, stat.ML, cs.LG, stat.ME]目的:ランダムフォレストにおける局所的な特徴量重要度と相互作用の復元
- 機械学習モデルの解釈性は,モデルの信頼性と利用を向上させるために不可欠である。
- ランダムフォレストの局所的な特徴量重要度に関する理論的な理解が不足している。
- 個々の予測に対する特徴量と相互作用の真の局所的なシグナルを確実に復元すること。
- 提案手法は,局所スパイク疎性モデルの下で,真の局所的シグナル特徴量と相互作用を一貫して復元することを証明した。
- 特徴量の値の大きさ(大きいか小さいか)が予測を駆動しているかを識別できる。
- シミュレーション研究と実際のデータ例を通じて,提案手法の有用性が示された。
AI生成キャプションを用いた1億枚以上の銀河画像に対する意味検索 [astro-ph.IM, cs.AI, cs.CV, cs.LG]目的:銀河画像の意味検索エンジンの開発
- 天文学では,膨大な銀河画像から科学的に興味深い現象を発見することが重要である。
- 手動での画像ラベリングは遅く,数十億枚の銀河画像の探索を制限している。
- ラベルなし画像データから意味検索エンジンを構築し,効率的な現象発見を目指す。
- 現在のVision-Language Model(VLM)は,十分な情報を含む画像の説明を生成できることが示された。
- 開発したAION-Searchは,直接的な画像類似性検索よりも優れた性能を発揮し,ゼロショットでの希少現象検出において最先端の性能を達成した。
- VLMベースのリランキング手法により,上位100件の結果において,最も困難なターゲットに対する再現率がほぼ2倍になった。
電気生理学における前方問題に対する深層学習による代理モデル:物理ベースモデルへのスケーラブルな代替案 [eess.IV, cs.AI, cs.LG]目的:心臓電気活動から体表面電位を計算する前方問題の効率的な代理モデル
- 臨床応用において,心臓の電気的活動を正確にシミュレーションすることは重要である。
- 従来の物理ベースモデルは計算コストが高く,リアルタイム処理や大規模シミュレーションが困難である。
- 深層学習モデルを用いて,計算効率の良い前方問題の求解を目指す。
- 提案された深層学習モデルは,心臓電圧伝播マップから心電図信号を高精度に予測できた。
- 回帰損失とスペクトルエントロピー項を組み合わせた損失関数が,時間領域と周波数領域の両方の忠実性を保つ上で有効であった。
- この研究は,深層学習が物理ベースモデルに代わるスケーラブルかつ費用対効果の高い代替手段となる可能性を示唆している。
間欠時系列予測:局所モデル対グローバルモデル [stat.ML, cs.LG]目的:間欠時系列予測における局所モデルとグローバルモデルの性能比較
- サプライチェーンにおける在庫管理は重要であり,安全在庫水準設定には確率的予測が不可欠である。
- 間欠時系列はゼロを多く含むため,従来の予測手法では精度が低下しやすい。
- 本研究では,最新の局所モデルとグローバルモデルを比較し,間欠時系列予測の精度向上を目指す。
- グローバルモデルの一つであるTiDEが,局所モデルや他の大規模グローバルモデルと比較して,最も高い予測精度を示した。
- TiDEは計算コストも低く,実用性に優れていることが示された。
- Tweedie分布が,高次の分位点推定において最も良好な結果をもたらした。
正解データなし大規模言語モデル評価のための裁判官認識ランキングフレームワーク [stat.ML, cs.LG]目的:大規模言語モデルのランキング評価手法
- 大規模言語モデルの性能評価は,その応用拡大に不可欠である。
- LLMを裁判官とする評価では,裁判官LLMの信頼性のばらつきが課題となっていた。
- 裁判官LLMの信頼性を考慮し,より正確なランキング評価を実現すること。
- 提案手法は,Bradley-Terry-Luceモデルを拡張し,裁判官固有の識別パラメータを導入することで,モデル品質と裁判官の信頼性を同時に推定する。
- 人間の選好との一致度が高く,既存手法よりもデータ効率が良いことが複数のベンチマークと新規データセットで示された。
- LLMランキングの不確実性定量化の精度向上にも貢献する。
ニューラル集合カルマンフィルタ:衝撃を含む圧縮性流体のデータ同化 [physics.flu-dyn, cs.LG]目的:衝撃を含む圧縮性流体のデータ同化における問題点の解決
- 気象予測や航空力学など,流体シミュレーションは科学技術の発展に不可欠である。
- 既存のデータ同化法は,衝撃付近で虚偽の振動や非物理的な現象を引き起こしやすい。
- ニューラルネットワークを用いて,データ同化の安定性と精度を向上させることを目指す。
- ニューラル集合カルマンフィルタは,流れのアンサンブルを深層ニューラルネットワークのパラメータ空間に写像する。
- 物理情報に基づいた転移学習により,ネットワークパラメータの滑らかな変動を保証し,虚偽の振動を抑制する。
- 数値実験の結果,本手法は,衝撃を含む圧縮性流体のデータ同化において有効であることが示された。
ベイジアン最適化におけるトムソンサンプリングの悔やみの上界 [stat.ML, cs.LG]目的:ベイジアン最適化手法であるガウス過程トムソンサンプリングの悔やみの上界
- 最適化問題解決において,効率的な探索と利用のバランスが重要であるため。
- ガウス過程トムソンサンプリングの分析は,期待される悔やみに限定されている場合が多い。
- ガウス過程トムソンサンプリングの悔やみに関する様々な上界を導出すること。
- 本研究では,ガウス過程トムソンサンプリングに対する悔やみの下界を提示し,パラメータ依存性を示す。
- 累積悔やみの二乗モーメントの上界を導出し,デルタに対する改善された上界を示唆する。
- 緩和された必要条件を提示することで,時間水平線Tにおける累積悔やみの上界を改善した。
拡散モデルにおける学習データ統計の理論:易から難へ [stat.ML, cond-mat.dis-nn, cs.IT, cs.LG, math.IT]目的:拡散モデルの学習統計に関する理論的考察
- 生成モデルの性能向上に不可欠であり,その学習メカニズムの理解が重要である。
- 拡散モデルの学習ダイナミクスは未だ解明されておらず,効率的な学習方法が課題である。
- 拡散モデルが分布の複雑さをどのように学習するかというメカニズムの解明を目指す。
- 標準的な拡散モデルは,高次相関を学習する前に,単純なペアごとの入力統計を学習する傾向があることが示された。
- 混合累積モデルを用いた実験により,ペアごとの統計の学習は線形サンプル複雑度で可能であることが証明された。
- 高次統計の学習は少なくとも三次サンプル複雑度を要するが,相関する潜在構造が存在する場合は線形複雑度となることが示された。
監督型切り替え制御のためのオンライン学習 [math.OC, cs.LG, cs.SY, eess.SY]目的:部分観測線形動的システムに対する適切な制御器の特定と展開
- 制御システムにおいて,システムの不確実性や外乱へのロバスト性確保は重要課題である。
- 不安定化する可能性のある制御器の評価は難しく,既存手法では安定性の仮定が必要となる。
- 不安定な制御器も評価可能としつつ,有限時間性能を保証する新しい手法を開発する。
- 提案手法は,多腕バンディットアルゴリズムを制御理論に適用し,データ駆動型評価を実現する。
- システムの観測可能性を活用することで,状態履歴の影響を分離し,不安定化制御器の検出と正確なシステム同定を両立する。
- 次元に依存しない有限時間保証を持ち,O(N log^2 N)ステップで最適な制御器を特定し,L_2ゲインを達成する。
ソルバーを意識した乱流クロージャーの深層学習:ナッジ付き大規模渦シミュレーションからの学習 [physics.flu-dyn, cs.LG, math.DS, physics.comp-ph, physics.geo-ph]目的:乱流クロージャーモデルの学習
- 乱流は物理学,工学において普遍的に存在する現象であり,その予測精度向上は重要である。
- 従来の乱流モデルは,数値シミュレーションの精度と安定性の両立が課題となっていた。
- 本研究は,数値スキームの特性を考慮し,安定性を保ちつつ,疎なデータから乱流クロージャーを学習することを目的とする。
- 連続データ同化フレームワークを用いることで,大規模渦シミュレーションソルバーの修正や微分なしに,疎なDNSデータを用いたクロージャーの事前学習を可能にした。
- 学習された補正は,粗いソルバーの離散化誤差を系統的に追跡することが示された。
- 異なる離散化に対する適応能力により,幅広い数値スキームへの適用可能性を示唆している。
高次元実験データからの動力学の相空間学習における情報ボトルネック [physics.data-an, cs.AI, cs.IT, math.IT]目的:高次元観測データからの動力学系状態変数の同定
- 物理科学において,系の背後にある状態変数の把握は重要な課題である。
- 状態変数は直接観測できず,教師なしで高次元データから推測する必要がある。
- 高次元データから解釈可能な動力学座標を直接回収することを試みる。
- DySIBは,過去と未来の観測ウィンドウ間の予測相互情報量を最大化し,表現の複雑さを抑制する。
- 実験データ(振り子の動画)において,学習された座標が振り子の相空間の次元,トポロジー,幾何学と一致した。
- 学習された座標は,正準角と角速度と滑らかに整合しており,潜在空間における予測情報が有効であることを示した。
証明理論的意味論による情報概念へのアプローチ [math.LO, cs.AI]目的:情報概念の推論主義的意味論理論の構築に向けた第一歩
- 現代社会において情報は不可欠であり,その基盤を論理的・数学的に確立することが重要である。
- 既存の研究では,情報概念の十分な論理的・数学的基盤が確立されていないという課題がある。
- 推論と reasoning に基づく,概念的に厳密な情報概念の数学的・論理的説明を目指す。
- 情報概念を,真理ではなく推論可能性に基づいて再構築することで,新たな視点を提供する。
- 証明理論的意味論(P-tS)を用いて,情報の最小単位である「推論子(inferon)」の理論的基礎を構築する。
- P-tSのツールを応用することで,分散システムのモデリングにおける情報フローの数理的記述が可能となる。
CredibleDFGO:信頼性に基づく微分可能なファクターグラフ最適化 [eess.SP, cs.AI, cs.LG, cs.RO]目的:都市部におけるGNSS測位の精度と信頼性向上
- 都市部のナビゲーションにおいてGNSS測位は不可欠だが,精度が環境に左右される。
- 従来のGNSSソルバーは,都市峡谷環境下で不正確な共分散を報告する問題がある。
- 共分散の信頼性を明示的に学習し,より正確な測位と信頼性評価を実現する。
- 提案手法CredibleDFGOは,位置推定だけでなく共分散の信頼性も考慮して学習を行う。
- 実験結果から,都市部の3つのテストシーンで共分散の信頼性が向上することが確認された。
- 特に,過密都市部において,位置推定の平均水平誤差と95パーセンタイル誤差がそれぞれ改善された。
ASE-LSE不一致の様相:極端値と構造的要因の包括的特徴づけ [stat.ML, cs.LG, cs.SI]目的:ASE-LSE間の潜在的空間不一致の構造的要因
- グラフ構造の解析は,ネットワーク科学や機械学習において不可欠であり,多様な応用分野で活用されている。
- ASEとLSEは広く用いられる手法だが,同じグラフに適用しても結果が異なる場合があり,その理由が不明確である。
- グラフ構造がASE-LSE間の不一致に与える影響を明らかにすることで,両手法の使い分けを明確にすることを目指す。
- ラプラシアンが隣接行列の定数倍である場合に,ASEとLSEは同一の潜在的空間を生成することが証明された。これはグラフが正則または二部完全である場合に限られる。
- 最大不一致グラフは存在せず,不一致は常に理論上の上限を下回ることが示された。不一致の景観には最大値が存在しない。
- 次数不均一性と固有ギャップがASE-LSE間の不一致の主要な構造的要因であることが示された。これらの比率が不一致の予測因子となる。
最小曲面,結び目,そしてニューラルネットワーク [math.DG, cs.LG, math.GT]目的:結び目のHOMFLY多項式の係数と,双曲4空間における最小曲面の符号付き個数の関係の検証
- 低次元トポロジーは,数学や物理学の様々な分野に影響を与え,基本的な構造を理解する上で重要である。
- 最小曲面の存在や性質の厳密な決定は困難であり,特に複雑な形状を持つ結び目においては課題となる。
- 機械学習を用いて最小曲面を近似的に求め,Fineの予想を実験的に検証することで,新たな知見を得る。
- 物理情報を取り入れたニューラルネットワーク(PINN)を用いて,双曲空間における最小曲面方程式の解を求める新しいフレームワークを開発した。
- 様々な結び目を境界とする,近似的な最小曲面を構成し,自己交差の符号を計算するアルゴリズムを開発した。
- 分析した全ての結び目において,計算により得られた最小曲面と自己交差数は,Fineの予想と完全に一致し,その経験的証拠となった。
時系列生成のための三角参照シュレーディンガーブリッジ [stat.ML, cs.LG, math.PR]目的:時系列データの生成
- 金融モデリング等において,過去のデータに基づいた将来予測は重要である。
- 既存のシュレーディンガーブリッジは,生成されるパスの二次変動を固定するため,柔軟性に欠ける。
- ボラティリティや共分散構造を考慮した,より現実的な時系列データの生成を目指す。
- 提案手法(TR-SBTS)は,シュレーディンガーブリッジの枠組みを維持しつつ,参照となる確率過程を三角化することで,より柔軟な生成を可能にする。
- 凍結近似の安定性や,正則化されたカーネル推定の一貫性が数学的に証明されている。
- 数値実験により,提案手法の有効性が確認された。
行動条件付き保証を持つ共形リスク回避意思決定 [stat.ML, cs.AI, cs.LG]目的:行動条件付き共形予測によるリスク回避意思決定の安全性保証
- 機械学習の信頼性向上には,安全性を保証する不確実性定量化が不可欠である。
- 既存の共形予測は周辺的な安全性しか保証できず,意思決定の質が不十分である。
- 行動ごとに安全性が保証される共形予測により,リスク回避意思決定を改善すること。
- 行動条件付き共形予測は,各行動に対する安全性保証を提供する。
- この予測セットは,リスク回避型意思決定者の実行可能領域の近似として機能する。
- 提案手法は,実際のデータセット上で既存手法よりも性能が向上することを示した。
組織グラフにおける反事実的クエリに対する教師あり潜在変数分解 [q-bio.GN, cs.LG, stat.ML]目的:組織グラフにおける反事実的クエリ
- 組織構造は細胞の挙動に影響を与えるため,その理解は生命科学研究において重要である。
- 既存手法は特定の介入タイプに限定されるか,細胞を独立同一分布とみなすため,汎用性に欠ける。
- 空間的な文脈を考慮した反事実的推論により,細胞の挙動予測の精度向上を目指す。
- Cellinaは,細胞の固有状態と空間的文脈を教師あり潜在変数分解によって分離するフレームワークである。
- 複数のベンチマークにおいて,Cellinaは既存手法よりも高い予測精度,潜在変数分解性能,スケーラビリティを示した。
- Cellinaは,教師なし学習によって生物学的に特徴的な癌サブドメインを明らかにし,標的を絞った近隣細胞の摂動シミュレーションを可能にした。
NISQノイズを考慮した量子ニューラルネットワークにおけるヤコビアン幾何学的ロバスト性評価 [math.CO, cs.DM, quant-ph, cs.LG]目的:NISQ時代のノイズを考慮した量子ニューラルネットワークにおけるロバスト性の評価
- 量子計算はノイズの影響を受けやすく,その性能は制限される。古典的な深層学習のロバスト性は重要。
- 量子機械学習において,古典的な深層学習のロバスト性を量子ニューラルネットワークに移行させることは困難。
- ヤコビアン幾何学を用いて,ノイズ環境下での量子ニューラルネットワークのロバスト性を評価し,予測性能を向上させる。
- 提案手法JGRAは,ノイズの影響を考慮した量子ニューラルネットワークのロバスト性をヤコビアン幾何学から評価するフレームワークである。
- JGRAは,ノイズ校正,ノイズ対応学習,ノイズ条件付きヤコビアン抽出を含み,クリーン環境での構造とノイズ環境での推論挙動を結びつける幾何学的記述子を提供する。
- これらの記述子は,未知のノイズに対するロバスト性に関する予測情報を含んでいることが実証された。
特徴融合による多Modal脳腫瘍分類 [eess.IV, cs.CV, cs.LG]目的:脳腫瘍の分類
- 脳腫瘍の早期正確な診断は,患者の予後を大きく左右するため重要である。
- 既存の深層学習モデルは画像情報のみに依存し,臨床家の多Modalな推論を模倣できていない。
- MRI画像と画像特徴量の組み合わせにより,より高精度な脳腫瘍分類を目指す。
- 多Modalネットワークは,単一Modalベースラインと比較して,すべての構成で高い性能を示した。
- ゲート融合戦略が最も高い精度(96.13%)を達成した。
- MRI画像と画像特徴量の組み合わせが,脳腫瘍分類において有効であることが示された。
