arXiv雑要約
AI - 2026/03/11 公開
PathMem:病理学MLLMのための認知に沿ったメモリ変換へ [cs.AI]目的:病理学MLLMにおける構造化知識の統合と解釈可能なメモリ制御のメカニズム
- 病理診断には視覚的パターン認識と構造化知識の動的統合が不可欠であり,その精度が患者予後を左右する。
- 既存のMLLMは,病理学特有の診断基準を推論に一貫して組み込むことが難しく,性能に課題がある。
- PathMemは,病理医の階層的記憶プロセスに着想を得て,診断基準の知識統合とメモリ制御を改善する。
- PathMemは,長期記憶(LTM)とワーキングメモリ(WM)間の動的な移行をモデル化するMemory Transformerを導入した。
- WSI-Benchレポート生成において,WSI-Precisionが12.8%,WSI-Relevanceが10.1%向上し,最先端の性能を達成した。
- オープンエンド診断の精度も,既存のWSIベースモデルと比較して9.7%,8.9%それぞれ向上した。
画像を用いないでも問題ない:k空間のアンダーサンプリングからのエンドツーエンドマルチタスク心臓解析 [cs.CV, cs.AI]目的:アンダーサンプリングされたk空間データから心臓の生理学的ラベルを直接抽出する手法
- 心臓MRIは疾患診断に不可欠だが,計算コストが高い。
- 従来の画像再構成アプローチでは,情報損失やアーチファクトが発生しやすい。
- k空間から直接診断に必要な情報を抽出することで,これらの問題を解決する。
- k-MTRは,アンダーサンプリングされたk空間データと完全な画像を共有の潜在空間に整合させる。
- 大規模シミュレーションにより,k-MTRはアンダーサンプリングによる解剖学的情報の損失を潜在空間で回復する。
- 連続的表現の回帰,疾患分類,解剖学的セグメンテーションにおいて,最先端の画像ベースラインと同等の性能を達成した。
確信度ゲート定理:ランク付けされた意思決定システムはいつ棄権すべきか [cs.AI]目的:ランク付けされた意思決定システムにおける,介入と棄権の判断基準
- 推薦システムや臨床トリアージなど,多様な意思決定場面で利用されており,その性能向上が重要である。
- 確信度に基づく棄権が常に意思決定の質を向上させるわけではなく,条件によっては悪化する可能性がある。
- 構造的不確実性と文脈的不確実性の区別に基づき,棄権戦略の有効性を評価し,最適な適用条件を明確にする。
- 確信度ゲートの条件(ランク整列と反転ゾーンなし)を満たす場合,棄権は意思決定の質を向上させる傾向にあることが示された。
- 構造的不確実性下では,確信度に基づく棄権はほぼ単調に効果を発揮する一方,文脈的不確実性下ではその効果が減衰する。
- 文脈を考慮した代替案(アンサンブル不一致,新しさ特徴量)は,効果の低下をある程度軽減するが,完全な単調性は回復しない。
学習率がうまくいかない時:PPOアクター・クリティックにおける初期構造的シグナル [cs.LG, cs.AI]目的:深層強化学習における学習率の適切な設定
- 強化学習は,複雑なタスクを自動で学習できる可能性を秘めているため重要である。
- 強化学習の性能は学習率に大きく左右され,適切な値を探索するのが困難である。
- 学習率とニューロンの活性化パターンの関係を分析し,最適な学習率の早期選定を目指す。
- 学習率の初期段階におけるニューロンの活性化パターンが,学習の成否を予測できることが示された。
- クリティックネットワークとアクターネットワークで最適なOUI値の範囲が異なり,それぞれ安定性と性能に関係する。
- OUIに基づく早期選別ルールは,他の指標よりも高い精度で有望な学習試行を選び出すことが確認された。
Pythonのためのニューラルデバッガへ [cs.LG, cs.AI, cs.SE]目的:Pythonプログラムのデバッグ手法の研究
- コード生成や理解において,プログラムの動作理解が不可欠である。
- 既存のニューラルインタープリタは,デバッガのようなインタラクティブな制御が欠如している。
- ニューラルデバッガにより,プログラムの実行をステップごとに制御し,変数検査を可能とする。
- 大規模言語モデルをファインチューニング,または小規模モデルを最初から学習することで,ニューラルデバッガを構築した。
- CruxEval評価において,出力予測と入力予測の両方で高い性能を示し,条件付き実行モデリングの堅牢性を実証した。
- 本研究は,ニューラルデバッガをシミュレーション環境のワールドモデルとして活用する,エージェント型コーディングシステムの実現に向けた第一歩となる。
ニューラル最適化アルゴリズムの幅スケーリング:行列作用素ノルムI:行/列正規化とハイパーパラメータ転移 [cs.LG, cs.NA, cs.SY, eess.SY, math.NA, math.OC, stat.ML]目的:ネットワーク幅が増加しても安定した挙動を維持する最適化アルゴリズムの設計
- 深層学習における最適化アルゴリズムの設計は,モデルの性能と学習の安定性に不可欠である。
- 従来の最適化手法では,ネットワーク幅の変化に対する安定性が課題であった。
- 行列作用素ノルムに基づく新しい正規化手法により,幅に依存しない学習率スケーリングを実現する。
- AdamWやMuonを含む既存の最適化アルゴリズムを行列作用素ノルムによる最急降下法として解釈することで,幅に依存しない制御が可能となった。
- 提案する行/列正規化に基づくMOGAは,GPT-2やLLaMAの大規模事前学習において,Muonと同等以上の性能を発揮し,特に高速な学習を実現した。
- Muonのスムーズネス定数には幅$\sqrt{w}$に依存する成長が見られる一方,提案手法は幅に依存しない安定性を保証する。
意味からピクセルへ:階層的視覚理解のための粗から細へのマスク自己エンコーダー [cs.CV, cs.LG]目的:階層的視覚表現の学習
- 視覚的理解は,画像認識や物体検出など,多様な応用において不可欠である。
- 既存の自己教師あり学習法では,大域的な意味と細部の両立が困難である。
- 意味に基づいた学習から徐々に細部へと焦点を当てることで,よりロバストな表現を獲得する。
- C2FMAEは,意味マスク,インスタンスマスク,RGB画像という3つの粒度で階層的視覚表現を学習する。
- カスケードされたデコーダーが,シーンセマンティクスからオブジェクトインスタンス,そしてピクセル詳細へと順に再構成を行う。
- 画像分類,物体検出,セマンティックセグメンテーションにおいて,顕著な性能向上を達成した。
考える前に嘘をつく:推論が正直さをどのように向上させるか [cs.RO, cs.AI, cs.CL, cs.LG]目的:大規模言語モデルにおける欺瞞行動の発生条件の解明
- 言語モデルの倫理的行動は重要であり,社会実装における信頼性を左右する。
- 既存研究では,言語モデルの欺瞞率評価は行われているものの,欺瞞行動の根本原因は不明である。
- 本研究は,言語モデルの推論能力が正直さに与える影響を明らかにすることを目指す。
- 人間とは異なり,言語モデルは推論処理によって一貫して正直さが増すことが示された。
- 推論の内容ではなく,モデルの潜在表現空間の構造が,この効果に寄与していると考えられる。
- 欺瞞的な回答は,正直な回答よりも不安定であり,わずかなノイズで容易に変化することが確認された。
閉塞下における言語条件付きナビゲーションアフォーダンス予測:BEACON [cs.CC, cs.RO, cs.AI, cs.CV]目的:閉塞下での言語条件付きナビゲーションアフォーダンス予測
- ロボットの自律的な移動において,周囲の状況を理解し,人間からの指示に基づいて効率的に移動する能力は重要である。
- 従来の画像と言語の空間的対応手法は,視覚情報に依存しており,閉塞された領域での目標位置の推論が困難である。
- 本研究は,閉塞された領域を含む広範囲な領域でアフォーダンスヒートマップを予測することにより,この問題を解決することを目的とする。
- BEACONは,ロボットの周囲のRGB-D情報を活用し,空間的情報をVLMに注入することで,BEVヒートマップを予測する。
- 閉塞された目標位置を含む検証サブセットにおいて,最先端の画像空間ベースラインと比較して,平均精度が22.74パーセントポイント向上した。
- BEV空間での表現と,各モジュールの設計選択が有効であることが確認された。
群れの意思決定ダイナミクスにおける感情的変調 [cs.MA, cs.AI]目的:群れの意思決定における感情の変調効果
- 集団の意思決定は,生物学的・社会的な現象において重要であり,そのメカニズム解明が求められる。
- 既存の研究では,感情が意思決定に与える影響が十分に解明されていない。
- 感情の価数と覚醒度が意思決定プロセスをどのように変調するかを明らかにすること。
- 感情的変調は,効果的な採用と抑制率の変化を通じて,意思決定の結果と収束時間をバイアスさせる。
- 本研究は,従来の群れ意思決定理論と情動・社会モデリングを結びつけ,非線形増幅が対称的な感情条件下でも決定的な結果を生み出すことを示した。
- 提案されたフレームワークは,自然および人工システムにおける集団選択の感情的側面を研究するための柔軟なツールとなる。
大規模言語モデルを活用したガイドが視覚障碍者・弱視者のVR利用を支援する様子の理解 [cs.HC, cs.AI, cs.ET]目的:視覚障碍者・弱視者のVR利用におけるガイドの利用様態
- VRの社会的な普及に伴い,視覚障碍者・弱視者へのアクセシビリティ対応が重要になっている。
- 既存の研究では,AIガイドの有効性は検証されているものの,実際のユーザーによる検証は不足している。
- 大規模言語モデルを活用したガイドが,VR空間でどのような役割を果たすかを明らかにすること。
- 参加者は,単独でガイドをツールとして利用し,他のユーザーがいる環境では,ガイドを仲間として親しみ,人格化する傾向が見られた。
- ガイドの誤りも容認し,他のユーザーとのインタラクションを促すなど,ガイドに対するユニークな行動が観察された。
- 本研究は,VRアクセシビリティにおけるガイドの多様な可能性を示唆し,今後のガイド設計に貢献する。
データ統計から特徴ジオメトリへ:相関が重ね合わせをどのように形作るか [cs.CL, cs.RO, cs.LG, cs.AI, cs.CV]目的:ニューラルネットワークにおける特徴の重ね合わせの構造
- 機械的解釈可能性の分野において,ニューラルネットワークの内部表現理解は重要である。
- 既存の研究では,特徴間の相関が考慮されず,理想化された設定に限定されていた。
- 現実的なデータにおける特徴の相関が重ね合わせに与える影響を明らかにすること。
- 特徴間に相関が存在する場合,干渉はノイズではなく,建設的な役割を果たすことが示された。
- 特徴を共起パターンに従って配置することで,活性な特徴間の干渉を建設的にし,誤検出を避ける。
- 重み減衰を用いたモデルでは,意味的なクラスタや環状構造が自然に発生することが確認された。
表現学習を用いたタスク認識モジュレーションによる陸域炭素フラックスのアップスケーリング [cs.LG, physics.ao-ph]目的:陸域炭素フラックスのアップスケーリング精度の向上
- 地球炭素循環の把握は地球温暖化対策上不可欠であり,陸域炭素フラックスの正確な推定が重要である。
- 地上観測データの分布が偏っているため,既存のアップスケーリング手法は地域バイアスや予測不確実性を抱えている。
- 物理的制約と適応的な表現学習を統合し,グローバル炭素フラックス推定の堅牢性と汎化性能を高める。
- TAM-RLは,150以上のフラックス観測サイトで既存の最先端データセットと比較して予測性能を向上させた。
- RMSEを8-9.6%削減し,決定係数($R^2$)を19.4%から43.8%に向上させた。
- 炭素バランスの式から導出された損失関数と表現学習の組み合わせが,アップスケーリング精度向上に貢献した。
数学の問題を段階的に検証する [physics.soc-ph, cs.CY, stat.AP, cs.CY, cs.CL, cs.AI]目的:数学の問題の妥当性検証
- 大規模言語モデルの数学的推論能力向上に不可欠であり,信頼性の高いデータセット構築が課題である。
- 既存研究は正答に注力し,問題自体の不備や曖昧性を見落としがちである。
- 不適切な問題の検出と除去により,データセットの品質向上を目指す。
- 提案手法MathQ-Verifyは,問題の形式,定義との整合性,矛盾,情報充足性を段階的に検証する。
- 既存ベンチマークと独自データセットにおいて,F1スコアを最大25%向上させ,高い性能を達成した。
- 軽量なモデル投票により,約90%の適合率と63%の再現率を得て,信頼性の高いデータセットの構築に貢献する。
拡散と自己回帰LLMにおける表現構造と推論時のレイヤー省略 [cs.CL, cs.LG]目的:拡散モデルと自己回帰モデルにおける内部表現構造の比較
- 大規模言語モデルは自然言語処理の基盤であり,その性能向上は様々な応用を可能とする。
- 拡散モデルの内部表現が自己回帰モデルとどのように異なるのか,明確に示されていなかった。
- 拡散モデルの冗長性を利用した効率的な推論手法の開発を目指す。
- 拡散モデルは自己回帰モデルと比較して,より階層的な抽象化構造と早期レイヤーの冗長性を示すことが明らかになった。
- 自己回帰モデルで初期化された拡散モデルは,拡散学習後も自己回帰的な表現ダイナミクスを維持し,初期化バイアスが確認された。
- 拡散モデルにおいて,タスクに依存しない静的なレイヤー省略法により,性能を90%以上維持しつつ,FLOPsを最大18.75%削減することができた。
置換不変な2次元状態空間モデル:多変量時系列のための理論と標準的なアーキテクチャ [stat.ML, cs.AI, cs.LG]目的:多変量時系列モデリングにおける置換対称性の違反
- 多くの実世界システムは変数の順序に依存せず,その対称性を考慮することが重要である。
- 既存のモデルは変数の順序を暗黙的に課し,対称性を無視した結果,性能が制限される。
- 置換対称性を満たす新しい2次元状態空間モデルを構築し,性能向上を目指す。
- 理論的に,線形変数結合の完全な標準形を特徴付け,局所的な自己ダイナミクスとグローバルなプールされた相互作用への自然な分解を証明した。
- 提案するVI 2D SSMは,この理論的基盤に基づき,置換不変な集約を通じて標準的な等変形を実現し,変数の依存関係の深さを削減した。
- 予測,分類,異常検知のベンチマークで最先端の性能を達成し,対称性を保存する2次元モデリングの理論的必要性を検証した。
アライメント検証の形式的な限界 [stat.ML, cs.LG]目的:AIアライメント検証の限界
- AIの安全性を確保する上で,AIが意図した目的を確実に追求できるかどうかの検証が重要である。
- AIシステムの安全性評価は困難であり,形式的な検証手法の確立が求められている。
- 形式的な検証が可能な範囲を明確にし,現実的な保証の可能性を探る。
- 健全性,一般性,計算可能性の3つの性質を同時に満たす検証手順は存在しないことが証明された。
- 3つの性質のうちいずれか1つを緩和することで,検証は可能になる。
- このトレードオフは,アライメント認証の限界を示し,意味のある保証が残る領域を特徴づける。
マイクロ拡散圧縮 -- オンライン確率推定のためのバイナリツリー・トゥーディー雑音除去 [stat.ML, cs.IT, cs.LG, math.IT]目的:適応統計モデルによる確率推定の改善
- データ圧縮は,情報伝送や保存において不可欠であり,効率的な圧縮技術が求められている。
- 従来の予測モデルでは,観測頻度の低い文脈において確率推定が不正確になりやすい。
- 確率推定のバイアスを修正し,圧縮効率を向上させることを目指す。
- Midicothは,適応統計モデルの確率推定を改善するマイクロ拡散雑音除去層を導入したロスレス圧縮システムである。
- バイナリツリーを用いて,各バイト予測をビット単位の二値決定の階層に分解することで,効率的な校正を実現している。
- 複数の段階で雑音除去プロセスを適用することで,残差予測誤差を段階的に修正し,確率分布のバイアスを軽減する。
大規模言語モデル支援による超伝導量子ビット実験 [quant-ph, cs.AI]目的:超伝導量子ビット実験の自動化
- 量子情報処理や量子センシングにおいて,超伝導回路は重要な可能性を秘めている。
- 量子ビットの制御・測定シーケンスの実装は複雑であり,専門知識と時間を要する。
- 大規模言語モデルを用いて,量子ビットの制御・測定を迅速かつ柔軟に行うこと。
- 本研究では,大規模言語モデルを活用し,実験に必要なツールを自動的に生成・実行するフレームワークを開発した。
- このフレームワークを用いて,共振器の特性評価と量子非破壊測定実験を自律的に実施することに成功した。
- 標準的なプロトコルの迅速な展開や,新規実験手順の実装を支援し,量子ハードウェアの制御をより容易にする。
AI可視性の不確実性の定量化:生成検索測定のための統計的フレームワーク [math.CO, cs.DM, math.CO, cs.DM, math.CO, cs.DM, math.OC, cond-mat.mtrl-sci, cs.CL, math.CO, cs.DM, physics.chem-ph, stat.AP, cs.AI, cs.IR]目的:生成検索におけるドメイン可視性の測定に関する不確実性の評価
- AIを活用した検索エンジンは,情報探索のあり方を変革しつつあり,その影響力は増大している。
- 既存の可視性指標は,結果の変動性を考慮せず,固定値として扱われている点が課題である。
- 検索結果の確率的性質に着目し,より信頼性の高い可視性指標の算出を目指す。
- 生成検索プラットフォームにおける引用分布はべき乗則に従い,有意な変動を示すことが実証された。
- ドメイン間の見かけ上の差異の多くは,測定誤差の範囲内に収まることが判明した。
- 引用ランキングはサンプル間で不安定であり,上位ドメインだけでなく,頻繁に引用されるドメイン全体で確認された。
普遍的最小不利サブモデルに基づくカーネル除去バイアスプラグイン推定 [math.ST, cs.LG, stat.ML, stat.TH]目的:非パラメトリックモデルにおけるパスワイズ微分可能なパラメータの推定
- 統計的推論において,効率的なパラメータ推定は重要な課題である。効率性は推定の精度を最大化する。
- 従来の推定方法は,効率的影響関数を明示的に導出し評価する必要があり,困難な場合がある。
- 普遍的最小不利サブモデルを利用し,効率的影響関数の評価を回避する新しい推定方法を提案する。
- 提案手法であるULFS-KDPEは,再生核ヒルベルト空間におけるデータ適応型除去フローを構築する。
- ULFS-KDPEは,明示的な効率的影響関数の導出や評価を必要とせず,セミパラメトリック効率を達成する。
- シミュレーション研究により,提案手法の有効性と理論的結果が裏付けられた。
シミュレーションに基づく推論の信頼性向上へ [stat.ML, cs.LG]目的:シミュレーションに基づく推論における信頼性向上
- 科学的知見は観察と理論,データ検証を通して発展する。統計モデルがその中で重要な役割を担う。
- 機械学習を用いた統計分析には近似が含まれることがあり,過信された結論を導く可能性がある。
- 過信を防ぎ,適切な推論を行うための手法を開発し,近似の信頼性を診断すること。
- 機械学習を用いた統計分析における近似が,過信された結論を生む可能性があることが実証された。
- バランシングという正則化手法により,過信を抑制し,より適切な近似を導くことが可能になった。
- ベイズニューラルネットワークを用いることで,正則化なしに過信を軽減できることが示された。
経済学における強化学習の概観 [econ.GN, cs.LG, q-fin.EC]目的:経済学への強化学習手法の導入と応用可能性
- 経済モデルの複雑化に伴い,従来の最適化手法では対応困難な問題が増加している。
- 次元の呪いにより,厳密な動的計画法の適用範囲が限られ,大規模問題への対応が課題である。
- 高次元状態,連続行動,戦略的相互作用を含む経済モデルへの適用を目指す。
- 強化学習は,動的計画法の自然な拡張として,複雑な経済問題への適用可能性を提供する。
- 価格設定,在庫管理,戦略的ゲーム,選好抽出などのシミュレーションを通じて,そのメカニズムが示されている。
- 強化学習は,シミュレーターの精度依存性やパラメータ設定の困難さなど,いくつかの制約を抱えている。
ボレル空間におけるデータ駆動型ロバストマルコフ決定過程:公理的アプローチによる性能保証 [math.OC, cs.LG, stat.ML]目的:不確実な外乱分布を持つマルコフ決定過程におけるロバスト性
- 意思決定問題において,現実世界では不確実性がつきものであり,そのロバスト性が重要である。
- 従来のマルコフ決定過程は外乱分布が既知であるとする前提があり,現実の問題への適用が困難である。
- データ駆動的に構築したロバストマルコフ決定過程を用いて,外乱分布が未知の場合でも性能保証を行う。
- 提案手法では,経験分布からの距離関数に基づき,不確実性集合を定義することで,ロバスト最適値関数とサンプル外性能関数の一致性を示す。
- 限られたサンプルサイズにおいても,ロバスト最適値関数がサンプル外性能関数の上限となる確率的保証を確立した。
- 経験分布に基づくマルコフ決定過程が,提案手法のような有限サンプル性能保証を満たさないことを示した。
生成モデルによる統計的推論:フローマッチングと因果推論 [eess.SP, cs.ET, stat.ML, cs.LG]目的:生成モデルの統計的解釈と,それを用いた統計的推論の枠組み
- 近年の生成AIの発展は目覚ましいが,統計学的な解釈が課題であった。
- 生成AIの予測精度は高いものの,内部メカニズムの解釈・分析が困難である。
- フローマッチングを基盤とし,統計的推論における信頼性を高めることを目指す。
- 生成モデルを,高次元確率分布の非パラメトリック学習手法として再解釈した。
- 欠損データ補完や反事実分析を,統計的に正当化された方法で実行可能となった。
- 生存分析や因果推論といった応用を通じて,生成モデルの有効性を示した。
衛星電子機器のオンライン信頼性予測のための適応的アクティブラーニング [stat.ME, cs.LG]目的:衛星電子機器のオンライン信頼性予測の精度向上
- 宇宙環境下での電子機器は過酷であり,信頼性確保が不可欠であるため。
- 稼働データ不足,運用条件の変動,機器ごとのばらつきが信頼性予測の精度を阻害する。
- 限られたデータで高精度な信頼性予測を実現し,衛星システムの健全性管理を支援する。
- 提案手法は,Wiener過程に基づく劣化モデルと適応的なアクティブラーニングを統合した。
- シミュレーションと天宮宇宙ステーションの事例研究により,予測精度が大幅に向上し,データ要件が大幅に削減された。
- 本手法は,複雑な衛星電子システムの予知保全と健全性管理に効率的なソリューションを提供する。
ハイパーグラフオブザーバーに対する良好なレギュレーター条件の検証:因果不変性に基づく自然勾配学習 [stat.ML, cond-mat.stat-mech, cs.LG, math-ph, math.MP]目的:因果不変なハイパーグラフ基盤における持続的オブザーバーの良好なレギュレーター条件への適合性
- 複雑なシステムを理解・制御するには,システムと環境の関係性をモデル化することが不可欠である。
- 既存の制御理論では,システムの内部モデルがどのように形成され,環境に適応するかというメカニズムが不明確である。
- ハイパーグラフオブザーバーの学習則が,情報幾何学的に最適化された自然勾配降下法に従うことを示す。
- 持続的オブザーバーは,Conant-Ashbyの良好なレギュレーター定理の条件を満たすことが確認された。
- 内部モデルが存在する場合,Fisher情報計量の出現は標準的な情報幾何学から導かれる。
- 特定の仮定の下で,VanchurinのType IIフレームワークにおけるパラメータαの閉形式解が得られ,量子-古典的な閾値が示唆された。
組合せ構造の強化学習による生成:ラムゼイ数 [math.CO, cs.AI, cs.CC]目的:ラムゼイ数の新たな下界値の算出
- 組合せ数学の基礎であり,グラフ理論などに応用される重要な分野である。
- ラムゼイ数の計算は組合せ爆発を起こしやすく,計算量が非常に大きい。
- 大規模言語モデルを用いた探索アルゴリズムを開発し,計算効率を向上させる。
- 古典的なラムゼイ数の下界値を5つ改善した。R(3, 13)は60から61へ,R(3, 18)は99から100へなど。
- 既存の正確なラムゼイ数の下界値を再現し,多くの他のケースにおいても最良の下界値に匹敵する結果が得られた。
- AlphaEvolveという大規模言語モデルベースのコード変異エージェントを開発し,複数の結果を導き出す汎用的な探索アルゴリズムを実現した。
可逆性に基づく離散パラメータを持つ分布のための生成サンプラー [stat.ML, cs.LG, cs.NA, math.NA]目的:複雑な非正規化分布からのサンプリング手法
- 計算物理学や機械学習において,複雑な分布からのサンプリングは重要な課題である。
- 離散変数や混合変数系への既存手法の適用は,勾配の定義困難性や推定量の分散の大きさといった問題がある。
- ターゲット関数の勾配や連続緩和に頼らず,幅広い状態空間でサンプリングを可能にすること。
- 詳細平衡性から導かれる時間可逆性を統計的制約として課すことで,生成サンプリングの枠組みを確立した。
- 順方向および逆方向のマルコフ軌道の結合分布間の最大平均不一致(MMD)を最小化することで学習を行う。
- ガウス混合分布,イジングモデル,離散指数と連続力学を組み合わせたハイブリッドシステムにおいて,熱力学的な観測値を正確に再現できることを示した。
ベイズ最適化におけるトムソンサンプリングの期待後悔限界について [stat.ML, cs.LG]目的:ベイズ最適化手法であるガウス過程トムソンサンプリングの期待後悔限界
- ベイズ最適化は,評価コストの高い関数の最適化に有効であり,様々な分野で応用が広がっている。
- ガウス過程トムソンサンプリングの分析は期待後悔に限定されており,高確率での後悔限界が確立されていなかった。
- ガウス過程トムソンサンプリングの高確率後悔限界,緩和された条件,累積後悔上限の改善を目指す。
- 本研究では,ガウス過程トムソンサンプリングに対する後悔下限と,$\delta$ に対する多項式依存性を示した。
- 累積後悔の二乗モーメントの上限を導き,より改善された後悔上限が$\delta$に対して得られることを示した。
- 期待緩和後悔上限と,時間範囲$T$における改善された累積後悔上限も確立した。
ボロノイ図を用いた物理情報ニューラルネットワークによる流場再構成と,エンドツーエンドのセンサー配置最適化 [physics.flu-dyn, cs.LG]目的:流場再構成の精度向上と,センサー配置最適化
- 流体解析において,高精度な流場再構成は不可欠であり,工学設計や現象理解に貢献する。
- 既存手法は,センサーの配置や欠損に弱く,再構成精度が低下する課題があった。
- 本研究は,センサー配置の最適化により,ロバストで高精度な流場再構成を実現する。
- 提案手法VSOPINNは,異なるレイノルズ数において,流場再構成精度を大幅に向上させる。
- VSOPINNは,センサーの配置を適応的に学習し,効果的なレイアウトを自動的に決定する。
- 一部のセンサーが故障した場合でも,高いロバスト性を維持し,安定した再構成結果を得る。
CERES:急性食糧不安に対する確率的早期警戒システム [stat.AP, cs.AI]目的:急性食糧不安の確率的予測
- 食糧安全保障は,人々の生存と安定した社会の維持に不可欠である。
- 食糧危機は予測が難しく,緊急支援の遅れが深刻な被害をもたらす。
- 本研究は,早期警戒システムを用いて食糧危機の発生を予測し,迅速な対応を可能にすることを目指す。
- CERESは,世界43カ国における急性食糧不安の確率を90日先まで予測するシステムである。
- 降水量の異常,植生指標,紛争イベント,食糧価格など6種類のデータを統合して予測を行う。
- 過去の食糧危機事例における検証で,高い予測精度を示した。予測は全て公開され,検証可能である。
非準拠バンドットにおける我々は何を重視すべきか:BRACE - 推奨,差し控え,および確実な効果を伴うバンドット [stat.ML, cs.LG]目的:非準拠バンドットにおける目的選択問題
- 行動経済学や機械学習において,最適な意思決定を行うためのアルゴリズム開発が重要視されている。
- 従来のバンドット問題では,推奨と実際の治療が一致すると仮定されていたが,現実には乖離が生じることが多い。
- 推奨の厚生,治療学習,および常に有効な不確実性の間で目的が一致しない問題を解決する。
- 本研究では,BRACEと呼ばれるパラメータフリーなアルゴリズムを提案し,特定の条件下で最適な推奨および治療ポリシーを特定できることを示した。
- 実験結果から,安全性の確保が容易な問題では後悔として,弱い識別下では差し控えと広い有効範囲として現れることがわかった。
- また,文脈が豊富な場合,半パラメータIV推論において安定化が必要な要素を明確にするための直交スコアを導出した。
a-TMFG:近似最近傍探索によるスケーラブルな三角化最大フィルタグラフ [stat.ML, cs.LG]目的:大規模データにおける三角化最大フィルタグラフの構築
- データ解析において,高次元データの関係性を可視化するグラフ表現が重要視される。
- 従来のTMFGは相関行列の計算と保存にメモリを消費し,大規模データへの適用が困難であった。
- 本研究は,近似最近傍探索を用いて,メモリ効率の良いグラフ構築手法を提案することでこの課題を解決する。
- 提案手法a-TMFGは,従来のTMFGと比較して,メモリ使用量を大幅に削減できることが示された。
- 大規模データセット(数百万の観測値)を用いた実験により,a-TMFGの頑健性とスケーラビリティが確認された。
- a-TMFGは,教師あり・教師なし学習への入力グラフとして利用可能であり,自然なグラフが存在しないケースに有効である。
皮質における学習のための変分潜在的均衡 [q-bio.NC, cs.AI, cs.NE, cs.SY, eess.SY, physics.bio-ph]目的:複雑な時空間パターンの学習における変分潜在的均衡の近似
- 脳は複雑なパターン認識能力においてAIを凌駕しており,そのメカニズムの解明は重要である。
- 深層学習は時系列データの学習にBPTTを用いるが,脳の回路やダイナミクスとは相容れない点が課題である。
- 脳のエネルギー保存則に基づき,生物学的に妥当なBPTTの近似手法を提示し,その問題を解決する。
- 提案手法は,エネルギー関数と実時間エラーダイナミクスを用いて,時間連続ニューロンネットワークにおけるBPTTを導出した。
- この手法により,空間的・時間的に局所的な方程式を導出し,神経細胞とシナプスのダイナミクスを記述できる。
- 本研究は脳型深層学習の理論的基盤を提供し,計算を行う物理回路の設計指針となる。
ノイズ下における光量子機械学習の進化 [quant-ph, cs.LG]目的:光量子機械学習におけるノイズの影響と軽減策
- 量子機械学習は,従来の機械学習の限界を打破する可能性を秘めており,様々な分野への応用が期待される。
- 光量子機械学習システムは,ノイズの影響を受けやすく,性能,信頼性,スケーラビリティが制限されるという課題がある。
- 光量子機械学習システムにおけるノイズ源を分析し,ノイズ軽減策を検討することで,ロバストかつスケーラブルなシステム開発を目指す。
- 本レビューでは,光量子機械学習システムにおける主要なノイズ機構を分類し,学習性能や収束行動への影響を分析した。
- 従来のノイズ特性評価手法に加え,高度な手法を概観し,光量子システムにおけるノイズ軽減戦略に関する最近の研究動向を調査した。
- 実験的進歩を強調し,現実的なノイズ条件下でロバストかつスケーラブルな光量子機械学習システムを開発するための将来の研究方向性を示した。
離散時間署名による普遍性の確立 [math.PR, cs.LG, q-fin.MF]目的:区分線形経路空間におけるグローバルなユニバーサル近似
- 金融工学等に応用され,経路依存型金融商品の評価やリスク管理に不可欠な分野である。
- 複雑な経路を持つ確率過程の関数を近似する理論的基盤が十分ではなかった。
- 署名に基づく近似理論を構築し,経路依存型関数や確率微分方程式への応用を目指す。
- 区分線形経路空間における線形関数の密度に関するグローバルな近似定理を確立した。
- ブラウン運動の区分線形補間が,近似定理の積分可能性条件を満たすことを示した。
- これにより,経路依存型関数,確率常微分方程式,ブラウン運動駆動確率微分方程式の$L^p$-近似結果が得られた。
ニュートリノ誘発核子ノックアウトのモデルパラメータの初回推定:シミュレーションに基づく推論 [hep-ph, cs.AI, hep-ex, physics.comp-ph]目的:ニュートリノ誘発核子ノックアウト現象のモデルパラメータ推定
- GeV領域のニュートリノ実験において,正確なパラメータ決定には核相互作用のシミュレーションが不可欠である。
- 現在のシミュレーションは不完全であり,実験との比較のために経験的なパラメータ調整が用いられている。
- シミュレーションに基づく推論(SBI)の適用可能性を検証し,パラメータ調整の効率化を目指す。
- MicroBooNEの調整済みGENIEイベント発生器をSBIで再検討した結果,わずかに異なるパラメータ値が好ましいと示された。
- SBIアルゴリズムは,実験データに対してわずかに優れた適合度を示した。
- 訓練済みのアルゴリズムは,GENIEと一部パラメータのみ共有するNuWroシミュレーションを近似できた。
XConv:畳み込み層のための低メモリ確率的逆伝播 [quant-ph, cs.CC, physics.hist-ph, cs.NI, cs.LG, cs.NA, math.NA]目的:畳み込みニューラルネットワークの効率的な学習手法
- 深層学習の発展により,大規模なモデル学習が不可欠となっている。
- 大規模モデル学習では,中間活性の保存によるメモリ消費が課題である。
- メモリ消費を抑えつつ,学習精度を維持することが求められている。
- XConvは,既存の畳み込み層を置き換えることで,メモリ使用量を削減する。
- 標準的な逆伝播を維持し,アーキテクチャ制約やコード変更も不要である。
- 様々なタスクで,従来の勾配法と同等の性能を示すことが確認された。
分散型連合学習に関する調査 [cs.LG, cs.CR, cs.DC]目的:分散型連合学習手法の体系的レビュー
- データ活用において,プライバシー保護と分散環境での学習ニーズが高まっている。
- 中央集権型連合学習は単一障害点となり,信頼性の問題がある。
- 分散型連合学習における課題と将来の研究方向性を明確化する。
- 本調査では,2018年から2026年初頭までの分散型連合学習手法を,伝統的な分散型FLとブロックチェーンベースのFLの2つのアーキテクチャファミリーに分類した。
- ボトルネックに対応する統一的な分類法を提案し,評価手法の限界と文献のギャップを指摘した。
- トポロジーを考慮した脅威モデル,分散環境に適したプライバシー概念,操作に強いインセンティブメカニズムなど,今後の研究方向性を示唆した。
多項式過剰パラメータ化された畳み込みニューラルネットワークは,構造化された強力な当選宝くじチケットを含む [cs.LG, math.CO, math.PR]目的:構造化された当選宝くじチケットの存在
- 深層学習モデルの過剰パラメータ化が,学習性能に及ぼす影響を理解する重要性
- 構造化プルーニングに関する数学的ツールが限られており,SLTHの形式的な分析が困難であったこと
- 構造化プルーニングにおけるSLTHの理解を深め,過剰パラメータ化の役割を明らかにする
- ランダムに初期化された畳み込みニューラルネットワーク内に,学習なしでも良好な性能を発揮する構造化サブネットワークが存在することが証明された。
- この結果は,構造化プルーニングにおけるSLTHに関する最初の指数関数未満の限界値を提供する。
- これにより,深層学習における過剰パラメータ化の役割に関する新たな研究の道が開かれる。
実世界グラフクラスタリングのための証明可能なフィルタ [cs.LG]目的:実世界グラフにおけるクラスタリング手法の性能向上
- グラフクラスタリングは重要な未指導学習問題であり,近年進歩の著しいグラフニューラルネットワークよりも頑健である。
- 既存のクラスタリング手法は,ホモフィリーグラフに焦点を当てており,ヘテロフィリーを無視する傾向がある。
- 実世界のグラフは構造的な不均一性を示すため,ホモフィリー/ヘテロフィリーの単純な分類が困難であり,その解決が求められている。
- 本研究では,理論的根拠に基づいた新しいフィルタを提案し,ホモフィリーおよびヘテロフィリーグラフの両方で高い性能を示すことが確認された。
- 近傍情報に基づき,ホモフィリーおよびヘテロフィリーエッジを正確に識別し,低域通過および高域通過フィルタを構築することにより,包括的な情報を捉える。
- 重要特徴の強調には,squeeze-and-excitationブロックを使用し,最先端のクラスタリング手法と比較して優位性を示す。
PnLCalib:点と線最適化によるスポーツフィールド登録 [cs.CV, cs.AI]目的:スポーツフィールド登録の精度向上
- スポーツ映像解析において,正確なフィールド登録は不可欠である。選手の動きや戦術分析に必要となる。
- 従来手法は初期カメラ位置の推定に依存し,動的な環境や特殊なカメラ位置では精度が低下する。
- 3Dフィールドモデルと線分検出を活用し,初期推定に依存しない高精度なカメラ較正を実現する。
- 提案手法は,既存技術と比較して,マルチビューおよびシングルビュー3Dカメラ較正において優れた性能を示す。
- 特に,フィールドラインの非線形最適化による改良モジュールが,初期較正の精度向上に貢献する。
- SoccerNet-Calibration等の実データを用いた実験により,多様な放送環境下でのロバスト性と精度が実証された。
深層学習による座標とフローマップを用いた多スケールシステムの計算効率向上 [cs.CL, cs.DC, cs.LG, cs.NE, nlin.CD]目的:多スケールシステムの計算効率向上手法
- 分子,細胞,個体などの相互作用による複雑系の解析は,科学的理解に不可欠である。
- 動的な変化が大きく,時間・空間スケールが広いため,計算コストが非常に高くなる。
- 深層学習を用いて,時間ステップを最適化し,計算コストを削減することを目的とする。
- 深層学習による座標とフローマップの同時学習により,高精度な時間ステップ予測を実現した。
- 従来のシミュレーション手法と比較して,計算コストを大幅に削減できることを示した。
- Fitzhugh NagumoニューロンモデルとKuramoto-Sivashinsky方程式において,その有効性を実証した。
分散型多エージェント強化学習におけるGNN駆動型内発的報酬による異種エージェント協調性の向上 [cs.MA, cs.AI, cs.RO]目的:分散型多エージェント強化学習における異種エージェント間の協調性向上
- 多様なタスクへの応用が期待される多エージェント強化学習の発展が重要である。
- 異種エージェント環境下での分散学習は,集中学習やパラメータ共有を前提とする場合が多い。
- 部分観測性や報酬の希薄性といった課題下で,異種エージェント間の効率的な協調学習を実現する。
- 提案手法CoHetは,MPEおよびVMASベンチマークにおいて,最新手法と比較して優れた性能を示した。
- GNNに基づく内発的報酬を用いることで,異種エージェントの方策学習を促進する効果が確認された。
- エージェントのダイナミクスモデルが内発的報酬モジュールに与える影響に関する分析が行われた。
重い裾を持つ分布のためのスパース変分Student-t過程 [cs.LG, cs.AI]目的:重い裾を持つ分布に対するモデリング
- 非パラメトリックモデリングにおいて,ガウス過程は強力なツールである。しかし,外れ値に敏感であるという課題がある。
- Student-t過程は頑健な代替手段だが,大規模データセットへの拡張性が乏しい。
- スパース変分Student-t過程を開発し,Student-t過程のスケーラビリティを向上させる。
- 本研究で提案するSVTPは,UCIおよびKaggleデータセットにおいて,外れ値や重い裾を持つデータに対して,スパースガウス過程を大幅に上回る性能を示した。
- SVTPは,最長で3倍の高速な収束と,40%低い予測誤差を達成し,20万を超えるサンプルデータセットに対しても計算効率を維持した。
- Student-t分布のFisher情報行列とベータ関数間の新たな関係性を利用した自然勾配最適化法を導出した。
HYGENE:拡散に基づくハイパーグラフ生成手法 [cs.LG, cs.DM]目的:ハイパーグラフの生成
- 社会ネットワーク,バイオインフォマティクスなど,複雑な関係性を表現する上で重要である。
- 現実的かつ多様なハイパーグラフを生成する有効なモデルが不足している。
- 拡散モデルを用いて,ハイパーグラフの生成における課題を解決すること。
- HYGENEは,双方向グラフ表現に基づき,局所的な拡張によりハイパーグラフを生成する。
- ノイズ除去拡散過程を用いることで,大域的な構造を構築してから局所的な詳細を洗練させる。
- 実験により,HYGENEが様々なハイパーグラフの特性を忠実に再現できることが示された。
任意の精度と疎性におけるニューラルネットワークのロバストな学習 [cs.LG, cs.AI, cs.CL, cs.CV, cs.NA, math.NA]目的:ニューラルネットワークのロバスト性の向上
- AI技術の発展に伴い,計算資源の効率的な利用が重要になっている。
- 量子化や疎性化は計算コスト削減に有効だが,勾配消失や不安定性を招く。
- 量子化ノイズへのロバスト性を高め,安定した学習を可能にすること。
- 本研究では,量子化を付加ノイズとして明示的にモデル化する手法を提案した。
- これにより,勾配パスを明確にし,量子化ノイズに対するロバスト性を獲得できる。
- 提案手法は,最新のLLMにおいて最先端の結果を示し,効率的なニューラルネットワークへの理論的根拠を提供する。
強化学習におけるハイパーパラメータ最適化のための柔軟かつ効率的なベンチマーク:ARLBench [cs.LG]目的:強化学習におけるハイパーパラメータ最適化のベンチマーク
- 強化学習の性能はハイパーパラメータに大きく依存し,その調整は重要である。
- 既存のハイパーパラメータ最適化手法は,評価にコストと時間がかかり,汎化性能の検証が困難である。
- ARLBenchは,限られた計算資源でも効率的にハイパーパラメータ最適化手法を比較・評価することを可能にする。
- ARLBenchは,多様なアルゴリズムと環境の組み合わせを網羅したハイパーパラメータ最適化タスクのサブセットを提供することで,計算コストを削減する。
- このベンチマークとデータセットは,強化学習における自動ハイパーパラメータ最適化(AutoRL)研究の基盤として活用できる。
- ARLBenchは,効率性,柔軟性,将来性を兼ね備えたAutoRL研究のための基盤となる大規模なハイパーパラメータランドスケープデータセットを提供する。
特権情報を用いたデータセット縮約 [cs.CV, cs.AI, cs.LG]目的:データセット縮約における性能維持
- 大規模データセットの効率的な学習が重要であるため。
- 既存手法では,データとラベルのみを利用し,情報量が限定的である。
- 特権情報を活用し,より効果的なデータセット縮約を実現すること。
- 提案手法DCPIは,既存のデータセット縮約手法と容易に統合可能である。
- ImageNet-1K等の実験で,DCPIが性能向上に寄与することが示された。
- 効果的な特徴ラベルは,識別力と多様性のバランスが重要であることが判明した。
