arXiv雑要約

AI - 2025/12/16 公開

  • モデルと部分空間を意識した可変優先度による汎用的なOOD検出 [q-bio.QM, cs.CG, stat.ML, stat.ML, cs.LG]目的:OOD(分布外)検出の枠組み
    • 機械学習モデルの信頼性確保は重要であり,未知のデータへの対応が不可欠である。
    • 回帰や生存分析におけるOOD検出は,離散ラベルがないため困難である。
    • 予測における不確実性の定量化と,分布外データの効率的な識別を目指す。
    • 提案手法は,モデルが学習した関係性を重視し,予測に寄与しない特徴量を抑制する局所的な近傍を構築する。
    • 既存手法と比較して,機能的なシフトを捉えた合成データや実データにおいて,OOD検出性能が向上した。
    • 食道癌の生存分析において,リンパ節郭清に関連する分布シフトが手術ガイドラインに合致するパターンを特定した。

    Link: https://arxiv.org/abs/2512.13003

  • 確率的勾配降下法の停止規則:いつでも有効な信頼区間によるアプローチ [math.OC, cs.LG, math.ST, stat.ML, stat.TH]目的:凸最適化問題に対する確率的勾配降下法(SGD)の停止規則
    • 機械学習における最適化の基礎であり,モデルの精度向上に不可欠な手法である。
    • 既存の研究では,期待値または固定の時点での収束が保証されるのみで,任意の時点での最適解への距離評価が困難である。
    • SGDの現在の手法が最適解にどれだけ近いかを統計的に評価できる停止規則を確立すること。
    • 本研究では,非負マルチンゲールを用いて構築された,射影SGDの重み付き平均劣最適性に対する,いつでも有効なデータ依存型上限信頼区間を提案する。
    • 提案する停止規則は,確率$1-\alpha$で$\varepsilon$-最適であり,標準的な確率的近似ステップサイズの下でほとんど確実に有限であることが証明されている。
    • これは,一般的な凸目的関数を持つ射影SGDに対する,時間的に一様な厳密な性能保証および有限時間での$\varepsilon$-最適性の証明の最初の例である。

    Link: https://arxiv.org/abs/2512.13123

  • ニンジンとムチ,または両方?競争環境における持続可能な食料選択のための価格インセンティブ [econ.GN, cs.AI, q-fin.EC]目的:持続可能な食料選択のための価格インセンティブの効果
    • 食肉消費は地球規模の温室効果ガス排出の主要な要因であり,削減が急務である。
    • 価格介入の効果は示唆されているが,消費者選択肢が限られた状況での研究が多い。
    • 現実的な競争環境における価格介入の有効性と経済的実現可能性を検証する。
    • 肉に対する割増金と割引を組み合わせた施策が,温室効果ガス排出量を削減し,売上に大きな影響を与えなかった。
    • 割増金のみでは,売上が減少し,他の場所での売上が増加する「スピルオーバー効果」が発生し,環境的な利点が相殺された。
    • 価格介入は,菜食主義者だけでなく,食肉習慣のある消費者にも効果があり,食習慣を変える可能性を示唆した。

    Link: https://arxiv.org/abs/2512.13174

  • MicroPhaseNO:地震で訓練された位相ニューラル演算子を微小地震の位相拾得へ適用 [physics.geo-ph, cs.LG]目的:微小地震の位相拾得における性能向上
    • 地震監視や地下構造探査において,地震波の位相拾得は不可欠な技術である。
    • 従来の作業は手作業であり,リアルタイム処理や大規模アレイでの利用が困難である。
    • 地震データで訓練されたモデルを転移学習により微小地震データへ適応し,効率的な位相拾得を実現する。
    • 既存のPhaseNOや従来のワークフローと比較して,F1スコアと精度が最大30%向上した。
    • 系統的な時間差と拾得の不確実性を大幅に低減することに成功した。
    • 本手法は,少量の較正データセットで適応可能であり,他の微小地震タスクへの応用も容易である。

    Link: https://arxiv.org/abs/2512.13197

  • 物理情報回帰の再考:訓練ループと専用アーキテクチャからの脱却 [math.OC, cs.LG]目的:物理情報回帰問題に対する新たな手法
    • 科学技術の発展には,物理法則に基づく高精度な予測が不可欠である。
    • 従来の物理情報回帰は,学習に時間を要したり,汎用性に欠けたりする課題があった。
    • 予測時に物理法則を直接適用し,効率的な予測を実現すること。
    • 本研究では,既存のサンプルから微分や曲率情報を直接計算することで,予測点の状態を算出する手法を提案した。
    • 反応拡散系に関する比較ベンチマークにおいて,ニューラルネットワークベースの手法と同等の予測精度を達成した。
    • 長時間の訓練ループやサンプリング配置の変化に対するロバスト性を実現し,計算コストを削減した。

    Link: https://arxiv.org/abs/2512.13217

  • 第二階情報を用いたLMOに基づくモーメンタム法の改良 [math.OC, cs.LG]目的:深層学習における効率的な最適化手法の理論的保証
    • 機械学習タスクにおいて,モーメンタム法の有効性が実証されている。
    • 従来のモーメンタム法は収束率に限界があり,特に非ユークリッド空間での適用が困難である。
    • LMOフレームワークにヘッセ行列補正モーメンタムを統合し,より高速な収束を目指す。
    • 提案手法は,従来のモーメンタム法よりも高速なO(1/K^{1/3})の収束率を理論的に保証する。
    • 本手法は,問題の幾何学的な特性に適応し,任意のノルム設定下で有効に機能する。
    • MLPやLSTMネットワークの学習実験により,理論的な知見が裏付けられた。

    Link: https://arxiv.org/abs/2512.13227

  • インタラクティブVR実験に基づいたメンタルローテーションの深層学習モデル [q-bio.NC, cs.LG]目的:人間のメンタルローテーションをモデル化するメカニズム
    • メンタルローテーションは,人間の認知能力の基礎であり,空間認識や問題解決に不可欠である。
    • 既存のモデルでは,人間のメンタルローテーションにおける空間的推論や記号的処理の統合が不十分である。
    • 深層学習,等方性,そして神経記号的学習を統合することで,より精度の高いメンタルローテーションモデルを構築する。
    • 本モデルは,画像から3次元空間表現を生成し,そこから記号的な記述を導き出し,回転シミュレーションを予測する。
    • VR実験を通じて得られた知見をモデル設計に組み込み,人間の認知プロセスをより良く捉えることに成功した。
    • モデルの各コンポーネントの必要性を系統的なアブレーション実験によって示し,その有効性を確認した。

    Link: https://arxiv.org/abs/2512.13517

  • 機械学習を用いたIODP390/393探査における岩石層判別精度の向上 [physics.geo-ph, cs.LG]目的:IODP390/393探査の検層データからの岩石層判別精度向上
    • 地質資源探査や環境モデリングにおいて,正確な岩石層判別は不可欠である。
    • 検層データの解釈は,掘削条件や岩石の複雑な組成変化により困難を伴う。
    • 機械学習を用いて,既存の検層データからより正確な岩石層判別を行う。
    • 決定木と勾配ブースティングモデルが,それぞれ0.9950の精度と0.9951のF1スコアを達成した。
    • 教師あり機械学習と教師なし機械学習の組み合わせが,岩石層のクラスタリングを可能にした。
    • 本研究で開発された手法は,世界中の海洋における検層データ解析への応用が期待される。

    Link: https://arxiv.org/abs/2512.13529

  • 複数コンピューター実験の同時等高線探索 [stat.ME, cs.LG]目的:複数独立コンピューター実験における,指定された応答値を同時に返す入力設定の特定
    • シミュレーション等のコンピューター実験は,現実世界の複雑な現象を解明するための重要な手法である。
    • 複数の実験結果を同時に満たす条件を効率的に探索することは困難である。
    • 複数の応答面を考慮し,交差する等高線を効率的に探索する手法を開発する。
    • 提案手法であるjCLは,既存の等高線探索戦略と比較して,性能が著しく向上することが示された。
    • jCLは,複数の応答曲面を探求しつつ,交差する等高線の学習を活用することで,効率的な探索を実現する。
    • 本研究は,航空機における安定飛行条件の特定という動機づけに基づき,その有効性を検証した。

    Link: https://arxiv.org/abs/2512.13530

  • 流体安定性における適応サンプリング [physics.flu-dyn, cs.LG]目的:パラメータ化された流体流れ問題における分岐境界の効率的な検出
    • 流体流れの安定性は,航空宇宙,エネルギー,環境など,多様な工学分野において重要な課題である。
    • 従来の分岐境界の特定には,膨大な計算コストがかかり,高次元問題への適用が困難である。
    • 本研究では,機械学習と深層生成モデルを組み合わせることで,分岐境界の特定に必要なシミュレーション数を削減することを目指す。
    • 提案手法は,分岐確率を予測する分類ネットワークと,高エントロピー領域にサンプリングを集中させるKRnetを組み合わせる。
    • 分類ネットワークの出力のエントロピーを不確実性の指標として用い,KRnetの学習を誘導することで,効率的な適応サンプリングを実現する。
    • 均一分布から開始した場合,提案手法は少ないNavier-Stokesシミュレーションで正確な分岐境界を特定し,高次元安定性解析の基盤となる。

    Link: https://arxiv.org/abs/2512.13532

  • 深層ニューラルネットワークにおける特徴選択への非パラメトリック統計的アプローチ:理論的保証付き [stat.ML, cs.LG]目的:深層ニューラルネットワークにおける特徴選択
    • 機械学習において,特徴選択はモデルの性能向上と解釈可能性を高める上で重要である。
    • 高次元データにおいては,適切な特徴を選択することが困難であり,過学習や計算コストの増加を招く。
    • 本研究は,理論的な保証に基づいた効率的な特徴選択手法を提案し,高次元データへの適用を目指す。
    • 本研究では,深層ニューラルネットワークをインデックスモデルとして再構成し,Steinの公式を利用することで,勾配降下法を必要としない特徴選択を実現した。
    • サンプルサイズが$n = \Omega(p^2)$で,特徴選択の一貫性が保証されることが示された($p$は特徴量の次元)。
    • 高次元データに対しては,$n = \Omega(s \log p)$($s$はスパース性レベル)で非線形選択の一貫性を達成するスクリーニングと選択のメカニズムを導入した。

    Link: https://arxiv.org/abs/2512.13565

  • 確率的勾配降下法の高次元スケーリング限界の普遍性 [stat.ML, cs.LG, math.PR, math.ST, stat.TH]目的:高次元における確率的勾配降下法のスケーリング限界
    • 機械学習において,高次元データは一般的であり,その学習効率が重要である。
    • 高次元データにおける学習は,次元の呪いなどにより困難になりやすい。
    • 特定の条件下で,確率的勾配降下法の挙動が普遍的に収束することを示す。
    • データが等方性ガウス混合分布に従う場合,確率的勾配降下法の統計量の進化は,次元とサンプルサイズが無限大に近づくにつれて,自律的な常微分方程式(ODE)に収束する。
    • 本研究では,データが積測度の混合分布であっても,最初の2モーメントが対応するガウス分布と一致し,初期化ベクトルと真のベクトルが十分に座標的に分散していれば,同様の収束が起こることを示した。
    • 初期化ベクトルが座標に整列している場合など,ODEの限界が普遍的でない例も示した。

    Link: https://arxiv.org/abs/2512.13634

  • 密度推定における最適近似係数 [cs.LG, cs.CC, cs.IT, math.IT, math.PR, stat.ML]目的:密度推定における近似の最適性
    • 統計的推論や機械学習において,確率分布の近似は重要な課題である。
    • 未知の分布に対する近似分布の選択は,一般に困難を伴う。
    • 近似係数の理論的限界を明らかにし,最適な近似手法を開発すること。
    • ヤトラコスによる先行研究では,近似係数3が達成可能であることが示されている。
    • 本研究では,近似候補集合からの出力に限定する場合,係数3が最適であることを証明した。
    • 任意の密度を出力可能とする場合,係数を2に改善でき,これが最適であるを示した。

    Link: https://arxiv.org/abs/1902.05876

  • 需要学習における適応的リスク軽減 [cs.LG, cs.IR]目的:未知の需要分布を持つ製品の有限期間にわたる動的価格設定
    • 小売業における価格設定は,収益に直結するため,効率的な価格決定手法が重要である。
    • 需要モデルの曖昧性や顧客到着パターンの不確実性から,収益損失のリスクが高まる場合がある。
    • 顧客到着パターンに適応するデータ駆動型曖昧性集合を用いて,収益損失のリスクを軽減する。
    • 提案手法は,データに基づいて需要モデルの曖昧性集合を適応的に縮小し,リスクを低減する。
    • 顧客到着パターンに依存する後悔の限界が確立され,モデル特定に必要なデータと収益損失の関連性が明確になった。
    • 価格変更の制約を緩和した場合,既知の後悔の限界に到達し,既存手法よりも優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2011.10690

  • CSAW-M:乳がんマスキングのベンチマーキングのための順序分類データセット [cs.CV, cs.LG]目的:乳がんマスキングのベンチマーキング用データセット
    • 乳がん検診では,間隔性癌や大型浸潤癌の早期発見が重要である。
    • 検診マンモグラフィでは,腫瘍が周囲組織に隠れて見逃されるマスキングが課題である。
    • 本研究は,マスキングの潜在的な可能性を直接評価するデータセットを提供する。
    • CSAW-Mは,1万人以上のデータを含む最大の公開データセットである。
    • マスキングの推定レベルは,乳房密度よりも間隔性癌や大型浸潤癌の診断予測に優れていた。
    • 専門家によるマスキングの潜在的評価を直接的にアノテーションとして提供している。

    Link: https://arxiv.org/abs/2112.01330

  • Transformerとグラフニューラルネットワークを用いた論理合成における結果品質の予測 [cs.DM, math.CO, cs.AR, cs.LG]目的:論理合成における結果品質の予測
    • 論理合成は,回路設計において重要な工程であり,性能や面積を最適化する上で不可欠である。
    • 最適化シーケンスの実行に時間がかかり,高品質な回路設計の迅速な探索が課題となっている。
    • 最適化シーケンスと回路の組み合わせに対する結果品質を予測し,効率的な設計を支援すること。
    • Transformerとグラフニューラルネットワークを組み合わせることで,未知の回路・最適化シーケンスペアに対する結果品質の予測が可能となった。
    • 特に,TransformerとGraphSageの組み合わせが最も優れた結果を示し,平均絶対誤差(MAE)は0.412であった。
    • この手法は,回路設計プロセスの効率化に貢献することが期待される。

    Link: https://arxiv.org/abs/2207.11437

  • 効率的なオンライン広告のための垂直半連合学習 [cs.LG, cs.IR]目的:オンライン広告における垂直半連合学習の効率化
    • データプライバシー保護の重要性が高まる中,データ分散環境での学習ニーズが増加している。
    • 従来の垂直連合学習は,サンプル重複の制約やリアルタイム配信のシステム負荷が大きいという課題がある。
    • 本研究は,独立したローカル配信を可能にしつつ,連合学習の利点を維持する新しい学習設定を目指す。
    • 提案手法であるJoint Privileged Learning (JPL)フレームワークは,一方の参加者の特徴量不足を克服し,異質なサンプル空間に適応する。
    • 実際の広告データセットを用いた実験により,提案手法が既存手法を上回る有効性が確認された。
    • 本研究は,実用的な垂直半連合学習(Semi-VFL)の実現可能性を示し,広告システムへの応用を促進する。

    Link: https://arxiv.org/abs/2209.15635

  • ロボット操作における解釈性とインタラクティブ性の向上:ニューロシンボリックアプローチ [cs.RO, cs.AI, cs.HC]目的:言語誘導による視覚的推論とロボット操作の結合のためのニューロシンボリックアーキテクチャ
    • ロボットの自律性は重要であり,人間との自然な対話を通じてタスクを遂行できる能力が求められている。
    • 従来のロボット制御は,特定の環境やタスクに依存し,汎用性や柔軟性に欠けるという課題があった。
    • 本研究は,ニューロシンボリックアプローチを用いて,ロボットの解釈性とインタラクティブ性を向上させることを目指す。
    • 提案手法は,視覚的属性の推論,空間関係の理解,論理的思考など,様々な基本スキルを組み合わせることで,タスクに依存しない汎用的な操作を実現した。
    • 合成データセットおよび実環境での評価により,提案手法の精度,サンプル効率,ユーザーの語彙へのロバスト性が確認された。
    • インタラクティブな物体選択タスクにおいて,シミュレーションおよび実ロボット環境で平均80.2%の成功率を達成し,解釈可能なソリューションとしての有効性が示された。

    Link: https://arxiv.org/abs/2210.00858

  • 物理情報ニューラルネットワークによる動的線形弾性体のモデリング [cs.IR, cs.IR, cs.HC, cs.NE]目的:動的線形弾性体のモデリング
    • 固体力学は,構造物の設計や破壊解析において不可欠な分野である。
    • 従来の数値解析では,計算コストが高く,逆問題解決が困難な場合がある。
    • 物理情報ニューラルネットワークを用いて,効率的な材料同定を目指す。
    • 提案手法は,有限要素法による解を訓練データとして利用し,精度とロバスト性を実証した。
    • 特に,材料同定問題における代理モデルとして,計算効率の高さを示した。
    • 本研究で開発したフレームワークは,様々な動的固体力学問題へ容易に適用可能である。

    Link: https://arxiv.org/abs/2312.15175

  • 複雑なリレーショナルスキーマを持つモジュール式リレーショナルデータベース生成手法 [cs.DB, cs.LG]目的:複雑なリレーショナルスキーマに対応するモジュール式リレーショナルデータベース生成フレームワーク
    • 企業や政府で広く利用されるリレーショナルデータベースは,データ共有や分析に不可欠である。
    • プライバシー保護のため,リレーショナルスキーマの複雑さを考慮した合成データ生成が困難である。
    • 複合キーやテーブル間の間接的な関係など,現実世界の複雑なスキーマに対応する。
    • 提案手法IRGは,既存手法が対応できない10種類の現実世界のデータベースで,リレーショナルスキーマとデータ関係を捉えることに成功した。
    • 生成された合成データは,分析タスクやデータマイニングアプリケーションにおける代替データとしての有用性が高いことが示された。
    • IRGは,テーブル間の関係を学習し,複雑なキー制約とデータ相関を維持するためのモジュールで構成されている。

    Link: https://arxiv.org/abs/2312.15187

  • 拡散生成モデリングによるプラグアンドプレイ3D人体姿勢分析:PADS [cs.CV, cs.AI]目的:3D人体姿勢分析のための拡散生成モデリングフレームワーク
    • 3D人体姿勢分析は,ロボティクス,VR/AR,モーションキャプチャ等,幅広い応用分野で重要である。
    • 既存手法は,タスクごとに教師データが必要であり,汎用性に欠けるという課題があった。
    • 本研究は,タスク固有の教師データや再学習なしに,様々な姿勢分析タスクに対応できる汎用的な手法を提案する。
    • 提案手法PADSは,まずタスクに依存しない3D姿勢の事前分布を拡散生成モデリングにより学習する。
    • 次に,事後サンプリングスキームを用いて,様々な姿勢分析タスクへの訓練不要の適応を実現する。
    • 実験結果から,PADSは既存手法と比較して優れた性能と汎化能力を示すことが確認された。

    Link: https://arxiv.org/abs/2401.08930

  • 「私の全て」:公開されたSpotifyプレイリストからユーザー属性を抽出する [cs.CL, cs.CR, cs.LG, cs.SI]目的:ユーザー属性の推論
    • 音楽ストリーミングサービス利用の拡大に伴い,プレイリストが個人の音楽体験において重要な役割を担うようになった。
    • プレイリストの内容から,個人の属性を推測する研究は,プライバシー保護の観点から課題が多い。
    • 公開プレイリストを用いて,ユーザーの属性を高精度に予測するモデル構築を目指す。
    • Spotifyユーザー739人から収集した10,286の公開プレイリストを分析した結果,楽曲情報から属性予測が可能であることが示された。
    • 統計分析と機械学習アルゴリズムを組み合わせることで,ユーザー属性の予測精度を向上させた。
    • 本研究は,プレイリストがユーザーの自己表現の場であると同時に,個人情報を含む可能性を示唆する。

    Link: https://arxiv.org/abs/2401.14296

  • 推薦システムのための自己教師あり学習に関する包括的調査 [cs.IR, cs.AI]目的:推薦システムにおける自己教師あり学習の枠組みに関する包括的なレビュー
    • 情報過多への対策として,個々のユーザーの好みに基づく推薦は不可欠である。
    • 教師あり学習はデータスパースネスに起因する表現学習の限界を抱えている。
    • 自己教師あり学習は,ラベル付きデータに依存せず,データ内の構造を活用して学習を行う。
    • 本調査では,170以上の論文を分析し,推薦システムのための自己教師あり学習フレームワークを包括的にレビューした。
    • 9つの異なるシナリオを調査し,様々な文脈におけるSSLを活用した推薦システムの理解を深めた。
    • コントラスト学習,生成学習,敵対的学習といった自己教師あり学習パラダイムの詳細を各ドメインで解説した。

    Link: https://arxiv.org/abs/2404.03354

  • CCTV映像における逆走自転車の高速検出:疎なサンプリングだけで十分 [cs.CC, cs.FL, cs.CV, cs.AI]目的:逆走自転車の割合の効率的な推定
    • 交通状況の最適化や法執行の展開において,異常な交通行動の監視は重要である。
    • 全ての逆走自転車を正確に記録するには,高解像度カメラとイベント検出が必要であり,リソース制約となる。
    • 疎なフレームで逆走自転車を検出し,自己回帰移動平均モデルで全体的な割合を推定すること。
    • 提案手法WWC-Predictorは,従来の追跡手法と比較して19.12%のGPU時間を消費するだけで,平均誤差率1.475%を達成した。
    • 分単位のアノテーションが付与された35分間の動画データセットを用いて,手法の有効性を評価した。
    • 疎なフレームでの逆走自転車検出と,それを用いた割合推定により,効率的な推定を実現した。

    Link: https://arxiv.org/abs/2405.07293

  • ノード摂動に対するグラフ畳み込みネットワークのロバスト性の多面体抽象解釈による検証 [cs.LG, cs.FL]目的:ノード摂動に対するグラフ畳み込みネットワークのロバスト性検証
    • グラフ構造データは多様な分野で利用され,その応用範囲は広範である。
    • 入力グラフの微小な摂動に対して脆弱であり,安全性が重要なアプリケーションでの利用が課題である。
    • 多面体抽象解釈を用いてロバスト性の厳密な上限・下限を算出し,実用的な検証手法を確立する。
    • 提案手法は,ロバスト性限界の精度向上と検証の実行時間改善を両立している。
    • 本手法は,GCNの学習過程においてもロバスト性を向上させるために活用できる。

    Link: https://arxiv.org/abs/2405.08645

  • 時間的グラフリンク予測のための効率的なニューラル共通隣接ノード [cs.MA, cs.SI, cs.LG, cs.AI, cs.SI]目的:時間的グラフにおける動的なリンク予測
    • ソーシャルネットワーク等,現実世界の様々なネットワーク分析において重要である。
    • 既存手法は計算コストが高く,大規模データセットへの適用が困難である。
    • 計算効率と表現力を両立した,大規模時間的グラフ向けリンク予測モデルを開発する。
    • 提案手法TNCNは,ペアワイズモデリングの原理を効率的な時間的アーキテクチャに適用することで,高い性能を発揮する。
    • TGBデータセットにおいて,転移学習と帰納学習の両方で最先端の性能を達成した。
    • 大規模データセットにおいて,既存のGNNベースラインと比較して最大30.3倍の高速化を実現した。

    Link: https://arxiv.org/abs/2406.07926

  • ニューラル確率的Volterra方程式:経路依存ダイナミクスの学習 [cs.LG, math.PR, stat.ML]目的:経路依存ダイナミクスの学習
    • 複雑な時間発展を捉える必要性から,記憶効果を持つ確率的モデルが重要視されている。
    • 既存のモデルでは,高次元データや複雑な非線形性への対応が課題となっていた。
    • ニューラルネットワークを用いて,複雑な確率的Volterra方程式を効率的に学習することを試みる。
    • ニューラル確率的Volterra方程式は,従来のニューラル確率的微分方程式やDeepONetと比較して良好な性能を示した。
    • 擾乱された振り子方程式,一般化されたOrnstein-Uhlenbeck過程,粗いHestonモデルなど,様々なSVEsで有効性が確認された。
    • 本研究は,物理に基づいたニューラルネットワークアーキテクチャの可能性を示す。

    Link: https://arxiv.org/abs/2407.19557

  • 確率的微分方程式による完全ベイズ型微分ガウス過程 [cs.LG, cs.AI]目的:カーネルハイパーパラメータの確率的推論
    • ガウス過程モデルは不確実性の定量化に優れ,様々な分野で活用されている。
    • 従来の微分ガウス過程では,カーネルハイパーパラメータが固定されている点が課題である。
    • カーネルハイパーパラメータを確率変数として扱うことで,モデルの柔軟性を向上させる。
    • 本研究では,結合された確率的微分方程式を用いて,カーネルハイパーパラメータと帰納点の事後分布を同時に学習する。
    • ハイパーパラメータの推定不確実性を考慮することで,モデルの表現力と複雑な動的システムへの適応性を高める。
    • 実験結果から,提案手法は従来のモデルよりも柔軟性,精度,パフォーマンス指標において優れていることが示された。

    Link: https://arxiv.org/abs/2408.06069

  • 動的な不正検知:強化学習をグラフニューラルネットワークに統合 [cs.LG, cs.SI]目的:金融不正検知における手法
    • 金融市場の秩序維持と経済・社会発展の保護に不可欠な研究分野である。
    • 不正取引は稀であり,ラベルの不均衡が大きな課題となっている。
    • 時間とともに変化する不正パターンへの対応と,ノード情報と隣接ノード情報のバランス改善を目指す。
    • 強化学習をグラフニューラルネットワークに組み込むことで,ラベルの不均衡問題への対応を可能にした。
    • 中央ノードの重要性を保ちつつ,隣接ノードからの情報を効果的に統合できるモデルを提案した。
    • グラフ構造の動的な変化を考慮することで,時間とともに変化する不正パターンへの適応性を高めた。

    Link: https://arxiv.org/abs/2409.09892

  • OM4OV:オントロジーマッチングを活用したオントロジーバージョン管理 [cs.AI, cs.CL, cs.IR]目的:オントロジーバージョン管理におけるオントロジーマッチングの活用
    • セマンティックウェブの発展に伴い,オントロジーの経時的な変化を管理する重要性が高まっている。
    • オントロジーバージョン管理は重要視される一方,既存のマッチング技術の単純な適用では課題が生じている。
    • オントロジーマッチング技術を効率的にオントロジーバージョン管理に適用するための手法を確立する。
    • オントロジーマッチングシステムは,適切な修正を加えることでオントロジーバージョン管理に再利用可能である。
    • 既存のOM4OVパイプラインは,偏った測定,更新エンティティの検出性能の低下,説明可能性の低下といった問題点がある。
    • クロスリファレンス(CR)機構を提案することで,候補数の削減とオントロジーバージョン管理性能の向上を実現した。

    Link: https://arxiv.org/abs/2409.20302

  • 構造化状態空間モデルの暗黙的バイアスは,クリーンラベルによって汚染される可能性がある [cs.LG, stat.ML]目的:構造化状態空間モデルの暗黙的バイアスに対するクリーンラベルによる汚染現象の解明
    • 近年の深層学習モデルにおいて,汎化性能の向上が重要な課題となっている。
    • 構造化状態空間モデルはTransformerの代替として注目されているが,その暗黙的バイアスに関する理解は不十分である。
    • クリーンラベルによる汚染に対する構造化状態空間モデルの脆弱性を明らかにし,対策を検討する必要がある。
    • 本研究では,構造化状態空間モデルの暗黙的バイアスが,教師データによって正しくラベル付けされたデータを含む場合でも,汎化性能を損なう可能性があることを理論的に証明した。
    • 特定の訓練データの追加が暗黙的バイアスを歪め,結果として汎化が失敗する現象が確認された。
    • この現象は,敵対的機械学習におけるクリーンラベルによる汚染と関連しており,構造化状態空間モデルの安全性を考慮する上で重要な知見を提供する。

    Link: https://arxiv.org/abs/2410.10473

  • ニューラル崩壊を用いたトロイアン攻撃の浄化 [cs.CG, cs.LG, cs.CR]目的:トロイアン攻撃の浄化機構
    • 深層学習モデルは広く利用され,セキュリティリスクが重要課題となっている。
    • 学習段階でのトロイアン攻撃は検知が難しく,深刻な脅威となりうる。
    • ニューラル崩壊の歪みを検出し,攻撃を受けたモデルを浄化すること。
    • トロイアン攻撃は,ニューラル崩壊の収束を阻害することが実験的に示された。
    • この収束の阻害を利用し,軽量で汎用性の高い浄化機構を設計した。
    • 様々なネットワーク構造に対し,本機構によるトロイアン攻撃の浄化が有効であることが確認された。

    Link: https://arxiv.org/abs/2411.12914

  • 剪定から接ぎ木へ:学習可能な層融合による動的知識再分配 [cs.LG, cs.AI, cs.CL]目的:生成事前学習トランスフォーマーの効率的な圧縮
    • 大規模言語モデルの計算コストが高く,実用上の制約となっている。
    • 構造化プルーニングは性能劣化を引き起こしやすく,効果的な圧縮が困難である。
    • プルーニングにおける知識の損失を最小限に抑え,性能を維持しつつ圧縮を実現する。
    • FuseGPTは,既存手法と比較して,より高い圧縮率で同等以上の性能を実現した。
    • 25%のスパース率において,FuseGPTはperplexityの低減と,ゼロショット推論能力の向上を達成した。
    • FuseGPTは,4ビットGPTQとの組み合わせにより,52.1%の圧縮率を実現し,品質劣化は軽微であった。

    Link: https://arxiv.org/abs/2411.14507

  • QUOTA:テキスト-画像モデルによる対象物数推定の定量化 - 任意のドメインにおいて [cs.CV, cs.LG]目的:テキスト-画像モデルによる対象物数推定の定量化
    • 画像認識技術は,自動運転やロボット工学など,様々な分野で不可欠な技術である。
    • 既存手法では,ドメインごとにモデルを再学習する必要があり,計算コストが高い。
    • ドメインに依存しない汎用的な手法により,効率的な対象物数推定を実現する。
    • QUOTAは,再学習なしで未知のドメインにおける対象物数推定を可能にする最適化フレームワークである。
    • 二重ループメタ学習戦略とプロンプト学習を組み合わせることで,ドメイン不変なプロンプトを最適化する。
    • 新しいベンチマークを用いて評価した結果,QUOTAは既存モデルを精度と整合性で上回った。

    Link: https://arxiv.org/abs/2411.19534

  • KNN-MMD:局所分布アラインメントによるクロスドメインワイヤレスセンシング [cs.CV, cs.AI, eess.SP]目的:クロスドメインワイヤレスセンシングのための新しい手法
    • ワイヤレスセンシングは,様々な環境での応用が広がっており,人々の活動認識に貢献している。
    • 環境変化に敏感なCSIのため,環境が変わると性能が低下しやすいという課題がある。
    • カテゴリ間の関係性を考慮した局所的な分布アラインメントにより,クロスドメイン性能を向上させる。
    • 提案手法KNN-MMDは,ターゲットドメインのKNNを用いてヘルプセットを構築し,カテゴリごとの局所アラインメントを実現する。
    • 既存手法で問題となる性能の不安定性を抑制し,最適な学習停止基準を設けることで安定した性能を実現した。
    • ターゲットドメインのサポートセットを検証セットとして利用することで,ラベルなしデータでも学習停止を判断可能とした。

    Link: https://arxiv.org/abs/2412.04783

  • マジック集合を用いたDatalogMTLにおける目標駆動型推論 [cs.DL, cs.AI]目的:DatalogMTLにおける目標駆動型推論手法
    • 時間的推論は,産業界や金融分野など多様な応用において重要である。
    • DatalogMTLは表現力が高くとも計算複雑性が高く,実用的な推論が困難である。
    • DatalogMTLの推論効率を改善し,実用性を高めることを目指す。
    • 提案手法は,既存の最先端の推論技術と比較して,一貫して優れた性能を示した。
    • マジック集合を用いることで,トップダウン評価をボトムアップ推論で効率的にシミュレートした。
    • 公開されているベンチマークを用いて実装と評価を行い,有効性を確認した。

    Link: https://arxiv.org/abs/2412.07259

  • 敵対的ロバストネスに基づくエッジ重み付けによる協調フィルタリング推薦システムの防御 [cs.LG, stat.ML]目的:協調フィルタリング推薦システムに対する防御手法
    • 推薦システムは情報過多な現代において,ユーザーに最適な情報を提供する上で不可欠である。
    • 協調フィルタリングは,プロファイルインジェクション攻撃に対して脆弱であり,推薦結果が操作される可能性がある。
    • エッジの重み付けを通じて,攻撃に対するシステムのロバスト性を向上させることを目指す。
    • 提案手法では,スペクトル敵対的ロバストネス評価を用いて各ユーザー間エッジのロバストネススコアを算出し,脆弱なエッジの影響を軽減する。
    • 実験の結果,提案手法は様々な攻撃に対して有効であることが示された。
    • エッジの重み付けによる防御は,協調フィルタリング推薦システムの信頼性を高める。

    Link: https://arxiv.org/abs/2412.10850

  • AIを活用した若者のプライバシーに関する懸念の解明:詳細な探索と体系的レビュー [cs.CY, cs.LG]目的:若者のデジタル市民が人工知能(AI)システムにおけるプライバシーに関して抱く認識,懸念,期待
    • デジタル技術の進展に伴い,若者のAI利用は増加しており,プライバシー保護の重要性が高まっている。
    • AIシステムのデータ収集・利用方法の不透明さ,プライバシー侵害のリスクが指摘されている。
    • 若者のAI利用におけるプライバシーに関する懸念を明らかにし,プライバシー保護策の提言を目指す。
    • 若年層のAIに対するプライバシー懸念は大きく,個人情報のコントロール不足やデータ不正利用への恐れが示された。
    • データ共有の意向は,期待される利益とデータ保護の保証に強く関連していることが明らかになった。
    • AIの透明性,信頼性,予測可能性が,若者のAIに対する信頼に大きく影響することが示唆された。

    Link: https://arxiv.org/abs/2412.16369

  • 非線形保存則の長期的予測のためのニューラル平衡 [cs.LG, physics.comp-ph, physics.flu-dyn]目的:非線形保存則の長期的予測のための機械学習フレームワーク
    • 流体シミュレーションは,気象予測や材料科学など幅広い分野で不可欠である。
    • 従来の数値解法は計算コストが高く,複雑な現象の長期的予測が困難である。
    • ニューラルネットワークを用いて効率的かつ高精度な長期的予測手法を開発すること。
    • NeurDEは,物理学,数値解法,機械学習を統合した新しいパラダイムを確立した。
    • 少量のデータで学習したニューラルネットワークが,訓練範囲外の衝撃波の進化を高精度に予測可能である。
    • NeurDEは,高価な根の探索や大規模な速度格子を必要とせず,スケーラブルで効率的なシミュレーションを実現する。

    Link: https://arxiv.org/abs/2501.06933

  • ロボットワールドモデル:ロボットの頑健な方策最適化のためのニューラルネットワークシミュレータ [cs.RO, cs.AI, cs.LG]目的:ロボット制御における頑健な方策最適化
    • 現実世界でのロボット活用には,環境を正確に予測する能力が不可欠である。
    • 従来のワールドモデルは,長期的予測や現実世界への適応に課題を抱えている。
    • 複雑な環境下での予測精度向上と,シミュレーションから現実世界への転移を容易にすること。
    • 提案手法は,自己教師あり学習と二重自己回帰メカニズムにより,ドメイン固有の知識に依存せず,信頼性の高い長期的予測を可能にする。
    • モデルベースの強化学習における,長期的予測の困難さ,誤差の蓄積,そしてシミュレーションから現実世界への転移の問題に対処する。
    • 本研究は,適応的かつ効率的なロボットシステムの開発に向けたスケーラブルで頑健なフレームワークを提供する。

    Link: https://arxiv.org/abs/2501.10100

  • 条件付き拡散モデルによる意思決定における状態の組合せの一般化 [cs.LG]目的:意思決定における状態の組合せの一般化
    • 実世界の問題は組合せ的なものが多く,効率的な学習が重要である。
    • 訓練データで全ての状態の組合せを網羅することは不可能である。
    • 未学習の状態組合せに対する汎化性能の向上を目指す。
    • 条件付き拡散モデルを用いた行動模倣は,従来の強化学習手法よりも,未見の状態組合せに対して優れた汎化性能を示す。
    • 従来の強化学習は,未知の状態における信頼性の低い価値予測が課題となる。
    • 迷路,運転,マルチエージェント環境など,様々な環境で有効性が確認された。

    Link: https://arxiv.org/abs/2501.13241

  • ベンチマークを超えて:AI規制の誤った約束について [cs.LG, cs.AI, cs.CL]目的:AI規制の現状に対する問題提起と新たな規制フレームワークの提案
    • AI技術の社会実装が進む中で,安全性確保は喫緊の課題である。
    • AIモデルの安全性評価がベンチマークに依存しており,実世界での性能を反映していない。
    • ベンチマークに頼らない,現実的かつ利用可能な規制フレームワークを確立すること。
    • 既存のAI規制は,ベンチマークの性能に依存するため,実世界での有害な影響を軽減できない。
    • AIの解釈可能性の課題が規制において軽視されており,そのことが問題の根底にある。
    • 新たな規制フレームワークを提案し,学際的な協力による問題解決を呼びかけている。

    Link: https://arxiv.org/abs/2501.15693

  • 二重最適化ZOFO:効率的なLLMのファインチューニングとメタ学習 [cs.LG]目的:大規模言語モデルの効率的なファインチューニングとメタ学習手法
    • 大規模言語モデルは自然言語処理の様々なタスクで高い性能を示すが,計算コストが大きい。
    • ファインチューニングは計算資源を要し,特に大規模モデルでは困難な場合がある。
    • 計算効率を維持しつつ,ファインチューニングの精度を向上させる手法が求められている。
    • Bilevel-ZOFOは,高速な局所適応と安定した全モデル更新を組み合わせることで,既存手法を凌駕する性能を示す。
    • 従来のZOおよびFO-PEFT手法と比較して,学習速度が2〜4倍向上し,同程度のメモリ効率を維持する。
    • 全モデルの能力とFew-shot効率を両立し,新しいタスクへの迅速な適応を可能にするメタ学習アルゴリズムである。

    Link: https://arxiv.org/abs/2502.03604

  • 特徴エンジニアリングによる物理情報ニューラルネットワークの性能向上 [cs.LG]目的:物理現象を記述する偏微分方程式の求解
    • 科学技術計算において,複雑な物理現象のシミュレーションは不可欠であり,高精度かつ高速な求解手法が求められる。
    • 従来の物理情報ニューラルネットワークは,学習に時間がかかり,十分な精度を得ることが難しい場合がある。
    • 特徴エンジニアリングを活用し,少ないパラメータで高精度かつ高速な求解を実現すること。
    • 本研究で提案するSAFE-NETは,既存の特徴エンジニアリング手法と比較して,桁違いに低い誤差と少ないパラメータ数で高い性能を示す。
    • SAFE-NETは,フーリエ特徴やシンプルな単層ネットワーク構造,効果的な最適化アルゴリズムを用いることで,学習の収束を早め,より深いネットワークや複雑なアーキテクチャを上回る。
    • 学習に必要なパラメータ数は平均して65%少なく,学習エポック数も30%以下で済む。また,各エポックの計算時間も95%高速である。

    Link: https://arxiv.org/abs/2502.07209

  • チャネル依存性,限られた見返し期間,およびデータセットの単純性:時系列予測はどの程度偏っているか [cs.LG]目的:時系列予測における予測の公平性確保のための見返し期間のチューニング
    • 時系列予測は,需要予測や株価予測など,幅広い分野で重要な役割を果たす。
    • 見返し期間の設定が任意になりやすく,モデル評価の妥当性が損なわれる問題がある。
    • 適切な見返し期間のチューニングと,データセットの特性に応じたモデル選択の重要性を示す。
    • 見返し期間のチューニングを怠ると,モデルの性能ランキングが逆転する可能性がある。
    • 特定のデータセットでは,チャネル非依存モデル(PatchTST等)が優れているように見えるが,これはチャネル間相関の弱さとパターン単純性の結果である。
    • チャネル依存モデルは,強いチャネル間依存性を持つデータセットにおいて,チャネル非依存モデルを大きく上回る性能を示す。

    Link: https://arxiv.org/abs/2502.09683

  • 米の分類と品質評価のための全体リアルタイム機構 [cs.RO, cs.CV, cs.AI]目的:米の品種と特徴に基づく分類と品質評価
    • 米は世界中で広く栽培されており,食糧安全保障において重要な役割を担っている。
    • 従来,品質評価は熟練した目視検査に頼っており,時間と労力がかかる上に,主観的な誤差が生じやすい。
    • 機械視覚技術を活用し,米の品質評価を自動化することで,精度と効率を向上させる。
    • 提案手法は,オブジェクト検出において99.14%のmAPを達成し,高い検出精度を示した。
    • 分類タスクにおいては,97.89%の精度を達成し,品種識別能力の高さを示した。
    • 同じ品種内での整粒度評価では,平均97.56%の精度を達成し,効果的な品質評価システムに貢献する。

    Link: https://arxiv.org/abs/2502.13764

  • 進化するデータストリームに対する表形式ファウンデーションモデルのインコンテキスト学習 [cs.CL, cs.LG, cs.AI]目的:進化するデータストリームにおけるインコンテキスト学習の可能性
    • データストリームマイニングは,変化するデータに対応する必要があり,その重要性は増している。
    • 従来のアンサンブル学習は計算コストが高く,新しいデータへの迅速な適応が課題である。
    • 表形式のファウンデーションモデルを活用し,リアルタイムでのモデル適応を実現することを目的とする。
    • TabPFNとスライディングメモリ戦略の組み合わせが,非定常ベンチマークにおいてHoeffdingツリーアンサンブルを上回る性能を示した。
    • Transformerの暗黙的なメタ学習能力とコンテキスト最適化が,動的な環境における適応学習の課題に直接対処できることが示された。
    • データストリームの要約にオンザフライのスケッチを用いることで,効率的な処理が可能となることが示唆された。

    Link: https://arxiv.org/abs/2502.16840

  • 正確な3D多房心臓メッシュ再構築のための関係解剖学的教師あり学習 [cs.CV, cs.AI]目的:多房心臓解剖学の正確な再構築
    • 患者個別モデリング,生理学的シミュレーション,介入計画において,正確な心臓解剖学の再構築は不可欠である。
    • 既存手法は表面ごとの幾何学的教師あり学習に依存し,各房を独立にモデル化するため,解剖学的に妥当でない房間の侵入が発生しやすい。
    • 本研究は,房間の空間的関係を明示的に考慮した関係解剖学的教師あり学習により,この問題を解決することを目指す。
    • 提案手法では,Mesh Interrelation Enhancement (MIE) lossを導入し,占有率ベースの目的関数を用いて房間の関係を定量的に教師あり学習に組み込んだ。
    • 複数のCTおよびMRデータセットを用いた実験により,提案手法は臨床的に重要な境界侵入を最大83%まで抑制できることが示された。
    • 距離ベースの評価指標だけでは十分な解剖学的正確性を保証できず,房間の関係を明示的に考慮することが重要であることが明らかになった。

    Link: https://arxiv.org/abs/2503.07874

  • 多孔質媒体における反応溶解予測のための深層学習反復スタックアプローチ [cs.LG]目的:多孔質媒体における反応溶解予測
    • 地下資源開発や二酸化炭素貯留など,地表下の現象を理解する上で重要である。
    • 従来の数値シミュレーションは計算コストが高く,効率的な代替手法が求められている。
    • 深層学習を用いて,反応溶解過程の将来状態を高速かつ高精度に予測することを試みる。
    • 本研究で提案する深層学習アプローチは,時間的・空間的情報を組み合わせて予測精度を向上させた。
    • 従来の数値シミュレーターと比較して,約10^4倍の高速化を実現した。
    • 既存の最先端手法に対する予測結果の比較においても,高い性能を示した。

    Link: https://arxiv.org/abs/2503.08410

  • SpurLens:マルチモーダルLLMにおける誤った手がかりの自動検出 [cs.CV, cs.CL, cs.LG]目的:マルチモーダルLLMにおける誤った視覚的手がかりの特定
    • LLMの信頼性向上は重要である。誤った手がかりへの依存は,LLMの性能を著しく低下させるため。
    • 従来の視覚モデルは誤った相関に依存しやすい。LLMが言語による監督下でも同様のバイアスを示すかは不明であった。
    • LLMにおける誤った手がかりを自動的に検出し,その影響を定量化することで,より堅牢なモデル開発を目指す。
    • SpurLensはGPT-4とオブジェクト検出器を活用し,人間の監督なしに誤った視覚的手がかりを特定するパイプラインである。
    • 誤った相関により,LLMはオブジェクト認識において誤った手がかりに過度に依存し,幻覚を増幅することが明らかになった。
    • プロンプトアンサンブルや推論に基づくプロンプティングなどの緩和策を検討し,誤ったバイアスの根本原因を調査した。

    Link: https://arxiv.org/abs/2503.08884