arXiv雑要約

AI - 2026/03/24 公開

  • 特徴増分クラスタリングと一般化限界 [math.ST, cs.LG, stat.TH]目的:特徴増分型データストリームに対する効果的なクラスタリングアルゴリズムの設計
    • 活動認識システムなど,多様な環境下での学習システムにおいて,データ属性が徐々に増加する場面が多い。
    • 特徴が徐々に増加するデータストリームに対する理論的保証を持つクラスタリングアルゴリズムは未開拓である。
    • データへのアクセス状況に応じた特徴増分クラスタリングアルゴリズムを提案し,その一般化性能を評価する。
    • 提案する4種類のFICアルゴリズム(FT, DR, DA, MR)は,特徴増分クラスタリングの問題に有効に対応可能である。
    • これらのアルゴリズムの一般化誤差限界を詳細に分析し,学習データ量,仮説空間の複雑さ,事前学習モデルの質などが影響することを明らかにした。
    • 数値実験により,特に活動認識クラスタリングタスクにおいて,提案アルゴリズムの有効性が確認された。

    Link: https://arxiv.org/abs/2603.21590

  • DiT-Flow:潜在空間と拡散Transformerに基づく,多様な歪みにロバストな音声強調 [eess.AS, cs.AI, cs.SD]目的:多様な歪みに対するロバスト性を備えた音声強調手法の開発
    • 近年,拡散モデルやフローマッチングなどの生成モデルが音声処理分野で高い性能を示している。
    • 音声強調モデルは,限られたデータセットで学習され,狭い条件で評価されることが多く,実用性に課題がある。
    • 学習と実環境とのギャップを埋め,多様な歪み環境下での高性能な音声強調を実現することを目指す。
    • 提案手法DiT-Flowは,合成データセットStillSonicSetにおいて,最先端の生成モデルによる音声強調手法を上回る性能を示した。
    • LoRAとMoEフレームワークを組み合わせることで,パラメータ効率と高性能を両立し,わずか4.9%のパラメータで5種類の未知の歪みに対して優れた性能を発揮した。
    • フローマッチングが,多様な条件における音声強調に有効であることが示された。

    Link: https://arxiv.org/abs/2603.21608

  • SPINONet:計算力学応用のためのスケーラブルなスパイクニューロン物理情報ニューラル演算子 [physics.comp-ph, cs.LG]目的:計算力学における物理情報ニューラル演算子学習モデルのエネルギー効率向上
    • 計算力学は,工学分野においてシミュレーションや設計に不可欠であり,その精度と効率が重要である。
    • 既存の物理情報ニューラル演算子学習モデルは計算コストが高く,特にエッジデバイスでの利用が制限されている。
    • スパイクニューロンを用いることで,計算量を削減し,エネルギー効率の高いモデルを構築することを目指す。
    • SPINONetは,スパイクニューロンの特性を利用し,計算量を削減しつつ,従来のモデルと同等の予測性能を達成した。
    • 限られたデータによる教師あり学習を組み合わせることで,物理情報学習だけでは収束しない場合に有効であることが示された。
    • SPINONetのアーキテクチャと設計選択が,計算負荷とエネルギー消費の削減に繋がることを理論的に考察した。

    Link: https://arxiv.org/abs/2603.21674

  • CoNBONet: 不確か性解析のための神経科学に着想を得たベイジアンオペレーターネットワーク [stat.ML, cs.LG]目的:非線形動的システムの確率的励起下における時間依存信頼性分析
    • 工学設計において,システムの信頼性評価は不可欠であり,その精度と効率が重要視される。
    • 従来のモンテカルロ法は計算コストが高く,高次元・時間依存問題への適用が困難である。
    • CoNBONetは,計算効率と不確か性評価の両立を図り,信頼性分析の新たな手法を提供する。
    • 提案手法CoNBONetは,神経科学に着想を得たネットワーク構造により,高速かつ低消費電力での推論を実現した。
    • スプリット確証予測により,理論的な保証に基づいた信頼性の高い不確か性評価を可能にした。
    • 様々な非線形動的システムに対する検証により,予測精度と故障確率の網羅性が確認された。

    Link: https://arxiv.org/abs/2603.21678

  • ハイブリッド量子ニューラルネットワークにおけるモデル選択:量子Transformerアーキテクチャへの応用 [quant-ph, cs.LG]目的:量子,古典,ハイブリッドTransformerアーキテクチャの評価手法
    • 量子機械学習は,その応用範囲の広さから近年注目されており,様々な分野での活用が期待されている。
    • 量子機械学習モデルの設計には明確な指針が少なく,最適な設定を見つけるためには膨大な計算資源が必要となる。
    • 有望なモデル候補を効率的に絞り込み,完全な学習パイプラインの実行を回避すること。
    • 本研究で開発されたQuantum Bias-Expressivity Toolbox (QBET) は,モデルの単純性バイアス (SB) と表現力 (EXP) を評価するための指標を提供する。
    • QBETを用いることで,Transformerベースの分類および生成タスクにおいて,量子型自己注意機構が古典型を上回るシナリオを特定することができた。
    • SB指標に基づいたモデルのランキングによって,完全な学習を必要とせずに,有望なモデル変種を効率的に事前選別することが可能となった。

    Link: https://arxiv.org/abs/2603.21749

  • 倉本モデルにおける識別可能性と償却推論の限界 [stat.AP, cs.LG]目的:倉本モデルにおけるパラメータ推定と不確実性定量
    • 物理,生物,工学における同期現象の研究に広く用いられる
    • 高次元の状態空間と扱い困難な尤度関数により,推論が計算的に困難
    • シミュレーションデータから事後分布を学習し,高速な推論を実現する
    • 償却型ベイズ推論は,従来のベイズ手法と比較して計算コストを削減する
    • 合成倉本ネットワークへの適用により,事後分布の近似と不確実性の把握が可能
    • オシレータネットワークの不確実性を考慮した分析の柔軟なフレームワークを提供する

    Link: https://arxiv.org/abs/2603.21752

  • サイクル一貫性のあるTransMorph:脳MRI登録のためのバランスの取れた深層学習フレームワーク [eess.IV, cs.AI, cs.CV]目的:脳MRI登録のための深層学習フレームワーク
    • 医学画像解析において,解剖学的構造の空間的な整合は不可欠であり,疾患の診断や進行評価に重要である。
    • 既存の深層学習法は計算効率は高いものの,長距離の解剖学的対応関係の把握や変形の一貫性維持に課題があった。
    • 長距離対応と変形の一貫性を改善し,高精度かつ安定した脳MRI登録を実現することを目指す。
    • 提案手法は,大規模な多施設共同データセットにおいて,複数の定量評価指標で優れた性能を示した。
    • 前方および後方変形場を同時に推定することで,局所的な解剖学的詳細とグローバルな空間関係の両方を捉えることを可能にした。
    • 安定性と物理的に妥当な変形場を維持し,大規模神経画像データセットへの適用に適している。

    Link: https://arxiv.org/abs/2603.21760

  • クラスタ特定予測モデリング:リソース制約のあるWi-Fiコントローラ向けの拡張性のあるソリューション [eess.SP, cs.LG]目的:管理型Wi-Fiネットワークにおける予測モデリング最適化
    • Wi-Fi利用者の増加に伴い,ネットワーク管理の効率化が重要になっている。
    • 大規模ネットワークにおいて,中央コントローラのメモリや計算資源に制約がある。
    • リソース制約下でも高精度な予測を実現する手法を確立すること。
    • クラスタ特定モデルは,高活動度のクラスタにおいて,グローバルモデルよりも優れた精度を示した。
    • モデルの複雑さと精度,リソース利用とのトレードオフを分析し,拡張性を確認した。
    • 選択的なモデル展開によるリソース最適化が,大規模Wi-Fi環境の効率的な運用に貢献する。

    Link: https://arxiv.org/abs/2603.21778

  • 重み付きネットワークにおける構造的集中:トポロジーを考慮した指標群 [stat.ML, cs.LG]目的:重み付きシステムの集中度測定のための統一的な枠組み
    • ネットワーク構造は経済,金融,複雑系など多様な分野で重要な役割を果たす。
    • 既存の集中度指標は重みの分散を捉えるものの,関係性のトポロジーを無視する点が課題。
    • 重み分布とネットワーク構造を同時に考慮した集中度指標を開発し,構造的集中を評価する。
    • 本研究で提案するネットワーク集中度指標(NCI)は,ネットワークリンクに沿った重み付き相互接続の実現割合を測定する。
    • NCIは正規化,不変性,解釈可能性といった重要な特性を維持しつつ,様々な依存性の側面を評価可能。
    • 実証的な分析から,同じ重み分布でもネットワークトポロジーによって構造的集中度が大きく異なることが示された。

    Link: https://arxiv.org/abs/2603.21918

  • Suiren-1.0技術報告:分子基盤モデル群 [physics.chem-ph, cs.AI]目的:多様な有機システムの正確なモデル化のための分子基盤モデル群
    • 創薬や材料科学において,分子の物性予測は重要な課題である。
    • 既存の分子モデルは,計算コストが高いか,予測精度に限界がある。
    • 高精度かつ効率的な分子物性予測を実現する新しいモデルを開発すること。
    • Suiren-1.0は,空間自己教師あり学習とSE(3)不変アーキテクチャにより,量子特性予測において高い性能を示した。
    • 分子間相互作用の学習により,Suiren-Dimerはさらにその能力を拡張した。
    • Conformation Compression Distillationにより,軽量なSuiren-ConfAvgが開発され,SMILESや分子グラフから高精度な表現を生成する。

    Link: https://arxiv.org/abs/2603.21942

  • 弱い重力レンズ効果を用いた質量マッピングのための,迅速な不確実性評価を可能にするプラグアンドプレイアプローチ [astro-ph.CO, astro-ph.IM, cs.LG, stat.ME]目的:弱い重力レンズ効果の質量マッピング手法
    • 宇宙論的モデルの制約において,高精度なデータが重要となる。
    • 既存手法は再学習が必要,または計算コストが高い。
    • 柔軟性,効率性,精度を兼ね備えた新手法の開発。
    • PnPMassは,最先端の深層学習手法に匹敵する性能を示す。
    • 推論が高速であり,単一の学習フェーズで済む。
    • 既存手法よりも誤差範囲が小さく,今後の弱重力レンズサーベイに適している。

    Link: https://arxiv.org/abs/2603.22006

  • MAGPI:乏しいデータからの代替モデル構築のための多精度拡張ガウス過程入力 [math.CO, cs.CG, math.MG, stat.ML, cs.LG]目的:乏しいデータからの代替モデル構築における,多精度拡張ガウス過程入力の提案
    • シミュレーション等に高コストなモデルを使用する場合,効率的な代替モデル構築が重要である。
    • 高コストなモデル評価により,学習データが限られる場合,代替モデルの信頼性が低下する。
    • 低精度モデルを活用し,高精度モデルよりも安価かつ高精度な代替モデルを構築することを目指す。
    • 本研究で提案するMAGPIは,低精度データを活用した特徴量拡張により予測精度を向上させた。
    • MAGPIは,既存の多精度ガウス過程回帰アプローチである共分散法と自己回帰推定量の利点を統合している。
    • 数値実験の結果,MAGPIは最先端手法と比較して予測精度と計算コストの両方を改善した。

    Link: https://arxiv.org/abs/2603.22050

  • 決定式点過程による機械学習原子間ポテンシャル向けデータキュレーション [quant-ph, cs.AR, stat.AP, cs.LG]目的:機械学習原子間ポテンシャル構築のための有用な訓練データセットの生成とラベル付け
    • 機械学習原子間ポテンシャルは,分子シミュレーションの効率化に不可欠であり,材料科学等の分野で重要性が増している。
    • 高精度な訓練データセットの作成には量子力学計算が必要であり,計算コストが課題となっている。
    • 決定式点過程を用いて,効率的かつ多様な訓練データセットの構築を目指す。
    • 決定式点過程は,分子記述子のカーネルを利用することで,既存手法と同等以上の性能を示す。
    • ハフニウム酸化物データを用いた実験により,コンパクトで多様な訓練データセットの構築が確認された。
    • 本研究は,異種またはマルチモーダルデータ,オンラインアクティブラーニングへの応用可能性を示唆する。

    Link: https://arxiv.org/abs/2603.22160

  • CayleyPy-4:AIホログラフィー - AIタスクのためのホログラフィック弦双対性の類似物に向けて [hep-th, cs.AI, cs.LG, math.CO, math.GR]目的:AIタスクにおけるホログラフィック弦双対性の類似物の存在
    • AI技術の発展には,計算効率の向上が不可欠であり,新たなアプローチが求められている。
    • 現在のAIシステムは,計算資源を大量に消費する傾向があり,効率的な計算手法が課題となっている。
    • グラフ構造上の粒子軌跡予測とAIタスクの類似性を利用し,効率的な計算手法を開発すること。
    • Cayleyグラフにおいて,離散的な弦による双対的な記述が可能であることが示された。
    • 対称群S_nのCayleyグラフでは,対応する双対オブジェクトが平坦な多角形となることが明らかになった。
    • グラフの直径は,多角形内部の整数点の数に比例し,「複雑性=体積」のパラダイムが実現されることが示唆された。

    Link: https://arxiv.org/abs/2603.22195

  • 機械学習を用いたナトリウムイオン電池向け高容量ヤヌスアミノベンゼン-グラフェン負極の特性評価 [cond-mat.mtrl-sci, cond-mat.mes-hall, cs.LG, physics.atm-clus, physics.chem-ph]目的:ナトリウムイオン電池用負極材料としてのヤヌスアミノベンゼン-グラフェンの特性
    • ナトリウムイオン電池は,エネルギー貯蔵デバイスとして重要であり,高性能な負極材料の開発が求められている。
    • 従来の負極材料では,高容量,低動作電圧,高速なナトリウムイオン輸送,機械的安定性を同時に満たすことが困難である。
    • アミノベンゼン修飾されたヤヌスグラフェンが,高容量ナトリウムイオン電池負極材料として有効であることを示す。
    • シミュレーションにより,アミノベンゼンへのサイト特異的吸着,Na$_n$@AB$_m$構造形成,層間ギャラリーへの充填という3段階のナトリウム蓄積機構が明らかになった。
    • 0.15 V vs. Na/Na$^{+}$付近に広がる低電圧プラトーを示し,理論的な重量容量は約400 mAh g$^{-1}$と推定された。
    • 体積変化は無視でき,ナトリウム拡散率はハードカーボンよりも2〜3桁高く,優れたイオン伝導性を示すことが確認された。

    Link: https://arxiv.org/abs/2603.22254

  • ガウスカーネル距離に対する相対誤差埋め込み [cs.LG]目的:ガウスカーネル距離の相対誤差埋め込み
    • カーネル法は非線形なデータ解析に有効であり,機械学習の様々な分野で利用されている。
    • カーネル距離の近似計算には次元の呪いが伴い,計算コストが増大する可能性がある。
    • ガウスカーネルにおける特徴量マップの次元数を理論的に決定し,近似精度を保証すること。
    • ガウスカーネルに対し,特徴量マップ上のユークリッドノルムが,カーネル距離に対して(1+ε)相対誤差を持つことが示された。
    • n個のデータ点に対して,O((1/ε^2) log(n))次元の近似特徴空間で十分かつ必要であることが示された。
    • 元の点がℝ^dに存在し,直径がMで有界な場合,O((d/ε^2) log(M))次元で十分であることが示された。

    Link: https://arxiv.org/abs/1602.05350

  • パラメータ化されたゲームにおける人間の戦略的意思決定 [cs.GT, cs.AI, cs.LG, econ.TH]目的:人間の戦略的意思決定プロセス
    • 現実世界のゲームはパラメータに依存し,その理解は戦略設計に不可欠である。
    • パラメータ値が未知の場合,リアルタイムでの最適解法は困難を伴う。
    • 時間・資源制約下における人間の迅速な意思決定支援。
    • 本研究では,リアルタイムソルバーなしで迅速な意思決定を可能にする新しいフレームワークを提案する。
    • このフレームワークは,複数プレイヤーや不完全情報といった多様な状況に適用可能である。
    • 人間の戦略的意思決定を支援することで,現実世界の複雑なゲームへの応用が期待される。

    Link: https://arxiv.org/abs/2104.14744

  • 同質なユーザーへの後悔しないベイジアン推薦 [cs.GT, cs.IR, cs.LG]目的:同質なユーザーに対するオンラインベイジアン推薦問題の解決
    • インターネット経済において,製品の状態を考慮した推薦は重要性を増している。
    • ユーザーの嗜好や信念が事前に不明なため,効果的な推薦ポリシーの設計が課題である。
    • 後悔を最小化しつつ,ユーザーの行動に適応する推薦ポリシーを構築すること。
    • 本研究では,ラウンド数に対して対数オーダーの後悔を持つオンラインポリシーを提案した。
    • 情報理論的な下限により,これより良いオーダーの後悔を持つ適応的なポリシーは存在しないことが示された。
    • 線形計画問題として定式化することで,状態数に対して多項式オーダー,ラウンド数に対して対数オーダーの後悔を持つポリシーを提示した。

    Link: https://arxiv.org/abs/2202.06135

  • 多段階優先:部分観測性におけるロバストな連続制御のための軽量な深層強化学習戦略 [cs.RO, cs.AI]目的:部分観測性環境下におけるロバストな連続制御のための深層強化学習戦略
    • ロボット制御分野では,深層強化学習の応用が期待されており,その性能向上が重要視されている。
    • 部分観測環境下では,状態が完全に観測できないため,強化学習アルゴリズムの性能が低下しやすい。
    • 部分観測環境下において,よりロバストな深層強化学習アルゴリズムを特定し,改善することを目指す。
    • 部分観測性下では,PPOがTD3やSACよりも高いロバスト性を示すことが実験的に確認された。
    • この結果は,多段階ブートストラップの安定化効果に起因すると考えられる。
    • TD3とSACに多段階ターゲットを組み込むことで,そのロバスト性が向上することが示された。

    Link: https://arxiv.org/abs/2209.04999

  • 一般化された状態・行動空間における方策最適化 [cs.LG, cs.AI, math.OC]目的:一般化された状態・行動空間における方策最適化手法の開発
    • 強化学習は,自律的な意思決定システムの構築に不可欠であり,その応用範囲は広い。
    • 一般的な状態・行動空間では,状態の列挙が困難であり,既存の方策最適化手法の適用が制限される。
    • 状態・行動空間が一般的な環境下でも適用可能な,収束性保証のある強化学習アルゴリズムを開発すること。
    • 本研究では,最近開発された方策ミラー降下法を一般化し,関数近似を組み込むことで,明示的な方策パラメータ化を必要としない手法を提案した。
    • また,新しい方策二乗平均法を提案し,より単純な関数近似技術の適用を可能にした。
    • 提案手法は,精確な方策評価の下で,大域的最適解への線形収束または定常状態への亜線形収束が理論的に保証された。

    Link: https://arxiv.org/abs/2211.16715

  • 継続的連合学習のためのより良い生成リプレイ [cs.LG, cs.AI]目的:継続的連合学習における性能向上
    • 連合学習はデータプライバシーを保護しながら学習が可能であり,医療や金融分野で重要。
    • 既存研究は単一タスクに偏っており,継続学習や非IIDデータへの対応が課題。
    • 分散環境下での学習不安定性を改善し,継続学習性能の低下を抑制。
    • 提案手法FedCILは,モデル統合と一貫性維持により,既存手法を大幅に上回る性能を示す。
    • 分散学習における非IIDデータの影響を分析し,学習の不安定性が性能低下の原因であることを指摘。
    • 複数のベンチマークデータセットで有効性を検証し,継続的連合学習における実用性を確認。

    Link: https://arxiv.org/abs/2302.13001

  • 半教師ありノード分類における幾何学的アンバランス [cs.LG]目的:グラフデータにおけるノード分類の幾何学的アンバランスの軽減
    • グラフデータは,ソーシャルネットワークや生物学的ネットワークなど,様々な分野で利用されており,その分析は重要である。
    • グラフデータにおいてクラスの不均衡が存在する場合,少数クラスのノード分類精度が低下するという課題がある。
    • 少数クラスノードの幾何学的曖昧さを軽減することで,よりロバストなノード分類を実現することを目的とする。
    • 本研究では,クラス不均衡グラフにおけるメッセージパッシングが,リーマン多様体埋め込み空間で少数クラスノードの幾何学的曖昧さを生むことを理論的に示した。
    • 擬似ラベル整列,ノード再配置,曖昧さフィルタリングを通じて幾何学的アンバランスを明示的に軽減する統一的なフレームワークを提案した。
    • 多様なベンチマークデータセットにおける実験により,提案手法が既存手法を凌駕し,特に深刻なクラス不均衡下で高い性能を示すことが確認された。

    Link: https://arxiv.org/abs/2303.10371

  • トーラス効率型完全準同型暗号のための阻害型Transformerとゲート付きRNN [cs.LG]目的:完全準同型暗号下でのスケーラブルなプライバシー保護機械学習の実現
    • AI技術の発展に伴い,プライバシー保護と機械学習の高性能化が重要な課題となっている。
    • 完全準同型暗号は計算コストが高く,特にTransformerやRNNのような複雑なモデルではその影響が大きい。
    • TransformerとRNNの構造を改変し,暗号化された状態での計算効率を向上させる。
    • Transformerとゲート付きRNNに阻害構造を導入することで,乗算と活性化関数を削減し,整数演算のみで計算可能にした。
    • TFHE環境下での回路深度と実行時間が大幅に削減され,暗号化推論速度が3~6倍向上,プレーンテキスト推論速度も30~50%改善された。
    • MNIST,IMDB,IAM手書き文字データセットを用いた実験で,阻害型モデルは競争力のある精度を維持し,DistilBERTを用いた知識蒸留によりGLUEタスクで高い性能を示した。

    Link: https://arxiv.org/abs/2308.05629

  • MatSegNet:高強度鋼における炭化物析出物の正確な分析のための新たな境界認識型深層学習モデル [cs.CV, cond-mat.mtrl-sci, cs.LG]目的:高強度鋼における炭化物析出物の包括的なセグメンテーションと定量的な特徴付け
    • 高強度鋼の機械的特性向上には,炭化物析出物の制御が不可欠である。
    • 従来の炭化物析出物の分析は,時間と労力を要し,精度に課題があった。
    • 炭化物析出物の高精度な分析を深層学習を用いて実現し,材料開発を加速すること。
    • MatSegNetは,既存の深層学習アーキテクチャと比較して,炭化物析出物のセグメンテーション性能において優れた結果を示した。
    • 下部ベイナイトと焼き戻しマルテンサイトの炭化物特性に統計的な差は見られず,従来の識別方法への注意喚起となった。
    • 深層学習が材料の組織-特性関係を明らかにし,材料イノベーションを促進する可能性が示された。

    Link: https://arxiv.org/abs/2312.17251

  • 都市型汎用知能に向けて:都市基盤モデルのレビューと展望 [cs.CY, cs.AI, cs.LG]目的:都市基盤モデルの定義,課題,および実現に向けた枠組み
    • 都市の効率性,持続可能性,居住性を向上させる上で,機械学習の活用は不可欠である。
    • 都市基盤モデルの分野は急速に発展しているが,明確な定義や体系的なレビュー,普遍的な解決策が不足している。
    • 都市基盤モデルの課題を克服し,多用途なモデルの実現を促進するための枠組みを提案すること。
    • 本研究では,都市基盤モデルの定義と概念を提示し,その開発における特有の課題を強調した。
    • 都市データを種類別に分類するデータ中心の分類体系を提案し,既存の研究を整理した。
    • 都市基盤モデルに関連する既存のベンチマークとデータセットを体系的にまとめ,その幅広い応用可能性を示した。

    Link: https://arxiv.org/abs/2402.01749

  • 棄権を伴う多腕バンディット問題に対する漸近的・ミニマックス最適後悔限界 [cs.LG, cs.IT, math.IT, stat.ML]目的:棄権を伴う多腕バンディット問題におけるアルゴリズム開発
    • 機械学習におけるオンライン意思決定問題の重要性が高まっており,特に探索と活用のバランスが重要である。
    • 従来の多腕バンディット問題では,必ず腕を選択する必要があり,最適な腕が不明な場合に不利益を被る可能性がある。
    • 本研究では,棄権という戦略を導入することで,より効率的な意思決定を可能にし,後悔を最小限に抑えることを目指す。
    • 提案アルゴリズムは,情報理論的な下限と同等の後悔限界を達成し,漸近最適性を示すことができた。
    • 棄権オプションの導入が,アルゴリズムの性能向上に貢献することが定量的に明らかになった。
    • 数値実験の結果は,理論的な知見を裏付けるとともに,実用的な利点の可能性を示唆している。

    Link: https://arxiv.org/abs/2402.15127

  • リストサンプルの圧縮と一様収束 [cs.LG, stat.ML]目的:リスト学習における汎化に関する古典的な原理の適用可能性
    • 機械学習の理論的基盤を理解する上で,汎化性能の保証は重要である。
    • リスト学習では,従来のPAC学習における原理がそのまま適用できるか不明確である。
    • リストPAC学習における一様収束とサンプル圧縮の完全性の有無を検証する。
    • リスト学習において,一様収束は学習可能性と同値であることが示された。
    • ラベル空間が{0,1,2}の場合,学習可能なクラスでも圧縮できないクラスが存在することが証明された。
    • これにより,LittlestoneとWarmuthのサンプル圧縮予想のリスト版が反駁された。

    Link: https://arxiv.org/abs/2403.10889

  • ヘッセ行列フリー影響関数の再検討,拡張,および改良 [cs.LG, stat.ML]目的:モデル解釈,サブセット学習データ選択,ノイズラベル検出におけるサンプル影響の評価
    • モデルの挙動を理解し,改善するための重要なツールであり,機械学習の信頼性向上に不可欠である。
    • 深層モデルへの適用において,ヘッセ行列の計算コストと存在しない場合があるという課題が存在する。
    • 単純な近似手法を理論的に解明し,公平性とロバスト性への応用を検討することで,影響関数の実用性を高める。
    • 単純な近似手法であるTracInが,深層モデルにおいて良好な性能を示す理由を理論的に説明した。
    • TracInを公平性とロバスト性の評価に拡張し,より広範な応用可能性を示した。
    • TracInをアンサンブル戦略によって改良し,合成データおよび実際のタスクにおいて有効性を示した。

    Link: https://arxiv.org/abs/2405.17490

  • HPE-CogVLM:ヘッドポーズグラウンディングタスクによるビジョン言語モデルの高度化 [cs.SI, cs.CL, cs.CV, cs.AI, cs.CL]目的:ヘッドポーズ推定の精度向上
    • 画像認識と自然言語処理の融合は,より高度なAIシステムの実現に不可欠である。
    • 従来のヘッドポーズ推定モデルは,実環境でのロバスト性に課題があり,汎用性に欠ける。
    • ビジョン言語モデルの能力を活用し,ヘッドポーズ推定と物体検出を両立させる。
    • 提案手法HPE-CogVLMは,既存の最先端CNNモデル(6DRepNet)と比較して,平均絶対誤差を31.5%削減した。
    • 直接LoRAファインチューニングやタスクアリティメチックによる統合と比較して,全てのヘッドポーズ推定指標で優れた性能を示した。
    • 高コサイン類似度閾値と「勝者総取り」層選択戦略を用いることで,無効な応答形式の問題を解決した。

    Link: https://arxiv.org/abs/2406.01914

  • 吸収的離散拡散が密かにクリーンデータの条件付き分布をモデル化する [cs.LG, cs.CL]目的:吸収的離散拡散モデルにおける,トランジット状態間の周辺確率の比率である「コンクリートスコア」の表現
    • 言語モデリングにおいて,離散拡散モデルは有望視されており,その効率的な学習手法が求められている。
    • 従来の拡散モデルは計算コストが高く,特に大規模データでの学習に課題がある。
    • コンクリートスコアが条件付き確率として表現できる点を利用し,計算効率の改善を目指す。
    • 吸収的拡散におけるコンクリートスコアは,クリーンデータの条件付き確率に時間依存のスカラーを掛けた形で解析的に表現できることが示された。
    • 時間条件を必要としない新しい拡散モデルRADD(Reparameterized Absorbing Discrete Diffusion)が提案され,関数評価回数の削減に貢献する。
    • RADDはGPT-2スケールでの5つのゼロショット言語モデリングベンチマークにおいて,最先端の性能を達成した。

    Link: https://arxiv.org/abs/2406.03736

  • 大規模言語モデルを用いたロボット形態の進化 [cs.NI, eess.SP, cs.IR, cs.LG, cs.RO]目的:ロボット形態の生成と最適化
    • ロボット工学の発展には,多様な環境に適応可能なロボット設計が不可欠である。
    • 従来のロボット設計は時間と計算資源を要し,効率的な探索が課題であった。
    • 大規模言語モデルと進化アルゴリズムを組み合わせ,効率的なロボット設計を可能にすること。
    • RoboMorphは,大規模言語モデルと進化アルゴリズムを用いて,モジュール式ロボットのデザインを自動生成・最適化する。
    • 4種類の地形において,Robogrammarのグラフ探索法と同等またはそれ以上の性能を持つ,多様な地形特化型ロボット形態を発見した。
    • 大規模言語モデルが進化選択と組み合わせることで,自動ロボット設計のための効果的な生成オペレーターとなり得ることを示した。

    Link: https://arxiv.org/abs/2407.08626

  • 人間とAIのチームにおける認知的な波及効果 [cs.HC, cs.AI, econ.GN, q-fin.EC]目的:人間とAIのチームにおける認知的な波及効果の存在
    • チームワークは,生産性や創造性の向上に不可欠であり,その質的理解が重要である。
    • AIがチームにもたらす影響は,単なる道具としての利用にとどまらない可能性が指摘されている。
    • AIへの接触が,人間同士のコミュニケーションや認知に与える影響を明らかにすること。
    • AIへの接触は,人間同士の共有言語,注意,メンタルモデル,社会的結束に波及効果をもたらすことが示された。
    • この波及効果は,環境,方法,タスク,AIの質に関わらず一貫して認められ,AIの存在自体が影響を与えることを示唆する。
    • AIは,暗黙の「社会的力場」として機能し,人々の思考,注意,関係性に影響を与えることが示唆される。

    Link: https://arxiv.org/abs/2407.17489

  • 有限のニューラルネットワークをガウス過程の混合として:証明可能な誤差境界から事前分布の選択へ [cs.LG, stat.ML]目的:有限幅・深さのニューラルネットワークのガウス過程の混合近似
    • ニューラルネットワークの理論的理解を深める上で,ガウス過程との関係性は重要な研究テーマである。
    • 有限のニューラルネットワークとガウス過程の間には誤差境界が確立されておらず,近似の精度評価が困難である。
    • 本研究は,有限のニューラルネットワークの近似誤差を理論的に評価可能なガウス過程の混合を提供する。
    • 提案手法は,任意のニューラルネットワークと許容誤差εに対して,ε-近いガウス過程の混合を有限の入力点集合上で導出可能である。
    • 誤差境界の微分可能性を利用し,ニューラルネットワークのパラメータを調整して特定のガウス過程の関数的振る舞いを模倣できる。
    • 回帰および分類問題における実験により,ニューラルネットワーク予測の理解と不確実性の定量化への貢献が示唆される。

    Link: https://arxiv.org/abs/2407.18707

  • 方策勾配法の強多項式時間性と検証分析 [cs.LG, cs.AI, cs.DS, math.OC]目的:有限状態・行動マルコフ決定過程および強化学習における方策勾配法の収束性
    • 強化学習は,複雑な意思決定問題を解決する強力な手法であり,その応用範囲は広い。
    • 方策勾配法は実装が容易だが,収束速度が遅く,理論的な保証が不足している。
    • 本研究では,方策勾配法の収束性を理論的に保証し,最適解の検証手法を提供する。
    • 本研究で提案するアドバンテージギャップ関数を用いることで,方策勾配法が強多項式時間でマルコフ決定過程を解けることを示した。
    • 確率的環境下では,アドバンテージギャップ関数が各状態の最適性ギャップを近似し,準線形収束性を示すことが確認された。
    • 提案手法は,強化学習における最適性の証明を可能にし,アルゴリズム間比較に依存する現状の課題を克服する。

    Link: https://arxiv.org/abs/2409.19437

  • 多層ピカール近似とReLU,Leaky ReLU,Softplus活性化関数を持つ深層ニューラルネットワークによる高次元半線形放物型偏微分方程式の近似 [math.NA, cs.LG, cs.NA, math.PR]目的:高次元半線形放物型偏微分方程式の近似手法
    • 偏微分方程式は自然科学や工学の様々な分野で現象を記述する上で不可欠である。
    • 高次元問題における従来の数値解法の計算コストは,次元の増加に伴い指数関数的に増大する。
    • 深層学習を用いた次元の呪いを克服し,効率的な近似解法を開発することを目指す。
    • 多層ピカール近似と深層ニューラルネットワークが,特定の条件下で半線形Kolmogorov偏微分方程式の解を$L^\mathfrak{p}$-意味で近似できることが示された。
    • 多層ピカール近似の計算コストとニューラルネットワークのパラメータ数は,次元$d$と精度$\epsilon$に対して多項式的にしか増加しない。
    • ReLU,Leaky ReLU,Softplus活性化関数が,高次元問題において有効に機能することが確認された。

    Link: https://arxiv.org/abs/2409.20431

  • メタ学習と時間グラフネットワークを用いた都市間不動産鑑定 [cs.CL, cs.LG, cs.AI]目的:都市間不動産鑑定の性能向上
    • 不動産鑑定は,取引,投資,税制など様々な分野で重要である。
    • 深層学習はデータ集約的であり,データが少ない小規模都市への適用が困難である。
    • 豊富なデータを持つ都市から知識を転移し,データ不足の都市での鑑定精度を改善する。
    • 提案手法MetaTransferは,複数の大都市から知識を転移することで,データ不足の都市での不動産鑑定性能を向上させる。
    • 時間変化する不動産取引をイベント異種グラフとしてモデル化し,空間的・時間的相関を捉えるEvent-Triggered Temporal Graph Networkを設計した。
    • Tri-Level Optimization Based Meta-Learningにより,転移学習の負の影響を軽減し,都市間の知識転移効果を高めた。

    Link: https://arxiv.org/abs/2410.08947

  • ファウンデーションモデルからの学習:手動アノテーションなしの果実検出モデル [cs.CV, cs.LG]目的:手動アノテーションを必要としない,ドメイン固有の小規模モデルの学習フレームワーク
    • 農業分野におけるデータ不足は深刻であり,AI技術の導入を阻害する要因となっている。
    • 十分なラベル付きデータがない場合,高性能な物体検出モデルを構築することが困難である。
    • 大規模な事前学習済みモデルの知識を活用し,ラベルなしデータから高性能な果実検出モデルを開発すること。
    • 提案手法SDM-Dは,果実検出タスク(物体検出,セマンティックセグメンテーション,インスタンスセグメンテーション)において,手動アノテーションなしで優れた性能を発揮する。
    • SDM-Dは,豊富なラベル付きデータで学習したモデルに匹敵する性能を達成し,Grounding SAMやYOLO-Worldなどのオープンセット検出手法を上回る。
    • 25,000枚以上の画像を含む大規模な果実セグメンテーションデータセットMegaFruitsと,関連コードを公開し,研究の再現性を高めている。

    Link: https://arxiv.org/abs/2411.16196

  • タスク漸進的カリキュラム学習によるロバストな視覚的質問応答 [cs.CV, cs.LG]目的:ロバストな視覚的質問応答システムの開発
    • 視覚的質問応答は,AI研究において重要な課題であり,画像と質問を理解する能力が求められる。
    • 既存のシステムは,分布の変化やデータ不足に弱く,汎化性能に課題がある。
    • 質問の難易度とセマンティック構造を考慮した学習戦略により,汎化性能を向上させる。
    • 提案手法であるTPCLは,質問タイプと難易度に基づいたカリキュラム学習を行うことで,IID,OOD,低データ環境下での汎化性能を改善する。
    • データ拡張や明示的なバイアス除去に頼らず,VQA-CP v2およびv1で最先端の性能を達成し,既存のロバストVQAベースラインを大きく上回る。
    • TPCLは,バックボーンモデルの性能を最大28.5%向上させることが示された。

    Link: https://arxiv.org/abs/2411.17292

  • アナログインメモリコンピューティングのための低ランクアダプターによる効率的なTransformer適応 [cs.AR, cs.LG]目的:アナログインメモリコンピューティングにおけるTransformer適応の効率化
    • Transformerモデルの高性能化に伴い,計算資源の制約が課題となっている。
    • 従来のハードウェア適応にはモデル全体の再学習が必要で,時間とエネルギーを消費する。
    • 低ランクアダプターを用いて,ハードウェアとタスクへの適応を効率的に行うことを目指す。
    • AHWA-LoRAは,SQuAD v1.1およびGLUEベンチマークにおいて有効性が確認された。
    • AHWA-LoRAは,大規模モデルへの拡張性を示し,命令チューニングや強化学習にも適用可能であることが示された。
    • RISC-Vベースのマルチコアアクセラレータを用いたハイブリッドアーキテクチャにより,全AIMC実装と比較してわずか4%のオーバーヘッドで効率的なTransformer推論を実現した。

    Link: https://arxiv.org/abs/2411.17367

  • アフリカにおける給水・衛生インフラへのアクセス状況の監視:衛星画像と自己教師あり学習の活用 [cs.CV, cs.CY, cs.LG]目的:アフリカ地域における給水および衛生インフラへのアクセス状況の評価モデルの開発
    • 清潔な水と衛生は健康,幸福,持続可能な開発に不可欠であり,世界的な不均衡は依然として存在する。
    • 多くの国において,データ収集の限界やデータの公開性の欠如が,SDG 6の進捗状況の正確な追跡を妨げている。
    • 衛星画像と深層学習を活用し,データ収集のギャップを埋め,インフラへのアクセス状況を評価する手法を確立すること。
    • 開発されたモデルは,給水設備へのアクセス状況で84%以上,下水道システムへのアクセス状況で87%以上の高い精度を達成した。
    • 人口データと組み合わせることで,国レベルでの公式統計との高い一致性(給水アクセスR2=0.92,下水道アクセスR2=0.72)が確認された。
    • この手法は,SDG指標6.1.1および6.2.1を代表する国レベルの推定値を提供し,効果的かつ費用対効果の高いツールとなる。

    Link: https://arxiv.org/abs/2411.19093

  • PrecLLM:小規模LLMを用いた非構造化電子カルテからの効率的な臨床アノテーション抽出のためのプライバシー保護フレームワーク [cs.CL, cs.AI]目的:非構造化電子カルテからの効率的な臨床アノテーション抽出
    • 医療現場における自然言語処理の重要性が増しており,大量のテキストデータ分析が求められている。
    • LLMの利用はプライバシー規制や計算コストの高さが課題となり,臨床現場への導入が制限されている。
    • プライバシーを保護しつつ,小規模LLMでも効率的に臨床アノテーションを抽出できるフレームワークの構築。
    • PrecLLMは,正規表現とRetrieval-Augmented Generation (RAG)を組み合わせた前処理により,小規模LLMの性能を大幅に向上させた。
    • MIMIC-IVデータセットを用いた比較実験により,PrecLLMは既存のファインチューニングされたLLMと同等以上の性能を示した。
    • 本研究は,プライバシー保護と計算資源の制約下で,安全かつ効率的な医療応用を実現するためのLLM活用に貢献する。

    Link: https://arxiv.org/abs/2412.02868

  • 深層演算ネットワークを用いた隠れた物理法則とシステムパラメータの学習 [cs.LG]目的:隠れた物理法則の発見とシステムパラメータの特定
    • 計算科学や工学において,観測データから物理法則を抽出することは,シミュレーションや予測の精度向上に不可欠である。
    • 従来のデータ駆動型手法は,再学習の必要性,ノイズへの敏感さ,またはPDE間の汎化性の欠如といった課題を抱えている。
    • 本研究は,深層演算ネットワークを用いてこれらの課題を克服し,より効率的でロバストな物理法則発見とパラメータ特定を目指す。
    • 提案手法は,反応拡散系,Burgers方程式,2次元熱方程式,2次元Helmholtz方程式といったベンチマーク問題で高い精度を示した。
    • 解の相対誤差はO(10^-2)程度,パラメータ推定誤差はO(10^-3)程度であり,限られたノイズを含む観測データ下でも高い性能を維持した。
    • 演算子学習と物理情報を取り入れたモデリングを組み合わせることで,複雑な動的システムにおけるロバストな逆問題解決への道を開いた。

    Link: https://arxiv.org/abs/2412.05133

  • 過パラメータ化モデルに対する局所ステップを用いた分散勾配降下の有効性 [cs.DL, cs.LG, cs.DC, stat.ML]目的:過パラメータ化モデルにおける分散勾配降下の暗黙的バイアス
    • 機械学習モデルの分散学習は,計算資源を効率的に活用し,大規模データセットに対応可能であるため重要である。
    • 分散学習における通信コストはボトルネックとなりやすく,効率的なアルゴリズムが求められている。
    • 局所勾配降下法がどの解に収束するかという問題に対し,線形分離可能データを用いた解析を通じて解明を目指す。
    • 局所勾配降下法は,データがすべて一箇所にある場合の中央化モデルの方向へ収束することが示された。
    • 局所ステップ数に関わらず,中央化モデルへの収束率を正確に特定した。
    • 局所ステップ数に依存しない学習率を用いた修正アルゴリズムでも同様の暗黙的バイアスが確認された。

    Link: https://arxiv.org/abs/2412.07971

  • アクティブラーニングにおける再現性のコスト [cs.LG]目的:アクティブラーニングにおける再現性とラベル効率のトレードオフ
    • 機械学習の信頼性は重要であり,再現性はその根幹をなす要素である。
    • アクティブラーニングにおいて,再現性を高めるとサンプル複雑度が上昇する傾向がある。
    • 再現性を確保しつつ,アクティブラーニングのラベルコストを最小限に抑えることを目指す。
    • 再現性を保証するためのランダム化閾値処理技術を導入した新しいアクティブラーニングアルゴリズムを提案した。
    • 理論的分析により,再現性を強制することでラベル複雑度が増加するものの,CALとA^2は依然として大幅なラベル削減を達成することが示された。
    • アクティブラーニングにおいて,効率性と安定性のバランスに関する知見が得られた。

    Link: https://arxiv.org/abs/2412.09686

  • 連続的な増分学習と消去が可能なコンパクトな確率的ニューラルネットワークに基づくパターン分類器の自動構築 [cs.RO, cs.SY, eess.SY, cs.LG, cs.CV]目的:連続的な増分学習と消去に対応可能なパターン分類器の自動構築
    • パターン認識は,画像や音声など多様なデータから意味のある情報を抽出する上で重要である。
    • 従来のニューラルネットワークは,学習データの追加や削除に柔軟に対応できない場合がある。
    • 本研究は,少ないパラメータで効率的に学習・消去が可能な分類器の構築を目指す。
    • 提案手法は,パラメータ調整を必要とせず,単一パスのネットワーク成長アルゴリズムにより自動的に構造とパラメータを決定する。
    • 実験結果から,本手法で構築されたコンパクトな確率的ニューラルネットワークは,従来のモデルよりも少ない隠れ層ユニット数で,同等の分類性能を示すことが確認された。
    • また,連続的なクラス増分学習と消去タスクにおいても,十分な性能を発揮することが示された。

    Link: https://arxiv.org/abs/2501.00725

  • C-HDNet:ネットワーク干渉下における観測データからの因果効果推定のための超次元計算 [cs.LG, stat.ME]目的:観測データからの因果効果推定
    • 社会的相互作用が重要な場面で,因果推論は政策決定や介入効果の評価に不可欠である。
    • ネットワーク構造における干渉効果を考慮しないと,因果効果の推定にバイアスが生じる可能性がある。
    • ネットワーク干渉下で,より正確な因果効果推定を実現することを目指す。
    • 本研究では,超次元計算の原理に基づいた新規なマッチング手法を提案した。
    • 提案手法は,既存の最先端手法と同等以上の性能を示し,計算コストの大幅な削減を実現した。
    • 大規模データやリアルタイム性が求められる状況での応用に適していると考えられる。

    Link: https://arxiv.org/abs/2501.16562

  • DesCLIP:VLMベースの画像認識のための汎用属性記述を用いたロバストな継続学習 [cs.CV, cs.AI]目的:VLMベースの画像認識における継続学習のロバスト性の向上
    • 近年,画像とテキストの相互理解が可能なVLMが発展しており,様々な応用が期待されている。
    • VLMの継続学習においては,新たなタスクを学習する際に,以前の知識が失われる「破局的忘却」が課題となる。
    • 汎用的な属性記述を用いることで,VLMの知識保持能力を高め,継続学習における性能低下を抑制することを目指す。
    • DesCLIPは,特定のクラスと特徴量の直接的な関連付けではなく,汎用的な属性記述を介したトリラテラルな関連付けを構築する。
    • 言語アシスタントを用いて具体的な属性記述候補を生成し,アンカーベースの埋め込みフィルタで関連性の高い記述を選択する。
    • 実験の結果,DesCLIPは既存の継続学習手法と比較して,VLMベースの画像認識において優れた性能を発揮することが示された。

    Link: https://arxiv.org/abs/2502.00618

  • クラス別情報を用いた構造化Lassoプルーニングの強化 [cs.CV, cs.AI]目的:軽量なニューラルネットワークモデルの実現
    • 現代のアプリケーションは,計算資源の制約下での高性能なモデルを必要とするため。
    • 既存のプルーニング手法はフィルタの重要度のみに着目し,クラス別情報を考慮しない場合がある。
    • クラス別情報に基づき,プルーニング前後の統計的情報の損失を抑制することを目指す。
    • 提案手法は,CIFAR-10データセット上のVGG16モデルにおいて,パラメータを85%削減し,FLOPsを61%削減しつつ,精度を94.10%に維持した。
    • ImageNetデータセット上のResNetアーキテクチャでは,パラメータを55%削減し,精度を76.12%に維持した(0.03%の低下)。
    • モデルサイズと計算資源を削減しつつ,精度の維持に成功した。

    Link: https://arxiv.org/abs/2502.09125

  • SFT 的な RLHF: 最適解から報酬加重アライメントへ [cs.LG, cs.AI, cs.CL]目的:大規模言語モデルと人間の価値観との整合性
    • 大規模言語モデルの利用拡大に伴い,安全性や倫理的な問題が重要になっている。
    • 従来の RLHF は実装や計算コストが高く,過学習や学習不安定性も課題となっていた。
    • 本研究は,RLHF の簡略化と効率化を図り,性能低下を抑制することを目的とする。
    • 提案手法 VAR は,LLM の学習ポリシーと RLHF の最適解の分布差を最小化する。
    • オフラインの報酬加重 SFT の形式に変換することで,学習の安定性と効果を向上させている。
    • 評価実験において,VAR はオフラインアライメント手法を凌駕し,有用性と安全性指標で優れた性能を示した。

    Link: https://arxiv.org/abs/2502.11026

  • ヘルグロッツ・ネット:調和位置エンコーディングを用いた球面データの陰的ニューラル表現 [cs.SI, cs.CY, physics.soc-ph, cs.LG, eess.SP]目的:球面データの陰的ニューラル表現
    • 球面データ処理は,従来のユークリッド手法の適用を困難にする特有の課題を抱えるため,重要性が高い。
    • 既存の陰的ニューラル表現は,球面データの固有の幾何学を考慮していない場合,精度と安定性に課題がある。
    • 本研究は,球面データに適した,精度と安定性を兼ね備えた陰的ニューラル表現モデルを構築することを目的とする。
    • 提案手法Herglotz-NETは,複素ヘルグロッツ写像に基づく調和位置エンコーディングを用いることで,球面上のwell-posedな表現を実現している。
    • 球面に基づいた陰的ニューラル表現は,特定の条件を満たせば,ネットワークの深さに応じた予測可能なスペクトル拡張を示すことが示された。
    • Herglotz-NETは,球面データの高精度なモデリングを可能にする,スケーラブルで柔軟なフレームワークとして確立された。

    Link: https://arxiv.org/abs/2502.13777