arXiv雑要約

AI - 2026/06/11 公開

  • 宇宙論的推論のための解釈可能なニューラルマーキング統計 [astro-ph.CO, cs.LG]目的:宇宙論パラメータの抽出における情報量の向上
    • 宇宙の大規模構造を理解する上で,物質密度分布の非ガウス性を捉えることが重要である。
    • 二点相関関数では,非ガウス成分を完全に捉えることが難しく,宇宙論的情報の一部が失われる。
    • ニューラルネットワークを用いて,より効果的に非ガウス情報を二点相関関数に組み込むことを目指す。
    • 提案手法は,従来のマーキング統計と比較して,$\sigma_8$の制約を2.9倍,$\Omega_m$の制約を1.8倍に改善した。
    • パラメータ空間における潜在的な幾何学構造が,$\Omega_m$と$\sigma_8$の方向と一致しており,宇宙論的情報の主要軸を捉えていることを示唆する。
    • 本研究は,宇宙論的推論のための,より強力で解釈可能な要約統計量の開発への道を開く。

    Link: https://arxiv.org/abs/2606.11295

  • SPADE:自己回帰型高分解能カロリメーターシミュレーションのための分割と遅延埋め込み [physics.ins-det, cs.LG, hep-ex, hep-ph]目的:自己回帰型変圧器による高分解能カロリメーターシャワー生成
    • 素粒子物理学において,高精度なカロリメーターシミュレーションは,実験データの解釈に不可欠である。
    • 従来のシミュレーション手法は計算コストが高く,大規模実験での利用が課題となっている。
    • 多機能トークンを持つシーケンスに対する効率的な自己回帰モデルの構築を試みる。
    • SPADEは,ILD検出器的な光子シャワー生成において,最新のAllShowersモデルと競合しうる性能を示した。
    • SPADEは,以前のOmniJet-$\alpha_C$モデルを大幅に上回る性能を達成した。
    • このメカニズムは,多機能トークンを持つ任意の生成タスクに適用可能であり,高次元データに対するLLMスタイルの事前学習を可能にする。

    Link: https://arxiv.org/abs/2606.11304

  • 緩和された大域的幾何学における分散最適化のための量子化確率的原始二元法 [math.OC, cs.AI, cs.LG, cs.SY, eess.SY, stat.ML]目的:分散最適化における量子化確率的原始二元法の解析
    • 機械学習の発展に伴い,大規模データに対する分散最適化の重要性が増している。
    • 通信コストがボトルネックとなり,特に限られたビット数での通信が課題となっている。
    • 量子化による通信コスト削減と,それによる最適化性能への影響を明らかにする。
    • 提案手法q-PDGDは,緩和された大域的幾何学のもとで線形収縮を示す。
    • 定数ステップサイズを用いることで,勾配ノイズ,量子化歪み,ネットワーク接続性に基づいた近傍への線形収縮が確認された。
    • Polyak-Lojasiewicz不等式下では,同様の確率的量子化設定において近傍への線形収縮が達成された。

    Link: https://arxiv.org/abs/2606.11339

  • 焼きなましエントロピー配分によるランキングと選択 [stat.ML, cs.LG, math.OC]目的:ランキングと選択における逐次的な予算配分のための焼きなまし加重ソフトminフレームワーク
    • 最適な選択肢を見つけることは,リソース配分における重要な課題であり,様々な分野で応用が期待される。
    • 既存手法では,複数の候補がほぼ同程度に有効な場合,急激な切り替えが発生し,最適な配分が困難になる。
    • 本研究では,候補間のソフトmin重みを用いたサーロゲート関数により,急激な切り替えを緩和し,効率的な予算配分を実現する。
    • 提案手法は,古典的なmaximin定式化と同じ一次大偏差ターゲットを維持しつつ,より滑らかな配分を実現する。
    • ソフトmin重みは有効な候補に集中し,固定された重みのもとで誘導されるターゲット配分マップは単体内部で連続となることが示された。
    • ガウス分布と指数分布を用いた数値実験により,特に複数の候補がほぼ同程度の性能を示す場合に,提案手法の競争力と有効性が確認された。

    Link: https://arxiv.org/abs/2606.11347

  • 空間的にマスキングされた回帰は,電気生理学的記録における局所的および分布的予測可能性を明らかにする [q-bio.NC, cs.LG, physics.data-an, q-bio.QM]目的:電気生理学的記録における局所的情報と分布的情報の寄与度定量
    • 脳機能解明には,神経活動の空間的・時間的パターンを正確に把握することが不可欠である。
    • 電極記録は局所的な測定と解釈されがちだが,ネットワーク全体の活動の影響を考慮する必要がある。
    • 本研究は,電極信号が局所情報と分布情報にどの程度依存するかを明らかにすることを目的とする。
    • 空間的にマスキングされた回帰(SMR)を用いて,電極信号の再構成を試みた結果,高い再構成精度が確認された。
    • 近傍電極を除去しても予測可能性が残存し,電極信号が局所的な冗長性と広範な分布構造の両方を反映していることが示された。
    • EEGとiEEGを比較した結果,EEGの方が被験者間での転送がより強く,SMRが記録された信号の局所性と分布性のバランスを定量化する上で有用であることが示唆された。

    Link: https://arxiv.org/abs/2606.11415

  • FlexiBrain:解像度非依存型ボクセルレベルエンコーディングによるネイティブfMRI [eess.IV, cs.CE, cs.IT, cs.LG, math.IT, q-bio.NC]目的:ネイティブfMRIデータに対する解像度非依存型ボクセルレベルエンコーディングフレームワーク
    • 大規模ニューロサイエンス研究において,データ異質性が課題となっている。脳機能画像解析の発展には不可欠な要素である。
    • 既存手法は,データ均一化のため厳格な前処理を必要とし,解剖学的情報の損失や計算コスト増大を招いている。
    • FlexiBrainは,解剖学的情報を保持しつつ,計算コストを削減し,よりロバストなボクセルレベルfMRIモデル開発を可能にする。
    • FlexiBrainは,Mamba-JEPAを基盤とする解像度非依存型ボクセルレベルエンコーディングフレームワークであり,物理単位でパッチサイズを定義し動的にリサイズする。
    • 5つの異なる下流タスクにおいて,FlexiBrainは最先端手法を凌駕し,最大12パーセントポイントの性能向上を達成した。
    • FlexiBrainは,シームレスなプラグインモジュールとして機能し,前処理コストを大幅に削減し,開発を加速させる。

    Link: https://arxiv.org/abs/2606.11500

  • 都市熱ミニキューブ:都市熱研究のためのAI対応データセット [physics.ao-ph, cs.LG]目的:都市熱研究における機械学習応用を目的とした,公開されたFAIR指向のデータセット
    • 都市の熱環境は,健康やエネルギー消費に影響するため,その理解と対策が重要である。
    • 都市の熱環境は場所によって大きく異なるが,詳細なデータ収集と解析が困難である。
    • 本研究は,都市熱環境の解析を容易にするための,準備済みのデータセットの提供を目指す。
    • 「都市熱ミニキューブ」は,南北アメリカ大陸の48都市における2022-2023年の90x90kmのグリッドデータを公開する。
    • Landsat 8/9,Sentinel-1,GOES-R等の多種多様なセンサーデータが,空間・時間的に整合性の取れた形式で提供される。
    • 本データセットは,都市熱環境に関する機械学習モデルの開発と検証を促進することが期待される。

    Link: https://arxiv.org/abs/2606.11534

  • 脳波とfNIRSを用いたうつ状態の分類に関するエンドツーエンド機械学習 [q-bio.NC, cs.AI, cs.LG]目的:うつ状態の分類のための機械学習フレームワーク
    • 社会的なストレス増大により精神医療の需要が高まっており,客観的な診断手法が求められている。
    • 従来の精神医学的診断は主観的なバイアスや医師の判断に依存し,客観性に課題がある。
    • 脳波やfNIRSなどの生体信号を用いた客観的なうつ状態の検出方法を確立すること。
    • 本パイロット研究では,11名の健康な学生を対象に,生体信号に基づいたうつ状態検出の基礎となる枠組みを構築した。
    • 提案するフレームワークは,臨床利用に向けた自動化された客観的診断ツール開発の第一歩となる。
    • 高齢者におけるうつ病と認知症の合併が高いため,早期の鑑別が重要である。

    Link: https://arxiv.org/abs/2606.11555

  • 電子健康記録におけるロバストかつ柔軟な知識転移によるスペクトル埋め込みの強化 [stat.ML, cs.LG, stat.ME]目的:電子健康記録からの臨床概念と患者の低次元埋め込み
    • 希少疾患の分析では,データ数が限られるため,有効な分析手法が求められる。
    • 既存手法は,潜在データ行列と知識行列間の厳格な信号整合性を仮定し,現実的でない場合がある。
    • 共有信号が弱く,部分的にしか整合しない希少疾患データにおける埋め込み精度向上。
    • 提案手法は,知識行列から無関係な成分を除去し,共有成分と異質成分を分離して回復する二段階のスペクトル埋め込み手順を導入した。
    • シミュレーションと多発性硬化症コホート分析の結果,既存手法と比較して性能が向上した。
    • 特に,共有信号が弱く,部分的にしか整合しない状況下で顕著な効果が確認された。

    Link: https://arxiv.org/abs/2606.11570

  • 量子回路シミュレーション性能予測のためのファミリーを意識した残差アーキテクチャ [hep-ex, cs.SY, eess.SY, quant-ph, cs.ET, cs.LG]目的:量子回路シミュレーションの性能予測
    • 量子コンピュータの発展には,効率的なシミュレーションが不可欠である。
    • 近似テンソルネットワークシミュレータの最適なパラメータ選択は,試行錯誤に依存し,計算コストが高い。
    • アルゴリズムファミリーに着目し,シミュレーションコスト予測の精度向上を目指す。
    • 提案アーキテクチャは,目標とする忠実度を達成するための最小近似閾値を高精度に予測可能である。
    • 予測時の推論時間は約50ミリ秒と短く,従来の試行錯誤によるシミュレーションに要する時間を大幅に短縮できる。
    • アルゴリズムファミリーを考慮したモデリングが性能向上に最も大きく貢献することが確認された。

    Link: https://arxiv.org/abs/2606.11620

  • ロバストな非線形システム同定のためのQENDyの積分定式化 [math.DS, cs.LG]目的:非線形システムの同定
    • 複雑なシステムのモデル化には,正確な同定が不可欠である。
    • 従来の同定手法は,ノイズに弱く,高精度なモデルが得られない場合がある。
    • ノイズの影響を受けにくい,ロバストな同定手法を確立すること。
    • 本研究では,QENDyの新しい積分定式化を提案し,時間微分計算の必要性をなくした。
    • これにより,ノイズに対する感度が低減され,よりロバストなシステム同定が可能となった。
    • 提案手法は,従来のQENDyよりも,より安定したダイナミクスの学習を可能にする。

    Link: https://arxiv.org/abs/2606.11629

  • 量子注意による高次トークン相互作用 [quant-ph, cs.LG]目的:高次トークン相互作用の効率的な計算手法
    • 自然言語処理の性能向上には,トークン間の複雑な関係性を捉えることが不可欠である。
    • 従来の注意機構では,高次相互作用の表現に計算資源の制約がある。
    • 量子注意を用いることで,浅い層で高次トークン相互作用を効率的に表現することを目指す。
    • 量子高次注意(QHA)は,データ再アップロードと非クリフォードエンタングラを利用し,回路内で高次相互作用を合成する。
    • QHAは,標準的な注意機構では表現できない高次相関を,浅い回路で表現可能であることを理論的に証明した。
    • 実験的に,QHAは隠れ部分パリティ問題において,従来の注意機構よりも優れた汎化性能を示し,遺伝的エピスタシス,ノイズを含むパリティ学習,グラフ三角形検出などのタスクで高い性能を発揮した。

    Link: https://arxiv.org/abs/2606.11673

  • 近接系外惑星集団の機械学習によるクラスタリング:かき集めによる形成との関連性 [astro-ph.EP, astro-ph.IM, cs.LG]目的:近接系外惑星集団の内在的な構造
    • 系外惑星探査は,太陽系外における惑星系の多様性を理解する上で重要である。
    • 観測された系外惑星と理論モデルの間の定量的な関係性を確立することが困難である。
    • 機械学習を用いて,観測された系外惑星集団と形成過程の関連性を明らかにすること。
    • 近接系外惑星を,惑星と恒星の相互作用を表す動的パラメータに基づき,ガウス混合モデルを用いてクラスタリングした。
    • クラスタは,かき集めによる形成のシミュレーション集団にマッピングされ,ガスの有無や組成比が分析された。
    • 超巨大ガス惑星は,ホットジャイアントやウォームジャイアント優位の集団よりも早い形成時代に関連していることが示された。

    Link: https://arxiv.org/abs/2606.11737

  • バッチ数制約のない更新型Lasso: 勾配強化アプローチ [stat.ML, cs.LG]目的:高次元一般化線形モデルにおけるオンライン推定
    • ストリーミングデータに対する効率的なモデル推定は,現代のデータ解析において不可欠である。
    • 既存手法はバッチ数に制約があり,大規模データへの適用が困難であった。
    • バッチ数制約を解消し,高次元データにおける推定精度向上を目指す。
    • 提案手法では,過去の要約情報のみを用いる勾配強化された代理損失関数を導入した。
    • この手法により,既存の更新型推定法の改良とバッチ数制約の除去を実現した。
    • シミュレーションおよび実データ解析の結果,既存手法と比較して高い精度が確認された。

    Link: https://arxiv.org/abs/2606.11738

  • インターリーブスタッキングを用いた高速音声基盤モデル蒸留 [eess.AS, cs.AI, cs.CL, cs.SD]目的:高速音声基盤モデル蒸留の効率化
    • 音声基盤モデルは様々な音声タスクに応用可能であり,その重要性が増している
    • 蒸留は推論速度を向上させるが,学生モデルの学習に時間がかかる
    • スタッキングによって学習を加速し,モデルの展開を迅速化することを目指す
    • 提案手法であるインターリーブスタッキングは,層の位置を維持することで性能劣化を抑制する。
    • 実験の結果,SUPERBにおいて有効性が確認された。
    • インターリーブスタッキングは,従来のスタッキング手法よりも学習効率が高いことが示された。

    Link: https://arxiv.org/abs/2606.11766

  • 楽観的乗数重み更新の最終反復収束 [math.OC, cs.LG]目的:凸/非凸鞍点問題に対する楽観的乗数重み更新(OMWU)の漸近収束
    • ゲーム理論や機械学習において,鞍点問題は重要な最適化問題として広く現れる。
    • OMWUはOGDAの非ユークリッド的なエントロピー版だが,その漸近収束性には未解決の問題があった。
    • 本研究は,OMWUの漸近収束性を証明し,鞍点問題の解法に貢献する。
    • 滑らかな凸凹鞍点問題において,適切な学習率下でOMWUが漸近的に収束することを証明した。
    • この結果は,一意性,厳密補完性,誤差限界,解近傍での初期化を必要としない。
    • 境界議論を用いることで,全ての集積点は不活性座標KKT条件を満たすことを示した。

    Link: https://arxiv.org/abs/2606.11773

  • 時間不整合制御問題における均衡学習のための決定論的方策勾配法 [q-fin.CP, cs.LG, math.OC]目的:時間不整合制御問題における決定論的均衡方策の学習
    • 金融工学等に応用が期待され,時間不整合性の影響を考慮した最適な意思決定が重要である。
    • 従来の制御理論では時間不整合性を適切に扱えず,実用的な問題への適用が困難であった。
    • 時間不整合性を考慮した均衡方策を効率的に学習し,実用的な問題への応用を目指す。
    • 提案手法は,拡張ハミルトン・ヤコビ・ベルマン方程式を用いて問題を二段階に分割することで均衡方策を学習する。
    • 決定論的方策勾配法と内点反復法を組み合わせたactor-critic型反復により,時間不整合性の様々な要因に対応できる。
    • 平均分散ポートフォリオ管理や非指数割引最適追跡ポートフォリオといった古典的な金融応用において,その有効性が示された。

    Link: https://arxiv.org/abs/2606.11798

  • 解釈可能な量子状態トモグラフィのためのスパース化されたコルモゴロフ・アーノルド・ネットワーク [quant-ph, cs.AI, cs.LG]目的:量子状態トモグラフィにおける解釈可能な再構成規則の確立
    • 量子技術の発展には,量子状態の正確な再構成が不可欠である。
    • 機械学習は高い精度を達成するが,モデルの内部構造が不明瞭である。
    • 学習モデルの構造を検証可能な形で表現し,物理構造との整合性確認を可能にする。
    • スパース化されたコルモゴロフ・アーノルド・ネットワーク(KAN)は,再構成規則として機能し,内部構造が検証可能であることが示された。
    • 有限ショットサンプリングと非偏光ノイズ下で,KANはGHZ状態に関連するパウリ演算子のセットを正確に特定した。
    • KANの構造は,GHZ状態の解析的なパウリ群化と一致し,経路レベルでの構造的解釈可能性を示した。

    Link: https://arxiv.org/abs/2606.11814

  • REACH:多チャンネル車両チャネル推定のための解釈可能性に基づく特徴特定とアーキテクチャ圧縮 [eess.SP, cs.LG]目的:多チャンネル混合SNRトレーニングにおける深層学習チャネル推定器の汎化性能向上メカニズムの解明
    • 車両通信における無線チャネル推定は,信頼性の高いデータ伝送に不可欠であり,その性能向上が重要である。
    • 深層学習モデルのブラックボックス性は,その解釈性と信頼性の低下を招き,実用化の障壁となっている。
    • チャネル推定器の解釈可能性を高め,モデルの圧縮による性能劣化を最小限に抑えることで,実用性を向上させる。
    • 提案手法REACHにより,チャネル条件を通して一貫して重要な時周波数特徴を特定し,入力次元削減を可能にした。
    • REACHは,ほぼ普遍的な内部表現を明らかにし,観測されたOOD汎化性能を説明する表現的根拠を提供した。
    • 得られたフィルター分類に基づいたアーキテクチャ圧縮により,パラメータ数とFLOPsを大幅に削減しつつ,NMSE劣化を1dB未満に抑えた。

    Link: https://arxiv.org/abs/2606.11857

  • ラベルシフト下における共形ベイズ:事後キャリブレーション vs. 学習時適応 [stat.ML, cs.LG]目的:ラベルシフト下における共形ベイズの妥当性と効率性
    • 機械学習モデルの汎化性能向上は重要であり,特にドメイン間の不一致は課題となる。
    • ラベルシフトは,学習データとテストデータのラベル分布の不一致を引き起こし,予測性能を低下させる。
    • ラベルシフトに対応しつつ,予測区間の妥当性と効率性を両立させる手法を確立する。
    • 事後キャリブレーションと学習時適応という2つのアプローチが,ターゲットドメインにおける妥当なカバレッジを回復する。
    • バイアスがない状況下では,両アプローチが同等のカバレッジを達成する。
    • 学習最適化においては,学習時適応がバイアスを軽減し,区間幅を縮小する。

    Link: https://arxiv.org/abs/2606.11865

  • 不確実性を考慮したニューラルネットワークによる磁性材料特性のモデル化 [cond-mat.mtrl-sci, cs.LG]目的:磁性材料の特性予測におけるモデルの信頼性評価
    • 材料開発において,計算コスト削減と効率化が求められている。
    • 高品質なデータ不足と分布外予測の必要性から,予測の信頼性が課題となる。
    • モデルの不確実性定量化により,予測の信頼性を評価する手法を確立する。
    • 古典的機械学習モデルと最新モデルの不確実性推定の質を比較検証した。
    • ガウス負対数尤度損失とドロップアウト法を適用し,予測不確実性の推定を試みた。
    • グラフニューラルネットワークを用いて,微細構造情報からの強制力予測への応用を示した。

    Link: https://arxiv.org/abs/2606.11870

  • 検出限界以下の観察:HR+/HER2-転移性乳癌におけるctDNA時系列解析のための検閲ポアソンベイズ潜在成長変化点検出器(Span検出器) [q-bio.QM, cs.LG, stat.ME]目的:HR+/HER2-転移性乳癌患者のctDNA時系列データを用いた,薬剤耐性の早期検出
    • 循環腫瘍DNA(ctDNA)は,画像診断よりも前に薬剤耐性の兆候を示すため,早期診断と治療介入に重要。
    • ctDNAの検出限界以下の場合,微小な亜集団の断続的な検出となり,情報が失われるという課題がある。
    • 検出限界以下のデータも活用し,薬剤耐性の兆候をより早期に,かつ正確に検出することを目指す。
    • Span検出器は,検閲ポアソンモデルを用いて二値検出プロセスをモデル化し,検出率の上昇を示す変化点を検出する。
    • シミュレーションデータにおいて,Span検出器は,従来のsnapshot法と比較して,進行性の兆候を約2倍捉えることができた。
    • 実際の乳癌データを用いた検証では,既存のCoxモデルと同等の予測性能を示し,そのメカニズムの妥当性を確認した。

    Link: https://arxiv.org/abs/2606.11876

  • 持続性から生存性へ:トポロジー的特徴量に対する仮説検定,効果量,およびベクトル化 [stat.ML, cs.LG, math.AT]目的:トポロジー的特徴量の比較と機械学習への応用
    • トポロジーデータ解析は,データの本質的な形状を捉え,様々な分野で応用が広がっている。
    • 既存手法では,持続性図形の統計的比較と,その後の予測との間に一貫性がないという課題があった。
    • 持続性図形を生存データとして扱い,仮説検定とベクトル化を統一的に行う手法を開発すること。
    • STRANDは,持続性値をイベント時間とみなし,生存関数に基づいて持続性図形を比較する。
    • 開発したノンパラメトリック検定は,Type Iエラーの制御と高い検出力を両立している。
    • STRANDは,ベンチマークデータセットにおいて,既存のベクトル化手法と同等以上の性能を示した。

    Link: https://arxiv.org/abs/2606.11911

  • 車両IoTネットワークにおけるCSIに基づく位置推定のためのエッジトリガー分散推論 [eess.SP, cs.LG]目的:CSIに基づく位置推定におけるエッジトリガー分散推論(ETDI)の実現
    • 車両IoTネットワークにおいて,高精度な位置推定は自動運転や安全運転支援に不可欠である。
    • 分散アンテナアレイからのCSI情報を全て中央に送信すると,通信資源の浪費や遅延が発生しやすい。
    • 有用な情報を持つアンテナアレイのみを効率的に選択し,位置推定精度を向上させることを目指す。
    • 提案手法NARRASは,既存のスパースレポート戦略と比較して,同等のアップリンク活動量で位置推定精度を向上させる。
    • チャネルチャート正則化を用いることで,スパースレポート下での位置推定誤差の変動を抑制し,ロバスト性を高める。
    • ETDIは,リソース制約のあるデバイスが共通の推論タスクのためにアクセスチャネルを共有する,より広範な問題に適用可能である。

    Link: https://arxiv.org/abs/2606.11914

  • 注意における相転移:コピーヘッド創発のベイズ理論 [math.SP, cs.SI, math-ph, math.MP, physics.data-an, stat.ML, cond-mat.dis-nn, cs.LG]目的:注意メカニズムにおける特徴学習の理論的解明
    • Transformerの性能向上に不可欠な注意メカニズムの理解が求められている。
    • 注意パターンが訓練中に急激に現れる現象の理論的説明が課題であった。
    • 注意メカニズムにおける相転移をベイズ理論を用いて解明し,コピーヘッドの創発過程を明らかにする。
    • ソフトマックス注意機構においては,訓練データ量に応じて明確な一次相転移が確認された。
    • 一方,線形注意機構では,初期に二次相転移が見られ,その後,滑らかな連続的な変化を経て構造化された注意パターンへと進化する(クロスオーバー)。
    • 本研究は,大規模言語モデルの訓練におけるコピーサブ回路の急激な創発を,理論的に説明する第一歩となる。

    Link: https://arxiv.org/abs/2606.12058

  • 量子オッカム学習:回路ベース量子学習におけるサンプルによる表現力 [quant-ph, cs.LG]目的:有限サイズの量子回路で生成された量子データに対する情報理論的オッカム理論
    • 量子機械学習において,表現力はデータ学習の重要な要素である。量子データの表現を学習するには,統計的な意味を持つ表現力が必要となる。
    • 表現力は重要だが,有限のデータサンプル数で学習可能な範囲に制限されている。表現力とサンプル数の間の適切なバランスが課題である。
    • サンプル数に基づいて,量子回路の表現力を評価し,最適な回路複雑度を選択するための枠組みを提供する。
    • 有限サイズの量子回路生成データに対し,実現可能なサンプル数は回路のゲート数に依存する。
    • データに基づいたモデル選択定理により,事前にゲート数を指定する必要がなくなる。
    • サンプル数と許容誤差に基づき,サポート可能なゲート数を評価する表現力法則を導出した。

    Link: https://arxiv.org/abs/2606.12211

  • AIのためのマーケット設計:著作権二分法の克服 [econ.TH, cs.AI, cs.GT, cs.LG, stat.ML]目的:AIモデルの学習に利用される人間が生成したコンテンツのマーケット設計
    • AI技術の進歩には,大量の学習データが不可欠であり,そのデータ供給が重要課題となっている。
    • 既存の著作権制度では,コンテンツ制作者への適切な報酬が確保されず,創作意欲が減退する可能性がある。
    • 創作者のインセンティブを維持しつつ,AIの性能向上を両立できるマーケット設計を提案することを目的とする。
    • 「無制限利用」と「強固な知的財産権」のどちらも,創作者への報酬や創作意欲の維持に問題があることが示された。
    • 特に革新的な創作者は,「独創性へのペナルティ」により,十分なインセンティブが得られないという現象が明らかになった。
    • データ仲介者による外部不経済の内部化と,革新的な貢献への補助金支給によって,効率的なマーケット設計が可能となることが示唆された。

    Link: https://arxiv.org/abs/2606.12260

  • LSTMに基づくIoTデバイス識別 [cs.CR, cs.AI, cs.LG]目的:IoTデバイスの識別方法
    • IoTデバイスの普及に伴い,セキュリティ対策の重要性が高まっている。
    • IoTデバイスの種類の多様性から,個々のデバイスの識別が困難である。
    • LSTMを用いて,IoTデバイスを効率的に識別する手法を開発すること。
    • 本研究では,Aalto大学のデータセットを用いて,LSTMネットワークによるIoTデバイス識別パイプラインを提案した。
    • 25種類の特徴量を抽出し,時系列データとしてLSTMに入力することで,識別精度を向上させた。
    • 最適な設定では,テストデータにおいて79.85%の正答率と75.70%のF1スコアを達成した。

    Link: https://arxiv.org/abs/2304.13905

  • オフラインマルチエージェント強化学習における拡散モデルによる汎化性能とデータ効率の向上 [cs.AI, cs.LG, cs.MA]目的:オフラインマルチエージェント強化学習における汎化性能とデータ効率の向上
    • マルチエージェントシステムは,現実世界の複雑な問題を解決する上で重要であり,その学習技術の進歩が求められている。
    • 既存のオフライン強化学習アルゴリズムは,環境変化に対する頑健性やデータ効率に課題がある。
    • 拡散モデルを用いることで,ポリシーの表現力と多様性を高め,環境変化への適応性とデータ効率を改善する。
    • 提案手法であるDOM2は,既存の最先端手法と比較して,マルチエージェント環境における性能,汎化性能,データ効率において顕著な改善を示す。
    • DOM2は,環境が変化した場合でも,その高い表現力と多様性により,30の設定中28個で優れた汎化性能を発揮する。
    • DOM2は,既存アルゴリズムと同等の性能を達成するために,5%以下のデータ量で済むため,データ効率が20倍向上する。

    Link: https://arxiv.org/abs/2307.01472

  • マルチユーザー遅延制約付きスケジューリングのためのオフライン拡散ポリシー [cs.AI]目的:マルチユーザー遅延制約付きスケジューリングの効率的なポリシー
    • 組み込みAI,メッセージング等,様々なリアルタイムシステムにおいて,効率的なリソース配分が不可欠である。
    • 従来の学習手法は,システム動特性の推定が困難であり,オンラインでのシステムとのインタラクションが必要となる。
    • オフラインデータのみから,遅延制約を考慮した高性能なスケジューリングポリシーを学習すること。
    • 提案手法SOCDは,オフラインデータのみを用いて,拡散ポリシーと批評家ネットワークを組み合わせることで,効率的なスケジューリングポリシーを学習する。
    • SOCDはラグランジュ乗数最適化をオフライン強化学習に統合し,オンラインでのシステムとのインタラクションを不要とする。
    • 実験結果は,SOCDが様々なシステム動特性に対してロバストであり,既存手法と比較して優れた性能を発揮することを示している。

    Link: https://arxiv.org/abs/2501.12942

  • 汚染に着目:水文情報に基づいたノイズを考慮した学習によるジオ空間PFASマッピング [cs.CY, cs.SI, cs.CY, physics.soc-ph, cs.CV, cs.AI, cs.CY, cs.LG]目的:ジオ空間PFAS汚染マッピングのための深層学習フレームワーク
    • PFASは環境中に残留し,健康への影響が懸念されるため,広範囲なモニタリングが重要である。
    • 現地サンプリングのコストと労力により,大規模モニタリングが困難であり,データが不足している。
    • AIを活用し,限られたデータと環境情報を統合することで,汚染リスク評価を支援する。
    • FOCUSは,既存手法と比較してPFAS汚染マッピングにおいて,空間的な一貫性を保ちながら高い精度を達成した。
    • 水文連結性,土地被覆,発生源からの距離といった要素を考慮した学習により,ロバストな予測が可能となった。
    • 本研究は,完全な物理モデルがない状況下で,追加サンプリングの優先順位付けと汚染源の特定に貢献する。

    Link: https://arxiv.org/abs/2502.14894

  • 知覚シーケンスからのパターンと抽象化の学習 [cs.RO, cs.SY, eess.SY, cs.RO, cs.LG]目的:知覚シーケンスにおけるパターンと抽象化の学習メカニズム
    • 認知科学において,知覚情報はどのように構造化され,学習,汎化,予測を可能にするのかが重要である。
    • 高次元の感覚情報から意味のある構造を抽出する際の,計算原理が未だ不明確である。
    • シーケンス構造の効率的な学習と表現を可能にする,チャンキングと抽象化の原理を解明する。
    • 実験により,人間は速度と正確性を両立させながら,潜在的なチャンクに適応することが示された。
    • 提案モデルは,シーケンスをチャンクごとに解析し,再利用可能なプリミティブとして機能する階層構造を学習する。
    • 本研究は,チャンキングと抽象化という単純な計算原理が,構造化された知識獲得を可能にすることを示唆する。

    Link: https://arxiv.org/abs/2503.10973

  • リソース制約下における逐次学習のための腫瘍形態ニューラルエージェント集団 [cs.NE]目的:リソース制約下における逐次学習のための,腫瘍形態に着想を得たニューラルエージェント集団の有効性
    • 分散型人工知能は,限られた計算資源下で効率的に機能する必要がある。
    • 従来の集中型最適化手法では,分散環境での適応が困難である。
    • 腫瘍形態のダイナミクスを利用することで,分散環境下での適応能力を高めることを目指す。
    • エージェント集団における選択圧が高まるほど,生存エージェントの局所精度が向上することが確認された。
    • 初期集団の多様性やクローン集団の規模に応じて,アーキテクチャ変異が最適な役割を果たすことが示された。
    • 資源の獲得と複製速度の向上は人口動態を変化させつつも,予測精度は一定範囲内に維持された。

    Link: https://arxiv.org/abs/2503.12743

  • 中間トークンを人格化しないこと:推論/思考の痕跡として捉えることの危険性 [cs.RO, cs.AI]目的:中間トークン生成に関する誤った解釈と,その研究への悪影響
    • 大規模言語モデルの推論能力向上には,その内部プロセス理解が不可欠である。
    • 中間トークンを人間の思考プロセスと同一視する傾向があり,誤った解釈を招く。
    • 中間トークンの人格化を避け,モデルの特性に基づいた適切な利用を促す。
    • 中間トークンは,人間の思考過程を反映しているわけではなく,単なるモデルの出力に過ぎない。
    • 中間トークンを人格化することで,モデルの限界や特性を見誤り,効果的な活用が阻害される。
    • 研究コミュニティ全体で,中間トークンを人格化しない姿勢を持つことが重要である。

    Link: https://arxiv.org/abs/2504.09762

  • 消去されたが忘れ去られない:バックドアが概念消去をどのように侵害するか [cs.CR, cs.AI, cs.LG]目的:テキスト画像生成モデルにおける有害な出力に対する概念消去手法の脆弱性評価
    • テキスト画像生成モデルの拡大に伴い,有害な出力への懸念が高まっている。
    • 既存の概念消去手法は,有害概念との関連を完全に削除できず,表層的な繋がりを隠蔽している可能性がある。
    • 概念消去手法に潜むバックドア脆弱性を明らかにし,将来的な手法の堅牢性評価に貢献する。
    • 概念消去後にバックドアトリガーが残存し,有害コンテンツを生成する「Erasure Evasion Backdoor (EEB)」の存在を明らかにした。
    • 6つの最先端の消去手法に対し,有名人識別解除で最大82%,物体消去で最大94%の成功率でEEBによる有害コンテンツの露呈を確認した。
    • EEBは既存手法の盲点を明らかにする一方で,将来的な概念消去技術のストレステストツールとしても活用できる。

    Link: https://arxiv.org/abs/2504.21072

  • 離散時間ガウス過程混合モデルのロボットポリシー学習における非合理的な有効性 [cs.CC, cs.DM, math.CO, cs.RO, cs.AI, cs.LG]目的:ロボットマニピュレーションにおける柔軟なポリシー表現と模倣学習
    • ロボットによる複雑なタスクの自律的な実行は,製造やサービス業など様々な分野で重要である。
    • 従来のロボット学習手法は,大量のデータや複雑な環境設定を必要とし,汎化性能に課題があった。
    • 少ないデータからの学習と,多様なタスクへの汎化を可能にする新しいポリシー表現手法の開発。
    • MiDiGapは,わずか5件のデモンストレーションから学習でき,カメラ画像のみを用いて高い汎化性能を示す。
    • 複雑なタスク(コーヒーを作る,ドアを開ける,スコップで掬うなど)や,多峰性タスク(マグカップを掛けるなど)において優れた性能を発揮する。
    • RLBenchなどのベンチマークタスクにおいて,ポリシーの成功率を大幅に向上させ,軌跡コストを削減する。

    Link: https://arxiv.org/abs/2505.03296

  • 速度正則化Adam:物理学に着想を得た最適化手法 [eess.SY, cs.SY, cs.RO, cs.LG, cs.AI, quant-ph]目的:深層ニューラルネットワークの学習のための最適化
    • 深層学習の性能向上には,効率的な最適化手法が不可欠である。
    • 従来のAdamなどの最適化手法は,不安定な状態近傍で振動し,収束が遅くなる場合がある。
    • 本研究は,速度に基づく正則化により振動を抑制し,安定した収束を実現する。
    • 速度正則化Adam(VRAdam)は,学習率に速度に基づく高次のペナルティを加え,大きな重み更新を抑制する。
    • VRAdamは,高い速度領域において効果的な動的学習率の縮小と振動の減衰を実現する。
    • 画像分類,言語モデリング,生成モデリングなど,様々なタスクにおいてAdamWを含む既存の手法を上回る性能を示す。

    Link: https://arxiv.org/abs/2505.13196

  • Pass@K ポリシー最適化:より困難な強化学習問題の解決 [cs.LG, cs.AI, cs.CL, stat.ML]目的:pass@k性能の直接最適化
    • 強化学習は,複雑な意思決定問題を解決する強力な手法であり,様々な分野への応用が期待されている。
    • 従来の強化学習は,単一のサンプルに偏重し,サンプル集合全体の有用性を活かしきれていない。
    • サンプル集合の共同の報酬を最大化することで,探索を改善し,より困難な問題の解決を目指す。
    • 提案手法Pass@K Policy Optimization(PKPO)は,pass@k性能を直接最適化する報酬変換を行う。
    • この手法により,kの値にかかわらず,安定した効率的な最適化が可能となる。
    • 実験結果から,PKPOはpass@1性能を維持しつつ,pass@k性能を大幅に向上させることが示された。

    Link: https://arxiv.org/abs/2505.15201

  • レンジ演算:信頼できない相手先における検証可能な深層学習推論 [cs.CR, cs.AI, cs.ET, cs.LG, cs.PF]目的:分散型機械学習における深層学習推論の検証
    • ブロックチェーンの制約から推論を外部に委託するケースが増加しているため,計算の正確性を保証する必要がある。
    • 再実行なしに計算の正しさを検証する効率的な方法が課題となっている。
    • 効率的かつ検証可能な深層学習推論を実現し,検証コストを削減すること。
    • 本研究では,レンジ演算という新しいフレームワークを提案し,非算術演算を検証可能な算術ステップに変換する。
    • ブールエンコーディングや大規模なルックアップテーブルを回避しつつ,既存手法と同等の性能を達成した。
    • 検証コスト,推論側の計算負荷,および通信オーバーヘッドを削減することに成功した。

    Link: https://arxiv.org/abs/2505.17623

  • 差分プライバシー学習におけるバウンド付き適応クリッピングによる不均衡な影響の緩和 [cs.LG, cs.CR, stat.ML]目的:差分プライバシー学習における不均衡な影響の緩和
    • プライバシー保護は重要であり,機械学習モデルの利用拡大には不可欠である。
    • 既存手法では,少数グループに対して予測精度に不均衡が生じる場合がある。
    • 適応クリッピングの過度な勾配抑制を防ぎ,少数グループの精度低下を改善する。
    • 提案手法は,Skewed MNISTとFashion MNISTにおいて,無制限適応クリッピングと比較して最悪クラスの精度を10%以上向上させた。
    • Automaticクリッピングと比較して7%,定数クリッピングと比較して5%の精度向上を確認した。
    • バウンド付き適応クリッピングは,勾配抑制を抑制することで公平性を高める。

    Link: https://arxiv.org/abs/2506.01396

  • MLaGA:マルチモーダル大規模言語・グラフアシスタント [cs.AI]目的:マルチモーダルグラフにおける推論能力の向上
    • 現実世界のデータはテキストだけでなく画像など多様な形式で存在し,グラフ構造で表現されることが多い。
    • 既存のLLMベースのグラフ手法は,テキスト属性が豊富なグラフに特化しており,マルチモーダルグラフへの応用が遅れている。
    • テキストと画像などの多様な属性を持つグラフデータに対するLLMの推論能力を拡張し,実用的な性能を示す。
    • MLaGAは,テキストと視覚的属性を統合した構造を意識したマルチモーダルエンコーダを設計し,グラフ事前学習を通して属性を整列させる。
    • 軽量なプロジェクターを用いて,マルチモーダル特徴とグラフ構造をLLMにシームレスに統合するマルチモーダル命令チューニングを実装した。
    • 複数のデータセットにおける実験で,MLaGAは最先端のベースライン手法と比較して,様々なグラフ学習タスクで優れた性能を示した。

    Link: https://arxiv.org/abs/2506.02568

  • 拡散に基づく累積敵対的浄化によるビジョン言語モデルの保護 [cs.CV, cs.AI]目的:ビジョン言語モデルにおける敵対的摂動に対する堅牢性の向上
    • マルチモーダル理解において優れた性能を示すビジョン言語モデルの信頼性確保が重要である。
    • 人間には知覚できない程度の摂動が,モデルの出力結果を大きく変化させ,誤った判断を招く可能性がある。
    • 敵対的摂動を効果的に中和し,ビジョン言語モデルの安全な運用を実現することを目的とする。
    • 本研究では,拡散過程において意味的な変化の収束速度を理論的に定量化し,敵対的影響が単調に減少することを示した。
    • 提案手法DiffCAPは,ビジョン言語モデルの埋め込み間の類似性に基づいてノイズ注入の閾値を適応的に決定し,効率的なノイズ除去を実現する。
    • 実験結果から,DiffCAPは既存の防御手法と比較して大幅な性能向上を示し,ハイパーパラメータ調整の複雑さや拡散時間を削減することが確認された。

    Link: https://arxiv.org/abs/2506.03933

  • LLMファインチューニングにおける安全性の確保:狭い安全領域へのアンカリング [cs.LG]目的:LLMのファインチューニングにおける安全性維持
    • LLMの利用拡大に伴い,安全性確保の重要性が増している
    • ファインチューニング時に有害データが混入しやすく,安全性が損なわれる
    • ファインチューニング時の更新方向を制御し,安全性を維持すること
    • AsFTは,ファインチューニングにおける更新方向を制約することで,モデルを狭い安全領域内に留める。
    • 実験の結果,AsFTは有害な挙動を最大7.60%削減し,タスク性能を3.44%向上させた。
    • 既存手法と比較して一貫して優れた性能を示した。

    Link: https://arxiv.org/abs/2506.08473

  • 言語モデル解釈のためのクロスレイヤー離散概念発見 [cs.DC, cs.CC, cs.LG, cs.AI, cs.CL]目的:言語モデルの解釈可能性向上
    • 言語モデルは高度な性能を示す一方,内部メカニズムは不透明であり,解釈が困難である。
    • 層間のresidual streamにより特徴が混合・重複し,単一層の分析では構造を捉えられない。
    • residual streamの影響を解消し,解釈可能な概念ベクトルを抽出する。
    • CLVQ-VAEは,既存手法と比較して概念除去による精度低下が最大93%に達した。
    • LLMによる概念評価において,本手法が66.7%のケースで最上位にランクされた。
    • ヒューマンアノテーターによる予測再現率は78%であり,クラスタリングの54%を上回った。

    Link: https://arxiv.org/abs/2506.20040

  • 出現構造の理論としての持続ホモロジー [cs.PF, cs.LG]目的:出現構造の持続性に関する理論的枠組み
    • 複雑系の理解に不可欠であり,微視的な変化があっても巨視的な構造が維持される理由を解明する。
    • 出現現象の数学的な定義が難しく,その普遍的な性質を捉えることが困難である。
    • 持続ホモロジーを用いて出現構造を定量化し,その安定性や頑健性を予測する。
    • 持続ホモロジーを用いることで,出現特性を「測定問題」として捉え,数学的に定義することが可能となった。
    • スペクトルギャップの存在が,出現構造の安定性を示す指標となりうることを示した。
    • 大気,神経,社会システムにおける出現構造の予測可能性について,検証可能な仮説を提示した。

    Link: https://arxiv.org/abs/2507.03065

  • 既約要素からの線形層の構成 [cs.LG]目的:線形層の構成要素としての幾何学的素元の同定と合成
    • 大規模モデルの振る舞いから,低レベルな素元がより高機能なモジュールを構成することが示唆されている。
    • これらの素元が十分に理解されておらず,効率的なモデル構築の阻害要因となっている。
    • 幾何学的素元を用いた線形層の表現と,その分解アルゴリズムの開発。
    • 線形層は双ベクトル(向き付き平面)の合成として表現可能であることが,クリフォード代数を用いて示された。
    • 双ベクトルを生成するロータの積から線形層を分解する微分可能なアルゴリズムが提案された。
    • 提案手法は,従来の密行列に比べてパラメータ数を大幅に削減し,LLMの性能を維持した。

    Link: https://arxiv.org/abs/2507.11688

  • マルチモーダルAIエージェントによる持続可能性評価 [cs.AI, cs.CE]目的:電子機器のカーボンフットプリントの自動推定
    • 計算産業の環境負荷増大に対応するため,電子機器の排出量評価が不可欠である。
    • 従来のLCAは,専門的知識とデータ収集に時間を要し,情報が入手困難な場合が多い。
    • 公開情報を活用し,迅速かつ高精度なカーボンフットプリント推定を実現する。
    • マルチモーダルAIエージェントシステムが,専門家によるLCAの代替として機能することが示された。
    • システムは,専門家によるLCAの19%以内の誤差でカーボンフットプリントを算出可能である。
    • ドメイン知識の活用により,環境負荷推定がデータ駆動型予測タスクとして再構築された。

    Link: https://arxiv.org/abs/2507.17012

  • OCSVM誘導表現学習による教師なし異常検知 [cs.LG, cs.AI, eess.IV, stat.ML]目的:教師なし異常検知のための表現学習手法
    • 異常検知は,異常データが稀少な状況で重要であり,多くの機械学習応用において不可欠である。
    • 既存手法は,再構成誤差や特徴空間の最適化に課題があり,汎用性や頑健性に限界がある。
    • 本研究は,特徴学習とOne-Class SVMを直接的に結びつけ,より高精度で頑健な異常検知を目指す。
    • 提案手法は,MNIST-Cベンチマークと脳MRIにおける微細な病変検出タスクにおいて有効性を示した。
    • 既存手法が捉えにくい微小で高信号でない病変を検出することに成功した。
    • MNIST-Cの摂動やMRIのテクスチャ・年齢変化といったドメインシフトに対し,頑健性を示す結果が得られた。

    Link: https://arxiv.org/abs/2507.21164

  • サポート境界経験混合による継続学習 [cs.LG, cs.CV]目的:逐次的なタスクで訓練されたモデルにおける破滅的忘却の軽減
    • 機械学習において,新しいタスクを継続的に学習する能力は,実用的な応用において不可欠である。
    • 既存の継続学習手法は,過去のデータを十分に表現できず,決定境界が不安定になりやすい。
    • 決定境界付近の表現を強化し,より安定した継続学習を実現すること。
    • 提案手法は,潜在特徴にノイズを加え,決定境界付近のデータを生成するサポート境界データ(SBD)を導入する。
    • 経験再生とSBDを組み合わせた経験混合(EB)フレームワークにより,CIFAR-10, CIFAR-100, Tiny ImageNet, ImageNet1Kで一貫して精度が向上した。
    • 精度向上率は,それぞれ10%, 6%, 13%, 2%であった。

    Link: https://arxiv.org/abs/2507.23534

  • RelayFormer:スケーラブルな画像・動画操作局所化のための統一的な局所・グローバル注意フレームワーク [cs.CV, cs.AI]目的:画像と動画における改ざん領域の特定
    • 高度な編集ツールの普及に伴い,画像や動画の改ざん検出は重要性を増している。
    • 既存手法は,解像度の多様性や画像から動画への拡張に課題がある。
    • RelayFormerは,解像度変化に対応し,画像と動画を統一的に処理することで,これらの課題を解決する。
    • RelayFormerは,固定サイズのサブ画像とGLRトークンを用いたリレーベースの注意機構により,効率的なグローバル情報の伝播を実現した。
    • 既存手法と比較して,解像度への適応性,画像・動画の統一処理,計算コストと精度のバランスに優れる。
    • 様々なベンチマークにおいて,優れた性能と効率が確認された。

    Link: https://arxiv.org/abs/2508.09459