arXiv雑要約

AI - 2026/06/03 公開

  • 科学的発見のために,複雑なモデルよりも構造の特定を優先すべきである [stat.ML, cs.AI, cs.CY, cs.LG, econ.EM, stat.AP]目的:科学的発見における構造特定
    • 近年の機械学習の進展は,科学的仮説の生成やメカニズムの説明に貢献している。
    • 高次元データにおいては,観測データだけではメカニズムを特定することが困難である。
    • 大規模言語モデルが科学研究を支援する上で必要な基準を提示する。
    • 機械学習モデルによるメカニズム学習は,多くの場合決定不能であり,観測関係が同じでも不整合なメカニズムが存在する。
    • 大規模言語モデルは,複数の説明を一つの流暢な記述に統合してしまうため,特に注意が必要である。
    • メカニズム学習の具体的な基準を定めることで,大規模言語モデルが科学研究を模倣するのではなく,支援するようになる。

    Link: https://arxiv.org/abs/2606.02632

  • エコーPOSEド:心エコー誘導のための幾何学的自己蒸留 [eess.IV, cs.AI]目的:経胸部心エコー画像の姿勢推定によるリアルタイム誘導
    • 心エコー検査は非侵襲的で広く用いられるが,熟練した技術が必要とされる。
    • 検査者の技術依存性が高く,標準化や効率化が課題となっている。
    • 熟練者によるラベル付けやプローブ追跡なしに,自動的な姿勢推定を実現する。
    • エコーPOSEドは,3D心エコー画像から学習し,プローブの調整を提案することで,リアルタイム誘導を可能にする。
    • 仮想的な摂動下で幾何学的な一貫性を維持し,患者内および患者間での誘導シミュレーションを実現した。
    • 患者内シミュレーションにおいて,誘導された視点と目標視点の間の平均角度誤差は8.2度であった。

    Link: https://arxiv.org/abs/2606.02634

  • 疎な視点からのデジタル再構成レントゲン写真による肺結節容積測定:解剖学的正則化TensoRF [eess.IV, cs.AI, cs.CV]目的:肺結節の容積測定手法の開発
    • 肺がんの早期発見には,正確な結節容積の把握が不可欠である。
    • 従来のTensoRFは,レントゲン画像への適用時に密度勾配を抑制する問題があった。
    • 本研究では,疎な視点からの肺結節容積測定を可能にする手法を提案する。
    • 密度シフトを0に設定することで,TensoRFの勾配フローを回復し,安定した容積再構成を実現した。
    • 解剖学的正則化TensoRF (AReT) は,わずか3つの直交レントゲン投影から肺結節を再構成可能である。
    • AReTは,臨床的に有用な10mm以上の結節において,Pearsonの相関係数0.983を達成し,体積誤差を大幅に改善した。

    Link: https://arxiv.org/abs/2606.02639

  • SVHalluc:音声視覚大規模言語モデルにおける音声-視覚幻覚のベンチマーク [eess.AS, cs.AI, cs.CV, cs.LG, cs.MM, cs.SD]目的:音声視覚大規模言語モデルにおける音声-視覚幻覚の評価
    • 近年,音声と視覚情報を統合する大規模言語モデルが注目されている。それらの性能向上は,人間らしい知能を実現する上で重要である。
    • 既存の研究では,環境音を用いた評価が中心であり,人間の言語のような複雑な意味構造を持つ音声の扱いは不十分である。
    • 本研究は,音声内容が音声視覚大規模言語モデルに幻覚を引き起こすことを示し,その評価基準を確立する。
    • 本研究で開発したSVHallucベンチマークを用いて,最先端のオープンソース音声視覚大規模言語モデルが,音声と視覚の整合性に課題があることが明らかになった。
    • 複数のタスクにおいて,これらのモデルの精度はほぼランダムレベルにとどまるのに対し,Gemini 2.5 Proは大幅に高い性能を示した。
    • 分析の結果,モデルの失敗は,単一モダリティの認識能力は高いものの,モダリティ間の理解が不十分なことが原因と考えられる。

    Link: https://arxiv.org/abs/2606.02642

  • ターゲット更新が線形Q学習を安定化する可能性:周期性とソフトダイナミクス [stat.ML, cs.AI, cs.LG]目的:Q学習におけるターゲット更新機構の安定化効果の理論的解明
    • 強化学習は,複雑な意思決定問題を解決する強力な手法であり,その応用範囲は広い。
    • 線形Q学習は,関数近似を用いるが,一般的には収束性が保証されないという課題がある。
    • 周期的なターゲット更新とソフトターゲット更新が収束を保証する条件を厳密に導出する。
    • Q学習において,特定のスペクトル条件とステップサイズ条件の下で,周期的なターゲット更新とソフトターゲット更新が,厳密なQ-Bellman解への収束を保証することを証明した。
    • 線形Q学習のダイナミクスを正確に記述するスイッチング線形システムを用いて理論解析を行った。
    • 決定論的線形Q学習における解析結果を基に,確率的強化学習環境への拡張可能性を示した。

    Link: https://arxiv.org/abs/2606.02645

  • マルチエージェントLLMシステムにおけるリングルマン効果:効果的なチームサイズのスケール則 [physics.soc-ph, cs.AI, cs.MA]目的:マルチエージェントLLMシステムのチームサイズと効率の関係を明らかにする
    • LLMのマルチエージェント化は,複雑な問題解決能力の向上に不可欠である。
    • エージェント数を単純に増やすだけでは,必ずしも性能向上に繋がらない場合がある。
    • 効果的なチームサイズを定量的に把握し,システム設計に役立てる。
    • 提示されたスケール則は,多様な設定下で高い精度(R^2 > 0.99)で適合した。
    • 密な議論によるエージェントの多様性は,特定のタスクにおいて限界に達することが示された。
    • 同質チームにおける「議論」の効果は,再評価によるものが大きい可能性が示唆された。

    Link: https://arxiv.org/abs/2606.02646

  • コヒーレントな交換後悔とチャネル証明学習 [quant-ph, cs.GT, cs.LG, math.OC]目的:コヒーレントな交換後悔に対するアルゴリズムの開発と,分散型完全情報学習における量子ゲームの分離可能量子相関均衡への到達
    • ゲーム理論は,経済学や計算機科学など,様々な分野における意思決定の分析に不可欠である。
    • 従来の外部後悔は,量子ゲームにおける局所的なCPTPマップによる状態変化を考慮していない。
    • 本研究は,CPTPマップによる任意の局所的な状態変化に対する後悔指標を導入し,学習アルゴリズムを開発する。
    • コヒーレントな交換後悔を達成するためのエントロピーミラーアセントを用いたアルゴリズムが提案され,その後悔量は$O(\sqrt{dT\log d})$であることが示された。
    • 置換チャネルは従来の外部後悔と同程度の学習速度$\Theta(\sqrt{T\log d})$を示す一方,ユニタルチャネルは最小後悔ゼロを達成する。
    • 有限量子ゲームにおける分散型完全情報学習は,$T=O(\max_i d_i\log d_i/\varepsilon^2)$ラウンドで$\varepsilon$-近似分離可能量子相関均衡に到達する。

    Link: https://arxiv.org/abs/2606.02655

  • 降水予測のための洗練学習:スペクトル解結合型反復洗練フレームワーク [eess.IV, cs.AI, cs.LG]目的:降水予測における精度向上
    • 災害軽減において,正確な短期降水予測は不可欠である。気象現象の理解と被害の最小化に貢献する。
    • 深層学習モデルは,予測の平滑化やスペクトル減衰といった課題を抱えており,詳細な対流構造の再現が困難である。
    • スペクトル解結合による反復洗練を通じて,予測の平滑化と非現実的な幻覚を抑制し,高精度な予測を実現することを目指す。
    • SDIRは,安定した低周波骨格を抽出し,物理的制約の下で高周波テクスチャを反復的に洗練することで,従来のモデルの課題を克服する。
    • 実験の結果,SDIRは空間精度において最先端手法を大きく上回り,スペクトル忠実度においても拡散モデルに匹敵する性能を示すことが確認された。
    • これにより,信頼性の高い高解像度運用型降水予測が可能となる。

    Link: https://arxiv.org/abs/2606.02661

  • 潜在動的システムにおける状態結合型ボラティリティ:部分観測下での復元 [stat.ML, cs.LG]目的:潜在動的システムの復元
    • 生物,行動,生理系の理解に不可欠。状態空間モデルの応用範囲拡大に貢献。
    • 従来のモデルは変動が状態に依存しない前提。実際の系では状態依存性が無視できない。
    • 状態依存性のある変動を捉え,システムのダイナミクス理解を深める方法論を確立する。
    • 提案手法は,状態依存性を考慮しない既存手法と比較して,復元バイアスを大幅に低減した。
    • 潜在状態の持続性が高いほど復元性能は向上し,観測ノイズが高いほど検出性能は有利になった。
    • 部分観測下においても,状態結合型ボラティリティの特定と推定が可能であることが示された。

    Link: https://arxiv.org/abs/2606.02664

  • ScoreStop:関数的スコア検定を用いた勾配に基づく早期停止 [math.CO, cs.DM, stat.ML, cs.LG]目的:勾配ブースティング決定木における過学習回避のための早期停止手法
    • 勾配ブースティングは高性能だが,過学習しやすい。適切な停止基準が重要である。
    • 従来の停止基準は,解釈困難なパラメータに依存し,ノイズの影響を受けやすい。
    • 勾配情報を利用し,統計的検定に基づいた,よりロバストな停止基準を提案する。
    • ScoreStopは,現在の予測モデルが最適な予測モデルであるという仮説を検証する。
    • 関数的スコア検定を用い,勾配の更新方向に対して不変な統計量を計算する。
    • 合成実験と実データによる評価で,ScoreStopは従来の損失関数に基づく手法と同等の性能を示す。

    Link: https://arxiv.org/abs/2606.02740

  • リー群小群とリー代数小群不変畳み込みニューラルネットワークの理論的側面 [math.DG, cs.LG, math.CT]目的:リー群小群不変ニューラルネットワークの理論的基礎
    • 幾何学的深層学習の発展において,対称性構造を組み込むことが重要である。
    • 既存のニューラルネットワークは,複雑な対称性構造を効率的に扱えない場合がある。
    • リー群小群を用いたニューラルネットワークの理論的枠組みを確立し,その応用可能性を探る。
    • リー群小群不変畳み込みニューラルネットワークを,連続写像を用いて定義した。
    • 特定のリー群小群においては,リー代数小群不変ニューラルネットワークと等価であることが示された。
    • 群不変なグローバルプーリングの一般化として,小群不変なグローバルプーリングが提案された。

    Link: https://arxiv.org/abs/2606.02758

  • 単一の通過だけで十分:学習された恒星の振る舞いによる系外惑星検出 (EXOVEIL) [astro-ph.EP, astro-ph.IM, cs.LG]目的:系外惑星検出のためのシステムEXOVEILの性能評価と新規惑星候補の探索
    • 系外惑星探査は,宇宙における生命の存在可能性を探る上で不可欠な研究分野である。
    • 従来の系外惑星検出方法は,複数回の通過を必要とし,単一通過の惑星検出は困難であった。
    • EXOVEILは,単一通過の惑星検出を可能にし,従来のシステムでは見逃されていた惑星候補を発見する。
    • EXOVEILは,自己教師あり学習によって恒星の明るさ変動を予測し,予測とのずれから惑星の通過信号を検出する。
    • Keplerデータを用いた評価で,1000ppmの深さを持つ通過の32%を検出し,分類ベースのシステムよりも優れた性能を示した。
    • TESSデータへの適用では,再学習なしで全ての既知惑星を検出,ミッション間の転移学習能力も実証された。

    Link: https://arxiv.org/abs/2606.02778

  • ニュートリノ指紋:IceCubeイベントのCNN方向再構成のための画像ベース符号化 [astro-ph.IM, cs.LG]目的:IceCubeイベントのCNN方向再構成のための画像ベース符号化手法
    • 高エネルギーニュートリノ観測は,宇宙線起源解明に不可欠である。
    • 従来の再構成手法は計算コストが高く,複雑になりがちである。
    • 画像認識技術を応用し,効率的かつ解釈可能な再構成を目指す。
    • 本研究では,イベントデータをコンパクトな画像「ニュートリノ指紋」に変換する手法を提案した。
    • ResNet18モデルを用いて平均角度誤差1.10ラジアンを達成し,既存手法に匹敵する性能を示した。
    • この手法は,計算効率が高く,イベントの特徴を視覚的に理解しやすいという利点がある。

    Link: https://arxiv.org/abs/2606.02788

  • 進化型ニューラルエージェントにおけるコミュニケーションを通じた自己制御 [q-bio.PE, cs.MA, cs.NE, nlin.AO]目的:自己制御メカニズムとしてのコミュニケーション戦略
    • 複雑な行動の理解に不可欠であり,人工生命研究における重要な課題である。
    • コミュニケーションの進化における自己言及の影響が不明であった。
    • コミュニケーションが単なる情報伝達を超え,自己制御に利用されるかを検証する。
    • 進化させたエージェントの行動戦略として,安全な場所からの呼びかけ,危険を知らせる呼びかけ,自己制御のための呼びかけの3つが確認された。
    • 自己制御のための呼びかけを行うエージェントは,自身の発声を依存する傾向が強く,その依存性は行動の因果関係に起因すると考えられる。
    • 自身の発声機能を遮断すると,自己制御のための呼びかけ戦略は機能不全に陥るが,安全な場所からの呼びかけ戦略は維持されることが示された。

    Link: https://arxiv.org/abs/2606.02840

  • スケーラブルな誘導ガウス過程:正確な勾配削減による実現 [stat.ML, cs.LG]目的:誘導ガウス過程のスケーラビリティ向上
    • 高次元問題において関数評価が困難な場合,ガウス過程の代替モデルとしての重要性が高い。
    • 従来の誘導ガウス過程は計算量が状態空間のサイズに関して3乗で増加し,高次元で適用が困難。
    • 標的点と条件付け点の接続方向に対して直交する勾配成分を活用し,計算コストを削減する。
    • TERAは,標的固有の正確な勾配削減に基づき,スケーラブルな誘導ガウス過程を実現した。
    • 条件付け点のサイズmが指定されれば,条件付き密度は高々m^2個の方向微分で完全に特徴付けられる。
    • 実証実験により,TERAは標準的な誘導ガウス過程よりも大幅に高速に,最先端の予測精度を達成した。

    Link: https://arxiv.org/abs/2606.02909

  • Transformerアーキテクチャを用いた3成分地震波形のデータ駆動型予測 [astro-ph.IM, cs.LG, gr-qc, physics.geo-ph]目的:3成分地震波形の予測
    • 地震波の伝播は非線形かつ多スケールであり,地震ハザード評価や地震早期警報に不可欠な研究分野である。
    • 地震波形の長期的予測は困難であり,特に観測データだけではその性能に限界がある。
    • Transformerモデルを用いて,観測データに基づき,より高精度な地震波形を予測することを試みる。
    • 提案手法SeismoGPTは,P波到達後からS波到達後までの波形コンテキストを入力とし,その後を再帰的に予測する。
    • 多様な震源深さ,震央距離,マグニチュードの合成地震波形に対する評価において,高い相関係数(0.93以上)が確認された。
    • 予測の失敗例は,物理的に不自然な信号生成よりも,自己回帰的な展開中の位相ずれが主な原因であった。

    Link: https://arxiv.org/abs/2606.02912

  • 高次元アウトカムと高次元予測変数に対する高速スクリーニング手法 [math.OC, cs.SY, eess.SY, stat.ME, cs.LG, math.ST, stat.ML, stat.TH]目的:高次元データ間の相互作用モデリングにおける次元削減
    • 多種多様な高次元データの解析は,生命科学や医学研究において重要である。
    • 既存のスクリーニング手法は予測変数を削減するのみで,アウトカム次元が大きすぎる。
    • アウトカムと予測変数の両方の次元を同時に削減し,計算負荷と解釈性の問題を解決する。
    • 提案手法GIDSは,既存手法と比較して,シミュレーションにおいて優れた性能を示した。
    • ADNIデータセットの分析により,約9000個のCpGと2000個の転写産物が重要であることが示された。
    • GIDSは,アルツハイマー病の根底にある協調的な調節機構に関する生物学的洞察を提供した。

    Link: https://arxiv.org/abs/2606.03018

  • 軌道を考慮したノード貢献度と静的制御可能性の限界 [stat.ML, cs.LG]目的:複雑なネットワークにおける個々のノードのシステム行動への貢献度の評価
    • 複雑なネットワーク分析において,システム全体の振る舞いを理解するためのノードの役割解明は重要である。
    • 既存手法は静的グラフ特性や線形時不変なモデルに依存するため,非線形かつ時間変化するシステムへの適用が困難である。
    • 本研究は,システムの軌道に沿ったノードの動的影響力を定量化し,静的制御可能性との差異を明らかにすることを目指す。
    • 「創発的貢献度(EC)」という新しい指標を定義し,非線形かつ時間変化するシステムにおけるノードの貢献度を評価できることを示した。
    • ECは,線形時不変なシステムにおいては平均制御可能性と一致するが,永続的なレジームスイッチング下で乖離することが明らかになった。
    • 実世界のシステムへの適用により,ECが静的制御可能性を超えた情報を提供する場面を特定し,その計算コストの正当性を示唆した。

    Link: https://arxiv.org/abs/2606.03067

  • 風力タービンの時系列データに対する特徴抽出とインタラクティブ学習に基づく異常検知モデル:Trans GAN-WT [stat.AP, cs.LG]目的:風力タービンの異常検知手法
    • 風力発電所の規模拡大に伴い,運転・保守コストが増大しており,早期の異常検知が重要である。
    • 既存の異常検知手法では,冗長な情報が多いデータにおける関係性のモデリングが困難である。
    • 本研究は,異常データの有効活用と微小な異常の検知率向上を目指している。
    • 提案手法TransGAN-WTは,複数の風力タービンデータセットで平均F1スコア96.10%を達成し,既存手法を上回る性能を示した。
    • 誤検知率(FPR)は0.06%であり,統計的有意性のある性能向上をWilcoxonの符号順位検定によって検証した。
    • 本手法は,風力タービンの安定運転を効果的に保証することが期待される。

    Link: https://arxiv.org/abs/2606.03112

  • AnyAudio-Judge:音声指示追従のための動的ルーブリックベースのベンチマークと評価器 [eess.AS, cs.AI, cs.SD]目的:音声指示追従の厳密な評価
    • 近年の音声生成技術の発展に伴い,指示と生成物の整合性評価が重要となっている。
    • 既存の自動評価手法は汎用LLMに依存し,複雑な指示の分解や詳細な不一致の検出が困難である。
    • 複雑な指示を分解し,詳細な属性の不一致を捉えることで,より正確な評価を可能とする。
    • 提案手法は,複雑な音声キャプションを検証可能な二値ルーブリック項目に動的に分解する。
    • AnyAudio-Judge Benchは,4つの多様な音声ドメインを含む7,920件のサンプルで構成される包括的なベンチマークである。
    • 実験により,AnyAudio-Judgeは最新技術と比較してゼロショット整合性検出を大幅に向上させ,音声生成における指示整合性を改善する。

    Link: https://arxiv.org/abs/2606.03116

  • FinStressTS:金融時系列予測のためのパラメトリック合成ベンチマーク [q-fin.CP, cs.LG, q-fin.ST]目的:金融時系列予測におけるモデルの挙動と制御された構造的原因との関連性を示す,メカニズムを考慮した合成ベンチマーク
    • 金融予測は,ノイズ比の低さや潜在的要因などから困難であり,精度の高い予測手法の開発が求められる。
    • 実世界のデータだけでは,予測の失敗原因を特定することが難しく,モデルの改善が困難である。
    • モデルの挙動を構造的原因と結びつけ,予測の失敗モードを診断し,リスクを考慮した予測を可能にすること。
    • ボラティリティ,テールリスク,ジャンプなどのメカニズムに依存してモデルの性能が変化することが示された。
    • 定常的な状況下ではパラメトリックな確率モデルが適正にキャリブレーションされ,分布が多峰性または疎な場合には柔軟なモデルが有効である。
    • ニューラルモデルは,単純なベースラインを上回るためにはより多くのデータが必要であり,潜在的な状態や複雑な分布の学習時に大きな効果が期待される。

    Link: https://arxiv.org/abs/2606.03184

  • 文脈内学習における思考の連鎖の漸近理論 [stat.ML, cond-mat.dis-nn, cs.LG]目的:思考の連鎖の深さと汎化性能の関係の理論的解明
    • 大規模言語モデルの性能向上に不可欠な推論メカニズムであり,その理論的基盤の理解が求められる。
    • 思考の連鎖の深さが深くなるにつれて,汎化性能がどのように変化するのか,その振る舞いが不明確である。
    • 思考の連鎖の深さと汎化性能の関係を数学的に解析し,最適な深さを明らかにすることを目指す。
    • 思考の連鎖の深さに関して,指数関数的改善,多項式改善,飽和,過剰思考という明確な相転移が存在することが示された。
    • 最適な思考の連鎖の深さは,事前学習データの量と文脈長に依存することが明らかになった。
    • 事前学習データや文脈が不十分な場合,深すぎる思考の連鎖は誤りの増幅や飽和を引き起こす可能性があることが示唆された。

    Link: https://arxiv.org/abs/2606.03217

  • 較正の階層構造:分類と回帰の融合 [math.CO, cs.DM, math.NT, stat.ML, cs.LG]目的:確率的予測と実際の結果の一致度を形式化する較正の概念に関する研究
    • 機械学習モデルの信頼性評価において,予測確率と実際の事象発生頻度の整合性は重要である。
    • 分類と回帰それぞれにおける較正の概念は確立されているものの,それらの関係性は十分に理解されていない。
    • 分類と回帰における様々な較正概念間の階層構造を明らかにすることで,より普遍的な理解を目指す。
    • 名義尺度データに対する「モード較正」の概念を新たに導入し,分類問題における較正の定義を詳細化。
    • 確率積分変換(PIT)較正が,離散データに対する既存の較正概念とは独立であることを理論的に証明。
    • 予測分布の平均,分位点,事象確率といった要素に基づく較正概念を一般化し,様々なデータ形式に対応可能。

    Link: https://arxiv.org/abs/2606.03245

  • リハーサルに基づくクラス増分型時系列分類のための統計的特徴と深層エンコーディングの組み合わせ [stat.ML, cs.LG]目的:クラス増分型時系列分類における統計的特徴と深層エンコーディングの組み合わせ
    • 実環境のシステムでは,既存知識を保持しつつ,新しいカテゴリや情報を追加する必要がある。
    • 多変量時系列データの場合,時間構造により,クラス増分型継続学習はさらに困難である。
    • 本研究は,多変量時系列データに対するクラス増分型継続学習の課題解決を目指す。
    • 提案手法は,5つのベンチマークデータセットで高い平均精度を達成した。
    • 実験設定全体で,低い忘却率を維持することが確認された。
    • 深層エンコーディングと統計的特徴の組み合わせが有効であることが示された。

    Link: https://arxiv.org/abs/2606.03292

  • 明示的な単位距離下界証明の最適化 [math.OC, cs.AI, cs.CG, cs.NE, math.CO]目的:単位距離問題における下界証明のパラメータ最適化
    • 平面上の点配置における単位距離の最大数を知ることは,組み合わせ幾何学における基本的な問題である。
    • 既存の研究では,パラメータ選択が最適化されておらず,更なる改善の余地があった。
    • 本研究は,整数計画法を用いてパラメータ最適化を行い,より厳密な下界証明を得ることを目指す。
    • Erdősの単位距離予想の反証とSawinによる定量的な改良を踏まえ,単位距離の最大数を評価する。
    • 整数最適化と検証パイプラインを開発し,既存の証明を再現・改善した。
    • 最適化の結果,現在の証明は,$u(n) > n^{1.0152}$ を示すことができた。

    Link: https://arxiv.org/abs/2606.03419

  • 短期シナプス可塑性が多段階目標指向行動計画のためのPFCに着想を得た貯水池モデルにおける目標条件付きダイナミクスを安定化する [eess.IV, cs.MM, cs.NI, q-bio.NC, cs.NE]目的:多段階目標指向行動選択タスクにおける目標条件付きダイナミクスの安定化
    • 前頭前皮質は行動計画に必要な目標情報を保持する。そのメカニズム解明は認知神経科学上重要である。
    • 行動時間スケールにおいて,回帰回路が目標情報を利用可能な形で保持する仕組みは不明である。
    • 短期シナプス可塑性(STP)が目標情報を安定化し,行動計画を支援する可能性を検証する。
    • STPは,線形的に読み取れる目標表現の形成には必須ではないことが示された。
    • ノイズ条件下では,STPがないモデルの成功率が大幅に低下したが,STPがあるモデルはほぼ維持された。
    • STPは,目標依存的な有効結合パターンを動的に変調することで,ロバストな目標条件付きダイナミクスをサポートする。

    Link: https://arxiv.org/abs/2606.03481

  • 量子ニューラルネットワークのハードウェア上でのスケーラブルな学習と臨床データ補完への応用 [quant-ph, cs.AI, cs.LG]目的:量子ニューラルネットワークのハードウェア上でのスケーラブルな学習手法
    • 量子計算は,従来の計算機では困難な問題を解決する可能性を秘めており,近年注目を集めている。
    • 量子ニューラルネットワークの学習には,勾配推定のコストがボトルネックとなっており,大規模な学習が困難である。
    • 本研究は,量子ビット数に対して対数的にコストを削減する学習フレームワークを開発し,実用的なスケーラブルな学習を実現することを目指す。
    • 提案手法は,量子回路の評価回数を $O(n^2)$ から $O(\log n)$ に削減し,近未来のハードウェア上での量子ニューラルネットワークの最適化を可能にする。
    • 臨床データ補完のベンチマークであるMIMIC-IIIデータセットを用いて,IonQ Forte Enterpriseハードウェア上で16量子ビットで学習を行い,性能劣化は見られなかった。
    • 学習済みモデルは,古典的なニューラルネットワークの性能を上回り,患者の生存予測において高い精度と低い分散を示した。

    Link: https://arxiv.org/abs/2606.03517

  • スパース主成分分析へのロバスト最適化アプローチ [stat.ML, cs.LG, math.OC]目的:スパース主成分分析のロバスト最適化手法
    • 高次元データ解析において,次元削減は重要な課題である。主成分分析はその基礎的ツールである。
    • 従来のスパース化手法は,パラメータ調整が難しいという問題があった。
    • 悪性摂動に対するロバスト最適化により,パラメータ調整なしにスパース化を実現する。
    • 提案手法AdvPCAは,再構成誤差に対してロバストな最適化を行うことで,スパース性を獲得する。
    • この定式化は閉形式解を持つため,効率的な反復アルゴリズムを構築できる。
    • 合成データとゲノムデータを用いた実験により,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2606.03553

  • 少数のデータを用いたパルサーノイズ予測のための長短期記憶ネットワーク [stat.ML, cs.LG]目的:パルサータイミング残差の予測
    • 重力波探査において,ミリ秒パルサーのタイミング残差は重要なデータである。
    • パルサーの回転周波数サブグループ間のデータ不足が課題となっている。
    • 少ないデータから高精度な予測を可能にする手法を開発する。
    • 提案手法は,モデル非依存メタ学習アルゴリズムを用いてLSTMネットワークを最適化することで,少ないデータでの迅速な適応を実現した。
    • IPTA第2データリリースを用いた評価で,3つの評価指標において高精度な予測性能と,10%のタイミング残差のみでのモデル微調整が可能であることを示した。
    • 軽量な構造により,CPUメモリは16.86MB,単一ステップ予測には18ミリ秒しか要せず,実用性に優れる。

    Link: https://arxiv.org/abs/2606.03574

  • 共形P値からE値への集合保存型キャリブレーション [math.DS, cs.SY, eess.SY, stat.ML, cs.LG]目的:共形推論におけるP値からE値への変換手法の開発
    • 機械学習モデルの信頼性評価は重要であり,不確実性の定量化は不可欠である。
    • 従来のP値に基づく共形推論は柔軟性に欠け,保守的な予測集合になりやすい。
    • P値とE値の間の直接的な関係を確立し,効率的な共形推論を可能にすること。
    • 提案手法P2Eキャリブレータは,予測集合を変えることなく共形P値をE値に変換できる。
    • P2Eキャリブレータは,既存のP値からE値へのキャリブレータよりも効率的なことが理論的,実験的に示された。
    • クロス共形推論や共形集約において,所望のカバレッジ保証を満たしつつ効率を改善できる。

    Link: https://arxiv.org/abs/2606.03600

  • 制約付きリソースにおける逐次価格設定のための適応推論 [math.OC, cs.SY, eess.SY, nlin.CD, cs.MA, cs.RO, stat.ML, cs.LG]目的:リソース制約下での価格設定制御における適応推論
    • 価格設定は収益最大化の核心であり,経済的合理性を支える重要なメカニズムである。
    • リソース制約下では,目標価格帯が実行可能セットから除外されるという問題が存在する。
    • リソース状態を考慮した価格設定制御により,実行可能な目標範囲を保証し,局所密度を継続的に記録すること。
    • 提案手法は,局所的なデバイシングにより,リソース状態に応じた信頼区間を確立する。
    • 安価な探索だけでは推論が不十分であり,目標の質量の多さが推論速度を決定することが示された。
    • 実験により,保証された範囲内での較正と,リソース状態が目標のサポートを崩壊させた際の診断的棄権が確認された。

    Link: https://arxiv.org/abs/2606.03736

  • 実力かネットワークか:研究がどこに発表されるかを決定する要因 [econ.GN, cs.AI, q-fin.EC]目的:研究発表の場を決定する要因の分析
    • 科学研究において,発表場所は研究者の評価に直結するため,その決定要因の理解は重要である。
    • 研究の質を客観的に評価することが難しく,発表の場と質が相互に影響し合うという問題がある。
    • 研究アイデアの質を事前評価し,発表場所の決定要因を解明することを目的とする。
    • 経済学分野の研究論文を分析した結果,論文の質,実行力,研究者間の繋がりが発表場所を決定する主要な要因であることが示された。
    • 実行力は,論文の質を担保する基盤となり,最も大きな影響力を持つことが明らかになった。
    • 研究者間の繋がりは,特に競争の激しい上位ジャーナルにおいて影響力を持ち,質の高い論文でも発表が困難になる場合がある。

    Link: https://arxiv.org/abs/2606.03763

  • ブレグマンとレヴィ:連続・離散時間の重い尾を持つノイズ下における確率的ミラー降下法 [math.CO, cs.DM, math.OC, cs.LG, math.PR]目的:重い尾を持つノイズ下における確率的ミラー降下法のロバスト性
    • 機械学習において,勾配降下法は広く用いられるが,ノイズの影響を考慮する必要がある。
    • 実際のデータには,有限分散を持たない重い尾を持つノイズが含まれる場合がある。
    • 重い尾を持つノイズ下でも収束性を保証できるアルゴリズムの理論的解明。
    • 本研究では,確率的ミラー降下法を確率微分方程式(LMF)として解析し,重い尾を持つノイズ下での挙動を明らかにした。
    • 凸関数の最適化において,LMFは$\mathcal{O}(\epsilon^{-p/(p-1)})$時間内に$\epsilon$-最適化を達成することが示された。
    • 相対的に強い凸関数の最適化においても同様の収束性を示し,長距離ジャンプの影響を定量化した。

    Link: https://arxiv.org/abs/2606.03769

  • 拡散モデルにおけるフロー蒸留のための定量的近似フレームワーク [stat.ML, cs.LG]目的:拡散蒸留の定量的近似フレームワーク
    • 拡散モデルは高品質な画像生成を可能にするが,計算コストが高い。
    • 蒸留による高速化は有効だが,誤差の蓄積や不安定性が課題となる。
    • 誤差の増幅メカニズムを解明し,安定性を考慮した蒸留手法を開発する。
    • 学習されたフローマップの合成における誤差伝播として,少ステップサンプリングを捉えた。
    • ReLU-ReQUネットワークがガウス混合スコアを時間的に一様に近似することを証明した。
    • 累積安定度座標における非一様時間グリッドを用いることで,相対MSEを最大51.9%削減した。

    Link: https://arxiv.org/abs/2606.03820

  • シグナル損失下における広告システムのプライバシー保護型インクリメンタル測定 [stat.ML, cs.LG]目的:プライバシー制約された広告測定におけるロバストな因果的決定問題の定式化
    • 広告効果測定は,マーケティング戦略の最適化に不可欠であり,投資対効果を最大化する上で重要である。
    • プライバシー保護技術の導入により,測定シグナルが劣化し,正確な効果測定が困難になるという課題がある。
    • 劣化された広告シグナルから,因果関係に基づいた信頼性の高い測定結果を得ることを目指す。
    • 提案手法は,プライバシー保護による劣化を考慮し,インクリメンタル測定に関する確実な判断を提供できる決定境界を提示する。
    • Criteo UpliftおよびHillstrom email実験において,ある程度のシグナル劣化下でも,陽性効果の検証に成功している。
    • 不確実性とノイズが同時に存在する場合,多くの設定で明確な判断は困難であり,更なる研究が必要である。

    Link: https://arxiv.org/abs/2606.03878

  • 勾配降下法を超えて:アナログイジングマシン向けAdam [physics.app-ph, cs.LG]目的:アナログイジングマシンにおける最適化手法の改善
    • ムーアの法則の限界に伴い,最適化問題を解決する新たな計算手法としてイジングマシンが注目されている。
    • 多くのアナログイジングマシンは勾配降下法に依存しており,速度や安定性に課題がある。
    • Adam最適化をアナログイジングマシンに適用し,性能向上を目指す。
    • Adamに基づくダイナミクスが,勾配降下法やMomentum法と比較して,目標達成時間の大幅な短縮と解の質の向上を実現した。
    • 連続時間近似Adamは,物理実装の簡素化に寄与しつつ,連続時間設定でAdam全体の性能を上回った。
    • 離散時間設定では性能差は縮小したが,Adamは難易度の高い重み付き問題において優れた性能を示した。

    Link: https://arxiv.org/abs/2606.03917

  • SEAOTTER:効率的な再構成のためのワンタイムトランスコード付きセンサー埋め込みオートエンコーダー [eess.IV, cs.CV, cs.LG, cs.RO]目的:ロボティクスにおける効率的な画像圧縮フレームワーク
    • ロボティクスでは大量の画像データを取得可能だが,帯域幅や計算資源の制約がある。
    • 既存のコーデックはエンコードに高負荷であり,組込み機器での利用が困難である。
    • JPEGインフラとの互換性を維持しつつ,高効率な圧縮と再構成を実現すること。
    • SEAOTTERは,学習された潜在表現と標準JPEGファイルの組み合わせにより,帯域幅と計算資源の制約下でも高い性能を発揮する。
    • 200:1の圧縮率において,AVIFと比較してエンコード速度が7倍,デコード速度が3.5倍向上し,ImageNet Top-1精度も+8%改善された。
    • 学習可能なJPEG色と量子化変換により,グローバル,高密度,そして視覚言語ベースの知覚における精度向上が可能となった。

    Link: https://arxiv.org/abs/2606.03940

  • 台風:事前学習済み言語モデルのための効果的なタスク固有マスキング戦略へ [cs.CL, cs.AI]目的:マスク言語モデリングにおけるマスキング対象トークンの選択戦略の改善
    • 事前学習済み言語モデルは自然言語処理の様々なタスクで高い性能を示すため,その性能向上は重要である。
    • 従来のマスキング手法はランダムであるため,タスクへの適応性が低く,性能向上に限界がある。
    • タスクの損失関数の勾配に基づいてマスキング対象を決定することで,より効果的な学習を目指す。
    • 提案手法Typhoonは,勾配情報に基づきトークンタイプごとの重要度を推定し,マスキング分布を調整する。
    • MRPCとCoLAのタスクにおいて,TinyBERT,DistilBERT,BERT-baseの3つのモデルを検証した結果,有意な性能差は認められなかった。
    • 再現性を重視した評価の結果,勾配に基づくタスク適応型マスキングはランダムマスキングと比較して明確な優位性を示さなかった。

    Link: https://arxiv.org/abs/2303.15619

  • 確信度を伴う潮流計算学習:電圧リスクに対する確率的保証フレームワーク [eess.SY, cs.LG, cs.SY]目的:潮流計算学習と電圧リスク推定に対する確率的保証
    • 電力系統の安全性確保は重要であり,機械学習の応用が期待される。
    • 機械学習は高い精度が求められるが,信頼性や解釈可能性に課題がある。
    • 機械学習の信頼性を保証し,安全性に配慮した電力系統運用を可能にする。
    • 提案手法は,ガウス過程回帰の予測分散を用いて電圧リスクの推定誤差を確率的に保証する。
    • 新たに設計したVertex-Degree Kernel (VDK) により,大規模データでの学習効率が向上した。
    • ネットワークスイープ型アクティブラーニングにより,少ないデータで効率的に学習可能となった。

    Link: https://arxiv.org/abs/2308.07867

  • 不確実性下での計画:対称性,ポリシー推論,および解の圧縮 [cs.AI]目的:不確実性下での計画タスクを解くための最適なポリシー探索
    • 人工知能における不確実性への対応は重要であり,計画立案の基盤となる。
    • 既存手法では,ポリシー空間の探索効率が悪く,計算コストが高いという課題がある。
    • ポリシーの同値性に着目し,探索空間の削減と計算効率の向上を目指す。
    • ポリシー間の同値関係を定義することで,探索空間を効果的に削減できることを示した。
    • 群論的技法を用いて,状態間の対称性を効率的に計算する方法を提示した。
    • ドメイン仕様のみから解ポリシー関数を多項式時間で推論する手法と,効率的な部分状態ポリシーを生成する整数計画法を開発した。

    Link: https://arxiv.org/abs/2403.19883

  • Annot-Mix:複数アノテーターからのノイズを含むクラスラベルを用いたmixup拡張 [cs.LG]目的:ノイズを含むクラスラベルからの学習
    • 機械学習において,データのラベル品質は性能に大きく影響する。
    • アノテーターによるラベル付けにはノイズがつきものであり,学習の妨げとなる。
    • 複数アノテーターの情報を活用し,ノイズの影響を軽減する手法が求められている。
    • 提案手法Annot-Mixは,複数アノテーターからのラベル情報を考慮したmixup拡張である。
    • 11のデータセットを用いた評価により,既存の11手法を上回る性能を示した。
    • 人間のアノテーターとシミュレーションデータ,両方に対して有効であることが確認された。

    Link: https://arxiv.org/abs/2405.03386

  • 知識グラフ埋め込みによる統計的ELにおける確率推論の近似 [cs.AI]目的:統計的ELにおける確率推論の近似手法
    • 統計的情報が豊富にあるが,有効な結論を導くのは困難であるため,効率的な推論技術が求められる。
    • 従来の推論手法は計算コストが高く,大規模な知識グラフへの適用が難しいという課題がある。
    • 知識グラフ埋め込みを用いて,計算効率良く確率推論を近似し,大規模知識グラフへの適用を目指す。
    • 知識グラフ埋め込みを用いることで,統計的ELにおける確率推論を効率的に近似できることを示した。
    • 提案手法は,実行時間と健全性の保証を提供する。
    • 実験結果から,提案手法が良好な近似精度と実行時間を示すことが確認された。

    Link: https://arxiv.org/abs/2407.11821

  • PINNfluence:影響関数によるPINNの解釈 [cs.LG, cs.AI, physics.comp-ph, physics.flu-dyn]目的:PINNの解釈のためのトレーニングデータ帰属フレームワーク
    • 物理現象のシミュレーションにおいて,機械学習の応用が重要視されている。
    • PINNはブラックボックス性が高く,予測根拠の説明が困難である。
    • PINNのデータ依存性を解析し,信頼性向上に資する。
    • PINNfluenceは,影響関数を拡張することで,予測,損失,データ間の微細な関連性を明らかにする。
    • ベンチマーク実験により,影響パターンが,学習済みのPINNと学習不足のPINNを識別できることが示された。
    • PINNfluenceは,PINNのデータに基づいた理解と改善への新たな道を開く。

    Link: https://arxiv.org/abs/2409.08958

  • ブラックボックス最適化における信頼構築:説明可能性のための包括的フレームワーク [cs.LG, cs.AI]目的:ブラックボックス最適化における説明可能性向上
    • 現実世界の多くの応用において,高コストなブラックボックス関数の最適化は重要である。
    • サロゲート最適化は一般的だが,その複雑さから説明可能性と透明性が課題となっている。
    • サロゲート最適化のアプローチに対する信頼を,包括的な指標群によって高める。
    • 提案する包括的な指標群(IEMSO)は,サロゲート最適化プロセスを多角的に評価可能にする。
    • 評価指標は,サンプリング戦略,バッチ特性,最適化プロセス,特徴量の重要度に着目している。
    • 実験結果は,様々なベンチマークにおいて提案指標の有効性を示している。

    Link: https://arxiv.org/abs/2410.14573

  • Align-KD:モバイルVision-Languageモデルの強化に向けたクロスモーダルアライメント知識の蒸留 [cs.CV, cs.AI]目的:モバイルVision-Languageモデルの性能向上
    • マルチモーダルタスクにおいて,高度な理解と推論能力を持つVision-Languageモデルの重要性が増している。
    • モデルを小型化すると性能が低下しやすく,性能とサイズのトレードオフが課題となっている。
    • Vision-Languageモデルにおける重要なクロスモーダルアライメント知識の蒸留を可能にすること。
    • Align-KDにより,1.7BのMobileVLM V2モデルが7Bの教師モデルから豊富な知識を獲得できる。
    • トレーニング損失の設計を工夫することで,6つのベンチマークで平均スコアが2.0%向上した。
    • 提案手法は,異なるトレーニングサブセットにおいても一貫した性能向上を示した。

    Link: https://arxiv.org/abs/2412.01282

  • ニューラルネットワークによる可測測度の生成 [cs.LG, cs.IT, math.IT, math.PR, math.ST, stat.ML, stat.TH]目的:m-可測測度の近似
    • 測度論は,確率論や偏微分方程式など,数学の様々な分野の基礎をなす重要な研究領域である。
    • 高次元空間における複雑な測度の近似は,計算コストが高く,効率的な手法が求められている。
    • ReLUニューラルネットワークを用いて,m-可測測度を効率的に近似する手法を確立すること。
    • ReLUニューラルネットワークを用いることで,m-可測測度をWasserstein距離において任意に小さな誤差で近似できることが示された。
    • ネットワークの重みは量子化され,かつ有界であり,近似誤差εに対する必要なネットワーク数は$2^{b(\varepsilon)}$以下である。
    • 近似のレート$b(\varepsilon)$は,rectifiabilityパラメータmに依存し,周囲の次元よりも小さくなる可能性がある。

    Link: https://arxiv.org/abs/2412.05109

  • 効率と精度のトレードオフ:マルチヘッド早期終了を用いたRAG強化LLMレコメンダーシステムの最適化 [cs.IR, cs.LG]目的:RAG強化LLMレコメンダーシステムの効率と精度の最適化
    • レコメンダーシステムは,ユーザー体験を向上させ,ビジネス成果に貢献する上で不可欠である。
    • LLMの活用には計算コストがかかり,リアルタイム処理が課題となっている。
    • LLMレコメンダーシステムの効率と精度を両立させる新たな手法の確立。
    • グラフ畳み込みネットワーク(GCN)を用いた効率的な情報検索により,データ検索時間を大幅に短縮した。
    • マルチヘッド早期終了戦略により,モデル推論の動的な終了が可能となり,応答速度が向上した。
    • 計算時間を削減しつつ,レコメンダーシステムの信頼性を損なわない精度を維持・向上させた。

    Link: https://arxiv.org/abs/2501.02173

  • ASAP:ニューラル組合せ最適化における満足化汎化エッジの活用 [cs.LG, cs.AI]目的:組合せ最適化問題における汎化性能の向上
    • 組合せ最適化問題は現実世界の様々な課題に応用可能であり,その効率的な解決は重要である。
    • 深層強化学習による組合せ最適化問題の求解は,分布シフトに対して脆弱性を持つという課題がある。
    • 有望な行動の特定に着目し,汎化性能を高めることで,分布シフトへの適応力を向上させる。
    • 提案手法ASAPは,提案ポリシーと選択ポリシーの二段階構成により,ロバスト性と適応性を両立する。
    • Model-Agnostic Meta-Learning (MAML) を用いた二段階学習により,新たな分布への迅速な適応を可能にする。
    • 3D-BPP,TSP,CVRPにおける実験により,既存手法の汎化性能を向上させ,分布外のインスタンスに対する適応性能が優れていることが示された。

    Link: https://arxiv.org/abs/2501.17377

  • 大規模言語モデルに対する敵対的機械学習は進展していない [cs.CE, cs.LG, cs.CR]目的:敵対的機械学習における問題点の現状分析
    • 機械学習モデルの安全性確保は重要であり,特に敵対的環境下での堅牢性が求められる。
    • 従来の敵対的機械学習研究は,評価の厳密性に課題があり,進捗が遅れている。
    • 本研究は,大規模言語モデルにおける敵対的機械学習が抱える問題点を指摘し,今後の方向性を示す。
    • 大規模言語モデルの敵対的機械学習研究は,問題の定義が曖昧になり,解決が困難になっている。
    • 評価方法の確立が難しく,意味のある進捗が得られていない可能性が示唆されている。
    • 今後10年間の研究が,実質的な進歩をもたらさない可能性も懸念される。

    Link: https://arxiv.org/abs/2502.02260

  • 結晶特性予測のための相互空間を意識した長距離モデリング ReciNet [cs.LG, cond-mat.mtrl-sci]目的:結晶構造からの結晶特性予測
    • 材料科学における基礎課題であり,新材料開発に不可欠である。
    • 既存手法では,周期構造における長距離相互作用の捉えが不十分である。
    • 周期構造の相互空間を利用し,長距離相互作用を効果的にモデル化すること。
    • ReciNetは,JARVIS,Materials Project,MatBenchなどのベンチマークで高い予測精度を達成した。
    • 混合エキスパートを用いることで,複数特性予測における計算効率と特性間の正の転移が確認された。
    • 本モデルは,結晶特性予測におけるスケーラブルかつ高精度な解決策となり得る。

    Link: https://arxiv.org/abs/2502.02748