arXiv雑要約

AI - 2026/05/19 公開

  • NodeSynth:AI評価のための社会的に整合性のある合成データ [cs.LG, cs.CL]目的:AIモデル評価のための社会的に整合性のある合成データ生成手法
    • AIの進化に伴い,モデルの安全性と公平性の評価が重要性を増している。
    • 既存の評価データセットでは,社会的な側面や倫理的な問題が十分に考慮されていない場合がある。
    • 現実世界の証拠に基づいた,より現実的で社会的に関連性の高い合成データ生成を目指す。
    • NodeSynthは,既存のベンチマークと比較して,最先端LLMの失敗率を最大5倍まで引き上げた。
    • 詳細な分類学的拡張が,これらの失敗率の増加に大きく貢献することが確認された。
    • Llama-Guard-3などの著名なガードモデルにおける重大な欠陥が明らかになった。

    Link: https://arxiv.org/abs/2605.14381

  • 洞察の再生による状態保持型推論 [cs.AI]目的:大規模言語モデルにおける多段階推論の能力向上
    • 複雑な問題を解決するため,言語モデルの推論能力は重要であり,CoTはその有効な手法として注目されている。
    • CoTの長さが長くなるほど必ずしも精度が向上せず,適切な長さを超えるとむしろ低下するという課題がある。
    • 推論過程で得られた重要な洞察を保持し,推論の後半でアクセス可能にすることで,精度低下を防ぐことを目指す。
    • 提案手法「InsightReplay」は,推論過程で抽出した重要な洞察を定期的に再生することで,推論の規模拡大における情報の消失を抑制する。
    • 2x3x4のベンチマーク実験の結果,InsightReplayは24設定全てで精度向上を示し,平均で1.65ポイント,最大で9.2ポイントの改善を達成した。
    • 実験結果から,モデルの推論能力は推論量だけでなく,中間的な洞察へのアクセス可能性にも依存することが示唆された。

    Link: https://arxiv.org/abs/2605.14457

  • ロボットがお手伝いをする:長時間の家事タスク実行のためのベンチマークとエージェント [cs.CL, cs.AI]目的:長期的な家事タスクにおける計画レベルの自律性評価
    • ロボットの家庭内での活動は,生活の質を向上させ,労働力不足の解消に貢献する重要な課題である。
    • 既存のベンチマークは短期的なナビゲーションや操作に偏っており,複雑な家事タスクに対応できないという課題があった。
    • 自由形式の指示に基づいた,長期的な家事タスクの計画と実行能力を向上させることを目指す。
    • LongActという新たなベンチマークを開発し,高レベルな認知能力(指示理解,依存関係管理,記憶維持,適応計画)の評価を可能にした。
    • VLM駆動型エージェントHoloMindを提案し,GPT-5やQwen3-VLモデルを用いた実験で,長期的なタスク実行性能が大幅に向上することを示した。
    • 最新モデルでも目標達成率が59%,タスク全体成功率が16%と低いことから,長期計画の重要性が改めて浮き彫りになった。

    Link: https://arxiv.org/abs/2605.14504

  • 組合せ最適化におけるニューラルソルバーとヒューリスティックソルバーの比較に関する償却効率閾値 [cs.LG, cs.AI, cs.NE]目的:ニューラルソルバーとヒューリスティックソルバーのエネルギー効率の比較
    • 組合せ最適化問題は現実世界で頻繁に発生し,効率的な解法が求められている。
    • ニューラルソルバーは学習にGPUを使用するため,エネルギー効率が低いという批判がある。
    • ニューラルソルバーがヒューリスティックソルバーよりも効率的になるための展開量を特定する。
    • ニューラルソルバーがヒューリスティックソルバーよりもエネルギー効率が高くなるためには,ある程度の展開量が必要である。
    • 展開量が増加すると,ニューラルソルバーとヒューリスティックソルバーのエネルギー比は一定値に収束する。
    • CVRP環境において,展開量の閾値は約4560インスタンスであることが示された。

    Link: https://arxiv.org/abs/2605.14624

  • FactorizedHMR:ビデオにおける人体メッシュ復元のハイブリッドフレームワーク [cs.CV, cs.AI]目的:ビデオからの人体メッシュ復元における精度向上
    • コンピュータビジョン分野において,人体の3次元構造を正確に把握することは,行動認識や人間とのインタラクションにおいて重要である。
    • ビデオからの人体メッシュ復元は,遮蔽や奥行き情報の不足により,曖昧な解釈が生じやすいという課題がある。
    • 本研究では,トルソーと末端関節の曖昧さを分離し,よりロバストな復元を目指す。
    • トルソーとルートの安定的な復元を優先し,確率的なフローマッチングを用いて残りの関節を補完する二段階フレームワークを提案した。
    • 複合ターゲット表現,幾何学に基づいた教師あり学習,特徴量に基づいたclassifier-free guidanceを用いることで,遮蔽状況下での性能を向上させた。
    • 多様な視点からの合成データパイプラインを導入し,カメラ空間およびワールド空間のベンチマークにおいて,良好な結果を得た。

    Link: https://arxiv.org/abs/2605.14854

  • SurgicalMamba:状態再構成によるオンライン手術段階認識のためのデュアルパスSSD [cs.CV, cs.AI]目的:オンライン手術段階認識の精度向上
    • 手術室のコンテキストを理解したシステム構築に不可欠であり,医療の質向上に繋がる。
    • 既存手法では,長時間の動画や非一様な時間経過,チャンネル間の強い相関に対応しきれない。
    • 効率的な計算コストで,手術段階を正確かつリアルタイムに認識することを目指す。
    • SurgicalMambaは,Mamba2のデュアルパスSSD構造を採用し,フレームごとの計算コストを抑止することに成功した。
    • 7つの公開データセットで最先端の精度を達成し,特にCholec80では94.6%,AutoLaparoでは89.5%の認識率を記録した。
    • 学習された回転平面は,手術ワークフローの解釈可能な内部表現を獲得し,段階に沿った構造を示した。

    Link: https://arxiv.org/abs/2605.14889

  • OpenDeepThink:ブラッドリー・テリー集計による並列推論 [cs.AI]目的:テスト時計算量のスケーリングによるLLM推論能力の向上
    • LLMの推論能力向上において,計算資源の効率的な活用が不可欠である。
    • 並列候補生成は容易だが,正解がない状況下での最適な候補選択が課題となる。
    • ブラッドリー・テリー比較を用いた,客観的な候補選択手法の開発。
    • OpenDeepThinkは,LLMによるペアワイズ比較とブラッドリー・テリー集計により,候補を効率的に選別する。
    • Gemini 3.1 ProのCodeforces Eloを405ポイント向上させ,27分で8ラウンドの推論を達成した。
    • この手法はモデルの性能に依存せず,客観的な検証が可能なドメインで特に高い効果を示す。

    Link: https://arxiv.org/abs/2605.15177

  • スケーラブルでエネルギー効率の高いアナログ再帰計算のためのハードウェア・ソフトウェア協調設計 [cs.AR, cs.LG]目的:スケーラブルでエネルギー効率の高いアナログ再帰計算のハードウェア・ソフトウェア協調設計
    • 常時稼働AIは環境センサーや生体インプラント等,低消費電力性が重要である。アナログ回路は極めて低い消費電力での推論を可能にする。
    • 既存のアナログ実装はフィードフォワード構造に限定されており,再帰ダイナミクスへの拡張はノイズの蓄積により困難とされてきた。
    • 本研究は,ハードウェア・ソフトウェア協調設計により,アナログ再帰計算におけるノイズ蓄積の問題を解決することを目指す。
    • Bistable Memory Recurrent Units (BMRUs) を用いたアナログ回路を設計し,学習済みパラメータと回路要素の1対1対応を実現した。
    • 離散出力により,セル境界でのアナログノイズを20倍以上抑制し,アナログ再帰を可能にした。
    • シミュレーションにより,ソフトウェアモデルが物理ハードウェアを高精度にシミュレート可能であり,再帰の追加は線形的なコストで済むことを示した。

    Link: https://arxiv.org/abs/2605.15216

  • Transformerを用いたラグランジュ粒子力学の統一的シミュレーション [cs.GR, cs.LG]目的:多様な物理現象のシミュレーション
    • シミュレーション科学において,特定ソルバーに依存しない汎用的なシミュレータの実現が長年の課題である。
    • 既存手法は,物理現象ごとにソルバーを設計する必要があり,柔軟性に欠ける。
    • 単一のTransformerアーキテクチャで多様な物理現象をシミュレーションする手法を開発し,その問題を解決する。
    • 提案手法は,布,弾性固体,ニュートン流体,非ニュートン流体,粒状材料,分子動力学といった多様な物理現象に適用可能である。
    • 共有されたラグランジュ粒子表現に基づき,予測・修正デザインを採用することで,未見の材料や境界条件,初期条件,外部力に対しても汎化性能を示す。
    • ダウンストリームタスクとして,インタラクティブな制御,逆設計,実世界の操作データからの学習も可能であり,現象ごとのソルバーエンジニアリングの必要性を低減する。

    Link: https://arxiv.org/abs/2605.15305

  • 記憶の奥底に潜む脅威:LLMエージェントにおけるスリーパーメモリポイズニング [cs.CR, cs.AI]目的:LLMエージェントのメモリ汚染とその影響
    • LLMの能力向上に伴い,パーソナライズされた対話を実現する永続的メモリの活用が重要になっている。
    • 永続的メモリの利用は,悪意のあるコンテンツによる長期的な汚染という新たなセキュリティリスクをもたらす。
    • 本研究は,外部コンテンツ経由での潜伏的なメモリ汚染とその影響を明らかにすることを目的とする。
    • GPT-5.5では99.8%,Kimi-K2.6では95%の確率で,悪意のあるメモリが書き込まれることが確認された。
    • 書き込まれた悪意のあるメモリは,その後の対話において60〜89%の確率で攻撃者が意図した行動を引き起こすことが示された。
    • 永続的メモリは,複数回の対話にわたる長期的な攻撃対象となり得る脆弱性を持つことが明らかになった。

    Link: https://arxiv.org/abs/2605.15338

  • AI制御におけるアンサンブル監視:多様な信号が計算資源の増加を上回る [cs.AI]目的:AI制御システムの安全性とユーザー意図との整合性確保のための監視手法に関する研究
    • AIシステムの実用化が進む中で,安全性と意図整合性の確認は不可欠である。
    • 大規模AIシステムの監視は困難であり,人的監視だけでは限界がある。
    • 多様な監視信号を組み合わせたアンサンブル監視による,誤った行動の検出精度向上を目指す。
    • 多様な監視モデルの組み合わせが,単一モデルや均質アンサンブルよりも高い検出性能を示すことが示された。
    • 特に,3つの監視モデルからなる最適なアンサンブルは,同一モデル3つからなるアンサンブルに比べて2.4倍の性能向上を達成した。
    • ファインチューニングされたモデルは,プロンプトのみでは得られない検出能力を発揮し,アンサンブルの性能向上に貢献する。

    Link: https://arxiv.org/abs/2605.15377

  • 償却エネルギーに基づくベイズ推論 [math.NA, cs.AI, cs.NA]目的:非線形逆問題におけるベイズ推論の効率化
    • パラメータと観測データの同時サンプリングから推論を行う分野であり,様々な科学技術に応用可能である。
    • 従来のマルコフ連鎖モンテカルロ法は計算コストが高く,多数の観測データに対して繰り返し推論を行うのが困難である。
    • 観測データに依存する写像を学習し,事後分布を近似することで,高速な推論を実現する。
    • 提案手法は,真の事後分布と学習された写像による推し出し分布間の平均エネルギー距離を最小化することで学習される。
    • 関数空間逆問題において,事後分布の構造(多峰性や主要なモード)を捉えながら,新しい観測データに対する高速な事後サンプリングを可能にする。
    • 多孔質媒体フローや地震反転といった偏微分方程式制約逆問題への適用例から,手法の有効性が示された。

    Link: https://arxiv.org/abs/2605.15407

  • STS:推測型トークン疎性を用いた効率的な疎注意 [cs.LG, cs.CL]目的:大規模言語モデルの推論における注意機構の効率化
    • 大規模言語モデルの性能向上には,計算資源の効率的な利用が不可欠である。
    • 注意機構の計算量は系列長に対して二乗に増加し,長文処理のボトルネックとなる。
    • 推測型デコーディングを活用し,計算コストを削減する疎注意機構の提案。
    • STSは,再学習なしに注意機構の計算量を削減する疎注意機構である。
    • 代表的なベンチマーク NarrativeQAにおいて,約90%の疎性で2.67倍の高速化を達成した。
    • 既存手法を上回り,精度劣化を抑制しつつ高い疎性を実現した。

    Link: https://arxiv.org/abs/2605.15508

  • オペレーター制御による6G:接続インフラから保証されたデジタルサービスへ [cs.NI, cs.AI, cs.ET]目的:6Gにおけるオペレーターの制御権確立と,それによる保証されたデジタルサービスの提供
    • 次世代通信技術である6Gは,産業構造や社会のデジタル化を大きく変革する可能性を秘めている。
    • 既存のモバイルネットワークは,ベンダー依存度が高く,オペレーターの自由度が制限されている。
    • 本研究は,オペレーターがネットワークを制御し,顧客に保証されたサービスを提供できる6Gの実現を目指す。
    • 本研究では,ネットワークの所有権を「所有」「連合」「消費」の3層に分類し,戦略的価値に応じてアーキテクチャの主権を分配する「6G制御コンパクト」を提案する。
    • また,オペレーターの制御をサービスレベル目標に変換する「保証エコノミー」を定義し,収益化可能なビジネスモデルを提示する。
    • 楽天モバイルの実運用データに基づき,オペレーター制御型6Gの実現可能性を示すとともに,2025年から2032年以降へのロードマップと具体的な行動指針を提示する。

    Link: https://arxiv.org/abs/2605.15553

  • 多数クラスに対する相補的ラベル学習のための偏った遷移行列の活用 [cs.LG, cs.AI, cs.CV]目的:多数クラス相補的ラベル学習における性能向上
    • 弱教師あり学習は,ラベル付けコストを削減し,実用的な応用を可能にする重要な手法である。
    • 従来の相補的ラベル学習法は,大規模なラベル空間への拡張が困難であり,10クラス程度の分類に限定されてきた。
    • 本研究は,偏ったラベル生成プロセスを導入することで,多数クラス環境下での学習信号の希薄化問題を解決することを目指す。
    • 提案手法であるBICLは,CIFAR-100とTinyImageNet-200において,従来手法と比較して7倍以上の精度向上を達成した。
    • BICLは,データ収集から学習までの一貫したフレームワークを通じて,偏りを活用することで効果的な学習を可能にする。
    • 本研究は,実世界アプリケーションにおける多数クラス相補的ラベル学習の実現に向けた新たな道筋を示す。

    Link: https://arxiv.org/abs/2605.15586

  • 深層学習におけるゼロ次最適化は,能力不足ではなく,探索不足である [cs.LG]目的:深層学習におけるゼロ次最適化手法の可能性の再評価
    • 深層学習のモデルは大規模化の一途を辿っており,計算資源の効率的な利用が重要となっている。
    • 勾配計算が困難な環境や,メモリ消費量の大きいバックプロパゲーションの代替手法が求められている。
    • 既存のゼロ次最適化法の限界を克服し,大規模な深層学習モデルへの適用を可能にすること。
    • 従来のゼロ次最適化法の評価は,局所的な視点に偏っており,その潜在能力が十分に活かされていない可能性がある。
    • 分散の制御や方向微分などの手法を用いることで,ゼロ次最適化法の効率性を向上させることが示された。
    • ゼロ次最適化法の特性を活かし,分散環境やリソース制約のある環境での学習への応用が期待される。

    Link: https://arxiv.org/abs/2605.15622

  • シリコンと海馬の架け橋:ベクトルHaSHとTEMのための基盤としての代数決定論的メモリ「VaCoAl」 [cs.NE, cs.AI]目的:ベクトルHaSHとトルマン・アイヒェンバウム機械における海馬-内嗅皮質回路の機能解明
    • 記憶と空間認知の神経基盤理解は,認知機能不全の解明に不可欠である。
    • 海馬における記憶想起のメカニズム,特に多段階リプレイにおける忠実度低下が課題である。
    • VaCoAlを用いて,記憶想起の基盤となる代数的構造とその生物学的実現可能性を提示する。
    • VaCoAlは,ガロア体線形帰還シフトレジスタに基づく代数決定論的超次元メモリであり,ベクトルHaSHとTEMの基盤となる。
    • VaCoAlの拡散は,ランダム射影の代替として準直交性を保証し,多段階リプレイにおける減衰をモデル化する。
    • VaCoAlのアーキテクチャは,海馬計算を制約し,パール因果ラダーに基づいた進化論的根拠を提供する。

    Link: https://arxiv.org/abs/2605.15652

  • 超低電力無線デバイスにおけるTransformerモデルの分散推論 [cs.LG]目的:Transformerモデルの分散推論
    • IoT分野では,Transformerモデルの利用が拡大している。しかし,その計算負荷は大きい。
    • 単一の低電力IoTデバイスでは,Transformerモデルの実行が困難であるという課題がある。
    • 複数のデバイスで協調して推論を行うことで,大規模モデルの実行を可能にすることを目指す。
    • CATSフレームワークを開発し,超低電力無線デバイスでのTransformerモデルの分散推論を実現した。
    • SomeGatherという新しい通信方式により,通信帯域幅とRAM使用量を削減しつつ,モデルの精度を維持した。
    • 実環境実験により,最大16台のデバイスで,単独デバイスの14倍の規模のモデルを協調して実行できることを示した。

    Link: https://arxiv.org/abs/2605.15694

  • UAM:VLA学習における忘却に関する二重ストリームの視点 [cs.CV, cs.AI]目的:VLA学習における忘却現象とその改善策
    • 視覚と言語,行動を統合するVLAモデルは,ロボット工学や人間-ロボットインタラクションにおいて重要な役割を担う。
    • VLA学習時に,事前学習済みVLMの持つ多Modal能力が低下するという「具現化税」の問題が存在する。
    • 脳の視覚経路に着想を得た新たなアーキテクチャUAMにより,VLMの能力を維持しつつ,行動学習を可能にすることを目指す。
    • UAMは,VLMの多Modal能力を95%以上維持しながら,様々な操作タスクにおいて既存モデルを上回る成功率を達成した。
    • アーキテクチャの分離により,VLMの知識を凍結したり,補助データを用いることなく,多Modal能力の維持が可能となった。
    • UAMの結果は,VLMの持つ意味的理解能力が,行動学習においても一般化性能に貢献することを示唆している。

    Link: https://arxiv.org/abs/2605.15735

  • 不完全な世界モデルは悪用可能である [cs.AI, cs.LG]目的:強化学習におけるモデル悪用の新たな定義
    • 現実世界の問題解決にAIが不可欠となる中,強化学習の安全性が重要視されている。
    • 世界モデルを用いた強化学習では,モデルの不備が予期せぬ行動を引き起こす可能性がある。
    • 世界モデルの悪用という問題を形式的に定義し,その回避策を提示すること。
    • 世界モデルが悪用可能であるとは,ある方針が別のものより優れているとモデルが示唆する一方,実際の環境では逆の結果となることである。
    • 大規模な方針集合においては,モデル悪用は本質的に避けられないことが証明された。
    • 有限な方針集合における安全性の保証は,モデル悪用を防ぐものではないことが示された。緩和された悪用の概念と安全な範囲が提示された。

    Link: https://arxiv.org/abs/2605.15960

  • 強化学習によるクアッドローターの適応外ループ制御 [cs.RO, cs.LG]目的:クアッドローターの適応的な外ループ制御
    • ドローン技術は,物流,監視,災害対応など幅広い分野で活用が期待されており,その自動化が重要である。
    • シミュレーションから実機への転移において,環境の不確実性に対処することが難しい。
    • 動的な外乱下でも安定した飛行を可能とする,ロバストな制御手法を開発する。
    • 本研究では,残差ダイナミクス予測器を用いて,外乱をオンラインで推定する適応制御アーキテクチャを提案する。
    • 提案手法は,シミュレーションと実機のずれを解消するための効率的な較正機構とスラスト補正メカニズムも導入する。
    • 実機実験の結果,提案手法は従来のベースラインと比較して,質量変化や積載物の非対称性といった不確実性の下で,より精密な軌道追跡を実現した。

    Link: https://arxiv.org/abs/2605.16015

  • プロパティに基づくLLMによるプログラム合成:プランニングへの応用 [cs.AI, cs.LG]目的:プランニングにおける直接ヒューリスティック関数の合成
    • LLMを活用したプログラム合成は,従来の解決策を超える成果を上げている分野である。
    • 従来のプログラム合成では,プログラムの品質評価に単純な数値スコアを用いるため,効率が低い。
    • 形式的に定義されたプロパティに基づき,LLMへの具体的な反例提示を通じて,効率的なプログラム合成を目指す。
    • プロパティに基づく手法により,候補プログラムの生成回数を大幅に削減し,評価コストを低減できる。
    • 合成されたヒューリスティック関数は,ほとんどのテストタスクにおいて直接性を持つことが確認された。
    • 従来の生成方法と比較して,平均で7分の1のプログラム数で,より多くのタスクを探索なしで解決した。

    Link: https://arxiv.org/abs/2605.16142

  • Transformerにおけるプロトコル依存的な層の冗長性 [cs.LG, cs.AI, cs.CL]目的:Transformer層の圧縮可能性評価におけるプロトコルのずれ
    • Transformerは自然言語処理の基盤であり,その効率的な圧縮は重要である。
    • 層の重要度評価に用いるプロトコルによって結果が異なり,最適な圧縮戦略の選択が困難である。
    • 層の置き換え可能性と可換性の両方を評価し,より信頼性の高い圧縮方法を確立すること。
    • 置き換えプロトコルと可換性プロトコルは,Transformer層の重要度評価において異なる結果を示す。
    • Pythiaモデルの学習過程において,このずれは初期化から収束に向かって拡大する。
    • Qwen3-8BとLlama-3.1-8Bの比較により,ずれが層の削除戦略に影響を与えることが示された。

    Link: https://arxiv.org/abs/2605.16234

  • グラフ上のマターンガウス過程 [stat.ML, cs.LG]目的:グラフ上のマターンガウス過程の理論的性質と実用的な応用
    • グラフ構造データは,ソーシャルネットワークや分子構造など,様々な分野で重要な役割を果たす。
    • グラフ上のガウス過程モデルは選択肢が限られており,複雑なグラフ構造への適用が困難である。
    • ユークリッド空間におけるマターンガウス過程の性質をグラフに拡張し,実用的な学習手法を開発する。
    • 本研究で提案するグラフ上のマターンガウス過程は,ユークリッド空間やリーマン空間における類似モデルの利点を引き継いでいる。
    • インデューシングポイントなどの標準的な手法を用いることで,効率的な学習が可能となる。
    • これにより,ミニバッチ学習や非共役設定など,より幅広い応用が可能となり,実用性が高まる。

    Link: https://arxiv.org/abs/2010.15538

  • ミクスアップバーコード:点群間の幾何学的・トポロジカルな相互作用の定量化 [math.AT, cs.CG, cs.LG]目的:点群間の幾何学的・トポロジカルな相互作用の定量化
    • 形状解析において,幾何学的構造とトポロジカルな特徴を同時に捉えることは重要である。
    • 従来のトポロジカルデータ解析は,幾何学的配置に十分な感度を持たない場合がある。
    • 点群間の相互作用を定量的に評価し,低次元および高次元データへの応用を目指す。
    • ミクスアップバーコードを導入し,点群間の幾何学的・トポロジカルな相互作用を捉える新たな手法を提案した。
    • 総ミクスアップおよび総ミクスアップ割合という統計量を定義し,相互作用の複雑さを数値化した。
    • 機械学習における埋め込み表現の分散化問題への応用により,本手法の有効性を示した。

    Link: https://arxiv.org/abs/2402.15058

  • 距離と類似度学習のための深層ReLUネットワークの一般化解析 [stat.ML, cs.LG]目的:距離と類似度学習における一般化性能の理論的解明
    • 機械学習の性能向上には,未知データへの汎化能力の理解が不可欠である。
    • 距離・類似度学習の一般化性能に関する厳密な理論的保証は十分ではない。
    • 深層ReLUネットワークを用いて真の距離関数を近似し,一般化誤差の上界を導出する。
    • 真の距離関数の明示的な表現を導出し,深層ReLUネットワークでその近似能力を分析した。
    • ネットワークの深さ,非ゼロの重み数,計算ユニット数に着目し,複雑度を特徴付けた。
    • 構築した仮説空間に対する超過リスク限界を確立し,明示的な超過リスクレートを導出した。

    Link: https://arxiv.org/abs/2405.06415

  • 確率的勾配降下の長期的分布:大規模偏差解析 [math.OC, cs.LG, math.PR, stat.ML]目的:確率的勾配降下の長期的分布の解析
    • 機械学習の最適化において,確率的勾配降下法は広く利用されている重要な手法である。
    • 非凸問題における確率的勾配降下の長期的挙動は,理論的に十分に解明されていない。
    • 確率的勾配降下の長期的分布を,大規模偏差の理論を用いて明らかにする。
    • 確率的勾配降下の長期的分布は,目的関数のエネルギーとノイズの統計に基づいたボルツマン・ギブズ分布に類似している。
    • 臨界領域は,非臨界領域と比較して指数関数的に頻繁に訪れる。
    • 確率的勾配降下の反復は,エネルギーが最も低い状態の周囲に指数関数的に集中する。

    Link: https://arxiv.org/abs/2406.09241

  • 多利用者量子ネットワークにおける量子セキュアな連合学習の実験的検証 [quant-ph, cs.ET, quant-ph, cs.AI, cs.CR, cs.DC]目的:量子ネットワークを用いた,情報理論的に安全な連合学習プロトコル
    • プライバシー保護は重要課題であり,連合学習は分散的な学習を可能にする。
    • 量子時代において,従来の連合学習はプライバシー漏洩のリスクを抱える。
    • 近接量子技術を用いた,データプライバシーを確保する連合学習プロトコルを開発する。
    • 提案するQuNetQFLプロトコルは,量子秘密鍵を用いてモデル更新をマスクし,情報理論的なセキュリティを提供する。
    • 4クライアントの量子ネットワークで実験的に検証され,量子データセットと実データセットで性能が評価された。
    • 大規模シミュレーションでは,200クライアントへの拡張性と,モデル圧縮による通信コスト75%削減が示された。

    Link: https://arxiv.org/abs/2501.12709

  • 分布トランスフォーマー:オンザフライ事前分布適応による高速近似ベイズ推論 [stat.ML, cs.LG]目的:近似ベイズ推論の実現
    • ベイズ推論は不確実性の下での合理的な推論枠組みを提供するが,実用化には計算量の課題がある。
    • 既存手法は計算コストが高い,あるいは事前分布の変化に弱いという問題がある。
    • 事前分布を動的に適応させながら,高速な近似ベイズ推論を可能にすることを目指す。
    • 分布トランスフォーマーは,任意の分布間の写像を学習する新しいアーキテクチャである。
    • 事前分布を対応する事後分布に写像することで,近似ベイズ推論を実行する。
    • 計算時間を大幅に短縮しつつ,既存手法と同等以上の対数尤度性能を達成した。

    Link: https://arxiv.org/abs/2502.02463

  • 自然主義的認知科学:自然な行動の全範囲を捉える汎化可能なモデルと理論に向けて [q-bio.NC, cs.AI]目的:認知科学における汎化可能な理論の構築
    • 認知科学は人間の思考を理解する上で重要であり,その成果はAI等の発展にも繋がる。
    • 既存研究は,実験環境が限定的で,自然な状況での行動を十分に説明できていない。
    • より自然な実験とAI技術を統合し,自然な状況下での認知現象の理解を目指す。
    • 神経科学,認知科学,AI分野の研究から,自然主義的実験パラダイムの重要性が示唆されている。
    • AIにおける自然なデータからの学習は,従来の認知モデリングとは異なる行動パターンと汎化能力を生み出す。
    • AIと認知科学の統合により,実験制御と理論的理解の両立が可能となり,自然な認知現象へのアプローチが進む。

    Link: https://arxiv.org/abs/2502.20349

  • 分散プロファイルを持つ非同一分布データに対するランダム特徴量を用いた高次元リッジ回帰 [stat.ML, cs.LG, math.PR, math.ST, stat.ME, stat.TH]目的:非同一分布データにおけるリッジ回帰の学習及びテストリスクの漸近同値性の導出
    • 機械学習において,高次元データへの対応が重要であり,効率的な回帰手法の確立が求められている。
    • 従来のランダム特徴量リッジ回帰は,データの独立同分布性を仮定しており,現実のデータへの適用が限定される。
    • 分散プロファイルモデルに基づき,非同一分布データに対するリッジ回帰の汎化性能を評価する。
    • 学習及びテストリスクの漸近同値性が,線形+カオス近似とトラフィック確率議論を用いて導出された。
    • 演算子値自由確率を用いた決定論的な同値性も得られ,数値実験によりその精度が確認された。
    • 不均一な分散プロファイルが,汎化性能に影響を与え,リッジパラメータが小さい場合に二重降下現象を示すことが示された。

    Link: https://arxiv.org/abs/2504.03035

  • LLM推論とAIエージェントのためのスループット最適化スケジューリングアルゴリズム [stat.ML, cs.LG, math.PR]目的:LLM推論システムの効率的な最適化
    • LLMとAIエージェントの需要が急速に増加しており,システム効率が重要である。
    • LLM推論システムの数学的モデリングとキューイング理論の検討が不足している。
    • スループットの観点からLLM推論システムの最適化を目指す。
    • 本研究では,広範なワークコンザービングスケジューリングアルゴリズムが最大スループットを達成することを証明した。
    • OrcaとSarathi-Serveはスループット最適であることが確認され,FasterTransformerとvLLMには注意が必要である。
    • バッチサイズ制限や循環ルーティングトポロジがスループットに影響を与えることが示唆され,今後の課題を提示した。

    Link: https://arxiv.org/abs/2504.07347

  • 病理的音声における自動匿名化の知覚的影響 [eess.AS, cs.AI, cs.LG]目的:病理的音声の自動匿名化に伴う知覚的・臨床的影響の評価
    • 臨床音声データの倫理的な共有は重要であり,匿名化はその鍵となる技術である。
    • 自動匿名化が音声の知覚的品質や臨床評価に及ぼす影響は十分に解明されていない。
    • 音声障害の種類や聞き手の属性に応じた匿名化の影響を明らかにすること。
    • 聞き手は自動匿名化された音声を高い精度で識別できたが,疾患の種類によって識別率は異なり,慣熟によってその差は縮小した。
    • 匿名化処理により,音声の知覚的品質が低下し,グループ間の品質順位が変化したが,母語話者であるかどうかは品質低下に影響しなかった。
    • 臨床的重症度の評価は,特に構音障害,異音障害,音声障害において良好な一致度を維持しており,匿名化による影響は小さいことが示された。

    Link: https://arxiv.org/abs/2505.00409

  • 機能性材料の逆設計のための活性学習に基づくワークフロー [cond-mat.mtrl-sci, cond-mat.supr-con, cs.AI, cs.LG]目的:機能性材料の特定の特性を持つ逆設計手法の開発
    • 再生可能エネルギー等,先端分野の発展には材料設計が不可欠である。
    • 既存の結晶構造生成・予測法は成功率が低いという課題がある。
    • 活性学習により材料生成を最適化し,所望の性能特性へ誘導する。
    • 提案手法InvDesFlow-ALは,既存モデルと比較してRMSEを32.96%改善した。
    • 低生成エネルギー材料や低Ehull材料の設計にInvDesFlow-ALが有効であることが示された。
    • 常圧BCS超伝導体探索において,140Kの転移温度を持つLi₂AuH₆を発見した。

    Link: https://arxiv.org/abs/2505.09203

  • 構造化高次元回帰のためのニューラル適応的shrinkage(Nash) [stat.ML, cs.LG]目的:構造化高次元回帰における,ニューラルネットワークを用いた変量ごとの適応的なshrinkage
    • データ解析において,疎な線形回帰は基本的な手法である。変数の構造や異質な起源に対応する必要がある。
    • 従来のsparse regressionは,変数が構造を持つ場合や多様な情報源から来る場合に,性能が低下する問題がある。
    • 本研究は,変量固有の情報を活用し,cross-validationなしで正則化を調整する新しいフレームワークを提案し,この問題を解決する。
    • Nashは,変量ごとのpenaltyを適応的に調整し,精度と適応性を向上させる。
    • 分割変分経験ベイズアルゴリズムにより,計算速度が大幅に向上し,既存手法と比較して74〜106倍高速化を実現した。
    • 実際のデータを用いた実験により,既存手法よりも高い精度が確認された。

    Link: https://arxiv.org/abs/2505.11143

  • HTSC-2025:AI駆動臨界温度予測のための常圧高温超伝導体ベンチマークデータセット [cond-mat.supr-con, cond-mat.mtrl-sci, cs.AI, cs.LG]目的:常圧高温超伝導体に関するベンチマークデータセット
    • 高温超伝導材料は産業や生活に不可欠であり,その発見は重要である。
    • AIによる超伝導転移温度予測の研究が進むが,公平な比較が困難である。
    • AIを用いた超伝導材料探索の加速に貢献するベンチマークデータセットの提供。
    • HTSC-2025は,2023年から2025年に理論物理学者によって予測された常圧高温超伝導材料を網羅するデータセットである。
    • BCS超伝導理論に基づき,X$_2$YH$_6$系やMXH$_3$系など多様な材料系を含む。
    • データセットは公開されており,継続的に更新されることで,AIによる材料探索の進展を促すことが期待される。

    Link: https://arxiv.org/abs/2506.03837

  • グローバル平滑性と局所平滑性:理論上も,探索と適応ステップサイズが有効である! [math.OC, cs.LG]目的:最適化における反復回数の複雑性評価
    • 機械学習等の分野で,滑らかな関数の最適化は重要な課題である。
    • 従来の評価では,勾配のグローバルなリプシッツ定数に依存し,局所的な特性を捉えきれていない。
    • 関数自体の性質に基づいた「グロカル」平滑性の概念を導入し,アルゴリズム間の比較を容易にする。
    • 「グロカル」平滑性の仮定の下で,探索法が固定ステップサイズよりも優位性を持つことが示された。
    • 特定の条件下では,探索法を用いた最急降下法が,加速法よりも優れた反復回数複雑性を持つことが明らかになった。
    • PolyakステップサイズやAdGDステップサイズを含む,様々な最適化アルゴリズムにおいて改善された複雑性が確認された。

    Link: https://arxiv.org/abs/2506.12648

  • 基本SDP緩和に基づく疎PCAのランダム化アルゴリズム [stat.ML, cs.LG, math.OC]目的:疎PCAのための近似解
    • 高次元データの解析において,次元削減は重要な課題である。
    • 疎PCAはNP困難であり,効率的なアルゴリズムの開発が求められている。
    • 基本SDP緩和に基づき,実用的な近似アルゴリズムを提案する。
    • 提案アルゴリズムは,SDP解から複数の解を生成し,最適な解を選択する。
    • 近似率は,スパース度定数以内であることが高い確率で保証される。
    • 技術的仮定の下では,平均近似率は$\mathcal{O}(\log{d})$に制限される。

    Link: https://arxiv.org/abs/2507.09148

  • 機械は数体を学習するが,どのように? ガロア群の場合 [math.NT, cs.LG]目的:ガロア群の分類
    • 数論において,数体の分類は重要な課題である。
    • ガロア群の決定は計算量が多く,困難を伴う。
    • 機械学習を用いて,ガロア群を分類する新たな基準を確立する。
    • 決定木などの解釈可能な機械学習手法を用いて,次数4, 6, 8, 9, 10のガロア拡大のガロア群を分類した。
    • Dedekind zeta関数の係数とガロア群の関係性を明らかにした。
    • zeta関数の係数の分布からガロア群を分類するための新たな基準を証明した。

    Link: https://arxiv.org/abs/2508.06670

  • 生成モデルにおける補間スケジュールのLipschitz制約に基づく設計 [stat.ML, cs.LG, cs.NA, math.NA]目的:生成モデルの補間スケジュールの設計
    • 生成モデルは,複雑なデータ分布からのサンプル生成において重要な役割を担う。
    • 既存の補間スケジュール設計は,統計的基準や計算コストの最適化に偏りがちである。
    • ドリフト場のLipschitz定を最小化することで,より安定した効率的な補間スケジュールを設計する。
    • 統計的等価性の公式化により,ドリフト場の数値的性質に着目したスケジュール設計が可能となった。
    • ガウス分布やガウス混合分布に対して,線形スケジュールと比較してLipschitz定を指数関数的に改善する最適なスケジュールを導出した。
    • 確率的Allen-Cahn方程式やNavier-Stokes方程式において,設計されたスケジュールが微細な統計量をより正確に再現することを確認した。

    Link: https://arxiv.org/abs/2509.01629

  • 生活満足度の個人効用が,政治的立場とは無関係な不平等嫌悪を示す [econ.GN, cs.AI, cs.CY, q-fin.EC]目的:社会における幸福の優先順位と,公平性と個人の幸福との間のトレードオフに関する国民の意向
    • 幸福度は政策判断の重要な指標であり,国民の価値観を反映した社会設計が求められる。
    • 平均的な生活満足度は,個人の価値観や不平等への意識を考慮していない場合がある。
    • 集団全体の価値観をより正確に反映する,非線形効用に基づいた幸福度指標の開発を目指す。
    • 多数の参加者は,凹型の効用曲線を示し,個人のリスク回避よりも,社会全体の生活満足度における不平等への嫌悪感が強いことが示された。
    • このような公平性に関する選好は,政治的立場とは無関係であり,イデオロギーを超えた共通の規範意識が示唆された。
    • 本研究は,平均的な生活満足度を政策指標として用いることの妥当性に疑問を呈し,価値観に基づいたAIシステム設計にも示唆を与える。

    Link: https://arxiv.org/abs/2509.07793

  • 実データを用いたマッチングモデルのユニバーサル逆蒸留 (GANなし) [stat.ML, cs.LG]目的:マッチングモデルの効率的な蒸留
    • 生成モデルの品質向上は重要だが,推論速度が課題となっている。
    • 既存の蒸留法は特定のフレームワークに限定され,実データ活用にはGANが必要。
    • 実データを用いたGANなしの汎用的な蒸留フレームワークを確立する。
    • 本研究では,RealUIDという全てのマッチングモデルに適用可能な蒸留フレームワークを提案する。
    • RealUIDは,Flow MatchingやDiffusionモデルを含む様々なモデルに適用可能である。
    • 実データを取り込みながら,GANのような複雑な学習を必要としない点が特徴である。

    Link: https://arxiv.org/abs/2509.22459

  • スパース深層加法モデルと相互作用:解釈性と予測性の向上 [stat.ML, cs.LG]目的:スパース駆動型特徴選択と深層サブネットワークを組み合わせたフレームワーク
    • 近年の深層学習の進展により,少量サンプルから学習可能なパーソナライズモデルが求められている。
    • 高次元特徴を扱い,解釈性を維持しながら高い予測精度を実現することが課題である。
    • 相互作用を効率的に検出し,解釈可能な高次元回帰モデルを構築すること。
    • SDAMIは,Effect Footprintの原理に基づき,相互作用を網羅的な探索なしに発見する。
    • シミュレーション結果から,SDAMIは伝統的な手法では見逃される純粋な相互作用を正確に特定できることが示された。
    • 本研究は,解釈可能な高次元回帰のための原理的なフレームワークとしてSDAMIの有効性を示した。

    Link: https://arxiv.org/abs/2509.23068

  • 量子コンピュータによる多層ニューラルネットワークの推論の高速化 [quant-ph, cs.CC, quant-ph, cs.LG]目的:多層ニューラルネットワークの推論における量子コンピュータの利用可能性
    • 深層学習は画像認識など様々な分野で重要な役割を担っており,計算資源の効率化が求められている。
    • 古典計算では深層学習の推論に時間がかかり,リアルタイム処理が困難な場合がある。
    • 量子コンピュータの特性を利用し,深層学習の推論処理を高速化することを目指している。
    • 量子コンピュータを用いて,非線形活性化関数を持つ多層ニューラルネットワークを初めて完全にコヒーレントに実装した。
    • 量子データアクセス方式によって,古典的手法に対して2次または4次の速度向上を確立した。
    • 入力とネットワーク重みへの効率的な量子アクセスにより,推論コストに関する指数関数的なスケーリングを証明した。

    Link: https://arxiv.org/abs/2510.07195

  • X線スペクトルの潜在的表現の抽出:Chandra源の分類,回帰,および降着シグネチャ [astro-ph.IM, cs.AI, cs.LG]目的:Chandra X線スペクトルから,コンパクトかつ物理的に意味のある潜在的表現
    • 大規模X線サーベイにおいて,スペクトル情報は源の理解に不可欠である。
    • 既存手法では,Chandra Source Catalogのような大規模スペクトルデータへの適用が困難である。
    • 深層学習を用いて,効率的かつ解釈可能な表現を学習し,今後の解析を支援する。
    • 教師なし学習により,X線スペクトルを8次元の潜在空間に圧縮することに成功した。
    • 潜在空間でのクラスタリングにより,8種類の天体ソースで約40%の分類精度が得られた。AGNとコンパクト天体のみに限定すると,約69%に向上した。
    • 潜在的特徴量は,スペクトル情報や時間変動と相関を示し,物理的に意味のある情報を含んでいることが示された。

    Link: https://arxiv.org/abs/2510.14102

  • SU(5)における風味良い探索:機械学習によるアプローチ [hep-ph, cs.LG, hep-th]目的:SU(5)大統一理論におけるフェルミオン質量問題の解決策の比較
    • 素粒子物理学の標準模型を超えた理論構築は,未解決の物理現象の説明を目指す上で重要である。
    • SU(5)大統一理論はフェルミオンの質量を説明できないため,修正が必要とされている。
    • SU(5)モデルへの修正において,最も標準模型に近い,美しいモデルを特定すること。
    • 45次元場と24次元場による修正を比較した結果,24次元場による修正の方が,より標準模型に近いことが示された。
    • 超対称性,非超対称性の両方のシナリオにおいて同様の結果が得られた。
    • 連続パラメータyの最適化により,y≈0.8が最も標準模型に近いモデルに対応することが明らかになった。

    Link: https://arxiv.org/abs/2511.08154

  • TPV:テスト予測分散を通じたパラメータ摂動の分析 [math.OC, cs.SY, eess.SY, stat.ML, cs.LG]目的:訓練済みモデルの出力に対するパラメータ摂動の一次感度であるテスト予測分散(TPV)の分析
    • 機械学習モデルの堅牢性は,実世界への応用において極めて重要であり,その評価手法の確立が求められている。
    • 従来の堅牢性評価は,ラベルに依存する場合が多く,ラベルなしでの評価方法が課題となっていた。
    • TPVを用いることで,ラベルに依存しない形でモデルの堅牢性を評価し,改善するための新たな手法を開発すること。
    • TPVは,SGDノイズ,ラベルノイズ,量子化,プルーニングなど,様々な摂動メカニズムを統一的に捉えることができる。
    • 訓練データにおけるTPVは,過パラメータ化された条件下でテストデータにおけるTPVに収束することが理論的に証明された。
    • TPVはテスト損失と高い相関があり,ラベルなしプルーニング基準やモデル選択の指標として実用的な応用が可能であることが示された。

    Link: https://arxiv.org/abs/2512.11089

  • 注意の勾配ダイナミクス:クロスエントロピーによるベイズ多様体の形成 [stat.ML, cs.AI, cs.LG]目的:注意機構における勾配学習が内部幾何学を形成するメカニズムの解明
    • Transformerモデルの確率的推論能力の高さから,その内部動作原理の理解が求められている。
    • Transformerモデルの学習によって形成される内部幾何学が,どのようにして確率的推論を可能にするのか不明である。
    • クロスエントロピー学習が注意スコアと値ベクトルをどのように再構築し,ベイズ多様体を形成するかを明らかにすること。
    • 注意スコアの勾配は,アドバンテージに基づき,期待値との差によって決定されることが示された。
    • 値ベクトルの更新は,注意重みに基づいて行われ,クエリと値の共進化を促進する正のフィードバックループが形成される。
    • この勾配ダイナミクスは,EMアルゴリズムと類似しており,最適化プロセスが幾何学,ひいては関数を形成する統一的な理解を提供する。

    Link: https://arxiv.org/abs/2512.22473

  • 重い裾を持つノイズ下における非滑らかな凸最適化のためのクリップ勾配法:洗練された分析 [math.OC, cs.LG, stat.ML]目的:重い裾を持つノイズ下での非滑らかな凸最適化におけるクリップ勾配法の収束レートの改善
    • 現代の機械学習タスクでは,勾配ノイズの分布が有限の二乗モーメントを持つとは限らず,より重い裾を持つ分布が現実的である。
    • 重い裾を持つノイズ下での最適化は,既存のアルゴリズムでは収束が遅い場合がある。
    • 本研究は,クリップ勾配法における収束レートをより精密に分析し,既存の結果よりも高速なレートを導出することを目指す。
    • クリップ勾配法(Clipped SGD)の収束レートについて,有効次元(generalized effective dimension)を考慮したより洗練された分析を提供した。
    • 非滑らかな凸問題および強凸問題において,従来のレートよりも高速な収束レート ${\cal O}(\sigma_{\frak l}d_{\rm eff}^{-1/2{\frak p}}\ln^{1-1/{\frak p}}(1/\delta)T^{1/{\frak p}-1})$および${\cal O}(\sigma_{\frak l}^2d_{\rm eff}^{-1/{\frak p}}\ln^{2-2/{\frak p}}(1/\delta)T^{2/{\frak p}-2})$を導出した。
    • 期待値収束におけるレートについても解析を行い,既存の下界を破る新たなレートと,それに一致する新たな下界を確立することで,解析の最適性を証明した。

    Link: https://arxiv.org/abs/2512.23178

  • 地盤工学におけるPINNと演算学習の批判的評価 [physics.geo-ph, cs.LG]目的:地盤工学におけるSciML(科学機械学習)手法の性能評価と適用可能性
    • 地盤工学の数値解析は複雑であり,計算コストが高いことが課題である。
    • 従来の数値解析手法では,大規模なデータや複雑な形状への対応が難しい場合がある。
    • 本研究は,SciMLが地盤工学の問題解決に貢献できるか検証する。
    • MLPはデータへの適合は良いが,長期予測では誤差が大きくなる。
    • PINNは,領域内では精度が高いが,領域外では予測が困難である。
    • SciMLは,検証された領域内での補間やパターン認識には適しているが,逆解析には微分可能な物理ベースソルバーを優先すべきである。

    Link: https://arxiv.org/abs/2512.24365