arXiv雑要約

AI - 2026/05/27 公開

  • LocateAnything:並列ボックスデコーディングによる高速かつ高品質な視覚言語接地 [cs.CV, cs.AI, cs.LG, cs.RO]目的:視覚言語モデルにおける視覚的接地と検出の高速化と高精度化
    • 視覚と言語を組み合わせた理解は,画像認識やロボティクスなど多くの応用分野で不可欠である。
    • 従来の視覚的接地・検出は,ボックス情報を逐次的にトークン化するため,処理速度が遅れるという課題があった。
    • ボックス情報を並列にデコードすることで,処理速度の向上と位置特定精度の向上を目指す。
    • LocateAnythingは,並列ボックスデコーディング(PBD)に基づく統一的な生成フレームワークであり,ボックスの幾何学的整合性を維持し,大幅な並列処理を可能にする。
    • PBDにより,デコーディングのスループットと位置特定精度が向上し,様々なベンチマークで高いIoU(Intersection over Union)における位置特定品質が改善された。
    • 大規模なデータセットLocateAnything-Dataを構築し,PBDと大規模トレーニングデータの相乗効果により,効率的かつ正確な視覚的接地と検出を実現した。

    Link: https://arxiv.org/abs/2605.27365

  • MUSE-Autoskill: スキル生成,記憶,管理,評価による自己進化型エージェント [cs.AI, cs.CL, cs.LG, cs.MA]目的:スキルを中心としたエージェントフレームワーク
    • 複雑なタスク解決において,LLMエージェントは再利用可能なスキルに依存する点が重要である。
    • 既存のスキル生成手法では,スキルが孤立的・静的な存在として扱われ,再利用性や信頼性に課題がある。
    • スキルライフサイクル管理により,タスク成功率や効率,スキル再利用を向上させることを目指す。
    • 本フレームワークは,エージェントがタスク解決能力を継続的に向上させることを可能にする。
    • スキルレベルのメモリにより,タスク間の経験蓄積を実現し,効果的な再利用と適応を促進する。
    • SkillsBenchを用いた実験により,ライフサイクル管理されたスキルが有効であることが示された。

    Link: https://arxiv.org/abs/2605.27366

  • 採用におけるアルゴリズムの単一栽培 [cs.CY, cs.AI]目的:採用におけるアルゴリズムの単一栽培
    • 労働市場における効率性と公平性の確保は重要である。
    • 採用アルゴリズムのバイアスと差別問題が存在する。
    • アルゴリズムの単一栽培が差別を助長する可能性を検証する。
    • 特定のアルゴリズムベンダーのシステムを利用した求職者データ分析の結果,人種間の不均衡が明らかになった。
    • アジア系と黒人申請者のそれぞれ14.74%と25.87%が,米国の雇用差別基準に照らし合わせると不利な影響を受ける職位に応募している。
    • 10職に申し込んだ申請者の4%が全ての職で拒否勧告を受けており,偶然よりも高い割合である。

    Link: https://arxiv.org/abs/2605.27371

  • グラスマン多様体上のランダムウォークによる連続関数の確率的グローバル最適化 [math.OC, cs.LG]目的:連続関数のグローバル最適化手法
    • 複雑な最適化問題解決は,機械学習やデータ分析など広範な分野で重要である。
    • 従来の最適化手法は,凸性や滑らかさの仮定に依存し,複雑な関数には適用が難しい場合がある。
    • グラスマン多様体上のランダムウォークを用いて,そのような制約からの解放を目指す。
    • 提案手法は,低次元部分空間での最適化を繰り返すことで,高次元関数のグローバル最適化を実現する。
    • 収束性は,制限された最小値の幾何学的分布にのみ依存し,従来の条件を必要としない。
    • 損失関数の狭い深いディップの影響を受けにくい「ブラインドスポット耐性」を持つことが示された。

    Link: https://arxiv.org/abs/2605.14151

  • オープンウェイトAIモデルにおける倫理的制約のガバナンスの限界 [cs.AI, cs.CY, cs.SE]目的:オープンウェイトAIモデルにおける倫理的制約の追跡可能性
    • AI技術の急速な発展に伴い,倫理的な問題が顕在化しており,そのガバナンスが重要である。
    • AIモデルの派生過程で倫理的制約が失われやすく,サプライチェーン全体の責任追跡が困難である。
    • AIモデルの派生系列における倫理的制約の伝播限界を定量的に評価し,ガバナンスの改善策を提案する。
    • Hugging Face Hub上の214万件以上のモデルリポジトリの監査により,倫理的制約の証拠は,平均1.31ステップの派生ごとに半減することが示された。
    • 7世代以上の派生モデルの80%以上は,ガバナンス判断に必要な情報が不足しており,この限界を「ガバナンスの地平線」と定義した。
    • ライセンスメタデータの回復実験から,単なる施行だけでなく,政策設計が重要な要素であり,宣言義務化がガバナンスの地平線を大きく改善することが示された。

    Link: https://arxiv.org/abs/2605.24383

  • リアルタイムらせんbSSFP心臓MRIにおける高速アーチファクト抑制:CAIPI同時マルチスライス撮像 [physics.soc-ph, cond-mat.dis-nn, cs.SI, math.CO, physics.med-ph, cs.LG, eess.IV]目的:リアルタイムらせんbSSFP心臓MRIにおける高速アーチファクト抑制法の開発
    • 心臓機能評価には複数の断層が必要であり,撮像時間の短縮が臨床的ニーズに応える上で重要である。
    • 同時マルチスライス撮像は高速化に有効だが,非カルテシアン軌道と組み合わせると再構成に時間がかかる。
    • ディープラーニングを用いてアーチファクトを抑制し,リアルタイム再構成を可能にすることを目的とする。
    • リアルタイム同時マルチスライス撮像は,従来の息止め撮像と比較して約13倍高速であった(15秒対3分15秒)。
    • ディープラーニングを用いた再構成は,圧縮センシングと比較して約50倍高速であった(30秒対24分55秒)。
    • ディープラーニングによるアーチファクト抑制は,画像品質の定量的・定性的評価において圧縮センシングを上回った。

    Link: https://arxiv.org/abs/2605.26127

  • AutoDFT:自律的DFT計算のための閉ループマルチエージェントフレームワーク [physics.med-ph, cs.RO, cond-mat.mtrl-sci, cs.AI, cs.CE]目的:自律的DFT計算のためのフレームワーク開発
    • 材料科学と化学における計算的発見の基盤であり,新材料開発等に不可欠な手法である。
    • 計算の収束不良や予期せぬ物理現象への対応など,専門家の介入が必要であり,効率が低い。
    • LLMによる推論を計算サイクル全体に組み込み,専門家なしでも信頼性の高い結果を得ることを目指す。
    • AutoDFTは,VASPBenchにおいて94.1%のタスクレベル成功率を達成し,GPT-5.2との組み合わせで高い性能を示した。
    • 確立された材料データベースを用いて,電子状態,磁気的特性,エネルギー特性の定量的に信頼できる予測を実現した。
    • 計画と実行の間の閉ループを確立することで,高度な計算知識を持たない実験者でも第一原理計算結果を得ることが可能になった。

    Link: https://arxiv.org/abs/2605.26179

  • GNNベース創薬毒性予測における説明可能性の限界:分子構造で解明できないこと [q-bio.QM, cs.LG]目的:GNNを用いた薬物毒性予測における説明可能性のギャップの分類
    • 創薬において,安全性の高い薬剤開発は不可欠であり,毒性予測の精度向上が重要である。
    • 分子構造のみからでは,薬物の全ての薬理学的特性を予測することは困難である。
    • 本研究は,分子構造に符号化可能な情報量と,予測不可能な毒性影響を明確化する。
    • アスピリンをモデル化合物として,GNNによる毒性予測において,分子構造が約45%の説明力を持つことが示された。
    • 予測できない毒性影響は,「符号化不能」「データ欠損」「アッセイ不一致」「表現誤差」の4つのカテゴリに分類された。
    • 表現誤差はMPNNのメッセージ伝達層に集中しており,アテンションプーリング実験によって特定された。

    Link: https://arxiv.org/abs/2605.26183

  • 最小曲面,結び目,およびニューラルネットワーク [math.DG, cs.LG, math.GT]目的:結び目のHOMFLY多項式の係数と,双曲4空間における最小曲面の符号付き個数の関係の検証
    • 低次元トポロジーは,数学や物理学において基本的な研究対象であり,その理解は重要である。
    • 結び目の不変量であるHOMFLY多項式と幾何学的な最小曲面との関係は未解明な部分が多い。
    • ジョエル・ファインの予想を検証するため,最小曲面の計算手法を開発し,その予測との比較を行う。
    • 物理情報に基づいたニューラルネットワーク(PINN)を用いて,双曲空間における最小曲面方程式を解く新しい機械学習フレームワークを開発した。
    • 様々な結び目を含む近最小曲面を構築し,自己交差を検出し,その符号を計算するアルゴリズムを開発した。
    • 解析した全ての結び目において,計算によって得られた最小曲面と自己交差数は,ファインの予想と完全に一致し,経験的な証拠を提供した。

    Link: https://arxiv.org/abs/2605.26234

  • 多変量呼吸不全予測の予備的評価:胸部X線写真がEHRデータのみでは得られない性能向上をもたらすか [eess.IV, cs.AI, cs.LG]目的:呼吸不全の早期予測
    • 集中治療における早期介入には,呼吸状態の早期予測が不可欠である。
    • 既存のEHRベースのモデルは生理学的悪化を監視できるが,胸部X線写真に反映される肺病態を捉えきれない場合がある。
    • 胸部X線写真情報を活用し,呼吸不全の予測精度向上を目指す。
    • ゲート付き多変量モデルは,EHRデータのみのベースラインよりも高い識別能を示した(REMEDIS: AUROC 0.860, MedInsight: AUROC 0.858,Vent.io: AUROC 0.752)。
    • 医師の予測と比較して,多変量モデルは感度を大幅に向上させつつ,特異度を維持した。
    • EHRデータのみのモデルと比較して,多変量統合は特異度と陽性的中率を向上させ,選択された患者のリスク評価を改善する可能性を示唆した。

    Link: https://arxiv.org/abs/2605.26255

  • 未知の単調リンク関数を持つ非線形因子モデルの不完全かつノイズのあるデータからの学習 [eess.SP, cs.SY, eess.SY, stat.ML, cs.LG, econ.EM]目的:非線形因子モデルの復元
    • 潜在的な低次元構造の学習は,高次元データの解析において重要な役割を果たす。
    • 非線形性と関数の未知性により,従来の因子モデルでは対応が困難なケースが存在する。
    • 単調なリンク関数を仮定することで,識別可能性を保ちつつ柔軟な非線形モデリングを可能にする。
    • 提案手法は,低ランク因子,荷重,非線形リンク関数を同時に復元する。
    • ブロック座標降下法に明示的な正則化を導入することで,スケーリングと回転の曖昧さに対処する。
    • 因子とサンプリング条件のコヒーレンスが穏やかな場合,ノイズあり/なし両方で収束性が保証される。

    Link: https://arxiv.org/abs/2605.26271

  • 比率に基づく処置効果に対する二重に頑健なメタ学習器 [stat.ML, cs.LG, stat.ME]目的:比率に基づく処置効果推定手法の開発
    • 医療,価格設定,マーケティングなど,処置効果が自然に比率で表現される場面が多い。
    • 既存の推定方法は,対数線形構造を課すか,この関数に対する頑健性の保証がない汎用回帰を用いる。
    • 比率CATE推定を二つのロジスティック回帰の積に分解し,より頑健な推定を実現する。
    • Q-Learnerは,低転換率のデータセットにおいて,既存手法よりも安定した性能を示す。
    • 提案する二重に頑健な学習器は,観察データにおいても優れた性能を発揮する。
    • これらの結果から,観察データにおける処置効果推定のデフォルト手法として有用である。

    Link: https://arxiv.org/abs/2605.26288

  • 深層学習に基づく代数レイノルズ応力クロージャ:乱流シミュレーションのためのRANS [physics.flu-dyn, cs.LG]目的:乱流シミュレーションのためのRANSにおける代数レイノルズ応力クロージャ
    • 工学や科学において乱流は遍在するが,直接シミュレーションは計算コストが高い。
    • 機械学習クロージャは分布シフトの影響を受けやすく,汎化性能が課題である。
    • 少ないデータで学習し,様々な条件で正確に汎化できるクロージャモデルを開発する。
    • DARSMは,従来のRANSモデルと比較して,平均的な速度誤差を2~4倍低減した。
    • 特に,特定のケースでは最大12倍の誤差低減を実現している。
    • 付着流から分離流へと流動様式が変化する条件下でも,再学習なしに高い精度を維持した。

    Link: https://arxiv.org/abs/2605.26358

  • LeJEPAはいつ世界モデルを学習するか [stat.ML, cs.LG]目的:世界モデルの学習におけるLeJEPAの性質
    • 現実世界の複雑さを理解し,それをモデル化することは,知的な行動の基盤となる。
    • 既存の世界モデルは,真の自由度を捉えきれず,汎化性能に課題がある。
    • LeJEPAがどのような条件で世界構造を正確に復元できるかを理論的に解明する。
    • LeJEPAは,広範なクラスの世界において,非線形な観測から潜在変数を線形に復元することが証明された。
    • ガウス分布が,線形識別可能性を保証する唯一の潜在分布であることも示された。
    • 線形識別可能性は,最適な潜在空間での計画を可能にする。

    Link: https://arxiv.org/abs/2605.26379

  • 治療意図を通じた交絡因子検出:新しい観察研究デザイン [stat.ME, cs.AI, cs.LG, stat.ML]目的:交絡因子の検出
    • 介入効果の理解は科学的進歩に不可欠であり,因果推論は多くの分野で重要である。
    • 観察データは,未観測の交絡因子により因果推論が困難となる場合が多い。
    • 人間の専門家の知識を活用し,未観測交絡因子を特定することで因果推論を改善することを目指す。
    • 治療意図を通じた交絡因子検出という新しい研究デザインを提案し,理論的根拠を確立した。
    • 集中治療室(ICU)の電子カルテデータにおける未観測交絡の存在を示す経験的証拠が得られた。
    • 臨床テキスト注釈と自然言語処理を活用し,既知の真値を持つ半合成環境で本手法の概念実証を行った。

    Link: https://arxiv.org/abs/2605.26413

  • 大規模分布外テストのための構造適応型帰納的推論 [physics.soc-ph, cs.SI, physics.data-an, stat.ME, cs.AI, cs.LG, stat.ML]目的:大規模分布外テストにおける信頼性の高い異常検知手法の開発
    • 機械学習の応用範囲拡大に伴い,未知のデータへの対応能力が重要視されている
    • 従来の帰納的推論は,データの構造的情報を活用しにくく,性能が制限される場合がある
    • 構造的パターンを考慮した新規な帰納的推論手法により,分布外データの検出精度向上を目指す
    • 提案手法SCQは,個々のテスト証拠と構造的パターンを統合し,有意性指標を提供する。
    • P-TAMSは,複数の候補モデルから最適なモデルを自動選択し,構造化された分布外テストに適応する。
    • 実験結果から,提案手法は偽陽性率を制御し,多様な設定で良好な性能を示すことが確認された。

    Link: https://arxiv.org/abs/2605.26429

  • 自律型AIエージェントのための時間整合性のある反実仮想的算定実行環境の基礎 [math.CO, cs.DM, q-fin.RM, cs.AI]目的:自律型AIエージェントにおける,副作用を伴う行動に対する時間整合性のある反実仮想的リスク評価
    • AIエージェントの自律性が高まるにつれ,その行動に伴うリスク管理が重要となる。
    • 既存のリスク管理は事後的なものであり,行動前の予防的リスク評価が不足している。
    • 行動ごとの保険を基本単位として,事前トランザクション層によるリスク管理を実現する。
    • 提案フレームワークは,契約上固定された安全なデフォルトに対して,行動ごとの反実仮想的リスク評価を可能にする。
    • アンダーライティング境界内で,経路分解された行動を境界ポテンシャルに集約し,ゲーム耐性を高める設計が可能となる。
    • 実行行動予算保証を得るための,確率的リスク評価と実行制限の定理が導かれる。

    Link: https://arxiv.org/abs/2605.26508

  • DGLD:ドメインゲート付き潜在拡散による新規高性能エネルギー物質の探索 [physics.chem-ph, cs.AI]目的:新規高性能エネルギー物質の探索
    • エネルギー物質の性能向上は,推進剤の軽量化や兵器の小型化に直結し,安全性向上にも貢献する。
    • 高性能エネルギー物質の設計は,ラベル付きデータが乏しく,既存の生成モデルでは精度向上が困難である。
    • 本研究では,ラベル品質を考慮した生成モデルDGLDを開発し,高性能エネルギー物質の効率的な探索を目指す。
    • DGLDにより,第一原理計算で検証された12個の新規有望物質を特定した。
    • 特に,3,4,5-トリニトロ-1,2-イソキサゾール(L1)は,既存の分子構造とは大きく異なり,高い密度と爆速を示す。
    • 別の有望物質(E1)は,L1とは異なる化学構造を持ちながら,さらに高い爆速を実現している。

    Link: https://arxiv.org/abs/2605.26540

  • データ駆動型スパース識別による支配偏微分方程式の特定:ノックオフフィルタと多基準トレードオフに基づく手法 [stat.AP, cs.LG]目的:支配偏微分方程式の簡潔な識別
    • 物理現象のモデリングにおいて,支配方程式の特定は不可欠である。
    • 候補項間の多重共線性により,偽の項が選択されやすい。
    • ノックオフフィルタと多基準トレードオフにより,正確な方程式構造を復元する。
    • 提案手法KO-PDE-IDENTは,ノイズ下においても真の偏微分方程式構造を正確に復元可能である。
    • ノックオフフィルタとSHAPを組み合わせることで,効率的な統計量の構築を実現している。
    • 予測精度,モデルの複雑さ,係数不確実性のバランスにより,最適な支配方程式を選択する。

    Link: https://arxiv.org/abs/2605.26631

  • CARTランダムフォレストにおけるランダム機会集合への逐次割り当て:アンサンブルリスクの確率制御理論 [stat.ML, cs.LG]目的:CARTランダムフォレストの解釈可能性向上と最適化
    • 機械学習における予測精度向上は重要であり,特にランダムフォレストはその代表的な手法である。
    • ランダムフォレストの内部メカニズムは複雑で,ブラックボックスとして扱われがちである。
    • 確率制御理論を用いてランダムフォレストの振る舞いを分析し,最適化の可能性を探る。
    • CARTランダムフォレストを,特徴量サブサンプリングをランダムな実行可能行動集合,CART分割ルールを行動割り当てポリシーと解釈した。
    • このポリシーは,情報的分割数状態における確率的プロセスを誘導し,単一の決定木の誤差と,フォレストの平均二乗誤差(MSE)における決定木間の相互作用項を決定する。
    • 特徴量サブサンプリングによる情報的機会率と,マスク内分割ポリシーからの収縮強度という2つの設計レバーが分離された。

    Link: https://arxiv.org/abs/2605.26675

  • 適切な較正 [econ.TH, cs.LG, stat.ML]目的:適切な較正および適切なカライベートの概念の拡張
    • 予測の精度向上は,意思決定やリスク管理において不可欠であり,信頼性の高い予測手法が求められる。
    • 従来の較正の概念は,特定の得点ルールに依存しており,より一般的な状況への適用が課題であった。
    • 任意の適切な得点ルールにおいて一様に収束する,より強固な概念である「適切なカライベート」を確立する。
    • 標準的な二乗誤差得点ルールに対する「カライベート」概念を,適切な得点ルールのクラスに拡張した。
    • 較正は常に適切な較正を意味するが,カライベートは必ずしも適切なカライベートを意味しないことが示された。
    • 適切なカライベートと,不確実性の下での意思決定における予測への最適反応時の普遍的な後悔回避との等価性が示された。

    Link: https://arxiv.org/abs/2605.26703

  • Transformerは文脈内で事後予測分布を学習できる [stat.ML, cs.LG]目的:文脈内学習による事後予測分布の近似
    • ベイズ予測は不確実性の定量化に不可欠であり,リスク管理や意思決定を支援する。
    • Transformerが文脈内で分布を学習できるかどうかの理論的理解は十分ではない。
    • Transformerが事後予測平均と分散を対象とする勾配降下法を実装できることを示す。
    • Transformerは,ガウス過程回帰問題において,事後予測平均と分散を対象とする勾配降下法を実装可能である。
    • 非線形写像により,事後予測分布のビン分割確率を算出できる。
    • 正規化と注意層の深さが,Transformerのサンプルサイズを超える外挿能力に重要な役割を果たす。

    Link: https://arxiv.org/abs/2605.26713

  • ニューラル細胞オートマトンの予測不確実性の測定 [eess.IV, cs.AI, cs.CV]目的:ニューラル細胞オートマトンに基づく医用画像セグメンテーションにおける不確実性の推定
    • 近年,医用画像セグメンテーションの精度向上が求められており,新たな手法が模索されている。
    • ニューラル細胞オートマトンの予測の信頼性を判断することが難しいという課題がある。
    • ニューラル細胞オートマトンの内在する構造を利用し,予測の安定性を評価することで不確実性を測る。
    • 提案手法である「レジリエンス」は,ニューラル細胞オートマトンの状態に対する微小な摂動に対する予測の安定性を評価する。
    • レジリエンスは,セグメンテーション品質の予測において,既存手法よりも信頼性の高い失敗ケースの識別を可能にする。
    • これにより,ニューラル細胞オートマトンに基づくモデルの信頼性と安全性の向上に貢献する。

    Link: https://arxiv.org/abs/2605.26726

  • MatFormBench:ターゲット駆動型材料組成のベンチマーク評価フレームワーク [cond-mat.mtrl-sci, cs.AI]目的:ターゲット駆動型材料組成のための生成戦略の評価と指針
    • 材料設計において,目的とする物性を達成する組成を探索する重要性が高まっている。
    • 既存の機械学習ベンチマークは順予測に偏っており,逆最適化アルゴリズムの評価が不十分である。
    • ターゲット駆動型材料設計の進展を阻害する逆設計アルゴリズムの評価ギャップを解消すること。
    • MatFormBenchは,現実的な材料の構造と物性の関係を忠実に再現する合成サンプルを生成する物理駆動型生成スキームを統合している。
    • 提案されたMatFormScoreは,ターゲット達成度,探索効率,探索能力,ロバスト性,安定性の5つの軸でアルゴリズム性能を定量的に評価する。
    • 拡散モデルが最も高い全体性能を示し,VAEやGAベースの手法は特定のシナリオで優位性を示した。

    Link: https://arxiv.org/abs/2605.26741

  • 量子モンテカルロ法の符号問題に対するニューラル自己回帰的制御変量 [math.GR, cs.CC, math.OC, cs.SY, eess.SY, cond-mat.str-el, cs.LG, physics.comp-ph]目的:量子モンテカルロシミュレーションにおける符号問題を軽減するためのゼロ平均制御変量の構築
    • 量子多体系問題の数値計算において,モンテカルロ法は重要な役割を担う。
    • 符号問題は,モンテカルロ法におけるボトルネックであり,正確な計算を困難にする。
    • 自己回帰的制御変量を用いることで,符号問題を効果的に軽減することを目指す。
    • 三角格子ハイゼンベルク反強磁性体において,制御変量を用いた検証が行われた。
    • 平均符号の標準誤差を1桁,エネルギー推定量の標準誤差を3~5倍程度低減することに成功した。
    • 本研究は,自己回帰的制御変量が符号問題の軽減に有効であることを示した。

    Link: https://arxiv.org/abs/2605.26814

  • ジェットタグにおける粒子・Lund多様性 [math.CO, cs.DM, math.NT, hep-ph, cs.LG, hep-ex]目的:ジェット内のQCD放射の階層的な表現と,それを用いたトップクォークやヒッグスボソンなどのタグ付け性能の向上
    • 高エネルギー物理実験において,ジェット構造の理解は新たな物理現象探索に不可欠である。
    • 従来のジェット解析手法では,QCD放射の階層構造を十分に捉えきれていない場合がある。
    • トランスフォーマーモデルとLund平面の情報を統合し,より高精度なジェットタグ付けを実現すること。
    • PLuMは,粒子情報とLund平面のスプリッティングを共有潜在空間に射影することで,両方の情報を統合的に処理する。
    • トップクォークや$\mathrm{H}\to\mathrm{b}\bar{\mathrm{b}}$タグ付けにおいて性能が向上し,特に$\mathrm{H}\mathrm{H}(4\mathrm{b})$探索において,背景除去率が25%向上した。
    • これは,bジェット形成に関する階層的情報が,トランスフォーマーモデルにおいても依然として有効であることを示唆している。

    Link: https://arxiv.org/abs/2605.26821

  • 感覚調整ネットワーク:対象指向現象学の建築的基盤としての停止可能性 [q-bio.PE, cs.DM, q-bio.NC, cs.AI, cs.RO]目的:認知科学における認知主義と4Eアプローチの対立を解消するための,感覚調整ネットワーク(SMN)の提案
    • 認知科学は,言語や推論を説明できる認知主義と,身体性を重視する4Eアプローチに分かれており,統合が課題である。
    • 認知主義は意味の基盤を説明できず,4Eアプローチは身体構造の詳細な規定に乏しい点が問題である。
    • SMNは,身体構造における拮抗的動態と停止可能性によって,認知と身体性の統合を目指す。
    • SMNは,身体全体を有機的に捉え,拮抗的動態に基づいた構造を持つことで,対象指向現象学の基盤となる停止可能性を実現する。
    • 自己変調可能な行動パターン(SMAP)により,自己と世界の区別が構造的に組み込まれ,カテゴリーとして付与されるものではない。
    • 行動パターンの階層構造(基底,停止可能,交渉可能,取引的)は,自律的な規則性から公的な慣習化への単一の経路を提供する。

    Link: https://arxiv.org/abs/2605.26856

  • ロバストな開放量子系制御のための適応型強化学習:時間最適化を用いたマルチタスクフレームワーク [eess.IV, cs.MM, math.OC, cs.SY, eess.SY, quant-ph, cs.LG]目的:多様なハミルトニアンにおける開放系量子制御のための最適パルス系列
    • 量子技術は,計算,通信,センシングなど,幅広い分野での応用が期待されている。
    • 現実の量子デバイスはノイズの影響を受けやすく,その制御は困難である。
    • ノイズ環境下においても高精度な量子状態制御を実現するロバストな制御手法の開発。
    • マルチタスクSACモデルは,51種類のハミルトニアンに対して高精度な状態遷移パルスを生成可能。
    • 学習済みのモデルは,訓練に使用されていないハミルトニアンに対しても高い性能を維持した。
    • SACで学習した制御パルスは,GRAPE最適化された制御よりもノイズに対して頑健であることが示された。

    Link: https://arxiv.org/abs/2605.26925

  • ニューラルネットワークにおける表現の整列は,信号対雑音比とサンプルサイズに左右される [stat.ML, cond-mat.dis-nn, cs.LG, cs.NE, q-bio.NC]目的:ニューラルネットワークにおける表現の整列
    • 深層学習の汎化性能向上には,ネットワーク内部の表現理解が不可欠である。
    • 異なるネットワーク間での表現の不一致は,モデルの解釈性と頑健性を阻害する。
    • 信号対雑音比とサンプルサイズが表現の整列に与える影響を解明すること。
    • 信号対雑音比とサンプルサイズは,表現の整列に同様の効果を持つ。
    • 整列度は,信号対雑音比に対して単調に変化するが,サンプルサイズに対してはそうではない。
    • 表現の整列が最小となるのは,データの補間閾値付近であり,整列度と汎化性能は必ずしも相関しない。

    Link: https://arxiv.org/abs/2605.26973

  • 制約付きベイズ実験計画:オンラインプランニングによる実現 [stat.ML, cs.LG]目的:制約下でのベイズ実験計画最適化
    • 実験回数を減らし,効率的にデータを収集することは,科学研究やエンジニアリングにおいて重要である。
    • 従来のベイズ実験計画法では,予算や物理的制約など,動的な制約への適応が困難であった。
    • 本研究は,動的な制約下でも効果的な実験計画を立てるための手法を開発することを目的とする。
    • 提案手法は,事前学習された方策とシナリオツリーを用いたオンラインプランニングを組み合わせることで,制約付きベイズ実験計画を実現する。
    • 様々な制約付き実験計画タスクにおいて,既存手法と比較して,より情報量の多い実験シーケンスを生成することが示された。
    • 計算コストの増加はわずかであり,実用性も高いことが確認された。

    Link: https://arxiv.org/abs/2605.26990

  • 一般化可能な推薦のための因果表現学習 [stat.ML, cs.LG, stat.ME]目的:観測データから学習したモデルの汎化性能向上
    • 推薦システムは,ユーザー行動やプラットフォームのフィルタリングの影響を受け,データに偏りが生じやすい。
    • 学習データと実運用データとの分布のずれが,オフライン評価とオンライン性能の乖離を引き起こす。
    • 分布のずれに対する汎化性能を向上させるため,因果表現学習の理論を応用する。
    • 提案手法は,情報理論的な基準に基づき,因果成分のみに依存する表現を学習する。
    • SpotifyでのA/Bテストにより,実運用におけるリスナーエンゲージメントの向上が確認された。
    • KuaiRandデータセットおよび合成ベンチマークでも,分布のずれ下でベースラインを上回る汎化性能が示された。

    Link: https://arxiv.org/abs/2605.27043

  • 相関行列に対するWishart事前分布の新しいMCMC実装に基づくガウス過程学習 [stat.ML, cs.LG]目的:ガウス過程におけるカーネルハイパーパラメータのベイズ推論
    • 高次元データの学習において,カーネルの共分散行列の推定は重要である。
    • 多変数の関数を扱う場合,複数の長さスケールパラメータの同時推定が困難である。
    • 共分散行列に対する事前分布の直接的な指定を通して,情報量の少ない入力を特定する。
    • 相関行列に対する「自己組織化」Wishart事前分布を開発し,MCMCによるカーネルハイパーパラメータのベイズ推論を行った。
    • MCMC反復の履歴ウィンドウを利用することで,時間ステップ依存のスケール行列を定義し,連鎖への適応性を導入した。
    • 合成データと実世界データセットを用いた実験により,提案手法の有効性を確認した。

    Link: https://arxiv.org/abs/2605.27093

  • TWIST:アプリケーションを意識した無線デジタルツインのための閉ループトークン同期 [math.CO, cs.FL, eess.IV, cs.AI]目的:アプリケーションを意識した無線デジタルツインのためのトークン同期
    • 無線デジタルツインは,物理世界と仮想世界のリアルタイムな同期を実現し,様々な応用分野での活用が期待されている。
    • 限られた通信資源下では,視覚的な再構成の最適化だけでは,アプリケーションが必要とするセマンティックな状態とのミスマッチが生じやすい。
    • TWISTは,アプリケーションの優先度に応じて同期モードを適応的に変更することで,効率的な同期と高精度な状態推定を実現する。
    • TWISTは,物理的観測をトークンとして表現し,無線リンク上で状態を同期することで,従来の画素ベースの伝送や固定モード伝送と比較して,トラフィック状態推論の精度を向上させる。
    • 誤り訂正保護と補完モデルを組み合わせることで,不確実なトークン情報を効果的に復元し,セマンティックなデジタルツインの状態をより正確に更新する。
    • TWISTは,チャンネル品質,受信者の不確実性,セマンティックなドリフト,アプリケーションの優先度といったフィードバック統計を生成し,それに基づいて同期モードを適応させることで,同期コストを削減する。

    Link: https://arxiv.org/abs/2605.27205

  • Qiskit QuantumKatas:LLM評価のためのMicrosoftの量子コンピューティング演習の適応 [quant-ph, cs.AI]目的:LLMの量子コンピューティング能力の体系的な評価
    • 量子コンピューティングは,従来の計算機では解けない問題を解く可能性を秘めており,学術・産業界で注目されている。
    • 大規模言語モデル(LLM)の量子コンピューティング分野における能力評価は,まだ十分に進んでいない。
    • 既存の教育教材を基盤とし,LLMの量子コンピューティングに関する理解度を客観的に評価するベンチマークを構築する。
    • 本ベンチマークは,モデルの能力を識別することができ,最高設定の正答率は32.3%から83.1%の範囲であった。
    • モデルは既知のアルゴリズムの実装には優れているが,問題のエンコードには苦戦していることが示された。
    • 思考連鎖プロンプティングは,一部のモデルでは有効だが,他のモデルでは性能を低下させる可能性があることが明らかになった。

    Link: https://arxiv.org/abs/2605.27210

  • 線形・非線形次元削減の統一に向けたRBMの再定式化 [cs.LG, stat.ML]目的:線形および非線形次元削減のためのRBM再定式化
    • 高次元データ処理は,情報検索,画像認識など様々な分野で重要性を増している。
    • 従来のRBMは確率解釈とMCMCが必要であり,計算コストが高いという課題があった。
    • MCMCを用いないCDアルゴリズムの収束性と,線形・非線形次元削減の統一を目指す。
    • 本研究では,MAP推定とEMアルゴリズムを用いて,MCMCを用いないCDアルゴリズムの収束性を理論的に証明した。
    • RBMを決定論的なモデルとして再定式化し,CDアルゴリズムが勾配降下法を近似することを示した。
    • 実験により,再定式化されたRBMが線形・非線形次元削減において良好な性能を発揮し,特に非線形削減ではPCAを上回る結果が得られた。

    Link: https://arxiv.org/abs/1909.08210

  • 優先順位付き知識ベースの一貫性のない部分に対するクエリと修復:複雑性解析と抽象的な議論との関連性 [cs.LO, cs.AI, cs.DB]目的:優先順位付き知識ベースにおける不整合の処理
    • 知識ベースは,情報に基づいた意思決定や推論に不可欠であり,その信頼性は重要である。
    • 知識ベースに不整合が存在する場合,クエリに対する適切な回答を得ることが困難になる。
    • 不整合を許容する意味論に基づいた最適な修復の複雑性を解析し,議論枠組みとの関連性を明確化する。
    • 優先順位付き知識ベースにおけるグローバル最適,パレート最適,完全性最適の修復概念を定義した。
    • これらの修復概念に基づいたクエリ包含,一意な最適修復の存在,すべての最適修復の列挙に関するデータ複雑性が解析された。
    • パレート最適修復は安定拡張と密接に関連し,グラウンデッド拡張に触発された新しい意味論が提案された。

    Link: https://arxiv.org/abs/2003.05746

  • ハイパーネットワークを用いた継続的なモデルベース強化学習 [cs.LG, cs.AI, cs.RO]目的:継続的なタスクシーケンスにおける動力学モデルの学習
    • モデルベース強化学習は,ロボットの自律的な学習に不可欠であり,効率的な計画に重要である。
    • 既存手法では,モデルの再学習に時間がかかり,経験が増えるほど遅延が大きくなる。
    • 本研究は,限られたメモリで効率的にタスクに応じた動力学モデルを学習する手法を提案する。
    • 提案手法HyperCRLは,過去のデータを再学習せず,最新の経験のみを用いて学習を行う。
    • HyperCRLは,固定容量のハイパーネットワークにより,非定常かつタスクに応じた動力学を表現する。
    • ロボットの移動および操作タスクにおいて,既存手法やcoresetベースの手法と同等以上の性能を示す。

    Link: https://arxiv.org/abs/2009.11997

  • メッシュベース物理シミュレーションのBSMS-GNNによる効率的な学習 [cs.FL, math.CO, cs.LG]目的:大規模メッシュにおける物理シミュレーション学習
    • 物理シミュレーションは,現実世界の挙動を再現する上で不可欠であり,様々な分野で応用が期待される。
    • 大規模メッシュでは,計算コストとオーバー スムージングの問題があり,GNNを用いた効率的なシミュレーションが課題である。
    • 手動での粗メッシュ作成や空間近接に基づくレベル構築の課題を克服し,効率的な多段階シミュレーションを実現する。
    • 提案手法Bi-strideは,手動での粗メッシュ作成を必要とせず,空間近接による誤ったエッジの生成を回避する。
    • Bi-strideは,U-Netに類似した構造により,計算コストを大幅に削減することを可能にする。
    • 実験の結果,提案手法BSMS-GNNは,既存手法と比較して,精度と計算効率の両面で優れた性能を示す。

    Link: https://arxiv.org/abs/2210.02573

  • 解釈可能な連合学習に向けて [cs.LG]目的:解釈可能な連合学習の現状と将来展望
    • データ活用の重要性が増す中,プライバシー保護と機械学習の発展が求められている。
    • 連合学習はプライバシー保護に貢献するが,モデルの解釈性が課題となっていた。
    • 連合学習モデルの解釈性を高め,信頼性と公平性を向上させることを目指す。
    • 本調査は,解釈可能な連合学習に関する初の包括的なサーベイとなる。
    • 解釈性を考慮した連合学習手法の分類と分析を行い,主要な評価指標を提示した。
    • モデルのデバッグ,貢献度評価,公平な報酬分配など,今後の発展に向けた方向性を示唆した。

    Link: https://arxiv.org/abs/2302.13473

  • 大規模言語モデルを用いた多エージェント因果探索 [cs.AI, cs.CL]目的:因果関係の特定
    • 科学における基礎問題であり,変数の因果関係を明らかにすることが重要である。
    • 従来の統計的因果探索法は観察データのみに依存し,メタデータの文脈情報を無視する。
    • LLMのバイアスや記憶に依存する判断を避けるため,多エージェントによる議論を取り入れる。
    • MACは,五つのベンチマークデータセットと三つの評価指標において,既存の統計手法およびLLMベース手法を上回る集計性能を示した。
    • Gemini-2.0-Flashを使用した場合,15の評価ポイントのうち10で1位を獲得し,地震グラフの完全な再構成にも成功した。
    • 異なるバックボーンLLMを用いても堅牢な性能を維持している。

    Link: https://arxiv.org/abs/2407.15073

  • 機械学習のための漸進的Gauss-Newton降下法 [cs.LG, math.OC, stat.ML]目的:機械学習における効率的かつスケーラブルな最適化手法の提案
    • 機械学習では,大規模なデータセットに対する学習効率が重要であり,スケーラビリティが求められる。
    • 確率的勾配降下法は効率的だが,特徴量のスケーリングや局所的なモデル感度に影響を受けやすい。
    • 本研究は,そのような影響を受けにくい,新たな最適化手法を開発し,その有効性を示す。
    • 提案手法であるIncremental Gauss-Newton Descent (IGND) は,Gauss-Newton法を簡略化し,行列演算や線形方程式の解法を必要としない。
    • IGNDは,サンプルごとの勾配に対するスカラー正規化として閉形式で表現でき,メモリ効率が良い。
    • 実験結果から,IGNDは感度スケーリングに対するロバスト性を向上させ,既存の確率的最適化手法と同等またはそれらを補完する性能を示す。

    Link: https://arxiv.org/abs/2408.05560

  • 深層ReLUネットワークと深層演算ネットワークのニューラルスケーリング則:理論的研究 [cs.LG, stat.ML]目的:深層演算ネットワークにおけるニューラルスケーリング則の定量化
    • 深層ニューラルネットワークの性能向上において,ニューラルスケーリング則は重要な役割を担う。
    • ニューラルスケーリング則を理解するための完全な理論的枠組みは未発達である。
    • 演算学習におけるニューラルスケーリング則の一部の説明と,その応用に関する理論的基盤を提供する。
    • 深層演算ネットワークの近似誤差と汎化誤差の関係を,ネットワークモデルサイズや学習データサイズなどの主要因に基づいて明らかにした。
    • 入力関数が低次元構造を持つ場合,よりタイトな誤差限界を導き出した。
    • これらの結果は深層ReLUネットワークやその他の類似構造にも適用される。

    Link: https://arxiv.org/abs/2410.00357

  • CktGen:生成AIを用いたアナログ回路の自動設計 [cs.LG]目的:生成AIによるアナログ回路の自動設計手法
    • アナログ回路設計は,熟練した専門知識を要し,設計期間が長いため,自動化が望まれている。
    • 既存手法では,単一の最適化タスクとして扱うため,様々な設計仕様への対応が課題であった。
    • 本研究は,仕様に基づいたアナログ回路の生成により,設計の自動化を促進することを目的とする。
    • CktGenは,回路と仕様を潜在空間にマッピングし,それらを再構築する変分オートエンコーダである。
    • 回路と仕様のエンコードを分離し,潜在空間を整列させることで,仕様と回路の一対多の関係性を捉えている。
    • 実験結果から,CktGenが最先端手法と比較して大幅な性能向上を達成することが示された。

    Link: https://arxiv.org/abs/2410.00995

  • CHESTNUT:モバイルエッジ環境におけるQoSデータセット [cs.LG]目的:モバイルエッジ環境におけるQoSデータセット
    • ネットワークサービスの性能評価においてQoSは重要であり,特にモバイルエッジ環境での利用が拡大している。
    • 既存のQoSデータセットは静的な指標に偏り,時間や地理情報の動的な属性が欠如している。
    • 時間と地理情報を含むQoSデータセットを提供し,より正確なQoS予測を可能にすること。
    • 本研究では,QoS収集時に時間と地理情報を正確に記録した新たなデータセットを提案した。
    • 提案データセットは,QoSの変動を時間と場所の関係で捉え,予測の精度向上に貢献する。
    • モバイルエッジ環境におけるQoS予測を支援するための,信頼性の高いデータを提供することを目的とする。

    Link: https://arxiv.org/abs/2410.19248

  • LLM量子化における精度と性能のトレードオフ:「BF16か死か」 [cs.CY, cs.LG, cs.AI]目的:LLM量子化における精度と性能のトレードオフの評価
    • LLMの推論コストは高額であり,高速化が求められている。
    • 量子化による性能向上は確かだが,精度とのバランスが不明確である。
    • 異なる量子化形式がLLMの性能に与える影響を明らかにする。
    • FP8量子化は,モデルの規模にかかわらず,ほぼ損失なく精度を維持できることが示された。
    • 調整されたINT8量子化は,わずかな精度低下(1-3%)で高い性能を発揮することが確認された。
    • INT4量子化は予想以上に競争力があり,8ビット量子化に匹敵する性能を示すことがわかった。vLLMフレームワークを用いた分析から,W4A16は同期環境に,W8A8は非同期バッチ処理に最適であることが示された。

    Link: https://arxiv.org/abs/2411.02355

  • LiPUP-MA:居住体験を中心とした参加型都市計画のためのマルチエージェントフレームワーク [cs.AI, cs.CL, cs.LG]目的:居住体験と計画修正を繰り返す閉ループパラダイムによる参加型都市計画の実現
    • 都市計画において,住民の意見を反映させることは重要であり,より良い都市空間を創造する上で不可欠である。
    • 既存手法は,静的な嗜好収集や一回の議論に依存し,現実の都市計画の循環的な性質を捉えられていない。
    • 居住体験に基づく計画修正のサイクルを確立し,都市計画の質を向上させることを目指す。
    • LiPUP-MAは,都市に根ざした居住体験を収集・整理するためのPlan-centric Graph-based Experience Bankを構築する。
    • 経験,視覚,地理空間情報を統合し,計画を修正するSpatially-constrained Skill-augmented Plannerエージェントを搭載する。
    • 従来の評価指標と居住体験に基づく指標の両方において,LiPUP-MAはベースラインを上回り,反復サイクルによって計画品質がさらに向上する。

    Link: https://arxiv.org/abs/2412.20505

  • 革新的な珪肺と肺炎の分類:グラフTransformer事後モデリングとアンサンブル技術の活用 [cs.CV, cs.LG]目的:珪肺関連肺炎症の分類と検出
    • 肺疾患の早期発見と正確な診断は,患者の予後改善に不可欠である。
    • 珪肺と肺炎の画像診断は,症状の類似性から鑑別が困難な場合がある。
    • 本研究は,肺炎症の微細な違いを識別し,診断精度向上を目指す。
    • 構築したSVBCXデータセットは,珪肺と肺炎研究の貴重なリソースとなる。
    • グラフTransformerと深層ニューラルネットワークを統合したモデルは,高い分類性能を示した。
    • アンサンブル学習により,マクロF1スコア0.9749,AUC ROCスコア0.99超を達成し,堅牢な分類能力を実証した。

    Link: https://arxiv.org/abs/2501.00520

  • モデルの重みを模倣することによる効率的なデータ選択のためのサンプル有用性の評価 [cs.LG, cs.AI]目的:効率的なデータ選択のためのサンプル有用性の評価
    • ウェブクローリングデータは膨大で,機械学習の進歩に不可欠なリソースである。
    • 収集されたデータにはノイズや偏りが含まれており,適切なデータ選択が課題となる。
    • 既存手法の制約を克服し,スケーラブルなデータ選択手法を確立すること。
    • Mimic Scoreという,事前学習済みモデルの重みを利用した新しいデータ品質指標を提案した。
    • Grad-Mimicという2段階のフレームワークにより,学習の加速と効果的なデータフィルタリングを実現した。
    • 6つの画像データセットで性能が向上し,CLIPモデルの学習ステップ数を20.7%削減した。

    Link: https://arxiv.org/abs/2501.06708

  • CleanSurvival: 強化学習を用いたイベント時間モデルのための自動データ前処理 [cs.LG]目的:イベント時間モデルに対する前処理パイプラインの最適化
    • 機械学習の性能向上において,データ前処理の重要性が認識されている。
    • イベント時間モデルにおいては,自動化されたデータ前処理ソリューションが不足している。
    • イベント時間モデル特化型の自動データ前処理手法を開発し,分析の効率化を目指す。
    • 提案手法CleanSurvivalは,強化学習を用いて最適なデータ前処理パイプラインを選択する。
    • 実データを用いた実験により,単純なベースラインと比較して予測性能が向上することが示された。
    • シミュレーション実験では,欠損やノイズの様々な状況下での有効性が確認された。

    Link: https://arxiv.org/abs/2502.03946

  • 車両エッジコンピューティングにおけるインテリジェントオフローディング:深層強化学習アプローチとアーキテクチャの包括的レビュー [cs.LG, cs.AI, cs.DC, cs.MA]目的:車両エッジコンピューティングのための深層強化学習に基づくオフローディング手法に関する研究
    • 高度な交通システム(ITS)の複雑化に伴い,外部インフラへの計算オフローディングが重要になっている。
    • 従来のオフローディング戦略は,動的で異質な環境への対応が難しく,課題となっている。
    • 次世代ITS向けの,堅牢かつインテリジェントなオフローディング戦略開発を支援すること。
    • 本レビューでは,単一エージェント,マルチエージェントなどの学習パラダイムに基づいた既存研究を分類・比較している。
    • システムアーキテクチャ(集中型,分散型,階層型)や最適化目標(遅延,エネルギー,公平性)に関する分析も行っている。
    • マルコフ決定過程(MDP)の応用方法や,報酬設計,協調メカニズム,スケーラビリティの動向を明らかにしている。

    Link: https://arxiv.org/abs/2502.06963