arXiv雑要約

AI - 2026/02/05 公開

  • 安全な探索における実行可能領域と不確実モデルの均衡について [cs.LG, cs.SY, eess.SY]目的:安全な探索における実行可能領域と環境モデルの均衡点
    • 強化学習において,環境探索の安全性の確保は極めて重要である。ロボット制御など,現実世界への応用が不可欠なため。
    • 実行可能領域を制限することで安全性を確保するアプローチは一般的だが,最大化可能な領域やその特定方法が未解決の課題である。
    • 実行可能領域と環境モデルの均衡点を見出すことで,より安全かつ効率的な探索を可能にすることを目指す。
    • 本研究では,安全な探索が実行可能領域と環境モデルの均衡を見出すことであると初めて明らかにした。
    • 提案手法SEEは,実行可能領域の最大化と不確実モデルの最小化を交互に行うことで,均衡点へ収束することを証明した。
    • 古典的な制御タスクにおける実験で,SEEは制約違反なく実行可能領域を拡大し,均衡点へ迅速に到達することを示した。

    Link: https://arxiv.org/abs/2602.00636

  • ハルシネーションは空間最適性の結果である:メンバーシップテストのためのレート歪み定理 [cs.LG, cs.AI, cs.CL, cs.DS, cs.IT, math.IT]目的:大規模言語モデルにおけるハルシネーションのメカニズム解明
    • 言語モデルの規模拡大に伴い,その信頼性確保が重要課題となっている。
    • 言語モデルは,根拠のない情報を高い確信度で生成するハルシネーションを起こしやすい。
    • 限られたモデル容量下における情報圧縮の限界が,ハルシネーションの根本原因である。
    • 本研究では,ハルシネーションをメンバーシップテスト問題として定式化し,レート歪み定理を導出した。
    • 定理により,最適なメモリ効率は事実と非事実のスコア分布間のKLダイバージェンスによって特徴付けられることが示された。
    • 最適な戦略は沈黙や忘却ではなく,一部の非事実に対して高い確信度を与えることであるため,ハルシネーションは避けられない。

    Link: https://arxiv.org/abs/2602.00906

  • LASS-ODE:基礎モデルと力学系の接続を可能にするODE計算のスケーリング [cs.LG, cs.AI]目的:基礎モデルと力学系の接続を可能にするODE計算のスケーリング
    • 近年の基礎モデルの発展は目覚ましいが,物理システムの動的予測は未だ課題である。
    • 物理制約の複雑さから,計算のスケーラビリティや知識共有の効率性がボトルネックとなっている。
    • 局所線形ODE表現と共通構造ハブを導入し,スケーラビリティと知識共有を同時に実現する。
    • ODEの一貫性を保つために高価な非線形積分は不要であり,トークンごとの局所線形ODE表現が有効である。
    • 提案手法LASS-ODEは,40GBのODE軌道コレクションで事前学習し,高い性能とゼロショット汎化能力を示す。
    • 異なるODEシステム間での知識集約を可能にする共通構造ハブが,性能向上に貢献する。

    Link: https://arxiv.org/abs/2602.01009

  • ConvexBench:LLMは凸関数を認識できるか [cs.AI]目的:大規模言語モデルの凸関数の認識能力の評価
    • 凸解析は現代数学の重要な分野であり,様々な応用がある。
    • LLMが研究レベルの数学・科学を自動化する中で,凸関数の理解が不可欠である。
    • LLMの深層関数合成における凸関数の識別能力の限界を明らかにすること。
    • 最先端のLLM実験の結果,深さが増すにつれて性能が急速に低下することが示された。
    • モデルの推論トレース分析から,構文解析の失敗と怠惰な推論が原因であることが判明した。
    • 提案するエージェント的分割統治フレームワークにより,深層合成における失敗を軽減し,性能が大幅に向上した。

    Link: https://arxiv.org/abs/2602.01075

  • TxRay:ライブブロックチェーン攻撃の事後分析を支援するエージェント [cs.CR, cs.AI]目的:ライブブロックチェーン攻撃の事後分析の自動化
    • DeFiの普及によりブロックチェーンが金融インフラと化し,セキュリティ重要性が増している。
    • 事後分析は手動で行われ,証拠が限られているため,時間と労力を要する。
    • 限られた証拠から攻撃ライフサイクルを再構築し,根本原因を特定することを可能にする。
    • TxRayは,限られた証拠からライブACT攻撃を再構築し,証拠に基づいた根本原因を導き出す。
    • TxRayは,再現性のあるPoCを生成し,インシデント固有のオラクルを用いて事後分析の自己検証を行う。
    • 114件のインシデントで,TxRayは専門家と合致する根本原因と実行可能なPoCを92.11%の精度で再現した。

    Link: https://arxiv.org/abs/2602.01317

  • 歪み制御球面双射のための二チャート・ベルトラミ最適化:脳表面登録への応用 [cs.GR, cs.CV, cs.LG, math.AG]目的:歪み制御された球面双射の最適化
    • 表面マッピングは,ランドマーク整列や画像駆動登録など,様々な分野で不可欠である。
    • 既存手法では,生成されるマッピングの幾何学的歪みを効率的に制御する仕組みが欠けている。
    • 球面上の歪みを明示的に制御し, bijective 性を保証する最適化手法を確立すること。
    • 本研究では,球面上の準共形自己写像を表す二チャート球面ベルトラミ微分(SBD)を導入した。
    • SBDとクロスチャート一貫性条件を用いることで, globally bijective な球面変形を実現する BOOST フレームワークを開発した。
    • ランドマーク照合や強度ベースの球面登録実験で,高いタスク性能と制御された歪み,堅牢な bijective 性が確認された。

    Link: https://arxiv.org/abs/2602.01589

  • モード誘発を超えて:潜在拡散推論による多様性維持強化学習 [cs.LG, cs.AI]目的:大規模言語モデルの推論能力向上
    • 言語モデルの推論能力は,様々なタスクにおいて重要であり,その性能向上が求められている。
    • 従来の強化学習では,トークン空間での探索がモード崩壊を起こし,多様性が失われるという課題があった。
    • 潜在空間での探索を通じて,多様性を維持し,より効果的な推論を実現することを目指す。
    • 提案手法LaDi-RLは,連続的な潜在空間で探索を行うことで,複数の解モードを維持し,多様性の維持に成功した。
    • 潜在空間での最適化は,テキスト空間での最適化よりも効果的であり,組み合わせることでさらなる性能向上が確認された。
    • コード生成と数学的推論のベンチマークにおいて,従来の強化学習手法と比較してpass@1がそれぞれ+9.4%,+5.7%向上した。

    Link: https://arxiv.org/abs/2602.01705

  • Co-RedTeam:LLMエージェントによる連携セキュリティ発見とエクスプロイト [cs.DB, cs.LG, cs.CR]目的:LLMエージェントを用いたセキュリティ発見とエクスプロイトの連携フレームワーク
    • サイバーセキュリティは,社会インフラや個人情報を守る上で不可欠であり,その重要性は増している。
    • 脆弱性発見とエクスプロイトの自動化は困難で,既存手法は相互作用の限界や実行環境への適応不足に課題がある。
    • LLMエージェントの連携により,現実世界のレッドチーム作業を模倣し,脆弱性発見とエクスプロイトを自動化する。
    • Co-RedTeamは,多様な基盤モデルにおいて,強力なベースラインを常に上回り,脆弱性エクスプロイトで60%以上の成功率を達成した。
    • 脆弱性検出においても10%以上の絶対的な改善が見られ,実行フィードバック,構造化された相互作用,およびメモリの重要性が確認された。
    • 本フレームワークは,セキュリティドメイン知識,コード認識分析,実行に基づいた反復推論,長期記憶を統合することで高い汎用性を示す。

    Link: https://arxiv.org/abs/2602.02164

  • なぜ操舵が機能するのか:言語モデルのパラメータダイナミクスに関する統一的視点 [cs.CL, cs.AI, cs.CV, cs.IR, cs.LG]目的:大規模言語モデルの制御手法に関する統一的分析
    • 言語モデルの制御は,その応用範囲拡大に不可欠であり,人間とのより自然な対話実現に繋がる。
    • 既存の制御手法はそれぞれ独立して研究されており,相互の関係性や比較が困難であった。
    • 本研究は,既存手法を統合的に捉え,制御性能の向上を目指す。
    • 様々な制御手法は,制御信号によって誘起される動的な重み更新と捉えることができる。
    • 制御の強さと,対象概念への指向性(preference)と,一貫性のある生成(utility)の間にはトレードオフが存在する。
    • 新たな操舵手法SPLITは,preferenceを向上させつつ,utilityの低下を抑制する。

    Link: https://arxiv.org/abs/2602.02343

  • 人間介入型ベイズ最適化によるパーソナライズ画像生成 [cs.CV, cs.LG]目的:パーソナライズ画像生成のための手法
    • 生成AIの発展により,多様な画像生成が可能になったが,ユーザーの意図を正確に反映することが課題である。
    • 言語によるプロンプトだけでは,ユーザーが求める理想の画像に近づける限界がある。
    • 人間が判断する画像間の近さを活用し,よりユーザーの好みに合致した画像生成を目指す。
    • 本研究では,MultiBOという手法を提案し,複数候補画像からの選択によるフィードバックをベイズ最適化に組み込んだ。
    • ユーザーからのフィードバックを繰り返すことで,生成モデルが理想の画像に近づくことを実験的に示した。
    • 30人のユーザーによる評価と定量的な指標から,提案手法がパーソナライズ画像生成において有効であることが示唆された。

    Link: https://arxiv.org/abs/2602.02388

  • UniReason 1.0:世界知識に整合した画像生成・編集のための統一的な推論フレームワーク [cs.CV, cs.AI]目的:画像生成と編集を統合した推論能力
    • 画像生成AIの発展は,創造性の拡張や新たな表現方法の創出に貢献する重要な分野である。
    • 既存のマルチモーダルモデルは複雑な推論を苦手とし,生成と編集を分離して扱っている。
    • 世界知識を活用し,生成と編集を統合することで,より高度な推論能力を実現することを目指す。
    • UniReasonは,生成時に世界知識に基づいたテキスト推論を取り入れ,潜在的な知識を推測する。
    • 編集機能を活用して,視覚的なエラーを自己修正し,細部を洗練させることで,より自然な画像を生成する。
    • WISE,KrisBench,UniREditBenchなどの評価において,UniReasonは高度な性能を示し,汎用的な合成能力も維持している。

    Link: https://arxiv.org/abs/2602.02437

  • CreditAudit:LLM評価と選択のための第2次元 [cs.CL, cs.AI, cs.CL, cs.LG]目的:LLMの評価と選択のための,展開指向のクレジット監査フレームワーク
    • LLMの性能向上は著しいが,ベンチマークスコアと実際の利用体験の乖離が課題となっている。
    • システムプロンプトやインタラクション方法の微小な変化が,大規模な失敗を引き起こす可能性がある。
    • 安定性を考慮したLLMの評価・選択を可能にし,より信頼性の高い展開を支援することを目的とする。
    • CreditAuditは,複数のベンチマークで,意味的に整合性のあるシステムプロンプトテンプレートを用いてモデルを評価する。
    • 平均性能に加え,シナリオごとの性能変動(sigma)を安定性リスク指標として提供し,AAAからBBBまでのクレジットグレードで表示する。
    • 実験の結果,平均性能が類似するモデルでも,変動が大きく異なり,安定性リスクが選択を左右することが示された。

    Link: https://arxiv.org/abs/2602.02515

  • ProphetKV:検索拡張生成における効率的なKVキャッシュ再利用のためのユーザークエリ駆動型選択的再計算 [cs.OS, cs.AI]目的:検索拡張生成におけるKVキャッシュ再利用の効率化
    • 大規模言語モデルの性能向上には,文脈情報の効率的な活用が不可欠である。
    • 検索拡張生成の初期段階で,長い文脈の処理に計算資源が集中し,ボトルネックとなっている。
    • ユーザークエリとの関連性が低いトークンが再計算予算を圧迫し,精度低下を招く問題を解決する。
    • ProphetKVは,ユーザークエリとの意味的な関連性に基づいてトークンの優先順位を動的に決定する。
    • 再計算予算を,検索された文脈とユーザークエリ間の情報格差を埋めることに重点的に割り当てることで,高精度な注意機構の回復を実現する。
    • 実験結果から,ProphetKVは既存手法と比較して,精度を大幅に向上させながら,再計算量を削減できることが示された。

    Link: https://arxiv.org/abs/2602.02579

  • RAP:RoPEアラインメントプルーニングによるKVキャッシュ圧縮 [cs.LG, cs.AI]目的:大規模言語モデルにおけるKVキャッシュの圧縮
    • 大規模言語モデルの普及に伴い,長文脈推論のメモリ・計算コストが課題となっている。
    • 既存の低ランク分解はRoPEに基づくLLMでは回転構造の再構成が必要となり,圧縮効果が薄れる。
    • RoPEアラインメントプルーニングにより,KVキャッシュ,パラメータ,FLOPsを同時に削減する。
    • RAPは,LLaMA-3-8BとMistral-7Bにおいて,KVキャッシュ,パラメータ,FLOPsを20-30%削減することに成功した。
    • RAPは,推論時のレイテンシをそれぞれベースラインの83%(prefill)および77%(decode)に低減した。
    • RAPはRoPEの回転構造を維持しつつ,B吸収を回復させ,再構成を排除することで圧縮を実現した。

    Link: https://arxiv.org/abs/2602.02599

  • daVinci-Agency:長期的エージェントデータを効率的に活用する [cs.LG, cs.AI, cs.SE]目的:長期的エージェントワークフローのためのデータ効率的な学習手法
    • 大規模言語モデルの応用範囲拡大には,長期的なタスク実行能力が不可欠である。
    • 長期的な依存関係や段階的な進化を捉えた学習データの不足が課題となっている。
    • ソフトウェア進化の過程に着目し,PRシーケンスから効率的に学習データを得る。
    • daVinci-Agencyは,PRシーケンスを構造化された教師信号として活用する。
    • タスクを継続的なコミットで分解し,一貫性を維持,バグ修正履歴から改善パターンを学習する。
    • GLM-4.6のファインチューニングでToolathlonにおいて47%の相対的な改善を達成した。

    Link: https://arxiv.org/abs/2602.02619

  • 大規模における心電図バイオメトリクスの検証と識別 [cs.HC, cs.LG]目的:大規模心電図バイオメトリクスの性能評価と標準化
    • 生体認証技術は,セキュリティや利便性向上に不可欠であり,その多様化が求められている。
    • 心電図バイオメトリクスは有望だが,大規模な評価データセットや標準的な評価プロトコルが不足していた。
    • 本研究は,大規模データセットを用いた評価を通じて,心電図バイオメトリクスの性能を定量的に示すことを目指す。
    • 表形式の特徴量でも識別性能が確認され,深層学習モデルを用いた波形モデリングによる性能向上が示された。
    • 検証実験では,厳格な誤受入率(FAR)条件下で高い真正受入率(TAR)を達成し,識別実験でも高いRank@1とRank@10が得られた。
    • オープンセット環境では,二段階パイプラインにより高いDIR@FARが実現され,心電図が個人識別可能な特徴を持つことが示された。

    Link: https://arxiv.org/abs/2602.02776

  • Tabula RASA:Transformerにおける関係性ボトルネックの露呈と打破 [cs.CY, cs.LG, cs.AI]目的:Transformerの多段関係推論における限界克服
    • Transformerは様々な分野で高性能を示すが,構造化データに対する多段関係推論は苦手である。
    • Transformerはグラフ接続性の問題を定数深度で解決できず,多段推論には層の深さが課題となる。
    • グラフ構造データに対する構造的誘導バイアスを導入し,多段推論能力の向上を目指す。
    • RASAは,グラフ接続位置への注意を制限する疎な隣接マスクと,関係固有の注意傾向を符号化する学習可能なエッジ型バイアスを導入する。
    • MetaQA知識グラフQAベンチマークにおいて,RASAは3-hop質問で97.7%の精度を達成し,EmbedKGQA(94.8%)を2.9%上回った。
    • RASAの利点は推論の深さに伴い増加し,構造的誘導バイアスの有効性が示された。

    Link: https://arxiv.org/abs/2602.02834

  • CoBA-RL:LLMにおける強化学習のための能力指向予算配分 [cs.LG, cs.AI]目的:LLMにおける強化学習の予算配分戦略
    • 大規模言語モデル(LLM)の推論能力向上は,様々な応用において不可欠である。
    • 従来の予算配分は一律的であり,計算資源の非効率な利用を招いている。
    • モデルの学習状態を考慮した,効率的な予算配分方法の確立が求められている。
    • CoBA-RLは,モデルの能力を考慮した価値関数を用いて,サンプルごとの学習効果を予測する。
    • ヒープベースの貪欲戦略により,計算資源を学習効果の高いサンプルに効率的に配分する。
    • 実験の結果,CoBA-RLは探索と活用のバランスを最適化し,複数のベンチマークで汎化性能を向上させた。

    Link: https://arxiv.org/abs/2602.03048

  • 「現実でなくても幸せだ」:GenAI写真編集が想起体験となるプロセス [cs.CL, cs.HC, cs.AI]目的:GenAI写真編集の利用状況と,それが想起体験に与える影響
    • 写真は個人の記憶を記録・共有する重要な手段であり,その編集は記憶の再構築に影響を及ぼす可能性がある。
    • GenAIによる写真編集は容易になった一方,記憶の正確性や個人のアイデンティティへの影響が懸念されている。
    • GenAI写真編集が想起体験に及ぼす影響を理解し,責任あるGenAIのデザインに貢献すること。
    • 参加者は,事実の正確性よりも想起された感情を優先する傾向が見られた。
    • 背景などの環境編集は容易に行われたが,人物のアイデンティティに関わる編集は受け入れられなかった。
    • 写真編集のプロセス自体が想起体験となり,ポジティブ・ネガティブ両方の影響をもたらすことが示された。

    Link: https://arxiv.org/abs/2602.03104

  • 臨床オフライン強化学習のための報酬設計:トリドライブポテンシャル関数による報酬エンジニアリング [cs.RO, cs.LG]目的:臨床オフライン強化学習における報酬設計の自動化
    • 臨床現場での最適な治療方針決定は重要であり,強化学習はその有望な手法の一つである。
    • 報酬関数の設計は専門知識を要し,汎用性の低い手動ヒューリスティクスに頼りがちである。
    • 大規模言語モデルを活用し,疾患特有の報酬関数を自動的に設計することで,この課題を解決する。
    • 提案手法は,生存,確信度,能力という3つの要素からなるポテンシャル関数を用いて報酬関数を設計する。
    • 定量的な評価指標を導入し,報酬構造の最適化を厳密に行うことで,より安全で効果的な学習を実現する。
    • 大規模言語モデルによる領域知識の統合により,疾患に特化した報酬設計を自動化し,ポリシーの性能を向上させる。

    Link: https://arxiv.org/abs/2602.03305

  • 道徳的判断における解釈可能なモデルの構築 [cs.CL, cs.IR, cs.AI, cs.CY, cs.LG]目的:道徳的判断に関するニューラルネットワークの意思決定メカニズム
    • 倫理的ジレンマへのAIの応用が広がる中,その判断根拠の透明性が重要視されている。
    • AIの道徳的判断はブラックボックス化しやすく,その偏りや不公平性が懸念されている。
    • ニューラルネットワークの判断プロセスを分析し,道徳的判断における偏りの所在を特定すること。
    • カスタマイズされたTransformerモデルを用いて,トロッコ問題形式の倫理的ジレンマに対するニューラルネットワークの道徳的判断を分析した。
    • Moral Machineデータセットで77%の精度を達成し,詳細な分析が可能な小型な2層アーキテクチャを構築した。
    • 解釈可能性技術を用いて,道徳的推論がネットワーク全体にどのように分布しているかを明らかにし,偏りが特定の計算段階に局在化することを示した。

    Link: https://arxiv.org/abs/2602.03351

  • ラベル地平線パラドックス:金融予測における教師あり学習目標の再考 [cs.LG]目的:金融予測における最適な教師信号の特定
    • 金融市場の予測は,投資戦略やリスク管理において不可欠であり,経済的安定に貢献する。
    • 従来の教師あり学習では,教師データが予測目標と一致することが前提とされている。
    • 予測目標と教師信号のずれが,予測精度に与える影響を明らかにすること。
    • 教師信号は,市場のダイナミクスによって変化する,予測地平線によって最適化されることが示された。
    • 動的な信号対雑音のトレードオフを理論的に解明し,汎化性能の向上要因を特定した。
    • 提案する二層最適化フレームワークは,大規模な金融データセットにおいて,既存手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2602.03395

  • 全ての負例が等しくない:LLMは妥当な推論からより良く学習する [cs.LG, cs.AI]目的:LLMの推論能力向上に向けた負例学習の有効性
    • LLMの推論能力は重要であり,その向上が求められている
    • 既存手法では,全ての誤った回答を同等に扱っている
    • 負例の質に着目し,より効果的な学習方法を確立すること
    • 妥当な負例(PNS)を生成する手法を提案し,その有効性を示した。
    • PNSは,既存の負例生成手法と比較して,平均2.03%の性能向上を達成した。
    • PNSは,様々なバックボーンモデルでプラグアンドプレイ型データソースとして利用可能である。

    Link: https://arxiv.org/abs/2602.03516

  • 抵抗ネットワークの訓練方法:一般化均衡伝播と解析的学習 [cs.LG, cond-mat.dis-nn, cond-mat.mes-hall, cond-mat.soft, cs.ET]目的:抵抗ネットワークの訓練における勾配の正確な計算手法と,それを用いた学習フレームワーク
    • 機械学習は強力だが,デジタルハードウェアはエネルギー消費が大きい。省エネなアナログ計算の需要がある。
    • アナログ計算システムは物理的な制約から局所学習が必要だが,効率的な訓練方法が確立されていない。
    • 提案手法は,回路理論に基づき,抵抗ネットワークの訓練を効率化し,性能劣化を抑制することを目指す。
    • 提案手法により,抵抗ネットワーク全体の複製や読み出しなしで,出力層のみを用いて訓練が可能となった。
    • 解析的な勾配計算により,一部の抵抗値のみを更新しても,性能劣化を抑えられることが示された。
    • 一般化均衡伝播は,結合学習や均衡伝播を含む広範なヘブ学習アルゴリズムを包含するフレームワークである。

    Link: https://arxiv.org/abs/2602.03546

  • 対称性群の群表現による辞書学習 [cs.IR, cs.CL, cs.CL, cs.PF, math.OC, cs.LG, eess.SP, stat.ML]目的:対称性に対する不変性を持つ辞書を学習すること
    • データから適切な変換を学習し,疎な表現を得る辞書学習は,様々な応用分野で重要である。
    • 既存手法では,特定の対称性群に対する辞書の学習が困難であり,計算コストが高い。
    • 群表現を用いた新たな手法により,効率的な辞書学習と次元削減を実現する。
    • 本研究では,コンパクト群上の非アベリアンフーリエ解析を活用し,対称性を持つ辞書学習のアルゴリズムを提案した。
    • SO(2)群ではスペクトラヘドラル記述が可能であり,SO(3)群に対しては近似手法を開発し,最適化手法を確立した。
    • 数値実験により,提案手法がSO(3)不変辞書学習において有効であることが示された。

    Link: https://arxiv.org/abs/2305.19557

  • Pテンソル:高次メッセージパッシングネットワーク構築のための一般形式 [stat.ML, cs.LG, math.ST, stat.TH]目的:高次メッセージパッシングネットワークにおける,より表現力の高いネットワークの構築
    • グラフニューラルネットワークは,様々な分野で活用が広がっており,その性能向上が重要である。
    • 既存のネットワークでは,複雑な構造を持つデータの表現に限界があるという課題が存在する。
    • サブグラフ構造を利用した高次なメッセージパッシングを実現し,表現力を向上させることを目指す。
    • 本研究で導入されたPテンソルは,サブグラフニューラルネットワークにおける高次の置換不変性を持つメッセージパッシングを定義する簡潔な方法を提供する。
    • Pテンソルパラダイムは,既存の分子データセットのベンチマークにおいて,最先端の性能を達成することが示された。
    • グラフニューラルネットワークと高次置換不変ネットワークという2つのアプローチを統合する汎用的なフレームワークを確立した。

    Link: https://arxiv.org/abs/2306.10767

  • SPD多様体上の効率的かつ安定なリーマン計量:コレスキー積幾何に基づく [math.DG, cs.LG, math.MG]目的:SPD多様体上の効率的で安定なリーマン計量の設計
    • SPD行列学習の発展により,効果的なSPDニューラルネットワークにおいてリーマン計量が重要であることが示された。
    • 既存のSPD計量は計算コストが高く,数値的な安定性に課題がある場合がある。
    • コレスキー分解に基づく新たなSPD計量を設計し,計算効率と安定性を向上させる。
    • 提案するPower--Cholesky計量(PCM)とBures--Wasserstein--Cholesky計量(BWCM)は,閉形式演算子を持ち,計算効率に優れている。
    • 実験の結果,提案計量はSPD深層学習,数値安定性解析,テンソル補間において有効であることが示された。
    • 提案計量を用いたリーマン多項ロジスティック回帰分類器や残差ブロックの性能が確認された。

    Link: https://arxiv.org/abs/2407.02607

  • 部分観測下における予測的低ランク行列学習:混合投影ADMM [math.CO, cs.DM, stat.ML, cs.LG]目的:部分観測された行列の低ランク性を利用した学習
    • 推薦システムや画像処理など,様々な分野でデータ欠損問題が重要視されている。
    • 観測データが一部しか得られない場合,高精度な行列復元が困難である。
    • 線形に依存する付随情報を用いて,より精度の高い行列復元を目指す。
    • 提案手法は,合成データにおいて既存手法よりも目的関数値を平均2.3%低減し,再構成誤差を41%削減した。
    • 大規模データ(10000×10000行列)の求解時間を1分以内に抑え,計算効率の高さを示した。
    • 実データにおいては,サンプル外誤差を既存手法よりも67%低減し,実行時間を97%短縮した。

    Link: https://arxiv.org/abs/2407.13731

  • 拡散モデルを用いたkmスケールUK地域気候シミュレーションからの降水エミュレーション [physics.ao-ph, cs.LG]目的:高解像度気候シミュレーションからの降水のエミュレーション
    • 気候変動の影響理解には高解像度シミュレーションが不可欠である。しかし,計算コストが課題となっている。
    • 地域気候モデルは計算負荷が高く,大量のシミュレーションが困難であるという問題点がある。
    • 本研究は,計算コストを削減しつつ高解像度降水シミュレーションを可能にすることを目指す。
    • 拡散モデルを用いたエミュレーターは,2.2km解像度の地域気候モデルの降水シミュレーションを低コストで再現可能であることが示された。
    • エミュレーターは,60km解像度の全球気候モデルの出力をダウンスケールし, convective processes の影響を捉えることができる。
    • 本手法は,高解像度データが限られた状況でも有効であり,将来の気候変動予測や不確実性評価に貢献できる可能性がある。

    Link: https://arxiv.org/abs/2407.14158

  • 多数の対象物におけるスクリーニングの省略がより効率的である [econ.TH, cs.AI, cs.GT, cs.LG]目的:複数の異質な対象物の配分における効率的なメカニズム設計
    • 資源配分は経済学の根幹であり,効率的な配分メカニズムの構築が重要である
    • スクリーニングは情報非対称性を解消するが,コストがかかり,必ずしも効率的とは限らない
    • 対象物の多様性が増すにつれて,スクリーニングを省略したメカニズムがより効率的になることを示す
    • 対象物の種類が増えるほど,スクリーニングを行わないメカニズムの方が良好な結果を示す傾向にあることが判明した。
    • 漸近的に効率的なメカニズムの特徴付けにより,この傾向の根本的な理由が明らかになった。
    • パンデミックに対するワクチン接種スケジュールに,効率的なシステム「登録・招待・予約」を提案した。

    Link: https://arxiv.org/abs/2408.10077

  • 不連続性に対する結合積分型PINN [physics.flu-dyn, cs.LG]目的:不連続性を含む偏微分方程式の数値解法
    • 物理現象のシミュレーションにおいて,精度と効率が重要視される。
    • PINNは不連続性,特に衝撃波の取り扱いに課題がある。
    • 衝撃波近傍での安定性を向上させ,メッシュフリーな解法を提供する。
    • 結合積分型PINN (CI-PINN) は,積分ポテンシャルと積分制約を導入することで,衝撃波近傍でのロバスト性を改善した。
    • 標準的なPINNと比較して,メッシュ生成や数値フラックスの計算を必要としない利点がある。
    • Burgers方程式,Buckley-Leverett方程式,オイラー方程式,浅水方程式といったベンチマーク問題で検証された。

    Link: https://arxiv.org/abs/2411.11276

  • 潜在的確率的微分方程式によるニューラルダイナミクスの生成モデリング [q-bio.NC, cs.LG]目的:生物学的ニューラルシステムの計算モデル開発のための確率的フレームワーク
    • 脳機能解明には,ニューロン集団の活動ダイナミクスを記述するモデルが不可欠である。
    • 既存モデルは,解釈可能性やパラメータ数の多さといった課題を抱えている場合が多い。
    • 少ないパラメータで,解釈可能なニューラルダイナミクスモデルを構築することを目指す。
    • 本研究では,潜在的確率的微分方程式を用いて,ニューロン活動の生成モデルを構築した。
    • 振動子とニューラルネットワークを組み合わせたハイブリッドモデルは,従来のブラックボックスモデルと同等の性能を示した。
    • パラメータ数は大幅に削減され,不確実性の推定や解釈性も向上した。

    Link: https://arxiv.org/abs/2412.12112

  • 逆方向確証予測 [stat.ML, cs.LG]目的:確証性保証と予測集合サイズの柔軟な制御
    • 予測モデルの信頼性評価は,現実世界での応用において不可欠である。
    • 従来の確証予測では,予測集合サイズが変動し,実用性に課題がある。
    • データに基づき予測集合サイズを制御し,解釈可能な予測を可能にする。
    • 本研究で提案する逆方向確証予測は,確証的な網羅性を保証しつつ,予測集合サイズの制御を可能にする。
    • e値を用いた事後検証に基づき,データ依存的な誤判定率を考慮した理論的保証を提供する。
    • 医療診断など,大きな予測集合が現実的でない応用において特に有効性が期待される。

    Link: https://arxiv.org/abs/2505.13732

  • ねじれを考慮したフローマッチングによる柔軟なMOF生成 [q-bio.BM, cs.LG]目的:金属有機構造体(MOF)の生成
    • MOFはガス貯蔵や分離など多岐に渡る応用が期待され,材料科学において重要な研究対象である。
    • MOFの設計空間が広大であるため,新規な構造を持つMOFの発見が困難である。
    • 化学的自由度と幾何学的自由度をモデル化することで,新規なMOFと構成要素の生成を目指す。
    • 提案手法は,従来の深層生成モデルよりも高い再構成精度を達成した。
    • 有効,新規かつユニークなMOFを生成することが可能となった。
    • 新規な構成要素の作成も実現した。

    Link: https://arxiv.org/abs/2505.17914

  • スケーラブルな深基底カーネルガウス過程 [stat.ML, cs.LG]目的:深基底カーネルを用いたスケーラブルなガウス過程回帰
    • ガウス過程は複雑なデータ分析に有用だが,計算量が課題となる。
    • 大規模データセットへの適用には,計算効率の向上が不可欠である。
    • 大規模データに対するガウス過程の効率的な近似手法を開発する。
    • 深基底カーネル(DBK)は,ニューラルネットワークパラメータ化された基底関数を用いて構築され,線形時間複雑度での推論を可能にする。
    • DBKは,スパース深カーネル学習やガウスベイズ最終層法を包含する統一的な視点を提供する。
    • ミニバッチ確率的目標関数を用いることで,予測分布を直接最適化し,過度に単純化された不確実性とランク不足な解を回避する。

    Link: https://arxiv.org/abs/2505.18526

  • 深層学習による高精度かつスケーラブルな交換相関エネルギー計算 [q-bio.GN, cs.AR, physics.chem-ph, cs.AI, cs.CE, cs.LG, physics.comp-ph]目的:深層学習に基づく交換相関エネルギー汎関数Skalaの開発
    • 物質科学や化学において,分子や材料の物性予測に不可欠な密度汎関数理論の精度向上。
    • 既存の交換相関エネルギー汎関数は,計算効率とのトレードオフがあり,化学的精度を達成できていない点。
    • 深層学習を用いて,高精度かつ効率的な交換相関エネルギー汎関数を構築し,物性予測の精度向上を目指す。
    • Skalaは,小分子の原子化エネルギーに関して化学的精度を達成し,半局所DFTの計算効率を維持している。
    • Skalaは,多様な化学構造を網羅した学習データ量の増加に伴い,系統的に精度が向上する。
    • Skalaは,追加の高精度データを取り込むことで,主族元素化学におけるハイブリッド汎関数に匹敵する精度を示す。

    Link: https://arxiv.org/abs/2506.14665

  • ミニマックスとベイズ最適ベターアーム識別 [econ.EM, cs.LG, math.ST, stat.ME, stat.ML, stat.TH]目的:固定予算におけるベターアーム識別のためのミニマックスおよびベイズ最適戦略
    • 意思決定における最適な選択肢の迅速な特定は,資源配分の効率化に不可欠である。
    • 既存手法では,ベターアームを効率的に識別するための理論的限界が明確でなかった。
    • 本研究は,ベターアーム識別における理論的限界を明確にし,最適な戦略を提案する。
    • 提案戦略は,漸近的にミニマックス性とベイズ最適性を同時に達成する。
    • シンプルな後悔に関して,上限と下限が完全に一致し,定数項まで等しい。
    • 本手法は,パイロット段階とミニマックスゲームを用いた効率的なサンプリングを提供する。

    Link: https://arxiv.org/abs/2506.24007

  • リソース制約デバイス向け量子化対応ニューロモルフィックアーキテクチャ:皮膚疾患分類への応用 [eess.IV, cs.AI, cs.CV]目的:皮膚疾患の分類における量子化対応ニューロモルフィックアーキテクチャの提案
    • 皮膚疾患の早期発見・診断は,医療において非常に重要である。
    • 従来のCNN推論は計算コストと消費電力が大きく,デバイスへの実装が困難である。
    • CNNからSNNへの変換における課題を解決し,省電力な皮膚疾患分類を実現する。
    • 提案手法QANAは,HAM10000データセットにおいて,既存のSNNベースラインをTop-1精度で3.5%,Macro F1で12.0ポイント上回る。
    • 臨床データセットにおいても,Top-1精度で3.2%,Macro F1で3.6ポイントの改善が確認された。
    • BrainChip Akida上での実機評価では,GPU実装と比較してレイテンシを94.6%,エネルギー消費量を99.0%削減した。

    Link: https://arxiv.org/abs/2507.15958

  • DP-SPRT:差分プライバシーを考慮した逐次確率比検定 [stat.ML, cs.CR, cs.LG, math.ST, stat.TH]目的:差分プライバシー制約下における二つの単純仮説の逐次検定
    • データ分析において,プライバシー保護と統計的検定の効率性は重要な課題である。
    • 既存手法では,プライバシー保護と検定精度の両立が困難であり,特に逐次検定においては大きな課題であった。
    • 差分プライバシーを保証しつつ,効率的な逐次確率比検定を実現することで,プライバシー保護された統計的推論を可能とする。
    • DP-SPRTは,事前に定義された区間外にクエリ結果が到達した場合に停止するOutsideIntervalメカニズムを用いることで,プライバシーと精度のバランスを実現している。
    • ラプラスノイズを用いた純粋な差分プライバシーと,ガウスノイズを用いたRényi差分プライバシーの両方の設定において,DP-SPRTの性能を理論的に評価した。
    • DP-SPRTは,タイプIおよびタイプIIエラーが小さく,二つの仮説が近い場合において,サンプル複雑性に関して最適に近い性能を示すことが示された。

    Link: https://arxiv.org/abs/2508.06377

  • 関数的ANOVAモデルのためのベイジアン加法回帰木 [math.CO, cs.DM, q-bio.QM, stat.ML, cs.LG]目的:関数的ANOVA分解に基づくベイジアン加法回帰木(ANOVA-BART)の開発
    • 高次元データや複雑な関係性のモデリングにおいて,予測精度と解釈性の両立が重要である。
    • 既存のBARTモデルは予測性能は高いが,モデルの解釈性に課題がある。
    • ANOVA分解を用いることで,BARTの解釈性を高め,理論的な保証を維持しつつ予測性能を維持・向上させる。
    • 提案手法ANOVA-BARTは,BARTと同程度の予測精度と不確実性定量性能を維持しつつ,構成要素の選択においても有効性が確認された。
    • ANOVA-BARTの後方集中率はほぼミニマックス最適であり,BARTでは得られない各相互作用の収束レートが提供される。
    • 予測精度,解釈性,理論的整合性のバランスを取ることで,ANOVA-BARTはBARTの魅力的な代替案となることが示唆される。

    Link: https://arxiv.org/abs/2509.03317

  • シングルトン最適化された適合予測 [stat.ML, cs.LG]目的:シングルトン予測の頻度向上
    • 予測の信頼性評価が重要であり,確率的な保証を提供する適合予測が注目されている。
    • 既存手法は平均セットサイズを最適化するが,明確な単一予測の実現には課題がある。
    • 非シングルトンセットを生成する確率を最小化し,単一予測の頻度を向上させることを目指す。
    • 提案手法SOCOPは,既存の非適合度スコアと比較して,シングルトン予測の頻度を大幅に向上させた。
    • 平均セットサイズへの影響は最小限に抑えられ,実用性と予測精度の両立が可能となった。
    • 画像分類やLLMの多肢選択問題への応用実験で,SOCOPの有効性が確認された。

    Link: https://arxiv.org/abs/2509.24095

  • DAISI:確率的補間を用いた逆サンプリングによるデータ同化 [stat.ML, cs.LG, physics.ao-ph]目的:データ同化手法の開発
    • 科学技術分野において,モデル予測と観測値を統合し,システムの状態を推定する上で不可欠である。
    • 複雑な動力学や観測演算子においては,古典的なデータ同化手法が仮定するガウス分布が成り立たない場合がある。
    • 複雑なシステムにおける,疎でノイズの多い非線形観測下でのデータ同化精度向上を目指す。
    • DAISIは,フローベース生成モデルに基づくスケーラブルなフィルタリングアルゴリズムである。
    • 事前学習済みの生成モデルを事前分布として利用し,予測情報を逆サンプリングステップで組み込む。
    • 従来のデータ同化手法が苦戦する,疎でノイズが多く非線形な観測下で高いフィルタリング精度を達成した。

    Link: https://arxiv.org/abs/2512.00252

  • 推論時に拡散モデルにおける隠れた生体分子の構造ランドスケープを解き明かす [q-bio.BM, cs.LG]目的:生体分子の構造分布探索の効率化
    • 生体分子の機能は構造変化に依存し,その予測は生命科学研究の基盤である。
    • 実験的な構造分布の決定は困難であり,計算手法による予測が不可欠である。
    • 拡散モデルを用いて,既存手法では捉えきれない構造多様性を明らかにすること。
    • ConforMixは,分類器ガイダンス,フィルタリング,自由エネルギー推定を組み合わせることで,構造分布のサンプリングを改善する。
    • 静止構造予測モデルにも適用可能であり,ドメイン運動やポケットの柔軟性といった構造変化を捉える。
    • ConforMixは,モデルの事前学習とは独立して機能し,生物学的に重要なタンパク質に対して高い拡張性と有用性を示す。

    Link: https://arxiv.org/abs/2512.03312

  • 変分推論と正規化フローを用いた輸送型可逆ジャンプ提案の訓練のための新しいフレームワーク [stat.ML, cs.LG]目的:輸送型可逆ジャンプマルコフ連鎖モンテカルロ法の提案とモデル間,モデル内の提案の訓練
    • ベイズ推論は,不確実性を定量化でき,幅広い分野で応用が期待されるため重要である。
    • 高次元のベイズ推論は計算コストが高く,効率的なサンプリング手法が求められている。
    • 複雑な分布からのサンプルを必要とせず,計算コストを削減した効率的な訓練手法を確立すること。
    • 提案手法は,複雑なターゲット分布からのパイロットサンプルを必要とせず,単純な基底分布からのサンプルのみで学習が可能である。
    • 条件付き正規化フローを用いた新しい超次元変分推論法を開発し,輸送型提案を効率的に近似する。
    • 数値実験の結果,提案手法で訓練されたTRJ法は既存手法と比較して,より高速な混合を示す。

    Link: https://arxiv.org/abs/2512.12742

  • 近隣からの学習によるPHIBP:データ不足環境における感染症動態の予測 [stat.ML, cs.LG, math.PR]目的:データ不足環境下における感染症動態予測
    • 感染症の発生予測は,公衆衛生の向上や医療資源の効率的配分に不可欠である。
    • 過去に症例が報告されていない地域では,データが極端に不足し,正確な予測が困難である。
    • 本研究は,データ不足環境下においても信頼性の高い感染症予測を可能にすることを目指す。
    • ポアソン階層型インドのビュッフェ過程(PHIBP)が,稀なカウントデータの取り扱いに有効であることが示された。
    • PHIBPは,絶対的な存在量を基盤とし,関連地域から統計的な強みを借りることで,ゼロカウントに対する感受性を回避する。
    • 実験結果は,PHIBPが正確なアウトブレイク予測と有意義な疫学的洞察を提供する統合的なフレームワークであることを確認した。

    Link: https://arxiv.org/abs/2512.21005

  • 拡散モデルにおける推論時アラインメント:変分安定ドゥーブのMatchingによる手法 [stat.ML, cs.LG, cs.NA, math.NA, math.OC, math.ST, stat.TH]目的:拡散モデルの推論時アラインメント
    • 生成モデルの応用範囲拡大に不可欠であり,多様なデータ分布への適応が求められている。
    • 事前学習済モデルの再学習なしに,望ましい特性を付与することが課題となっていた。
    • ドゥーブのh変換に基づく,安定したガイダンス推定によるアラインメントの実現。
    • 本研究では,変分安定ドゥーブのMatchingという新しいガイダンス推定フレームワークを提案した。
    • 提案手法は,ガイダンスを基盤とするドゥーブのh関数の対数の勾配として定式化し,一貫した推定量を実現する。
    • 理論的に,推定されたガイダンスの非漸近収束率が確立され,低次元空間における次元の呪いの緩和が確認された。

    Link: https://arxiv.org/abs/2601.06514

  • 普遍的潜在同相多様体:クロスドメイン表現の統一フレームワーク [eess.IV, cs.LG, eess.SP]目的:異なるモダリティ間の潜在表現の統一
    • 多様なデータから知識を獲得するため,異なる表現形式の統合が重要である。
    • 異なるモダリティ間には構造的な不整合が存在し,統合を困難にしている。
    • 潜在多様体の同相性に基づき,モダリティ間の整合性を保証し,表現を統一する。
    • フレームワークは,人間による記述と機械学習による観測の両方を,単一の潜在構造に統合できる。
    • MNISTからFashion-MNISTへの転移学習において,再学習なしで86.73%の精度を達成した。
    • CelebA画像の5%のピクセルからのスパース復元や,CIFAR-10におけるゼロショット分類においても高い性能を示した。

    Link: https://arxiv.org/abs/2601.09025

  • 最大平均不一致の統一的な不偏分散推定:不均衡データと帰無仮説・対立仮説下でのロバストな有限サンプル性能と正確な高速化 [stat.ML, cs.LG]目的:最大平均不一致(MMD)の分散特性に関する統一的な有限サンプル表現
    • 二標本検定において,MMDはカーネル法に基づく重要な統計量であり,その推論の精度は分散推定に依存する。
    • 既存のMMD分散推定法は,帰無仮説・対立仮説やデータバランスによって異なり,統一性が欠けている。
    • 様々な仮説とサンプル構成に対応できる,MMD分散の統一的な有限サンプル表現を確立すること。
    • MMD統計量のU統計量表現とHoeffding分解を用いて,分散特性を解析し,統一的な有限サンプル表現を導出した。
    • 特に,Laplacianカーネルを用いた一変量ケースでは,計算量を$\mathcal O(n^2)$から$\mathcal O(n \log n)$に削減する正確な高速化手法を提案した。
    • 提案手法は,不均衡データを含む様々なサンプル構成においてロバストな性能を示すことが確認された。

    Link: https://arxiv.org/abs/2601.13874

  • 注意は保持ではない:無限コンテキストアーキテクチャにおける直交性制約 [q-bio.NC, cs.AI]目的:特定の出来事的知識を,一般的な意味的知識を損なうことなく保存すること
    • 生物の記憶システムはAIが抱える課題を解決しており,そのメカニズム解明は重要である。
    • 現在のAIシステムは,出来事記憶と意味記憶の分離が不十分である。
    • 意味的知識の干渉による記憶の信頼性低下という問題の解決を目指す。
    • 意味的類似性が高い事実を保存する際に,事実の数が増えるほど精度が著しく低下する。
    • この問題はモデルの容量を増加させるだけでは解決できず,根本的な原因はキーベクトルの意味的重複にある。
    • 知識オブジェクト(KO)と呼ばれる,ハッシュベースの構造化された事実表現を用いることで,高精度な記憶の保持が可能となった。

    Link: https://arxiv.org/abs/2601.15313

  • 修正フローの低次元適応:拡散と確率的局在化の視点 [stat.ML, cs.AI, cs.LG, math.ST, stat.TH]目的:拡散モデルと確率的局在化の視点からの,修正フローの低次元への適応度
    • 生成モデリングは,画像生成などの分野で重要な役割を果たしており,高品質なサンプル効率が求められる。
    • 既存のサンプリング手法は,高次元データにおいて計算コストが高く,効率的なサンプリングが課題となっている。
    • ターゲット分布の低次元構造に適応することで,サンプリング効率を向上させることを目指す。
    • 修正フローがターゲット分布の低次元構造に自動的に適応し,サンプリングを高速化することを示した。
    • 適切な時間離散化スキームとドリフト推定により,iteration complexityが$O(k/\varepsilon)$になることを証明した。
    • DDPMと修正フローの間の新たな関係を確立し,より穏やかな条件で低次元適応を実現する確率的修正フローサンプラーを設計した。

    Link: https://arxiv.org/abs/2601.15500