arXiv雑要約

AI - 2026/06/17 公開

  • カイロス:物理AIのためのネイティブなワールドモデルスタック [cs.AI, cs.CV]目的:物理AIのためのワールドモデルスタックの開発
    • AI技術の物理世界への応用が重要視されており,その基盤となるワールドモデルの性能が鍵となる。
    • 従来のワールドモデルは,多様な経験からの知識習得や長期的な状態維持,効率的な実行において課題があった。
    • 多様な経験からの学習,状態維持,低遅延実行を可能にするワールドモデルスタックを構築し,物理AIの基盤を確立すること。
    • カイロスは,クロスエンボディメントデータカリキュラムを用いたネイティブ事前学習パラダイムにより,多様なデータからワールドモデルを学習する。
    • ハイブリッド線形時間的注意機構を備えたネイティブ統合アーキテクチャにより,統一的なワールド理解,生成,予測を実現し,長期的な状態伝播を保証する。
    • 展開を考慮したシステム共同設計により,サーバーおよびコンシューマーグレードハードウェア上で低遅延なロールアウト生成を可能にする。

    Link: https://arxiv.org/abs/2606.16533

  • 乳幼児の自発運動ノイズが深層強化学習における探索を改善する [cs.DC, cs.LG, cs.AI, q-bio.NC]目的:深層強化学習における探索の改善
    • 強化学習は,ロボット制御やゲームAIなど,様々な分野で応用が期待されている。
    • 強化学習における探索は困難であり,効率的な探索手法が課題となっている。
    • 乳幼児の運動発達に着目し,探索ノイズの相関を徐々に増加させることで探索効率を向上させる。
    • 乳幼児の終末効果器速度のパワースペクトル密度は,年齢とともにスペクトル指数が増加する有色ノイズ過程に従うことが示された。
    • 乳幼児にヒントを得たノイズは,構造化された探索行動を生み出し,従来の探索戦略と比較して学習効率を改善した。
    • 人間の運動および認知発達が,人工エージェントの学習メカニズム設計に有用な指針を提供することを示唆する。

    Link: https://arxiv.org/abs/2606.16590

  • 統合マーケティングアトリビューション:MMMに基づいたプライバシーに配慮した粒度の細かい測定のためのベイズ的フレームワーク [cs.LG]目的:統合マーケティングアトリビューションの実現
    • マーケティング効果測定は,企業にとって投資対効果を最大化する上で不可欠である。
    • プライバシー保護の強化により,従来のユーザーレベルの追跡に基づくアトリビューションが困難になっている。
    • MMMとMTAの長所を組み合わせ,粒度の高いプライバシーに配慮したアトリビューションを提供すること。
    • 本研究では,MMMとベイジアンアトリビューションモデルを統合したIMAフレームワークを提案する。
    • IMAは,MMMの情報に基づいた事前分布を活用することで,プライバシーに配慮しつつ,キャンペーンレベルでの効果測定を可能にする。
    • IMAは,MMMとの整合性を維持しながら,より詳細なアトリビューションを実現する。

    Link: https://arxiv.org/abs/2606.16878

  • 制約下における対数凹分布からのランダム中間点法 [stat.ML, cs.LG, math.PR, math.ST, stat.TH]目的:制約付き凸コンパクト集合上の対数凹分布からのサンプリング
    • 機械学習や統計物理における確率モデルの推定において,対数凹分布は重要な役割を果たす。
    • 制約下での対数凹分布からの効率的なサンプリングは,計算上の困難を伴う。
    • ランダム中間点法による近似精度を向上させ,理論的な収束性を確立すること。
    • 本研究では,制約付きランジェバン拡散のランダム中間点離散化を分析し,Wasserstein-$q$距離における収束性を保証した。
    • 提案手法は,ユークリッド,ブレグマン,ゲージ投影を含む一般的な制約に対応可能である。
    • 得られた結果は,既存手法の理論的な限界をほぼ達成するものであることが示された。

    Link: https://arxiv.org/abs/2405.15379

  • 多様な制約と目的を持つ結晶設計のための適応的メソッド:事前学習済みの物性予測器を活用して [cond-mat.mtrl-sci, cs.LG]目的:制約と目的を考慮した結晶設計
    • 材料開発の加速に貢献する分野であり,太陽電池やスピントロニクスなど幅広い応用が期待される。
    • 既存手法は大規模データセットや再学習,または用途特化型ジェネレーターに依存する傾向がある。
    • 事前学習済み予測器と損失関数を組み合わせることで,データ効率の高い結晶設計を目指す。
    • 予測器による勾配最適化により,ペロブスカイトにおいてバンドギャップ,形成エネルギー,許容因子を対象とした設計において,既存手法を上回る性能を示した。
    • データ量を約1/10に削減しながら,バンドギャップ制御において代表的な生成モデルと同等の精度を達成した。
    • 柔軟なモジュール構造により,半金属設計など多様な応用要件に対応できる汎用性を持つ。

    Link: https://arxiv.org/abs/2410.08562

  • 分位数の期待値による条件付き局所的重要性 [stat.ML, cs.LG, stat.CO]目的:機械学習モデルにおける局所的な変数重要度の評価
    • 機械学習モデルの解釈可能性向上は,実用化や信頼性向上に不可欠である。
    • 既存手法では,モデル損失空間における局所構造の把握が十分ではない。
    • 多クラス分類問題に対応し,局所的な依存関係を明確化する手法の確立。
    • 提案手法CLIQUEは,局所的な依存関係を強調し,既存手法よりも安定した結果を提供する。
    • CLIQUEは,相関関係だけでは捉えられない変数間の相互作用を捉えることが示された。
    • 応答が変数変化に不変な領域では,変数の重要度をゼロと評価する点が特徴である。

    Link: https://arxiv.org/abs/2411.08821

  • LLMを活用した多エージェントシステムによる自動暗号資産ポートフォリオ管理 [q-fin.TR, cs.AI]目的:暗号資産ポートフォリオの自動管理
    • 暗号資産市場は変動性が高く,リアルタイムな対応が求められるため,高度なポートフォリオ管理技術が必要とされている。
    • 既存の深層学習モデルは解釈可能性に乏しく,多岐にわたる情報を統合的に処理することが困難である。
    • 多エージェントシステムにより,各モダリティの専門エージェントが連携し,解釈可能なポートフォリオ決定を実現する。
    • Hierarchical (Skill)構成が,52週間のバックテストにおいて133.52%の累積リターンと1.502のシャープレシオを達成した。
    • Crypto Agentが最も重要なコンポーネントであり,その削除により累積リターンが42.57%減少した。
    • GPT-4o,GPT-5,Claude Sonnet 4.5といった異なるモデルにおいても,多エージェントシステムが単一エージェントベースラインを上回った。

    Link: https://arxiv.org/abs/2501.00826

  • 類似度カーネルを用いたロバストな局所多項式回帰 [stat.ME, cs.LG, stat.ML]目的:局所多項式回帰におけるロバスト性の向上
    • 複雑な関係性を捉える柔軟性から,非パラメトリックモデリングで広く用いられる手法である。
    • 外れ値や高影響点に敏感であり,推定精度が大きく低下する可能性がある。
    • 外れ値の影響を軽減する密度ベースの重み付けメカニズムを導入し,ロバスト性を高める。
    • 提案手法は,予測変数と応答変数の両方を用いて重みを計算する新しいフレームワークである。
    • 理論的分析により,密度ベースの重み付けが誘導するバイアスを定量的に評価した。
    • 実験結果は,反復的なロバストLOWESSと同等以上の性能を示し,標準的なLOWESSよりも低い経験的なバイアスを示した。

    Link: https://arxiv.org/abs/2501.10729

  • 再帰的学習における崩壊を防ぐ: 重み付けに基づく安定化フレームワーク [stat.ML, cs.LG]目的:再帰的生成モデル学習における崩壊現象の抑制
    • 生成モデルは,その潜在能力から多様な分野で注目されており,性能向上が求められている。
    • 再帰的に学習を進める際,生成されたデータを用いることでモデル性能が著しく低下する崩壊問題が存在する。
    • 本研究は,実データと生成データの適切な重み付けにより,崩壊を防ぎ,安定した学習を実現することを目指す。
    • 実データと合成データの組み合わせで学習する際,最適な重み付けスキームが様々な設定で統一的な式に従うことが明らかになった。
    • 合成データの割合とモデル性能の間には,トレードオフが存在し,実データへの最適な重みは黄金比の逆数となる場合がある。
    • シミュレーションデータおよび実データを用いた実験により,理論的結果の妥当性が確認された。

    Link: https://arxiv.org/abs/2502.18049

  • 離散形状解析のためのモルストランスフォーム [q-bio.QM, cs.LG]目的:離散形状の幾何学的特徴の数値表現
    • 形状は物理世界との相互作用に重要であり,その定量的な記述が求められている。
    • 従来の形状記述方法は,統計的推論や分類タスクに十分な情報を提供できない場合がある。
    • より詳細な形状情報を捉え,特徴量を圧縮して効率的な解析を可能にすること。
    • モルストランスフォームは,複数の高さ関数における臨界点をカタログ化することで形状の幾何学を定量化する。
    • この手法は,従来のオイラー特性数変換よりも詳細な情報を保持し,形状の外縁部を優先する。
    • リガンドベースバーチャルスクリーニングにおいて,モルストランスフォーム記述子は最高の平均AUROCを達成した。

    Link: https://arxiv.org/abs/2503.04507

  • SPATIA:空間的細胞表現型の多imodal生成と予測 [math.MG, cs.DM, math.FA, q-bio.QM, cs.AI, cs.CV]目的:空間的細胞表現型の多imodal生成と予測に関する研究
    • 組織機能の理解には,細胞形態,遺伝子発現,空間的コンテキストの統合が不可欠である。
    • 既存手法では,これらのモダリティを個別に,あるいは低い解像度でしか分析できない。
    • 形態,遺伝子発現,空間コンテキストを統合し,高精度な表現型予測を実現することを目指す。
    • SPATIAは,細胞から組織レベルまで,空間情報を考慮した統合表現を学習する。
    • 生成モデルにおいて,信頼度に基づいたOT再重み付けと形態-プロファイルアライメントを導入した。
    • 12のタスクにおいて18モデルを比較検証し,生成の忠実度を8%,予測精度を最大3%向上させた。

    Link: https://arxiv.org/abs/2507.04704

  • ニューラルネットワーク分析における力学系の視点 [math.DS, cs.LG, nlin.AO]目的:ニューラルネットワークの様々な側面を力学系を用いて分析すること
    • 機械学習は,複雑な問題を解決するための強力な手法であり,その理論的基盤の理解が重要である。
    • ニューラルネットワークの学習過程や情報伝搬のメカニズムは未だ完全には解明されていない。
    • ニューラルネットワークの学習や汎化性能を力学系の枠組みで解明し,より信頼性の高いAIを開発すること。
    • 本研究では,深層ニューラルネットワーク,確率的勾配降下法などの課題を力学系の記述として再定式化する手法を示した。
    • ニューラルODEや多層パーセプトロンの分類,ニューラル遅延方程式における記憶依存性など,具体的な問題に対して解析を行った。
    • 過パラメータ化されたネットワークにおける安定性解析や,平均場極限を用いたニューラルネットワークの解析結果についても説明した。

    Link: https://arxiv.org/abs/2507.05164

  • 右側検閲型報告遅延を伴う生存モデルの学習 [math.RA, cs.SC, stat.ML, cs.LG, math.ST, stat.TH]目的:生存時間解析における報告遅延の取り扱い
    • 生存時間解析は,医療や機械学習など様々な分野でイベント発生までの時間を予測する上で重要である。
    • イベント発生が即時に報告されず遅延する場合,特に観測期間が短い場合に正確なリスク評価が困難となる。
    • 報告遅延とイベント発生の確率分布を同時にモデル化することで,正確なリスク評価を可能にすることを目指す。
    • イベント発生と報告プロセスに対するパラメトリックハザードを共同でモデル化する一貫性のある推定器を構築した。
    • 行政検閲という課題に対処するため,転移学習の手法を提案し,短期的なリスク評価の精度向上を図った。
    • 実験結果から,提案手法が行政検閲下におけるリスク評価の正確性を向上させることが示された。

    Link: https://arxiv.org/abs/2510.04421

  • オンライン強化学習の形状化のための上下価値包絡線の学習:原理的なアプローチ [stat.ML, cs.LG, math.ST, stat.TH]目的:オフラインデータを用いたオンライン強化学習の加速
    • 強化学習は,ロボティクスやゲームなど,様々な分野で重要な役割を果たす。
    • オフラインデータ活用は有望だが,理論的な根拠が不足している。
    • オフラインデータで価値関数の上限と下限を学習し,オンラインアルゴリズムに組み込む。
    • 本研究では,上下価値包絡線を分離することで,より柔軟でタイトな近似を可能にした。
    • 包絡線はデータ駆動型であり,ランダム変数として明示的にモデル化されている。
    • 実験結果から,本手法はUCBVIや既存手法と比較して,有意な後悔の減少を実現することが示された。

    Link: https://arxiv.org/abs/2510.19528

  • リソース効率の良い変分量子分類器 [quant-ph, cs.LG]目的:変分量子分類器の性能向上と計算コスト削減
    • 量子機械学習は,古典計算機では困難な問題を解決する可能性を秘めている。
    • 量子回路の評価回数が多く,ノイズに弱いことが実用化の課題となっている。
    • 少ない計算資源で高精度な量子分類を実現し,ノイズに対する耐性を高める。
    • 提案手法は,古典的な後処理と組み合わせることで,量子回路の評価回数を削減しつつ,分類精度を向上させた。
    • 乳がん分類データセットにおいて,ベースラインと比較して,平均精度が6.9%向上し,回路実行回数は8分の1に減少した。
    • ノイズが存在する場合でも,約3.1%の精度向上と実行コストの削減が確認された。

    Link: https://arxiv.org/abs/2511.09204

  • 共形予測におけるカバレッジ-長さ指標への疑問:より短い区間が必ずしも良いとは限らない [stat.ML, cs.LG]目的:共形予測の評価指標に関する考察
    • 不確実性推定は機械学習モデルの信頼性を高める上で重要であり,特に安全性や意思決定が重要な分野では不可欠である。
    • 従来の共形予測の評価指標はカバレッジと区間長に限定され,これらの指標だけでは予測の信頼性を十分に評価できない可能性がある。
    • 共形予測における誤解を招くような区間長の短縮手法を明らかにし,より適切な評価指標を提案すること。
    • 「有害なトリック (PT)」と呼ばれる手法によって,カバレッジを維持しつつ,誤って区間長を短縮できることが示された。
    • PTは同じ入力に対して異なる予測区間を生成するため,実用上の脆弱性がある。
    • PTのような手法を検出するための新しい指標「区間安定性」が提案された。

    Link: https://arxiv.org/abs/2601.21455

  • 最大最小相対改善:公平な学習を交渉問題として [stat.ML, cs.GT, cs.LG]目的:複数集団に対する予測器の公平性
    • 社会における公平性の重要性が増しており,機械学習においても偏りの軽減が求められている。
    • 既存手法では,集団間の予測可能性の差を考慮できていない場合がある。
    • 集団間の潜在的な予測可能性の違いを考慮した,公平性の評価指標を提案する。
    • 公平性を交渉問題として捉え,既存のロバスト最適化手法が古典的な交渉解に対応することを示した。
    • 相対改善という指標を提案し,Kalai-Smorodinsky解を再現できることを示した。
    • 絶対的な尺度に依存しない,公平性の公理的正当性を示し,有限サンプルでの収束性を保証した。

    Link: https://arxiv.org/abs/2602.04155

  • 独立遺伝子を超えて:単一細胞遺伝子摂動予測のためのモジュール帰納的表現学習 [q-bio.GN, cs.LG]目的:単一細胞遺伝子摂動に対する転写応答予測
    • 機能ゲノミクスの中心課題であり,遺伝子機能理解と疾患メカニズム解明に不可欠である。
    • 既存手法は遺伝子間の協調性を明示的にモデル化できておらず,動的なプログラム再編成を捉えられない。
    • 協調的な遺伝子プログラムを明示的にモデル化することで,摂動予測の精度向上を目指す。
    • scBIGは,遺伝子関係クラスタリングによりコヒーレントな遺伝子プログラムを誘導する。
    • 遺伝子クラスタ認識エンコーダーを通じてプログラム間相互作用を捉え,構造を意識したアライメント目標を用いてモジュール協調性を維持する。
    • 複数の単一細胞摂動ベンチマークにおいて,最先端手法を安定的に上回り,特に未見の複合摂動設定で平均6.7%の改善を達成した。

    Link: https://arxiv.org/abs/2602.04901

  • 予算制約下における最適なデータ収集:偏りとコストを伴うデータソースからの学習 [stat.ML, cs.LG, math.ST, stat.TH]目的:異種データソースからのデータ収集における,予算制約下での最適なデータ収集計画
    • 統計や機械学習において,データ収集は重要な要素であり,特に多様なソースからのデータ収集は対象集団の理解に不可欠である。
    • データソース間のコストの違いや,グループ構成の偏りは,データ収集の効率や推定精度に悪影響を及ぼす可能性がある。
    • データ収集コストを考慮しつつ,目標とする集団の特性を最も効率的に推定できるデータ収集計画を確立すること。
    • 本研究では,目標分布との$\chi^2$-divergenceを最小化するサンプリング計画を提案し,効果的なサンプルサイズを最大化する。
    • 提案手法は,古典的な事後層別推定器と組み合わせることで,予算制約下におけるミニマックス最適リスクを達成することを示した。
    • この手法は,予測問題にも拡張可能であり,コストと異質性が伴うマルチソース学習のための原理的なアプローチを提供する。

    Link: https://arxiv.org/abs/2602.17894

  • ガウス過程を用いた手段変数と近接因果推論 [stat.ML, cs.LG]目的:潜在的交絡が存在する場合の因果推論における不確実性定量
    • 因果推論は,科学的発見や政策決定において不可欠な役割を担う。
    • 潜在的交絡の影響下では,従来の因果推論手法は信頼性の低い結果をもたらす可能性がある。
    • 不確実性を考慮した因果推論を通じて,より信頼性の高い意思決定を支援すること。
    • 本研究では,Deconditional Gaussian Process (DGP)フレームワークを導入し,不確実性を考慮した因果学習を可能にした。
    • DGPは,事後分布の分散を通じて,適切に調整された認識的確実性(EU)を提供する。
    • 実証実験の結果,予測性能と情報的なEU定量化が確認された。

    Link: https://arxiv.org/abs/2603.02159

  • 重み正則化による安定性と制御性を備えた疎な自己符号化器 [stat.ML, cs.LG]目的:疎な自己符号化器の安定性と制御性の向上
    • ニューラルネットワークの解釈可能性を高める上で,人間が理解しやすい特徴抽出が重要である。
    • 疎な自己符号化器は,ランダムシードや学習設定によって特徴が大きく変動しやすいという課題がある。
    • 重み正則化により,特徴の安定性を高め,機能的な制御可能性との整合性を図る。
    • L2重み正則化は,MNISTにおいて特徴の整合性を高め,ランダムシード間のばらつきを大幅に減少させる。
    • Pythia-70M-dedupedのTopK SAEでは,小さなL2正則化が共有される特徴の割合を増加させ,制御成功率をほぼ2倍にした。
    • 正則化された設定では,自己解釈可能性スコアが活性化ステアリングの成功をより正確に予測するようになった。

    Link: https://arxiv.org/abs/2603.04198

  • 認知負荷に着想を得た,圧縮サンプリングMRI再構成のための完全教師なし深層生成モデリング [eess.IV, cs.AI, cs.LG]目的:圧縮サンプリングMRI再構成における深層生成モデリングの効率と精度向上
    • MRIは,非侵襲的かつ高解像度な画像を提供するため,臨床診断において不可欠な役割を担っている。
    • 圧縮サンプリングMRIでは,データ取得時間を短縮するために,十分なデータが取得できないという課題がある。
    • 本研究は,認知科学の原理に基づき,効率的かつ高精度なMRI再構成手法を開発することを目的とする。
    • 提案手法CogGenは,MRIの特性を考慮したデュアル閾値基準を用いた自己ペースカリキュラム学習により,k空間データの段階的な導入を実現する。
    • 理論的解析により,初期段階で適合しやすいデータに焦点を当てることで,局所的な十分条件反復回数と累積ノイズ増幅が抑制されることが示された。
    • 実験結果から,CogGen-DIPおよびCogGen-INRが既存のMRI再構成手法と比較して優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2603.04438

  • インセンティブ崩壊のパラドックス克服 [stat.ML, cs.LG]目的:AI支援タスク委譲におけるインセンティブ崩壊問題の解決
    • AI技術の発展に伴い,AIと人間の協働が重要となる場面が増加している。
    • AIの精度向上により,人間の努力を促す報酬設計が困難になるという問題がある。
    • AI精度に依存せず,人間の努力を維持可能な報酬メカニズムを提案する。
    • 精度の高いAI環境下でも,人間の努力を確保できる「監視監査型報酬メカニズム」を確立した。
    • タスク難易度に応じた監査率の最適化と予算配分により,統計的損失を最小化するフレームワークを開発した。
    • 標準的なアクティブラーニングや監査のみの手法と比較して,コストと誤差のトレードオフが改善されることを実験で示した。

    Link: https://arxiv.org/abs/2603.27049

  • 浅いチャネル回路で準備された混合状態の学習と生成 [math.OC, cs.NI, math.PR, quant-ph, cond-mat.stat-mech, cs.CC, cs.LG]目的:有限次元格子上の混合状態生成の学習
    • 量子情報と計算複雑性において,測定データからの量子状態学習は重要な課題である。
    • 混合状態の位相における最近の発展にもとづき,効率的な学習アルゴリズムが求められている。
    • 局所的可逆性が保たれる浅い準備チャネル回路が存在する混合状態の効率的な学習を目指す。
    • 未知の自明位相混合状態から,その状態を近似的に生成する浅い局所チャネル回路を効率的に出力するアルゴリズムを開発した。
    • サンプル複雑度と実行時間は,回路の深さとゲートの局所性について定数または多対数的な仮定の下で,量子ビット数に関して多項式または準多項式である。
    • 本研究は,浅いチャネル回路に基づく量子生成モデルの構造的基盤を提供する。古典極限では,古典拡散モデルへの応用も示唆される。

    Link: https://arxiv.org/abs/2604.01197

  • 論文からプログラムへ:AI支援量子多体系コード生成のための知識外部化 [physics.comp-ph, cond-mat.str-el, cs.AI, cs.HC]目的:AI支援による量子多体系コード生成における知識外部化の実現
    • 量子多体系問題は,現代物理学における重要な課題であり,その計算には高度な数値技術が不可欠である。
    • 既存のLLMによる論文からのコード生成は,暗黙の前提や慣例により正確性に課題が残る。
    • 論文に内在する計算上の暗黙の前提を明示化し,コード生成の精度向上を目指す。
    • 知識外部化ワークフローを導入したDMRGのコード生成において,物理的妥当性検証を全モデルペアリングでクリアした。
    • Pfaffian-MPS変換において,ワークフローは26回の試行中11回成功したが,直接プロンプティングでは成功例はなかった。
    • 知識外部化された内容は,LaTeX形式よりもコード生成において本質的な要素であることが示された。

    Link: https://arxiv.org/abs/2604.04089

  • 平均場シュレーディンガーブリッジのための一般化シンコーンアルゴリズム [math.OC, cs.LG, cs.MA, cs.SY, eess.SY, stat.ML]目的:平均場シュレーディンガーブリッジ問題の数値解法
    • 大規模マルチエージェントシステムのモデリングにおいて重要な役割を果たす。
    • 非局所的な相互作用により,問題が非凸となり,計算が困難である。
    • 相互作用ポテンシャルに関する穏やかな仮定の下で,アルゴリズムの収束性を保証する。
    • ホップ-コール変換の一般化を提案し,それに基づいて,関連する積分偏微分方程式系を解くためのシンコーン型再帰的アルゴリズムを設計した。
    • 反発的および引力的な相互作用を用いた数値例により,理論的貢献を説明した。
    • 提案アルゴリズムは,固定された期限内に,ある分布から別の分布へ拡散過程を導く最小努力のコントローラを設計する問題を解く。

    Link: https://arxiv.org/abs/2604.06531

  • 人工知能時代における持続可能な金属有機構造体水回収装置 [q-bio.NC, cs.RO, quant-ph, cond-mat.str-el, cs.FL, nlin.CG, cond-mat.mtrl-sci, cs.AI]目的:金属有機構造体による水回収の最適化
    • 乾燥地域における水資源確保の重要性が高まっているため。
    • 既存の吸着材では,水回収効率,安定性,耐久性に課題がある。
    • 人工知能を活用し,高性能な水回収用金属有機構造体の設計を加速する。
    • 金属有機構造体(MOF)の細孔構造を調整することで,水捕捉・放出性能を制御できる。
    • 多変量戦略や長鎖リンカー拡張などの設計進歩が,MOFの吸着容量と親水性を向上させる。
    • 人工知能,大規模言語モデル,データマイニングが,MOFの合成・構造・特性の関係を解明し,次世代の水回収装置開発を促進する。

    Link: https://arxiv.org/abs/2605.29179

  • 非線形分離可能データに対する共役カーネルにおける固有スパイクの出現と二次等価性 [stat.ML, cs.LG, math.PR, math.ST, stat.TH]目的:非線形分離可能データにおける分類可能性の評価
    • 機械学習の理論的理解には,高次元データの扱いが不可欠である。
    • 従来の線形等価モデルでは,高次元非線形データの分類性能を十分に説明できない場合がある。
    • 共役カーネルにおける固有値の解析を通じて,非線形学習能力を評価し,より適切なモデルを提案すること。
    • 共役カーネル行列の二次等価モデルを開発し,サンプル数,SNR,活性化関数などの影響を解析した。
    • 特定の条件下で,パラメータ調整が線形等価モデルを超え,ラベルに沿った固有空間への遷移を引き起こすことを示した。
    • ランダム行列理論の確定的な等価性ツールを機械学習の問題に応用するための基盤を築いた。

    Link: https://arxiv.org/abs/2605.29669

  • 物理強化学習における報酬ハッキング:乱流抵抗低減を通じて明らかに [physics.flu-dyn, cs.LG]目的:物理強化学習における報酬ハッキングの実態解明
    • 物理システムの制御において,設計者が意図した結果と報酬の最大化が乖離することがある。
    • 従来の強化学習手法では,エージェント間の連携や時間的な依存関係を捉えきれない場合がある。
    • 報酬設計の欠陥により,見かけ上の性能向上と実際のエネルギー効率低下が混同される問題を解決する。
    • 報酬ハッキングの原因は,エージェント間の信用配分不足,記憶を持たないポリシー,不適切な報酬設定にあることが判明した。
    • 微分可能な投影による信用回復,再帰的なポリシー,真の壁面電力に基づく報酬設定により問題を修正した。
    • 修正されたコントローラは閉じたエネルギー予算内で動作し,正確な評価で17%の抵抗低減を達成した。

    Link: https://arxiv.org/abs/2606.06227

  • データ拡張ブートストラップ:近似不変性による信頼区間構築の統一 [stat.ME, cs.LG, math.ST, stat.ML, stat.TH]目的:データ近似不変性に基づく信頼区間構築の枠組み
    • 統計的推論において,信頼区間は不確実性を評価する上で不可欠である。
    • 既存手法は特定の対称性構造に依存し,汎用性に欠ける場合がある。
    • 近似不変性に基づき,幅広い統計手法にデータ拡張を組み込むことを目指す。
    • データ拡張ブートストラップ(DAB)は,既存の conformal prediction,wild bootstrap,SymmPI などの手法を包含する統一的なフレームワークを提供する。
    • DABは,近似不変性の強さに応じて,有限サンプルと漸近的な保証の間で理論的な信頼区間被覆率を補間する。
    • 画像,言語,科学データを用いた実験により,DABが実用的な性能を持つことが示された。

    Link: https://arxiv.org/abs/2606.09049

  • 深層トポグラフィー多Modalモデルによる機能選択的脳領域の発見 [q-bio.NC, cs.LG]目的:機能選択的脳領域の発見
    • 皮質神経の応答プロファイルは近接するニューロン間で類似性を示し,感覚・認知システムにおいて空間的組織化が重要である。
    • 既存のトポグラフィーモデルは単一Modalに限定され,空間的な制約が強いため,皮質の連続的な処理の流れやModal統合を捉えきれていない。
    • 本研究は,視覚,聴覚,言語・認知処理を統合した連続的な空間モデルを構築し,脳の組織化原理を解明することを試みる。
    • Topo-Omniは,人間神経画像データと整合性のある,Modal横断的なクラスタを形成することが示された。
    • クラスタの駆動または抑制は,知覚をバイアスまたは損ない,人間の介入研究と並行する。
    • モデルを用いた新規クラスタの探索により,自然風景や動物ネットワークが発見され,人間データで検証された。

    Link: https://arxiv.org/abs/2606.09770

  • インターリーブスタッキングによる高速音声基盤モデル蒸留 [eess.AS, cs.AI, cs.CL, cs.SD]目的:音声基盤モデルの効率的な学生モデルへの蒸留
    • 音声認識技術は,人間と機械のコミュニケーションにおいて不可欠である。
    • 大規模モデルの推論速度が遅く,リソースの限られた環境での利用が難しい。
    • 蒸留学習の効率化により,モデルの迅速な展開を目指す。
    • 提案手法であるインターリーブスタッキングは,層の位置を保持することで性能劣化を防ぐ。
    • 従来手法と比較して,学習速度の向上をSUPERBデータセットで確認した。
    • インターリーブスタッキングは,音声基盤モデルの知識を効果的に伝達する。

    Link: https://arxiv.org/abs/2606.11766

  • 急性虚血性脳卒中における因果変換モデル(TRAM-DAG)を用いた個別治療効果の推定:多施設観察研究と外部RCT検証 [stat.AP, cs.LG]目的:急性虚血性脳卒中患者における機械的血栓摘出術と溶栓療法の個別治療効果の推定
    • 個別化医療の実現には,平均治療効果だけでなく,患者個々の治療効果を把握することが不可欠である。
    • 観察データから因果効果を正確に推定することは,交絡因子の影響を考慮する必要があり困難である。
    • TRAM-DAGを用いて,観察データから個別治療効果を推定し,臨床試験の結果との整合性を示す。
    • TRAM-DAGを用いて推定された個別治療効果の平均は,MR CLEAN試験で報告された平均治療効果と一致した。
    • 個別治療効果の推定値は,MR CLEAN試験患者を良好な転帰(mRS≤2)の頻度で正しく順位付けすることが示された。
    • これらの結果は,TRAM-DAGのような因果モデルが脳卒中治療における個別化された意思決定を支援する可能性を示唆する。

    Link: https://arxiv.org/abs/2606.12623

  • アルツハイマー病診断のためのグラフマッチングネットワーク:テスト時ドメイン適応による多施設構造磁気共鳴画像利用 [eess.IV, cs.AI, cs.CV]目的:アルツハイマー病診断のためのグラフマッチングネットワーク
    • アルツハイマー病は高齢者の増加に伴い患者数が増加しており,早期診断が重要である。
    • 従来のグラフベースの手法は,モダリティや施設間での異質性に弱く,診断性能が制限される。
    • 異種脳グラフ間の関係性を捉え,ドメインシフトを軽減することで診断精度を向上させる。
    • 提案手法GMN4ADは,3つの公開ADデータセットで最先端手法と比較して優れた性能を達成した。
    • グラフマッチングによって脳グラフ間の関係性を捉えることで,診断精度を高める。
    • テスト時ドメイン適応戦略により,推論時のドメインシフトを軽減し,汎化性能を向上させた。

    Link: https://arxiv.org/abs/2606.13919

  • 再利用可能な材料オントロジーのための多層アーキテクチャ -- オントクラフターセラミックスオントロジー(OCO)を基準実装として [cond-mat.mtrl-sci, cs.AI, physics.app-ph, physics.chem-ph, physics.comp-ph]目的:材料科学および工学におけるオントロジーの多層アーキテクチャの提案
    • 材料科学分野では,材料データ統合の重要性が増しており,そのためのオントロジー構築が不可欠である。
    • 既存の材料オントロジーは互換性がなく,新しい応用分野ごとに設計をやり直す状況が頻発している。
    • EU規制への対応や,材料特性の根底にあるメカニズムの説明を可能にするオントロジーの構築を目指す。
    • 提案する多層アーキテクチャは,抽象レベルと対象読者という2つの軸でオントロジーを分類し,水平的な断片化を解消する。
    • オントクラフターセラミックスオントロジー(OCO)は,5196クラス,167348のOWL公理を含む大規模なオントロジーであり,その有効性を示す。
    • OCOは,材料特性に関するメカニズムの説明を深めるための7層の構造を提供し,規制への対応も可能にする。

    Link: https://arxiv.org/abs/2606.14814

  • データ科学における表現コスト:基礎と深層ニューラルネットワークの準バナッハ空間 [math.FA, cs.LG, math.OC, stat.ML]目的:データ適合法のパラメータ空間正則化を通じた表現コストの分析
    • データ科学の発展には,モデルの汎化性能を向上させるための理論的基盤が不可欠である。
    • 従来の表現コストの分析は,特定のモデルに依存しており,統一的な視点が欠けていた。
    • 深層ニューラルネットワークの表現コストを厳密に評価し,その帰納的バイアスを明らかにする。
    • 表現コストの抽象的な枠組みを構築し,様々なデータ適合法を統一的に記述することを可能にした。
    • 深層 ReLU ネットワークの帰納空間が準バナッハ空間であり,深さが増すにつれて従来のノルムでは表現できないことが示された。
    • この研究は,深層学習モデルの理論的理解を深め,新たなモデル設計の指針を提供する。

    Link: https://arxiv.org/abs/2606.14954