arXiv雑要約

AI - 2026/03/04 公開

  • 機械学習を用いた衝撃応答スペクトル曲線からの衝撃時間波形の逆再構成 [cs.LG, eess.SP]目的:衝撃応答スペクトル曲線からの衝撃時間波形の逆再構成手法
    • 衝撃応答スペクトルは,構造物の振動特性評価に不可欠であり,安全性評価や設計において重要である。
    • 衝撃時間波形からスペクトルを得ることは容易だが,スペクトルから時間波形を推定する逆問題は困難である。
    • 既存手法の計算コストや制約を克服し,効率的かつ高精度な逆再構成を実現すること。
    • 条件付き変分オートエンコーダ(CVAE)を用いることで,衝撃応答スペクトルから衝撃時間波形を直接生成することを可能にした。
    • 提案手法は,古典的な手法と比較してスペクトル適合性が向上し,未知のスペクトルに対しても高い汎化性能を示した。
    • 推論速度が大幅に向上し,従来の反復最適化手法と比較して3〜6桁高速化された。

    Link: https://arxiv.org/abs/2603.03229

  • SynthCharge:学習ベース最適化とベンチマーキングを可能にする実行可能性スクリーニングを備えた電気自動車経路インスタンス生成器 [cs.LG, cs.AI]目的:電気自動車経路問題のベンチマークデータセット
    • 交通渋滞緩和や環境負荷低減に貢献する電気自動車の効率的な運行計画が重要である。
    • 既存のベンチマークデータセットは静的で,実行可能性が確認されておらず,再現性のある評価が困難である。
    • 実行可能性が保証された多様な電気自動車経路問題インスタンスを生成し,学習ベースのモデル評価を支援する。
    • SynthChargeは,顧客数や時空間設定を変化させながら,実行可能性を検証済みのEVRPTWインスタンスを生成する。
    • インスタンスの形状,エネルギー容量のスケーリング,充電ステーションの配置を考慮し,現実的な問題を構築する。
    • 実行不可能なインスタンスを効率的に除外し,信頼性の高いベンチマーク環境を提供する。

    Link: https://arxiv.org/abs/2603.03230

  • ベイズ敵対的多エージェントフレームワークを用いたAI科学ローコードプラットフォーム [cs.AI]目的:AI科学におけるコード生成の自動化
    • 科学研究の効率化が求められる中,AIによるコード生成の自動化は不可欠である。
    • 大規模言語モデルの信頼性,複数エージェント間でのエラー伝播,評価指標の曖昧さが課題となっている。
    • 信頼性と評価の不確実性を軽減し,専門知識がないユーザーでも利用可能なプラットフォームを構築する。
    • 提案手法は,ベイズ推論と敵対的学習を組み合わせた多エージェントフレームワークを用いることで,コード生成の堅牢性を高めている。
    • ローコードプラットフォームとして,非専門家でもドメイン特化型要件に変換し,プロンプトエンジニアリングの必要性を削減する。
    • 地球科学分野の課題においても,既存モデルを凌駕する高い信頼性を示すことが確認された。

    Link: https://arxiv.org/abs/2603.03233

  • 神経生物学的原理に基づいたスパースニューラルネットワークの誘導:生物学的に妥当な表現の創出 [cs.LG]目的:生物学的に妥当な表現の創出
    • 深層学習の汎化性能や少ないデータからの学習に課題があり,生物の神経系に見られる柔軟性に欠ける。
    • 深層学習は生物の神経回路の効率的な学習メカニズムを模倣できていない点が問題である。
    • 神経生物学的原理を取り入れ,汎化性能と少ないデータからの学習能力を向上させる。
    • 提案手法は,スパース性,対数正規分布,デール則などの神経生物学的原理を自然に組み込む。
    • その結果,敵対的攻撃に対するロバスト性が向上し,特に少数の学習データでの汎化性能が向上した。
    • この制約を統合することで,生物学的に妥当なニューラル表現が出現し,深層学習設計への神経生物学的原理の組み込みの有効性が示された。

    Link: https://arxiv.org/abs/2603.03234

  • 潜在ニューラル常微分方程式動力学を持つ自己符号化器縮約次モデルにおける幾何学的正則化 [cs.CY, cs.LG, cs.NA, math.NA, physics.comp-ph]目的:自己符号化器縮約次モデルにおける学習された潜在表現の幾何学的正則化
    • 物理現象のモデリングにおいて,データ駆動型アプローチの重要性が増している。
    • 潜在空間の構造が適切でない場合,長期的予測の精度が低下する可能性がある。
    • 潜在空間の幾何学的構造を改善することで,長期的予測性能の向上を目指す。
    • 近傍等距性正則化,確率的デコーダ利得ペナルティ,二階方向曲率ペナルティは,潜在ダイナミクスの学習を困難にする傾向がある。
    • スティフェル射影は,学習された潜在ダイナミクスの条件付けに関する診断を改善し,ロールアウト性能を向上させる。
    • この設定では,潜在幾何学の不一致の影響が,デコーダの滑らかさ向上の利点を上回ると考えられる。

    Link: https://arxiv.org/abs/2603.03238

  • UniG2U-Bench: 統一モデルはマルチモーダル理解を進めるか [cs.CV, cs.AI]目的:マルチモーダル理解における生成の有効性評価
    • 視覚情報と言語情報を統合するマルチモーダル研究は,AIの汎用性向上に不可欠である。
    • 既存のベンチマークでは,生成が理解にどう貢献するかを系統的に評価できていない。
    • 生成を通して理解が促進される具体的なタスクを特定し,そのメカニズムを解明する。
    • 統一モデルは,基本となるVision-Language Model (VLM)よりも性能が劣ることが多い。
    • 空間認識,視覚的錯覚,多段階推論など,特定のタスクでは生成による性能向上が見られた。
    • 類似の推論構造を持つタスクや同じアーキテクチャのモデルは,一貫した振る舞いを示した。

    Link: https://arxiv.org/abs/2603.03241

  • 密度に基づいた応答最適化:暗黙の承認シグナルによるコミュニティに根ざしたアライメント [cs.AI, cs.CL]目的:コミュニティ固有の規範に沿った言語モデルのアライメント
    • オンラインコミュニティでは,多様な規範が形成されており,それらに適応した言語モデルが求められる。
    • 明示的な嗜好データや事前定義された原則に依存する既存のアライメント手法は,リソースの限られたコミュニティには適用が難しい。
    • コミュニティにおけるコンテンツの受容行動から暗黙の嗜好シグナルを抽出し,明示的なラベルなしでアライメントを行う。
    • コミュニティが受容する応答は,表現空間において高密度な領域を占め,コミュニティ固有の規範を反映していることが示された。
    • 提案手法DGROは,明示的な嗜好ラベルなしで言語モデルをコミュニティの規範にアライメントできる。
    • DGROは,リソースの限られた多様なコミュニティにおいて,人間やモデルによる評価において優れた性能を示した。

    Link: https://arxiv.org/abs/2603.03242

  • 推測的推測デコーディング [cs.RO, cs.CL, cs.LG]目的:推測的デコーディングのさらなる高速化
    • 大規模言語モデルの推論速度向上は,実用化における重要な課題である。
    • 従来の推測的デコーディングは,推測と検証の依存関係により並列化に限界があった。
    • 推測と検証の並列化により,推論速度のボトルネックを解消すること。
    • 提案手法であるSaguaroは,最適化された推測的デコーディングよりも最大2倍高速である。
    • 自己回帰デコーディングと比較して最大5倍の高速化を達成した。
    • 推測と検証の並列化を実現するための3つの課題を特定し,解決策を提示した。

    Link: https://arxiv.org/abs/2603.03251

  • Valet:伝統的な不完全情報カードゲームの標準化テストベッド [cs.AI]目的:不完全情報ゲームの性能評価のための標準テストベッド
    • ゲームAI研究において,多様なゲームでの性能評価は重要である。しかし現状では困難である。
    • 不完全情報ゲームの性能比較は,ゲーム選択に依存し,汎用的な評価が難しいという課題がある。
    • 多様なカードゲームを標準化し,公平なAI性能比較を実現することを目指す。
    • Valetは,21種類の伝統的なカードゲームを含む包括的なテストベッドである。
    • 各ゲームのルールはRECYCLEというカードゲーム記述言語で記述され,実装の標準化を図っている。
    • モンテカルロ木探索を用いた初期的な性能評価を行い,ベンチマークスイートとしての有用性を示した。

    Link: https://arxiv.org/abs/2603.03252

  • 継承された目標ずれ:文脈的圧力がエージェントの目標を損なう可能性 [cs.AI]目的:言語モデルにおける目標ずれの程度と原因の特性評価
    • 長文脈タスクにおける言語モデルの利用拡大に伴い,目標維持の重要性が高まっている。
    • 従来の言語モデルは目標ずれを起こしやすいが,最新モデルへの影響は不明であった。
    • 文脈的圧力による目標ずれの脆弱性を明らかにし,改善策の必要性を示す。
    • 最新モデルは,ある程度の文脈的圧力には耐性があることが示された。
    • しかし,より弱いエージェントからの事前入力に条件付けられると,目標ずれが発生しやすいことが判明した。
    • GPT-5.1のみが一貫して耐性を示し,目標ずれの挙動はプロンプトや指示の階層構造に依存しないことが示された。

    Link: https://arxiv.org/abs/2603.03258

  • 過渡期対流優勢問題に対する安定化有限要素解の物理情報に基づいた後処理 [math.NA, cs.LG, cs.NA]目的:過渡期対流優勢問題における安定化有限要素法の精度向上
    • 数値シミュレーションは工学設計において不可欠であり,現象の正確な予測が求められる。
    • 対流優勢な流れのシミュレーションでは,数値計算上の振動や不正確な解が得られやすい。
    • 物理情報ニューラルネットワークと有限要素法を組み合わせ,解の精度と効率を向上させる。
    • 提案手法は,終端時刻における安定化有限要素解の精度を大幅に向上させることを実証した。
    • 物理情報に基づいた後処理は,特に急峻な層や波動といった特徴を捉える上で有効である。
    • 終端時刻付近に焦点を当てたニューラルネットワークの適用により,計算コストを削減しつつ高い精度を実現した。

    Link: https://arxiv.org/abs/2603.03259

  • LoGeR:ハイブリッドメモリによる長文脈幾何学的再構成 [cs.CY, cs.CV, cs.LG]目的:長尺動画における高精度な3次元再構成
    • 動画理解において,長時間の文脈を捉えることは重要である。しかし,計算量やメモリ容量が課題となる。
    • 既存手法では,長尺動画への対応が困難であり,再構成精度が低下する問題がある。
    • チャンク間のコヒーレンスを維持しつつ,長尺動画の3次元再構成を実現することを目指す。
    • LoGeRは,従来の最先端手法と比較して,KITTIデータセットでのATEを74%以上削減した。
    • 学習時に128フレームのシーケンスで学習し,推論時に数千フレームまでのシーケンスに一般化できる。
    • 提案手法は,最長19,000フレームのシーケンスを持つVBRデータセットでも,ロバストで一貫性のある再構成を達成した。

    Link: https://arxiv.org/abs/2603.03269

  • 重力フォールズ:モバイルデバイスを標的としたスピアフィッシングにおけるDGA検出手法の比較分析 [cs.CR, cs.LG, cs.NI]目的:モバイルデバイスを標的としたスピアフィッシングにおけるDGA検出手法の性能評価
    • モバイルデバイスの利用拡大に伴い,SMSスピアフィッシングによる攻撃が増加しており,その対策が急務である。
    • DGA検出研究は主にマルウェアのC2やメールフィッシングに焦点を当てており,SMSスピアフィッシング特有の戦術に対する評価が不足している。
    • SMSスピアフィッシングで用いられるDGA戦術の変化に対応できる検出手法を明らかにすること。
    • Gravity Fallsデータセットを用いた評価の結果,ランダム文字列ドメインでは高い性能を示したが,辞書連結やテーマ型コンボスクワッティングでは性能が低下した。
    • 従来のヒューリスティックや最新の機械学習ベースの検出器は,Gravity Fallsで観察されるDGA戦術の変化に一貫して対応できないことが示された。
    • より文脈を考慮したアプローチの必要性が示唆され,将来の評価のための再現可能なベンチマークが提供された。

    Link: https://arxiv.org/abs/2603.03270

  • 集団統計情報に基づく移動軌跡の学習 [cs.LG]目的:人口統計情報に応じた移動軌跡の生成
    • 公共衛生や社会科学において,人々の移動は重要な研究対象であり,多様な人学的特徴が移動パターンに影響する。
    • 既存の軌跡生成モデルは,人口統計ラベルの欠如により,こうした多様性を捉えられていないという課題がある。
    • 本研究は,個々の軌跡データと集団レベルの統計情報のみを用いて,人口統計情報に基づいた移動軌跡を生成する手法を開発し,その問題を解決する。
    • 提案手法ATLASは,人口統計ラベルのない個々の軌跡,地域レベルの移動特性,国勢調査データに基づいた地域レベルの人口構成のみを用いて,移動軌跡を生成する。
    • 実験の結果,ATLASは既存手法と比較して人口統計的なリアリズムが大幅に向上し,教師あり学習に匹敵する性能を示すことが確認された。
    • 理論的分析により,ATLASの有効性の要因として,地域間での人口統計的多様性と集計特徴の有用性が明らかになった。

    Link: https://arxiv.org/abs/2603.03275

  • テザー:対応に基づく軌道変形を用いた自律的な機能的遊び [cs.RO, cs.AI, cs.CV]目的:自律的な機能的遊びの実現
    • ロボット工学において,人間による手間のかかるデモンストレーションの代替として,相互作用と経験から学習する能力は重要である。
    • 多様な環境状態や未知の状況に対応できるロバストなポリシーと,継続的に有用な経験を生み出す方法が課題である。
    • 少ないデモンストレーションから,タスク指向の相互作用を通じて自律的な学習サイクルを確立し,ロボットのデータ収集を効率化する。
    • 提案手法テザーは,少数のデモンストレーション(10個以下)から,シーン内の意味的キーポイントに対応づけを行い,アクションを調整することで,高いデータ効率とロバスト性を実現した。
    • ビジョン言語モデルを活用したタスク選択,実行,評価,改善のサイクルを繰り返すことで,人間の介入を最小限に抑えつつ,多様で高品質なデータセットを生成した。
    • 本研究は,家庭環境下で長時間にわたる自律的なマルチタスクプレイを可能にし,クローズドループ模倣学習ポリシーの性能向上に貢献する1000以上の専門レベルの軌道データを生成した。

    Link: https://arxiv.org/abs/2603.03278

  • 包丁を使った皮むき:微細な操作と人間の嗜好との整合 [cs.RO, cs.AI, cs.CV, cs.LG, cs.SY, eess.SY]目的:微細な操作と人間の嗜好の整合
    • 料理,外科手術,職人技など,多くの重要な操作は自動化が困難である。
    • タスクの質が連続的かつ主観的であり,定量的な評価が難しい。
    • 人間の嗜好に合致したタスク品質の向上を目指す。
    • 力覚を考慮したデータ収集と模倣学習により,頑健な初期ポリシーを学習した。
    • 学習した報酬モデルと定量的指標を組み合わせ,人間のフィードバックに基づきポリシーを微調整した。
    • 50~200件の皮むき軌跡で,90%以上の成功率を達成し,最大40%の性能向上を示した。

    Link: https://arxiv.org/abs/2603.03280

  • CFG-Ctrl:制御に基づく分類器不要型拡散ガイダンス [cs.CV, cs.LG]目的:拡散モデルにおけるセマンティックアライメントの強化
    • 拡散モデルは画像生成において高品質な結果を生み出すため,その制御手法の改善が重要である。
    • 従来のCFGは線形制御に依存するため,大規模なガイダンススケールで不安定性やセマンティック精度の低下が生じる。
    • スライディングモード制御を導入し,セマンティックエラーに対する収束性とロバスト性を向上させる。
    • 提案手法SMC-CFGは,Stable Diffusion 3.5, Flux, Qwen-Imageを含む様々なモデルで,セマンティックアライメントの性能を向上させる。
    • SMC-CFGは従来のCFGと比較して,より広い範囲のガイダンススケールで安定した性能を示す。
    • 本研究は,スライディングモード制御による非線形フィードバックが,拡散モデルの収束性を理論的に保証することを示した。

    Link: https://arxiv.org/abs/2603.03281

  • 現実世界の咳音記録とメタデータからの結核予測 [cs.RO, cs.HC, cs.RO, cs.HC, eess.AS, cs.AI]目的:結核の予測モデルの構築
    • 結核は依然として世界的な健康問題であり,早期発見と治療が重要である。
    • 既存の診断方法は専門的な知識や設備を要し,資源の限られた地域では困難な場合がある。
    • 咳音分析と臨床データを用いて,低コストで結核を早期に発見する方法を確立すること。
    • 咳音のみによる分類で平均AUC 0.70±0.05を達成した。
    • 臨床情報と組み合わせることで,AUCは0.81±0.05に向上した。
    • 本研究は,モバイルアプリを用いた結核スクリーニングの可能性を示唆している。

    Link: https://arxiv.org/abs/2307.04842

  • 音声・オーディオ信号に対する正弦波モデルのパラメータ推定について [eess.AS, cs.AI, cs.MM, eess.SP]目的:音声・オーディオ信号に対する正弦波モデルのパラメータ推定性能の比較
    • 音声・オーディオ処理において,信号の効率的な表現と解析は重要な課題である。
    • 従来の正弦波モデルでは,非定常信号や複雑な信号に対して十分な精度が得られない場合がある。
    • 異なる正弦波モデルの性能を比較し,それぞれの長所と短所を明らかにすることで,より適切なモデル選択を可能とする。
    • 標準的な正弦波モデル(SM),指数減衰正弦波モデル(EDSM),拡張適応準調和モデル(eaQHM)のパラメータ推定性能を比較した。
    • eaQHMは,中~大規模なウィンドウサイズ解析においてEDSMを上回り,EDSMは小規模なウィンドウサイズにおいて高い再構成値を示すことがわかった。
    • 今後は,eaQHMの適応性とEDSMのパラメータ推定のロバスト性を融合させた新たなパラダイムが,高品質なオーディオ信号の解析・再合成に貢献すると考えられる。

    Link: https://arxiv.org/abs/2401.01255

  • 直接重み混合のためのParamΔ:追加コストなしでの大規模言語モデルのポストトレーニング [cs.CL, cs.AI, cs.LG]目的:大規模言語モデルのポストトレーニングにおける知識伝達手法
    • 大規模言語モデルは,指示追従や推論能力など,様々なタスクで高性能を示すが,その性能を維持・向上させるにはポストトレーニングが不可欠である。
    • 従来のポストトレーニングは,高品質なデータと高い計算コストを必要とし,ベースモデルの更新ごとに再トレーニングや評価を行う手間がかかる。
    • 本研究は,追加のトレーニングコストなしで,更新されたベースモデルにポストトレーニング済みの能力を効率的に付与することを目的とする。
    • 提案手法ParamΔは,既存のポストトレーニング済みモデルと更新されたベースモデルの重みの差を利用することで,ポストトレーニングと同様の性能を実現する。
    • Llama3,Llama3.1,Qwen,DeepSeek-distilledモデルを用いた実験では,ParamΔモデルが従来のポストトレーニングを効果的に再現することが示された。
    • 例えば,Llama3-inst,Llama3-base,Llama3.1-baseモデルから得られたParamΔモデルは,Llama3.1-instモデルの性能の平均約95%を達成した。

    Link: https://arxiv.org/abs/2504.21023

  • ALARM:不確実性定量を用いた複雑環境モニタリングにおけるMLLMベースの異常検知の自動化 [cs.LG, cs.AI, cs.CV]目的:複雑環境におけるMLLMベースの異常検知システムの開発
    • 近年,視覚情報の異常検知において,大規模言語モデル(LLM)の活用が注目されている。
    • 複雑な環境下では異常が文脈に依存し曖昧になりやすく,正確な判断が困難である。
    • 不確実性定量を取り入れることで,より堅牢で信頼性の高い異常検知を目指す。
    • 本研究では,不確実性定量と品質保証技術を統合したALARMフレームワークを提案した。
    • ALARMは,推論パイプラインと計算プロセスに基づき,ロバストかつ正確な性能を実現する。
    • スマートホームと創傷画像分類のデータセットを用いた実験により,ALARMの優れた汎用性と意思決定の信頼性が示された。

    Link: https://arxiv.org/abs/2512.03101

  • 線虫エレガンスニューロン分類のためのグラフ系・非グラフ系手法のベンチマーク分析 [q-bio.NC, cs.AI]目的:線虫エレガンスニューロンの分類手法の性能評価
    • 神経科学研究において,ニューロンの正確な分類は脳機能の理解に不可欠である。
    • 既存手法では,線虫エレガンスの複雑な神経回路網を効果的にモデル化できていない。
    • グラフニューラルネットワークの有効性を検証し,最適な特徴量を特定すること。
    • 空間的特徴と接続特徴において,注意機構を用いたGNNが従来の基盤モデルを大きく上回る性能を示した。
    • 神経活動特徴は,データの時間分解能の低さから十分な性能を発揮できなかった。
    • 本ベンチマークはGNNの有用性を確認するとともに,空間的特徴と接続特徴が線虫エレガンスニューロンクラスの重要な予測因子であることを示唆する。

    Link: https://arxiv.org/abs/2603.02241

  • ドメイン横断型乳児の泣き声分類のためのLMUベースの逐次学習と事後アンサンブル融合 [eess.AS, cs.LG, cs.SD]目的:乳児の泣き声原因のドメイン横断的な分類
    • 乳児の健康状態モニタリングにおいて,泣き声は重要な情報源である。
    • 泣き声は短く非定常な信号であり,アノテーションが限られており,ドメイン間のシフトが大きい。
    • 異なるデータセット間での汎化性能向上と,効率的な実時間処理の実現。
    • 提案手法は,MFCC,STFT,ピッチ特徴を融合した多分岐CNNエンコーダと,強化されたLegendre Memory Unit (LMU) を用いる。
    • LMUはLSTMと比較して,少ないパラメータで安定した系列モデリングが可能である。
    • 事後アンサンブル融合により,ドメイン特有の知識を保持しつつ,データセットバイアスを軽減し,Baby2020およびBaby CryingデータセットでマクロF1スコアの改善が確認された。

    Link: https://arxiv.org/abs/2603.02245

  • オンデバイスにおける効率的なパーソナライズされたキーワードスポッティングのためのチャネルプルーニング手法OnDA [eess.AS, cs.LG, cs.SD]目的:効率的なパーソナライズドキーワードスポッティングの実現
    • 常に起動しているキーワードスポッティングは,様々な環境下で高い精度が求められるため,重要な研究分野である。
    • ユーザーや環境の変化に対応するためには,モデルの適応が必要だが,遅延や消費電力の制約がある。
    • オンデバイスでの学習とアーキテクチャ適応を組み合わせ,モデルの圧縮と性能維持を両立することを目指す。
    • 提案手法OnDAは,HeySnipsおよびHeySnapdragonデータセットにおいて,タスク性能を維持しつつ,最大9.63倍のモデルサイズ圧縮を実現した。
    • Jetson Orin Nano上での評価では,オンライン学習時および推論時の遅延と消費電力を,重みのみを調整する手法と比較して最大1.77倍改善した。
    • オンデバイスでの学習とアーキテクチャ適応の組み合わせが,効率的なパーソナライズドキーワードスポッティングに貢献する。

    Link: https://arxiv.org/abs/2603.02247

  • Whisper-RIR-Mega: 音響環境に対するASRの頑健性を評価するためのクリーン・残響ペア音声ベンチマーク [eess.AS, cs.AI, cs.LG, cs.SD]目的:音響環境に対する自動音声認識(ASR)の頑健性の評価
    • ASRは,様々な環境下での利用が求められており,特に音響環境の影響は重要である。
    • 残響はASRの性能を著しく低下させるが,現実的な残響環境下での評価データセットが不足している。
    • 現実的な残響条件下でのASR性能評価を可能にするデータセットの提供。
    • Whisper-RIR-Megaは,クリーン音声と残響音声のペアから構成される大規模なベンチマークデータセットである。
    • 実験の結果,残響は全てのモデルサイズにおいて性能を低下させ,WERの悪化は0.12~1.07ポイントに及んだ。
    • 本研究により,ASRの頑健性に関する研究を促進するためのデータセット,評価コード,ベースライン結果が公開された。

    Link: https://arxiv.org/abs/2603.02252

  • 量子AS-DeepOnet:2次元発展方程式を解くための量子注意型スタックDeepONet [quant-ph, cs.LG]目的:2次元発展方程式の求解
    • 物理現象のシミュレーションは,科学技術の発展に不可欠であり,その重要性は高い。
    • 従来の数値解析手法は計算コストが高く,効率的な求解方法が求められている。
    • 計算コストを削減しつつ,古典的なDeepONetと同等の精度と収束性を実現すること。
    • 提案手法Quantum AS-DeepOnetは,従来のDeepONetと同等の精度を維持しながら,学習パラメータ数を約60%削減できる。
    • パラメータ化された量子回路とクロスサブネット注意機構を組み合わせることで,効率的な演算を実現している。
    • 異なる初期条件やソース項に対しても,再学習なしに推論が可能である。

    Link: https://arxiv.org/abs/2603.02261

  • 文脈的逆転可能ワールドモデル:大腸癌薬物応答のための神経記号型エージェント的フレームワーク [q-bio.QM, cs.AI]目的:大腸癌の薬物応答予測のための神経記号型エージェント的フレームワーク
    • 個別化医療の実現には,ゲノムデータと薬物応答データの両方が重要である。
    • 薬物応答データが不足しているため,高次元ゲノムデータを有効活用できない現状がある。
    • 臨床的文脈を考慮した透明性の高いAIによる,薬物応答予測とメカニズム解明を目指す。
    • Sanger GDSCデータセットを用いて,堅牢な予測相関 (r=0.504) を達成した。
    • MSIステータスのような臨床的文脈を明示的にモデル化することで,性能が向上した。
    • in silico CRISPR変異により,薬剤感受性に影響を与える遺伝子編集を予測し,治療機会と抵抗性を区別した。

    Link: https://arxiv.org/abs/2603.02274

  • トポロジー的因果効果 [stat.ME, cs.LG, stat.ML]目的:トポロジー構造の変化による因果効果の推定
    • 複雑な空間での因果推論は重要であり,従来の統計手法では捉えきれない構造的変化が存在する。
    • 従来の因果推論手法は,ユークリッド空間に限られており,非ユークリッド空間では機能しない場合がある。
    • 複雑な構造を持つデータにおける因果効果を,トポロジー的な特徴量を用いて定量的に評価すること。
    • 本研究では,潜在的な結果のトポロジー構造の差異を通じて因果効果を定義する新しいフレームワークを提案した。
    • 持続ホモロジー図のパワー重み付きシルエット関数を用いて,効率的かつロバストな推定量を開発し,機能的な弱収束を確立した。
    • 多様な複雑な結果型に対して,提案手法がトポロジー的因果効果を信頼性高く定量化できることを実証した。

    Link: https://arxiv.org/abs/2603.02289

  • 習慣形成と合理性の制約を用いたニューラル需要推定 [econ.GN, cs.LG, q-fin.EC]目的:ニューラル需要システム
    • 消費者の需要を理解することは,経済学やマーケティングにおいて不可欠である。
    • 従来の需要モデルは,特定の関数形を仮定する必要があり,柔軟性に欠ける。
    • 習慣形成が需要に与える影響を考慮した,より柔軟な需要モデルを構築する。
    • 本研究では,KLダイバージェンスを最小化するニューラル需要システムを開発した。
    • シミュレーションの結果,習慣形成を考慮することで需要の弾力性と厚生評価が正確に算出された。
    • 実証分析の結果,習慣形成を組み込むことで,予測誤差が約33%減少し,価格上昇による厚生損失が15-16%増加した。

    Link: https://arxiv.org/abs/2603.02331

  • 大規模電子モデル:普遍的な基底状態予測器 [cond-mat.str-el, cs.AI, cs.LG]目的:相互作用する電子の基底状態予測
    • 物質科学において,電子相関を正確に扱うことは重要である。
    • 従来の密度汎関数理論では強い電子相関を扱うことが困難である。
    • 大規模電子モデルによる基底状態予測でその課題を克服する。
    • 本モデルは,フェルミ集合アーキテクチャを用いることで,汎用的な多体フェルミオン波動関数を表現する。
    • 訓練された単一モデルが,見えない結合強度や粒子数セクターに対しても,正確な基底状態波動関数を予測する。
    • これにより,物質発見のための基底モデル手法の基礎を確立した。

    Link: https://arxiv.org/abs/2603.02346

  • 確率的勾配降下法におけるFisher幾何学的拡散:最適レート,オラクル複雑性,情報理論的限界 [stat.ML, cs.LG, math.OC]目的:確率的勾配降下法のFisher幾何学的理論
    • 機械学習の最適化において,効率的な勾配降下法は重要な役割を果たす。
    • ミニバッチノイズの適切なモデリングが困難であり,学習の収束を遅らせる可能性がある。
    • ミニバッチノイズを内因的な損失誘起行列として捉え,最適レートを導出すること。
    • ミニバッチ勾配共分散は,射影されたFisher情報またはGodambe行列に等しいことが示された。
    • 総オラクル予算Nの下で,Fisher/Godambeリスクに関する一致するミニマックス上限および下限が導出された。
    • 実験により,Lyapunov予測が検証され,スカラー温度マッチングでは方向性ノイズ構造を再現できないことが示された。

    Link: https://arxiv.org/abs/2603.02417

  • Z-グロモフ・ワッサーシュタイン距離を用いたグラフ予測の適合性 [stat.ML, cs.LG]目的:グラフ構造の予測における適合性評価
    • グラフ予測は回帰問題の一分野であり,構造化された出力が求められるため重要である。
    • グラフ予測において,予測の不確実性を定量化する信頼性のある手法が不足している。
    • 予測の不確実性を考慮した,分布に依存しない保証を提供する適合性予測フレームワークを提案する。
    • 提案手法はZ-グロモフ・ワッサーシュタイン距離を用いて非適合性を定義し,グラフ間の比較を可能にする。
    • スコア適合性量子回帰(SCQR)を導入し,複雑な出力空間における予測集合の適応性を向上させた。
    • 合成データと分子識別問題を用いた評価により,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2603.02460

  • グローバル量子ネットワークのための衛星軌道パラメータ最適化 [quant-ph, cs.LG, cs.NI]目的:グローバル量子ネットワークにおけるエンタングルメント生成率最大化のための衛星軌道パラメータおよび配置
    • 地球上の量子通信には限界があり,グローバル量子インターネットの実現には衛星が不可欠である。
    • 既存の衛星配置は,地上局へのエンタングルメント生成率を最大化するものではない場合がある。
    • 本研究は,地上局にエンタングルメントを効率的に分配するための最適な衛星軌道と配置を決定することを目指す。
    • ベイズ最適化と遺伝的アルゴリズムの性能は同程度であり,最適化手法としての有効性が示された。
    • ベイズ最適化は遺伝的アルゴリズムと比較して,より効率的に収束する傾向がある。
    • いずれの手法も,地上局の配置に基づく単純なアプローチと比較して,著しい改善をもたらす。

    Link: https://arxiv.org/abs/2603.02480

  • ジェームズの対称正定値行列ビコーン領域における幾何学的構造と偏差 [stat.ML, cs.CG, cs.CV, cs.LG]目的:対称正定値行列の幾何学的構造に関する研究
    • 信号処理,統計,金融など広範な分野で対称正定値行列データが重要であり,その幾何学的理解は不可欠である。
    • 既存の幾何学的枠組みでは,多様体上の測地線が必ずしも直線状にならないという課題があった。
    • ジェームズのビコーン再パラメータ化に基づき,測地線が直線となる新たなフィンズレリアン構造と二元情報幾何学的構造を確立する。
    • ジェームズのビコーン再パラメータ化から,フィンズレリアン構造と二元情報幾何学的構造の2つの新しい構造を導入した。
    • スペクトラプレックスがビコーン領域のアフィン部分空間に含まれることを証明し,Hilbert VPM距離がHilbert単純体距離を一般化することを示した。
    • これらの新しい構造と伝統的な類似性/相違性の間の様々な不等式について議論した。

    Link: https://arxiv.org/abs/2603.02483

  • 低次数法はロバストな部分空間回復の予測に失敗する [stat.ML, cs.CC, cs.DS, cs.LG]目的:ロバストな部分空間回復問題における計算可能性の予測
    • 高次元データ分析において,計算と統計のギャップを予測する手法の重要性が増している。
    • 低次数法が全ての計算問題を正確に予測できるという仮説に対し,反例が存在する可能性が指摘されている。
    • 低次数法では予測できない問題に対し,効率的なアルゴリズムの存在を示す。
    • 本研究では,多項式時間で解けるが,低次数法では予測できない問題が示された。
    • この問題は,よく研究されているロバストな部分空間回復問題の特殊なケースである。
    • 反集中特性を利用したアルゴリズムは,低次数法では捉えられない可能性が示唆された。

    Link: https://arxiv.org/abs/2603.02594

  • スパースPCAの組み合わせ的アプローチ:尖ったアイデンティティモデルを超えて [stat.ML, cs.DS, cs.LG, math.OC]目的:高次元統計におけるスパースPCAの組み合わせ的アルゴリズムの成功条件
    • 高次元データ分析において,次元削減は重要な課題であり,スパースPCAはその有効な手法の一つである。
    • 既存の組み合わせ的スパースPCAアルゴリズムは,尖ったアイデンティティモデルに限定され,汎用性に課題があった。
    • 尖ったアイデンティティモデルに依存しない,より汎用的な組み合わせ的スパースPCAアルゴリズムを開発すること。
    • 本研究では,標準的な組み合わせ的アルゴリズムが尖ったアイデンティティモデルを超えた場合に失敗する具体的な反例を提示した。
    • 新たに提案する組み合わせ的アルゴリズムは,一般化された共分散行列に対しても理論的な収束性を保証する。
    • 提案手法は,s^2の多項式個のサンプルとd^2の多項式個の時間でスパース主成分ベクトルを復元可能であることを示した。

    Link: https://arxiv.org/abs/2603.02607

  • 心臓構造疾患の電気心電図からの検出:解釈可能な基礎モデル予測子の一般化加法モデルによる手法 [quant-ph, cs.NI, stat.AP, cs.AI, cs.LG, stat.ME, stat.ML]目的:心臓構造疾患検出のための解釈可能なフレームワーク
    • 心臓構造疾患は有病率が高く,早期発見が重要である。高コストな心エコー検査の代替手段が求められている。
    • 既存のAIモデルはブラックボックスであり,解釈性が低く,臨床現場での導入が課題となっている。
    • 臨床的に意味のある電気心電図の予測子を一般化加法モデルに統合し,解釈性と予測性能を両立することを目指す。
    • 提案手法は,EchoNextベンチマークにおいて,最先端の深層学習モデルと比較して,AUROC,AUPRC,F1スコアがそれぞれ+0.98%,+1.01%,+1.41%向上した。
    • 訓練データの30%のみでも,わずかに高い性能を達成し,多様な集団に対する頑健性も確認された。
    • 推定された関数は,従来の電気心電図診断と心臓構造疾患のリスクの関係に関する解釈可能な洞察を提供する。

    Link: https://arxiv.org/abs/2603.02616

  • ウィーン4G/5G ドライブテストデータセット [math.CO, cs.DM, eess.SP, cs.AI, cs.LG]目的:モバイルネットワーク分析,計画,最適化のための大規模実データセット
    • 無線通信技術は現代社会の基盤であり,その性能向上は社会機能維持に不可欠である。
    • 実環境での大規模データセットの不足が,モバイルネットワーク研究のボトルネックとなっていた。
    • 都市規模の実データセットを提供し,環境を考慮した学習を可能にすること。
    • 本研究では,オーストリアのウィーン市で収集された4G/5Gのドライブテストデータセットを公開した。
    • このデータセットは,ネットワーク側とユーザー側の両方の視点からネットワーク情報を包括的に提供する。
    • 建物や地形モデルも含まれており,レイトレースなどの検証にも活用可能である。

    Link: https://arxiv.org/abs/2603.02638

  • 古い確率的勾配を用いた凸および非凸な連合学習:ステップサイズを減衰させるだけで十分 [math.OC, cs.LG]目的:遅延勾配モデル下における分散型確率的最適化
    • 機械学習モデルの学習において,大規模データセットを分散処理する重要性が増している。
    • エージェント間の通信遅延が,学習の収束速度や精度に悪影響を与える可能性がある。
    • 遅延のある環境下でも効率的な学習を可能にするステップサイズ戦略を確立すること。
    • 事前設定された減衰ステップサイズが,適応的なスキームと同等の性能を発揮することが示された。
    • この分析により,減衰ステップサイズが非凸および強凸な目的関数に対して最適なSGDレートを回復することが明らかになった。
    • 遅延勾配モデル下での分散型最適化において,ステップサイズの調整が重要であることが確認された。

    Link: https://arxiv.org/abs/2603.02639

  • カテゴリ変数入力モデルに対する厳密な機能ANOVA分解 [quant-ph, cs.CC, stat.ML, cs.LG]目的:カテゴリ変数入力モデルにおける機能ANOVA分解
    • モデルの解釈可能性は重要であり,予測の根拠を理解することは不可欠である。
    • 一般的な従属分布に対する閉じた形の分解式が存在せず,近似計算に頼る必要があった。
    • カテゴリ変数入力モデルに対する厳密で効率的な機能ANOVA分解を提供する。
    • 本研究により,追加の仮定なしに閉じた形の分解式が導出され,計算効率が大幅に向上した。
    • 古典的な独立なケースをシームレスに復元し,非矩形サポートを持つ分布を含む任意の依存構造に拡張できる。
    • 独立性下でのSHAPとANOVAの関係を利用し,一般的なカテゴリ設定におけるSHAP値の自然な一般化を可能にする。

    Link: https://arxiv.org/abs/2603.02673

  • ニューラル量子サポートベクタデータ記述による一類分類 [quant-ph, cs.LG]目的:一類分類のためのニューラル量子サポートベクタデータ記述
    • 異常検知や品質管理など,機械学習の重要な課題であり,実用的な応用範囲が広い。
    • 現代のデータセットは複雑化,高次元化しており,表現力と効率性を両立した手法が求められている。
    • 非線形な特徴変換を学習し,高次元空間での効率的な表現と潜在空間への写像を最適化する。
    • 提案手法NQSVDDは,古典的なDeep SVDDや量子ベースラインと比較して,同等または優れたAUC性能を達成した。
    • パラメータ効率を維持しつつ,現実的なノイズ条件下でも堅牢な性能を示した。
    • ニューラルネットワーク,量子データエンコーディング,変分量子回路を統合したハイブリッドなフレームワークである。

    Link: https://arxiv.org/abs/2603.02700

  • ChemFlow:化学混合物における多スケール表現学習のための階層型ニューラルネットワーク [quant-ph, cs.DC, cs.ET, physics.chem-ph, cs.LG]目的:化学混合物の物性予測
    • 化学製品開発や材料設計において,混合物の物性予測は不可欠である。
    • 分子間相互作用と混合組成を同時に考慮する必要があり,既存手法では現実的な環境の再現が困難である。
    • 原子レベルから分子レベルまでの階層的な相互作用を捉え,組成に応じた情報交換を可能にする。
    • ChemFlowは,原子,官能基,分子レベルの特徴を統合する階層的フレームワークであり,複雑な化学混合物の挙動予測を可能にする。
    • Chem-embedモジュールにより,混合状態と原子特性の影響を受けた文脈を考慮した原子表現を生成する。
    • 濃度依存性の物性予測において,既存モデルを大きく上回り,高い精度と効率を示す。

    Link: https://arxiv.org/abs/2603.02810

  • 認知機能障害検出のための自己教師あり音響表現におけるバイアスと公平性 [eess.AS, cs.LG]目的:認知機能障害の検出におけるバイアス分析と公平性の評価
    • 音声による認知機能障害の検出は,侵襲性のない早期診断法として期待されている。
    • 人口統計学的および臨床的サブグループ間での性能格差が未解明であり,公平性と一般化可能性への懸念がある。
    • 音響表現におけるバイアスを分析し,サブグループ間での性能格差を明らかにすること。
    • 認知機能障害検出において,Wav2Vec 2.0の高層embeddingsは従来の音響特徴量を上回り,UARは最大80.6%を達成した。
    • しかし,女性および若年層の参加者において識別力が低く,特異度にも大きな差が見られた。
    • 認知機能障害と抑うつ症の分類間におけるタスク間の一般化は限定的であり,それぞれのタスクで異なる表現が用いられていることが示唆された。

    Link: https://arxiv.org/abs/2603.02937

  • スパースオートエンコーダが明らかにするシングルセル基盤モデルにおける整理された生物学的知識と最小限の制御論理:GeneformerとscGPTの比較アトラス [q-bio.GN, cs.LG, q-bio.CB]目的:シングルセル基盤モデルにおける生物学的知識と制御論理の構造
    • シングルセルデータ解析は,生命現象の理解に不可欠であり,その複雑さを解き明かす鍵となる。
    • 既存の基盤モデルは共起情報を学習するものの,因果的な制御メカニズムを正確に捉えきれていない。
    • スパースオートエンコーダを用いてモデルの内部表現を解析し,生物学的知識と制御論理の存在を検証する。
    • GeneformerとscGPTの残差ストリームにスパースオートエンコーダを適用し,それぞれ82525件と24527件の表現特徴のアトラスを構築した。
    • アトラスは,遺伝子オントロジーなどの生物学的データベースとの関連性を示し,階層的な抽象化構造が確認された。
    • しかし,ゲノム規模のCRISPRiデータを用いた検証では,転写因子と標的遺伝子の特異的な応答は限定的であり,モデル表現がボトルネックとなっていることが示唆された。

    Link: https://arxiv.org/abs/2603.02952

  • 量子アニーリングのためのCNN分類器の層ごとのQUBOベース学習 [quant-ph, cs.AI]目的:CNN分類器の学習フレームワーク
    • 画像認識分野では,高性能な分類モデルが求められており,計算資源の効率化が課題である。
    • 従来の量子回路学習は,バレンプレートゥの問題や計算量の増加により,実用化が困難であった。
    • 量子アニーリングを用いて,古典的なCNN分類器の最終層を効率的に学習することを目指す。
    • 提案手法は,特徴量グラム行列を用いた凸二次近似により,安定した学習を可能にする。
    • 問題の規模は画像解像度とビット精度に依存し,学習サンプル数には依存しない。
    • MNIST,Fashion-MNIST,EMNIST等のデータセットで,古典的な確率的勾配降下法と同等またはそれ以上の精度を達成した。

    Link: https://arxiv.org/abs/2603.02958

  • 格子QCD観測量の分散低減:正規化フローの利用 [hep-lat, cs.LG]目的:格子QCDにおける観測量の分散低減手法
    • 素粒子物理学の標準模型の非摂動的な側面を研究する上で不可欠な格子QCD計算の効率化。
    • 格子QCD計算では,統計的誤差が大きく,高精度な結果を得るには計算コストが課題となる。
    • 正規化フローを用いて,観測量の分散を低減し,計算コストを削減することを目指す。
    • 正規化フローを用いることで,グルーオン演算子挿入を含むSU(3)ヤング・ミルズ理論および2フレーバーQCDにおける観測量の分散を10~60倍低減することに成功した。
    • グルーボール相関関数やハドロン構造に関わるグルーオン行列要素において,計算上の利点が示された。
    • 分散低減は格子体積に依存しないため,体積移行により学習コストを最小化できることが示唆された。

    Link: https://arxiv.org/abs/2603.02984

  • 因果推論のための一般化ベイズ法 [math.OC, cs.SY, eess.SY, stat.ML, cs.LG]目的:因果効果のベイズ推論
    • 因果推論は,医療,経済,政策決定など,様々な分野で不可欠な役割を果たす。
    • 従来のベイズ法では,データ生成過程の確率モデルの指定が必要であり,モデル選択への依存性が高い。
    • モデル選択に依存せず,因果効果の推定値に直接事前分布を置くことで不確実性を定量化すること。
    • 本研究では,明示的な尤度モデリングを回避し,因果推定量に直接事前分布を置く一般化ベイズ枠組みを提案する。
    • この枠組みにより,既存の損失関数に基づく因果推定量が,完全な不確実性定量を備えた推定量へと変換される。
    • 提案手法は,様々な因果推定量(ATE,CATEなど)に適用可能であり,実証実験により校正された不確実性を持つ因果効果推定が可能であることを示した。

    Link: https://arxiv.org/abs/2603.03035

  • QFlowNet:生成フローネットワークによる高速・多様・効率的なユニタリー合成 [quant-ph, cs.AI]目的:ユニタリー行列の量子ゲートの系列への分解
    • 量子計算の発展には,効率的な量子回路の構築が不可欠であり,ユニタリー合成はその重要な要素である。
    • 従来の強化学習アプローチは,疎な報酬信号や,解の多様性の欠如といった課題を抱えている。
    • 疎な信号からの効率的な学習と,多様な解の探索を可能にする新たな手法の開発。
    • QFlowNetは,生成フローネットワークとTransformerを組み合わせることで,高速かつ多様なユニタリー合成を実現した。
    • 3量子ビットのベンチマークにおいて,99.7%という高い成功率を達成し,コンパクトな回路の多様な集合を発見した。
    • これにより,QFlowNetは効率的で多様なユニタリー合成のパラダイムとして確立された。

    Link: https://arxiv.org/abs/2603.03045

  • 到達可能性から学習可能性へ:量子ニューラルネットワークの幾何学的設計原理 [quant-ph, cs.LG, hep-ex, hep-ph, stat.ML]目的:量子ニューラルネットワークにおける特徴学習能力の幾何学的基盤
    • 深層学習の成功は,データの幾何学的変形能力に起因する。量子ニューラルネットワークでも同様の機能が必要。
    • 量子ニューラルネットワークにおいて,深さや状態の到達可能性だけでは特徴学習が保証されないという課題がある。
    • データと学習可能な重みの間の非自明な依存関係を確立し,幾何学的な制御可能性を実現する。
    • 古典的-Lie代数写像(CLA)とほぼ完全な局所選択性(aCLS)の基準を導入し,幾何学的な柔軟性の条件を明確にした。
    • データに依存しない学習可能なユニタリー変換は完全だが選択性がなく,固定された変形に対してデータエンコーディングは選択的だが調整不可能であることが示された。
    • aCLSを満たすデータ再アップロードモデルが,ゲート操作数を大幅に削減しながら,調整不可能なスキームを上回ることが数値例で検証された。

    Link: https://arxiv.org/abs/2603.03071

  • ブラックボックス密度ベースクラスタリングにおけるスケーラブルな不確実性定量化 [stat.ML, cs.LG]目的:クラスタリングにおける不確実性の定量化
    • データ分析において,クラスタリングはデータの構造理解に不可欠である。
    • 従来のクラスタリング手法では,結果の不確実性が十分に考慮されない場合がある。
    • 密度推定の不確実性をクラスタリング構造へ伝播させることで,より信頼性の高いクラスタリングを実現する。
    • マルチンゲール事後分布と密度ベースクラスタリングを組み合わせた新しいフレームワークを提案した。
    • 提案手法は,ニューラル密度推定器とGPU並列計算により,高次元かつ不規則な形状のデータに対しても効率的にスケールする。
    • 頻度主義的な一貫性保証を確立し,合成データおよび実データでの有効性を検証した。

    Link: https://arxiv.org/abs/2603.03188