arXiv雑要約

AI - 2026/04/30 公開

ハンケル構造センシングと分解による超解像多信号到来方向推定 [cs.DC, quant-ph, cs.LG, eess.SP]目的：超解像多信号到来方向推定の新しい枠組み
- 現代の自律システムにおけるセンシングの重要性が増しており，高精度なDoA推定が求められている。
- 大規模アレイにおける空間サンプリングの制約や，限られたコヒーレンス時間による性能低下が課題である。
- 制約のある環境下でも，高精度かつ迅速なDoA推定を可能にすることを目指す。
- 提案手法は，白色ガウスノイズ下で最大尤度推定に最適であることが示された。
- 独立同一分布のラプラスノイズ下では，インパルス性干渉や破損した測定に対して高いロバスト性を持つ。
- シミュレーションにより，既存手法と比較して優れた超解像能力が確認された。
Link: https://arxiv.org/abs/2604.26793
Bian Que：オンラインシステム運用における柔軟なスキル配置のためのエージェント的フレームワーク [eess.SY, cs.SY, eess.SY, cs.SY, cs.AI, cs.MA]目的：大規模オンラインシステム運用における異常検知，原因究明，リリース監視の自動化
- オンラインシステムの規模拡大に伴い，運用保守の負担が増大しており，自動化が急務である。
- 従来のLLMエージェントは推論能力よりも，適切なデータと知識の選択・編成が課題であった。
- イベントに対応するデータと知識のマッピングを自動化し，運用負荷を軽減することを目指す。
- Bian Queは，運用パターンを３つに抽象化し，柔軟なスキル配置を可能にするフレームワークである。
- KuaiShouのeコマース検索エンジンへの導入により，アラート発生件数を75％削減，原因究明の精度を80％達成した。
- 平均解決時間を50％以上短縮し，オフライン評価では99.0％の合格率を記録した。
Link: https://arxiv.org/abs/2604.26805
ViCrop-Det：空間的注意エントロピーによるクロッピングを用いた学習不要な小物体検出 [cs.CV, cs.AI]目的：小物体検出における性能向上
- 自然画像における空間的異質性が課題であり，特に微小な物体が存在する領域での特徴劣化が問題となっている。
- Transformerアーキテクチャは優れた性能を示すが，均一な受容野が情報密度の低い領域では効率が悪く，特徴が失われやすい。
- 空間的注意エントロピーに基づき，物体が存在する可能性の高い領域に計算資源を集中させることで，特徴劣化を防ぎ，検出精度を向上させる。
- ViCrop-Detは，RT-DETR-R50やDeformable DETRに対して，mAP@50を1-3%改善する性能を示した。
- MS COCOデータセットでは，小物体に対するAPが向上し，中・大型物体に対するAPは維持された。
- 計算資源が限られた状況下でも，ViCrop-Detは均一なクロッピングと比較して，精度と速度のバランスに優れた性能を発揮した。
Link: https://arxiv.org/abs/2604.26806
3Dニューロイメージ分類のための複数インスタンス学習のマルチデータセットベンチマーク [cs.LG]目的：3Dニューロイメージ分類における複数インスタンス学習，3D CNN，3D ViTの性能比較
- 医療画像解析において，CTやMRIスキャンからの正確な病変分類は臨床診断において不可欠である。
- 3D CNNは高い性能を示すものの，学習に膨大な計算資源と時間を要する点が課題である。
- 限られた計算資源でも効率的に高性能な分類モデルを構築するための手法を確立すること。
- シンプルな平均プーリングを用いたMILが，中規模データセットの4/6において既存のMILや3D CNNと同等以上の性能を示した。
- 平均プーリングMILは，大規模データセットにおいても競争力のある性能を維持しつつ，学習時間が25倍高速であった。
- スライスごとの注意メカニズムの質や半合成データセット分析から，既存のMILアプローチの限界と今後の改善方向性が示唆された。
Link: https://arxiv.org/abs/2604.26807
非同期フェデレーテッド・アンラーニング：不変量校正による医療画像への応用 [cs.LG]目的：医療画像における，データ削除の影響を完全に除去する非同期フェデレーテッド・アンラーニング手法
- データ保護規制の高まりから，学習済みモデルからのデータ完全削除が重要になっている。
- 従来の同期型アンラーニングは，デバイスの遅延により全体の処理時間が長くなる問題があった。
- 非同期処理と不変量校正により，効率的かつ信頼性の高いデータ削除を実現する。
- 提案手法AFU-ICは，同期型ベースラインと比較してウォールクロックレイテンシを大幅に削減した。
- AFU-ICは，データ削除の効果とモデルの忠実度において，再学習と同等の性能を達成した。
- 本手法は，クロスサイロの医療環境において，効率的，コンプライアンス，かつ信頼性の高いフェデレーテッド学習を可能にする。
Link: https://arxiv.org/abs/2604.26809
最大マージングラフカットを用いた半教師あり学習 [cs.LG]目的：半教師あり学習のためのアルゴリズム
- 機械学習において，ラベル付けされたデータは限られている場合が多い。
- 限られたラベルデータから効果的に学習する方法が課題である。
- 調和関数解に基づくラベルとのマージンを最大化するグラフカットを学習する。
- 提案手法は，既存の多様体正則化SVMと比較して，多くの場合に良好な性能を示す。
- 合成問題とUCI MLリポジトリの3つのデータセットで評価された結果，良好な結果が得られた。
- 汎化誤差に関する理論的な上限も証明された。
Link: https://arxiv.org/abs/2604.26818
空間的交配機構による身体性進化を特徴とするARIELロボティクスシステムの個体群動態 [cs.AR, cs.DC, cs.NE]目的：空間的配偶を伴う身体性進化アルゴリズムにおける個体群動態
- ロボットの自律進化は，複雑な環境に適応可能なロボット開発に不可欠である。
- 空間構造が進化ダイナミクスに及ぼす影響は十分に解明されていない。
- 空間的交配機構が個体群の進化に与える影響を明らかにすること。
- 近接ペアリングとランダムペアリングのピークフィットネスにはわずかな差が見られたが，統計的変動範囲内と考えられる。
- 空間的親選択と確率的死亡選択を組み合わせると，不安定な個体群動態が生じる。
- エネルギーに基づく選択実験では，個体数激増と絶滅を分ける臨界ゾーン数を持つ連続的な相転移が発見された。
Link: https://arxiv.org/abs/2604.26822
ランダムクラウド：訓練なしでの最小限のニューラルアーキテクチャの探索 [cs.LG, cs.AI]目的：ニューラルアーキテクチャの探索
- 深層学習モデルの性能向上には，最適なネットワーク構造の設計が不可欠である。
- 従来のアーキテクチャ探索は，計算コストが高く，時間と資源を要する。
- 訓練を必要としない，効率的なアーキテクチャ探索手法を確立すること。
- ランダムクラウドは，7つの分類ベンチマークにおいて，Magnitude PruningやRandom Pruningを上回る，または同等の性能を示した。
- 特にSonarデータセットでは，Magnitude Pruningと比較して，4.9ポイントの精度向上（p=0.017）を達成し，パラメータを87％削減した。
- 本手法は，5つのデータセット中4つにおいて，フルサイズのネットワークの訓練を避けることで，既存のプルーニング手法よりも高速であった。
Link: https://arxiv.org/abs/2604.26830
限られたシミュレーション訓練下における探索・救助UAVミッションのためのルールベースの高レベルコーチング [cs.RO, cs.AI, cs.LG]目的：目標条件付き強化学習におけるルールベースの高レベルコーチングの枠組み
- 災害時の迅速な救助活動において，UAVの自律的な活用は不可欠である。
- シミュレーション環境の構築が困難な場合が多く，十分な訓練データが得られないという課題がある。
- 限られた訓練データでも安全かつ効率的にUAVが任務を遂行できる手法を開発する。
- 提案手法は，衝突による失敗を減らすことで，初期の安全性とサンプル効率を向上させた。
- 高レベルコーチングにより，解釈可能なミッションおよび安全性を考慮したガイダンスを提供した。
- タスク固有の動的環境へのオンライン適応能力を維持しながら，上記の改善を実現した。
Link: https://arxiv.org/abs/2604.26833
HalluCiteChecker：AI研究者時代の幻覚的な引用検出と検証のための軽量ツールキット [cs.CL, cs.AI, cs.DL]目的：科学論文における幻覚的な引用の検出と検証
- 学術研究の信頼性は重要であり，正確な引用は不可欠である。
- AIアシスタントの普及により，存在しない引用が混入する問題が生じている。
- 幻覚的な引用の自動検出・検証により，レビューアの負担軽減を目指す。
- HalluCiteCheckerは，科学論文における幻覚的な引用を検出・検証するためのツールキットである。
- 本ツールキットは軽量であり，標準的なラップトップで数秒以内に検証が可能である。
- オフラインで動作し，CPUのみで効率的に実行できる。
Link: https://arxiv.org/abs/2604.26835
確率的ニューラルネットワークダイナミクスに対する不確実性認識型予測安全性フィルタ [cs.LG, cs.SY, eess.SY]目的：深層強化学習における探索時の制約充足
- 強化学習において，安全性を確保しつつ効率的に学習を進めることは重要である。
- 従来の予測安全性フィルタは，モデルの規模や適用範囲に限界があった。
- 確率的アンサンブルを用いた予測モデルの不確実性を考慮し，安全性を高める。
- 本研究で提案するUPSiは，到達可能集合を用いて安全性を厳密に予測する。
- UPSiは，モデルの過剰利用を防ぐ確実性制約を導入し，既存のMBRLフレームワークに統合可能である。
- 標準的なsafe RLベンチマークにおいて，従来のニューラルネットワークPSFと比較して探索の安全性が大幅に向上した。
Link: https://arxiv.org/abs/2604.26836
スケーラブルな長文コンテキストLLMサービングのための，スパース注意機構と階層型メモリの統合 [cs.LG]目的：長文コンテキストLLMサービングにおけるスループット向上とコスト削減
- LLMの性能向上には，より長いコンテキストを処理できる能力が不可欠である。
- 既存のスパース注意機構は，システムレベルでの効率化が難しく，GPU-CPU間のデータ転送がボトルネックとなる。
- スパース注意機構と階層型メモリを協調設計することで，LLMサービングの効率を大幅に向上させる。
- SPINは，異なるスパース注意機構を統一的なページベースのKVサブストレートにマッピングする。
- リクエスト毎のHBMバジェットを動的に調整し，GPUフレンドリーなバケット化されたLRUポリシーを採用することで，PCIeラウンドトリップを削減する。
- アクティブなワーキングセットに合わせて設計された二層階層型メタデータレイアウトにより，スループットを最大5.66倍，TTFTを最大9倍低減する。
Link: https://arxiv.org/abs/2604.26837
言語拡散モデルは，未学習データも想起可能な連想記憶である [cs.RO, cs.LG, cs.AI, cs.CL]目的：言語拡散モデルにおける記憶と生成能力のメカニズム解明
- 大規模言語モデルの性能向上に伴い，その内部メカニズムの理解が不可欠となっている。
- 言語モデルが学習データを暗記している可能性と，真の生成能力の評価方法が課題となっていた。
- 拡散モデルが連想記憶として機能し，記憶と生成の転移を定量的に捉えることを目指す。
- Uniform-based Discrete Diffusion Models (UDDMs) は，連想記憶（AM）と類似の振る舞いを示すことが明らかになった。
- 学習データサイズが増加すると，学習データ周囲の引力盆地が縮小し，未学習データ周囲の引力盆地が拡大する転移が確認された。
- 予測トークン列の条件付きエントロピーを用いることで，記憶から一般化への転移を検出できることが示された。
Link: https://arxiv.org/abs/2604.26841
履歴書選考におけるGenAI利用に関する主体性の認識：採用ワークフローをめぐって [cs.RO, cs.CY, cs.AI]目的：採用ワークフローにおけるGenAI利用を通じた主体性とコントロールに関する認識
- 採用活動は企業の重要な意思決定に関わるため，公平性と質の確保が不可欠である。
- GenAIが意思決定プロセスに組み込まれる中で，人間の主体性がどのように影響を受けるか不明である。
- 採用担当者がGenAI利用下で感じる主体性の変化と，その影響を明らかにすること。
- 採用担当者は最終的な権限を持つと認識している一方，GenAIが評価情報の基礎を形作る「見えない設計者」となっている。
- GenAIの導入は，上層部からの指示や，応募者のAI利用への対抗，生産性向上といった外部要因に左右されることが多い。
- GenAI導入後の効率向上は限定的であり，採用担当者のスキル低下を招き，意思決定の適切な監督が危惧される。
Link: https://arxiv.org/abs/2604.26851
自動車用脆弱道路利用者安全のためのエッジAI：知識蒸留による展開可能な検出 [cs.CV, cs.LG, cs.RO, eess.IV]目的：脆弱道路利用者の安全確保のための，エッジデバイスでの物体検出
- 自動車の安全運転支援システムにおいて，歩行者等の脆弱道路利用者の早期発見は不可欠である。
- エッジデバイスでのAIモデル実行には計算資源の制約があり，高精度モデルの搭載が困難である。
- 知識蒸留により，軽量なモデルでも高精度を維持し，エッジデバイスでの利用を可能にすること。
- 知識蒸留フレームワークにより，YOLOv8-SモデルをYOLOv8-Lモデルの知識で学習することで，3.9倍のモデル圧縮を実現した。
- INT8量子化下において，教師モデルが大幅に性能劣化するのに対し，生徒モデルは精度低下を抑制することに成功した。
- 知識蒸留は，検出能力だけでなく，精度の校正を転移することで誤検知を削減し，安全性を向上させる。
Link: https://arxiv.org/abs/2604.26857
MoRFI：単調スパースオートエンコーダ特徴識別 [eess.SY, cs.SY, math.AP, cs.CL, cs.LG]目的：言語モデルにおける幻覚の因果的寄与方向の特定
- 大規模言語モデルは事前学習で知識を獲得するが，その知識の信頼性が課題となっている。
- ファインチューニングによる知識の追加が，幻覚を悪化させるメカニズムが不明である。
- ファインチューニングデータに含まれる未知の事実が，知識想起能力に与える影響を特定する。
- ファインチューニングで新たな知識を導入すると，幻覚が増加し，学習期間が長くなるほどその傾向が強まることが確認された。
- 事前学習済みのスパースオートエンコーダとMoRFIを用いることで，幻覚に因果的に寄与する潜在方向を特定できた。
- 未知の事実への暴露は，残差ストリーム内の特定の方向における知識の想起を阻害することが示された。
Link: https://arxiv.org/abs/2604.26866
KAYRA：AI支援核型分析のためのマイクロサービスアーキテクチャ - クラウドとオンプレミスでの展開 [cs.LG, cs.CV]目的：AI支援核型分析システムの開発
- 核型分析は，遺伝性疾患やがんの診断において重要な役割を担う検査である。
- 従来の核型分析は熟練した専門家による手作業に依存しており，時間と労力がかかる。
- 本研究では，AIを活用した核型分析システムをマイクロサービスアーキテクチャで構築し，柔軟な展開を可能とする。
- KAYRAは，セグメンテーション精度98.91%，分類精度89.1%を達成し，従来の密度閾値法や既存のAIシステムと比較して有意に高い性能を示した。
- 特に，セグメンテーション精度において，既存のAIシステムに対しても統計的に有意な改善が見られた。
- KAYRAは，臨床現場での専門家によるレビューワークフローと統合されており，実用レベル6（TRL 6）に達している。
Link: https://arxiv.org/abs/2604.26869
ArchEHR-QA 2026におけるHealthNLP_Retrievers：根拠に基づいた臨床質問応答のためのカスケードLLMパイプライン [cs.CL, cs.LG]目的：電子カルテからの根拠に基づいた臨床質問応答
- 患者が自身の医療情報を理解し活用するためには，アクセス性だけでなく情報の解釈支援が重要である。
- 電子カルテの複雑性により，患者自身が情報を理解し，適切な行動につなげることが困難である。
- LLMを活用したパイプラインを構築し，患者の質問に対する正確で質の高い回答を生成すること。
- 提案手法は，質問解釈において1位，回答生成で5位，証拠特定で7位，回答-証拠アライメントで9位を獲得した。
- LLMを構造化された多段階パイプラインに統合することで，根拠の明確化，精度向上，そしてプロフェッショナルな医療コミュニケーションの質の向上が確認された。
- 本研究の成果は，患者向け医療コミュニケーションの改善に貢献すると期待される。
Link: https://arxiv.org/abs/2604.26880
FaaSMoE：マルチテナント向け混合エキスパートサービングのためのサーバーレスフレームワーク [cs.DC, cs.LG]目的：マルチテナント混合エキスパートモデルの効率的なサービング
- 大規模言語モデルの能力向上と，その推論コストの最適化が求められている。
- 混合エキスパートモデルは資源の浪費が生じやすく，特にマルチテナント環境でその傾向が顕著である。
- FaaSを活用し，エキスパートをオンデマンドで呼び出すことで資源利用効率を高める。
- FaaSMoEは，従来のフルモデルベースラインと比較して，資源使用量を3分の1以下に削減した。
- FaaS上に構築されたFaaSMoEは，エキスパートのステートレスな関数としてのデプロイメントを実現した。
- FaaSMoEは，テナント間での資源共有と，スケーラビリティの高いMoEサービングを可能にする。
Link: https://arxiv.org/abs/2604.26881
構造化データと非構造化データのための多重加法ニューラルネットワーク [cs.LG]目的：構造化データと非構造化データに対応可能な多重加法ニューラルネットワークの有効性
- 機械学習分野において，多様なデータ型への対応は重要な課題である。
- 従来の勾配ブースティング法は，データ型によっては性能が制限される場合がある。
- 本研究は，ニューラルネットワークを活用し，多様なデータ型に対応可能なモデルを提案する。
- 提案手法MANは，構造化データにおいて，従来のXGBoostを精度面で上回る結果を示した。
- CNNやカプセルニューラルネットワークといったアーキテクチャを組み合わせることで，画像や音声などの非構造化データにも適用可能である。
- MANのアーキテクチャは継続学習を促進し，過学習を防ぐための高度なヒューリスティクスを組み込んでいる。
Link: https://arxiv.org/abs/2604.26888
ClawGym：効果的なクローエージェント構築のためのスケーラブルなフレームワーク [cs.RO, cs.SY, eess.SY, eess.SY, cs.RO, cs.SY, cs.CL, cs.AI, cs.LG]目的：クローエージェント開発ライフサイクルを支援するスケーラブルなフレームワーク
- ローカルファイルやツールを扱うエージェントの重要性が増しており，効率的な開発手法が求められている。
- 既存の手法では，検証可能な訓練データ生成や，訓練と診断評価の統合が困難であった。
- 訓練データ生成，エージェント訓練，評価のプロセス全体を効率化し，開発を加速させる。
- ClawGymは，13.5Kの多様なタスクデータセット(ClawGym-SynData)を構築し，エージェント訓練に活用した。
- 教師ありファインチューニングや強化学習パイプラインを通じて，高性能なクローエージェント(ClawGym-Agents)を開発した。
- 自動フィルタリングと人間・LLMレビューにより校正されたベンチマーク(ClawGym-Bench)を構築し，信頼性の高い評価を実現した。
Link: https://arxiv.org/abs/2604.26904
ニューラルアセンブリによる因果学習 [cs.LG, cs.AI, cs.NE]目的：因果関係性の学習
- 脳の働きを理解する上で，因果関係の学習メカニズムの解明は重要である。
- 既存の研究では，ニューラルアセンブリが因果の方向性を内部化できるかは不明であった。
- ニューラルアセンブリのメカニズムだけで因果関係の方向性を学習できることを示す。
- ニューラルアセンブリの投影，局所的な可塑性制御，スパース勝者選択といった基本的な操作で，方向性学習が可能であることが示された。
- DIRECTというメカニズムを導入し，ソースとターゲットのアセンブリを適応的なゲインスケジュール下で共同活性化することにより，指向性関係を内部化することに成功した。
- シナプス強度非対称性や機能的伝播の重複といった検証戦略により，ニューラルアセンブリが生物学的に妥当なダイナミクスと形式的な因果モデルを結びつけることが確認された。
Link: https://arxiv.org/abs/2604.26919
収益最大化の学習曲線について [cs.LG, cs.DS, cs.GT, stat.ML]目的：収益最大化における学習曲線の特性
- 機械学習において，学習曲線はアルゴリズムの汎化性能を測る上で不可欠である。
- 収益最大化アルゴリズムの学習曲線は，最悪の場合の分布に依存しており，その形状を捉えられていない。
- 本研究は，単一アイテム・単一買い手という基本的な設定で学習曲線の減衰率を明らかにすることを目指す。
- 分布に制限がない場合，任意の分布に対して学習曲線がゼロに収束するアルゴリズムが存在する。
- しかし，その収束は非常に遅くなる可能性があり，最適な収益が有限である場合でも同様である。
- 最適な収益が有限の価格で達成される場合，最適な減衰率は概ね $1/\sqrt{n}$ である。
Link: https://arxiv.org/abs/2604.26922
Squint Boundにおける$\ln\ln T$項の除去方法について [cs.LG, math.OC, stat.ML]目的：Squintアルゴリズムのデータ非依存型限界における$\ln\ln T$項の除去
- 機械学習理論の発展には，アルゴリズムの学習効率評価が不可欠である。
- 学習限界の解析において，$\ln\ln T$項がボトルネックとなり，精度向上が課題となっている。
- $\ln\ln T$項を除去し，よりタイトな学習限界を得ることを目指す。
- シフトされたKTポテンシャルを用いることは，Krichevsky--Trofimovアルゴリズムにおける事前分布の変更と等価である。
- 同様のアイデアをSquintアルゴリズムに適用することで，データ非依存型限界から$\ln\ln T$項を除去できる。
- これにより，Squintアルゴリズムの性能評価において，より正確な理論的保証が可能となる。
Link: https://arxiv.org/abs/2604.26926
形状制約学習と最適輸送のためのハイパー入力凸ニューラルネットワーク [cs.HC, cs.CL, cs.LG, math.ST, q-bio.GN, stat.ME, stat.ML, stat.TH]目的：凸関数の学習
- 機械学習において，複雑な関数を効率的に近似することは重要な課題である。
- 既存のニューラルネットワークは凸性を保証せず，学習が不安定になる場合がある。
- 入力に関して常に凸性を保つニューラルネットワークを開発し，その性能を向上させる。
- HyCNNは，ICNNと比較して，同じ精度の2次関数を近似するために指数関数的に少ないパラメータで済むことが証明された。
- 合成実験の結果，HyCNNは凸回帰および補間タスクにおいて，既存のICNNやMLPよりも優れた予測性能を示した。
- HyCNNは，高次元の最適輸送マップ学習において，ICNNベースの手法や他のベースライン手法を上回る性能を示した。
Link: https://arxiv.org/abs/2604.26942
拡散大規模言語モデルのクロスアーキテクチャ蒸留：TIDE [cs.CL, cs.AI, cs.LG]目的：拡散大規模言語モデルにおけるクロスアーキテクチャ知識転移
- 拡散言語モデルは並列デコードと双方向コンテキストが可能であり，自然言語処理の進歩に貢献する。
- 最先端モデルはパラメータ数が多く，計算コストが高いという課題がある。
- 異なるアーキテクチャ間の知識蒸留により，軽量なモデルでも高性能を実現することを目指す。
- TIDEフレームワークは，蒸留強度調整，コンテキスト補強，クロス・トークナイザー目的関数により，効率的な知識伝達を実現する。
- 8Bおよび16Bの教師モデルから0.6Bの生徒モデルへ蒸留した結果，8つのベンチマークで平均1.53ポイントの性能向上を示した。
- 特にコード生成において顕著な改善が見られ，HumanEvalスコアはARベースラインの32.3に対して48.78に達した。
Link: https://arxiv.org/abs/2604.26951
開発者による内部AIモデル利用に関するリスク報告 [cs.CY, cs.AI]目的：内部AIモデル利用に伴うリスクの報告基準の標準化
- AI技術の急速な発展に伴い，安全性の確保が不可欠であるため。
- 内部利用におけるリスクは外部展開フレームワークでは十分に捉えられない。
- 各規制フレームワークに対応したリスク報告の基準を提示し，リスク管理を促進する。
- 本研究では，内部AIモデル利用のリスク報告における脅威ベクトルとして，自律的なAIの誤動作と内部脅威の2つを特定した。
- 各脅威ベクトルに対し，実行可能性，動機，機会という3つのリスク要因に基づいた報告構造を提案している。
- 定期的な詳細なリスク報告は，リスクが顕在化する前に特定し管理するための重要な手段となりうる。
Link: https://arxiv.org/abs/2604.24966
SongBench：楽曲品質評価のための多角的詳細ベンチマーク [cs.CL, cs.IR, eess.AS, cs.AI, cs.SD]目的：楽曲品質の多角的詳細評価のためのフレームワーク
- 近年のテキストからの楽曲生成技術の発展に伴い，高品質な音楽コンテンツの自動生成が期待されている。
- 既存の評価ベンチマークは，楽曲の多面的な美的なニュアンスを捉える専門的な粒度が不足している。
- 既存モデルの性能差を明らかにし，より専門的で音楽的に一貫性のある楽曲生成の方向性を示す。
- SongBenchは，ボーカル，楽器，メロディ，構成，編曲，ミキシング，音楽性といった7つの主要な側面から楽曲を評価する。
- 専門家によるアノテーションが付与された11,717サンプルからなるデータベースを構築し，最先端モデルの評価に活用した。
- SongBenchは専門家の評価との高い相関性を示し，現在のモデルの改善点を明確に示すベンチマークとして機能する。
Link: https://arxiv.org/abs/2604.25937
双線形空間変換器を用いた平面ガウススプラッティングによる無線光度場再構成 [physics.comp-ph, cs.ET, eess.SP, cs.AI]目的：無線光度場の再構成
- 電波環境の３次元的な特性把握が重要であり，正確な空間電力スペクトル予測が求められている。
- 既存手法は画像処理パイプラインを流用しており，物理的な解釈性や精度に限界があった。
- 物理に基づいた平面ガウススプラッティングで，高精度な無線光度場再構成を実現すること。
- 提案手法BiSplat-WRFは，空間電力スペクトルの合成タスクにおいて，既存のNeRFやGSベースラインを上回るSSIMを実現した。
- 双線形空間変換器(BST)が，電磁波の長距離相互作用を捉え，無線環境の複雑な物理現象を反映していることが確認された。
- より高性能なBiSplat-WRF+は，更なるSSIM向上を示し，今後の研究の基準となる。
Link: https://arxiv.org/abs/2604.25945
NTKニューラルネットワークの敵対的頑健性 [stat.ML, cs.LG]目的：敵対的摂動に対するニューラルネットワークの頑健性の評価
- 安全性確保が求められる分野で深層学習の利用が進む中，その脆弱性が課題となっている。
- 敵対的攻撃に対する頑健性の理論的理解が十分ではなく，対策が遅れている。
- NTKニューラルネットワークの敵対的頑健性の限界と最適化条件の解明。
- NTKニューラルネットワークは，勾配流法と早期停止により，最適な頑健性を達成可能である。
- 過学習領域においては，最小ノルム補間解が敵対的摂動に脆弱であることが示された。
- ソボレフ空間における敵対的回帰のミニマックス最適レートが確立された。
Link: https://arxiv.org/abs/2604.25965
事後後悔に基づくマーケティング予算配分の監査 [quant-ph, cs.AR, econ.EM, cs.AI, cs.LG, q-fin.PM]目的：マーケティング予算配分の最適性評価
- マーケティング予算は戦略的に配分されるが，その効果測定は困難である。
- 予算配分の事後評価は，最適な選択肢との比較が難しく，課題が多い。
- 過去の予算配分を監査し，改善の余地を特定することを目指す。
- 本研究では，過去のデータを用いて実現可能な配分を最適化し，後悔の度合いを定量化するフレームワークを提案する。
- 実務データを用いた実験により，このフレームワークが解釈可能な診断情報を提供し，予算配分の柔軟性と検出可能性のトレードオフを明らかにした。
- オンライン実験が困難な状況下で，過去の予算決定を監査するための実用的な手法となることが示された。
Link: https://arxiv.org/abs/2604.25977
オッカムの剃刀は，あなたのELBOほど鋭いだけである [stat.ML, cs.LG]目的：過学習回避のためのモデル選択
- モデル選択において，過学習を防ぐことは重要である。
- 変分推論におけるELBOが，平均場近似により過小適合を引き起こす場合がある。
- ELBOを用いたハイパーパラメータ学習が，共分散行列のランクに依存して過学習を起こしうることを示す。
- ELBOに基づくモデル選択は，真の証拠と比較して，過学習を起こしたモデルを好まない場合がある。
- 簡略化のために必要な低ランク近似が，モデル選択の可能性に影響を与える可能性がある。
- 大規模モデルへの適用においては，近似手法による影響に注意が必要である。
Link: https://arxiv.org/abs/2604.25984
ブラックホール吸着コードに対するニューラル演算子サロゲート学習 [astro-ph.HE, cs.LG]目的：ブラックホール吸着シミュレーションの計算コスト削減とパラメータ探索の効率化
- ブラックホール吸着現象は，相対論的ジェットや磁気リコネクションの理解に不可欠であり，天体物理学において重要な研究テーマである。
- 高精度なGR-MHDシミュレーションは計算コストが非常に高く，広範なパラメータ空間を体系的に探索することが困難である。
- ニューラル演算子を用いることで，シミュレーションの代替モデルを構築し，計算コストを削減し，より効率的なパラメータ探索を実現する。
- 物理情報に基づいたPINOモデルは，Sweet-Parkerから高速リコネクション領域におけるOrszag-Tang渦のSRRMHD進化を再現し，プラズマイド形成を学習した。
- OFormer型Transformerニューラル演算子は，BHACで生成されたスピーン・シース相対論的ジェットの進化を学習し，適応メッシュ上での予測が可能となった。
- 適応メッシュ上での直接的な適用は，長系列データを扱う上で線形アテンションの必要性を示唆している。
Link: https://arxiv.org/abs/2604.25985
QERNEL：大規模電子モデル [quant-ph, cs.ET, cond-mat.str-el, cs.AI, cs.LG]目的：パラメータ化された多電子ハミルトニアンの族に対する変分解法
- 固体物理学において，電子相関の効果を正確に記述することは重要である。
- 従来の計算手法では，大規模な電子系に対する計算コストが課題となっている。
- 大規模な電子系に対して，効率的に電子状態を予測するモデルの構築を試みる。
- QERNELは，FiLMベースのパラメータ条件付けと効率的なアーキテクチャを組み合わせることで，低コストで高い表現力を実現した。
- 半導体モアレヘテロ二層における電子系への適用により，最大150電子のシステムを単一のモデルで学習することができた。
- モアレポテンシャルの深さに応じて量子液体と結晶状態を捉え，相互作用エネルギーと電荷密度の急激な変化を捉えた。
Link: https://arxiv.org/abs/2604.26018
深偽オーディオ検出のための教師ありコントラスティブ学習における類似度選択と負例スケーリング [math.MG, cs.CG, eess.AS, cs.LG]目的：深偽オーディオ検出のための表現学習
- 音声処理分野において，深偽オーディオの検出は重要な課題である。セキュリティやプライバシー保護の観点から，その重要性は増している。
- 既存の深偽オーディオ検出手法では，十分な精度を達成できない場合がある。特に，コントラスティブ学習に焦点を当てた研究は少ない。
- 本研究は，コントラスティブ学習における類似度関数と負例スケーリングが深偽オーディオ検出精度に与える影響を調査し，最適な設定を明らかにすることを目指す。
- wav2vec2 XLS-R(300M)を用いた実験により，コサイン類似度を用いたコントラスティブ学習が最も高いITW EER（8.29%）とpooled EER（4.44%）を達成した。
- 角度類似度を用いた場合，遅延キューを使用しないことで良好な結果が得られ，大規模な負例セットへの依存度を低減できることが示唆された。
- ステージ1でエンコーダと射影ヘッドをコントラスティブ学習で微調整し，ステージ2で線形分類器を訓練するアプローチが有効であることが確認された。
Link: https://arxiv.org/abs/2604.26057
明示的な環境モデリングによるロバストな表現学習 [math.CO, cs.DM, math.PR, stat.ML, cs.LG]目的：複数の環境で収集されたラベル付きデータからの学習
- 環境変化に対応した機械学習の重要性が増しているため。
- 従来の因果的アプローチでは，環境がターゲットに直接影響しないと仮定している。
- 環境の影響を考慮しつつ，未知の環境でもロバストな予測を可能にする表現学習を目指す。
- 本研究では，環境間の変動を明示的にモデル化し，その変動を取り除くことで，ロバストな表現学習を試みた。
- 提案手法は，一般化ランダム切片モデルに基づき，因果的invariant表現学習法よりも優れた汎化性能を示すことが示された。
- 様々な難易度の設定において，提案手法が既存手法を上回る性能を実証した。
Link: https://arxiv.org/abs/2604.26128
疎なデータからのフィードラー数の最大化による疎グラフ学習 [eess.SP, cs.LG]目的：疎なデータからの疎グラフの学習
- 信号処理や機械学習において，データ間の関係性を表すグラフ構造の学習は重要である。
- 観測データ数が信号次元よりも大幅に少ない場合，グラフ構造の学習は非常に困難である。
- フィードラー数の最大化により，疎なデータからロバストな疎グラフ構造を推定すること。
- フィードラー数（グラフの連結性を表す指標）を正則化項として導入した疎グラフ学習手法を提案した。
- 提案手法は，エッジ選択によって目的関数を減少させる貪欲アルゴリズムと，Cheegerの不等式に基づいた並列アルゴリズムを用いる。
- シミュレーション実験により，提案手法が既存手法よりもロバストな疎グラフ推定が可能であることが示された。
Link: https://arxiv.org/abs/2604.26132
機械学習原子間ポテンシャルにおけるエキスパート混合フレームワーク：原子シミュレーションへの応用 [eess.AS, cs.CL, physics.comp-ph, cond-mat.mtrl-sci, cs.LG]目的：原子シミュレーションにおける計算コスト削減のためのエキスパート混合フレームワーク
- 物質の複雑な現象理解に不可欠だが，計算資源に制約がある第一原理計算の代替手法として重要。
- 機械学習原子間ポテンシャルは精度向上に貢献するが，大規模システムや長時間スケール計算で推論コストが課題。
- 領域分割と協調学習により，モデル間の不整合を抑制し，高速かつ高精度なシミュレーションを実現する。
- 提案手法は，Pt+CO触媒システムにおいて，エネルギー保存則を維持し，体積弾性率などのバルク物性を一致させた。
- 協調学習により，高精度なシミュレーションと同等の予測精度を，2倍以上の計算速度で達成した。
- モデル間の界面における機械的な不整合を，エネルギーと力のずれに対するペナルティによって抑制した。
Link: https://arxiv.org/abs/2604.26143
変分期待最大化法を用いた大規模非線形混合効果モデルの適合 [stat.ME, cs.CE, cs.LG, cs.MS, stat.CO]目的：大規模非線形混合効果モデルの適合手法
- 階層的・縦断的データ解析において，薬物動態薬力学モデル等の幅広い分野で利用されている。
- パラメータ数やランダム効果が増加すると，周辺尤度を最大化する従来の計算コストが課題となる。
- 変分期待最大化法を用いることで，計算効率を向上させ，大規模モデルへの適用を可能とする。
- 変分期待最大化法は，確率的グラフィカルモデルや変分オートエンコーダ等で実績があり，非線形混合効果モデルへの応用は限定的であった。
- 柔軟な変分族と自動微分を活用することで，15,000を超える集団パラメータを持つモデルに対しても効率的に周辺尤度を最大化できる。
- Pumasソフトウェアを用いて，標準的なワルファリンモデルと，15,410の集団パラメータと16のランダム効果を持つDeepNLME Fribergモデルの適合実験を行った。
Link: https://arxiv.org/abs/2604.26160
高次元分布の読み込みのためのツタ構造量子回路：Qvine [quant-ph, cs.AI]目的：高次元分布の読み込み
- 量子コンピュータを機械学習や金融などに応用する上で，高次元分布の効率的な読み込みは不可欠である。
- 高次元分布は次元の呪いの影響を受けやすく，量子ビット数と回路の複雑さが増大し，学習が困難になる。
- 本研究は，ツタ構造を利用した量子回路により，高次元分布の読み込みを効率化し，学習性を向上させることを目指す。
- Qvineは，古典的なツタ分解を模倣した量子回路アプローチであり，スケーラブル性と学習効率を両立する。
- 特に，正規ツタ(R-vine)の場合，回路の深さは次元に対して二次関数，D-vineや実用的なR-vineでは一次関数で増加する。
- 3次元および4次元ガウス分布，および株式リターンの実証的な結合分布を用いた実験により，Qvineの高い読み込み精度が確認された。
Link: https://arxiv.org/abs/2604.26213
拡散に基づく韻律制御による音声匿名化 [eess.AS, cs.LG, cs.SD]目的：音声匿名化における韻律の制御
- 音声は個人を特定する情報を含むため，プライバシー保護が重要である。
- 既存手法では，プライバシー保護と音声の有用性のバランスが難しい。
- 拡散モデルを用いて，プライバシーと韻律維持のバランスを制御する。
- DiffAnonは，拡散モデルとClassifier-Free Guidance（CFG）を組み合わせ，推論時に韻律の保存度を連続的に制御する。
- RVQコーデックのセマンティック埋め込みを基に音響詳細を洗練させ，匿名化強度と韻律忠実度を滑らかに調整する。
- 実験により，制御可能な動作点で高い有用性と競合性のあるプライバシーを両立することが示された。
Link: https://arxiv.org/abs/2604.26281
構造物モニタリングデータに対する外れ値耐性条件付き拡散モデルによる確率的データ品質評価 [eess.AS, cs.CL, stat.ML, cs.LG]目的：構造物モニタリングデータのデータ品質評価
- 構造物の健全性維持には，信頼性の高いモニタリングデータが不可欠である。データ品質は，その信頼性を保証する上で重要。
- 既存手法では，外れ値の影響を受けやすく，データ品質の正確な評価が困難な場合がある。
- 外れ値に強く，時間的文脈を考慮したデータ品質評価手法を開発し，モニタリングデータの信頼性を向上させる。
- 提案手法は，条件付き拡散モデルとHuber損失関数により外れ値へのロバスト性を高め，データ品質評価の精度を向上させる。
- 実構造物のデータを用いたケーススタディにより，提案手法が既存のクラスタリング，外れ値検出，深層再構成手法を上回る性能を示すことが確認された。
- アブレーション実験とハイパーパラメータ分析により，提案手法の有効性と堅牢性が実証された。
Link: https://arxiv.org/abs/2604.26366
量子番人：VQCに基づく鍵導出と量子ハードウェアを用いた多要素コンテキスト結合型画像ステガノグラフィ [cond-mat.soft, cond-mat.mtrl-sci, cs.CE, math.CT, quant-ph, cs.AI, cs.CR]目的：多要素コンテキスト結合型画像ステガノグラフィの枠組み
- 情報セキュリティの重要性が増す中，データの秘匿技術は不可欠である。
- 既存のステガノグラフィは，鍵漏洩や文脈依存性の脆弱性が課題である。
- 量子技術を活用し，より堅牢な秘匿システムを構築することを目指す。
- 本手法は，パスワード，共有秘密，コンテキスト文字列，参照画像署名の四要素認証を義務付ける。
- これらの要素の不一致は，データの誤った読み込みまたは認証失敗につながり，情報漏洩を防ぐ。
- 量子回路と暗号学的ハッシュ拡張を組み合わせることで，決定的な成功または失敗を実現する。
Link: https://arxiv.org/abs/2604.26413
理想格子上の順序依存逐次介入 [math.CO, cs.LG]目的：前提条件制約下の逐次介入
- 因果推論において，介入順序が結果に影響を与える可能性が重要である。
- 介入順序の影響を理論的に評価する枠組みが十分に確立されていない。
- 理想格子という構造を利用し，介入順序の影響を厳密に分析する。
- 許容される介入経路は，有限の前提条件ポセットの理想格子上の経路として表現される。
- 経路価値がエッジ加法的である場合，経路独立性はダイヤモンド曲率が消失することと同値である。
- 局所的なダイヤモンド場は，エッジに基づく経路モデルによって誘導されるための条件が明らかになった。
Link: https://arxiv.org/abs/2604.26472
安全性が重要なアプリケーションにおける校正チェックのレシピ [stat.ME, cs.LG]目的：確率的予測の校正チェック手法
- 自動運転や医療など，安全性に関わる予測システムの信頼性確保が重要である。
- 予測の正確性のみ評価されることが多く，分布の特性の検証が不十分である。
- 予測誤差が予測分布に従っているか検証し，安全性評価を支援することを目的とする。
- 提案手法は，校正チェックを統計的検定として捉え，単一の合否判定を行う。
- 過信された予測のみを排除し，保守的な予測を許容する改良も導入している。
- データモデル，評価指標，仮説設定，検定手順から構成されるモジュール型パイプラインを構築した。
Link: https://arxiv.org/abs/2604.26479
基礎物理学，実存的リスク，そして人類の未来 [quant-ph, cs.AI, gr-qc]目的：物理学の根源的探求
- 物理学は自然界の根本原理を解明し，科学技術の進歩を支える基盤である。
- 量子理論と重力の関係，意識と物理法則の関連性など，未解決の問題が残されている。
- 量子理論を超える物理学の可能性を探り，AI開発への影響を評価する。
- 過去25年間の物理学の根源的探求により，量子理論を超える物理学の存在が示唆された。
- 新たな進化法則や測定方法が発見される可能性があり，情報処理やAI開発に大きな影響を与えると考えられる。
- 実存的リスクへの対策や，人類の未来を考える上で，物理学の進展が重要となる。
Link: https://arxiv.org/abs/2604.26530
深層検定：依存性検出の事例 [stat.ML, cs.LG, stat.ME]目的：統計的仮説検定への深層学習の応用
- 統計的推論は，科学研究やデータ分析において不可欠な役割を担う。
- 従来の仮説検定法は，複雑な依存構造を持つデータに対して十分な検定力を発揮できない場合がある。
- 深層学習の識別能力を活用し，より強力な検定手法を開発すること。
- 本研究で提案する深層検定は，深層ニューラルネットワークを用いて，帰無仮説と対立仮説の下で生成されたデータの識別を行う。
- 大規模なシミュレーション研究の結果，深層検定は，様々な複雑な依存構造に対して，19の既存手法を上回る高い検定力を示すことが確認された。
- これにより，深層学習が統計的仮説検定に有効なアプローチとなりうる可能性が示唆された。
Link: https://arxiv.org/abs/2604.26558
二つの異なるカオス系分岐図の単一機械による推論 [nlin.CD, cs.LG]目的：二つの異なるカオス系のダイナミクスの推論
- 複雑な非線形現象の理解は，自然科学，工学など広範な分野で重要である。
- カオス系の分岐図の再構成には，大量のデータと計算資源が必要となる場合が多い。
- 少ないデータから複数のカオス系の分岐図を効率的に再構成することを可能とする。
- 提案された二重チャネル貯留計算スキームは，単一の機械で二つの異なるカオス系のダイナミクスを推論できる。
- 訓練された機械は，サンプリングされた状態の短期的な進化を予測するだけでなく，未知の状態の長期的な統計的性質も再現する。
- 貯留ネットワーク内の異なる動的パターンにより，二つのカオス系が符号化されていることが示された。
Link: https://arxiv.org/abs/2604.26632
ベイズテンソルネットワークカーネル機械に対するラプラス近似 [stat.ML, cs.LG]目的：ベイズテンソルネットワークカーネル機械における不確実性推定の実現
- 曖昧または分布外の入力に対するロバストな意思決定には，不確実性推定が不可欠である。
- テンソルネットワークの仮定はガウス性を損ない，標準的な確率推論を複雑にする。
- テンソルネットワークカーネル機械における原理的な不確実性推定を可能にすること。
- 提案手法LA-TNKMは，様々なUCI回帰ベンチマークにおいて，ガウス過程やベイズニューラルネットワークを上回る性能を示す。
- 線形化されたラプラス近似を用いることで，ベイズ推論を可能にし，スケーラビリティを維持している。
- 本研究は，テンソルネットワークカーネル機械における不確実性推定の有効性と実用性を実証する。
Link: https://arxiv.org/abs/2604.26673
パラメータ化された量子回路を特徴マップとして：マルチスペクトル土地被覆分類における表現品質と読み出し効果 [quant-ph, cs.LG]目的：マルチスペクトル衛星画像からの土地被覆分類のための変分量子分類器の性能評価
- 土地被覆分類は，地球環境変動の監視や資源管理において重要な役割を担う。
- 古典的な分類手法では，高次元データの複雑な特徴を捉えることが困難な場合がある。
- 量子回路による非線形な特徴抽出と，その読み出し方法の最適化を目指す。
- 線形読み出しを用いた量子分類器は，RBF-SVMなどの古典的な手法に匹敵する性能を示さなかった。
- しかし，学習済みの量子特徴マップをカーネル法と組み合わせることで，性能が大幅に向上した。
- 量子ビット数の増加に伴う飽和効果が確認され，パラメータのスケーリングとヒルベルト空間の次元との不一致が示唆された。
Link: https://arxiv.org/abs/2604.26675