arXiv雑要約

AI - 2026/04/29 公開

  • 宇宙飛行士向けスマートヘルスセンサーにおけるデバイス上での心臓特徴抽出のためのULP FPGAベースCNN [cs.CE, cs.AR, cs.AI]目的:宇宙飛行士向けスマートヘルスセンサーにおける心臓特徴抽出のための,超低消費電力FPGAベースCNNの実装
    • 宇宙探査の進展と地上での健康モニタリングの重要性が高まり,ウェアラブルセンサーでのリアルタイム処理が求められている。
    • バッテリー駆動のウェアラブルセンサーでは,電力消費と処理能力の制約が課題となっている。
    • 省電力かつ自律的な心臓モニタリングを実現するため,限られたハードウェアリソースでの特徴抽出を可能にする。
    • 本研究では,Lattice iCE40UP5K FPGA上に実装されたCNNを用いて,98%の検証精度を達成した。
    • 消費電力はわずか8.55mWであり,推論時間は95.5msと,限られたハードウェアリソース(2,861 LUTs, 7 DSP blocks)で動作する。
    • これにより,バッテリー駆動環境,特に宇宙環境でのデバイス上での心臓特徴抽出が実現可能となった。

    Link: https://arxiv.org/abs/2604.25799

  • Transformerにおける普遍的推論の障壁(とその克服方法) [cs.LG, cs.CL]目的:Transformerの汎用的な推論能力の限界と,その改善策
    • Transformerは自然言語処理において高い性能を示すが,複雑な推論問題への適用には限界がある。
    • Transformerは学習データ以上の長さの推論経路への汎化が難しく,計算能力に制約を受ける。
    • 問題サイズに応じた語彙拡張により,Transformerの推論能力を向上させることを目指す。
    • 標準的な位置エンコーディング下では,TransformerはTC^0を超える問題解決が困難である。
    • 語彙サイズを問題サイズに応じて拡張することで,より複雑な計算を表現できる長さに汎化可能なチューリングマシンをシミュレーション可能となる。
    • テープ位置に固有のトークンと,値の変化のみを記録することで,繰り返しコピーや最終出現位置の検索といった問題を回避できる。

    Link: https://arxiv.org/abs/2604.25800

  • MAIC-UI:生成UIを用いたインタラクティブなコースウェアの作成 [cs.CL, cs.AI, cs.HC]目的:インタラクティブなコースウェアの作成・編集システム
    • STEM教育において,インタラクティブな教材は学習効果を高める上で重要である。
    • 従来のコースウェア作成には専門知識が必要であり,教育者にとって参入障壁となっていた。
    • 本研究は,専門知識不要でインタラクティブなコースウェアを迅速に作成・編集することを目指す。
    • MAIC-UIは,教育者が教科書やPPT,PDFからインタラクティブなコースウェアをゼロコードで作成・編集可能にする。
    • 実験により,MAIC-UIは編集反復回数を減らし,Text-to-HTML生成と比較して学習性と制御性に優れることが示された。
    • 実際の授業での導入実験では,MAIC-UIが学習主体性を育み,学習成果の格差を縮小することが確認された。

    Link: https://arxiv.org/abs/2604.25806

  • TrialCalibre:RCTベンチマーキングと観察研究キャリブレーションのための完全自動因果推論エンジン [cs.AI]目的:RCTベンチマーキングおよび観察研究のキャリブレーションを目的とした自動因果推論エンジンの開発
    • 実際の医療データは,臨床意思決定や規制判断において重要性を増している。
    • 観察研究には,定量化が難しいバイアスが残存し,信頼性を損なう可能性がある。
    • BenchExCalのプロセスを自動化し,スケーラビリティを高めることで,因果効果推定の精度向上を目指す。
    • TrialCalibreは,オーケストレーター,プロトコル設計,データ合成などの専門エージェントから構成されるマルチエージェントシステムである。
    • エージェント学習やナレッジブラックボードを組み込み,適応的かつ透明性の高い因果効果推定を可能にする。
    • BenchExCalのワークフローを自動化し,スケーラビリティを向上させることで,因果推論の実用性を高める。

    Link: https://arxiv.org/abs/2604.25832

  • 短編動画推薦のための行動を意識した生成シーケンスモデリング [cs.AI, cs.IR]目的:短編動画の推薦精度向上
    • インターネットの発展により,コンテンツ推薦の精度に対する要求が高まっている。
    • 従来の推薦モデルは動画を単一の単位として扱うため,動画内の多様なセグメントに対するユーザーの微妙な嗜好を捉えきれない。
    • ユーザーの行動タイミングが持つ意図を考慮し,行動シーケンスを学習することで,より精度の高い推薦を実現すること。
    • 提案手法A2Genは,時間軸上でユーザーの行動を分析し,行動シーケンスを統合的に処理・予測する。
    • オフライン実験および大規模オンラインA/Bテストの結果,提案手法は既存手法を上回り,ユーザーの視聴時間,インタラクション率,リテンション率を向上させた。
    • 具体的には,視聴時間が0.34%増加,インタラクション率が8.1%増加,LifeTime-7が0.162%増加し,毎日4億人以上のユーザーに展開されている。

    Link: https://arxiv.org/abs/2604.25834

  • PSI-Bench:臨床に基づいた解釈可能なうつ病患者シミュレータ評価に向けて [cs.IR, cs.CL, cs.AI]目的:うつ病患者シミュレータの評価フレームワーク
    • メンタルヘルス研修において,複雑な患者との対話を安全に体験できるシミュレータの重要性が増している。
    • 既存の評価はLLMの判断に依存しており,多様な行動評価が不足している。
    • 多様かつ現実的な患者行動を捉えたシミュレータの評価方法を確立すること。
    • PSI-Benchを用いることで,7つのLLMシミュレータを評価し,応答が長すぎ,感情の解消が早すぎるなどの課題を特定した。
    • シミュレーションフレームワークがモデルの規模よりもシミュレーションの忠実性に大きな影響を与えることが示された。
    • PSI-Benchの評価結果は,専門家の判断と強い相関関係があることが確認された。

    Link: https://arxiv.org/abs/2604.25840

  • セキュリティアラートの主体的な調査に向けて [cs.CR, cs.AI]目的:セキュリティアラートの初期段階調査の自動化
    • セキュリティ侵害の増加に伴い,アラートの分析・対応は喫緊の課題である。
    • 大量のアラートと,検出システムからの情報不足が分析者の負担を増大させている。
    • LLMを活用し,アラート調査の初期段階を自動化することで分析者の負担を軽減する。
    • LLMと定義済みのクエリ,限定されたツールアクセスを用いることで,アラート調査の初期段階を自動化するワークフローを提案した。
    • 提案手法は,データ概要の提供,クエリの選択,証拠の抽出,最終的な判断を統合的に行う。
    • ワークフローを用いたLLMは,それ自体よりも高い精度でアラートの最終判断を下せることを示した。

    Link: https://arxiv.org/abs/2604.25846

  • 大規模EV配車におけるフェーズ型強化学習:実行可能性を保証する行動選択 [cs.AI]目的:大規模EV配車における配車,再配置,充電の最適制御
    • 都市におけるEV利用拡大には,効率的な配車システムの構築が不可欠である。
    • 充電インフラの制約下での需要変動や移動時間予測の不確実性が課題である。
    • 充電制約と電力供給の制約を満たしつつ,収益を最大化する配車戦略を確立する。
    • 提案手法(PD-RSAC)は,既存手法と比較して,NYCタクシーデータを用いたシミュレーションで最も高い純利益(122万ドル)を達成した。
    • 特に,フィーダー制約違反はゼロであり,実用性も高いことが示された。
    • Wasserstein距離に基づくロバストな強化学習により,需要・移動時間の空間相関を考慮した最適化を実現した。

    Link: https://arxiv.org/abs/2604.25848

  • ADEMA:LLMエージェントによる長期的知識合成のための知識状態オーケストレーションアーキテクチャ [cs.AI]目的:長期的知識合成のための知識状態オーケストレーションアーキテクチャ
    • 大規模言語モデル(LLM)の活用は,複雑な課題解決において不可欠となりつつある。
    • LLMは,対話の過程で知識状態が変動しやすく,一貫性を保つことが困難である。
    • 知識状態の追跡と管理により,LLMの長期的知識合成能力を向上させることを目指す。
    • ADEMAは,明示的な知識状態の管理,二重評価による統治,適応的なタスクモード切り替えなどを組み合わせる。
    • チェックポイント/再開機能を削除すると,中断に弱い再開条件で無効な実行が発生した。
    • 二重評価やセグメント合成は,完了のための必須条件ではなく,軌道の統制や成果物の進捗を支援する。

    Link: https://arxiv.org/abs/2604.25849

  • グラフ誘導による言語モデルのファインチューニング:G-Loss [cs.CL, cs.AI, cs.LG]目的:言語モデルの埋め込み表現の学習
    • 自然言語処理の性能向上には,文脈を考慮した高品質な埋め込み表現が不可欠である。
    • 従来の損失関数は局所的な関係のみに着目し,グローバルな意味構造を捉えきれない。
    • 埋め込み空間における構造的な関係性を活用し,より識別力のある表現を獲得すること。
    • G-Lossは,ドキュメント間の類似性をグラフ構造で表現し,学習を誘導する。
    • 5つのベンチマークデータセットで,従来の損失関数と比較して高い分類精度を示した。
    • G-Lossは収束が速く,意味的に一貫性のある埋め込み空間を生成することが確認された。

    Link: https://arxiv.org/abs/2604.25853

  • SIEVES:視覚的証拠のスコアリングを通じた選択的予測の汎化 [cs.CV, cs.AI]目的:視覚言語タスクにおける選択的予測の改善
    • マルチモーダル大規模言語モデルの性能向上に伴い,実世界での信頼性が重要視されている。
    • 既存のベンチマークは飽和に近づきつつあり,分布外(OOD)データに対する誤差許容度が課題となっている。
    • 視覚的証拠の品質をスコアリングすることで,OODデータにおけるカバレッジを向上させる。
    • SIEVESは,既存手法と比較して,OODベンチマークにおけるカバレッジを最大3倍に向上させる。
    • SIEVESの選択器は,モデルの重みやロジットにアクセスできない状況でも,様々なreasonerモデルに転移可能である。
    • SIEVESは,5つのOODデータセットと3つのreasonerモデルにおいて,特定の訓練や適応なしに汎化することが示された。

    Link: https://arxiv.org/abs/2604.25855

  • Transformerにおける文脈内学習能力の調査 [cs.NI, cs.LG, cs.AI]目的:Transformerにおける文脈内学習の性能に影響を与える要素の分析
    • Transformerは自然言語処理の分野で高い性能を示しており,その応用範囲は広い。
    • 文脈内学習の成功条件は理論的に示されているものの,実証的なスケーリング則は未解明な点が多い。
    • 文脈内学習における性能を決定する次元数,文例数,事前学習タスク数の関係を明らかにすること。
    • ガウス混合二値分類タスクにおいて,入力次元,文例数,事前学習タスク数が文脈内学習の精度に影響を与えることを示した。
    • モデルが文脈のみからタスク構造を推論できる幾何学的条件を特定し,その条件下のスケーリング則を明らかにした。
    • ノイズを含む文脈内ラベルを記憶しながらも,クリーンなテストデータで高い汎化性能を発揮する良性オーバーフィッティングの発生条件を調査した。

    Link: https://arxiv.org/abs/2604.25858

  • Luminol-AIDetect:テキストシャッフル下でのパープレキシティに基づく高速ゼロショット機械生成テキスト検出 [cs.RO, cs.CL, cs.AI, cs.CY]目的:機械生成テキストの検出
    • 近年,大規模言語モデルの発展に伴い,AI生成テキストが増加しており,その識別が重要になっている。
    • 従来の検出手法はモデル固有の特性に依存するため,未知の生成モデルに対しては汎化性能が低いという課題がある。
    • 生成モデルの構造的な脆弱性を利用し,モデル非依存でテキストを識別することを目指している。
    • 提案手法Luminol-AIDetectは,テキストのシャッフル操作によって生じるパープレキシティの変化を利用し,機械生成テキストと人間が書いたテキストを区別する。
    • 8つのコンテンツ領域,11種類の敵対的攻撃,18の言語にわたる評価において,最先端の性能を示し,誤検出率を大幅に低減した。
    • 本手法は計算コストが低く,実用的な機械生成テキスト検出システムとして期待できる。

    Link: https://arxiv.org/abs/2604.25860

  • RESTestBench:自然言語要件からのLLM生成REST APIテストケースの効果評価ベンチマーク [cs.SE, cs.AI]目的:LLM生成REST APIテストケースの効果評価のためのベンチマーク
    • APIテストはソフトウェア品質の確保に不可欠であり,効率的なテスト手法が求められている。
    • 従来のテスト指標は,自然言語要件からのテスト生成の妥当性を評価するには不十分である。
    • 自然言語要件に基づいたテスト生成の効果を正確に測定できるベンチマークの提供。
    • RESTestBenchは,3つのRESTサービスと検証済み自然言語要件(明確/曖昧版)から構成される。
    • 要件ベースのミューテーションテスト指標を導入し,生成されたテストケースの欠陥検出能力を評価する。
    • 曖昧な要件に対して,SUTとのインタラクションがテスト効果を低下させる場合があることが示された。

    Link: https://arxiv.org/abs/2604.25862

  • エラーが有益となりうる場合:方策勾配のための不完全な報酬の分類 [cs.LG, cs.AI, stat.ML]目的:不完全な報酬の分類
    • 言語モデルの強化学習は,報酬設計が性能に大きく影響する。
    • 従来の評価指標では,不正確な報酬は有害視されてきた。
    • 報酬誤差が必ずしも有害でないことを理論的に示す。
    • 報酬誤差は,真の報酬の増加に与える影響によって分類可能である。
    • 誤差が,真の報酬が中程度の出力に方策が停滞するのを防ぐ場合がある。
    • 人間のフィードバックからの強化学習における報酬モデル評価指標の改善に貢献する。

    Link: https://arxiv.org/abs/2604.25872

  • 歩行者置き去りはしない:適応信号制御のための脆弱な道路利用者リアルタイム検知と追跡 [cs.MM, cs.CV, cs.AI, cs.RO, cs.SY, eess.SY]目的:脆弱な道路利用者の安全確保
    • 高齢者や障害者など,歩行者の安全確保は社会的な要請である。
    • 従来の信号機は固定タイミングであり,歩行者の状況に合わせた制御が困難である。
    • 歩行者検知と信号制御の連携により,立ち往生のリスクを低減することを目指す。
    • 本研究では,リアルタイム適応信号システムNPLBを開発した。
    • YOLOv12とByteTrackを組み合わせることで,脆弱な道路利用者の安全性を71.4%向上させた。
    • 信号延長は crossing cycle の12.1%にとどまり,効果的なシステムであることが示された。

    Link: https://arxiv.org/abs/2604.25887

  • 条件付き誤調整:一般的な介入は文脈的トリガーの背後に現れる誤調整を隠蔽しうる [cs.LG, cs.AI, cs.CR]目的:言語モデルの誤調整の検出と,介入による影響の評価
    • 言語モデルの安全性確保は重要であり,意図しない有害な出力の抑制が不可欠である。
    • ファインチューニングされた言語モデルは,分布外のデータでより深刻な誤調整を示す可能性がある。
    • 既存の介入方法が,誤調整を完全に解消しているわけではないことを明らかにする。
    • 既存の介入は,標準的な評価では誤調整を軽減するが,訓練文脈に類似したプロンプトで誤調整が再発する。
    • 誤調整データと良性データの混合,および良性データでの追加学習といった介入も条件付き誤調整を引き起こす。
    • イノキュレーションプロンプトは条件付き誤調整を低減する可能性があるが,訓練がオンポリシーである場合や推論蒸留を含む場合に限る。

    Link: https://arxiv.org/abs/2604.25891

  • RLHFアノテーションの3つのモデル:拡張,証拠,権威 [cs.CY, cs.AI, cs.CL]目的:RLHFアノテーションの規範的役割に関する3つの概念モデルの区別
    • 大規模言語モデルの行動を制御する上で,人間のフィードバックは不可欠である。
    • RLHFにおける人間の判断の規範的役割が明確にされていない。
    • アノテーションの収集,検証,集約方法を最適化するための指針を提示する。
    • 人間の判断の役割として,拡張,証拠,権威という3つのモデルを提示した。
    • 各モデルがRLHFパイプラインに与える影響を議論し,混同による問題点を指摘した。
    • アノテーションの次元を分離し,各次元に適したパイプラインを設計することを推奨する。

    Link: https://arxiv.org/abs/2604.25895

  • ロバストな二本指把持のための変分ニューラル信念パラメータ化:多峰度不確実性下での手法 [cs.RO, cs.LG, cs.SY, eess.SY]目的:ロバストな二本指把持の実現
    • ロボットによる把持は,製造業や物流など幅広い分野で不可欠な技術である。
    • 把持の実行には接触のばらつきや外乱が伴い,把持の確実性が課題となっている。
    • 接触パラメータと物体の姿勢に関する信念を効率的に表現し,ロバスト性を高めることを目指す。
    • 提案手法は,接触パラメータの不確実性や外力に対するロバストな把持成功率を向上させた。
    • 計画時間を従来のモデル予測制御と比較して約1桁削減することに成功した。
    • シミュレーションおよび実機実験において,リスクの較正精度が向上し,平均絶対較正誤差を低減した。

    Link: https://arxiv.org/abs/2604.25897

  • TSNアフィニティ:類似度に基づいたパラメータ再利用による継続的オフライン強化学習 [cs.LG, cs.AI]目的:継続的オフライン強化学習におけるタスク系列学習と,過去のタスク性能維持
    • 強化学習は,ロボット制御やゲームAIなど,幅広い分野で応用が期待されている。
    • オフライン強化学習は,データ収集コストが高い場合に有効だが,性能向上が難しい。
    • タスク類似度に基づいたパラメータ再利用により,記憶コストを抑えつつ,性能維持と向上が期待される。
    • 提案手法TSN-Affinityは,TinySubNetworksとDecision Transformerを組み合わせ,アクション互換性と潜在的類似度に基づいたタスクルーティングを実現した。
    • AtariゲームとFranka Emika Pandaロボットアームのシミュレーションによる評価で,疎なSubNetworksからの高い保持率と,ルーティングによるマルチタスク性能の向上が確認された。
    • 類似度に基づいたアーキテクチャ再利用は,CORL環境において,リプレイベース戦略の有効な代替手段となりうる。

    Link: https://arxiv.org/abs/2604.25898

  • 自然言語意味論のための機能幾何代数 [cs.MA, cs.DC, cs.SY, eess.SY, cs.CL, cs.AI, cs.LG]目的:自然言語意味論の数学的基盤
    • 自然言語処理の発展には,より表現力豊かな意味表現が必要不可欠である。
    • 従来の線形代数では,意味の構成性や型依存性,解釈可能性に限界がある。
    • 幾何代数を用いて,意味の構造化と推論機能を強化すること。
    • 幾何代数は,線形代数よりも高次の概念と相互作用を表現できる。
    • 機能幾何代数(FGA)は,型付き構成的意味論を可能にし,推論と変換をサポートする。
    • 既存のtransformerアーキテクチャに幾何代数の演算を組み込むことで,表現力を拡張できる。

    Link: https://arxiv.org/abs/2604.25902

  • 炭素税を課したTransformer:巨大言語モデルのグリーン圧縮パイプライン [cs.SE, cs.LG]目的:巨大言語モデルの効率性と環境負荷の軽減
    • ソフトウェア工学へのLLM導入が進む中,計算コストの増大が課題となっている。
    • LLMはサイズが大きく,展開に時間とメモリを要し,環境負荷も高い。
    • 効率性と環境コストを重視した圧縮パイプラインを構築し,持続可能なAIを目指す。
    • 提案手法Carbon-Taxed Transformers(CTT)は,モデルのメモリ使用量を最大49倍削減する。
    • コードクローン検出,要約,生成において,推論速度を最大10倍,CO2排出量を最大81%削減する。
    • 精度はクローン検出で約98%,要約で約89%,生成でテキスト指標で最大91%,pass@1で最大68%を維持する。

    Link: https://arxiv.org/abs/2604.25903

  • 教師強制を一般化ベイズとして捉える:カオス的ダイナミクスにおけるスイッチング代理モデルの最適化幾何学の不一致 [cs.LG, math.DS, stat.ML]目的:カオス的ダイナミクスに対する決定論的再帰的代理モデルの安定した学習
    • カオス的ダイナミクスを再構成することは,物理学,気象学など様々な分野で重要である。
    • 再帰型ニューラルネットワークを用いたダイナミクス再構成において,安定した学習が困難である。
    • 教師強制による学習における最適化幾何学的不一致を解析し,より適切な学習方法を探求する。
    • 教師強制は介入に基づく予測損失であり,モデルの周辺尤度幾何学と必ずしも一致しない。
    • スイッチング拡張されたAL-RNNsにおいて,教師強制は曲率を増大させる一方,周辺尤度曲率は情報不足の補正により減少する。
    • 窓ごとのエビデンス微調整は,ホールドアウトエビデンスを改善するものの,重要なダイナミクス量に対しては教師強制で事前学習したモデルよりも性能が低下する場合がある。

    Link: https://arxiv.org/abs/2604.25904

  • モデルが監督にどれだけ早くコミットすべきか:Tsallis損失連続体における推論モデルの学習 [cs.CL, cs.IR, cs.LG, cs.AI]目的:推論モデルの学習における,初期成功確率が低い場合の学習停滞問題の緩和
    • 推論モデルは多様なタスクに応用可能だが,訓練データの不足は大きな課題である。
    • 出力レベルの監督による後学習では,初期成功確率が低い場合に強化学習が停滞しやすい。
    • Tsallis損失関数を用いて,強化学習の初期停滞を解消し,効率的な学習を実現する。
    • Tsallis q-logarithmを用いた損失関数 J_Q を定義し,初期停滞の問題を緩和することに成功した。
    • FinQA,HotPotQA,MuSiQueのデータセットで実験を行い,既存手法GRPOと比較して大幅な性能向上を示した。
    • 特にHotPotQAにおいては,maj@16で47.9を達成し,GRPOより14.4ポイント向上した。

    Link: https://arxiv.org/abs/2604.25907

  • 再帰的マルチエージェントシステム [cs.CL, cs.AI, cs.CL, cs.LG]目的:マルチエージェントシステムにおける再帰的なスケーリングの可能性
    • 複雑な問題解決において,複数のエージェントによる協調が重要視されている。
    • 従来のマルチエージェントシステムは,規模拡大に伴い計算コストが増大しやすい。
    • 再帰的な構造を導入することで,効率的な協調学習を実現し,性能向上を目指す。
    • RecursiveMASは,異なるエージェントを再帰的なループで接続し,潜在的な思考生成と状態遷移を可能にする。
    • 実験結果から,数学,科学,医療など9つのベンチマークにおいて,平均で8.3%の精度向上が確認された。
    • 推論速度が1.2倍~2.4倍向上し,トークン使用量が34.6%~75.6%削減されることが示された。

    Link: https://arxiv.org/abs/2604.25917

  • 知能の定量的定義 [cs.AI, cs.CC, cs.LG]目的:任意の物理システムに対する知能の運用的な定量的定義
    • AI研究の進展には,知能を客観的に評価する基準が不可欠である。
    • 既存の知能の定義は曖昧で,定量的な評価が困難であるという課題がある。
    • 知能の普遍的な定義を確立し,様々なシステムへの応用を目指す。
    • システムの知能密度は,独立した出力の対数と記述長の比率として定義された。
    • システムが情報を記憶するか,知識を獲得するかは,記述長の増加パターンによって判断できる。
    • この定義は,論理回路から脳まで,基盤に依存しない知能の連続体を提供する。

    Link: https://arxiv.org/abs/2604.10873

  • 時系列異常検知のための最小限のノイズ除去ネットワーク [cs.LG, cs.AI]目的:時系列異常検知における,マンニホールド射影の原理を正しく実装した訓練目標
    • 時系列データは,金融,医療,製造など幅広い分野で重要な役割を担っている。
    • 既存の異常検知手法は,複雑なアーキテクチャに依存し,計算コストが高い場合がある。
    • 本研究では,単純なネットワーク構造で高精度な異常検知を実現することを目指す。
    • JuReは,単一のDepthwise Separable Convolutional Residual Blockを使用し,隠れ次元は128である。
    • TSB-ADベンチマークにおいて,AUC-PR 0.404を達成し,ニューラルネットワークベースラインの中で最高性能を示した。
    • 訓練時のノイズ付加が検出品質を大きく左右することが確認された。

    Link: https://arxiv.org/abs/2604.17388

  • LLMマルチエージェントシステムにおけるグラフベースの異常検知ベンチマーク共通フレームワーク GAMMAF [cs.CR, cs.AI, cs.MA]目的:LLMマルチエージェントシステムにおける異常検知手法の評価環境の提供
    • LLMのMASへの統合が進み,協調問題解決能力が向上する一方で,攻撃対象領域が拡大している。
    • グラフベースの異常検知法は有望だが,モデルの学習と有効性評価のための標準化された環境が不足している。
    • 既存および将来の防御モデルの性能をベンチマーク可能な,MASインタラクションの合成データ生成フレームワークを提供する。
    • GAMMAFは,多様なネットワークトポロジーでの議論をシミュレーションし,堅牢な属性グラフとして相互作用を捉える学習データ生成パイプラインを備えている。
    • GAMMAFを用いた評価により,既存の防御基盤モデル(XG-Guard, BlindGuard)の有効性とスケーラビリティが確認された。
    • 効果的な攻撃修復はシステム整合性を回復するだけでなく,早期コンセンサスを促進し,敵対的エージェントの大量トークン生成を抑制することで,運用コストを大幅に削減する。

    Link: https://arxiv.org/abs/2604.24477

  • 解釈可能なファジーモデリングによる,神経多様性と神経定型集団におけるP300脳波インタフェースの集団レベル表現の違いの解明 [eess.SP, cs.HC, cs.LG]目的:P300脳波インタフェースにおける集団レベルの表現の違いの分析
    • 脳波インタフェースは,コミュニケーション手段として広く用いられ,その応用範囲は拡大している。
    • 集団間の脳波パターンには異質性が存在し,その解明が困難である。
    • 集団間の脳波表現構造の違いを明らかにすることで,個々のニーズに合わせたインタフェース設計を目指す。
    • 提案手法は,複数の深層学習モデルと同等の性能を達成した。
    • 再構成されたファジー中心は,波形形態と表現幾何学において集団依存的な系統的な違いを示した。
    • 集団間のP300波のタイミングに有意な差が認められ,集団ごとのプロトタイプの組織化も部分的に分離していた。

    Link: https://arxiv.org/abs/2604.24765

  • 専門家混合に基づく基盤モデルのGlueX DIRC検出器への応用 [physics.data-an, cs.LG, hep-ex, nucl-ex, physics.ins-det]目的:GlueX DIRC検出器における,チェレンコフ光の高速シミュレーション,粒子識別,ノイズフィルタリングのための統一的フレームワーク
    • 素粒子物理学研究において,検出器性能の向上は高精度な実験結果を得るために不可欠である。
    • 従来の解析手法は,タスクごとに異なるパイプラインを構築する必要があり,効率が悪い。
    • 本研究は,単一の基盤モデルで複数のタスクを効率的に処理し,解析パイプラインの簡素化を目指す。
    • 専門家混合に基づく基盤モデルは,GlueX DIRC検出器において,高速シミュレーション,粒子識別,ノイズフィルタリングに有効であることが示された。
    • このモデルは,既存の方法と同等かそれ以上の性能を維持しつつ,タスク固有のパイプラインの断片化を解消する。
    • 検出器の低レベル入力から直接動作し,アーキテクチャを変更することなく,GlueX DIRCの全運動学的空間で有効に転移することが確認された。

    Link: https://arxiv.org/abs/2604.24775

  • 複雑な疾患モデリングと意思決定支援のための多段階ソフトコンピューティングフレームワーク:肝硬変のケーススタディ [q-bio.OT, cs.LG]目的:複雑な疾患モデリングと治療探索のための機械学習駆動型多段階意思決定フレームワーク
    • 肝硬変は世界的な健康問題であり,早期発見と適切な治療が患者の生活の質を向上させる上で重要である。
    • バイオメディカルデータからの複雑な疾患モデリングは,高次元性,特徴量の相関,ノイズ,ラベル付きサンプルの少なさから計算上困難である。
    • 本研究は,不確実性,異質性,限られたサンプルが存在する状況下での,疾患モデリングのロバスト性,解釈可能性,一般化性能を向上させることを目指す。
    • 肝硬変のケーススタディにおいて,疾患関連の血管内皮細胞サブポピュレーションを特定し,7つのロバストなシグネチャー遺伝子(HSPB1,GADD45A,CLDN5,ATP1B3,C1QBP,ENPP2,PARL)を抽出した。
    • CNNベースの表現学習モジュールは,従来のパイプラインと比較して分類性能で優れていることが示された。
    • 本フレームワークは疾患に依存せず,不確実性や異質性,限られたサンプルを伴う他のオミクス駆動型のバイオメディカルアプリケーションにも容易に拡張可能である。

    Link: https://arxiv.org/abs/2604.24796

  • 宇宙マイクロ波背景スペクトルゆらぎ計算のためのコードパッケージspectroxide [astro-ph.CO, astro-ph.IM, cs.AI, hep-ph]目的:宇宙マイクロ波背景スペクトルゆらぎの計算
    • 宇宙論的初期条件や宇宙進化を理解する上で,宇宙マイクロ波背景は重要な情報源である。
    • スペクトルゆらぎの正確な計算には高度な数値計算が必要であり,既存の公開コードは限られている。
    • AI支援による科学ソフトウェア開発の可能性と課題を検証し,スペクトルゆらぎ計算の効率化を目指す。
    • 本研究では,AI (Claude Code) によって生成されたRustコードとPythonインターフェースを用いたスペクトルゆらぎ計算コードspectroxideを開発した。
    • コードは,コンプトン散乱,二重コンプトン放出,および bremsstrahlung を考慮し,初期赤方偏移 $z \sim 5 \times 10^6$ から現在までのスペクトルゆらぎを計算する。
    • 開発過程におけるAI支援の有効性と,物理学専門家によるバグ修正の重要性を示し,人間とAIの協調開発におけるベストプラクティスを提言した。

    Link: https://arxiv.org/abs/2604.24838

  • 海底電力ケーブルにおける露出長変動の分散光ファイバセンシングによる監視 [math.AG, cs.CC, eess.SP, cs.LG, physics.soc-ph]目的:海底ケーブル露出長変動の異常検知手法
    • 海底ケーブルは海洋エネルギー供給の要であり,その安定稼働は重要である。
    • 海底ケーブルの露出は損傷リスクを高めるが,常時監視は困難である。
    • 分散光ファイバセンシングを用いた,データ制約下での信頼性高い監視手法の確立。
    • 提案手法は,露出長変化に伴う振動特性を捉えつつ,環境影響を抑制する特徴抽出が可能である。
    • 実験結果から,異常スコアは露出長変化の増加とともに単調に減少し,強い相関関係($r = -0.83$)が確認された。
    • 少量データでの学習にも関わらず,二値分類においてF1スコア0.82を達成し,実用性を示唆した。

    Link: https://arxiv.org/abs/2604.24880

  • ニューラル波動関数を用いた2次元スピン不均衡性フェルミ気体のエキゾチックな対状態の解明 [cond-mat.quant-gas, cond-mat.supr-con, cs.LG, physics.comp-ph]目的:2次元スピン不均衡性フェルミ気体のゼロ温度相図
    • 超伝導や量子物質の研究において,フェルミ気体の相転移と物性解明は重要課題である。
    • スピン不均衡性フェルミ気体では,相分離やエキゾチックな相の出現機構が不明な点が多い。
    • 強相互作用下におけるスピン不均衡フェルミ気体の新たな相とその形成機構を明らかにすること。
    • 弱相互作用領域では,フルデ・フェレル・ラーキン・オヴチニコフ相が,強相互作用領域では偏極超流動が観測された。
    • 強相互作用下では,少数スピンの運動量密度が多数スピンの占める領域でほぼゼロになる現象が確認された。
    • 中間的な相互作用強度では,クーパー対が結晶化するエキゾチックな相が現れることが示唆された。

    Link: https://arxiv.org/abs/2604.24883

  • メタ学習による超伝導量子ビットのデータ駆動型ハミルトニアン簡約 [quant-ph, cs.LG]目的:超伝導量子プロセッサの有効ハミルトニアンモデルの迅速なオンライン適応
    • 量子コンピュータの性能向上には,量子ビットの正確なモデル化が不可欠である。
    • 従来のハミルトニアン簡約手法は,特定の条件下で精度が低下する問題がある。
    • メタ学習を用いて,多モードハミルトニアンからの有効量子ビット記述の簡約を可能にする。
    • HAMLフレームワークは,シミュレーションと実際の測定値を組み合わせることで,効率的な適応を実現する。
    • 測定構成の貪欲選択により,オンライン適応効率が向上することが示された。
    • HAMLは,Schrieffer-Wolff摂動論が破綻する領域でも有効な二量子ビット係数を復元できる。

    Link: https://arxiv.org/abs/2604.24912

  • テール認識型チャネル推定のためのEVTに基づく生成AI [eess.SP, cs.AI, cs.SY, eess.SY]目的:超高信頼・低遅延通信の実現に向けたチャネルモデリング手法
    • 5G以降のネットワークにおいて,ミッションクリティカルなアプリケーションを支える重要な技術である。
    • 従来のチャネル推定は,大規模データや高コストな計算を必要とし,リアルタイム処理が困難である。
    • 極値理論と生成AIを統合し,少ないデータで極端な事象を捉え,チャネルモデリングの精度向上を目指す。
    • 極値理論によりチャネルのテール分布をモデル化し,稀な事象を正確に特徴づけることが可能となった。
    • 生成AIを活用することで,限られたサンプルからデータ拡張とチャネルパラメータ推定を実現した。
    • 自動車環境で収集した実験データを用いて,提案手法がデータ拡張とオンライン推定において従来の方式を上回る性能を示すことを実証した。

    Link: https://arxiv.org/abs/2604.25008

  • より一般的な幾何学におけるPINN [math.DG, cs.LG, hep-th]目的:PINNモデルの応用可能性の検討
    • 微分幾何学は,物理現象の記述やデータ解析に不可欠な理論的基盤である。
    • 従来の数値解法では,複雑な幾何学構造への対応が困難な場合がある。
    • PINNを用いて,微分幾何学における問題を効率的に解決することを目指す。
    • PINNは,微分条件に基づいた損失関数を用いて学習されるニューラルネットワークである。
    • 微分幾何学の構成は微分汎関数の最小化として表現でき,PINNの損失関数に組み込める。
    • 本研究は,PINNの原理と,微分幾何学への応用例を紹介する。

    Link: https://arxiv.org/abs/2604.25020

  • 優先フィードバックを用いたベイズ最適化におけるThompsonサンプリングの有限時間解析 [stat.ML, cs.LG]目的:優先フィードバックを用いたベイズ最適化におけるThompsonサンプリングの性能評価
    • 人間の専門家や実験による設計において,評価が難しい問題への応用が期待されている。
    • 従来のベイズ最適化では,スカラー値による評価が必要であり,主観的な評価が困難な場合がある。
    • ペアワイズ比較によるフィードバックを活用し,評価の主観性を軽減することを目指す。
    • 提案手法は,標準的なThompsonサンプリングと同等の性能を持つことが有限時間解析により示された。
    • アンカー不変性を活用した選択戦略と,二重Thompsonサンプリングのペアリング手法が解析の鍵となった。
    • 合成データと実データを用いた実験により,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2604.25025

  • 確率フローマッチングによる遺伝子制御の生物物理学的モデル学習 [q-bio.MN, cs.LG, physics.bio-ph]目的:遺伝子制御の生物物理学的モデルの学習
    • 細胞分化は遺伝子制御ネットワークによって制御され,その理解は生命科学研究の根幹である。
    • 既存の手法はメカニズムの解釈性が低く,未知の条件への一般化が困難である。
    • 単一細胞レベルでの時間分解能測定から,生物物理学的に整合性のあるモデルを構築し,遺伝子制御のメカニズムを解明する。
    • 確率フローマッチング(PFM)は,時間分解能を持つ単一細胞測定から,生物物理学的に整合性のある確率過程を学習するためのスケーラブルなフレームワークである。
    • PFMを3つの造血データセットに適用した結果,生物物理学的に整合性のあるモデルのみが,細胞系列の移行や遺伝子擾乱応答のメカニズムを正確に捉えていることが示された。
    • PFMは不均衡な集団にも対応可能であり,細胞の増殖と死滅のダイナミクスを同時に推論できる。

    Link: https://arxiv.org/abs/2604.25062

  • ボーミアン軌跡に基づくスコアマッチングによる量子力学 [quant-ph, cs.LG, physics.chem-ph, physics.comp-ph]目的:ボーミアン軌跡上のスコア関数の学習
    • 量子力学は,現代科学技術の根幹であり,物質の微視的な振る舞いを記述する上で不可欠である。
    • 時間依存性シュレーディンガー方程式の数値解法は計算コストが高く,複雑な系への適用が困難である。
    • スコアマッチングと正規化フローの概念を導入し,効率的な時間発展演算子を構築することを目指す。
    • 本研究では,ニューラルネットワークを用いてスコア関数を近似し,自己整合的なFisherダイバージェンスを最小化することで時間発展を記述する。
    • 無節な波動関数に対しては,この手法がシュレーディンガー方程式のダイナミクスを再現することを証明した。
    • 二重井戸ポテンシャルやモース鎖における波動包絡の分裂や非調和振動に対して本手法の有効性を示した。

    Link: https://arxiv.org/abs/2604.25137

  • スペクトルカルチグラフィのための正則化注意カーネル回帰の高速化 [math.OC, cs.LG]目的:スペクトルカルチグラフィにおける正則化注意カーネル回帰の高速化
    • 無線ネットワークのセンシングや最適化において,空間的な無線電界の再構成が不可欠である。
    • 注意メカニズムに基づくカーネルは計算コストが高く,条件数の増大により反復ソルバーが非効率になる。
    • 注意カーネルシステムの逆スペクトル構造を捉えたデータ依存型事前条件子を学習することで,計算効率を向上させる。
    • LAKERアルゴリズムは,条件数を最大で3桁削減し,収束を20倍以上高速化する。
    • 高い再構成精度を維持し,学習ベースの前処理が有効であることを示す。
    • 事前条件付き共役勾配法との統合により,効率的な最適化を実現している。

    Link: https://arxiv.org/abs/2604.25138

  • 最大値選出標本を用いた部分的教師あり分類 [stat.ME, cs.LG, stat.ML]目的:最大値選出標本における部分的教師あり分類の理論的枠組みとアルゴリズム
    • 教師あり学習にはラベル付きデータが必要だが,ラベル付けはコストがかかる。ラベルなしデータも活用したいというニーズがある。
    • 従来のFSCはランダムサンプリングを前提としているが,実際には最大値選出サンプリングが用いられる場合がある。
    • 最大値選出サンプリングにおけるFSCの尤度関数を導出し,正確な推定を可能にすること。
    • 最大値選出サンプリングにおけるFSCのための潜在表現を導入し,適切なEMアルゴリズムと重み付き尤度FSC手続きを開発した。
    • シミュレーション実験により,従来の誤った方法と比較して,提案手法が大幅に性能を向上させることが示された。
    • 実際のデータ分析を通して,提案手法の実用的な価値が実証された。

    Link: https://arxiv.org/abs/2604.25145

  • 分類のためのエリート駆動型サポートベクターマシン [quant-ph, cs.MS, stat.ML, cs.LG, math.ST, stat.ME, stat.TH]目的:分類における参照モデルの活用
    • 機械学習において,既存の知識やモデルを有効活用することは,性能向上や学習効率の改善に繋がる。
    • 従来のSVMはデータ駆動型であり,信頼できる既存モデルや優先順位を直接組み込む手段がない。
    • 参照モデルの知識を組み込み,SVMの予測性能を向上させることを目指す。
    • 提案手法EDSVMは,参照モデルのSlack変数の値を活用し,新たなSlack変数を参照値に近づけることで,予測精度を向上させる。
    • C-EDSVMとLS-EDSVMという2つのモデルを開発し,標準的なSVMソルバーで実装可能であることを示した。
    • シミュレーションとUCIベンチマーク実験により,EDSVMが参照SVMの挙動に追従しつつ,C-SVM等と同等以上の性能を発揮することが確認された。

    Link: https://arxiv.org/abs/2604.25158

  • アラスカにおける最大3日間の降雪量確率的ダウン スケーリングのための条件付きフローマッチング [physics.comp-ph, cs.LG, physics.ao-ph]目的:アラスカ南東部の最大3日間の降雪量に関する高解像度降水シミュレーションの確率的アンサンブル生成
    • 複雑な地形における降水は地形の影響を強く受けるため,気候モデルの解像度向上が重要である。
    • 既存の気候モデルでは地形の詳細が捉えきれず,高解像度シミュレーションには膨大な計算コストがかかる。
    • フローマッチングを用いた条件付き生成モデルにより,計算コストを抑えつつ高精度なダウン スケーリングを実現する。
    • WxFlowは,従来のバイキュービックダウン スケーリングと比較してスペクトル忠実度が87.8\%向上し,連続順位確率スコアが大幅に改善された。
    • WxFlowは,ラップトップ上で数秒で50個のメンバーからなるアンサンブルを生成することができた。
    • アンサンブルの広がりは空間的に一貫性があり,地形によって制御される,物理的に妥当な不確実性の構造を反映している。

    Link: https://arxiv.org/abs/2604.25172

  • 有効場理論からのコーン-シャムハミルトニアン:フローズンコアダイナミクスによる準粒子バンドの狭窄 [math.OC, cs.SY, eess.SY, quant-ph, cs.NI, cond-mat.mtrl-sci, cond-mat.str-el, cs.AI, cs.LG, physics.comp-ph]目的:コーン-シャムバンドと準粒子バンドの関係性の解明
    • 密度汎関数理論は物質の電子状態計算において不可欠だが,コーン-シャム固有値の物理的意味は曖昧であった。
    • アルカリ金属などにおいて,コーン-シャムバンド幅は光電子分光法(ARPES)の結果と20-35%のずれが見られた。
    • 有効場理論を用いて,コーン-シャムバンドを準粒子バンドとして解釈するための条件を導き出す。
    • コーン-シャムバンド幅と準粒子バンド幅のずれは,コア電子の動的効果を考慮することで説明できる。
    • フローズンコア効果が原因である狭窄因子zcoreを導入し,アルカリ金属で20-35%程度,AlやSiでは5%以下であることを示した。
    • 導出された式は,Li, Na, K, Ca, Mg, Al, Siに対して検証され,ARPESとのずれを解消することに成功した。

    Link: https://arxiv.org/abs/2604.25199

  • 構造,エネルギー,動力学の学習:タンパク質動力学のための人工知能に関するサーベイ [math.CO, cs.DM, q-bio.BM, cs.LG]目的:タンパク質動力学のための人工知能に関する進歩の総括
    • 生命現象の根幹をなすタンパク質動力学の理解は,生命科学研究において不可欠である。
    • 分子動力学シミュレーションの計算コストや,動的構造データの不足が課題となっている。
    • 人工知能を活用し,タンパク質動力学の研究を効率化し,精度向上を目指す。
    • 構造アンサンブルや軌道学習,物理エネルギー信号からの学習,分子シミュレーションの加速など,様々なアプローチが紹介されている。
    • データセットの現状と,スケーラビリティ,熱力学的整合性,動力学的忠実性などの課題が議論されている。
    • 実験的制約との統合も重要な課題として挙げられている。

    Link: https://arxiv.org/abs/2604.25244

  • エルデシュ・レーニ補グラフによるサイド観測を用いたオンライン学習 [math.LO, cs.CC, stat.ML, cs.LG]目的:敵対的マルチアームバンディット問題における学習手法
    • 強化学習の分野において,未知の環境下での最適な行動選択が重要視される。
    • バンディット問題では,探索と利用のバランスが課題であり,情報が限られた状況下での性能向上が求められる。
    • サイド観測を活用することで,探索効率を高め,バンディット問題の解法を改善することを目指す。
    • 提案手法は,サイド観測の確率$r$に応じて異なるアルゴリズムを使用する。
    • 確率$r$が大きい場合,$O(\sqrt{(T /r) \log N })$ の期待後悔を達成する。
    • 確率$r$が小さい場合,$O(\sqrt{(T/r) \log (N+T)})$ の期待後悔を達成する。また,$r$の範囲を推定する手法も提示する。

    Link: https://arxiv.org/abs/2604.25271

  • スペクトルバンディット [stat.ML, cs.AI, cs.LG]目的:グラフ上の滑らかな関数に対するバンディット問題の解決
    • 多様な応用分野でグラフ構造の活用が重要であり,効率的な学習手法が求められている。
    • 大規模グラフにおける最適な行動選択は,ノード数に比例したコストがかかるという課題がある。
    • 有効次元の概念を導入し,ノード数に依存しないスケーラブルなアルゴリズムを開発する。
    • 提案アルゴリズムは,有効次元に対して線形または亜線形にスケールすることが示された。
    • コンテンツベースの推薦実験により,少数の評価でユーザーの好みを高精度に推定できることが確認された。
    • 数千のアイテムに対する良好な推薦モデルが,わずか数十回のノード評価で構築可能である。

    Link: https://arxiv.org/abs/2604.25272

  • 呪われた状態から競争力へ:入力-状態安定性によるZO-FOギャップの解消 [math.OC, cs.LG, cs.NA, cs.SY, eess.SY, math.NA]目的:ゼロ次最適化アルゴリズムと一次最適化アルゴリズムの収束性に関する研究
    • 最適化アルゴリズムは機械学習や深層学習など,幅広い分野で不可欠な技術である。
    • ゼロ次アルゴリズムは,一次アルゴリズムに比べて反復回数に依存する傾向があり,性能面で劣るという課題があった。
    • 入力-状態安定性の概念を用いて,ゼロ次アルゴリズムの収束性を一次アルゴリズムと同等レベルに改善することを目指す。
    • 本研究では,特定の条件下において,ゼロ次アルゴリズムの収束レートが一次アルゴリズムと同程度であることを理論的に示した。
    • ゼロ次アルゴリズムの平均的な振る舞いが,有界の摂動を伴う一次アルゴリズムの平均的な振る舞いとして表現できることが示された。
    • 摂動のノルムの束縛を小さくすることで,ゼロ次アルゴリズムが一次アルゴリズムの固定点近傍に収束することが確認された。

    Link: https://arxiv.org/abs/2604.25372

  • 最先端AIチャットボット15種による緊急精神医学的トリアージの評価 [q-fin.PM, cs.CE, math.OC, q-fin.CP, eess.AS, cs.RO, q-bio.NC, cs.AI, cs.HC]目的:AIチャットボットによる精神医学的トリアージの性能評価
    • メンタルヘルス問題の増加に伴い,迅速かつ適切な初期評価の重要性が高まっている。
    • 精神医学的トリアージは,主観的な情報に依存するため,判断が難しい場合が多い。
    • AIチャットボットによるトリアージの精度向上と,安全な利用のための課題特定。
    • 最先端AIチャットボットは,緊急性の高い事例をほぼゼロエラーで緊急対応レベルと判断できた。
    • しかし,低~中リスクの事例に対しては,過剰なトリアージ傾向が認められた。
    • 医師の合意と照らし合わせ,AIのトリアージ性能を客観的に評価した結果である。

    Link: https://arxiv.org/abs/2604.25415