arXiv雑要約

AI - 2026/06/15 公開

CARE：科学実験における証拠の監査的レビューを通じてLLM生成ポリシーを制御する [cs.CL, cs.LG, cs.AI]目的：LLM生成ポリシーの制御方法
- 科学実験の自動化は，発見の加速と効率化に不可欠である。
- LLMを直接制御に用いると，安全性と安定性が課題となる。
- LLMの創造性を活かしつつ，安全性を確保する制御方法を確立する。
- CAREは，LLMの提案を監査可能なゲートで評価し，証拠に基づいた選択を可能にする。
- Minerva/Olympusベンチマークにおいて，最終的な最良スコアが80.0から88.5へ，ChemLexでは83.9から92.1へと向上した。
- LLMの自己進化は，監査可能なコントローラー下で提案空間を拡大することで，より信頼性が高まることが示唆された。
Link: https://arxiv.org/abs/2606.14581
異種鉄道システムにおける混乱を考慮した動的ルート最適化のための時間計画フレームワーク [cs.AI]目的：異種鉄道システムにおける動的ルート最適化と混乱管理のためのフレームワーク
- 鉄道運行の安全性と定時性を確保する上で，効率的なルート最適化は不可欠である。
- 異なる軌間や速度を持つ鉄道網では，インフラの互換性などにより連携が複雑になる。
- 手動による意思決定への依存を減らし，鉄道運行における安全性向上を目指す。
- 本フレームワークは，軌間互換性などの制約と，様々な混乱シナリオを明示的にモデル化する。
- 実験結果から，提案フレームワークは異種鉄道システムに対し，衝突のない時間的運行計画を生成できることが示された。
- 本研究は，手動による意思決定への依存を低減し，鉄道システムの安全性向上に貢献する。
Link: https://arxiv.org/abs/2606.14582
潜在モデルにおける感度成形 [cs.RO, cs.AI]目的：生成ダイナミクスモデルにおける分布外検出の信頼性向上
- ロボットシステムにおける安全な計画実行には，分布外の遷移を確実に検出することが不可欠である。
- 既存手法はダイナミクスを固定視するため，重要な行動選択に対して感度が低い場合に検出が困難となる。
- 学習されたダイナミクスの制御入力に対する局所的な応答感度を高めることで，分布外検出の精度向上を目指す。
- サポート条件付きの制御感度正則化により，高サポート領域における制御入力の変化に対する局所的な応答感度を促進する。
- これにより，制御によって引き起こされる変動を維持しつつ，弱い経験的サポートによる不安定な外挿を抑制する。
- ビジョンベースの障害物回避，操作，実ロボットナビゲーション実験において，分布外検出性能と安全な閉ループ計画が向上した。
Link: https://arxiv.org/abs/2606.14585
エラーが物語となる時：プロダクションLLMエージェント実行環境におけるサイレントフェイルの縦断的分類 [cs.SE, cs.AI, cs.DC]目的：プロダクション環境におけるLLMエージェントのサイレントフェイルの分類
- LLMエージェントは自律的に動作するため，システムの信頼性確保が重要である。
- 従来のシステムでは検知が困難な，人間へ伝達されないサイレントフェイルが存在する。
- LLM特有のサイレントフェイルのメカニズムを明らかにし，対策を提示する。
- サイレントフェイルは，環境，設計，エラー処理，LLMの特性，運用など，様々な要因によって発生する。
- サイレントフェイルの70%は，テストや監査ではなく，ユーザーの観察によって発見された。
- 監査は事前予防ではなく，リグレッション（回帰）テストとして有効である。
Link: https://arxiv.org/abs/2606.14589
AudioDER：ポストトレーニング大規模オーディオ言語モデルのための重複排除強化推論データセット [cs.SD, cs.AI]目的：大規模オーディオ言語モデルの推論能力向上を目指した，重複排除処理を施したデータセット
- 音声理解の分野では，大規模言語モデルの活用が進んでいる。より高度な推論能力が求められている。
- 既存の音声データセットは，内容が重複しており，多様性やポストトレーニングの効果を制限している。
- データセットの多様性を高め，重複を排除することで，音声推論能力の向上を図る。
- AudioDERは，約19.1万件の音声，質問，回答，キャプション，推論経路を含むデータセットである。
- AudioDERを用いたポストトレーニングにより，Qwen2-Audio-7B-Instructの複数の音声推論ベンチマークにおける性能が向上した。
- 本データセットは，音声推論研究とより高性能な大規模オーディオ言語モデルの開発に貢献することが期待される。
Link: https://arxiv.org/abs/2606.14591
機械貢献者の規制：オープンソースにおけるガバナンスと政策の整合性 [cs.SE, cs.AI]目的：オープンソースにおけるAI貢献者のガバナンスと政策の現状分析，およびその整合性に関する考察
- オープンソースソフトウェアは現代社会の基盤であり，その健全な発展は不可欠である。
- AI貢献者の増加に伴い，既存のオープンソースのガバナンス体制が機能不全に陥る可能性が生じている。
- AI貢献者に関する政策の整合性を評価し，調和のとれた枠組みを提案することで，この課題を解決する。
- オープンソース組織におけるAI貢献者に関するポリシーは断片的であり，統一された基準が存在しないことが判明した。
- EU AI ActやNIST AI RMFなどのAIガバナンスフレームワークと，実際の貢献ポリシーとの間に整合性の欠如が見られた。
- AI貢献者のポリシーを，開示，責任，人的監視などの6つの側面から分類し，成熟度スコアを算出する分類体系を提案した。
Link: https://arxiv.org/abs/2606.14594
より大きな領域へのTransformerニューラル演算子のゼロショット汎化 [cs.LG]目的：偏微分方程式の解作用素の近似
- 複雑な形状におけるPDEの近似計算において，ニューラル演算子は重要な役割を担う。
- 既存手法は固定の領域サイズを前提としており，推論時の汎化性能に限界がある。
- 訓練領域よりも大幅に大きな領域へのゼロショット推論を可能にすること。
- 提案手法では，アテンションロジット計算に分解可能なバイアスを導入し，局所性を制御。
- ロータリー位置埋め込みと組み合わせることで，空間的サポートを制御した表現力を実現。
- 2つのPDEベンチマークと3D産業用大気流れアプリケーションで，ゼロショット汎化性能が大幅に向上。
Link: https://arxiv.org/abs/2606.14597
拡散Transformer向けネイティブINT8計算の実現：Ideogram 4.0用融合INT8 GEMMカーネル [cs.LG]目的：拡散TransformerにおけるINT8計算の高速化
- 拡散モデルは画像生成において重要な役割を果たし，その高速化は実用上の課題である。
- 消費型GPU上でのINT8量子化は，FP8やNF4に比べて速度が遅いという問題がある。
- GPUのINT8テンソルコアを活用し，INT8計算のパフォーマンスを向上させる。
- 提案手法は，Ideogram 4.0の線形層に組み込むことで，bf16と比較して2.8〜4.2倍高速化を実現した。
- 768px画像生成において約1.1倍（9-10%）の速度向上を示し，1024px画像生成ではRTX 3090で156.5秒と，NF4やFP8よりも高速に完了した。
- 画像品質に測定可能な劣化は見られず，INT8は最速の選択肢となり，1024pxの単一GPUでの生成が可能になった。
Link: https://arxiv.org/abs/2606.14598
水素マルチエネルギーシステムにおける運用閾値検出と展開可能な派遣コントローラー開発のための統計的機械学習フレームワーク [cs.CL, cs.LG, cs.SY, eess.SY, math.OC, stat.CO]目的：水素マルチエネルギーシステムにおける運用特性の把握と制御最適化
- エネルギーシステムの効率化は，持続可能な社会の実現に不可欠である。
- 水素エネルギーシステムの運用データ解析は，複雑な非線形性を含み困難である。
- 統計的機械学習を組み合わせることで，より高精度なシステムモデルと制御を実現する。
- 太陽光発電量が水素生産量の変動の45.7%を説明し，高い相関関係が確認された。
- 風力発電は二変量相関が低いにも関わらず，Random Forest分析で最も重要な予測因子としてランク付けされた。
- 24時間周期の強い自己相関（r=0.845）を利用した時系列モデルにより，運用予測の精度向上が示された。
Link: https://arxiv.org/abs/2606.14601
モバイルヘルスにおける多時間軸行動予測のための深層学習アーキテクチャの比較研究 [cs.RO, cs.CE, q-bio.MN, q-bio.QM, cs.LG, cs.AI]目的：モバイルヘルスデータに対する多時間軸行動予測アーキテクチャの比較
- ウェアラブルデバイスから得られる行動データは，予防的な健康介入を支援する上で重要性が増している。
- 既存研究では，これらのデータに対する現代的な予測アーキテクチャの体系的な比較が不足していた。
- 異なるアーキテクチャの汎化性能や，個人レベルでのファインチューニングの効果を明らかにすること。
- 単一のアーキテクチャが常に優位性を示すわけではなく，PatchTSTが訓練モデルの中で最良の結果を示した。
- ゼロショットでの性能は，TimesFMが訓練モデルと同等またはそれを上回る場合があり，特にデータが少ない場合に有効であった。
- 個人レベルでのファインチューニングは，特徴ごとのRMSEを16〜60％削減し，睡眠データが最も恩恵を受けた。
Link: https://arxiv.org/abs/2606.14604
専門家主導型生存機械：複数の臨床コホートにおける層別化と解釈性の向上 [cs.LG, cs.AI]目的：生存予測における層別化と解釈性の向上
- 医療現場や臨床研究において，生存予測は患者管理と介入の最適化に不可欠である。
- 既存の深層学習モデルは，患者全体に対して共通の特徴表現を学習するため，患者サブグループ間の差異を見逃しやすい。
- 患者の異質性を捉え，より個別化された生存予測とリスク評価を実現すること。
- 提案手法AdaCSMは，複数の臨床コホートにおいて，最先端の生存分析モデルと比較して予測性能が向上した。
- MoEフレームワークを活用することで，患者パターンに応じた専門家によるリスク予測が可能となり，解釈性の高い結果が得られた。
- 動的なルーティングメカニズムにより，患者の生存予測とサブタイプクラスタリングを同時に最適化できる。
Link: https://arxiv.org/abs/2606.14608
潜在空間の月光：ベートーヴェン第27番第2楽章と機械学習メカニズムのキラリティーと構造的対応 [cs.CE, cs.SI, cs.SD, cs.AI, eess.AS]目的：ベートーヴェンの「月光ソナタ」の構造と機械学習アーキテクチャの対応
- 音楽の構造と認知メカニズムの解明は，芸術理解の深化に不可欠である。
- 音楽構造の分析には，音楽理論に依存した解釈が中心であり，客観的評価が困難である。
- 音楽構造を機械学習の観点から捉え，新たな分析手法の可能性を示す。
- 「月光ソナタ」の各楽章が，それぞれストリーミング，リカレント，周期的な位置エンコーディングメモリアーキテクチャを実装していることが示された。
- 楽曲の「温度」は分布の幅ではなく，スループットによって制御されるという反直観的な結果が得られた。
- エンコード・デコードサイクルのキラリティー測定から，自然言語の方が音楽よりも強い順序制約を持つことが示唆された。
Link: https://arxiv.org/abs/2606.14612
拡散Gemmaが実際にトークンをコミットする方法：並列でもシーケンシャルでもない [cs.LG]目的：拡散Gemmaのトークンコミット順序の計測と分析
- 拡散言語モデルの並列処理は，高速なテキスト生成に不可欠であり，その効率性向上は重要な課題である。
- 拡散モデルの実際のトークンコミット順序は測定されておらず，並列処理の特性が不明確であった。
- 拡散Gemmaのトークンコミット順序を詳細に分析し，並列処理の度合いを明らかにすること。
- 拡散Gemmaは，トークンを完全に並列に，またはブロック単位でシーケンシャルにコミットするのではなく，弱い左から右へのコミットバイアスを示す。
- モデルの「ブロックサイズ」は，アーキテクチャによるものではなく，計測粒度によって変化する。
- JSONのような構造化データでは，ほぼランダムな順序でコミットされ，数学的推論の精度はコミットの確信度と相関するが，事実の想起には影響しない。
Link: https://arxiv.org/abs/2606.14620
優秀な検証器が悪化する場合：自己改善VLMは新しいタスクで後退する可能性がある [cs.CL, cs.CE, cs.CR, cs.AI]目的：視覚言語モデルの自己改善における検証器駆動型自己DPOの現象
- 視覚言語モデルの性能向上は，様々な応用において不可欠である。
- 検証器の品質はタスクに依存し，汎用的な性能評価が困難である。
- タスク固有の検証器品質を評価し，適切な検証器を選択する必要がある。
- 検証器の性能が高いタスクでも，別のタスクでは性能が低下することが確認された。
- 性能低下は，検証器の誤りが自信を持って学習に反映されることで悪化する。
- 検証器駆動型の学習ループを実行する前に，ターゲットタスクの性能評価が重要である。
Link: https://arxiv.org/abs/2606.14629
制御関数用具変数法のグラフ拡散残差 [cs.LG]目的：制御関数用具変数推定における第一段階の残差抽出手法の開発
- 因果推論において，交絡の存在下で処理効果を正確に推定することは重要である。
- 従来の具変数法では，柔軟な制御関数を用いると残差情報が不足する可能性がある。
- グラフ拡散を用いた残差抽出により，より正確な処理効果の推定を目指す。
- 提案手法A-IHFは，グラフ上の特徴量を用いた拡散を通じて，治療効果の大きな変化を検出し，残差情報を抽出する。
- A-IHFは，54の合成ベンチマークにおいて，既存手法と比較して最も低い構造応答MSEを達成した。
- グラフが第一段階の構造を捉える場合に，特に高い性能が発揮される。
Link: https://arxiv.org/abs/2606.14636
自己教師あり音声モデルから専門家混合モデルへ：堅牢な反スプーフィングのために [cs.SD, cs.AI]目的：スプーフィング検知の汎化性能向上
- 音声合成技術の進歩により，現実と区別がつかない音声が生成され，スプーフィング攻撃が高度化している。
- 既存のスプーフィング対策システムは，未知の合成手法に対して頑健性に欠けるという課題がある。
- 自己教師あり学習で獲得した表現を活かし，未知の合成手法にも対応可能なスプーフィング検知手法を確立する。
- 提案手法では，自己教師あり音声表現モデルを専門家混合(MoE)アーキテクチャに変換することで，音響特徴の多様な側面を捉える。
- 14個のデータセットを用いた評価の結果，マクロEERを5.46%から4.81%に低減し，ベースラインと比較して11.9%の改善を達成した。
- MoE変換におけるアーキテクチャ選択の影響や，専門家の活性化パターンについても分析を行った。
Link: https://arxiv.org/abs/2606.14639
サブ線形ノイズ付きプローブを用いたオンライン凸最適化 [cs.LG, cs.DS]目的：凸集合上でのオンライン凸最適化における後悔最小化
- 機械学習の分野において，オンライン学習は動的に変化する環境への適応に不可欠である。
- 従来のオンライン凸最適化は，フィードバックの効率性やノイズに対するロバスト性に課題があった。
- 本研究は，サブ線形かつノイズを含むプローブを利用することで，オンライン凸最適化の性能を向上させることを目指す。
- サブ線形かつノイズを含むプローブの予算が，最悪の場合のオンライン凸最適化における後悔を改善することが示された。
- 後悔の上界は，プローブの予算$k$とノイズの度合い$\delta$に応じて適切に変化し，理論的な限界に近い値を示した。
- 本研究のアプローチは，pairwise probingの利点を分散減少効果によって定量化し，連続型指数重みの解析を簡素化する。
Link: https://arxiv.org/abs/2606.14640
注意を伴うリスニング：Transformerベースの音声モデルに対するエントロピー誘導型解釈可能性 [cs.SD, cs.AI]目的：Transformerベースの音声モデルにおける解釈可能性の向上
- 高精度な音声認識は，人間と機械の円滑なコミュニケーションに不可欠である。
- Transformerモデルの予測根拠は不透明であり，解釈性に課題がある。
- モデルの内部構造を活用し，より忠実で局所的な解釈を生成すること。
- 提案手法LEAF-Xは，エントロピー誘導型注意重み付けと多層注意展開を組み合わせる。
- LEAF-Xは既存手法と比較して，解釈の忠実度を32%向上させた。
- また，LEAF-Xは局所性とスパース性を高め，安定した帰属度を生成した。
Link: https://arxiv.org/abs/2606.14647
どの方向が重要か：アフィンロバスト最適化のための疎設計 [cs.LG, math.OC]目的：アフィンロバスト最適化における疎設計
- 機械学習と最適化において，不確実性のモデル選択は不可欠である。
- 有限の辞書と予算制約下では，どの不確実性方向を考慮すべきか不明である。
- 評価方向におけるカバレッジを最大化するデータ駆動型の選択規則を提案する。
- 提案手法は，閉じた形式のサポート関数を持つアトミックな不確実性集合を生成し，アフィン目的関数を持つロバスト計画問題を扱いやすくする。
- カバレッジ目標関数は単調かつ劣モジュラー性を持つことが証明され，貪欲法による$(1-1/e)$近似保証が得られた。
- 選択された部分集合からの損失を限定する証明と，サンプル外制御を行う半径較正規則も提供する。
Link: https://arxiv.org/abs/2606.14648
分離可能な信号を通じた非線形報酬関連を持つグラフ構造の組み合わせセミバンディット [cs.LG]目的：広範な相互接続データにおける最適な構造の特定
- 複雑なデータ構造から有用な情報を抽出する上で，効率的な探索は不可欠である。
- 非線形な統計的関係が遍在し，効率的な学習と予測が困難になっている。
- 非線形報酬関連を考慮したグラフ構造の組み合わせセミバンディット問題を解決する。
- 提案手法は，時間に対して亜線形，データ量に対して線形の性能保証を持つことが示された。
- ノイズ，モデル収束，解空間の不一致といった不確実性に対してロバストであることが確認された。
- 合成データと実世界の交通データを用いた数値実験により，実用的な有効性が示された。
Link: https://arxiv.org/abs/2606.14650
クロスドメインアクションシーケンスの解釈可能なワークフローへの抽象化 [cs.AI, cs.CL, cs.LG]目的：デジタルアプリケーション利用状況の客観的な記録であるシーケンシャルログから，意味のある知見を抽出すること
- デジタル製品の改善には，現実世界のユーザーインタラクションに基づいた知見が不可欠であるため，利用ログ分析が重要である。
- 既存の手法はノイズに弱く，アプリケーション間の汎化が困難であるという課題が存在する。
- 大規模言語モデルを用いて，低レベルのアクションシーケンスを高レベルな活動に抽象化し，その課題を解決することを目指す。
- 本研究で提案するWorkflowViewは，ブラウザログからのタスク説明再構築において高い意味的類似性を達成した（μsim = 0.91）。
- MOOCのインタラクションログを用いた学生のドロップアウト予測において，わずか5つのfew-shot事例でweighted F1 = 0.90に達した。
- Microsoft WordにおけるAIツール統合のワークフロー分析において，匿名性とプライバシー保護を両立した分析を可能にした。
Link: https://arxiv.org/abs/2606.14654
AIに頭痛を負わせる：コンピュータビジョンアプリケーションへの音響的敵対的攻撃 [cs.CV, cs.AI]目的：コンピュータビジョンシステムに対する音響的敵対的攻撃の実現可能性
- AIは自動運転，顔認識，セキュリティなど様々な分野で活用が拡大しており，その信頼性が重要である。
- 既存の研究では高周波数帯域の音響振動を使用しており，距離が短いという課題があった。
- 可聴域の低周波数音響振動を利用し，AIコンピュータビジョンシステムの脆弱性を明らかにすること。
- 可聴域の音響振動により，市販のカメラに共振を発生させ，オブジェクト検出モデル（YOLO11）の誤動作を実験的に確認した。
- AIコンピュータビジョンシステムが攻撃を受けやすい要因を特定し，将来的な対策開発に貢献する知見を得た。
- カメラの内部安定化メカニズムが想定外の振動に弱く，画像にアーティファクトが発生することで誤認識が誘発されることが示された。
Link: https://arxiv.org/abs/2606.14658
タスク性能を超えて：音声特徴量を用いた生物音響埋め込みの解読 [cs.DC, cs.LG, cs.SD]目的：生物音響埋め込みに含まれる音響特徴量の解明
- 生物音響学は，動物の行動や生態を理解する上で重要な役割を担う分野である。
- 既存の埋め込みモデルがどのような音響特徴を捉えているか不明瞭であり，希少種への応用が困難である。
- 埋め込みモデルが捉える音響特徴を特定し，モデル選択の指針を提供する。
- 事前学習された埋め込みモデルは，特定の音響特徴に特化しており，単一のモデルでは完全な音響空間を捉えられないことが示された。
- 複数のモデルを組み合わせた埋め込みが，最も高い性能を発揮し，相補的な音響空間のカバー範囲が示唆された。
- 音量特徴は高い再現性($R^2 = 0.76$)を示す一方，基本周波数は再現が困難($R^2 = 0.33$)であった。
Link: https://arxiv.org/abs/2606.14662
いつ書くべきか，いつ抑制すべきか：ルート特化型デュアルアダプターによる知識編集支援 [cs.LG]目的：知識編集における事実の更新と周辺行動の維持
- 大規模言語モデルの知識は不正確な場合があり，正確な更新が重要である。
- 既存手法では，更新時に不要な知識が損なわれることがある。
- 編集すべき場合と抑制すべき場合を識別し，正確な知識編集を実現する。
- 提案手法は，3つのベンチマーク（\cf{}，\zsre{}，\mquake{}）において，既存手法を上回る確率的優先度精度を達成した。
- 特にLlama-3.1-8B-Instructでは，\cf{}で0.8180，\zsre{}で0.8946，\mquake{}で0.9922という結果が得られた。
- ルート決定のメカニズムは，データセットによって最適な手法が異なり，文脈に応じた柔軟性が重要であることが示された。
Link: https://arxiv.org/abs/2606.14668
LLMエージェントワークフローにおける並列ブランチのための直接的な潜在空間合成 [cs.AI, cs.CL]目的：LLMエージェントワークフローにおける並列ブランチの合成手法
- LLMはエージェントシステムの実行エンジンとして重要だが，テキストインターフェースに依存している。
- 並列ブランチ構造が失われ，不要な計算が発生するテキスト結合による合成に課題がある。
- 並列ブランチのKVキャッシュを直接利用する合成手法を開発し，効率化を目指す。
- Parallel-Synthesisは，並列ワーカーエージェントが生成したKVキャッシュを直接利用する合成フレームワークである。
- 9つのデータセットで，テキストベースの合成と同等またはそれ以上の性能を示した。
- 最初のトークンまでの時間が2.5倍～11倍短縮され，効率的な合成の可能性が示された。
Link: https://arxiv.org/abs/2606.14672
圧縮計算は（おそらく）重ね合わせ計算ではない [cs.LG]目的：圧縮計算モデルの重ね合わせ計算としての妥当性
- ニューラルネットワークの表現能力向上は，AI研究の根幹をなす重要な課題である。
- 従来のニューラルネットワークでは，表現能力と計算量のトレードオフが存在する。
- 圧縮計算モデルが本当に重ね合わせ計算を利用しているか検証し，そのメカニズムを解明する。
- 圧縮計算モデルの性能向上は，入力の混合に起因するものであり，重ね合わせ計算によるものではないことが示された。
- 学習されたニューロンの方向は，混合行列の上位固有値に対応する部分空間に集中しており，混合項が解を支配していることが示唆される。
- 混合行列のみから導出されたSNMFベースラインは，既存のベースラインを上回り，モデルの損失プロファイルを再現する。
Link: https://arxiv.org/abs/2606.14673
汎用凸集合におけるオンライン在庫最適化のための最適な隠れ目標学習 [cs.CL, cs.LG, cs.SY, eess.SY, math.OC, stat.ML]目的：オンライン在庫最適化における最適な隠れ目標学習手法の開発
- 在庫最適化はサプライチェーン管理の重要な要素であり，効率的な運用に不可欠である。
- 既存手法では，需要の変動や制約条件への対応が難しく，最適な在庫レベルを維持することが困難である。
- 一般的な凸集合においても，より精度の高いオンライン在庫最適化を実現し，損失を最小化すること。
- 提案手法は，一般的な凸集合におけるオンライン在庫最適化において，最良の結果が得られることが証明された。
- オンライン勾配降下法を基本学習器として用いることで，後悔保証を改善し，理論的限界に近づけた。
- 本研究の結果は，合成データおよび実際の在庫データを用いた実験によって検証され，理論的な裏付けが得られた。
Link: https://arxiv.org/abs/2606.14679
HumP-KD: 高度な不確実性認識を用いた多段階プログレッシブ知識蒸留フレームワークによる効率的な火災分類 [cs.CV, cs.LG]目的：効率的な火災分類のための知識蒸留フレームワーク
- リアルタイム火災分類は，人命と財産を守る上で重要である。
- 限られた計算資源での高精度な火災分類モデルの実現が課題である。
- 軽量なモデルで高精度かつロバストな火災分類を可能にすることを目指す。
- 提案手法HumP-KDは，Dataset-IIにおいて平均F1スコア0.9876±0.0063を達成し，知識蒸留なしのMobileViT-Sベースライン（0.9537±0.0351）を大きく上回った。
- HumP-KDは，Swin-TinyやViT-Baseと比較してパラメータ数を大幅に削減しつつ，高い性能を維持している。
- CPUでの処理速度は37.72 FPSであり，リアルタイム展開に適している。
Link: https://arxiv.org/abs/2606.14684
コットンリーフビジョン：綿の葉病分類のための説明可能で堅牢な深層学習フレームワーク [cs.CV, cs.AI]目的：綿の葉病分類の精度向上
- 綿は繊維産業の基盤であり，経済的に重要な作物である。
- 葉病の正確な識別・検出が困難であり，経済的損失につながる。
- 深層学習を活用し，より高精度で信頼性の高い葉病分類を実現する。
- DenseNet201を用いて98%という高い分類精度を達成した。
- Grad-CAMやオクルージョン感度分析，敵対的学習により，モデルの解釈性とロバスト性を高めた。
- 実用的な農業アプリケーションのプロトタイプを開発し，現場での活用を検証した。
Link: https://arxiv.org/abs/2606.14686
洪水と収穫：言語生成の限界における自明性の数学的価値生成における証明可能性 [cs.LG, cs.AI, cs.CL, cs.DS]目的：数学的価値の生成における自明性の必要性
- 形式的な数学の自動生成は進展しているが，数学者が価値を認める結果を得るには限界がある。
- 証明検証器が検証可能な範囲と，数学者が価値を認める範囲とのギャップが課題となっている。
- 検証器の役割を明確化し，自明性の量が数学的価値の生成に与える影響を解明する。
- 検証器は単なる「好み」ではなく，適切な範囲をカバーする上で重要な役割を果たす。
- 自明性の許容度が有限の場合と無限の場合で，数学的価値のカバー率が大きく異なることが示された。
- 数学における価値ある情報の網羅には，無限に，しかし漸近的に無視できる量の自明性が不可欠である。
Link: https://arxiv.org/abs/2606.14688
多群平均推定における能動学習のための複雑度尺度 [cs.LG, cs.IT, math.IT]目的：多群平均推定における能動学習のmax-risk目的関数の最適化
- 機械学習において，限られたデータから効率的に学習することは重要である。能動学習は，そのための有効な手法の一つである。
- 多群平均推定問題では，各群の不確実性のばらつきが大きく，効率的なサンプル割り当てが課題となる。
- 本研究は，能動学習におけるサンプル割り当ての難易度を測る新たな複雑度尺度を提案し，理論的な限界を示す。
- 提案手法は，予算，不均一性，モデル依存的な複雑度という3つの要素に難易度を分解する。
- 滑らかなクラスにおいては，提案する複雑度尺度が分散とFisher情報の再パラメータ化と等価になる。
- 既存の上界との比較から，広範な状況下でほぼ最適性が示され，特に不均一なインスタンスにおいてギャップが特定された。
Link: https://arxiv.org/abs/2606.14690
多目的多エージェント強化学習における協調的な選好学習 [cs.CL, cs.MA, cs.AI]目的：多目的多エージェント強化学習における協調的な選好
- 複数目的の達成とエージェント間の協調が重要であり，複雑な問題解決に役立つ。
- エージェント間の目的の衝突や観測・役割の違いによる協調性の欠如が課題である。
- エージェント固有の選好を学習し，互いに補完的なトレードオフを可能にすること。
- 提案手法PCMAは，エージェント固有の選好を協調的に学習し，チーム全体のパフォーマンス向上に貢献する。
- 理論的には，チーム最適ゲームとして定式化し，選好の多様性がチーム改善を導くことを示す。
- 複数の協調的MOMA環境と交通制御シナリオにおいて，PCMAが性能とトレードオフの協調性を向上させることを実証した。
Link: https://arxiv.org/abs/2606.14693
ペルソナ・プルーナー：ロールプレイングのための軽量モデルの構築 [cs.CL, cs.LG, cs.CL]目的：ロールプレイングにおける軽量モデルの構築手法
- 大規模言語モデルは対話システムに大きな可能性をもたらす。多様なキャラクターやペルソナを表現することが求められる。
- 多数のキャラクターを同時に扱う場合，計算コストが課題となる。汎用モデルの利用は非効率的である。
- ペルソナ固有の情報を効率的に捉え，計算コストを削減する手法の開発。
- Persona-Prunerは，ペルソナ記述から特定の特徴的なサブネットワークを抽出し，軽量なロールプレイングモデルを構築する。
- 既存のプルーニング手法と比較して，ロールプレイング性能の低下を最大93.8%まで抑制できることが実験で示された。
- 汎用言語モデルの能力を維持しつつ，効率的なペルソナ表現を実現する。
Link: https://arxiv.org/abs/2606.14695
ClinHallu：医療MLLM推論における段階的幻覚診断のためのベンチマーク [cs.CV, cs.AI, cs.CL]目的：医療MLLM推論における段階的幻覚診断のためのベンチマーク
- 信頼性の高い臨床意思決定支援には，医療MLLMの信頼性が不可欠である。
- 既存の医療幻覚ベンチマークはデータ収集に重点が置かれ，推論過程のどの段階で幻覚が発生するかは無視されている。
- 推論過程における幻覚発生源の特定と，その軽減を目指す。
- ClinHalluは，視覚認識，知識想起，推論統合の３段階で構成される7,031件の検証済みインスタンスを含む。
- 段階置換介入により，特定の段階を修正することで最終的な回答への影響を測定できる。
- トレース監視型ファインチューニングは，段階的な幻覚を軽減することが示された。
Link: https://arxiv.org/abs/2606.14697
視線ヘッド：VLMがどのように記述対象を見ているか [cs.CV, cs.CL, cs.LG]目的：ビジョン言語モデルにおける画像記述メカニズムの解明
- 視覚と言語を結びつけるVLMは，多様な応用が期待される重要な分野である。
- VLMが画像記述をどのように実現しているかの内部メカニズムは未だ不明確である。
- VLMの画像記述メカニズムを特定し，その制御方法を確立することを目的とする。
- モデルは，画像記述時に注視する領域を追跡する「視線ヘッド」と呼ばれる少数の注意ヘッドを持つことが明らかになった。
- 上位100の視線ヘッドへの注意マスク介入により，83.1%の精度でモデルの回答を任意の漫画パネルに誘導できる。
- このメカニズムは，モデルサイズやアーキテクチャに依存せず，推論時にモデルの行動を制御するための実用的な手段となり得る。
Link: https://arxiv.org/abs/2606.14703
GAGPO：汎化されたアドバンテージグループ化された方策最適化 [cs.CL, cs.AI, cs.LG]目的：多段階環境における正確なステップ整合的時系列的なクレジット割り当て
- 大規模言語モデルエージェントの強化学習は強力だが，多段階環境でのクレジット割り当ては課題である。
- 報酬が希薄で，どの行動が成功または失敗に貢献したかを特定することが難しいという問題がある。
- 補助的な価値モデルに頼らずに，遅延した結果を個々の意思決定ステップに遡及させることを目指す。
- GAGPOは，サンプルロールアウトから非パラメトリックなグループ化された価値プロキシを構築する。
- TD/GAEスタイルの時系列的なアドバンテージを計算し，結果の監督を時間を通じて遡及的に伝播させる。
- ALFWorldとWebShopでの実験により，GAGPOは強力な強化学習ベースラインよりも優れていることが示された。
Link: https://arxiv.org/abs/2605.13217
シンプレックス制約スパースバギング：アンサンブル学習における一様事前分布からスパース事後分布への移行 [cs.LG, cs.AI]目的：ブートストラップに基づくバギングアンサンブルの，学習後の圧縮と確率較正
- アンサンブル学習は，個々のモデルの弱点を補い，汎化性能を向上させる重要な手法である。
- 標準的なバギングでは，すべての基評価器に均一な重みが与えられ，モデルの過信につながることがある。
- 基評価器の局所的な能力差を考慮し，モデルの過信を抑制することで，より正確な確率予測を実現する。
- シンプレックス制約スパースバギング(SCSB)は，アンサンブルを最大96%圧縮し，推論速度を向上させる。
- SCSBは，確率較正(期待較正誤差の低減)を改善しつつ，汎化性能を維持または向上させる。
- L1-シンプレックスのパラドックスに対処するため，凹二次ペナルティを導入し，スパース性を誘導する。
Link: https://arxiv.org/abs/2606.13589
モバイル睡眠段階推定のための軽量ランダムアテンションによる効率的な時間的モデリング [eess.SP, cs.AI, cs.LG]目的：モバイル環境における睡眠段階推定の効率化
- 在宅での睡眠モニタリングや閉ループ変調の基盤技術として，睡眠段階推定の重要性が高まっている。
- 既存のRNNやTransformerなどの系列モデルは，計算コストが高く，モバイルデバイスへの実装が困難である。
- 固定乱数射影に基づく軽量な時間的モデリングモジュールにより，効率的な睡眠段階推定を実現すること。
- 提案手法であるRandom Attention (RA)は，学習可能な系列モデリングの代わりに類似度に基づく集約を用いることで，パラメータ数を抑制しつつ効果的な時間的平滑化を実現した。
- 理論的解釈であるRandom Attention Prior Kernel (RAPK)により，RAが時間的睡眠構造をグローバルな平滑化項と特徴量類似度項に分解することが示された。
- Sleep-EDF-20およびSleep-EDF-78における実験で，RAは既存手法と比較して1-3％の精度およびF1スコアの向上を示し，LSTM，GRU，Transformerと同等の性能を達成した。
Link: https://arxiv.org/abs/2606.13694
Korzhinskii-Net：地下鉱床予知モデリングのための物理情報ニューラルネットワーク [physics.geo-ph, cs.AI, cs.LG]目的：地下鉱床予知モデリングの精度向上
- 鉱物資源探査において，経済性を左右する重要な要素。
- 既存手法は地表データに依存し，地下の物理現象を考慮していない。
- 地表データと物理モデルを統合し，より正確な鉱床予知を実現する。
- Korzhinskii-Netは，古典的な手法と比較してPR-AUC平均値0.885に対して0.281という大幅な改善を示した。
- この改善は，ニッケル，銅，金，ダイヤモンドの4つの商品クラスと5つの鉱床帯域全体で一貫して見られた。
- 物理情報に基づく微分可能なシミュレーターは，地表データのみでも鉱床の位置パターンを正確に捉えることが可能である。
Link: https://arxiv.org/abs/2606.13695
LoMC：ルーテッド基盤モデルにおける拒否抑制のための局所多方向補正 [stat.ML, cs.LG]目的：ルーテッド基盤モデルにおける拒否抑制の制御手法
- 大規模言語モデルの安全性確保は，その実用化において不可欠な課題である。
- 既存の広範囲な修正は汎用的な計算能力を損なう可能性があり，限定的な修正は十分な効果を発揮しない。
- 局所的な多方向補正により，拒否表現を効果的に修正しつつ，汎用性を維持することを目指す。
- LoMCは，サポート層をゲートとして利用し，補正能力を向上させつつ，介入範囲を抑制する。
- テキストとマルチモーダル両方の安全評価において，LoMCは拒否応答を大幅に改善し，汎用性を維持した。
- コンパクトな介入範囲で，拒否抑制と汎用性の両立を実現した。
Link: https://arxiv.org/abs/2606.13709
CisTransCell：遺伝子機能，制御，細胞コンテキストを用いた単一細胞摂動予測 [eess.SP, cs.NI, q-bio.GN, cs.AI]目的：単一細胞における遺伝子摂動応答の予測
- 単一細胞生物学において，細胞の振る舞いを理解するためには，遺伝子摂動に対する応答予測が不可欠である。
- 既存手法では，トレーニングデータに存在しない遺伝子摂動に対する予測精度が課題となっていた。
- 遺伝子機能，転写制御，細胞コンテキストを統合し，未知の摂動に対する予測精度向上を目指す。
- CisTransCellは，遺伝子制御に関する事前知識と，遺伝子産物の機能に関する事前知識を統合した。
- このフレームワークは，遺伝子機能から転写制御，そして最終的な転写変化へのカスケードとして摂動応答をモデル化する。
- ベンチマークデータセットにおける実験により，CisTransCellがゼロショット摂動予測において高い性能を発揮することが示された。
Link: https://arxiv.org/abs/2606.13713
異常検出における共形校正と随伴探索効果：新物理探索への応用 [hep-ph, cs.LG, hep-ex, stat.ML]目的：新物理探索のための異常検出における，信頼性のある有意性評価手法の確立
- 新物理探索は，素粒子物理学の最重要課題であり，未知の物理現象の発見を目指す。
- 機械学習を用いた異常検出は強力だが，統計的な解釈が不十分であり，偽陽性のリスクが高い。
- 共形予測に基づく校正層を導入し，統計的な信頼性を保証することで，偽陽性を抑制すること。
- 提案手法は，既存の異常スコアを信頼性のあるp値に変換し，分布に依存しない保証を提供する。
- LHC Olympicsデータを用いた検証の結果，背景の形状がp値を歪めている可能性が明らかになった。
- 共形校正層を用いることで，偽陽性を効果的に抑制し，統計的な信頼性を高めることが示された。
Link: https://arxiv.org/abs/2606.13780
再帰的に訓練された拡散モデル：分布の崩壊の抑制とスペクトル特性評価 [stat.ML, cs.LG]目的：生成モデルの再帰的訓練における分布の収束先と収束速度の解析
- 生成モデルは多様なデータ生成を可能にするため，画像生成等，幅広い分野で重要性が増している。
- 生成モデルの再帰的訓練は，モデル崩壊を引き起こし，真のデータ分布から乖離する可能性がある。
- 再帰的訓練における分布の収束メカニズムを解明し，崩壊を抑制する手法を提案することを目的とする。
- 再帰的訓練は，初期停止による影響でデータ分布から徐々に乖離し，幾何的に収束する。
- 収束先は，データ分布のガウス平滑化を無限に繰り返したものの無限混合として表現できる。
- スペクトル分解の結果，再帰的訓練は低域通過フィルタとして機能し，高次モードを減衰させる。
Link: https://arxiv.org/abs/2606.13796
大規模言語モデルと量子演算子の整合 [quant-ph, cs.AI]目的：量子演算子と言語入力を統合したモデリング
- 量子技術の発展には，量子アルゴリズムの効率的な実装が不可欠である。
- 大規模言語モデルは量子表現を理解できず，量子演算の推論に限界がある。
- 言語による制約付き量子回路合成を可能にし，量子認識型基盤モデルの実現を目指す。
- 本研究では，量子演算子をLLMの潜在空間にマッピングする手法を提案し，言語と量子情報の統合的モデリングを可能にした。
- 提案手法は，Pauli回転ゲートを用いたClifford+T回路合成において，最先端の手法と遜色ない結果を示し，学習データ量に応じて性能が向上した。
- 学習時に未見の制約を自然言語で指定することで，言語条件付きの回路合成を実現した。
Link: https://arxiv.org/abs/2606.13811
円錐最適化ソルバーの拡張性のある深層展開 [math.AT, cs.DM, math.CO, math.RT, math.OC, cs.LG]目的：円錐最適化ソルバーの深層展開による高速化
- ロボティクスなどにおける大規模半正定値計画問題の解法が重要である。
- 深層展開を大規模半正定値計画問題に拡張することには課題があった。
- 深層展開を適用し，行列計算のメモリ消費量と数値的安定性の問題を解決する。
- 提案手法では，行列を明示的に形成せずに陰関数微分を用いることでメモリ消費量を削減した。
- Dale\v{c}kii--Krein表現に基づくbackward ruleにより，固有値が重複する場合でも安定した微分を計算できる。
- 実験結果から，提案手法は最先端のソルバーよりも優れており，最大50倍の高速化を実現した。
Link: https://arxiv.org/abs/2606.13825
AIは科学者の論文発表数を減らす手助けができる [physics.soc-ph, astro-ph.IM, cs.AI]目的：論文発表システムの歪みを修正し，より質の高い論文発表を促進すること
- 科学研究の進展には，質の高い論文発表が不可欠である。
- 論文発表の増加が，研究者の時間を圧迫し，質を低下させている。
- AIを活用し，研究者が質の高い研究に集中できる時間的余裕を生み出す。
- AIの適切な活用は，論文発表システムの歪みを正す歴史的な機会を提供する。
- AIを用いることで，より少なく，より質の高い論文を発表することが可能となる。
- 研究者が最高の成果を出すための時間を確保し，研究活動を支援する。
Link: https://arxiv.org/abs/2606.13829
閉ループによる進化探索と不確実性考慮型学習を通じた分布外処理プロトコルの発見 [cond-mat.mtrl-sci, cs.LG]目的：分布外処理プロトコルの発見
- 材料や化学系の挙動は履歴依存性が強く，その機能は最終状態だけでなく操作履歴に左右される。
- プロトコルの探索は高次元であり，既存手法は保守的か，測定コストが非常に高くなる。
- 進化探索と不確実性考慮型学習を組み合わせ，効率的なプロトコル探索を実現する。
- 強誘電体薄膜において，スキャン探針電圧波形を操作プロトコルとして用いることで，非線形性を向上させる波形群を発見した。
- 最適な波形は，あらかじめ存在する弱く固定されたドメイン壁セグメントを選択的に活性化する。
- 本手法は，プロトコル調整を分布外探索と捉え直し，合成や焼きなまし，バッテリー形成などに応用可能である。
Link: https://arxiv.org/abs/2606.13859
残差多タスクニューラルネットワークを用いた多変量星間パラメータ推定 [astro-ph.IM, cs.LG]目的：星間パラメータ推定手法
- 恒星の物理的性質の理解は，天文学の基礎であり，宇宙の進化を解明する上で重要である。
- 従来の星間パラメータ推定は，計算コストが高く，大規模データセットへの適用が困難であった。
- 本研究は，効率的なニューラルネットワークモデルによって，大規模データセットでの正確なパラメータ推定を実現する。
- 提案手法は，有効温度で59.76K，金属量で0.103dex，表面重力で0.130dexの平均絶対誤差を達成した。
- パラメータ範囲に対する誤差は1～3%であり，54万程度の学習パラメータ数で高い効率を実現した。
- コンパクトな残差多タスクアーキテクチャと適切な信号前処理が，非線形パラメータ推定において有効であることが示された。
Link: https://arxiv.org/abs/2606.13868
複素位相構造を持つニューラルネットワーク量子状態に対する直接/適応混合位相勾配学習 [cond-mat.dis-nn, cond-mat.str-el, cs.LG, physics.comp-ph, quant-ph]目的：複素位相構造を持つニューラルネットワーク量子状態の学習方法
- 量子多体系物理学において，変分法は重要な役割を果たす。ニューラルネットワーク量子状態はその有力な手法の一つである。
- ゲージ場やフェルミオン統計などの影響下では，最適化が困難になる位相構造が問題となる。
- 位相勾配の推定方法を改善し，複素位相構造を持つ量子状態の学習を安定化させる。
- 直接的な位相勾配推定子を用いることで，従来の推定子よりも低い誤差で学習が可能となった。
- 100サイトのフラックスラダーにおいて，0.89%の中央値誤差を達成し，従来のベースラインを上回った。
- 適応混合推定子は，分散の面で常に従来の推定子と同等以上の性能を発揮することが示された。
Link: https://arxiv.org/abs/2606.13912
アルツハイマー病診断のためのグラフマッチングネットワーク：テスト時ドメイン適応と多施設構造MRIの活用 [eess.IV, cs.AI, cs.CV]目的：アルツハイマー病診断のためのグラフマッチングネットワーク
- 高齢化社会において，アルツハイマー病の早期診断は医療費抑制や患者QOL向上に不可欠である。
- 従来のグラフベース手法は，画像の種類や施設間差により，診断性能が制限される場合がある。
- 脳の異種グラフ間の関係性を捉え，ドメインシフトを軽減することで，より高精度な診断を目指す。
- 提案手法GMN4ADは，３つの公開ADデータセットにおいて，最先端手法と比較して優れた性能を示した。
- グラフマッチングにより，脳グラフ間の関係性を捉え，診断精度を向上させた。
- テスト時ドメイン適応戦略により，異なる施設間での診断性能のばらつきを抑制した。
Link: https://arxiv.org/abs/2606.13919