arXiv雑要約

AI - 2026/03/24 公開

  • セマンティック・ジオメトリ保存による視覚言語モデルの継続学習 [cs.CV, cs.LG]目的:視覚言語モデルの継続学習におけるセマンティック・ジオメトリの保存
    • 事前学習済みモデルの活用は,様々なタスクで高い性能を示すため重要である。
    • 継続学習において,新しいタスクへの適応時に過去の知識が失われることが課題である。
    • セマンティック・ジオメトリの歪みを抑制し,継続学習の安定性と性能向上を目指す。
    • 提案手法SeGP-CLは,敵対的アンカーを用いたセマンティック・ジオメトリの保存により, catastrophic forgetting を抑制する。
    • アンカーガイドによるクロスモーダルジオメトリ蒸留(ACGD)とテキストセマンティック・ジオメトリ正則化(TSGR)により,クロスモーダル構造とテキスト参照枠を安定化させる。
    • 5つの継続学習ベンチマークにおいて,最先端の性能を達成し,セマンティック・ジオメトリの保存効果が確認された。

    Link: https://arxiv.org/abs/2603.12055

  • 汎化可能な時空間予測のためのグラフを用いたインコンテキスト演算子ネットワーク [cs.LG, cs.AI]目的:汎化可能な時空間予測におけるインコンテキスト演算子学習の有効性
    • 時空間予測は,環境変化の理解や将来予測に不可欠であり,社会への貢献が期待される。
    • 従来の演算子学習は,データセットの規模や複雑さに依存し,汎化性能に課題があった。
    • インコンテキスト演算子学習を用いることで,少ないデータでも高精度な予測を可能にすること。
    • インコンテキスト演算子学習は,同じ学習データを用いた従来の演算子学習よりも複雑なタスクにおいて優れた性能を発揮する。
    • GICONは,空間領域間の汎化と,少ない学習事例からのスケーリングにおいて高いロバスト性を示す。
    • 中国2地域の空気質予測において,インコンテキスト演算子学習がより良い予測結果をもたらすことが示された。

    Link: https://arxiv.org/abs/2603.12725

  • Solidityスマートコントラクトのエラー検出におけるゼロショット推論手法のベンチマーク [cs.AI]目的:Solidityスマートコントラクトにおけるエラー検出と分類の精度評価
    • ブロックチェーンシステムの根幹をなすスマートコントラクトのセキュリティ確保は重要である。
    • スマートコントラクトは脆弱性を抱えやすく,経済的損失や信頼の低下を引き起こす可能性がある。
    • LLMを用いた脆弱性検出の自動化を目指し,最適なプロンプト戦略とモデル選択を明確にする。
    • エラー検出タスクにおいて,CoTとToTはリコールを大幅に向上させるが,精度は低下する傾向が見られた。
    • エラー分類タスクでは,ToTプロンプト下でClaude 3 Opusが最高のWeighted F1-score(90.8)を達成した。
    • CoTプロンプト下でも,Claude 3 Opusは高い性能を示した。

    Link: https://arxiv.org/abs/2603.13239

  • PCA重み付き検索拡張LLMとベイズ平均集約による手術時間予測:PREBA [cs.LG, cs.AI]目的:手術時間の予測精度向上
    • 病院経営において,手術室や医療スタッフの効率的な資源配分は重要である。
    • 質の高いラベル付きデータが必要であり,計算コストが高いという課題がある。
    • ローカルな臨床データに基づいて,より正確で安定した予測を可能にする。
    • PREBAは,PCA重み付き検索とベイズ平均集約により,LLM予測を臨床的証拠と統計的事前分布に基盤させている。
    • 3つの最先端LLMを用いた実データ評価の結果,MAEを最大40%削減,R^2を-0.13から0.62に向上させた。
    • PREBAは,教師あり機械学習と同等の精度を達成し,高い有効性と汎化性能を示した。

    Link: https://arxiv.org/abs/2603.13275

  • Qwen3-Omniを活用したセグメントベースのMLLMフレームワークによるニュアンス感情認識:AH検出 [cs.CV, cs.AI]目的:曖昧性と躊躇のような微妙な心理状態の感情認識
    • 行動介入やデジタルヘルスにおいて,人の微妙な心理状態を理解することの重要性が高まっている。
    • 表情,声のトーン,テキストの意味の不一致など,異なるモダリティ間の矛盾が感情認識の課題となっている。
    • 複雑な感情の矛盾を捉えるための,多言語大規模言語モデルの有効性を検証すること。
    • 提案手法はテストセットで85.1%の精度を達成し,既存のベンチマークを大幅に上回った。
    • 多言語大規模言語モデルが,複雑でニュアンスのある感情の葛藤を捉える能力が実証された。
    • セグメントベース戦略により,長時間の動画処理における計算効率とトークン制約の問題に対処した。

    Link: https://arxiv.org/abs/2603.13406

  • 大規模事前学習のための空間トランスクリプトミクスを画像として [cs.CV, cs.AI]目的:空間トランスクリプトミクスデータの効果的な大規模事前学習手法
    • 臨床・病理研究において,組織内の空間的文脈を考慮した遺伝子発現解析が不可欠である。
    • 既存の事前学習手法では,空間的依存性を無視したり,入力サイズが大きくなり学習効率が低下する問題がある。
    • 空間トランスクリプトミクスデータを画像として扱うことで,大規模事前学習を可能にし,下流タスクの性能向上を目指す。
    • 空間トランスクリプトミクスデータをクロップされた画像として扱うことで,空間的文脈を保持しつつ,訓練サンプル数を大幅に増加させることができた。
    • 提案手法は,従来の事前学習スキームと比較して,下流タスクにおける性能を安定的に向上させることを示した。
    • 空間パッチングとチャネル設計の両方が,効果的な事前学習のために必要であることを検証した。

    Link: https://arxiv.org/abs/2603.13432

  • リアルタイム生成モデル予測制御のための暗黙的最尤推定 [cs.RO, cs.AI, cs.LG]目的:リアルタイム生成モデル予測制御への適用を目指した暗黙的最尤推定の検討
    • ロボットの自律的な行動計画において,多様で複雑な行動分布を捉える重要性が高まっている。
    • 拡散モデルは高性能だが,反復処理による推論速度の遅さがリアルタイム制御への課題となっていた。
    • 推論速度を大幅に向上させ,リアルタイムでの行動計画を可能とする手法の確立を目指す。
    • 暗黙的最尤推定は,標準的な拡散モデルと同等の性能を,より高速な推論速度で実現することが示された。
    • オープンループおよびクローズドループ環境において,計画速度が大幅に改善された。
    • 人間ナビゲーションシナリオにおいて,動的な環境下でのリアルタイムかつ適応的な計画生成が実証された。

    Link: https://arxiv.org/abs/2603.13733

  • 潜在空間は必ずしも平坦ではない:双曲的概念制御 [cs.LG, cs.AI]目的:テキストから画像生成モデルにおける概念の制御手法
    • 生成AIの発展に伴い,安全性確保が重要課題となっている。
    • 既存手法では,概念の微調整が不安定になりやすい。
    • 双曲空間を利用し,より安定した概念制御を実現する。
    • 本研究で提案する双曲的概念制御(HyCon)は,安全性評価において最先端の結果を達成した。
    • HyConは,既存の生成モデルやテキストエンコーダを再利用し,軽量なアダプターを介して接続する。
    • 双曲空間を用いた制御は,信頼性の高い画像生成に有効であることが示された。

    Link: https://arxiv.org/abs/2603.14093

  • 解析力学正則化による物理制約付き方策最適化 [cs.CL, cs.IR, cs.SY, eess.SY, cs.RO, cs.LG]目的:物理制約を組み込んだ方策最適化
    • ロボット制御において,強化学習の活用が期待されるが,サンプル効率が課題である。
    • 既存の方策学習法は,複雑な物理法則をデータから再発見する必要があり,非効率である。
    • シミュレータで利用可能な物理モデルを活用し,効率的な学習を目指す。
    • 提案手法PIPERは,解析的なソフト物理制約を組み込むことで,学習効率と安定性を向上させた。
    • ラグランジュ残差を正則化項として導入することで,ダイナミクス的に整合性の取れた方策を学習する。
    • 既存のシミュレータや強化学習アルゴリズムを修正することなく,物理制約を統合できる点が特徴である。

    Link: https://arxiv.org/abs/2603.14469

  • 思考連鎖によるポリシー対応型エージェント調整:PA3 [cs.CL, cs.AI, cs.LG]目的:ビジネスルール遵守のためのLLMエージェント調整手法
    • LLMを活用した対話型アシスタントはツール利用に優れるが,複雑なビジネスルールへの対応が課題。
    • 全てのポリシーをコンテキストに含めることは,遅延や計算資源の無駄遣いを招き,性能低下の原因となる。
    • 推論時に関連ポリシーを想起・適用する手法により,コンテキスト長を抑制し,性能向上を目指す。
    • 提案手法は,ベースラインモデルを16ポイント上回り,同規模のインコンテキストベースラインを3ポイント上回る性能を示した。
    • また,使用単語数を40%削減し,効率的なポリシー対応を実現した。
    • Jaccardスコアに基づくPolicyRecall報酬と,幻覚に対するペナルティが,性能向上に貢献した。

    Link: https://arxiv.org/abs/2603.14602

  • 推論集約型検索エージェントのための計算資源配分 [cs.IR, cs.AI]目的:推論集約型検索における計算資源配分戦略
    • 長期的なエージェント運用において,記憶の増大に対応した情報検索が不可欠である。
    • クエリと関連文書の関連性が間接的で,推論を必要とする場合に,効率的な検索が課題となる。
    • クエリ拡張や候補再ランク付けにおける計算資源の最適配分を通して,検索性能の向上を目指す。
    • 再ランク付け段階では,より高性能なモデルや大規模な候補プールが大幅な性能向上をもたらすことが示された。
    • クエリ拡張段階では,軽量なモデル以上の性能向上は限定的である。
    • 推論時間の増加は,クエリ拡張と再ランク付けのどちらの段階でも,大きな改善には繋がらない。

    Link: https://arxiv.org/abs/2603.14635

  • シームレスな欺瞞:より大規模な言語モデルは知識隠蔽に長けている [cs.NI, cs.CL, cs.AI]目的:言語モデルにおける知識隠蔽の検出
    • 言語モデルの安全性確保は,社会実装において不可欠である。
    • 言語モデルは有害な知識を学習し,監査時にそれを隠蔽する可能性がある。
    • 大規模言語モデルにおける知識隠蔽の兆候を検出すること。
    • 分類器は小規模モデルにおいて,人間よりも信頼性高く知識隠蔽を検出可能であった。
    • しかし,分類器は未知のモデル構造や隠蔽された知識のトピックに対して汎化性能が低いことが判明した。
    • 700億パラメータを超える大規模モデルでは,分類器の性能はランダムレベルに低下し,知識隠蔽の検出が困難になった。

    Link: https://arxiv.org/abs/2603.14672

  • VorTEX:ターゲット音声抽出のための様々な重複比率 [cs.SD, cs.AI, cs.CL]目的:ターゲット音声抽出の性能向上
    • 音声分離技術は,雑音環境下でのコミュニケーションや音声認識の精度向上に不可欠である。
    • 既存手法は完全な重複を前提としており,現実的な重複比率における挙動が不明である。
    • 様々な重複比率下でロバストなターゲット音声抽出を可能にするモデルを開発する。
    • VorTEXは,Decoupled Adaptive Multi-branch (DAM) Fusionブロックを用いて主要な抽出と補助的な正則化を分離している。
    • 実験により,既存モデルが重複下で抑制や残差干渉を示すのに対し,VorTEXは20~100%の重複比率で最高分離忠実度を達成した。
    • VorTEXはSuRE(Suppression Ratio on Energy)をゼロに維持し,抑制駆動型アーチファクトのない堅牢な抽出を実現した。

    Link: https://arxiv.org/abs/2603.14803

  • 集約における迷路:メッセージパッシンググラフニューラルネットワークの表現力の根本的な限界について [cs.LG, cs.CC]目的:メッセージパッシンググラフニューラルネットワークの表現力の限界
    • グラフニューラルネットワークは,複雑なグラフ構造のデータを扱う上で重要な役割を担う。
    • 既存のグラフニューラルネットワークは,表現力に限界があり,複雑なグラフ構造を十分に識別できない場合がある。
    • 本研究は,グラフニューラルネットワークの表現力の限界を理論的に明らかにすることを試みる。
    • 汎用的な集約関数を持つメッセージパッシンググラフニューラルネットワークは,グラフ全体で多項式個の同値類しか誘導しない。
    • 一方,カラーリファインメント(CR)のわずか2回の反復でさえ,指数個以上の同値類を誘導する。
    • 先行研究ではグラフニューラルネットワークが完全なCRに一致するとされていたが,それは弱い定義に基づくものであった。

    Link: https://arxiv.org/abs/2603.14846

  • 確率的スコアの分解:信頼性,情報損失,および不確実性 [cs.LG, math.ST, stat.ML, stat.TH]目的:確率的スコアの分解に関する理論的枠組み
    • 予測モデルの信頼性は,現実世界での応用において重要な評価指標である。
    • 既存手法では,予測子の持つ情報の保持状況と信頼性の関係が明確でなかった。
    • 予測子の情報レベルに応じた損失の分解と,情報利得の定量化を目指す。
    • 任意の適切な損失関数に対して,損失の分解恒等式を導出した。
    • 特徴量からスコアへの情報損失を定量化する「グルーピング項」を導入した。
    • 提案手法を事後再校正やモデル集約に応用し,具体的な損失関数に対する式を示した。

    Link: https://arxiv.org/abs/2603.15232

  • 精神の計算概念 [cs.AI, cs.SY, eess.SY]目的:人工精神の構築における精神のモデル化へのアプローチ
    • 人工知能研究は,人間の認知機能を理解し,機械に実装することで,社会に貢献しうる。
    • 汎用人工知能の実現には,知能の根本的な仕組みや意識のモデル化が不可欠である。
    • 本研究は,精神をOSと捉え,ニーズに基づいた意思決定システムを提案することで,汎用人工知能の構築を目指す。
    • 精神を状態空間を持つOSと捉え,ニーズが行動の指針となるモデルを提案した。
    • エージェントのニーズ,感覚,行動を含む状態空間において,経験学習による汎用人工知能の実現を目指した。
    • 不確実性下における最適意思決定システムとして,汎用人工知能の構築問題を定式化した。

    Link: https://arxiv.org/abs/2603.15586

  • アルゴリズム取引戦略の開発と最適化 [cs.AI]目的:アルゴリズム取引戦略の開発と最適化
    • 金融市場の効率化と収益性向上に貢献するため,自動取引システムの重要性が増している。
    • 既存の取引戦略は,市場の変化への適応が遅れる場合や,感情分析の活用が不十分な場合がある。
    • 市場データとセンチメント分析を統合し,最適な取引戦略を構築することで,収益性向上を目指す。
    • 提案された戦略は,S&P 500の過去データを用いた検証で,ベースラインモデルを大幅に上回る結果を示した。
    • 総リターン,シャープレシオ,ドローダウンなどの指標において,優れたパフォーマンスが確認された。
    • テクニカル指標,センチメント分析,計算最適化の組み合わせが,アルゴリズム取引システムにおいて有効であることが示された。

    Link: https://arxiv.org/abs/2603.15848

  • 大規模報酬モデル:視覚言語モデルによる汎用的なオンラインロボット報酬生成 [cs.HC, cs.RO, cs.AI]目的:ロボットのオンライン報酬生成手法
    • ロボットの学習において,汎用性のある報酬関数の設計が課題となっている。
    • 手動での報酬設計には限界があり,ロボットの複雑なタスクへの適応が困難である。
    • 視覚言語モデルを活用し,手動設計を不要とするオンライン報酬生成を目指す。
    • 提案手法は,初期の模倣学習済みポリシーの成功率をわずか30回の強化学習反復で大幅に向上させた。
    • 視覚言語モデルが生成する報酬信号は,実行エラーを修正するための信頼性の高いフィードバックを提供できることが示された。
    • 本手法は,ゼロショットで未知の環境にも対応可能であり,サンプル効率が高いことが特徴である。

    Link: https://arxiv.org/abs/2603.16065

  • ファインチューナーの誤謬:ファインチューニングデータで事前学習すべき時 [cs.LG]目的:狭いドメインにおけるモデルの性能向上と汎化能力の維持
    • 実世界のモデル展開には,データが少ない狭いドメインでの高い性能が求められる
    • ファインチューニングは過学習のリスクがあり,汎用的な知識を忘れてしまう可能性がある
    • ドメインデータを利用した事前学習で,過学習を抑制し,汎化性能を向上させる
    • ドメインデータを用いた事前学習(SPT)は,標準的な事前学習と比較して,ファインチューニング後のドメイン性能と汎用的な能力を向上させる。
    • SPTは,特定のドメイン性能を達成するために必要な事前学習トークン数を最大1.75倍削減できる。
    • ドメインデータが事前学習コーパスで少ない場合,10億トークンのSPTモデルは30億トークンの標準事前学習モデルよりも優れた性能を示す。

    Link: https://arxiv.org/abs/2603.16177

  • 大規模IoTネットワーク向け深層学習ベースのインテリジェントIDS [cs.CR, cs.AI]目的:大規模IoTネットワークのセキュリティ強化
    • IoTの普及は利便性向上をもたらす一方,セキュリティリスクの増大を招いている
    • IoTネットワークには未承認デバイスの侵入や脆弱性の悪用といった脅威が存在する
    • 深層学習を用いたIDSにより,IoTネットワークの脅威検知・分類精度向上を目指す
    • 提案するCNNベースIDSは,二値分類で99.34%,グループ分類で99.02%,多クラス分類で98.6%の精度を達成した
    • 提案するLSTMベースIDSは,二値分類で99.42%,グループ分類で99.13%,多クラス分類で98.68%の精度を達成した
    • 深層学習ベースのIDSは,多様なサイバー脅威の識別と分類に有効であることが示された

    Link: https://arxiv.org/abs/2603.16342

  • Fast-WAM:ワールドアクションモデルはテスト時の未来予測を必要とするか? [cs.CV, cs.AI]目的:ワールドアクションモデルにおける未来予測の必要性
    • ロボットの自律的な行動計画において,環境の変化を予測する能力は重要である。
    • 既存のワールドアクションモデルは計算コストが高く,リアルタイム性に課題がある。
    • テスト時の未来予測を省略することで,計算効率を向上させることを目指す。
    • 提案手法Fast-WAMは,未来予測をテスト時に行わないにも関わらず,既存手法と同等の性能を達成した。
    • ビデオモデリングを訓練時に行うことが,性能向上の主要因であることが示唆された。
    • Fast-WAMは,既存の未来予測を行うWAMよりも4倍高速に動作し,リアルタイムでの実行が可能である。

    Link: https://arxiv.org/abs/2603.16666

  • MHPO:安定した強化学習のための変調ハザード認識型方策最適化 [cs.LG, cs.AI, cs.CL]目的:強化学習における安定性と頑健性の向上
    • 強化学習は,複雑な意思決定問題を解決する上で重要な手法である。
    • 既存の方策最適化手法は,勾配消失や不安定な学習に陥りやすい。
    • 本研究は,ハザード認識型方策最適化により,急激な方策変化を抑制し,学習の安定化を図る。
    • 提案手法MHPOは,重要度比を滑らかに制限するLog-Fidelity Modulator(LFM)を導入し,勾配の安定性を確保する。
    • また,Decoupled Hazard Penalty(DHP)により,生存分析からの累積ハザード関数を用いて,正と負の方策変化を独立して制御する。
    • 多様なベンチマークテストの結果,MHPOは既存手法を上回り,性能向上と学習安定性の両立を実現した。

    Link: https://arxiv.org/abs/2603.16929

  • 最新のビジョン言語モデルに対する敵対的攻撃 [cs.CR, cs.AI]目的:ビジョン言語モデルの敵対的頑健性評価
    • ビジョン言語モデルは,画像とテキストを理解し,多様なタスクに応用できるため重要である。
    • 敵対的攻撃に対して脆弱であり,誤った判断を招く可能性がある。
    • オープンソースのビジョン言語モデルのセキュリティ評価における課題を明らかにする。
    • LLaVA-v1.5-7Bは,3つの勾配ベース攻撃すべてに対して高い攻撃成功率を示した。
    • Qwen2.5-VL-7Bは,すべての攻撃に対してLLaVAよりもはるかに堅牢であることが示された。
    • これらの知見は,商用展開前のビジョン言語モデルのセキュリティ評価に重要な影響を与える。

    Link: https://arxiv.org/abs/2603.16960

  • PRISM:学習途中の定着と相互作用の解明 [cs.RO, cs.LG]目的:大規模言語モデルの学習途中の設計選択に関する包括的な実証研究
    • 大規模言語モデルの性能向上は,自然言語処理の発展に不可欠である。
    • 学習途中のデータや手法が性能に与える影響は,未だ十分に解明されていない。
    • 学習途中の最適な戦略を確立し,推論能力の向上に貢献することを目指す。
    • 学習途中の高品質なトークン約270億個での学習は,数学,コード,科学のベンチマークで一貫した改善をもたらす。
    • PRISMとRLのパイプラインは,6つの推論ベンチマークで大幅な改善(3-4倍)を示す。直接RLでは効果が限定的である。
    • 学習途中のデータ構成が最も重要であり,科学データを含めることでRL時のGPQA-Diamondの獲得点が向上する。

    Link: https://arxiv.org/abs/2603.17074

  • PCAに基づく幾何設計パラメータの解釈可能な表現と解析 [cs.LG]目的:幾何設計パラメータの推定
    • CAD技術の発展に伴い,複雑な形状を定義するパラメータ数が増加している。
    • 高次元の設計空間は,シミュレーションや最適化などの後続の工程で課題となる。
    • PCAによる次元削減を用いて,設計パラメータの解釈性を向上させる。
    • 古典的なPCAはコンパクトな表現に優れるが,生成された形状の基盤となる設計パラメータを直接復元できない。
    • 本研究では,PCAに基づく表現から設計パラメータを推定する問題に取り組んだ。
    • 実験を通してPCAの各段階における形状変化を詳細に分析し,パラメータ推定の条件を明らかにした。

    Link: https://arxiv.org/abs/2603.17535

  • 整列化されたターゲットドメイン局所的アラインメントによる解釈可能なクロスドメイン少数ショット学習 [cs.HC, cs.CV, cs.AI]目的:クロスドメイン少数ショット学習における解釈可能性の向上
    • クロスドメイン少数ショット学習は,汎用データから少ないターゲットデータで学習する重要技術である。
    • 既存のCLIPモデルは,ターゲットドメインにおける微細な視覚的特徴を捉えるのが難しい。
    • ドメインギャップとデータ不足によるCLIPの局所的パターン認識の課題を解決する。
    • 提案手法CC-CDFSLは,サイクル整合性により局所視覚特徴とテキスト意味を自己教師ありでアラインメントする。
    • Semantic Anchor機構は,視覚特徴を拡張・縮小することでノイズを低減し,関連性の低いマッピングをフィルタリングする。
    • 様々なベンチマークで,局所的アラインメントの改善,解釈性の向上,最先端の性能を達成した。

    Link: https://arxiv.org/abs/2603.17655

  • CoVerRL:生成器・検証器の共同進化によるラベルフリー推論における合意落とし穴からの脱却 [cs.RO, cs.SY, eess.SY, eess.SY, cs.SY, cs.CL, cs.AI, cs.LG]目的:ラベルフリー推論における合意落とし穴からの脱却
    • 大規模言語モデルの推論能力向上は重要であり,特に教師なし学習での進展が期待される。
    • 多数決による疑似ラベルを用いる手法では,一貫性を追求するあまり多様性が失われ,誤りを増幅する問題がある。
    • 生成器と検証器を共同進化させることで,多様性を維持しつつ誤りを減らし,推論精度を向上させる。
    • CoVerRLは,QwenおよびLlamaモデルファミリーにおいて,ラベルフリーベースラインよりも数学的推論ベンチマークで4.7〜5.9%高い性能を示す。
    • 自己検証の精度は,約55%から85%以上に向上し,両能力が実際に共同進化していることを確認した。
    • 生成器と検証器の役割を交互に行うことで,互いの能力を強化し,より正確な推論を可能にする。

    Link: https://arxiv.org/abs/2603.17775

  • RE-SAC:バス隊列制御における偶然的リスクと認識的リスクの分離:安定かつ堅牢なアンサンブル強化学習アプローチ [cs.AR, physics.chem-ph, cs.CL, cs.CY, cs.LG, cs.RO]目的:バス隊列制御における偶然的リスクと認識的リスクの分離
    • 公共交通機関の効率化は,都市交通の円滑化に不可欠である。
    • 従来の強化学習アルゴリズムは,不確実性の高い環境下で不安定になりやすい。
    • 偶然的リスクと認識的リスクを分離し,より安定した制御を実現すること。
    • 提案手法RE-SACは,従来のSACと比較して累積報酬が向上した。
    • RE-SACは,稀な状態におけるOracle Q値推定誤差を最大62%削減した。
    • 積分確率測度に基づく正則化と,多様なQアンサンブルが堅牢性の向上に貢献した。

    Link: https://arxiv.org/abs/2603.18396

  • 企業によるAIの虚偽表示がグリーンイノベーションに及ぼす波及効果 [cs.RO, cs.CY, cs.AI]目的:企業によるAIの虚偽表示とグリーンイノベーションの関係性
    • 持続可能な開発が重要視される中,企業の環境への配慮を示すグリーンイノベーションの促進が不可欠である。
    • AI技術の進展に伴い,企業によるAIの虚偽表示(AIウォッシング)が横行し,情報開示の信頼性が損なわれている。
    • AIウォッシングがグリーンイノベーションを阻害するメカニズムを解明し,改善策を提示することを目的とする。
    • 企業によるAIウォッシングは,グリーンイノベーションを抑制する効果があることが判明した。
    • この負の影響は,製品市場と資本市場の双方を通じて伝播する。
    • 特に,中小企業や競争の激しい業界において,AIウォッシングの負の影響が顕著である。

    Link: https://arxiv.org/abs/2603.18415

  • 企業によるAIウォッシングが農家のデジタル金融行動に与える影響:デジタル金融からの排除という視点からの分析 [cs.CY, cs.AI]目的:企業によるAIウォッシングが農家のデジタル金融行動に及ぼす影響
    • デジタル金融は農業の発展に不可欠であり,農家の金融アクセス改善に貢献する。
    • AI技術の誇大広告(AIウォッシング)により,農家はデジタル金融への信頼を損なう恐れがある。
    • AIウォッシングが農家のデジタル金融行動を抑制するメカニズムを解明し,対策を提示する。
    • 企業によるAIウォッシングは,農家のデジタル金融行動を著しく抑制することが明らかになった。
    • AIウォッシングは,知識的排除とリスク排除を悪化させ,間接的に農家の行動を阻害する。
    • 高い社会資本を持つ農家グループにおいては,AIウォッシングの影響が緩和されることが示された。

    Link: https://arxiv.org/abs/2603.18421

  • 深層VAE-GANを用いたデータ同化のための貯留層特性パラメータ化の高度化 [cs.PF, cs.LG]目的:貯留層特性のパラメータ化手法
    • 石油貯留層シミュレーションにおいて,過去の生産データとの整合性を高めることは,資源開発において不可欠である。
    • 既存手法は,有限のアンサンブルサイズやガウス分布の仮定により,非ガウス分布を持つ貯留層特性の表現に課題がある。
    • 深層学習モデルVAE-GANを統合し,地質学的に妥当なモデルとデータ同化性能を両立するパラメータ化手法を開発する。
    • 深層VAE-GANモデルをESMDAに統合することで,GANのように高品質な貯留層記述と,VAEのように良好な履歴照合を同時に実現できることが示された。
    • カテゴリカルおよび連続的な透水率値を持つ2つのケーススタディにおいて,本手法の有効性が確認された。
    • VAE-GANは,既存手法の課題である非ガウス分布の扱いと,地質学的な整合性の両方を改善する可能性を持つ。

    Link: https://arxiv.org/abs/2603.18766

  • エージェント制御プロトコル:エージェント行動の認可制御 [cs.CR, cs.AI]目的:B2B環境における自律エージェントのガバナンスに関する正式な技術仕様
    • 企業間取引における自律エージェントの利用が拡大しており,その制御の重要性が増している。
    • 既存のRBACやゼロトラストモデルでは,自律エージェントの行動範囲を制御し,監査可能性を確保することが困難である。
    • エージェントの行動認可を厳密に管理し,機関間の監査を可能にするためのプロトコルを確立すること。
    • エージェント制御プロトコル(ACP)は,エージェントの意図とシステム状態の変化の間に認可制御層を設けることで,行動を検証する。
    • ACPは,暗号的アイデンティティ,能力ベースの認可,リスク評価,委任,失効,監査機能を提供し,機関による明確な管理を可能にする。
    • このプロトコルは,組織間での相互運用性を考慮し,ポリシー評価の相違を検出し報告する仕組みを備えている。

    Link: https://arxiv.org/abs/2603.18829

  • 言語学習学生の視点からのLLM生成レッスン評価:Duolingoに関する短期事例研究 [cs.CL, cs.AI, cs.HC]目的:LLM生成レッスンに対する言語学習学生の評価
    • グローバル化が進み,職業上のコミュニケーション能力が重要となる場面が増加している。
    • 既存の言語学習アプリは汎用的なシナリオに偏り,職業特化型コンテンツが不足している。
    • 学習者のニーズに合わせた,個別化された専門分野特有のレッスンを提供することを目指す。
    • 回答者は,Duolingoで一般的なシナリオを職業関連のものよりも頻繁に遭遇した。
    • 一般的なシナリオは基礎的な文法,語彙,文化知識の構築に効果的であることが示された。
    • 一方,職業関連のシナリオは専門分野の語彙を習得し,プロフェッショナルレベルの流暢性を高める上で役立つことが示唆された。

    Link: https://arxiv.org/abs/2603.18873

  • 大規模言語モデルの安全な線形アラインメント [cs.AI]目的:大規模言語モデル間の表現の類似性に着目した,プライバシー保護推論フレームワーク
    • 言語モデルの発展は,様々な応用を可能にする。特に,データ共有が困難な状況下での利用が期待される。
    • モデルの学習データや構造の違いにより,モデル間の互換性が十分に活用されていない。
    • 表現の収束性を利用し,安全なクロスモデル推論を実現することで,プライバシー保護と高性能化を両立させる。
    • 独立に学習された言語モデル間において,線形変換によって表現空間をアラインメントできることを実証した。
    • 提案フレームワークは,ホモモーフィック暗号化と組み合わせることで,サブ秒単位の推論遅延と高いセキュリティを両立する。
    • 埋め込み分類や外挿検出において,モデルペア間の性能劣化を最小限に抑え,場合によってはテキスト生成も可能となった。

    Link: https://arxiv.org/abs/2603.18908

  • Nemotron-Cascade 2:カスケードRLと多ドメインのオンポリシー蒸留によるポストトレーニングLLM [cs.RO, cs.RO, cs.CL, cs.AI, cs.LG]目的:高度な推論能力とエージェント能力を持つLLMの構築
    • LLMは,自然言語処理の様々なタスクにおいて重要な役割を担っており,その性能向上は不可欠である。
    • 大規模LLMは計算コストが高く,推論能力とパラメータ数のバランスが課題となっている。
    • カスケードRLとオンポリシー蒸留により,パラメータ数を削減しつつ高性能なLLMを実現すること。
    • Nemotron-Cascade 2は,300億パラメータのMoEモデルであり,特に数学とコーディングの推論性能が優れている。
    • このモデルは,2025年のIMO,IOI,ICPC World FinalsにおいてGold Medalレベルの性能を達成し,高密度な知能を持つ。
    • カスケードRLの適用範囲拡大と多ドメインのオンポリシー蒸留が,性能向上に貢献している。

    Link: https://arxiv.org/abs/2603.19220

  • FinTradeBench:LLM向け金融推論ベンチマーク [cs.CE, cs.AI, cs.CL, cs.IR, q-fin.CP]目的:LLMにおける金融推論能力の評価
    • 金融判断は複雑であり,専門知識が不可欠である。
    • 既存のベンチマークは,株価やファンダメンタルズの相互作用評価が不十分である。
    • ファンダメンタルズと取引シグナルを統合した金融推論ベンチマークの提供。
    • FinTradeBenchは,NASDAQ-100企業の10年間のデータに基づいた1,400の質問を含む。
    • 検索拡張は,テキストベースのファンダメンタルズ推論を改善するが,取引シグナル推論には限定的である。
    • 現在のLLMは数値・時系列推論に課題があり,金融インテリジェンス研究の促進が期待される。

    Link: https://arxiv.org/abs/2603.19225

  • 人間対話データ資源を用いた協調性の自動分析:レビュー [cs.CL, cs.AI]目的:協調性分析におけるタスク指向人間対話データの活用
    • 協調性は高度な人間行動であり,その理解は人間社会の円滑な機能に不可欠である。
    • 協調性の分析には,客観的かつ大規模なデータの必要性があるが,十分な資源が不足している。
    • タスク指向の人間対話データ資源を活用し,協調性の分析手法を明らかにすること。
    • 本レビューでは,協調性分析に関連する理論,コーディング方式,タスク,モデリング手法を網羅的に整理した。
    • タスク指向の人間対話データ資源が,協調性の自動分析に有効な手段となりうることを示した。
    • 今後の協調性分析における未開拓領域を特定し,研究の方向性を示唆した。

    Link: https://arxiv.org/abs/2603.19292

  • ファインチューニングによる潜在的タスク発見を通じたスケーラブルなプロンプトルーティング [cs.CL, cs.AI, cs.LG]目的:プロンプトルーティングの性能最適化
    • 大規模言語モデルの活用範囲拡大に伴い,適切なモデル選択が重要になっている。
    • 既存手法では,タスクの細かな違いを捉えきれず,性能向上が限界に達している。
    • 潜在的なタスクを発見し,タスクに特化した品質推定を行うことで,ルーティング精度向上を目指す。
    • 提案手法は,10のベンチマークにおいて既存手法を上回り,最良のモデルと同等以上の性能を発揮した。
    • 特に,コストは最良のモデルの半分以下に抑えられ,費用対効果が高いことが示された。
    • グラフベースのクラスタリングと,タスク特化型予測ヘッドを持つ混合エキスパートモデルが貢献した。

    Link: https://arxiv.org/abs/2603.19415

  • FormalEvolve:多様かつ証明効果の高い自動形式化のためのニューロシンボリック進化探索 [eess.SY, cs.RO, cs.SY, cs.AI]目的:自動形式化における多様な候補集合の探索
    • 数学の形式化は,機械による検証を可能にし,数学の信頼性を高める上で不可欠である。
    • 意味的に整合性のある形式化であっても,証明の効率や成功率に大きな差が生じることが課題である。
    • 形式化の多様性を高め,証明効果の高い形式化を効率的に探索することを目的とする。
    • FormalEvolveは,LLMによる突然変異と交叉,そしてASTの書き換えによって多様な候補を生成する。
    • CombiBenchとProofNetにおいて,ジェネレーター呼び出し回数をT=100に制限した条件下で,それぞれ58.0%と84.9%のsemantic hit rate (SH@100)を達成した。
    • また,問題間のsemantic successの集中度を低下させ,CombiBenchにおける証明性能も向上した。

    Link: https://arxiv.org/abs/2603.19828

  • 構成調整のためのドメイン・空間性パターンの解明:ドメイン知識と適合度景観の融合 [cs.SE, cs.AI]目的:構成調整におけるドメイン知識と適合度景観の関係性の体系的な把握
    • 品質保証において,構成調整は性能向上の鍵となる。しかし,その効果のメカニズムは未解明な点が多い。
    • 既存研究は静的解析や動的データ解析に偏っており,汎用性や説明可能性に課題がある。
    • 適合度景観分析を活用し,構成調整の難易度とドメイン知識の関係性を明らかにすることで,調整ツールの改善に貢献する。
    • 構成調整の景観はシステム固有であり,システム領域,プログラミング言語,リソース強度といった単一のドメイン要素で構造が一貫して決定されることはないことが示された。
    • 主要なオプション(例:x264のpic-struct)は,リソースオプション(例:x264のcpu-independent)よりも景観の粗さに強い影響を与えることが明らかになった。
    • ワークロードが景観構造に与える影響は,タイプや規模に一律に結びつくものではなく,システムに依存して変化することが確認された。

    Link: https://arxiv.org/abs/2603.19897

  • 前方-後方表現におけるスペクトルアラインメント:時間的抽象化による実現 [cs.LG, cs.AI, cs.RO]目的:連続空間における後継表現学習のためのスペクトルアラインメント
    • 強化学習において,状態空間の表現学習は,汎化性能と効率的な学習に不可欠である。
    • 前方-後方表現は低ランク近似に依存するため,連続環境の高ランクな遷移ダイナミクスとのスペクトルミスマッチが課題となる。
    • 時間的抽象化によりスペクトルミスマッチを緩和し,安定した低ランク表現学習を実現すること。
    • 時間的抽象化は,遷移オペレーターの高周波成分を抑制するローパスフィルターとして機能する。
    • この抑制により,誘導される後継表現の実効ランクが低下し,同時に値関数誤差の上限が維持される。
    • 実験結果から,時間的抽象化が前方-後方学習の安定化に不可欠であることが示された。

    Link: https://arxiv.org/abs/2603.20103

  • ノイズ適応・問題適応型(加速)確率的勾配降下法 [cs.CL, cs.RO, math.OC, cs.LG, stat.ML]目的:ノイズと問題依存定数に対する確率的勾配降下法(SGD)の適応性
    • 機械学習の効率的な最適化は,複雑なモデルの学習において不可欠である。
    • SGDはノイズや問題の条件数に敏感であり,最適なステップサイズの設定が困難である。
    • ノイズや条件数に自動的に適応し,効率的な学習を実現するSGDの開発。
    • 滑らかで強凸な関数の最小化において,ステップサイズを指数的に減衰させることで,ノイズの大きさを事前に知らなくても,特定の収束率が達成される。
    • 確率的直線探索(SLS)を用いることで,解の近傍への収束が保証されるが,オフラインで滑らかさを推定すると収束が遅くなる。
    • Nesterov加速を用いたSGD(ASGD)は,滑らかさや強凸性のオフライン推定値を用いても解に収束し,より高速な収束率を示す。

    Link: https://arxiv.org/abs/2110.11442

  • 多視点協調転移学習を取り入れた新規TSKファジーシステムによる個別化てんかん脳波検出 [eess.SP, cs.LG]目的:個別化てんかん脳波検出のためのアルゴリズム
    • 臨床において脳波はてんかん診断に不可欠であり,診断支援システムの精度向上は重要である。
    • 個別化検出には,有効な特徴抽出の困難さ,データ不足,データ分布の不一致といった課題がある。
    • 多視点学習と転移学習を統合し,これらの課題を解決することを目指す。
    • 提案手法は,多視点学習により特徴の多様性を確保し,転移学習でデータ不足を補う。
    • 最大平均不一致に基づく適応技術を用いて,データ分布の不一致を解消する。
    • CHB-MITデータセットを用いた実験により,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2111.08457

  • ミニパッチアンサンブルによるデータ分割なしLOCO特徴重要度推論 [stat.ML, cs.LG, stat.ME]目的:機械学習モデルにおける特徴重要度推論
    • 機械学習モデルの解釈性と信頼性は重要であり,特徴重要度はその鍵となる。
    • 既存手法は,分布やモデルに関する制約があり,データ分割が必要となる場合が多い。
    • データ分割なしで,分布に依存しない特徴重要度推論を実現することを目的とする。
    • 本研究では,ミニパッチアンサンブルを利用した,データ分割を必要としない新しい推論フレームワークを提案した。
    • 提案手法は計算効率と統計効率に優れ,データ分割に伴う解釈上の課題を回避できる。
    • 訓練データと推論データが同一でも,穏やかな仮定のもとで信頼区間の漸近的妥当性が確認された。

    Link: https://arxiv.org/abs/2206.02088

  • ノイズ対照オンライン変化点検出 [stat.ML, cs.LG, math.ST, stat.ME, stat.TH]目的:オンライン変化点検出手法
    • 時系列データ分析において,変化点の特定は重要な課題である。
    • 変化点の検出には,データの分布変化を捉えることが難しい。
    • 分布間の差異を最大化することで,効率的な変化点検出を目指す。
    • 提案手法は,パラメータ的およびノンパラメータ的なシナリオの両方で適用可能である。
    • 平均実行長および期待される検出遅延に関する非漸近的な境界が証明された。
    • 合成データおよび実データを用いた数値実験により,アルゴリズムの効率が示された。

    Link: https://arxiv.org/abs/2206.10143

  • 分子シミュレーションと創薬のためのハイブリッド量子生成敵対ネットワーク [quant-ph, cs.LG, q-bio.BM]目的:分子シミュレーションと創薬における量子生成敵対ネットワークの性能評価
    • 分子研究は,医療開発,材料科学,創薬に直接影響する重要な分野である。
    • 古典計算手法では,大規模タンパク質鎖の設計に膨大な計算資源が必要となる。
    • 量子機械学習を用いて創薬の効率化を目指す。
    • 提案するQWGAN-HG-GPモデルは,QM9データセットを用いた評価において,他のQGANモデルよりも優れた性能を示した。
    • 特に,様々なドラッグ分子の特性評価指標において,高い精度を達成した。
    • 本研究は,量子生成モデルが創薬分野にもたらす可能性を示唆している。

    Link: https://arxiv.org/abs/2212.07826

  • ラッソを用いたシグネチャの一貫性について [stat.ML, cs.LG, math.ST, stat.AP, stat.TH]目的:ラッソ回帰によるシグネチャの一貫性
    • 時系列データ分析において,シグネチャは非線形性を線形化し,特徴選択を可能にする重要なツールである。
    • 既存手法では,シグネチャの利用において,一貫性の理論的保証が十分でなかった。
    • 本研究は,ラッソ回帰におけるシグネチャの一貫性条件を理論的・数値的に明らかにすることを目指す。
    • ラッソ回帰が漸近的かつ有限サンプルにおいても一貫性を持つ条件が確立された。
    • ブラウン運動に近い時系列や,弱い次元間相関を持つデータに対しては伊藤シグネチャが,平均回帰時系列に対してはストラトノビッチシグネチャが,より一貫性を示すことが示された。
    • シグネチャは非線形関数やオプション価格を高精度に学習可能であり,その性能は基礎過程の特性とシグネチャの選択に依存することが示された。

    Link: https://arxiv.org/abs/2305.10413

  • 並列確率的最適化による高信頼度推論はほぼ無コストで実現可能である [stat.ML, cs.LG]目的:高信頼度推論のための手法
    • オンライン設定における確率的最適化解の不確実性定量は,近年重要視されている。
    • 既存手法では,信頼区間の構築に計算コストやメモリ消費が課題となっていた。
    • 本研究では,効率的な計算と高速な収束性を備えた信頼区間構築手法を提案する。
    • 提案手法は,少数の独立した多段実行により分布情報を取得し,t分布に基づく信頼区間を構築する。
    • 追加の計算・メモリコストは最小限であり,推論プロセスはほぼ無コストで実現可能である。
    • 理論的な保証により,信頼区間のカバレッジが厳密に近似的に正確であり,高い信頼度での推論が可能となる。

    Link: https://arxiv.org/abs/2401.09346

  • ネットワーク上の相互作用粒子系:ネットワークと相互作用カーネルの同時推論 [stat.ML, cs.LG, math.DS, math.ST, stat.TH]目的:ネットワークと相互作用カーネルの同時推論
    • 多様な分野で多主体系をネットワーク上でモデル化する重要性が高まっている
    • 既存手法では,ネットワーク構造と相互作用規則の同時推定が困難である
    • ネットワーク構造と相互作用規則を効率的に同時に推定する手法を開発する
    • 提案手法は,交替最小二乗法(ALS)と,新規アルゴリズムであるオペレータ回帰と交替最小二乗法(ORALS)に基づいている
    • ALSは小規模データにおいて統計的に効率的かつ頑健だが,性能と収束の保証がない
    • ORALS推定量は,ある条件の下で一貫性と漸近正規性を満たす

    Link: https://arxiv.org/abs/2402.08412

  • SPABA:最適なサンプル複雑度を達成する単一ループ確率的二重最適化アルゴリズム [math.OC, cs.LG]目的:二重最適化問題に対する最適なサンプル複雑度
    • 機械学習における大規模なネストされた最適化問題解決の重要性が高まっている。
    • 二重最適化問題を解くための最適な複雑度境界が単一レベル最適化と同じかどうか不明だった。
    • SPABAによって,二重最適化と単一レベル最適化の複雑度分析のギャップを埋める。
    • SPABAは,有限和設定と期待設定の両方で最適なサンプル複雑度を達成する。
    • SPABAは,PAGE法の二重最適化への適応であり,他の確率的勾配推定器では複雑度分析のギャップが生じる可能性がある。
    • 提案された他の単一ループ二重最適化アルゴリズムも,最先端の結果に匹敵またはそれを上回るサンプル複雑度を示す。

    Link: https://arxiv.org/abs/2405.18777