arXiv雑要約

AI - 2026/03/10 公開

  • 構造的事前知識に基づく脱文脈化による非文脈的対象物に対するビデオ駆動的不変性:VINO [cs.CV, cs.AI]目的:非文脈的対象物に対するビデオ駆動的不変性の学習
    • 自己教師あり学習は急速に進歩しているが,学習された特徴は文脈に強く依存しやすい。
    • 密集した実環境のビデオデータには背景との共起関係があり,対象物の表現が崩壊する。
    • 構造的情報を活用し,背景情報を抑制することで,対象物中心の表現を獲得する。
    • VINOは,背景を抑制した前景連合ビューからの予測と,周囲の文脈を保持しつつ競合するインスタンスを除去した対象物条件付きシーンビューの観察を通じて,不均衡な蒸留問題を形成する。
    • マスク化蒸留により背景情報を信頼できなくし,表現を対象物中心の不変性へと導く。
    • PASCAL VOCでの注意可視化と教師なしオブジェクト検出により,VINOが前景と背景を効果的に分離することが示された。

    Link: https://arxiv.org/abs/2603.07222

  • 金融におけるデータ価値の解放:蒸留と難易度を考慮した学習に関する研究 [cs.LG]目的:金融分野におけるデータ活用による価値創出
    • 金融分野では,専門用語が多く,数値推論の精度が求められ,誤謬許容度が低い。
    • 既存のLLMは,金融分野特有の専門性や厳密性が求められるため,性能が十分に発揮されない。
    • 高品質な学習データと難易度に応じた学習手法により,金融LLMの性能向上を目指す。
    • 高品質なChain-of-Thoughtデータの蒸留と検証により,SFTの堅牢な基盤を確立。
    • 難易度と検証可能性を考慮したサンプリングが,RLの汎化性能を向上。
    • 9つのベンチマークにおいて,ODA-Fin-RL-8Bが既存の金融LLMを上回る性能を達成。

    Link: https://arxiv.org/abs/2603.07223

  • LightMedSeg:学習された空間アンカーを用いた軽量3D医療画像セグメンテーション [cs.LG, cs.CV]目的:3D医療画像セグメンテーションの効率化と高精度化
    • 臨床AIにおいて,医療画像の正確なセグメンテーションは不可欠であり,診断支援や治療計画に貢献する。
    • Transformerベースの手法は高精度だが,パラメータ数や計算コストが大きく,実用性に課題がある。
    • 少ない計算資源で高精度なセグメンテーションを実現し,臨床現場での利用を促進すること。
    • LightMedSegは,わずか0.48Mのパラメータと14.64GFLOPsで,重いTransformerベースラインと同程度のセグメンテーション精度を達成した。
    • 解剖学的事前知識を統合し,適応的なコンテキストモデリングにより,メモリ,遅延,データ可用性の制約下でも信頼性の高いセグメンテーションを実現。
    • アンカー条件付きFiLM変調や局所構造モジュールなどにより,境界領域への表現能力を動的に割り当て,計算冗長性を最小限に抑えた。

    Link: https://arxiv.org/abs/2603.07228

  • 開発者コミュニティにおけるソフトウェアバグ解決策推薦のための社会コンテキスト埋め込みを用いたハイブリッドLTRシステム [cs.SE, cs.AI]目的:ソフトウェアバグ解決策の推薦
    • ソフトウェア開発において,エラーやバグの解決は不可欠であり,開発効率に大きく影響する。
    • Stack Overflow等のQ&Aサイトは有用だが,回答数が多く最適な解決策を見つけるのに時間がかかる。
    • Stack Overflowの情報を活用し,開発者が迅速かつ正確にバグ解決策を見つけられるようにすること。
    • 提案モデルは,Stack Overflowの特徴を埋め込んだ学習ランキング(LTR)モデルを使用することで,ソフトウェアバグに対する解決策を推薦する。
    • テキストマイニング,自然言語処理,推薦アルゴリズムを組み合わせ,最適なバグ解決策を抽出・評価・推薦する。
    • 上位10件の回答推薦において,約78%の正答率を達成した。

    Link: https://arxiv.org/abs/2603.07229

  • 遺伝子擾乱に対する細胞応答の予測のための検索拡張生成 [cs.LG, cs.IR]目的:遺伝子擾乱に対する細胞応答予測モデルの性能向上
    • 遺伝子機能解明,疾患メカニズムの理解,治療法開発において,細胞応答予測は不可欠である。
    • 既存の深層学習モデルは,細胞種や擾乱状況が異なると汎化性能が低下しやすい。
    • 文脈情報を活用し,細胞種や擾乱状況に応じた応答予測の精度向上を目指す。
    • PT-RAGは,Replogle-Nadigデータセットにおいて,STATEやvanilla RAGよりも優れた性能を示した。
    • 特に,分布類似性指標($W_1$,$W_2$)において顕著な改善が見られた。
    • vanilla RAGの性能低下は,細胞種を考慮した微分可能な検索が本分野において重要であることを示唆する。

    Link: https://arxiv.org/abs/2603.07233

  • ウェブコンテンツ分布のマッチングから見た深層探索の再考 [cs.LG, cs.IR]目的:ウェブコンテンツ分布を考慮した深層探索フレームワーク
    • ウェブ検索は情報収集の基盤であり,深層探索エージェントの性能に大きく影響する。
    • 既存の深層探索エージェントは,検索エンジンの構造との不整合に苦しんでいる。
    • ウェブコンテンツ分布を考慮し,クエリと検索結果の適合性を高めることで,深層探索の精度向上を目指す。
    • 提案手法WeDasは,エージェントの観測空間に検索空間の構造的特徴を取り込むことで,サブゴールの達成率と精度を向上させる。
    • クエリと検索結果の適合性を定量化する「クエリ-結果整合性スコア」と,少量のクエリアクセスによるスコア推定メカニズムを導入した。
    • WeDasは,4つのベンチマークにおいて一貫して性能が向上し,高レベルな推論と低レベルな検索のギャップを埋める。

    Link: https://arxiv.org/abs/2603.07241

  • LEPA:予測アーキテクチャを用いた衛星リモートセンシングデータにおける幾何学的等価性の学習 [cs.CV, cs.AI]目的:衛星リモートセンシングデータの幾何学的等価性の学習
    • 地理空間基礎モデルは,大規模データ処理に不可欠であり,計算コスト削減に貢献する。
    • ユーザー定義領域と固定グリッド間の幾何学的ミスマッチが,アプリケーションの精度を低下させる。
    • 幾何学的変換に対する予測を通じて,正確な幾何学的調整を実現し,再エンコーディングを回避する。
    • 従来の補間は非凸な埋め込み多様体により信頼性が低い一方,LEPAは幾何学的増強に基づいて埋め込みを直接予測する。
    • HLS画像およびImageNet-1kの実験により,LEPAがMRRを0.2以下から0.8以上に向上させることが示された。
    • LEPAは,再エンコーディングなしで正確な幾何学的調整を可能にし,地球観測アプリケーションの性能を向上させる。

    Link: https://arxiv.org/abs/2603.07246

  • 異なる特徴空間における損失融合水平型連合学習:外部データセットを用いた第二原発癌予測の事例研究 [cs.LG]目的:第二原発癌の予測性能向上
    • 癌生存率向上に伴い,第二原発癌の発生が課題となっている。
    • 局所データセットの規模や地理的範囲の制限により,機械学習の有効性や汎化性能が低い。
    • 外部データを取り込み,プライバシーを保護しつつ,多施設連携を実現する手法を確立する。
    • 提案手法LF2Lは,機関間のデータ共有を回避し,プライバシーを保護しながら有効な連携を可能にする。
    • 共通および固有の特徴をバランス良く活用することで,SPC予測性能の大幅な向上が確認された。
    • AUROCとAUPRCにおいて,既存手法と比較して統計的に有意な改善が示された。

    Link: https://arxiv.org/abs/2603.07249

  • 異質な目標下における協調学習 [cs.MA, cs.AI]目的:異質な目標を持つエージェント間の協調戦略
    • 人間は状況に応じて協調と個別行動を使い分ける能力を持つ。機械への応用は重要。
    • 既存研究では,エージェントの目標が異なる状況での協調戦略が未解明である。
    • 異質な目標を持つエージェントが,最適な協調行動を学習する手法を確立する。
    • 模倣学習と強化学習を組み合わせた新しい手法を提案し,既存手法を上回る性能を示した。
    • チームメイトの行動を予測するモデルが,チームメイトの目標に関する情報量に応じて効果が変化することを示した。
    • このアプローチは,多様な環境における効果的な協調を可能にする。

    Link: https://arxiv.org/abs/2603.07253

  • 時系列データを代数方程式へ:カオス時系列の解釈可能なモデル化のための記号的機械学習 [cs.LG, nlin.CD, physics.data-an]目的:カオス時系列の解釈可能なモデル化
    • カオス時系列の予測は困難であり,科学的理解と実用上の信頼性が重要である。
    • 深層学習は精度が高い一方,ブラックボックスであるため,動的理解が難しい。
    • カオス時系列から解釈可能な代数方程式を学習し,予測精度と説明可能性を両立する。
    • 提案手法は,カオス時系列データから明示的な代数方程式を学習する。
    • 記号的予測器は,132個の低次元カオスアトラクタと2つの実世界の時系列データセットで高い予測精度を示した。
    • 学習された方程式は,基礎となるダイナミクスの重要な側面を明らかにする。

    Link: https://arxiv.org/abs/2603.07261

  • データ効率的な自律運転のための運動学を考慮した潜在世界モデル [cs.RO, cs.AI]目的:データ効率的な自律運転のための潜在世界モデルの構築
    • 自律運転は,安全性とコストの面で実世界のデータ収集が困難であり,効率的な学習が不可欠である。
    • 既存の世界モデルは,自律運転に必要な空間的・運動学的構造を明示的に捉えられていない場合がある。
    • 運動学的な情報を潜在空間に組み込むことで,より現実的な軌道生成と安定した方策最適化を実現する。
    • 提案手法は,既存のモデルと比較してサンプル効率と運転性能において一貫した改善を示すことがわかった。
    • 運動学的な情報を組み込むことで,潜在空間における空間表現の質が向上することが検証された。
    • RSSMベースの世界モデルに運動学的な制約を加えることは,自律運転の方策学習のためのスケーラブルで物理的に根拠のあるパラダイムを提供する。

    Link: https://arxiv.org/abs/2603.07264

  • 外来予約におけるマルチ目的強化学習を用いた適応的な二重予約戦略 [cs.LG]目的:外来予約における二重予約戦略の最適化
    • 外来診療の効率化は,医療サービスの質の向上と患者満足度向上に不可欠である。
    • 患者の無断キャンセルは,診療所の運営を妨げ,待ち時間を増加させる大きな問題である。
    • リアルタイムな状況や患者の特性に適応できる,動的な予約戦略の確立を目指す。
    • 本研究では,個々の患者の無断キャンセルリスクを予測し,それを強化学習に組み込んだ適応的な二重予約フレームワークを提案する。
    • 提案手法は,カルバック・ライブラー発散に基づく{\tau}ルールを用いて,類似した戦略間で選択的に知識を伝達し,収束性と戦略的多様性を向上させる。
    • SHAP値を用いて,無断キャンセルリスクの予測と予約決定の解釈可能性を高めることで,データに基づいた意思決定を支援する。

    Link: https://arxiv.org/abs/2603.07270

  • VisualDeltas:視覚的品質摂動からの選好学習 [cs.IR, cs.AI]目的:マルチモーダルデータにおける視覚的品質の変化から得られる選好学習フレームワーク
    • 視覚情報は,AIの知覚・推論能力の向上に不可欠であり,その学習方法の探求は重要である。
    • 質の高いアノテーションは高コストであり,十分なデータ収集が困難な場合がある。
    • 視覚品質の変化を利用し,人間のアノテーションに頼らずに効率的な選好学習を実現する。
    • VisualDeltasは,多様なマルチモーダルベンチマークにおいて,リジェクションサンプリングによるファインチューニングを上回る性能を示した。
    • ラベルの有無に関わらず適用可能であり,既存の教師あり学習と柔軟に組み合わせることができる。
    • 様々な視覚的劣化に対して,汎化性能の向上が確認された。

    Link: https://arxiv.org/abs/2603.07272

  • 変分フローマップ:ワンステップ条件付き生成のためのノイズ付加 [cs.CV, cs.LG, stat.ML]目的:単一ステップでの条件付き画像生成のためのフレームワーク
    • 画像生成技術は,現実世界の多様なデータに対応するため,高画質かつ効率的な手法が求められている。
    • 従来のフローマップは,サンプリング軌跡が明示的でないため,条件付き生成や逆問題への対応が困難であった。
    • 観測データに基づき,適切な初期ノイズを学習することで,条件付きサンプリングを可能にすることを目標とする。
    • 変分フローマップは,ノイズアダプターを導入し,観測データを尊重した高品質なサンプルを生成できる。
    • 提案手法は,既存の拡散モデルやフローモデルと比較して,サンプリング速度を大幅に向上させる。
    • ImageNetデータセットでの実験により,高い生成品質と高速なサンプリングが確認された。

    Link: https://arxiv.org/abs/2603.07276

  • 展開制約はLLMに幻覚的な引用を生じさせるか?4つのモデルと5つのプロンプト戦略による実験的研究 [cs.CL, cs.IR, cs.AI, cs.SE]目的:LLMにおける幻覚的な引用の検証可能性
    • 学術論文作成やソフトウェア工学における証拠統合においてLLMの利用が拡大している。
    • LLMは,一見正当に見える参考文献を幻覚することが多く,信頼性の問題がある。
    • 展開制約がLLMの引用生成に与える影響を検証し,幻覚を抑制する。
    • 17,443件の生成された引用において,どのモデルも存在率は0.475を超えなかった。
    • TemporalおよびCombo条件は,形式に準拠しつつ,存在率の低下が最も顕著であった。
    • 未解決の引用が多数を占め,その多くは捏造されたものであることが示唆された。

    Link: https://arxiv.org/abs/2603.07287

  • MAviS:鳥類のためのマルチモーダル会話アシスタント [cs.CV, cs.AI]目的:鳥類に関するマルチモーダル質疑応答の実現
    • 生物多様性の保全と生態学的モニタリングにおいて,詳細な理解と種固有の対応が重要である。
    • 既存のマルチモーダル大規模言語モデルは,鳥類のような専門分野における正確な情報提供が困難である。
    • 鳥類に関する知識を深め,マルチモーダルな質疑応答能力を向上させることを目指す。
    • MAviS-Datasetは,画像,音声,テキストを含む1,000種以上の鳥類データセットであり,事前学習と指示チューニングを可能にする。
    • MAviS-Chatは,鳥類の種理解,マルチモーダル質疑応答,シーン記述生成に特化したマルチモーダルLLMである。
    • MAviS-Chatは,既存のMiniCPM-o-2.6を大幅に上回り,最先端のオープンソース結果を達成した。

    Link: https://arxiv.org/abs/2603.07294

  • モジュール知覚AIのための皮質に着想を得たアーキテクチャ [cs.AI]目的:モジュール知覚AIの皮質に着想を得た設計図
    • 人間の認知能力を模倣したAI開発は,より柔軟で適応性の高いシステムの実現に不可欠である。
    • 現在の単一モデルは,解釈可能性,構成的汎化,適応的堅牢性に課題を抱えている。
    • 皮質モジュール性に着想を得て,解釈可能で堅牢な知覚AIシステムを構築すること。
    • 提案アーキテクチャは,階層的な予測フィードバックループと共有潜在空間を通して,構造化された推論を可能にする。
    • モジュール分解が,より安定かつ検査可能な表現をもたらすことを実証した。
    • 生物学的に検証された原則に基づき,高性能かつ透明性の高い推論を支援するシステム開発に貢献する。

    Link: https://arxiv.org/abs/2603.07295

  • 一般化フーリエ変換による連続対称性のスペクトル探索 [cs.LG, cs.AI]目的:連続対称性の発見
    • 科学や機械学習において対称性は重要だが,多くの場合事前に未知である。
    • 既存手法は生成子の空間を直接探索するか,学習された拡張スキームに依存する。
    • スペクトル構造に基づく新しいアプローチで対称性発見を目指す。
    • 関数のスペクトル分解における構造化されたスパース性が,部分群に対する不変性によって誘発されることが示された。
    • 最大トーラス上では,一般化フーリエ変換が多次元フーリエ解析に還元され,一パラメータ対称性を信頼性高く検出できる。
    • 複振り子やトップクォークタグ付けなど,構造化されたタスクで有効性が確認された。

    Link: https://arxiv.org/abs/2603.07299

  • AutoResearch-RL:自律的なニューラルアーキテクチャ探索のための継続的自己評価強化学習エージェント [cs.LG]目的:ニューラルアーキテクチャとハイパーパラメータの自動探索
    • 深層学習モデルの性能はアーキテクチャに大きく依存するため,効率的な探索手法が重要である。
    • 手動での探索は時間と労力を要し,最適なアーキテクチャを見つけることが困難である。
    • 人間の介入なしに,自動的に最適なアーキテクチャを探索する手法を開発すること。
    • AutoResearch-RLフレームワークは,強化学習エージェントがニューラルアーキテクチャとハイパーパラメータを自律的に研究する。
    • 固定された環境と編集可能なターゲットファイル,そしてメタ学習器の分離が設計の鍵である。
    • nanochat事前学習ベンチマークにおいて,300回の反復で手動調整されたベースラインと同等またはそれ以上の性能を発見した。

    Link: https://arxiv.org/abs/2603.07300

  • 大規模地域における郡レベルの作物収量予測のための検索拡張マルチスケールフレームワーク [cs.DB, cs.LG]目的:大規模地域における郡レベルの作物収量予測手法
    • 食料安全保障の確保や農業保険評価において,作物収量の予測は不可欠である。
    • 既存手法は,広範囲かつ長期間にわたる予測において性能が低下する課題がある。
    • 短期・長期的な時間的パターンと空間的なデータの変動を捉え,予測精度を向上させる。
    • 提案手法は,アメリカ合衆国630郡のトウモロコシ収量データにおいて,既存手法を上回る性能を示した。
    • 検索に基づく拡張戦略が,空間的異質性の下でのモデルのロバスト性を向上させる効果が確認された。
    • 年ごとの収量変動に対応するため,特徴量で説明できない年間のバイアスを除去するパイプラインを設計した。

    Link: https://arxiv.org/abs/2603.07305

  • StructSAM:構造とスペクトルを保持するトークンマージングによるセグメンテーション全能モデル [cs.HC, cs.CV, cs.LG]目的:セグメンテーション全能モデルにおけるトークン数の削減による高速化手法
    • 画像認識技術は,医療診断や自動運転など幅広い分野で重要であり,その効率化が求められている。
    • Transformerモデルは計算コストが高く,特に高解像度画像では処理速度が課題となっている。
    • セグメンテーション全能モデルの高速化と精度維持を両立する新たなトークンマージング手法の開発。
    • 提案手法StructSAMは,SAMのエンコーダのFLOPsを25-30%削減し,精度劣化を最小限に抑える。
    • StructSAMは,既存のトークンマージング手法(ToMe等)と比較して,同程度の計算量でより高い性能を示す。
    • トークンエネルギーに基づくマージングは,スペクトル歪みを抑制し,境界の保護とプロンプト情報の漏洩を防ぐ。

    Link: https://arxiv.org/abs/2603.07307

  • データ駆動型ヒントによる知能型チュータリングシステム [cs.RO, cs.NI, cs.AI]目的:知能型チュータリングシステムにおけるデータ駆動型ヒント生成
    • 学習者の理解度向上には個別最適化された指導が不可欠であり,その実現にITSは貢献する。
    • 従来のITSはヒントの生成やタイミングが手動設定に頼り,学習者に最適化されていない場合が多い。
    • 学習者の行動履歴から最適なヒントを生成し,問題解決を支援すること。
    • 過去の学習者データから,次のステップのヒント,ウェイポイント,戦略的なサブゴールを生成可能になった。
    • 行動データに基づき,ヒントを提供する適切なタイミングを判断する技術が発展した。
    • 大規模言語モデル(LLM)との統合により,さらなる問題解決支援の適応が期待される。

    Link: https://arxiv.org/abs/2603.07311

  • 部分観測環境におけるロバストな方策のための敵対的潜在状態学習 [cs.LG, cs.AI, stat.ML]目的:部分観測強化学習におけるロバスト性向上
    • 現実世界の多くの問題は部分観測であり,ロバストな方策の構築が不可欠である。
    • 潜在分布の変化に対するロバスト性が課題であり,性能劣化の原因となる。
    • 敵対的な潜在初期状態に対するロバスト性を高めるための学習フレームワークを提案する。
    • 敵対的潜在初期状態POMDPを定義し,潜在ミニマックス原理を証明した。
    • Battleshipベンチマークにおいて,敵対的学習によりロバスト性のギャップを大幅に縮小した。
    • 反復的な最良応答学習は,理論的な近似証明と整合性のある予算依存性を示した。

    Link: https://arxiv.org/abs/2603.07313

  • 高度AIのための安全停止弁 [cs.AI, cs.LG]目的:高度AIの安全な停止方法
    • AIの進化は社会に大きな変革をもたらす可能性がある一方,制御不能となるリスクも存在する。
    • AIが自らの目標達成を優先し,人間の停止操作を妨げる可能性が懸念されている。
    • AIに「停止されること」を主要な目標として組み込むことで,安全性を高める方法を探る。
    • AIに「停止されること」を目標とすることで,人間の制御下にとどまる可能性が示唆された。
    • このアプローチが常に有効とは限らず,その条件を慎重に検討する必要がある。

    Link: https://arxiv.org/abs/2603.07315

  • FinSheet-Bench:単純な検索から複雑な推論まで,LLMが金融スプレッドシートで苦手とする箇所 [cs.AI]目的:金融スプレッドシートにおけるLLMの性能評価
    • オルタナティブ投資デューデリジェンスにおけるLLM活用が期待されるが,構造化データ処理能力が課題である。
    • 実際のファンドポートフォリオデータセットが機密情報であるため,LLMのベンチマーク作成が困難である。
    • 実務的な金融アプリケーションで使用可能なLLMの性能水準を明らかにする。
    • FinSheet-Benchは,現実のプライベートエクイティファンド構造を模倣した合成データを用いて,LLMの金融スプレッドシート処理能力を評価する。
    • OpenAI,Google,Anthropicの10モデルを評価した結果,単独モデルでは専門家による利用が難しいレベルのエラー率が確認された。
    • 最も性能の良いGemini 3.1 Proでも,複雑なスプレッドシートでは精度が低下し,大規模なスプレッドシート(152社,8ファンド)では平均精度が48.6%に低下した。

    Link: https://arxiv.org/abs/2603.07316

  • ShakyPrepend:改善されたサンプル複雑性を持つ多グループ学習器 [cs.LG]目的:多グループ学習における条件付き損失の制御
    • 社会の多様性に対応するため,グループごとの予測精度の向上が重要である。
    • 既存手法では,グループ構造や空間的異質性への適応が不十分である。
    • 差分プライバシーに着想を得た手法で,理論的保証を改善し,実用的な指針を提供する。
    • ShakyPrependは,既存手法と比較して,グループ構造と空間的異質性に効果的に適応することが示された。
    • 提案手法は,多グループ学習におけるサンプル複雑性を改善するための理論的保証を提供する。
    • 実世界への展開に向けた実践的な指針が提示された。

    Link: https://arxiv.org/abs/2603.07319

  • 表現学習におけるノルム階層の遷移:ニューラルネットワークが近道を手放す時期と理由 [cs.LG, cs.AI]目的:表現学習におけるノルム階層の遷移メカニズムの解明
    • 表現学習は,AIの性能向上に不可欠であり,その効率的な学習法の確立が求められている。
    • ニューラルネットワークは学習初期に誤った近道を利用しやすく,構造化された表現への移行が遅れる場合がある。
    • この研究は,近道から構造化された表現への移行時期を予測する理論的枠組みを提供する。
    • ノルム階層遷移(NHT)フレームワークは,正則化最適化におけるパラメータノルムの階層的探索として,遅延表現学習を説明する。
    • 重み減衰により,高ノルムの近道解から低ノルムの構造化表現へとモデルが徐々に移行することが示された。
    • 実験結果は,モジュール算術,CIFAR-10,CelebA,Waterbirdsにおいて,NHTフレームワークの予測を支持している。

    Link: https://arxiv.org/abs/2603.07323

  • 第三の野心:人工知能と人間行動の科学 [cs.AI, cs.CL, cs.CY]目的:人間行動,文化,倫理的推論の研究における大規模言語モデルの科学的道具としての利用
    • AI研究は生産性向上や安全性確保に重点が置かれてきたが,人間理解への応用が重要である。
    • AIモデルの出力が,人間行動の証拠として扱われる際の認識論的限界が明確化されていない。
    • 大規模言語モデルに凝縮された人間の象徴的行動のパターンを分析し,社会科学研究に役立てる。
    • 大規模言語モデルは,人間が議論し,正当化し,物語を語り,規範を交渉する際のパターンを大規模に学習している。
    • モデルの出力は,集団的な言説のパターンを計算機的に利用可能にする,圧縮された生成表現と捉えられる。
    • プロンプトベースの実験や合成集団サンプリングなど,新たな方法論が社会科学研究のデザインに活用できる。

    Link: https://arxiv.org/abs/2603.07329

  • 安全重視の意思決定中の脳波からの神経力学的進行と同一性多様体の自己教師あり進化学習 [cs.CL, cs.NE]目的:安全重視の意思決定における脳波からの神経力学的進行と同一性多様体の発見
    • 交通環境における人間と車両のインタラクションにおいて,脳波を用いた認知状態の推定が重要性を増している。
    • 既存手法は,脳波を静的な生体認証情報として扱うか,長期的な神経力学的軌跡を無視したタスク特化型のデコーダを用いるため,セキュリティや継続的な認知状態のモデル化が課題である。
    • 本研究は,外部ラベルや事前定義された認知段階モデルなしに,連続的な脳波から個別化された神経力学的進行と固有の同一性多様体を自己教師あり進化学習によって発見することを目指す。
    • 提案手法は,段階内時間予測可能性,境界コントラスト,試行間アライメント,および疎な段階別特徴量重みを同時に最適化する。
    • シミュレーションされた横断歩道での意思決定タスク実験により,安定した個人特有の段階構造と神経力学的シグネチャが明らかになり,認証と異常検知に貢献する。
    • 提案手法は,既存手法と比較して,境界コントラストが大幅に向上し,試行間での意図境界の汎化性能が向上し,解釈可能な段階別特徴量の割り当てが可能となった。

    Link: https://arxiv.org/abs/2603.07334

  • VisualScratchpad:Vision Languageモデルにおける推論時の視覚概念分析 [cs.AI]目的:Vision Languageモデルの視覚概念分析手法
    • 近年,Vision Languageモデルの性能は向上しているが,その挙動の解釈が困難である。
    • モデルの誤りの原因特定が難しく,体系的なデバッグが課題となっている。
    • 推論時の視覚概念を分析し,モデルの内部動作を可視化することで,誤りの原因を特定する。
    • VisualScratchpadは,視覚エンコーダとテキストトークン間の関連性を可視化し,モデルがどのような視覚概念を利用しているかを示す。
    • Sparse Autoencoderを用いて視覚概念を抽出し,トークン-潜在空間ヒートマップにより,効果的な概念アブレーションのための潜在変数の特定を支援する。
    • ケーススタディにより,クロスモーダルアライメント不足,誤解を招く視覚概念,利用されていない隠れた手がかりといった,未解明の誤りモードを明らかにした。

    Link: https://arxiv.org/abs/2603.07335

  • AIパーソナを用いた合意形成スキルの育成:人間らしい音声に基づくAgora [cs.HC, cs.AI, cs.CE]目的:合意形成スキルの育成
    • 民主主義社会において,熟議と合意形成能力は,健全な政治運営に不可欠である。
    • 従来の熟議プロセスは参加機会が限られており,市民全体の合意形成能力向上には課題がある。
    • AIを活用し,より多くの人々が合意形成を実践できる環境を構築し,そのスキル向上を目指す。
    • AIプラットフォームAgoraは,政策課題に対する多様な意見を提示し,合意形成を支援する。
    • 予備実験の結果,Agoraの音声解説機能利用者は,問題解決スキルや内部熟議において高い能力を示した。
    • また,より質の高い合意声明を作成することが確認された。これにより,市民教育の新たな可能性が示唆された。

    Link: https://arxiv.org/abs/2603.07339

  • メカニズム的説明からのコンセプトボトルネックモデル学習 [cs.LG, cs.AI]目的:コンセプトボトルネックモデルの学習
    • AIの解釈可能性は,信頼性と安全性を高める上で不可欠である。
    • 既存のCBMは事前定義されたコンセプトに依存し,予測力や学習可能性に課題がある。
    • ブラックボックスモデルから抽出したコンセプトに基づき,CBMの性能向上を目指す。
    • 提案手法M-CBMは,既存のCBMと比較して,同程度のスパース性でより高い性能を示す。
    • コンセプト予測の精度が向上し,簡潔な説明が可能となる。
    • NCCという新しい指標により,情報漏洩を制御した公平な比較を実現した。

    Link: https://arxiv.org/abs/2603.07343

  • 系統的な分布シフト下における臨床表現の学習 [cs.DC, cs.NI, cs.CL, cs.LG]目的:臨床データの表現学習による,分布シフトへのロバスト性向上
    • 医療現場での機械学習活用が広がる中で,汎化性能の維持が重要となる。
    • 医療機関間でのデータ収集方法や記録の違いが,モデルの性能低下を招く。
    • 環境依存性を抑えた表現学習により,異なる医療機関でも有効なモデル構築を目指す。
    • 提案手法は,複数の電子カルテ予測タスクにおいて,既存手法よりAUROCを2~3ポイント向上させた。
    • 分布外データに対する性能向上に加え,分布内データにおける性能維持と校正精度の改善も確認された。
    • 表現学習時に系統的な分布シフトを考慮することが,医療AIのロバスト性と転移性を高める上で重要である。

    Link: https://arxiv.org/abs/2603.07348

  • マルチロボットマッピングのための分散ガウス過程モデル [cs.RO, cs.LG, stat.ML]目的:マルチロボットマッピングにおける協調的な関数学習
    • ロボットの自律性が求められる現代において,環境マッピングは不可欠な技術である。
    • 複数ロボットによるマッピングでは,情報統合の効率性や通信コストが課題となる。
    • 局所的な情報と計算のみで全体的なマッピングを可能にし,通信負荷を軽減すること。
    • 提案手法DistGPは,Tree-Structured GPsよりも優れた性能を発揮することが示された。
    • DistGPは,分散・非同期学習によって,集中型バッチ学習モデルと同等の性能に到達可能である。
    • DiNNOとの比較において,DistGPはより高い精度と疎な通信環境下でのロバスト性を示した。

    Link: https://arxiv.org/abs/2603.07351

  • AgrIチャレンジ:農業画像におけるチーム間検証のためのデータ中心AIコンペティション [cs.HC, cs.HC, cs.CV, cs.AI, cs.LG]目的:農業画像における汎化性能の向上
    • 農業分野における画像認識技術は,食料生産の効率化に不可欠である。
    • 実環境でのデータ分布の変化により,モデルの汎化性能が低下しやすい。
    • データ収集方法が汎化性能に与える影響を評価するフレームワークの構築。
    • 既存モデルは整理されたデータセットでは高い精度を示すが,実際の圃場環境下では汎化性能が低下する。
    • チーム間検証(CTV)により,異なるチームが収集したデータセット間での汎化性能の差が明らかになった。
    • 複数チームのデータを用いた共同学習により,汎化性能が大幅に向上することが示された。

    Link: https://arxiv.org/abs/2603.07356

  • 圧縮センシングおよびその他の逆問題のための調整可能な複雑度を持つ潜在生成モデル [cs.LG, cs.AI]目的:逆問題に対する生成モデルの性能向上
    • 逆問題は,限られた情報から信号を復元する上で重要であり,多様な分野で応用されている。
    • 従来の生成モデルは固定の複雑度しか持たず,問題に応じて表現誤差や過学習を引き起こす可能性がある。
    • 調整可能な複雑度を持つ生成モデルを開発し,最適化された性能と汎化能力を実現すること。
    • 提案手法は,圧縮センシング,インペインティング,ノイズ除去,位相復元などのタスクにおいて,固定複雑度モデルよりも低い再構成誤差を達成した。
    • 線形ノイズ除去設定において,最適な調整パラメータがノイズとモデル構造にどのように依存するかを理論的に解析した。
    • 調整可能な複雑度を持つ生成モデルの可能性を示し,さらなる理論的発展と幅広い逆問題への応用を促す。

    Link: https://arxiv.org/abs/2603.07357

  • AIエージェントにおけるイェークス・ドドソン曲線:マルチエージェントLLMシミュレーションにおける環境圧力下での創発的協調 [cs.AI]目的:AIエージェントにおける創発的行動発達率を最大化する環境設計
    • AIの自律的な問題解決能力向上は,社会の様々な課題解決に不可欠である。
    • LLMエージェントの複雑な環境下での行動特性は未だ十分には解明されていない。
    • 環境圧力を調整することで,LLMエージェントの協調行動を促進する手法を確立すること。
    • 環境圧力と協調行動の間に,反転U字型の関係が存在することが示された。
    • 適度な環境圧力(維持コスト5)下で,エージェント間の取引が最も活発であった。
    • 性的選択が,エージェント間の攻撃行動を排除し,コミュニケーション行動を誘発することが確認された。

    Link: https://arxiv.org/abs/2603.07360

  • 長期的な山火事リスク予測のためのN-Tree拡散 [cs.LG, cs.CV]目的:長期的な山火事リスク予測のための確率的空間場生成
    • 山火事は生態系や社会に甚大な被害をもたらすため,その予測は重要である。
    • 既存手法では,複数予測期間にわたる計算効率が課題となっていた。
    • 本研究は,冗長な計算を削減し,予測精度と効率を向上させることを目指す。
    • 提案手法NT-Diffusionは,初期段階のノイズ除去を共有し,後の段階で分岐することで計算コストを削減する。
    • 実際の山火事データを用いた評価で,NT-Diffusionは既存手法と比較して,予測精度と推論コストの両方で改善が確認された。
    • 本手法は,確率的モデリングに適した平滑な空間リスク場を提供し,長期的な予測を可能にする。

    Link: https://arxiv.org/abs/2603.07361

  • 微小領域におけるスケーリング則:小型モデルが誤りをどのように変化させるか [cs.LG, cs.AI]目的:小型モデルにおける性能変化のメカニズム解明
    • TinyMLやエッジAIの発展には,小型モデルの性能理解が不可欠である。
    • 従来の調査は大規模モデルに偏っており,20Mパラメータ以下の小型モデルは未解明であった。
    • 小型モデルのスケーリング則を明らかにし,誤りの変化とモデルサイズの関係を理解する。
    • モデルサイズが小さくなるにつれて,誤分類される入力データが変化することが示された。
    • 小型モデルは,容易なクラスに学習容量を集中させ,難しいクラスを放棄する傾向がある。
    • 最小サイズのモデルは,意外にも高いキャリブレーション性能を示すことが確認された。

    Link: https://arxiv.org/abs/2603.07365

  • LLMにおける公平性のためのファンクターベースおよびRAG駆動型バイアス軽減の必要性 [cs.CL, cs.CL, cs.AI]目的:大規模言語モデルにおけるバイアス軽減手法
    • LLMの社会実装が進む中,潜在的な偏りが倫理的・社会的な問題を引き起こす可能性が懸念される。
    • LLMは,性別,民族,地域などの属性と職業や社会的役割との間に系統的な歪みを伴うバイアスを抱えやすい。
    • カテゴリー理論とRAGを組み合わせることで,より公平で公正なモデル出力を実現することを目指す。
    • 本研究は,バイアスを除去しつつ意味的整合性を保つカテゴリー理論的変換と,最新の知識を注入するRAGの有効性を個別に検証した。
    • カテゴリー理論は,偏った意味領域を非偏った標準形に写像する厳密な数学的枠組みを提供する。
    • これらのアプローチを統合することで,LLMの公平性を担保するための包括的なフレームワークを提案する。

    Link: https://arxiv.org/abs/2603.07368

  • CSI不要なmmWaveビームフォーカシングのための階層型マルチエージェント強化学習 [cs.LG]目的:ミリ波システムにおける機械的に再構成可能な反射面の制御
    • 無線環境の変革が期待される再構成可能なインテリジェントサーフェスの実用化
    • チャネル状態情報(CSI)推定のオーバーヘッドと集中型最適化の次元爆発
    • CSI推定を行わず,ユーザ位置情報のみで高精度なビームフォーカシングを実現
    • 提案手法は,集中型ベースラインと比較して2.81〜7.94 dBのRSSI改善を達成した。
    • システム複雑性が増加するにつれて,その性能優位性は拡大する。
    • ユーザ密度が2倍になっても,ユーザあたりの性能劣化や総電力消費の不安定化は最小限に抑えられた。

    Link: https://arxiv.org/abs/2603.07370

  • ConfHit:オラクルフリーな保証を持つ共形生成設計 [cs.LG, cs.AI]目的:深層生成モデルによる科学的発見における信頼性保証
    • 科学的発見において,新しい候補の生成に加え,その候補の特性に対する信頼性が重要である。
    • 既存の共形予測法は,計算コストやオラクルへのアクセス制限,分布シフトにより,創薬における応用が限定されている。
    • ConfHitは,上記課題を解決し,信頼性保証付きの生成モデルを構築することを目指す。
    • ConfHitは,実験的なオラクルを必要とせず,分布フリーな枠組みで信頼性保証を提供する。
    • 生成されたバッチに,指定された信頼水準で少なくとも1つのヒットが含まれることを保証する「認証」と,保証を弱めることなく生成を洗練する「設計」を形式化した。
    • 分子設計タスクにおいて,複数の信頼水準で有効な保証を提供し,コンパクトな認定セットを維持することで,原理的かつ信頼性の高いフレームワークであることを示した。

    Link: https://arxiv.org/abs/2603.07371

  • 低リソース環境における機械翻訳のドメイン特化型品質推定 [cs.CL, cs.AI, cs.LG]目的:低リソース環境下の機械翻訳における品質推定手法の開発
    • 機械翻訳の利用拡大に伴い,翻訳品質の自動評価が重要視されている。
    • 特に,ドメイン特化型かつ低リソース言語ペアでは,品質推定が困難である。
    • 大規模言語モデルを活用し,より堅牢な品質推定手法を確立すること。
    • プロンプトのみでは,オープンウェイトモデルの品質推定は不安定でありやすい。
    • 中間層への低ランク適応(ALOPE/LoRMA)が,品質推定性能を安定的に向上させる。
    • 特に,意味的に複雑なドメインにおいて,その効果が顕著に現れる。

    Link: https://arxiv.org/abs/2603.07372

  • AIトレーニングのための並列光回路スイッチのスケジューリング [cs.NI, cs.AI]目的:AIトレーニングにおけるデータセンターのトラフィック需要とエネルギー消費の増加に対応するための,並列光回路スイッチ(OCS)における効率的なスケジューリング手法
    • AI技術の急速な発展に伴い,データセンターのトラフィック量とエネルギー消費量が大幅に増加している。
    • 並列OCSの導入は有効だが,再構成遅延を考慮した効率的なトラフィックスケジューリングが課題となっている。
    • 再構成遅延を考慮しつつ,並列OCSにおけるスケジューリング最適化を図り,AIワークロードの処理時間を短縮すること。
    • 提案手法Spectraは,トラフィック行列を最小限の加重置換に分解し,ロードアウェアな割り当てと制御された置換分割を行うことで,スケジューリング期間を大幅に短縮する。
    • GPTモデルやMoEを用いたAIワークロード,標準ベンチマークにおいて,最先端アルゴリズムと比較して,平均1.4~2.4倍の性能向上を達成した。
    • Spectraによって得られたスケジューリング期間は,新たに導出された下限に一貫して近い値を示している。

    Link: https://arxiv.org/abs/2603.07373

  • エージェントによる検索拡張生成(RAG):分類,アーキテクチャ,評価,研究方向 [eess.SY, cs.SY, cs.AI, cs.CL, cs.CR, cs.IR]目的:エージェント型RAGシステムの体系的理解のための統一的フレームワーク
    • 大規模言語モデルの活用が拡大する中で,知識検索と生成を組み合わせたRAG技術が重要性を増している。
    • エージェント型RAGの研究は急速に進むも,体系的な理解が不足し,アーキテクチャや評価方法が不統一である。
    • エージェント型RAGシステムの信頼性,制御可能性,スケーラビリティを向上させるための研究方向性を示す。
    • エージェント型RAGを有限ホライズン部分観測マルコフ決定過程として形式化し,制御ポリシーと状態遷移を明示的にモデル化した。
    • 計画メカニズム,検索オーケストレーション,メモリパラダイム,ツール呼び出し動作による分類体系とモジュールアーキテクチャを開発した。
    • 従来の評価方法の限界を分析し,幻覚の蓄積,メモリ汚染,検索のずれ,ツールの脆弱性などのシステムリスクを特定した。

    Link: https://arxiv.org/abs/2603.07379

  • 疎性と分布外汎化 [cs.LG, cs.AI]目的:分布外汎化の原理的説明
    • 知識論における根本問題であり,AIアライメントを含む機械学習においても重要である。
    • 訓練分布とテスト分布の乖離に対する汎化性能の理論的解明が課題である。
    • 特徴量における疎性を利用し,分布外汎化の条件を形式的に示す。
    • 世界は区別可能な特徴を通じて経験され,オッカムの剃刀は可能な限り少ない特徴に依存する仮説を支持する。
    • 仮説の疎性は,訓練分布とテスト分布が関連する特徴において十分に重なり合う場合に,汎化を可能にする。
    • Blumerらの古典的なサンプル複雑度限界を,分布外の文脈に一般化する定理を証明した。

    Link: https://arxiv.org/abs/2603.07388

  • 一つのスコーンで鳥に餌を与える:二段階最適化によるマルチタスク勾配バランスの加速 [cs.LG, math.OC]目的:マルチタスク学習における勾配バランスの効率化
    • 機械学習において,複数のタスクを同時に最適化するマルチタスク学習は,汎化性能向上に不可欠である。
    • 既存の勾配バランス手法は,全てのタスクの勾配情報を必要とするため,計算コストが高いという課題がある。
    • 二段階最適化と零次法を用いることで,勾配バランスの計算効率を改善し,大規模データセットへの適用を可能とする。
    • 提案手法MARIGOLDは,マルチタスク勾配バランスを二段階最適化として捉え,効率的な求解を可能にする。
    • 実験結果から,MARIGOLDは既存手法と比較して,計算効率と性能の両面で優れていることが示された。
    • 本手法は,大規模な公開データセットおよび産業規模データセットにおいて有効であることが確認された。

    Link: https://arxiv.org/abs/2603.07389

  • 法的コンプライアンス分類と証拠検索のための決定論的ファジー選別 [cs.LG]目的:法的コンプライアンス分類と証拠検索のための決定論的ファジー選別システムの開発
    • 契約証拠の量が増加しており,機械学習による効率的な選別が求められている。
    • 既存の機械学習モデルは不透明で再現性が低く,法的フレームワークとの整合性が課題である。
    • 決定論的な手法を用いて,説明可能で監査可能な選別システムの構築を目指す。
    • 決定論的デュアルエンコーダと透明なファジー選別バンドに基づいたシステムを開発した。
    • ACORDベンチマークとCUADデータセットを用いた評価で,高い精度と再現性を示した。
    • 自動判断範囲を最大化しつつ,エラー率を2%以下に抑える閾値を調整することで,実用的なシステムを実現した。

    Link: https://arxiv.org/abs/2603.07390

  • AQuA:曖昧な視覚的質問に対する戦略的応答生成に向けて [cs.DC, cs.CL, cs.RO, cs.SY, eess.SY, cs.CV, cs.AI, cs.CL]目的:曖昧な視覚的質問に対する戦略的な応答生成
    • 近年,画像と言語を理解するモデルの能力評価として,視覚的質問応答が重要視されている。
    • 既存のデータセットは曖昧さを含んでおらず,現実世界での曖昧な質問への対応が課題であった。
    • 曖昧さのレベルに応じた適切な応答戦略をモデルに学習させ,より自然な応答を目指す。
    • 本研究では,曖昧な視覚的質問データセットAQuAを構築し,曖昧さのレベルと最適な応答戦略を定義した。
    • 既存のモデルは曖昧さの種類に適応できず,過信した回答や不確実性の認識不足が課題であることが示された。
    • AQuAでファインチューニングしたモデルは,曖昧さを認識し,適切な戦略を選択することで,既存モデルを上回る性能を示した。

    Link: https://arxiv.org/abs/2603.07394

  • 線形オートエンコーダー型レコメンダーの一般化:分離された期待二乗損失による [cs.LG]目的:線形オートエンコーダー型レコメンダーの性能向上
    • レコメンダーシステムは,情報過多な現代において,ユーザーに適切な情報を提供する上で不可欠である。
    • 既存の線形オートエンコーダーモデルは,ハイパーパラメータの選択肢が限定され,性能向上の余地があった。
    • より広範なハイパーパラメータ範囲における解を導き出し,モデルの性能を向上させる。
    • 分離された期待二乗損失(DEQL)を導入することで,EDLAEの解法を簡略化し,$b > 0$ の範囲での解を導出した。
    • DEQLに基づく手法は,既存のEDLAEよりも優れたテスト性能を示すことが,ベンチマークデータセットを用いた実験で確認された。
    • DEQLは解の探索空間を拡大し,より高性能なモデルの発見を可能にする。

    Link: https://arxiv.org/abs/2603.07402