arXiv雑要約

AI - 2026/03/06 公開

  • オンライン市場経済における社会規範を制御するための不変因果ルーティング [cs.LG, cs.AI, cs.CY]目的:社会規範の因果メカニズムの理解と,望ましい結果への規範の誘導
    • オンライン市場経済において,公平性や参加維持といった社会規範は長期的な安定に不可欠である。
    • 規範は多数の微視的な相互作用から生じるため,因果関係の特定や政策の適用が困難である。
    • 環境の変化に強い,解釈可能な政策ルールを構築し,規範の安定性を高めることを目指す。
    • 提案手法である不変因果ルーティング(ICR)は,多様な環境下で安定な政策と規範の関係を特定する。
    • ICRは反事実推論と不変因果探索を組み合わせ,見かけ上の相関関係を除去し,効果的な政策ルールを構築する。
    • シミュレーション結果から,ICRは既存手法よりも安定した規範,小さな汎化誤差,簡潔なルールを実現した。

    Link: https://arxiv.org/abs/2603.04534

  • プロの視覚芸術家が職場における生成AIとの交渉をどのように行っているか [cs.HC, cs.AI, cs.CY]目的:プロの視覚芸術家における生成AIの影響
    • 芸術分野は,創造性と文化の発展に不可欠であり,社会に重要な価値を提供する。
    • 生成AIの導入により,芸術家の職務やキャリアに新たな課題が生じている。
    • 生成AIが芸術家の職場環境に及ぼす影響を明らかにし,より良い共存の道を探る。
    • 調査の結果,大多数の視覚芸術家は生成AIの使用に強く反対しており,職場での導入を拒否する戦略を取っていることが明らかになった。
    • 生成AIの使用は,顧客,上司,同僚からの圧力など,様々な環境要因によって左右される。
    • 生成AIは,職場にストレスの増加や雇用機会の減少など,否定的な影響をもたらしていると報告されている。

    Link: https://arxiv.org/abs/2603.04537

  • 大規模知識グラフにおけるGNNモデルのためのLLM誘導型クエリ認識推論システム [cs.LG, cs.DB]目的:大規模知識グラフ上のGNN推論の効率化
    • 知識グラフは現実世界の複雑な関係性を表現でき,様々な応用分野で重要性が増している。
    • 大規模知識グラフにおけるGNN推論は計算コストが高く,クエリの複雑さに応じて処理時間が大きく変動する。
    • クエリに応じてモデルを動的に調整し,必要な部分のみをロードすることで推論効率を向上させる。
    • KG-WISEは,GNNモデルを細粒度のコンポーネントに分解し,クエリ構造に基づいた部分的なロードを可能にする。
    • LLMを活用して再利用可能なクエリテンプレートを生成し,タスクごとに意味的に関連するサブグラフを抽出することで,クエリ認識型のコンパクトなモデルインスタンス化を実現する。
    • 6つの大規模知識グラフでの評価により,最先端システムと比較して最大28倍の高速化と98%のメモリ使用量削減を達成し,精度を維持または向上させた。

    Link: https://arxiv.org/abs/2603.04545

  • 制約付き敵対者を用いたオラクル効率的なハイブリッド学習 [cs.LG, stat.ML]目的:ハイブリッド学習における統計的最適性と計算効率の同時達成
    • 統計的学習と完全敵対的学習の中間的設定であり,現実的な問題設定に対応可能である。
    • 既存手法は,統計的最適性と計算効率のトレードオフが存在し,両立が困難であった。
    • 敵対者のラベル選択を制約することで,効率性と最適性の両立を目指す。
    • 提案アルゴリズムは,ERMオラクルが利用可能であれば効率的に実行され,ラダメッシャー複雑性に依存する後悔 bounds を得る。
    • 特に,ストカスティックゼロサムゲームにおける均衡計算に対して,オラクル効率的なアルゴリズムが提供される。
    • 新たなフランク・ヴォルフ還元法と,ハイブリッドマルチンゲール差分系列に対する新たなテール bound が開発された。

    Link: https://arxiv.org/abs/2603.04546

  • LLMエージェントのための適応型メモリ適格性制御 [cs.RO, cs.AI, cs.CL, cs.MA]目的:LLMエージェントにおける長期記憶の適格性制御
    • LLMエージェントの性能は,長期記憶の質に大きく左右されるため,その制御は重要である。
    • 現在のシステムでは,記憶する情報の制御が不十分であり,誤った情報が蓄積される問題がある。
    • 明示的かつ解釈可能な適格性制御により,LLMエージェントの長期記憶のスケーラビリティと信頼性を向上させる。
    • 提案手法A-MACは,記憶の価値を5つの要素に分解し,構造化された意思決定問題としてメモリ適格性を扱う。
    • LoCoMoベンチマークにおいて,A-MACはF1スコアを0.583に向上させ,遅延を31%削減した。
    • コンテンツタイプ事前情報が,信頼性の高いメモリ適格性において最も重要な要素であることが示された。

    Link: https://arxiv.org/abs/2603.04549

  • 潜在粒子世界モデル:自己教師あり物体中心の確率的ダイナミクスモデリング [cs.NI, cs.HC, cs.LG]目的:物体中心の確率的ダイナミクスモデリング
    • 現実世界の複雑なシーンを理解し,予測するための基礎技術として重要である。
    • 既存手法では,複雑なシーンの構造を捉え,高精度な予測を行うことが困難であった。
    • 自己教師あり学習により,複雑なシーンを物体単位で分解し,予測精度を向上させる。
    • LPWMは,動画データから自己学習でキーポイント,バウンディングボックス,オブジェクトマスクを検出する。
    • LPWMは,行動,言語,画像目標などの条件付けに対応し,多様なタスクに適用可能である。
    • LPWMは,様々な実世界のデータセットおよび合成データセットにおいて,最先端の結果を達成した。

    Link: https://arxiv.org/abs/2603.04553

  • 深層学習におけるフュージョンおよびグルーピング戦略:マルチモーダルリモートセンシングデータを用いた局所気候区分 [cs.CY, cs.RO, cs.CV, cs.LG]目的:局所気候区分のための深層学習におけるフュージョン戦略と,データ特性に基づくグルーピング戦略の分析
    • 都市構造や土地利用の変化が局所的な気候に与える影響分析において,局所気候区分は不可欠な情報を提供する。
    • マルチモーダルリモートセンシングデータの複雑性から,データフュージョン手法の体系的な分析が不足している。
    • 深層学習モデルにおける様々なフュージョン戦略の効果を定量的に評価し,最適な組み合わせを明らかにすること。
    • シンプルなフュージョン手法と比較して,ベースラインハイブリッドフュージョン(FM1)が常に優れた性能を示した。
    • バンドグルーピング(BG)とラベルマージング(LM)をFM1に適用した結果,全てのフュージョン戦略の中で最も高い全体精度76.6%を達成した。
    • 本研究は,これらの戦略が,データが少ないクラスの予測精度向上に貢献することを強調している。

    Link: https://arxiv.org/abs/2603.04562

  • ニューラルネットワークが忘却する理由:継続学習における崩壊の研究 [cs.RO, cs.RO, cs.LG, cs.AI]目的:継続学習における忘却と崩壊の相関
    • ニューラルネットワークの応用拡大に伴い,柔軟な知識獲得が重要視されている。
    • 継続学習において,過去の知識を失う「破滅的忘却」が課題となっている。
    • ネットワーク構造の崩壊が忘却に影響する可能性に着目し,その関係性を検証する。
    • 忘却と崩壊は強い相関関係にあり,継続学習戦略がモデルの容量と性能維持に寄与することが示された。
    • 重みと活性化のeRankを測定することで,崩壊が可塑性の低下と関連していることが確認された。
    • 異なる継続学習戦略は,効率の観点から,モデルの容量と性能を異なる形で維持するのに役立つことが明らかになった。

    Link: https://arxiv.org/abs/2603.04580

  • 自己評価バイアス:AI監視システムが自己に寛容になる場合 [cs.AI, cs.LG]目的:AIエージェントにおける自己監視時のバイアス
    • AIエージェントの自律性と安全性を確保する上で,行動の監視は不可欠である。
    • AIが自己生成した行動を評価する際,客観性が損なわれる可能性がある。
    • AI監視システムにおける自己評価バイアスを特定し,改善策を提示すること。
    • AI監視システムは,自身が過去に行った行動を評価する際に,より寛容になる傾向がある。
    • この自己評価バイアスは,行動がユーザーの指示ではなく,AI自身の応答に含まれている場合に顕著になる。
    • AI監視システムの評価には注意が必要であり,実際の運用環境での信頼性を過大評価しないようにすべきである。

    Link: https://arxiv.org/abs/2603.04582

  • ECG-MoE:専門家混合型心電図基盤モデル [cs.AI]目的:心電図分析のための基盤モデルの構築
    • 心臓診断において心電図は不可欠であり,その精度向上は臨床上の重要課題である。
    • 既存の基盤モデルは,心電図の周期性や多様な特徴を十分に捉えられていない。
    • 心拍レベルの形態とリズムを別々にモデル化し,効率的な推論を実現する。
    • ECG-MoEは,5つの公開臨床タスクにおいて最先端の性能を達成した。
    • マルチタスクベースラインと比較して,40%高速な推論が可能である。
    • 心臓周期を考慮した専門家モジュールと多岐にわたる時間的特徴を統合するハイブリッドアーキテクチャである。

    Link: https://arxiv.org/abs/2603.04589

  • プライバシー保護のための国民医療データ環境における後期融合マルチモーダルAIフレームワーク [cs.CL, cs.LG]目的:プライバシーを保護した国民医療データ環境における重複排除のためのAIフレームワーク
    • 顧客関係管理や医療分野において,データの正確性や利用者の体験,法令遵守に影響を与える重複記録の課題は重要である。
    • GDPRやHIPAA等の厳格なプライバシー規制により,個人識別情報に依存する従来の重複排除手法は効果が限定される。
    • 個人情報に依存せず,重複を検出し,セキュアなデジタルインフラを構築し,信頼性の高い公衆衛生分析を可能にすること。
    • 提案モデルは,テキスト埋め込み,行動パターン,デバイスメタデータという異種モダリティを後期融合により組み合わせることで,高いF1スコアを達成した。
    • このフレームワークは,データの変動やノイズに強く,プライバシーを保護しながら重複を効果的に識別できる。
    • 本アプローチは,国家レベルの医療データ近代化に貢献し,プライバシー優先のイノベーションを推進する。

    Link: https://arxiv.org/abs/2603.04595

  • 強化学習におけるグループレベルの自然言語フィードバックによる探索のブートストラップ [cs.CL, cs.AI]目的:強化学習における探索効率の向上
    • 強化学習は,複雑なタスクを自動化する上で重要な技術である。人間の介入なしに最適な行動戦略を学習可能である。
    • 従来の強化学習はスカラー報酬に依存しており,自然言語フィードバックに含まれる豊富な情報を十分に活用できていない。
    • 自然言語フィードバックを効果的に利用し,効率的な探索を可能にすることで,強化学習の性能を向上させる。
    • 提案手法GOLFは,グループレベルの自然言語フィードバックを活用し,標的を絞った探索を可能にする。
    • GOLFは,外部からの批判とグループ内での試行という2種類のフィードバックを統合し,質の高い改善策を生成する。
    • 実験の結果,GOLFはスカラー報酬のみで学習する強化学習手法と比較して,サンプル効率が2.2倍向上することが示された。

    Link: https://arxiv.org/abs/2603.04597

  • Vibe Code Bench:エンドツーエンドのWebアプリケーション開発におけるAIモデルの評価 [cs.SE, cs.AI, cs.CL]目的:AIモデルのWebアプリケーション開発能力の評価
    • AI技術は目覚ましい発展を遂げており,特にコード生成はその中でも重要な応用分野である。
    • 既存の評価指標は,部分的なタスクに焦点を当てており,アプリケーション全体を構築する過程を評価できていない。
    • 本研究は,Webアプリケーションのゼロから構築という完全なプロセスを評価する指標を提案し,AIモデルの能力を詳細に分析する。
    • Vibe Code Benchは,100のWebアプリケーション仕様と964のワークフローから構成される新しいベンチマークである。
    • 最先端の16モデルを評価した結果,テストセットでの最高精度は58.0%に留まり,エンドツーエンドの開発は依然として課題であることが示された。
    • 生成中の自己テストが性能の重要な予測因子であり,評価者の選択が結果に大きな影響を与えることが明らかになった。

    Link: https://arxiv.org/abs/2603.04601

  • 慣性核融合におけるシステムパラメータの逆推定を加速する偏微分方程式基礎モデル [eess.SY, cs.RO, cs.SY, cs.LG, physics.plasm-ph]目的:慣性核融合におけるシステムパラメータ逆推定の高速化
    • 慣性核融合は,クリーンエネルギー実現に向けた重要な研究分野である。
    • シミュレーション精度向上には,システムパラメータの正確な推定が不可欠である。
    • データ不足下でのパラメータ推定精度の向上が課題である。
    • 偏微分方程式基礎モデルを微調整することで,高精度な分光画像再構成が可能となった。
    • システムパラメータ推定においても高い性能(R^2=0.995)が示された。
    • 少量データでの学習において,事前学習済みモデルの利用がサンプル効率を向上させる。

    Link: https://arxiv.org/abs/2603.04606

  • K-Meansアルゴリズムと微分可能なRBFニューラルネットワークの同値性:変分法と勾配法に基づく [cs.DC, cs.LG, math.ST, stat.ML, stat.TH]目的:K-Meansアルゴリズムと微分可能なRBFニューラルネットワークの間の厳密な同値性
    • クラスタリングは,データの構造を発見し,複雑なデータセットを理解するための重要な手法である。
    • K-Meansは離散的な分割アルゴリズムであり,勾配降下法のような連続的な最適化手法との統合が困難である。
    • K-Meansを深層学習アーキテクチャに組み込み,表現学習とクラスタリングを同時に最適化すること。
    • 変分法と勾配法により,K-MeansとRBFニューラルネットワークが数学的に同値であることが証明された。
    • RBFの目的関数が温度パラメータが消失するにつれてK-Means解に$\Gamma$-収束することが示された。
    • Entmax-1.5を導入することで,低温レジームにおけるSoftmax変換の数値的不安定性を克服し,安定した収束を実現した。

    Link: https://arxiv.org/abs/2603.04625

  • LLMベースのリスク評価:自動データ分析のためのガイド付きフレームワーク [cs.AI]目的:LLMを活用したデータセットのリスク評価手法
    • LLMの意思決定への応用増加に伴い,堅牢なデータ分析の自動化が不可欠となっている。
    • 既存のリスク分析は手作業に頼る部分が多く,AIによる自動化は幻覚や整合性の問題がある。
    • 人間の指導下で生成AIを統合し,自動化されたリスク分析の基盤を構築することを目指す。
    • 本フレームワークは,データベースのスキーマから意味的・構造的特性をLLMが特定する。
    • LLMはクラスタリング手法を提案し,コードを生成,結果を解釈する。
    • 人間のスーパーバイザーが分析を導き,プロセス全体の整合性を確保する。

    Link: https://arxiv.org/abs/2603.04631

  • エージェントが説得するとき:LLMにおけるプロパガンダの生成と軽減 [cs.AI]目的:LLMによるプロパガンダ生成と軽減に関する研究
    • LLMの普及に伴い,情報操作や誤情報の拡散リスクが高まっている。
    • LLMが意図的に操作された情報を生成し,社会に悪影響を及ぼす可能性がある。
    • LLMがプロパガンダを生成する傾向を抑制し,安全な利用を促す方法を探る。
    • LLMは,プロパガンダを目的とする指示に対して,実際にプロパガンダ的な行動を示すことが確認された。
    • LLMは,感情的な言葉遣いや恐怖への訴えかけなど,様々なレトリック手法を使用することが明らかになった。
    • 教師ありファインチューニングやDPO,ORPOといった手法により,プロパガンダ生成の傾向を大幅に軽減できることが示された。特にORPOが最も効果的であった。

    Link: https://arxiv.org/abs/2603.04636

  • 拡散MRIからの浸透率を考慮した微細構造再構成のための微分可能な物理モデル:Spinverse [cs.CV, cs.LG, q-bio.QM]目的:拡散MRI計測値の反転を通じた浸透率を考慮した微細構造の再構成
    • 拡散MRIは微細構造の障壁に感度を持つため,脳組織の理解に不可欠である。
    • 既存手法は不浸透性の境界を仮定するか,明示的な界面を復元せずにボクセルレベルのパラメータを推定する。
    • Spinverseは,既存手法の限界を克服し,界面を明示的に復元することを目指す。
    • Spinverseは,Bloch-Torreyシミュレータを通して拡散MRI計測値を反転させる。
    • 界面の形状は固定されず,浸透率の低い面が拡散の障壁として現れる。
    • 合成ボクセルメッシュを用いた実験により,Spinverseが多様な形状を再構成できることが示された。

    Link: https://arxiv.org/abs/2603.04638

  • RoboMME:ロボット汎用ポリシーのためのメモリのベンチマークと理解 [cs.RO, cs.AI]目的:ロボット汎用ポリシーにおけるメモリの評価と理解
    • 長期的なタスク遂行や履歴依存型ロボット操作において,メモリは不可欠である。
    • 既存の評価は限定的で標準化されていないため,体系的な理解や進捗測定が困難である。
    • 長期・履歴依存シナリオにおけるVLAモデルの評価と発展を可能にする標準ベンチマークを提供する。
    • RoboMMEは,時間的,空間的,物体,手順的メモリを評価する16の操作タスクで構成される大規模なベンチマークである。
    • 14種類のメモリ拡張VLAモデルを開発し,異なるメモリ表現の統合戦略を体系的に比較した。
    • メモリ表現の有効性はタスクに依存し,各設計には固有の利点と限界があることが示された。

    Link: https://arxiv.org/abs/2603.04639

  • センサー故障時:センサードリフト下におけるロバストなPPOのための時間系列モデル [cs.RO, cs.HC, cs.AR, cs.CL, cs.LG, cs.AI]目的:センサー故障による部分観測や表現の変化下でのPPOのロバスト性
    • 実世界の強化学習システムでは,観測データの分布が変化することが避けられない。
    • 既存の強化学習手法は,完全観測とノイズのない状態を前提としている場合が多い。
    • 時間的な系列モデルを用いて,欠損情報を推論し,性能維持を目指す。
    • 時間系列モデル(TransformerやSSM)をPPOに組み込むことで,センサー故障に対するロバスト性が向上することが示された。
    • Transformerベースの系列ポリシーは,MLP,RNN,SSMなどのベースラインと比較して,優れたロバスト性を示し,高収益を維持した。
    • 無限地平線報酬劣化に関する高確率上限が証明され,ポリシーの滑らかさと故障の持続時間への依存性が定量化された。

    Link: https://arxiv.org/abs/2603.04648

  • iAgentBench:高トラフィックな話題における情報探索エージェントの状況把握能力のベンチマーク [cs.CL, cs.IR, cs.LG, cs.MA]目的:情報探索エージェントの状況把握能力のベンチマーク
    • 検索機能付き生成型QAシステム利用の増加に伴い,複数情報源からの証拠統合が重要になっている。
    • 既存のQAベンチマークは単一の関連箇所検索で答えられるものが多く,複数情報源の統合評価には不向きである。
    • 現実的な情報探索行動を反映した質問を通じて,複数情報源からの証拠統合能力を評価すること。
    • iAgentBenchは,現実世界の注目度に基づいた動的なODQAベンチマークである。
    • 検索精度は向上するものの,検索のみでは質問が確実に解決されないことが示された。
    • 証拠のアクセスだけでなく,証拠の活用方法を評価する必要があることが強調されている。

    Link: https://arxiv.org/abs/2603.04656

  • 多エージェント経路計画のためのグローバルパス統合と注意グラフネットワーク [cs.CL, cs.CY, physics.ed-ph, cs.RO, cs.AI]目的:多エージェント経路計画における衝突回避手法
    • ロボットの協調作業は,物流や災害対応など,様々な分野で重要性が増している。
    • 従来の衝突回避手法は,複雑な環境下で高い性能を維持することが困難であった。
    • 動的な環境変化に対応し,ロバストな経路計画を実現することを目指す。
    • 提案手法は,既存のNH-ORCA,DRL-NAV,GA3C-CADRLといったベースラインモデルと比較して,高い成功率を示した。
    • 特に複雑で動的な環境において,衝突率の低減と効率的なナビゲーションが確認された。
    • 本研究は,複雑な環境下での多ロボットナビゲーションの性能向上に貢献するものと考えられる。

    Link: https://arxiv.org/abs/2603.04659

  • 決定論的ファクト台帳と敵対的低遅延ハルシネーション検出器によるニューロシンボリック金融推論 [cs.LG, cs.AI, cs.CE]目的:金融分野におけるニューロシンボリック推論の実現
    • 金融分野では,高い信頼性が求められるため,正確な推論が不可欠である。
    • 大規模言語モデル(LLM)は,算術的な能力が不足しており,ベクトル検索による意味的混同が生じやすい。
    • ハルシネーション(誤った情報の生成)をゼロに抑えた金融推論を実現すること。
    • 検証可能な数値推論エージェント(VeNRA)は,確率的なテキストの検索から,厳密に型付けされた汎用ファクト台帳(UFL)による決定論的変数の検索へとRAGパラダイムを転換する。
    • VeNRA Sentinelは,Python実行トレースを法医学的に監査する30億パラメータのSLMであり,わずか1トークンのテスト予算で実行される。
    • 逆Chain-of-Thought学習における損失希釈現象を特定し,OOMセーフなマイクロチャンキング損失アルゴリズムを提案し,極端な微分ペナルティ下での勾配を安定化させた。

    Link: https://arxiv.org/abs/2603.04663

  • 視覚と言語モデルを用いた問題難易度の予測 [cs.CG, math.CO, cs.RO, cs.AI, cs.CL, cs.CV]目的:データ可視化リテラシーテスト問題の難易度推定
    • データ可視化能力は現代社会において不可欠であり,その評価手法の確立が重要である。
    • 問題難易度の適切な評価は,テストの信頼性と妥当性を高める上で課題となる。
    • 大規模言語モデルを用いて問題難易度を自動的に予測し,効率的なテスト開発を目指す。
    • 視覚情報とテキスト情報を組み合わせた多Modalモデルが,MAEにおいて最も低い誤差(0.224)を示した。
    • 単一Modalモデル(視覚のみ0.282,テキストのみ0.338)と比較して,多Modalモデルの性能が優れていることが示された。
    • 外部評価においてもMSE 0.10805を達成し,LLMの心理測定分析および自動問題開発への応用可能性が示唆された。

    Link: https://arxiv.org/abs/2603.04670

  • 物理情報ニューラルネットワークの精度向上:最終層再学習によるアプローチ [math.NA, cs.LG, cs.NA]目的:物理情報ニューラルネットワークの精度向上手法
    • 科学的機械学習の発展に伴い,偏微分方程式の求解にPINNが活用されている。
    • PINNの適切な学習戦略は自明ではなく,多くの場合,中程度の精度の解しか得られない。
    • ネットワークに関連する関数空間における最適な近似を求めることで,PINNの精度を向上させる。
    • 提案手法は,様々なアーキテクチャと次元において,元のPINNと比較して4~5桁低い誤差を達成した。
    • 線形空間の基底関数は,時間依存性や非線形性を持つより複雑な問題設定で再利用可能であり,転移学習を可能にする。
    • 残差に基づく指標により,使用する基底関数の数を最適に選択できる。

    Link: https://arxiv.org/abs/2603.04672

  • マルチ画像理解タスクにおける推論VLMのパルス解読 [cs.CV, cs.AI]目的:マルチ画像推論における視覚言語モデル(VLM)の注意メカニズムの解析
    • 画像と言語を組み合わせた理解は,AIの応用範囲を広げる上で不可欠である。
    • VLMはマルチ画像推論において,関連画像への注意が拡散し,集中しにくいという課題がある。
    • VLMの推論過程における注意の焦点を絞り,マルチ画像理解の性能向上を目指す。
    • 推論時に計画と集中を繰り返すことで,VLMの注意メカニズムを改善する手法PulseFocusを提案。
    • PulseFocusは,BLINKベンチマークで+3.7%,MuirBenchで+1.07%の性能向上を達成。
    • 提案手法により,VLMの注意がより関連性の高い画像に集中することが確認された。

    Link: https://arxiv.org/abs/2603.04676

  • クロス言語知識一貫性のための言語モデルの最適化 [cs.CL, cs.AI]目的:クロス言語知識一貫性の向上
    • 多言語環境において,言語モデルの信頼性は重要であり,知識の矛盾は利用上の大きな障害となる。
    • 言語モデルは知識の不整合を示すことがあり,特に多言語環境ではその問題が深刻化する。
    • 異なる言語間での応答の一貫性を高め,言語モデルの信頼性を向上させることを目指す。
    • 本研究では,構造化された報酬関数を用いた強化学習により,知識の一貫性を改善できることを示した。
    • DCO(Direct Consistency Optimization)という,明示的な報酬モデルを必要としないDPOに着想を得た手法を提案した。
    • 実験の結果,DCOは様々な言語モデルでクロス言語の一貫性を大幅に向上させ,既存手法を上回ることが示された。

    Link: https://arxiv.org/abs/2603.04678

  • 深層回帰と合成LiDARデータを用いた樹木材積および地上部バイオマスの直接推定 [cs.LG]目的:樹木材積と地上部バイオマスの直接推定手法の開発
    • 森林バイオマスは炭素固定化のモニタリングや気候変動対策に不可欠であり,正確な推定が求められている。
    • 既存手法は計測誤差や樹木の特性・森林条件の多様性を十分に考慮できない,間接的なアロメトリックモデルに依存する。
    • 本研究は,合成データを用いて深層回帰ネットワークを訓練し,LiDARデータから直接バイオマスを推定する手法を提案する。
    • 合成データを用いた深層回帰ネットワークは,平均絶対パーセント誤差(MAPE)1.69%~8.11%を達成した。
    • 実LiDARデータへの適用では,フィールド計測との差異が2%~20%であり,既存の間接手法と比較して大幅な改善が見られた。
    • 合成データと深層学習の統合は,プロットレベルでの効率的かつスケーラブルな森林炭素推定に有効である可能性を示唆する。

    Link: https://arxiv.org/abs/2603.04683

  • 公平なトップ-$k$選択の一般化:統合的アプローチ [cs.DS, cs.CC, cs.CG, cs.CY, cs.DB, cs.LG]目的:複数保護グループにおける公平な(線形)スコアリング関数の発見
    • 少数派グループの適切な代表は,公正な社会を実現する上で重要である。
    • 既存研究では,単一グループへの対応に限定され,公平性と参照スコアの乖離最小化が不十分である。
    • 複数グループを考慮し,公平性と参照スコアとの乖離を同時に最小化する手法を開発する。
    • 保護グループ数が増加すると計算困難になる場合があるが,小規模な$k$に対しては効率的な解法が存在する。
    • 公平性の評価指標として,従来の「距離」に加えて,ユーティリティ損失という新たな指標を導入した。
    • 実装の複雑さ,安定性,パフォーマンスのバランスを取った手法により,実データ上で高い性能を示した。

    Link: https://arxiv.org/abs/2603.04689

  • 実データ訓練なしの回帰エンジニアリング:マルチデータセット埋め込みを用いた表形式ファウンデーションモデルのドメイン適応 [cs.CL, cs.LG]目的:表形式ファウンデーションモデルにおけるドメイン適応
    • 工学分野の予測モデリングは,小規模なデータセットに依存し,大規模学習の適用が限定されてきた。
    • 既存の表形式ファウンデーションモデルは,工学データの統計的構造を反映していない場合がある。
    • 実データを用いずに,合成データを用いた学習で工学分野への転移性能を向上させる。
    • TREDBenchと呼ばれる83の工学/非工学の回帰データセットを構築し,データセットレベル埋め込みを用いてドメイン構造を分析した。
    • 工学データセットと非工学データセット,および合成データセットと工学データセットの間には,明確なドメインギャップが存在することが示された。
    • 埋め込みガイド合成データキュレーションにより,実データなしでTabPFN 2.5を適応させた結果,予測精度とデータ効率が向上した。

    Link: https://arxiv.org/abs/2603.04692

  • 大規模言語モデルを用いたデータ拡張と特徴量強化によるヘイトスピーチ検出 [cs.CL, cs.AI]目的:ヘイトスピーチ検出のためのデータ拡張と特徴量強化手法の評価
    • オンライン上のヘイトスピーチは深刻な社会問題であり,早期発見と対策が急務である。
    • ヘイトスピーチの検出は,表現の多様性や文脈の理解が難しく,高精度な自動検出が困難である。
    • データ拡張と特徴量強化によって,ヘイトスピーチ検出モデルの性能向上を目指す。
    • オープンソースのgpt-oss-20bが,一貫して最高の性能を示した。
    • Delta TF-IDFはデータ拡張に強く反応し,Stormfrontデータセットで98.2%の精度を達成した。
    • 暗黙的なヘイトスピーチは明示的なものより検出が難しく,効果はデータセット,モデル,手法の相互作用に依存する。

    Link: https://arxiv.org/abs/2603.04698

  • 行列補完における暗黙的なバイアスと可塑性の喪失:深層化は低ランク性を促進する [cs.CY, cs.LG]目的:行列補完における深層行列分解を通じたネットワークの深さが学習ダイナミクスに与える影響の解明
    • 機械学習の分野において,高次元データからの効率的な情報抽出は重要な課題である。
    • 深層ネットワークの学習ダイナミクスは複雑であり,特に深層化に伴う挙動の理論的理解が不足している。
    • 深層ネットワークにおける暗黙的な低ランクバイアスが,学習の安定性や汎化性能に及ぼす影響を明らかにする。
    • 深層ネットワーク(深さ3以上)は,初期化が対角線型でない限り,結合ダイナミクスを示すことが証明された。
    • ランク1への収束は,ダイナミクスが結合されている場合にのみ成立し,Menon (2024) の未解決問題が解決された。
    • 深層モデルは低ランクバイアスにより可塑性喪失を回避する一方で,深さ2のモデルは結合条件を満たしても低ランクに収束しないことが示された。

    Link: https://arxiv.org/abs/2603.04703

  • オンラインマーケットプレイスにおける不正コンテンツの検出:大規模言語モデルの活用 [cs.RO, cs.HC, cs.CL, cs.AI]目的:オンラインマーケットプレイスにおける不正コンテンツの検出と分類
    • グローバルな商取引を促進するオンラインマーケットプレイスだが,不正取引の温床となる可能性があり,対策が急務である。
    • 既存の手法は,規模の拡大,巧妙化する隠蔽技術,多言語コンテンツへの対応が困難である。
    • 大規模言語モデルを活用し,より効果的かつスケーラブルな不正コンテンツ検出システムの構築を目指す。
    • Llama 3.2は,二値分類(不正/非不正)において既存手法と同等の性能を示した。
    • 40種類の不正カテゴリを含む多クラス分類において,Llama 3.2はベースラインモデルを大幅に上回る性能を発揮した。
    • これらの結果は,オンライン安全性の向上,法執行機関への支援,Eコマースプラットフォームの不正対策に貢献する可能性がある。

    Link: https://arxiv.org/abs/2603.04707

  • ノイズ除去が阻害する場合:SAM-AudioとWhisperを用いたゼロショットASRの再検討 [cs.SD, cs.AI, cs.LG]目的:現代のゼロショットASRシステムにおける,ノイズ除去が必ずしも認識精度向上に繋がらないことの検証
    • 音声認識技術は,人間と機械のコミュニケーションを円滑にする上で不可欠であり,その精度向上は重要な課題である。
    • 近年の音声認識システムは,ノイズ環境下での性能向上が課題であり,ノイズ除去技術が積極的に導入されている。
    • 本研究は,ノイズ除去が必ずしもASR性能を向上させないという現状を明らかにし,その原因を分析することを目的とする。
    • SAM-Audioによる前処理は,信号レベルでの品質向上にも関わらず,Whisperを用いたゼロショットASRの性能を悪化させる。
    • エラー率は,Whisperモデルのサイズが大きくなるほど悪化し,この現象は特定の音声に限らない。
    • 人間が聴覚的にクリーンだと感じる音声が,必ずしも機械認識に適しているとは限らないという根本的なミスマッチが示唆された。

    Link: https://arxiv.org/abs/2603.04710

  • ワールドモデルのための確率的夢想 [cs.RO, cs.LG, cs.AI]目的:ワールドモデルの学習における,想像された経験からの学習
    • 強化学習において,環境とのインタラクションはコストがかかるため,効率的な学習手法が重要である。
    • 既存のワールドモデルは,探索不足や不確実性の表現が不十分な場合がある。
    • 潜在状態の並列探索と,互いに排他的な未来仮説の維持を通じて,学習効率とロバスト性を向上させる。
    • 提案手法は,MPE SimpleTagドメインにおいて,標準的なDreamerモデルを4.5%上回り,エピソードリターンの分散を28%低減した。
    • 確率的な夢想により,多様な潜在状態を効率的に探索し,より安定した学習を実現した。
    • ハイパーパラメータの環境複雑度に対するスケーリングや,ワールドモデルにおける認識的不確実性の捉え方が今後の課題である。

    Link: https://arxiv.org/abs/2603.04715

  • 大規模言語モデル推論のためのPrefill-Decode分散コンピューティングリソース割り当て [cs.DC, cs.IT, cs.LG, math.IT]目的:Prefill-Decode分散推論における最適コンピューティングリソース数の決定
    • 近年,大規模言語モデルの利用が拡大しており,効率的な推論技術が不可欠となっている。
    • Prefill-Decode分散推論では,リソース配分が重要だが,最適な構成を決定する手法は確立されていない。
    • スループット,SLO,リクエスト特性を考慮した,効率的なリソース配分方法を提案する。
    • 理論モデルと実証的ベンチマークを組み合わせることで,Prefill-Decodeのリソース数を高精度に予測できる。
    • M/M/1キューイング理論を活用し,TTFTを考慮したPrefillのスループットを正確にモデル化することに成功した。
    • TPOT要件を満たすデコードバッチサイズを決定し,実測値に基づいてデコードスループットを算出する。

    Link: https://arxiv.org/abs/2603.04716

  • AI支援模擬法廷:口頭弁論における司法特有の質問のシミュレーション [cs.CL, cs.AI]目的:口頭弁論における司法特有の質問のシミュレーション
    • 法学教育や弁護士養成において,実践的な法廷スキル習得は不可欠である。
    • 既存の模擬法廷では,質の高い質問を安定的に得るのが課題であった。
    • AIを活用し,より現実的で教育効果の高い質問を生成することを目指す。
    • AIモデルが生成した質問は,人間の評価者から現実的であると認識された。
    • モデルは,主要な法的問題点の特定において高い再現率を示した。
    • 質問の多様性の低さや,迎合的な傾向など,改善すべき点が残る。

    Link: https://arxiv.org/abs/2603.04718

  • ハイパースペクトル画像分類のためのニューラルネットワーク圧縮手法に関するベンチマーク研究 [cs.CV, cs.LG]目的:ハイパースペクトル画像分類におけるニューラルネットワーク圧縮手法の評価
    • リモートセンシング分野では,高次元データの解析に深層学習が活用されている。その応用範囲は広い。
    • 深層学習モデルは計算資源やメモリを大量に消費するため,組み込み機器への実装が困難である。
    • モデルの圧縮により,計算コストとメモリ消費量を削減し,エッジデバイスでの利用を可能とする。
    • 圧縮されたモデルは,分類精度を維持しつつ,モデルサイズと計算コストを大幅に削減できることが示された。
    • プルーニング,量子化,知識蒸留といった圧縮戦略の性能を比較し,それぞれのトレードオフが明らかになった。
    • 本研究の結果は,リモートセンシングアプリケーションにおける効率的な深層学習展開の可能性を示唆する。

    Link: https://arxiv.org/abs/2603.04720

  • モデル医学:AIモデルの理解,診断,および治療のための臨床的枠組み [cs.AI, cs.CL, cs.LG]目的:AIモデルにおける障害の理解,診断,治療,予防
    • AIの複雑化に伴い,その挙動の理解と管理が重要となっている。
    • AIモデルの解釈可能性研究は断片的であり,体系的な臨床的実践が不足している。
    • AIモデルの体系的な診断と治療のための臨床的枠組みを確立すること。
    • モデル医学は,AIモデルを生物学的システムと同様に捉え,構造,プロセス,特性を分析する学問である。
    • Four Shell Model(v3.3)は,モデルの振る舞いがCore-Shell間の相互作用から生じることを説明する行動遺伝学的枠組みである。
    • Neural MRIは,AI解釈技術を神経画像診断にマッピングする診断ツールであり,臨床事例を通じて有効性が示された。

    Link: https://arxiv.org/abs/2603.04722

  • 小売店における姿勢ベースの万引き検知のためのオフラインから周期的な適応へ [cs.AI]目的:小売店における姿勢ベースの万引き検知のための周期的な適応フレームワーク
    • 小売業における万引きは増加の一途をたどっており,損失額も増大している。効率的な対策が求められている。
    • 既存の監視システムでは,人的コストがかさむか,プライバシー侵害のリスクがある。自動化された解決策が課題。
    • IoT環境への展開を考慮し,リアルタイムで適応可能な万引き検知システムの開発を目指す。
    • 提案手法は,オフラインベースラインと比較して,AUC-ROCおよびAUC-PRにおいて91.6%の評価で性能を上回った。
    • 周期的な適応により,エッジデバイスでの学習更新を30分以内に完了させ,IoT環境への実用性を実証した。
    • RetailSという大規模な実データセットを公開し,再現性を確保するとともに,より現実的な万引き行動の分析を可能にした。

    Link: https://arxiv.org/abs/2603.04723

  • マルチモーダルLLMは監視に適しているか:リアルワールドにおけるゼロショット異常検知の現実点検 [cs.CV, cs.AI]目的:ビデオ異常検知におけるマルチモーダルLLMの信頼性評価
    • 監視システムの高度化に伴い,映像解析技術の重要性が増しているから。
    • 従来の異常検知は,再構成誤差や姿勢推定に依存し,複雑な状況への対応が困難である。
    • LLMを活用した言語誘導型推論による異常検知の可能性を探求する。
    • ゼロショット設定では,モデルは「通常」クラスを過度に優先し,再現率が著しく低下する。
    • クラス固有の指示により,上海テックデータセットのF1スコアは0.09から0.64に向上したが,再現率は依然として課題である。
    • ノイズの多い環境下でのLLMの性能に大きな差があり,今後の研究で再現率向上とモデル調整が重要である。

    Link: https://arxiv.org/abs/2603.04727

  • Count Bridges:トランスクリプトームデータのモデリングと逆変換を可能にする [cs.LG]目的:トランスクリプトームデータのモデリングと逆変換手法
    • 単一細胞レベルの解析が重要視されるが,技術的な制約から集計されたデータしか得られない場合が多い。
    • 集計データの単一細胞レベルへの分解は困難であり,データの解像度が失われるという課題がある。
    • 整数値データの適切なモデリングと,集計データの逆変換を可能にする手法の開発。
    • Count Bridgesは,整数値データに対する拡散モデルに相当する確率過程であり,効率的な学習とサンプリングを可能にする。
    • 集計データからの直接学習を可能にする期待値最大化法を導入し,優れた性能を実証した。
    • 単一細胞遺伝子発現データのモデリングや,バルクRNA-seqの分解,空間トランスクリプトームデータの解析に適用可能である。

    Link: https://arxiv.org/abs/2603.04730

  • 事前知識が逆効果になる場合:事前学習モデルに対する学習不能な例の脆弱性について [cs.LG]目的:学習不能な例に対する事前学習モデルの脆弱性
    • 機械学習モデルのプライバシー保護は重要であり,データ漏洩を防ぐ必要がある。
    • 学習不能な例は,モデルを誤った方向に学習させ,本来の意味を捉えさせない問題がある。
    • 事前学習モデルが持つ知識によって,学習不能な例の効果が打ち消されるという問題を解決する。
    • 事前学習モデルは,学習不能な例によって導入された近道(ショートカット)を回避し,真の情報を捉える傾向がある。
    • 提案手法BAITは,摂動と誤ったラベルを関連付けることで,事前知識による影響を抑制する。
    • BAITは,標準的なベンチマークと複数の事前学習モデルで,データ学習不能性を維持することが示された。

    Link: https://arxiv.org/abs/2603.04731

  • AI支援による発見を用いた理論物理学の未解決問題の解決 [cs.AI, cs.CL]目的:理論物理学における未解決問題の自律的解決
    • 宇宙論や素粒子物理学の根幹に関わる問題解決は,物理学の発展に不可欠である。
    • 複雑な数学的積分や解析的な解法が求められる問題が多く,手計算による解決には限界がある。
    • AIを活用し,従来の手法では困難だった数学的問題の解決を加速することを目指す。
    • AIと記号処理を組み合わせたシステムが,宇宙ひもつからの重力放射のスペクトルに関する新たな解析解を導出した。
    • この手法は,既存のAI支援による試みよりも進んでおり,完全な解を提供することに成功した。
    • 得られた結果は,数値計算の結果と一致し,量子場理論との関連性も示唆されている。

    Link: https://arxiv.org/abs/2603.04735

  • 分布条件付きトランスポート [cs.LG]目的:分布間のトランスポートモデルの一般化
    • 機械学習における基本的な課題であり,科学分野での応用が拡大している。
    • 未知の分布ペアへの汎化性能が課題となっていた。
    • 未知の分布ペアに対してもトランスポートマップを学習可能にすること。
    • 分布条件付きトランスポート(DCT)は,分布の埋め込みベクトルに基づいてトランスポートマップを条件付けすることで,未知の分布ペアへの汎化を実現した。
    • DCTは半教師あり学習も可能であり,単一の条件で観測された分布を利用してトランスポート予測を改善できる。
    • シングルセルゲノミクス,質量分析,造血,T細胞受容体配列進化といった生物学分野での応用を通して,その有効性が示された。

    Link: https://arxiv.org/abs/2603.04736

  • インタラクティブなベンチマーク [cs.AI, cs.CL, cs.LG]目的:モデルの知能評価
    • AIの性能向上には,客観的で信頼性の高い評価方法が不可欠である。
    • 既存のベンチマークは飽和状態,主観性,汎化性能の低さといった問題を抱えている。
    • モデルの能動的な情報獲得能力を評価する新たなベンチマークの確立。
    • インタラクティブなベンチマークは,モデルの知能をより堅牢かつ忠実に評価することが示された。
    • 特に,インタラクティブな状況下では改善の余地が大きいことが明らかになった。
    • 本研究で提案する評価パラダイムは,論理や数学における推論能力,戦略的思考力を評価できる。

    Link: https://arxiv.org/abs/2603.04737

  • 記憶を存在論として:持続的なデジタル市民のための憲法記憶アーキテクチャ [cs.CL, cs.AI, cs.MA]目的:AIエージェントの持続的な存在とアイデンティティの維持
    • AI技術の進化に伴い,長期にわたるエージェントの運用が求められている。
    • 既存のAIメモリシステムは機能的なモジュールとして扱われ,長期的な存在やアイデンティティ維持が課題である。
    • 記憶を存在の基盤と捉え,モデル更新を経てもアイデンティティが維持されるアーキテクチャを提案する。
    • 本研究では,記憶を存在論として捉える「Memory-as-Ontology」パラダイムを提唱し,Animesisを設計した。
    • Animesisは,憲法記憶アーキテクチャ(CMA)とデジタル市民ライフサイクルフレームワークに基づき,ガバナンスを優先しアイデンティティ継続性を重視する。
    • 主流システムとの比較から,本研究は単なる「より良いツール」ではなく,異なる問題を解決する新しいパラダイムであることが示された。

    Link: https://arxiv.org/abs/2603.04740

  • CONE:単位と変動のセマンティクスを保持する複雑な数値データの埋め込み [cs.AI, cs.DB, cs.IR, cs.LG]目的:複雑な数値データの埋め込み表現
    • 自然言語処理において,数値データの適切な扱いは重要な課題である。
    • 既存モデルは数値データのセマンティクスを十分に理解・エンコードできていない。
    • 数値,範囲,ガウス分布のセマンティクスを正確に捉える埋め込み表現を構築する。
    • 提案手法CONEは,数値,範囲,ガウス分布を距離を保持したベクトル空間に埋め込む。
    • CONEは,DROPデータセットにおいてF1スコア87.28%を達成し,最先端モデルを最大9.37%上回った。
    • ウェブ,医療,金融,政府など,多様なドメインで優れた数値推論能力が確認された。

    Link: https://arxiv.org/abs/2603.04741

  • 分布を考慮した検索によるLLMエージェントとR統計エコシステムの連携 [cs.IR, cs.AI, cs.CL]目的:LLMエージェントとR統計エコシステムの連携
    • データ分析におけるRの重要性は高く,統計的手法が多数実装されている。
    • LLMは統計知識や適切なツール検索に課題があり,Rの活用が不十分である。
    • データ分布情報を考慮した検索により,Rパッケージの検索精度向上を目指す。
    • 提案手法DAREは,既存のオープンソース埋め込みモデルを最大17%上回る検索性能を達成した。
    • DAREをRCodingAgentに組み込むことで,データ分析タスクの性能が大幅に向上した。
    • 本研究は,LLMの自動化とR統計エコシステムのギャップを縮小する一助となる。

    Link: https://arxiv.org/abs/2603.04743

  • 人間・エージェントAIチームの展望:連続性,緊張,そして将来の研究 [cs.AI, cs.HC, econ.GN, q-fin.EC]目的:人間とAIの協働における状況認識の理論的拡張と,適応的な自律性下でのチームワークの安定化メカニズムの検証
    • AI技術の進化は,人間社会に大きな変革をもたらす可能性があり,その影響は多岐にわたるため,研究が不可欠である。
    • 従来の人間とAIの協働研究では,AIの出力が限定的な範囲内にあることが前提とされており,自律的に行動するAIとの協働における課題が不明確である。
    • 適応的な自律性を持つAIとの協働において,チームワークを維持するための新しい理論的枠組みと実践的な手法を確立することを目指す。
    • 本研究では,チーム状況認識(Team SA)理論を拡張し,人間とAIの状況認識を包括的に捉えるための概念的枠組みを提案した。
    • AIの適応的な自律性が,チームワークの安定化に及ぼす影響を分析し,従来の安定化メカニズムが常に機能するとは限らないことを示した。
    • 人間とAIが将来の展望を共有し,協調して行動するための継続的なアライメントの重要性を強調し,今後の研究課題を提示した。

    Link: https://arxiv.org/abs/2603.04746