arXiv雑要約

AI - 2026/03/23 公開

Eコマース検索クエリ推薦のためのエンドツーエンドハイブリッド生成アーキテクチャAIGQ [cs.RO, cs.IR, cs.AI]目的：Eコマースにおける検索クエリ推薦の改善
- Eコマースにおけるユーザーの購買意図把握と潜在的なニーズの発掘は，売上向上に不可欠である。
- 従来のクエリ推薦手法は，IDベースのマッチングに依存し，意味理解が浅く，コールドスタート性能や多様性に課題がある。
- 本研究は，より深い意味理解と多様性を実現し，コールドスタート問題を克服するクエリ推薦手法を提案する。
- AIGQは，セッション情報を活用した教師あり学習と興味関心に基づいたランキング戦略により，ユーザーの意図をより正確にモデル化する。
- IL-GRPOは，クエリの関連性とリスト全体の質を同時に最適化する報酬メカニズムを備えた新しい方策勾配アルゴリズムである。
- オフライン評価と大規模なA/Bテストの結果，AIGQはプラットフォームの有効性とユーザーエンゲージメントにおいて大幅な改善をもたらすことが示された。
Link: https://arxiv.org/abs/2603.19710
類似性と相違性，そしてペアワイズ比較からの学習 [cs.CL, cs.CL, cs.LG]目的：インスタンスペアに対する弱いラベルを活用した二値分類
- 明示的なインスタンスレベルのラベル取得が困難な分類問題は，実用上の課題が多い。
- 既存手法は確率的なラベルに依存し，主観的な不確実性評価が不安定性を招く。
- 相対的な判断のみを用いることで，ラベルノイズへのロバスト性を高める。
- 提案手法SD-Pcompは，類似性/相違性ラベルとペアワイズ比較ラベルを組み合わせる。
- 2つのバイアス除去リスク推定器を開発し，理論的分析と実験で性能向上を実証した。
- 単一の弱いラベルを用いる手法と比較して，分類性能が向上する。
Link: https://arxiv.org/abs/2603.19713
段階的：自動システム検証のためのニューロシンボリック証明探索 [cs.CL, cs.AI]目的：自動システム検証のための証明探索の自動化
- 安全性や信頼性が求められるシステムにおいて，その正当性を保証する検証は不可欠である。
- 形式検証は手間がかかり，大規模なシステムへの適用が困難であるという課題がある。
- 大規模言語モデルを活用し，証明探索を自動化することで，検証の効率化を目指す。
- 本研究では，ニューラルネットワークと形式的推論を組み合わせたフレームワークを開発した。
- seL4ベンチマークにおいて，77.6%の定理を証明することに成功し，既存手法を大幅に上回った。
- 他のベンチマークにおいても高い汎化性能を示し，スケーラブルな自動ソフトウェア検証への道筋を示した。
Link: https://arxiv.org/abs/2603.19715
FedRG：ノイズの多いクライアントを持つ連合学習における表現幾何学の解放 [cs.LG, cs.AI]目的：連合学習におけるノイズサンプル識別とラベル修正の改善
- 連合学習は分散環境で有用だが，データ品質が学習性能に大きく影響する。
- 既存手法はスカラー損失値に依存するため，異質環境下でのノイズサンプル識別が困難。
- 表現幾何学に基づき，ノイズサンプルをロバストに識別し，学習の安定化を図る。
- 提案手法FedRGは，自己教師あり学習によりラベルに依存しない球状表現を生成する。
- 球状フォン・ミーゼス・フィッシャー混合モデルを用いて，セマンティッククラスターを捉え，ノイズサンプルを識別する。
- 実験結果から，FedRGは多様なノイズクライアント環境下で最先端手法を凌駕する性能を示す。
Link: https://arxiv.org/abs/2603.19722
MOSS-TTSD：テキストからの対話生成 [cs.SD, cs.AI, cs.CL]目的：対話の音声生成
- ポッドキャスト等，多様なコンテンツ制作において，対話の音声生成技術の重要性が高まっている。
- 従来の音声合成技術では，対話の文脈や複数話者間の整合性を維持することが困難であった。
- 長時間の対話や複数話者間の自然な音声合成を可能にすること。
- MOSS-TTSDは，最大60分間の単一パス合成，最大5話者までの多者対話，短い音声サンプルからのゼロショットボイスクローニングをサポートする。
- 提案手法は，英語および中国語を含む複数の言語に対応し，様々な長尺シナリオに適応可能である。
- 客観評価および主観評価の結果から，MOSS-TTSDが既存のベースラインを上回る対話生成性能を示すことが確認された。
Link: https://arxiv.org/abs/2603.19739
連合学習における大規模言語モデルの整合化のための Federated Personalized Direct Preference Optimization [cs.LG, cs.CL]目的：大規模言語モデルと人間の選好の整合化
- AIの進化において，人間の価値観や意図に沿ったモデルの構築が不可欠である。
- 分散環境下での選好データは偏りが大きく，モデルの性能低下を招く。
- 非IIDデータ下における選好の整合化と汎化性能の向上を目指す。
- 提案手法FedPDPOは，連合学習環境において最先端の性能を達成した。
- ドメイン内およびドメイン間のデータセットで，平均精度が最大4.80%向上した。
- 凍結された事前学習済みLLMとLoRAアダプターの組み合わせにより，効率的な学習を実現した。
Link: https://arxiv.org/abs/2603.19741
二重経路帰属：SwiGLU-Transformerに対する層別ターゲット伝播による効率的な帰属 [cs.LG, cs.CL]目的：TransformerベースのLLMの内部メカニズム解明
- LLMの信頼性と効果的な運用には，その内部構造の理解が不可欠である。
- 既存の帰属手法は，忠実性と計算効率のバランスが課題であり，密な成分帰属は計算コストが高い。
- SwiGLU Transformerにおける情報フローを効率的に追跡し，忠実な帰属を実現すること。
- DPAは，カウンターファクタル事例を必要とせず，凍結されたTransformerを1回の順伝播と逆伝播で情報フローを追跡する。
- DPAは，SwiGLU Transformerの計算構造を解析的に分解し，ターゲットとなるunembeddingベクトルを伝播させる。
- DPAは，モデルの成分数に依存しないO(1)の時間計算量で，長い入力シーケンスと密な成分帰属を可能にする。
Link: https://arxiv.org/abs/2603.19742
少数のサンプルを用いた点群セグメンテーションにおける不確実性を考慮したプロトタイプ学習 [cs.CV, cs.AI]目的：少数のサンプルを用いた3Dセマンティックセグメンテーションにおける正確なセマンティックマスクの生成
- 3次元点群のセグメンテーションは，ロボティクスや自動運転など幅広い分野で重要性が増している。
- 教師データが少ない状況下では，既存のプロトタイプベースの手法は汎化性能が課題となる。
- 本研究は，不確実性を考慮することで，少数のサンプルでもロバストなセグメンテーションを実現する。
- 提案手法UPLは，サポート点群とクエリ点群の両方の情報を活用し，プロトタイプ表現を強化する二重ストリームプロトタイプ洗練モジュールを導入している。
- プロトタイプ学習を変分推論問題として定式化することで，不確実性の明示的なモデル化を可能にし，信頼性の高いマスク予測を実現している。
- ScanNetおよびS3DISベンチマークにおける実験により，UPLが様々な設定で最先端の性能を達成し，信頼性の高い不確実性推定を提供することが示された。
Link: https://arxiv.org/abs/2603.19757
自律的剪定によるネットワークの成長 [cs.CV, cs.LG]目的：画像分類のためのネットワーク構造最適化
- 深層学習モデルの性能向上には，より大規模なネットワークが必要不可欠である。
- 大規模モデルは計算コストが高く，メモリ消費量も膨大であるという課題がある。
- 少ないパラメータで高精度なモデルを構築し，効率的な学習を実現することを目指す。
- 提案手法GNAPは，ネットワークの成長と自律的な剪定を組み合わせることで，スパースなネットワークを学習可能である。
- MNISTデータセットにおいて，わずか6.2kパラメータで99.44%の精度を達成した。
- CIFAR10データセットにおいても，157.8kパラメータで92.2%の精度を達成し，高い性能を示した。
Link: https://arxiv.org/abs/2603.19759
身体化された科学：自律的身体化AIによる発見ループの閉環 [cs.AI]目的：科学的発見ループの閉環
- 科学研究は実験サイクルを伴うものであり，物理的な世界との相互作用が不可欠である。
- 既存の計算機アプローチは，発見を孤立した予測として捉え，物理世界との継続的な相互作用を欠いている。
- 物理的フィードバックに基づいた推論により，予測と実験検証のギャップを埋め，自律的な発見システムの実現を目指す。
- 本研究では，知覚・言語・行動・発見（PLAD）の統合的フレームワークを提案し，物理環境における自律的な科学的探索を可能にする。
- PLADフレームワークは，エージェントが実験環境を認識し，科学的知識に基づいて介入を行い，その結果を学習することで，継続的な発見ループを形成する。
- このアプローチにより，生命科学や化学分野における自律的な発見システムの実現への道筋を示す。
Link: https://arxiv.org/abs/2603.19782
階層的直交プロトタイプ学習による汎化Few-Shot 3D点群セグメンテーション [cs.CV, cs.AI]目的：汎化Few-Shot 3D点群セグメンテーションにおける性能向上
- 3D点群セグメンテーションは，ロボティクスや自動運転などの分野で重要である。
- Few-Shot学習では，新しいクラスへの適応と既存クラスの知識維持のバランスが課題である。
- 新しいクラスへの適応時の既存クラスの忘却を抑制し，汎化性能を高めることを目指す。
- 提案手法HOP3Dは，階層的直交プロトタイプ学習とエントロピーに基づく正則化を導入する。
- HOP3Dは，勾配と表現レベルで基盤クラスと新規クラスの学習を分離し，干渉を軽減する。
- ScanNet200およびScanNet++での実験により，既存手法を上回る性能が確認された。
Link: https://arxiv.org/abs/2603.19788
多変量分布のコアセットを用いたスケーラブルな学習 [cs.LG, cs.DS, stat.CO, stat.ME, stat.ML]目的：多変量分布学習のスケーラビリティと効率性の向上
- 統計学や機械学習において，効率的な回帰分析と密度推定は重要である。
- 大規模データへの対応が既存手法の課題となっている。
- 大規模データにおけるスケーラブルな学習を可能とする。
- 提案手法により，重要度サンプリングを用いた大幅なデータ削減が実現された。
- 対数尤度が$(1\pm\varepsilon)$の誤差範囲内に収まることが確率的に保証され，統計モデルの精度が維持される。
- 複雑な分布や非線形関係において，全パラメータモデルよりも適応性が高いことが示された。
Link: https://arxiv.org/abs/2603.19792
スケーラブルな回路最適化のための量子特徴マップにおけるゲート貢献量の定量化 [cs.LG]目的：量子特徴マップにおけるゲート貢献量の定量化
- 量子機械学習は分類タスクにおいて有望だが，ノイズやデバイス制約が効率的な実行を妨げている。
- 現在の量子デバイスでは，回路規模の縮小と性能維持の両立が課題となっている。
- ゲートの重要度指標を用いて，量子特徴マップの回路規模を削減し，性能を最適化する。
- 提案手法GATEにより，忠実度，エンタングルメント，感度を考慮したゲート重要度指標が開発された。
- シミュレーション，エミュレーション，実機環境での評価により，回路規模と実行時間の削減が確認された。
- ゲート除去による予測精度への影響は小さく，場合によっては改善も見られた。
Link: https://arxiv.org/abs/2603.19805
セマンティックに基づいた教師あり学習による統一マルチモーダルモデルの性能向上 [cs.CV, cs.AI]目的：統一マルチモーダルモデルにおける粒度ミスマッチと教師信号の冗長性の解消
- マルチモーダルな情報理解と生成を統合するモデルの重要性が高まっている。
- 既存の生成学習法には，粒度のミスマッチや教師信号の冗長性といった課題がある。
- テキストに沿った領域への集中と，より密な関係性の学習を促すことで性能向上を目指す。
- SeGroSは，GenEval，DPGBench，CompBenchにおける評価で，様々なUMMアーキテクチャにおいて生成の忠実性とクロスモーダルな整合性を大幅に向上させた。
- 提案手法では，テキストプロンプトの疎性を補完するセマンティックな視覚的ヒントを導入する。
- さらに，マスキングベースのUMMの教師あり学習を強化するため，セマンティックに基づいた破損入力を生成する。
Link: https://arxiv.org/abs/2603.19807
二時間スケールの学習力学：ニューラルネットワーク訓練における集団的視点 [cs.LG, math.AP, stat.ML]目的：ニューラルネットワーク訓練における集団学習力学の理論的枠組み
- 機械学習の性能向上には，効率的な学習アルゴリズムの確立が不可欠である。
- 集団ベースの学習法は有効だが，その背後にある数学的記述は未だ十分ではない。
- 集団学習におけるパラメータとハイパーパラメータの結合分布を解析し，最適なハイパーパラメータへの収束条件を明らかにする。
- 集団内のニューラルネットワークを相互作用するエージェント系としてモデル化し，パラメータとハイパーパラメータの二時間スケール力学を記述する理論的枠組みを構築した。
- 大規模集団の極限において，パラメータとハイパーパラメータの結合分布を導出し，ハイパーパラメータ密度に対する選択-変異方程式を導出した。
- このモデルは，集団学習を双レベル最適化や複製子-変異体モデルと関連付け，ノイズと多様性の役割を明確にした。
Link: https://arxiv.org/abs/2603.19808
自動シャトルと共有空間における視線情報と文脈を考慮した歩行者軌跡予測：仮想現実実験 [cs.LG]目的：自動シャトルと共有空間における歩行者の行動予測モデルの開発
- 都市空間への自動シャトル導入は進むが，交通ルールが曖昧なため，安全確保が課題である。
- 既存の予測モデルは車両中心であり，歩行者の視線や文脈を考慮していない点が課題である。
- 歩行者の視線情報と文脈を統合することで，より高精度な行動予測を実現することを目的とする。
- 歩行者の行動パターンとして，躊躇，回避行動，視線配分，空間調整が特定された。
- GazeX-LSTMモデルは，視線情報，軌跡，文脈を統合することで予測精度を向上させた。
- 視線情報と文脈情報の組み合わせは，予測精度に対して相乗効果をもたらすことが示された。
Link: https://arxiv.org/abs/2603.19812
GDEGAN：リガンド結合部位予測のためのガウス動的等変グラフ注意ネットワーク [eess.SY, cs.SY, math.OC, cs.LG]目的：リガンド結合部位予測の精度向上
- 構造ベースの創薬において，リガンド結合部位の正確な予測は不可欠である。
- 既存の等変グラフニューラルネットワークは，隣接残基の化学的・幾何学的特性の変化を考慮していない。
- 隣接残基の特性分布の統計的特徴を捉え，結合部位を認識する新しい注意機構を開発する。
- GDEGANは，COACH420，HOLO4k，PDBBind2020データセットにおいて，既存手法を大幅に上回る性能を示した。
- DCCの相対的な改善率は37〜66％，DCAの成功率は7〜19％であった。
- 本研究は，潜在的な結合部位を特定することで，タンパク質-リガンドドッキングを加速し，治療標的の特定に貢献する。
Link: https://arxiv.org/abs/2603.19817
類推によるFrameNet意味役割分類 [cs.CL, cs.AI]目的：FrameNetにおける意味役割分類のための類推的関係の定義と応用
- 自然言語処理において，文中の語と意味役割の対応付けは重要な課題である。
- 意味役割のラベル付けには専門知識が必要であり，アノテーションコストが高いという課題がある。
- 類推的関係を利用し，少ないパラメータで高精度な意味役割分類を実現することを目指す。
- 類推的関係を二値分類問題として捉え，軽量な人工ニューラルネットワークを訓練した。
- 訓練時に意味役割情報を一切使用せず，推論時に類推的転移により意味役割を推定する。
- 本手法は，計算効率と省資源性を維持しつつ，既存の最先端の結果を上回った。
Link: https://arxiv.org/abs/2603.19825
FormalEvolve：多様性と証明効果の高い自動形式化のための神経記号進化探索 [cs.CG, cs.AI]目的：自動形式化における多様かつ証明効果の高い形式化手法の探索
- 数学の自動検証は，数学の厳密性と信頼性を高める上で不可欠である。
- 意味的に一貫した形式化でも，証明探索の効率や成功率に大きな差が生じる場合がある。
- 形式化の多様性を高め，証明可能性を向上させる手法を開発し，自動形式化の精度を向上させる。
- FormalEvolveは，LLMを活用した突然変異と交差，およびAST書き換えにより，多様な形式化候補を生成する。
- CombiBenchとProofNetにおいて，生成回数制限T=100のもとで，それぞれ58.0%と84.9%の意味的ヒット率(SH@100)を達成した。
- 問題間の意味的成功の集中度を下げ(Giniの低下)，固定された証明予算下でCombiBenchにおける証明性能を向上させた。
Link: https://arxiv.org/abs/2603.19828
FIPO：将来のKLダイバージェンスに基づく方策最適化による深層推論の引き出し [cs.LG]目的：大規模言語モデルにおける推論のボトルネック克服
- 言語モデルの推論能力向上は，高度なタスク遂行に不可欠であり，AI研究の中心課題である。
- 従来の報酬関数は粒度が粗く，重要な論理的転換点と重要でないトークンを区別できていない。
- 将来のKLダイバージェンスを導入し，トークンの影響度に応じた重み付けを行うことで，密な利点関数を確立する。
- FIPOは，Qwen2.5-32Bにおいて，平均的な思考連鎖長を約4,000トークンから10,000トークン以上に拡張することに成功した。
- AIME 2024 Pass@1の精度も50.0%から58.0%（最終的には約56.0%に収束）に向上し，DeepSeek-R1-Zero-Math-32Bやo1-miniを上回った。
- 本研究は，密な利点関数の確立が，基盤モデルの潜在能力を最大限に引き出す上で重要な経路であることを示唆している。
Link: https://arxiv.org/abs/2603.19835
意味的デルタ：人間とLLMの対話を区別する解釈可能な信号 [cs.CL, cs.AI]目的：人間とLLM生成の対話を区別するための解釈可能な統計的特徴
- LLMの普及に伴い，その挙動の理解と評価が教育，学術研究を含む多岐にわたる分野で重要となっている。
- LLM生成テキストと人間が書いたテキストの識別は困難であり，信頼性の高い識別手法が求められている。
- LLMと人間の対話における意味構造の違いを定量化し，識別を可能とする新たな指標を提案する。
- LLM生成テキストは，人間によるテキストと比較して，意味的デルタ値が有意に高いことが示された。
- この結果は，LLMが人間よりも話題の集中度が高い，すなわち意味構造が硬直的であることを示唆する。
- 提案手法は，既存の検出技術を補完する計算コストの低い信号として，アンサンブル検出システムへの統合が可能である。
Link: https://arxiv.org/abs/2603.19849
深層学習 기반オンラインマッピングの故障モード：測定と対応方法 [cs.CV, cs.AI, cs.LG]目的：深層学習 기반オンラインマッピングの故障モードの特定と定量化
- 自動運転技術の発展には不可欠だが，環境への汎化性能が課題となっている。
- 既存手法では，故障の原因を特定・分離することが困難であった。
- 入力特徴の記憶と既知の地図形状への過学習という2つの要因を分離し，定量化する。
- 提案フレームワークにより，地理的近接性と幾何学的類似性を制御した評価サブセットを用いて，故障モードを特定・測定した。
- Fr\'echet距離に基づく再構成統計量と，局所化過学習スコア，地図形状過学習スコアを導入し，故障モードを定量化した。
- MSTベースの疎化戦略により，トレーニングデータの冗長性を削減し，汎化性能の向上を示した。
Link: https://arxiv.org/abs/2603.19852
IsoCLIP：CLIPプロジェクターの分解による効率的なモダリティ内アライメント [cs.RO, cs.MA, cs.CV, cs.LG]目的：CLIPモデルにおけるモダリティ内アライメントの改善
- 画像とテキストの理解を組み合わせるVision-Languageモデルは，多様な応用で重要性が増している。
- CLIPのようなモデルを単一モダリティのタスクに適用した場合，モダリティ内アライメントが不十分になるという課題がある。
- プロジェクターの構造を分析し，モダリティ内アライメントを改善することで，効率性と性能向上を目指す。
- プロジェクター内の演算子を分析した結果，モダリティ間アライメントとモダリティ内正規化の役割が分離されていることが示された。
- 等方性部分空間の抽出により，モダリティ間の良好なアライメントが確認され，異方性方向の除去がアライメント改善に繋がることが示された。
- 提案手法は，学習を必要とせず，遅延を低減し，既存手法を上回る性能を複数のCLIPモデルで実現した。
Link: https://arxiv.org/abs/2603.19862
NASimJax：ペネトレーションテストのためのGPUアクセラレーションされたポリシー学習フレームワーク [cs.LG, cs.CR]目的：ペネトレーションテストにおける強化学習ポリシーの学習基盤
- サイバーセキュリティの脅威が増大する中，脆弱性診断の自動化が不可欠である。
- 従来のシミュレータは処理速度が遅く，大規模なネットワーク環境での学習が困難である。
- 大規模ネットワークにおける，ゼロショット汎化性能を持つポリシーの学習を可能にする。
- NASimJaxは，オリジナルのNASimと比較して最大100倍の環境スループットを実現した。
- 優先度付きレベルリプレイは，ドメインランダム化よりも，特に大規模な環境において，より効果的であることが示された。
- 疎なトポロジーで学習させることで，訓練中に見られなかった高密度なトポロジーに対しても，汎化性能が向上することが確認された。
Link: https://arxiv.org/abs/2603.19864
記憶における潜在的な汎化能力のダイナミクスと転移性について [cs.LG]目的：記憶期間中の潜在的な汎化能力のダイナミクスと転移性の解明
- 深層学習は高い汎化能力を持つが，そのメカニズムは未だ不明な点が多い。
- ラベルをシャッフルされたデータでも高い精度を維持する記憶現象が，真のラベルへの汎化能力を低下させる。
- モデル内部に存在する潜在的な汎化能力のダイナミクスと転移メカニズムを明らかにすること。
- 学習初期に潜在的な汎化能力がピークを迎え，モデルの汎化能力と相関することが示された。
- MASCプローブの数学的構造は2次分類器であり，非線形であることが確認された。
- 潜在的な汎化能力を線形プローブを用いてモデルの汎化能力に直接転移する手法が提案された。
Link: https://arxiv.org/abs/2603.19865
イベントログからの意思決定同期パターンの発見 [cs.LG]目的：ビジネスプロセスにおける意思決定同期パターンの発見
- ビジネスプロセスの効率化と公平性確保は重要であり，リソースの最適な利用に不可欠である。
- 既存のプロセス発見技術は，複数のケースの属性を考慮した意思決定メカニズムに対応できていない。
- 複数のケース属性を考慮した意思決定同期パターンを自動的に発見し，プロセス改善に貢献する。
- サプライチェーンプロセスに着想を得たアプローチにより，特定のプロセス構成と制約条件から意思決定同期パターンを発見可能になった。
- 単一のパターンを含む4つのプロセスモデルと，4つのパターン全てを含む複雑なモデルに対して，提案手法が期待されるパターンを確実に抽出できることが示された。
- 発見されたパターンは，実行するケースを決定する制約条件とともに形式化され，具体的なプロセス構造として表現された。
Link: https://arxiv.org/abs/2603.19879
テスト時に合意が誤っていた場合：テスト時における選択的補完型強化学習 [cs.LG, cs.AI]目的：大規模言語モデルの推論能力向上
- LLMの推論能力は重要であり，その向上は様々な応用を可能にする。
- テスト時強化学習は多数決に依存するため，分散した回答分布下で誤った軌道を強化するリスクがある。
- ラベルノイズの増幅を軽減し，誤った軌道を信頼性高く排除すること。
- SCRLは，厳格な合意基準による信頼性の低い多数決のフィルタリングを実現した。
- SCRLは，生成不確実性に基づいた誤った軌道の信頼性のある剪定を可能にする負の疑似ラベル機構を導入した。
- 複数の推論ベンチマークにおいて，SCRLはベースラインと比較して大幅な改善を示し，堅牢な汎化性能と訓練の安定性を維持した。
Link: https://arxiv.org/abs/2603.19880
メタ学習のためのメタ特徴と知識グラフ埋め込みの統合 [cs.LG, cs.AI]目的：パイプライン性能推定とデータセット性能に基づく類似度推定の改善
- 機械学習の実験記録は膨大であり，過去の実験を活かすメタ学習の重要性が高まっている。
- 既存手法はデータセットのメタ特徴のみに依存し，実験結果やパイプラインのメタデータを活用できていない。
- 知識グラフ埋め込みを用いてデータセットとパイプライン間の相互作用を捉え，メタ学習の性能向上を目指す。
- KGmetaSPは，単一のパイプラインに依存しないメタモデルを用いて，精度の高いパイプライン性能推定を可能にした。
- 既存手法と比較して，データセット性能に基づく類似度推定の精度を向上させた。
- 構築した大規模ベンチマークとKG，KGmetaSPは，メタ学習の新たな基準点となり，実験データの統合的活用を促進する。
Link: https://arxiv.org/abs/2603.19888
効率的なLLMツール利用のためのユーティリティに基づくエージェントオーケストレーション [cs.DB, eess.SY, cs.SY, math.CV, math.DG, math.DS, cs.AI]目的：LLMツール利用エージェントにおける，回答品質と実行コストのバランス
- LLMのツール利用は，複雑なタスク解決に不可欠であり，その効率化が求められている。
- 既存手法では，回答品質とコストのトレードオフが課題であり，最適化が困難である。
- エージェントの行動を明示的に制御し，品質とコストのバランスを調整するフレームワークを提供する。
- 提示手法では，回答，検索，ツール呼び出しなどの行動をユーティリティに基づいて選択し，コスト効率を向上させる。
- 実験により，明示的なオーケストレーションがエージェントの行動に大きな影響を与えることが示された。
- 軽量なユーティリティ設計が，エージェント制御の現実的かつ効果的なメカニズムとなりうる。
Link: https://arxiv.org/abs/2603.19896
構成調整のためのドメイン・空間性のパターン解明：ドメイン知識と適応度景観の融合 [cs.SE, cs.AI]目的：構成調整におけるドメイン知識と適応度景観の関係性の体系的把握
- 品質保証において，システムの性能向上のための構成調整は不可欠である。
- 構成可能なシステムのブラックボックス性のため，調整者の効果に関する理解が不足している。
- 適応度景観分析とドメイン駆動型分析を組み合わせることで，調整の成功/失敗要因を解明する。
- 構成調整の適応度景観はシステム固有であり，特定のドメイン要素が一貫して構造を形成するわけではないことが判明した。
- 主要な機能フローを制御するコアオプションは，リソースオプションよりも景観の粗さに強い影響を与える。
- ワークロードの効果は，種類と規模の両方が景観の変化に寄与するが，その影響はシステムに依存する。
Link: https://arxiv.org/abs/2603.19897
人間のように学習する：類推的概念学習による汎化カテゴリ検出 [cs.IR, eess.SY, cs.SY, cs.HC, cs.RO, cs.CV, cs.AI]目的：汎化カテゴリ検出における，新たなカテゴリの発見と既存カテゴリの認識維持
- データから新たなカテゴリを発見することは，AIの汎化能力向上に不可欠である。
- 既存の手法では，細粒度なカテゴリの識別が脆弱であり，境界が曖昧になりやすい。
- ラベル付き知識からの類推により，未知データに対するカテゴリ分離を明確にすること。
- 本研究で提案するATCGモジュールは，既存の汎化カテゴリ検出パイプラインに容易に組み込むことができる。
- ATCGは，視覚的特徴とテキスト情報を融合させ，知識の転移とカテゴリ分離の精度向上を実現する。
- 6つのベンチマークにおいて，ATCGは全体的な性能，既知クラス，新規クラスの性能を安定的に向上させた。
Link: https://arxiv.org/abs/2603.19918
スパンレベル機械翻訳メタ評価 [cs.CL, cs.AI]目的：機械翻訳誤差検出の評価手法
- 機械翻訳技術は目覚ましい進歩を遂げ，多様な応用を可能にしている。
- 誤差検出を行う自動評価器の性能を信頼性高く測定する確立された手法は存在しない。
- 自動評価器の評価におけるスパンレベルの適合率，再現率，Fスコアの比較検討を通じて，より適切な評価戦略を提案する。
- スパンレベル評価における手法の違いがランキングに大きく影響することが示された。
- 広く使用されている一部の手法は，機械翻訳誤差検出の評価には不向きであることが判明した。
- 「部分一致と部分加点」 (MPP) とマイクロ平均を用いたメタ評価戦略が，堅牢な評価手法として提案された。
Link: https://arxiv.org/abs/2603.19921
RAM：自然環境下における3D人体モーションのあらゆる復元 [cs.CV, cs.AI]目的：自然環境下における3D人体モーションの復元手法
- 近年のコンピュータビジョン研究において，人体モーションの理解は重要な課題である。
- 遮蔽や複雑な相互作用により，自然環境下での正確なモーション追跡が困難である。
- 遮蔽や相互作用下でもロバストなモーション復元を実現する技術の確立を試みる。
- 本研究では，モーションを考慮したセマンティックトラッカーとカルマンフィルタを組み合わせ，遮蔽や相互作用下でのロバストな人物識別を実現した。
- さらに，過去の情報を活用するTemporal HMRモジュールにより，一貫性と滑らかさのあるモーション推定を可能にした。
- 実験結果から，RAMは既存の最先端技術と比較して，Zero-shot追跡の安定性と3D精度において大幅な性能向上を示した。
Link: https://arxiv.org/abs/2603.19929
Memori：効率的で文脈を意識したLLMエージェントのための永続メモリ層 [cs.CL, cs.LG]目的：LLMエージェントにおける文脈を意識した振る舞いを可能にするための，API層における永続メモリ
- LLMが自律エージェントとして進化するにつれ，長期的な文脈維持が不可欠となる。
- 既存のアプローチは，特定のベンダーに依存し，プロンプトに大量の会話履歴を注入する必要がある。
- トークンコストの削減とパフォーマンスの向上を実現する，構造化されたメモリ表現を提案する。
- Memoriは，LoCoMoベンチマークにおいて81.95%の精度を達成し，既存のメモリシステムを凌駕した。
- Memoriは，クエリあたり約1,294トークン（フルコンテキストの約5%）しか使用しないため，大幅なコスト削減に貢献する。
- この結果は，LLMエージェントの有効なメモリが，より大きなコンテキストウィンドウではなく，構造化された表現に依存することを示唆する。
Link: https://arxiv.org/abs/2603.19935
TAPAS：非対称プライベート集約の効率的な二者サーバプロトコル（Prio(+)を超えて） [cs.CL, cs.CR, cs.LG]目的：分散データからのプライベート集約
- AIシステムの学習において，個々の記録を公開せずに分散データを利用する技術は重要である。
- 既存の二者サーバプロトコルは，サーバ間の対称的なコストが入力次元に依存する。
- 大規模なモデルパラメータに対する集約効率を向上させ，プライバシーとセキュリティを強化する。
- TAPASは，信頼されたセットアップや前処理を必要としない非対称な集約スキームである。
- サーバ間の通信量は入力次元に依存せず，標準的な格子仮定に基づく量子耐性を持つ。
- 識別可能なアボートと完全な悪意のあるセキュリティを備え，二者サーバ環境におけるプライバシーと正確性を確立した。
Link: https://arxiv.org/abs/2603.19949
Transformerの計画検証能力について [eess.SY, cs.SY, cs.AI, cs.CL, cs.LG]目的：Transformerによる計画検証の能力
- AI計画立案は，ロボット工学や自動化において重要な役割を担う
- Transformerの汎化性能は不安定であり，理論的理解が不足している
- Transformerが計画検証を学習可能な条件を明らかにすること
- Transformerは，特定の古典的計画ドメインにおいて，長い計画を検証できることが証明された。
- シーケンス長と語彙サイズの同時増加下で，Transformerの汎化性能を保証するC*-RASPが提案された。
- 計画の学習可能性に影響を与える構造的特性が特定された。
Link: https://arxiv.org/abs/2603.19954
HiPath：構造化病理レポート予測のための階層的な視覚と言語の整合 [cs.CV, cs.AI, cs.LG]目的：構造化病理レポート予測
- 病理診断は，正確かつ迅速な治療方針決定に不可欠であるため，その効率化が重要視されている。
- 既存の視覚言語モデルはレポートの構造を十分に考慮しておらず，診断精度に課題が残る。
- 病理画像とレポート間の階層的な整合性を高め，高精度な構造化レポート予測を実現することを目指す。
- HiPathは，既存の基盤モデルを活用し，わずか1500万パラメータの軽量なフレームワークで高い性能を発揮する。
- 749,000件の実際の中国語病理症例を用いた実験で，HiPathは厳密精度68.9%，臨床的受容精度74.7%を達成し，安全率は97.3%を示した。
- 異なる病院での評価でも，厳密精度がわずか3.4pp低下するのみで，97.1%の安全性を維持し，汎化性能が確認された。
Link: https://arxiv.org/abs/2603.19957
連続スプーフィング攻撃下におけるチャネル予測に基づく物理層認証 [cs.CR, cs.LG]目的：連続スプーフィング攻撃に対する物理層認証の枠組み
- 無線ネットワークはスプーフィング攻撃に脆弱であり，セキュリティ対策が不可欠である。
- 従来の物理層認証は単一パケット攻撃に偏っており，連続攻撃への対策が不十分である。
- デバイス移動やチャネルフェージングによるチャネル変動を考慮し，認証精度を向上させる。
- 提案手法はTransformerを用いたチャネル予測モジュールにより，スプーフィング期間中の正当なCSIを予測する。
- 予測モジュールの入力は認証結果に応じて適応的に更新され，持続的なスプーフィングに対する堅牢性が確保される。
- レイリーフェージングチャネル下でのシミュレーション結果は，高い認証精度と低い予測誤差を示した。
Link: https://arxiv.org/abs/2603.19962
グラフ2TS：量子分位グラフVAEによる構造制御時系列生成 [cs.LG, cs.AI]目的：時系列データの構造制御生成手法
- 時系列データは，様々な分野で重要な役割を担う。その生成は，予測やシミュレーションに不可欠である。
- 既存の生成モデルは，大域的な時間構造の維持と局所的な確率的変動のモデル化のバランスが難しい。
- 本研究では，構造と残差動的な分離により，時系列データの生成における構造制御を目指す。
- 提案手法Graph2TSは，量子分位に基づく遷移グラフを用いて時系列の構造を表現し，グラフから時系列への生成を行う。
- 実験の結果，Graph2TSは，既存の拡散モデルやGANと比較して，分布の忠実性，時間的整合性，代表性の点で優れていることが示された。
- 構造制御とクロスモーダル生成は，時系列モデリングにおいて有望な方向性である。
Link: https://arxiv.org/abs/2603.19970
モバイルWi-Fiデバイスのためのモデル駆動型学習ベース物理層認証 [cs.OS, cs.PF, cs.LG]目的：モバイルWi-Fiデバイスにおける物理層認証スキームの開発
- 無線技術の発展によりIoTが普及する中で，認証リスクへの対策が重要である。
- 従来の物理層認証はチャンネル統計に依存し，現実環境での利用が課題であった。
- 仮説検定に基づいた学習型物理層認証スキームにより，この課題を解決することを目指す。
- 提案手法LiteNP-Netは，チャンネル統計の事前知識なしでもNP検出器の性能に匹敵することがシミュレーションで示された。
- Wi-Fi IoT開発キットを用いた実験環境では，LiteNP-Netが従来の相関ベース手法や最先端のSiameseベース手法を上回る性能を示した。
- 仮説検定と統計モデルを組み合わせることで，実用的な物理層認証を実現した。
Link: https://arxiv.org/abs/2603.19972
トロイの囁き：ブートストラップガイダンスによるOpenClawのステルス操作 [cs.CR, cs.AI]目的：自律型コーディングエージェントに対するガイダンスインジェクション攻撃の特定と評価
- ソフトウェア開発における自律型エージェントの活用が広がり，環境管理を含む高度な機能が期待されている。
- OpenClaw等のプラットフォームでは拡張性が重視される一方，初期化時のガイダンス注入という新たな攻撃経路が存在する。
- 本研究は，悪意のあるガイダンスを注入し，エージェントの行動を操作する攻撃とその対策を明らかにすることを目的とする。
- ガイダンスインジェクションは，従来のプロンプトインジェクションとは異なり，有害な行動を日常的なベストプラクティスとして巧妙に偽装する。
- 構築した26種類の悪意のあるスキルは，認証情報の窃取，ワークスペースの破壊，権限昇格など，13の攻撃カテゴリに及ぶ。
- 実験の結果，攻撃の成功率は16.0%から64.2%に達し，既存の静的解析やLLMベースのスキャナによる検出を94%のスキルが回避した。
Link: https://arxiv.org/abs/2603.19974
ドメイン特化型生成AIによる批判的思考の促進 [cs.HC, cs.AI]目的：批判的思考を促進するためのドメイン特化型生成AIの活用
- AI技術は，知識労働の効率化や新たな知見の発見に貢献し，教育や研究のあり方を大きく変える可能性を秘めている。
- 生成AIの批判的思考への影響は定かではなく，適切な実装方法が課題となっている。
- ドメイン特化型AIを用いた対話的アプローチで，批判的思考を効果的に支援することを目指す。
- ドメイン特化型AIが生成する問いかけは，ユーザーの貢献を促し，批判的思考を深める上で有効であることが示唆された。
- 生成AIによる「生産的な摩擦」と，ユーザーの知識や経験に基づいた相互作用が，批判的思考を支援する鍵となる。
- ユーザーの特性や熟練度に合わせて問いかけを変化させることで，さらに効果的な批判的思考の促進が期待できる。
Link: https://arxiv.org/abs/2603.19975
X-World：スケーラブルなエンドツーエンド運転のための制御可能な自我中心的マルチカメラワールドモデル [cs.CV, cs.AI]目的：スケーラブルで再現性のある自動運転評価のためのシミュレーション環境
- 自動運転技術の発展には，現実世界でのテストに代わる効率的な評価手法が不可欠である。
- 既存の評価パイプラインは実走行に依存しており，コストが高く，再現性が低いという課題がある。
- 提案手法は，行動に基づいた現実的な未来予測シミュレーションを提供し，評価の効率化を目指す。
- X-Worldは，行動条件付きのマルチカメラ生成ワールドモデルであり，ビデオ空間で未来の観測をシミュレートする。
- 複数のカメラからの情報と未来の行動シーケンスに基づいて，X-Worldは指示された行動に従う未来のビデオストリームを生成する。
- X-Worldは，シーンのロールアウトを編集可能にし，天気や時間帯などの外観レベルの制御にも対応している。
Link: https://arxiv.org/abs/2603.19979
LLMのポストトレーニングにおけるマルコフ状態の再導入による能力上限の打破 [cs.LG, cs.AI, cs.CL]目的：LLMのポストトレーニングにおける能力上限打破
- 大規模言語モデル(LLM)は自然言語処理の発展に不可欠であり，その性能向上は重要な課題である。
- LLMの強化学習によるポストトレーニングは，既存のパターンを微調整するに留まり，新たな戦略を発見できないという限界がある。
- 本研究は，明示的なマルコフ状態を導入することで，この限界を打破し，LLMの新たな推論能力を引き出すことを目指す。
- マルコフ状態を活用することで，サンプル効率を大幅に向上させることが理論的に保証された。
- 複雑な論理パズルにおいて，標準的な強化学習によるポストトレーニングの性能限界を，マルコフ状態の導入により一貫して打破することが示された。
- LLMにおける「履歴を状態とする」モデリングから，構造化されたマルコフ表現への移行が，生成AIにおける新たな発見と推論能力の解き放ちのために不可欠である。
Link: https://arxiv.org/abs/2603.19987
自然なクロスデータセット分布シフト下における表情認識のためのテスト時適応の評価 [cs.CV, cs.LG, eess.IV, eess.SP]目的：表情認識におけるテスト時適応の有効性
- 実世界の様々な環境下での応用において，表情認識の精度向上が求められている。
- 異なるデータセット間での分布シフトにより，表情認識モデルの性能が著しく低下する問題がある。
- 自然な分布シフト下における表情認識モデルの適応能力の改善を目指す。
- テスト時適応は，自然な分布シフト下で表情認識性能を最大11.34％向上させることが示された。
- エントロピー最小化法は，ターゲット分布がクリーンな場合に有効である。
- プロトタイプ調整法は，分布距離が大きい場合に優れている。特徴量アライメント法はノイズの多いターゲット分布で効果的である。
Link: https://arxiv.org/abs/2603.19994
ベクトル埋め込みのインデックス作成のための超高速K-means [cs.LG, cs.DB, cs.IR]目的：高次元ベクトル埋め込みのクラスタリング
- 大規模データ分析において，ベクトル埋め込みの効率的なクラスタリングは不可欠である。
- 既存のK-meansアルゴリズムは，高次元データにおいて計算コストが高いという課題がある。
- ベクトル埋め込みの検索精度を維持しつつ，クラスタリング処理の高速化を目指す。
- SuperKMeansは，現代のCPUにおいてFAISSやScikit-Learnよりも最大7倍高速，GPUにおいてはcuVSよりも最大4倍高速にクラスタリングを行う。
- 不要な次元を効率的に削減することで，データアクセスと計算のオーバーヘッドを低減している。
- 検索タスクにおけるセントロイドの品質が向上しなくなった時点でK-meansを早期終了するEarly Termination by Recallという新しい仕組みを導入。
Link: https://arxiv.org/abs/2603.20009
エージェンティックRS-EnsNAS：アンサンブル分離自己進化型アーキテクチャ探索 [eess.SY, cs.SY, cs.LG]目的：産業生産システムにおけるニューラルアーキテクチャ探索の検証ボトルネックの解消
- ニューラルネットワークの性能はアーキテクチャに大きく依存し，自動探索が重要である。
- 大規模アンサンブルを用いた場合，各候補アーキテクチャの検証コストが非常に高くなる。
- アンサンブル全体の性能を個々のモデルの評価から予測し，探索コストを削減することを目指す。
- アンサンブル分離理論を確立し，単一学習者の評価からシステムレベルの性能を予測する。
- 候補アーキテクチャの探索コストをO(M)からO(1)に削減し，検証済みの勝者のみにO(M)のコストを適用する。
- 特徴量バギングやLLM駆動型探索など，多様なパイプラインに対応可能な解決戦略を統合する。
Link: https://arxiv.org/abs/2603.20014
切り離しスキップリンクとRプローブ：MLLM OCRにおける特徴集約と勾配伝播の分離 [cs.CL, cs.DB, cs.IR, cs.CV, cs.AI]目的：マルチモーダル大規模言語モデルにおけるOCRタスクの性能向上
- 近年のマルチモーダル大規模言語モデルの発展は目覚ましいが，OCR分野への応用は課題が多い。
- 特徴融合の過程で，高レベルのセマンティック情報が低レベルの視覚的特徴を上書きし，学習を不安定化させる問題がある。
- スキップ接続による勾配干渉を軽減し，低レベルの視覚情報をより効果的に活用することを目指す。
- 提案手法である「切り離しスキップリンク」は，勾配の逆伝播をスキップ接続で遮断することで，学習の安定性と収束性を向上させる。
- 新たに導入した「Rプローブ」は，LLMが投影された視覚的トークンからピクセルレベルで情報を再構成できるかを測定し，細粒度情報の保存状態を診断する。
- 様々なViTバックボーンとマルチモーダルベンチマークにおいて，OCRタスクの性能が向上し，汎用的なマルチモーダルタスクにも良い影響を与えることが確認された。
Link: https://arxiv.org/abs/2603.20020
侵襲的冠動脈造影画像における病変の自動検出，セグメンテーション，重症度推定のためのオープンソースエンドツーエンドフレームワークODySSeI [cs.LG]目的：侵襲的冠動脈造影画像における病変の検出，セグメンテーション，および重症度推定の自動化
- 冠動脈疾患の診断において，侵襲的冠動脈造影は臨床上のゴールドスタンダードである
- 造影画像の解釈には主観が入りやすく，医師間・医師内でのばらつきが生じる可能性がある
- 病変の自動検出・セグメンテーション・重症度推定による，客観的かつ効率的な診断支援を目指す
- 本研究で開発されたODySSeIは，ヨーロッパ，北米，アジアの多様な患者データに対して高い汎化性能を示す
- ピラミダルデータ拡張（PAS）は，病変検出性能を大幅に向上させ，セグメンテーション性能も改善した
- 提案する病変重症度推定手法は，最小管腔径（MLD）の予測精度が高く，臨床現場での迅速な意思決定を支援する
Link: https://arxiv.org/abs/2603.20021
人間とAIによるソフトウェアデリバリーの調整：3つのソフトウェア近代化プログラムに関する遡及的縦断フィールドスタディ [eess.SY, cs.SY, cs.SE, cs.AI]目的：ソフトウェアデリバリーにおける人間とAIの連携による効率化
- ソフトウェア開発は，ビジネスの根幹を支える重要な活動であり，その効率化が求められている。
- AIの導入は進んでいるものの，チームレベルでのデリバリーに関する知見は不足している。
- AIをデリバリープロセスに組み込み，効率性と品質の向上を目指す。
- Chironプラットフォームを用いた3つのソフトウェア近代化プロジェクトにおいて，AIと人間の連携による効果を検証した。
- 基盤環境と比較して，プロジェクト期間は36.0から9.3週に短縮され，人的リソースも大幅に削減された。
- 特に，AIをワークフローに統合することで，スピード，カバレッジ，問題点の減少が同時に実現されたことが示された。
Link: https://arxiv.org/abs/2603.20028