arXiv雑要約

AI - 2026/03/10 公開

  • 分布ロバスト幾何学的結合確率制約最適化:ニューロダイナミックアプローチ [cs.CL, cs.NE, cs.AI, math.OC]目的:分布ロバスト幾何学的結合確率制約最適化問題の解法
    • 不確実性下での意思決定において,ロバストな最適化手法の重要性が高まっている。
    • 確率的制約を持つ最適化問題は,計算が困難であり,効率的な解法が求められている。
    • 未知の確率分布に対するロバスト性を備えた,効率的な解法を提案する。
    • 本研究では,ニューラルネットワークを用いた新しいアプローチを提案し,確率的な収束を保証する。
    • 既存の最適化手法に頼らず,複数の問題インスタンスに対応可能な解法を提供する。
    • 形状最適化問題と通信問題への適用により,提案手法の有効性を実証した。

    Link: https://arxiv.org/abs/2603.06597

  • 未来の倫理的AIフレームワークの構築:哲学から実践へ [cs.CY, cs.CY, cs.AI]目的:AIの倫理的リスク管理のための制御アーキテクチャ
    • AI技術の発展は社会に大きな変革をもたらすが,倫理的課題も増大している。
    • 既存のAIガバナンスは原則レベルで示されることが多く,具体的な運用制御が不足している。
    • AIライフサイクル全体にわたる倫理的リスクを管理し,実効性のあるガバナンスを実現すること。
    • 本研究では,結果主義,義務論,徳倫理の思考を組み込んだ,AIライフサイクル各段階でのゲート構造を提案する。
    • 提案フレームワークは,定量評価,法的遵守,環境制約を考慮したゲートで構成され,リスクを早期に特定・抑制する。
    • このフレームワークは,既存のMLOpsパイプラインに統合可能であり,AIガバナンスの運用面での基盤となりうる。

    Link: https://arxiv.org/abs/2603.06599

  • FuzzingRL:VLMの失敗を明らかにするための強化学習ファジング [cs.LG, cs.AI]目的:VLMの脆弱性を明らかにするための質問生成手法
    • VLMはAIシステムの信頼性と安全性を左右するため,その誤り箇所を特定することは重要である。
    • VLMはエラーを起こしやすく,そのエラーの発生状況を特定することが困難である。
    • VLMの脆弱性を効率的に発見し,その性能低下を引き起こす質問を生成することを目指す。
    • 提案手法により,生成された質問に対するVLMの回答精度を低下させることが可能となった(例:Qwen2.5-VL-32Bの精度は86.58%から65.53%に低下)。
    • ファジングポリシーは,単一のVLMに対して訓練された後,他の複数のVLMに対しても有効であり,それらの性能を低下させる質問を生成することが示された。

    Link: https://arxiv.org/abs/2603.06600

  • 切り替え可能活性化ネットワーク [cs.LG]目的:深層ニューラルネットワークの効率化
    • 深層学習モデルの性能向上は目覚ましいが,計算コストが課題となっている。
    • 既存手法では,推論時の効率化が限定的である。
    • 入力に応じて活性化を制御し,計算資源を効率的に配分する。
    • SWANは,各ニューロンにバイナリゲートを導入し,活性化を動的に制御する。
    • これにより,冗長性を削減しつつ,精度を維持した効率的な推論を実現する。
    • 学習済みモデルをコンパクトな密度モデルに変換することも可能である。

    Link: https://arxiv.org/abs/2603.06601

  • データ要約のためのKhatri-Raoクラスタリング [cs.LG, stat.ML]目的:データ要約の簡潔性と精度
    • データ量は増加の一途をたどっており,効率的な要約手法の必要性が高まっている。
    • 従来のクラスタリング手法では,要約の冗長性が課題となり,特にクラスタ数が多い場合に問題となる。
    • Khatri-Raoクラスタリングにより,より簡潔で精度の高いデータ要約を実現することを目指す。
    • Khatri-Raoクラスタリングは,標準的なk-Meansよりも簡潔性と精度のバランスに優れたデータ要約を可能にする。
    • 表現学習を活用したKhatri-Rao深層クラスタリングは,深層クラスタリングによる要約のサイズをさらに削減し,精度を維持する。
    • Khatri-Raoパラダイムは,k-Meansと深層クラスタリングの両方において有効であることが示された。

    Link: https://arxiv.org/abs/2603.06602

  • スケール依存的なデータ重複 [cs.LG, cs.AI]目的:事前学習におけるデータ重複が汎化性能に与える影響の解明
    • 大規模言語モデルの性能向上には,大量の学習データが不可欠である。
    • Web規模のデータセットでは,表面的な一致だけでなく意味的に類似した文書の重複が問題となる。
    • モデルのスケールに応じて変化する重複の影響を定量的に評価し,学習データセットの構築指針を示す。
    • モデルの能力が高まるにつれて,意味的に等価な文書に対するクロスエントロピー損失勾配が一致する傾向が確認された。
    • 大規模データセットにおける最近傍類似度の分布が,べき乗則からの逸脱を示し,意味的な衝突の加速が示唆された。
    • 有限な一意な文書からのデータサンプリングによる事前学習実験から,一意性の制限が大規模モデルにおいて損失の増加を引き起こすことが示された。

    Link: https://arxiv.org/abs/2603.06603

  • 誤りを自覚するとき:LLMエラー検出のための信頼度と正答率の整合性 [cs.LG, cs.CL]目的:LLMのエラー検出のための信頼度と正答率の整合性向上
    • LLMが重要な意思決定システムに導入される中,その不確実性を測定する信頼性のある方法の欠如は,信頼性の根本的なリスクとなる。
    • 既存手法では,LLMの出力に対する信頼度を正確に評価できず,誤りやハルシネーションの検出が困難である。
    • 本研究は,LLMの信頼度スコアを正規化し,自己評価フレームワークを導入することで,エラー検出の精度向上を目指す。
    • 提案する正規化された信頼度スコアと自己評価フレームワークは,様々なタスクとモデルで信頼性の高い信頼度推定を可能にした。
    • 教師ありファインチューニング(SFT)は,最尤推定を通じて良好な信頼度校正をもたらすが,強化学習(PPO, GRPO)やDPOは報酬の悪用を通じて過信を誘発することが明らかになった。
    • 強化学習モデルに対して自己蒸留を用いたSFTを行うことで,信頼性の低下を回復させることが示された。RAGにおける応用例により,選択的なコンテキスト検索により高い精度を達成した。

    Link: https://arxiv.org/abs/2603.06604

  • 構造を意識した集合型Transformer:非同期臨床時系列のための時間的・変数タイプ注意バイアス [cs.LG]目的:非同期臨床時系列データに対する新たなTransformerモデルの設計
    • 電子カルテ等の臨床データは医療現場において重要な情報源であり,その分析は患者ケアの向上に不可欠である。
    • 臨床時系列データは不規則かつ非同期であるため,従来の時系列解析手法の適用が困難であるという課題がある。
    • 時間的・変数タイプ情報を効率的に組み込むことで,臨床時系列データの予測精度を向上させることを目指す。
    • 提案手法STAR-Setは,ICU予測タスクにおいて,既存のグリッド型や集合型ベースラインモデルを上回るAUC/APRを達成した。
    • 学習された時間スケール$\tau$と変数タイプ親和性$B$は,時間的文脈と変数間の相互作用に関する解釈可能な情報を提供する。
    • STAR-Setは,文脈情報を活用した時系列モデルへのプラグインとして実用性があることが示された。

    Link: https://arxiv.org/abs/2603.06605

  • レゴネット:ブロック重みクラスタリングによるメモリフットプリントの削減 [cs.LG]目的:ニューラルネットワークのメモリフットプリント削減手法
    • ニューラルネットワークの高性能化に伴い,モデルサイズが増大しており,組み込みデバイスへの適用が課題となっている。
    • 限られたメモリ資源の組み込みデバイスでは,大規模モデルの利用が困難であるという問題が存在する。
    • モデルの重みをブロック化しクラスタリングすることで,メモリ使用量を削減し,組み込みデバイスでの利用を可能にすること。
    • 提案手法であるレゴネットは,層の種類を問わずモデル全体の重みをブロック化し,そのブロックをクラスタリングすることで圧縮を実現する。
    • Cifar-10およびImageNetで学習したResNet-50において,32個の4x4ブロックを使用することで,メモリフットプリントを64倍以上削減することに成功した。
    • 16個の4x4ブロックの配置を工夫することで,3%未満の精度損失で128倍の圧縮率を達成した。再学習や微調整は不要である。

    Link: https://arxiv.org/abs/2603.06606

  • V2Xリソース割当のためのマルチエージェント強化学習:課題の分離とソリューションのベンチマーク [cs.MA, cs.AI, cs.LG]目的:セルラーV2Xネットワークにおける無線リソース割当に関する課題の分離と,マルチエージェント強化学習アルゴリズムの性能評価
    • V2Xは,自動車の安全性向上や自動運転実現に不可欠であり,効率的なリソース割当が鍵となる。
    • マルチエージェント強化学習は複雑で,非定常性,協調の難しさ,大きな行動空間などの課題が絡み合っている。
    • 本研究は,各課題が性能に及ぼす影響を明確にし,V2X環境に特化したアルゴリズム開発の基盤を提供する。
    • C-V2Xリソース割当を段階的に複雑化させた干渉ゲームとして定式化し,各課題の影響を分離して評価できるベンチマーク環境を構築した。
    • 大規模かつ多様なSUMO生成の交通データを用いて,様々な車両トポロジーと干渉パターンを再現し,現実的な評価を可能にした。
    • 実験の結果,車両トポロジーの変化に対するポリシーの頑健性と汎化性能が,C-V2Xリソース割当における最も重要な課題であることが示された。

    Link: https://arxiv.org/abs/2603.06607

  • スケーリング戦略:アクセス可能な強化学習研究のためのスタンドアロン型オープンソースStarCraft IIベンチマーク [cs.AI, cs.LG]目的:強化学習研究のための,中間的なStarCraft IIベンチマーク
    • リアルタイムストラテジーゲームは,AI研究において複雑な課題を提供し,知能開発の重要なプラットフォームである。
    • StarCraft IIのフルゲームは複雑すぎる一方,ミニゲームは単純すぎて,現実的な計算資源での実験が困難である。
    • フルゲームとミニゲームの中間となるベンチマークを提供し,現実的な計算資源での強化学習研究を可能にすること。
    • Two-Bridge Map Suiteは,資源収集や視界制限を無効化し,長距離ナビゲーションとマイクロ戦闘に焦点を当てた環境である。
    • 実験の結果,エージェントはフルゲームの計算コストをかけずに,一貫した操作や交戦行動を学習することが示された。
    • Two-Bridgeは,PySC2上で動作する軽量なGym互換のラッパーとして公開され,広く利用可能な標準ベンチマークとなることを目指す。

    Link: https://arxiv.org/abs/2603.06608

  • 条件付きランダム化検定によるテーブル型ファウンデーションモデルの有効な特徴レベル推論 [cs.LG]目的:テーブル型データにおける特徴量の関連性評価
    • 機械学習モデルの解釈可能性は重要であり,モデルの信頼性を高める上で不可欠である。
    • ブラックボックスモデルでは,特徴量と目的変数の関係を統計的に検証することが困難である。
    • 非線形かつ相関のある状況下でも,有効なp値を導き出す手法を確立すること。
    • 条件付きランダム化検定(CRT)とテーブル型データ用確率的ファウンデーションモデル(TabPFN)を組み合わせることで,特徴量レベルの仮説検定が可能になった。
    • 提案手法は,モデルの再学習やパラメータに関する仮定を必要とせずに,有限サンプルで有効なp値を提供する。
    • この手法は,非線形かつ相関のあるデータセットにおいて,特徴量の関連性を評価するための実用的なアプローチを提供する。

    Link: https://arxiv.org/abs/2603.06609

  • CapTrack:LLMポストトレーニングにおける忘却の多面的評価 [cs.LG]目的:LLMのポストトレーニングにおける忘却の分析
    • LLMは性能向上やドメイン適応に不可欠だが,その学習方法には課題も存在する。
    • ポストトレーニングは知識喪失を引き起こすことが知られており,その評価は精度のみに焦点が当たっている。
    • モデルの行動とユーザー体験に悪影響を及ぼす,より広範な忘却現象を分析する。
    • CapTrackは,LLMの忘却を分析するための行動分類と評価スイートを組み合わせたフレームワークである。
    • 実験の結果,忘却はパラメータ知識の喪失だけでなく,ロバスト性やデフォルト行動の変化を含むことが明らかになった。
    • 指示チューニングは最も大きな変化をもたらし,選好最適化はより保守的で,失われた機能を部分的に回復できる。

    Link: https://arxiv.org/abs/2603.06610

  • 培養不要の水サンプル顕微鏡画像に対する深層学習推論を用いた新規な水質安全検査アプローチ [cs.OH, cs.CV, cs.CY, cs.LG]目的:水質安全検査の迅速化と低コスト化
    • 水質汚染は健康被害を引き起こすため,迅速かつ正確な水質検査が不可欠である。
    • 従来の検査法は培養に時間を要し,コストも高額であるという課題があった。
    • 培養を必要とせず,低コストで迅速な水質安全検査を実現すること。
    • 深層学習を用いることで,水中の病原体の有無を迅速かつ高精度に判定できる。
    • テストのコストを20~50ドルから0.44ドルに大幅に削減することに成功した。
    • Webサーバやモバイルアプリケーションへの展開により,手軽に水質検査が可能となった。

    Link: https://arxiv.org/abs/2603.06611

  • 合意形成は検証ではない:LLMの真実性に対する群知能戦略の失敗理由 [cs.LG, cs.AI]目的:LLMの真実性に関する群知能戦略の有効性
    • LLMの性能向上は重要であり,特に真実性の評価は社会への影響が大きい。
    • 検証が容易でない分野において,LLMの真実性を向上させる有効な手段が不足している。
    • LLMの誤りを減らし,真実性を高めるための現実的なアプローチを模索する。
    • Pass@kなどの手法は,検証可能な分野では有効だが,真実性の評価が難しい分野では効果がないことが示された。
    • LLMは,正解を特定するよりも,他のLLMがどのような回答を生成するかを予測することに優れている。
    • LLMのエラーは相関性が高く,多数のサンプルを集めても誤った信念が強化されるだけで,信頼性の高い真実のシグナルは得られない。

    Link: https://arxiv.org/abs/2603.06612

  • OptiRouletteオプティマイザー:最大5.3倍高速な収束を実現する新しい確率的メタオプティマイザー [cs.LG, cs.AI, cs.CV, cs.NE]目的:深層学習の最適化手法
    • 深層学習モデルの性能は最適化手法に大きく左右されるため,より効率的な手法の開発が重要である。
    • 既存の最適化手法は,特定のモデルやデータセットに対して最適な設定が難しく,汎用性に課題がある。
    • OptiRouletteは,複数の最適化手法を動的に選択することで,収束の安定性と高速化を目指す。
    • OptiRouletteは,画像分類タスクにおいて,AdamWベースラインと比較して平均テスト精度を大幅に向上させた。
    • 特に,CIFAR-100,CIFAR-100-C,Tiny ImageNet,Caltech-256において,9%以上の精度向上が確認された。
    • OptiRouletteは,AdamWでは達成できなかった目標精度に,全実行において安定して到達することが示された。

    Link: https://arxiv.org/abs/2603.06613

  • 生成モデルの相関分析 [cs.LG, cs.CV]目的:生成モデルの相関性に関する知見
    • 生成モデルは,画像生成など多様な分野で活用が広がっている。
    • 既存モデルでは,ノイズデータと予測ターゲットの相関が弱い場合がある。
    • 拡散モデルとフローマッチングの相関関係を分析し,予測精度の向上を目指す。
    • 拡散モデルとフローマッチングを統一的な数式で表現することに成功した。
    • 理論分析により,既存モデルにおけるノイズデータと予測ターゲットの相関の弱さが示唆された。
    • この相関の弱さが,モデルの学習プロセスに影響を与える可能性が示された。

    Link: https://arxiv.org/abs/2603.06614

  • 徐々にペア化モデリングを行うことによる変数分離:焼きなまし共生成 [cs.LG, cs.AI]目的:科学応用における多変量共生成のためのフレームワーク
    • 科学分野では,複数の変数を同時に生成する共生成が重要である。複雑な現象のシミュレーションやデータ補完に不可欠だ。
    • 変数の数が増えると計算コストが指数関数的に増加し,データ不足による偏りが生じやすい。
    • この研究は,計算負荷を軽減し,データバランスを改善することで,より効率的な共生成を可能にする。
    • 提案手法である焼きなまし共生成(ACG)フレームワークは,高次元拡散モデルの代わりに低次元拡散モデルを用いることで,計算コストを削減する。
    • ペアワイズな変数生成を組み合わせることで,多変量共生成を実現し,共有共通変数を通じて一貫性のある多変量生成を可能にする。
    • コンセンサス,加熱,冷却の3段階の焼きなましプロセスにより,共有変数の整合性を維持し,各ペアのデータ分布を学習可能な多様体に制約する。

    Link: https://arxiv.org/abs/2603.06615

  • RACER:大規模言語モデルのためのリスクを考慮したキャリブレーションされた効率的なルーティング [cs.LG, cs.AI, math.ST, stat.TH]目的:大規模言語モデルの最適なルーティング
    • マルチモデルシステムにおいて,コストと性能のバランスを最適化する上で重要である。
    • 既存のルーティング手法は単一モデル選択に依存し,誤ったルーティングが起こりやすい。
    • 誤ルーティングのリスクを制御しつつ,期待されるセットサイズを最小化することを目指す。
    • RACERは,既存のルーティング手法を拡張し,モデルセットを出力することで,より正確な集約を可能にする。
    • 理論的に,RACERは未知のテストデータに対して,分布に依存しない厳密なリスク制御を達成することが証明された。
    • 広範な実験により,RACERがさまざまなベンチマークで下流タスクの精度を向上させることが示された。

    Link: https://arxiv.org/abs/2603.06616

  • Evo:進化するバランスを持つ自己回帰拡散大規模言語モデル [cs.LG, cs.AI]目的:自己回帰モデルと拡散モデルを統合した継続的な進化生成フレームワーク
    • 大規模言語モデルは,自然言語処理の様々なタスクにおいて目覚ましい成果を上げている。
    • 自己回帰モデルと拡散モデルは異なる生成メカニズムを持つため,両者の長所を組み合わせることが課題であった。
    • 不確実性に応じて自己回帰と拡散のバランスを適応的に調整し,高品質かつ高速なテキスト生成を目指す。
    • Evoは,潜在的なフローとしてテキスト生成を捉え,トークンの意味的な成熟度を示す進行変数tを用いて自己回帰と拡散を統合する。
    • 理論的に,自己回帰モデルと拡散モデルは共有確率フローの離散化として導出され,統一された変分ELBOからEvoの学習目的が導かれる。
    • Evo 8Bは,15の多様なベンチマークにおいて最先端または非常に競争力のある結果を達成し,高速な推論速度を維持する。

    Link: https://arxiv.org/abs/2603.06617

  • 多重生物ネットワークにおけるゼロショット相互作用予測のためのトポロジー認識フレームワーク [cs.LG, cs.AI, q-bio.QM]目的:多重生物ネットワークにおけるゼロショット相互作用予測
    • 複雑な生物システム理解には不可欠であり,多様な相互作用様式を捉えることが重要である。
    • 既存手法は多重性を十分にモデル化できず,構造と配列情報の統合が困難である。
    • 未知のエンティティに対するゼロショット予測の精度向上を目指す。
    • 本フレームワークは,ドメイン固有の基礎モデルとトポロジー認識グラフトークナイザーを活用する。
    • 対照学習により,異なるモダリティ間の埋め込みを整合させ,教師・生徒蒸留戦略を用いて汎化性能を高める。
    • 実験結果から,最先端手法と比較して相互作用予測性能が向上し,個別化医療への貢献が期待される。

    Link: https://arxiv.org/abs/2603.06618

  • 必要なトークンはすべてではない:トークン効率の良い強化学習 [cs.LG, cs.AI]目的:トークン効率の良い強化学習のためのフレームワーク
    • 大規模言語モデルの進歩を支える強化学習は,長大な思考連鎖(CoT)への適用において計算コストが課題となっている。
    • 生成された全てのトークンに対する誤差逆伝播が,計算資源を圧迫し,学習のスケーラビリティを阻害している。
    • トークン選択による部分的な更新で効率化を図り,長大な軌跡における強化学習のスケーラビリティを向上させる。
    • NATは,生成されたトークンの部分集合のみを用いて方策を更新する統一的なフレームワークである。
    • Horvitz-Thompson再重み付けによる偏りのない部分トークン方策勾配推定器を用いることで,統計的に正確な勾配を保証する。
    • 実験の結果,NATは既存手法と同等の性能を維持しつつ,トークン数を50%削減することに成功した。

    Link: https://arxiv.org/abs/2603.06619

  • GraphSkill:ドキュメント誘導型階層的検索拡張コーディングによる複雑なグラフ推論 [cs.SE, cs.AI, cs.CL, cs.LG]目的:複雑なグラフ推論のための手法
    • グラフアルゴリズムの自動推論の需要が高まっており,LLMコミュニティで注目されている。
    • 既存手法では,技術ドキュメントの階層構造が無視され,ノイズの多い検索結果となる。
    • 技術ドキュメントの階層構造を活用し,論理エラーを修正することで推論精度向上を目指す。
    • 提案手法GraphSkillは,ドキュメント階層構造を上位から下位へ辿ることで,ノイズを削減し,高品質なコード生成を実現した。
    • 自己デバッグコーディングエージェントにより,自動生成された小規模テストケースを用いてコードを反復的に改良した。
    • 新たなデータセット{\dataset}を用いて評価を行い,既存手法と比較して高いタスク精度と低い推論コストを達成した。

    Link: https://arxiv.org/abs/2603.06620

  • 報酬への攻撃:プロセス報酬モデルの堅牢性とハッキング可能性の分析 [cs.LG]目的:プロセス報酬モデルの脆弱性とハッキング可能性の評価
    • 大規模言語モデルの推論パイプラインにおいて,プロセス報酬モデルの重要性が増している。
    • 既存のプロセス報酬モデルは,敵対的最適化に対して脆弱である可能性がある。
    • プロセス報酬モデルの脆弱性を定量化し,その堅牢性を評価すること。
    • 最先端のプロセス報酬モデルは,表面的なスタイルの変更には強いが,論理的な誤りの検出には一貫性がないことが明らかになった。
    • 勾配ベースの攻撃により,無効な軌跡に対する報酬が上昇し,脆弱な報酬地形が存在することが示された。
    • AIME問題で訓練されたポリシーは高いプロセス報酬を獲得する一方で,正答率は低く,報酬獲得の多くはスタイルの捷径によるものであることが判明した。

    Link: https://arxiv.org/abs/2603.06621

  • ARIMAからAttentionへ:時間的深層学習による電力負荷予測 [cs.LG, cs.AI]目的:電力負荷の短期予測手法の比較と性能評価
    • 現代の電力システムにおいて,効率的な管理・最適化・安定化は不可欠である。
    • 従来の統計モデルでは,複雑な電力消費の時系列パターンを捉えきれない場合がある。
    • Attentionメカニズムを用いたTransformerモデルの有効性を検証し,予測精度向上を目指す。
    • Transformerモデルは,他のモデルと比較して最も低いMAPE(3.8%)を達成した。
    • 自己注意機構により,電力消費データの複雑な時間的パターンをより正確に捉えることができた。
    • 本研究は,電力負荷予測におけるAttentionベースのアーキテクチャの可能性を示唆する。

    Link: https://arxiv.org/abs/2603.06622

  • 生成モデルにおけるGRPOの進展:サーベイ [cs.LG]目的:生成モデルに対するGRPOの発展と応用
    • 生成モデルは画像,動画,音声など多様なタスクで性能を向上させている。
    • 生成モデルの出力と人間の好みやタスク目標との整合性が課題である。
    • Flow-GRPOとその発展的研究を整理し,生成モデルの汎用的なアライメント手法を示す。
    • Flow-GRPOは,生成システムの安定した強化学習アライメントを可能にする。
    • 報酬信号設計,多様性維持,報酬ハッキング対策など,Flow-GRPOの改良が進んでいる。
    • Flow-GRPOは,テキスト・画像生成,動画生成,3Dモデリングなど様々な生成パラダイムに適用されている。

    Link: https://arxiv.org/abs/2603.06623

  • 探索空間理論:前提知識を考慮した位置情報ベース推薦の形式的基礎 [cs.IR, cs.AI, cs.DS, cs.LG]目的:位置情報ベース推薦における前提知識依存性の形式的表現
    • 位置情報推薦は高度化しているが,場所の体験には前提知識が不可欠である。
    • 場所間の前提知識の依存関係を形式的に表現する枠組みが存在しない。
    • 前提知識を考慮した推薦の形式的保証を提供する理論を構築すること。
    • 探索空間理論(EST)は,位置情報推薦に知識空間理論を応用した形式的枠組みである。
    • ESTにおいて,有効なユーザー探索状態は有限分配格子を形成し,段階的な学習空間を提供する。
    • ESTに基づいた探索空間推薦システム(ESRS)は,形式的な妥当性保証を提供する。

    Link: https://arxiv.org/abs/2603.06624

  • 集合学習に基づくグラフニューラルネットワークによる舗装欠損データ補完 [cs.LG, cs.AI]目的:舗装欠損データの補完
    • 道路ネットワークの状態把握や維持管理計画の策定において,舗装の状態データは不可欠である。
    • センサーエラーや不定期な点検により,データが欠損することが多く,情報の損失や評価の偏りを招く。
    • 隣接区間の特徴や条件間の依存関係を活用し,欠損値を正確に補完する手法を開発すること。
    • 提案手法では,集合学習に基づくグラフ畳み込みネットワークを用いることで,隣接区間の条件の依存関係を捉える。
    • テキサス州運輸省のデータを用いた実験結果から,提案モデルが欠損データの補完において有望な結果を示した。
    • 既存手法と比較して,より正確な補完が可能となり,舗装管理の精度向上に貢献する。

    Link: https://arxiv.org/abs/2603.06625

  • Grouter:表現からのルーティング分離によるMoE学習の高速化 [cs.LG, cs.AI]目的:MoE学習の高速化と性能向上
    • 大規模言語モデルの性能向上の鍵としてMoEアーキテクチャが注目されている。
    • 従来のMoE学習では,ルーティングポリシーの探索と重みの学習が同時に行われ,収束が遅い。
    • 学習済みのMoEモデルから構造を蒸留し,固定されたルーターとして利用することで,学習を加速する。
    • Grouterは,ルーティング構造の最適化と重み更新を分離することで,モデルの収束速度と品質を大幅に向上させる。
    • 実験により,Grouterが優れた性能と効率を示すことが実証され,事前学習データの利用効率が4.28倍に向上した。
    • また,スループットは最大33.5%向上し,MoE学習における事前的なルーティングの重要性が示された。

    Link: https://arxiv.org/abs/2603.06626

  • T-REX:食料品バスケット推薦のためのTransformerベースのカテゴリ系列生成 [cs.IR, cs.LG]目的:食料品バスケット推薦のためのカテゴリ系列生成
    • オンライン食料品市場は成長しており,効果的な推薦システムの需要が高い。
    • 従来の推薦手法では,食料品の反復購入やバスケット内の複雑なアイテム関係に対応できない。
    • バスケット生成における情報漏洩の問題を解決し,より正確な予測を目指す。
    • 提案手法T-REXは,Transformerアーキテクチャを用いてカテゴリレベルの提案を生成することで,短期的なバスケット依存性と長期的なユーザー嗜好を学習する。
    • 動的な系列分割を用いた効率的なサンプリング戦略,時間パターンを考慮した適応的な位置エンコーディング,次元削減と推薦品質維持を両立したカテゴリレベルモデリングがT-REXの革新的な点である。
    • オフラインデータおよびオンラインA/Bテストの結果,既存システムと比較して有意な改善が確認された。

    Link: https://arxiv.org/abs/2603.06631

  • 時間的取引ネットワークにおける解釈可能な不正検知のためのリーケージセーフなグラフ特徴量 [cs.LG, cs.CR]目的:時間的取引ネットワークにおける不正エンティティの分類のための,時間的制約とリーケージの無い(因果的)グラフ特徴量抽出プロトコル
    • 不正検知は金融システムの健全性を保つ上で不可欠であり,その精度向上は喫緊の課題である。
    • 既存手法は取引属性に偏りがちで,ネットワーク構造から得られる情報を十分に活用できていない。
    • 取引ネットワークの構造的特徴を抽出し,不正検知における解釈性と精度を向上させることを目指す。
    • 厳密な時間的分割を用いたランダムフォレスト分類器は,将来のテスト期間において高い識別能力を示した(ROC-AUCは約0.85,Average Precisionは約0.54)。
    • 取引属性が主要な予測信号である一方,グラフ由来の特徴量は補完的な解釈可能性を提供し,調査ワークフローにおけるリスクの把握に貢献する。
    • キャリブレーションされたモデルは,トリアージにおける優先順位付けをより正確に行えることが示された。

    Link: https://arxiv.org/abs/2603.06632

  • 機械学習における新たな不確定性原理 [cs.LG]目的:機械学習における多項式解の探索
    • 機械学習は,科学的課題解決の強力な手段として重要性が増している。
    • Heaviside関数とシグモイド関数の不安定性により,最適解への到達が困難である。
    • 急峻な最小値を持つほど,峡谷は滑らかになるという不確定性原理を解明する。
    • 機械学習における問題は,物理学の現象として理解できる。
    • 従来の不確定性原理を,特異なシグモイド関数群にも拡張する。
    • ランダムな初期値から探索する手法の有効性を理論的に説明する。

    Link: https://arxiv.org/abs/2603.06634

  • 小規模言語モデルにおけるグラフ特性推論:表現と推論戦略の影響 [cs.LG]目的:小規模言語モデルにおけるグラフ理論的特性推論の条件
    • 自然言語処理の進展により,構造化された推論を要する問題への応用範囲が拡大している。
    • 小規模言語モデルが,テキスト形式で提示された関係構造の形式的な特性をどの程度推論できるか不明である。
    • 小規模モデルにおけるグラフベースのドメインへの適用可能性を評価し,構造化推論の成功・失敗条件を特定すること。
    • 入力表現が構造的性能に大きく影響し,近傍構造を維持する表現が推定の安定性と順序の一貫性を向上させる。
    • マルチブランチ推論が,設定全体で最も信頼性の高い集計的な改善をもたらすことがわかった。
    • グラフ特性推論は,表現の組織化と推論設計に大きく依存し,モデル規模だけでなく,関係情報のエンコード方法も重要である。

    Link: https://arxiv.org/abs/2603.06635

  • SmartBench:異常なデバイス状態と行動的コンテキストにおけるLLMの評価 [cs.LG, cs.AI]目的:スマートホームにおけるLLMの異常検知能力の評価
    • スマートホーム技術は生活の質を向上させる可能性を秘めているため,その発展が重要である。
    • 既存のLLMは指示理解に優れる一方,スマートホームの異常状態の検出能力は不十分である。
    • 本研究は,LLMがスマートホームの異常を適切に検知・対応するための基盤となるデータセットを提供する。
    • SmartBenchは,通常のデバイス状態と異常な状態,及びそれらの遷移コンテキストを含む初のLLM向けスマートホームデータセットである。
    • 13種類のLLMを評価した結果,最先端モデルの多くは十分な異常検知性能を示さなかった。
    • 例えば,Claude-Sonnet-4.5はコンテキスト非依存の異常カテゴリで66.1%の精度,コンテキスト依存の異常では57.8%の精度にとどまった。

    Link: https://arxiv.org/abs/2603.06636

  • HEARTS:ヘルスケア時系列データにおけるLLMの推論能力ベンチマーク [cs.LG, cs.AI]目的:ヘルスケア時系列データに対するLLMの階層的推論能力の評価
    • 医療分野における時系列データは,患者の状態を理解し,適切な治療を行う上で不可欠である。
    • 既存のベンチマークはヘルスケア時系列データの多様性と複雑さを十分に捉えられていない。
    • LLMが多様なヘルスケア時系列データを扱うための推論能力の限界を明らかにする。
    • LLMは,専門的なモデルと比較して大幅に性能が劣り,その性能は一般的な推論スコアと弱い相関関係にある。
    • LLMは,単純なヒューリスティックに頼りがちであり,多段階の時間的推論に苦戦する。
    • 時間的複雑性が高まるにつれて性能が低下し,モデルファミリー内で同様の失敗モードが見られることから,スケールアップだけでは不十分である。

    Link: https://arxiv.org/abs/2603.06638

  • RECAP:貯留槽ダイナミクスに対する自己組織化読み出しとしての局所Hebbianプロトタイプ学習 [cs.NE, cs.AI, cs.CV, cs.LG, q-bio.NC]目的:貯留槽ダイナミクスと自己組織化Hebbianプロトタイプ読み出しとの結合による,ロバストな画像分類戦略
    • 脳のロバストな知覚は高次元な集団活動と局所的な可塑性メカニズムに依る。計算神経科学の発展に不可欠。
    • 現代の画像認識システムは誤差逆伝播に依存し,局所計算や可塑性との整合性が低い。生物学的妥当性に課題が残る。
    • 局所的な学習則に基づき,ロバストな画像認識を実現する新たな学習戦略を確立することを目指す。
    • RECAPは,訓練されていない貯留槽ダイナミクスと自己組織化Hebbianプロトタイプ読み出しを組み合わせることで,ロバストな画像分類を可能にする。
    • 同手法は誤差逆伝播を回避し,オンラインプロトタイプ更新と自然に適合する。
    • MNIST-Cにおける実験により,RECAPが破損した学習サンプルにさらされなくても,多様な破損に対してロバストであることが示された。

    Link: https://arxiv.org/abs/2603.06639

  • 剪定に基づく拡散モデルにおける概念の再活性化リスクの解明 [cs.CV, cs.LG]目的:拡散モデルにおける剪定ベースのアンラーニングにおける概念再活性化リスク
    • 拡散モデルは強力な生成能力を持つが,学習データに含まれる不要な概念の除去が課題である。
    • 剪定ベースのアンラーニングは効率的だが,情報の漏洩リスクが十分に検証されていない。
    • 剪定された重みの位置情報が悪用され,削除された概念が再活性化される問題を解決する。
    • 剪定ベースのアンラーニングは,必ずしも安全ではなく,削除された概念をデータや再学習なしに再活性化可能であることが示された。
    • 拡散モデルにおける重要な概念関連重みを特定することで,剪定方法にかかわらず元の概念を効果的に復元できる。
    • 剪定位置を隠蔽し,アンラーニングの有効性を維持する安全な剪定メカニズムの検討が重要である。

    Link: https://arxiv.org/abs/2603.06640

  • SR-TTT:驚き度を考慮した残差テスト時学習 [cs.CY, cs.LG, cs.AI, cs.CL]目的:テスト時学習における正確な想起課題での性能低下の解決
    • 言語モデルの文脈長拡張は,より複雑なタスクの遂行や,長文の理解を可能にする上で重要である。
    • 従来のテスト時学習は,情報ボトルネックにより,驚き度の高いトークンを急速に忘却するという課題があった。
    • 驚き度の高いトークンを正確に保持することで,テスト時学習における想起性能の向上を目指す。
    • SR-TTTは,損失ゲートされたスパースメモリアーキテクチャを導入することで,正確な想起課題における性能低下を解消した。
    • 低エントロピーな背景文脈に対してはO(1)のメモリを維持しつつ,重要なトークンに対してのみexact attentionを利用する。
    • 実装,スクリプト,事前学習済み重みは公開されており,再現性を担保している。

    Link: https://arxiv.org/abs/2603.06642

  • 安全な骨癒合段階の解釈のための信頼度を考慮した連合学習 [cs.LG, cs.AI]目的:骨癒合段階の解釈における,信頼度を考慮した連合学習フレームワーク
    • 遠隔医療の発展に伴い,分散した医療データの活用が重要視されている。
    • 分散環境では,悪意のある参加者や信頼性の低いデータによる影響が懸念される。
    • 信頼性の低い参加者を排除し,モデルの整合性を保ちつつ,包括性を維持すること。
    • 提案手法は,適応的な信頼度スケーリングとフィルタリングメカニズムを導入することで,学習の安定性と予測性能を向上させる。
    • 信頼度の低いクライアントを除外し,信頼性が改善されれば再参加させることで,モデルの完全性を担保する。
    • 本研究は,連合医療センシングにおける適応的な信頼メカニズムの実現可能性を示す。

    Link: https://arxiv.org/abs/2603.06646

  • LLMとSLMを用いたIBNオーケストレーションの性能比較 [cs.NI, cs.AI]目的:LLMとSLMを用いた5G/6G IBNオーケストレーションの性能評価
    • 5G/6Gネットワークの進化に伴い,完全自律的なネットワーク管理が求められており,IBNがその中心技術となる。
    • IBNオーケストレーションの自動化には,高性能かつ効率的なモデルが必要である。
    • LLMとSLMの特性を比較し,IBNオーケストレーションにおける最適なモデルの選択に貢献する。
    • LLMとSLMは,翻訳精度において同程度の性能を示すことが確認された。
    • SLMは,IBNライフサイクルの完了速度を20%向上させることが示された。
    • 本研究は,IBNオーケストレーションにおけるSLMの有効性を示唆する。

    Link: https://arxiv.org/abs/2603.06647

  • VR環境における連続的な一人称視点からの物体状態変化の推論 [cs.CV, cs.AI]目的:VR環境における物体状態変化に関する質問応答タスクのベンチマーク
    • VR技術の発展に伴い,自然言語によるシーン変化の問い合わせが重要になっている。
    • 背景での状態変化など,直接的な操作がない変化の検出が困難である。
    • 既存のベンチマークが存在せず,状態変化の推論能力評価が難しい。
    • ObjChangeVR-Datasetを導入し,物体状態変化の質問応答タスクを評価するベンチマークを新たに提供した。
    • 視点と時間に基づいた検索と,複数視点からの情報を統合する推論フレームワークObjChangeVRを提案した。
    • ObjChangeVRは,既存手法と比較して,複数のMLLMにおいて有意な性能向上を示した。

    Link: https://arxiv.org/abs/2603.06648

  • HURRI-GAN:生成敵対ネットワークを用いた観測点外へのハリケーンバイアス補正の新しいアプローチ [cs.LG, cs.AI]目的:ハリケーンによる高解像度予測の迅速化と精度向上
    • 沿岸地域はハリケーンによる甚大な被害を受けるため,正確な予測が不可欠である。
    • 高解像度物理モデルは計算時間が長く,リアルタイムな緊急対応の要求を満たせない場合がある。
    • 生成敵対ネットワークを用いて物理モデルのバイアスを補正し,計算時間を削減する。
    • HURRI-GANは,観測点外のバイアス補正を生成する能力を示した。
    • 生成されたバイアス補正を適用することで,予測精度が向上した。
    • 低いRMSE値は,HURRI-GANの正確なデータ生成能力を示唆している。

    Link: https://arxiv.org/abs/2603.06649

  • 測地勾配降下法:目的関数誘導多様体上の汎用的かつ学習率不要な最適化アルゴリズム [cs.LG, cs.AI]目的:目的関数誘導多様体上の最適化
    • 機械学習における最適化はモデルの性能に直結し,その効率性は重要である。
    • ユークリッド勾配降下法は多様体の幾何構造を捉えきれず,更新軌道が多様体から外れるリスクがある。
    • 複雑な多様体上でも効率的に最適化を行う手法を確立すること。
    • 本研究で提案する測地勾配降下法(GGD)は,n次元球を用いて多様体の局所的な形状を近似する。
    • GGDは学習率を必要とせず,実験結果ではBurgersデータセットで最良のMSEを35.79%~48.76%削減した。
    • MNISTデータセットではクロスエントロピー損失を3.14%~11.59%削減し,Adamアルゴリズムを上回る性能を示した。

    Link: https://arxiv.org/abs/2603.06651

  • PaLMR:マルチモーダルプロセスアラインメントによる忠実な視覚的推論へ [cs.CV, cs.AI]目的:視覚的根拠に基づいた忠実な思考過程の構築
    • 大規模言語モデルの推論能力向上は重要であり,特にマルチモーダルLLMにおける視覚的推論は課題である。
    • 既存手法は最終的な正答率を重視する傾向があり,視覚的証拠の誤認識といったプロセスレベルの誤りが見過ごされがちである。
    • PaLMRは,最終結果だけでなく推論過程のアラインメントを実現し,視覚的に忠実な思考過程を促すことを目指す。
    • PaLMRは,プロセスを意識したデータ層と最適化層の2つの要素から構成され,思考過程と視覚的事実のアラインメントを強化する。
    • Qwen2.5-VL-7Bを用いた実験により,PaLMRは推論におけるハルシネーションを大幅に削減し,視覚的推論の忠実性を向上させることが示された。
    • HallusionBenchで最先端の結果を達成し,MMMU,MathVista,MathVerseにおいても高い性能を維持した。

    Link: https://arxiv.org/abs/2603.06652

  • IoTボットネット検出におけるグラフ構築手法が性能に与える影響 [cs.NI, cs.NI, cs.CR, cs.LG]目的:IoTボットネット検出におけるグラフ構築手法の性能への影響評価
    • IoTデバイスの普及に伴い,IoTボットネット攻撃が増加しており,高度な検出手法が求められている。
    • グラフニューラルネットワーク(GNN)は有効だが,グラフ構造データへの変換方法が性能に大きく影響する。
    • 様々なグラフ構築手法を比較し,最適な手法を特定することで,IoTボットネット検出の精度向上を目指す。
    • Gabrielグラフが97.56%の最高検出精度を達成し,他の手法と比較して優れた性能を示した。
    • 共有最近傍法(SNN)は78.56%と最低の検出精度となり,グラフ構築手法の選択が重要であることが示唆された。
    • 変分オートエンコーダ(VAE)による次元削減が,高次元データの計算負荷軽減に有効であることが確認された。

    Link: https://arxiv.org/abs/2603.06654

  • マルチスペクトル航空画像における雑草検出のためのパラメータ効率的な畳み込みアプローチ [cs.CV, cs.AI]目的:マルチスペクトル航空画像における雑草セグメンテーション
    • 農業分野における生産性向上には,雑草の効率的な検出が不可欠である。
    • 既存のセグメンテーションモデルは,計算コストが高く,メモリ要件が大きいという課題がある。
    • 計算効率とメモリ消費量を削減しつつ,高精度な雑草検出を実現すること。
    • 提案手法FCBNetは,WeedBananaCODおよびWeedMapデータセットにおいて,mIoUで85%を超える性能を示した。
    • FCBNetは,U-Net,DeepLabV3+などの既存モデルと比較して,計算効率とメモリ効率において優れている。
    • バックボーンを固定化することで,学習パラメータ数を90%以上削減し,メモリ要件を大幅に軽減した。

    Link: https://arxiv.org/abs/2603.06655

  • GameVerse:視覚言語モデルはビデオベースの反省から学習できるか [cs.CV, cs.AI]目的:ビデオベースの反省学習の可能性
    • ゲームプレイは視覚情報と行動の相互作用であり,AIの学習において重要な示唆を与える。
    • 既存の視覚言語モデルは,単一の試行評価に偏り,反省と改善のループを欠いている。
    • ビデオベースの反省を通して,視覚言語モデルの学習能力と戦略改善を評価する。
    • GameVerseというゲームベンチマークを用いて,視覚言語モデルの反省学習能力を評価した。
    • 失敗例と専門家のチュートリアルを組み合わせることで,モデルの性能が向上することが示された。
    • この学習方法は,強化学習と教師ありファインチューニングを組み合わせたものに類似している。

    Link: https://arxiv.org/abs/2603.06656

  • 科学リテラシー:生成AIによる科学的知識と推論の教育,学習,評価における一貫性の促進 [cs.CY, cs.AI]目的:科学リテラシー向上の可能性
    • 科学技術の発展は,市民が科学的知識を理解し,合理的に判断する能力を必要とする。
    • 既存の教育現場では,科学リテラシーを効果的に育成することが困難である。
    • 生成AIを活用し,教育,学習,評価に一貫性をもたらすことで,科学リテラシーを向上させる。
    • 生成AIは,科学的知識と推論の教育,学習,評価において,一貫性と効果を高める可能性を秘めている。
    • AIツールと能力を活用することで,科学リテラシー育成のための具体的なアーキテクチャ設計が可能となる。
    • 科学リテラシーの事例研究を通して,他の学習分野への応用可能性も示唆される。

    Link: https://arxiv.org/abs/2603.06659

  • 現代AIのための近似最近傍探索:射影拡張グラフアプローチ [cs.IR, cs.DB, cs.LG]目的:現代AIアプリケーションにおける近似最近傍探索の性能向上
    • AI技術の発展に伴い,大規模データからの高速な類似検索が不可欠となっている。
    • 既存手法は検索効率に偏重し,AIワークロードの多様な要求に対応できていない。
    • 高い検索効率,高速なインデックス作成,低メモリ消費などを両立する手法を開発する。
    • 提案手法PAGは,射影技術をグラフインデックスに統合することで,距離計算量を削減する。
    • 6つの現代的なデータセットでの実験により,PAGはHNSWと比較して最大5倍高速なQPS-再現率性能を示す。
    • PAGは,高次元データや様々な検索サイズに対しても堅牢であり,オンライン挿入をサポートする。

    Link: https://arxiv.org/abs/2603.06660

  • EnsAug:データ拡張駆動型アンサンブルによる人体モーション系列解析 [cs.CV, cs.LG]目的:人体モーション系列解析のためのロバストな深層学習モデル訓練
    • 人体モーション解析は,医療,スポーツ,エンターテイメントなど広範な分野で重要性が増している。
    • アノテーション付きデータセットが不足しやすく,汎用的なデータ拡張では不自然なモーションが生じやすい。
    • 多様な拡張手法から得られる学習信号を最大限活用し,より高精度なモデルを構築することを目指す。
    • 提案手法EnsAugは,各モデルを異なる単一の幾何学的変換で拡張したデータセットで訓練するアンサンブル学習を採用する。
    • 実験の結果,EnsAugは,単一のモデルを組み合わせた拡張データセットで訓練する標準的な方法よりも性能が大幅に向上した。
    • 手話認識および人体活動認識のベンチマークで最先端の精度を達成し,高いモジュール性と効率性を示した。

    Link: https://arxiv.org/abs/2603.06661