arXiv雑要約

AI - 2026/03/24 公開

制約付きオンライン凸最適化における$O(\sqrt{T})$累積制約違反障壁の打破と$O(\sqrt{T})$静的後悔の達成 [cs.LG, stat.ML]目的：制約付きオンライン凸最適化問題における静的後悔と累積制約違反の最小化
- 機械学習や意思決定において，制約条件を満たしつつ最適な行動を選択する重要性が高まっている。
- 従来のアルゴリズムでは，静的後悔を$O(\sqrt{T})$に抑える場合，累積制約違反が$\Omega(\sqrt{T})$になることが予想されていた。
- 本研究は，この従来の予想を覆し，より優れた累積制約違反性能を達成することを目指す。
- 提案アルゴリズムは，$d=2$の場合に，静的後悔$O(\sqrt{T})$と累積制約違反$O(T^{1/3})$を同時に達成する。
- これにより，従来のアルゴリズムが抱える累積制約違反の障壁を打破することが示された。
Link: https://arxiv.org/abs/2603.20671
PAVE：検索拡張LLMのための前提を意識した検証と編集 [eess.SY, cs.SY, cs.CL, cs.AI]目的：検索拡張LLMにおける根拠に基づいた質問応答の検証と編集
- 知識集約型タスクにおいて，LLMの性能向上に検索拡張が有効である。
- 検索された情報と矛盾する回答を生成してしまうLLMが存在する。
- 根拠となる前提の抽出と，それに基づく修正により，LLMの整合性を高める。
- PAVEは，検索された文脈を質問条件付きの原子的事実へと分解する。
- 生成された回答と抽出された前提との整合性を評価し，低スコアの場合に修正を行う。
- 実験の結果，PAVEは既存手法と比較して，最大32.7ポイントの精度向上を達成した。
Link: https://arxiv.org/abs/2603.20673
階層型ポリアモリーシステムのAI駆動マルチエージェントシミュレーション：社会的な生殖効率を最適化するための計算フレームワーク [cs.AI, econ.GN, q-fin.EC]目的：階層型ポリアモリーシステム(SPS)のモデリングと評価
- 少子化は現代社会における深刻な問題であり，特に東アジア諸国で顕著である。
- 従来の結婚制度は崩壊の危機にあり，女性の充足感と経済的安定，男性の性的欲求を満たせない。
- SPSを通じて，女性の出産への負担と男性の性的不満を軽減し，社会全体の厚生を改善すること。
- 本研究は，エージェントベースモデリング，マルチエージェント強化学習，大規模言語モデルを活用した計算フレームワークを提案する。
- シミュレーション結果は，SPSが女性の母性ペナルティと男性の性的欲求不満に対処できる可能性を示唆している。
- SPSは，富の分散メカニズムを提供し，社会全体の厚生を向上させる可能性がある。
Link: https://arxiv.org/abs/2603.20678
中心性に基づく効率的なエコー状態ネットワークのプルーニング [cs.LG, cs.AI, math.OC]目的：エコー状態ネットワークの効率化
- 時系列予測において，非線形なモデリング手法として広く利用されている。
- ランダムに初期化された貯留槽には冗長なノードが多く，計算コストが高い。
- 中心性指標を用いて重要度の低いノードを削除し，効率を改善すること。
- 提案手法により，貯留槽のサイズを大幅に削減できることが示された。
- 予測精度を維持し，場合によっては向上させることも可能である。
- 貯留槽の本質的なダイナミクスを保持しつつ，計算効率を高める。
Link: https://arxiv.org/abs/2603.20684
SNAP：音声ディープフェイク検出における話者情報の中和 [cs.SD, cs.AI]目的：音声ディープフェイク検出における話者情報の影響軽減
- 近年の音声合成技術の進展により，リアルな偽装音声が容易に生成可能となり，社会問題化が懸念される。
- 既存のディープフェイク検出器は，話者固有の情報に依存しやすく，未知の話者に対して汎化性能が低い。
- 話者情報を除去することで，検出器が合成アーティファクトに焦点を当て，汎化性能を高める。
- 提案手法SNAPは，話者空間を推定し，直交投影によって話者依存成分を抑制する。
- SNAPを用いることで，検出器が話者情報ではなく，アーティファクトに着目するようになり，性能が向上する。
- 実験により，SNAPが最先端の性能を達成することが示された。
Link: https://arxiv.org/abs/2603.20686
スパイクニューラルネットワークにおけるニューロンの自己適応が表現能力とロバスト性を向上させる [cs.LG]目的：スパイクニューラルネットワークにおける表現能力とロバスト性の向上
- 低消費電力でリアルタイム処理が可能なエッジコンピューティングの実現が期待されている。
- 従来のLIFニューロンは情報容量が制限され，ノイズに弱く，精度とロバスト性が低下する。
- 生物学的カリウムチャネルに着想を得たKvLIFモデルにより，これらの問題を解決することを目指す。
- 提案するKvLIFモデルは，ニューロンの興奮性とリセットダイナミクスを適応的に調整する。
- 静止画像およびニューロモルフィックデータセットにおいて，既存のLIFモデルと比較して，分類精度とロバスト性の向上が確認された。
- 生物学的妥当性と計算効率を両立し，低消費電力ニューロモルフィック展開に適したニューロンモデルを提供する。
Link: https://arxiv.org/abs/2603.20687
実験的アプローチにおける人工知能：グロースハッキング，リーンスタートアップ，デザイン思考，アジャイル [cs.CY, cs.AI]目的：人工知能の実験的アプローチへの統合
- 市場の変化への適応が重要視される中，組織のパフォーマンス向上への貢献が期待されている。
- 人工知能の導入は進むものの，その効果を最大化するための具体的な手法が課題となっている。
- グロースハッキング等の手法と人工知能を組み合わせることで，効率性と効果を高めることを目指す。
- 本研究により，人工知能がデータ分析，リアルタイムフィードバック，自動化等のツールを提供し，これらの手法を強化することが示された。
- 例えば，成長ハッキングにおける意思決定の改善，リーンスタートアップにおける反復サイクルの効率化，デザイン思考における創造性の向上に貢献する。
- 一方で，スキル不足，倫理的懸念，データガバナンス等の課題も明らかになり，戦略的な導入と厳格なデータ管理の必要性が示唆された。
Link: https://arxiv.org/abs/2603.20688
SWE-Next：エージェントのためのスケーラブルな現実世界のソフトウェアエンジニアリングタスク [cs.SE, cs.AI]目的：ソフトウェアエージェント学習のためのスケーラブルなソフトウェアエンジニアリングタスクおよび軌跡収集
- ソフトウェア開発の自動化は，生産性向上や開発コスト削減に貢献し，重要な研究分野である。
- 実世界のソフトウェアリポジトリからタスクを抽出する際，有効な事例が少なく，環境構築にコストがかかるという課題がある。
- 実リポジトリから高品質なタスクを効率的に収集し，学習データセットを構築することを目的とする。
- SWE-Nextは，テスト改善と回帰回避を厳密に検証することで，高品質な自己検証可能なタスクインスタンスを生成する。
- リポジトリの環境プロファイルを再利用することで，環境構築コストを削減し，データ収集の効率化を実現した。
- 実験結果から，SWE-Nextは，より高品質な教師あり学習データを提供し，少ない学習データで高いpass@1を達成することが示された。
Link: https://arxiv.org/abs/2603.20691
衛星から路上へ：生成ビジョンモデルによる災害後の視点合成 [cs.CL, cs.CY, cs.CV, cs.AI]目的：災害後の状況把握のための衛星画像からの路上視点画像合成
- 災害発生直後の迅速な状況把握は不可欠であり，衛星観測は被害範囲の推定に広く利用される。
- 衛星画像は地上レベルの視点に欠け，具体的な構造的損傷や影響の特性評価が難しいという課題がある。
- 衛星画像から災害後の路上視点を合成することで，地上データの入手困難な状況下での情報ギャップを埋める。
- 提案手法では，Vision-Language Model (VLM) ガイド型と，損傷に敏感な Mixture-of-Experts (MoE) 法という2つの生成戦略を導入した。
- 実験の結果，拡散ベースの手法は高い知覚的リアリズムを達成するものの，構造の詳細を幻覚することがあるという現実性・忠実度のトレードオフが明らかになった。
- 標準的なControlNetは最高の意味的精度(0.71)を示したが，VLM強化型とMoEモデルは質感の妥当性には優れるものの，意味的明確性に苦戦した。
Link: https://arxiv.org/abs/2603.20697
数値パラメータと構造パラメータの分離：深層強化学習による大規模TSPに対する適応的遺伝的アルゴリズムの経験的研究 [cs.NE, cs.AI]目的：遺伝的アルゴリズムにおけるパラメータ制御の役割解明
- 進化計算は多様な問題解決に有効だが，パラメータ設定が重要となる。
- パラメータの重要度が均一ではなく，スケーラビリティのボトルネックとなり得る。
- 数値パラメータと構造パラメータを分離し，それぞれの役割を明確化する。
- 深層強化学習を用いた適応的パラメータ制御により，静的ベースラインを上回る性能が確認された。
- 特に大規模問題(rl5915)において，最適解とのギャップを約45%削減することに成功した。
- 構造パラメータの動的な再構成が，局所最適解からの脱出と停滞の防止に決定的な役割を果たすことが示唆された。
Link: https://arxiv.org/abs/2603.20702
NDT：非微分Transformerとその感情分析への応用 [cs.IR, cs.CL, cs.LG]目的：テキストにおける人間による感情理解
- 人間と機械の有意義な対話には，テキスト内の感情理解が不可欠である。
- 感情の正確な把握は依然として困難であり，更なる研究の動機となっている。
- 異なる注意機構を専門化させ，より複雑な文脈関係を捉えることを目指す。
- 提案手法NDTは，感情分析において複数のデータセットで競争力のある性能を示した。
- NDTは，Transformerの注意機構に加算戦略を用いることで，多様な情報を統合する。
- 本研究は，ノイズ除去よりも概念多重化の観点から注意機構の設計を探求する。
Link: https://arxiv.org/abs/2603.20704
RoboECC：VLAモデルのマルチ要素を考慮したエッジクラウド協調展開 [cs.DC, cs.LG, cs.RO]目的：VLAモデルのエッジクラウド協調展開に関するフレームワーク
- 具現知能におけるVLAモデルの重要性が高まる一方，推論コストが課題となっている。
- 既存のエッジクラウド協調フレームワークは，VLAモデルの多様な構造への適応が困難である。
- ネットワーク帯域の変化に強く，VLAモデルの性能を最適化する展開手法を提案する。
- RoboECCは，モデルとハードウェアを考慮した分割戦略により，最適な展開ポイントを特定する。
- ネットワーク状況の変化に応じて展開を調整する手法により，性能を維持する。
- 実験により，RoboECCが最大3.28倍の高速化を達成し，オーバーヘッドは2.55倍～2.62倍に抑えられたことが示された。
Link: https://arxiv.org/abs/2603.20711
分子特性予測のためのマルチRF融合とマルチGNNブレンディング [cs.IR, cs.SI, cs.AI, cs.LG]目的：分子特性予測における性能向上
- 創薬や材料科学において，分子の特性を正確に予測することは重要である。
- 既存の分子特性予測モデルは，汎化性能や安定性に課題が残されている。
- ランダムフォレストとGNNを組み合わせることで，予測精度と安定性を向上させる。
- 提案手法Multi-RF Fusionは，ogbg-molhivデータセットにおいて，ROC-AUC 0.8476±0.0002を達成し，OGBリーダーボードで1位となった。
- Random Forestのパラメータ調整（max_features=0.20）とGNN予測のシード平均化が，性能向上に貢献している。
- 外部データや事前学習を使用せずに，高い予測性能と安定性を実現した。
Link: https://arxiv.org/abs/2603.20724
深度認識型クロスアテンションを用いた音響ボアホール画像の弱学習マルチモーダルセグメンテーション [cs.CV, cs.AI, physics.geo-ph]目的：音響ボアホール画像のマルチモーダルセグメンテーション手法
- 地質探査において，ボアホール画像は地層構造の重要な情報源である。
- 専門家による詳細なアノテーション作成はコストが高く，大規模な解析が困難である。
- 弱学習によるセグメンテーションを通じて，アノテーションコストを削減し，効率的な解析を実現する。
- 閾値処理による仮ラベルを学習モデルで洗練することで，従来手法よりもロバストなセグメンテーションが可能となった。
- 深度認識型クロスアテンションが，画像情報と掘削ログ情報を効果的に融合し，セグメンテーション精度を大幅に向上させた。
- 自信度に基づいた融合戦略（CG-DCA）が，既存手法と比較して一貫して高い性能を示した。
Link: https://arxiv.org/abs/2603.20729
推論のトポロジーが重要である：複雑な推論タスクのための思考のネットワーク [cs.CL, cs.AI]目的：複雑な推論タスクにおける思考のネットワークによる推論能力の向上
- 大規模言語モデルの推論能力向上は，様々な分野での応用を可能にする重要な課題である。
- 従来のChain-of-ThoughtやTree-of-Thoughtでは，複雑な推論における中間結果の統合や仮説の再検討が困難である。
- 思考のネットワークは，より柔軟な推論構造を提供し，複雑な推論問題を解決することを目指す。
- 思考のネットワークは，複数の段階を踏む推論において，従来のChain-of-ThoughtやTree-of-Thoughtを上回る性能を示す。
- 特に，大規模言語モデルが生成したヒューリスティクスを用いて推論グラフを探索することで，論理的な推論において優れた結果が得られた。
- 評価方法の違いが，各手法のランキングに影響を与えることが示され，特にオープンエンドな質問応答において，思考のネットワークの性能が過小評価される傾向が見られた。
Link: https://arxiv.org/abs/2603.20730
局所的プライバシーを持つグラフニューラルネットワークに対する敵対的攻撃 [cs.LG, cs.CR]目的：局所的プライバシー保護されたグラフニューラルネットワークに対する敵対的攻撃の影響
- グラフ構造データ解析において，グラフニューラルネットワークは強力なツールであるため，その重要性は高い。
- 機密情報を扱う場合，敵対的攻撃に対する脆弱性が懸念される。プライバシー保護と堅牢性の両立が課題である。
- 局所的プライバシー保護が敵対的攻撃に対してどのように影響するかを調査し，防御策の方向性を示す。
- 局所的プライバシー保護は，敵対的攻撃に対して必ずしも堅牢性をもたらさないことが示唆された。
- 既存の攻撃手法は，局所的プライバシー保護されたグラフニューラルネットワークにも有効であることが確認された。
- プライバシー保護とセキュリティのバランスを考慮した，新たなグラフ学習アーキテクチャの必要性が示された。
Link: https://arxiv.org/abs/2603.20746
ラショモン集合エージェントによる社会知覚における認識的不確実性のモデル化 [cs.AI]目的：生徒の主観的な社会知覚の相違と進化
- 社会認知は，人間関係の理解に不可欠であり，教育や組織行動など様々な分野で重要である。
- 社会情報は不完全であり，個人の知覚の正確性にばらつきがあるため，社会構造の認識に誤りが生じやすい。
- 生徒ごとの主観的な視点に基づき，社会的不確実性がどのように伝播するかを明らかにすること。
- 本フレームワークは，グローバルな情報を必要とせずに，現実世界の教育現場で見られる集団ダイナミクスを再現することに成功した。
- 生徒は，アクセス可能な局所的な手がかりから同じグループ構造に対する異なる見解を持つ可能性があり，ピアコミュニケーションを通じて徐々に変化する。
- 各生徒に個別化された主観的なグラフを割り当てることで，認識の不確実性を考慮し，現実的な社会知覚のシミュレーションを可能にした。
Link: https://arxiv.org/abs/2603.20750
動的パッチサンプリングとブロックスキップによるメモリ効率的な拡散Transformerのファインチューニング [cs.CV, cs.AI]目的：拡散Transformerのメモリ効率的なファインチューニング手法
- 近年の画像生成技術の進歩は，高品質なコンテンツ作成を可能にする。
- 拡散Transformerのファインチューニングには，膨大な計算資源とメモリが必要となる。
- リソース制約下での実用的な展開を可能にするため，メモリ使用量の削減を目指す。
- 提案手法DiT-BlockSkipは，動的パッチサンプリングとブロックスキップを統合することでメモリ使用量を削減する。
- 動的パッチサンプリングは，拡散ステップに応じてパッチサイズを調整し，高解像度と詳細情報の両立を実現する。
- ブロックスキップ機構は，重要なTransformerブロックを選択的にファインチューニングし，メモリ効率を高める。
Link: https://arxiv.org/abs/2603.20755
構造的バイアス下におけるアップリフトモデリングの評価：指標の安定性とモデルのロバスト性に関する洞察 [cs.LG]目的：アップリフトモデリングにおける構造的バイアスの影響評価
- パーソナライズドマーケティングの成果を最大化するため，顧客行動の変化を正確に予測する必要がある。
- 現実世界のデータには，選択バイアスや交絡因子などのバイアスが含まれており，モデルの精度と信頼性を損なう。
- 構造的バイアスがモデルの評価に与える影響を明らかにし，よりロバストなモデルと指標を開発する。
- アップリフトターゲティングと予測は異なる目的であり，一方での成功が他方を保証するものではないことが示された。
- 多くのモデルは様々なバイアス下で不安定な性能を示す一方，TARNetは比較的ロバストであることが確認された。
- 指標の安定性はATE（平均処置効果）との数学的な整合性と関連しており，ATE近似指標がより安定したモデルランキングを提供する。
Link: https://arxiv.org/abs/2603.20775
OmniPatch：セマンティックセグメンテーションにおけるViT-CNNクロスアーキテクチャ転送のための汎用敵対パッチ [cs.LG, cs.AI, cs.CV]目的：セマンティックセグメンテーションにおける汎用的な敵対パッチ
- 自動運転の安全性確保には不可欠であり，高精度なセグメンテーションが求められる。
- 未知のモデルに対する攻撃に対する脆弱性が残されており，実用上の課題となっている。
- ViTとCNNを含む多様なアーキテクチャに適用可能な汎用パッチの開発。
- OmniPatchは，画像全体への摂動や単一アーキテクチャへの最適化という既存手法の限界を克服する。
- 本研究では，ターゲットモデルのパラメータにアクセスすることなく，ViTとCNNの両アーキテクチャ間で汎化する敵対パッチを学習するフレームワークを提案する。
- 提案手法は，多様な画像とアーキテクチャに対する高い転送性と実用性を示す。
Link: https://arxiv.org/abs/2603.20777
マルコフ境界学習のためのニューラル自己回帰フロー [cs.LG]目的：マルコフ境界の発見
- 応答変数の予測性能を最大化するため，最小限の変数の集合であるマルコフ境界の特定は重要である。
- 従来の制約ベースの手法は，局所的な因果構造を評価する点で進歩しているが，信頼性の理論的な保証が不足している。
- 情報理論からの条件エントロピーをスコアリング基準として統合し，効率的なマルコフ境界の発見を目指す。
- 複雑な依存関係を捉えるために，マスクされた自己回帰ネットワークを設計した。
- 多項式時間で実行される並列化可能な貪欲探索戦略を提案し，解析的な証拠によって支持されている。
- 学習されたマルコフ境界でグラフを初期化することで，因果探索の収束が加速されることを示した。
Link: https://arxiv.org/abs/2603.20791
LLMのRLVR学習は，一般的なQAにおける思考能力を向上させない：評価手法と簡単な解決策 [cs.CL, cs.SI, cs.CL, cs.LG]目的：LLMにおける一般的なQAタスクに対する思考能力の評価と改善
- 大規模言語モデル(LLM)の思考能力向上は，より高度な問題解決や意思決定に不可欠である。
- 検証可能なタスクでのRLVR学習効果は高いものの，一般的なQAへの転移が確認されていなかった。
- QAタスクにおいて，質の高い思考プロセスを育成し，RLVR学習の効果を改善すること。
- 検証可能なタスクと異なり，一般的なQAタスクにおけるRLVR学習の効果は限定的であることが判明した。
- QAタスクでは，質の高い思考プロセスを経ることなく高報酬が得られるショートカットが存在することが示唆された。
- 思考プロセスのみを初期学習させるSTART手法が，QAベンチマークにおいて思考の質と最終回答の両方を改善することが示された。
Link: https://arxiv.org/abs/2603.20799
大規模近傍探索と反復ニューラル制約ヒューリスティクスの融合 [cs.LG]目的：制約充足問題に対するニューラルヒューリスティクスの性能向上
- 制約充足問題は，組み合わせ最適化の基礎であり，現実世界の様々な問題を解決する上で重要である。
- 従来の制約充足手法は，問題の規模が大きくなると計算コストが指数関数的に増加する。
- ニューラルネットワークを活用し，効率的かつ効果的な制約充足手法を開発することが求められている。
- 本研究では，反復ニューラルヒューリスティクスと大規模近傍探索（LNS）の関連性を明らかにし，既存のニューラル制約充足手法ConsFormerをLNSに組み込んだ。
- 実験の結果，ConsFormerをLNSに適用することで，従来の性能を大幅に向上させ，古典的な手法や他のニューラルベースラインとの競争力を高めることが確認された。
- 確率的な破壊演算子の方が貪欲な演算子よりも優れており，貪欲な修復演算子の方がサンプリングベースの修復演算子よりも高品質な解を見つけやすいという一貫した設計パターンが観察された。
Link: https://arxiv.org/abs/2603.20801
マルチモーダル大規模言語モデルにおける視覚表現劣化に対する予測的正則化 [cs.CL, cs.CV, cs.LG]目的：マルチモーダル大規模言語モデルにおける視覚表現劣化の抑制
- 近年，画像とテキストを扱うモデルが発展しているが，その性能向上のためには視覚能力の維持が重要である。
- 大規模言語モデルのテキスト生成能力向上を目指す過程で，視覚能力が犠牲になっている可能性がある。
- 内部表現の視覚的特性を維持し，より堅牢なマルチモーダル理解を実現することを目指す。
- マルチモーダル大規模言語モデルの中間層における視覚表現の劣化が，グローバル機能とパッチ構造の両面で確認された。
- この劣化は，テキスト生成を最適化する過程で視覚的な忠実度が損なわれることが原因であると考えられる。
- 提案手法である予測的正則化は，視覚表現の劣化を効果的に緩和し，視覚言語タスクの性能向上に貢献する。
Link: https://arxiv.org/abs/2603.20808
GMPilot：FDA cGMP 遵守のための専門AIエージェント [cs.AI]目的：医薬品製造におけるFDA cGMP遵守支援
- 医薬品業界における品質管理は，消費者の安全と製品の信頼性に不可欠である。
- コンプライアンスコストが高く，知識体系が断片的で，対応が遅れる課題がある。
- AIを活用し，品質管理の意思決定を改善し，効率的なコンプライアンスを実現する。
- GMPilotは，規制と過去の検査観察から構築された知識ベースを活用する。
- RAGとReActフレームワークにより，リアルタイムかつトレーサブルな意思決定支援を提供する。
- シミュレーションにおいて，GMPilotは品質管理担当者の対応と専門性を向上させる可能性を示した。
Link: https://arxiv.org/abs/2603.20815
PlanaReLoc：3D平面素子を用いた領域ベース構造マッチングによるカメラ再定位 [cs.CV, cs.AI]目的：3D平面素子と構造ベースのマッチングによるカメラ再定位手法
- ロボットや拡張現実などの分野で，環境中の自己位置推定は重要な課題である。
- 従来の構造ベースの手法は，点群の対応付けに依存しており，計算コストが高いという課題がある。
- 平面素子を用いることで，軽量かつロバストなカメラ再定位を実現し，計算コストを削減することを目指す。
- PlanaReLocは，クエリ画像と3D平面地図間の平面素子を，学習された埋め込み空間内で関連付けることで，効率的な再定位を実現した。
- 提案手法は，ScanNetおよび12Scenesデータセットにおいて，高精度な再定位性能と，テクスチャや事前知識への依存性の低さを実証した。
- 平面素子は，信頼性の高いクロスモーダル構造対応を実現し，効果的なカメラ再定位を可能にすることが示された。
Link: https://arxiv.org/abs/2603.20818
有界ノイズ下における双線形システム同定の$\widetilde{O}(1/\epsilon)$サンプル複雑度達成 [cs.LG, cs.SY, eess.SY, stat.ML]目的：有界対称対数凹型外乱下における離散時間双線形システムの有限サンプル集合メンバーシップ同定
- システム同定は，制御システムの設計や予測において不可欠であり，その精度向上が重要である。
- 双線形システムは線形システムに比べ解析が難しく，同定問題の解決が遅れている。
- 本研究は，双線形システム同定におけるサンプル複雑度を$\widetilde{O}(1/\epsilon)$に抑える手法を提示し，不確実性定量化の精度向上を目指す。
- 提案手法は，既存の線形システムに対する結果や，より強いノイズ仮定下での結果と比較して，より困難な双線形設定に対応する。
- 軌道に依存する回帰子と，多項式平均二乗状態成長を持つ限界安定力学を許容する条件下で，実現可能パラメータ集合の直径がサンプル複雑度$\widetilde{O}(1/\epsilon)$で縮小することを証明した。
- シミュレーションにより理論の妥当性が確認され，提案推定器の不確実性定量化における利点が示された。
Link: https://arxiv.org/abs/2603.20819
Compass：動的な適応のための複合AIワークフローの最適化 [cs.DC, cs.AI, cs.LG]目的：複合AIワークフローにおける構成の動的切り替えによる性能最適化
- AI技術の発展に伴い，複数のAIモデルを連携させる複合AIの重要性が増している。
- 従来の複合AIシステムは固定インフラに依存し，変動する負荷に対応できない場合がある。
- 本研究は，インフラ容量に応じて構成を切り替えることで，精度と遅延のトレードオフを最適化する。
- Compassは，オフラインでの最適化とオンラインでの適応により，動的な構成切り替えを実現する。
- 構成探索アルゴリズムCOMPASS-Vは，網羅的な探索と比較して評価回数を大幅に削減しつつ，100%の再現率を達成した。
- ランタイム適応により，変動する負荷パターン下で90-98%のSLA遵守率を達成し，静的な高精度ベースラインを71.6%上回った。
Link: https://arxiv.org/abs/2603.20821
生物配列のクロス粒度表現：ESMとBiGCARPからの考察 [cs.LG]目的：生物配列モデルにおけるクロス粒度知識の統合
- 生命科学分野における基盤モデルの重要性が高まっており，高性能な配列解析が求められている。
- 既存のモデルは，配列の階層的な粒度構造を十分に活用できていないという課題がある。
- 異なる粒度の表現を組み合わせることで，生物学的知識の活用と予測性能の向上が期待される。
- BiGCARPとESMのクロスモデル埋め込み初期化は，単純な方法では性能向上につながらないことが示された。
- より深い層の埋め込みは，モデルが学習した知識をより文脈的かつ忠実に表現していることが明らかになった。
- 異なる粒度の表現が相補的な生物学的知識を符号化し，組み合わせることで中間レベルの予測タスクで性能が向上することが確認された。
Link: https://arxiv.org/abs/2603.20825
文脈的推薦のための，対数後悔と頑健性を持つ単純な射影不要アルゴリズム [cs.LG]目的：文脈的推薦における効率的なアルゴリズムの開発
- 個々のユーザーの状況に合わせて最適な行動を推薦する技術であり，実用的な応用が期待される。
- 既存手法は計算コストが高く，特に大規模データへの適用が困難であるという課題がある。
- 既存手法の計算コストを削減し，より効率的な文脈的推薦アルゴリズムを提案すること。
- 本研究では，既存のONS法と同等の後悔保証を持つ，より効率的なアルゴリズムを提案した。
- 提案手法は，ONS法でボトルネックとなるマハラノビス射影を不要とし，計算量を削減する。
- さらに，提案手法は不完全な行動フィードバックに対しても頑健性を持つ。
Link: https://arxiv.org/abs/2603.20826
属性グラフクラスタリング：統一的なフレームワークと産業界の視点 [cs.LG]目的：属性グラフクラスタリングにおけるアルゴリズムの分類と評価基準の改善
- グラフ構造とノード属性を同時に活用し，データ内のグループ構造を明らかにする重要な技術。
- 学術的な評価基準が現実の産業利用に適していないため，性能向上が限定的である。
- 産業界の制約を考慮し，実用的な評価基準と技術開発の方向性を示す。
- エンコード，クラスタリング，最適化という3つのモジュールから構成される統一的なフレームワークを提案。
- 既存の評価プロトコルが，小規模で同質的なデータに偏っている点を指摘し，多角的な評価基準を提唱。
- 大規模データ，異種性，ノイズなどの産業界特有の課題に対応するための実践的なエンジニアリング戦略を提示。
Link: https://arxiv.org/abs/2603.20829
マルチエージェント知識エコシステムにおけるガバナンスを考慮したベクトルサブスクリプション [cs.DC, cs.AI]目的：マルチエージェント知識エコシステムにおける，ガバナンスを考慮した知識監視メカニズム
- AIエージェントの普及に伴い，リアルタイムな知識監視の重要性が増している。
- 既存のシステムでは，データ取り扱いポリシーが異なるエージェント間で，権限外の知識へのアクセスが発生する可能性がある。
- 本研究は，法的規制に基づいた多次元ポリシー制約を組み込むことで，この問題を解決することを目指す。
- 提案手法は，意味的類似性照合とポリシー制約を組み合わせ，規制遵守を可能にする。
- AIngram環境での評価により，すべてのポリシー制約を正しく適用しつつ，許可されたコンテンツを配信できることが確認された。
- 5つのポリシー次元の消去実験から，単一の次元だけでは完全なコンプライアンスは達成できないことが示された。
Link: https://arxiv.org/abs/2603.20833
MERIT：多ドメイン効率的なRAW画像変換 [cs.CV, cs.AI]目的：多ドメインRAW画像変換の統一的フレームワーク
- 多様なカメラで撮影されたRAW画像は，コンピュータビジョンの応用において重要な役割を果たす。
- 異なるカメラ間ではスペクトル特性やノイズが大きく異なり，直接利用が困難である。
- 多数のカメラに対応可能な，単一モデルによるRAW画像変換を実現する。
- 提案手法MERITは，既存手法と比較して画像品質が大幅に向上した（5.56dB改善）。
- MERITは，学習に必要な反復回数を大幅に削減し，スケーラビリティに優れている（80%削減）。
- 新たに多ドメインRAW画像変換用のデータセットMDRAWを構築し，標準的な評価を可能にした。
Link: https://arxiv.org/abs/2603.20836
Dodgersort：不確実性を考慮したVLM誘導の人間協調型ペアワイズランキング [eess.SY, cs.SY, cs.CV, cs.AI, cs.HC, cs.LG]目的：ペアワイズランキングの信頼性向上とアノテーションコスト削減
- データラベリングの質がAI性能に大きく影響するため，高信頼なラベリング手法が重要である。
- 従来の分類ラベリングでは，評価者間信頼性が低い場合がある。
- 人間とAIが協力し，効率的かつ高信頼なランキングを構築することを目指す。
- Dodgersortは，CLIPベースの階層的事前順序付け，ニューラルランキングヘッド，確率的アンサンブルを利用し，アノテーションコストを削減する。
- 医療画像，歴史的年代測定，美学のランキングタスクにおいて，11～16％のアノテーション削減と評価者間信頼性の向上を達成した。
- FG-NETにおける実験では，ベースラインよりも5～20倍多くのランキング情報を得て，精度と効率のトレードオフを最適化した。
Link: https://arxiv.org/abs/2603.20839
因果推論のための知識を活用した事前学習モデル [cs.LG]目的：因果関係の発見
- データから因果関係を明らかにすることは，科学的発見や意思決定において重要である。
- 既存手法は，強い仮定が必要，または介入データや事前知識に依存し，実用性に課題がある。
- 弱い事前知識のみで，実用的な因果推論を可能にすることを目指す。
- 本研究では，弱い事前知識を統合した知識を活用型事前学習モデルを提案する。
- 二重ソースエンコーダー・デコーダー構造とカリキュラム学習戦略により，様々な事前知識強度に適応する。
- 実験の結果，既存手法と比較して一貫した性能向上と高いロバスト性，実用性が確認された。
Link: https://arxiv.org/abs/2603.20842
HiCI：長文コンテキスト注意のための階層的構築・統合 [cs.CL, cs.AI, cs.LG]目的：長文コンテキスト注意における情報構造化の改善
- 大規模言語モデルの性能はコンテキスト長に依存し，より長いコンテキストを扱えるモデルが求められている。
- 既存手法では，長文コンテキストにおける局所情報とグローバル情報の構造化が不十分である。
- 階層的な注意機構を導入し，明示的な情報構造化により長文コンテキストモデリングの性能向上を目指す。
- HiCIはLLaMA-2のパラメータ効率的な適応により，コンテキスト長を4Kから100K/64Kトークンに拡張することに成功した。
- 言語モデリング，検索，指示追従のベンチマークにおいて，既存の強固なベースラインを上回る一貫した改善が見られた。
- 特に，トピック検索においては商用モデルに匹敵し，コード理解においてはGPT-3.5-Turbo-16Kを上回る性能を示した。
Link: https://arxiv.org/abs/2603.20843
ChatGPTは現代中国詩を本当に理解できるか [cs.CL, cs.AI]目的：現代中国詩に対するChatGPTの理解度評価
- AI技術は文学研究に新たな可能性をもたらし，詩の理解や創作を支援しうる。
- 大規模言語モデルの詩理解は実験結果の分析にとどまり，根本的な理解力評価が不足していた。
- ChatGPTの現代中国詩理解の現状を詳細に評価し，その限界を明らかにすること。
- ChatGPTは詩人の意図と73%以上のケースで一致し，ある程度の理解力を持つことが示された。
- しかし，詩情の把握といった側面では理解度が不十分であり，改善の余地がある。
- 本研究で提案する評価フレームワークは，大規模言語モデルの文学理解度評価に有効である。
Link: https://arxiv.org/abs/2603.20851
カザフ語用小規模言語モデルSozKZのゼロからの効率的な学習 [cs.CL, cs.AI]目的：カザフ語テキストを用いた小規模言語モデルの学習
- カザフ語は2200万人以上が話す言語であり，言語技術の発展が重要である。
- 既存の多言語モデルは低リソース言語への配分が少なく，カザフ語の形態素構造に適していない。
- 言語固有のトークナイザーを用いた小規模モデルの学習により，低リソース言語技術の実現を目指す。
- SozKZは，90億トークンのカザフ語テキストを用いて，50M～600MパラメータのLlamaアーキテクチャ言語モデルをゼロから学習した。
- 600Mモデルは，カザフ文化に関するQAで30.3%の精度を達成し，3.2BパラメータのLlama-3.2-1Bに匹敵する性能を示した。
- また，SIB-200のトピック分類では，評価した2Bパラメータまでの多言語モデルを上回る25.5%の精度を達成した。
Link: https://arxiv.org/abs/2603.20854
不均衡な白血球分類のための小規模分類器のアンサンブル [cs.CV, cs.LG]目的：白血病診断のための白血球分類自動化
- 白血球分類は，熟練した病理医による細胞検査の代替となりうる。時間と資源を節約できる。
- 希少な細胞タイプの分類アルゴリズムは，染色や患者間の異質性により頑健性に課題がある。
- 白血球のデータセットを拡張し，小規模な事前学習済みモデルのアンサンブルによる分類性能向上を目指す。
- 提案手法は，SwinV2-Tiny，DinoBloom-Small，ConvNeXT-V2-Tinyモデルの軽量アンサンブルで高い性能を達成した。
- 層化3分割交差検証を行い，9モデルのlogit averagingにより分類精度を向上させた。
- モデルは，好中球系の幼若な細胞やリンパ球の区別に課題が残る。今後の改善が期待される。
Link: https://arxiv.org/abs/2603.20856
ニューラルネットワークの可塑性回復による高速転移学習 [cs.CV, cs.AI]目的：転移学習におけるニューラルネットワークの可塑性回復戦略
- 画像認識分野では，ImageNetで事前学習済みのモデルを利用した転移学習が広く行われている。
- 事前学習済みの重みは飽和しやすく，勾配が小さくなることで，下流タスクへの適応が阻害される場合がある。
- 本研究では，転移学習前に重みを再初期化することで，ニューラルネットワークの可塑性を回復し，学習効率を向上させる。
- 提案手法は，CNNとViTの両方において，画像分類ベンチマークにおいて高いテスト精度と高速な収束を実現した。
- 本手法は計算コストの増加が少なく，既存の転移学習パイプラインに容易に組み込むことができる。
- 事前学習済みの重みが飽和することで失われるニューラルネットワークの可塑性問題に対処した。
Link: https://arxiv.org/abs/2603.20860
意味セクション：閉塞された表現空間のためのアトラスネイティブな特徴オントロジー [cs.LG, cs.AI, cs.CL, cs.NE]目的：閉塞された表現空間における特徴表現のオントロジーの改善
- AIの解釈可能性研究は，モデルの挙動を理解する上で不可欠であり，その進展が求められている。
- 既存の研究では，特徴をグローバルな表現として捉えがちで，局所的な意味の多様性を捉えきれない場合がある。
- 文脈に応じて変化する局所的な意味を捉え，より正確な特徴オントロジーを構築することを試みる。
- 本研究では，文脈アトラス上で定義された「意味セクション」という新しい特徴表現を提案した。
- 意味セクションは，ツリー構造に基づく伝播可能性とサイクル整合性によって，グローバルな特徴表現への拡張が可能であることが示された。
- 実験結果から，既存のベクトル類似度では意味同一性が再現されない一方，意味セクションに基づく同一性回復はほぼ完璧であることが確認された。
Link: https://arxiv.org/abs/2603.20867
ReLaMix：遅延を考慮した残差混合による，遅延に強い金融時系列予測 [cs.AI, cs.LG]目的：高頻度金融市場における遅延や部分的な古い観測データの影響を軽減する予測手法
- 金融市場予測は，経済状況の把握やリスク管理に不可欠であり，その精度向上は重要な課題である。
- 実際の金融市場ではデータ取得・伝送の遅延が発生し，予測精度を低下させる要因となっている。
- 遅延データによる予測精度の低下を抑制し，より現実的な状況下での予測性能を高める。
- 提案手法ReLaMixは，TimeMixerの軽量な拡張であり，遅延観測下でのロバストな信号回復を実現する。
- ReLaMixは，不要な古い値を抑制しつつ，残差混合による市場ダイナミクスの保存により，高い予測精度を達成した。
- PAXGUSDTおよびBTCUSDTデータセットにおける実験により，ReLaMixが既存手法を上回り，汎化性能も確認された。
Link: https://arxiv.org/abs/2603.20869
戦略的参加下における性能保証付きインセンティブを意識した連合平均化 [cs.LG, math.OC]目的：戦略的なデータ参加を捉えたナッシュ均衡探索更新規則によるインセンティブを意識した連合平均化手法
- 分散環境での機械学習は，データプライバシー保護と効率的な学習を両立する重要な手法である。
- 参加エージェントが自身の利益を優先し，戦略的にデータ提供を調整する可能性がある。
- エージェントの継続的な参加を促し，安定した学習を可能にするフレームワークを開発すること。
- 提案手法は，凸および非凸な目的関数設定下で性能保証が確認された。
- MNISTおよびCIFAR-10データセットを用いた数値実験で，良好なモデル性能と安定したデータ参加戦略が示された。
- エージェントは競争力のあるグローバルモデル性能を達成しながら，安定したデータ参加戦略に収束する。
Link: https://arxiv.org/abs/2603.20873
RubricRAG：ルーブリック生成のためのドメイン知識検索による解釈可能かつ信頼性の高いLLM評価に向けて [cs.IR, cs.AI, cs.CL, cs.LG]目的：LLM評価におけるルーブリック生成を通じた解釈性と信頼性の向上
- LLMの性能評価は重要であり，その自動化が求められている。しかし，従来の評価方法は不透明である。
- 既存の評価指標は単一のスコアのみを出力するため，改善点や具体的な課題の特定が困難である。
- この研究では，ドメイン知識検索を利用したルーブリック生成により，より解釈可能で効果的なLLM評価を目指す。
- 本研究で提案するRubricRAGは，関連クエリからドメイン知識を検索することで，人間が作成したルーブリックとの類似性を高める。
- RubricRAGは，生成されたルーブリックを用いて，より正確に優れた応答を識別することが可能となる。
- 実験結果から，汎用LLMでは人間が作成したルーブリックとのずれが課題となる一方，RubricRAGによって改善が確認された。
Link: https://arxiv.org/abs/2603.20882
上肢外骨格による受動運動中に生じる運動イメージの開始と終了の特性評価 [cs.CL, cs.RO, cs.AI, cs.HC]目的：上肢外骨格による受動運動中の運動イメージの開始と終了の特性
- ロボット工学と脳機械インターフェースは，運動リハビリテーションに有望視されている。
- リハビリ用外骨格による受動運動下で，非侵襲的な脳機械インターフェースで運動意図を高精度に検出することが課題。
- 機能運動の開始と終了を自然に制御できるよう，運動イメージの開始と終了を特定すること。
- 脳波信号を用いたデコーダにより，安静状態から運動イメージ開始，および運動イメージ維持から終了への移行を検出した。
- オフライン評価で，開始検出の平均正答率は60.7%，終了検出の平均正答率は66.6%であり，運動イメージの開始と終了を識別できることが示された。
- 擬似オンライン評価でも同様の性能が得られ，将来的なオンライン外骨格制御の可能性を示唆している。
Link: https://arxiv.org/abs/2603.20885
LLMルーター：プリフィルだけで十分 [cs.MM, cs.CL, cs.LG]目的：LLMのモデル選択による性能向上
- LLMは急速に進化しており，様々なタスクに応用可能である。
- 個々のLLMの得意分野が異なるため，最適なモデル選択が課題である。
- 内部プリフィル活性化を利用し，最適なモデルペアリングを実現する。
- 提案手法は，既存のルーターが依存する脆弱な意味情報に頼らず，内部活性化を用いる。
- SharedTrunkNetは，最高の単独モデルとOracleの間の精度ギャップの最大45.58%を捉える。
- また，コストが最も高いモデルと比較して74.31%のコスト削減を達成する。
Link: https://arxiv.org/abs/2603.20895
ビルキホッフ多面体を超えて：スペクトル球制約ハイパーコネクション [cs.LG, cs.AI]目的：ハイパーコネクションの制約条件に関する研究
- 深層学習モデルの表現力を高める上で，残差接続の拡張が重要である。
- 既存手法では，制約条件が強すぎて表現力に限界がある，または計算コストが高いという問題がある。
- スペクトル球制約を用いることで，より柔軟で効率的なハイパーコネクションを実現し，モデルの性能向上を目指す。
- 本研究では，残差接続の特性を損なわずに，より多様な特徴量の相互作用を可能にする新しい制約条件を提案した。
- 提案手法は，不安定なSinkhorn反復やパラメータ化のオーバーヘッドを解消し，訓練の安定性を維持する。
- スペクトル球制約は，既存の制約条件よりも表現力が高く，非退化的な残差行列を学習できることが示された。
Link: https://arxiv.org/abs/2603.20896
AIデータセンターによるデータ熱島効果：温暖化世界への影響の定量化 [cs.CY, cs.AI, cs.AR]目的：AIデータセンター周辺の気温上昇
- AIサービス利用の増加に伴い，データセンターの重要性が増している。
- データセンターの消費電力増加が環境に与える影響は不明確であった。
- データセンター稼働が周辺地域に及ぼす熱影響を定量的に評価する。
- AIデータセンター稼働開始後，周辺地域の地表面温度が平均2℃上昇することが確認された。
- この気温上昇は「データ熱島効果」と呼べる局所的な気候変動を引き起こす。
- 3億4000万人以上がこの気温上昇の影響を受ける可能性がある。
Link: https://arxiv.org/abs/2603.20897
オンライン継続学習のための自然勾配降下法 [cs.LG, cs.AI, cs.CV]目的：画像分類におけるオンライン継続学習の性能向上
- AIの応用範囲拡大に伴い，継続的に学習する能力が重要視されている。
- 既存手法では，新たな学習によって過去の知識が失われる「破滅的忘却」が課題。
- オンライン環境下での学習速度を改善し，破滅的忘却を抑制すること。
- 自然勾配降下法とKFACを組み合わせた手法が，既存のオンライン継続学習手法の性能を大幅に向上。
- Split CIFAR-100，CORE50，Split miniImageNetなどのデータセットで有効性が確認された。
- 特に，既存の継続学習手法と組み合わせることで，より高い効果が得られた。
Link: https://arxiv.org/abs/2603.20898
言語モデルにおける捷径思考の緩和：勾配を意識した訓練アプローチ [cs.CL, cs.AI]目的：言語モデルの捷径思考の緩和
- 言語モデルの発展は，多様な自然言語処理タスクの自動化を可能にする重要な研究分野である。
- 言語モデルは，表面的なパターンや答えの記憶に頼る捷径思考に陥りやすく，真の論理的推論が困難である。
- 捷径思考を検出し，訓練データを調整することで，言語モデルの汎化性能とロバスト性を向上させる。
- 提案手法SARTは，ShortcutScoreと勾配手術により，捷径を促進するサンプルを検出し，緩和する。
- 制御された推論ベンチマークにおいて，SARTは最も強力なベースラインと比較して，精度が+16.5%，ロバスト性が+40.2%向上した。
- 分布シフト下での汎化性能が大幅に改善された。
Link: https://arxiv.org/abs/2603.20899