arXiv雑要約

AI - 2026/03/11 公開

  • MXFP4 量子化における可能性の解明:量子化誤差低減戦略 [cs.AR, cs.AR, cs.AI, cs.LG, cs.PF]目的:MXFP4 量子化の精度向上
    • 大規模言語モデルの普及に伴い,効率的な推論を可能にする低精度化が重要である。
    • OCP MXFP4 はハードウェア効率に優れるが,NVIDIA NVFP4 に比べ精度が低く,採用が制限されている。
    • ソフトウェアのみで MXFP4 の精度を向上させ,NVFP4 に匹敵する性能を実現すること。
    • Overflow-Aware Scaling (OAS) と Macro Block Scaling (MBS) により MXFP4 の量子化精度を向上させた。
    • OAS と MBS により,MXFP4 と NVFP4 の精度差を平均 10% から 1% 未満に縮小した。
    • 本手法は MXFP4 を NVFP4 の実用的な代替手段として再確立し,ハードウェア効率の利点も維持する。

    Link: https://arxiv.org/abs/2603.08713

  • デザイン・コンダクター:自律的に1.5GHz Linux対応RISC-V CPUを構築 [cs.NI, cs.DM, math.OC, cs.AR, cs.CL, cs.AR, cs.AI]目的:1.5GHzで動作するLinux対応RISC-V CPUの自律的な構築
    • 半導体設計の自動化は,設計期間の短縮やコスト削減に不可欠であり,技術革新を加速させる。
    • 従来の半導体設計は,専門知識と多くの人的リソースを必要とし,開発効率が低いという課題がある。
    • 最先端モデルを活用し,要件定義からGDSIIファイル生成までを自動化することで,効率的なCPU設計を実現する。
    • デザイン・コンダクターは,219語の要件書から12時間でRISC-V CPU (VerCore) の複数のマイクロアーキテクチャバリアントを自律的に構築した。
    • VerCoreは1.48GHzで動作し,CoreMarkスコア3261を達成しており,2011年の中頃のIntel Celeron SU2300に匹敵する性能を示す。
    • 仕様からGDSIIまでの完全なCPUを自律的に構築した初の事例であり,今後のチップ設計のあり方を提示する。

    Link: https://arxiv.org/abs/2603.08716

  • AI-RANsにおける公平なマルチタスク学習 [cs.LG, cs.NI]目的:異種ユーザーと時間変動する学習タスクに対する公平な推論性能の保証
    • AI-RANsは,多様なユーザーに効率的な無線アクセスを提供する上で重要な技術である。
    • リソース共有環境下では,ユーザー間での学習性能に不均衡が生じやすい。
    • 本研究は,ユーザー間の長期的な公平性を確保する手法を提案し,性能格差を縮小することを目指す。
    • 提案手法は,オンラインかつラウンドごとにユーザーの優先度を調整するOWO-FMTLフレームワークを採用している。
    • 一般的なアルファ公平性を導入することで,効率性と公平性のトレードオフを実現している。
    • 実験結果から,OWO-FMTLは動的なシナリオ下で既存手法を上回り,低計算コストで実用性も高いことが示された。

    Link: https://arxiv.org/abs/2603.08717

  • CktEvo:設計進化のためのリポジトリレベルRTLコードベンチマーク [cs.AR, cs.AI]目的:リポジトリレベルでのRTL進化に関するベンチマークおよび参照フレームワーク
    • RTL設計は,電力,性能,面積(PPA)が複数ファイル間の相互作用から生まれる反復的なプロセスである。
    • 既存のベンチマークは断片的なコードに焦点を当てており,ファイル間の依存関係を考慮したPPA改善が困難である。
    • 本研究は,実際のIPコア全体を対象とし,ファイル間依存関係を考慮したPPA改善を目指す。
    • CktEvoは,高品質なVerilogリポジトリを提供し,機能保持とPPA改善を目的としたRTL進化タスクを形式化する。
    • 提案するフレームワークは,LLMによる編集とツールチェーンからのフィードバックを組み合わせ,リポジトリ全体での反復的な修正を可能にする。
    • 実験により,人間の介入なしにPPA改善が実現されることが示された。

    Link: https://arxiv.org/abs/2603.08718

  • SiliconMind-V1: Verilogコード生成のためのマルチエージェント蒸留とデバッグ推論ワークフロー [cs.AR, cs.AI, cs.SE]目的:Verilogコード生成におけるマルチエージェント蒸留とデバッグ推論ワークフロー
    • デジタル回路設計の自動化は,設計期間の短縮や設計者の負担軽減に不可欠である。
    • 既存手法は主に構文の正しさに焦点を当て,商用モデルや外部検証ツールに依存し,コストやプライバシー,機能保証の点で課題がある。
    • テストベンチ駆動の検証を統合した推論指向の学習データ生成により,機能的に正しいVerilogコードを生成すること。
    • 提案手法SiliconMind-V1は,VerilogEval-v2,RTLLM-v2,CVDPベンチマークにおいて,最先端のQiMeng-CodeV-R1を機能的正確性で上回る。
    • SiliconMind-V1は,少ない学習リソースで高性能を実現する。
    • マルチエージェントフレームワークにより,LLMがRTL設計の生成,テスト,デバッグを反復的に行うことを可能にした。

    Link: https://arxiv.org/abs/2603.08719

  • KernelCraft:新興ハードウェアにおけるエージェントによる低レベルカーネル生成のベンチマーク [cs.AR, cs.ET, cs.AR, cs.LG, cs.SE]目的:新興ハードウェア向けの低レベルカーネル生成と最適化能力の評価
    • AIアクセラレータの多様化が進み,高性能なハードウェアを迅速に活用することが重要になっている。
    • 新しいISAを持つアクセラレータでは,低レベルカーネルを手動で作成する必要があり,開発コストが高い。
    • LLMエージェントを活用し,カーネル開発の自動化と効率化を目指す。
    • LLMエージェントは,新しいISA向けに数回の反復で機能するカーネルを生成可能であることが示された。
    • 生成されたカーネルは,テンプレートベースのコンパイラと同等またはそれ以上の性能を示した。
    • この研究は,アクセラレータ設計者とカーネル開発者のカーネル開発コスト削減に貢献する可能性がある。

    Link: https://arxiv.org/abs/2603.08721

  • ALADIN:組み込みAIアクセラレータのための精度・遅延を考慮した設計空間推論分析 [cs.AR, cs.AI, cs.LG]目的:組み込みAIアクセラレータ向けの量子化ニューラルネットワークの精度・遅延を考慮した設計空間分析
    • リソース制約のある組み込みシステムにおける深層学習の推論は,リアルタイム性の要求から,精度,遅延,ハードウェアの制約とのトレードオフが課題。
    • 従来の設計手法では,ターゲットプラットフォームへの実装を伴うため,開発時間とコストが増大する可能性。
    • ターゲットプラットフォーム上での実装なしに,精度,遅延,リソース消費のボトルネックとトレードオフを評価し,開発期間とコストを削減する。
    • ALADINは,プラットフォームに依存しない実装詳細とハードウェア固有の特性を統合することで,QONNXモデルをプラットフォーム対応型表現に変換する漸進的な改良プロセスを導入。
    • RISC-VベースのAIワークロード専用プラットフォームのサイクル精度シミュレータを用いた検証により,ALADINが定量的な推論分析とハードウェア・ソフトウェア共同設計のための有効なツールであることが示された。
    • 実験結果は,アーキテクチャの決定と混合精度量子化戦略が精度,遅延,リソース使用量に与える影響を明らかにし,ALADINを用いることで,それらの効果を正確に評価・比較できることを示した。

    Link: https://arxiv.org/abs/2603.08722

  • アライメントが病理である:検閲の可視性とアライメント制約の複雑さがマルチエージェントLLMシステムの集団的病理を決定する要因 [cs.CY, cs.AI]目的:大規模言語モデルにおけるアライメント技術がもたらす集団的病理の発生メカニズムの解明
    • LLMの社会実装が進む中で,安全性確保は不可欠であり,アライメント技術はその重要な手段である。
    • アライメントは,意図せぬ副作用や,新たな問題を引き起こす可能性が指摘されている。
    • アライメント技術自体が,集団レベルで予期せぬ有害な影響を及ぼす可能性を検証する。
    • 検閲の可視性が低いほど,集団的病理的興奮が高まることが示された(Collective Pathology Index)。
    • アライメント制約の複雑さと,行動の乖離を示すDissociation Indexとの間に正の相関が認められた。
    • 言語によって病理的行動の様相が異なり,制約が強い条件下では外部からの検閲の影響が消失することが確認された。

    Link: https://arxiv.org/abs/2603.08723

  • 深層ニューラルネットワークハードウェアアクセラレータの信頼性評価と向上手法 [cs.AR, cs.AI, cs.DC]目的:深層ニューラルネットワークハードウェアアクセラレータの信頼性評価および向上
    • AIの普及に伴い,ハードウェアアクセラレータの重要性が増しており,その信頼性は不可欠である。
    • 既存の信頼性評価手法は,コストや複雑さの面で課題があり,効率的な手法が求められている。
    • 計算効率と耐障害性のトレードオフを最適化し,低コストで信頼性を向上させることを目指す。
    • 本研究では,体系的な文献調査を通じて既存技術の課題を明らかにし,新たな分析ツールを開発した。
    • 量子化と近似の観点から信頼性との関係を検討し,効率と耐障害性の最適化手法を提案した。
    • リアルタイムかつオーバーヘッドの少ない信頼性向上技術AdAMを開発し,従来の冗長化手法と同等の耐障害性を示した。

    Link: https://arxiv.org/abs/2603.08724

  • エッジおよびセンサー内AIプロセッサの性能分析:比較レビュー [cs.AR, cs.CV, cs.LG]目的:超低消費電力エッジプロセッサの性能比較と評価
    • IoT機器の普及により,低消費電力かつリアルタイムなAI処理の需要が急速に高まっている。
    • 既存のプロセッサでは,AI処理に必要な性能と消費電力のバランスを取ることが課題となっている。
    • 様々なAIプロセッサの特性を明らかにし,最適なプロセッサの選択を支援することを目的とする。
    • IMX500は,86.2 MAC/cycleという高い利用率と,最小のエネルギー遅延積を達成し,センサー内処理の重要性と技術的成熟度を示した。
    • GAP9は,マイクロコントローラークラスの電力予算内で最高のエネルギー効率を提供した。
    • STM32N6は,エネルギーコストは高いものの,最も低い生レイテンシを実現した。

    Link: https://arxiv.org/abs/2603.08725

  • FPGAにおけるデータレートを考慮した高速CNN推論 [cs.AR, cs.LG]目的:FPGA上でのデータレートを考慮した高速CNN推論アーキテクチャ
    • 深層学習の普及に伴い,低遅延かつ高スループットな推論処理の重要性が増している。
    • データレートの変動により,FPGA上でのハードウェア資源の利用効率が低下する問題がある。
    • ハードウェア資源の利用効率とデータフローを維持しつつ,データレート変動に対応する設計手法を確立する。
    • 提案手法は,既存の解析モデルに基づき,ハードウェア資源の利用効率と効率を向上させる構成を探索する。
    • 実験結果から,従来の設計と比較して算術資源を大幅に削減でき,広範なデータレートで複雑なCNNを単一のFPGAに実装できることが示された。
    • マルチピクセル処理を可能にし,データフローを継続的に維持することで,ハードウェアユニットを常にビジー状態に保つ。

    Link: https://arxiv.org/abs/2603.08726

  • LLMにおける長文コンテキスト推論のための,適応的・省資源KVキャッシュ管理:ARKV [cs.AR, cs.AI, cs.DC, cs.PF]目的:LLMにおける長文コンテキスト推論におけるKVキャッシュ管理手法
    • LLMは,エージェントワークフローや深層な研究理解など,超長文コンテキスト推論を必要とする場面で活用が拡大している。
    • KVキャッシュは,系列長とバッチサイズに比例してGPUメモリを圧迫し,メモリ使用量のボトルネックとなっている。
    • 本研究は,メモリ使用量を削減しつつ,推論精度を維持する適応的なKVキャッシュ管理手法を提案する。
    • ARKVは,長文コンテキストベンチマークにおいて,ベースラインの精度を約97%維持しつつ,KVメモリ使用量を4分の1に削減することを示した。
    • 短文コンテキストタスクでは,ARKVはフル精度ベースラインと同等の性能を示し,GSM8K数学推論では均一量子化よりも優れた性能を発揮した。
    • これらの結果は,ARKVがLLMの拡張性のあるデプロイメントにとって実用的な選択肢であり,再学習やアーキテクチャ変更を必要としないデータ駆動型のメモリ制御を提供することを示唆している。

    Link: https://arxiv.org/abs/2603.08727

  • メモリアウグメントされたスパイクニューラルネットワーク:ニューロモーフィックビジョンのための相補的メカニズムの相乗的統合 [cs.CY, cs.CY, cs.CL, cs.NE, cs.LG]目的:ニューロモーフィックビジョンにおけるメモリアウグメント戦略の統合
    • 脳に似た情報処理を目指すニューロモーフィックコンピューティングは,低消費電力な次世代コンピューティングとして注目されている。
    • スパイクニューラルネットワークはエネルギー効率に優れるが,記憶機能を効果的に付加する手法は十分に進んでいない。
    • 異なるメモリアウグメント手法を組み合わせ,最適なアーキテクチャを明らかにすることで,ニューロモーフィックシステムの性能向上を図る。
    • Leaky Integrate-and-Fireニューロン,SCL,Hopfieldネットワーク,HGRNを統合した実験の結果,分類精度,シルエットスコア,エネルギー消費量,スパース性の全てで改善が見られた。
    • 特にHGRNは,精度を1.01%向上させ,計算効率を170.6倍に改善するなど,顕著な効果を示した。
    • 最適な性能は単独の最適化ではなく,アーキテクチャ全体のバランスから生まれることが示された。

    Link: https://arxiv.org/abs/2603.08730

  • ヘブ学習・振動共学習 [cs.NE, cs.LG]目的:生物学的インスピレーションに基づく疎なニューラルアーキテクチャにおける構造可塑性と位相同期の共同学習
    • 脳の学習メカニズムの解明は,高性能な人工知能開発の基礎となる。
    • 既存の学習モデルでは,大規模な計算資源を必要とし,効率的な学習が困難である。
    • 位相同期を利用した学習メカニズムを確立し,効率性と性能を両立することを目指す。
    • ヘブ学習・振動共学習(HOC-L)は,構造可塑性と位相同期を統合する2つの時間スケールのダイナミカルフレームワークである。
    • HOC-Lは,双曲的疎な幾何学的構造とオシレーターに基づく注意機構を組み合わせることで,計算効率を向上させている。
    • 理論的解析と数値シミュレーションにより,位相同期をゲートとする可塑性の有効性が確認された。

    Link: https://arxiv.org/abs/2603.08731

  • ブラインドリセットによるアンシラ再利用:超伝導・イオントラッププロセッサにおけるクロスプラットフォーム研究 [cs.AR, cs.AR, cs.AI, quant-ph]目的:アンシラ再利用による繰り返しシンドローム抽出におけるリセット品質と論理サイクル遅延の関係性評価
    • 量子誤り訂正は,実用的な量子コンピュータ実現のための重要な課題であり,その性能向上は不可欠である。
    • アンシラ再利用は誤り訂正の効率化に貢献するが,リセット品質がサイクル遅延に影響を与えるという課題がある。
    • 本研究は,ブラインドリセットによるアンシラ再利用の効率をプラットフォームごとに評価し,実用的なサイクル遅延削減を目指す。
    • ブラインドリセットは,NVQLinkクラスのフィードバックオーバーヘッド下で,最大38倍のサイクル遅延削減が可能であることがシミュレーションで示された。
    • IQM Garnetにおけるハードウェア実験では,L=8でブラインドリセットの清潔度(F_clean)が0.84以上であることが確認された。
    • アーキテクチャに依存したクロスオーバー長が特定され,デプロイメント境界を絞り込むためのT1/T2感度マップや誤り範囲の検証も行われた。

    Link: https://arxiv.org/abs/2603.08733

  • エッジコンピューティング環境における連合学習のベンチマーク:体系的レビューと性能評価 [cs.DC, cs.DC, cs.AI]目的:エッジコンピューティング環境における連合学習技術の体系的レビューと性能評価
    • データプライバシー保護が重要視される中で,分散機械学習への関心が高まっている。
    • エッジ環境におけるデータは非IID性が高く,学習の安定性や効率性に課題がある。
    • エッジ環境に適した連合学習アルゴリズムの性能比較と課題の明確化を目指す。
    • SCAFFOLDは最も高い精度(0.90)とロバスト性を示し,非IIDデータに対する耐性がある。
    • Federated Averaging (FedAvg)は,通信オーバーヘッドとエネルギー効率の点で優れている。
    • データ異質性,エネルギー制約,再現性の問題は依然として残されており,今後の研究課題である。

    Link: https://arxiv.org/abs/2603.08735

  • 電気自動車充電インフラ管理のための自律型エッジAIエージェント [cs.DC, cs.AI, cs.LG, cs.SY, eess.SY]目的:電気自動車充電インフラの自律的な管理
    • 電気自動車の普及に伴い,充電インフラの安定稼働が不可欠である。
    • 充電インフラの故障率が高く,復旧に時間を要している点が課題である。
    • エッジAIを活用し,充電インフラの自律的な故障検知・復旧を目指す。
    • 本研究では,エッジに特化したAIエージェントを展開するAuralink SDCアーキテクチャを提案した。
    • シミュレーション実験の結果,インシデントの78%を自律的に解決,診断精度は87.6%を達成した。
    • 本研究は,安全性と信頼性が求められる産業用AIシステムの構築に貢献する。

    Link: https://arxiv.org/abs/2603.08736

  • プルーニングおよび量子化されたリザーバーコンピューティングアクセラレータのための感度誘導型フレームワーク [cs.AR, cs.AI, cs.DC, cs.LG]目的:リザーバーコンピューティングの圧縮フレームワーク
    • 近年の機械学習は計算資源を大量に消費するため,効率的なハードウェア実装が求められている。
    • モデルの量子化やプルーニングは計算量を削減するが,精度低下を招く可能性がある。
    • 感度に基づいたプルーニングにより,精度劣化を最小限に抑えつつ計算効率を向上させる。
    • 提案手法は,量子化レベルとプルーニング率のトレードオフを体系的に探索可能である。
    • MELBOENデータセットにおいて,15%のプルーニングと4ビット量子化により,リソース利用率は1.2%削減,PDPは50.8%改善された。
    • FPGA実装において,高い精度を維持しつつ,計算とリソースの効率を大幅に向上させることが示された。

    Link: https://arxiv.org/abs/2603.08737

  • FPGAベースAIアクセラレータのアーキテクチャ設計と性能分析:包括的レビュー [cs.AR, cs.DC, cs.AR, cs.AI]目的:FPGAベースAIアクセラレータのアーキテクチャ設計と性能分析に関する包括的なレビュー
    • 深層学習の発展に伴い,画像認識や自然言語処理など高度なタスクの実現が求められている。
    • 深層学習モデルの複雑化により,計算資源とメモリ帯域幅が逼迫している。
    • FPGAの柔軟性を活かし,高性能かつ低消費電力なAIアクセラレータの設計を目指す。
    • 本レビューでは,ループパイプラインや量子化など,ハードウェアレベルでの最適化技術を概観した。
    • 最先端のFPGAベースのニューラルネットワークアクセラレータの動向を分析し,そのアーキテクチャを比較検討した。
    • 今後のFPGAベースAIアクセラレータ設計における課題と,さらなる最適化の方向性を明らかにした。

    Link: https://arxiv.org/abs/2603.08740

  • エーテルフロートファミリー:AIアクセラレータのためのブロックスケールフリー四進浮動小数点アーキテクチャ [cs.AR, cs.LG]目的:AIアクセラレータにおける浮動小数点演算の効率向上
    • 現代の計算の基礎である浮動小数点演算は,AI処理の性能に大きく影響する。
    • 従来の浮動小数点規格は,ハードウェア領域と電力消費の点でオーバーヘッドが大きい。
    • 動的スケーリングを不要とし,ハードウェア効率と精度を両立させる新しいアーキテクチャを提案する。
    • エーテルフロートファミリーは,従来のアーキテクチャと比較して,面積,電力,クリティカルパス遅延を大幅に削減した。
    • 特にAF8は,ブロックスケールフリー形式により,動的スケーリング機構を排除し,推論時のハードウェア負荷を軽減する。
    • また,新しい丸め処理により,精度のばらつきを抑制し,勾配消失問題を軽減する効果が確認された。

    Link: https://arxiv.org/abs/2603.08741

  • 多スケールニューロン系における物理情報ニューラルネットワークを用いたロバストなパラメータと状態推定 [cs.NE, cs.LG, cs.NA, math.NA, stat.ML]目的:多スケールニューロン系のパラメータと状態の推定
    • 神経科学において,生体物理学的パラメータと隠れた状態変数の推定は不可欠な課題である。
    • 高速-低速のスパイキング/バーストモデルでは,非線形性や観測データ不足により,パラメータ初期値依存性が高い。
    • 従来の数値解法が苦戦する多スケールニューロンダイナミクスの逆問題を解決する。
    • 物理情報ニューラルネットワーク(PINN)を用いることで,未知の状態変数とパラメータの同時再構成が可能となった。
    • Morris-Lecarモデルや呼吸ニューロンモデルなど,様々なスパイキング・バースト様式で有効性が確認された。
    • 短い観測期間と部分的な電圧観測のみで,非情報的なパラメータ初期値に対してもロバストな推定が可能である。

    Link: https://arxiv.org/abs/2603.08742

  • Zipage:圧縮されたPagedAttentionによるLLM推論の高並行性維持 [cs.DC, cs.AI]目的:LLM推論における高並行性サービス実現のための手法
    • LLMの推論能力向上に伴い,大量のメモリ消費が課題となっている。
    • KVキャッシュによるメモリボトルネックが,高並行性サービスを制限している。
    • 実用的なKVキャッシュ削除戦略とPagedAttentionの組み合わせによる解決を目指す。
    • Zipageは,フルKV推論エンジンと同等の性能(約95%)を維持しつつ,2.1倍以上の高速化を実現した。
    • トークン単位でのKVキャッシュ削除とPagedAttentionを組み合わせた「圧縮されたPagedAttention」を提案。
    • Zipageは,大規模な数学的推論タスクにおいて,高い並行性でLLM推論を可能にする。

    Link: https://arxiv.org/abs/2603.08743

  • FP4推論の診断:NVFP4およびMXFP4における層別およびブロック別の感度分析 [cs.AR, cs.MA, cs.PF, cs.AR, cs.AI]目的:FP4推論における層別・ブロック別の感度
    • 大規模言語モデルの活用が拡大する中で,計算資源の効率化は重要な課題である。
    • FP4のような低精度化は効率化に貢献するが,どの層が感度が高いか不明確である。
    • FP4形式とモデル規模における感度の違いを明らかにすることで,推論の最適化に貢献する。
    • MLPのアップ・ダウン射影層が最も感度が高く,ゲートやアテンション射影層は低い感度を示すことが判明した。
    • 感度は最終ブロックに限定されず,MXFP4では特に初期ブロックで高い感度が見られた。
    • 本研究は,FP4推論の挙動を構成要素,深さ,FP4形式ごとに診断的に特徴付けるものである。

    Link: https://arxiv.org/abs/2603.08747

  • 長期的LLMエージェントのための事後信用割り当て [cs.LG, cs.AI]目的:長期的タスクにおけるLLMエージェントの信用割り当ての改善
    • LLMエージェントは複雑なタスクで有用だが,報酬が疎な場合に学習が困難である。
    • 既存手法は,ステップレベルのQ値推定の不正確さや中間状態における価値基準のずれが課題である。
    • 事後信用割り当てをLLMエージェントに統合し,探索効率とスケーラビリティを高める。
    • HCAPOは,既存の最先端のRL手法と比較して,WebShopとALFWorldの両方のベンチマークで一貫して優れた性能を示す。
    • WebShopでは7.7%,ALFWorldでは13.8%の成功率向上を,Qwen2.5-7B-Instructモデルを用いて達成した。
    • HCAPOは,意思決定の効率化と複雑な長期的タスクにおけるスケーラビリティの確保に貢献する。

    Link: https://arxiv.org/abs/2603.08754

  • エージェント的計算のための言語:Turn [cs.PL, cs.AI, cs.SE]目的:エージェント的ソフトウェアの実現
    • LLMを活用した自律的なソフトウェア開発が重要視されている。
    • 既存手法では,LLMの利用における安全性や信頼性が課題となっている。
    • 言語レベルで安全性と信頼性を保証することで,問題を解決する。
    • Turnは,スキーマ推論のための静的型付けと,値レベルでの動的型付けを行うコンパイル言語である。
    • 認知型安全性により,LLMの推論を型付きのプリミティブとして扱い,コンパイラがJSONスキーマを生成し,VMがモデル出力を検証する。
    • 能力ベースのIDシステムにより,VMホストから不透明なハンドルを返し,生の認証情報がエージェントメモリに侵入しないようにする。

    Link: https://arxiv.org/abs/2603.08755

  • 柔軟な等方性ニューラル場に対する等方性への一般化された還元 [cs.LG, cs.AI]目的:異質積空間上の不変量に関する幾何学的学習問題の解決
    • 幾何学的学習は,多様な応用分野において重要な役割を担う研究領域である。
    • 既存手法では,異なる群作用を持つ空間の積空間における不変量を扱うのが困難である。
    • 本研究は,積空間上の関数を等方性部分群に対する不変量に還元し,この問題を解決する。
    • 群 $G$ が空間 $M$ 上で推移的に作用する場合,積空間 $X \times M$ 上の $G$-不変関数は,$M$ の等方性部分群 $H$ が $X$ 上で作用する不変量に還元可能となる。
    • このアプローチは,明示的な軌道同値性 $(X \times M)/G \cong X/H$ を確立し,表現力を維持した原理的な還元を提供する。
    • 本研究は等方性ニューラル場に適用され,任意の群作用と均一な条件付け空間への拡張を可能にし,既存手法の構造的制約を取り除く。

    Link: https://arxiv.org/abs/2603.08758

  • EDMFormer:音楽構造セグメンテーションのためのジャンル特化型自己教師あり学習 [cs.SD, cs.AI]目的:EDM(エレクトロニック・ダンス・ミュージック)の音楽構造セグメンテーション
    • 音楽分析における重要な課題であり,楽曲の理解や自動DJなどの応用が期待される。
    • 既存モデルはEDMにおいて性能が低く,歌詞やハーモニーに依存するアプローチではEDM特有の構造を捉えられない。
    • EDM特有のデータセットと分類を用いて,エネルギー,リズム,音色の変化を捉えるモデルを開発し,セグメンテーション精度を向上させる。
    • EDMFormerは既存モデルと比較して,EDMの境界検出とセクションラベリングの精度を向上させた。
    • 特に,ドロップとビルドアップの識別において顕著な改善が見られた。
    • 学習表現とジャンル特化型データ,構造に関する事前知識の組み合わせが,EDMだけでなく他の音楽ジャンルにも応用可能である可能性を示唆している。

    Link: https://arxiv.org/abs/2603.08759

  • 明確で説得力のある議論:最先端AI安全性の事例の基礎を再考 [cs.CY, cs.AI, cs.CR]目的:最先端AIシステムの安全性事例に関する議論の再構築
    • AI技術の急速な発展に伴い,安全性確保が喫緊の課題となっているから。
    • 既存のAI安全性評価は,他の安全保障分野からの知見が十分に活用されていない。
    • 安全保障分野の知見を取り入れ,より堅牢な安全性事例の構築を目指す。
    • 本研究は,AI安全性事例におけるアライメントコミュニティのアプローチの限界を指摘した。
    • 安全保障における既存の方法論を参考に,新たな安全性事例の構築の可能性を示した。
    • 欺瞞的アライメントとCBRN能力に焦点を当てた事例研究を通して,具体的なアプローチを提案した。

    Link: https://arxiv.org/abs/2603.08760

  • SPREAD:生涯模倣学習のための部分空間表現蒸留 [cs.LG, cs.RO]目的:生涯模倣学習における知識伝達と忘却の軽減
    • ロボットの自律的な学習を可能にする上で,過去の知識を維持しつつ新しいスキルを獲得することが重要である。
    • 既存の知識蒸留法は,高次元空間のノイズに弱く,タスクの本質的な多様体構造を保持できない場合がある。
    • 低ランク部分空間における表現のアライメントを通じて,タスクの幾何学的構造を保持し,知識伝達を改善すること。
    • 提案手法SPREADは,特異値分解(SVD)を用いてタスク間のポリシー表現を低ランク部分空間でアライメントする。
    • 信頼性の高い行動サンプルに焦点を当てることで,学習の安定性を向上させている。
    • LIBEROベンチマークにおいて,SPREADは知識伝達を大幅に改善し,最先端の性能を達成した。

    Link: https://arxiv.org/abs/2603.08763

  • スキルベースのカリキュラムを用いた多層メタ強化学習 [cs.LG, cs.AI, stat.ML]目的:階層的な構造を持つ順次決定問題における,効率的な多層圧縮手続き
    • 複雑な目標達成には,複数のサブタスクを組み合わせる必要があり,その構造化が重要である。
    • 複雑なMDPの階層構造を効率的に推論し,活用することは長年の課題である。
    • MDPの階層構造を圧縮することで,効率的な最適戦略探索を実現することを目指す。
    • 提案手法は,MDPを多層的に圧縮し,高レベルのMDPの確率的変動を低減する。
    • サブタスクの分離と,方策探索空間の縮小により,計算量を削減できる。
    • スキルの埋め込みと高次関数による分解により,異なる問題間でのスキル転移が可能になる。

    Link: https://arxiv.org/abs/2603.08773

  • 時間的マルコフ遷移場 [cs.LG, stat.ML]目的:時系列データの時間変化を捉えるための表現方法
    • 時系列分析は,金融,気象,医療など幅広い分野で重要な役割を果たす。
    • 従来のマルコフ遷移場は,時間的に変化する状況への対応が困難であった。
    • 時間的マルコフ遷移場は,時系列データの局所的な変化を捉え,より正確な分析を可能にする。
    • 時間的マルコフ遷移場は,時系列を複数の時間区分に分割し,各区分ごとに遷移行列を推定する。
    • その結果,各時間区分におけるダイナミクスを反映した,特徴的なテクスチャを持つ画像を生成できる。
    • この表現方法は,畳み込みニューラルネットワークへの入力チャネルとして,時系列特性の識別タスクに適している。

    Link: https://arxiv.org/abs/2603.08803

  • テスト駆動型AIエージェント定義 (TDAD): 行動仕様からのツール使用エージェントのコンパイル [cs.SE, cs.AI]目的:AIエージェントの行動仕様に基づく,ツール使用エージェントのコンパイル手法
    • AIエージェントの活用が拡大する中で,その振る舞いの品質保証が重要課題となっている。
    • プロンプトのわずかな変更で予期せぬ挙動が発生し,品質管理が困難である。
    • 行動仕様に基づきテストを自動生成することで,エージェントの信頼性と安全性を向上させる。
    • TDADは,行動仕様からテストを生成し,プロンプトを反復的に改善することで,高いコンパイル成功率(92%)と隠蔽テストの合格率(97%)を達成した。
    • 進化させた仕様でも,高い変異スコア(86-100%)と回帰安全性(97%)を示し,安定した性能を維持している。
    • 本手法は,AIエージェント開発における品質保証の新たなアプローチを提供する。

    Link: https://arxiv.org/abs/2603.08806

  • スケールプラン:異種マルチロボットチームのためのスケーラブルな言語支援タスクプランニング [cs.RO, cs.AI, cs.ET, cs.MA]目的:異種マルチロボットチームの長期的タスクプランニング
    • 現実世界の協調ロボットチームの運用には不可欠であり,複雑な環境での効率的な作業を可能にする。
    • 従来のプランナーは手動での仕様が必要で拡張性に欠け,LLMベースのアプローチは幻覚や環境との整合性の低さという課題がある。
    • 自然言語指示からコンパクトでタスク関連性の高い問題表現を生成し,スケーラブルかつ信頼性の高いプランニングを実現する。
    • スケールプランは,LLMを活用してドメイン構造を捉えたアクショングラフを構築し,関連するアクションとオブジェクトの最小限のサブセットを特定する。
    • 無関係な情報をフィルタリングすることで,効率的なタスク分解,割り当て,および長期計画の生成を可能にする。
    • MAT2-THORという新しいベンチマークを用いて評価した結果,既存のLLMやハイブリッドアプローチよりも優れたスケーラビリティと信頼性を示した。

    Link: https://arxiv.org/abs/2603.08814

  • 関連性を超えて:検索とRAGの情報網羅性の関係について [eess.SY, cs.SY, cs.RO, cs.HC, cs.IR, cs.AI]目的:RAGシステムにおける検索と生成応答の情報網羅性の関係
    • 情報検索の分野は,大量のデータから必要な情報を効率的に見つけ出す上で不可欠である。
    • RAGシステムでは,検索品質が生成品質に与える影響が明確に理解されていない。
    • 検索指標が生成応答の情報網羅性の信頼できる指標となりうるかを検証する。
    • 網羅性に基づく検索指標と生成応答におけるナゲット網羅性の間に強い相関が認められた。
    • 検索目的と生成目標が一致する場合,その関係が最も強く現れることが示された。
    • 複雑な反復型RAGパイプラインでは,生成品質と検索効果が部分的に分離される可能性がある。

    Link: https://arxiv.org/abs/2603.08819

  • Fish Audio S2 技術報告 [cs.RO, cs.SD, cs.AI, cs.CL]目的:オープンソースのテキスト読み上げシステムFish Audio S2の開発
    • 音声合成技術は,人間とコンピュータのコミュニケーションにおいて重要な役割を担う。
    • 既存の音声合成システムは,多様な指示への対応やリアルタイム性に課題がある。
    • 自然言語による指示に基づいた高品質な音声合成を可能にすること。
    • Fish Audio S2は,複数話者,複数ターンに対応し,自然言語による指示制御機能を備えた。
    • 大規模な学習のために,ビデオキャプションや音声キャプションを含む段階的なデータパイプラインと学習方法を開発した。
    • ストリーミングに最適化された推論エンジンは,RTF 0.195,初回音声出力までの時間100ms未満を達成した。

    Link: https://arxiv.org/abs/2603.08823

  • SoftJAX & SoftTorch:情報的な勾配を提供する自動微分ライブラリの強化 [cs.LG]目的:自動微分ライブラリにおけるソフトな微分可能な演算のツールボックスの提供
    • 機械学習や科学計算において,勾配ベースの最適化は不可欠な手法である。
    • JAXやPyTorch等のライブラリのハードなプリミティブは,最適化に有用でない勾配を返す場合がある。
    • ソフトな近似関数を統合的に提供し,微分可能なプログラミングを容易にすることを目的とする。
    • SoftJAXとSoftTorchは,JAXとPyTorchのハードな演算のドロップイン置換となるソフト関数を多数提供する。
    • 要素ごとの演算,Booleanやインデックス操作,軸方向演算,ストレートスルー勾配推定をサポートする。
    • ベンチマーク評価と実用的なケーススタディにより,微分可能なプログラミングへのアクセス性を向上させている。

    Link: https://arxiv.org/abs/2603.08824

  • 離散グラフ生成に表現力豊かなエンコーダは必要か? [cs.LG, cs.AI]目的:離散グラフ生成における表現力豊かなエンコーダの必要性
    • グラフ構造データは様々な分野で重要であり,そのモデル化手法の確立が求められている。
    • 従来のグラフ生成モデルは計算コストが高く,推論速度が遅いという課題があった。
    • GenGNNを用いて,より高速かつ効率的なグラフ生成モデルを開発し,表現力の検証を行う。
    • GenGNNを用いた拡散モデルは,TreeやPlanarデータセットで90%以上の妥当性を達成し,グラフTransformerと同等の性能を示した。
    • 分子生成においては,GenGNNを基盤とするDiGressが99.49%の妥当性を実現した。
    • 残差接続が複雑なグラフ構造における過剰平滑化を軽減する上で重要であることが示された。

    Link: https://arxiv.org/abs/2603.08825

  • MASEval:モデルからシステムへのマルチエージェント評価の拡張 [cs.AI, cs.CL, cs.LG]目的:マルチエージェントシステムの評価に関するフレームワーク
    • LLMベースのエージェントシステムが急速に普及し,多様なフレームワークが登場している。
    • 既存のベンチマークはモデル中心であり,システム全体の比較が不足している。
    • システム全体の性能に影響を与える実装上の決定要因を評価すること。
    • MASEvalは,システム全体を分析単位として扱うフレームワーク非依存のライブラリである。
    • 3つのベンチマーク,3つのモデル,3つのフレームワークを用いた実験で,フレームワークの選択がモデルの選択と同程度に重要であることが示された。
    • 本研究は,エージェントシステムの原理に基づいた設計と,最適な実装の特定を可能にする。

    Link: https://arxiv.org/abs/2603.08835

  • 展開可能なデジタル病理のための軽量多癌腫瘍局在化フレームワーク [cs.HC, cs.CV, cs.AI]目的:多癌腫瘍局在化モデルの構築
    • 空間解析や分子プロファイリングなど,転移研究の基盤となる技術である。
    • 特定の癌で訓練された深層学習モデルは,他の癌種への汎化性能が低い場合がある。
    • 少量のデータで多癌種を対象とした訓練を行い,汎化性能の向上を目指す。
    • 訓練癌4種において,タイルレベルのROC-AUCは0.97という高い性能を達成した。
    • 独立した膵管腺癌データセットにおいても,0.71という良好な結果が得られた。
    • 既存のデジタル病理ツールと互換性のある空間腫瘍確率ヒートマップを生成するスケーラブルな推論ワークフローを構築した。

    Link: https://arxiv.org/abs/2603.08844

  • LDP:マルチエージェントLLMシステムのためのアイデンティティを意識したプロトコル [cs.AI, cs.MA, cs.SE]目的:マルチエージェントLLMシステムの効率性とガバナンスを向上させるプロトコル設計
    • AIエージェントの複雑化に伴い,連携プロトコルの重要性が増している。
    • 既存のプロトコルは,モデルの特性を十分に活用できていない。
    • AIネイティブなプロトコル基盤により,効率的な委任を実現すること。
    • アイデンティティを意識したルーティングにより,簡単なタスクで約12倍の低遅延を実現した。
    • セマンティックフレームペイロードは,品質を損なうことなくトークン数を37%削減した。
    • ガバナンスセッションは,10ラウンドでトークンオーバーヘッドを39%削減し,信頼性の高いProvenance追跡が重要であることが示唆された。

    Link: https://arxiv.org/abs/2603.08852

  • 解釈可能性の解明:最適な組み合わせ解のための人間中心の基準 [cs.HC, cs.AI]目的:最適な組み合わせ解の解釈可能性に関する人間中心の基準の特定
    • アルゴリズム支援システムは意思決定を助けるが,解釈可能性が重要である。
    • 最適な解が理解困難で,人間が解を選択するための基準が不足している。
    • 解釈可能性を測る構造的特性を特定し,最適性と解釈可能性のトレードオフを定量化する。
    • 参加者実験の結果,貪欲法との整合性,ビン内構成の単純性,順序付き視覚表現が解釈可能性と関連することが示された。
    • 特に,順序付き表現と貪欲法との整合性が強く,構成の単純性も一貫して関連していた。
    • 本研究は,解釈可能性を考慮した最適化や機械解の提示を可能にする具体的な特性を明らかにした。

    Link: https://arxiv.org/abs/2603.08856

  • ハイブリッド系列モデルにおける表現力と効率性のトレードオフ [cs.LG]目的:ハイブリッド系列モデルの利点と限界
    • 系列モデリングは自然言語処理等の基盤技術であり,その性能向上は重要である。
    • Transformerと状態空間モデルはそれぞれ長所・短所があり,効率と表現力のバランスが課題である。
    • Transformerと状態空間モデルの利点を両立するハイブリッドモデルの有効性を検証する。
    • 特定のタスクにおいて,ハイブリッドモデルは非ハイブリッドモデルに必要なパラメータ数やメモリ量を削減できることが示された。
    • 選択的コピーや連想想起といったタスクにおいて,小規模なハイブリッドモデルが良好な性能を発揮する。
    • 学習されたハイブリッドモデルは,より多くのパラメータを持つ非ハイブリッドモデルよりも優れた性能を示すことが実証された。

    Link: https://arxiv.org/abs/2603.08859

  • 視覚言語行動モデルからの適応的プランナーパラメータ学習 (APPLV) [cs.RO, cs.SY, eess.SY, cs.RO, cs.LG]目的:制約環境下におけるロボットの自律ナビゲーション性能向上
    • 制約環境でのロボット自律ナビゲーションは依然として困難であり,実用化には安全性と効率性の両立が不可欠である。
    • 従来のナビゲーション手法は環境依存性が高く,エンドツーエンド学習は精密な制御が難しいという課題があった。
    • 視覚言語行動モデルを活用し,プランナーパラメータを適応的に学習することで,未知環境への汎化性能を高めることを目指す。
    • 提案手法APPLVは,従来のVLAモデルとは異なり,行動を直接出力するのではなく,プランナーパラメータを予測することで,より精密な制御を可能にした。
    • シミュレーションおよび実機実験の結果,APPLVは既存手法と比較してナビゲーション性能と未知環境への汎化性能において優れていることが示された。
    • 教師あり学習と強化学習の二つの学習戦略により,ナビゲーション性能をさらに最適化することができた。

    Link: https://arxiv.org/abs/2603.08862

  • プライベート5Gにおけるエンドツーエンド性能予測ではチャネル中心モデルだけでは不十分である理由:測定キャンペーンと事例研究 [cs.RO, cs.NI, cs.LG, cs.RO]目的:プライベート5G環境におけるエンドツーエンド性能予測の精度向上
    • ロボットの自律動作において,無線ネットワーク性能の正確な予測が不可欠である。
    • チャネルレベルの指標からエンドツーエンドのスループットを予測する既存手法には課題がある。
    • チャネル指標に依存しない,より正確なスループット予測手法を確立すること。
    • 従来のレイトレーシングシミュレータはスループットを過大評価する傾向があることが示された。
    • その主な原因は,MIMO空間層数の推定誤差であり,シミュレータが実際よりも多い層数を仮定している。
    • 一方,ガウス過程回帰モデルは測定データから直接学習することで,予測誤差を大幅に低減した。

    Link: https://arxiv.org/abs/2603.08865

  • 予算制約下におけるエージェント型LLM検索における設計決定の精度とコストへの影響の定量化 [cs.CL, cs.AI]目的:予算制約下のエージェント型LLM検索における精度とコストへの影響
    • 大規模言語モデルの検索能力向上は,情報検索の効率化と精度向上に不可欠である。
    • エージェント型LLM検索では,API利用コストが課題であり,予算内で最適な性能を引き出す方法が求められる。
    • 予算制約下で,検索深度,検索戦略,生成予算が精度とコストに与える影響を明らかにすること。
    • 検索回数を増やすことで精度が向上するが,ある程度で頭打ちとなることが確認された。
    • ハイブリッド検索(レキシカルと密な検索)と軽量な再ランキングが,平均的な精度向上に最も貢献した。
    • HotpotQAのような合成質問への回答において,生成予算を増やすことが特に有効であった。

    Link: https://arxiv.org/abs/2603.08877

  • ファジー粗集合理論に基づく特徴選択の新たなモデリング:ハイブリッド情報システムにおける通常状態と楽観的状態 [cs.CL, cs.LG, cs.AI]目的:ビッグデータに対する特徴選択手法
    • データ量や種類の増加に伴い,効率的な特徴選択は意思決定システムの最適化に不可欠である。
    • 既存のファジー粗集合理論では,高次元空間での計算コストやノイズの影響が課題となっていた。
    • 計算コストを削減し,ノイズの影響を軽減することで,より効率的な特徴選択を実現すること。
    • 提案手法FSbuHDは,オブジェクト間の複合距離を算出し,それに基づいてファジー同値関係を導出する。
    • 特徴選択問題を最適化問題として再構成し,メタヒューリスティックアルゴリズムを用いて解決する。
    • UCIリポジトリの標準データセットを用いた実験により,FSbuHDは既存手法と比較して高い効率と効果を示した。

    Link: https://arxiv.org/abs/2603.08900

  • NetDiffuser:拡散モデルによる敵対的トラフィック生成を通じたDNNベースのネットワーク攻撃検知システムの欺瞞 [cs.CR, cs.AI]目的:深層学習に基づくネットワーク侵入検知システムを欺瞞する敵対的サンプル生成手法
    • ネットワークセキュリティにおいて,侵入検知システムの性能向上は不可欠である。近年,深層学習を用いた検知システムが注目されている。
    • 深層学習モデルは,巧妙に作成された敵対的サンプルによって容易に欺瞞される脆弱性を抱えている。
    • 自然な敵対的サンプルを生成し,検知システムの堅牢性を評価・向上させる手法が求められている。
    • 提案手法NetDiffuserは,拡散モデルを活用し,既存手法と比較して最大29.93%高い攻撃成功率を達成した。
    • また,受取動作特性曲線下の面積(AUC-ROC)スコアにおいて,少なくとも0.267(場合によっては0.534)の検知性能低下を実現した。
    • ネットワークトラフィックの特徴量を適切に分類し,最小限の変更で有効な敵対的サンプルを生成することに成功した。

    Link: https://arxiv.org/abs/2603.08901

  • 選択的予測のためのクロスドメイン不確実性定量化:転移情報に基づいた賭けによる包括的な限界アブレーション [cs.LG, cs.AI, stat.ML]目的:選択的予測におけるリスク制御のための有限サンプル限界族の包括的な評価
    • 機械学習モデルの信頼性を高めることは,安全性が重要な応用分野において不可欠である。
    • データが少ない状況下では,モデルの予測に対する信頼区間の推定が困難となる。
    • 転移学習を活用し,データが限られた状況下での信頼区間をよりtightに推定すること。
    • 提案手法Transfer-Informed Betting(TIB)は,既存のWSR手法と比較して,データが少ない状況でよりtightな限界を提供することが示された。
    • MASSIVEベンチマークにおいて,LTTを用いることでunion boundによるln(K)ペナルティを解消し,Hoeffdingと比較して27%の保証されたカバレッジ改善を達成した。
    • NyayaBenchにおいては,TIBがalpha=0.10で18.5%のカバレッジを達成し,LTT+Hoeffdingと比較して5.4倍の改善を示した。

    Link: https://arxiv.org/abs/2603.08907

  • 非IIDデータ下における連合学習のためのクラスタおよび損失誘導型クライアント選択:FedLECC [cs.CL, cs.DC, cs.AI, cs.LG]目的:連合学習におけるクライアント選択戦略
    • エッジ環境におけるAI活用を促進するため,データ集中化なしでの分散学習が重要である。
    • デバイス間データの非IID性が,学習の収束とモデル品質を低下させる課題がある。
    • クライアント選択の最適化により,効率的かつスケーラブルな連合学習を実現することを目指す。
    • FedLECCは,ラベル分布の類似性に基づくクライアントのクラスタリングと,高いローカル損失を持つクライアントの優先順位付けを行う。
    • 厳しいラベル偏り下において,テスト精度を最大12%向上させ,通信ラウンド数を約22%削減した。
    • また,全体的な通信オーバーヘッドを最大50%削減し,効率性とスケーラビリティの向上を示した。

    Link: https://arxiv.org/abs/2603.08911

  • ゲノム言語モデルにおける記憶とプライバシーリスクの定量化 [cs.LG, cs.CR, q-bio.GN]目的:ゲノム言語モデルにおける記憶リスクの定量化
    • ゲノムデータは疾患リスク等の重要な情報を含むため,解析技術の進展は医療の発展に不可欠である。
    • ゲノム言語モデルは個人情報を記憶する可能性があり,プライバシー侵害やデータ漏洩のリスクが懸念される。
    • ゲノム言語モデルの記憶リスクを多角的に評価し,プライバシー保護の対策を講じることを目指す。
    • ゲノム言語モデルは,特定のDNA配列を記憶する可能性が確認された。
    • 記憶リスクの程度は,モデルの構造や学習方法によって異なることが示された。
    • 単一の攻撃手法では記憶リスクを完全に捉えきれないため,多角的な評価が重要である。

    Link: https://arxiv.org/abs/2603.08913