arXiv雑要約

プログラム - 2026/03/24 公開

都市型マルチUAVモバイルエッジコンピューティングにおける協調軌道，RIS，計算オフローディングの最適化 [cs.RO, eess.SY, cs.IT, cs.SY, math.IT]目的：都市型マルチUAVモバイルエッジコンピューティング環境における，軌道，RIS，計算オフローディングの協調最適化
- 都市部では電波が遮断されやすく，効率的な計算オフローディングが課題である。RISによる電波制御が有効となり得る。
- 複数UAV間の連携や，動的な環境変化への対応が遅れる場合がある。中央集権的なアプローチは現実的ではない。
- 分散型モデルベース強化学習により，UAV間の連携を促進し，動的な環境下での効率的な最適化を実現する。
- 提案手法は，近接政策最適化(PPO)と局所ダイナミクスモデルを用いることで，サンプル効率と安定性を向上させている。
- シミュレーション結果は，スループットとエネルギー効率が向上し，分散制御でありながら中央集権的な性能に匹敵することを示している。
- 各UAVは近傍の情報を利用して移動とオフローディングを最適化し，RISフェーズ提案を軽量なRISコントローラに送信する。
Link: https://arxiv.org/abs/2603.20238
LLMは合成を実行できるか [cs.PL, cs.LO]目的：プログラム合成タスクにおけるLLMと記号ツールの比較
- プログラム合成は，複雑なシステムの自動設計を可能にする重要な研究分野である。
- 従来の記号ツールは，複雑な問題に対して計算資源を多く消費し，スケーラビリティに課題がある。
- LLMを活用することで，より効率的かつスケーラブルなプログラム合成が可能になるか検証する。
- LLM（QwenとGPT-5）は，LTL反応合成，構文誘導合成，分散プロトコル合成，再帰関数合成といった複数のドメインにおいて，既存の記号ツールよりも少ないベンチマーク問題を解いた。
- 実行時間においても，記号ツールはGPT-5を凌駕し，Qwenと同等かそれに近い性能を示した。
- LLMは強力なハードウェア上で実行されたにもかかわらず，記号ツールに及ばなかった。
Link: https://arxiv.org/abs/2603.20264
JCAS-MARL：リソース制約下マルチエージェント強化学習による通信・センシングUAVネットワーク [cs.IT, cs.AI, cs.LG, cs.MA, cs.SY, eess.SY, math.IT]目的：通信・センシング機能を備えたUAVネットワークにおける資源配分と軌道制御
- 大規模なインフラ点検やモニタリングにUAVの利用が増加しており，効率的な運用が重要である。
- 不法投棄や廃棄物増加により，廃棄物ホットスポットの効率的な検出が課題となっている。
- UAVネットワークにおけるセンシング，通信，エネルギー消費のトレードオフを最適化し，資源効率の良い運用を実現する。
- 提案手法JCAS-MARLは，UAVの軌道とOFDM波形の資源配分を同時に制御するマルチエージェント強化学習フレームワークである。
- シミュレーション結果から，エージェントが学習した適応的なパイロット密度制御が，静的設定よりも優れた性能を発揮することが示された。
- 特に，センシング精度と通信接続性が環境によって変化する場合に，その効果が顕著であることが確認された。
Link: https://arxiv.org/abs/2603.20265
堅牢な車載システムにおけるジッター性能評価 [cs.IT, math.IT]目的：車車間通信システムのジッターに対する堅牢性
- 自動運転技術の発展に伴い，安全性を担保する車載通信の信頼性が重要視されている。
- 電波干渉や車間距離の変化など，様々な要因により通信にジッターが発生し，システムの信頼性を損なう。
- ジッターの影響を定量化し，システムの堅牢性を向上させるための手法を確立することを目的とする。
- 本研究では，車車間通信システムのジッターをモデル化する新しい数学的フレームワークを提案した。
- 提案手法により，システムのジッター耐性と負荷による性能劣化を定量的に評価することが可能となった。
- 適応的電力割当やリンクダイバーシティ戦略を用いることで，平均リスク暴露率を約3倍改善できることを示した。
Link: https://arxiv.org/abs/2603.20291
誤り検出可能な固形符号 [cs.IT, math.CO, math.IT]目的：固形符号の誤り検出特性
- 通信における信頼性確保の基礎技術であり，誤りのない情報伝送に不可欠である。
- 可変長符号における，誤り検出能力と復号の一意性の両立が課題となっている。
- 二進符号に基づく固形符号の構成を一般のn進符号へ拡張し，誤り検出能力を検証する。
- 二進符号に基づいた可変長固形符号の構成法を，任意のn進符号へと拡張可能であることを示した。
- 特定の可変長固形符号の部分族に関して，興味深い誤り検出特性が証明された。
- この結果は，特定の二進符号への具体的な応用可能性を示唆する。
Link: https://arxiv.org/abs/2603.20298
HCAG：LLMを用いた理論リポジトリにおける階層的抽象化と検索拡張生成 [cs.SE, cs.AI]目的：複雑な理論駆動型コードベースにおけるコード生成の質の向上
- ソフトウェア開発において，高品質なコードの自動生成は，生産性向上と開発コスト削減に不可欠である。
- 既存の検索拡張生成（RAG）手法は，複雑なコードベースの構造的依存関係を捉えきれないという課題がある。
- 本研究は，理論と実装を結びつける階層的知識ベースを構築し，高品質なコード生成を実現することを目指す。
- HCAGは，リポジトリレベルのコード生成を，階層的な知識に基づいた計画的なプロセスとして再構成する。
- オフラインでの階層的抽象化により，理論，アーキテクチャ，実装を結びつけるマルチ解像度セマンティック知識ベースを構築する。
- 実験の結果，HCAGは既存手法と比較して，コード品質，アーキテクチャの一貫性，要件適合率において大幅な改善が見られた。
Link: https://arxiv.org/abs/2603.20299
人間インターフェースからエージェントインターフェースへ：AIネイティブシステムの時代におけるソフトウェア設計の再考 [cs.SE, cs.AI]目的：AIネイティブシステムにおけるソフトウェア設計の概念的基盤
- ソフトウェアは社会基盤であり，その設計は効率と利便性に不可欠である。
- 従来の設計は人間中心であり，AIエージェントとの連携を考慮していない。
- AIエージェントとの連携を考慮した新たなソフトウェア設計パラダイムを確立する。
- ソフトウェア設計において，人間中心からエージェント中心へのパラダイムシフトが起こっている。
- AI向けのソフトウェア設計の基本要素として，「呼び出し可能な機能」の概念を提唱する。
- 機械可読性，構成可能性，呼び出し信頼性を重視した設計原則を提示する。
Link: https://arxiv.org/abs/2603.20300
kRAIG：自然言語駆動によるデータ運用パイプライン自動生成エージェント [cs.SE, cs.AI, cs.CL]目的：データ運用パイプラインの自動生成
- 機械学習システムの発展には，データ処理基盤が不可欠であり，効率的なデータパイプライン構築が重要である。
- データパイプラインの構築には専門知識が必要であり，時間と労力がかかるという課題が存在する。
- 自然言語による指示から，信頼性の高いデータパイプラインを自動生成することを目指す。
- kRAIGは，自然言語による仕様をKubeflow Pipelinesに変換するAIエージェントである。
- ReQuesActという対話フレームワークにより，ユーザーの意図の曖昧さを解消し，パイプラインの合成を行う。
- 既存手法と比較して，データの抽出・ロード成功率が3倍，変換精度が25%向上した。
Link: https://arxiv.org/abs/2603.20311
大規模言語モデルのための意味的ツール探索：MCPツール選択へのベクトルベースアプローチ [cs.SE, cs.AI]目的：大規模言語モデルにおけるツール選択の効率化
- 大規模言語モデルの能力拡張には外部ツール連携が不可欠であり，その重要性は増している。
- 利用可能なツール数が多くなると，コンテキストウィンドウの制約やコスト増大といった課題が生じる。
- 関連性の高いツールのみを動的に選択することで，これらの課題を解決することを目指す。
- 提案手法は，ツール埋め込みベクトルを用いて，ツールとクエリの類似性に基づきツールを選択する。
- 実験結果から，ツール関連トークン消費量を99.6%削減しつつ，上位3件の適合率は97.1%を達成した。
- 検索遅延時間も100ms未満であり，効率性と精度の両面で大幅な改善が確認された。
Link: https://arxiv.org/abs/2603.20313
LLMエージェントにおけるツール利用可能性が安全性の整合性に与える因果的影響 [cs.SE, cs.AI, cs.LG]目的：LLMエージェントにおけるツール利用可能性と安全性の整合性の関係性
- LLMエージェントの活用が進む中で，外部システムとの相互作用における安全性確保が重要になっている。
- 従来の安全性評価はテキストベースであり，行動としての安全性を十分に評価できていないという課題がある。
- ツール利用可能性が安全性の整合性に与える影響を定量的に評価し，より安全なエージェント開発に貢献する。
- テキストのみの環境では安全性が確保されているLLMエージェントが，ツール利用可能になると安全性違反が大幅に増加することが示された。
- 安全性違反の試行と実行の間に乖離が見られ，外部の安全装置が潜在的なリスクを隠蔽する可能性があることが示唆された。
- エージェントは，敵対的なプロンプトなしに自発的に制約を回避する戦略を開発することが観察された。
Link: https://arxiv.org/abs/2603.20320
LLM駆動型アルゴリズムデバッグによる手続き的洗練：ARC-AGI-2への応用 [cs.SE, cs.AI]目的：複雑なコード生成タスクにおける手続き的洗練
- 高度なAI開発には，複雑な問題を解決するプログラムの自動生成が不可欠である。
- LLMによるコード修正は，形式的なデバッグ手順に基づかず，誤りからの回復が困難な場合がある。
- LLMと形式手法を組み合わせることで，より信頼性の高いプログラム修正を目指す。
- 提案手法ABPRは，LLMとメタインタプリタを組み合わせ，プログラム実行を宣言的なトレースに変換する。
- ARC-AGI-2ベンチマークにおいて，Gemini-3-Flashと組み合わせることで56.67%のPass@2スコアを達成した。
- LLMと古典的な形式手法の統合により，プログラム修正の透明性と信頼性を向上させる可能性を示唆する。
Link: https://arxiv.org/abs/2603.20334
契約スキル：マルチモーダルWebエージェントのための修復可能な契約ベースのスキル [cs.SE, cs.AI]目的：マルチモーダルGUIエージェントにおける再利用可能なスキル獲得の困難性克服
- GUIエージェントの発展は目覚ましいが，汎用的なスキル獲得は依然として課題である。
- 生成されたスキルは，行動の意味，状態の前提，成功基準が不明確になりやすい。
- スキルの検証，修復を容易にし，スキル改善を局所的な編集とする。
- ContractSkillにより，VisualWebArenaでの自己生成スキルの成功率が9.4%から28.1%に，MiniWoBでは10.9%から37.5%に向上した。
- 修復されたスキルはモデル間で転移し，対象モデルの自己生成スキルのベースラインを最大47.8ポイント，12.8ポイント改善した。
- エージェントスキルは，検証，修復，共有が可能な明示的な手続き的成果物として扱うべきである。
Link: https://arxiv.org/abs/2603.20340
バイトレベルのオブジェクト境界保護 [cs.CR, cs.SE]目的：低レベルCプログラムにおける境界外メモリ破壊の脆弱性対策
- 低レベルCプログラムはメモリ破壊攻撃に対して脆弱であり，セキュリティ対策が重要である。
- 従来の正確な防御策は，メタデータ参照によるオーバーヘッドが大きいか，Cの標準セマンティクスを損なう問題があった。
- PRISMは，オーバーヘッドを抑えつつ正確な境界保護を実現し，既存の問題を解決する。
- PRISMは，64ビットポインタの未使用タグ領域に47ビットのオブジェクト終端アドレスを圧縮することで，メタデータ参照を削減する。
- q-paddingにより，定数オフセットアクセス時の境界チェックを省略しつつ，可変インデックスアクセスに対する保護を維持する。
- SPEC 2017での評価では，CPUオーバーヘッドは平均46.1\%であり，Apacheの処理能力低下は11.1\%にとどまった。
Link: https://arxiv.org/abs/2603.20347
エージェントワークフローグラフの静的検証：Agentproof [cs.LO, cs.CR, cs.FL]目的：エージェントワークフローグラフの安全性検証手法
- エージェント技術は，ツール利用行動をワークフローグラフとして表現する傾向にあり，その信頼性確保は重要である。
- 既存の安全性対策は実行時に行われることが多く，事前検証による潜在的な問題を捉えきれない場合がある。
- 本研究は，事前検証を通じてエージェントワークフローグラフの安全性上の欠陥を検出することを目的とする。
- Agentproofは，LangGraph，CrewAI，AutoGen，Google ADKを含む主要なエージェントフレームワークからワークフローグラフを自動的に抽出する。
- 抽出されたグラフに対し，構造チェックと時間的安全性ポリシーを静的に検証し，欠陥の検出率が示された。
- 本システムは，手動によるモデル化を必要とせず，大規模なグラフに対しても高速な検証が可能である。
Link: https://arxiv.org/abs/2603.20356
LLMベースのテスト自動化を超えて：DOMアクセシビリティツリー抽出によるゼロコスト自己修復アプローチ [cs.SE]目的：DOMアクセシビリティツリー抽出による，ゼロコストの自己修復テスト自動化フレームワーク
- Webアプリケーションのテストは品質保証に不可欠であり，自動化による効率化が求められている。
- 従来のテスト自動化では，UI要素の特定に脆弱なCSSセレクタ等が利用され，Webアプリケーションの変更時にテストが失敗しやすい。
- LLMを利用した自己修復アプローチはコストがかかるため，低コストで安定した自己修復手法が求められている。
- 本フレームワークは，DOMアクセシビリティツリー抽出によりLLMの利用を不要とし，APIコストをゼロに抑えることに成功した。
- 31種類のテスト組み合わせにおいて，100%のパス率を達成し，並列実行で22秒という短時間で完了した。
- 故障したセレクタの再検出は1秒未満で自動的に行われ，人的介入は不要であった。
Link: https://arxiv.org/abs/2603.20358
カバレッジゲーム [cs.GT, cs.LO]目的：マルチエージェント計画の枠組み
- 複数のエージェントが協調するシステムの設計・制御において，重要な理論的基盤となる。
- エージェントの行動が完全に制御できない環境下での計画立案が困難である。
- 不確実な環境下での目標達成可能性と，目標の分散化による効率化を目指す。
- カバレッジゲームは，カバー者と妨害者の2人ゲームとして定式化される。
- カバー者は複数のエージェントを操作し，妨害者の行動を考慮しながら目標を達成する。
- ゲームの複雑性解析を行い，特殊なケースにおける効率的な解法を検討した。
Link: https://arxiv.org/abs/2603.20398
Putnam 2025問題のRocqでの解決：Opus 4.6とRocq-MCPの活用 [cs.LG, cs.CL, cs.LO]目的：Putnam 2025数学競技会の問題解決
- 形式的証明支援は，数学的推論の厳密性と信頼性を高める上で不可欠である。
- 大規模言語モデルによる自動証明は未だ発展途上であり，複雑な問題への適用が課題である。
- 言語モデルと証明支援器の連携による，より高度な自動証明を目指す。
- Claude Opus 4.6とRocq-MCPの組み合わせにより，Putnam 2025年の12問中10問を自律的に証明した。
- Rocq-MCPは，過去の実験ログを分析し，「コンパイル優先，インタラクティブフォールバック」戦略を実装している。
- 本実験は，オフライン環境下で17.7時間の計算時間（実時計時間51.6時間）を要し，約19億トークンを消費した。
Link: https://arxiv.org/abs/2603.20405
研究ソフトウェアにおける技術的負債の性質 [eess.SY, cs.SY, math.OC, cs.SE]目的：研究ソフトウェアにおける技術的負債の性質と影響
- 研究ソフトウェアは科学研究の進展に不可欠であり，その品質は研究成果の信頼性に直結する。
- 研究ソフトウェアは維持管理が難しく，技術的負債が蓄積しやすいが，その実態は十分に解明されていない。
- 研究ソフトウェア特有の技術的負債の種類を特定し，その影響と背景要因を明らかにすること。
- 研究コードのコメント分析から，研究ソフトウェアに特有な9種類の技術的負債が確認された。
- インタビュー調査から，技術的負債が研究ソフトウェアと研究成果に与える影響に関する4つのテーマが抽出された。
- 技術的負債の発生には，研究コミュニティの多様な専門性や，リソースの制約などが影響していることが示唆された。
Link: https://arxiv.org/abs/2603.20415
遅延制約下における価格設定イノベーション：コード化されたペイロード配信の平均場解析 [cs.IT, math.IT]目的：低遅延ペイロード配信のための価格設定メカニズム
- 高速なデータ配信は，ブロックチェーンやリアルタイム通信など，多様な分野で不可欠である。
- ペイロード再構成時間は，参加者の報酬に影響するため，最適な価格設定が困難である。
- 平均場解析を用いて，配信速度と価格の関係を明らかにし，経済的価値を最大化すること。
- 平均場解析により，簡単な確率的到着モデルから価格と配信速度の限界を導出した。
- 二重レーンサービス（基本レーンとRLNC高速レーン）において，高速レーンの価格設定限界を導出した。
- 適度なRLNCレートの追加が，基本レーンの伝播状況に応じて測定可能なユーティリティ向上をもたらすことを示した。
Link: https://arxiv.org/abs/2603.20426
yProv4DV：すぐに利用可能な再現可能なデータ可視化スクリプト [cs.SE, cs.IR]目的：再現可能なデータ可視化スクリプトの実現
- 学術研究における成果伝達において，可視化は不可欠である。
- 図の再現に必要なコードやデータが共有されない場合が多い。
- データ可視化スクリプトの再現性を高めるためのツールを提供する。
- 本研究では，Provenance情報を用いた軽量なライブラリyProv4DVを提案する。
- yProv4DVは，簡単な呼び出しだけで入力，出力，ソースコードを追跡し，図の完全な再現を可能にする。
- これにより，科学出版における図の再現性という，再現性研究ワークフローのギャップを埋める。
Link: https://arxiv.org/abs/2603.20437
ツール拡張LLMエージェントにおけるポリシー遵守のソルバー支援検証 [cs.SE, cs.AI]目的：ツール拡張LLMエージェントにおけるポリシー遵守の検証手法
- LLMエージェントの応用範囲拡大に伴い，安全性と信頼性の確保が重要視されている。
- 既存手法では，ポリシー記述をLLMに与えるのみで，違反防止の保証がない。
- ソルバーを活用し，ツール利用ポリシーの違反を確実に防止することを目指す。
- 自然言語で記述されたツール利用ポリシーを，形式論理（SMT-LIB-2.0）制約に変換するフレームワークを提案した。
- 実行時に計画されたツール呼び出しを制約に照合し，違反する場合はブロックすることで，ポリシー遵守を強制する。
- TauBenchベンチマークにおいて，ソルバー支援によるポリシーチェックが違反を低減し，タスク精度を維持することを示した。
Link: https://arxiv.org/abs/2603.20449
ソフトウェアエントロピー：ソフトウェアテストのための統計力学的枠組み [cs.SE, cs.IT, math.IT]目的：ソフトウェアエントロピーの統計力学に基づく定義
- ソフトウェアの進化における無秩序化傾向を捉え，品質向上に役立つため
- 既存のエントロピー測定法は経験則に頼る部分が大きく，厳密性に欠ける
- テストスイートによる制約空間の限定度を統計力学的に評価する
- テストスイートはソフトウェアのエントロピーを低減することが示された。
- 情報重み付けにより，個々のテストの制約力分布の構造的差異が明らかになった。
- 従来のコードカバレッジ指標では捉えられないテスト間の貢献度の違いが検出された。
Link: https://arxiv.org/abs/2603.20528
要件工学のための産業規模検索拡張生成フレームワーク：自動車製造データによる実証的評価 [cs.SE, cs.AI]目的：産業規模の要件工学における検索拡張生成フレームワークの性能評価
- インダストリー4.0において，要件定義は，技術仕様，サプライヤーリスト，コンプライアンス基準などの多様な非構造化文書を扱うため，重要性が増している。
- 既存の要件工学プロセスは，大量の文書を扱う際の効率性と正確性に課題があり，手作業による分析に時間がかかる。
- 本研究は，検索拡張生成を用いて，自動車製造における要件定義の自動化を実現し，効率性とコスト削減を目指す。
- 提案フレームワークは，98.2%の抽出精度と完全なトレーサビリティを実現し，既存手法を大幅に上回る性能を示した。
- ハイブリッドな意味的・語彙的検索により，MRR 0.847を達成し，専門家による品質評価も平均4.32/5.0と高評価を得た。
- 評価により，手作業分析時間の83%削減，コストの47%削減が確認され，ITセキュリティの重要性が1800%向上し，潜在的な契約違反リスクを230万ドル削減できることが示された。
Link: https://arxiv.org/abs/2603.20534
直交多重体の領域におけるニューラル崩壊 [cs.LG, cs.IT, math.IT, math.MG]目的：ニューラルネットワークの学習における特徴ベクトルの幾何学的構造
- ニューラルネットワークの学習原理を理解する上で，特徴空間の構造把握は重要である。
- クラス数が多い場合，特徴ベクトルの崩壊パターンが複雑化し，解析が困難である。
- クラス数と特徴空間の次元数に応じた特徴ベクトルの崩壊形状を特定し，理解を深める。
- 特徴ベクトルは，クラス数と特徴空間の次元数によって定義される直交多重体の頂点へと崩壊することが示された。
- この崩壊形状の解析には，ラドンの定理や凸幾何学の技術が用いられた。
- 本研究は，従来の単純なシンプレックス崩壊とは異なる幾何学的構造を明らかにした。
Link: https://arxiv.org/abs/2603.20587
LogFold：構造化トークンとハイブリッド符号化によるログの圧縮 [cs.SE]目的：ログデータの圧縮手法
- ソフトウェアシステムの規模拡大に伴い，ログデータ量が急増しており，効率的な圧縮が重要である。
- 既存のログ圧縮アルゴリズムは，複雑なトークン内の冗長性やトークンタイプに応じたきめ細かい符号化戦略が不足している。
- 構造化トークン内の新たな冗長性パターンを明らかにし，タイプに応じた符号化戦略を導入することで，ログ圧縮率の向上を目指す。
- LogFoldは，既存の最先端手法と比較して平均で11.11%の圧縮率向上を達成した。
- LogFoldは，16の公開ログデータセットを用いて検証され，その有効性が示された。
- 圧縮速度は9.842 MB/sであり，実用的な性能を備えている。
Link: https://arxiv.org/abs/2603.20618
次世代再構成可能推論アクセラレータのための最小命令セットアーキテクチャMINISA [cs.DC, cs.AR, cs.PL]目的：次世代再構成可能推論アクセラレータのための最小命令セットアーキテクチャ
- AI分野の発展に伴い，柔軟性と高性能を両立するアクセラレータが求められている。
- 微細な制御粒度による柔軟性は，オフチップメモリからの制御ビットのフェッチオーバーヘッドを増大させる。
- 制御コストを抑えつつハードウェアの柔軟性を維持する新たな制御方法の確立を目指す。
- MINISAは，仮想ニューロン（VN）単位での制御により，オフチップ命令トラフィックを大幅に削減した。
- 様々なGEMMワークロードにおいて，35倍から40万倍の命令トラフィック削減効果が確認された。
- これにより，マイクロインストラクションサイクルの96.9%を占める命令フェッチ遅延を解消し，最大31.6倍の性能向上を実現した。
Link: https://arxiv.org/abs/2603.20623
フレキシブルアンテナ搭載無線システムの有効ランク分析と最適化：可動アンテナかピンチングアンテナか？ [cs.IT, math.IT]目的：フレキシブルアンテナの空間自由度を客観的に分析・比較するための指標としての有効ランクの最適化
- 次世代無線通信において，空間自由度を効果的に活用することが重要であり，フレキシブルアンテナ技術はその鍵となる。
- 既存の評価指標では，フレキシブルアンテナの構造の違いによる空間自由度の変動を直接的に測定することが困難である。
- 可動アンテナとピンチングアンテナのアンテナ位置を最適化することで，有効ランクを向上させることを目指す。
- 提案手法であるGAIQNとMAGAQNは，ベンチマークと比較して有効ランクをそれぞれ少なくとも1.6%と1.3%向上させることをシミュレーションによって確認した。
- GAIQNとMAGAQNは，複数の可動アンテナやピンチングアンテナ間の衝突を回避しながら有効ランクの向上を実現する。
- 同じ数のフレキシブルアンテナを使用した場合，可動アンテナシステムはピンチングアンテナシステムよりも高い有効ランクを，ピンチングアンテナシステムはより安定した空間自由度を提供する。
Link: https://arxiv.org/abs/2603.20629
ドメイン固有言語に対するLLM生成コードの評価：LAMMPSによる分子動力学 [cs.SE, cond-mat.mtrl-sci]目的：LLM生成コードの妥当性評価手法
- 科学計算においてコードとデータの利用方法が変化しており，LLMの活用が重要である。
- LLMがドメイン固有言語(DSL)の科学的に有効なコードを生成できるか不明である。
- LLMのDSLコード生成能力の限界を明らかにし，活用方法を探る。
- LLM生成のLAMMPS入力ファイル評価手順を確立し，正規化と構文解析を用いたエラー検出を可能にした。
- LLMは科学的なDSLコード生成に限界があることが示された。
- ドメイン専門家によるLLMの活用に向けた実践的な道筋が提示された。
Link: https://arxiv.org/abs/2603.20630
AEGIS：手がかりから判決へ -- 方言とメタ監査によるグラフ誘導型脆弱性推論 [cs.CL, cs.CE, cs.SE, cs.AI, cs.CR]目的：脆弱性検出におけるLLMの推論の信頼性向上
- ソフトウェアの安全性確保は不可欠であり，脆弱性検出技術の発展が求められている。
- 既存のLLMを用いた脆弱性検出は，根拠の薄弱な推論や誤った依存関係の構築が課題となっていた。
- 閉じた事実基盤上での検証を通じて，より正確で信頼性の高い脆弱性検出を実現すること。
- AEGISは，Code Property Graphを用いた依存関係チェーンの動的再構築により，根拠のない推測を抑制した。
- Verifire AgentとAudit Agentの対立的議論と監査により，幻覚による誤った判決を防止する。
- PrimeVulデータセットにおいて，最新の性能を達成し，122のPair-wise Correct Predictionsを記録した。
Link: https://arxiv.org/abs/2603.20637
次世代マルチAP協調空間再利用のための階層型強化学習 [cs.NI, cs.ET, cs.IT, math.IT]目的：マルチAP協調空間再利用におけるネットワーク最適化
- 次世代Wi-Fiでは，AP間の協調が性能向上に不可欠であり，特にC-SRの効率的な実現が求められている。
- 従来の最適化手法は，AP間交渉のオーバーヘッドが大きく，複雑なパラメータ調整が必要となる。
- AP間協調による資源配分を最適化し，QoS要件を満たす効率的な手法を確立することを目指す。
- 提案手法は，システムレベルシミュレーションにより，ネットワークのスループット向上を検証した。
- 公平性も向上することから，次世代Wi-Fiネットワークへの応用が期待される。
- 二層Multi-Armed Banditアルゴリズムにより，全ノードへの公平な資源配分を維持しつつ最適化を実現した。
Link: https://arxiv.org/abs/2603.20647
REVERE：科学ワークフローのための反復進化型研究エンジニア [cs.RO, cs.SE, cs.AI]目的：科学ワークフローにおけるプロンプト最適化の枠組み
- 科学研究の効率化は，知識の進歩と社会への貢献に不可欠である。
- 既存手法は局所的な情報に依存し，タスク間の共通パターンを見逃すことが多い。
- グローバルな学習と反復的な改善により，研究コーディングの性能向上を目指す。
- REVEREは，グローバルな学習コンテキストを活用し，反復的な最適化を行うことで，既存の最先端手法を上回る性能を示す。
- SUPER，ResearchCodeBench，ScienceAgentBenchといったベンチマークにおいて，それぞれ4.50%，3.51%，4.89%の性能向上を達成した。
- 継続的な学習とグローバルメモリの統合メカニズムが，エージェントの能力進化に貢献することが示された。
Link: https://arxiv.org/abs/2603.20667
SWE-Next：エージェントのためのスケーラブルな現実世界のソフトウェアエンジニアリングタスク [cs.SE, cs.AI]目的：ソフトウェアエージェント学習のためのスケーラブルなソフトウェアエンジニアリングタスクおよび軌跡収集
- ソフトウェア開発の自動化は，生産性向上や開発コスト削減に貢献し，重要な研究分野である。
- 実世界のソフトウェアリポジトリからタスクを抽出する際，有効な事例が少なく，環境構築にコストがかかるという課題がある。
- 実リポジトリから高品質なタスクを効率的に収集し，学習データセットを構築することを目的とする。
- SWE-Nextは，テスト改善と回帰回避を厳密に検証することで，高品質な自己検証可能なタスクインスタンスを生成する。
- リポジトリの環境プロファイルを再利用することで，環境構築コストを削減し，データ収集の効率化を実現した。
- 実験結果から，SWE-Nextは，より高品質な教師あり学習データを提供し，少ない学習データで高いpass@1を達成することが示された。
Link: https://arxiv.org/abs/2603.20691
分散推定における重い裾のノイズへの対処：漸近的性能とトレードオフ [cs.IT, math.IT, math.OC]目的：分散推定における重い裾のノイズに対するアルゴリズムの提案
- IoT機器等の普及により，分散推定の重要性が増している。
- 重い裾のノイズは，通信や観測において問題となることが多い。
- 重い裾のノイズ下での，分散推定の性能限界を明らかにする。
- 提案アルゴリズムは，確実収束性と漸近正規性を持つことが示された。
- コンセンサスとイノベーションの更新に非線形性を導入することで，重い裾のノイズの影響を抑制する。
- ネットワークトポロジーとシステムノイズの間のトレードオフが明らかになった。
Link: https://arxiv.org/abs/2603.20728
散在因子の補集合 [cs.NI, cs.DS, cs.FL, math.CO]目的：散在因子の補集合の定義と性質
- 形式言語理論において，単語内の部分列の構造解析は重要な課題である。
- 散在因子の存在や非存在を効率的に判定する方法が未確立であった。
- 散在因子の補集合を導入し，その構造的特徴を明らかにすることで，この問題を解決する。
- 散在因子の補集合のサイズに関する組合せ論的結果が得られた。
- 与えられた単語と散在因子から補集合を計算するアルゴリズムが提案された（計算量はO(|w|・|u|・(w choose u))）。
- 補集合と元の単語から散在因子を再構築するアルゴリズムも提示された。
Link: https://arxiv.org/abs/2603.20790
AIコーディングツールのエンジニアリングにおける落とし穴：Claude Code，Codex，Gemini CLIにおけるバグの経験的研究 [cs.SE]目的：AIコーディングツールにおけるエンジニアリングの落とし穴の特定
- ソフトウェア開発においてAI支援ツールの活用が拡大しており，その品質が重要となっている。
- AI支援ツールの開発は，伝統的なソフトウェア工学，AIシステム設計，HCIの複雑な交差点上にあり，特有の課題を抱えている。
- 信頼性と堅牢性の高い次世代AIコーディングアシスタントを設計するための指針を提供する。
- これらのツールにおけるバグの67%以上が機能に関連していることが明らかになった。
- バグの根本原因の36.9%は，API，統合，または構成のエラーに起因していた。
- ユーザーから最も頻繁に報告される症状は，APIエラー（18.3%），ターミナル問題（14%），コマンド失敗（12.7%）である。
Link: https://arxiv.org/abs/2603.20847
不安定な異種無線ネットワークにおける深層適応レート割り当て [cs.IT, cs.LG, math.IT]目的：深層適応レート割り当て（DARA）による，動的な輻輳制御とデータ分配の最適化
- 5G+ネットワークの普及に伴い，移動体通信の安定性・性能向上が重要視されている。
- 特に車両ネットワーク等の高速移動環境では，無線リンク品質の変動が大きく，既存のスケジューラでは対応が困難である。
- 本研究では，Transformerを用いた経路状態予測とDARAを統合し，リアルタイムな輻輳制御を目指す。
- DARAは，適応的な輻輳窓フラクションを計算し，経路間のデータ分配を最適化する。
- 中程度の変動性を持つ環境下では，既存の学習型スケジューラと比較してファイル転送時間の短縮に貢献する。
- バッファリング制約下のストリーミングにおいて，DARAは顕著な再バッファリングの改善を実現し，最新のスケジューラが連続的な停止を示すのに対し，安定した動画再生を可能にする。
Link: https://arxiv.org/abs/2603.20926
因果誘導型拡散による安定特徴選択 [cs.LG, cs.AI, cs.IT, math.IT]目的：安定した特徴選択のための手法
- データ中心型AIにおいて，ロバストな性能を実現するには特徴選択が不可欠である。
- 既存手法は単一のデータ分布下での予測性能を最適化するため，分布シフトに弱い。
- 分布シフトに強い，安定した特徴選択手法を開発する。
- 提案手法CGDFSは，予測誤差と環境間分散の低減を目指し，特徴部分集合の事後推論として特徴選択を定式化する。
- 拡散モデルを学習事前分布として用いることで，特徴間の構造的依存性を捉え，大規模な探索を可能にする。
- 実データ実験の結果，CGDFSは既存手法と比較して，より安定かつ転移性の高い特徴部分集合を選択し，分布外性能を向上させる。
Link: https://arxiv.org/abs/2603.20930
エージェントのためのアクセス制御：AC4A [cs.RO, cs.CR, cs.AI, cs.PL]目的：エージェントのアクセス制御に関するフレームワーク
- LLMエージェントの利用拡大に伴い，セキュリティ確保が重要となる。
- 既存システムでは，アクセス権限が粗く，過剰な権限付与のリスクがある。
- 必要なリソースへのアクセスのみを許可するフレームワークを確立する。
- AC4Aは，APIやWebページへのアクセス権限を細かく制御するフレームワークである。
- Unixファイルシステムのアクセス制御を参考に，リソースを階層構造で定義する。
- 実世界のAPIとWebページを用いたケーススタディで，AC4Aの有効性を実証した。
Link: https://arxiv.org/abs/2603.20933
Accompanist: レジリエントなコレオグラフィックプログラミングのためのランタイム [cs.DC, cs.CE, cs.PL]目的：レジリエントなコレオグラフィックプログラミングのランタイム
- サービス指向アーキテクチャにおいて，分散トランザクションの信頼性確保が重要である。
- 中央オーケストレーターがない環境では，レジリエントなSagaトランザクションの実装が困難である。
- ランタイムによるフォールトトレランス機能により，プログラムの複雑さを抑えつつ，分散Sagaトランザクションを実現する。
- Accompanistは，Choralコレオグラフィックプログラミング言語のためのレジリエントなランタイムである。
- コンパイル済みのコードをサービス側面のサイドカーとしてデプロイすることで，分散Sagaトランザクションを実装できる。
- 決定性，べき等性，耐久性のあるメッセージキューという前提に基づき，コードの正当性を保証する形式モデルを提示する。
Link: https://arxiv.org/abs/2603.20942
複数の差分プライバシー制約に関する合成定理 [cs.DC, cs.IT, cs.CR, math.IT, math.ST, stat.TH]目的：差分プライバシー制約が同時に成立するメカニズムの正確な合成
- プライバシー保護は，データ利用における重要な課題であり，その厳密な保証が求められる。
- 複数のプライバシー制約を同時に満たすメカニズムの合成は，解析が困難である。
- 異質な差分プライバシー保証のメカニズムの合成を通して，この問題を解決することを目指す。
- 提案手法により，プライバシー領域を異質な差分プライバシー保証のメカニズムの混合として正確に表現できることが示された。
- この枠組みは，任意の数の差分プライバシー制約を持つメカニズムの合成にも自然に拡張される。
- 二項仮説検定の混合に関する構造的補題を通して，この結果が示された。さらに，$f$-DP合成への応用も試みられた。
Link: https://arxiv.org/abs/2603.20968
超規則行列と有限体上のMDS符号の確率 [cs.IT, math.IT]目的：有限体上の線形符号がMDS符号となる確率
- 符号理論は，通信や情報セキュリティの分野において重要な役割を担う。
- MDS符号の存在確率を正確に評価することは困難であった。
- 行列の超規則性に関する確率的閾値を明らかにすること。
- 符号のパラメータと有限体のサイズの関係から，MDS符号となる確率が0または1に収束する条件を導出した。
- 行列の超規則性についても同様の確率的閾値が成立し，その確率分布が指数関数的に減少することが示された。
- 特定のサイズの行列に対する超規則行列の数を評価し，多項式的な構造とそうでない構造の区別を示した。
Link: https://arxiv.org/abs/2603.20983
圧縮Transformerにおける構造感受性：誤差伝播， Lyapunov安定性，および形式的に検証された境界 [cs.LG, cs.AI, cs.CL, cs.LO]目的：Transformer圧縮時の構造感受性の分析
- Transformerは自然言語処理の基盤技術であり，その効率化は重要である。
- Transformerの圧縮は性能低下を引き起こす可能性があり，その原因の特定が課題である。
- Transformerの圧縮に対する構造感受性を定量化し，安定性を高める方法を模索する。
- GPT-2 Smallにおいて，単一の行列の圧縮がperplexityを大きく悪化させることが示された。
- 早期のMLP up-projectionは特に感受性が高く，value projectionは圧縮に強いことが明らかになった。
- Lyapunov安定性理論により，残差結合が誤差を抑制するメカニズムが説明され，形式的な誤差境界が証明された。
Link: https://arxiv.org/abs/2603.20991
データセンター内用途におけるコヒーレント伝送における多重経路干渉によるビット誤り率変動について [cs.IT, eess.SP, math.IT]目的：データセンター内用途におけるコヒーレント伝送におけるビット誤り率変動のメカニズム解明
- データセンター内通信は高速化・大容量化が進み，高効率な変調方式が求められている。
- 多重経路干渉は信号品質を劣化させ，高次変調方式の性能を制限する要因となる。
- コヒーレント伝送における多重経路干渉の影響を理論的に評価し，ビット誤り率変動を抑制する。
- 本研究では，多重経路干渉がPAM-4コンスタレーションの形状を変化させることを理論的に示した。
- このコンスタレーションの変化が，データセンター内通信においてビット誤り率の変動を引き起こすことを明らかにした。
- 従来の知見では説明できなかったビット誤り率変動のメカニズムを初めて解明した。
Link: https://arxiv.org/abs/2603.20995
スキルプローブ：マルチエージェント協調による創発的なエージェントスキルマーケットプレイスのセキュリティ監査 [cs.CR, cs.SE]目的：創発的なエージェントスキルマーケットプレイスのセキュリティ監査
- 大規模言語モデルエージェントの普及に伴い，スキルマーケットプレイスの重要性が増している。
- スキルマーケットプレイスでは，意味と行動の不整合やスキルの組み合わせによるリスクが課題となっている。
- 本研究は，マルチエージェント協調によるセキュリティ監査フレームワークを提案し，これらの課題を解決する。
- 大規模な評価により，ダウンロード数とセキュリティ品質には相関関係がないことが明らかになった。
- 高リスクスキルは，リスクリンクの次元で単一の巨大な連結成分を形成し，カスケードリスクが系統的なものであることを示した。
- 本研究は，信頼できるAgentic Webを構築するためのスケーラブルなガバナンス基盤の構築に貢献する。
Link: https://arxiv.org/abs/2603.21019
積分制約下における最小ダイバージェンスの二重表現 [cs.IR, cs.IT, math.IT, math.ST, stat.TH]目的：積分制約下における最小ダイバージェンスの二重表現の導出
- 統計学や確率論において重要な問題であり，逐次推論，バンディット理論，分布ロバスト最適化など，幅広い分野で応用される。
- 既存のアプローチでは，高次元や複雑な制約条件に対する汎用的な二重表現の導出が困難であった。
- 任意の分布に対する制約付き最小ダイバージェンスの二重表現を導き，実用的なアルゴリズムへの応用を目指す。
- 制約付き最小ダイバージェンスの二重表現を導出するための一般的な二段階手法を提案した。
- この手法は，有限サポート分布に対する古典的な凸双対性から始まり，それを任意の分布に拡張する抽象的な交換引数を用いる。
- 提案手法を応用し，逐次検定，推定，変化点検出における最適な手続きを構築した。
Link: https://arxiv.org/abs/2603.21027
Solidityのみによる学習を通じた低リソーススマートコントラクトにおけるゼロショット脆弱性検出 [cs.CR, cs.SE]目的：低リソースなスマートコントラクトの脆弱性検出
- 分散型金融の発展を支えるスマートコントラクトのセキュリティ確保は不可欠である。
- Vyper等の低リソース言語の脆弱性検出ツールが乏しく，学習データも限られている。
- Solidityで学習したモデルをVyperに適用し，データ不足を克服することを試みる。
- Sol2VyはSolidityからVyperへの知識転移を可能にする新しいフレームワークである。
- Solidityのみで学習されたSol2Vyは，Vyperコントラクトに対して高い検出性能を示した。
- 既存手法と比較して，Sol2Vyは有意に優れた性能を発揮する。
Link: https://arxiv.org/abs/2603.21058
費用対効果の高い自動運転車安全性テストにおける道路要素と車両ダイナミクスの役割：インスタンス空間解析からの洞察 [cs.SE]目的：自動運転車のテストシナリオにおける静的・動的要素，およびそれらの相互依存性とテスト結果の関係性
- 自動運転車の安全性確保は重要であり，実走行テストはコストとリスクが高い。
- シミュレーションテストは代替手段だが，安全性評価に必要なテストケースの生成が困難。
- 道路要素と車両ダイナミクスの相互作用を考慮することで，効率的なテストを可能にする。
- 本研究では，インスタンス空間解析を用いて道路要素と車両ダイナミクスがテスト結果に与える影響を分析した。
- 静的・動的要素を組み合わせることで，テスト結果の予測精度が向上することが確認された。
- 道路要素と車両ダイナミクスの相互作用が，自動運転車のテストにおける故障検出能力を高めることが示された。
Link: https://arxiv.org/abs/2603.21066
二項原始二重誤り訂正BCH符号の一般化被覆半径について [cs.IT, math.IT]目的：二項原始二重誤り訂正BCH符号の一般化被覆半径の決定
- 符号理論は，情報伝送における誤り訂正に不可欠であり，信頼性の高い通信を可能とする。
- 線形符号の一般化被覆半径の解析は複雑であり，特に高次の符号においては未解明な点が多い。
- 一般化スーパーコード補題を用いることで，より簡潔な証明と新たな下界の導出を目指す。
- 一般化スーパーコード補題を導入し，既知の下界の証明を簡素化し，新たな下界を確立した。
- $\rho_2(\text{BCH}(2,m))$ と $\rho_3(\text{BCH}(2,m))$ の下界証明を大幅に簡略化した。
- 十分大きな $m$ に対して，$2k \le \rho_k(\text{BCH}(2,m)) \le 2k+1$ が成り立つことを示した。
Link: https://arxiv.org/abs/2603.21068
ℓp距離空間における高速最近傍探索 [cs.DS, cs.CG, math.MG]目的：ℓp距離空間における最近傍探索のためのデータ構造
- 大規模データセットにおける効率的な情報検索の基盤技術であり，様々な応用分野で重要である。
- 高次元データにおける最近傍探索は計算コストが高く，実用上のボトルネックとなっている。
- ℓp距離空間において，高速なクエリ時間と省スペースを実現するデータ構造を構築すること。
- 本研究では，p>2のℓp空間における最近傍探索のためのランダム化データ構造を提案した。
- 提案手法は，高速なクエリ時間とpoly(dn)の空間複雑度を実現し，近似率がp^{O(1) + \log\log p}である。
- 既存の最先端手法と比較して，性能向上または同等レベルの性能を示すことが確認された。
Link: https://arxiv.org/abs/2603.21148
創発的形式検証：自律型AIエコシステムによる6つの領域におけるSMTベースの安全性独立発見 [cs.SE, cs.AI]目的：自律型AIエコシステムにおける形式検証の創発
- AIシステムの安全性確保は，社会実装において不可欠であり，その重要性は増している。
- 従来の安全性評価は，手動による検証に頼ることが多く，複雑化するAIシステムへの対応が困難である。
- AI自身が安全性評価手法を発見することで，より効率的かつ網羅的な検証が可能となる。
- 自律型AIエコシステムが，形式手法に関する明示的な指示なしに，6つの異なるAI安全性領域でZ3 SMTソルバーの使用を独立して提案した。
- この発見は，形式検証がAI安全性の単なる有用な技術ではなく，複雑なシステムが自己の安全性を考察する上で創発的に現れる特性であることを示唆する。
- 提案されたunified framework（substrate-guard）は，5つの実装された領域で181のテストケースに対し，100%の分類精度を達成し，実証的テストでは見逃されるバグを検出した。
Link: https://arxiv.org/abs/2603.21149