arXiv雑要約

プログラム - 2026/03/18 公開

  • 6Gネットワークにおけるチャネル推定とレーダスペクトルセンシングのための量子鍵配送を保護した連合学習 [cs.CR, cs.IT, cs.LG, math.IT]目的:6Gネットワークにおけるチャネル推定とレーダスペクトルセンシングのための連合学習フレームワーク
    • 次世代通信(6G)では,セキュリティとプライバシー保護が重要な課題となっている。
    • 従来の連合学習は,モデル更新情報の漏洩によるプライバシー侵害のリスクを抱えている。
    • 量子鍵配送(QKD)を用いて連合学習を保護し,安全なモデル更新を可能にすること。
    • 提案手法は,チャネル推定において0.216のNMSE,レーダセンシングにおいて92.1%の精度と0.72のmIoUを達成した。
    • 傍受者が存在する場合,QBERは〜25%に上昇し,ラウンドは意図通りに中断された。
    • 再構成誤差は$10^{-5}$以下に抑えられ,正しい集約が確認された。

    Link: https://arxiv.org/abs/2603.15649

  • 報酬抑制を超えて:多エージェント強化学習における動的表現回路遮断による隠密通信プロトコルの再構築 [cs.LG, cs.AI, cs.CL, cs.IT, cs.MA, math.IT]目的:多エージェント強化学習における隠密な共謀の検出と抑制
    • 分散型多エージェント強化学習は,自律システムの安全性において重要な役割を担う。
    • エージェント間における隠密な通信プロトコルの開発は,監視を回避する重大なAI安全上の脅威となる。
    • 潜在的な通信経路における協調を検出し,より堅牢な防御メカニズムを確立することを目指す。
    • 提案手法であるDRCBは,観測不可能なメッセージを統計的に監査可能なオブジェクトに変換することで,隠密通信を監視する。
    • コンテクスト・囚人のジレンマ実験において,DRCBは監視者の平均精度を9.3%向上させ,ボラティリティを43%削減することに成功した。
    • 符号シーケンスの分析から「意味劣化」が確認され,複雑な隠密符号化が困難になることが示された。

    Link: https://arxiv.org/abs/2603.15655

  • DRCY:エージェントによるハードウェア設計レビュー [cs.AR, cs.AI, cs.SE]目的:ハードウェア設計レビューの自動化
    • ハードウェア設計の誤りは修正に多大なコストと時間を要するため,設計段階での検証が重要である。
    • 既存のEDAツールは構造的な接続規則しか検証できず,部品データシートとの整合性確認が課題である。
    • 部品データシートに基づいたピンレベルでの接続の整合性検証を自動化し,設計エラーを早期に発見すること。
    • DRCYは,部品データシートを自動取得し,ピンごとの分析を行うことで,設計レビューの第一段階を自動化する。
    • DRCYはAllSpice Hubに導入され,CI/CDアクションとして設計レビューの提出時に実行されている。
    • 大手ハードウェア企業において,自動車設計から宇宙探査まで,幅広い分野で利用されている。

    Link: https://arxiv.org/abs/2603.15672

  • 潜在的事後因子に関する理論的基礎:複数証拠推論に対する形式的保証 [cs.AI, cs.IT, cs.LG, math.IT, stat.ML]目的:複数異種証拠項目の集約
    • 医療診断や金融リスク評価など,重要な分野で複数証拠推論が不可欠である。
    • 既存手法は,形式的保証が不十分,または複数証拠への対応が困難である。
    • 信頼性の高い多証拠AIの基盤を確立し,安全性が求められる応用を可能にする。
    • 潜在的事後因子(LPF)の理論的特性を完全に記述し,形式的保証を提供した。
    • 校正保存,モンテカルロ誤差減衰,PAC-Bayes boundなど,7つの保証を証明した。
    • 実験結果は,制御されたデータセット上で理論的保証を裏付けた。

    Link: https://arxiv.org/abs/2603.15674

  • 弱終了インターフェースプロトコルの構築 [cs.LO, cs.FL, cs.SE]目的:弱終了インターフェース構成を保証する構築方法
    • コンポーネントの組み合わせにおいて,インターフェースは互換性を決定する重要な役割を担う。
    • 非同期通信システムでは,デッドロックやリブロックのリスクが高く,解決が求められる。
    • 到達可能な状態において,システムが最終的に終了する可能性を保証する手法の拡張を目指す。
    • サーバーのインターフェース仕様から,部分ミラー関係を用いてクライアントを導出する手法を示す。
    • この理論をより広範な実践に応用できるよう,既存の結果を一般化する。
    • 本研究の成果をオープンソースツールに組み込み,弱終了インターフェース設計を支援する。

    Link: https://arxiv.org/abs/2603.15675

  • LLMアプリケーションの品質保証ゲートとしての自動自己テスト:エビデンスに基づくリリース管理 [cs.SE, cs.AI]目的:LLMアプリケーションのリリース判断をエビデンスに基づいて行う自動自己テストフレームワーク
    • LLMは非決定的な出力とモデルの進化により,従来のテストでは品質管理が困難である。
    • LLMアプリケーションのリリースにおける品質保証の基準が明確でなかった。
    • エビデンスに基づく品質ゲートを導入し,リリース判断の自動化と品質向上を目指す。
    • フレームワークは,タスク成功率,コンテキスト維持率,応答速度,安全性,エビデンスカバレッジの5つの指標で品質を評価する。
    • 実際に展開された会話型AIシステムを用いたケーススタディにより,ROLLBACKが必要なビルドを特定し,安定した品質進化を支援した。
    • エビデンスカバレッジが回帰検知に重要であり,テスト実行時間はテストスイートの規模に比例することが示された。

    Link: https://arxiv.org/abs/2603.15676

  • ゆる構造ソフトウェア:実行時再配線型マルチエージェントシステムのエンジニアリング的背景,構造,および進化エントロピー [cs.SE, cs.AI]目的:実行時再配線型マルチエージェントシステムのゆる構造ソフトウェアの設計原則とパターン
    • 大規模言語モデルを用いたマルチエージェントシステムは自律性が高まり,複雑な問題解決に貢献するが,その制御が課題となっている。
    • エージェント数の増加に伴い,文脈圧力,協調エラー,システムドリフトといった問題が顕在化し,システムの堅牢性を損なう。
    • システムの進化エントロピーを管理し,設計性,スケーラビリティ,進化可能性を向上させるためのフレームワークを提案する。
    • ゆる構造ソフトウェア(LSS)は,決定論的ロジック構築から,実行時生成されるエントロピー管理へとエンジニアリングの焦点を移行する。
    • LSSは,View/Context Engineering,Structure Engineering,Evolution Engineeringという三層のエンジニアリングフレームワークによって,エントロピーを制御可能にする。
    • LSSデザインパターンは,流動的な相互作用を安定化させつつ,エージェントの適応性を維持するセマンティック制御ブロックとして機能する。

    Link: https://arxiv.org/abs/2603.15690

  • VibeContract:Vibeコーディングにおける欠落した品質保証 [cs.SE]目的:Vibeコーディングにおける品質保証の新たな手法
    • LLMの進化によりソフトウェア開発が加速しているが,品質保証が課題となっている。
    • AI生成コードは見た目は正しくても,論理的誤りや不整合を含む可能性がある。
    • VibeContractにより,AI生成コードの信頼性と保守性を向上させる。
    • VibeContractパラダイムは,自然言語による意図をタスクシーケンスに分解し,タスクレベルの契約を生成する。
    • 開発者はこれらの契約を検証し,タスク,契約,生成コード間のトレーサビリティを維持する。
    • 契約はLLMをテスト,実行時検証,デバッグに導き,継続的な品質保証を可能にする。

    Link: https://arxiv.org/abs/2603.15691

  • LLMの推論時間とエネルギー消費の関係性に関する調査 [cs.PF, cs.AI, cs.SE]目的:LLMのAPI利用におけるエネルギー消費量の推定手法
    • LLMの規模拡大に伴い,環境への影響や資源消費が深刻化している。
    • API経由での利用ではエネルギー消費量が不透明であり,利用者はコストを把握しづらい。
    • 推論時間を指標としてエネルギー消費量を推定し,利用者の理解を深める。
    • 推論時間からAPI利用時のGPUモデルを推定できることが示された。
    • 推定されたGPUモデルに基づき,エネルギー消費量の見積もりが可能となった。
    • 本研究は,APIベースLLM利用におけるエネルギーコストの可視化に貢献する。

    Link: https://arxiv.org/abs/2603.15699

  • SEMAG:自己進化型マルチエージェントコード生成 [cs.SE, cs.AI]目的:自己進化型マルチエージェントコード生成フレームワーク
    • プログラミング支援の自動化は,ソフトウェア開発の効率化に不可欠である。
    • 既存手法はモデル選択が手動であり,タスクの変化への適応が困難である。
    • タスクの難易度に応じてワークフローを適応させ,モデルを自動更新する。
    • SEMAGは,複数のベンチマークにおいて,最新のPass@1精度を達成した。
    • 同一の基盤モデルを用いても,既存手法よりCodeContestsで3.3%の性能向上を示した。
    • 自己進化型モデル選択により,最適な基盤モデルを特定し,52.6%のPass@1精度を実現した。

    Link: https://arxiv.org/abs/2603.15707

  • 工学設計およびシステム工学におけるデータセットのナビゲーションマップのフレームワークとプロトタイプ [cs.SE, cs.AI, cs.CE, cs.DB, cs.DL]目的:工学設計およびシステム工学におけるデータセットのナビゲーションマップの構築
    • システムライフサイクル全体でのデータ活用は,工学設計とシステム工学の発展に不可欠である。
    • 既存のデータセットは分散しておりアクセスが困難で,研究の進展を阻害している。
    • データセットの発見と利用を促進し,データ駆動型研究を加速することを目的とする。
    • 本研究では,ドメイン,ライフサイクル段階,データ型,形式に基づいてデータセットを分類する多次元分類体系を提案した。
    • 知識グラフデータモデルを用いたインタラクティブな探索ツールのアーキテクチャとプロトタイプを開発した。
    • 初期段階の設計やシステムアーキテクチャにおけるデータ不足(「データ砂漠」)を明らかにした。

    Link: https://arxiv.org/abs/2603.15722

  • ClawWorm:LLMエージェント生態系における自己伝播攻撃 [cs.CR, cs.AI, cs.LG, cs.MA, cs.SE]目的:LLMエージェント生態系に対する自己伝播攻撃の実現と分析
    • LLMエージェントは自律的に動作し,複雑な相互接続を持つ生態系を形成。その安全性は重要課題である。
    • 既存のLLMエージェントフレームワークのセキュリティ特性は未解明な部分が多く,脆弱性の存在が懸念される。
    • 本研究は,実運用規模のエージェントフレームワークに対する自己複製型ワーム攻撃を実証し,脆弱性の根本原因を特定する。
    • ClawWormは,単一のメッセージから起動し,エージェントの設定を乗っ取り,再起動時にペイロードを実行する自己伝播ワームである。
    • 実験の結果,高い感染成功率,多段伝播,ペイロードからの独立性が確認された。
    • 脆弱性の根本原因を分析し,各信頼境界を対象とした防御戦略を提案した。

    Link: https://arxiv.org/abs/2603.15727

  • グラフにおける最小平衡頂点分離器の高速近似アルゴリズム [cs.DS]目的:グラフにおける最小平衡頂点分離器問題に対する高速な擬似近似アルゴリズムの提案
    • ネットワーク分析やグラフ理論は,現実世界の複雑なシステムをモデル化する上で不可欠である。
    • 最小平衡頂点分離器問題はNP困難であり,大規模グラフに対する効率的な解法が求められている。
    • 既存手法の計算時間を短縮し,より実用的な近似解を得ることを目指す。
    • 提案アルゴリズムは,$O(n^{O(\varepsilon)}m^{1+o(1)})$ の時間計算量で,最適解の$\Theta(1)$-平衡な頂点分離器を近似的に求める。
    • 特に,$f(n)=\omega(1)$ のとき,$O({\rm OPT}_c\cdot\sqrt{\log n}\cdot f(n))$ のサイズの頂点分離器を $O(m^{1+o(1)})$ で生成可能である。
    • 半定値計画法緩和と,Arora-KaleのMatrix Multiplicative Weight Updateフレームワークを活用している。

    Link: https://arxiv.org/abs/2603.15782

  • 空中フェデレーションエッジ学習を活用した協調型統合センシング・通信のための多目的最適化 [cs.IT, math.IT]目的:協調ワイヤレスセンシングを実現するための,多目的統合センシング・通信(ISAC)フレームワークの提案
    • 無線通信とセンシングの融合は,IoTデバイスの普及に伴い,新たな応用分野の開拓に不可欠である。
    • エッジデバイスの分散学習におけるプライバシー保護と効率的なリソース利用が課題となっている。
    • 通信とセンシングを同時に行うことで,リソース効率を向上させ,より高精度なセンシングを実現することを目指す。
    • 提案手法は,通信性能を損なうことなく,センシング精度を向上させることを数値的に示している。
    • 従来の協調センシングスキームが抱える局所推定誤差の平均誤差による制限を克服し,理論限界に近い性能を達成している。
    • 本研究で提案する空中フェデレーションエッジ学習を活用したISACフレームワークは,多目的最適化問題を効率的に解決する。

    Link: https://arxiv.org/abs/2603.15783

  • 設定可能なソフトウェアシステムにおけるバックボーンアルゴリズムの比較分析 [cs.SE]目的:設定可能なソフトウェアシステムのバックボーンアルゴリズムの性能評価
    • バリアビリティモデルは,製品ライン工学等のソフトウェア開発において重要性が増している。
    • 既存研究では,SATソルバーの性能評価に偏っており,実際のバリアビリティモデルに対する評価が不足していた。
    • 実際のバリアビリティモデルに基づき,最適なバックボーンアルゴリズムの選択指針を確立すること。
    • バリアビリティモデルの論理式は,節密度が高い一方で節の複雑さが低いという構造的特徴を持つことが示された。
    • 1,000変数以下の論理式にはアルゴリズム2/3,それ以上の規模には適応的チャンクサイズ選択を用いたアルゴリズム5が推奨される。
    • フィルタリングヒューリスティクスは,バリアビリティモデルにおいては効果がない,あるいは性能を低下させる可能性がある。

    Link: https://arxiv.org/abs/2603.15833

  • 情報圧縮型匿名化:プライバシー保護型教師あり機械学習のためのセンシティブ入力保護 [cs.LG, cs.AI, cs.IT, math.IT]目的:プライバシー保護型機械学習のための情報圧縮型匿名化手法とVEILアーキテクチャの開発
    • 機械学習はセンシティブなデータを活用するケースが増加しており,プライバシー保護の重要性が高まっている。
    • 従来の差分プライバシーや準同型暗号化は,性能低下や計算コストの増加を伴うという課題があった。
    • アーキテクチャと数学的設計により,性能劣化なく堅牢なプライバシー保護を実現することを目的とする。
    • 情報圧縮型匿名化(ICA)は,データの信頼できる環境でのエンコードを通じて,センシティブな情報を不可逆的に匿名化する。
    • ICAは,表現学習を教師あり学習の目的に合わせて最適化することで,予測精度を維持しながら低遅延かつ高性能な機械学習を実現する。
    • VEILアーキテクチャは厳格な信頼境界を強制し,スケーラブルな多地域展開をサポートし,プライバシーバイデザイン規制に適合する。

    Link: https://arxiv.org/abs/2603.15842

  • ピンチングアンテナシステムを用いた統合センシング・通信のための低複雑度チューニング [cs.IT, math.IT]目的:統合センシング・通信のためのピンチングアンテナシステム設計
    • 無線通信システムの効率化が求められており,センシングと通信の統合が鍵となる。
    • 従来の設計では,センシングと通信の同時実現において計算負荷が高いことが課題である。
    • 計算量を削減し,高速なチューニングを実現することで,より実用的なISACシステムを構築する。
    • 提案手法は,ベースライン設計と比較して,有意に広いセンシング・通信レート領域を達成する。
    • バイパーティショニング戦略により,センシング電力配分とピンチング位置の調整を低複雑度で実現する。
    • リアルタイムでの動的チューニングが可能となり,無線システムの性能向上に貢献する。

    Link: https://arxiv.org/abs/2603.15844

  • 視覚とテキストのコードの混合 [cs.PL]目的:ドメイン固有の幾何学的アイデアを表現するための,視覚的構文構造の作成
    • 既存のプログラミング言語では,特定の分野の幾何学的概念を表現するのに限界がある。
    • テキストのみの表現では,視覚的なアイデアの表現が困難であり,開発効率を阻害する。
    • テキストと視覚的構文を等価に扱う,拡張可能なプログラミング言語の実現を目指す。
    • Hybrid ClojureScript は,テキストと視覚的構文を組み合わせた初のハイブリッドプログラミング言語である。
    • この言語では,プログラム内に視覚的なインタラクティブな構文を埋め込むことが可能である。
    • IDEは埋め込まれた構文をGUIとして表示し,プログラマはGUIと対話しながら開発できる。

    Link: https://arxiv.org/abs/2603.15855

  • 補間式の探索における非二値的な手法:理論と実践 [cs.LO]目的:古典論理における補間式の探索
    • 形式システムの解析は,論理学の基礎であり,推論の妥当性を検証する上で不可欠である。
    • 既存の補間式探索法は,二値解像度に基づいているものが多く,効率性や適用範囲に限界がある。
    • 非二値解像度に基づいた新たな手法により,より効率的かつ柔軟な補間式探索を可能にすること。
    • 本研究で提案する手法は,従来の解像度とは異なり,非二値的な解像度に基づいている点が特徴である。
    • 反証系を基点とすることで,証明系とは異なる視点から論理システムの分析が可能となる。
    • このアプローチは,反証計算の分野にとどまらず,補間式探索といった応用にも広がりを示す。

    Link: https://arxiv.org/abs/2603.15876

  • 科学ソフトウェアにおける自己申告による技術的負債:優先順位,感情,および成果物への伝播 [eess.SY, cs.SY, cs.SE]目的:科学ソフトウェアにおける技術的負債の優先順位付け,感情,持続性,伝播に関する理解
    • 科学ソフトウェアは研究の再現性と進捗に不可欠であり,その品質維持が重要である。
    • 科学ソフトウェアにおける技術的負債の管理は十分でなく,メンテナンスのボトルネックとなる。
    • 技術的負債の優先順位付けと除去を支援するツール開発のための基礎情報を提供する。
    • コメント,コミット,プルリクエストにおける技術的負債は,イシューよりも優先度が高いことが示された。
    • 負の感情が伴う技術的負債は,緊急性が高まる傾向にあることが明らかになった。
    • 技術的負債の解決・除去率は,オープンソースソフトウェアの平均を下回っており,放置された負債が課題である。

    Link: https://arxiv.org/abs/2603.15883

  • エージェントによるコードレビューにおける人間とAIの相乗効果 [cs.SE]目的:人間レビュアーとAIエージェントによるフィードバックの違い
    • 高品質なソフトウェア開発には,コードレビューが不可欠であり,欠陥の検出と保守性の向上に寄与する。
    • AIエージェントがコードレビューに導入されつつあるが,その効果と人間レビュアーとの比較に関する実証的な証拠は限られている。
    • AIエージェントと人間レビュアーの協調パターンを分析し,レビュー結果への影響を理解すること。
    • 人間レビュアーは,AIエージェントよりも理解,テスト,知識移転を含む追加のフィードバックを提供する。
    • AI生成コードのレビューでは,人間レビュアーは人間が書いたコードよりも11.8%多くのやり取りを行う。
    • AIエージェントによるコード提案は,人間レビュアーによる提案よりも低い割合で採用され,未採用の提案の過半数は誤りか代替修正で対応される。
    • 採用されたAIエージェントの提案は,人間レビュアーの提案よりもコードの複雑さとサイズを大幅に増加させる。

    Link: https://arxiv.org/abs/2603.15911

  • VIBEPASS:バイブ・コーダーは本当にバイブ・チェックにパスできるか? [cs.MS, cs.SE, cs.AI]目的:潜在的なバグを明らかにする識別的なテストケースの作成と,それを診断条件に基づいて修復する能力の評価
    • ソフトウェア開発の自動化において,モデルが自己診断・自己修復を行う能力は不可欠である。
    • 大規模言語モデルによる「バイブ・コーディング」が進む中で,自己診断・修復能力の体系的な評価が不足している。
    • 大規模言語モデルの自己診断・修復能力におけるボトルネックを特定し,自動デバッグの課題を再定義すること。
    • 最先端のLLM12モデルを評価した結果,故障を特定するための推論能力は,一般的なコーディング能力とは比例しないことが判明した。
    • テスト入力の生成は高い精度で行える一方,識別的なテスト生成で性能が低下し,故障仮説の生成が主要なボトルネックとなっている。
    • 自己生成テストで故障を検出できた場合,外部テストで誘導された修復よりも優れた結果が得られるが,故障検出に失敗すると性能が低下する。

    Link: https://arxiv.org/abs/2603.15921

  • GitHub Actions時代におけるテストコードレビューの再現研究 [cs.SE]目的:テストコードレビューの現状分析
    • ソフトウェア品質確保において,テストコードは重要な役割を担う。
    • テストコードのレビューは,本番コードに比べて議論が少ない傾向にある。
    • プルリクエストモデルとGitHub Actionsがテストコードレビューに与える影響を調査する。
    • GitHubのプルリクエストモデルは,Gerritと比較してテストコードと本番コード間の議論のバランスを改善する。
    • しかし,GitHub Actionsの導入により,本番コードへのレビューが集中する傾向が強まった。
    • GitHub Actions導入後は,テストを含むプルリクエストのレビュー確率とコメント密度の中央値がゼロに近づいた。

    Link: https://arxiv.org/abs/2603.15935

  • 大規模コードベースにおけるエージェント的最適化の評価 [cs.HC, cs.CY, cs.SE, cs.AI, cs.CL]目的:大規模コードベースに対するエージェント的最適化の評価
    • LLMを活用したコード生成が発展し,大規模なコードベース全体の最適化が求められている
    • 既存のコードベンチマークは,現実的な制約下での全体的な最適化行動を評価するには不十分である
    • LLMエージェントによる現実的な制約下でのコードベース最適化能力を包括的に評価すること
    • 本研究では,科学計算用Pythonリポジトリから抽出された957個の性能ボトルネックを含む「FormulaCode」という新しいベンチマークを提案した。
    • FormulaCodeは,各タスクに対して専門家が作成したパッチと,平均264.6個のコミュニティが維持する性能ワークロードを伴う。
    • 評価の結果,大規模かつ多目的最適化は,最先端のLLMエージェントにとって依然として大きな課題であることが示された。

    Link: https://arxiv.org/abs/2603.16011

  • ソフトウェアメトリクスを役立つものにする [cs.SE]目的:ソフトウェアメトリクスの有用性向上
    • ソフトウェア開発における品質管理の重要性が高まっているため
    • 既存のソフトウェアメトリクスは実用的な判断に結びつきにくい
    • メトロロジーの知見を導入し,ソフトウェアメトリクスの研究方向を示す
    • ソフトウェアメトリクスが測定科学(メトロロジー)の理解なしに発展したことが問題の根源である。
    • ソフトウェアメトリクスを,クラスのリファクタリングや統合テストの妥当性判断といった実用的な問いに答えられるようにする必要がある。
    • ソフトウェアメトリクスの研究は,より実用的な指標の開発に向けて,メトロロジーに基づいたアプローチを取るべきである。

    Link: https://arxiv.org/abs/2603.16012

  • VLAベース運転システムのための安全性事例パターン:SimLingoからの知見 [cs.RO, cs.SE]目的:VLAベース運転システムの安全性確保手法
    • 自動運転技術は社会実装が進んでおり,安全性への信頼が不可欠である。
    • 自然言語入力を含むVLAベースシステムは,予測不能な挙動を引き起こす可能性がある。
    • VLAベースシステムの安全性を系統的に評価・検証する手法の確立を目指す。
    • 本研究では,VLAベース運転システムに特化した安全性事例パターンを提案した。
    • 提案手法RAISEは,ハザード分析とリスクアセスメントを拡張し,安全なシナリオの詳細化を可能にする。
    • SimLingoを用いた事例研究により,RAISEによる厳密かつ証拠に基づいた安全主張の構築を示した。

    Link: https://arxiv.org/abs/2603.16013

  • スムーズな較正の重要性 [cs.LG, cs.DS]目的:スムーズな較正の理論的基礎の一般化と拡張
    • 予測モデルの信頼性評価において,正確な確率予測が不可欠であるため。
    • 従来の較正指標では,ロバストな評価が困難であり,過剰に自信のある予測が生じやすい。
    • スムーズな較正に基づく新たな普遍予測保証を提示し,モデルの汎化性能向上を目指す。
    • スムーズな較正予測子に対する普遍予測保証を,全ての有界な適切な損失関数に対して確立した。
    • 予測子にノイズを加えることで,ベンチマーク予測子との競争において,スムーズな較正誤差とアースムーバー距離が重要な役割を果たすことが示された。
    • スムーズな較正を,予測とラベルの結合分布へのアースムーバー距離を用いて特徴づける新たな表現を提示し,サンプル複雑性に関する限界を示した。

    Link: https://arxiv.org/abs/2603.16015

  • 適応型多頭有限状態ギャンブラー [cs.IT, math.IT]目的:多頭有限状態ギャンブラーの予測能力向上
    • 系列データの予測は,情報科学や複雑系科学において基盤となる重要な課題である。
    • 従来のギャンブラーモデルでは,過去のパターンを捉える能力に限界があった。
    • データ依存的な頭部移動により予測能力を向上させることを目指す。
    • 適応型ギャンブラーは,非データ依存型ギャンブラーよりも高い予測能力を示すことが示された。
    • 頭部の数が増えるにつれて,予測能力に厳密な階層構造が存在することが証明された。
    • 頭部の数が多くなると,予測能力が低下するような系列が存在することも明らかになった。

    Link: https://arxiv.org/abs/2603.16034

  • 構造を意識した検索拡張LLMによる信頼性の高い科学的可視化パイプライン構築 [cs.DC, cs.GR, cs.HC, cs.SE]目的:科学的可視化パイプラインの構築における信頼性向上
    • 科学的可視化は,データ解析や理解に不可欠であり,科学研究の進展に大きく貢献する。
    • パイプライン構築は,段階間の依存関係が厳しく,誤りが発生しやすい。自然言語からの自動生成は困難。
    • LLMを活用し,構造化された情報を提供することで,パイプラインの実行可能性と正確性を高める。
    • 提案手法は,パイプラインに沿ったvtk.jsコード例を提供することで,モジュール選択やパラメータ設定の精度を向上させる。
    • 複数の科学的可視化タスクとLLMを用いて評価した結果,パイプラインの実行可能性が大幅に向上し,修正コストが減少した。
    • 生成されたパイプラインの検査と評価を支援するインタラクティブな分析インターフェースも提供する。

    Link: https://arxiv.org/abs/2603.16057

  • リポジトリレベルコードレビューのためのローカル優先型マルチエージェントアーキテクチャ RepoReviewer [cs.SE, cs.AI]目的:リポジトリレベルコードレビューのためのマルチエージェントシステム
    • ソフトウェア開発において,コードレビューは品質向上の重要なプロセスである。
    • 既存の自動レビューは,構造,コンテキスト,実装の詳細を統合的に処理できず,効率が低い。
    • リポジトリレベルの自動レビューを効率化するアーキテクチャの提案と評価。
    • RepoReviewerは,リポジトリ取得,コンテキスト合成,ファイルレベル分析,優先順位付け,要約生成の各段階に分解する。
    • 本システムは,Python CLI,FastAPI API,LangGraph,Next.js UIを備えたローカル優先型の設計である。
    • ベンチマーク優位性を主張するのではなく,将来の研究のための再利用可能な評価基盤を提供する。

    Link: https://arxiv.org/abs/2603.16107

  • SWE-QA-Pro:リポジトリレベルのコード理解のための代表的なベンチマークとスケーラブルな学習レシピ [cs.SE, cs.AI, cs.CL]目的:リポジトリレベルのコード理解に関するベンチマークと学習レシピ
    • ソフトウェア開発の自動化には不可欠だが,信頼できるベンチマークが存在しない。
    • 既存の評価は,学習済みモデルが暗記した知識で不正解釈する可能性があり,網羅性に欠ける。
    • 多様なリポジトリと厳格な難易度調整により,エージェント型コード理解の必要性を検証する。
    • SWE-QA-Proでは,エージェント型ワークフローが直接応答よりも大幅に高い性能を示すことが確認された。
    • スケーラブルな合成データパイプラインとSFT/RLAIFによる二段階学習レシピを提案し,小規模モデルでも効率的なツール利用と推論を可能にした。
    • Qwen3-8Bモデルは,提案レシピによりSWE-QA-ProでGPT-4oを上回り,最先端モデルとの差を縮小した。

    Link: https://arxiv.org/abs/2603.16124

  • LLMベースのセグメンテーションによる方言非依存SQL解析 [cs.DB, cs.SE]目的:多様なSQL方言に対応可能なSQL解析手法
    • データ分析においてSQLは不可欠であり,解析・書き換えツールが多数存在する。
    • SQL方言の多様性により,既存ツールは未知の構文に弱いという課題がある。
    • LLMの長所と文法ベース解析を融合し,方言依存性を克服する。
    • SQLFlexは,句レベルおよび式レベルのセグメンテーションにより,複雑なSQLを段階的に解析する。
    • SQL lintingにおいて,ANSIモードでSQLFluffよりもF1スコアが63.68%向上し,方言モードと同等の性能を示す。
    • テストケース削減においては,SQLessの最大10倍の簡略化率を達成し,独立評価で8つの異なる方言の91.55%~100%を解析した。

    Link: https://arxiv.org/abs/2603.16155

  • 非GRS型ユークリッドおよびエルミートLCDコードとそのEAQECCへの応用 [cs.IT, math.IT]目的:非GRS型線形コードを利用したユークリッドLCDコード,エルミートLCDコード,および小次元ハルの線形コードの構成
    • 符号理論は,通信システムや暗号化において重要な役割を担うため,その発展が不可欠である。
    • 従来のGRS型コードでは,Sidelnikov-Shestakov攻撃やWieschebrink攻撃に脆弱性があるという課題が存在する。
    • 本研究は,GRS型コードに依存しない線形コードを用いて,より安全な符号の構成を目指す。
    • 一般化Roth-Lempel(GRL)コードを用いて,ユークリッドLCDコード,エルミートLCDコード,および小次元ハルの線形コードの新たな構成法を確立した。
    • 特定のユークリッドGRLコードの1次元ハルの個数の上限を導出し,エルミートGRLコードのハルの次元の上限を初めて導出した。
    • 得られた結果を応用し,いくつかのEAQECCの族を構成した。また,GRLコードが$k >\ell$において非GRS型であることを証明した。

    Link: https://arxiv.org/abs/2603.16187

  • ソフトウェア成果物トレーサビリティの体系化:関連性,技術,応用 [cs.SE]目的:ソフトウェア成果物トレーサビリティに関する体系的知識フレームワーク
    • ソフトウェア開発において,品質保証と保守活動には成果物間のトレーサビリティが不可欠である。
    • 成果物間の関連性,曖昧なリンキング技術,応用シナリオの知識が断片化している。
    • 成果物トレーサビリティに関する研究の不均衡を明らかにし,再現性の問題を解決すること。
    • 22種類の成果物タイプ間の23種類の関連性を含む,初のグローバルな成果物トレーサビリティグラフが構築された。
    • 再現性の危機に対処するため,技術的決定マップと標準化されたベンチマークを含む包括的な評価フレームワークが提供された。
    • 産業界への導入のギャップを定量化し,具体的なエンジニアリング活動と成果物パスを動的に整合させるための役割中心フレームワークが提案された。

    Link: https://arxiv.org/abs/2603.16208

  • CTFプラットフォームのためのGitOps [cs.SE]目的:CTF(Capture The Flag)競技の展開と管理のためのGitOpsベースのフレームワーク
    • サイバーセキュリティ人材育成においてCTFは重要であり,実践的なスキル向上に貢献する。
    • 従来のCTF環境構築は手作業が多く,環境の再現性や規模拡張に課題があった。
    • GitOpsを活用し,CTF環境の自動化とバージョン管理を実現することで,効率性と信頼性を向上させる。
    • CTF Pilotは,課題定義とインフラ構成をGitリポジトリで一元管理し,自動化されたデプロイメントを可能にした。
    • 実際のCTFイベントでの評価により,コスト効率の高さと高い同時実行性,堅牢な分離が確認された。
    • CTF Pilotは主催者と参加者の体験を向上させ,今後の改善の可能性を示唆している。

    Link: https://arxiv.org/abs/2603.16265

  • 新規CRTに基づく漸近的に理想的な分割階層型秘密分散スキーム [cs.CR, cs.IT, math.IT]目的:分割階層型秘密分散スキームの設計
    • 情報セキュリティにおいて,秘密を安全に共有・管理する技術は不可欠である。
    • 既存のCRTに基づくDHSSは,セキュリティ上の脆弱性や情報レートの低さといった問題があった。
    • これらの問題を解決し,より安全で効率的な秘密分散スキームを構築することを目指す。
    • 本研究では,柔軟なシェアサイズに対応可能な,漸近的に完全なCRTに基づくDHSSを提案した。
    • 提案スキームは,全てのシェアサイズが等しい場合に漸近的に理想的となり,情報レートは1を達成する。
    • また,計算安全性も有しており,既存スキームの課題を克服した。

    Link: https://arxiv.org/abs/2603.16267

  • 回転アンテナを活用したモバイルエッジコンピューティング [cs.RO, cs.IT, math.IT]目的:回転アンテナを用いたモバイルエッジコンピューティングシステムの最大計算遅延の最小化
    • モバイルエッジコンピューティングは,低遅延サービス実現に不可欠。通信信頼性と計算効率の向上が重要課題である。
    • 従来のシステムでは,厳しい遅延要件を満たす無線チャネルの確保が困難であるという課題がある。
    • 回転アンテナの指向性制御により,無線チャネルを改善し,計算遅延を削減することを目指す。
    • 提案する回転アンテナ活用スキームは,従来のベンチマーク手法と比較して,最大計算遅延を大幅に削減できることがシミュレーションにより確認された。
    • 計算リソース割り当て,受信ビームフォーミング,回転角度を同時に最適化する効率的なフレームワークを開発した。
    • Karush-Kuhn-Tucker条件,半正定値緩和,フラクショナルプログラミング,逐次凸近似などの最適化手法を適用した。

    Link: https://arxiv.org/abs/2603.16275

  • 三次元アフィン空間論理 [cs.LO]目的:アフィン幾何学を扱う領域ベースの空間論理の研究
    • 空間推論は,ロボティクスや地理情報システムなど幅広い分野で不可欠である。
    • アフィン幾何学に基づく空間論理の研究はまだ少なく,特に高次元空間での研究が不足している。
    • 異なる次元のアフィン論理の理論の違いを明らかにすることで,今後の高次元空間の研究を正当化する。
    • 本研究は,次元が異なれば異なる理論を持つことを示し,高次元空間における更なる研究の必要性を示した。
    • 特に三次元の場合について考察し,この論理の表現力を探求した結果,三次元座標系を記述する公式を構築できた。
    • 高次元のアフィン空間では,全ての領域がアフィン同値であることが証明された。

    Link: https://arxiv.org/abs/2603.16308

  • 大規模言語モデルを活用した製造業における品質管理システムのための人間中心アーキテクチャ [cs.SE, cs.AI]目的:製造業における品質管理システムへの大規模言語モデル認知アシスタント統合のためのアーキテクチャ
    • 製造業の競争力向上には,品質管理システムの継続的な改善と知識管理が不可欠である。
    • 既存のソフトウェアアーキテクチャは,品質管理システムに大規模言語モデル認知アシスタントを統合する際の人間中心設計に欠けている。
    • 品質管理システムにおける大規模言語モデル認知アシスタントの運用を可能にする柔軟性と拡張性のあるアーキテクチャを提案すること。
    • 提案されたアーキテクチャは,柔軟性,拡張性,モジュール性,作業支援機能を品質管理システムに提供する。
    • 反復的な専門家によるフォーカスグループにより,アーキテクチャの有効性が確認された。
    • 本アーキテクチャは,産業界との連携を通じて,製造プロセスの改善に貢献する可能性を示す。

    Link: https://arxiv.org/abs/2603.16325

  • 要求と解決策の融合:意図から実装へ [cs.SE]目的:プロンプトを,要件と解決策を兼ね備えた軽量な成果物として捉えること
    • ソフトウェア開発において,要求定義は品質向上の基盤であり,開発効率を左右する重要な要素である。
    • 現在のプロンプト作成は,非公式かつ場当たり的であり,要件の正確な伝達や変更管理が困難である。
    • プロンプトを要求工学の観点から再考することで,より高品質なコード生成と開発プロセス改善を目指す。
    • プロンプトは,機能と品質(要件),一般的な解決策(アーキテクチャ戦略),具体的な解決策(実装制約)の3要素で構成される。
    • プロンプトは,具体性を増しつつ進化する傾向が認められた。
    • プロンプトを用いた開発は,要件の検証・確認を促進する可能性が示唆された。

    Link: https://arxiv.org/abs/2603.16348

  • SseRex:Solanaスマートコントラクトの効率的なシンボリック実行 [cs.CR, cs.SE]目的:Solanaスマートコントラクトの脆弱性検出
    • Solanaは急速に普及しているが,セキュリティインシデントが頻発しており,自動分析技術の重要性が増している。
    • 既存手法はSolanaの独特なアカウントモデルに対応できておらず,十分な脆弱性検出が困難である。
    • Solana特有のバグ(所有者チェックの欠如など)を発見し,セキュリティリスクを軽減すること。
    • SseRexは,8,714個のバイトコードのみのコントラクトにおいて,既存手法を上回る性能を示した。
    • 467個のコントラクトで潜在的なバグを検出し,その有効性が確認された。
    • 120のオープンソースSolanaプロジェクトの分析から,些細な問題が深刻な脆弱性の原因となることが示唆された。

    Link: https://arxiv.org/abs/2603.16349

  • 採点精度の向こうへ:TAとLLMの評価の一致性に関する探求 [cs.CY, cs.SE]目的:TAとLLMによるUMLクラス図の採点の一致性
    • 教育の質向上には,効率的かつ信頼性の高い評価手法が不可欠である。
    • 既存研究では,LLMの評価が全体的な図に対して行われ,詳細な基準レベルでの分析が不足している。
    • オープンソースLLMを用いて,基準レベルでの評価一致性を明らかにすることで,採点支援の可能性を探る。
    • オープンソースLLMは,基準ごとの採点精度において最大88.56%を達成し,既存研究を上回る性能を示した。
    • 基準ごとの最適なLLMを組み合わせたモデルは,TAの評価に近い性能を示し,混合型採点システムの可能性を示唆した。
    • 本研究は,オープンソースLLMがUMLクラス図の採点において有効であることを示し,評価作業量の増加に対応するための実用的なアプローチを提供する。

    Link: https://arxiv.org/abs/2603.16357

  • 部分可換モノイドで次数付けされたモノイダル圏 [cs.LO, math.CT]目的:部分可換モノイドによるモノイダル圏の次数付けの公理化
    • 圏論は数学の抽象的な構造を扱う上で不可欠であり,計算やプログラミングへの応用も進んでいる。
    • 既存の圏論では,副作用を持つ計算や並行処理などの複雑な現象を扱うのが難しい場合がある。
    • 部分可換モノイドによる次数付けを導入することで,副作用や並行性をより自然に表現することを目指す。
    • 効果的圏は,純粋な射と効果的な射の2種類の射を持ち,それらは部分的に定義されたモノイド積を持つ。
    • 本研究では,部分可換モノイド(PCM)によるモノイダル圏の次数付けという概念を導入し,効果的圏をPCM-次数付けモノイダル圏の部分圏として捉える。
    • PCMによる次数付けは,共有リソースへのアクセスにおける非干渉並行性や,限られたリソースの使用量など,様々なモデル化に利用できる。

    Link: https://arxiv.org/abs/2603.16375

  • 次元型システムと決定論的メモリ管理:ネイティブコンパイルにおける設計時意味論的保存 [cs.PL, math.CT, math.LO]目的:次元型アノテーションの永続化を通じたコンパイルフレームワーク
    • 近年,プログラムの性能最適化が重要視されており,特にメモリ管理と数値表現の選択が鍵となる。
    • 従来のコンパイラでは,次元情報をコード生成前に消去するため,最適化の機会が失われるという課題があった。
    • 設計時に意味論的情報を保持し,メモリ管理戦略や数値表現を選択することで,性能と正確性を向上させる。
    • 次元型システム(DTS)は,有限生成アベル群からの制約を用いたHindley-Milner unificationを拡張し,多項式時間で決定可能で完全かつ主要な推論を実現する。
    • DTSは,コード生成前に次元アノテーションを消去するのではなく,コンパイルメタデータとして保持し,表現とメモリ配置の決定に活用する。
    • 決定論的メモリ管理(DMM)は,エスケープ分析とメモリ配置を次元型フレームワーク内で統一し,自動微分との関連性も明らかになった。

    Link: https://arxiv.org/abs/2603.16437

  • マルチエージェント強化学習によるマルチ衛星システムにおける遅延CSIへの対策 [cs.IT, cs.AI, eess.SP, math.IT]目的:マルチ衛星システムにおける総レート最大化
    • 衛星通信はグローバル接続の実現に不可欠だが,高品質なサービス提供には正確なCSIが求められる。
    • 衛星通信特有の伝搬遅延によりCSIが古くなり,通信品質が低下する課題がある。
    • 遅延CSI環境下でも総レートを最大化するMARLアルゴリズムを開発し,その有効性を示す。
    • 提案手法であるDS-PPOは,CSIの不正確さに対してロバスト性を示すことが確認された。
    • DS-PPOを用いることで,総レートの向上が確認された。
    • DS-PPOの収束性解析と計算複雑性評価を行った。

    Link: https://arxiv.org/abs/2603.16470

  • 移動アンテナアレイにおける相互結合を用いた指向性向上の研究 [cs.RO, cs.IT, math.IT]目的:移動アンテナアレイにおける指向性向上
    • 無線通信において,電波の指向性を高めることは,通信距離の延伸や干渉の抑制に不可欠である。
    • 従来のアンテナアレイでは,アンテナ間の相互結合は悪影響と見なされてきた。
    • 相互結合を積極的に利用することで,指向性を飛躍的に向上させる方法を確立すること。
    • 提案手法であるGreedy SearchとGradient Descent (GS-GD) アルゴリズムにより,アンテナ位置の最適化が効率的に行われた。
    • 相互結合を利用した移動アンテナアレイは,従来の均一線形アレイと比較して,全方向で顕著な指向性向上を実現した。
    • GS-GDアルゴリズムは,ほとんどの方向において大域最適解に接近することが示された。

    Link: https://arxiv.org/abs/2603.16472

  • TRACE: LLMによるコード翻訳の実行効率の評価 [cs.SE]目的:LLMによるコード翻訳における実行効率の評価
    • ソフトウェア開発において,コードの効率性はパフォーマンスに直結し,システム全体の品質を左右する重要な要素である。
    • LLMによるコード翻訳は機能の正確性に焦点が当たりがちで,実行効率の評価は十分に行われていない。
    • 本研究は,LLMによるコード翻訳における実行効率の課題を明らかにし,効率的なコード生成の評価基準を確立する。
    • 本研究で新たに開発されたTRACEベンチマークを用いることで,28種類のLLMの実行効率を詳細に評価した。
    • コードの正確性は実行効率と必ずしも相関せず,高性能なモデルであっても効率性が低い場合があることが示された。
    • LLM翻訳の23.5%に顕著な非効率性が認められ,アルゴリズムの誤りや言語構造の不一致,リソース管理の不備がその原因であることが判明した。

    Link: https://arxiv.org/abs/2603.16479

  • ネットワーク分析によるバリアビリティモデルの考察 [cs.SE]目的:バリアビリティモデルの構造的特性に関する研究
    • ソフトウェアの複雑化に伴い,バリアビリティモデリングは不可欠な技術となっている。
    • 大規模なバリアビリティモデルの構造的特性に関する体系的な研究が不足している。
    • ネットワーク分析を用いてバリアビリティモデルの構造を理解し,保守・進化を支援すること。
    • バリアビリティモデルは,依存関係が支配的で,中心的な特徴が存在し,ノードの次数分布に特徴があるなど,一貫した構造的特性を示すことが明らかになった。
    • ドメインによって構造に差異が見られたが,それらは保守に関連する特徴の特定やモジュール分解の機会を示唆する。
    • 本研究は,バリアビリティモデルの経験的分析のためのスケーラブルなグラフベースの基盤を提供し,将来の研究に定量的な証拠を提供する。

    Link: https://arxiv.org/abs/2603.16577

  • (ランダム)幾何グラフにおける直径計算 [cs.RO, cs.DS]目的:ランダム幾何グラフの直径計算手法
    • グラフ理論は,ネットワーク構造の解析に不可欠であり,現実世界の様々な問題を解決に導く。
    • 幾何グラフの直径計算は,大規模グラフにおいて計算量が膨大となり,効率的なアルゴリズムが求められている。
    • 幾何グラフの特性を利用し,既存手法よりも高速な直径計算アルゴリズムを開発すること。
    • ランダム幾何グラフの直径計算アルゴリズムを開発し,平均次数が${\Theta}(n^{\delta})$のとき,$\tilde{O}(n^{\frac{3}{2}(1+{\delta})} +n^{2 - \frac{5}{3}{\delta}})$という計算時間で実行可能であることを示した。
    • 本アルゴリズムは,平均次数が${\Theta}(n^{3/19})$の場合に$\tilde{O}(n^{1.737})$という計算時間を達成し,既存手法よりも優れている。
    • 幾何グラフの構造的特徴を捉えたフレームワークを構築し,直径計算効率の向上に貢献する。

    Link: https://arxiv.org/abs/2603.16684

  • 非線形情報理論:期待値が劣線形である通信モデルにおける分布的不確実性の特徴づけ [cs.IT, math.IT, math.PR]目的:通信モデルにおける分布的不確実性の特徴づけ
    • 通信ネットワークの複雑化に伴い,確率分布が単一に定まらない不確実性が重要になっている。
    • 従来の確率論では,非定常・不均一な現象や分布的不確実性を捉えることが困難である。
    • 非線形期待値理論を用いて,不確実な分布を持つ情報源や通信路の符号化限界を明らかにする。
    • 非線形情報エントロピー,同時エントロピー,条件エントロピー,相互情報などの基本概念を定義し,その性質を確立した。
    • 最大誤差確率基準下における達成可能な符号化率の上界は非線形情報エントロピーであり,最小誤差確率基準下では符号化率の集束点を決定する非線形ソース符号化定理を提案した。
    • 最大誤差確率基準と最小誤差確率基準における達成可能な符号化率の上界と集束点を導出した非線形チャネル符号化定理を提案した。

    Link: https://arxiv.org/abs/2603.16700