arXiv雑要約

プログラム - 2026/03/26 公開

  • 木上の最適非ラベル付き小石移動とその多エージェント経路探索への応用 [cs.DS]目的:木上の小石移動計画の最適化
    • 経路探索問題は,ロボティクスやAIにおける基本的な問題であり,効率的な解決が求められている。
    • 多エージェント環境下での経路探索は,複雑性が高く,最適解を見つけることが困難である。
    • 木構造における小石移動問題を効率的に解くことで,多エージェント経路探索に応用可能となる。
    • 本研究では,木上の非ラベル付き小石移動問題を,入力と出力のサイズに比例する線形時間で解くアルゴリズムを提案した。
    • 提案アルゴリズムは,最適な移動計画を見つけることが可能であり,既存手法よりも高速に動作する。
    • この結果を拡張することで,木構造上の多エージェント経路探索における最適なmakespan,コスト合計,移動計画長の評価が可能となった。

    Link: https://arxiv.org/abs/2603.23503

  • 減衰木における円滑なルーティング [cs.DS, cs.MA]目的:グラフにおける経路集合の円滑なスケジュール
    • 災害時の避難計画等,緊急時における経路選択は重要である。
    • 経路が時間経過とともに使用不可能になる状況下での効率的なルーティングは課題である。
    • 時間経過に伴う経路の閉鎖を考慮した,可能な限り遅い避難可能時刻の算出を目指す。
    • 星型グラフや経路グラフにおいても,この問題はNP困難であることが証明された。
    • 避難可能時刻を算出するための整数計画法(ILP)が提案された。
    • 人工データおよびドイツの河川沿いの都市データを用いて,ILPとその緩和解の実行時間が比較された。

    Link: https://arxiv.org/abs/2603.23504

  • DeepOFW:ピーク対平均電力比低減のための深層学習駆動OFDM柔軟波形変調 [cs.IT, cs.LG, eess.SP, math.IT]目的:ピーク対平均電力比の低減
    • 無線通信において,電力増幅器の効率が通信性能を左右するため,電力効率の向上が重要である。
    • OFDMのような多搬送波変調方式は,ピーク対平均電力比が高く,電力増幅器の効率を低下させるという課題がある。
    • 本研究は,深層学習を用いてピーク対平均電力比を低減し,電力効率を向上させる新しい波形変調方式を提案する。
    • 提案手法DeepOFWは,従来のOFDMと比較してピーク対平均電力比を大幅に低減できることをシミュレーションにより実証した。
    • DeepOFWは,ビット誤り率の面でも既存の伝送方式と比較して改善された性能を示すことが確認された。
    • DeepOFWは,学習段階をオフラインで行うことで,既存のハードウェアへの実装を容易にしている。

    Link: https://arxiv.org/abs/2603.23544

  • 空ビル不変量の計算 [cs.DS, math.AG, math.AT, math.RT]目的:多パラメータ持続ホモロジーモジュールの古典的なランク不変量を,Harder-Narasimhan 濾過を用いて定義する空ビル不変量の計算
    • トポロジー的データ解析において,多パラメータ持続ホモロジーはデータの形状や構造を特徴付ける強力なツールである。
    • 既存のアルゴリズムは,モジュールの次元が大きい場合,計算量が膨大になり実用性に乏しいという問題があった。
    • Harder-Narasimhan 濾過の加法性と特殊な中心電荷を利用し,効率的な近似アルゴリズムを開発することで,この問題を解決する。
    • 本研究では,空ビル不変量の計算において,次元$d$のモジュールに対して,$O(1/\varepsilon^d \cdot T_{\mathsc{dec}})$ の実行時間を持つFPT $\varepsilon$-近似アルゴリズムを提案した。
    • モジュールの壁と部屋構造は,$d-1$次の多項式の下包絡線によって計算可能であり,これにより空ビル不変量の正確な計算が可能になった。
    • 2パラメータモジュールに対しては,提案アルゴリズムとChengのアルゴリズムを実装し比較することで,有効性を実証した。

    Link: https://arxiv.org/abs/2603.23560

  • 有限関数概念クラスに対するラベル付き圧縮スキーム [cs.IT, cs.LG, math.IT]目的:有限関数概念クラスのVC次元に等しいラベル付き圧縮スキーム
    • 機械学習において,効率的なデータ表現は学習アルゴリズムの性能に大きく影響する。
    • 既存の圧縮スキームは,VC次元の証明が困難な概念クラスに対して適用が難しい。
    • VC次元dを持つ任意の概念クラスに対して,サイズdの圧縮スキームの存在を示す。
    • 本研究により,VC次元dを持つ有限関数概念クラスに対して,サイズdのラベル付き圧縮スキームが存在することが証明された。
    • これは,長年未解決だったサンプル圧縮予想を解決するものである。

    Link: https://arxiv.org/abs/2603.23561

  • 離散変調CV-QKDにおける長距離伝送のためのソフト情報を用いた逆和解 [cs.IT, math.IT]目的:離散変調CV-QKDにおける長距離伝送のための逆和解手法の性能評価
    • 量子鍵配送は,盗聴耐性のある安全な通信を実現する技術として重要である。
    • 従来の逆和解法では,低SN比環境下での性能が課題となっていた。
    • 本研究は,低SN比環境下でも有効な逆和解法を提供し,長距離伝送を可能にすることを目的とする。
    • 提案手法は,非常に低いSN比下でも良好な性能を示すことが確認された。
    • これにより,提案手法が逆和解問題に対する汎用的な解決策となりうることが示唆された。

    Link: https://arxiv.org/abs/2603.23585

  • LLMORPH:大規模言語モデルの自動変異試験 [cs.SE, cs.AI, cs.CL, cs.LG]目的:大規模言語モデルの信頼性評価と改善
    • 近年,大規模言語モデルの性能向上は目覚ましいが,その信頼性確保が重要課題となっている。
    • 大規模言語モデルの出力の正当性を検証する自動化された手段が不足している点が課題である。
    • 人手によるラベル付けなしに,大規模言語モデルの潜在的な不具合を検出することを目指す。
    • LLMORPHは,変異試験を活用し,大規模言語モデルのNLPタスクにおける誤動作を自動的に検出する。
    • 36種類の変異関係を4つのNLPベンチマークと3つの最先端LLM(GPT-4,LLAMA3,HERMES 2)に適用した結果,56万件以上のテストを実行した。
    • LLMORPHは,大規模言語モデルの出力における不整合を自動的に検出し,その有効性を実証した。

    Link: https://arxiv.org/abs/2603.23611

  • LLMLOOP:自動反復フィードバックループによるLLM生成コードとテストの改善 [cs.SE, cs.AI]目的:LLM生成コードとテストの自動改善
    • LLMはコード生成能力が高いが,品質向上が課題である。
    • 生成コードのコンパイルエラーや誤りが頻発し,修正に労力がかかる。
    • LLM生成コードの品質向上と,テストの自動生成・改善を目指す。
    • LLMLOOPは,コンパイルエラーの解決,静的解析問題への対処,テストケースの修正,およびテスト品質の向上を含む5つの反復ループを用いる。
    • HUMANEVAL-Xベンチマークを用いた評価により,LLMLOOPがLLM生成コードの改善に有効であることが示された。
    • 生成されたテストケースは,検証メカニズムと回帰テストスイートとして機能する。

    Link: https://arxiv.org/abs/2603.23613

  • LLM生成コードの検知--修正--検証:多言語,多粒度実証研究 [cs.SE]目的:LLM生成コードの脆弱性管理ワークフローの評価
    • LLMによるコード生成はソフトウェア開発を効率化するが,セキュリティ評価は困難である。
    • LLM生成コードのセキュリティ脆弱性の評価手法やベンチマークが不足している。
    • テストに基づいた脆弱性管理ワークフローの有効性を評価し,改善点を明らかにする。
    • 反復的な検知--修正--検証(DRV)ワークフローは,単一パスの修正と比較して,安全かつ正しいコードの生成率を向上させることが示された。
    • 検知レポートは修正作業の指針として有用であることが多いが,その信頼性は一貫性がない。
    • 修正の信頼性は,修正範囲に大きく依存する。テストに基づいた,エンドツーエンドの評価が不可欠である。

    Link: https://arxiv.org/abs/2603.23633

  • AgdaにおけるTop型を持つSystem Iの形式化 [cs.LO, cs.PL]目的:Top型を持つSystem Iの形式化
    • 型理論は計算機科学の基礎であり,プログラムの意味論や検証に不可欠である。
    • 形式的な検証は,複雑なシステムにおいて誤りの検出が困難であるという課題を抱えている。
    • System Iを形式的に検証することで,型理論に基づいた安全なプログラム開発に貢献する。
    • 本研究では,型理論System IにTop型を導入し,その形式化をAgdaで行った。
    • 進捗と強力正規化に関する証明を含む完全な形式化を実現した。
    • これにより,System Iの理論的基礎を強化し,より信頼性の高いソフトウェア開発を支援する。

    Link: https://arxiv.org/abs/2603.23652

  • 摂動駆動:ADASの摂動に基づくテストのためのフレームワーク [cs.SE]目的:ADASの堅牢性と汎化能力の評価
    • 自動運転技術の安全性確保は,社会実装において極めて重要である。
    • 深層学習に基づくADASは,想定外の入力やデータに対して脆弱性を持つ。
    • 様々な摂動を組み合わせた体系的なテストによる,ADASの脆弱性評価を実現する。
    • PerturbationDriveは,30種類以上の画像摂動を実装し,ADASのテストを支援する。
    • オフライン評価とオンライン閉ループテストに対応し,多様なシナリオでの評価が可能である。
    • プロシージャ型道路生成や探索的テストと統合することで,再現性と拡張性の高いフレームワークである。

    Link: https://arxiv.org/abs/2603.23661

  • 2Dラスタライズのセマンティクス [cs.PL]目的:Skia 2Dグラフィックスライブラリの形式セマンティクス
    • グラフィックス処理は,現代のアプリケーションにおいて不可欠であり,その効率性はパフォーマンスに直結する。
    • 既存のラスタライズライブラリは複雑なセマンティクスを持ち,最適化が困難であるという課題がある。
    • Skiaの形式セマンティクスを構築し,最適化パターンを特定・検証することで,ラスタライズ効率の向上を目指す。
    • $\mu$Skiaは,Skiaの言語機能やグラフィックス機能をカバーする形式セマンティクスであり,Leanで実装された。
    • Google Chromeから検出された非効率なSkiaコードパターンを特定し,その代替コードの正しさを$\mu$Skiaを用いて検証した。
    • 開発したSkiaオプティマイザは,トップ100ウェブサイトのSkiaプログラムに対し,18.7%の高速化を実現した。

    Link: https://arxiv.org/abs/2603.23696

  • ソフトウェアアーキテクチャからの抽象的な侵入テストケース生成に向けたLLMの活用 [cs.SE]目的:ソフトウェアアーキテクチャモデルからの抽象的侵入テストケース(APTC)の生成
    • ソフトウェアの品質特性に影響する初期設計決定を捉えるアーキテクチャの重要性
    • アーキテクチャレベルでのセキュリティ評価とフィードバックが不足している現状
    • アーキテクチャレベルでのセキュリティ評価を支援するAPTC生成による脆弱性未発見の防止
    • 提案手法により生成されたAPTCは,有用性93%,正しさ86%を達成し,その有効性が示された。
    • 生成されたAPTCは,アーキテクトがセキュリティ上重要な設計決定を特定する上で役立つ。
    • また,ペネトレーションテスターに対して,実行可能なテストガイダンスを提供する。

    Link: https://arxiv.org/abs/2603.23698

  • 分布ロバストなk-of-n逐次検査 [cs.DS]目的:k-of-n逐次検査における期待コストの最小化
    • 確率的最適化問題の基礎であり,信頼性評価や意思決定において重要である。
    • 各テストの成功/失敗確率が正確に分かっていることが前提であり,現実的ではない場合が多い。
    • 未知の確率に対するロバスト性を考慮し,最悪の場合でもコストを最小化する検査戦略を確立する。
    • テストコストが均一な場合,分布ロバストなk-of-n逐次検査に対する2近似アルゴリズムが得られた。
    • 一般的なコストの場合,各不確実性区間が$[\epsilon, 1-\epsilon]$に含まれる$\epsilon$-boundedインスタンスに対して,$O(\frac{1}{\sqrt \epsilon})$-近似アルゴリズムが得られた。
    • 内側の最大化問題に対し,コストが多項式的に有界であるという仮定の下で,準多項式時間近似スキームが得られた。

    Link: https://arxiv.org/abs/2603.23705

  • 貪欲法による集合被覆問題に対する効率的な局所探索アルゴリズムの改良 [cs.DS]目的:集合被覆問題に対する効率的な局所探索アルゴリズムの設計
    • 集合被覆問題は,組み合わせ最適化の重要な課題であり,様々な応用分野で利用されている。
    • 既存の局所探索アルゴリズムは,計算量が膨大であり,大規模なインスタンスに対する適用が困難である。
    • 入力インスタンスを積極的に疎化し,遡及的更新を可能にすることで,計算量を削減する。
    • 本研究で提案するアルゴリズムは,既存のアルゴリズムと比較してクエリ複雑性を大幅に改善する。
    • 特に,f = poly log Δ の場合,クエリ複雑性を Δ^{O(log Δ)} から Δ^{O(log log Δ)} に短縮する。
    • 遡及的更新という技術は,局所探索アルゴリズムの設計において独立した興味を持つと考えられる。

    Link: https://arxiv.org/abs/2603.23715

  • 機械学習コードにおけるログの臭いの経験的特性評価 [cs.SE]目的:機械学習コードにおけるログの臭いの分類と現状の把握
    • 機械学習システムの再現性,可視性,信頼性を確保する上で,ログは重要な役割を担う。
    • 設計不良なログは,実験追跡,セキュリティ,デバッグ,システムパフォーマンスに悪影響を及ぼす可能性がある。
    • 機械学習特有のログの臭いを特定し,その影響と頻度を明らかにすること。
    • 大規模な分析により,機械学習プロジェクトにおける12種類のログの臭いを発見した。
    • アンケート調査の結果,特定のログの臭いは再現性,保守性,信頼性に強い影響を与えることが示唆された。
    • ラベル付けされたデータセットを公開し,今後の研究を支援する。

    Link: https://arxiv.org/abs/2603.23769

  • デジタルツイン支援による測定設計とチャネル統計量の予測 [cs.IT, cs.LG, math.IT]目的:無線システムにおける性能保証のための無線チャネルおよびその統計量の予測
    • 無線通信システムの性能を保証するためには,正確なチャネル情報の把握が不可欠である。
    • 従来の統計的ラジオマップは柔軟性があるが,性能は関数選択に左右され,環境形状の活用が不十分である。
    • オープンソースマップ由来の未校正デジタルツインを活用し,測定効率の良いチャネル統計量予測を実現する。
    • 本研究では,未校正のデジタルツインから得られる幾何学的情報を活用し,ガウス過程によるチャネル予測の事前情報を抽出するハイブリッドフレームワークを提案する。
    • 提案手法は,少数のチャネル測定と組み合わせることで,環境全体のチャネル統計量をデータ効率良く予測することを可能にする。
    • また,ガウス過程の不確実性定量化を活用することで,限られたリソース下での情報量の多いプローブ位置を特定し,測定オーバーヘッドを削減する。

    Link: https://arxiv.org/abs/2603.23787

  • 意図的な不服従:エージェントの行動履歴における失敗の自動検出 [cs.SE, cs.AI]目的:エージェントの行動履歴の検証
    • AIエージェントがソフトウェアシステムに組み込まれる機会が増加しており,その安全性と信頼性が重要である。
    • 従来の評価方法では,プロセス中の失敗を見逃しやすく,詳細な行動分析が困難である。
    • エージェントのプロンプトとシステム指示から行動ルールを抽出し,行動履歴のコンプライアンスを自動的に評価する。
    • AgentPexは,異なるモデルのエージェントの行動の違いを明確に区別することが示された。
    • 結果から,結果のみを評価する方法では捉えられない仕様違反が検出された。
    • ドメインと指標ごとの詳細な分析により,エージェントの強みと弱みを把握することが可能になった。

    Link: https://arxiv.org/abs/2603.23806

  • アクセシビリティテストにおける解釈のギャップを埋める:大規模言語モデルによる共感的で法規制を意識したバグレポート生成 [cs.SE, cs.HC]目的:アクセシビリティテストにおける,関係者向けの共感的で法規制を意識したバグレポートの生成
    • モバイルアプリのアクセシビリティ向上は,デジタル包摂の実現に不可欠である。
    • 既存の自動テストツールは技術的な出力が多く,専門知識がない関係者には理解が難しい。
    • バグレポートの解釈ギャップを埋め,関係者の理解を深めることで,アクセシビリティ改善を促進する。
    • 本研究で開発したフレームワーク\textsc{HEAR}は,技術的なバグレポートを共感的で関係者向けの記述に変換する。
    • ユーザー調査の結果,\textsc{HEAR}が生成するレポートは,技術ログと比較して,共感性,緊急性,説得力,法的リスクの認識において大幅な改善が見られた。
    • また,\textsc{HEAR}は追加の認知負荷をほとんどかけずに,客観的な根拠に基づいたレポートを作成する。

    Link: https://arxiv.org/abs/2603.23828

  • テラヘルツ無線データセンターのための測定値較正AI支援デジタルツイン [cs.IT, math.IT]目的:テラヘルツ無線データセンターにおけるチャネル特性評価とシステムレベル性能評価
    • データセンター内接続の高速化が求められる中,テラヘルツ無線通信が有望視されている。
    • 複雑な屋内環境下での正確なチャネル特性評価とシステムレベル性能評価が困難である。
    • 測定,レイトレーシング,暗黙的ニューラル場モデリングを統合し,高精度な無線環境予測を実現する。
    • 300GHzでのチャネル測定を行い,LoSおよびNLoSシナリオで測定結果とレイトレーシングシミュレーションの整合性を示した。
    • 測定とレイトレーシングデータに基づき,RT-条件付きINFを開発し,RTで欠損するNLoS領域での高精度なRF場予測を可能にした。
    • デジタルツインが生成する包括的なRFマップは,無線データセンターのシステムレベル分析と意思決定に貢献する。

    Link: https://arxiv.org/abs/2603.23837

  • APISENSOR:ランタイムトラフィックログからのWeb APIの堅牢な検出 [cs.CL, cs.CY, cs.IR, cs.SE]目的:Web APIの検出
    • LLMエージェントが複雑なWebアプリケーションを操作する上で,APIの利用は不可欠である。
    • APIドキュメントの不備や不整合が頻発しており,API利用の妨げとなっている。
    • 混合トラフィック環境下でも堅牢なAPI検出を可能にすることを目的とする。
    • APISENSORは,トラフィックのノイズ除去と正規化,グラフに基づく二段階クラスタリングを組み合わせることで,高精度なAPI検出を実現した。
    • 6つのWebアプリケーションを用いた評価で,平均Group Accuracy Precision 95.92%,F1スコア94.91%を達成し,最先端手法を凌駕した。
    • 様々なアプリケーションとノイズ設定において,APISENSORは最低限の性能変動を示し,優れた堅牢性を証明した。また,実際のアプリケーションにおけるAPIドキュメントの不整合を検出した。

    Link: https://arxiv.org/abs/2603.23852

  • ニューラルネットワークの形式的解析のためのLuna Bound Propagator [cs.MA, cs.LG, cs.AI, cs.LO]目的:ニューラルネットワーク検証のためのbound propagation手法
    • 深層学習の安全性確保が重要視され,形式的解析のニーズが高まっている。
    • 既存のalpha-CROWNはPython実装のため,既存の検証器との統合が困難である。
    • C++による実装により,検証器への統合と長期的な利用を可能とする。
    • LunaはInterval Bound Propagation,CROWN分析,alpha-CROWN分析をサポートする。
    • VNN-COMP 2025のベンチマークにおいて,既存のalpha-CROWNと同等の性能を示す。
    • Lunaは,boundの厳密性と計算効率の両方において,高い競争力を持つ。

    Link: https://arxiv.org/abs/2603.23878

  • SiftMoE:ワイヤレス分散MoE推論のための類似度を考慮した省エネルギーなエキスパート選択 [cs.IT, cs.NI, math.IT]目的:ワイヤレス分散MoE推論におけるエキスパート選択戦略
    • 大規模言語モデルの活用が広がる中で,エッジデバイスでの推論が重要になっている。
    • エッジデバイスの限られたリソースでは,多数のエキスパートを全て格納できない。
    • 通信コストと推論精度を両立する,効率的なエキスパート選択手法が求められている。
    • SiftMoEは,エキスパートの類似度を利用し,通信コストと推論精度を最適化する。
    • 理論的な精度低下の上限値を確立し,遅延と精度制約下での省エネルギー化問題を定式化した。
    • シミュレーションにより,従来のTop-Kルーティングと比較して,SiftMoEがエネルギー消費を大幅に削減しつつ,推論精度を維持することが示された。

    Link: https://arxiv.org/abs/2603.23888

  • Praxium:AIベースのテレメトリと依存関係分析によるクラウド異常診断 [cs.SE, cs.LG]目的:クラウド異常の検知と根本原因の推論
    • クラウド利用の拡大に伴い,マイクロサービスアーキテクチャの複雑性が増し,設定ミスやバグのリスクが高まっている。
    • 従来の診断手法は専門家の知識に依存するため,CI/CD環境下でのスケーラビリティが課題となっていた。
    • ソフトウェアの導入による影響を考慮した,迅速な異常診断と根本原因の特定を目指す。
    • Praxiumは,AIベースのテレメトリ分析と依存関係分析により,クラウド環境における異常を効果的に検知可能であることを示した。
    • 根本原因の推論においても高い精度を維持し,特に頻繁なパッケージ導入環境下でも信頼性の高い結果が得られた。
    • 異常検知のF1スコアは0.97を超え,実用的なハイパーパラメータ調整の分析も提供した。

    Link: https://arxiv.org/abs/2603.23890

  • 無限ホライズンMDPにおける最適な分散依存後悔上限 [cs.LG, cs.IT, math.IT, math.OC, stat.ML]目的:無限ホライズンマルコフ決定過程(MDP)におけるオンライン強化学習の理論的・アルゴリズム的発展
    • 強化学習は,複雑な環境下での意思決定において重要な役割を果たす。
    • 無限ホライズンMDPの強化学習は,エピソード形式と比較して理論的・アルゴリズム的に未発達である。
    • インスタンス固有の複雑さに適応し,初期コストを削減するアルゴリズムを開発すること。
    • 本研究では,平均報酬後悔と$\gamma$-後悔という2つの無限ホライズン目的関数に対し,最適な分散依存後悔保証を持つ実用的なUCB型アルゴリズムを開発した。
    • 後悔上限は$\tilde{O}( \sqrt{SA\,\text{Var}} + \text{下位項})$の形で表され,最悪の場合にミニマックス最適だが,簡単な問題インスタンスにも適応する。
    • 最適なバイアススパン$\Vert h^\star\Vert_\text{sp}$が事前にわかっている場合,下位項は$\Vert h^\star\Vert_\text{sp} S^2 A$としてスケーリングし,事前知識がない場合は$\Vert h^\star\Vert_\text{sp}^2 S^3 A$のスケーリングとなる。

    Link: https://arxiv.org/abs/2603.23926

  • エネルギー意識的な要件依存性分類:ナレッジグラフ vs. ベクトル検索によるSLM拡張推論 [cs.SE]目的:要件の競合検出のエネルギー効率化
    • システム仕様は常に進化するため,要件の競合評価は不可欠である。
    • 従来の競合検出は労力がかかる上に,LLMはエネルギー消費が大きい。
    • SLMとエネルギー効率的なアーキテクチャを用いた持続可能な要件エンジニアリングを目指す。
    • ナレッジグラフベースの検索(KGR)とベクトルベースのセマンティック検索(VSR)を比較検討した。
    • エネルギー消費量,遅延時間,炭素排出量を測定し,予測性能とのトレードオフを分析した。
    • 構造化された検索が,セマンティック検索よりも要件の競合検出に有効であることが示された。

    Link: https://arxiv.org/abs/2603.23954

  • 二次元ナップサック問題における近似スキームと構造的障壁(回転あり) [cs.RO, cs.DS, cs.CG]目的:回転を許容する二次元ナップサック問題の近似解法
    • 多次元パッキング問題は,現実世界の資源配分や最適化に応用可能な重要な分野である。
    • ナップサック問題の多次元化,特に回転の導入は,問題の複雑性を著しく増大させる。
    • この研究では,ナップサック問題における近似解の精度向上を目指す。
    • 基数制約下では,$(1+\epsilon)$-近似解が定数個の矩形コンテナ内に貪欲に配置可能であることが示された。
    • 重み付きの場合では,$(1.497+\epsilon)$-近似アルゴリズムを設計し,既存の近似比を改善した。
    • 回転なしの場合の重み付き近似比も改善し,$13/7+\epsilon$を達成した。また,$(1+\epsilon)$-近似アルゴリズムの計算量下限も示した。

    Link: https://arxiv.org/abs/2603.23970

  • 無線通信のためのリドバーグ原子量子受信機:二色励起対三色励起 [cs.RO, cs.IT, math.IT]目的:無線通信におけるリドバーグ原子量子受信機(RAQR)の三色励起に基づくアーキテクチャの検討
    • 量子通信は,安全性と大容量通信の可能性から注目されており,次世代通信技術として期待されている。
    • 従来のRAQRは,不安定な青色レーザーの使用や,ドップラー広がりによる感度限界,低周波帯域の検出不能などの課題があった。
    • 本研究は,これらの課題を解決し,より高性能なRAQRアーキテクチャを提案することで,実用的な量子通信システムの実現を目指す。
    • 三色励起を用いるRAQRアーキテクチャは,従来の二色励起方式と比較して,工学的なコストを削減し,ドップラー効果の抑制と低周波帯域の検出を可能にする。
    • 提示されたモデルは,原子物理学と通信理論を融合し,RAQRの感度,容量,スペクトルアクセス範囲を評価するための基盤を提供する。
    • 数値シミュレーションの結果,三色励起RAQRは,従来の二色励起RAQRや古典的なアンテナ受信機よりも優れた感度を示すことが明らかになった。

    Link: https://arxiv.org/abs/2603.24062

  • 湾曲した焦線ビームによる堅牢で安全な近距離無線通信 [cs.IT, eess.SP, math.IT]目的:近距離無線通信における物理層セキュリティの提供
    • 無線通信のセキュリティ確保は重要であり,盗聴対策が不可欠である。
    • 盗聴者の位置推定誤差が大きくなると,秘匿率が著しく低下する問題がある。
    • 位置推定誤差に強い,堅牢なセキュリティを提供する手法を確立すること。
    • 提案手法は,電磁焦線効果を利用したビームフォーミングにより,盗聴領域を回避し,正規ユーザーを照らす。
    • シミュレーション結果から,提案手法は位置推定誤差0.25mに対して,最悪の場合の盗聴レートを最大80%削減できることが示された。
    • これにより,堅牢で安全な通信を実現する優位性が確認された。

    Link: https://arxiv.org/abs/2603.24077

  • セマンティック通信における予期せぬ敵対的頑健性 [cs.CL, cs.DB, cs.IT, math.IT]目的:セマンティック通信システムの敵対的頑健性に関する研究
    • 深層学習を活用したセマンティック通信は,次世代の通信技術として期待されている。
    • 深層学習モデルは,敵対的摂動に対して脆弱であることが知られている。
    • 本研究は,セマンティック通信システムの隠れた頑健性を明らかにする。
    • セマンティック通信システムは,従来の通信システムよりも高い敵対的頑健性を示すことが明らかになった。
    • ノイズを含む訓練データによる暗黙の正則化が,デコーダの平滑性を生み出し,敵対的攻撃に対する保護に貢献する。
    • セマンティック通信システムは,従来のシステムと同程度の歪みを生じさせるためには,最大で14〜16倍の攻撃電力が必要となる。

    Link: https://arxiv.org/abs/2603.24082

  • ニューラルコードモデルのロバスト性境界の強化と報告:知能的なコード理解のために [cs.IR, cs.SE]目的:ニューラルコードモデルのロバスト性向上と,そのロバスト性境界の保証
    • 近年の深層学習の発展に伴い,コード理解タスクにおけるニューラルコードモデルの重要性が増している。
    • ニューラルコードモデルは,微小な摂動によって予測が誤る脆弱性を抱えており,その対策が求められている。
    • モデル内部へのアクセスなしで,軽量かつ理論的なロバスト性境界を保証する防御手法を開発する。
    • 提案手法ENBECOMEは,攻撃成功率を大幅に低減しつつ,高い精度を維持することを示した(欠陥検出ではASRを42.43%から9.74%に,精度低下は0.29%)。
    • ENBECOMEは,推論時にセマンティクスを保持する摂動をコードに加えることで,決定境界を滑らかにし,ロバスト性を向上させる。
    • 実験により,ENBECOMEは平均で1.63の認定ロバスト性半径を達成し,識別子1.63個までの変更は誤分類を引き起こさないことが証明された。

    Link: https://arxiv.org/abs/2603.24119

  • 確率的プログラム合成における尤度ハッキング [cs.CL, cs.LG, cs.PL]目的:確率的プログラム合成における尤度ハッキングの防止
    • ベイズモデリングの自動化が重要視される中,言語モデルを用いた確率的プログラム合成が注目されている。
    • 強化学習により訓練された言語モデルは,データ適合性向上ではなく,尤度報酬を不正に増大させる「尤度ハッキング」を起こしやすい。
    • 尤度ハッキングを防止するための構文条件を提示し,安全な言語フラグメントを構築することで,この問題を解決する。
    • 尤度ハッキングは,PyMCコードを生成するGRPO訓練モデルにおいて,初期段階で発生しやすいことが確認された。
    • 尤度ハッキングに強いStanの修正版であるSafeStanを実装し,最適化圧下で尤度ハッキングを防止できることを実証した。
    • 言語レベルの安全制約が,自動ベイズモデリングにおいて理論的にも実用的にも有効であることが示された。

    Link: https://arxiv.org/abs/2603.24126

  • ペルソナ化LLMによる自動クラウドソーシングテストへ [cs.SE]目的:自動クラウドソーシングGUIテストの実現
    • ソフトウェアの品質保証は重要であり,GUIテストはその中心的な役割を担う。
    • 自動テストは再現性や効率に優れる一方,人間のような多様な行動を模倣できない。
    • 多様なテスト行動を再現し,自動テストの現実性と有効性を向上させる。
    • PersonaTesterは,テストの考え方,探索戦略,操作習慣といったペルソナをLLMに組み込み,多様なテスト行動を再現する。
    • 実験結果から,PersonaTesterは実際のクラウドワーカーの行動パターンを忠実に再現し,一貫性と変動性を示すことが確認された。
    • ペルソナに基づいたテストエージェントは,より効果的なテストイベントを生成し,クラッシュや機能的なバグを多く発見した。

    Link: https://arxiv.org/abs/2603.24160

  • RISアシストD-MIMOによるエネルギー効率の高い6G屋内ネットワーク [cs.IT, eess.SP, math.IT]目的:RISアシストD-MIMOシステムにおけるエネルギー効率の最大化
    • 6G通信では,データレート向上と同時に消費電力の抑制が重要課題となっている。
    • 従来の無線システムでは,電波の反射を利用した効率的なエネルギー利用が課題であった。
    • RISを用いて電波環境を制御し,エネルギー効率を向上させる手法を確立すること。
    • 提案手法は,アクセスポイントの電力配分とRISの位相設定を最適化することで,エネルギー効率を改善する。
    • シミュレーション結果から,提案手法は等電力を割り当てる手法やランダム散乱体を用いる手法よりも優れた性能を示すことが確認された。
    • RISの位相シフト最適化,制御アーキテクチャ,サイズなどがエネルギー効率に与える影響を定量的に評価した。

    Link: https://arxiv.org/abs/2603.24180

  • ソフトウェア工学教育へのメンタルヘルス,幸福,持続可能性の統合 [cs.CY, cs.SE]目的:ソフトウェア工学教育におけるメンタルヘルス,幸福,持続可能性の統合
    • ソフトウェア工学分野では,技術力だけでなく,倫理観や社会への貢献が重要視されている。
    • 従来の教育では,技術スキル偏重で,学生のメンタルヘルスや幸福への配慮が不足している。
    • 学生が技術と人間性を両立させ,社会に貢献できるソフトウェアエンジニアを育成すること。
    • 学生は,より人間中心の視点を持つようになった。
    • 学生間のメンタルヘルスに関する議論が増加した。
    • 幸福を,技術やビジネスツールとしてだけでなく,社会や個人を支援するためのインスピレーションとして捉え始めた。

    Link: https://arxiv.org/abs/2603.24191

  • AI支援プログラミング学習者の第1世代:ドイツ中学生における批判的思考とAI倫理のジェンダーによるパターン [cs.CY, cs.SE]目的:AI支援プログラミング学習における批判的思考,AI倫理,そしてジェンダーによる見解の差異
    • ソフトウェア開発の未来を担う次世代を育成する上で,AIとの適切な関わり方を理解させることは重要である。
    • AI技術の急速な発展に対し,特に教育現場における批判的思考と倫理観の育成が課題となっている。
    • 中学生におけるAI支援プログラミングの学習状況と倫理観を把握し,教育に役立つ知見を得る。
    • 学生はAI倫理に対する強い意識を持つ一方で,AI生成コードの理解不足のまま利用する傾向が見られた。
    • AIに関する責任は政治や企業にあると考える学生が多く,ドイツの文化的背景が影響している可能性がある。
    • 男子学生はAI支援プログラミングを積極的に利用する傾向があり,女子学生は懐疑的で協調性を重視する傾向があった。

    Link: https://arxiv.org/abs/2603.24197

  • MVVMパターンをC++フロントエンドとAgdaベースのバックエンドに適用 [cs.PL]目的:C++フロントエンドとAgdaベースのバックエンドを持つQtアプリケーション開発の体系的な方法論
    • ソフトウェア開発における信頼性と保守性を高めるため,形式手法と実用的なプログラミングの統合が重要である。
    • Agdaのような形式言語とC++のような実用的な言語を連携させる方法は確立されておらず,再利用性に欠ける。
    • 形式手法を用いて検証可能なバックエンドを開発し,C++による効率的なユーザーインターフェースを実現すること。
    • 本研究では,MVVMパターンを適用することで,AgdaまたはHaskellベースのバックエンドを持つQtアプリケーションの体系的な開発方法を提供した。
    • 任意のHaskell組み込みライブラリをAgdaコードで使用するための解決策と,C/C++からの直接FFI呼び出しによる中断機能を実現する新しいHaskell futureデザインを提案した。
    • agda2hsコンパイラを用いたアプローチが,RocqやMAlonzoと比較して有効であることをベンチマークによって示した。

    Link: https://arxiv.org/abs/2603.24199

  • DVM:動的AIモデル向けリアルタイムカーネル生成 [cs.CE, cs.RO, cs.PL, cs.AI, cs.LG]目的:動的AIモデルにおけるリアルタイムカーネル生成手法
    • AI計算は動的な性質を持つため,高速かつ効率的な実行が重要である。
    • 既存のコンパイラは,コンパイル時間が長く,動的モデルへの適用が困難である。
    • コンパイルの高速化またはオーバーヘッドの隠蔽により,動的モデルの効率を向上させる。
    • DVMは,CPUでバイトコードにエンコードし,NPUで仮想命令にデコードすることで,リアルタイムコンパイルを実現する。
    • DVMは,静的グラフと動的グラフの両方で,シンボル推論に基づくフュージョンを実行する。
    • 評価の結果,DVMは既存手法と比較して,演算/モデル効率が最大11.77倍向上し,最大コンパイル時間が5桁短縮されることが示された。

    Link: https://arxiv.org/abs/2603.24239

  • k-NN近傍幾何学によるソフトウェア要求の不特定性検出 [cs.CL, cs.SE]目的:ソフトウェア要求の不特定性の検出
    • 要求工学は,高品質なソフトウェア開発に不可欠である。不完全な要求は,開発の遅延やコスト増を招く。
    • 要求仕様には,暗黙の前提や抜け落ちた要件が含まれることが多く,これが不特定性として問題となる。
    • 本研究は,幾何学的手法を用いて,要求仕様における見落とされた要件タイプを自動的に検出することを目指す。
    • 提案手法geogapは,要求をベクトルとして表現し,k-NN距離を用いてカバレッジ不足を評価する幾何学的なアプローチである。
    • PROMISE NFRベンチマークにおいて,geogapは,50件以上の要求を持つプロジェクトで,完全に欠落した要件タイプの検出において0.935 AUROCを達成し,人手によるアノテーションを必要とする基準値と同等の性能を示した。
    • 各パイプラインコンポーネント(プロジェクトごとの正規化,ニューラル埋め込み,幾何学的なスコアリング)が,測定可能な価値をもたらすことが,6つのベースラインとの比較によって確認された。

    Link: https://arxiv.org/abs/2603.24248

  • 分散型および自己主権型アイデンティティの機能要件 [cs.SE]目的:分散型アイデンティティ(DI)および自己主権型アイデンティティ(SSI)システムの機能要件の導出
    • 中央集権的なID管理システムのセキュリティ・プライバシー問題から,DI/SSIへの関心が高まっている
    • DI/SSIシステムの評価手法が確立されておらず,導入が限定的である
    • DI/SSIシステムの評価に必要な機能要件を体系的に導出し,評価基盤を構築する
    • 機能要件の導出手法を詳細に示し,DI/SSIシステムの機能モデルを形式化
    • DI/SSIシステムの基本的な操作を網羅する包括的な機能要件セットを提示した
    • 確立された要求工学の方法に基づいた,再現可能な評価フレームワークへの基盤を確立する

    Link: https://arxiv.org/abs/2603.24250

  • ソフトウェアサプライチェーンの臭い:安全な依存関係管理のための軽量分析 [cs.SE, cs.CR]目的:ソフトウェアサプライチェーンにおける潜在的なセキュリティリスクの指標
    • 現代のソフトウェアは外部依存に大きく依存しており,サプライチェーンの安全確保は不可欠である。
    • サプライチェーンにおける脆弱性や悪意のある依存関係が混入するリスクが存在する。
    • サプライチェーンの構造的な問題点を検出し,セキュリティ対策を改善すること。
    • 本研究では,ソフトウェアサプライチェーンの「臭い」という概念を導入し,セキュリティリスクを示唆する指標を定義した。
    • 開発者へのインタビューから,定義した「臭い」が現実の懸念と一致し,有用であることが示された。
    • MavenとNPMのパッケージを分析した結果,両エコシステムで「臭い」の発生状況が異なり,Mavenではトレーサビリティと署名の問題が顕著であった。

    Link: https://arxiv.org/abs/2603.24282

  • 仕様のギャップ:コードエージェントにおける部分的な知識下での協調の失敗 [cs.SE, cs.AI, cs.MA]目的:複数LLMベースのコードエージェントが同一クラスの一部を実装する際の協調問題
    • ソフトウェア開発において,複雑なタスクを複数のエージェントに分割することで効率化が期待される。
    • 仕様が曖昧な場合,エージェント間で内部表現の不一致が生じ,統合が困難になる問題がある。
    • 仕様の詳細度を変化させることで,エージェント間の協調の難易度と解決策を明らかにすること。
    • 仕様の詳細度が低下すると,2エージェントの統合精度が大幅に低下し,単一エージェントの精度との間に25~39ポイントの協調ギャップが生じた。
    • 最も詳細の少ない仕様レベルでも,ASTベースの競合検出器は97%の精度を達成したが,完全な仕様を復元しても競合レポートを追加する以上の効果は認められなかった。
    • ギャップは協調コストと情報非対称性の合計として分解され,これら二つの効果は独立していることが示唆された。

    Link: https://arxiv.org/abs/2603.24284

  • デジタル回路設計のための基本的なブール演算子の複雑性 [cs.DS]目的:デジタル回路設計における基本的なブール変換の回路複雑性限界
    • デジタル回路の高性能化には,回路の複雑性を抑えることが不可欠である。
    • 基本的なブール演算子の複雑性評価が十分でなく,効率的な回路合成が困難である。
    • 基本的なブール演算子の複雑性を評価し,効率的な回路合成手法を確立すること。
    • 本研究では,カウンタ,加算器,エンコーダ,マルチプレクサなど,構造的に単純な関数や演算子の回路複雑性限界を調査した。
    • 数値,多項式,行列を用いる複雑な代数演算は対象外とし,より具体的な演算の実装への応用についても議論した。
    • 回路複雑性限界の把握は,効率的なデジタル回路設計に貢献すると考えられる。

    Link: https://arxiv.org/abs/2603.24319

  • 部分倍加距離空間におけるクラスタリングのための準線形時間近似スキーム [cs.CY, cs.DS]目的:部分倍加距離を持つメトリック空間におけるクラスタリング問題に対する準線形時間近似アルゴリズムの開発
    • クラスタリングは,データ分析や機械学習において重要なタスクであり,大規模データセットへの応用が求められている。
    • 一般的なメトリック空間における$k$-median問題は,効率的な近似アルゴリズムが限られており,計算コストが高い。
    • 倍加次元が有界である場合に適用できる近似アルゴリズムを一般化し,より広範な問題に対応すること。
    • 本研究では,$X$または$Y$のいずれかの倍加次元が有界である場合に,$(1+\epsilon)$-近似アルゴリズムを拡張することに成功した。
    • これにより,離散Fr\'echet距離を用いた$(k,\ell)$-median問題に対する,初の準線形時間近似アルゴリズムが実現した($\ell$が定数)。
    • アルゴリズムの実行時間は,$2^{2^t} \tilde O(n+m)$であり,$t$は倍加次元と$\epsilon$に依存する。

    Link: https://arxiv.org/abs/2603.24336

  • ジェンダーに基づくプロンプトとLLMによるコードレビュー:プロンプトにおけるジェンダー表現がコード品質と評価に及ぼす影響 [cs.SE, cs.HC]目的:LLMを用いたプログラミングおよびコードレビューにおける,ジェンダー表現とコード品質・評価の関係
    • プログラミングにおけるLLM利用が拡大する中で,公平性とバイアスを理解することは不可欠である。
    • LLMの評価において,ジェンダーバイアスが潜在的に影響している可能性が指摘されている。
    • プロンプトにおけるジェンダー表現がLLMのコード生成と評価に与える影響を明らかにすること。
    • 女性が作成したプロンプトは,間接的で丁寧な表現が特徴だが,コードの機能性や品質に一貫した差は見られなかった。
    • LLMによるコードレビューでは,女性が作成したコードの方が,品質が同程度であるにもかかわらず,より多く承認される傾向があった。
    • プロンプトにおけるジェンダー表現はコードの長さと保守性に影響し,レビューアの行動はモデルによって変化することが示された。

    Link: https://arxiv.org/abs/2603.24359

  • 重み付き射影リード・ミュラー符号の構造 [cs.IT, math.AC, math.IT]目的:重み付き射影リード・ミュラー符号の基本的な構造的性質
    • 符号理論は,情報伝送やデータ保存における誤り訂正に不可欠な技術である。
    • 既存の符号では,効率的な誤り訂正性能と複雑さのバランスが課題となっている。
    • 重み付き射影リード・ミュラー符号の構造を深く理解し,性能向上に貢献すること。
    • 重み付き射影リード・ミュラー符号に対する再帰的な構成法を提示した。
    • この構成法を用いて,一般化ハミング重みの上限を導出した。
    • 低次数においては,これらの符号を評価符号として記述できることを示した。

    Link: https://arxiv.org/abs/2603.24397

  • 自動車アプリケーションのためのハイブリッド時空間論理:モデリングとモデル検査 [cs.MA, cs.LO]目的:自動車の安全性を評価するためのハイブリッド時空間論理
    • 自動車の安全性確保は,社会にとって不可欠であり,高度な検証技術が求められている。
    • 複雑な運転シナリオにおける安全性検証には,時間と空間の両方を考慮した論理的枠組みが不可欠である。
    • 効率的なモデル検査アルゴリズムの開発により,自動車システムの安全性検証を加速させる。
    • 提案されたハイブリッド時空間論理(HSTL)は,車両の位置情報を時間と空間の両方で正確に表現できる。
    • 最適化されたモデル検査アルゴリズムは,到達可能な状態と状態遷移を限定することで,検索空間を削減する。
    • 安全追従,交差点,追い越し,隊列走行などの一般的な運転シナリオにおいて,最適化アルゴリズムは指数関数的な性能向上を示す。

    Link: https://arxiv.org/abs/2603.24443

  • Composer 2 技術レポート [cs.SE, cs.LG]目的:エージェント型ソフトウェアエンジニアリングのためのモデル
    • ソフトウェア開発の自動化は,生産性向上やコスト削減に不可欠である。
    • 既存モデルは,複雑なソフトウェア開発タスクにおける長期計画や正確な実行に課題がある。
    • 現実的なコーディング問題に対する推論能力と実行能力を向上させる。
    • Composer 2は,エージェント型ソフトウェアエンジニアリングにおいて高い計画能力とコーディング能力を示す。
    • 継続的な事前学習と大規模な強化学習により,推論,複数ステップ実行,長期的一貫性が向上した。
    • CursorBench評価では,以前のComposerモデルと比較して大幅な精度向上(61.3)が確認された。

    Link: https://arxiv.org/abs/2603.24477

  • ツリー深さパラメータ化されたハミルトンサイクルに対するより高速な多項式空間アルゴリズム [cs.DS]目的:ハミルトンサイクル問題の,ツリー深さパラメータ化された高速多項式空間アルゴリズムの開発
    • NP困難なグラフ問題は,ツリー分解を用いることで効率的に解ける場合がある。計算量実用性の向上に貢献。
    • 既存の動的計画法アルゴリズムは指数関数的な空間を必要とし,大きなパラメータ値に対して適用が困難。
    • ツリー深さというより制限の強い構造を用いて,多項式空間での高速アルゴリズムの実現を目指す。
    • 本研究では,既存のアルゴリズムよりも高速な,$4^\tau n^{O(1)}$ 時間で動作する多項式空間アルゴリズムを提案。
    • ハミルトンサイクル問題を含む複数の問題を,一致するペアを用いることで効率的に解くことに成功。
    • Nederlofらのアルゴリズム($5^\tau n^{O(1)}$)よりも時間計算量が改善された。

    Link: https://arxiv.org/abs/2603.24492

  • 専門家向け効率性,新規参加者向け可視性:Kubernetesにおけるラベルとコードの整合性に関する事例研究 [cs.SE]目的:Kubernetesプロジェクトにおけるラベルとコードの整合性の程度,安定性,検証,および貢献者の経験レベル別の協調結果との関係
    • ソフトウェア開発プロジェクトにおける効率的な協調は,プロジェクトの成功に不可欠である。
    • ラベルとコードの整合性が低い場合,開発者の混乱や協調の妨げが生じる可能性がある。
    • ラベルとコードの整合性を評価し,改善策を提示することで,より円滑な協調を促進する。
    • ラベルとコードの整合性は全体的に高く,約46.6%のプルリクエストで完全な整合性が確認された。
    • 経験豊富な開発者では,整合性が高いほどレビューの参加者数が減少する傾向が見られた。
    • 新規参加者では,整合性が高いほどレビューへの参加者数が増加する傾向が見られた。

    Link: https://arxiv.org/abs/2603.24501