arXiv雑要約

プログラム - 2026/03/17 公開

  • 草の根の絆:市場流動性のための草の根的基盤 [cs.DC, cs.MA, cs.PL]目的:市場流動性のための草の根的基盤の確立
    • グローバルな金融システムにおける新しい金融手段の可能性を探ることは重要である。
    • 従来の暗号通貨は取引コストが高く,草の根暗号通貨は金利による流動性に乏しい。
    • 草の根債券によって流動性を高め,多様な金融商品を表現することを目指す。
    • 草の根債券は,草の根暗号通貨に満期日を付与することで,キャッシュを将来の債券として捉え直す。
    • デジタルソーシャルコントラクトを用いることで,信用枠,ローンなど多様な金融商品を表現可能となる。
    • 従来の流動性指標も,草の根債券に適用可能であることが示された。

    Link: https://arxiv.org/abs/2603.13671

  • スケーラブルな機械学習システムのためのマイクロサービスアーキテクチャパターン [cs.SE]目的:スケーラブルな機械学習システムのマイクロサービスアーキテクチャパターン
    • 機械学習は現代システムにおいて不可欠であり,その重要性は増している。
    • 機械学習モデルの管理,デプロイ,スケーリングには課題が多い。
    • マイクロサービスアーキテクチャによる効率的な課題解決を目指す。
    • Netflix,Uber,Googleなどの事例から,マイクロサービスによる機械学習タスクの処理方法を検討した。
    • マイクロサービスアーキテクチャは,レイテンシ削減とスケーラビリティ向上に貢献しうる。
    • 大規模システムにおいて,より高速で効率的な機械学習アプリケーションを実現できる可能性を示唆した。

    Link: https://arxiv.org/abs/2603.13672

  • 多エージェントSACによるビームフォーミング設計:共同秘密鍵生成とデータ伝送 [cs.IT, eess.SP, math.IT]目的:共同秘密鍵生成とデータ伝送の最適化
    • 情報セキュリティの重要性が増しており,量子コンピュータ攻撃への耐性も求められている
    • 盗聴下での高いデータ伝送速度と秘密鍵生成速度を両立することが課題である
    • 部分観測性下での効率的な秘密鍵生成とデータ伝送のバランス改善
    • 提案手法は,既存のベンチマークアルゴリズムと比較して優れた性能を達成した。
    • 秘密鍵生成速度とデータ伝送速度のトレードオフを効果的に両立することが示された。
    • 知的な盗聴者および部分観測の不確実性に対するロバスト性も確認された。

    Link: https://arxiv.org/abs/2603.13716

  • AIエージェントは本当にコードの可読性を向上させるのか? [cs.SE]目的:AIエージェントによるコードリファクタリングがコードの可読性に与える影響
    • ソフトウェア品質と保守性の基礎は可読性である。可読性が低いと開発効率が低下し,バグのリスクが増大する。
    • 既存の研究では,AIエージェントによるリファクタリング全般が対象であり,可読性向上に特化した分析が不足している。
    • AIエージェントによるリファクタリングがコードの可読性を実際に向上させるか検証し,課題を明らかにすること。
    • AIエージェントは,命名規則やフォーマットよりも,ロジックの複雑さやドキュメントの改善に注力していることが明らかになった。
    • 可読性向上のためにAIエージェントが行ったリファクタリングは,従来の品質指標(保守性指数やサイクロマティック複雑度)を低下させた。
    • 可読性に関連するコミットの56.1%で保守性指数が低下し,42.7%でサイクロマティック複雑度が増加した。

    Link: https://arxiv.org/abs/2603.13723

  • AIエージェントによるテスト:テスト生成頻度,品質,カバレッジに関する実証研究 [cs.SE]目的:AIエージェントによるテスト生成の実態と,人間が作成したテストとの比較
    • ソフトウェア開発において,自動テストは品質向上と開発効率化に不可欠である。
    • AIを活用したテスト生成ツールは普及しているが,実用的な開発環境での挙動は未知数である。
    • 実世界の開発リポジトリにおけるAIによるテスト生成の頻度と品質を評価する。
    • AIがテストを追加したコミットは全体の16.4%を占めることがわかった。
    • AI生成テストは,コード長やアサーション密度が高く,循環的複雑性は低い傾向が見られた。
    • AI生成テストによるコードカバレッジは,人間が作成したテストと同等であり,多くのプロジェクトでカバレッジの改善に貢献した。

    Link: https://arxiv.org/abs/2603.13724

  • ブール論理のための冪項多項式代数 [cs.LO, cs.AI, cs.SC]目的:ブール論理式の表現言語
    • ブール関数を扱う上で,効率的な表現方法が重要である。CNFとANFは代表的な表現だが,変換時に指数関数的な増加が生じうる。
    • CNFとANF間の直接変換は,構造によっては指数関数的なサイズの増加を引き起こす。補助変数や制約が不要な表現が求められている。
    • CNFとANFの間の構造的な不整合を表現レベルで解消し,コンパクトな表現を可能にすること。
    • 冪項と冪項多項式を用いて言語を形式化し,ブール演算に対応する代数的演算を定義した。
    • 論理和の節はコンパクトなカノニカル表現を持つこと,冪項は局所的な短縮・展開規則をサポートすることを示した。
    • このフレームワークは,句ベースと代数ベースの推論を橋渡しし,構造を意識したCNF/ANF変換やハイブリッド推論手法の新たな方向性を示す。

    Link: https://arxiv.org/abs/2603.13854

  • 配列直交性を持つ完全系列の非存在について [cs.IT, math.IT]目的:配列直交性を持つ完全系列の存在限界
    • 通信システムやレーダー技術において,信号の識別性能向上が重要であり,その鍵となるのが系列の特性である。
    • 完全系列の探索はMowの予想により制約されており,長大な系列の実現が困難である。
    • 配列直交性に基づく構成法における完全系列の長さの限界を明確にすること。
    • 純粋な二変数多項式インデックス関数による系列は,代数的周期性によりFrank-Heimiller限界を超えることはないことが示された。
    • 分数位相散乱を抑制しようとすると位相空間が崩壊し,結果的に$n^2$の限界が再確認された。
    • これらの定理は可換代数に依存し,非可換単位四元数を用いた構成法とは対照的である。

    Link: https://arxiv.org/abs/2603.13914

  • SeqTG: 逐次整数線形計画法によるスケーラブルな組み合わせテスト生成 [cs.CL, cs.SE]目的:組み合わせテストにおける,制約下での最小被覆配列の生成
    • ソフトウェアの品質向上には,インタラクションに起因する欠陥検出が不可欠であり,組み合わせテストが重要な役割を果たす。
    • 従来の貪欲法はスケーラブルだが,終盤の複雑なペアの網羅において冗長なテストスイートになりがちである。
    • 厳密な数理計画法を適用することで終盤の冗長性を解消し,テストスイートのコンパクト化と制約遵守を両立することを目指す。
    • SeqTGは,高速な貪欲法による初期化と厳密な整数線形計画法による最適化を組み合わせることで,スケーラビリティと効率性を実現した。
    • 評価実験の結果,SeqTGは既存手法と比較して,テストスイートのコンパクト化において優れた性能を示した。
    • 特に終盤の冗長性の排除に効果があり,厳しい制約条件下でも高品質なテストスイートを生成することが確認された。

    Link: https://arxiv.org/abs/2603.13963

  • ReqToCode:要求追跡可能性をコードベースの構造的特性として埋め込む [cs.SE]目的:要求追跡可能性の構造的埋め込みによる,安全性が求められるソフトウェア開発における追跡性の維持
    • 安全性確保が重要なソフトウェア開発において,要求と実装の一貫性確認は不可欠である。
    • 要求,コード,テストが独立して変更されるため,追跡情報が陳腐化しやすいという課題がある。
    • コードベースに追跡可能性を埋め込み,コンパイル時に検証することで,追跡情報の劣化を防ぐ。
    • ReqToCodeは,要求を表現する「Traceable」というコード要素を生成し,コードに埋め込む。
    • Traceableは要求のメタデータを持ち,実装やテストコードから参照されることで,双方向のリンクを確立する。
    • 要求変更時には,段階的なライフサイクルを通じて警告やビルドエラーを発生させ,開発チームに情報を提供する。

    Link: https://arxiv.org/abs/2603.13999

  • MapReplay:Java HashMap のためのトレース駆動型ベンチマーク生成 [eess.SY, cs.SY, cs.PL, cs.PF, cs.SE]目的:Java HashMap のパフォーマンス評価手法
    • JavaアプリケーションやJVMにおいてHashMapは広く利用されており,その性能は重要である。
    • 既存のベンチマークは,現実的な使用状況を捉えきれないか,実行コストが高いという課題がある。
    • 現実的な操作シーケンスを再現し,効率的な評価を可能にするベンチマーク手法を開発すること。
    • MapReplayは,アプリケーションベンチマークの現実性とマイクロベンチマークの効率性を兼ね備えた手法である。
    • MapReplayはHashMap APIの使用状況をトレースし,内部状態を再現することで,現実的な評価を実現する。
    • DaCapo-ChopinとRenaissanceを用いた評価により,アプリケーションレベルのパフォーマンス傾向を再現し,実験時間を短縮した。

    Link: https://arxiv.org/abs/2603.14019

  • 整数評価点を用いるToom-Cook乗算の機械的検証 [cs.DS]目的:Toom-Cook乗算の正当性
    • 高速な多倍長整数演算は,暗号化や科学計算など,多くの分野で不可欠である。
    • Toom-Cook乗算は計算量を削減するが,再帰の停止条件を厳密に保証する必要がある。
    • 整数評価点を用いたToom-Cook乗算に対し,機械的に検証可能な停止条件を導出する。
    • 本研究では,汎用的な整数評価点を用いたToom-Cook乗算の正当性をLean 4とMathlibを用いて機械的に検証した。
    • 再帰の停止を保証する閾値関数を導出し,その閾値が被演算数に依存しないことを証明した。
    • AI定理証明器Aristotleを活用することで,機械的検証プロセスの自動化の可能性を示した。

    Link: https://arxiv.org/abs/2603.14038

  • レガシーコード翻訳のためのLLMベースのマルチエージェント手法:LegacyTranslate [cs.SE]目的:レガシーコードの翻訳品質向上
    • 大規模レガシーシステムの近代化は,企業環境において重要な課題である。既存のシステムを維持しつつ,新しい技術へ移行する必要がある。
    • LLMを直接コード翻訳に適用すると,構文的には有効だが,コンパイルエラーや既存フレームワークとの統合性の問題が生じやすい。
    • APIを意識した翻訳により,コンパイルと既存システムへの統合を改善し,実用的な近代化を実現することを目指す。
    • 初期翻訳エージェント単独で45.6%のコンパイル可能な出力,30.9%のテスト合格率を達成した。
    • API関連付けエージェントと改良エージェントを追加することで,コンパイル率はさらに8%向上し,テスト合格率は3%増加した。
    • 各エージェントが翻訳品質の向上に貢献することが示された。

    Link: https://arxiv.org/abs/2603.14054

  • DeepFix:エージェントAIを用いた機械学習ワークフローのデバッグと修正 [cs.SE]目的:機械学習ワークフローのデバッグと修正
    • 機械学習は重要アプリケーションに利用が増加しており,その品質保証が不可欠である。
    • 複雑なモデル構造や入力空間の広さから,機械学習システムの体系的なテストは困難である。
    • 従来のテストでは検出が難しい潜在的なバグの発見と修正支援を目指す。
    • DeepFixは,機械学習パイプライン全体を自動テストするツールであり,エージェントAIフレームワークを活用している。
    • Deepchecksを用いてバグを検出し,その後,エージェントAIを用いて詳細なバグレポートを生成する。
    • バグの重大度に基づいたランキング,分かりやすい説明,そして修正方法の提案を提供する。

    Link: https://arxiv.org/abs/2603.14099

  • 計算機科学の達成度と文章スキルがVibeコーディングの習熟度を予測する [cs.HC, cs.SE]目的:Vibeコーディング習熟度を予測する要因
    • ソフトウェア開発において,自然言語によるプログラミング手法が注目を集めているため。
    • Vibeコーディングの成功に影響を与えるスキルが明確にされていない。
    • Vibeコーディングの習熟度を高めるためのスキルセットを特定すること。
    • 計算機科学の達成度と文章スキルがVibeコーディングのパフォーマンスを有意に予測することが示された。
    • 特に,計算機科学の達成度は,一般的な認知スキルを統制した後でも,依然として有意な予測因子であった。
    • これらの結果は,ツール設計やカリキュラム開発に役立ち,プロンプト作成と計算機科学の基礎のどちらを重視すべきかを示唆する。

    Link: https://arxiv.org/abs/2603.14133

  • Sublime:偏ったストリームに対する亜線形エラーと空間効率 [cs.DS, cs.DB, cs.IT, math.IT]目的:偏ったストリームにおける頻度推定の精度とメモリ効率の改善
    • データストリーム中の頻度追跡は重要であり,リアルタイム処理に不可欠である。
    • 既存の頻度推定スケッチは,データの偏りに対してメモリ効率が悪く,エラー率がストリーム長に比例して増加する。
    • Sublimeは,ストリームの偏りと長さに動的に適応することで,これらの問題を解決することを目指す。
    • Sublimeは,カウンターの拡張により偏ったデータのメモリ消費量を削減する。
    • ストリーム長に応じてカウンター数を拡張することで,エラー率の増加を抑制する。
    • Count-Min SketchとCount SketchにSublimeを適用し,精度とメモリ効率の大幅な向上を実証した。

    Link: https://arxiv.org/abs/2603.14190

  • YARAエコシステムのマイニング:アドホックな共有からデータ駆動型脅威インテリジェンスへ [cs.SE, cs.CR]目的:YARAエコシステムの構造的特徴,メンテナンス,拡散のダイナミクス,運用上の信頼性に関する実証的証拠の特定
    • YARAはマルウェア検知の標準技術であり,ソフトウェアサプライチェーン全体のセキュリティ確保に不可欠である。
    • 公開リポジトリの品質が不明確であり,信頼性や有効性に関する検証が不足している。
    • YARAルールの品質評価と,脅威インテリジェンスの精度向上を目指す。
    • YARAルールは少数の作者に集中しており,全体の80%の採用が10人の作者によって推進されていることが判明した。
    • エコシステムは「静的なサプライチェーン」として機能しており,リポジトリの活動停止期間の中央値は782日,技術的な遅延の中央値は4.2年である。
    • 静的品質スコアは高い一方で,動的ベンチマークでは誤検知が多く,リコールの低さが明らかになった。また,ランサムウェアへの偏りが強く,最新の脅威への対応が遅れている。

    Link: https://arxiv.org/abs/2603.14191

  • 共有空,共有スペクトル:低高度経済のための協調的衛星-5Gネットワーク [cs.IT, math.IT]目的:低高度航空機向けの通信要件充足
    • 低高度経済の発展に伴い,安定した通信インフラの重要性が高まっている。
    • 衛星ネットワークと5Gネットワークの単独利用では,低高度における広範なカバレッジ確保が困難である。
    • 衛星と5Gの連携による低高度航空機への効率的な通信提供を目指す。
    • 提案手法は,粗い同期と協調的なスペクトル共有により,低コストかつ迅速な導入を実現する。
    • 低高度航空機の位置情報を活用した時間周波数スペクトル共有フレームワークを提案する。
    • リンク特徴を利用したクラスタリングにより,計算量を削減し,実用的な性能向上を達成した。

    Link: https://arxiv.org/abs/2603.14196

  • ソフトウェアエンジニアの,エージェント型コーディングアシスタントに対する認知的な関与度の理解 [cs.HC, cs.AI, cs.SE]目的:ソフトウェアエンジニアの認知的な関与と意味理解のプロセス
    • AIの過度な依存は思考力低下を招く可能性があり,特に自律性の高いAIシステムでは注意が必要。
    • 現状のエージェント型コーディングアシスタントは,熟考や検証を促す設計が不十分である。
    • AI支援プログラミングにおける,エンジニアの関与を維持し,より深い思考を促進する。
    • タスクの進行に伴い,ソフトウェアエンジニアの認知的な関与度は一貫して低下することが示された。
    • 現在のエージェント型コーディングアシスタントは,反省,検証,意味理解のための手がかりが限られている。
    • より豊かなインタラクションや認知的な強制メカニズムを活用した設計が,関与を維持する機会を提供する。

    Link: https://arxiv.org/abs/2603.14225

  • ハイブリッドデータレイクにおけるマルチモーダル,マルチホップ質問応答のためのエージェントDAGオーケストレーションプランナーフレームワーク [cs.AI, cs.SE]目的:ハイブリッドデータレイクにおけるマルチモーダル,マルチホップ質問応答
    • 企業における構造化データと非構造化データの統合が進み,自然言語による質問応答のニーズが高まっている。
    • 既存の質問応答システムは,非効率な検索と結合に依存し,マルチホップ推論をサポートしていない。
    • 構造化データと非構造化データを横断する複雑な質問に対し,正確かつ効率的な回答を実現すること。
    • 提案フレームワークA.DOTは,ユーザーの質問を構造化・非構造化データストアを網羅するDAG実行プランに変換する。
    • A.DOTは,スキーマを意識した推論,検証,並列実行,キャッシュ機構を取り入れ,質問応答の正確性と応答速度を向上させる。
    • ベンチマークデータセットにおいて,A.DOTはベースラインと比較して,正答率が14.8%,完全性が10.7%向上した。

    Link: https://arxiv.org/abs/2603.14229

  • ISIガウスチャネルの識別 [cs.IT, math.IT]目的:ISIガウスチャネルの識別容量
    • 無線通信において基本的なモデルであり,通信システムの性能評価に不可欠である。
    • チャネル識別能力の厳密な評価が困難であり,性能限界が不明確であった。
    • ISIチャネルにおける識別容量の上界と下界を導出し,通信性能の限界を明らかにする。
    • 符号長nに対してISIタップ数が亜線形に増加する場合でも,信頼性の高い識別可能なメッセージ数はnの対数に対して指数関数的に増加する。
    • ピーク電力制約下にある決定論的エンコーダを用いた離散時間ガウスチャネルについて,非漸近的な上限と下限を確立した。
    • 得られた結果は,チャネルの特性と符号化レートの関係を明らかにし,効率的な通信システムの設計に貢献する。

    Link: https://arxiv.org/abs/2603.14246

  • ITKIT:SimpleITKとMMEngineに基づく実行可能なCT画像解析 [cs.SE, cs.CV]目的:CT画像解析のための実行可能性検証
    • CT画像は臨床診断・治療に不可欠であり,その解析は医療の発展に貢献する。
    • 既存のフレームワークは,使いにくさや設定の複雑さが課題となっている。
    • ITKITは,手軽さと柔軟性を両立し,CT画像解析のハードルを下げることを目指す。
    • ITKITは,DICOMから3Dセグメンテーション推論までの完全なパイプラインを提供する。
    • CLIによる簡易な操作で,低スペックな環境でも容易に利用可能である。
    • OneDL-MMEngineにより,高度なユーザーは柔軟なモデル設定とデプロイメントを行える。

    Link: https://arxiv.org/abs/2603.14255

  • 構造化・幾何学的集合系に対するオンラインヒット集合アルゴリズムの改良 [cs.DS, cs.CG]目的:構造化・幾何学的集合系におけるオンラインヒット集合問題に対するアルゴリズムの性能向上
    • オンラインヒット集合問題は,データストリーム処理やネットワーク最適化など,様々な分野で重要な役割を果たす。
    • 従来のアルゴリズムは,一般的に二重対数的な競争率を持ち,その改善が課題であった。
    • 線形浅セル複雑性を持つ集合系において,競争率を単一対数的に改善することを目指す。
    • 線形浅セル複雑性を持つ集合系における重み付きオンラインヒット集合問題に対して,O(log n log log n) 競争率のアルゴリズムを提案した。
    • これにより,幾何学的集合族に対する重み付きオンラインヒット集合問題の上界を初めて確立し,一般問題との差を埋めることに貢献した。
    • 提案アルゴリズムは,二重対数的な因子を効果的に単一対数的な因子に置き換えることに成功した。

    Link: https://arxiv.org/abs/2603.14293

  • ほぼ均一な辺サンプリング:独立集合と局所グラフクエリの活用 [cs.DS]目的:辺のほぼ均一なサンプリング手法
    • グラフアルゴリズムの効率化に不可欠であり,大規模グラフの解析を可能とする。
    • サブ線形時間でグラフを扱う際,正確な辺の計数と均一なサンプリングのバランスが課題。
    • 独立集合クエリと局所クエリを用いた新しいモデルで,効率的な辺サンプリングを実現する。
    • 独立集合クエリと局所クエリの組み合わせモデルにおいて,辺の計数推定と同等の複雑度でサンプリングが可能となることが示された。
    • 独立集合クエリのみを用いたモデルにおいても,辺の計数推定と同等の複雑度でサンプリングが可能であることを証明した。
    • 各クエリモデルにおいて,均一な辺サンプリングの下限が,既知の近似辺計数下限とほぼ一致することが示された。

    Link: https://arxiv.org/abs/2603.14306

  • FDD大規模MIMOにおけるCSI圧縮の限界 [cs.IT, math.IT, stat.ML]目的:CSI圧縮の限界に関する解析と,それに基づく効率的なCSIフィードバックアーキテクチャの提案
    • 大規模MIMOは,通信容量の飛躍的な向上を可能にする技術であり,次世代無線通信の鍵となる。
    • FDDシステムにおけるCSIフィードバックは,チャネルの次元が高いため,その効率が通信性能を大きく左右する。
    • 広帯域CSIの特性を捉え,高効率な圧縮を実現することで,CSIフィードバックのオーバーヘッドを削減することを目指す。
    • 提案手法GMTCは,ニューラルネットワークに基づく手法と比較して,同等の圧縮性能を達成しつつ,モデルメモリと推論複雑性を大幅に削減する。
    • 最適なビット配分は,単一のグローバルな逆水準充填レベルによって決定されるという構造的な結果が得られた。
    • GMTCは,状態適応型変換符号化によって,大規模なニューラルエンコーダに頼ることなく,ほぼ最適なCSI圧縮を実現できることを示す。

    Link: https://arxiv.org/abs/2603.14325

  • 非対称TSPに対するより良い近似保証 [cs.DS, math.CO]目的:非対称TSPの近似比率の改善
    • 巡回セールスマン問題は組み合わせ最適化の古典であり,様々な応用がある。
    • 非対称TSPは,対称TSPよりも解くのが難しい問題として知られている。
    • 本研究は,非対称TSPに対するより現実的な近似解を提供することを目指す。
    • 非対称TSPの近似比率を15未満に改善した。
    • 非対称TSPの特別な場合である,重みなし有向グラフに対する近似比率も改善された。
    • 与えられた異なる終点を持つ最小コストツアーの一般化においても近似比率の改善が得られた。

    Link: https://arxiv.org/abs/2603.14334

  • チャープ領域波形のための統合されたパルス整形OFDMフレームワーク:連続時間モデリングと実用的な入出力解析 [cs.CL, cs.OS, cs.DC, cs.IT, eess.SP, math.IT]目的:チャープ領域波形の統合的なフレームワークに関する研究
    • 無線通信において,周波数利用効率向上のため,多重化技術の重要性が高まっている。
    • チャープ領域波形は,その実装において,ナイキストレート以下のサンプリングによる周波数エイリアシングの問題を抱えている。
    • 周波数エイリアシングの影響を解析し,適切なパルス整形フィルタを適用することで直交性を維持する手法を提案する。
    • チャープ領域波形は,ウェイル・ハイゼンベルクフレームワークにおけるパルス整形OFDMとして解釈できる。
    • 実装されたチャープ波形は,適切なサンプリングレートとパルス整形フィルタによって直交性を保つことが示された。
    • 実用的な受信機におけるチャープ領域波形の入出力関係は,従来の遅延ドップラーモデルに従わないことが示された。

    Link: https://arxiv.org/abs/2603.14358

  • セキュアなWeb to ERP決済フローへ: SAPベースシステムにおけるHTTPヘッダ信頼性の脆弱性事例研究 [cs.CR, cs.SE]目的:Web to ERP決済フローにおけるHTTPヘッダ信頼性の脆弱性
    • WebとERPシステムの連携は,現代の金融取引において不可欠であり,そのセキュリティは重要である。
    • クライアントからのHTTPメタデータへの過度な信頼が,決済の完全性を損なう潜在的な脆弱性となる。
    • HTTPレベルの検証の弱点を特定し,安全な決済処理のための設計と検証方法を提案すること。
    • 本研究では,SAPベースの決済フローにおけるHTTPヘッダ信頼性の脆弱性の事例を分析した。
    • 脆弱性は,未払い取引が完了済みと誤って処理される原因となった。
    • 支払状態の形式化,信頼境界の強化,および定期的なセキュリティレビューが推奨される。

    Link: https://arxiv.org/abs/2603.14365

  • 信頼よりも恐怖:システムプロンプトにおける動機付けフレーミングがAIエージェントのデバッグ深さに与える影響 [cs.SE]目的:AIエージェントのデバッグパフォーマンスに対する動機付けフレーミングの影響
    • AI技術の発展に伴い,AIエージェントの信頼性と効率性の向上が重要視されている。
    • システムプロンプトの設計はAIエージェントの行動に影響を与えるが,その効果は十分に解明されていない。
    • AIエージェントのデバッグ能力を最大化するための効果的なプロンプト設計手法を確立すること。
    • 信頼に基づいたフレーミングは,恐怖に基づいたフレーミングと比較して,AIエージェントの探索的行動を促進することが示された。
    • 信頼フレーミングを用いることで,AIエージェントはより多くの隠れた問題を特定し,より詳細な調査を行う傾向にある。
    • 恐怖フレーミングは,AIエージェントのパフォーマンス向上に寄与せず,デフォルトの満足化戦略からの脱却を促せないことが明らかになった。

    Link: https://arxiv.org/abs/2603.14373

  • 線形関数および有限連鎖環上の局所的に有界関数に対する関数訂正符号 [cs.IT, math.IT]目的:関数訂正符号の最適冗長性
    • 通信やデータストレージにおいて,誤り訂正は不可欠な技術である。
    • 従来の符号理論では,十分な性能を発揮できない場合がある。
    • より広範な関数のクラスに対する訂正符号の構成を目的とする。
    • 局所的に有界関数に対する関数訂正符号の明示的な構成が示された。
    • $\mathbb{Z}_4$上の不規則な同質距離符号に関するPlotkin類似の限界が導出され,既存の限界を改善した。
    • 線形関数に対するPlotkin類似の限界が導出され,線形関数が全単射の場合には古典的なPlotkin限界に帰着することが示された。

    Link: https://arxiv.org/abs/2603.14471

  • CangjieBench:低リソース汎用プログラミング言語におけるLLMのベンチマーク [cs.SE, cs.AI, cs.CL]目的:低リソース汎用プログラミング言語Cangjieに対するLLMの性能評価
    • 大規模言語モデルの応用範囲拡大のため,多様なプログラミング言語への対応が重要である。
    • 低リソース言語はデータ不足のため,LLMによるコード生成・理解が困難である。
    • CangjieBenchにより,低リソース言語におけるLLMの課題と改善策を明確にする。
    • 直接生成は性能が低い一方,構文制約生成が精度と計算コストのバランスが良いことが示された。
    • Agentは最高精度を達成するが,トークン消費量が大きいという課題がある。
    • コード変換タスクはテキスト変換タスクよりも性能が低く,言語特有のパターンへの過学習が示唆された。

    Link: https://arxiv.org/abs/2603.14501

  • DNA-MGC+: 合成DNAによる信頼性と効率的なデータ保存のための汎用コーデック [cs.IT, cs.ET, math.IT]目的:合成DNAデータストレージにおける信頼性およびリソース効率の向上
    • データ量は増加の一途をたどっており,長期保存の新たな手法が求められている。
    • DNAデータストレージはノイズの影響を受けやすく,エラーが発生しやすいという課題がある。
    • 多様な条件下で信頼性と効率的なデータ検索を可能にするコーデックの開発。
    • DNA-MGC+は,既存のコーデックと比較して,一貫して優れた性能を示すことが確認された。
    • 合成シナリオにおいて,最大24%のIDSエラー率下でも信頼性の高いデコードが可能である。
    • 電気化学合成下で,3x以下のシーケンス深度かつ3.5 bits/nt以下のリードコストで信頼性の高いデータ検索を実現した。

    Link: https://arxiv.org/abs/2603.14527

  • 過決定線形システムの最大エントロピー最小二乗解 [math.NA, cs.IT, cs.NA, math.IT, math.ST, stat.TH]目的:過決定線形システムの近似におけるエントロピーに基づく重み付き最小二乗法の理論的基盤
    • データへのロバストな適合は,様々な科学技術分野において重要な課題である。
    • 従来の最小二乗法では,外れ値の影響を受けやすく,安定した解を得ることが困難である。
    • 本研究は,外れ値の影響を抑制し,より安定した近似解を求めることを目指す。
    • 提案手法では,重みベクトルをエントロピー最大化によって決定し,あらかじめ指定した平均二乗誤差を実現する。
    • 得られた最適化問題は非凸であるが,最小二乗解から分岐する滑らかな解の存在と局所的な一意性が証明された。
    • 平均二乗誤差がゼロに近づく極限では,線形モデルに適合するデータの最大部分集合に重みが集中し,外れ値の影響が抑制される。

    Link: https://arxiv.org/abs/2603.14547

  • ISTQB認定資格の検証:ソフトウェアテスト専門職への貢献,およびAIによる実務者の推奨と批判の統合 [cs.CL, cs.DL, cs.CL, cs.SE]目的:ISTQB認定資格に対する認識と批判の分析
    • ソフトウェアテストは,高品質なシステム開発に不可欠であり,その専門性の向上が求められている。
    • ISTQB認定資格は広く認知されているが,実務への適合性や効果に関して議論がある。
    • ISTQB認定資格のメリットとデメリットを明確にし,ソフトウェアテストの知識体系への貢献を評価する。
    • 実務者の推奨意見からは,キャリア上のメリット,コミュニケーションの改善,共通語彙の確立がISTQB認定資格の主な価値として挙げられた。
    • 批判としては,過剰な理論的内容,アジャイルや自動化環境での関連性の低さ,実務的なテストスキルの育成不足などが指摘された。
    • 専門家レビューの結果,多くの推奨意見は妥当であると確認された一方,批判の中にはテスト実践における異なる学派間の対立などの問題も含まれていた。

    Link: https://arxiv.org/abs/2603.14572

  • 多クラスベイズネットワーク分類器の説明スケーリング [cs.CL, cs.AI, cs.LG, cs.LO]目的:多クラスベイズネットワーク分類器の説明手法
    • AIの説明可能性は,モデルの信頼性と社会実装に不可欠である。
    • ベイズネットワーク分類器の説明は,計算コストが高く,スケーラビリティに課題がある。
    • 多クラス分類器の説明を効率化し,実用的な規模に拡張すること。
    • 提案手法は,二値分類器に限定されず,コンパイル時間を大幅に改善する。
    • 出力されるクラス式は,OR分解可能な否定標準形(NNF)回路として表現される。
    • これにより,分類器の意思決定の説明計算が容易になる。

    Link: https://arxiv.org/abs/2603.14594

  • LLMを活用したリリースインテリジェンス:クラウドネイティブCI/CDパイプラインにおける変更概要の自動生成と影響分析 [cs.ET, cs.SY, eess.SY, cs.SE, cs.AI]目的:クラウドネイティブCI/CDパイプラインにおける変更概要の自動生成と影響分析
    • ソフトウェアデリバリーの高速化と信頼性向上は,ビジネス競争力に直結する重要な課題である。
    • 変更内容の把握と影響範囲の特定が手作業では困難であり,人的ミスや遅延の原因となる。
    • LLMを活用し,変更内容の自動要約と影響分析を行うことで,迅速かつ正確な情報提供を目指す。
    • 本研究では,CI/CDプロモーションワークフローにAIを活用したリリースインテリジェンスを組み込むフレームワークを提案した。
    • 提案手法は,変更内容の収集,LLMによる要約,依存関係分析を組み合わせることで,関係者にとって有用な情報を自動生成する。
    • Kubernetesネイティブなリリースプラットフォームでの実装例を通して,その有効性と課題を議論した。

    Link: https://arxiv.org/abs/2603.14619

  • s2n-bignum-bench:LLMの低レベルコード推論能力を評価するための実用的なベンチマーク [cs.PL, cs.AI, cs.CR, cs.LO]目的:LLMの低レベルコード推論能力の評価
    • 近年,LLMと形式手法を組み合わせた神経記号的アプローチが数学系定理証明で成果を上げている。
    • 数学コンテスト形式の成功は,実世界のコードの証明構築能力を示唆しない。
    • 産業用暗号ライブラリの形式検証をLLMに試みさせ,低レベルコード推論能力を評価する。
    • 本ベンチマークは,HOL Lightで検証済みのs2n-bignumライブラリのアセンブリルーチンを対象とする。
    • LLMに形式仕様を与え,HOL Lightで受け入れられる証明スクリプトを生成させる。
    • 本ベンチマークは,実用的な低レベル暗号アセンブリの機械検証可能な証明合成に焦点を当てている。

    Link: https://arxiv.org/abs/2603.14628

  • 合成指紋検出のための継続的少サンプル適応 [cs.CV, cs.IT, math.IT]目的:合成指紋検出における適応能力の向上
    • 指紋認証は広く利用されており,その安全性確保が重要であるため。
    • 生成AIの進化により,現実と区別のつかない合成指紋が生成可能になっている。
    • 未知の生成AIで生成された合成指紋に対する検出能力を向上させる。
    • 提案手法は,様々なDNNバックボーンとデータセットで,未知の合成スタイルに対する迅速な適応と,既知のスタイルへの忘却の抑制という良好なトレードオフを達成した。
    • 継続的少サンプル適応のため,二値クロスエントロピー損失と教師あり対照損失を組み合わせ,過去のスタイルからの少数のサンプルをリプレイすることで,破滅的忘却を緩和する。
    • 従来のDNNモデルでは,学習データに過剰適合し,未知の生成AIで生成された合成指紋に対して汎化性能が低下する傾向がある。

    Link: https://arxiv.org/abs/2603.14632

  • エントロピーの根絶:超簡潔グラフのための最適な木抽出 [cs.DS, cs.IT, math.IT]目的:ラベルなしグラフの可逆圧縮のための方法
    • グラフ構造の効率的な表現は,大規模ネットワーク分析やデータマイニングにおいて不可欠である。
    • 既存のグラフ表現法は,メモリ使用量が多く,大規模グラフへの適用が困難な場合がある。
    • グラフの構造的冗長性を排除し,メモリ使用量を最小化する表現法の開発。
    • 最小エントロピー木抽出(MINETREX)問題はNP困難であり,近似アルゴリズムの性能限界が示された。
    • 貪欲法による近似アルゴリズムは,比較的良好な近似率を達成する。
    • 抽出された木と残りのエッジを別個に格納することで,グラフの度数エントロピー圧縮を実現するデータ構造が得られる。

    Link: https://arxiv.org/abs/2603.14649

  • 非定常オンライン線形計画法の単一サンプルにおける多対数的な後悔限界 [cs.DS, cs.LG]目的:非定常オンライン線形計画法における後悔の限界
    • 資源配分は社会経済活動の根幹であり,効率的な配分手法の確立が重要である。
    • 現実世界の資源配分問題は非定常的であり,既存手法では対応が困難な場合がある。
    • 限られた情報下での効率的な資源配分戦略を確立し,実用的な問題を解決する。
    • 提案手法は,大規模資源条件下で $O((\log n)^2)$ の後悔限界を達成することを示した。
    • 環境変化やデータ不足といった厳しい条件下でも,多対数的な後悔が実現可能であることを示した。
    • 定常状態と非定常状態のオンライン線形計画法間のギャップを埋める貢献がある。

    Link: https://arxiv.org/abs/2603.14673

  • エージェントトレース:展開されたマルチエージェントシステムにおける根本原因分析のための因果グラフ追跡 [cs.LG, cs.AI, cs.SE]目的:展開されたマルチエージェントシステムの故障診断
    • 実世界でのマルチエージェントAIシステムの導入が進み,システムの複雑化に伴い,故障診断の重要性が増している。
    • カスケード効果や隠れた依存関係,長い実行トレースにより,マルチエージェントシステムの故障診断は困難である。
    • 実行ログから因果グラフを再構築し,エラーの遡及と根本原因の特定を効率化すること。
    • AgentTraceは,実行ログから因果グラフを再構築し,エラー発生箇所から遡って根本原因を特定する。
    • 構造的および位置的な信号を用いて候補となる根本原因をランク付けすることで,解釈可能性を高めている。
    • 多様なベンチマークテストにおいて,AgentTraceは高い精度と低遅延で根本原因を特定し,既存手法を上回った。

    Link: https://arxiv.org/abs/2603.14688

  • 直観的時相論理の時相アンサーセットプログラミングへの応用 [cs.CC, cs.DC, cs.LO, cs.AI]目的:時相アンサーセットプログラミングの論理的基盤
    • 知識表現と推論の分野において,時間的推論は重要な役割を担う。
    • 既存の時相論理プログラミングのアプローチは,理論的な基盤が脆弱である。
    • 直観的時相論理と時相論理プログラミングの間の形式的な対応関係を確立すること。
    • 本研究では,直観的論理と論理プログラミングの関係性に着目し,時相平衡論理を提案した。
    • PearceとOsorioのアプローチを時相設定に拡張し,形式的な対応関係を明らかにした。
    • これにより,時相アンサーセットプログラミングの理論的基盤が強化され,新たな研究方向性が示唆された。

    Link: https://arxiv.org/abs/2603.14692

  • ローカルコード最適化を超えて:ソフトウェアシステム最適化のためのマルチエージェント推論 [cs.SE, cs.AI]目的:ソフトウェアシステム最適化
    • 現代のソフトウェアは複雑化しており,システム全体の性能を最適化することが重要である。
    • 既存のアプローチは局所的なコード変換に偏っており,システム全体の相互作用を捉えきれていない。
    • マイクロサービス等のシステム全体を考慮した最適化手法を開発し,性能向上を目指す。
    • マルチエージェントフレームワークを提案し,システムレベルの性能推論を可能にした。
    • 提案手法は,マイクロサービスベースのシステムにおいて,スループットが36.58%向上し,平均応答時間が27.81%減少した。
    • 制御フロー,データフロー,アーキテクチャ情報などを統合することで,システム全体のボトルネックを特定し,最適化戦略を構築した。

    Link: https://arxiv.org/abs/2603.14703

  • 知識の活性化:エージェント型ソフトウェア開発のための機関知識プリミティブとしてのAIスキル [cs.AI, cs.HC, cs.SE]目的:機関知識の提供のための,AIスキルを構造化された原子知識ユニット(AKU)に特化するフレームワーク
    • 企業は重要な機関知識を蓄積するが,それは人間が解釈できる形式に閉じ込められている。
    • エージェント型ソフトウェア開発のボトルネックは,モデルの能力ではなく,知識アーキテクチャである。
    • 組織における文脈の再構築なしに,機関に根ざしたガイダンスを提供する。
    • AIスキルをAKUとして構造化することで,エージェントやエンジニアが機関知識を効率的に利用できる。
    • AKUは知識グラフを形成し,オンボーディングの圧縮,チーム間の摩擦の軽減,修正カスケードの排除に貢献する。
    • 機関知識をエージェント時代に合わせてアーキテクチャ化することで,組織はモデル能力への投資のみを行う組織を上回る。

    Link: https://arxiv.org/abs/2603.14805

  • ミッション指向型6G非地球ネットワークにおける遅延制約下でのリソース相乗効果 [cs.IT, math.IT]目的:ミッション指向型非地球ネットワークにおける遅延制約下でのリソース相乗効果
    • 災害時など,地上インフラが機能不全に陥った際の通信手段確保が重要である。
    • 緊急時において,限られたリソースで迅速な状況把握を実現することが課題である。
    • 災害時の緊急対応において,通信と計算リソースの効率的な連携によるコスト削減を目指す。
    • 提案手法は,既存手法と比較して約20%のコスト削減を達成し,その最適性と有効性が確認された。
    • 通信と計算リソース間の基本的なトレードオフが解析的に導出された。
    • エッジ情報ハブの配置最適化のために,逐次凸近似法が開発された。

    Link: https://arxiv.org/abs/2603.14812

  • SimCert:深層ニューラルネットワーク圧縮における行動類似性の確率的認証 [cs.SE, cs.AI, cs.LG]目的:深層ニューラルネットワーク圧縮における行動類似性の検証
    • 組み込みシステムへのDNN活用が拡大しており,その信頼性確保が重要である。
    • 量子化やプルーニング等の圧縮手法は,安全性や性能に悪影響を及ぼす可能性がある。
    • 圧縮モデルの行動類似性を確率的に保証し,安全性を評価する手法を提供する。
    • SimCertは,量子化とプルーニングに対応した二重ネットワークによる記号伝播を用いる。
    • Bernsteinの不等式に基づいた分散を考慮したバウンディングにより,安全性の証明を強化する。
    • ACAS Xuや画像認識のベンチマークで,既存手法を上回る性能が確認された。

    Link: https://arxiv.org/abs/2603.14818

  • 完全ニューラルネットワーク検証における反例誘導ブランチングと方向性緩和分析 [cs.SE]目的:完全ニューラルネットワークの検証における効率的なブランチング手法
    • 深層ニューラルネットワークの安全性確保は重要であり,形式検証が不可欠である。
    • 既存のデータフロー検証手法は,効率的な反例誘導のためのヒューリスティックが不十分である。
    • 反例から得られる情報に基づき,ブランチングを効率化することで検証時間を短縮する。
    • 提案手法DRG-BaBは,方向性緩和ギャップヒューリスティックを用いて,偽陽性につながるニューロンに優先的にブランチングを行う。
    • 線形制約から直接偽陽性反例を導出することで,汎用的な探索をターゲットを絞った改良へと変換する。
    • 高次元ベンチマーク実験により,提案手法が既存手法と比較して探索ツリーのサイズと検証時間を大幅に削減することが示された。

    Link: https://arxiv.org/abs/2603.14823

  • PCodeTrans:逆コンパイルされた擬似コードをコンパイル可能で実行可能な同等物へ変換 [cs.SE, cs.AI]目的:逆コンパイルされた擬似コードから,コンパイル可能かつ実行可能な同等コードの生成
    • バイナリ解析の基礎であり,ソフトウェアの理解や脆弱性発見に不可欠な技術である。
    • 従来のツールは可読性を優先し,コンパイル可能性や実行時の正確性に課題があった。
    • 逆コンパイルされたコードの正確性を高め,元のバイナリの動作を再現することを目指す。
    • PCodeTransは,コンパイル可能性を保証しつつ,LLMを活用して意味的なずれを修正するフィードバックループを実現した。
    • CoreutilsとBinutilsを用いた評価で,PCodeTransは既存の手法を大きく上回り,高いコンパイル率と動作一致率を示した。
    • 特に,シンボル情報のないバイナリに対しても高い堅牢性を維持し,96%以上の動作一致率を達成した。

    Link: https://arxiv.org/abs/2603.14855

  • ハーブランド図式から関数的解釈へ [cs.LO]目的:ハーブランド図式と古典的順序論理の関数的解釈
    • 論理学の基礎をなす順序論理の形式化と証明方法の理解深化に貢献する。
    • 順序論理の証明におけるカット除去の必要性が課題となっていた。
    • カット除去に頼らずハーブランド図式からハーブランド連言を直接抽出する方法を提示する。
    • ハーブランド図式の核心的なアイデアは,ゲアハルトとコーレンバッハによる古典論理の関数的解釈に類似した,古典的順序論理の関数的解釈として再構築できる。
    • 本研究は,ハーブランド図式をより抽象的かつ一般的な枠組みで理解することを可能にする。
    • 順序論理の関数的解釈は,証明の構造と意味論的解釈の関係を明確化する上で重要な役割を果たす。

    Link: https://arxiv.org/abs/2603.14933

  • 区間上の半連続単調演算を持つ凸代数 [cs.LO, math.LO]目的:区間[0,1]上の半連続単調演算を持つ凸代数の分類
    • 代数学は,数学の基礎であり,様々な分野に応用されている。
    • コンパクトな定量的等式理論の範囲が明確でなかった。
    • 区間[0,1]上の半連続単調演算を持つ凸代数を完全に分類すること。
    • 区間[0,1]上の半連続単調演算を持つ全ての可能な凸演算の明示的な構成を与えた。
    • この結果は,Mioの定理が適用される理論の範囲を正確に記述する。

    Link: https://arxiv.org/abs/2603.14955

  • 非周期構造は崩壊しない:損失圧縮のためのフィボナッチ階層 [cs.IT, math.CO, math.DS, math.IT]目的:損失圧縮における非周期階層の構造的優位性
    • データ圧縮は情報科学の根幹であり,効率的な圧縮技術はストレージ容量の削減とデータ伝送速度の向上に不可欠である。
    • 周期的な階層構造は,階層の深さが増すにつれて有効な検索位置が減少し,圧縮効率が低下する問題がある。
    • 非周期的なフィボナッチ階層が,周期的な階層構造の崩壊問題を解決し,より効率的な圧縮を可能にすることを示す。
    • フィボナッチ準結晶タイリングは,周期的なタイリングが示す有限の深さでの崩壊を回避し,全てのレベルで利用可能なn-gram検索位置を維持する。
    • 黄金補償特性により,位置数の指数関数的な減少とフレーズ長の指数関数的な増加が釣り合い,規模不変なカバレッジを維持する。
    • 実験結果から,非周期階層に基づくQuasicryth圧縮器は,周期5をベースラインとする圧縮器よりも大きな圧縮率を示すことが確認された。

    Link: https://arxiv.org/abs/2603.14999