arXiv雑要約

プログラム - 2026/03/09 公開

行動方針としてのトラバーサル：ログ蒸留されたゲート付き行動木を，安全で堅牢かつ効率的なエージェントのための外部化された検証可能な方針として [cs.HC, cs.HC, cs.LG, cs.AI, cs.CR, cs.SE]目的：LLMエージェントの長期的な方針を明示化し，安全性と効率性を向上させること
- 自律型LLMエージェントの性能向上は，AI研究における重要な課題である。
- 既存手法では，安全性の確保が後付けであり，長期的な方針がモデル内部に暗黙的に存在している。
- 実行ログから抽出した行動木を用いることで，安全性を保証しつつ，方針を明示的に表現すること。
- ゲート付き行動木（GBT）は，15以上のベンチマークにおいて成功率を向上させ，違反率をほぼゼロに近づけた。
- SWE-bench Verifiedにおいて，GBT-SEは成功率を34.6%から73.6%に向上させ，違反率を2.8%から0.2%に削減した。
- 8B実行器においても，SWE-bench VerifiedとWebArenaで成功率がそれぞれ2倍以上に向上した。
Link: https://arxiv.org/abs/2603.05517
EigenData：関数呼び出しデータ合成，監査，および修復のための自己進化型マルチエージェントプラットフォーム [cs.RO, cs.SE, cs.AI, cs.CL]目的：関数呼び出しデータに関する合成，監査，修復を行うプラットフォーム
- LLMの機能活用には，API等のツールと連携する能力が不可欠であり，そのためには質の高い学習データが必要である。
- 既存の学習データは，実行環境，バックエンドデータベース，多様な対話経路において品質が十分でない場合がある。
- 高品質な学習データの自動生成，既存データの品質評価と修正，より適切な評価指標の導入を目指す。
- EigenDataは，データベース構築，実行環境生成，対話経路合成を自動化するマルチエージェントシステムである。
- BFCL-V3を監査・修復し，関数スキーマ，実装，参照軌跡の体系的なエラーを特定・修正した。
- 結果として，修復されたベンチマークと結果重視の評価指標により，モデルランキングと人間の判断との相関性が大幅に向上した。
Link: https://arxiv.org/abs/2603.05553
記述論理概念におけるモデル変更 [cs.LO, cs.AI]目的：記述論理概念に対するモデル修正の形式化
- 知識表現の基盤技術であり，意味論的推論や知識ベースシステムの構築に不可欠である。
- 既存の研究では，モデルの変更操作の組み合わせが単純であるとの誤解がある。
- モデル変更の種類（排除，受容，修正）の形式的定義と，それらの関係性の解明を目指す。
- モデル変更として，排除，受容，修正の３つの主要な変更様式を定義した。
- 修正が排除と受容の単純な組み合わせに還元されないことを示した。
- ELおよびALC記述論理概念における排除と受容の整合性，ALC概念における修正の整合性に関する結果を得た。
Link: https://arxiv.org/abs/2603.05562
ツール創成：自己進化型言語エージェントのためのタスク駆動型ツール作成ベンチマーク [cs.SE, cs.AI]目的：自己進化型言語エージェントのツール作成能力の定量化
- 言語エージェントの自己進化研究は進んでおり，タスクに応じたツール作成・適応能力が重要視されている。
- 既存のベンチマークは事前定義された仕様に依存し，拡張性や自律的な進化を阻害している。
- 抽象的な要件のみからツールを作成し，現実の問題解決に活用できるかを評価することで，課題解決を目指す。
- 最先端モデルであっても，初回試行で正確なツールインターフェースや実行可能なロジックを生成するのは困難である。
- わずかな初期の欠陥がパイプライン上で増幅され，下流の指標が著しく低下する。
- 本ベンチマークは，実世界の問題に対応できる汎用的なツールの合成に向けた研究を促進することを期待する。
Link: https://arxiv.org/abs/2603.05578
メモリ制約のあるフラッシュ組み込みデバイス向け，省スペースなB木実装 [cs.DB, cs.DS]目的：メモリ制約のある組み込みデバイスにおけるB木の効率的なインデックス処理
- 農業，環境，産業監視などデータ収集デバイスはIoT応用で重要。デバイス内処理の最適化が求められる。
- サーバー向けB木最適化は，組み込みデバイスのリソース制約により適用が困難な場合が多い。
- リソースの少ない組み込みデバイスでも効率的なB木インデックス処理を実現すること。
- 実験結果から，小型デバイスでも効率的なB木インデックス処理が可能であることが示された。
- ストレージに特化した最適化を用いることで，有意な性能向上が確認された。
Link: https://arxiv.org/abs/2603.05632
モデルコンテキストプロトコル(MCP)ソフトウェアにおける実際的な欠陥：包括的な分類 [cs.SE]目的：MCPサーバーにおける欠陥の分類
- 基盤モデルの急速な普及により，ソフトウェアの能力が飛躍的に向上している。
- 外部ツールとの連携における信頼性，セキュリティ，堅牢性が課題となっている。
- MCPベースのシステム特有の欠陥を特定し，より安全なシステムの開発に貢献する。
- 実証的な証拠に基づき，MCPサーバーにおける5つの高レベルの欠陥カテゴリを特定した。
- 調査の結果，すべての欠陥カテゴリが実際に発生することが確認された。
- 本研究は，MCPベースのシステムにおけるエラーが発生しやすいコンポーネントを特定し，開発者への示唆を提供する。
Link: https://arxiv.org/abs/2603.05637
ハイブリッド構造編集：ツール向けの構造，ユーザー向けのテキスト [cs.PL]目的：プログラミング環境におけるツール拡張のあり方
- プログラミングにおいて，優れたツールはより良い結果を生み出すため，開発効率向上に不可欠である。
- 既存の拡張メカニズムでは，テキストソースコードとツールの密な統合が難しく，構造追跡に課題がある。
- 構造的制約を宣言し遵守することで，ツールの安全な拡張と一貫性のあるユーザー体験を実現すること。
- ハイブリッド構造編集は，ツールビルダーに構造的保証を提供しつつ，ユーザーには慣習的なテキスト編集インターフェースを提供する。
- このアプローチにより，プログラムの構造に関する制約を宣言し，その遵守を確実にすることができる。
- 実装とケーススタディを通して，ハイブリッド構造編集の有効性が示された。
Link: https://arxiv.org/abs/2603.05644
CHERIにおけるVM実装の落とし穴：CRuby移植からの教訓 [cs.PL]目的：CHERI環境におけるVM実装の潜在的な問題点の特定と解決策の提示
- メモリ安全性の確保は現代のソフトウェアシステムにおいて重要な課題であり，セキュリティ向上に不可欠である。
- 従来のポインタによる脆弱性が依然として存在し，VMのような複雑なシステムでは特に深刻である。
- CHERIアーキテクチャへのVM移植における具体的な落とし穴を明らかにし，安全なVM構築を支援する。
- CRubyのCHERIへの移植事例を通じて，C言語の未定義動作に起因する落とし穴を分類・分析した。
- VM特有の実装テクニックやイディオムが，CHERIの厳格なメモリ安全モデルと矛盾し，予期せぬエラーを引き起こすことが示された。
- 特定された問題に対する回避策を提示し，CRuby移植への適用や既存事例の調査を通じてその有効性を検証した。
Link: https://arxiv.org/abs/2603.05645
関数型プログラミングの授業におけるLLMの評価：包括的な研究 [cs.PL]目的：関数型プログラミングの授業におけるLLMの有効性
- 教育現場におけるLLMの利用は，学習者の知識習得を支援する可能性を秘めている。
- LLMは高リソース言語では有効だが，低リソース言語での性能は不明な点が多い。
- 低リソース言語OCamlにおけるLLMの能力を評価し，その限界と可能性を明らかにすること。
- 主要なLLM3つは，関数型プログラミングの典型的な課題において，全体的に有効であることが示された。
- しかし，PythonやJavaといった高リソース言語と比較すると，課題解決数は少なかった。
- LLMは，構文・型エラーの修正や，基本的な概念に関する質問への回答に強みを持つことが明らかになった。
Link: https://arxiv.org/abs/2603.05646
JoinActors: ジョインパターンを持つアクターのためのモジュールライブラリ [cs.CY, cs.HC, cs.PL]目的：ジョインパターンを用いたメッセージパッシングアプリケーションにおける効率的なパターンマッチング手法
- 分散システムにおける並行処理の複雑さを軽減し，より直感的で宣言的なプログラミングを可能にする。
- 既存のジョインパターン実装は，特定のドメインに特化し，既存の環境への統合が困難である場合が多い。
- 既存言語に組み込み可能で，様々なマッチングアルゴリズムを比較・利用できるモジュール性の高いツールキットを開発する。
- JoinActorsライブラリは，Scala 3の標準的なパターンマッチングAPIに類似した直感的なインターフェースを提供することで，容易な統合を実現している。
- メタプログラミングを活用したモジュール設計により，複数のマッチングアルゴリズムの組み込みと性能比較が可能となった。
- 最適化されたマッチングアルゴリズムは，既存のJoinActorsライブラリと同等の結果を生成しながら，有意に高い性能を達成している。
Link: https://arxiv.org/abs/2603.05648
勾留型静的型付けにおける性能改善のための型アノテーション効率的選択 [cs.PL]目的：勾留型静的型付けプログラムの実行性能改善のための型アノテーション部分集合の選択
- 近年のプログラミング言語設計において，静的型付けと動的型付けの統合を可能にする勾留型静的型付けが注目されている。
- 部分的に型アノテーションを追加するだけでは，実行速度が低下する可能性があり，それが課題となっている。
- 型推論によって得られた型アノテーションから，より効率的な部分集合を選択することで，実行性能を向上させる。
- 提案手法は，軽量なアプローチにより短いコンパイル時間を実現し，データフローに沿って型アノテーションを選択する。
- Reticulated Pythonを用いた実験により，型推論で得られたすべての型アノテーションを使用する単純な戦略と比較して，提案手法がより優れた性能を示すことが確認された。
- 既存のアプローチと同程度の実行速度を達成しつつ，型アノテーションの導出と選択にかかるコンパイル時間の安定性を維持する利点がある。
Link: https://arxiv.org/abs/2603.05649
冷蔵庫内での並べ方：単純なエントロピー感受型厳密なインプレースソートアルゴリズム [cs.DS]目的：厳密なインプレースソートアルゴリズムの開発
- 組み込みシステムはメモリ制約が厳しいため，効率的なメモリ使用が不可欠である。
- 既存のソートアルゴリズムは，追加のメモリを使用するか，エントロピーに基づいた最適な時間複雑度を持たない。
- 入力配列のエントロピーに基づいた最適な時間複雑度を持つインプレースソートアルゴリズムの実現。
- 本研究では，厳密なインプレースであり，入力配列のエントロピーH(A)に関して最適な実行時間を実現する比較ベースのソートアルゴリズムを初めて提案する。
- スタックベースの自然マージソートアルゴリズムを実装するための2つの単純なパラダイムを示し，O(n(1 + H(A)))時間で厳密なインプレースを実現する。
- 冷蔵庫のようなメモリ制約のある組み込みシステムにおいて，効率的なソート処理を可能にする。
Link: https://arxiv.org/abs/2603.05676
LTLGuard：コンパクトな言語モデルと軽量な記号推論によるLTL仕様の形式化 [cs.LO, cs.AI, cs.SE]目的：LTL仕様の生成と一貫性検証
- 要求仕様の正確性はシステム開発において不可欠であり，形式的な検証が重要である。
- 自然言語による要求記述は曖昧さを持ちやすく，形式仕様への変換が困難である。
- 小規模言語モデルによるLTL仕様の自動生成における，文法誤りや矛盾の解決。
- LTLGuardは，制約付き生成と形式的な一貫性チェックを組み合わせたツールチェーンである。
- 生成されたLTL仕様は，矛盾がないことが確認されている。
- 軽量な自動推論ツールを用いて，候補仕様を反復的に改善し，矛盾の原因を特定する。
Link: https://arxiv.org/abs/2603.05728
CodeScout: ソフトウェアエージェントのための文脈に沿った課題記述の強化 [eess.SY, cs.SY, cs.CL, cs.CL, cs.SE]目的：ソフトウェアエージェントにおける課題記述の改善
- ソフトウェア開発の効率化に貢献するAI支援ツールの重要性が増している。
- AIによるコード支援は，曖昧な課題記述に起因する問題が課題となっている。
- CodeScoutは，課題記述の曖昧さを解消し，エージェントの性能向上を目指す。
- CodeScoutは，対象コードベースの事前探索を通じて，曖昧な要求を具体的な課題記述へと変換する。
- SWEBench-Verifiedを用いた評価で，解決率が20％向上，最大27件の追加解決に貢献した。
- 文脈分析によるクエリの洗練が，AIコード支援能力向上に有効であることが示唆された。
Link: https://arxiv.org/abs/2603.05744
ReflexiCoder：強化学習による自己省察と自己修正を通じて，大規模言語モデルにコード生成能力を学習させる [cs.RO, cs.CL, cs.LG, cs.SE]目的：大規模言語モデルにおける，自己省察と自己修正によるコード生成能力の向上
- コード生成において，大規模言語モデルの活用が期待される。複雑な課題解決には限界がある。
- 従来の反復改善戦略は，外部からの情報や計算コストが高い。
- モデル内部で，自己省察と自己修正を可能にし，外部依存性を低減する。
- ReflexiCoder-8Bは，HumanEval (Plus)で94.51% (87.20%)，MBPP (Plus)で81.80% (78.57%)を達成し，オープンソースモデルの最先端性能を確立した。
- BigCodeBench，LiveCodeBench，CodeForcesといったベンチマークにおいても高い性能を示し，GPT-5.1に匹敵またはそれを上回る結果を出した。
- 規律ある高速な推論と自己省察により，推論時間の計算コストを約40%削減した。
Link: https://arxiv.org/abs/2603.05863
極大規模RIS支援近距離場安全通信におけるビームフォーミング最適化 [cs.IT, math.IT]目的：極大規模再構成可能知能表面（RIS）を用いた近距離場物理層セキュリティ通信システムにおける秘匿率最大化
- 無線通信の安全性確保は不可欠であり，傍受リスクへの対策が重要である。
- 従来のセキュリティ手法は，大規模RIS環境下での性能劣化が課題である。
- 大規模RISを活用した，より堅牢な秘匿率向上が求められている。
- 提案手法は，基地局のプレコーディングとRISの反射係数行列を共同で最適化し，秘匿率を向上させる。
- 人工ジャミングを導入することで，通信セキュリティをさらに強化する。
- シミュレーション結果から，提案手法は傍受者がユーザと同じ方向に位置する場合でも安全通信を確保できることが示された。
Link: https://arxiv.org/abs/2603.05922
コーディングエージェントの失敗に対するXAI：生の実行トレースを実用的な洞察に変換 [cs.SE, cs.AI]目的：コーディングエージェントの失敗原因の特定と修正の効率化
- ソフトウェア開発の自動化は生産性向上に不可欠であり，LLMベースのエージェントはその重要な役割を担う。
- エージェントの失敗原因は解明が難しく，開発者の負担となるため，迅速な特定と修正が求められる。
- 生の実行トレースから，人間が理解しやすい構造化された説明を生成し，問題解決を支援する。
- 本研究で開発したXAIアプローチは，失敗原因の特定時間を2.8倍短縮することに成功した。
- また，適切な修正提案の精度を73%向上させ，生の実行トレースと比較して大幅な改善が見られた。
- 構造化されたアプローチは，既存の生成AIモデルによる説明よりも一貫性のある，ドメイン特化型の洞察を提供した。
Link: https://arxiv.org/abs/2603.05941
局所・クラウドモデルのカスケードによるコード補完の遅延と精度の両立 [cs.CY, cs.SE]目的：コード補完における遅延と精度のバランス改善
- ソフトウェア開発効率の向上に不可欠であり，開発者の生産性向上に寄与する。
- 大規模言語モデルは精度が高いが遅延が大きく，小規模モデルは高速だが精度が低いという課題がある。
- 局所モデルとクラウドモデルのカスケードにより，遅延を抑えつつ精度を向上させることを目指す。
- MCComは，ユーザーの操作をトリガーとしてクラウドLLMを起動することで，クラウド計算コストを削減する。
- 2段階の推測デコード戦略と反復検索メカニズムにより，モデル間の協調性を高めている。
- 121Mパラメータの軽量モデルが，7B最先端モデルの73.8%の性能を達成した。遅延を最大47.9%削減し，LLM使用量を46.3%削減した。
Link: https://arxiv.org/abs/2603.05974
ω鎖による対角化：有界チューリングマシン上の反復自己認証と最小固定点 [cs.LO]目的：有界チューリングマシンにおける反復自己認証の最小固定点
- 計算可能性理論において，停止問題は重要な未解決問題であり，その解決は計算機の限界を理解する上で不可欠である。
- 自己認証は，チューリングマシンの停止性を検証する際に時間的オーバーヘッドが生じるため，有界マシンでは成立しないという問題がある。
- 有限の停止観測から無限の計算を捉えるため，ω鎖と最小固定点の概念を用いて，この問題を解決することを試みる。
- 有限の観測から最小固定点への移行を連続的な対角化の遅延として捉える新たな視点を提供する。
- この構成は，停止問題を捉えるためのドメイン理論的枠組みを提示する。
- ω鎖のスコット限界は，マシンの停止挙動を完全に捉えた無限の計算を表す最小固定点に収束する。
Link: https://arxiv.org/abs/2603.06012
増幅機能を備えた対角線外RISのモデリングと最適化 [cs.IT, eess.SP, math.IT]目的：対角線外RISにおける信号モデルの構築と最適化
- 無線通信におけるスペクトル効率向上の重要性が高まっており，RIS技術が注目されている。
- 従来のRISは受動素子であり，信号の損失が大きいため，性能に限界があった。
- 増幅機能を持つRISを用いることで，信号損失を抑制し，通信性能を向上させる。
- 提案手法は，下り方向の合計レート最大化問題をWMMSE問題として定式化し，単調減少が証明可能な交互最適化フレームワークを提案する。
- 提案手法は，MMSEコンバイナと重みのクローズドフォーム更新，水満しのようなビームフォーマ更新，および要素ごとの増幅更新を含む。
- 数値実験の結果，提案手法は従来の受動的なBD-RISと比較して，大幅な合計レート向上を実現することが示された。
Link: https://arxiv.org/abs/2603.06020
ガウス面積による（ほぼ）最適な時間での無知識学習 [cs.LG, cs.DS, stat.ML]目的：ガウス周辺下における概念クラスの学習複雑性
- 機械学習の理論において，学習可能性と計算量の関係を明らかにすることは重要である。
- 既存手法では，近似の精度と多項式次数との間にトレードオフが存在し，効率的な学習が困難である。
- ガウス面積に基づく学習複雑性のより正確な上限を導き出し，学習効率の向上を目指す。
- 本研究により，既存の結果を改善し，近似精度εに対する多項式次数dを $\tilde O (\Gamma^2 / \varepsilon^2)$ に削減できた。
- この結果は，統計的クエリモデルにおける多項式閾値関数の無知識学習の複雑性に関する（ほぼ）最適な上限を与える。
- Feldmanらの構成の直接的な類似を用いて，この結果を証明した。
Link: https://arxiv.org/abs/2603.06027
仕様と現実が出会う時：イーサリアムインフラにおけるAPI不整合の解明 [cs.SE, cs.CR]目的：イーサリアムにおけるAPI不整合の検出
- イーサリアムは巨大な資産を保護し，DeFiエコシステムの基盤であるため，その信頼性は極めて重要である。
- イーサリアムクライアントAPIに広範な実装不整合が存在し，ユーザー体験やネットワークの信頼性を損なう可能性がある。
- 既存のテスト手法は不十分であり，API不整合を自動的に検出するフレームワークが求められている。
- APIDifferは，API仕様に基づいてテストスイートを生成し，異なるクライアント間でAPIの不整合を自動的に検出する。
- 評価の結果，11の主要なイーサリアムクライアントにおいて72個のバグが発見され，そのうち90.28%が開発者によって確認または修正された。
- APIDifferは既存のツールよりも高いコードカバレッジを達成し，誤検出率を大幅に削減した。コミュニティからの反応も肯定的である。
Link: https://arxiv.org/abs/2603.06029
テキスト仕様とドメインモデル間の意味的整合性の検出 [cs.SE]目的：テキスト仕様とドメインモデル間の整合性判定
- ソフトウェア開発初期段階で，テキスト仕様に基づいたドメインモデルは有用である。モデルの品質が開発の成否を左右する。
- 正確なドメインモデル作成とテキスト仕様との明確な関連付けは，特に初心者モデラーにとって課題である。
- 部分的なドメインモデルとテキスト仕様の整合性を自動的に判定し，モデルの品質向上に貢献すること。
- 提案手法では，自然言語処理とLLMを活用し，モデル要素に対応する自然言語記述を生成し，原文と照合することで整合性を判定する。
- 実験結果から，適合率がほぼ1，再現率が約78%で整合性と不整合性を識別できることが示された。処理時間は要素あたり18秒～1分。
- 本手法は，誤った判定がほとんどなく，3/4以上のモデル要素を分類可能であるため，モデリングツールへの組み込みやオフライン検証に利用できる。
Link: https://arxiv.org/abs/2603.06037
貪欲なパケット転送 [cs.DS]目的：オンライン到着パケットの転送における最大フロー時間の最小化
- ネットワークにおけるパケット転送は，通信システムの効率性に不可欠な要素である。
- 既存の転送アルゴリズムは，最適な性能を保証するものが少なく，競争率の改善が課題である。
- 特定の条件下における貪欲アルゴリズムの性能評価と，その限界の明確化を試みる。
- 各パケットが1つまたは2つのルータを経由する場合，貪欲アルゴリズムの競争率は正確に$2-2^{1-k}$となる。
- ランダム化アルゴリズムであっても，下限は$4/3$を超えることが示された。
- 2014年にAntoniadisらによって提起されたオープン問題に対して，部分的な進展が得られた。
Link: https://arxiv.org/abs/2603.06039
AI以前のベースライン：2022年の開発者IDE満足度とツール自律性 [cs.SE]目的：ソフトウェア開発者のIDE満足度とツール選択の自律性に関する現状の定量的な把握
- ソフトウェア開発は現代社会の基盤であり，その効率性と開発者の満足度は重要である。
- AI技術の導入が開発環境に与える影響を評価するには，AI以前の正確なベースラインデータが必要である。
- AI導入前後の開発者体験の変化を定量的に把握し，AI技術の導入効果を検証すること。
- 2022年7月の調査において，ソフトウェア開発者のIDE満足度は全体的に高く，平均は8.14であった。
- ツール選択における自律性がIDE満足度を最も強く予測する要因であり，デモグラフィックや役割よりも有意に影響を与えることが確認された。
- クラウドIDEの利用率は低く，ネットワーク依存が主な障壁として挙げられ，これは現代のAIエージェントにとっても重要な制約となる。
Link: https://arxiv.org/abs/2603.06050
GenAIのためのLINDDUNベースのプライバシー脅威モデリングフレームワーク [cs.CR, cs.SE]目的：生成AIにおけるプライバシー脅威分析を支援するためのフレームワーク
- 生成AIの普及に伴い，個人情報保護は重要課題となっている。
- 従来のセキュリティ脅威モデリングでは，プライバシー侵害のリスクが軽視されがちである。
- 生成AI特有のプライバシーリスクを特定・評価できるフレームワークの構築。
- 本研究では，LINDDUNに基づき，生成AIに特化したプライバシー脅威モデリングフレームワークを提案した。
- 文献調査とチャットボットシステムへの適用により，フレームワークを構築し，LINDDUNの7種類の脅威タイプのうち3つに影響を与える100件の事例を追加した。
- AIエージェントシステムへの適用により，本フレームワークが包括的なプライバシー分析を支援できることを実証した。
Link: https://arxiv.org/abs/2603.06051
干渉路における分散意味的アライメント：ゲーム理論的アプローチ [cs.IT, cs.GT, math.IT]目的：干渉路における分散意味的アライメントの最適化
- AI駆動システムにおいて，効率的なタスク遂行には意味伝達が不可欠である。
- 異なるロジックや内部表現により，意味的な不整合が生じ，通信の妨げとなる。
- 複数デバイスの干渉環境下での意味的共存と潜在空間のずれを解決する。
- 提案手法は，線形MIMOトランシーバの分散非協調ゲームによる共同最適化を可能にする。
- ナッシュ均衡の存在条件を導出し，送信と意味的アライメント戦略を最適化する。
- 数値結果は，情報圧縮，干渉軽減，意味的アライメント，タスク性能間のトレードオフを示す。
Link: https://arxiv.org/abs/2603.06077
C拡張Pythonプロジェクトにおける現実世界の故障検出と自動ユニットテスト生成 [cs.SE]目的：C拡張を持つPythonプロジェクトの故障検出とテスト生成
- Pythonのパフォーマンス向上のためC拡張が利用されている。安定性と信頼性の確保が重要。
- C拡張内の例外はPythonの例外処理を回避し，インタプリタをクラッシュさせる可能性がある。
- C拡張におけるクラッシュを検出し，テスト生成を継続できるよう改善する。
- 提案手法では，テスト生成と実行を分離し，各テストを独立したサブプロセスで実行する。
- これにより，クラッシュがテスト生成プロセスを停止することなく，故障検出が可能になった。
- 21のライブラリから1648モジュールを対象に評価した結果，56.5%多くのモジュールをテストでき，32の未知の故障を発見した。
Link: https://arxiv.org/abs/2603.06107
アルカイド：距離制約符号化による耐編集性を持つ，証明可能な安全なステガノグラフィ [cs.CR, cs.IT, cs.MM, math.IT]目的：編集エラーに対する耐性を備えた，証明可能な安全なステガノグラフィスキーム
- 情報隠蔽は，通信の秘匿性を確保する上で重要であり，特にセキュリティが求められる状況で不可欠である。
- 既存のステガノグラフィは同期に依存し，編集エラーに弱いため，実用上の課題となっていた。
- 編集エラーが発生した場合でも，正確な復号を保証する，より堅牢なステガノグラフィスキームを開発すること。
- アルカイドは，最小距離復号原理を符号化プロセスに組み込み，異なるメッセージ間の編集距離に厳格な下限を設けることで，編集エラーへの耐性を実現している。
- 理論的に，アルカイドは有界のエラーに対して決定的な堅牢性を持つことが証明されている。
- 実験結果は，多様なエラーチャネルにおいて99%～100%の復号成功率，0.2ビット/トークンのペイロード，6.72ビット/秒の符号化速度を示す。
Link: https://arxiv.org/abs/2603.06169
フェージングチャネルにおける連続開口アレイの秘匿性能について [cs.DC, cs.IT, eess.SP, math.IT]目的：連続開口アレイ（CAPA）を用いた盗聴チャネルにおける秘匿率および秘匿遮断確率の分析
- 無線通信における情報セキュリティは，プライバシー保護や機密情報漏洩防止のために不可欠である。
- 盗聴者の存在下での無線通信の秘匿性能評価は，セキュリティ対策において重要な課題である。
- CAPAシステムの秘匿性能を理論的に解析し，その特性を明らかにすることで，安全な無線通信システムの設計に貢献する。
- CAPAシステムは，単一の盗聴者，複数の独立した盗聴者，複数の協調的な盗聴者のいずれの場合においても，高SNR領域において同一のスロープとダイバーシティオーダーを示すことが示された。
- 単一の盗聴者がいるCAPAシステムは，最も小さい高SNRオフセットと最大の配列ゲインを持つ一方，複数の協調的な盗聴者がいるCAPAシステムは，最も大きい高SNRオフセットと最小の配列ゲインを持つことが示された。
- シミュレーション結果は理論的解析を検証し，CAPAシステムは，半波長アンテナ間隔を持つ空間的に離散的なアレイシステムと比較して，より高い秘匿率とより低い秘匿遮断確率を達成することが確認された。
Link: https://arxiv.org/abs/2603.06171
ハイパーパラメータ調整はグリーンな深層学習につながるか：深層学習モデルのハイパーパラメータとエネルギー消費の相関に関する実証研究 [cs.SE]目的：深層学習モデルのハイパーパラメータとエネルギー消費の相関
- 深層学習の発展に伴い，計算資源とエネルギー消費が増大しており，環境負荷低減が重要である。
- 深層学習モデルのエネルギー消費量は大きいものの，ハイパーパラメータの影響に関する研究は十分ではない。
- ハイパーパラメータ調整がエネルギー消費量削減に貢献し，より環境に優しい深層学習モデルを開発すること。
- 多くのハイパーパラメータがエネルギー消費と相関関係を持つことが明らかになった。
- ハイパーパラメータを調整することで，性能を損なうことなくエネルギー消費量を削減できる可能性がある。
- 並列環境では，エネルギー消費量がハイパーパラメータの変化の影響を受けやすくなることが示された。
Link: https://arxiv.org/abs/2603.06195
大規模言語モデルを用いたストーリーポイント推定 [cs.SE]目的：ストーリーポイント推定の可能性
- アジャイル開発において，ストーリーポイントは開発チームの計画と進捗管理に不可欠である。
- 機械学習モデルは学習データに大きく依存し，十分なデータ収集が課題となる。
- 学習データが少ない状況下でもストーリーポイントを推定できる手法の確立。
- 大規模言語モデルは，学習データなしでも既存の深層学習モデルを上回るストーリーポイント推定性能を示す。
- 少数の学習データを用いることで，大規模言語モデルのストーリーポイント推定性能は更に向上する。
- 比較判断は，ストーリーポイントの直接推定よりも容易ではないが，大規模言語モデルの学習データとして有効である。
Link: https://arxiv.org/abs/2603.06276
分子ISIチャネルにおける信念適応型MAP検出：異分散性ノイズへの対応 [cs.IT, cs.ET, math.IT]目的：分子拡散通信における異分散性ノイズを持つ分子間干渉(ISI)チャネルに対する最適な検出手法
- 分子拡散通信は，ナノデバイス間の通信手段として注目されており，その実現には信頼性の高い信号検出が不可欠である。
- 従来の検出器は，分子数チャネルのノイズ分散が状態に依存する異分散性を考慮していない場合が多く，性能が制限される。
- 本研究では，状態依存的な平均と分散を明示的に組み込んだ，より高精度な信号検出を実現することを目指す。
- 提案手法である信念適応型MAP検出(BA-MAP)とSoft BA-MAPは，受信側の現在の状態信念に基づいて適応的なMAP閾値を導出する。
- シミュレーションと情報理論的解析により，提案手法が従来の等化や固定閾値法を上回り，最大100%のスループット向上を達成することが確認された。
- 状態依存的なノイズ分散を考慮することで，現実的な分子拡散通信環境下での性能向上が期待できる。
Link: https://arxiv.org/abs/2603.06304
デジタルツインの汎用的な特徴モデル [cs.SE]目的：デジタルツインの特徴モデル
- 産業，経済，社会など様々な分野でデジタルツイン技術の導入が進んでおり，その重要性は増している。
- デジタルツインの性質や応用に関する研究は多く存在するものの，包括的な特徴モデルは存在していなかった。
- 既存研究の体系的マッピングに基づき，デジタルモデル，シャドウ，ツインを網羅する汎用的な特徴モデルを提案し，その有用性を示す。
- 提案された特徴モデルは，緊急，車両，製造の3つの事例において検証された。
- このモデルは，設計段階での情報に基づいた意思決定を支援し，モデル駆動型開発を促進すると期待される。
- また，テストケースの推論のためのモデルベースの基盤を提供し，デジタルツインの検証・妥当性評価を促進すると考えられる。
Link: https://arxiv.org/abs/2603.06308
準ねじれ符号と有限体上の付加巡回符号の関係 [cs.IT, math.IT]目的：準ねじれ符号と付加巡回符号の関係性の解明
- 誤り訂正符号は，デジタル情報の信頼性確保に不可欠であり，通信・記憶技術の発展を支える。
- 従来の符号理論では，構造の理解が困難な符号が多く，効率的な復号技術の開発が課題となっていた。
- 準ねじれ符号と付加巡回符号の関係を明らかにすることで，符号の構造解析と効率的な復号を可能とする。
- 準ねじれ符号の多項式表現を確立し，インデックス2の準ねじれ符号の双対符号を決定した。
- 準ねじれ符号と付加巡回符号の間に一対一対応関係を導き出した。
- 付加設定におけるトレース内積と，準ねじれ設定におけるユークリッド・シンプレクティック内積の関係を明らかにした。
Link: https://arxiv.org/abs/2603.06309
充足可能性ソルビングによる関係性の発見 [cs.RO, cs.NI, cs.LO]目的：一階述語論理における接続演算の自動化
- 自動推論は，数学やソフトウェア検証において重要な役割を担う分野である。
- 既存手法では，証明探索の効率化に限界があり，複雑な論理式に対しては困難である。
- 充足可能性ソルビングを活用し，証明探索の構造を効率的にエンコードすることで，この問題を解決する。
- 本研究では，一階述語論理の接続演算に対するSATベースの手法を提案し，対称性解消による自動化の推進を目指した。
- ３つの異なるSATエンコーディングを提示し，その理論的特性とSAT/SMTソルバーの影響を分析した。
- 新規ソルバーupCoPを実装し，実用的な実行可能性を示した。
Link: https://arxiv.org/abs/2603.06345
リポジトリ指向の長期的対話コンテキスト管理のためのスケーラブルなベンチマーク [cs.SE]目的：リポジトリ指向開発における長期的対話コンテキスト管理の評価
- 大規模言語モデルの進化により，コード理解と生成能力が向上し，強力なコードアシスタントが登場している。
- 長期的対話コンテキストが長すぎると，モデルが重要な情報を失い，性能が低下する可能性がある。
- リポジトリ指向開発に特化したコンテキスト管理手法の評価ベンチマークを確立し，課題を解決する。
- LoCoEvalは，リポジトリ指向開発シナリオに特化した初の長期的対話コンテキスト管理ベンチマークである。
- 既存のコンテキスト管理手法やLLMは，リポジトリ指向の対話において大きな課題に直面していることが示された。
- 会話情報とリポジトリ情報を統合した新しい手法は，既存手法よりも優れた性能とロバスト性を示した。
Link: https://arxiv.org/abs/2603.06358
横断ランク，適合性，および列挙 [cs.DS]目的：ハイパーグラフの横断ランクの認識と最小ヒット集合の列挙
- 組合せ最適化問題として，様々な応用分野で重要性が増している。
- 既存アルゴリズムは，エッジ数$m$に対して指数時間的な計算量を要する。
- エッジ数$m$に対する依存性を緩和し，頂点数$n$に対する依存性を増加させる。
- エッジ数$m$，最大次数$\Delta$，頂点数$n$，およびランク$k$に基づき，横断ランクが$k$以上であるかを認識するアルゴリズムを提案した。
- 提案手法では，最小ヒット集合を拡張するための「先読み」法を用いることで効率的な計算を実現した。
- 横断ランク$k^*$を持つハイパーグラフの全ての最小ヒット集合を，遅延時間$O(\Delta^{k^*-1} mn^2)$で列挙できることを示した。
Link: https://arxiv.org/abs/2603.06402
強化学習フレームワークの参照アーキテクチャ [cs.SE, cs.AI, cs.LG]目的：強化学習フレームワークの参照アーキテクチャ
- 強化学習の応用拡大に伴い，多様な技術が登場している。
- フレームワーク間のアーキテクチャに一貫性がなく，比較や統合が困難である。
- フレームワークの共通基盤となる参照アーキテクチャを確立すること。
- 18の主要な強化学習フレームワークを分析し，共通するアーキテクチャ要素と関係性を特定した。
- それらを基に，参照アーキテクチャを策定し，代表的な強化学習パターンを再構築した。
- 一般的な構成要素や改善の方向性など，アーキテクチャの傾向を明らかにした。
Link: https://arxiv.org/abs/2603.06413
DNAカバレッジ深度問題：双対性，重み分布，および応用 [cs.IT, math.CO, math.IT]目的：DNAデータストレージにおける全エンコード鎖の復元に必要なリード数の期待値
- DNAデータストレージは，高密度かつ長期的なデータ保存を可能にする有望な技術である。
- 小フィールド上の構造化コードファミリーでは，最適なMDSコードを利用できない場合がある。
- 線形コードのDNAカバレッジ深度を効率的に計算するための組み合わせツールを開発すること。
- 本研究では，双対性議論と拡張重み列挙子の概念に基づいて，線形コードのカバレッジ深度問題を解決するための組み合わせツールを開発した。
- 具体的には，単体符号，ハミング符号，3元ゴレイ符号，拡張3元ゴレイ符号，および1次リード・ミューラー符号に対する閉形式の式を導出した。
- 線形コードのカバレッジ深度を高フィールド拡張の重み分布の項で表現する一般的な式が本研究の中心的な成果である。
Link: https://arxiv.org/abs/2603.06489
MIMO符号化キャッシングにおける非対称ストリーム割当と線形復号性 [cs.IT, eess.SP, math.IT]目的：MIMO符号化キャッシングシステムにおける線形復号性を保証する非対称ストリーム割当手法
- ネットワークデバイスのキャッシュメモリを積極的に活用し，通信効率を向上させる技術として重要である。
- 従来のストリーム割当は対称性を前提としており，MIMO-CCの潜在能力を最大限に引き出せていない。
- ユーザーごとのストリーム割当に基づき，線形復号性を保証することで，より広範なDoF実現可能性領域を拡大すること。
- 提案手法は，対称的および非対称的なビットレベルCCスキームの両方に対して線形復号性を保証する基準を導出した。
- 非対称ストリーム割当を可能にするヒューリスティックなMIMO-CC配信・スケジューリングフレームワークを提案した。
- 対称制約のある設計と比較して，達成可能なDoFの実現可能性領域を拡大することを示した。
Link: https://arxiv.org/abs/2603.06534
JITコンパイラの性能劣化バグの理解と検出 [cs.RO, cs.SY, eess.SY, cs.SE]目的：JITコンパイラの性能劣化バグの検出手法
- JITコンパイラは，JavaやJavaScript等の主要言語の実行速度向上に不可欠である。
- 従来のバグ検出技術は機能的な誤りに焦点を当てており，性能劣化バグの検出は困難であった。
- JITコンパイラの性能劣化バグを自動的に検出し，実行時の性能低下を防ぐことを目指す。
- 4つのJITコンパイラにおける191件のバグレポートを分析し，性能劣化バグの誘発要因とパターンを明らかにした。
- 性能劣化バグの自動検出手法である階層的差分性能テスト（Jittery）を提案し，実装した。
- Jitteryを用いて，Oracle HotSpotとGraal JITコンパイラに12個の未知の性能劣化バグを発見し，そのうち11個が確認，6個が修正された。
Link: https://arxiv.org/abs/2603.06551
タルスキの純粋部分集合論のトポロジー的書き換え [math.LO, cs.LO]目的：タルスキの純粋部分集合論の形式化と拡張
- 空間的推論において，定性的モデルの表現力向上は重要な課題である。
- グッドマン様式 Mereology や擬トポロジーでは，真のユークリッド幾何や完全なトポロジー空間が欠如している。
- Mereology からトポロジー空間を導き出し，幾何学的表現力を向上させることを目指す。
- 依存型理論とCoqを用いて，タルスキ幾何学を形式化し，Mereologicalクラスが正則開集合に対応することを証明した。
- これにより，個称名のトポロジーを構築し，タルスキの幾何学的素因を拡張することが可能になった。
- タルスキの公理系を削減し，T2分離公理と追加定義を導入することで，理論を拡張した。
Link: https://arxiv.org/abs/2511.12727
LLMは帰納的定義を含む制約解決に役立つか？ [cs.RO, cs.SY, eess.SY, cs.LO, cs.AI]目的：帰納的定義を含む制約解決へのLLMの活用
- 形式検証やプログラム解析において，帰納的定義の制約解決は不可欠である。
- 従来のSMT/CHCソルバーは，特に抽象データ型を含む場合，帰納的定義の制約解決が苦手である。
- LLMを活用し，帰納的定義の推論に必要な補助的な補題を生成することで解決を目指す。
- 構造化されたプロンプトにより，LLMが帰納的定義に関する推論に必要な補助的な補題を生成することが可能となった。
- LLMと制約ソルバーを統合した神経記号的アプローチにより，既存のソルバーの性能を向上させることができた。
- 実験結果から，本手法は帰納的定義を含む制約解決タスクにおいて，約25%の解法率向上を達成した。
Link: https://arxiv.org/abs/2603.03668
一般確率的理論における（およびの）古典的説明 [quant-ph, cs.LO]目的：確率的モデル間の「説明」概念の定式化
- 確率論は，不確実性を扱う上で不可欠であり，科学的推論の基礎である。
- 確率的モデルの説明の形式化が十分に進んでいない。
- 一般確率的理論における古典的説明の普遍的な構造を明らかにすること。
- 確率的モデル間の説明を，圏論的な枠組みで定義した。
- 局所有限な確率的モデルは，古典的な説明を持つことが示された。
- この構成は関手的であり，古典的表現の存在を保証する。
Link: https://arxiv.org/abs/2603.05627
積層型インテリジェントメタサーフェス：基礎，最近の進歩，および課題 [eess.SP, cs.IT, math.IT]目的：積層型インテリジェントメタサーフェス（SIM）技術の包括的な概要
- 無線通信の電波伝搬制御は，環境適応型システムの実現に不可欠である。
- 従来の単層メタサーフェスでは，電磁波変換の柔軟性に限界があった。
- SIMの電磁波処理能力を最大限に引き出すための理論的・技術的課題を解決する。
- SIMは，多層メタサーフェス間の波の相互作用を利用し，電磁波変換の自由度を飛躍的に向上させる。
- 本調査では，SIMの物理原理，モデリング手法，ハードウェア実装，およびアーキテクチャ設計について概説する。
- SIMは，6G無線システムにおける完全なプログラム可能な電磁波プロセッサとしての実現に向けた有望な方向性を示す。
Link: https://arxiv.org/abs/2603.05633
構造を持たないNP探索における内在情報フロー [math.OC, cs.CC, cs.IT, math.IT]目的：NP探索における情報獲得プロセスの分析
- NP問題の効率的な解決は計算機科学における重要な課題である。
- 既存の研究では計算時間のみに着目しており，情報獲得の観点が欠けている。
- 情報理論に基づき，NP探索の根本的な情報量制約を明らかにすること。
- NP探索を情報獲得のプロセスとして捉え，隠れた解の不確実性を削減する過程を分析した。
- 極端なモデル（psocidモデル）において，各プローブが提供する情報量は非常に限定的であることが示された。
- 情報量の不足により，信頼性の高い解の回復には指数時間が必要となることが示唆された。
Link: https://arxiv.org/abs/2603.06315
情報理論への視覚的入門 [cs.IT, math.IT]目的：情報理論の主要概念
- 科学全般に広範に適用可能な数学的ツール群を提供する学問分野である。
- データ圧縮やノイズ環境下での伝送における限界が明確に理解されていない。
- 基本的な確率論に基づき，情報理論の概念を直感的に理解すること。
- エントロピー，相互情報量，チャネル容量といった主要概念が，基礎的な確率論から導き出されることを示した。
- データソースの最短可能な符号化や，ノイズの多いチャネルを通じた信頼性の高い通信速度の上限を決定する要因を説明した。
- 情報理論の理解を深めるための視覚的，直感的アプローチを提示した。
Link: https://arxiv.org/abs/2206.07867
プログラミングのための圏論 [cs.PL, math.CT]目的：圏論のプログラミングへの応用
- 関数型プログラミングの基礎理論として重要であり，抽象的な構造を扱うことで，プログラムの理解と設計を深めることができる。
- データ型や副作用といった概念の数学的な基礎が明確でなく，形式的な扱いが難しいという課題がある。
- 初期代数やモナドといった圏論的道具を用いて，データ型や副作用を数学的に厳密に扱う方法を提供する。
- 初期代数は，データ型とそれに対する再帰関数を数学的に特徴づける枠組みを提供する。
- モナドは，関数型言語における副作用を扱うための数学的な基盤を提供する。
- 講義ノートには，多くの問題とその解答が含まれており，学習に役立つ。
Link: https://arxiv.org/abs/2209.01259
グラフ特性のコンテナ法による検証 [cs.RO, cs.MA, cs.CL, cs.CY, cs.DS]目的：グラフの$\rho$-クリーク特性および$\epsilon$-彩色可能性の検証
- グラフ理論は，ネットワーク構造の分析や最適化において重要な役割を果たす。
- 大規模グラフにおける特性検証は計算コストが高く，効率的なアルゴリズムが求められる。
- コンテナ法を拡張し，検証に必要なサンプル数を削減することを目指す。
- 稠密グラフモデルにおいて，$\rho n$-クリークを持つグラフと，クリーク形成に必要なエッジ追加数$\epsilon n^2$のグラフを，$\tilde{O}(\rho^3/\epsilon^2)$個の頂点のランダムサブグラフで識別可能であることを示した。
- $\epsilon$-彩色可能性の検証では，$\tilde{O}(k/\epsilon)$個の頂点のサブグラフで，$k$-彩色可能なグラフと，少なくとも$\epsilon n^2$のエッジが単色になるグラフを識別できることを示した。
- これらの結果は，コンテナ法がグラフ特性の検証アルゴリズム解析において強力なツールであることを示す。
Link: https://arxiv.org/abs/2308.03289