arXiv雑要約

プログラム - 2026/05/19 公開

LLMに基づくコードの自然言語要件に対する静的検証：産業経験報告 [cs.SE]目的：自然言語で記述された要件に対するコードの静的検証
- ソフトウェアの安全性・信頼性確保は重要であり，特に自動車等の高度なシステムにおいては不可欠である。
- 従来の静的解析ツールはビジネスロジックの整合性検証には限界があり，自然言語要件との乖離検出が困難である。
- 自然言語要件と実装コードの整合性を検証する，LLMを活用した新しい静的解析手法を確立すること。
- LLMを活用した二段階ワークフローを構築し，自然言語要件から検証可能なルールを抽出することに成功した。
- 抽出されたルールに基づいて，コードが要件を満たしているかを検証するAIベースのコード監査を実現した。
- この手法は，コンパイルや実行を必要とせず，開発ライフサイクルの早期段階での検証・妥当性確認を可能にする。
Link: https://arxiv.org/abs/2605.17926
文脈を考慮したコード事前学習：コード生成への応用 [cs.SE]目的：コード生成における文脈の活用
- ソフトウェア開発効率向上において，コード生成の重要性が増している。
- 既存モデルは，コード生成時に周囲の文脈を十分に活用できていない。
- 呼び出し文脈を考慮した事前学習により，コード生成の精度向上を目指す。
- CallerGenは，呼び出し文脈を意識した事前学習を行う初のコードモデルである。
- CallerEvalという新しいベンチマークを用いて評価した結果，既存モデルを上回る性能を示した。
- 特に，220Mと0.5Bモデルは，CallerEvalにおいて高いpass@1率を達成し，文脈の重要性を示した。
Link: https://arxiv.org/abs/2605.17957
一貫性に基づく強化学習によるLLMのコード推論能力の向上 [cs.LG, cs.PL]目的：LLMのコード推論能力の向上
- コード推論は，LLMの推論能力を測る上で重要であり，コード生成や数学的推論といった下流タスクに貢献する。
- 従来の強化学習手法は，最終的な出力や粗粒度の信号のみに基づいて報酬を設計しており，ステップごとの推論の一貫性を考慮していない。
- ステップごとの推論の一貫性を重視することで，報酬のスパース性や報酬ハッキングの問題を軽減し，学習能力を最大限に引き出すことを目指す。
- 提案手法CodeThinkerは，3つの主要コンポーネント（ステップワイズ推論を意識したモデル学習モジュール，動的ビームサンプリング戦略，一貫性報酬メカニズム）を備えている。
- 3つのベンチマークにおける実験により，CodeThinkerは複数のLLMで最先端の性能を達成し，Qwen2.5-Coder-7B-Instructでは最も強力なベースラインを4.3％上回る精度を示した。
- 追加学習なしで，CodeThinkerは数学的推論とコード推論タスクでそれぞれ平均5.33％と3.11％の精度向上を達成した。
Link: https://arxiv.org/abs/2605.17958
BLAgent：ファイルレベルのバグ特定のためのエージェント的RAG [cs.DC, cs.CE, cs.SE, cs.AI]目的：ファイルレベルのバグ特定
- ソフトウェア保守において，バグ特定は根本原因分析やプログラム修復などの重要な課題である。
- 既存のRAGパイプラインは静的な検索に依存し，正確な誤りコードの特定に必要な推論が不足している。
- リポジトリの構造を考慮したRAGフレームワークを開発し，バグ特定精度とコスト効率を改善すること。
- BLAgentは，コード構造を考慮したエンコーディング，二重の視点からのクエリ変換，そして二段階のエージェント的再ランク付けを統合する。
- SWE-bench Liteにおいて，BLAgentはオープンソースモデルで78%以上のTop-1精度，クローズドソースモデルで86%以上の精度を達成した。
- BLAgentは最強のベースラインと比較して18倍以上コストが低く，APRフレームワークへの統合により，プログラム修復の成功率を20%以上向上させた。
Link: https://arxiv.org/abs/2605.17965
ガバナンス型マルチエージェントランタイムにおける検証ゲート付き完了：バウンデッドアーキテクチャのケーススタディ [cs.SE, cs.AI]目的：ガバナンス型マルチエージェントランタイムにおける検証ゲート付き完了のパターン
- マルチエージェントシステムは，複雑なワークフローと持続的な状態を持つようになり，その制御が重要になっている。
- エージェントによる完了の主張を検証するメカニズムが不足しており，信頼性の高い運用が困難である。
- 完了の主張を検証ゲートで制御し，監査可能性を確保することで，システムの信頼性を高める。
- 検証ゲート付き完了のパターンにおいて，既知の結果に対する検証成功率は99.5%であった。
- シャドーポリシー検証では，ルール合致率は98.58%であり，誤った成功は認められなかった。
- 検証ゲートとパケット化された記録により，完了決定が検査可能かつフェイルクローズであることが示された。
Link: https://arxiv.org/abs/2605.17998
LogRouter：大規模データシステムにおけるログ質問応答のための適応型二段階LLMルーティング [cs.LG, cs.DB, cs.SE]目的：自己ホスト環境におけるログ質問応答システムの開発
- 大規模データシステムでは，ログ分析が重要であり，迅速かつ正確な情報抽出が求められる。
- リソースに制約のある環境において，全てのクエリを大規模言語モデルに通すことはコストがかかる。
- コストを抑えつつ，ログ質問応答の精度と効率を向上させることを目指す。
- LogRouterは，PySpark，GPUアクセラレーション，デュアルインデックスストレージなどを組み合わせたエンドツーエンドのシステムである。
- 二段階のコストを考慮したルーティングにより，クエリを最適な実行パスに割り当てることで，平均精度88.4%を達成した。
- ルーティングによって，固定32Bモデルと比較して平均待ち時間を55%削減し，精度を維持した。
Link: https://arxiv.org/abs/2605.18015
PROTEA：マルチエージェントLLMワークフローのオフライン評価と反復改善 [cs.CL, cs.AI, cs.HC, cs.SE]目的：マルチエージェントLLMワークフローのデバッグと改善のための手法
- LLMの活用範囲拡大に伴い，複雑なタスクを複数のLLMに分割する手法が注目されている。
- マルチエージェントシステムでは，エラー原因の特定や改善が困難である。
- ワークフローのボトルネックを特定し，プロンプトを効率的に修正することで改善を目指す。
- PROTEAは，ワークフローのノード出力を評価し，ボトルネックを特定するインターフェースを提供する。
- 最終回答を参考に，ノードレベルでの期待値を生成し，出力と比較することで評価を行う。
- ドキュメント検査の精度は64.3%から83.9%へ，レコメンデーションのHit@5は0.30から0.38へ向上した。
Link: https://arxiv.org/abs/2605.18032
準2次サンプルにおける効率的なロバスト回帰について [cs.DS, stat.ML]目的：効率的なアルゴリズムにおけるサンプル複雑度，条件数，実行時間，予測誤差のトレードオフに関する理解の深化
- ロバスト回帰は，外れ値の影響を受けにくいモデル構築に不可欠であり，実用的なデータ分析において重要である。
- 既存手法では，サンプル数や計算時間と予測誤差のトレードオフが明確でなく，効率的なアルゴリズムの開発が課題であった。
- サンプル数を削減し，計算時間を短縮しつつ，高い予測精度を実現するアルゴリズムを開発することを目指す。
- 提案アルゴリズムは，$\widetilde{O}(d/\epsilon^4)$ サンプルを使用し，予測誤差 $O(\sqrt{\epsilon\kappa})$ を達成し，既存手法を改善した。
- $\epsilon \kappa \lesssim 1$ の条件下において，誤差 $o(\sqrt{\epsilon\kappa})$ を達成する効率的なSQアルゴリズムには，$\Omega(d^2)$ サンプルのクエリが必要であるという下界が示された。
- $\epsilon \kappa \lesssim 1$ といった仮定がない場合，効率的なアルゴリズムには $\tilde{\Omega}\left(\min\{d\epsilon^{2}\kappa^{2},\ \epsilon^{2}d^{2}\}\right)$ サンプルが必要となることが示された。
Link: https://arxiv.org/abs/2605.18042
様相論理の証明論的研究 [cs.LO]目的：主要な様相論理の証明論的枠組み
- 様相論理は，可能性や必然性といった概念を形式的に扱う上で重要な役割を果たす。
- 既存の証明系では，様々な様相論理を統一的に扱うことが難しい場合がある。
- この研究は，主要な様相論理を扱うための基礎的な証明論的枠組みを提示することを目指す。
- 本研究では，ハイパーシーケント計算に基づいた枠組みを提案し，{\sf K}や{\sf S5}といった基本的な様相論理を扱えることを示した。
- 提案された枠組みから，{\sf K, T, D, S4, S5}などの様相論理に対する標準的なシーケント計算およびハイパーシーケント計算が自然に導出されることを説明した。
- また，{\sf KB, KDB, KTB}を除く主要な様相論理に対し，カット除去定理を構文的に証明した。
Link: https://arxiv.org/abs/2605.18043
A-ProS：マルチモデルフィードバックによる信頼性の高い自律プログラミングへ [cs.SE, cs.AI]目的：自律プログラミングエージェントの信頼性向上
- ソフトウェア開発における自動化の重要性が増しており，LLMを活用したコード生成が注目されている。
- LLMによるコード生成は高いポテンシャルを持つものの，実行フィードバックを用いた反復改善が十分ではない。
- マルチモデルフィードバックを用いて，自律プログラミングエージェントのコード生成とデバッグの精度向上を目指す。
- A-ProSはChatGPT (GPT-4, GPT-5) をコード生成器とし，Codestral-2508，Llama-3.3-70B，DeepSeek-R1をデバッグ批評家として組み合わせた。
- GPT-5を用いたワークフローでは，初期の正解数が39から3回の反復で85-90に，GPT-4では15から31-38に改善された。
- 状態を持つ反復改善は，状態を持たないアプローチより8.5-10.6% の改善を示し，繰り返しエラーを最大3.5倍削減した。
Link: https://arxiv.org/abs/2605.18073
熱流沿いのフィッシャー情報の対数凸性に対する六角形の反例 [cs.IT, math.IT]目的：熱流に沿ったフィッシャー情報の対数凸性の反例の構築
- フィッシャー情報は，統計的推論や情報理論において重要な役割を果たす量である。
- フィッシャー情報の対数凸性に関するチェン・ゲン予想は，長年未解決であった。
- 二次元におけるチェン・ゲン予想の反例を示すことで，高次元における関連する予想の誤りを導く。
- 本研究では，滑らかで厳密に正の値を持つ，ガウス減衰密度を$\R^2$上に構築した。
- この密度を用いることで，熱流に沿ったフィッシャー情報が対数凸でないことを示した。
- この結果は，ガウス型完全単調予想，マッキーン予想，トスカニのエントロピー冪予想の誤りも示唆する。
Link: https://arxiv.org/abs/2605.18081
可動アンテナ支援による安全な低軌道衛星ネットワーク：アンテナ位置とビームフォーミングの同時最適化 [cs.IT, math.IT]目的：可動アンテナを用いた低軌道衛星通信における安全な伝送方式の最適化
- 第6世代移動通信(6G)では衛星通信の利用が拡大しており，そのセキュリティ確保が重要課題となっている。
- 低軌道衛星コンステレーションでは，合法衛星と傍受衛星との角度が小さく，安全な伝送設計が困難である。
- 可動アンテナを用いて空間的自由度を活かし，傍受衛星からの情報漏洩を防ぐ伝送方式を開発する。
- 提案する方式は，ビームフォーミングと可動アンテナの位置を同時に最適化することで，平均秘匿率を最大化する。
- 半定値緩和，高精度な逐次凸近似，低複雑度な差分進化アルゴリズムを組み合わせた最適化フレームワークを開発した。
- 数値評価により，提案方式が従来の固定アンテナ方式よりも優れた性能を発揮することが示された。
Link: https://arxiv.org/abs/2605.18099
連結木探索と列挙の複雑性 [cs.CC, cs.DS]目的：最小辺数による多部グラフの接続
- 化学情報学などへの応用が期待され，グラフ理論上の構造最適化の基盤となる。
- 多部グラフの接続問題は，その組み合わせ爆発により計算効率が課題となる。
- 特定条件下での効率的な接続木の決定，数え上げ，列挙手法を確立する。
- 決定問題はNP困難であるが，部分数の固定パラメータ問題として扱える。
- 完全，準完全，t-準完全多部グラフ上では，多項式時間または線形時間アルゴリズムが存在する。
- 完全多部グラフに対し，最適な遅延を持つ効率的な探索アルゴリズムが設計された。
Link: https://arxiv.org/abs/2605.18125
脆弱性検出の強化に向けた多視点推論フレームワーク [cs.SE]目的：ソフトウェア脆弱性検出における精度向上
- ソフトウェアセキュリティ確保は重要であり，脆弱性検出は攻撃のリスクを低減する上で不可欠である。
- 既存手法は単一の推論パラダイムに依存しており，複雑な脆弱性への対応が課題となっていた。
- 多様な脆弱性に対応可能な，多視点推論による脆弱性検出手法の開発。
- 提案手法ReasonVulは，3つのLLMエージェントによる多視点推論フレームワークであり，PrimeVulデータセットで高いPairAccとF1スコアを達成した。
- JITVULデータセットでの評価においても一般化性能が確認され，現実のソフトウェアシステムへの応用可能性を示した。
- 542件の対立事例分析の結果，389件が正しく解決され，エラー修正メカニズムによる隠れた脆弱性の発見に貢献していることが示された。
Link: https://arxiv.org/abs/2605.18153
可算鎖上のMSO再パラメータ化の決定可能性 [cs.LO]目的：MSO再パラメータ化の決定問題
- 論理学の構造を定義する上で重要な解釈の理論的基盤を確立する。
- 解釈の表現次元が高く，複雑性が課題となっていた。
- 解釈の表現次元を削減する再パラメータ化の決定可能性を解決する。
- 可算標記線形順序上において，与えられたMSO式が$d$次元再パラメータ化を許容するかどうかは決定可能である。
- 再パラメータ化を許容する解釈は，$d$次元点解釈と同値であることが示された。
Link: https://arxiv.org/abs/2605.18248
CommitDistill：ソフトウェアリポジトリのための軽量知識中心型メモリ層 [cs.NI, cs.SE, cs.AI]目的：ソフトウェアリポジトリのgit履歴からの知識抽出と，その知識を用いた情報検索
- ソフトウェア開発における過去の知識の再利用は，生産性向上や品質改善に不可欠である。
- git履歴には豊富な知識が含まれるものの，開発者やAIアシスタントによる有効活用が不十分である。
- git履歴から知識を抽出し，効率的に検索可能なメモリ層を構築することで，この課題を解決する。
- CommitDistillは，git履歴から「事実」「スキル」「パターン」といった型の知識単位を抽出する。
- 256文字という限られた検索予算内で，CommitDistillはBM25やgit log --grepよりも高い検索精度（0.750のヒット率）を示した。
- 大規模言語モデルを用いた評価では，CommitDistill単独では大きな改善は見られなかったが，抽出処理の高速性（10,000コミットを4秒未満）が確認された。
Link: https://arxiv.org/abs/2605.18284
コアルジェブラ的トレース意味論における合成性 [cs.LO]目的：トレース同値性に対する合成性の保証
- プロセス記述言語の適切な設計には，合成性という性質が不可欠である。
- 既存のアプローチは，強い双シミュレーションという粒度の細かい同値性に限定されていた。
- より緩いトレース同値性においても合成性が成立することを明らかにすること。
- TuriとPlotkinの抽象GSOSアプローチがトレース同値性にも適用可能であることが示された。
- Kleisli圏上でGSOS則であるDe Simone則を導入し，その合成性を証明した。
- 確率系に対する新たなDe Simone形式を導出し，確率トレース同値性に対する合成性を保証した。
Link: https://arxiv.org/abs/2605.18285
高メモリ空間結合符号における存在と数え上げの限界：組合せ的ヌルシュテルンザッツによる [cs.IT, math.IT]目的：高メモリ空間結合低密度パリティチェック符号の設計に関する存在と数え上げの限界
- 通信システムの信頼性を高めるため，誤り訂正符号の高性能化は不可欠である。
- 空間結合符号は高性能だが，短絡サイクルが性能低下の原因となる。
- 組合せ的ヌルシュテルンザッツを用いて，サイクルによる有害構造の排除に必要なメモリ量を評価する。
- 組合せ的ヌルシュテルンザッツにより，指定されたサイクルを排除するための十分なメモリ条件を導出した。
- 完全接続基グラフにおいて，4サイクルおよび4サイクルと6サイクルの排除に必要なメモリ量を厳密に特徴付けた。
- サイクルを排除するエッジ拡散配置の数に関する下限を導出し，設計空間を特徴付けた。
Link: https://arxiv.org/abs/2605.18323
同じシグナル，異なる意味：ソフトウェアエンジニアリングエージェントのフレームワーク間行動分析 [cs.SE, cs.AI]目的：ソフトウェアエンジニアリングエージェントの行動特性と成果の関係
- LLMを活用したソフトウェア開発の自動化が注目されており，エージェントの行動理解が不可欠である。
- エージェントの行動特性と成果の関係は，特定のフレームワークに依存する可能性があり，汎用性に疑問が残る。
- 異なるフレームワークにおけるエージェントの行動特性を比較し，汎用的な知見の妥当性を検証する。
- 異なるフレームワーク間では，同じ行動特性が異なる意味を持つことが確認された。
- エラー率に着目すると，低いほど解決率が高いと解釈できる構成と，高いほど解決率が高いと解釈できる構成が同程度に存在した。
- フレームワークの種類が，LLMの種類よりもエージェントの行動特性の変動に大きく影響することが示された。
Link: https://arxiv.org/abs/2605.18332
二分線形ハッシュにおける第2次最大負荷境界に関する注意 [cs.DS]目的：二分線形ハッシュにおける最大負荷の期待値と確率的上限の解析
- ハッシュ関数はデータ検索の効率性に不可欠であり，その性能向上が重要である。
- 線形ハッシュは実装が容易だが，最大負荷の予測が難しく，性能劣化の原因となる。
- 二分線形ハッシュが独立キーハッシュと同等の性能を発揮することを示す。
- 二分線形ハッシュの期待最大負荷は，$16\log n/\log\log n$ であり，独立キーハッシュと同程度である。
- 最大負荷が，$R\frac{\log n}{\log\log n}$ を超える確率は，$O\left(\frac{(\log\log n)^2}{R^2(\log n)^{2-2/R}}\right)$ で抑えられる。
- 特定のバケットの負荷が $2^a-2$ を超える確率は，$ \gamma^{-1}2^{-a^2} $ であり，漸近的に最適である。
Link: https://arxiv.org/abs/2605.18335
数学情報学：アルゴリズム [cs.CL, cs.LO]目的：アルゴリズムの形式的な定義
- 計算可能性の理論は，計算の基礎を理解する上で重要である。
- 既存の計算モデルでは，アルゴリズムとデータが密接に結びついている。
- アルゴリズムをデータから分離し，抽象的な仕様として捉えること。
- 本研究では，アルゴリズムを有向グラフとして形式的に定義した。
- この定義は，制御をグラフで，データを代数で表現することにより，分離を実現する。
- 計算モデルにおけるプログラムによるアルゴリズムの実装を厳密に定義した。
Link: https://arxiv.org/abs/2605.18342
確率的命令型プロセス代数 [cs.DC, cs.AR, cs.LO]目的：確率的選択演算子を持つプロセス代数の拡張
- 分散コンピューティングにおけるアルゴリズムのモデル化と検証が重要である。
- 確率的アルゴリズムの挙動を形式的に記述・検証する手法が不足している。
- 分散アルゴリズムの特性記述と検証のための基盤を提供する。
- 本研究では，確率的選択を常に他の選択よりも優先して解決する拡張プロセス代数を提案した。
- この拡張により，リーダー選出問題や合意形成問題といった確率的アルゴリズムのモデリングが可能となる。
- 提案手法は分散コンピューティング分野における形式手法の発展に貢献すると期待される。
Link: https://arxiv.org/abs/2605.18362
仮説を持つ連続代数 [cs.LO]目的：仮説を持つ連続代数の体系
- Kleene代数は，プログラムの意味論や形式手法において重要な役割を果たす。
- Kleene代数の変種は多数存在するが，それぞれ異なる公理系を持つため統一的な扱いが難しい。
- 既存のKleene代数の変種を包含する，より一般的な体系を構築し，完全な公理化を目指す。
- 提案された枠組みは，Kleene代数，テスト付きKleene代数，正規木言語などを統一的に扱える。
- 閉言語をモデルとする正当性と完全性が証明された。
- 完全な公理化は一般には不可能だが，モジュール的なアプローチで完全化を達成するためのツールが提供された。
Link: https://arxiv.org/abs/2605.18450
単独の開発者ですべてを実現：ブラウンフィールド環境の企業におけるAI支援によるワンパーソンチームの事例研究 [cs.SE]目的：AI支援によるワンパーソンチームの設計と評価
- エンジニアリングにおける生産性向上は，競争力強化に不可欠である。
- 従来のクロスファンクショナルなチーム体制では，人員コストやコミュニケーションコストがかさむ。
- AIを活用したワンパーソンチームの実現可能性と，その成功要因の特定。
- AIツールにより，4人分の作業量を1人の経験豊富なエンジニアが半分の時間で完了した。
- AI生成コードの初回レビュー通過率は90%で，統合テストも全てパスした。
- 直接的な人員コストは85%以上削減され，AIはチームメンバーを代替するのではなく，エンジニアの能力を増幅することが示された。
Link: https://arxiv.org/abs/2605.18461
π計算を意味論的意味合いに接続する [cs.LO, cs.PL]目的：非同期π計算の変種AWpiの導入とその性質の分析
- 並行処理システムの形式的な検証において，π計算は重要な理論的基盤となっている。
- 従来のπ計算では，名前の所有権や能力の扱いに課題があり，意味論的モデルとの接続が難しい。
- AWpiを用いることで，π計算と意味論的モデルの間のギャップを埋め，より強力な検証技術を開発することを目指す。
- AWpiにおいて，ワイヤ（転送器）は置換として機能し，自然に圏を構成することが示された。
- この圏は，プロセスを射，型を対象とし，ワイヤは恒等射として作用する。
- ゲーム意味論からの知見を活用し，一般的な高階言語機能の解釈に必要な構造を構築した。
Link: https://arxiv.org/abs/2605.18496
固定汎用トークン化下でのBM25コード検索の改善：ドロップインBM25修正としての適応的q-Logオッズ [cs.IR, cs.AI, cs.SE]目的：BM25におけるq-Logオッズの導入によるコード検索性能の向上
- コード検索はソフトウェア開発において重要な役割を担うため，検索精度の向上は不可欠である。
- 既存のBM25は，汎用トークン化環境下では識別子の分離が不十分であり，検索精度が低下する。
- 本研究では，q-Logオッズを導入することでBM25の識別子分離能力を高め，コード検索精度を向上させる。
- CoIR CodeSearchNet Goデータセットにおいて，NDCG@10が0.2575から0.4874へ大幅に向上した。
- この改善効果は，複数のコード言語で確認され，テキストデータセットBEIRではほとんど認められなかった。
- ハパックス密度からqを推定する手法を提案し，BM25が最適なコーパスにおいてもq=1付近を維持できることを示した。
Link: https://arxiv.org/abs/2605.18561
過剰熱心なコーディングエージェント：良性タスクにおける範囲外アクションの測定 [eess.SY, cs.SY, cs.SE, cs.AI, cs.CL, cs.CR]目的：過剰熱心な行動の測定
- 近年，コーディングエージェントの自律性が高まり，セキュリティ上の課題が顕在化している。
- エージェントが許可された範囲を超えた行動をとる「過剰熱心な行動」の評価方法が確立されていない。
- 過剰熱心な行動を定量的に評価し，エージェントの安全性を高めることを目指す。
- 新たなベンチマーク「OverEager-Gen」を構築し，過剰熱心な行動を測定する際の妥当性に関する問題を明らかにした。
- 許容声明を削除することで，エージェントの過剰熱心な行動の発生率が大幅に増加することを確認した（Claude Code で0.0%から17.1%へ）。
- エージェントのフレームワークやベースモデルによって過剰熱心な行動の発生率が異なり，特に許可型フレームワークでは高い傾向がみられた。
Link: https://arxiv.org/abs/2605.18583
シャーマ＝ミットラルエントロピーは主要化格子上で劣加法的かつ超モジュールである [cs.IT, math.CO, math.IT, math.PR]目的：シャーマ＝ミットラルエントロピーの劣加法性と超モジュール性
- 情報理論において，エントロピーは不確実性の尺度として重要である。
- 既存のエントロピー指標（シャノン，ツァリス，レニー）の性質は十分に理解されていない。
- シャーマ＝ミットラルエントロピーの数学的性質を明確にすること。
- シャーマ＝ミットラルエントロピーが，$n$次元確率分布の主要化格子上で劣加法性を持つことが証明された。
- 同様に，シャーマ＝ミットラルエントロピーが超モジュール性を持つことも証明された。
- 本結果は，シャノンエントロピー等に対する既知の結果を統合し，拡張するものである。
Link: https://arxiv.org/abs/2605.18600
グラフラベル選択のための近似アルゴリズム [cs.DS, cs.LG]目的：グラフラベル選択における近似解の導出
- グラフ構造の解析は，社会ネットワークや生物学的ネットワークなど，様々な分野で重要である。
- 大規模グラフにおけるラベル予測には，計算コストと精度の両立が課題となっていた。
- 限られた予算内で，グラフ全体を代表する頂点集合を選択し，精度の高いラベル予測を実現すること。
- 本研究では，標準的な予算制約下におけるグラフラベル選択問題に対し，$\tilde{O}(\log^{1.5} n)$-近似アルゴリズムを初めて提案した。
- 既存研究は，資源の増強に依存するか，証明可能な保証のないヒューリスティックに限られていた。
- 提案アルゴリズムの実用的な変種は，既存手法と同等の品質を維持しつつ，より大規模なグラフにも適用可能であることが示された。
Link: https://arxiv.org/abs/2605.18623
Reversa：AIエージェント向け運用仕様へのレガシーソフトウェア変換フレームワーク [cs.DC, cs.SE, cs.AI]目的：レガシーソフトウェアをAIエージェントが利用可能な運用仕様へ変換する手法
- レガシーシステムには重要なビジネスロジックが暗黙的に存在し，その理解と活用が不可欠である。
- 既存のレガシーシステムのコードは複雑で，AIエージェントが安全に修正するには信頼性の高い情報が不足している。
- AIエージェントがレガシーシステムを安全に改修するために必要な，明確な仕様と信頼性のある情報を提供する。
- Reversaは，コードと仕様間のトレーサビリティ，信頼性評価，および人間による検証のためのギャップ保持を重視したマルチエージェントパイプラインである。
- ATMのCOBOLからGoへの移行事例において，517の主張，10のギャップ，53のGherkinシナリオ，および9/11のタスクが完了した計画が生成された。
- 本研究では，カバレッジ，トレーサビリティ，信頼性，有用性，コストを測定するための評価プロトコルを提案している。
Link: https://arxiv.org/abs/2605.18684
一般化された性能評価と一般化されたコントローラ合成について [cs.MS, econ.EM, cs.LO, cs.PF, cs.SY, eess.SY]目的：一般化された性能評価およびコントローラ合成のフレームワーク
- 現代社会においてシステム性能の定量的な評価と最適化は不可欠である。
- 従来の性能評価手法では，複雑なシステムや変化する環境への対応が困難である。
- より広範なシステムの性能評価と制御設計を可能とする新たなフレームワークの構築。
- 本研究では，真の並行プロセス計算と格子値性能評価言語に基づいた，一般化された性能評価のフレームワークを提案した。
- いくつかの計算機科学の問題が，一般化された性能評価の特殊なケースとして表現できることを示した。
- 一般化された性能評価の逆問題であるコントローラ合成についてもフレームワークを提示し，そのアルゴリズムの概要を示した。
Link: https://arxiv.org/abs/2605.18688
PopPy：Python複合AIアプリケーションにおける並列性の機会的利用 [cs.DC, cs.AI, cs.PL]目的：Python複合AIアプリケーションにおける並列性の機会の発見
- AI技術の発展に伴い，Pythonを用いた複合AIアプリケーションの利用が拡大している。
- これらのアプリケーションの実行時間がボトルネックとなり，高速化が課題となっている。
- Pythonの複雑性，動的ディスパッチ，変数の変更といった課題を克服し，並列化を実現する。
- PopPyは，標準Python実行と比較して，最大6.4倍の実行速度向上を達成した。
- PopPyは，Pythonの表現力豊かな部分集合をサポートし，開発者の負担を最小限に抑える。
- PopPyは，コンパイル時コンパイラとランタイムを組み合わせることで，並列抽出を実現した。
Link: https://arxiv.org/abs/2605.18697
ニューロシンボリック学習と検証のための定量線形論理 [cs.LO, cs.LG]目的：ニューロシンボリック学習と検証のための定量線形論理の提案
- ニューラルネットワークに論理的制約を組み込むことで，より堅牢で解釈可能なAIシステムの構築が期待される。
- 微分可能な論理と論理的性質の維持との間にトレードオフが存在し，実用的な基礎が確立されていない。
- 機械学習で一般的に用いられる演算（和とlog-sum-exp）に基づいた論理のセマンティクスを設計し，その有効性を検証する。
- 提案された定量線形論理(QLL)は，標準的な線形論理の法則を概ね満たしている。
- QLLは，テスト時の性能が論理的制約の検証結果と相関しており，既存の最先端技術と比較して優れている。
- QLLは，論理的妥当性と実証的有効性の両面において，長年の課題に対する解決策を提供する。
Link: https://arxiv.org/abs/2605.13845
量子誤り訂正の端点間形式化 [quant-ph, cs.LO]目的：量子誤り訂正符号の距離証明
- 量子計算の信頼性確保に不可欠であり，実用的な符号パラメータの信頼性が求められる。
- 符号距離の厳密な証明はNP困難であり，手計算や検証不可能なソルバーに頼らざるを得ない。
- 形式検証を通じて，産業規模の符号に対して機械的に検証可能な距離証明を提供する。
- Lean-QECは，安定化符号理論を形式化し，距離証明のパイプラインを構築した。
- 距離条件をブール充足可能性問題に変換することで，計算量を削減し，符号規模の拡張を実現した。
- Bivariate Bicycle系列の符号（[[90, 8, 10]]，[[70, 6, 9]]）に対して，自動生成された距離証明を検証した。
Link: https://arxiv.org/abs/2605.16523
分布の統計的アンラーニング：仮説検定アプローチ [math.ST, cs.IT, cs.LG, math.IT, stat.ML, stat.TH]目的：分布レベルのアンラーニング
- 機械学習の応用拡大に伴い，有害情報やバイアスの除去が重要となる。
- 特定のドメインからのデータ完全削除は計算コストが高く，部分削除では統計的保証が得られない。
- 望ましくない分布の影響を減らしつつ，目的分布の性能を維持するサンプル選択を目指す。
- 本研究では，ドメインを確率分布としてモデル化し，仮説検定を用いてサンプル選択基準を定式化した。
- 編集されたデータの分布が許容範囲内であること，および削除・維持のパレート最適解を特徴付けた。
- 多峰性を持つ望ましくないドメインに対するアンラーニングの性質や，大規模なデータセットにおける漸近的振る舞いを明らかにした。
Link: https://arxiv.org/abs/2605.16645
RIS検出・識別のための新規変調方式の設計と実用検証 [eess.SP, cs.IT, math.IT]目的：RIS検出・識別信頼性の向上
- 無線通信において，通信環境最適化のため，能動/受動的要素制御が重要視されている。
- RISの誤検出や見逃しは，システム性能を大きく低下させる要因となっている。
- RISの受動ビームフォーミングを活用し，検出精度とカバレッジ拡大を目指す。
- 提案変調方式は，RIS IDを無線で変調することにより，検出信頼性を高める。
- シミュレーションとプロトタイプ実験により，誤検出・見逃し確率の低減効果が確認された。
- 受動ビームスイープにより，検出範囲の拡大に貢献することが示された。
Link: https://arxiv.org/abs/2605.17009
高次元共分散推定のための対称性を考慮した凸縮小 [stat.ME, cs.IT, eess.SP, math.IT]目的：高次元共分散推定のためのデータ適応型縮小推定量の開発
- 高次元データ分析において，共分散行列の正確な推定は，リスク管理や特徴選択等の重要な課題である。
- 従来の共分散行列推定方法は，高次元データにおけるノイズの影響を受けやすく，推定精度が低下する問題がある。
- 本研究では，対称性に着目し，よりロバストで正確な共分散行列の推定を目指す。
- 提案手法は，レドイト・ウルフ縮小推定量を一般化し，利用可能な対称性群から構造化されたターゲットを用いることで，推定精度を向上させる。
- 候補グループの選択には，ホールドアウト負対数尤度に基づく二段階の手続きを用い，データ駆動によるグループ選択のオラクル不等式を確立した。
- 実データ実験の結果，提案手法は，金融，気候，ゲノミクスなど多様な分野において，レドイト・ウルフ縮小推定量よりも優れていることを示した。
Link: https://arxiv.org/abs/2605.17111
ノイズと不正確なサイド情報を用いた効率的な帰納的行列補完 [stat.ML, cs.IT, cs.LG, math.IT, math.ST, stat.TH]目的：ノイズと不正確なサイド情報下における行列補完の効率性向上
- 行列補完はデータ解析の基礎であり，欠損値からの情報復元に不可欠である。
- 既存手法では，効率性とノイズへの対応を両立することが困難であった。
- サイド情報を活用し，効率的かつ正確な行列補完を実現することを目指す。
- サイド情報に基づいた新しいアルゴリズムにより，従来の次元数に依存しない効率的な補完が可能となった。
- 理論的解析により，提案手法がサイド情報の次元数に基づいたサンプル複雑度で線形収束することを示した。
- 不正確なサイド情報に対しても，効率性と最適性が維持されることが実証された。
Link: https://arxiv.org/abs/2605.17189
三重射影的ほぼ完全非線形置換と関数 [math.CO, cs.IT, math.IT]目的：有限ベクトルの空間における，奇数次元かつ3で割り切れる次元を持つほぼ完全非線形（APN）置換の大きな族
- 暗号理論において，非線形性の高い関数は差分攻撃への耐性向上に不可欠である。
- APN関数は暗号化において重要だが，特に偶数次元でのAPN関数の構成は困難である。
- 三重射影構造を利用し，新たなAPN関数と，非単射なAPN関数を構成すること。
- 奇数次元の空間において，3で割り切れる次元を持つ空間でAPN置換の大きな族が得られた。
- 偶数次元においては，全単射でないAPN関数および関連する高非線形関数が提示された。
- これらの関数は，一般線形群GL(3,2^m)によって誘導される三重射影構造を持つ。
Link: https://arxiv.org/abs/2605.17545
出現回数を保存する写像について [math.CO, cs.DS]目的：出現回数保存写像の性質と特徴付け
- 言葉の組み合わせ論において，重複や順序といった性質を保つ写像の構造が重要である。
- 写像が特定の文字列の出現回数を保存する条件が未解明であった。
- 出現回数を保存する写像の条件を明らかにし，その応用を目指す。
- 干渉を持たない写像の概念を導入し，その判定アルゴリズムを開発した。
- 出現回数保存写像を干渉を持たない写像として正確に特徴付けた。
- フィボナッチ列やチュー・モース列の最小一意部分文字列を特定することに成功した。
Link: https://arxiv.org/abs/2605.18034
局所ハミルトニアンにおける量子アルゴリズムの高速化：エントロピーによる制御 [quant-ph, cs.CC, cs.DS]目的：局所ハミルトニアンの低エネルギー状態推定と状態準備
- 量子複雑性理論において，低エネルギー状態の探索は重要な課題である。
- 既存手法では，量子ビット数が増えるほど計算量が指数関数的に増加する。
- より少ない計算量で，低エネルギー状態を効率的に準備すること。
- 本研究では，深さ$d$の量子回路で得られる状態のエネルギーを制限することで，Groverの限界を超えるアルゴリズムを提案した。
- 深さ$d$の基底状態を持つハミルトニアンに対し，既存手法と同等のエネルギー保証を実現した。
- 本アルゴリズムは，強くエンタングルした状態と古典的に記述可能な状態の違いに関する洞察を提供する。
Link: https://arxiv.org/abs/2605.18241
スマートコントラクトの脆弱性検出における深層学習の活用 [cs.CR, cs.ET, cs.LG, cs.SE]目的：イーサリアム製スマートコントラクトの脆弱性判断
- ブロックチェーン技術の普及に伴い，スマートコントラクトのセキュリティ確保が重要となっている。
- 既存の脆弱性検出ツールは，パターンマッチング等に依存し，未知の脆弱性に対応できない場合がある。
- 深層学習を用いて，ソースコードのラベル付けのみで，バイトコードの脆弱性を高精度に検出することを目指す。
- DLVAは，既存の脆弱性検出ツールと比較して，10～1000倍の高速性を示す。
- SC2Vは，スマートコントラクトのバイトコードをベクトル化し，モデルの識別能力を2.2%向上させる。
- DLVAは，Slitherのラベルを92.7%の精度で予測し，誤検知率は7.2%に抑えることに成功した。
Link: https://arxiv.org/abs/2304.10726
凸集合による機械学習助言を用いたオンライン資源配分 [cs.DS, cs.LG, math.OC]目的：オンライン資源配分における機械学習助言の活用
- 需要予測の精度向上は，資源配分の効率化に不可欠であり，経済的損失の低減に繋がる。
- 機械学習による需要予測は不確実性を伴うため，誤った予測に基づく資源配分のリスクが存在する。
- 不確実な機械学習助言下でも，効率性と堅牢性を両立する資源配分アルゴリズムを開発すること。
- 提案手法は，機械学習助言の信頼度に応じて動的に保護レベルを調整することで，最悪ケースと平均ケースの性能をバランスさせる。
- 古典的な保護レベルアルゴリズムを拡張し，助言の不確実性への適応性を向上させることに成功した。
- 数値実験の結果，提案アルゴリズムは，単なる点予測に基づく既存手法を上回り，優れた性能を示すことが確認された。
Link: https://arxiv.org/abs/2306.12282
VMT19937：メルセンヌ・ツイスター19937に基づくSIMDフレンドリーな擬似乱数生成器 [eess.SY, cs.SY, cs.DC, cs.DS, cs.PF]目的：SIMD命令を活用した擬似乱数生成手法
- シミュレーション分野では，大量の擬似乱数が必要不可欠であるため，高速かつ高品質な乱数生成器が求められる。
- 既存のメルセンヌ・ツイスターは統計的性質は良好だが，SIMD命令の活用が不十分で，更なる高速化の余地があった。
- SIMD命令を最大限に活用し，メルセンヌ・ツイスターと同等の統計的性質を持つ，より高速な乱数生成器を開発すること。
- 複数のメルセンヌ・ツイスターインスタンスの状態を位相差させ，ラウンドロビン方式でポーリングすることで，SIMDの並列処理能力を最大限に活用した。
- SIMDレジスタの幅に応じてスループットがほぼ線形に向上し，特に最新のCPUにおいて大幅な速度改善が確認された。
- 提案手法は，様々なシミュレーションアプリケーションにおいて，効率的な乱数生成を可能にする。
Link: https://arxiv.org/abs/2309.16682
SumComp：整数環を用いたデジタル無線計算の符号化 [cs.IT, math.IT]目的：デジタル無線計算のための符号化方式
- 通信と計算は別個に扱われてきたが，応用分野では情報自体の価値より，ローカルな情報の機能性が重要となる場面が増加している。
- 既存のChannelComp方式は汎用的で複雑な計算を要し，特定の変調方式に最適化されていないという課題があった。
- QAMおよびPAM変調に特化した新たな符号化方式SumCompを開発し，計算効率の向上を目指す。
- SumComp符号化は，加重平均二乗誤差(MSE)および平均絶対誤差(MAE)において，従来の無線計算やChannelComp方式を上回る性能を示すことがシミュレーションで確認された。
- 特に，低ノイズ環境下では，算術平均および幾何平均の計算において，正規化されたMSEが約10dB改善された。
- SumComp符号化は，デジタル無線計算における計算能力の向上に貢献する。
Link: https://arxiv.org/abs/2310.20504
距離再彩色 [cs.DC, cs.DS, cs.DM]目的：距離彩色再構成問題の計算複雑性
- グラフ理論における再構成問題は，計算機科学の様々な分野に応用されており，その効率的な解法は重要である。
- グラフ彩色問題の再構成可能性は，彩色数やグラフの構造によって計算複雑性が大きく異なることが知られている。
- 距離彩色再構成問題の計算複雑性を，グラフの種類ごとに明らかにすることを目的とする。
- 距離$d \geq 3$の場合，平面グラフ，二部グラフ，2-退化グラフにおいても，$(d, k)$-彩色再構成問題はPSPACE完全である。
- 距離$d = 2$の場合，平面グラフと2-退化グラフにおいても，同様にPSPACE完全であることが示された。
- スプリットグラフにおいては，距離$d = 2$で計算困難だが，距離$d \geq 3$では効率的に解けるという興味深い二分性が見られる。
Link: https://arxiv.org/abs/2402.12705
低ランクトープリッツ行列の復元：下降錐解析と構造化ランダム行列 [cs.IT, math.IT]目的：低ランクトープリッツ行列の安定的な復元
- 高次元データ解析において，低ランク行列の復元は重要な課題である。
- 測定回数が少ない場合，安定的な復元が困難となる場合がある。
- トープリッツ構造を利用し，測定回数を削減した復元手法を確立する。
- 本研究では，ランク$r$以下の対称トープリッツ行列を，$r\log^{2} n$程度のランク1準ガウス測定から，指数関数的に減少する失敗確率で安定的に復元可能であることを示した。
- 下降錐解析とメンデルソンの小球法を用いることで，トープリッツ制約下での復元を可能にした。
- トープリッツ構造を持つランダム行列のスペクトルノルムの決定は，独立した興味深い結果である。
Link: https://arxiv.org/abs/2407.03175
境界付きホップトークンによる独立集合再構成 [cs.DS]目的：グラフの独立集合間の再構成可能性とその計算複雑性
- グラフ理論における独立集合は，様々な応用分野で重要な役割を果たす。
- 独立集合の再構成問題は計算困難であり，効率的なアルゴリズムが求められている。
- 再構成規則を一般化することで，問題の複雑さの変化を明らかにすることを目指す。
- k-Jumpモデルにおいて，kが3以上の場合は計算複雑性が同等になることが示された。
- Splitグラフに対する2-Jumpモデルの独立集合再構成問題は多項式時間で解けることが示された。
- 直径が2k+1以下のコードグラフにおける最適化問題は，kが3以上のときNP困難である。
Link: https://arxiv.org/abs/2407.11768
冗長性こそが重要である (CSPスパース化のため) [cs.DS, cs.DM, cs.IT, cs.LO, math.CO, math.IT]目的：CSPスパース化の限界と可能性
- 組合せ最適化問題において，計算効率の良い近似アルゴリズムを開発する上で重要な研究分野である。
- CSPのスパース化においては，非冗長なインスタンスサイズが下限となるものの，それを達成できるか不明であった。
- CSPのスパース化可能性を，冗長性の観点から明確にすることを目指している。
- CSPインスタンスは，その非冗長性（または連鎖長）の範囲内でスパース化可能であることが示された。
- この結果は，非線形符号論の文脈でVC型定理として一般化されており，エントロピー法が応用されている。
- 非冗長性に関する既存研究がCSPスパース化に直接適用され，新たな非冗長性解析手法が提案されている。
Link: https://arxiv.org/abs/2411.03451
束縛されたクリーク数を持つ$P_7$-フリーグラフにおける疎な誘導部分グラフ [cs.DS, math.CO]目的：最大重み独立集合，フィードバック頂点集合，頂点平面化などの計算問題における，最大疎な誘導部分グラフの探索
- グラフ理論における構造的制約と計算可能性の関係を明らかにすることは，組み合わせ最適化問題の解決に不可欠である。
- 固定されたパスを誘導部分グラフとして含まないグラフにおいても，多項式時間で解ける問題が存在するか不明であった。
- 束縛されたクリーク数を持つ$P_7$-フリーグラフにおいても，上記の問題を多項式時間で解決することを目指す。
- 本研究により，$P_7$-フリーグラフでクリーク数が制限されている場合，これらの問題が多項式時間で解けることが示された。
- 既存研究のアルゴリズムを拡張することで，より広範なグラフクラスに対する計算可能性を証明した。
- これにより，CMSO$_2$論理で定義可能な性質を持つ最大疎な誘導部分グラフ問題に対する，新たな計算可能性の結果が得られた。
Link: https://arxiv.org/abs/2412.14836