arXiv雑要約

プログラム - 2026/05/08 公開

ボトルネック多重ナップサック問題に対するほぼ最適解アルゴリズム [cs.DS]目的：ボトルネック多重ナップサック問題の近似解法
- 資源配分問題は，現実の様々な状況で発生し，効率的な解決が求められている。
- ボトルネック多重ナップサック問題はNP困難であり，厳密解の計算は困難である。
- ナップサックへの割り当て最適化により，最小利益の最大化を目指す。
- 全てのナップサックの容量が同一の場合，$(\frac{2}{3} - \varepsilon)$-近似アルゴリズムが導き出された。
- 容量が異なるナップサックの場合，$(\frac{1}{2} - \varepsilon)$-近似アルゴリズムが提案された。
- 提案アルゴリズムの性能限界が，$(\frac{1}{2} + \varepsilon)$という困難度によって示された。
Link: https://arxiv.org/abs/2605.05233
LLMエージェントシステムにおけるエンタープライズツールライブラリのための宣言的記述言語：DADL [cs.CL, cs.IR, cs.SE]目的：エンタープライズツールライブラリの記述と管理
- LLMエージェントの普及に伴い，外部ツールとの連携が不可欠となっている。
- 従来のAPI連携は，個々のサーバープロセスが必要となり，管理コストが高い。
- ツールカタログの規模拡大に伴うコンテキストウィンドウ消費の問題を解決する。
- DADLは，REST APIのエンドポイント，認証，ページネーションなどを宣言的に記述するYAML形式である。
- DADLにより，APIごとのサーバープロセスが不要となり，認証・認可を一元管理できる。
- Code Modeにより，ツール広告に必要なコンテキストコストを142倍削減できた。
Link: https://arxiv.org/abs/2605.05247
知能システムのための制御付きメタプログラミング：eval を制御された効果として再分類 [cs.PL, cs.AI]目的：知能システムにおける実行構造の動的合成
- AIの進化に伴い，実行時のプログラム合成が不可欠となり，安全性と信頼性が重要視されている。
- 従来の言語ではevalが制限なく実行され，権限の増幅を引き起こすリスクがある。
- evalを制御された効果として再分類し，プログラム実行の安全性を確保すること。
- 制御付きメタプログラミングにより，プログラム表現の操作を純粋な計算とし，実行への移行を制御可能とした。
- 提案システムはプログラムの能力要件，ポリシー遵守，リソース見積もりを分析し，実行を許可するかどうかを決定する。
- 形式的な証明により，形式操作の純粋性，迂回防止定理，境界保存が保証された。
Link: https://arxiv.org/abs/2605.05248
スケーラブルな検索のための識別子不要なコード埋め込みモデル [cs.CR, cs.LG, cs.SE]目的：バイナリリバースエンジニアリングにおける関数関連付け
- ソフトウェアセキュリティにおいて，コードの挙動理解は不可欠であるため，効率的な関数関連付けが重要視される。
- 既存の検索ツールはAIの能力を十分に活用できておらず，ソースコードとデコンパイルコード間の双方向関連付けが困難である。
- ソースコードとデコンパイルコード間の双方向関連付けを可能にし，関数関連付けの性能向上を目指す。
- Qwen3-Embeddingモデルをコントラスト学習でファインチューニングすることで，関数関連付けにおいて既存モデルを大幅に上回る性能を達成した。
- 本モデルは，明示的に学習していない定数アルゴリズム関連付けタスクに対しても高い汎化能力を示すことが確認された。
- この研究は，AIを活用したリバースエンジニアリングの効率化に貢献する可能性を示すものである。
Link: https://arxiv.org/abs/2605.05251
AIベース文書知能による人口規模の監査保証の自動化 [cs.SE, cs.AI]目的：AIベース文書知能を用いた大規模監査取引テストの自動化フレームワーク
- 顧客対応明細書の正確性確認は，企業の信頼性維持に不可欠である。
- 従来のPDF明細書の目視確認は，時間と労力がかかり，大規模取引には適さない。
- 本研究は，PDF明細書からのデータ抽出を自動化し，監査範囲を拡大することを目指す。
- Snowflake Document AIを活用し，少量のアノテーションデータでPDF明細書から構造化データを抽出することに成功した。
- 抽出されたデータと真実のデータソースを照合することで，大規模な取引における差異を特定できるようになった。
- インタラクティブなダッシュボードと自動レポートにより，リスクのリアルタイムな特定と継続的保証が可能となった。
Link: https://arxiv.org/abs/2605.05252
PARNESS：エンドツーエンド自動科学研究のためのペーパーハーネス：動的ワークフロー，全文インデックス，およびクロスラン知識蓄積 [cs.SE]目的：エンドツーエンド自動科学研究を可能にするフレームワークの開発
- 科学研究の自動化は，研究効率の向上や新たな発見の促進に不可欠である。
- 既存の自動研究システムは，ワークフローの固定化や知識の集積が不十分である。
- PARNESSは，柔軟なワークフローと知識の蓄積により，これらの課題を解決することを目指す。
- PARNESSは，YAMLで記述可能な柔軟なワークフローエンジンを搭載している。
- PDF全文とコードリポジトリのインデックス化により，研究に必要な情報を効率的に収集できる。
- 知識グラフを用いた情報検索により，LLMへの適切な情報提供を可能にする。
Link: https://arxiv.org/abs/2605.05258
世代と学習の架け橋：コード生成におけるLLMの品質問題に関する体系的レビュー [cs.SE, cs.AI]目的：コード生成用LLMの品質問題と学習データ品質問題の関連性
- コード生成AIの発展は，ソフトウェア開発の自動化を促進し，生産性向上に貢献する。
- 生成されたコードに潜在的なバグやセキュリティ脆弱性が含まれる可能性があり，信頼性が課題となる。
- 学習データ品質がコード生成品質に与える影響を明らかにし，信頼性の高いLLM開発を目指す。
- 本レビューでは，114の主要研究を分析し，生成コードの品質問題と学習データ品質問題の分類体系を確立した。
- 学習データにおける品質問題からコード生成時の品質問題への18種類の典型的な伝播メカニズムを特定した。
- データ，モデル，生成の各ライフサイクルにおける検出・緩和技術の動向を整理し，データ中心型品質保証への移行を示唆した。
Link: https://arxiv.org/abs/2605.05267
グレイマスの記号論的四角形に対する図式的証明論的意味論 [cs.LO]目的：グレイマスの記号論的四角形に着想を得た構造意味論の断片に対する図式的証明システム
- 構造意味論は，言語や記号が持つ意味構造を解析し，コミュニケーションの基盤を理解する上で重要である。
- 従来の論理的枠組みでは，グレイマスの記号論的四角形のような非古典的な意味操作を形式化することが困難であった。
- 本研究は，図式的証明論を用いて，グレイマスの記号論的四角形におけるメタ項の構成を統一的に捉えることを目指す。
- 本研究では，スパイダー図を用いて図式的証明システムを構築し，矛盾と含意の関係を図式的な変換として捉えた。
- メタ項の構成は，基本図形の連言から，輪郭導入と生息地変換の規則からなる固定された推論スキーマを通じて導出可能であることが示された。
- この枠組みは，グレイマスの「+」演算を論理的結合ではなく，導出的構成として解釈する意味論的解釈を提供する。
Link: https://arxiv.org/abs/2605.05273
バイアスなきパラメータ推定と信号再構成について [cs.IT, math.IT, math.OC, math.PR]目的：パラメータ推定と信号再構成の理論拡張
- 画像処理等の分野で，信号を正確に復元する技術は重要である。
- 従来の復元手法では，ノイズに対する頑健性が課題となっていた。
- 本研究は，ノイズに強く，パラメータを正確に推定する手法を提案する。
- 無雑音環境下における復元可能なパラメータ数の上限が理論的に導出された。
- 正しい大きさの順序で全ての非ゼロパラメータを得られる確率を評価する測度を定義した。
- 標準化された非バイアス手法のノイズ頑健性に関する疑問に対する数学的な説明が提供された。
Link: https://arxiv.org/abs/2605.05276
有限エキスパートバンクによる通信効率的なMoEの専門家ルーティング [cs.LG, cs.IT, math.IT]目的：通信効率的なMoEにおける専門家ルーティングの最適化
- 機械学習において，計算資源の効率的な活用が重要であり，MoEはその有効な手段となる。
- MoEのゲート機構は学習とルーティングを担うが，そのルーティング情報の定量化が課題であった。
- 有限エキスパートバンクを用いてルーティング情報を解析し，効率的な専門家ルーティングの設計指針を提供する。
- 提案手法により，ルーティング情報と汎化性能のギャップが相関することを確認した。
- Xu-Raginsky boundの緩さや，一様和の限界との比較も行われた。
- 本フレームワークは，リソースを考慮したMoE推論システムの分析ツールとして利用可能である。
Link: https://arxiv.org/abs/2605.05278
BLEUを超えて：コード翻訳のセマンティック評価手法 [cs.PL, cs.CL]目的：コード翻訳の正確性評価
- LLMの能力としてコード翻訳は重要であり，その性能評価が不可欠である。
- 従来のBLEUなどの指標は構文類似度のみを測り，プログラムの意味を考慮していない。
- 意味的等価性を重視した，より正確なコード翻訳評価手法の確立を目指す。
- 提案手法はコンパイラテストの手法を応用し，LLMによるバイナリリフティングの評価を可能にする。
- 翻訳が正しい実行結果を生み出す割合を「セマンティック正しさ」として定義し，その指標を用いた評価を行った。
- LLMベースのアプローチがヒューリスティックな手法を大きく上回り，BLEUスコアとセマンティック正しさには相関がなかった。
Link: https://arxiv.org/abs/2605.05282
拡張ファジー論理プログラムに対するパラコンシステント意味論：近似不動点理論によるアプローチ [cs.LO]目的：拡張ファジー論理プログラムに対するパラコンシステント意味論の定式化
- 論理プログラミングは，知識表現と推論の強力なツールとして広く用いられている。
- 失敗による否定と強い否定を両方含むプログラムの意味論は，矛盾なく定義することが困難である。
- 近似不動点理論を用いて，両否定を含むファジー論理プログラムに対する適切な意味論を確立する。
- 近似不動点理論を用いることで，多様な意味論を統一的に表現することが可能となった。
- 既存の意味論を一般化し，新たな意味論の創出を促す基盤を提供する。
- ファジー論理プログラミングにおける否定の扱いの可能性を広げた。
Link: https://arxiv.org/abs/2605.05286
エージェントの保護：ベンダー中立型，マルチテナント企業向け検索とツール利用 [cs.CR, cs.AI, cs.IR, cs.SE]目的：企業における検索拡張生成（RAG）とエージェントAIシステムのセキュリティ確保
- 企業AIの導入が進む中，データ保護とアクセス制御の重要性が増している。
- 既存のRAGアーキテクチャでは，権限確認を怠り，テナント間のデータ漏洩リスクがある。
- マルチテナント環境におけるデータセキュリティを確保し，情報漏洩を防ぐことを目指す。
- 提案アーキテクチャは，ポリシーを意識したインジェスト，検索時のゲート処理，共有推論を組み合わせることで，層状の分離を実現する。
- セキュリティに関わる重要な操作をサーバー側に集中させることで，マルチテナント分離の自然な強制ポイントを設ける。
- OGXによる実装と実験により，ABACゲートがテナント間のデータ漏洩をなくし，オーバーヘッドがごくわずかであることが確認された。
Link: https://arxiv.org/abs/2605.05287
公開リポジトリにおけるログベースの検知ルール進化 [cs.CR, cs.SE]目的：ログベースの検知ルール進化の分析
- 現代のセキュリティ運用において，ログベースの検知ルールは不可欠であり，専門知識を反映している。
- ネットワーク侵入検知シグネチャの進化は研究されてきたが，ログベースの検知ルールの経時的な変化はほとんど研究されていない。
- 公開リポジトリにおける検知ルール進化のパターンを明らかにし，より良いルール作成プロセスを支援する。
- SigmaとSSCの6,859件のルール履歴を分析した結果，約56%のルールが少なくとも1回以上検知ロジックの修正を受けていることが判明した。
- ルールの進化は単調ではなく，多くのルールが時間とともに句を追加したり削除したりする非線形な変化を示している。
- 構造分析とLLM推論の結果，約4分の1から3分の1のルールが，カバレッジの拡大と誤検知の削減を交互に行っていることが示唆された。
Link: https://arxiv.org/abs/2605.05383
線形制約下での条件付き拡散：ランジェバン混合と情報理論的保証 [cs.LG, cs.IT, math.IT]目的：線形逆問題における事前学習済み拡散モデルを用いたゼロショット条件付きサンプリング
- 画像処理や信号処理において，不完全な観測からの信号復元は重要な課題である。
- 既存手法では，観測データの一貫性を確保するのみで，条件付き分布の偏りを抑制できていない。
- 観測データと未観測データの間の情報量に基づき，より正確な条件付きサンプリングを実現すること。
- スコア関数の正規-接線分解により，観測方向のスコアは測定によって決定され，接線方向のスコアが未知であることが示された。
- 接線方向のスコアを無条件のスコアで置換することによる誤差は，観測成分と未観測成分間の条件付き相互情報量によって上限されることが証明された。
- 提案手法である投影ランジェバン初期化とガイド付き逆拡散は，インペインティングおよび超解像度タスクにおいて既存手法を上回る性能を示した。
Link: https://arxiv.org/abs/2605.05387
エージェント駆動型コーディングのための準備：意図的な準備を文脈エンジニアリング手法として [cs.SE, cs.AI, cs.HC]目的：エージェント駆動型コーディングにおける準備段階の確立
- AI技術の進化によりソフトウェア開発の効率化が期待される一方で，その効果を最大限に引き出すためには適切な開発手法が不可欠である。
- 現状のAIコーディングでは，準備不足が原因で修正・再設計に時間がかかり，開発効率を損なう問題が存在する。
- 本研究は，AIエージェントがより質の高いコードを生成するための準備段階の重要性を示し，開発効率の向上を目指す。
- 料理における「ミーズ・アン・プラス」の概念を応用し，文脈の整理，共同仕様の作成，タスク分解という３段階の準備手法を提案した。
- ハッカソンでの実験結果から，約2時間の準備によって，AIエージェントによるフルスタック教育プラットフォームの並行実装が可能になった。
- 「文脈流暢性」という新たな開発者のスキルを提唱し，逆向き設計や暗黙知の外部化といった既存のフレームワークとの関連性を示唆した。
Link: https://arxiv.org/abs/2605.05400
マイナーフリーグラフにおけるフロー障壁を超えるセパレータ [cs.DS]目的：K_h-マイナーフリーグラフに対するバランスセパレータのサイズ縮小
- グラフ理論は，ネットワーク設計やスケジューリングなど，様々な分野に応用される重要な研究領域である。
- 平衡セパレータのサイズ縮小は，アルゴリズム効率化の鍵となるが，フロー障壁によって制限されてきた。
- 本研究は，フロー障壁を超えるセパレータを構築し，平衡セパレータサイズの縮小を目指す。
- 本研究では，フローに基づくアルゴリズムを改良し，サイズがO(hlogh√n)の平衡セパレータを構築した。
- さらに，低直径分解を組み込むことで，サイズO(h√logh√n)のセパレータを実現し，フロー障壁を超えた。
- これは，Alon，Seymour，Thomasの提唱する，より小さい平衡セパレータの実現に向けた重要な一歩となる。
Link: https://arxiv.org/abs/2605.05494
意味通信と待ち行列：クロスカスタ層における遅延とタスク忠実度の最適化 [cs.IT, cs.AI, cs.LG, cs.NI, eess.SP, math.IT]目的：意味的画像伝送における遅延とタスク忠実度最適化
- 無線通信において，効率的なスペクトル利用とタスク関連情報の伝達が重要である。
- 従来の通信は，チャンネル資源を過剰に消費し，遅延を招く可能性がある。
- 意味通信を活用し，遅延とタスク忠実度のトレードオフを最適化することを目指す。
- 意味的自己符号化器を用いることで，受信波形から画像再構成とラベル予測を同時に行うことが可能となった。
- 潜在次元をクロスカスタ層の制御変数として活用することで，意味的忠実度とチャンネル資源使用量の調整を実現した。
- 待ち行列を考慮した意味レート制御により，遅延とAge of Information (AoI)を大幅に削減できることが示された。
Link: https://arxiv.org/abs/2605.05514
パッチに関連するビルド失敗か？継続的インテグレーションにおける無関係なビルド失敗に関する実証研究 [cs.SE]目的：無関係なビルド失敗の理解と予測
- 継続的インテグレーションは，ソフトウェア開発の効率化に不可欠であり，迅速なフィードバックループを提供。
- ビルド失敗の原因特定に時間がかかり，開発者の生産性を低下させる可能性がある。
- 無関係なビルド失敗を予測し，開発者の無駄な労力を削減すること。
- 開発者は，ビルド失敗が自分の変更に関連するかどうかを判断するのに中央値で4時間も費やしていることが判明。
- 抽出された33の特徴量を用いた半教師あり学習モデルは，精度0.70～0.88，再現率0.30～1.00を達成。
- CIの遅延，エラーメッセージの繰り返し，先行コメントの数などが，無関係なビルド失敗の有用な指標であることが示唆。
Link: https://arxiv.org/abs/2605.05564
AIエージェントにおける倫理の実践：開発者がリポジトリコンテキストファイルに価値観を組み込む方法 [cs.SE, cs.CY]目的：AIエージェントに対する倫理的原則の具体化
- AI技術の進化に伴い，倫理的な配慮が不可欠となっている。
- AIエージェントの倫理的行動をどのように定義し，実装するか明確ではない。
- 開発者がAIエージェントの行動を制御するための具体的な方法を明らかにすること。
- 開発者は既に，公平性，アクセシビリティ，プライバシー等の指針をリポジトリファイルに埋め込んでいることが確認された。
- これらのファイルは，抽象的な倫理原則を開発ワークフロー内の具体的な指示に翻訳する，開発者によるガバナンス層として機能する。
- この新たな実践に関する研究課題として，価値観の多様性，ガバナンスの動態，エージェントの遵守状況などが挙げられる。
Link: https://arxiv.org/abs/2605.05584
二値テスト時集約の正確な構造：投票が役立つか，損をするか，あるいは進路を変えるか [cs.LG, cs.IT, math.IT]目的：二値テスト時集約における投票の効果に関する構造
- 予測モデルの性能向上は重要であり，特に高機能モデルの変更コストが高い場合に有効な手法が求められている。
- 従来の理論では投票の効果は単調であるとされていたが，実際の挙動はより複雑であり，その詳細な構造は未解明であった。
- 本研究では，交換可能性の仮定の下で，投票が支配される潜在的な分布に着目し，投票曲線が必ずしも単調ではないことを示す。
- 投票は，各二項分散スケールにおいて，多数決閾値を超える潜在的な質量の過剰を記録する「署名」を回復する。
- 完全なオッズ予算曲線とこの署名は等価であり，曲線は署名を一意に復元する。
- この視点により，形状現象，分岐対称性の識別不能性，実現可能性，変動，およびエンドポイントレートが説明される。
Link: https://arxiv.org/abs/2605.05592
ほぼ最適な注意コセット [cs.HC, cs.DS, cs.AI]目的：注意メカニズムの近似計算
- 大規模言語モデルの性能向上に不可欠な注意機構の計算コスト削減が求められている。
- 注意機構の計算量は入力データのサイズに比例するため，大規模データへの適用が困難である。
- 注意機構のコセットを構成することで，計算コストを抑えつつ近似精度を保つことを目指す。
- 単位ノルムのキーと値の集合に対し，サイズが$O({\sqrt{d} e^{\rho+o(\rho)}/\varepsilon})$のコセットが存在することが示された。
- このコセットは，ノルムが$\rho$で制限されたすべてのクエリに対し，注意機構の近似誤差を$\varepsilon$以下に抑える。
- 既存の結果を上回る性能を示すとともに，コセットのサイズに関する下限も改善された。
Link: https://arxiv.org/abs/2605.05602
3-デザインを支持する有限長constacyclicコード族とその符号理論における応用 [cs.IT, math.IT]目的：3-デザインを支持するconstacyclicコード族の構成と，それらの符号理論への応用
- 有限体上のconstacyclicコードは，代数学，代数幾何学，グラフ理論等，数学の広範な分野と関連する重要な研究対象である。
- 古典的な巡回符号と比較して，constacyclicコードの研究は十分に進んでいない。
- 本研究は，3-デザインを支持するconstacyclicコード族を構成し，その性質を明らかにすることで，この分野の発展を目指す。
- 有限体$\mathbb{F}_{q^2}$上の$\lambda$-constacyclicコード族を新たに構成し，無限個の3-デザインを支持することを示した。
- これらのコードのパラメータと重み分布を完全に決定した。
- これらのコードの部分体符号や，エンタングルメント支援量子誤り訂正符号 (EAQECCs)，局所回復可能符号 (LRCs) への応用についても検討し，有用な結果を得た。
Link: https://arxiv.org/abs/2605.05613
高密度ハイパーグラフにおける大規模独立集合のアルゴリズム的相転移 [cs.DS, cs.CC, cs.DM, math.CO, math.PR]目的：高密度ランダムハイパーグラフにおける大規模独立集合のアルゴリズム的トレクタビリティ
- 大規模データセットの解析において，グラフ構造の理解は不可欠であり，独立集合の探索は重要な問題である。
- 高密度グラフでは，従来のアルゴリズム手法が適用困難であり，効率的なアルゴリズム設計が課題となっている。
- 本研究は，高密度ハイパーグラフにおける大規模独立集合のサイズを特定し，近似アルゴリズムを開発することを目指す。
- 高密度$r$-均一Erdős-Rényiハイパーグラフにおいて，最大独立集合のサイズを特定した。
- 一様モデルでは$r^{1/(r-1)}$，$r$-partiteモデルでは$(\max_i \gamma_i)^{-1/(r-1)}$ の近似率を達成するオンラインアルゴリズムを設計した。
- 提案アルゴリズムの性能限界を示す下限を確立し，計算ギャップの鋭さを証明した。
Link: https://arxiv.org/abs/2605.05618
現実世界のソフトウェア開発におけるプロアクティブなコーディングアシスタントの実証研究 [cs.SE, cs.AI]目的：現実世界のソフトウェア開発におけるプロアクティブなコーディングアシスタントの有効性に関する評価
- ソフトウェア開発の生産性向上は，ビジネスの迅速化とコスト削減に不可欠である。
- 従来のコーディングアシスタントは受動的であり，開発者の負担が大きいという課題がある。
- 実際の開発者の行動データに基づき，より自然で効率的なアシスタントを実現する。
- 大規模な実データ収集により，LLMシミュレーションによるIDEトレースと現実のIDEトレースに大きな乖離があることが示された。
- 新しいベンチマークであるProCodeBenchを公開し，既存のアプローチでは現実のIDEトレース下での性能が低いことを明らかにした。
- シミュレーションデータは，現実世界のデータと組み合わせることで，効果的なモデルのファインチューニングに貢献しうる。
Link: https://arxiv.org/abs/2605.05700
自動量子プログラム検証のための実用的な仕様言語（テクニカルレポート） [cs.LO, cs.FL]目的：自動量子プログラム検証の実現
- 量子コンピュータの発展に伴い，プログラムの正当性保証が重要になっている。
- 既存の検証手法では，高水準な仕様記述から自動検証を行うことが困難である。
- 線形時間で仕様から自動機を生成し，大規模な検証を可能にすること。
- 拡張された集合ベースの仕様言語と，線形時間で自動機を生成するアルゴリズムを開発した。
- 生成されるコンパクトな自動機により，従来困難であった規模の量子プログラムの検証を自動的に行うことができる。
- 表現力と効率性を両立し，実用的な量子プログラム検証を実現した。
Link: https://arxiv.org/abs/2605.05786
自己訂正型ゴシッププロトコル [cs.RO, cs.FL, cs.LO, cs.DC]目的：エラーを含む自己訂正型ゴシッププロトコルの研究
- 分散システムにおける信頼性確保は重要であり，特にエラー耐性を持つプロトコルの設計が不可欠である。
- 従来のプロトコルは中央集権的な管理が必要であり，スケーラビリティや単一障害点の問題を抱えていた。
- 本研究は，中央集権的な管理なしにエラーを訂正し，分散環境での効率的な情報伝達を実現することを目指す。
- エラーのあるメッセージ伝送を，中心的な権限なしに訂正する手法を提案した。
- 提案手法が最適性に与える影響を分析し，メモリ制約や完全情報プロトコルとの比較を行った。
- 動的な認識論理を用いることで，分散環境におけるエラー訂正の理論的基盤を確立した。
Link: https://arxiv.org/abs/2605.05801
チャットから面接へ：経験オントロジーを用いた主体的な要件引き出し [cs.SE]目的：要件引き出しの自動化
- 要件工学において，要件定義はソフトウェア開発の成功に不可欠なプロセスである。
- 従来の要件定義は分析者の経験に依存しており，暗黙的な要件の抜け漏れや冗長な質問が発生しやすい。
- 経験オントロジーを用いて面接を誘導することで，効率的かつ効果的な要件引き出しを実現する。
- 提案手法OntoAgentは，既存のベースラインと比較して，要件引き出しの有効性と質問効率において有意に優れた性能を示した。
- IRE（情報抽出率）が33％，TKQR（質問あたりの要件数）が21％向上した。
- 質的研究においても，実際のシナリオでの実用的な利点が示された。
Link: https://arxiv.org/abs/2605.05828
LLM出力に対する二進木符号化の加法近似計画 [cs.CL, cs.CY, cs.HC, cs.IT, cs.DS, math.IT]目的：大規模言語モデルの次トークン分布のような離散確率分布を，レート制約下で二進木によって誘導される二進分布で近似すること。
- 言語モデルの効率的な表現は，計算資源の制約下での応用を可能にするため重要である。
- 確率分布の近似は，計算コストと精度とのトレードオフが課題である。
- レート制約下での最適な二進分布近似を効率的に行うこと。
- 本研究では，レート制約下における二進木分割問題を多項式時間で近似する加法近似計画を開発した。
- これにより，ほぼ最適な二進近似の保証が得られ，大規模言語モデルを用いたステガノグラフィの原理的な枠組みが提供される。
- レートはトークンあたりの隠れた情報のビット数に対応し，全変動距離は統計的な検出可能性を制御する。
Link: https://arxiv.org/abs/2605.05837
一階述語論理の断片に対する決定可能性結果：記号モデル特性による [cs.LO]目的：一階述語論理の断片に対する決定可能性
- 自動検証や知識表現において，一階述語論理の決定可能性は重要な課題である。
- 一階述語論理全体は決定不可能であり，その断片の決定可能性を調べる必要がある。
- 記号モデル特性を用いて，決定可能性が不明だった論理断片の決定可能性を示す。
- 記号構造は，無限の一階構造を有限に表現する方法であり，決定可能性の証明に利用される。
- 層状化公式の断片を拡張し，自己ループ関数を許容することで，より広範な論理断片の決定可能性が示された。
- 記号モデルの構築法は汎用的であり，他の同様に制限された断片にも適用可能である。
Link: https://arxiv.org/abs/2605.05840
AI生成コードの脆弱性修正：モデルのファインチューニングとプロンプト戦略 [cs.SE]目的：AI生成コードの脆弱性軽減策の検討
- AI技術の発展に伴い，コード生成の自動化が期待されるが，セキュリティ上の課題が普及の阻害要因となっている。
- 生成されたコードには，バグやセキュリティ上の弱点が含まれることが多く，信頼性を損なうという問題がある。
- 一般的な脆弱性リスト（CWE）に基づき，コード生成モデルのセキュリティ強化戦略の効果を検証する。
- セキュリティ改善策は，モデルや戦略に依存する傾向が強く，普遍的な解決策は存在しないことが示された。
- 特定の脆弱性を軽減できる戦略もあるが，修正によって新たな脆弱性が生じる副作用も確認された。
- AI生成コードのセキュリティ確保には，多角的なアプローチが必要であることが示唆された。
Link: https://arxiv.org/abs/2605.05867
離散最適輸送：焼きなまし法アルゴリズムの高速収束 [cs.DS, math.PR]目的：有限状態空間における焼きなまし法アルゴリズムの解析のための離散最適輸送フレームワーク
- 最適輸送は，確率分布間の距離を測る強力なツールであり，機械学習や統計物理学に応用可能である。
- 焼きなまし法は，複雑な最適化問題を解くための有力な手法だが，収束速度の理論的保証が十分でない場合がある。
- 本研究は，焼きなまし法の収束速度を理論的に保証し，その性能を向上させることを目指している。
- 離散Wasserstein距離と離散作用の概念を導入し，焼きなまし法の収束をKLダイバージェンスを用いて評価した。
- 平均場イジング模型において，焼きなまし法が$O(n^5\beta^2/\varepsilon)$ステップで$\varepsilon$誤差を達成することを示した。
- 平均場q状態Potts模型において，焼きなまし法が$\mathrm{poly}(n, \beta, 1/\varepsilon)$ステップで$\varepsilon$誤差を達成することを示した。
Link: https://arxiv.org/abs/2605.05877
機械学習を用いたソフトウェア工学における非英語開発者サポートの評価 [cs.CE, cs.SE]目的：機械学習における非英語開発者サポートの現状と課題
- ソフトウェア開発のグローバル化が進み，多言語対応の重要性が増している。
- 既存のコード生成・評価ツールは英語中心であり，非英語環境での性能が不明である。
- 非英語コードコメント生成の性能と，その評価方法の信頼性を明らかにすること。
- コード生成性能は英語以外で著しく低下し，言語エラーは最大15.1倍増加する。
- 非英語コメントにおけるエラー検出は，既存の自動評価手法では信頼性が低い。
- 人間の判断が不可欠であり，多言語ツール開発における評価と生成が重要な課題である。
Link: https://arxiv.org/abs/2605.05902
MASアルゴリズム：マルチエージェントシステムによるアルゴリズムプログラミング問題解決のためのワークフロー [cs.AI, cs.SE]目的：アルゴリズムプログラミング問題解決のための体系的なワークフロー
- AIにおける構造化推論能力評価に不可欠であり，複雑なシナリオへの対応力を測る。
- 既存手法はモデル修正やデータ拡張が中心で，コストがかかり解釈性に乏しい。
- 外部ツールやプロンプト技術の断片化を解消し，統一的なフレームワークを提供する。
- 提案手法MAS-Algorithmは，Qwenシリーズモデルにおいて平均6.48%の正答率向上を達成した。
- 同一データでの効率的なパラメータ調整では0.89%の微増に留まった。
- LiveCodeBench-Proにおいても4.72%の改善が見られ，他の指標でも一貫した向上が確認された。
Link: https://arxiv.org/abs/2605.05949
多目的時系列最短経路問題に対するラベル訂正アルゴリズム [cs.DS, math.OC]目的：多目的時系列最短経路問題における非支配解の集合とその対応する効率的な経路の算出
- 交通網やスケジューリングなど，時間制約のある最適化問題への応用が期待される分野である。
- 従来のラベル訂正法では，目的関数の単調性や等張性が必須条件とされていた。
- 単調性や等張性を仮定しない状況下でも解を導出できるアルゴリズムを開発する。
- 最大許容パス長を設けることで，非支配解を生成するために必要なゼロ期間時系列サイクル周回回数を制限する。
- 提案アルゴリズムは，特定の条件下ではパス長制限が不要であり，全ての非支配解を計算できる。
- 一般的なラベル訂正アルゴリズムを開発し，その有効性を検証する。
Link: https://arxiv.org/abs/2605.05954
Heimdallr：GitHub CIワークフローにおけるLLM誘発セキュリティリスクの特性評価と検出 [cs.CR, cs.SE]目的：GitHub CIワークフローにおけるLLM誘発セキュリティリスク
- ソフトウェア開発における自動化ニーズの高まりから，CI/CDパイプラインのセキュリティ確保が重要である。
- LLMの利用拡大に伴い，外部からの入力操作による悪意あるプロンプト注入等のリスクが顕在化している。
- CIワークフローにおけるLLM利用時の脆弱性を特定し，具体的な脅威ベクターを検出する手法を確立する。
- 本研究では，LLMとCIセキュリティの交差点に着目し，新たな攻撃対象領域を特定した。
- ワークフローの実行チェーン全体に沿ってリスクを分析し，リスク分類と脅威ベクターの分類体系を構築した。
- 開発したハイブリッド分析フレームワークHeimdallrは，高い精度でLLMノードの識別，トリガー可能性の分類，脅威ベクターの検出を実現した。
Link: https://arxiv.org/abs/2605.05969
ランダム化ハダマール変換による量子化：効率的なヒューリスティクスの証明 [cs.LG, cs.AI, cs.DS, cs.NI]目的：勾配圧縮，推論高速化，KVキャッシュ圧縮，モデル重み量子化，ベクトルデータベースにおける近似最近傍探索のための量子化手法におけるランダム化ハダマール変換の理論的性能評価
- 現代的な機械学習モデルは大規模化しており，計算資源の効率的な利用が不可欠である。
- 量子化はモデルサイズを削減するが，精度低下を招く可能性があり，その対策が求められている。
- ランダム化ハダマール変換の理論的性能を明らかにし，Uniform Random Rotationと同等の性能を保証すること。
- 2つのランダム化ハダマール変換の組み合わせは，高次元入力において各座標の周辺分布が標準ガウス分布に収束することを示した。
- これにより，DRIVEやQUIC-FLといった現代的な圧縮スキームにおいて，ランダム化ハダマール変換はUniform Random Rotationと同等の性能を達成できる。
- ベクトル量子化においては，3つのランダム化ハダマール変換の組み合わせが有効であり，Uniform Random Rotationと同等の期待誤差となる。
Link: https://arxiv.org/abs/2605.06014
アルゴリズム認識のための抽象構文木パターン有効性の検証 [eess.SY, cs.SY, math.OC, cs.SE]目的：アルゴリズム認識における抽象構文木パターンの有効性
- ソフトウェアの保守・リエンジニアリングにおいて，コードの意図理解は不可欠である。
- 既存手法は使い勝手やスケーラビリティに課題があり，精度評価も十分でない。
- 抽象構文木パターンを利用し，効率的かつ高精度なアルゴリズム認識を目指す。
- 提案手法は，BigCloneEvalベンチマークにおいて平均F1スコア0.74を達成した。
- これは，大規模言語モデルCodellama（F1スコア0.35）を上回る性能である。
- また，コードクローン検出ツールとの比較では，再現率0.62を達成し，最良ツール（0.20）を上回った。
Link: https://arxiv.org/abs/2605.06098
逆ガウスチャネルの識別能力 [cs.IT, math.IT]目的：逆ガウスチャネルの識別容量
- 分子通信は，生体環境などでの情報伝達に有効であり，その理論的基盤の確立が重要である。
- 流体環境における分子通信のチャネル容量は未だ十分には解明されていない。
- ピーク時間制約下での決定論的符号化方式における識別容量の上界と下界を明らかにすること。
- 逆ガウスチャネルの識別容量は，特定の条件下において，符号長$n$に対して指数関数的に増加する。
- この増加率は，$2^{(n \log n)R}$で表され，$R$は符号化レートである。
- この結果は，分子通信における情報伝達能力を評価する上で重要な知見を提供する。
Link: https://arxiv.org/abs/2605.06103
ランダム化学習増強型オンライン入札のパレート最適解 [cs.DS]目的：ランダム化学習増強型オンライン入札における最適な整合性
- オンライン入札は，リソース配分や階層的クラスタリングなど，オンライン意思決定問題の基盤技術である。
- 既存研究では，整合性とロバスト性の関係にギャップが存在し，最適な戦略設計が困難であった。
- 整合性とロバスト性の関係を明確化し，ランダム化入札戦略の理論的根拠を提供する。
- ロバスト性Rが2.885以上の場合，最適な整合性Cの上界と下界が一致し，理論的なギャップが解消された。
- 入札関数という新たな抽象化を導入し，ランダム化入札戦略の設計と解析を統一的に行う枠組みを確立した。
- 提案手法をインクリメンタル中央値問題に適用し，クラスタリングの実用的な設定における有効性を示した。
Link: https://arxiv.org/abs/2605.06106
スケジュールと較正：コードLLMのためのユーティリティ誘導型マルチタスク強化学習 [cs.SE, cs.AI]目的：コードLLMに対するマルチタスク強化学習による性能向上
- コード生成AIの性能向上は，ソフトウェア開発の効率化に不可欠である。
- 既存のマルチタスク学習法は，タスク間の違いを考慮せず，最適化戦略が固定されている。
- タスクの有用性を考慮した学習スケジュールと最適化により，マルチタスク学習の限界を克服する。
- 提案手法ASTORは，タスクの学習可能性と相乗効果を示す「タスクユーティリティ」に基づき，データスケジュールとポリシー最適化を行う。
- 実験の結果，ASTORは既存の専門モデルを9.0%-9.5%上回り，最良のマルチタスク学習ベースラインを7.5%-12.8%上回る性能を示した。
- ASTORは，単一のモデルで全てのタスクにおいて性能を向上させることを実証した。
Link: https://arxiv.org/abs/2605.06111
破壊，陳腐化，欠落？プロジェクトレベルのテスト進化におけるコーディングエージェントのベンチマーク [cs.SE]目的：プロジェクトレベルでのテスト進化のベンチマーク
- ソフトウェアの品質保証において，テストは不可欠であり，コード変更への追従が求められる。
- 既存のベンチマークはメソッドレベルに留まり，テストの特定や新規テストの作成を考慮していない。
- プロジェクト全体のテストスイート進化を自動化し，効果的なテスト維持を目指す。
- TEBenchは，Defects4Jプロジェクトを基に，314のタスクインスタンスを構築した。
- エージェントのテスト識別F1スコアは45.7%～49.4%で収束し，フレームワークやベースモデルに依存しない性能上限が示された。
- 陳腐化したテストの識別が最も困難で，F1スコアは約36%に留まり，実行失敗信号に頼る傾向が示された。
Link: https://arxiv.org/abs/2605.06125
BUILD-AND-FIND：エージェント管理コードベースを評価するための努力量に応じたプロトコル [cs.CL, cs.SE, cs.AI]目的：エージェント管理コードベースから意図された選択をダウンストリームエージェントがどの程度回復できるか，そしてその回復にどの程度の調査が必要かを評価すること
- 近年のエージェント技術の発展により，コードリポジトリ全体のエンジニアリングをエージェントが管理するケースが増加している。
- 生成されたコードが動作的に正しいだけでなく，将来の作業のためのコミュニケーション手段としての役割も担うため，意図された設計が明確に表現されていることが重要である。
- 生成されたコードベースから意図された選択をダウンストリームエージェントがどの程度容易に回復できるかを定量的に評価し，コードの可読性向上に貢献すること。
- BUILD-AND-FINDプロトコルは，行動的正確性と，コードベースからの意図された選択の回復を分離して評価する。
- 回復の正確性と再現性が確実である場合にのみ，調査の努力量が考慮され，より少ない努力で回復できるコードベースほど，意図が理解しやすいと判断される。
- 高優先タスクパックの評価では，回復の正確性はほぼ飽和しており，調査の努力量とファインダー固有の効果が主な比較項目となっている。
Link: https://arxiv.org/abs/2605.06136
精度を超えて：LLM安全ジャッジの信頼性テストとしてのポリシー不変性 [cs.AI, cs.SE]目的：LLM安全ジャッジの信頼性評価
- エージェントの安全性確保は重要であり，自動評価手法の信頼性が不可欠である。
- 既存の評価指標は，LLMジャッジの判断を絶対視し，その妥当性を検証していない。
- LLMジャッジがポリシーに依存せず，エージェントの行動のみに基づいて判断できるか検証する。
- LLM安全ジャッジは，評価ポリシーの表現方法に影響を受けやすく，エージェントの行動と区別できない場合がある。
- ポリシーのわずかな変更（意味の変更なし）で，最大9.1%の判定が覆ることが示された。
- ポリシー不変性スコアとジャッジカードを提案し，既存の評価指標では見過ごされるジャッジの信頼性差を可視化した。
Link: https://arxiv.org/abs/2605.06161
メンテナンス活動の変化がPyPIネットワークの生態系に与える影響の依存性伝播モデリング：サポート戦略の評価 [cs.SE]目的：PyPI生態系におけるメンテナンス活動の変化が全体に与える影響の伝播を捉える依存性に基づいた生態系影響モデル
- オープンソースソフトウェアの生態系は重要であり，その健全性はソフトウェア開発全体に大きな影響を与える。
- 既存のサポートメカニズムは，生態系レベルの影響を考慮しておらず，効果的なサポート決定が困難である。
- 依存性伝播モデルを用いて，生態系への影響が大きいパッケージを特定し，優先的にサポートすること。
- 依存性伝播の影響に基づく優先順位付けでは，PyPIパッケージ全体の0.1%がモデル化された生態系影響の約80%を占める。
- 既存のサポートセットは，生態系影響との整合性が大きく異なることが明らかになった。
- 生態系影響，社会的フットプリント，運用可能性は，生態系サポートの異なる側面を表している。
Link: https://arxiv.org/abs/2605.06164
楕円関数体を用いた可用性を持つ局所修復符号 [eess.SY, cs.SY, cs.IT, math.IT]目的：楕円関数体を用いた局所修復符号の構成
- 大規模分散クラウドストレージなどの現代システムにおいて，データ信頼性の確保が重要である。
- 既存の局所修復符号は，符号長や修復性能に制約がある場合がある。
- 楕円関数体を利用し，より効率的で柔軟な局所修復符号を構築することを目指す。
- 本研究では，豊富な有理点を持つ通常の楕円曲線を用いて，最適な局所修復符号を新たに構築した。
- これにより，符号長が$O(q+2\sqrt{q})$で，柔軟な局所性を備えた$q$進の最適な局所修復符号が得られた。
- また，楕円関数体の自己同型群を用いたフレームワークにより，2つの復元集合を持つ局所修復符号の構成を可能にした。
Link: https://arxiv.org/abs/2605.06182
シンボリック実行トレースによるLLMへのプログラム意味論の教授 [cs.SE, cs.LG, cs.PL]目的：LLMのプログラム意味論理解度向上
- LLMの能力向上は，安全で信頼性の高いソフトウェア開発に不可欠である。
- LLMはプログラムの特性確認は得意だが，違反検出性能に課題がある。
- プログラム違反検出性能の向上を目指す。
- LLMにシンボリック実行トレースで学習させることで，違反検出精度を大幅に改善した。
- 約3,000件のバグトレースと推論時の思考連鎖を組み合わせることで，精度が17%以上向上した。
- 8Bモデルは，4倍大きな32Bモデルを凌駕し，全体的な精度でも匹敵する性能を示した。
Link: https://arxiv.org/abs/2605.06184
SiblingRepair：大規模言語モデルを用いた兄弟箇所に基づく複数箇所修正 [cs.SE]目的：関連機能の実装箇所における類似の誤りを特定し，一貫性のある修正
- ソフトウェアの品質向上には，プログラムの自動修正が不可欠であり，効率的な修正技術が求められている。
- 既存の自動修正技術は，修正対象の特定や修正パッチの生成に制約があり，汎用性に欠ける場合がある。
- 大規模言語モデルを活用し，より柔軟で効率的な兄弟箇所に基づく複数箇所修正を実現する。
- SiblingRepairは，既存の最先端技術であるHerculesと比較して，大幅な性能向上を示した。
- トークンと埋め込みを用いたコードマッチングにより，テストカバレッジやコミット履歴に依存せずに兄弟箇所を効果的に検出できる。
- 同時修正と反復修正という2つの戦略を組み合わせることで，一貫性のある修正パッチを生成する。
Link: https://arxiv.org/abs/2605.06209
限界における対照的な識別と生成 [cs.LG, cs.AI, cs.CL, cs.DS]目的：対照的なデータからターゲット仮説を識別・生成すること
- 機械学習において，限られたデータから仮説を学習する枠組みは重要である。
- 従来の学習方法は，個々のラベルに焦点を当てており，関係性を持つデータへの対応が課題であった。
- 関係性のあるデータから仮説を効率的に学習する手法を確立することを目指す。
- 対照的な識別可能なクラスの正確な特徴付けと，対照的なクロージャー次元を定義した。
- 均一な対照的な生成のサンプル複雑度を正確に評価し，識別と生成の相互比較可能な階層構造を明らかにした。
- 有限の敵対的破損下で，対照的なペアからの識別と正例からの識別が異なることを示した。
Link: https://arxiv.org/abs/2605.06211
QBFに対する両側木幅：戦略と分解の関係 [cs.DS, cs.CC]目的：QBFの固定パラメータ計算可能性
- グラフの木構造に近い度合いを示す木幅は，様々な問題の複雑さを評価する上で重要である。
- QBFは木幅が定数であってもPSPACE完全であり，効率的な解法が難しい。
- 戦略と分解を統合した新しいパラメータ「両側木幅」を用いてQBFの効率的な解法を確立する。
- 本研究では，戦略とQ分解を同時に可能にする新しい分解パラメータ「両側木幅」に関して，QBFの固定パラメータ計算可能性を証明した。
- 両側木幅は，既存の戦略ベースと分解ベースの手法を統合し，より強力なパラメータとなる。
- この結果は，QBFのパラメータ計算可能性の分野において，新たな知見を提供する。
Link: https://arxiv.org/abs/2605.06262