arXiv雑要約

プログラム - 2025/10/14 公開

Hound：セキュリティ監査における複雑系推論のための関係優先知識グラフ [cs.CR, cs.AI, cs.LG, cs.PL]目的：複雑なコードベースにおける関連コンポーネント間のシステムレベル推論の改善
- システムセキュリティの重要性が増す中，コードベース全体の構造理解が不可欠である。
- 従来の解析手法では，コードベースの複雑さからシステム全体の脆弱性特定が困難である。
- 関係性を重視した知識グラフを用いて，システム構造の理解と脆弱性仮説の検証を効率化する。
- Houndは，関係優先知識グラフエンジンにより，ベースラインLLM解析器と比較して，リコールとF1スコアを向上させた (リコール31.2% vs 8.3%, F1 14.2% vs 9.8%)。
- 柔軟な関係優先グラフが，モデルの理解範囲をコール/データフローを超えた抽象的な側面まで拡張し，仮説を中心としたループが貢献した。
- アナリスト定義の柔軟な視点と，長期的な脆弱性仮説に基づく確信度更新が，システムレベル推論を可能にしている。
Link: https://arxiv.org/abs/2510.09633
大規模言語モデルによるコード生成の堅牢化：セキュアコーディング実践に基づくグラフ構造による推論 [cs.CR, cs.AI, cs.SE]目的：セキュアコーディング実践に基づいたグラフ構造による推論
- ソフトウェア開発におけるLLM活用が拡大する中，その安全性確保は喫緊の課題である。
- LLM生成コードの脆弱性は依然多く，既存手法はリソース消費や未知の脆弱性への対応が難しい。
- セキュアコーディング実践をグラフ化し，推論を通じてLLMのコード生成を導くことで，脆弱性を低減する。
- GRASPは，セキュアコーディング実践をDAG（有向非巡回グラフ）として構造化することで，LLMの推論を支援する。
- 複数のLLMにおいて，GRASPは80%を超えるセキュリティ達成率を示し，未知の脆弱性に対して最大88%の改善を達成した。
- 本手法は，解釈可能性が高く，モデルに依存せず，スケーラブルなセキュリティ向上を可能にする。
Link: https://arxiv.org/abs/2510.09682
LLMを活用したエージェントシステムに関するソフトウェア工学のベンチマークとソリューションの包括的調査 [cs.SE, cs.CL]目的：LLMを活用したエージェントシステムのソフトウェア工学におけるベンチマークとソリューションの関連性に関する理解
- 近年，LLMの進化がソフトウェア工学に革新をもたらしており，その発展はソフトウェア開発の効率化に不可欠である。
- ベンチマークとソリューションの関連性が明確でなく，体系的な進捗や評価が困難になっている。
- LLMを活用したソフトウェア工学における評価とソリューションアプローチの間のギャップを埋めることを目指す。
- 本調査では，150以上の論文を分析し，プロンプトベース，ファインチューニングベース，エージェントベースのパラダイムを含むソリューションを網羅的に分類した。
- コード生成，翻訳，修正などのタスクをカバーするベンチマークと，それに対応するソリューション戦略を50以上関連付け，包括的なパイプラインを提示した。
- マルチエージェントコラボレーションフレームワークや，形式検証とLLMベースの手法の統合など，将来の研究方向性についても提言した。
Link: https://arxiv.org/abs/2510.09721
InteractScience：インタラクティブな科学デモンストレーションコード生成のプログラム的・視覚的評価 [cs.SE, cs.AI]目的：インタラクティブな科学デモンストレーションコード生成能力の評価
- 科学教育や研究において，概念説明や新たな教育手法，研究成果の提示にインタラクティブなデモンストレーションは不可欠である。
- 既存のベンチマークは，科学知識の評価とインタラクティブなフロントエンドコード生成を統合的に評価できていない。
- 科学知識とインタラクティブなフロントエンドコード生成を統合的に評価できるベンチマークを構築すること。
- InteractScienceは，5つの科学分野にわたる質問と，それに対応するユニットテスト，参照スナップショット，チェックリストで構成される。
- 30のLLMを評価した結果，ドメイン知識とインタラクティブなフロントエンドコーディングの統合に課題が残ることが示された。
- InteractScienceは，現実的なインタラクティブな操作を用いた能力を自動的に測定する初のベンチマークとして，科学分野におけるコード生成研究を促進する基盤となる。
Link: https://arxiv.org/abs/2510.09724
Herb.jl：統一的なプログラム合成ライブラリ [cs.PL, cs.AI, cs.SE]目的：プログラム合成手法の再利用と拡張の容易化
- AI研究における基盤技術であり，プログラミングの自動化に貢献する
- 既存の手法は再利用が難しく，開発に時間と労力を要する
- プログラム合成の基本的な構成要素をモジュール化し，再利用性を高める
- Herb.jlは，プログラム合成アルゴリズムを拡張可能なサブコンポーネントに分割することで，手法の再利用を容易にする。
- 簡単な問題と文法の定義，既存の合成器の実装，ベンチマークテストの実行例を示すことで，Herb.jlの利点を実証する。
- Julia言語で実装されており，柔軟性と拡張性に優れている。
Link: https://arxiv.org/abs/2510.09726
推論の幾何学：表現空間における論理の流れ [cs.AI, cs.CL, cs.LG, cs.LO]目的：大規模言語モデルにおける推論過程の幾何学的モデリング
- AIの発展において，推論能力の解明は不可欠であり，人間レベルの知能実現への鍵となる。
- 大規模言語モデルの推論メカニズムはブラックボックスであり，その過程を理解することが困難である。
- 表現空間における推論の流れを幾何学的に捉え，推論過程の解釈可能性を高めることを目指す。
- 大規模言語モデルの推論は，表現空間における滑らかな流れとしてモデル化できることが示された。
- 論理的文は，これらの流れの速度を局所的に制御する役割を果たすことが明らかになった。
- 本研究は，大規模言語モデルの推論現象を研究するための概念的基盤および実践的ツールを提供する。
Link: https://arxiv.org/abs/2510.09782
部分的に重複する特徴空間における分散クラスタリング [cs.DS, cs.DC, cs.LG]目的：部分的に重複する特徴空間における分散クラスタリング問題
- 医療分野など，複数の機関が類似データを持つ場合に重要となる分散データ処理の基盤技術。
- 各機関が持つ特徴空間が異なるため，単純な集約によるクラスタリングが困難であるという課題。
- 各機関のデータを活用しつつ，データプライバシーを保護した分散クラスタリング手法の確立。
- 提案手法は，グローバルなセントロイドを共同更新する連合学習アルゴリズムと，統計的パラメータを共有するワンショットアルゴリズムの2種類で構成される。
- シミュレーションにより，提案アルゴリズムが集中型解に収束する条件が明らかになった。
- 公開データセットを用いた実験により，提案手法の有効性が実証された。
Link: https://arxiv.org/abs/2510.09799
IECZ-III：サイズ認識不変量を用いた強固な縮約リフト [cs.CC, cs.IT, math.IT]目的：ガジェットリフトを通じた構造伝達のための，コンパクトかつサイズ認識に基づく設計図
- 計算複雑性理論において，効率的なデータ処理の限界を理解することは重要である。
- 既存の構造伝達手法では，計算コストや情報の損失が課題となっていた。
- サイズ認識不変量を用いることで，効率的かつ正確な構造伝達を実現することを目指す。
- 本研究では，累積mod-$q$フーリエ質量とノイズ安定性という2つの低次の不変量を再利用可能な「プロファイル」として扱う。
- 座標置換の下でプロファイルは正確に保持され，ファンインが制限される条件下では次数予算が最大で$+\Delta k$だけ緩和される。
- 本フレームワークは，単調コスト（消去複雑度，EC）とサイズ認識$\mathrm{AC}^0{+}\log$に対する相関への「エコー」に対して分布下界を提供する。
Link: https://arxiv.org/abs/2510.09808
分解ネットワーク：深層成分分析と合成 [cs.LG, cs.CV, cs.IT, cs.NE, math.IT]目的：入力の解釈可能な成分への分解
- データ表現の効率化と解釈性が重要視されている。
- 従来のオートエンコーダでは，潜在表現がブラックボックス化しやすい。
- 成分間の競合を促し，意味のある疎な表現を獲得すること。
- DecompNetは，複数の並列ブランチを持つセマンティックオートエンコーダである。
- 各ブランチは，他のブランチの再構成を引いた残差入力を担当する。
- Gauss-Seidel法を微分可能なネットワークに展開し，成分間の明示的な競合を促す。
Link: https://arxiv.org/abs/2510.09825
エージェント特性に基づくテスト：Pythonエコシステムにおけるバグ検出 [cs.SE, cs.AI]目的：Pythonエコシステムにおけるバグ検出のためのLLMベースのエージェント
- ソフトウェアの信頼性確保は重要であり，テストは不可欠なプロセスである。
- 従来のテスト手法では，網羅的なテストケースの作成が困難な場合がある。
- LLMとプロパティベーステストを組み合わせ，自律的にバグを検出する。
- 提案手法は，100のPythonパッケージに対して広範な評価を実施し，生成されたバグ報告の56%が有効なバグであることが確認された。
- 上位21件のバグのうち，86%が有効であり，81%はメンテナに報告する価値があると判断された。
- NumPyなどの人気パッケージに対して5件のバグを報告し，そのうち4件のパッチがマージされた。
Link: https://arxiv.org/abs/2510.09907
テンソルアクセラレータISA記述からの自動コンパイラバックエンド生成 [cs.PL, cs.AR]目的：テンソルアクセラレータのISA記述からコンパイラバックエンドの自動生成
- 深層学習の高性能化には，テンソルコンパイラの役割が重要である。
- 新規アクセラレータはコンパイラバックエンドが不足しており，開発が困難である。
- アクセラレータ設計の迅速な反復を可能にする，柔軟なバックエンド構築を目指す。
- ACTは，ISA記述のみからテンソルアクセラレータ用のコンパイラバックエンドを自動生成する。
- ACTが生成したバックエンドは，手動最適化されたカーネルライブラリと同等かそれ以上の性能を示す。
- コンパイルオーバーヘッドを低く抑えつつ，音性と完全性が保証されたバックエンドを生成可能である。
Link: https://arxiv.org/abs/2510.09932
浮動小数点エラーの原精度算術による修復：OFP-Repair [cs.SE]目的：浮動小数点プログラムのエラー修復手法
- 浮動小数点演算は，軍事，航空宇宙，金融システム等の重要分野で利用され，正確性が不可欠である。
- エラーの種類に応じた適切な修復方法の選択が困難であり，高精度計算の必要性が判断しにくい。
- 原精度算術で修復可能なエラーと高精度計算が必要なエラーを区別し，効率的な修復を可能にすること。
- OFP-Repairは，4つの精度指標において，3～8桁の改善を達成した。
- 実世界のケースにおいて，原精度で修復可能なエラーを全て検出し，3つのエラーを修正することに成功した。
- GNU Scientific Library (GSL) の15個のバグのうち，5個を修復し，開発者からの導入検討の意向を得ている。
Link: https://arxiv.org/abs/2510.09938
帯域効率の良いエッジクラウド推測デコードのための共形疎化 [cs.LG, cs.AI, cs.IT, math.IT]目的：エッジクラウド推測デコードにおける帯域幅効率の改善
- 推論処理の高速化が求められる現代において，エッジコンピューティングとクラウドコンピューティングの連携が重要である。
- エッジとクラウド間の帯域幅の制約が，推測デコードのボトルネックとなっている。
- トークン分布の効率的な圧縮により，エッジクラウド間の通信量を削減し，遅延を改善することを目指す。
- 提案手法であるSQS-SDフレームワークは，分布の疎性を活用することで，効率的な圧縮を実現する。
- K-SQSとC-SQSの2つのアプローチにより，異なる状況下でエンドツーエンドの遅延と拒否率を改善する。
- 共形予測を用いるC-SQSは，分布からの逸脱を抑制し，より安定した性能を示す。
Link: https://arxiv.org/abs/2510.09942
3要素および保守的ドメインにおけるモジュラ計数 [cs.LO]目的：制約充足問題における準同型の数
- 組合せ問題の多様なモデリングに応用されており，学際的に注目されている分野である。
- 一般的な関係構造への準同型のモジュラ計数に関する研究はまだ十分ではない。
- 3要素ドメインと保守的ドメインにおけるモジュラ計数の複雑さを調査し，問題をより小さなドメインに帰着させる方法を提案する。
- 本研究では，モジュラ計数問題をより小さなドメインに帰着させる新しい手法を開発した。
- 3要素ドメインおよび保守的ドメインにおけるモジュラ計数の複雑性を詳細に分析した。
- これらの結果は，モジュラ計数問題の効率的な解法開発に貢献すると期待される。
Link: https://arxiv.org/abs/2510.09950
AIの運用：MLOps実践，ユーザー満足度，組織コンテキストに関する実証的証拠 [cs.RO, cs.SE, cs.AI, cs.CL, cs.HC, cs.LG]目的：MLOps実践，ユーザー満足度，組織コンテキスト間の関係性
- AI活用は重要性を増しているが，規模拡張やチーム間の連携に課題が多い。
- MLOpsは解決策として提唱されているが，その有効性を実証する研究は不足している。
- 本研究は，MLOps実践がユーザー満足度に与える影響を明らかにすることを目指す。
- 9つのMLOps実践のうち7つがユーザー満足度と有意な正の相関を示した。
- 効果的なMLOpsの実装は，AI開発に具体的な価値をもたらすことが示唆された。
- 組織規模はMLOpsと満足度の関係を調整しないものの，組織コンテキストがMLOpsの普及に影響する。
Link: https://arxiv.org/abs/2510.09968
リモート干渉軽減のためのナル・プリコーディングとフラクショナルプログラミング [cs.CL, cs.IT, math.IT]目的：リモート干渉軽減策
- 5Gシステム普及により，大気ダクトを通じた遠隔からの干渉が深刻化しており，通信品質への影響が懸念される。
- 従来の技術では，大気ダクトによるリモート干渉を効果的に抑制できず，通信エリアの制約や性能低下が生じていた。
- 本研究は，リモート干渉の角度推定に基づき，ナル・プリコーディングとフラクショナルプログラミングを用いて干渉を軽減する。
- 提案手法により，これまで利用不可能だった低送信電力領域でのアップリンク通信が可能になった。
- チャネル推定における正規化平均二乗誤差が5.23dB低減された。
- 低送信電力条件下で，データレートが約5.8bit/s/Hzに達した。
Link: https://arxiv.org/abs/2510.09989
SLEAN：複数LLM連携のためのシンプル軽量アンサンブル解析ネットワーク：設計，実装，およびVibeコーディングバグ調査事例 [cs.SE, cs.AI]目的：複数LLMプロバイダー間の連携を通じた，テキストベースのプロンプトオーケストレーション
- AI技術の進化に伴い，複数LLMの活用が重要になっている。
- AIによるコード修正が，複雑性増加や機能破壊を引き起こす可能性がある。
- AI生成コードの有害な提案をフィルタリングし，安全なコード修正を可能にすること。
- SLEANは，複雑なシステムを必要とせず，シンプルなプロンプトブリッジとしてLLM間の連携を実現した。
- 15のソフトウェアバグに関する分析で，SLEANは有害な修正提案47件を拒否し，安全な修正提案22件を採用した。
- SLEANによる仲裁プロセスは，AI生成コードの変更量を83-90%削減し，最小限の変更による修正を促した。
Link: https://arxiv.org/abs/2510.10010
プログラムの安全性に関する検証済みコンパイルによるエンドツーエンドの合成的検証 [cs.CL, cs.PL]目的：プログラムの安全性のエンドツーエンドの合成的検証
- コンピュータシステムの正確な動作には，プログラムの安全性が不可欠である。
- Rustのような現代の安全なプログラミング言語では，エンドツーエンドの安全性を実現するのが困難である。
- モジュール間の安全性の概念を合成可能にし，検証済みコンパイルと検証的コンパイルの連携を実現すること。
- 本研究では，モジュール境界で合成可能な「オープン安全性」の定義を提案した。
- オープン安全性は，異種モジュールの安全性を個別に検証し，ターゲットレベルで結果を合成することを可能にする。
- Rustに触発されたOwlang言語のための検証済みコンパイラを開発し，合成的な安全性検証を評価した。
Link: https://arxiv.org/abs/2510.10015
組み合わせ哲学的不等式 [cs.CE, cs.DS]目的：オンライン組合せ割当における近似アルゴリズムの性能評価
- 資源配分は経済学，計算機科学において不可欠であり，効率的な割当メカニズムの設計が重要である。
- オフライン最適解に対する競争率は限界があり，オンライン最適解に対する近似アルゴリズムが求められている。
- サブモジュラー評価値を持つエージェントに対する近似比の向上と，XOS評価値を持つエージェントの限界を示す。
- サブモジュラー評価値を持つエージェントに対し，新たなオンライン構成LP緩和に対する$0.5 + \Omega(1)$近似アルゴリズムを確立した。
- XOS評価値を持つエージェントに対し，オンライン構成LPの$0.5$の積分ギャップを示すことで，既存アプローチの限界を明らかにした。
- 本研究は，ユニットデマンドやk-デマンドエージェントに対する正の結果を拡張し，組合せ割当設定における近似アルゴリズムの可能性を検討した。
Link: https://arxiv.org/abs/2510.10039
LLMを活用したスケッチングによるJavaScript難読化ツールのテスト [cs.SE, cs.AI, cs.PL]目的：JavaScript難読化ツールの正確性の評価
- 知的財産保護とリバースエンジニアリング対策として難読化は重要。
- 既存の評価は脱難読化耐性に偏り，プログラムの意味保持性が未検証。
- 難読化による機能変更やセキュリティ低下を防ぐためのテスト手法を確立。
- OBsmithはLLMと実プログラムからテストケースを生成する新しいフレームワーク。
- OBsmithは11個の難読化ツールの未発見のバグを特定。
- 従来のファジングツールでは検出できなかった難読化特有の誤動作を検出。
Link: https://arxiv.org/abs/2510.10066
数学的指針による浮動小数点数エラー検出手法 [cs.SE]目的：浮動小数点数プログラムにおけるエラー誘発入力の検出
- 浮動小数点演算は科学技術計算の根幹であり，その正確性は極めて重要である。
- エラー誘発入力の検出には計算コストが高く，効率的な探索が課題であった。
- ニュートン・ラフソン法を用いて，効率的かつ効果的なエラー誘発入力検出を目指す。
- 提案手法MGDEは，既存手法FPCCと比較して，検出されるバグの数が大幅に増加した。
- MGDEはFPCCの6.4倍以上の速度でバグ検出が可能であり，計算効率が向上した。
- 複数入力プログラムに対してもMGDEは有効であり，FPCCでは検出できなかったバグを検出した。
Link: https://arxiv.org/abs/2510.10081
IntrinTrans：RISC-Vベクトル向けのLLMベースの内在コード変換器 [cs.SE]目的：RISC-Vベクトル拡張への既存のベクトル化された内在コードの自動変換
- ハードウェア固有機能を活用する内在関数は，ライブラリ性能最適化の重要な手法である。
- RISC-Vベクトル拡張(RVV)のサポート需要が高まる中，手動変換の限界が課題となっている。
- LLMを活用し，コンパイル・テストフィードバックによる自動変換と性能最適化を目指す。
- LLMを活用した多エージェントアプローチにより，ほとんどの場合で意味的に正しいRVV内在コードが生成された。
- 限られた反復回数で変換が成功し，一部ケースではオープンソース実装を最大5.93倍上回る性能が確認された。
- レジスタ使用情報に基づいた最適化により，RVV固有の機能を十分に活用している。
Link: https://arxiv.org/abs/2510.10119
LLMからの証明戦略抽出による記号的証明器の強化 [cs.LO]目的：LLMの内部戦略の抽出と記号的証明器の能力向上
- ソフトウェア検証において，インタラクティブな定理証明は重要な手法である。自動化による効率化が求められている。
- LLMの利用はコストやセキュリティ上の懸念があり，従来の記号的アプローチの重要性は依然として高い。
- LLMの証明戦略を抽出し，記号的証明器に活用することで，両者の強みを組み合わせることを目指す。
- 提案手法Strat2Rocqは，LLMから証明戦略を抽出し，Rocqの補題として形式化することで，CoqHammerの証明能力を向上させる。
- LLMの証明過程を分析し，自然言語の証明から形式化された補題を生成する。エラー軽減のため，エージェント的なアプローチも採用。
- オープンソースのRocqプロジェクトにおいて，Strat2RocqはCoqHammerの成功率を13.41%向上させることを示した。
Link: https://arxiv.org/abs/2510.10131
大規模言語モデルを用いたWeb脆弱性PoC生成に関する体系的研究 [cs.SE]目的：Webアプリケーション脆弱性に対するPoC（概念実証）の自動生成
- ソフトウェアセキュリティにおいて，脆弱性の再現と理解，そして対策は不可欠であり，PoCはその重要な役割を担う。
- 既存研究は主にゼロデイ脆弱性に焦点を当てており，公開されたCVE情報活用によるPoC自動生成は未開拓の課題である。
- 公開情報のみを用いて，大規模言語モデルによるPoC自動生成の実現可能性と性能評価を目指す。
- GPT-4oとDeepSeek-R1を用いて100件の実世界CVEを評価した結果，公開データのみで8%〜34%の成功率でPoCを生成できた。
- DeepSeek-R1がGPT-4oを上回り，コードコンテキストの追加は成功率を17%〜20%向上させ，関数レベルのコンテキストがファイルレベルより優位性を示した。
- 適応的な推論戦略によるプロンプト改善により，成功率は68%〜72%に大幅に向上し，脆弱性攻撃の動態を変える可能性が示唆された。
Link: https://arxiv.org/abs/2510.10148
大規模言語モデルでMOJOのファジングを改善：LLMだけで十分か？ [cs.SE, cs.AI]目的：MOJO言語に対するLLMベースのファジングフレームワークの提案
- ソフトウェアの信頼性向上において，ファジングは重要な役割を担う。自動化による効率的なテスト入力生成が求められている。
- 新言語MOJOは高性能だが，テストフレームワークやLLMベースのテスト用コーパスが不足している。
- LLMによる文法的に正しいが意味的に誤ったコード生成を防ぎ，ファジングの有効性を高めることを目指す。
- 提案手法MOJOFuzzerは，実行前に低品質な入力を排除することでテストケースの妥当性を大幅に向上させる。
- MOJOFuzzerは実行時フィードバックに基づきLLMプロンプトを動的に適応させ，反復学習によるファジング効率とバグ検出能力を高める。
- 実験結果から，MOJOFuzzerは従来のファジングや最先端のLLMベースのファジング手法を上回り，13個の未知のバグを発見した。
Link: https://arxiv.org/abs/2510.10179
時間的計画問題の非解可能性の厳密な証明 [cs.LO, cs.AI]目的：時間的計画問題における非解可能性の証明
- 自動計画はAIの基盤技術であり，ロボットや自動化システムに不可欠である。
- 計画問題が解けない場合，その証明には高い信頼性が求められる。
- 形式的な検証を用いて，非解可能な計画問題の証明を信頼性高く行う。
- 計画問題をtimed automataのネットワークに変換し，モデルチェッカと証明チェッカを用いる。
- エンコーディングの形式検証にはIsabelle/HOLを使用し，証明の信頼性を高めている。
- 既存の形式検証済み証明チェッカを利用することで，モデルチェッカの結果を保証する。
Link: https://arxiv.org/abs/2510.10189
セルラーネットワークにおける再構成可能知能表面のデータ駆動型展開 [cs.IT, math.IT]目的：セルラーネットワークにおける再構成可能知能表面の展開最適化
- 無線通信において，電波環境の改善は通信品質向上に不可欠である。
- 都市部では電波の反射や回折が多く，均一な電波到達が困難である。
- 電波環境の最適化による，カバレッジ向上とインフラコスト削減を目指す。
- 本研究では，物理的に整合性の取れたレイ tracing と実測データを活用し，RIS の配置，向き，設定，基地局ビームフォーミングを同時に最適化する。
- RIS を高密度に展開することで有意なカバレッジ改善が期待される一方，コスト効率に関する課題が示唆された。
- シミュレーションフレームワークと展開アルゴリズムはオープンソースソフトウェアとして公開され，今後の研究を促進する。
Link: https://arxiv.org/abs/2510.10190
LOOPerSet：データ駆動型ポリヘドラルコンパイラ最適化のための大規模データセット [cs.CL, cs.PL, cs.LG, cs.PF]目的：データ駆動型ポリヘドラルコンパイラ最適化のための大規模データセット
- コンパイラ最適化は，計算資源を効率的に活用し，高性能なソフトウェアを実現するために不可欠である。
- 機械学習を活用したコンパイラ最適化は，大規模な性能データセットの不足が課題となっている。
- 学習コストの削減と再現性のある研究を促進するため，大規模で多様なデータセットの提供を目指す。
- LOOPerSetは，22万個のポリヘドラルプログラムから生成された2800万個のラベル付きデータポイントを含む公開データセットである。
- 各データポイントは，プログラムと変換シーケンスを，実行時間という性能測定値にマッピングしている。
- LOOPerSetは，コストモデルの学習，新しいモデルアーキテクチャのベンチマーク，自動スケジューリングの探求に役立つ。
Link: https://arxiv.org/abs/2510.10209
タイプ導出を用いたコード生成における型正当性の保証学習 [eess.SY, cs.SY, cs.PL, cs.AI, cs.SE]目的：コード生成における型正当性の保証
- 近年，大規模言語モデルによるコード生成が注目されているが，型安全性は重要な課題である。
- 従来の制約付きデコーディングでは型エラーを減らせるが，モデル自身が型推論を学習しない点が課題である。
- 型システムをモデル内部に組み込み，型推論能力を向上させることでコード生成の性能改善を目指す。
- TyFlowは，型導出木とプログラム合成導出木を対応付け，合成決定シーケンスに基づく新たなコード表現を導入した。
- この手法により，モデルは型システムの学習負荷を軽減し，高水準のプログラム意味論に集中できるようになった。
- 実験の結果，TyFlowは型エラーを解消し，機能的な正当性も大幅に向上させた。
Link: https://arxiv.org/abs/2510.10216
古きは新なり：Exgen-Mallocによるシングルスレッドアプリケーションの最適化 [cs.PL]目的：シングルスレッドアプリケーション向けメモリ割当器の最適化
- データセンターの電力消費量は増加の一途をたどっており，効率的なメモリ管理が不可欠である。
- 既存のメモリ割当器はマルチスレッド環境に最適化されており，シングルスレッド環境では過剰なオーバーヘッドが発生する。
- シングルスレッド環境に特化したメモリ割当器を開発し，効率性とメモリ使用量の削減を目指す。
- Exgen-Mallocは，既存のdlmallocと比較して，SPEC CPU2017，redis-benchmark，mimalloc-benchにおいて，それぞれ1.17倍，1.10倍，1.93倍の高速化を達成した。
- Exgen-Mallocは，SPEC CPU2017，redis-benchmark，mimalloc-benchにおいて，それぞれ6.2%，0.1%，25.2%のメモリ節約を達成した。
- Exgen-Mallocは，シングルスレッド環境において，現代的なマルチスレッド割当器のデザインを取り入れ，パフォーマンスとメモリ効率を向上させている。
Link: https://arxiv.org/abs/2510.10219
制約付き長さを考慮した展開分解 [cs.CL, cs.IR, cs.AR, cs.DS]目的：制約付き長さ展開分解の存在性
- グラフ理論は，ネットワークの設計や分析において重要な役割を果たす。
- 従来の展開分解は，分解のサイズが大きくなるという課題があった。
- 展開分解のサイズを改善し，より効率的なグラフアルゴリズムを実現すること。
- 本研究では，既存の結果よりも改善されたサイズの $(h, s)$-長さ $\phi$-展開分解の存在を示す簡潔な証明を提示した。
- 証明は，疎な長さ制約付きカットの和集合がそれ自身疎な長さ制約付きカットであるという事実の直接的な応用である。
- 疎な長さ制約付きカットの和集合をとる際のスパース性の損失を改善し，$s\cdot n^{O(1/s)}$ を達成した。
Link: https://arxiv.org/abs/2510.10227
コードレビューのための基盤AI：エンタープライズパイプラインにおけるリソース効率の高い大規模モデル提供 [eess.SY, cs.SY, q-bio.NC, cs.SE, cs.LG]目的：コンプライアンスが重視される環境における自動コードレビューの導入促進
- 高品質なソフトウェア開発において，コードレビューはバグの早期発見と品質向上に不可欠である。
- 静的解析ツールは大量の指摘を出すが，その根拠が不明確な場合が多く，LLMの幻覚やコストも課題である。
- 静的解析とASTを活用し，低コストで根拠のあるコードレビューを実現すること。
- 提案手法は，安全重視のC/C++標準において，高速なフィードバック（中央値59.8秒）を実現した。
- 大規模な独自モデルと比較して，違反削減率や違反発生率において遜色ない性能を示した。
- 小規模な調査の結果，提案手法はトリアージ作業の削減と，レビューの根拠に対する理解促進に貢献する可能性が示唆された。
Link: https://arxiv.org/abs/2510.10290
アルゴリズム的制御器 [cs.CC, cs.AI, cs.IT, cs.SY, eess.SY, math.IT, q-bio.NC]目的：出力のアルゴリズム複雑度の削減を通じた制御器の性能評価
- 制御理論は，システムの安定性や効率的な動作を実現するために不可欠である。
- 従来の制御理論では，システムの内部モデルの重要性が認識されているが，厳密な証明が不足していた。
- アルゴリズム情報理論を用いて，制御器が世界モデルを内包することの必要性を定量的に示す。
- 制御器が良いアルゴリズム的制御器である場合，出力のアルゴリズム複雑度が低減されることが示された。
- 複雑度の差が大きいほど，相互アルゴリズム情報量の高い世界と制御器のペアが有利になる。
- この枠組みは，制御器が読み出しの条件付き記述長を最小化するように動作すると示唆している。
Link: https://arxiv.org/abs/2510.10300
差分プライバシーに関する情報理論的考察 [cs.SI, cs.CE, eess.SY, cs.SY, cs.CY, cs.IT, cs.CR, math.IT, math.ST, stat.TH]目的：差分プライバシーの理論的根拠の整理
- 個人情報保護は重要であり，そのための技術的基盤が求められている。
- データ公開時のプライバシーリスクの定量化が困難であった。
- 情報理論の視点から差分プライバシーの保証を明確化する。
- 差分プライバシーは，確率分布の差を評価することでリスクを測定する。
- 差分プライバシーアルゴリズムは，データから出力への情報伝達路と捉えることができる。
- 情報理論的な指標が，差分プライバシーの保証に重要な役割を果たすことが示された。
Link: https://arxiv.org/abs/2510.10316
未知への備え：データ変化へのAIOpsキャパシティ予測モデルの適応 [cs.SE, cs.AI]目的：AIOpsにおけるキャパシティ予測モデルのデータ変化への適応戦略
- ソフトウェア組織において，リソースの効率的な配分と運用需要への対応は不可欠である。
- 予測モデルの精度維持には継続的な再学習が必要だが，そのコストとスケーラビリティが課題となる。
- データ変化を検知した際の再学習が，精度と効率のバランス改善に寄与するかを検証する。
- ドリフトベースの再学習は，多くのケースで定期的な再学習と同等の予測精度を達成し，コスト効率が良い。
- データが急速に変化する場合には，予測精度を最大化するためには定期的な再学習が依然として有効である。
- これらの知見は，再学習オーバーヘッドを削減しつつ，堅牢な性能を維持するためのAIOpsシステム改善に役立つ。
Link: https://arxiv.org/abs/2510.10320
ソフトウェア脆弱性検出のためのハイブリッドネットワークモデルによる意味と構造の架け橋 [cs.SE, cs.AI, cs.CR]目的：ソフトウェア脆弱性検出手法
- ソフトウェアの安全性確保は重要であり，脆弱性検出は不可欠な課題である。
- 従来の静的・動的解析では，脆弱性に影響する構造的な依存関係を見落とす場合がある。
- 本研究は，構造と意味の両方を考慮した新たな脆弱性検出アプローチを提案する。
- 提案手法は，Javaの脆弱性検出において93.57%の精度を達成した。
- これは，Graph Attention Networkベースの手法や大規模言語モデルと比較して大幅な改善である。
- また，重要なサブグラフの抽出と自然言語による説明により，解釈可能性も向上している。
Link: https://arxiv.org/abs/2510.10321
PrediQL：LLMを用いたGraphQL APIの自動テスト [cs.CR, cs.SE]目的：GraphQL APIに対する自動テスト手法
- APIの安全性確保は不可欠であり，脆弱性の早期発見が重要である。
- GraphQLの柔軟性ゆえに，既存のテストツールでは複雑な脆弱性を検出しにくい。
- LLMを活用し，GraphQL APIの効率的かつ効果的なテストを実現する。
- PrediQLは，LLMと検索技術を組み合わせた新しいファジング手法である。
- 従来のファジング手法と比較して，高いカバレッジと脆弱性検出率を達成した。
- APIセキュリティテストを，受動的な列挙から知的な探索へと変革する可能性を示す。
Link: https://arxiv.org/abs/2510.10407
コード安全解析のためのトレースベースアプローチ [cs.PL, cs.SE]目的：Rustにおけるコードの安全性確保
- メモリ安全性が重要視される現代において，プログラミング言語の安全性が不可欠である。
- Rustにはunsafeコードが存在し，それが潜在的な脆弱性となり得る。
- Rustのunsafeコードに関する体系的な理解と，安全なカプセル化を実現するための指針を提供する。
- Rustの安全設計をレビューし，実際のプロジェクトを分析することで，unsafeコードと未定義動作に関するフレームワークを確立した。
- Rustコードの健全性基準をまとめ，安全なカプセル化を達成するための具体的な指針を導き出した。
Link: https://arxiv.org/abs/2510.10410
普遍グレブナー基を用いた量子耐性暗号 [cs.IT, math.AC, math.CO, math.IT]目的：量子攻撃に耐性のある鍵確立プロトコルの提案
- 現代社会において，情報セキュリティの重要性は増大の一途を辿っている。
- 既存の公開鍵暗号は，量子コンピュータの出現により解読リスクが高まっている。
- 量子コンピュータによる攻撃に耐性を持つ新たな暗号方式の確立を目指す。
- 本研究では，多項式イデアルの普遍グレブナー基を秘密鍵として利用する鍵確立プロトコルを提案した。
- 暗号化と復号に必要な計算量の差を利用することで，量子攻撃に対する耐性を実現している。
- グラフのトリックイデアルに対する普遍グレブナー基の効率的な再帰的生成手法も提示した。
Link: https://arxiv.org/abs/2510.10429
最適サイズを持つ明示的なMin-wiseハッシュ族 [cs.DS, cs.DM]目的：Min-wiseハッシュ族および$k$-Min-wiseハッシュ族の明示的な構成
- Min-wiseハッシュは，スキミング，Webページ検出，$\ell_0$サンプリングなど，計算機科学の多くの分野で広く利用されている。
- 従来の構成は，比較的多くのランダムビットを必要とし，サブ定数誤差を実現していなかった。
- 本研究は，最適サイズのランダムビット数でサブ定数誤差を達成する明示的なMin-wiseハッシュ族の構築を目指す。
- 本研究では，$O(k\log N)$ビットと$2^{-O(\log N/\log\log N)}$の誤差を持つ明示的な$k$-Min-wiseハッシュ族を初めて提示した。
- これは，任意の$k=\log^{O(1)}N$に対して，$O(k \log N)$ビットという制約下で，既存の結果を改善するものである。
- 古典的なNisan-Zuckerman擬似乱数生成器をMin-wiseハッシュを欺くように適応させるためのいくつかの新しいアイデアが用いられている。
Link: https://arxiv.org/abs/2510.10431
マルチエージェントシステムによる堅牢なコード生成のテストと強化 [cs.SE, cs.AI]目的：マルチエージェントシステムによるコード生成の堅牢性評価と改善
- コード生成自動化はソフトウェア開発の効率化に不可欠であり，その重要性は増している。
- 既存のマルチエージェントシステムは性能が向上する一方，現実環境での堅牢性が検証されていない。
- マルチエージェントシステムにおける脆弱性を特定し，その堅牢性を高めるための手法を開発する。
- ファジングテストの結果，主要なマルチエージェントシステムの7.9%-83.3%が，わずかな変更で解決できなくなることが判明した。
- 計画立案エージェントとコーディングエージェント間のコミュニケーション不足が，堅牢性の問題の主要な原因であることが明らかになった。
- マルチプロンプト生成と監視エージェントの導入による修復手法は，特定された問題の40.0%-88.9%を解決し，堅牢性を大幅に向上させた。
Link: https://arxiv.org/abs/2510.10460
情報誘導型多段階グラフ剪定によるソーシャルネットワークの主要構造の維持 [cs.SI, cs.IT, math.IT]目的：ソーシャルネットワークの主要構造の維持
- 複雑な社会構造の理解に不可欠であり，コミュニティや情報伝達の把握に役立つ。
- 密な繋がりが本質的な相互作用パターンを隠蔽し，分析を困難にしている。
- タスク関連情報を考慮し，主要な構造を維持しつつネットワークを簡素化する。
- 提案手法IGPruneは，タスク関連の相互情報に基づいて効率的にエッジを剪定する。
- 実験の結果，IGPruneは重要な構造と機能を維持することが示された。
- 剪定されたネットワークは解釈可能な主要構造を明らかにし，科学的発見を支援する。
Link: https://arxiv.org/abs/2510.10499
ECO：コード大規模言語モデルの性能向上を目指した性能を意識したプロンプトによるコード最適化 [cs.PL, cs.AI, cs.SE]目的：コード大規模言語モデルによるコード最適化能力の向上
- コードの実行時間最適化は，アルゴリズムや構造選択に関する性能トレードオフの理解が必要であり，重要な課題である。
- 従来のコードペアを用いた方法は，性能向上要因が不明瞭で，表面的な模倣に陥りやすいという問題点がある。
- 性能を意識したプロンプトを通じて，コード大規模言語モデルに具体的な最適化ガイダンスを提供し，効率的なコード生成を促す。
- ECOは，遅いコードと速いコードのペアから，非効率性の根本原因と改善理由を記述したランタイム最適化指示（ROI）を抽出する。
- 入力コードに対し，ボトルネック診断を行うシンボリックアドバイザーと，関連するROIを検索するROIリトリーバーを並行して利用し，性能を意識したプロンプトを生成する。
- 実験の結果，ECOによるプロンプトは，コード大規模言語モデルのコード生成効率を大幅に改善し，最大7.81倍の高速化を達成した。
Link: https://arxiv.org/abs/2510.10517
リモートダイレクトメモリアクセス用検証済み高性能コンポーザブルオブジェクトライブラリ (拡張版) [cs.PL, cs.DC, cs.LO, cs.SY, eess.SY]目的：リモートダイレクトメモリアクセス上でのマルチノードオブジェクト構築のための，形式検証済みライブラリ
- データセンター，HPC，AI/MLなど現代的なワークロードにおいて，低遅延かつ高スループットなネットワークが不可欠であるため。
- 従来のRDMAは，使用が困難な弱いメモリモデルを採用しており，形式的な定義が最近になってようやく行われた。
- RDMAの特性を活用しつつ，形式的な検証が可能なシンプルなプログラミングモデルを提供することで，その課題を解決する。
- 本研究では，RDMA上にマルチノードオブジェクトを構築するための形式検証済みライブラリLOCOを提案する。
- LOCOオブジェクトは，高いカプセル化とRDMAの特性を活用し，カスタムRDMAシステムと同等の性能を実現する。
- また，マルチノードオブジェクトをモデル化可能な新しい検証フレームワークMowgliを開発し，LOCOライブラリの正当性を検証した。
Link: https://arxiv.org/abs/2510.10531
生成AIをソフトウェアテストに利用する学生の行動：観察研究 [cs.SE]目的：学生による生成AIを用いたソフトウェアテストの戦略と認識
- ソフトウェア開発における生産性向上は，高品質なソフトウェアを効率的に提供する上で不可欠である。
- 生成AIの導入は開発者の役割を変え，制御性，品質，学習に関する懸念が生じている。
- 初心者開発者が生成AIをどのように活用し，どのような課題を抱えるかを明らかにすること。
- 学生は生成AIの利用によって，時間短縮，認知負荷の軽減，テストアイデアの創出支援といった利点を報告した。
- 一方で，テストに対する信頼性の低下，品質への懸念，所有感の欠如といった課題も指摘された。
- 戦略やプロンプトのスタイルはワークフローに影響を与えたが，ミューテーションスコアやテストスメルの観点からは，テストの有効性やコード品質に有意な差は認められなかった。
Link: https://arxiv.org/abs/2510.10551
分散量子ストレージの容量について [cs.IR, cs.RO, cs.IT, math.IT, quant-ph]目的：分散量子ストレージの容量
- 量子情報技術の発展は，情報セキュリティの向上に不可欠である。
- 量子情報の分散保存は，ノイズや損失に強くする必要がある。
- 不均一なノードサイズや消去パターンに対応した容量の上限を求める。
- 分散量子ストレージの容量は，様々なグラフ構造において特徴付けられた。
- 量子CSSコードと古典的なセキュアストレージ問題との関連性が示された。
- 量子エントロピーの不等式を用いて，容量の上限が導出された。
Link: https://arxiv.org/abs/2510.10568
構成的対称性：圧縮としてのアルゴリズム的エージェントにおける擬群構造 [cs.LG, cs.AI, cs.IT, math.IT, q-bio.NC]目的：アルゴリズム的エージェントにおける構成的対称性に基づく圧縮の枠組み
- 知覚情報の効率的な処理は，人工知能やロボティクスにおける重要な課題である。
- 既存の手法では，複雑な知覚データを効率的に表現・圧縮することが困難である。
- 低次元多様体上の作用を通じて，知覚データの構造的制約と力学的制約を明らかにする。
- エージェントの構成方程式と読み出しは，対称性に対して不変性を持つ構造的制約を受ける。
- 静的な入力下では，対称性により保存量が誘導され，軌跡は低次元不変多様体に限定される。
- この枠組みは，深層モデルにおける構成性の利点を幾何学的に説明し，予測符号化の新しい定式化を提供する。
Link: https://arxiv.org/abs/2510.10586
ランダム順列集合の距離尺度：第2層信念構造の視点から [cs.AI, cs.IT, math.IT]目的：ランダム順列集合間の距離の測定
- 不確実な情報を扱う上での順序構造の表現が重要視されている。
- ランダム順列集合理論における順列質量関数の距離測定は未解決の課題である。
- 累積ジャカード指数の行列に基づき，新たな距離尺度を提案し，その特性を評価する。
- 提案手法は既存手法の欠点を克服し，Jousselme距離と両立する。
- 累積ジャカード指数行列の正定値性分析と補正スキームを提示した。
- 順位の高い要素間の不一致は，より大きな距離値をもたらす傾向がある。
Link: https://arxiv.org/abs/2510.10596
ノイズのない線形回帰における情報・計算のトレードオフ：無知的な汚染下 [cs.DS, math.ST, stat.ML, stat.TH]目的：ガウス共変量を持つノイズのない線形回帰における，無知的な汚染下の回帰ベクトルβの正確な復元
- 機械学習において，回帰分析は重要な役割を果たす。データの予測精度向上に不可欠である。
- 汚染データの存在は，回帰分析の精度を著しく低下させる。その影響を最小限に抑える必要がある。
- 効率的なアルゴリズムにおける計算量と精度のトレードオフを明確にすること。
- 効率的なStatistical Queryアルゴリズムに必要なVSTAT計算量は少なくとも$\tilde{\Omega}(d^{1/2}/\alpha^2)$となることが示された。
- 無知的な汚染下では，効率的なアルゴリズムで$1/\alpha$に対する2次の依存性があることが示された。
- サンプル数は少なくとも$\Omega(d/\alpha^2)$必要であり，これは最適なサンプル数$O(d/\alpha)$よりも大きい。
Link: https://arxiv.org/abs/2510.10665
離散変調CV-QKDにおけるソフト復号逆照合 [cs.IT, math.IT]目的：離散変調を用いた連続変数量子鍵配送における，安全な鍵生成率向上
- 量子鍵配送は，盗聴不可能な通信を実現する技術として重要であり，情報セキュリティの根幹をなす。
- 従来の逆照合では，離散変調を用いる場合，送信側（Alice）がハード情報しか持てないという課題があった。
- 受信側（Bob）のソフト情報を活用し，Aliceが鍵を復号できるよう，新たな逆照合技術を開発する。
- 提案手法は，安全な鍵生成率を大幅に向上させ，理論上の上限にほぼ到達することを示した。
- バイナリLDPC符号とbelief-propagation復号を用いた実装により，ビット誤り率の評価も行った。
- シミュレーション結果は，理論予測と一致しており，残差ギャップに関する考察も提示した。
Link: https://arxiv.org/abs/2510.10674