arXiv雑要約
プログラム - 2026/05/08 公開
精密デバッグベンチマーク:モデルはデバッグしているのか,それとも再生成しているのか? [cs.SE, cs.CL]目的:大規模言語モデルのデバッグ能力の評価
- コード生成AIの信頼性向上は,ソフトウェア開発の効率化に不可欠である。
- 既存のモデルは,デバッグ時に必要な箇所のみを修正する精度が低い。
- 正確なデバッグ能力を測るためのベンチマークとその評価指標を開発する。
- 提案されたPDBベンチマークは,既存のコーディングデータセットをデバッグ問題に変換可能である。
- 最先端モデルは高い合格率を示す一方で,修正の精度が低いことが示された。
- 反復的・エージェント的なデバッグ戦略でも,精度と再現率は大幅に向上しなかった。
統合テストからのユニットテストスイートの拡充 [cs.SE]目的:ユニットテストの自動生成によるテストスイートの拡充
- ソフトウェア品質確保において,テストは不可欠であり,特にユニットテストは早期の欠陥発見に貢献する。
- テストピラミッド構造が崩れ,統合テストやシステムテストが過多になりがちで,テストの粒度が粗く,実行時間が長くなる。
- 統合テストを活用し,コンポーネントの依存関係を分離して検証するユニットテストを生成することで,テストスイートの改善を目指す。
- 提案手法はNode.jsプラットフォームで有効であることが実証され,オープンソースのJSアプリケーションを用いた評価で好ましい結果が得られた。
- 統合テストからユニットテストを生成することで,テストの粒度を細かくし,欠陥の特定と修正を容易にすることが期待される。
- この手法はNode.js以外にも移植可能であり,他の言語やプラットフォームへの適用も可能である。
高次元密度と情報量の推定のための償却済みツリーコプラ [cs.LG, cs.IT, math.IT, stat.ME]目的:高次元データの依存構造モデリング
- 複雑なデータ間の依存関係を捉えることは,機械学習や統計モデリングにおいて重要である。
- 高次元データにおける依存構造のモデル化は計算コストが高く,現実的な問題への適用が困難である。
- 計算効率を向上させつつ,高次元データの依存構造を正確に推定することを目指す。
- 提案手法VDCは,二変量ノイズ除去モデルを再利用することで,ツリーコプラの学習コストを削減する。
- VDCは,合成データと実データにおける密度推定,相互情報量/総相関の推定において高い性能を示す。
- VDCにより,反復的なツリーコプラの適合が困難だったタスクでの明示的な情報量推定と依存性分解が可能になる。
区間順序問題の計算複雑性 [cs.DS]目的:区間順序問題における計算複雑性の解析
- バイオインフォマティクスなどに応用があり,順序最適化の基礎となる問題である。
- 一般的なコスト関数に対して効率的なアルゴリズムが存在しないことが課題である。
- 特定のコスト関数に対する多項式時間アルゴリズムの開発と,計算複雑性の限界を明らかにする。
- 動的計画法により,コスト関数への $O(2^n\text{poly}(n))$ 回の呼び出しで問題を解くアルゴリズムを開発した。
- コスト関数 $f$ が劣加法または超加法である場合,多項式時間アルゴリズムが存在することが示された。
- 任意のコスト関数に対するアルゴリズムの実行時間下限が $2^{n-1}$ であることが証明され,NP困難性も示された。
MISES:効果的なサービスのための最小情報充足性 [cs.GT, cs.IT, math.IT]目的:カテゴリに基づく資源配分メカニズムの効率性評価と最適化
- サービス提供における資源配分は,効率的なシステム運用と利用者の満足度向上に不可欠である。
- 従来の資源配分は,個々の需要を正確に把握せず,カテゴリのみに基づいて固定的な資源プロファイルを割り当てている。
- 本研究は,最小限の情報で効率的なサービス提供を実現するための資源配分メカニズムの理論的限界を明らかにする。
- カテゴリ間の配分分散と厚生損失のギャップに,二方向の厳密な境界が存在することが示された。
- 需要に由来するカテゴリが,厚生損失と虚偽申告インセンティブの両方を最小限に抑えることが明らかになった。
- 同質性の条件下では,集計結果指標がサービスレベルの検出において個別指標を厳密に上回り,検出問題への追加データはノイズとなる。
マンニホールドに固定された自己対戦による質問学習:検証可能な推論のためのANCORA [cs.LG, cs.AI, cs.PL]目的:検証可能な推論のための質問学習パラダイム
- AIの推論能力向上は,複雑な問題解決や高度な意思決定に不可欠である。
- 既存手法では,固定されたプロンプトセットに依存し,汎用性に欠ける場合がある。
- 人間によるアノテーションなしで,自己改善を通じて推論能力を獲得すること。
- ANCORAは,プロポーザーとソルバーが交互に作用し,検証可能なカリキュラムをゼロから構築する。
- Verus環境において,ANCORAはDafny2Verusのpass@1を81.5%に向上させ,既存のPSV自己対戦を上回る性能を示した。
- Dafny2Verusから学習することで,MBPPとHumanEvalにおいてそれぞれ36.2%と17.2%のpass@1を達成した。
現実的な都市環境における最適な送信機配置 [cs.IT, math.IT]目的:無線ネットワークにおける最適な送信機配置
- 無線通信の普及に伴い,基地局等の配置最適化が重要視されている。
- 従来の配置方法は簡略化されたモデルに依存し,実際の環境を十分に考慮できていない。
- 詳細な都市モデルに基づき,ネットワーク品質とコストのバランスを最適化する。
- 提案手法は,サンフランシスコとフィレンツェの3Dマップを用いたシミュレーションで有効性が確認された。
- 既存の基地局配置と比較して,平均データレートは約2倍,エッジレートは2~8倍向上した。
- 送信機の数を変えずに,ネットワーク性能の大幅な向上が可能であることが示された。
ドメイン固有の修復パターンに基づく脆弱性自動修復:VulKey [cs.CR, cs.SE]目的:ソフトウェア脆弱性の自動修復
- ソフトウェアの脆弱性が増加しており,効果的な自動修復ツールの必要性が高まっている。
- 既存手法では,CWEやNVDといった構造化されたセキュリティ知識を十分に活用できていない。
- 専門家の知識を階層的に抽象化し,修復パターンをガイドすることで,修復の精度向上を目指す。
- VulKeyは,CWEタイプ,構文的アクション,セマンティックなキー要素の3層構造で修復戦略を表現する。
- PrimeVulデータセットにおいて,31.5%の修復精度を達成し,既存の最高性能ベースラインを7.6%上回った。
- JavaベンチマークVul4Jにおいても,高い汎化性能を示すなど,クロス言語・クロスモデルでの有効性が確認された。
U-HNSW:汎用Lp距離下における効率的なグラフベース近似最近傍探索解法 [cs.DB, cs.DS]目的:汎用Lp距離下での近似最近傍探索問題に対する解法
- 多様な距離尺度に対応できる最近傍探索は,情報検索や機械学習において不可欠である。
- 汎用Lp距離を効率的に扱う既存手法は,計算コストが高く,実用性に課題がある。
- L1およびL2距離に基づくグラフ構造を利用し,高速かつ高精度な探索を実現する。
- U-HNSWは,既存のMLSH実装と比較して,最大で2670倍高速なクエリ時間を達成した。
- U-HNSWは,固定されたp値を持つANNS-Lp問題においても,オリジナルのHNSWを上回る性能を示した。
- 提案手法は,不要なLp距離計算を削減する早期終了戦略によって効率化を実現している。
低S/N通信のための文脈記憶増強ソース符号化 [cs.IT, cs.LG, math.IT]目的:低S/N環境下におけるソース符号化の堅牢性向上
- 通信において,効率的な情報伝送は不可欠であり,特に低S/N環境下での信頼性が重要となる。
- 従来のソース符号化は,チャネルエラーに弱く,わずかな誤りが伝送後の復元を妨げる場合がある。
- 本研究は,チャネルエラーの影響を受けにくい,文脈記憶を活用したソース符号化方式を提案する。
- 提案手法MASCは,送信側と受信側で共有される文脈記憶を用いて,ソースモデルを強化する。
- MMERによる疎なメモリ経路選択により,関連性の高い記憶のみが活性化され,確率推定の精度が向上する。
- 実験結果から,MASCは既存手法と比較して,低S/N環境下で優れた性能を示すことが確認された。
UVMarvel:LLM支援によるサブシステムレベルRTL検証のための自動UVMマシン [cs.AR, cs.SE]目的:サブシステムレベルRTL検証のための自動UVMテストベンチ構築
- IC開発において検証はボトルネックであり,全体の7割の時間を要する重要な工程である。
- UVMは再利用性を向上させるが,サブシステムレベルのテストベンチ作成には高度な専門知識と手間がかかる。
- LLMを活用し,サブシステムレベルのUVMテストベンチ構築を自動化することで,検証工程の効率化を目指す。
- UVMarvelは,多様な仕様をUVMテストベンチに変換する中間表現とバスプロトコルライブラリを導入した。
- シグナルトラッカーとVerilogパッチングライブラリを用いて,LLMによる刺激の改良を支援する。
- 主流のバスプロトコルに対応し,平均95.65%のコードカバレッジを達成,検証時間を大幅に短縮した。
プライベート構造部分集合検索 [cs.IT, math.IT]目的:プライベートな構造化された部分集合検索問題に関する研究
- データプライバシー保護の重要性が増す中,データベースからの安全な情報検索技術が求められている。
- 従来のプライベート情報検索(PIR)は,大規模データや複数メッセージの検索において効率性の課題があった。
- 応用特有の構造を持つ需要に対応することで,PIRの効率を向上させることを目指す。
- 提案手法は,特定の構造化された需要ファミリーにおいて,既存のマルチメッセージPIRよりも高い検索レートを達成できる。
- 需要構造を活用することで,サブパケット化レベルを削減し,効率的な検索が可能となる。
- 連続的な需要ファミリーにおいては,フィールドサイズ制限なしで最適なレートと低いサブパケット化を実現した。
プライベートな連続ブロック検索 [cs.IT, math.IT]目的:プライベートな連続ブロック検索問題の解決
- データ分散環境におけるプライバシー保護は重要であり,特にユーザーの検索意図を秘匿する必要がある。
- 従来のマルチメッセージプライベート情報検索は効率性に課題があり,サブパケット化レベルが高い場合がある。
- 連続ブロックという構造を利用することで,プライバシーを保護しつつ検索効率を向上させる。
- 提案手法は,プライベートな連続ブロック検索問題において,最適なレートを達成できる。
- 従来のマルチメッセージプライベート情報検索と比較して,サブパケット化レベルを大幅に削減できる。
- 連続ブロックの構造を活かすことで,効率的なデータ検索とプライバシー保護の両立を実現した。
対称シフトレジスタの表現 [math.CO, cs.IT, math.IT]目的:対称シフトレジスタに関する数学的枠組み
- 暗号理論や符号理論において,系列の周期性は重要な性質である。
- 対称シフトレジスタの周期決定は,解析が難しく,効率的な手法が求められていた。
- 非線形差分方程式を用いることで,対称シフトレジスタの構造を明らかにし,周期決定を容易にすること。
- 本研究では,対称シフトレジスタを関連する非線形差分方程式系として表現する新たなアプローチを提案した。
- 等差数列が重要な役割を果たし,レジスタが生成する数列の最小周期を決定しやすくなった。
- GitHubおよびWebアプリケーションで,実装とアルゴリズムの評価を公開している。
生成AIが6Gと未来を拓く:意味的通信のための拡散モデル [eess.SP, cs.IT, cs.LG, cs.MM, math.IT]目的:意味的通信における拡散モデルの応用可能性
- 無線通信は理論上の限界に近づいており,これまでのビット単位の伝送方法では限界がある。
- 拡散モデルと通信システム設計を結びつける体系的な指針がなく,研究者は異なる分野の文献を精査する必要がある。
- 拡散モデルを次世代無線ネットワークの基盤技術として確立することを目指す。
- 拡散モデルは,優れた生成品質,安定した学習,厳密な理論的根拠を持つことから,生成意味的通信において注目されている。
- 本研究では,条件付き拡散,効率的な拡散,汎用化拡散という3つの技術的柱を体系的にレビューした。
- 拡散モデルを用いることで,意味的な忠実性とロバスト性を維持しながら,極端な圧縮が可能になることが示された。
情報幾何学からの相対論的ハミルトニアンの創発構造 [math-ph, cs.IT, math.IT, math.MP, physics.class-ph]目的:相対論的エネルギー運動量関係の創発
- 物理学の根幹であり,宇宙の構造や現象を記述する上で不可欠である。
- 既存の理論では,相対論的対称性を仮定する必要がある。
- 統計的平均化と幾何学的不変性から相対論的関係を導き出す。
- 相対論的エネルギー運動量関係が,補助パラメータの揺らぎに対する最大エントロピー推論から有効なアンサンブル平均構造として創発することが示された。
- スケール不変制約によって確率分布が一意に決定され,これは関連する統計多様体のフィッシャー・ラオ幾何学から自然に生じる。
- この情報幾何学的枠組み内では,相対論的分散関係がローレンツ対称性を初期条件として課すことなく出現する。
選択後の分布モデル評価 [stat.ML, cs.IT, cs.LG, math.IT]目的:モデル評価における分布の信頼性確保
- モデルの性能評価は,様々な応用分野において不可欠であり,その信頼性は重要である。
- 事前評価でモデルを選択すると,評価データに対する過剰適合が生じ,性能評価に偏りが生じる可能性がある。
- 選択後のバイアスを制御し,信頼性の高い性能と信頼性のトレードオフ分析を可能にすること。
- 本研究で提案するPS-DMEは,データ依存的なモデル選択後においても,統計的に妥当な分布モデル評価を可能にする。
- PS-DMEは,偽カバー率を制御し,サンプル分割ベースラインよりもサンプル効率が良いことを理論的に証明した。
- 合成データ,テキストSQL変換,通信ネットワーク評価の実験で,PS-DMEの有効性が示された。
線形個数の還元可能構成とほぼ線形時間での4彩色定理 [math.CO, cs.CG, cs.DM, cs.DS]目的:平面グラフのほぼ線形時間での4彩色アルゴリズム
- グラフ理論は,ネットワーク,スケジューリング,マッピングなど,様々な現実世界の応用を持つ重要な分野である。
- 4彩色定理の既存の証明は,計算効率の観点から見て必ずしも最適ではない。
- 平面グラフの4彩色をより効率的に行うためのアルゴリズムを開発すること。
- 本研究では,4彩色定理の重要な一般化を示し,平面グラフの4彩色アルゴリズムを改善した。
- 線形個数の還元可能構成または非交差閉路を見つけることで,問題のサイズを定数倍に減らすことが可能になった。
- これにより,$O(n\log n)$時間での4彩色が実現し,1996年のロバートソンらのアルゴリズムを上回る結果となった。
複雑系の普遍的エントロピー [cond-mat.stat-mech, cs.IT, math.IT]目的:複雑系のエントロピーに関する公理的基盤
- 複雑系は自然科学,社会科学に広く現れ,その理解は重要である。
- 既存のエントロピー定義では,情報スケールでの不確かさを適切に捉えられていない。
- 情報スケールでの不確かさを満たす普遍的なエントロピーを構築すること。
- 最大化分布における情報スケールでの不確かさを測定する要件を満たす唯一のエントロピーが証明された。
- エントロピーの非加法性は,長距離依存性や非線形統計的結合に等しいことが示された。
- 結合,ストレッチパラメータ,次元の関数としてエントロピー適合性拡大率が示された。
