arXiv雑要約
プログラム - 2026/03/24 公開
エージェント型AIコーディングツールの設定:探索的研究 [cs.SE]目的:エージェント型AIコーディングツールの設定メカニズムに関する現状把握
- ソフトウェア開発の効率化が求められる中,AIを活用した自動化技術は不可欠である。
- AIコーディングツールの設定方法は確立されておらず,ツールの潜在能力を十分に引き出せていない。
- 開発者がどのようにAIツールを設定し,その設定がパフォーマンスにどう影響するかを明らかにする。
- AIコーディングツールの設定には8種類のメカニズムが存在し,その中でも「コンテキストファイル」が最も広く利用されている。
- AGENTS$.$mdというファイル形式が,ツール間の相互運用性を高める標準となりつつあることが示された。
- 高度な設定メカニズムである「スキル」や「サブエージェント」の活用は限定的であり,静的な指示に依存する傾向がある。
- ツールによって設定文化に違いが見られ,Claude Codeの利用者は最も幅広いメカニズムを活用している。
有向非巡回グラフ上の実数値関数の単調性検証 [cs.DS]目的:有向非巡回グラフ上の実数値関数の単調性検証問題
- グラフ構造を持つデータの解析は,様々な分野で重要であり,効率的なアルゴリズムが求められている。
- 単調性検証問題は計算量的に困難であり,効率的なアルゴリズムや下限が存在しない場合が多い。
- 有向非巡回グラフにおける単調性検証のクエリ複雑性に関する下限を確立し,アルゴリズムの性能向上を目指す。
- 二側検査器に対する下限 $\Omega(n^{1/2-\delta}/\sqrt{\varepsilon})$ が,古典的な上限 $O(\sqrt{n/\varepsilon})$ にほぼ一致することが示された。
- 一側検査器に対する下限 $\Omega(\sqrt n)$ が,明示的な二部グラフ上で確立され,従来の $\Omega(\log n)$ を改善した。
- 推移的簡約と推移的閉包の辺数を用いた新しいアルゴリズムが提案され,既存の上界を改善する条件が示された。
HookLens:Reactフック構造の理解のための可視化分析 [cs.RO, cs.SY, eess.SY, cs.HC, cs.SE]目的:Reactフック構造の理解とアンチパターンの特定
- Reactは広く利用されているが,コードの複雑化が課題となっている。
- フックの使用によりコンポーネント間の依存関係が複雑になり,保守性が低下しやすい。
- HookLensは,フックによる依存関係とデータフローの可視化を通じて,この問題を解決する。
- HookLensは,コンポーネント構造と依存関係の理解を効率化し,アンチパターンの発見を支援する。
- ユーザー調査の結果,HookLensは従来のコードエディタと比較して,アンチパターンの検出精度を大幅に向上させた。
- 最先端のLLMベースのコーディングアシスタントと比較しても,同等のタスクにおいて優れた性能を示した。
分布整合性のための物理に基づいた,シャノン最適圧縮:算術符号によるアプローチ [cs.IT, math.IT, physics.data-an]目的:データセットの分布整合性評価
- 科学分析において,生成AIによる合成データの信頼性検証が重要性を増している。
- 既存手法は相対的評価に留まり,絶対的な信頼性基準が存在しない。
- 物理情報に基づいた圧縮により,絶対的な分布整合性指標を確立する。
- 算術符号による無損失圧縮が,データセットの分布整合性を測る操作的尺度となる。
- 物理相関を共有するデータセットは,同様の最適記述が可能であり,不整合は符号長の増加として現れる。
- この過剰な符号長が絶対的な信頼性指標となり,ゼロが分布との整合性を示す。
FuzzySQL:LLM駆動型ファジングによるDBMS特殊機能の隠れた脆弱性の発見 [cs.DB, cs.CR, cs.SE]目的:DBMS特殊機能における脆弱性の発見
- データベースは重要な情報を扱うため,その堅牢性は極めて重要である。
- 従来のファジングは基本的なSQL構造に偏り,特殊機能のテストが不十分である。
- LLMを活用し,DBMS特殊機能の網羅的なテストと脆弱性発見を目指す。
- FuzzySQLは,文法ガイドされたSQL生成とロジックシフトプログレッシブミューテーションを組み合わせることで,多様なテストケースを生成する。
- 本研究では,MySQL,MariaDB,SQLite,PostgreSQL,ClickHouseを含む複数のDBMSに対しFuzzySQLを適用し,64件の脆弱性を発見した。
- 発見された脆弱性のうち27件は,テスト不足のDBMS特殊機能に関連し,60件がベンダーによって確認・修正された。
His2Trans:歴史的検索を用いた自己進化型C-to-Rust変換のためのスケルトン優先フレームワーク [cs.SE]目的:CからRustへの変換における,ビルドコンテキストの欠如とドメイン固有の進化知識の不足という課題解決
- 大規模なコードベースの移行は,ソフトウェアの安全性と保守性を高める上で不可欠である。
- 既存のLLMベースの手法は,複雑なビルドシステム下での型定義の再構築やAPI対応の推論に課題がある。
- ビルド情報を考慮したスケルトンと自己進化型知識抽出を組み合わせることで,安定した移行を実現する。
- His2Transは,産業規模のOpenHarmonyモジュールにおいて97.51%のインクリメンタルコンパイル成功率を達成し,ビルドエラーを効果的に修正した。
- 一般的なベンチマークでは,C2Rustと比較してunsafeコードの比率を25.23%ポイント削減し,警告の数も減少させた。
- 検証済みのパターンを継続的に統合することで,未見のタスクでの修正コストを約60%削減し,フレームワークの進化的な振る舞いを実証した。
有限体上における小行列乗算の複雑度下界:バックトラッキングと置換による証明 [cs.CC, cs.DS]目的:有限体上における行列乗算の双線形複雑度下界の証明手法
- 行列乗算は線形代数における基本的な演算であり,計算量理論の重要な題材である。
- 既存手法では,行列乗算の複雑度下界を厳密に求めるのが困難であった。
- バックトラッキングと置換法を組み合わせ,自動化された証明システムを構築し,下界算出を支援する。
- 本研究により,$3 \times 3$ 行列の $\mathbb{F}_2$ 上での乗算の双線形複雑度下界が,既存の19から20へと改善された。
- 証明は,バックトラッキング探索と動的計画法を用いて自動的に導出され,その正当性は検証された。
- この手法は,他の行列サイズや体に対する複雑度解析にも応用可能であると考えられる。
局所的差分プライバシー下における頻度と分布推定の厳密な最適性 [cs.RO, cs.IT, cs.CR, math.IT]目的:頻度と分布推定における厳密な最適性
- プライバシー保護は重要であり,データ利用の制約を緩和しつつ情報抽出を可能にする。
- 局所的差分プライバシーは高いプライバシー保護を提供するが,推定精度が低下する課題がある。
- 推定精度を最大化する最適な推定器の構成を明らかにすることで,その課題を解決する。
- 線形推定器が,頻度および分布推定の理論的な下限に達することが証明された。
- 最適な推定器の通信コストは,辞書サイズdに対して$\log_2(\frac{d(d-1)}{2}+1)$ビット程度まで低下する。
- 修正されたCount-Mean Sketchは,十分な辞書サイズにおいて理論的な最適性に匹敵する性能を示す。
Sublime:偏ったストリームに対する亜線形エラーと空間効率 [cs.DS, cs.DB, cs.IT, math.IT]目的:偏ったストリームにおける頻度推定の効率化
- リアルタイムなデータ分析において,キーの頻度を追跡することは不可欠である。
- 既存の頻度推定スケッチは,偏ったデータに対してメモリ効率が悪く,ストリーム長との誤差が線形に増加する。
- Sublimeは,メモリ効率と精度を向上させ,長期的なデータストリームにも対応する。
- Sublimeは,カウンタを動的に拡張することで,偏ったデータに対するメモリ使用量を削減する。
- カウンタ数を必要に応じて拡張することで,ストリーム長に伴う誤差の増加を抑制する。
- 理論的分析と実験により,Sublimeが既存手法と比較して精度とメモリ効率で優れていることが示された。
非周期構造は決して崩壊しない:無損失圧縮のためのフィボナッチ階層 [cs.IT, math.CO, math.DS, math.IT]目的:無損失圧縮における非周期階層の構造的優位性
- データ圧縮は,情報伝送や保存において不可欠な技術であり,効率的な圧縮手法が求められている。
- 従来の周期的な階層構造は,深さが増すにつれて利用可能なn-gram探索位置が減少するという問題がある。
- 本研究は,非周期階層を用いることで,周期構造の持つ問題を解決し,より効率的なデータ圧縮を実現することを目指す。
- フィボナッチ準結晶タイリングは,周期構造が深さO(log p)で崩壊するのに対し,どのレベルでも利用可能なn-gram探索位置を維持する。
- その結果,辞書再利用が全てのスケールで可能となり,より効率的な圧縮を実現できることが示された。
- 実験的に構築した圧縮器Quasicrythは,周期5のベースラインと比較して,データ量が増えるにつれて圧縮効率が向上することが確認された。
構成調整のためのドメイン・空間性パターンの解明:ドメイン知識と適合度景観の融合 [cs.SE, cs.AI]目的:構成調整におけるドメイン知識と適合度景観の関係性の体系的な把握
- 品質保証において,構成調整は性能向上の鍵となる。しかし,その効果のメカニズムは未解明な点が多い。
- 既存研究は静的解析や動的データ解析に偏っており,汎用性や説明可能性に課題がある。
- 適合度景観分析を活用し,構成調整の難易度とドメイン知識の関係性を明らかにすることで,調整ツールの改善に貢献する。
- 構成調整の景観はシステム固有であり,システム領域,プログラミング言語,リソース強度といった単一のドメイン要素で構造が一貫して決定されることはないことが示された。
- 主要なオプション(例:x264のpic-struct)は,リソースオプション(例:x264のcpu-independent)よりも景観の粗さに強い影響を与えることが明らかになった。
- ワークロードが景観構造に与える影響は,タイプや規模に一律に結びつくものではなく,システムに依存して変化することが確認された。
エントロピーの凸性を通じた新しいBrunn-Minkowski不等式と関数不等式 [math.MG, cs.IT, math.IT, math.PR]目的:測度の凹性とその相対エントロピーの凸性の関係
- 幾何学や確率論において,測度の性質は重要な役割を果たす。
- 古典的なBrunn-Minkowski不等式は,集合の凸性という強い仮定を必要とする。
- 対数凹測度に対する新しいBrunn-Minkowski不等式を導き出す。
- 測度の凹性と相対エントロピーの凸性の関係が示された。
- 中心星型体に対する新しい次元のBrunn-Minkowski不等式が証明された。
- ガウス空間におけるOtto-VillaniのHWI不等式の改良版が得られた。
量子ルザ拡散度によるマジックの定量化 [quant-ph, cs.IT, math-ph, math.IT, math.MP, math.PR]目的:量子マジックの定量化
- 量子情報理論において,量子状態の特性評価は重要であり,その応用範囲は広い。
- 量子マジックの定量化には,既存の方法では十分な精度や情報が得られない場合がある。
- 量子ルザ拡散度を用いることで,マジックの量をより正確に評価し,理解を深める。
- 量子畳み込みに対する量子エントロピーの振る舞いを調査し,量子中心極限定理を確立した。
- 量子ルザ拡散度を導入し,量子状態の安定化構造を研究した。
- マジックの量を定量化する新しい指標として,量子ルザ拡散度と量子倍加定数を提案した。
LLMテキストの帰属特定のためのトレーニング不要手法 [stat.ML, cs.AI, cs.CL, cs.IT, cs.LG, math.IT]目的:LLMによるテキスト生成の起源特定
- テキストの真正性確認は,教育機関やプラットフォーム運営において重要である。
- LLM生成テキストと人間生成テキストの区別が困難になっている。
- 特定のLLMによるテキスト生成を,誤検出率を抑制しつつ特定すること。
- 提案手法は,LLMテキストを過去に依存する確率過程としてモデル化する。
- 既知のLLM群間,または既知LLMと未知モデル間を識別する統計的検定を設計した。
- テキスト長が増加すると,タイプI/IIエラーが指数関数的に減少することが証明された。
不変理論,マジック状態蒸留,および古典符号の上限 [quant-ph, cs.IT, hep-th, math.IT]目的:古典誤り訂正符号の重み列挙子に対する新たな制約
- 量子情報理論における誤り訂正は,量子計算の実現に不可欠な技術である。
- 古典符号のパラメータに関する既存の制約では,性能向上の限界があった。
- マジック状態蒸留の物理的整合性から,古典符号の重み列挙子に新たな制約を導く。
- マジック状態蒸留の物理的整合性から,古典符号の重み列挙子に関する新たな制約が得られた。
- この制約は,古典不変理論から得られるものよりも厳しく,古典および量子符号の最小距離に関する新たな上限を導く。
- 特に,GF(4)上の[12m, 6m, 4m+2]パラメータを持つ極限エルミート自己双対符号の非存在が証明された。
計量複雑性はブライアント・タッパー多様性である [math.MG, cs.IT, math.IT]目的:コンパクト距離空間の計量複雑性とブライアント・タッパー多様性の関係性
- 多様性は,生物学,情報科学など幅広い分野で重要であり,複雑系の理解に不可欠である。
- 既存の多様性の概念は,距離や構造を考慮しない場合があり,現実世界の複雑さを捉えきれない。
- 計量複雑性から生成される多様性は,距離構造を考慮し,より精度の高い多様性の評価を可能にする。
- 計量複雑性は,ブライアント・タッパー多様性の具体例を与えることが示された。
- 特に,実数のコンパクト部分集合において,計量複雑性から得られる多様性はミンコフスキー超加法性を示す。
- この結果は,既存の多様性の研究に新たな視点を提供する。
レヴィ過程と金融モデルの情報幾何 [math.ST, cs.IT, math.DG, math.IT, math.PR, q-fin.MF, stat.TH]目的:レヴィ過程の情報幾何
- 金融モデリングにおいて,確率過程の幾何学的性質の理解は重要である。
- レヴィ過程の統計的推論における幾何学的構造は未だ十分に解明されていない。
- レヴィ過程に対する情報幾何学的枠組みを構築し,統計的応用を目指す。
- レヴィ過程のレヴィ三つ組を用いて,α-ダイバージェンスを直接導出した。
- 統計多様体上のフィッシャー情報行列とα-接続を特定した。
- 緩和安定過程,CGMYモデルなど,金融モデルで広く用いられるレヴィ過程の幾何学的構造を分析した。
シンプレクティック格子とGKP符号:暗号格子からの簡便な乱数構成 [quant-ph, cs.IT, math.IT]目的:標準的な短整数解格子(SIS)およびリングSIS,モジュールSIS格子(R-SIS, M-SIS格子)からのGKP符号の構成
- 格子暗号は,量子コンピュータに対する耐性を持つ有力な暗号方式であり,その安全性評価が重要である。
- 既存のGKP符号構築法は,パラメータ設定に制限があるか,鍵復元の高速化が困難であるといった課題があった。
- 暗号格子に基づき,より効率的で簡便なGKP符号の構成と,実用的な復号アルゴリズムの提案を目指す。
- SIS,R-SIS,M-SIS格子を用いてGKP符号を構成し,距離$\sqrt{n/\pi e}$を達成した。
- ConradらのNTRUに基づく構成と比較して,距離において有利な結果が得られた。
- 提案する復号アルゴリズムは,多くのパラメータ選択においてNTRU符号と同程度の性能を示すことが実験的に確認された。
条件付き相互独立性の特徴づけ:同値性と包含関係 [math.PR, cs.IT, math.IT]目的:条件付き相互独立性の同値性と包含関係に関する条件
- 確率論において中心的な概念であり,統計的モデリングや推論の基礎となる。
- 条件付き相互独立性の判定は一般に困難であり,効率的な手法が求められている。
- 条件付き相互独立性の同値性と包含関係を特徴づけるための十分条件と必要条件を確立する。
- 条件付き相互独立性(CMI)の同値性の必要十分条件が,その標準形を用いて導出された。
- CMI $K$ が $K'$ を包含する条件も,同様にCMIの標準形を用いて特徴づけられた。
- これらの結果は,CMIの理論的理解を深め,実用的な判定アルゴリズムの開発に貢献する。
ノイズ観測下における二部潜在空間グラフの情報理論的閾値 [math.PR, cs.IT, math.IT, math.ST, stat.TH]目的:ノイズ観測下二部潜在空間グラフにおける潜在幾何形状の検出可能性に関する情報理論的相転移
- グラフ構造からの潜在的な特徴抽出は,機械学習やデータ解析において重要な役割を果たす。
- エッジの一部にのみ潜在情報が含まれる場合,グラフ構造の検出は困難となる。
- ノイズのある観測下で潜在形状を検出するための厳密な閾値を情報理論的に求める。
- 固定されたエッジ密度pにおいて,次元dとマスク確率qの関数としての検出可能性の閾値を決定した。
- マスクが事前にわかっている場合と隠されている場合とで,検出問題の難易度が大きく異なることが示された。
- ガウス型ランダム幾何グラフにおける符号付き部分グラフ数の上限を導出し,最適な情報理論的閾値を特定した。
多重辺分割による臨界グラフの分離 [math.CO, cs.DM, cs.DS]目的:臨界グラフの分離に関する研究
- グラフ理論は,ネットワーク構造の解析に不可欠であり,様々な応用分野で重要である。
- グラフの分離数決定問題は計算困難であり,効率的なアルゴリズム開発が課題である。
- 特定の辺分割数に対する臨界グラフの存在と特徴を明らかにすることを目指す。
- 任意の整数$q \ge 1$に対し,$(\iota, q)$-臨界グラフが存在することが証明された。
- 連結な$m$辺の非星型グラフは,ある$q \le m - 1$に対して$(\iota, q)$-臨界であると示された。
- $(\iota, 1)$-臨界グラフの一般的な特徴づけ,および$(\iota, 1)$-臨界木の構成的特徴づけが提供された。
構造を持たないNP探索における内在情報フロー [math.OC, cs.CC, cs.IT, math.IT]目的:NP探索における情報取得プロセス
- 計算複雑性理論において,NP問題の効率的な解法は重要な課題である。
- 従来のNP探索の評価指標では,情報量に着目した分析が不足していた。
- 情報理論的視点からNP探索の限界を明らかにし,複雑性の起源を特定する。
- NP探索を情報取得プロセスとして捉え,隠された証拠の特定に必要な情報量を評価した。
- 構造を持たない極限的なモデル(psocidモデル)において,情報獲得効率の限界が示された。
- 探索の複雑性の情報理論的な起源が明らかになり,指数的な探索複雑性の理由が説明された。
整数値対称サブモジュラ関数における小値のカットの多項式サイズ符号化 [math.CO, cs.DS]目的:有限集合上の整数値対称サブモジュラ関数における,値が小さいカットのすべての集合の多項式サイズの表現
- グラフ構造の解析や組合せ最適化問題など,様々な分野でサブモジュラ関数が活用されている。
- サブモジュラ関数のカット構造を効率的に表現する方法が未確立であり,計算量のボトルネックとなっている。
- この研究では,カットの集合を多項式サイズで表現し,効率的なアルゴリズムを開発することを目的とする。
- 接続関数における値$k$を持つ集合族は,高々$O(n^{4k})$個の要素からなるリストで表現可能である。
- この表現は,包含されるべき集合,除外されるべき集合,および残りの要素の分割から構成される。
- 固定された$k$に対して,指定されたカルディナリティ制約を満たす集合$A$を見つけるための多項式時間アルゴリズムが得られる。
マルチモーダル大規模言語モデルに基づくビーム予測 [eess.SP, cs.IT, math.IT]目的:次世代無線通信システムのためのビーム予測精度向上
- 無線通信の性能向上には,正確なビーム形成が不可欠である。
- 環境変化へのロバストなビーム予測が課題となっている。
- マルチモーダルな情報を用いた高精度なビーム予測手法を開発する。
- 提案手法は,RGBカメラ画像やLiDAR点群などのセンサ情報を活用し,環境の変化に強いビーム予測を実現した。
- 大規模マルチモーダルデータセット「Multimodal-Wireless」を構築し,高精度な予測を可能にした。
- Top-1精度80.8%,正規化ゲイン89.1%を達成し,既存手法を上回る性能を示した。
