arXiv雑要約
プログラム - 2026/03/19 公開
ソフトウェア開発における生成AIの現状:文献調査と開発者調査からの考察 [cs.SE, cs.AI, cs.CY, cs.ET, cs.HC]目的:ソフトウェア開発における生成AIの利用状況とその影響
- ソフトウェア開発は経済社会の基盤であり,その効率化は重要である。
- 生成AIの活用は進んでいるものの,ライフサイクル全体での体系的な分析が不足している。
- 生成AIがソフトウェア開発の各段階に与える影響を定量的に明らかにすること。
- 生成AIは,設計,実装,テスト,ドキュメント作成において高い効果を発揮し,開発時間の短縮に貢献している。
- 79%の開発者が毎日生成AIを利用しており,ブラウザベースのLLMを好んで使用している。
- 生成AIの価値創造は,定型的なコーディングから仕様の質,アーキテクチャ設計,監督へと移行しており,ガバナンスの重要性が増している。
側方流動に対する木構造機械学習モデルの形式検証 [cs.LG, cs.LO]目的:側方流動予測のための木構造機械学習モデルの物理的整合性検証
- 地盤災害予測において機械学習の活用が期待される。しかし,データ依存性が課題となる。
- 既存手法では,個別の予測の説明やモデル能力の制限にとどまり,網羅的な保証が得られない。
- 本研究は,モデル全体の物理仕様を満たすか厳密に検証する手法を提案する。
- 訓練済み木構造アンサンブルを論理式に変換し,SMTソルバーを用いて物理仕様の検証を行った。
- 制約なしEBMは全ての仕様に違反したが,制約付きEBMは3/4の仕様を満たし,検証に基づく反復的な制約適用が有効であることが示された。
- 精度と物理的整合性の間にはトレードオフが存在し,高い精度と完全な適合性を両立するモデルは見つからなかった。
重み付き $(\alpha,\beta)$-スパナーに対する貪欲な補完法 [cs.DS]目的:重み付きグラフに対する$(\alpha,\beta)$-スパナーの構成
- グラフ理論において,距離の近似を効率的に行うため,スパナーは重要な役割を果たす。
- 既存のスパナー構成法では,グラフのサイズやスパナーのパラメータによっては,計算量が増大する課題があった。
- 貪欲な補完法を用いることで,より効率的なスパナー構成を目指す。
- 重み付きグラフに対し,疎な初期グラフから出発し,悪い伸縮性を持つ頂点対を繰り返し修正する貪欲な補完法を提案した。
- この手法により,これまで知られていなかった$(k,k-1)$-スパナーを$\tilde{O}(n^{1+1/k})$のサイズで構成できることを示した。
ソフトウェアエンジニアリング教育におけるLLMの利用,不正行為,および学術的誠実性 [cs.CY, cs.SE]目的:ソフトウェアエンジニアリング学生によるLLM利用に関する経験の記述
- ソフトウェアエンジニアリング教育の質保証は,社会が求める専門家育成に不可欠である。
- 従来の教育現場では,協調,再利用,外部からの支援に関する曖昧さが課題であった。
- LLMの利用状況と不正行為の関連性を明らかにすることで,適切な教育方法を模索する。
- 学生によるLLMの不正利用は,主にプログラミング課題,定期的な授業,ドキュメント作成において報告された。
- 時間的プレッシャーや不明確な指示が,不正利用の要因として挙げられた。
- 学生はLLM不正利用による学術的・職業的影響を認識している一方,正式な制裁は限定的であると認識している。
新しい貪欲法スパンナとその応用 [cs.DS]目的:グラフに対する$(\alpha,\beta)$-スパンナの計算手法
- ネットワークの効率的なルーティングや近似最短路問題において,スパンナは重要な役割を果たす。
- 既存のスパンナ構築アルゴリズムは,故障に対する耐性や重み付きグラフへの適用において課題があった。
- 故障耐性を持つスパンナや重み付きグラフに対する高性能なスパンナ構築を目指す。
- マルチグラフに対し,$f$辺の故障に耐える$(k,k-1)$-スパンナを,サイズ$O(fn^{1+\frac1k})$で構築するアルゴリズムを提案した。
- 重み付きグラフに対し,$O(n^{1+\frac{1}{k}})$辺を持つスパンナを構築し,パス長の近似精度を向上させた。
- クラスタリングとボール成長法を用いることで,貪欲法アルゴリズムの性能を分析し,より短い証明を得た。
Verilog設計のベクトル化とその検証・合成への影響 [cs.PL, cs.AR]目的:Verilog設計におけるベクトル化の実現と,その効果の検証
- デジタル回路設計において,設計規模の拡大と複雑化が進み,効率的な設計手法が求められている。
- Verilog HDLではベクトル表記は可能だが,合成ツールがベクトル信号を単一のエンティティとして扱わないため,ベクトル化の恩恵を受けにくい。
- ベクトル化によって記号的な複雑さを軽減し,形式検証ツールの効率向上を目指す。
- 提案するVerilogベクトル化ツールは,CIRCTコンパイラ基盤上で,複数のベクトル化パターンを認識できる。
- 実験の結果,Jasper形式検証ツールにおいて,ベクトル化により,展開時間が28.12%改善し,メモリ消費量は51.30%削減された。
- ChiBenchコレクションの1,157のデザインを対象とした評価で,上記の効果が確認された。
仕様が創発されるとき:長期的なコーディングエージェントにおける忠実度損失のベンチマーク [cs.SE, cs.AI]目的:長期的なコーディングエージェントにおける忠実度損失の評価
- ソフトウェア開発において,要件定義は開発の成功を左右する重要な要素である。
- 従来のベンチマークは完全な仕様を事前に与えるのに対し,実際の開発は段階的に仕様が明らかになることが多い。
- 段階的な仕様開示下でのコーディングエージェントの忠実度低下を評価し,その対策を検討すること。
- Claude CodeとCodexを評価した結果,単発仕様の方が多くの論文で高い実装忠実度を示した。
- 特にClaude Codeにおいて,構造的統合と意味的忠実度の両方で損失が見られた。
- ProjectGuardの導入により,Claude Codeにおける忠実度低下を90%まで回復し,重大な失敗を減少させることに成功した。
意味的通信のためのトポロジー保存型深層結合ソース・チャネル符号化 [cs.LG, cs.IT, eess.IV, math.IT]目的:意味的通信におけるグローバルな構造情報の保存
- 自動運転等の無線画像応用では,ピクセル単位の精度より構造情報の維持が重要である。
- 既存の深層結合ソース・チャネル符号化(DeepJSCC)は,ピクセル単位の損失を最適化するのみで,トポロジー保護がない。
- 画像や潜在特徴のトポロジーの一貫性を保ち,ロバストな潜在多様体を実現すること。
- 提案手法TopoJSCCは,持続ホモロジー正則化により,エンドツーエンド学習でトポロジーの一貫性を維持する。
- Wasserstein距離を最小化することで,オリジナル画像と再構成画像のcubical持続ホモロジー図形間の差異を抑制する。
- 低SNRや低帯域幅条件下で,トポロジー保存性とピーク信号対雑音比(PSNR)が向上することを示した。
区分されたダイグラフの上向きブック埋め込み [cs.DS, cs.CG]目的:区分されたダイグラフの上向きブック埋め込みの存在判定
- グラフ描画やネットワーク可視化において,グラフの構造を理解しやすい形で表現することが重要である。
- グラフの辺が交差しないようにページに分割する上向きブック埋め込みの判定は,一般にNP困難である。
- ページ数が2の場合の上向きブック埋め込みの存在判定問題について,その複雑性を明らかにすること。
- ページ数が2の場合,上向きブック埋め込みの存在判定問題はNP困難であることが示された。
- あらかじめ平面埋め込みが与えられたグラフに対しては,O(n log^3 n)時間で上向きブック埋め込みの存在判定が可能である。
- 二連結な有向部分2木に対しては,O(n^3)時間で判定するアルゴリズムが提示された。
IDベースソフトウェア署名のユーザビリティに関する縦断的研究 [cs.SE, cs.CR]目的:IDベースソフトウェア署名ツールのユーザビリティ問題の経時的な変化
- ソフトウェアの供給元を検証し,安全性を確保する上で,署名技術は不可欠である。
- 署名・検証作業のユーザビリティが低いと,導入が進まず,セキュリティが損なわれる可能性がある。
- 署名エコシステムのユーザビリティ改善に向け,検証プロセスを重視する必要がある。
- 5つのオープンソース署名エコシステムにおけるGitHub issue約3,900件を分析した結果,検証フロー,ポリシー設定,連携箇所にユーザビリティ上の問題が集中していることが明らかになった。
- 経時分析により,多くのエコシステムで報告される問題数は大幅に減少したが,検証フローや設定に関する問題は依然として残存している。
- IDベース署名は一部の負担を軽減するものの,検証の複雑さが残るため,今後の設計では検証プロセスを重視すべきである。
意図の形式化:AIエージェント時代の信頼性のあるコーディングのための大きな課題 [cs.SE, cs.AI, cs.PL]目的:意図の形式化
- ソフトウェア開発における信頼性は不可欠であり,AIの進化と共にその重要性は増している。
- 自然言語による要求とプログラムの動作との間のずれ(意図のギャップ)が長年の課題である。
- AI生成コードの信頼性を確保するため,意図を検証可能な形式仕様に翻訳する必要がある。
- 意図の形式化は,軽微なテストから完全な形式検証まで,状況に応じた信頼性レベルを提供する。
- 仕様の検証がボトルネックであり,ユーザーとの対話やテストなどの指標による品質評価が求められる。
- インタラクティブなテスト駆動型形式化,AI生成の事後条件,エンドツーエンドの検証パイプラインの有効性が示されている。
ブロック構造DNAベースデータストレージのための符号化情報検索 [cs.IT, math.CO, math.IT]目的:ブロック構造化データに対する符号化情報検索の達成可能な期待検索時間ペアの特性評価
- DNAストレージは,大容量かつ長期保存が可能であり,次世代のデータストレージ技術として注目されている。
- DNAストレージにおけるデータベースのブロック構造化されたデータの効率的な検索は未解決の問題である。
- 本研究は,ブロック構造化データの符号化情報検索における理論的な限界を明らかにする。
- 線形コードの生成行列Gを用いて,期待検索時間ペア(E_1(G), E_2(G))の達成可能な集合を特徴づけるための双対的なアプローチを提案した。
- 混合列を持たないコードに対して,双曲線制約 s_1/E_1 + s_2/E_2 ≤ 1 が導出され,これが普遍的に成り立つと予想される。
- ファイル専用MDSコードが,漸近的な限界領域において双曲線境界を達成することが示され,限界領域の正確な境界であると予想される。
エネルギーフローグラフ:ソフトウェアのエネルギー消費モデリング [cs.SE]目的:ソフトウェアのエネルギー消費のモデル化
- 計算システムのエネルギー需要が増大しており,性能重視からエネルギー消費を主要な設計要素とする設計への根本的な転換が必要である。
- 既存のアプローチでは,エネルギー消費を集合的・決定論的な特性として扱い,計算経路に依存するエネルギー消費の違いを無視している。
- エネルギー消費の経路依存性を考慮した体系的なエネルギー最適化手法を確立することを目指している。
- エネルギーフローグラフ(EFG)は,状態と遷移にエネルギーコストを付与した状態遷移システムとして計算プロセスを表現する。
- 350万回の実行による検証で,15.6%の解に高い経路依存性変動が見られた。構造的最適化により,最大705倍のエネルギー削減が確認された。
- AIパイプラインにおけるカスケードモデルは,最適化の組み合わせを5.1%の誤差で予測し,22回の測定で420万通りの可能性から選択を可能にした。
PAuth - エージェントのための正確なタスク範囲の認可 [cs.CR, cs.AI, cs.PL]目的:エージェントによるタスク遂行に必要な操作範囲の認可モデル
- AIエージェントの普及に伴い,Webサービスとの連携における安全な認可メカニズムが重要となる。
- 従来の認可モデルは,オペレーターに広範な権限を付与するため,過剰な権限を持つエージェントのリスクがある。
- ユーザータスクに必要な最小限の操作範囲のみを認可するモデルを構築し,安全性を高める。
- PAuthは,自然言語タスクの実行に必要な具体的な操作のみを暗黙的に認可する新しいモデルである。
- 評価の結果,PAuthは通常のタスクを正常に実行し,不正な操作を検知して警告を発することが確認された。
- この結果は,PAuthが権限に関する正確な推論を行うことを示している。
コード生成LLMにおけるデータポイズニングの検出:ブラックボックス脆弱性指向スキャンによる [cs.CR, cs.AI, cs.SE]目的:コード生成LLMに対するデータポイズニング攻撃の検出
- ソフトウェア開発におけるLLM活用が拡大しており,その安全性確保が重要である。
- 既存の手法は,構文の多様性により,コードにおける攻撃ターゲットの特定が困難である。
- コード生成LLM固有の構造的類似性に着目し,効率的なポイズニング検出を目指す。
- CodeScanは,異なるプロンプトに対する複数回のコード生成結果を分析し,構造的類似性を検出する。
- ASTを用いた正規化により,構文上の差異を吸収し,意味的に等価なコードを統一することで,攻撃構造を特定する。
- 108モデルの実験により,97%以上の検出精度と低い誤検出率を達成し,有効性が確認された。
対話は安価,論理は困難:LLMの事後条件形式化のベンチマーク [cs.CY, cs.SE]目的:プログラムの事前条件と事後条件の形式化
- プログラム検証の堅牢な基盤となりうるが,開発者が記述する例は稀である。
- 形式仕様の自動生成が困難であり,プログラム検証のボトルネックとなっている。
- LLMを用いて事前条件と事後条件の自動生成を可能にし,検証効率を向上させる。
- LLMは自然言語記述に基づき,有効な事前条件と事後条件を生成できることが示された。
- 商用モデルはオープンソースモデルよりも誤りの少ない結果を出したが,偽陰性の割合はやや高い傾向があった。
- 自動生成テストをデータセットに加えることで,正解と判定されていた誤った解が明らかになった。
CODMAS:構造化RTL最適化のための弁証的多エージェント協調フレームワーク [cs.RO, eess.SY, cs.SY, math.OC, cs.CL, cs.AR, cs.PL]目的:RTL最適化の自動化
- 電子設計自動化において,電力,性能,面積(PPA)の改善は不可欠である。
- RTLコードの最適化は複雑であり,手動での作業は時間がかかる。
- 多エージェント協調によるRTL最適化の効率化と自動化を目指す。
- CODMASは,パイプライン化において,クリティカルパス遅延を約25%削減することに成功した。
- クロックゲーティングにおいては,電力消費を約22%削減し,従来のプロンプトやエージェントによる手法よりも機能エラーとコンパイルエラーを減少させた。
- 構造化された多エージェント推論が,RTL最適化の自動化を大幅に向上させ,より複雑な設計にも適用可能であることを示した。
SYMDIREC:RTL合成と要約を強化するためのニューロシンボリック分割・検索・征服フレームワーク [cs.CL, cs.PL]目的:RTL合成と要約の性能向上
- ハードウェア設計自動化において,RTL合成と要約は不可欠であり,効率化が求められている。
- LLMはHDL構文の厳格さや指導データの不足から,RTLタスクで十分な性能を発揮できていない。
- シンボリックプランニングを取り入れ,RTLタスクの構造的精度を高めることを目指す。
- SYMDIRECは,VerilogとVHDLの両方をLLMのファインチューニングなしにサポートし,RTLタスクにおいて高い性能を示す。
- 合成タスクではPass@1レートが約20%向上し,要約タスクではROUGE-Lスコアが15-20%改善された。
- これらの結果は,RTLタスクにおけるシンボリックガイダンスの有効性を示唆している。
AIエージェントのためのグラフネイティブ認知メモリ:バージョン管理メモリアーキテクチャに対する形式的な信念修正意味論 [cs.AI, cs.IR, cs.LO]目的:AIエージェントの認知メモリアーキテクチャの形式的な基礎付け
- AIエージェントの性能向上には,長期的な知識の効率的な管理が不可欠である。
- 既存のメモリシステムは,アーキテクチャの統合や形式的な保証が不足している。
- 信念修正の形式理論を用いて,認知メモリの整合性と推論能力を向上させる。
- Kumihoは,グラフネイティブな認知メモリアーキテクチャであり,AGM信念修正の公理を満たすことを形式的に証明した。
- LoCoMoベンチマークにおいて,高いF1スコア(0.565)と敵対的拒否精度(97.5%)を達成した。
- LoCoMo-Plusベンチマークでは,93.3%の判定精度を達成し,既存のベースラインモデルを大幅に上回った。
漸近的に理想的な分割階層型秘密分散スキームの明示的構成 [cs.IT, math.IT]目的:漸近的に理想的な分割階層型秘密分散スキームの構成
- 情報セキュリティにおいて,秘密情報の保護は極めて重要である。秘密分散は,そのための有効な手法の一つである。
- 既存の理想的なスキームは共有サイズの巨大さが課題であり,非理想的なスキームは安全性と漸近的理想性の両立が難しい。
- 共有サイズを小さく抑えつつ,安全性と漸近的理想性を両立するスキームを構築することを目指す。
- 本研究では,多項式,線形同次漸化式,一方向関数を用いて,漸近的に理想的な分割階層型秘密分散スキームを明示的に構成した。
- 提案スキームは計算安全性,多くの公開値を持つが,共有サイズは小さく,配布者は多項式時間で処理可能である。
実環境における脆弱性パッチ特定手法の再検討 [cs.SE, cs.CR]目的:実環境における脆弱性パッチ特定性能の評価
- サイバー攻撃は日々巧妙化しており,未公開の脆弱性を突く攻撃も増加傾向にある。
- 大量のコミットから脆弱性パッチを手動で特定することは現実的ではない。
- NVDデータのみで学習したモデルの汎化性能低下を検証し,改善策を検討する。
- NVDデータで学習したモデルは,実環境のパッチに対する性能が大幅に低下する。
- NVD由来のパッチと実環境で発見されたパッチは,特徴に明確な差異が見られる。
- NVDデータに少量の手動特定パッチを組み合わせることで,モデルのロバスト性を向上させることが可能である。
シャノンはゲーデル・タルスキ・ローブに出会う:有限状態チャネルのシャノンフィードバック容量の決定不能性 [cs.IR, cs.IT, eess.SP, math.IT]目的:有限状態チャネルのフィードバック容量の正確な決定問題
- 通信システムの効率的な設計には,チャネルの容量を正確に把握することが不可欠である。
- 有限状態チャネルのフィードバック容量の正確な決定は,計算複雑性の問題から困難である。
- 有限状態チャネルのフィードバック容量の決定不能性を示すことで,その限界を明らかにする。
- 有限状態チャネルのフィードバック容量の正確な閾値問題は,たとえ非常に制約されたクラスのチャネルであっても決定不能であることが証明された。
- この結果は,実数の存在論的理論では正確な閾値述語が表現できないことを意味する。
- この決定不能性は,有限状態チャネルにおける正確なフィードバック容量の推論の根本的な限界を示唆する。
機械学習サービス誤用の特定と検出手法:MLmisFinder [cs.SE]目的:機械学習サービス誤用の検出
- 機械学習の活用は拡大する一方であり,ソフトウェア開発において不可欠となっている。
- 機械学習サービスの利用増加と要件の複雑化により,品質や保守性を損なう誤用が多発している。
- 機械学習サービスの誤用を自動的に検出し,適切な利用を支援することを目的とする。
- MLmisFinderは,機械学習サービス誤用の検出において,平均で96.7%の適合率と97%の再現率を達成した。
- 既存手法と比較して高い性能を示し,機械学習サービスに基づいたシステムの誤用が広範に存在することが判明した。
- データドリフトの監視やスキーマ検証などの分野において,特に誤用が多い傾向が明らかになった。
重み付き$d$- matroid交差に対する到達可能性を持つ多項式カーネル [cs.DS]目的:重み付き$d$- matroid交差問題に対する多項式カーネルの存在
- 組合せ最適化問題の効率的解決には,問題サイズの縮小が不可欠である。
- 重み付き$d$- matroid交差問題はNP困難であり,効率的なアルゴリズムが求められている。
- 一般的な matroid に対しても多項式カーネルを構成し,問題解決の効率化を目指す。
- 一つの matroid が任意の matroid で,残りの $d-1$ 個が partition matroid である場合,多項式カーネルが存在する。
- このカーネルのサイズは $\tilde{O}(k^d)$ であり,$d$-次元マッチング問題に対する最適限界と一致する。
- 提案手法は graphic, cographic, transversal matroid など,より広いクラスの matroid にも適用可能である。
コーディングエージェントの自己ブートストラップ:仕様即ちプログラム [cs.SE, cs.LG]目的:コーディングエージェントによる自己再現の検証
- AI技術の進化において,自動プログラミングは重要な役割を担う。
- 既存のAIコーディングエージェントは,複雑な仕様の理解と正確な実装が課題。
- 仕様に基づいた自己再現能力を高め,安定したソフトウェア開発を実現する。
- 926語の仕様書と初期実装から,新たに生成されたエージェントが仕様を正確に再現した。
- これはコンパイラ構築における古典的なブートストラップシーケンス,及びLispのメタ循環特性をAIコーディングエージェントの領域で再現したものである。
- 仕様が記録に残すべき安定した成果物であり,エージェントの改善は仕様の改善を意味することが示唆された。
Leanにおける合成微分幾何 [cs.NI, cs.DC, cs.LO, math.DG]目的:Leanとmathlibを用いた合成微分幾何学の形式化
- 微分幾何学は,多様体の性質を研究する上で不可欠な数学分野である。
- 形式的な証明支援システムにおける微分幾何学の形式化は困難を伴う。
- 微小近傍における多変数関数のテイラーの定理を形式的に証明すること。
- 本研究では,Leanとmathlibを用いて多変数関数のテイラーの定理を形式化し,証明した。
- 証明の多くは新規のものであり,mathlibを用いた構成的数学の可能性を示唆する。
- 合成微分幾何学の形式化を通して,証明支援システムの数学的応用範囲を広げた。
逆リンドン配列:定義,特性,および線形時間構成 [cs.DS, cs.FL]目的:逆リンドン語に対するリンドン配列の類似構造である逆リンドン配列の構築
- 文字列の組み合わせ論において重要な役割を果たす構造であり,接尾辞配列などの基本データ構造の構築に応用される。
- 通常の(正)リンドン語とは異なり,逆リンドン語は自明でない境界を持つため,理論的な困難が生じる。
- 逆リンドン配列の線形時間構成アルゴリズムを開発し,接尾辞比較への応用を目指す。
- 逆リンドン配列は,次の大きい接尾辞配列と境界補正項によって特徴づけられることが示された。
- この境界補正項は最長共通拡張(LCE)値と一致することが証明された。
- リンドン配列の線形時間構成の枠組みを応用し,一般的な順序付けられたアルファベットに対してO(n)時間のアルゴリズムを導出した。
ε-全知性フロー時間スケジューリングにおけるより単純な解析 [cs.DS]目的:ε-全知性環境における総フロー時間最小化問題に対するSLFアルゴリズムの最適性証明の簡略化
- ジョブスケジューリングは,計算資源の効率的な利用に不可欠であり,様々な分野で重要な役割を果たす。
- 従来の解析は複雑で理解が難しく,アルゴリズムの実用的な応用を妨げる要因となっていた。
- SLFアルゴリズムの最適性証明を簡略化することで,アルゴリズムの理解と実装を容易にすること。
- 本研究は,GuptaらのSLFアルゴリズムの最適性証明を簡略化することに成功した。
- 簡略化された証明は,より直感的で理解しやすく,アルゴリズムの実用的な応用を促進する。
VeriAgent:PPAを考慮したRTLコード生成のためのツール統合型マルチエージェントシステム(進化型メモリ付き) [cs.CL, cs.PL]目的:PPA(電力,性能,面積)を考慮した高品質なVerilogコード生成
- 高性能なハードウェア設計において,電力,性能,面積の最適化は不可欠である。
- 従来のLLMによるRTLコード生成は,機能的な正しさに偏り,PPAの最適化が不十分である。
- 本研究は,PPAを考慮したRTLコード生成を実現し,ハードウェア設計フローへのLLMの適用を促進する。
- 提案手法は,機能的な正しさを維持しつつ,PPAメトリクスにおいて有意な改善を実現した。
- EDAツールを閉ループのワークフローに統合することで,機能性と物理指標の同時最適化を可能にした。
- 進化型メモリメカニズムにより,モデルの再学習なしに継続的な改善をサポートし,スケーラブルなハードウェア設計フローを実現する。
プログラムハイパーグラフ:幾何代数,空間コンピューティング,物理認識コンパイルのための多方向関係構造 [cs.PL, cs.AR]目的:プログラムハイパーグラフの提案
- ヘテロジニアスコンピューティングの性能向上が重要であり,タイル配置やルーティング制約の最適化が不可欠である。
- 従来のプログラム意味グラフでは,多方向関係や幾何代数の表現に構造的な限界があった。
- 幾何代数や空間データフローアーキテクチャに対応可能なコンパイルフレームワークの構築を目指す。
- プログラムハイパーグラフは,プログラム意味グラフの拡張であり,多方向関係を表現できる。
- 幾何代数における次数は,既存の型システムにおける自然な次元軸として扱えることが示された。
- 幾何代数ライブラリの型理論的なギャップを埋め,コンパイルにおいて幾何学的な正確さ,メモリ配置,数値精度を統合的に導出できるフレームワークを実現した。
ソフトウェアアーキテクチャ設計における要件変動:事例研究 [cs.SE]目的:ソフトウェアアーキテクチャ設計における要件変動の影響
- ソフトウェア開発において,要件はプロジェクト成功の基盤であり,その品質が重要である。
- 要件変動が頻発すると,設計変更や手戻りが生じ,開発効率を低下させる問題がある。
- 要件変動がソフトウェアアーキテクチャ設計に及ぼす影響を明らかにすることで,より堅牢な設計を支援する。
- 本研究により,要件の不確実性や動的なビジネス環境が,要件変動の主な要因であることが示された。
- 要件変動は,スケジューリングの遅延や技術的負債の増加など,ソフトウェアアーキテクチャ設計に様々な課題をもたらすことが明らかになった。
- 要件変動の要因を軽減し,課題に対処するための手段について考察することで,アーキテクトへの支援を目指した。
記号から意味へ:情報システム工学における大規模言語モデルの存在論的・哲学的考察 [cs.SE]目的:大規模言語モデルの存在論的・哲学的影響に関する考察
- 情報システム工学の理論的基盤を揺るがす大規模言語モデルの出現は,学術的な探求を必要とする。
- 従来の認識論的・記号論的仮定が,大規模言語モデルの登場により再検討を迫られている。
- 大規模言語モデルが言語,意味,システム設計の関係に及ぼす影響を考察し,倫理的な枠組みを提示する。
- 大規模言語モデルは,単なる自動化ツールではなく,情報システム工学の哲学的・記号論的基盤を再構築する認識主体として理解されるべきである。
- 生成モデルの論理は,古典的な存在論と記号化の概念を拡張すると同時に不安定化させる。
- 透明性があり,倫理的に整合性の取れた枠組みに基づいた大規模言語モデルシステムの構築が不可欠である。
有限ブロック長大規模IoTにおける物理層セキュリティ:ランダム配置盗聴者に対する考察 [cs.DB, cs.IT, cs.SY, eess.SY, math.IT]目的:大規模IoTネットワークにおける物理層セキュリティ性能の解析
- IoTデバイスの普及に伴い,セキュリティリスクの増加が課題となっている。
- 短パケット通信における有限ブロック長制約が,セキュリティ性能を低下させる。
- ランダム配置盗聴者を考慮した環境下での,セキュリティ性能を定量的に評価する。
- 本研究では,確率的幾何学的手法を用いて,セキュリティ性能を解析した。
- その結果,確率的干渉,フェージング,盗聴者の空間的不確実性が,セキュリティ性能に影響を与えることが示された。
- ネットワークおよびチャネル条件が異なる環境下でのシステム動作を数値的に検証した。
進化する意味論的通信のためのキャッシュ利用型生成共同ソースチャネル符号化 [cs.IT, eess.IV, math.IT]目的:意味論的通信における無線ネットワークの伝送効率向上
- 無線通信において,データ量を削減し効率的な伝送を実現することは重要である。
- 既存手法は,動的な環境への対応が難しく,計算コストが高いという課題がある。
- 事前学習済みのモデルを活用し,学習不要で無線環境に適応する手法を提案する。
- 提案手法は,既存手法と比較して,大幅な帯域圧縮率を実現した。
- 平均帯域圧縮率は1/224であり,単一画像では1/1024を達成した。
- 知覚的品質を維持しつつ,高い圧縮率を達成することにより,効率的な通信を実現した。
二部グラフにおける二部完全部分グラフの再構成 [cs.DS]目的:二部グラフにおける二部完全部分グラフの再構成可能性
- グラフ理論はネットワークやシステムのモデリングに不可欠であり,計算複雑性は実用上の制約となる。
- グラフの再構成問題は計算複雑性が高く,効率的なアルゴリズムの発見が課題である。
- 二部グラフにおける二部完全部分グラフの再構成問題の複雑性を解明し,既存研究の限界を克服する。
- 二部グラフにおけるBalanced Biclique ReconfigurationはPSPACE-完全であることが証明された。
- これにより,$(i, j)$-完全二部グラフであるかどうかのSubgraph ReconfigurationもPSPACE-完全であることが示された。
- Connected Components ReconfigurationもPSPACE-完全であることが証明され,Nakahata氏の未解決問題に否定的な答えを与えた。
CodeT5-RNN:コード理解の強化に向けた文脈埋め込みの強化 [cs.SE]目的:コード理解のためのLLM埋め込みの改良
- ソフトウェア開発において,コードの正確な理解は品質と効率に不可欠である。
- LLM埋め込みは位置情報に依存しやすく,長距離の依存関係を捉えにくい場合がある。
- RNNを用いてLLM埋め込みを強化し,コードの順序依存性をより正確に捉える。
- 提案手法であるRoBERTa-BiGRUおよびCodeBERT-GRUは,欠陥検出ベンチマークでそれぞれ66.40%,66.03%の精度を達成した。
- CodeT5-GRUとCodeT5+-BiGRUは,ベースモデルを上回り,RoBERTa-BiGRUおよびCodeBERT-GRUよりも高い精度を示した。
- 実世界のデータセットにおける実験でも,一貫した改善が確認された。
FailureMem:故障を意識した自律ソフトウェア修理のためのマルチモーダルフレームワーク [cs.SE, cs.AI]目的:自律ソフトウェア修理のためのマルチモーダルフレームワーク
- ソフトウェアの信頼性向上は不可欠であり,自動化された修理技術の発展が求められている。
- 既存の修理システムは,柔軟な探索や局所的な視覚的根拠付けが不十分である。
- 過去の失敗事例を再利用し,修理の成功率を向上させることを目指す。
- FailureMemは,構造化された局所化と柔軟な推論を両立させるハイブリッドなワークフロー・エージェントアーキテクチャを統合する。
- 領域レベルの視覚的根拠付けを可能にするアクティブパーセプションツールを導入する。
- 過去の修理試行を再利用可能なガイダンスに変換するFailure Memory Bankを構築し,SWE-bench MultimodalにおいてGUIRepairよりも3.7%高い解決率を達成した。
CodeScout:コード検索エージェントの強化学習のための効果的なレシピ [cs.SE, cs.AI, cs.CL]目的:コード検索における強化学習のための効果的なレシピ
- 大規模なコードリポジトリを扱うエージェント開発において,関連コードの特定は不可欠である。
- 既存手法は複雑なツールに依存し,汎用的な環境での学習が困難である。
- 標準的なUnix端末のみで強化学習を行い,高性能なコード検索エージェントを実現する。
- CodeScoutは,SWE-Benchの各ベンチマークで,大規模なLLMや商用モデルに匹敵する性能を示す。
- 従来の環境を再利用する手法,報酬設計,RL最適化が,高い性能に貢献している。
- CodeScoutのモデル,コード,データは公開されており,コミュニティでの発展に貢献する。
ArchBench:ソフトウェアアーキテクチャタスクのための生成AIのベンチマーク [cs.SE]目的:ソフトウェアアーキテクチャタスクにおける生成AIの能力評価
- ソフトウェアの複雑化に伴い,アーキテクチャの維持・進化が重要である。
- 既存のベンチマークは実装の正確性に偏っており,アーキテクチャタスクの比較が困難である。
- アーキテクチャタスクの客観的な評価を可能にし,生成AIの能力向上に貢献する。
- ArchBenchは,ソフトウェアアーキテクチャタスクに特化した初の統一的なベンチマークプラットフォームである。
- 標準化されたパイプラインにより,データセットのダウンロード,推論,自動評価を容易に行うことができる。
- プラグインアーキテクチャを採用し,タスクの追加や評価結果の共有を促進することで,コミュニティの貢献を支援する。
scicode-lint:LLM生成パターンを用いた科学的Pythonコードにおける方法論的バグの検出 [cs.SE, cs.AI, cs.LG]目的:科学的Pythonコードにおける方法論的バグの検出
- 科学研究における再現性の確保は重要であり,コードの信頼性が不可欠である。
- 従来のlinterでは検出困難な,妥当だが誤った結果を生む方法論的バグが存在する。
- LLMを活用し,自動化された方法論チェックによるバグ検出の効率化を目指す。
- Kaggleノートブックの検証で,データリーク検出において100%の再現率と65%の適合率を達成した。
- 38の学術論文に対する検証では,LLMによる判断で62%の適合率が得られた。
- 制御されたテストでは,66のパターンに対して97.7%の精度を示した。
アクターベースシステムにおける因果関係のオーケストレーション [cs.SE, cs.LO]目的:アクターベースシステムの因果関係追跡フレームワーク
- システムの信頼性向上に,実行時検証の重要性が増している。
- アクター間の複雑な因果関係や非決定的なメッセージ送信が課題。
- 既存の監視ツールでは,マルチアクターシステムの因果関係追跡が困難。
- 本研究では,Erlang向けにアクター間の因果関係を自動追跡するACTORCHESTRAを開発した。
- ターゲットシステムへのコード挿入により,手動修正なしで因果関係の追跡基盤を確立した。
- WALTZという仕様言語を提供し,マルチアクタープロパティの記述を容易にした。
非一様コストモデルにおける平均ケースグラフ探索 [cs.DS, cs.IR]目的:グラフにおける平均ケース探索コストを最小化する探索戦略の設計
- グラフ探索は,ネットワーク検索やデータベース探索など,様々な分野で基盤となる重要な問題である。
- 探索コストのモデルが複雑になると,最適な探索戦略を見つけることが困難になる。
- 非一様コストモデルにおける効率的な探索戦略を開発し,近似率を保証することを目指す。
- 均一コストの場合,木構造に対して(4+ε)-近似FPTASをO(n^4/ε^2)時間で実現した。
- 一般グラフに対しては√log n近似アルゴリズムを導出し,非葉頂点数によるFPTASも提示した。
- 単調非減少コストの木構造に対しては,2-近似アルゴリズムを開発し,最悪ケースにも対応可能である。
CodeGreen:ソフトウェアエネルギー測定の精度と移植性の向上に向けて [cs.SE]目的:ソフトウェアエネルギー測定プラットフォームの設計と実装
- エネルギー最適化は,環境負荷低減やコスト削減に不可欠であり,その精度向上は重要な課題である。
- 既存のプロファイラは,精度とオーバーヘッドのトレードオフを強いられ,特定のハードウェアや言語に依存する傾向がある。
- 本研究は,プラットフォームのモジュール化と非同期アーキテクチャにより,精度と移植性の両立を目指す。
- CodeGreenは,Intel RAPL,NVIDIA NVML,AMD ROCmなどのハードウェアセンサーを独立してポーリングするNative Energy Measurement Backend(NEMB)を実装した。
- Tree-sitter ASTクエリを活用することで,Python,C++,C,Javaなどの言語に対して,手動による介入なしに自動的にインストルメンテーションを行うことが可能である。
- “Computer Language Benchmarks Game”を用いた検証により,RAPLとの相関係数はR^2 = 0.9934,エネルギー-ワークロード間の線形性はR^2 = 0.9997と高い精度が確認された。
TDAD:テスト駆動型エージェント開発 - グラフベースの影響分析によるAIコーディングエージェントのコード回帰削減 [cs.SE, cs.AI]目的:AIコーディングエージェントにおけるコード回帰の削減
- AI技術はソフトウェア開発の自動化を促進するが,品質保証が重要な課題である。
- AIエージェントは問題解決能力を持つ一方で,既存のテストを失敗させる回帰を引き起こしやすい。
- テストの影響分析を通じて,AIエージェントが変更の影響を受けやすいテストを特定し,回帰を抑制する。
- TDADは,SWE-bench Verifiedにおいて,テストレベルでの回帰を70%削減することに成功した。
- TDADのGraphRAGワークフローにより,問題解決率も24%から32%に向上した。
- TDDプロンプト単体では回帰が増加する一方,小規模モデルは文脈情報からより大きな恩恵を受けることが示された。
ソフトウェア脆弱性検出のためのスケーラブルなリポジトリレベルデータセットの構築 [cs.SE, cs.AI]目的:ソフトウェア脆弱性検出のための,正確なラベル付きデータセット
- ソフトウェアの脆弱性は増加の一途をたどっており,その検出は重要な課題である。
- 既存のベンチマークは関数単位に焦点を当てており,現実的な実行環境を捉えられていない。
- 現実的な環境下での脆弱性検出の精度とスケーラビリティの向上を目指す。
- 本研究では,現実的な脆弱性を実際のコードリポジトリに自動的に注入するベンチマークジェネレーターを提案する。
- 再現可能な脆弱性検証(PoV)エクスプロイトを合成し,リポジトリレベルでの脆弱性検出エージェントの学習・評価を可能にする。
- 注入と検出エージェント間の敵対的共同進化ループを通じて,現実的な制約下でのロバスト性を高めることを検討する。
スマートコントラクトにおける脆弱性検出のための機械学習 (拡張版) [cs.CR, cs.ET, cs.LG, cs.SE]目的:イーサリアムのスマートコントラクト脆弱性検出
- ブロックチェーン技術の普及に伴い,スマートコントラクトのセキュリティ確保が重要になっている。
- 既存の脆弱性検出ツールは,速度や精度に課題があり,効率的な分析が困難である。
- 機械学習を用いて,高速かつ高精度な脆弱性検出を実現し,スマートコントラクトの安全性を向上させる。
- 提案手法DLVAは,ソースコードのラベル付けデータを用いて,バイトコードの脆弱性を判断する。
- DLVAは,従来のツールSlitherを上回り,より多くの脆弱性コントラクトを発見し,高精度な検出を実現した。
- DLVAは,29種類の脆弱性について0.2秒でチェック可能であり,既存手法と比較して10倍~1000倍の高速化を実現した。
トゥムラ情報と二重最小化ペッツ・レイニィ・ラウタム情報 [math.OC, cs.SY, eess.SY, quant-ph, cs.IT, math.IT]目的:相関量の性質解明と仮説検定における応用
- 量子情報理論は,量子現象を利用した情報処理の基礎であり,その応用範囲は広い。
- 量子相関の定量化は困難であり,適切な指標の開発が求められている。
- 新たな相関量であるトゥムラ情報とその変種を導入し,その特性を明らかにする。
- トゥムラ情報と二重最小化ペッツ・レイニィ・ラウタム情報(PRLI)の一般的な性質を導出した。
- 特定の二値量子状態識別問題における逆直接指数が,PRLIによって定量化されることを示した。
- サノフ指数はトゥムラ情報によって決定され,チャネルへの拡張も検討した。
アトラクタ鍵付きメモリ [physics.optics, cond-mat.dis-nn, cs.ET, cs.IT, cs.NE, math.IT]目的:物理選択器の特性を利用した,選択とメモリアクセスを統合する新しいアーキテクチャ
- 計算効率と省エネルギー化が重要視される中で,選択とメモリアクセスの高速化は不可欠である。
- 従来の疎性ルーティングアーキテクチャでは,選択とメモリアクセスが分離されており,遅延とエネルギー消費が大きい。
- 物理選択器の署名を活用し,選択とメモリアクセスを統合することで,遅延とエネルギー消費を削減することを目指す。
- 物理選択器の署名が再現性があり,線形独立性を持つ場合,単一の線形デコーダで任意のペイロードにマッピング可能となる。
- この構成には,測定されたデバイス応答のSVDが一つ必要であり,能力を検証し,タスク選択前に最悪の場合のエラーを限定する。
- ランタイムエラーは,デコード忠実度とルーティング信頼性の2つの独立したチャネルに分解され,それぞれに対応した物理的起源と対策が存在する。
強連結向き付けにおける格子構造と効率的な基底構成 [math.CO, cs.DS]目的:強連結向き付けの効率的な基底の構成
- ネットワークフローや組み合わせ最適化問題に応用可能なグラフ理論の重要な分野である。
- 強連結向き付けの基底を効率的に構成するアルゴリズムが未確立であった。
- 強連結向き付けの基底を構成し,関連する問題を多項式時間で解くことを目指す。
- 強連結向き付けのタイトな部分集合からなる基底を多項式時間で構成するアルゴリズムを開発した。
- このアルゴリズムは,既存の非構成的な証明を拡張し,純粋な組合せ論的アプローチを採用している。
- このアルゴリズムの応用として,制約付き強連結向き付け問題を多項式時間で解けることを示した。
線形化リード・ソロモン符号の同値でない数について [math.CO, cs.IT, math.IT]目的:線形化リード・ソロモン符号の同値性の数
- 符号理論は,データ伝送や保存における誤り検出・訂正に不可欠であり,その応用範囲は広い。
- 線形化リード・ソロモン符号の同値性判定は困難であり,符号の分類を妨げる要因となっている。
- 線形化リード・ソロモン符号の同値でない数の公式を導き,分類問題を解決することを目指す。
- 線形化リード・ソロモン符号と$\mathbb{F}_q$-部分空間のシステム間の対応関係を利用し,同値性の判定基準を確立した。
- 二つの線形化リード・ソロモン符号が同値であるための必要十分条件は,符号を定義するノルムの集合が$\mathbb{F}_q^\ast$の元との積で一致することである。
- この結果を用いて,線形化リード・ソロモン符号の同値でない数の公式を導出し,具体的な例で検証した。
- 1
- 2
