arXiv雑要約
プログラム - 2026/04/30 公開
多言語コードインテリジェンスのための大規模言語モデル:サーベイ [cs.SE, cs.LG, cs.PL]目的:多言語コード生成および翻訳の現状と課題
- ソフトウェア開発におけるAI支援の重要性が増しており,その基盤技術として大規模言語モデルが注目されている。
- 既存研究はPythonなどのリソース豊富な言語に偏っており,RustやOCamlといった言語での性能が十分でない。
- 現実世界のシステムは多言語で構成されるため,信頼性の高い多言語コードインテリジェンスが求められている。
- 本サーベイでは,共有された自然言語の要件からの多言語コード生成と,セマンティクスを維持した多言語コード翻訳の2つの主要なタスクに焦点を当てている。
- 代表的な手法,ベンチマーク,評価指標をレビューし,クロス言語の汎化における課題と機会を提示している。
ロボット支援ISACにおける不規則な参照信号を用いた多期間スペクトル法による速度推定 [cs.RO, cs.IT, math.IT]目的:ロボット支援統合センシング・通信(ISAC)における速度推定
- ロボットセンシングを活用した高精度な位置・速度推定は,自動運転等の応用において重要である。
- 既存手法では,速度推定に専用の参照信号が必要であり,通信リソースの制約がある。
- 不規則な5G/6G参照信号のみを利用し,センシング専用の信号や3GPPの修正なしに速度推定を実現する。
- 提案手法は,従来の期間スペクトル法と比較して,低SNR環境下でのロバスト性を向上させる。
- 具体的には,10%の見逃し検出率において3dBのSNRゲインを達成し,誤報を51%削減する。
- 提案手法は,標準規格に準拠しつつ,新たなセンシング専用の参照信号を必要としない。
情報理論的客観関数に基づくKVキャッシュ退去戦略の再考 [cs.LG, cs.AI, cs.IT, math.IT]目的:大規模言語モデル推論におけるKVキャッシュ退去問題の解決
- 大規模言語モデルの性能向上には,効率的なキャッシュ管理が不可欠である。
- 既存の退去戦略は経験則に頼る部分が大きく,理論的根拠に乏しい。
- 情報ボトルネック原理に基づき,キャッシュの有効情報量を最大化する退去戦略を提案する。
- 本研究では,注意機構の線形ガウス近似を用いて,有効情報容量を特徴づける閉形式の相互情報目的関数を導出した。
- 既存の退去戦略は,この容量最大化原理の異なる近似と解釈できることが示された。
- 提案手法CapKVは,統計的レバレッジスコアを用いた対数行列式近似により,情報保存を重視した退去を実現し,実験的に優位性を示した。
エッジシステム向け軽量量子エージェント:PQCとNOMAのリソース割当 [cs.IT, cs.AI, math.IT]目的:量子安全なシナリオにおけるエッジシステムのリソース割当
- エッジコンピューティングは,リアルタイム性と低遅延が求められる現代の無線通信において重要である。
- 従来の資源割当アルゴリズムは複雑で,PQCモジュールのエネルギー消費を考慮していない。
- PQCモジュール消費電力制約下で,リアルタイムな資源割当を実現する。
- 提案手法は,計算スループットを大幅に向上させ,システムキューの安定性とエネルギー消費制約を確保する。
- 従来のSCAアルゴリズムと比較して,計算量を$\mathcal{O}(N)$に削減し,約46倍の高速化を達成した。
- 動的な無線環境において,リアルタイムな意思決定要件を満たすことが示された。
2ナノ秒未満で整数を10進文字列に変換 [eess.SY, cs.SY, physics.soc-ph, cs.DS]目的:整数から可変長の10進文字列への変換
- 計算機科学において基本的な演算であり,表示やデータ処理に不可欠である。
- 既存手法は再帰的除算やルックアップテーブルに依存し,速度改善の余地があった。
- SIMD化による高速化と,入力特性に応じた動的なバリアント選択を実現する。
- 提案手法は,最新のAMD/IntelプロセッサのSIMD命令を活用し,ルックアップテーブルを排除した。
- 分岐の多いバリアントと少ないバリアントの二つの設計を採用し,入力データに応じて使い分けている。
- 様々な整数サイズにおいて,既存手法やC++標準ライブラリ関数std::to_charsを1.4~4倍上回る性能を示した。
マルチエージェントシステムにおける行動のダイナミクスに関する推論:もしできれば実行する [cs.CL, cs.LO, cs.MA]目的:マルチエージェントシステムにおける行動のダイナミクスの推論
- 現実的なMASでは,エージェントは状況に応じて適応する必要がある。そのため,行動のダイナミクスを考慮した論理的枠組みが不可欠である。
- 既存の戦略的論理では,エージェントが利用可能な行動や行動に必要な知識の動的な変化を十分に扱えていない。
- エージェントの行動付与・剥奪のプロセスと,それが知識に及ぼす影響をモデル化することで,この問題を解決することを目指す。
- 本研究では,行動のダイナミクスをモデル化するATL-Dを提案し,知識への影響を捉えるATEL-Dを拡張した。
- ATLとの表現力の関係や,規範システムとの関連性について分析し,計算複雑性に関する結果を得た。
量子ベイズネットワーク:線形論理による構成性と型付け [cs.LO]目的:量子ベイズネットワークにおける構成性と型付け
- 古典・量子データを含むシステムにおける因果関係の分析と確率予測において,重要な数学的枠組みを提供する。
- 既存の量子ベイズネットワークでは,システムの複雑化に伴い,適切な構成性や型付けが課題となっていた。
- 線形論理に基づく型システムを導入し,量子ベイズネットワークの安全な構成を可能にすること。
- 古典的な原因のみの場合,標準的なベイズネットワークの因子分解と一致する。
- 純粋な量子的な場合,テンソルネットワークに帰着する。
- 線形論理の証明網に基づく型化された形式により,システムの適切な構成が保証される。
予測を用いた漸進的な強連結成分 [cs.DS, cs.LG]目的:予測を用いた強連結成分の漸進的な計算手法
- グラフアルゴリズムの効率化は,大規模データ処理やネットワーク分析において不可欠である。
- 動的なグラフ環境における強連結成分の維持は,計算コストが高く,課題となっている。
- 機械学習による予測を活用し,動的な強連結成分計算の効率改善を目指す。
- 良好な予測下では,ほぼ最適な性能を発揮し,予測誤差に応じて性能が緩やかに低下する。
- 提案手法の実装と実データを用いた実験により,理論的な予測と実測時間の改善が一致することを示した。
- この研究は,予測を用いたアルゴリズム設計の有効性を実証する。
GenDetect:模倣型DeFi攻撃カスケードに対するレジリエンスのためのリアクティブな検出の一般化 [cs.CR, cs.SE]目的:模倣型DeFi攻撃カスケードの検出に関する研究
- DeFiプロトコルは成長しており,攻撃者による経済的動機づけられた攻撃が頻発している。
- 従来のセキュリティ対策では,DeFi攻撃の迅速な拡散に対応できない。
- 一度観測された攻撃を,迅速に一般化可能な検出ルールに変換することを目指す。
- GenDetectは,DeFi攻撃の98%を正確に検出し,誤検知率は1%,見逃し率は3%を達成した。
- 過去3年間で56件の未発見の攻撃を新たに発見することに成功した。
- 関数シグネチャのセマンティクス抽象化と,ノイズの多いトランザクションロジックのマッチングという課題を解決した。
SWE-Edit:効率的なSWE-Agentのためのコード編集の再考 [cs.SE, cs.CL]目的:ソフトウェアエージェントにおける効率的なコード編集手法
- ソフトウェア開発の自動化は,生産性向上に不可欠であり,その鍵となるのが高度なコード編集能力である。
- 既存の手法では,コードの確認,修正計画,編集実行が混在し,文脈が複雑化して性能が低下する。
- SWE-Editは,この文脈の複雑さを解消し,エージェントの推論能力を向上させることを目指す。
- SWE-Editは,コード編集を「Viewer」と「Editor」という2つの専門エージェントに分離することで,文脈依存性の高い処理を効率化する。
- 編集モデルの有効性を検証した結果,適応的に編集モードを選択する手法が,従来の置換形式よりも優れた性能を発揮した。
- SWE-bench Verifiedにおいて,解決率が2.1%向上し,推論コストが17.9%削減された。また,エージェントの性能を予測するコード編集ベンチマークを提案した。
3GPP 5G-Advanced ISACネットワークにおけるマルチTRP支援UAV検知 [cs.HC, cs.IT, math.IT]目的:UAV検知のための,3GPP 5G-Advanced ISACネットワークにおけるマルチTRP支援
- 通信インフラによるセンシング技術が,新たな応用分野の創出に不可欠である。
- 単一TRPによるセンシングでは,角度範囲の制限や遮蔽の影響を受けやすく,検知信頼性が低い場合がある。
- マルチTRPを用いることで空間的多様性を確保し,UAV検知におけるセンシングのロバスト性を向上させる。
- マルチTRP支援により,ターゲットの可視性が向上し,誤検出が抑制され,位置推定誤差の分布が狭くなることが確認された。
- 2つのTRPからの投票閾値を設定することで,見逃し率と誤報抑制の間の最適なトレードオフが実現し,3GPPの性能目標を満たした。
- センシング更新間隔を長くすることで,センシングオーバーヘッドを大幅に削減し,よりスケーラブルなネットワーク展開を可能にした。
LLMによる未テストコード領域からの課題自動生成 [cs.SE]目的:未テストコード領域におけるバグの発見と,優先順位付けされた実行可能な課題報告の自動生成
- AIによる課題報告の増加に伴い,開発者の負担が増大しており,自動バグ検出ツールの信頼性向上が課題となっている。
- AI生成された課題報告は,実行可能性や再現性に欠け,開発者の信頼を得られていない現状がある。
- 本研究では,AIとカバレッジ分析を組み合わせることで,質の高い課題報告を生成し,開発者の負担軽減を目指す。
- IssueSpecterは,13のPythonプロジェクトで10,467件の課題報告を生成し,上位130件の84.6%が有効または調査に値すると確認された。
- LLMを用いたランキングは,ルールベースのランキングと比較して,P@3で50%,MRRで41%高い性能を示した。
- IssueSpecterは,CoverUpと比較して,同等の評価条件下で,より高いバグレポートの有効性(81.0%対76.2%)を達成した。
LLMを用いたバグ報告の改善手法ImproBR [cs.CL, cs.SE, cs.AI]目的:バグ報告の品質向上
- ソフトウェア保守において,バグ追跡システムは重要な役割を担う。
- ユーザから提出されるバグ報告は,再現手順等の情報が不足している場合が多い。
- 不足・不完全・曖昧な情報を改善し,バグ報告の有用性を高める。
- ImproBRは,DistilBERT,ヒューリスティック分析,GPT-4o miniを組み合わせたハイブリッド検出器を用いる。
- Mojiraデータセットにおいて,構造的な完全性が7.9%から96.4%に向上した。
- 実行可能な再現手順の割合が28.8%から67.6%に増加し,完全に再現可能なバグ報告が13件に増加した。
大規模言語モデルシステムに対するAI可観測性:信頼度較正からインフラストレースまでのモニタリング手法の多層分析 [cs.HC, cs.CL, cs.SE]目的:大規模言語モデルシステムの可観測性に関するモニタリング手法の分析と課題の特定
- 大規模言語モデルの利用拡大に伴い,その動作状況を把握する可観測性の重要性が増している。
- 既存のモニタリング手法は,スタックの特定の層に焦点を当てており,包括的な分析が不足している。
- モデルレベルとインフラレベルのモニタリングを統合し,運用上の知見につなげるための課題解決を目指す。
- 本研究では,AI可観測性に関する5つの近年の研究を分析し,5層の可観測性分類を提示する。
- 各モニタリング層はそれぞれ成熟しているものの,モデルレベルの信号とインフラレベルの異常を関連付ける統合が課題である。
- インフラテレメトリを運用チームが活用できる知見に変換するための,さらなる研究の方向性が示唆される。
有限関数型プログラミング [cs.PL]目的:関数型プログラミングと論理型プログラミングの統合
- 現代的なプログラミングパラダイムの基盤であり,ソフトウェア開発における柔軟性と効率性が求められている。
- 関数型と論理型プログラミングは異なるアプローチであり,統合が課題であった。
- 有限サポートという概念を用いて,両者の統一的な枠組みを提供する。
- 述語をサポートを持つ関数として扱うことで,関数型と論理型プログラミングを統合する。
- 有限サポートにより,関数を入力と出力のテーブルとして表現することが可能となる。
- 型システムを用いて有限サポートを検証し,変数接地とポインテッドセットをモデル化する。
フラッシュバック:文字列の可逆的な両側ランピール分解 [cs.DS, cs.CL]目的:文字列の可逆的な分解とその構造的性質
- 文字列処理は,情報科学における基礎技術であり,様々な応用分野で不可欠である。
- 効率的な文字列分解手法は,データ圧縮や検索アルゴリズムの性能向上に大きく影響する。
- ランペアリング定理に基づき,文字列のラン分解における理論的限界を明らかにし,実用的なアルゴリズムを開発すること。
- フラッシュバックは,文字列をO(n)時間・空間で分解・再構成できる可逆的な手法である。
- ランペアリング定理により,ランの数とトークンの数が正確に一致することが示された。
- 分解の結果は有限オートマトンで表現可能であり,ラン長の変更は一つのトークンのみに影響を与える。
LLM支援による経験的ソフトウェア工学:体系的文献レビューと研究アジェンダ [cs.SE]目的:経験的ソフトウェア工学におけるLLMの利用状況とその課題
- ソフトウェア工学の進歩に伴い,データ規模や手法の複雑性が増しており,経験的検証の重要性が高まっている。
- 再現性の確保が難しく,手法の妥当性評価や知識の共有が阻害されるという課題が存在する。
- LLMの活用による経験的ソフトウェア工学の効率化と信頼性向上を目指す。
- LLMはソフトウェアリポジトリマイニングや制御実験において,分類,フィルタリング,評価などの69のタスクを支援している。
- LLMの活用はデータ処理と分析の段階に集中しており,自動化指向のものが中心である。
- LLMのメリットとして効率性と拡張性が挙げられる一方,ハルシネーション,不整合,プロンプトへの依存性,再現性の問題が課題として指摘されている。
ソフトウェア開発ライフサイクルにおけるエージェントAI:アーキテクチャ,実証的証拠,そしてソフトウェアエンジニアリングの再構築 [cs.SE]目的:エージェントAIによるソフトウェア開発の変革
- ソフトウェア開発は,経済活動の基盤であり,その効率化は社会全体の発展に不可欠である。
- 従来のソフトウェア開発には,人的資源の制約や開発期間の長期化といった課題が存在する。
- エージェントAIを活用し,ソフトウェア開発の自動化と効率化を図ることで,これらの課題を解決することを目指す。
- 大規模言語モデルの進化により,ソフトウェア開発におけるエージェントAIの粒度が,行や関数レベルからリポジトリや機能レベルへと移行している。
- 実証的なデータから,SWE-bench Verifiedにおける性能が2023年10月から2026年4月にかけて1.96%から78.4%へと向上し,開発時間の13.6%-55.8%の削減が確認された。
- 2026年には,Anthropicの調査対象の仕事の49%で,AIがタスクの少なくとも4分の1で使用されていることが示唆された。
移動アンテナMIMOシステムにおける相互結合の再考:モデリングと最適化 [cs.IT, eess.SP, math.IT]目的:移動アンテナMIMOシステムにおける容量最大化のための相互結合の活用
- 無線通信において,通信品質向上のため,高度なアンテナ技術が不可欠である。
- 移動アンテナは有効だが,その動きに伴う相互結合の影響が十分には考慮されていなかった。
- 相互結合を新たな容量増加源として捉え,その最適化手法を開発する。
- 相互結合は単なる電磁波現象ではなく,移動アンテナMIMOシステムの容量増加に貢献する要素であることが示された。
- 狭帯域システムでは,ブロック座標降下法とSylvester方程式を用いたトラストレジオン法により最適化が実現された。
- 広帯域システムにおいても同様の手法を拡張し,様々なチャネル環境下で性能向上が確認された。
グループ鍵を用いた階層型安全集約の容量について [cs.IT, math.IT]目的:グループ鍵を用いた階層型安全集約問題の容量領域の決定
- プライバシー保護は重要であり,特に集約処理における情報漏洩を防ぐ必要性が高まっている。
- 従来の安全集約プロトコルでは,グループ鍵の管理や効率的な集約が課題となっていた。
- 本研究は,階層型構造における安全集約の理論的限界を明らかにし,最適な鍵レートを決定することを目的とする。
- グループサイズが1の場合,問題は実現不可能であることが示された。
- グループサイズが1より大きく,$UV$以下の範囲において,最適な容量領域を完全に特徴付けた。
- リレーセキュリティとサーバーセキュリティの制約に対応する最小限のグループ鍵レートを導出した。
先着順FIFOバッファ管理のための漸近的にロバストな学習拡張アルゴリズム [cs.DS, cs.LG]目的:先着順FIFOバッファ管理問題に対する学習拡張オンラインアルゴリズム
- ネットワークトラフィックの増加に伴い,効率的なバッファ管理が重要になっている。
- 従来のオンラインアルゴリズムは,予測精度の低い場合に性能が著しく低下する。
- 予測誤差に対するロバスト性を保ちつつ,最適な性能を達成することを目指す。
- 提案アルゴリズムは,1-一貫性,η-滑らかさ,漸近的な√3-ロバスト性を同時に達成する。
- 完璧な予測下では最適な競争比1を,予測誤差が増加しても滑らかな性能劣化を示す。
- 予測精度が任意に低い場合でも,最悪の場合の保証である√3の漸近的な競争比を維持する。
無限木に対する一階述語論理のオートマトンによる特徴付け [cs.LO, cs.FL]目的:無限木に対する一階述語論理の表現力
- ソフトウェアやハードウェアの検証において,形式手法による仕様記述が重要である。
- 分岐時間論理と一階述語論理の間の対応付けは難しく,構造的な課題が存在する。
- 分岐時間仕様形式主義による一階述語論理の強固な特徴付けを明らかにすること。
- 本研究では,2種類の躊躇型木オートマトンを導入し,それが\PolPCTLと\CTLsfの表現力を捉えることを示した。
- これにより,無限木に対する一階述語論理の一貫したオートマトン理論的特徴付けが得られ,新たな\CTLs断片\PolCTLsによる自然な標準形が導き出された。
- 一階述語論理は,無限木上では各分岐において安全性または共安全性の性質のみを表現できるという根本的な限界が明らかになった。
モデルベースシステムエンジニアリングのためのアセットアドミニストレーションシェルに基づくOCL検証フレームワーク [cs.SE, cs.SY, eess.SY]目的:モデルベースシステムエンジニアリングにおけるOCL制約検証の自動化
- 複雑化するシステムに対し,自動化と相互運用性が求められるため,MBSEモデルの整合性確保が重要である。
- MBSEモデルとOCL制約が別ツールで管理され,制約適用と結果解釈に手作業が発生する。
- アセットアドミニストレーションシェルを用いて,OCL制約とその検証結果を一元管理することを目指す。
- 本研究では,アセットアドミニストレーションシェルを用いてOCL制約を管理・検証するフレームワークを提案した。
- これにより,MBSEモデルの制約適用と結果解釈の自動化を実現し,開発効率の向上に貢献する。
- 提案手法の有効性を,架空の産業シナリオを通じて実証し,再現性を確保するため,関連成果物をGitHubで公開した。
二値m系列からのグラム行列のランク分布とダイナミクス:LCDコードへの応用 [cs.IT, math.IT]目的:二値m系列から生成されるグラム行列のランク分布とダイナミクスの解析
- 関数解析,統計,組合せ論,符号理論など,幅広い分野で基礎的な役割を果たすグラム行列の研究。
- m系列の特性評価は,その応用範囲の広さから重要である一方,グラム行列を用いた構造解析は十分に進んでいない。
- m系列から構成されるグラム行列のランク分布とダイナミクスを明確にすることで,m系列の構造的特徴を明らかにする。
- グラム行列のランク$r_n(t)$について,すべての$t$に対して明示的な公式を導出し,完全なランク分布を確立した。
- 許容される$t$の約半数に対して,グラム行列がフルランクとなることを証明した。
- ランク不足の状態は不安定であり,フルランクの状態は連続した$t$の値の範囲で強い持続性を示すことを明らかにした。
- この結果は,パンクチャードされた巡回単体符号のハル分布を完全に決定することに貢献する。
任意の共謀と異質セキュリティ制約を持つマルチサーバ安全集約 [cs.IT, math.IT]目的:マルチサーバ安全集約の通信レートと鍵レート
- プライバシー保護計算は,データ利用促進と個人情報保護の両立に不可欠である。
- 従来の安全集約研究は,均一なセキュリティ要件に偏っており,現実的な多様なシナリオに対応できない。
- 異質セキュリティ要件と任意のユーザ共謀を考慮し,安全集約の限界を明らかにする。
- 異質セキュリティ要件と任意の共謀を考慮したモデルにおいて,通信レートを特徴付けた。
- 多くのパラメータ領域において,安全集約に必要な最小鍵レートを決定した。
- ネットワークトポロジーと異質セキュリティ制約の相互作用が通信と鍵生成要件に影響することを明らかにした。
データ保護を持つ厳密な関数訂正符号の存在と構成 [cs.IT, math.IT]目的:データとデータの関数を異なる誤り訂正レベルで同時に保護する厳密な関数訂正符号の存在と構成
- データ保護は,情報セキュリティにおいて不可欠であり,データの信頼性と可用性を保証する上で重要である。
- 従来の符号理論では,データと関数の両方を同時に保護する符号の構成が十分には研究されていなかった。
- 本研究は,線形符号に対して厳密な関数訂正符号を構成するための理論的条件と具体的な手法を確立することを目指す。
- α距離グラフの枠組みを用いて,符号が厳密な関数訂正符号として機能するためのグラフ理論的な存在条件を確立した。
- Simonisの結果を拡張し,特定の重み分布の下で,より少ない独立した最小重み符号語を持つ新しい符号への変換を可能にした。
- 距離3の狭義BCH符号から厳密な関数訂正符号を独立して構成する方法を提示し,最小重み符号語が適切な部分符号に含まれることを示した。
擬似複素数量化除去 [cs.SC, cs.LO]目的:複素数における量化除去の枠組み
- 自動定理証明やモデル検査等の分野で,量化除去は重要な役割を担う。
- 複素数を含む理論の量化除去は,実数に比べて困難である。
- 複素数における量化除去の実用的な手法を開発すること。
- 本研究では,実数量化除去への還元と,その結果の複素数への再解釈を組み合わせた手法を提案。
- PythonベースのオープンソースシステムLogic1を用いた実装例を示し,計算可能性を実証。
- 提案手法は,複素数理論における量化除去の新たなアプローチを提供する。
動的な車載ネットワークにおけるインテリジェントな計算オフローディング:スケーラブルな多層パイプライン [cs.CL, cs.SE]目的:動的な車載ネットワークにおける計算オフローディングの最適化
- ソフトウェア定義型車両の高度化に伴い,演算能力の需要が増大しているため。
- 車載ハードウェアの陳腐化により,ソフトウェアの進化に対応できない問題がある。
- 演算ギャップを埋め,安全性とリアルタイム性能を確保することを目的とする。
- 提案パイプラインは,クラウドとエッジリソースへの動的な計算オフローディングを実現した。
- 改良された粒子群最適化アルゴリズムが,エッジサーバ選択を効率的に行うことを示した。
- CPUでは平均実行時間26ms,GPUでは550msで,応答時間の短縮と成功率の維持を確認した。
頂点ラベル付きグラフに対するパス報告距離オラクル [cs.RO, cs.DS]目的:頂点ラベル付きグラフにおける,指定されたラベルを持つ最も近い頂点までの距離を効率的に求めるデータ構造の開発
- グラフ理論は,ネットワーク分析や経路探索など,様々な分野で基礎となる重要な研究領域である。
- 既存の頂点ラベル付き距離オラクルの伸張率は高く,パス報告機能が欠如していた。
- 伸張率の改善とパス報告機能の追加により,より実用的な距離オラクルの構築を目指す。
- 本研究では,伸張率$(4k-5)(1+\epsilon)$,クエリ時間$O(k)$,サイズ$O(n^{1+o(1)}\cdot \ell^{1/k})$ のパス報告型頂点ラベル距離オラクルを提案した。
- さらに,伸張率を最適値である$2k-1$ に改善するオラクルを,クエリ時間のわずかな増加を伴って実現した。
- このオラクルのクエリ時間は $O(\ell^{1/k}\cdot\log n)$,サイズは$O(k\cdot n\cdot \ell^{1/k})$ である。
ソフトウェアエンジニアリングタスクにおける推測デコーディングの実証的研究 [cs.SE]目的:ソフトウェアエンジニアリングタスクにおける推測デコーディングの有効性評価
- ソフトウェア開発の効率化が求められる中,大規模言語モデルの活用が期待されている。
- 大規模言語モデルの自己回帰的推論の遅延が,インタラクティブな環境での利用を妨げている。
- 推測デコーディングによる高速化が期待されるが,大規模なリポジトリレベルのタスクでの検証が不足している。
- 推測デコーディングは,特に小規模モデルにおいて推論を高速化する可能性が示された。
- コード生成にはモデルベースの手法,リポジトリレベルの修正・編集にはモデルフリーの手法が適していることが示された。
- ソフトウェアエンジニアリングタスクの反復性が高いことが,モデルフリー手法の性能向上に寄与することが明らかになった。
書き換え誘導におけるテンプレート [cs.RO, cs.LO]目的:書き換え誘導における帰納法の仮説生成手法
- プログラムの等価性検証には形式的な手法が不可欠であり,書き換え誘導はその有力な手法の一つである。
- 既存の帰納法の仮説生成手法は,制約や計算を含む高階の書き換えシステムには適用が困難であった。
- テンプレートに基づいた新しい手法により,これまで検証できなかった等価性を証明することを目指す。
- 本研究では,高階の書き換えシステムにおいて,典型的なプログラミング構造を認識し,テンプレートとして利用する手法を提案した。
- 提案手法を既存の書き換え誘導システムに統合することで,帰納法の仮説生成のヒューリスティックを補完し,より複雑な等価性の証明を可能にした。
- これにより,従来は検証が困難であったプログラムの等価性証明を可能にした。
根拠化と合成性:神経記号システムにおける推論の非相補性について [cs.AI, cs.CV, cs.LG, cs.LO]目的:神経記号システムにおける根拠化と推論の寄与を解明すること
- 現代のニューラルネットワークは,分布外の推論を必要とする分野での応用が制限されている。
- 記号の根拠化が成功すれば,合成的な推論が自然に生まれるという仮説は検証されていない。
- 根拠化のみの学習では汎化は困難であり,明示的な推論学習が不可欠であることを示す。
- 根拠化のみを学習したモデルは,新規エンティティ,未知の関係,複雑なルール構成において汎化しないことが示された。
- 知覚的な根拠化と多段階推論を同時に学習した$i$LTNは,全てのタスクで高いゼロショット精度を達成した。
- 記号の根拠化は必要条件ではあるものの,汎化には不十分であり,推論は独立した能力であると結論付けられた。
AGEL-Comp:インタラクティブエージェントにおける構成的汎化のためのニューロシンボリックフレームワーク [cs.AI, cs.LG, cs.LO, cs.MA, cs.SC]目的:インタラクティブエージェントにおける構成的汎化の課題解決
- 近年,LLMを用いたエージェントが注目されるが,その頑健性には課題が残る。
- LLMベースのエージェントは,構成的汎化において体系的な失敗を示す。
- エージェントの行動を基盤化することで,構成的汎化能力の向上を目指す。
- AGEL-Compは,動的な因果プログラムグラフ,ILPエンジン,ニューラル定理証明器を統合。
- このアーキテクチャは,演繹・仮説形成の学習サイクルを実現し,エージェントの世界理解を拡張。
- Retro Quest環境での評価により,AGEL-Compが純粋なLLMベースモデルよりも優れた性能を示すことが確認された。
RepoDoc:知識グラフに基づく自動ドキュメント生成と漸進的更新フレームワーク [cs.SE]目的:大規模コードベースのドキュメント生成と更新
- ソフトウェアの品質向上には,正確かつ最新のドキュメントが不可欠である。
- 従来のドキュメント生成は,コードの依存関係を考慮せず,更新に手間がかかる。
- 知識グラフを活用し,効率的かつ正確なドキュメント生成・更新を実現する。
- RepoDocは,既存の最先端ツールと比較してAPIの網羅率を32.5%,完全性を10.4%向上させた。
- ドキュメント生成速度は3倍に向上し,トークン消費量は85%削減された。
- 漸進的更新においては,更新時間を73%,トークン使用量を77%削減し,更新リコールも10.2%向上した。
Solidity関数の意味的クローン特定と特徴付け [cs.SE]目的:Solidity関数の意味的クローンの検出と分析
- ブロックチェーン技術の普及に伴い,Solidityの重要性が増している。
- コードの再利用が進む中で,脆弱性の伝播が懸念される。
- 意味的クローン検出により,セキュリティ向上と効率的なコード代替案の発見を目指す。
- 大規模なSolidityスマートコントラクトデータセットを用いて,意味的クローン検出手法を検証した。
- 手動検証の結果,提案手法は59%の精度と97%の再現率を達成した(同名関数では84%の精度)。
- LLMを活用したコメント生成により,コメントが少ないコードでも75%の精度で意味的クローンを検出可能になった。
幾何学的交差グラフにおける小独立集合と小セパレータ [cs.HC, cs.RO, cs.SY, eess.SY, cs.DS, cs.CG]目的:幾何学的交差グラフにおける問題の計算複雑性
- 多くのNP困難問題は,一般的なグラフでは指数時間で解けないが,幾何学的グラフでは効率的に解ける場合がある。
- 既知のアルゴリズムでは,次元が高いほど計算時間が指数関数的に増加してしまう。
- 次元に関わらず,準指数時間で解ける問題群を特定し,その限界を示すことを目指す。
- 弱平方根現象と呼ばれる,新しい計算複雑性クラスを定義し,その存在と限界を示すアルゴリズムと下限を開発した。
- 2-サブカラーリングとTwo Sets Cut-Uncutが,弱平方根現象を示す具体的な例として示された。
- グラフ構造に関する新しい定理を導入し,小セパレータと小独立集合の関係を明らかにした。
PICKLES:要件定義とモデルベーステストのための自然言語フレームワーク [cs.SE]目的:要件定義とモデルベーステストのためのフレームワーク
- ソフトウェアの品質向上は重要であり,早期のテストが不可欠である。
- 従来のテスト手法では,人間が理解しやすい要件定義と自動テスト生成が両立しない場合がある。
- 人間が理解しやすい記述から自動テストケース生成を可能にし,テストカバレッジを向上させる。
- PICKLESは,GherkinスタイルのBDDシナリオを拡張した自然言語ベースの言語である。
- PICKLESシナリオと形式モデル間の双方向変換を実現し,統合的なマスターモデルを構築する。
- 交通管理システムのソフトウェアコンポーネントを用いた事例研究により,BDDと比較して高いカバレッジを達成した。
命令型プログラムに対するニューラル・構造的手法を用いたグラフ構築とマッチング [cs.SE, cs.AI]目的:命令型プログラムと仕様間の構造的・意味的類似性の特定
- 検証成果の再利用は,ソフトウェア開発における信頼性向上に不可欠である。
- プログラムと仕様の類似性特定は,言語や記述形式の違いにより困難である。
- 異なる言語や注釈スタイル間でも一貫したグラフ表現を構築すること。
- 命令型プログラムとその注釈を型付き属性グラフに変換するパイプラインが構築された。
- SentenceTransformerやCodeBERT等のモデルから得られる意味埋め込みを活用し,構造と意味の両方を捉えたグラフ表現を実現した。
- C, Java, C#を含む複数の言語と注釈スタイルで,一貫性のあるグラフ表現の構築が可能であることが示された。
産業ソフトウェア開発における効率的かつ責任あるLLM導入に関する提言 [cs.AR, cs.SE]目的:産業ソフトウェア開発におけるLLM効率的かつ責任ある導入のための提言
- ソフトウェア開発における生産性向上への期待が高まる中,LLMの活用は重要な研究分野である。
- LLMの産業利用は増加しているが,効果的かつ安全な導入に関する具体的な指針が不足している。
- 本研究は,産業環境におけるLLM導入のベストプラクティスを提示し,その課題解決を目指す。
- 本研究では,LLMをAIアシスタントとして利用することの有効性,関係者の満足度の重要性などが明らかになった。
- LLMの適用範囲の明確化,ソフトウェア開発ワークフローへの影響,人間による監視メカニズムの必要性も示唆された。
- オンライン調査の結果,提言の妥当性に対するソフトウェア開発者の高い合意が得られた。
中学校数学における能力評価の自動化のための異種LLMの人間介入型ベンチマーク [cs.AI, cs.CY, cs.SE]目的:中学校数学の能力評価自動化における複数のLLMの有効性評価
- 世界的にコンピテンシーベース教育が普及しており,質的な能力マッピングが求められている。
- 能力評価を質的に行うには教師の負担が大きく,効率化が課題となっている。
- LLMを活用し,教師の負担を軽減する能力評価自動化の可能性を検証する。
- 複数のLLMをベンチマークした結果,モデルのアーキテクチャが評価タスクとの適合性に大きく影響することが示された。
- Geminiモデルは「概ね一致」レベルであったが,大規模なOrionモデルは「一致なし」であり,パラメータ数よりもアーキテクチャの適合性が重要であることが示唆された。
- LLMは現時点では自律的な認定には不向きだが,「人間介入型」の枠組みにおいて,初期証拠抽出の支援として高い価値を持つことが示唆された。
プロンプトエンジニアリングによるマルチエージェントコード生成のためのTDDガバナンス [cs.SE, cs.AI]目的:大規模言語モデルを用いたコード生成におけるTDDガバナンスの確立
- ソフトウェア開発の効率化が求められる中,大規模言語モデルの活用が注目されている。
- 大規模言語モデルは不安定性や非決定性,開発規律の欠如といった課題を抱えている。
- プロンプトレベルおよびワークフローレベルでのガバナンス機構により,安定性と再現性を向上させる。
- 本研究では,古典的なTDD原則を構造化されたプロンプトおよびワークフローのガバナンスメカニズムとして実装したAIネイティブTDDフレームワークを提案した。
- 提案システムは,フェーズ順序の強制,修理ループの制限,検証ゲート,アトミックなミューテーション制御を実施し,安定性と再現性を改善する。
- プロンプトオーケストレーションにソフトウェアエンジニアリング規律を直接組み込むことで,信頼性の高いLLM支援開発の方向性を示す。
高等教育機関とソフトウェアエンジニアリング産業におけるスキルギャップの理解 [cs.SE]目的:高等教育機関とソフトウェアエンジニアリング産業間のスキルギャップの特定
- ソフトウェアエンジニアリング分野は急速に進化しており,常に最新の知識とスキルが求められる。
- 大学のカリキュラムで教えられるスキルと,産業界が求めるスキルの間に乖離が生じている。
- 産業界のニーズに合わせたカリキュラム改善を支援し,学生の就業準備を向上させる。
- 分析の結果,カリキュラムはプログラミング言語(18%)とデータベース管理(12.83%)に重点が置かれていることが明らかになった。
- 一方,産業界で最も求められるスキルはソフトウェア設計と計画であり,求人情報の約88.68%に含まれている。
- システム構造やソフトウェアドメインはカリキュラムで過小評価されており,データベース管理やコンパイラ設計は過大評価されている可能性がある。
Pythonシステムにおける残存欠陥の予測:メトリクス駆動アプローチ [cs.CL, cs.DC, cs.PF, cs.SE]目的:Pythonシステムの残存欠陥予測
- Pythonは動的言語であり,テストが困難で欠陥が残りやすい。
- リリース後の欠陥検出は困難であり,効果的な欠陥予測が求められる。
- 機械学習を用いて,リリース後の欠陥を効率的に予測すること。
- 教師あり学習モデル(RandomForest,XGBoost,CatBoost)が優れた性能を示し,再現率は0.85~0.9を達成した。
- 特に,開発者の活動やファイルサイズなどのプロセス系メトリクスが,欠陥予測において重要であることが示された。
- メトリクスとコード埋め込みは,表現空間において異なる領域を占めており,補完的な情報であると考えられる。
マイクロサービスシステムにおける根本原因特定において,どのような種類の異質性が重要か [cs.SE]目的:マイクロサービスシステムの根本原因特定における異質性の役割の体系的な調査
- クラウドネイティブシステムの普及に伴い,複雑性と異質性が増大しており,迅速な障害対応が重要になっている。
- 既存の研究は異質性の特定の一側面に焦点を当てており,全体的な診断価値を活かしきれていない。
- サービスとホスト間の非対称な依存関係を考慮した,異質性を考慮した根本原因特定手法を開発すること。
- マイクロサービスシステムと根本原因特定プロセスにおける異質性の多面的な役割を体系的に分析した。
- サービスとホスト間のクロスカスタ相互作用に起因する,非対称で異質な障害伝播が確認された。
- NexusRCLは,ヘテロジニアスグラフとしてサービスとホストを形式化し,Top-1精度とTop-5精度で最先端手法を上回った。
ソフトウェアバグがテストを回避する理由:大規模な実証研究からの証拠 [cs.SE]目的:ソフトウェア欠陥の発生と進化の特性
- ソフトウェアの信頼性向上は,社会のデジタル化に伴い益々重要になっている。
- テスト段階で発見されず,リリース後に発生する欠陥の原因が不明確である。
- リリース後の欠陥に焦点を当て,その特性と原因を明らかにすること。
- リリース後の欠陥は,古い,頻繁に変更される,変更の多いコンポーネントに集中する傾向がある。
- リリース後の欠陥の修正は,リリース前の欠陥よりも時間がかかり,複雑になることが多い。
- 欠陥は,コード構造だけでなく,進化とプロセス動的な要因によって発生することが示唆される。
自動プログラム修復の再現性の難しさ - Defects4Jデータセットを用いた経験 [cs.SE]目的:自動プログラム修復におけるデータセットの要件定義とDefects4Jの検証
- 自動プログラム修復は,ソフトウェアの信頼性向上に不可欠であり,開発コスト削減に貢献する重要な研究分野である。
- 既存のデータセットには,再現性の問題やテストスイートの不備など,評価実験を阻害する課題が存在する。
- Defects4Jデータセットの検証を通して,より厳密なデータセット要件を提示し,評価の信頼性を高めることを目指す。
- Defects4Jデータセットの835個の欠陥のうち,21.6%にあたる180個が厳密な再現性要件を満たさないことが判明した。
- さらに,7.1%にあたる59個の欠陥は,テストスイートが不十分であり,簡単なコード削除で全てのテストケースをパスしてしまう問題が確認された。
- 今回の研究で,自動プログラム修復のためのデータセットに関する体系的な要件を提示し,Javaプログラム評価フレームワークを実装した。
モデル編集とサービス進化:サービス推薦のための知識更新の視点 [cs.HC, eess.SY, cs.SY, math.OC, cs.HC, cs.SE]目的:サービス推薦のための知識更新フレームワーク
- ソフトウェアサービスは常に進化しており,効果的な推薦システムの設計が重要である。
- 従来の推薦システムは静的な情報に依存し,変化への対応が困難である。
- サービス事実の陳腐化と無効なサービスという課題を解決する。
- 提案手法EVORECは,モデル編集により効率的にサービス情報を更新する。
- 有限オートマトンを用いた制約付きデコーディングにより,無効なサービスの排除と重複の解消を実現した。
- 実データ実験の結果,既存手法を平均25.9%上回るRecall@5を達成し,サービス進化への適応性も示した。
部分観測性下での動的LTLf合成 [cs.DC, cs.LO]目的:部分観測性下でのLTLf合成手法
- システム設計において,仕様を満たす制御戦略の自動生成は重要である。特に,環境の一部が観測できない状況下での検証が課題となる。
- 既存手法は,状態空間爆発を引き起こす可能性があり,大規模システムへの適用が困難である。不要な状態が生成されることも問題となる。
- 観測可能な変数のみを用いて,動的に信念状態DFAを構築し,状態空間の爆発を抑制することを目指す。
- 提案手法では,観測可能な変数を基に仕様を進行させることで,信念状態DFAを動的に構築する。
- この手法により,不要な状態の生成を抑制し,効率的な合成が可能となる。
- 実験結果から,既存手法と比較して大幅な性能向上と,動的ゲームソルビングの利点が示された。
素数体における充足可能性に対する効果的なオーケストラルアプローチ [cs.LO]目的:素数体上の多項式方程式で定義される存在量化された一階述式の充足可能性判定
- ブロックチェーンにおけるセキュリティとプライバシー確保に,ZKPが不可欠な技術として注目されている。
- ZKPプロトコルの健全性と完全性の検証には,強力なSMTソルバーが必要とされている。
- ZKPコンパイラの正当性検証や算術回路の検証における充足可能性問題を解決することを目指す。
- 提案手法はDPLL($T$)ベースであり,理論ソルバーが様々なトレードオフを持つモジュールを調整する。
- プロトタイプ実装の結果,ZKPコンパイラのベンチマークや算術回路の検証において,既存の最先端ツールよりも優れた性能を示した。
- 充足可能性問題解決のために,効率性と完全性のバランスを重視したオーケストラルアプローチが有効であることが示された。
MaxMin独立集合再構成の(近似不能性)について [cs.DS]目的:MaxMin独立集合再構成問題の近似不能性
- グラフ理論は,ネットワークやスケジューリングなど,様々な現実の問題に応用可能である。
- 独立集合再構成問題はNP困難であり,効率的な解法が知られていない。
- MaxMin独立集合再構成問題の近似アルゴリズムの限界を示す。
- 一般グラフにおいて,$(n / \log n)$-近似アルゴリズムが存在することを示した。
- 退化グラフ,有界ツリー幅グラフ,H-マイナーフリーグラフに対する多項式時間近似アルゴリズムを提示した。
- 有界次数グラフ,帯域幅 $n^{\frac{1}{2}+\Theta(1)}$ のグラフ,二部グラフへの近似不能性の結果を拡張した。
