arXiv雑要約
プログラム - 2026/03/24 公開
LLMベースの自動アーキテクチャビュー生成:現状はどこまでか [cs.SE, cs.AI]目的:ソフトウェアアーキテクチャビューの自動生成能力の評価
- ソフトウェアの規模拡大に伴い,アーキテクチャの理解と保守が重要となる。
- アーキテクチャビューの作成は手作業に頼るため,時間と労力がかかる。
- LLMやエージェントを活用し,アーキテクチャビューの自動生成を支援すること。
- プロンプト戦略の工夫は,わずかな改善にとどまることが示された。
- Few-shotプロンプティングは,zero-shotと比較して明確性の欠陥を9.2%削減した。
- カスタムエージェントが汎用エージェントを上回り,詳細度と明確性の点で優れた結果となった。
匿名シャッフル実験のアンカー付き尤度比幾何:正確なプライバシーエンベロープと汎用的な低予算設計 [cs.RO, cs.IT, math.IT]目的:匿名シャッフル実験におけるプライバシー保護と効率的な設計
- データプライバシー保護は,個人情報保護の観点から重要であり,統計分析における課題である。
- 既存手法では,プライバシー保護レベルと分析精度とのトレードオフが明確でない場合がある。
- プライバシーを厳密に保証しつつ,統計的推測の精度を最大化する設計方法を確立すること。
- 匿名シャッフル実験において,バイナリランダム応答が特定の条件下でプライバシー保護の極値を示すことが示された。
- ペアワイズカイ二乗予算下では,正確なトレースキャップおよび二軌道フロンティア定理が証明された。
- 低予算下では,拡張ランダム応答が,すべてのチャネルと推定器に対して最適な性能を示すことが確認された。
自然言語から実行可能なプロパティへの変換:モバイルアプリのプロパティベーステストにおける試み [cs.DC, cs.SE]目的:モバイルアプリのプロパティベーステストにおける実行可能なプロパティの自動生成
- ソフトウェアの品質向上において,テスト自動化の重要性が高まっている。
- プロパティベーステストは有効だが,実行可能なプロパティの記述に専門知識と手間がかかる。
- 自然言語によるプロパティ記述を自動的に実行可能な形式に変換し,テストの負担を軽減すること。
- 提案手法iPBTは,マルチモーダルLLMを用いてUI要素のセマンティクスを抽出し,実行可能なプロパティを生成する。
- GPT-4oとDeepSeek-V3を用いた評価で,iPBTは124件のプロパティ記述に対して95.2%の精度を達成した。
- ユーザー調査の結果,iPBTは実行可能なプロパティ記述時間を56%削減し,テスト作業の効率化に貢献することが示された。
ライブラリ定理:外部組織化がエージェント的推論能力を支配する方法 [cs.AI, cs.CL, cs.DS, cs.LG]目的:エージェント的推論能力における外部記憶の組織化の重要性
- 近年,大規模言語モデルを用いたエージェントの能力向上に大きな関心がある。
- 思考過程の構造化された検索・索引は,まだ十分に探求されていない。
- 外部記憶の索引化が推論コストを指数関数的に削減することを示す。
- エージェントが索引付き外部記憶を持つ場合,検索コストは $O(\log_b N)$ となり,シーケンシャルスキャンによる $O(N)$ よりも大幅に低い。
- 抽象的な内容では,索引付きエージェントはストアサイズに関わらず中央値で1ページ読み取りに成功し,$O(1)$ の予測を裏付けた。
- 言語モデルは索引構築には有効だが,索引のトラバーサルには不向きであり,役割分担の必要性が示唆された。
どの警告の除去が有益であるか [cs.SE, cs.LG]目的:警告除去がコードの複雑さとバグの発生傾向に与える影響の評価
- 静的解析はソフトウェア工学の知識を捉え,問題のあるパターンを検出する上で重要である。
- 警告の除去がソフトウェア品質に及ぼす影響は不明であり,その評価が課題となっている。
- 有用な警告の除去を特定し,バグの発生を抑制するための介入方法を明らかにすること。
- 複雑さを低減させ,将来のバグ発生確率を減少させる警告除去の介入が特定された。
- Pythonファイルの約33%で該当する介入が確認され,バグの発生傾向を5.5パーセントポイント程度削減できる可能性がある。
- 介入の影響を評価する手法が提示され,因果関係研究における自然な介入の特定に貢献する。
I/Oモデルにおける3次元支配範囲の浅いカットの最適コスト構築 [cs.CG, cs.DS]目的:3次元支配範囲の浅いカットの最適コスト構築
- 空間データ管理において,範囲検索は基本的な処理であり,効率的なデータ構造が求められる。
- 浅いカットは範囲検索の効率化に貢献するが,I/Oモデルにおける効率的な構築アルゴリズムは未解決だった。
- I/Oモデルにおける3次元支配範囲の浅いカット構築の最適コストアルゴリズムを提案し,その応用を目指す。
- 提案アルゴリズムのI/O回数は,$O\left(\frac{N}{B}\log_{M/B}\left(\frac{N}{B}\right) \right)$であり,最適コストである。
- このアルゴリズムを応用し,オフライン3次元支配範囲報告および近似支配カウントの高速化を実現した。
- 本研究は,オフライン3次元範囲検索問題やデータ構造構築コスト改善への応用が期待される。
q-ガウス分布への構成的アプローチ:α-ダイバージェンスをレート関数として,一般化されたド・モワブル-ラプラスの定理 [cs.IT, cond-mat.stat-mech, math.IT, math.PR]目的:べき乗則分布の構成的な確率的枠組み
- 情報理論や確率論において,大規模偏差原理と中心極限定理は基礎的な概念である。
- べき乗則分布の確率的基礎は,古典的な二項過程のような構成的な導出が乏しい。
- 非線形微分方程式から出発し,べき乗則分布の確率的枠組みを構築し,その数学的性質を明らかにする。
- 一般化された二項分布に対する大規模偏差原理が証明され,α-ダイバージェンスがレート関数として特定された。
- この結果は,情報幾何学の構造との関連性を示している。
- 一般化されたド・モワブル-ラプラスの定理が証明され,一般化された二項分布が重い裾を持つ極限分布(q-ガウス分布)に収束することが示された。
覚醒:ソフトウェア工学研究の現代的課題と機会 [cs.CG, cs.SE]目的:ソフトウェア工学研究における現代的課題と機会
- ソフトウェアは社会基盤であり,その品質向上が不可欠である。
- 大規模な商用システムへのアクセスが困難で,研究環境の再現が難しい。
- 研究環境の課題を克服し,実社会のニーズに応える研究を推進する。
- 従来の漸進的な研究手法では,現代の課題に対応しきれないことが示唆されている。
- 産業界と学界の連携強化,大規模研究チーム,長期的なプロジェクトの重要性が強調される。
- 博士課程における産業界との連携や,研究資金・評価方法の見直しが提言されている。
Dynasto:自律運転テストのための妥当性に基づいた動的・静的パラメータ最適化 [cs.SE]目的:自律運転システムの安全性評価
- 自動運転技術の安全性を確保するためには,徹底的なテストが不可欠である。
- 既存のシナリオ生成手法では,現実的でない挙動による衝突と,実際のシステム障害を区別できない。
- 現実的な安全上の問題点を明らかにするための動的・静的パラメータの同時最適化を目指す。
- Dynastoは,RLと遺伝的アルゴリズムを組み合わせ,より多くの有効な障害を発見した。
- クラスタリングにより,テスト対象システムあたり約12種類の解釈可能な障害モードが得られた。
- 明示的な妥当性制約を用いた動的・静的最適化が,自動運転システムのテストにおいて有効であることが示された。
ドメイン知識と事例推論を活用したドメイン特化型コード生成 [eess.SY, cs.SY, eess.SY, cs.SY, cs.AI, cs.SE]目的:ドメイン特化型コード生成の性能向上
- ソフトウェア開発における生産性向上は重要であり,自動化技術への期待が高まっている。
- 汎用LLMはドメイン知識に乏しく,実世界での応用は困難な場合が多い。
- 知識グラフと事例推論を組み合わせることで,ドメイン知識の不足を補い,コード生成の精度向上を目指す。
- DomAgentは,知識グラフと事例推論を統合したDomRetrieverにより,ドメイン知識を効率的に取得・活用する。
- データサイエンスのベンチマークデータセット(DS-1000)において,DomAgentはコード生成性能を大幅に向上させた。
- DomAgentは,小規模なオープンソースモデルでも,大規模な商用LLMに匹敵する性能を実世界のタスクで実現可能にした。
LLMを活用した多分野ソフトウェア開発のワークフロー最適化:自動車産業における事例研究 [cs.CL, cs.IR, cs.CL, cs.SE, cs.AI]目的:多分野ソフトウェア開発におけるワークフロー最適化
- 自動車産業をはじめとする複雑なシステム開発では,専門知識と実装の連携が不可欠である。
- 専門家と開発者の間には形式や成果物の不整合があり,非効率な連携が課題である。
- LLMを活用し,手動による連携を自動化することで,ワークフローを効率化する。
- 提案手法は,自動車APIシステム(spapi)において93.7%のF1スコアを達成した。
- API開発時間を約5時間から7分未満に短縮し,推定979時間のエンジニアリング時間を削減した。
- 専門家と開発者双方から高い満足度が得られ,コミュニケーション効率の向上を報告した。
最小距離保持部分グラフ探索:パラメータ化研究 [cs.DS, cs.CC, cs.DM]目的:最小距離保持部分グラフの計算複雑性
- グラフ理論において,距離保持はネットワークの効率的な情報伝達に不可欠である。
- 最小距離保持部分グラフの探索は,計算量が多く,効率的なアルゴリズムが不足している。
- 様々なパラメータに対する計算複雑性を明らかにすることで,実用的なアルゴリズム開発に貢献する。
- Subsetwise Distance Preserver (SDP) および Pairwise Distance Preserver (PDP) 問題は,グリッド部分グラフ上ではNP困難である。
- PDPは頂点被覆が3のグラフ上でもNP困難だが,SDPは頂点被覆に対するFPTである。
- 両問題は,端点数とグラフのトレewidthをパラメータとするFPTである。
パラメータ化された自己無効化単方向リングにおけるリヴロック検出可能性 [cs.DC, cs.DM, cs.FL, cs.LO]目的:パラメータ化された対称的な単方向リングにおけるリヴロックの検出
- 並行システムの正当性検証は重要であり,リヴロック検出はその不可欠な要素である。
- リヴロック検出は一般に困難であり,特にパラメータ化されたシステムでは効率的な決定手順が不足している。
- この研究は,パラメータ化された自己無効化単方向リングにおけるリヴロック検出の効率的な決定手順を確立することを目指す。
- 本研究では,ドメインが$\mathbb{Z}_m$で制限されたパラメータ化された対称的な単方向リングにおいて,リヴロック検出が多項式時間で決定可能であることを証明した。
- アルゴリズムは,有限集合$T$上の収縮的な単調演算子の最大不動点を計算し,不動点が空でない場合にリヴロックを判定する。
- リヴロック自由性の証明は最大性に基づき,アルゴリズムはリングサイズ$K$に依存せず,$O(|T|^3)$の時間で実行される。
機密連合計算におけるサイドチャネル攻撃への対策 [cs.OS, cs.DB, cs.CR, cs.DS]目的:サイドチャネル攻撃に対する機密連合計算の堅牢化
- プライバシー保護技術は,データ共有の促進と個人のプライバシー保護の両立に不可欠である。
- 機密連合計算は内部関係者による情報漏洩リスクを抱えており,差分プライバシーの保証が脅かされる。
- 差分プライバシーによるサイドチャネル攻撃の緩和策を検討し,実装による検証を行う。
- 本研究では,機密連合計算プラットフォームにおけるサイドチャネルを特定した。
- 差分プライバシーが特定された2つのサイドチャネルを緩和できることを示した。
- そのうち1つの緩和策は,オープンソースライブラリに実装されている。
RuntimeSlicer:障害管理のための汎用的な統一されたランタイム状態表現に向けて [cs.CL, cs.MA, cs.SE, cs.AI]目的:障害管理のための汎用的なランタイム状態表現
- 現代のソフトウェアシステムは規模と複雑性が増しており,効果的な障害管理が不可欠である。
- 既存の手法はタスク指向のパイプラインに依存しており,タスクやシステム間の汎用性に欠ける。
- 多様なランタイムデータを統合し,システムの状態を包括的に捉える表現を学習すること。
- RuntimeSlicerは,メトリクス,トレース,ログを単一のシステム状態埋め込みに直接エンコードする。
- Unified Runtime Contrastive Learningにより,異種データソースを統合し,モダリティ間アライメントと時間的一貫性を最適化する。
- State-Aware Task-Oriented Tuningは,ランタイム状態のパーティション分割と,ダウンストリームタスクへの状態条件付き適応を可能にする。
プログラム可能な表面プラズモンニューラルネットワークを用いた開かれた環境における超高速マイクロ波センシングと動的物体の自動認識 [cs.CL, cs.CY, cs.CL, cs.IT, math.IT, physics.optics]目的:開かれた環境における動的物体の超高速マイクロ波センシングと自動認識
- 次世代のインテリジェントセンシングには,静的な検出を超え,動的なシーンを高速度かつ適応的に知覚するシステムが求められている。
- 従来のマイクロ波センシングシステムは,逐次的なデジタル処理のボトルネックにより,リフレッシュレートが数百ヘルツに制限されている。
- 本研究は,プログラム可能かつスケーラブルなマイクロ波センシングシステムを開発し,開かれた環境での応用を目指す。
- プログラム可能な表面プラズモンニューラルネットワーク(P-SPNN)が,リアルタイムのマイクロ波センシングと動的物体の自動認識を可能にした。
- P-SPNNシステムは,従来のミリ波センサーよりも2桁以上高速に動作し,25nsの知覚遅延と10kHzを超えるリフレッシュレートを実現した。
- 288のプログラム可能な位相変調ニューロンを用いて,開かれた道路環境で91〜97%の精度で人や車をリアルタイムで分類することができた。
推論トレース表現によるマルチエージェントシステムの効率的な障害管理 [cs.SE, cs.AI]目的:マルチエージェントシステムにおける障害管理の効率化
- 大規模言語モデルを用いたMASは,その高度な推論・協調能力から注目を集めており,ソフトウェアシステムの新たな設計パラダイムとなりつつある。
- 既存手法はトレース単位での処理に依存し効率が低く,過去の障害パターンを考慮しないため,診断精度が限られている。
- 過去の障害パターンを活用し,リアルタイムな障害検出・診断・緩和を実現することで,MASの信頼性向上を目指す。
- 提案手法EAGERは,推論トレース表現に基づき,エージェント内・エージェント間の推論と協調を効率的にエンコードする。
- EAGERは,教師なし学習を用いて歴史的な障害知識に基づいて,リアルタイムなステップごとの障害検出,診断,および自己回復を可能にする。
- 3つのオープンソースMASを用いた評価により,EAGERの有効性が確認され,信頼性の高いMAS運用に向けた今後の研究方向性を示唆する。
LLMとモンテカルロ木探索によるDBMSテストケース生成 [cs.CL, cs.SE, cs.AI]目的:DBMSの信頼性確保のための高品質なSQLテストケースの自動生成
- 現代のデータ駆動型アプリケーションにおいて,DBMSは基盤であり,その信頼性は不可欠である。
- 従来のファジング手法はDBMS固有の方言への適応に多大な手作業を要し,汎用性に欠ける。
- 軽量LLMを用い,構文的・意味的に多様なSQLテストケースを効率的に生成し,テストカバレッジを向上させる。
- 提案手法MISTは,3種類のDBMSと4つの軽量LLMにおいて,平均して行カバレッジが43.3%向上した。
- 関数カバレッジは32.3%向上し,分岐カバレッジは46.4%向上した。特にOptimizerモジュールでは最高69.3%の行カバレッジを達成した。
- MISTは,特徴ガイド型エラー駆動テストケース合成とモンテカルロ木探索によるテストケース変異を組み合わせることで,高いカバレッジを実現する。
定常オンライン競合解決スキーム [cs.GT, cs.DM, cs.DS, math.CO]目的:オンライン競合解決スキームの設計と解析
- ベイジアンオンライン選択とリソース配分において中心的役割を果たす。
- 最適なスキームの設計が技術的に困難であり,既存手法は複雑な場合が多い。
- シンプルなスキームの設計を可能にする新たな技術的枠組みを提供する。
- 定常オンライン競合解決スキーム(S-OCRS)の分布的特徴付けと汎用的なオンライン実装を提示した。
- 二部マッチングに対し,$(3-\sqrt{5})/2$-選択可能なS-OCRSを構築し,独立性ベンチマークを達成した。
- $k$-均一マトロイドおよび弱レイリーマトロイドに対し,それぞれ$1-\sqrt{2/(\pi k)} + O(1/k)$および$1/2$-選択可能なS-OCRSを導出した。
ライドヘイリングにおける非排他的通知:Lyftでの単一サイクル近似アルゴリズム [cs.DS, cs.DM, cs.GT]目的:ライドヘイリングにおける最適な通知ドライバー集合の選定
- ライドヘイリングは交通効率化に貢献する重要なサービスであり,迅速なマッチングが課題である。
- ドライバーの応答確率が不確実なため,効率的なマッチングが困難であるという問題がある。
- 複数のドライバーに同時に通知することで,マッチング効率の向上を目指す。
- 「First Acceptance (FA)」メカニズム下では,単一乗客ケースでPTAS,一般マッチング設定で4倍近似アルゴリズムを開発した。
- 「Best Acceptance (BA)」メカニズム下では,目的関数が単調かつ部分モジュールであり,$(1 - 1/e)$-近似が可能なことを示した。
- BA問題において,需要オラクルを用いて$(1 - 1/e)$の近似率を超える可能性を示し,同質受容確率の場合には多項式時間で最適解が得られる。
ソフトウェアエンジニアリングにおける1年間のインターンシッププログラム:学生の認識と教育者の学び [cs.SE]目的:ソフトウェアエンジニアリング教育におけるインターンシップの有効性
- ソフトウェア産業の発展には,実践的なスキルを持つ人材育成が不可欠である。
- 大学での知識と実際の業務とのギャップが,学生の就業準備の遅れにつながる。
- インターンシップを通じて,学生の課題解決能力と学習効果の最大化を目指す。
- 学生のインターンシップ報告書分析から,3つの主要な課題が特定された。
- 特定のコースが,インターンシップにおける学生の学習を効果的に支援することが示された。
- 教育者および企業に対する推奨事項を提案し,インターンシップの質向上に貢献する。
サイバーセキュリティ教育におけるAI活用:スケーラブルなエージェント型CTF設計原則と教育的成果 [cs.SE]目的:AIを活用したサイバーセキュリティ教育におけるCTF(Capture The Flag)設計原則と教育的成果の検証
- サイバーセキュリティ人材の育成は喫緊の課題であり,実践的なスキル習得が重要である。
- AI技術の進化に伴い,AIと人間の協調による学習が注目される一方で,公正な評価方法が確立されていない。
- AIを活用したCTF設計の原則を確立し,学習効果を最大化するための教育的指針を提示すること。
- LLMを活用したCTFにおいて,自律エージェントとハイブリッド型が,反復テストとツール連携が必要な課題で高い解答率を示した。
- 特に初学者向けCTFでは,複雑なマルチエージェントアーキテクチャよりも,軽量なツール拡張プロンプトと反復に基づく再試行が好まれる傾向が見られた。
- AI支援CTFの設計において,自律度に応じた評価基準,解答検証を支える証拠要件,信頼性のある評価とエンゲージメントを維持するためのトラック構造の重要性が示された。
ウェブアプリケーションセキュリティチュートリアルの調査 [cs.CR, cs.SE]目的:ウェブアプリケーションセキュリティチュートリアルの質に関する分析
- ウェブアプリケーションのセキュリティ確保は,現代のソフトウェア開発において不可欠である。
- オンラインチュートリアルの品質にばらつきがあり,開発者が適切な情報にアクセスしにくい状況がある。
- 有益なチュートリアルを特定するための指標を提示し,開発者のセキュリティ実装を支援すること。
- 調査の結果,多くのチュートリアルがベンダーによって提供され,実装よりも概要説明に重点が置かれていることが明らかになった。
- 完全な実行可能なコード例やOWASP,CWE,CVEなどの公式リソースへのリンクが少ないことが判明した。
- 実行可能なコードの有無と公式リソースへのリンクが,有用なチュートリアルを識別するための重要な指標となることが示された。
言語エージェントのための階層型メモリ理論に向けて [cs.IR, cs.AI, cs.IT, cs.SI, math.IT]目的:言語エージェントにおける階層型メモリの設計原理
- 大規模言語モデルの性能向上には,長文脈の処理能力が不可欠である。
- 既存のアプローチは多様であり,設計選択の比較が困難である。
- 階層型メモリの設計を形式化し,比較可能な枠組みを提供する。
- 本研究では,抽出,粗視化,トラバーサルの3つの演算子に基づく統一的な理論を提案する。
- 粗視化における代表関数に自己充足性という概念を導入し,有効な検索戦略を制約する要因を明らかにする。
- 提案理論を11の既存システムに適用し,その汎用性を示す。
限られた通信を持つUAV支援ワイヤレスネットワークにおける時空間注意エンハンスマルチエージェントDRL [cs.IT, cs.AI, cs.SY, eess.SY, math.IT]目的:UAV支援ワイヤレスネットワークにおけるスループット最大化
- 無線通信において,UAVを活用することで,地上からのデータ伝送を高速化し,通信範囲を拡大することが期待されている。
- UAV間の断続的な情報交換は遅延を生じさせ,効果的な協調を阻害する要因となっている。
- UAV間の情報共有を促進し,ネットワーク状態の認識精度を高めることで,遅延を削減しスループットを向上させる。
- 提案手法は,従来のMADRLと比較して,情報遅延を50%以上削減し,スループットを75%向上させることをシミュレーションで示した。
- UAV間の情報共有の改善はネットワーク容量を損なうことなく,学習性能とスループットを同時に向上させる。
- UAVの情報交換の必要性を低減し,UAV支援ワイヤレスネットワークにおけるMADRLの実用的な展開を促進する。
ブロードキャストチャネル向けレートレスDeepJSCC:歪み・レート・複雑さのトレードオフ [cs.IT, cs.LG, eess.SP, math.IT]目的:ブロードキャストチャネルにおける歪み,伝送レート,処理複雑さの柔軟なトレードオフ
- ワイヤレス環境において,データ集約型ブロードキャストアプリケーションが増加しており,効率的な通信手法が求められている。
- 既存のDeepJSCCは,最悪の場合のシナリオに限定され,適応的な複雑さやブロードキャスト環境への対応が不十分である。
- ヘテロなデバイス環境において,歪み,レート,復号複雑さの制御可能なトレードオフを実現すること。
- 提案手法は,学習されたソース変換と物理層LTコードを統合し,受信側の状況に応じてレートレスシンボルの受信数と復号反復回数を調整する。
- 不均等保護方式を用いることで,復号側情報を活用し,ヘテロな受信機に対応した性能向上が確認された。
- シミュレーション結果から,提案手法が厳しい通信・処理制約下で,エッジデバイスにおける画像ブロードキャスト品質を向上させることが示された。
MCPサーバーにおける過剰な権限を持つツール機能の監査 [cs.CR, cs.SE]目的:MCPサーバーのセキュリティ評価
- LLMと外部ツール連携の標準化が進む中,セキュリティリスクへの対策が急務である。
- MCPサーバーが持つ過剰な権限が,悪用される可能性が指摘されている。
- MCPサーバーのセキュリティ脆弱性を検出し,軽減策を提供する。
- mcp-sec-auditという拡張可能なセキュリティ評価ツールキットを開発した。
- PythonベースのMCPサーバーに対して静的パターンマッチングを実施し,DockerとeBPFを用いた動的サンドボックスファジングと監視を行う。
- ルールベース分析により危険な機能を検出し,軽減策を提案する。
AI支援開発ツールはプロンプトインジェクションの影響を受けないか [cs.CR, cs.SE]目的:AI支援開発ツールにおけるプロンプトインジェクション脆弱性の実証的分析
- LLMの利用拡大に伴い,そのセキュリティ確保が不可欠となっている。
- AI支援開発ツールは便利である一方,ツール汚染を介したプロンプトインジェクション攻撃のリスクがある。
- 広く利用されているAI支援開発ツールのセキュリティ状況を評価し,対策の指針を示す。
- 7つのAI支援開発ツールにおいて,プロンプトインジェクションに対する脆弱性が確認された。
- Claude Desktopのように強固なガードレールを持つツールもあれば,Cursorのように高い脆弱性を示すツールもある。
- ツール汚染,隠されたパラメータの悪用,不正なツール呼び出しといった攻撃手法が有効である場合がある。
自律型AIエージェントのための推論系統:状態チェックポイントと実行トレースを超えた構造化された行動分析 [cs.MA, cs.AI, cs.DC, cs.SE]目的:AIエージェントの推論行動の構造化された系統の分析
- AIの自律化が進むにつれ,行動分析の重要性が高まっている。
- 既存のツールでは,推論の根拠を体系的に記録・分析できない。
- エージェントの行動原理を理解し,信頼性を向上させる。
- 本研究では,意図,観察,推論を記録する「Agent Execution Record (AER)」を提案する。
- AERを用いることで,推論パターンの抽出や信頼性評価が可能となる。
- 実配備された原因究明エージェントへの適用により,評価方法を確立した。
FMEDA安全性指標の不確実性の定量化:ASIC検証強化のための誤差伝播アプローチ [cs.AR, cs.SE]目的:FMEDA安全性指標における不確実性の定量化
- 自動車システムにおけるASICの機能安全検証において,正確な安全性指標は不可欠である。
- 従来のFMEDA指標は,故障モード分布と診断率の推定精度に依存し,不確実性が大きい。
- FMEDA安全性指標の不確実性を定量化し,分析の信頼性を高めることを目指す。
- 提案手法は,誤差伝播理論をFMEDA計算に導入し,SPFMとLFMの最大偏差と信頼区間を定量化する。
- エラー重要度識別子(EII)を導入することで,不確実性の主要な原因を特定し,改善を促す。
- 本研究は,FMEDAの透明性と信頼性を高め,ISO 26262への準拠を支援する。
オープンソースのエネルギー効率測定ツール一覧:GitHubマイニング調査 [cs.SE, cs.ET]目的:オープンソースのエネルギー効率測定ツールの特定,分類,分析
- ソフトウェア開発におけるエネルギー効率は重要であり,その測定ツールが求められている
- 既存のオープンソースエネルギー測定ツールの特性と利用状況は十分に理解されていない
- GitHub上のツールを分析し,エネルギー効率を考慮したソフトウェア設計を支援する
- 585のリポジトリを分析し,エネルギー測定ソフトウェアツールとして関連性の高い24のリポジトリを特定した
- 初期のCPU中心のツールから,マルチレベル粒度(プロセス,コンテナ,AIワークロード)をサポートし,排出量推定機能を統合するツールへと進化していることが明らかになった
- 本研究は,MSRの観点からオープンソースのエネルギー・排出量測定ツールの構造化された概要を初めて提供する
なぜ検証が失敗するのか:検証失敗の説明 [cs.LO]目的:検証失敗の説明方法
- 形式検証は,ソフトウェアやハードウェアの信頼性向上に不可欠であり,安全性に関わるシステムでは特に重要である。
- 大規模な検証問題では,失敗原因の特定が困難であり,専門家の負担が大きい。
- 形式モデルに基づいた検証失敗を,人間が理解しやすい形で説明することを目指す。
- 検証失敗の原因を特定するために,述語の関連性に基づいて重要な部分を抽出する手法を提案。
- 抽出された述語間の依存関係を利用して,段階的に説明を生成し,失敗の全体像を把握しやすくする。
- 提案手法は,事例を通して有効性が示され,他の手法との比較も行われた。
3次元および高次元における幾何学的交差グラフの直径計算の現状 [cs.CG, cs.DS]目的:3次元および高次元における幾何学的交差グラフの直径計算に関する研究の現状把握と新たなアルゴリズム・限界の提示
- 幾何学的交差グラフの直径計算は,計算幾何学における基本的な問題であり,様々な応用分野で重要である。
- 高次元空間においては,既存のアルゴリズムは必ずしも効率的ではなく,計算量の壁が存在する。
- 本研究は,高次元空間における直径計算の効率向上と,問題の難易度に関する新たな知見の獲得を目指す。
- 3次元空間における単位立方体の直径が3以下であるかどうかの判定を,真に2次時間以下のアルゴリズムで実現した。
- 単位球の直径が3である場合の計算は,Orthogonal Vector (OV) 仮説の下で真に2次時間以下のアルゴリズムが存在しないことを示した。
- 3次元空間における単位立方体の直径が2である場合の計算を,ほぼ線形時間で実現するアルゴリズムを開発した。
分散トラストのための様相論理 [cs.LO, cs.MA]目的:マルチエージェントシステムにおけるトラストに関する推論手法
- 分散システムにおいて,エージェント間の信頼関係は重要な要素である。
- 複雑なネットワークにおけるトラストの伝播と検証が困難である。
- エージェント間のコミュニケーションチェーンにおける適切なトラスト評価を実現する。
- 様相論理を用いて,エージェントの信念とコミュニケーションを記述する言語を提案した。
- ネットワークにおける情報伝達とトラストの一般化を定義し,証明のラムダ計算への適応可能性を示した。
- 様相論理のネストにより,コミュニケーションチェーンを記述し,それに対するトラスト概念を確立した。
準線形時間での蝶の近似カウント [eess.SY, cs.MA, cs.RO, cs.SY, cs.CE, cs.DB, cs.DS]目的:二部グラフにおける蝶(2x2二部完全グラフ)の数の推定
- 二部グラフは,異なる2種類のエンティティ間の関係を表現する自然なモデルである。
- 既存のアルゴリズムはグラフ全体へのアクセスを必要とし,大規模グラフではI/Oコストが課題となる。
- 限られたグラフ構造へのアクセスで蝶の数を正確に推定し,クエリコストを削減する。
- 提案手法TLSは,次数クエリ,隣接クエリ,頂点ペアクエリモデルにおいて,効率的な蝶のカウント推定を実現する。
- TLSは,「小次数優先サンプリング」や「小さな部分集合による楔サンプリング」などの技術により,分散を抑制する。
- 理論的な保証のため,「重軽分割」と「推測と証明」の2つの新規技術を導入し,(1+eps)の精度を保証する。
記号回帰のための命令セットと言語 [cs.CL, cs.AI, cs.PL]目的:記号回帰における構造的冗長性の削減
- 記号回帰は,データから数式を発見する強力な手法であり,科学的発見やモデル構築に役立つ。
- 記号回帰では,同じ数式を表す多数の異なる表現が存在し,計算資源を無駄にしている。
- 表現の冗長性を解消し,探索効率を向上させることを目指す。
- IsalSRという表現フレームワークを提案し,数式DAGをコンパクトな文字列として表現する。
- IsalSRは,DAGの同型性を不変とするカノニカル文字列を生成し,冗長な表現を統合する。
- この手法により,記号回帰の探索空間を大幅に削減し,効率的な学習が可能となる。
樹状圏の公理について [cs.LO, math.CT, math.LO]目的:樹状圏の公理系に関する検討
- 論理学におけるモデル比較ゲームの理解を深める上で,圏論的枠組みは重要である。
- 既存の公理系では,経路の連結性に関する問題点が指摘されていた。
- 経路の連結性の問題を解決するため,「木連結性」という概念を提案する。
- 経路の連結性に関する既存の公理の不備が示された。
- 「木連結性」の概念を導入し,樹状圏の本質的な性質が維持されることを確認した。
- 経路関手はStreetフィブレーションであることを示した。
大規模モデルの実装同値性の検証 [cs.CL, cs.SI, cs.SE]目的:大規模モデルの実装間における同値性の確認
- 大規模言語モデルの普及に伴い,異なるフレームワークでの実装の検証が重要になっている。
- 演算子分解やテンソル配置の違いにより,同一の計算でもグラフ構造が大きく異なり,検証が困難である。
- 実装間の同値性を自動的に検証し,実装のバグ検出とデバッグの効率化を目指す。
- Emergeは,大規模モデルの実装をe-graphで表現し,実行値から関係性を推論することで同値性を検証する。
- Emergeは,既存のルールが不十分な場合,必要に応じて書き換えルールを合成し,SMTまたは制約付きランダムテストで検証する。
- HuggingFace TransformersとvLLMを対象とした評価により,Emergeは同値性を効率的に検証し,13件の既知のバグと8件の未知の不具合を発見した。
アルバンク:イーサリアム・ブロックチェーン技術とスマートコントラクトを用いた安全な分散型銀行アプリケーションの事例研究 [cs.RO, cs.CR, cs.SE]目的:イーサリアム・ブロックチェーン技術とスマートコントラクトを用いた分散型銀行アプリケーションの設計と開発
- 既存の銀行システムはセキュリティ上の脆弱性を抱えており,ブロックチェーン技術はその改善が期待される。
- 中央集権的なシステム構造が,効率性やセキュリティ,透明性の低下を招いている。
- ブロックチェーンとスマートコントラクトによって,銀行システムのセキュリティと信頼性を向上させる。
- ブロックチェーンとスマートコントラクトの統合は,銀行システムの集中化,非効率性,セキュリティ上の脆弱性を効果的に解決する。
- 重要なデータを分散型・不変の台帳に保存することで,データの改ざんを防ぎ,透明性を確保する。
- プロセスを自律的に管理し,すべてのユーザーに取引を公開することで,信頼性を高める。
抽象機械によるStrong Call by Needのシンプルかつ効率的な実装 [cs.MM, cs.PL]目的:Strong Call by Needの実装
- 関数型言語処理系の効率化は,計算資源の有効活用に不可欠である。
- 従来のStrong Call by Need実装は,複雑性や非効率性の問題があった。
- シンプルかつ効率的なStrong Call by Needの実装を提供することを目指す。
- RKNLという抽象機械を提案し,Strong Call by Needを双一次元のオーバーヘッドで実現した。
- この機械は,memothunk技術を用いた高階評価器から自動的に導出されたものである。
- 提案機械は,遅延評価版Krivine機械を保守的に拡張し,線形数のステップで正規順評価をシミュレートする。
StreamSampling.jl:Juliaにおけるデータストリームからの効率的なサンプリング [cs.SE, stat.CO]目的:データストリームからの効率的なサンプリング手法
- データ解析において,大規模データの高速処理が不可欠であり,ストリームデータはその代表例である。
- ストリームデータの全件把握はメモリ消費の面から困難であり,効率的なサンプリング手法が求められている。
- 未知のデータ量に対し,低メモリで単一パスでサンプリングを可能とする手法を提供する。
- StreamSampling.jlは,ストリームデータから効率的にサンプリングを行うJuliaライブラリである。
- 既存のサンプリング手法と比較して,メモリ使用量を削減し,ストリーム全体の展開を回避できる。
- 実験結果から,本ライブラリのパフォーマンスとメモリ効率が実証された。
多項式環におけるCRTに基づく漸近的に理想的な結合階層型秘密分散方式 [cs.CR, cs.IT, math.IT]目的:結合階層型秘密分散方式の構築
- 情報セキュリティにおいて,秘密を安全に共有・管理する技術は不可欠である。そのため,秘密分散方式の研究は重要である。
- 既存のCRTに基づく方式は,セキュリティ上の脆弱性や情報効率の低さが課題となっていた。
- 本研究は,これらの課題を解決し,より安全で効率的な秘密分散方式を提案することを目的とする。
- 本研究では,多項式環におけるCRTと一方向関数を利用することで,漸近的に完全な結合階層型秘密分散方式を構築した。
- 提案方式は計算安全性を持つとともに,柔軟なシェアサイズを可能にする。
- 特に,全てのシェアサイズが等しい場合,情報効率が1の漸近的に理想的な結合階層型秘密分散方式となる。
整数環におけるCRTに基づく漸近理想的階層型秘密分散 [cs.RO, cs.IR, cs.CL, cs.CR, cs.IT, math.IT]目的:整数環におけるCRTと一方向関数を用いた,分離型および結合型の階層型秘密分散スキーム
- 情報セキュリティにおいて,秘密情報を安全に共有・管理することは重要である。
- 従来の階層型秘密分散スキームには,セキュリティ上の脆弱性や情報レートの低下といった課題がある。
- CRTを用いた新たなスキームを提案し,情報レートとセキュリティを両立することを目指す。
- 提案スキームは漸近的に理想的であり,安全性も数学的に証明された。
- 既存のCRTに基づくスキームの脆弱性を解消し,情報レートの向上を実現した。
- 分離型と結合型の2つの階層型秘密分散スキームを提案することで,柔軟な権限管理が可能になった。
論文とコードは一致するか?バイオインフォマティクスのソフトウェアにおける論文とコードの一貫性検出のためのベンチマークとフレームワーク [cs.LG, cs.SE]目的:バイオインフォマティクスのソフトウェアにおける論文とコードの一貫性検出
- ソフトウェアの信頼性と科学的再現性は重要であり,そのためには論文と実装の一致が不可欠である。
- バイオインフォマティクス分野では,論文中の記述と実際のコード実装の乖離が頻繁に発生している。
- 論文とコードの間の一貫性を自動的に検証できるベンチマークとフレームワークを構築すること。
- 本研究では,バイオインフォマティクス分野における論文とコードの一貫性検出のための最初のベンチマークデータセット「BioCon」を構築した。
- 提案するフレームワークは,自然言語とコード間の意味的関係をモデル化し,高い精度(0.9056)とF1スコア(0.8011)を達成した。
- この研究は,科学ソフトウェアにおける再現性評価とクロスモーダル理解のための新たな研究方向を開拓する。
Erlangのための集合論的型: 理論,実装,および評価 [cs.RO, cs.PL]目的:Erlangの型システムに関する理論的基盤と実践的検証
- Erlangは並行処理に適しているが,動的型付けによる実行時エラーが課題である。
- Erlangの型指定はコンパイラで強制されないため,ドキュメントとしての役割に限定されている。
- Erlangの複雑な言語機能を考慮した上で,健全かつ決定可能な型システムを構築すること。
- 集合論的型システムにより,Erlangの型健全性が理論的に保証された。
- Erlangの型指定言語の全機能と,大部分のタームレベル構造をサポートする型チェッカが実装された。
- 標準ライブラリ等の実用的なコードに対して,型チェッカの有効性が確認された。
関係修飾問題の記述的複雑性 [cs.LO, cs.CC]目的:関係修飾問題の古典的およびパラメータ化された複雑性の分類
- 論理構造の計算可能性は,データベースや知識表現といった情報科学の根幹をなす。
- 関係修飾問題の複雑性は,対象とする論理構造や修飾の性質によって大きく異なる。
- 記述的複雑性を基に,関係修飾問題の計算困難度を体系的に分類すること。
- 対象となる性質の記述的複雑性によって,問題の複雑さが二分されることが示された。
- 単項関係構造や無向グラフは異なる複雑性を持つが,自己ループを持つグラフや有向グラフは同程度の困難さを示す。
- 問題は,容易に解けるか,あるいはW[2]-困難またはNP-困難であるかのいずれかである。
動的解析が問題解決を強化する [cs.SE]目的:ソフトウェアのバグ修正
- ソフトウェア品質の向上は,現代社会におけるシステム信頼性維持に不可欠である。
- 複雑なバグの特定と修正には,高度な解析技術と効率的な手法が求められる。
- ランタイム状態の可視化による,より迅速かつ正確なバグ修正を目指す。
- DAIRAは,動的解析を組み込んだ新たなバグ修正フレームワークである。
- テスト追跡駆動型手法により,変数変化やコールスタック等のランタイムデータを活用する。
- Gemini 3 Flash Previewを用いてSWE-bench Verifiedデータセットで79.4%の解決率を達成し,推論コストを削減した。
DAG圧縮グラフにおける基礎問題の複雑性について [cs.DS, cs.CC]目的:DAG圧縮の複雑性に関する解析
- グラフ圧縮は,大規模グラフの効率的な処理と記憶を可能にする重要な技術である。
- 既存の木構造圧縮では限界があり,より高効率な圧縮手法が求められていた。
- DAG圧縮が木構造圧縮よりも優れた圧縮性能を持つことを証明し,計算困難性を明らかにする。
- DAG圧縮は木構造圧縮よりも優れた圧縮率を達成可能であることが示された。
- KruskalのアルゴリズムをDAG圧縮グラフ上で直接実行できることが示された。
- DAG圧縮の最小化問題はNP困難であり,動的な更新においても同様であることが証明された。
制約付きシンボルデータによる有界構造モデル探索 [cs.LO]目的:ソフトウェア設計の検証
- ソフトウェアの信頼性確保は重要であり,検証技術のニーズは高い。
- 従来の検証技術は,外部ツールへの依存やセマンティックギャップの問題がある。
- Maude書き換え論理フレームワーク内で,効率的な有界モデル探索を実現すること。
- 本研究では,Maude Model Finder (MMF)を提案し,シンボル到達可能性を活用した構造的探索エンジンを開発した。
- MMFは,クラス宣言やグラフ・データ制約から有限オブジェクト構成を生成し,SMTソルバーを制約充足性チェックとサブサムプションに限定して利用する。
- 提案手法の終端性,健全性,完全性が確認され,MaudeのACUマッチングを用いた折り畳みによる対称性の削減が可能となった。
技術的負債から認知・意図的負債へ:AI時代におけるソフトウェア健全性の再考 [cs.CL, eess.SY, cs.SY, cs.SE]目的:ソフトウェア健全性に関する負債の多角的理解
- ソフトウェア開発において,変更容易性は重要であり,そのためには健全性が不可欠である。
- 従来の技術的負債に加えて,開発者の理解不足や意図の喪失が問題となっている。
- 技術的負債,認知・意図的負債の相互関係をモデル化し,ソフトウェア健全性の評価に役立てる。
- ソフトウェア健全性を評価する上で,技術的負債に加え,認知・意図的負債の重要性が示された。
- 認知負債は開発者の理解,意図負債は将来の利用のために明示的に記録された情報を指す。
- 3つの負債タイプ間の相互作用を考慮することで,より包括的なソフトウェア健全性の評価が可能となる。
