arXiv雑要約
プログラム - 2026/04/20 公開
量子誤り予算配分の最適化に向けたゲーム理論的アプローチ [quant-ph, cs.SE]目的:量子誤り予算配分の最適化
- 量子コンピュータ実現には,誤り耐性が必要であり,そのための資源見積もりが重要である。
- 従来の誤り予算配分は一様であり,物理資源の過剰な使用につながる可能性がある。
- ゲーム理論に基づき,誤り予算の最適な配分方法を提案し,資源効率を向上させる。
- 提案手法は,潜在ゲームという枠組みを用いており,ナッシュ均衡がパレート最適解を与える。
- 433のMQTベンチマークを用いて評価した結果,物理資源要件が平均で30.22%削減された。
- 特定の回路インスタンスでは,最大97.81%の改善が見られ,誤り予算最適化の有効性が示された。
オンライン取引の秘書問題変種 [math.OC, cs.DS]目的:売り手と複数の買い手間の取引を仲介する際の,最適な価格最大化
- オンライン取引は,現代経済において重要な役割を担っており,効率的な取引戦略の確立が求められている。
- 逐次的に現れる情報に基づいた意思決定は難しく,最適なタイミングを見極めることが課題である。
- 本研究は,オンライン取引における最適なアルゴリズムを開発し,競争率を向上させることを目指す。
- 提案アルゴリズムは,強力な競争率において約3.523という良好な結果を示し,既存の上界と下界のギャップを解消した。
- 弱い競争率においては,単純なオンラインアルゴリズムにより2という競争率を達成した。
- 売り手価格がゼロの場合の特殊なケースでは,弱競争率において1.83683以下,下界は1.76239であることを示した。
微分モダリティからの$\mathbb{N}$-フィルタリングされた微分モダリティの抽出 [math.CT, cs.LO]目的:微分モダリティからの$\mathbb{N}$-フィルタリングされた微分モダリティの抽出方法
- 圏論的基礎を持つ微分モダリティは,関数型プログラミングや型システムにおける微分可能な関数を扱うための強力な抽象化ツールである。
- 既存の微分モダリティでは,関数の次数や多項式的な性質を直接的に表現することが難しいという課題があった。
- 本研究は,任意の微分モダリティから,関数の次数を考慮した$\mathbb{N}$-フィルタリングされた微分モダリティを構成することで,この課題を解決する。
- 本研究により,微分モダリティから$\mathbb{N}$-フィルタリングされた微分モダリティへの変換が可能であることが証明された。
- この変換によって得られるモダリティは,多項式写像の概念と密接に関連しており,関数の次数を明確に扱うことができる。
- この結果は,型システムやプログラム解析における微分可能な関数の表現と操作に新たな可能性を開く。
内在量子符号に対するマクウィリアムズ恒等式 [quant-ph, cs.IT, math.IT]目的:対称群のユニタリ表現における量子誤り訂正の内在的列挙子枠組み
- 量子情報処理において,量子誤り訂正は信頼性の高い量子計算に不可欠である。
- 既存の誤り訂正符号の設計は,複雑な計算や制約を伴う場合が多い。
- 対称性に着目した,より効率的な量子誤り訂正符号の設計を目指す。
- 内在的なマクウィリアムズ恒等式を確立し,符号の特性評価に新たな視点を提供する。
- SU(2)の場合に,ウィグナー6j記号を用いて具体的な変換を計算した。
- 対称ベキ乗表現への応用により,qubitおよびqudit符号に対する線形計画法による限界値を導出した。
統合センシング・通信における送信機プライバシーのための新しいフレームワーク [eess.SP, cs.CR, cs.IT, math.IT]目的:送信機関連情報の不正な推論を制限する送信機プライバシーの確保
- ISACシステムは新たなセンシング技術であり,幅広い応用が期待されている。
- 通信内容が安全でも,センシングノードが無線波形を利用して送信機情報を推論可能。
- RISを用いたシステムにおいて,プライバシーを考慮したビームフォーミング設計を提案。
- RISによる伝搬環境の制御により,不正なチャネル推定精度を大幅に低下させることが示された。
- 信頼性の高い通信を維持しつつ,プライバシー保護とセンシング精度の両立が可能であることが確認された。
- 提案手法は,数値的に効率的な最適化フレームワークにより実現可能であることが示された。
再構成可能な原子アレイを用いた超高速量子誤り訂正に向けた研究 [quant-ph, cs.IT, math.IT]目的:量子誤り訂正の性能向上
- 大規模量子計算の実現には不可欠だが,量子ビット数のオーバーヘッドが課題。
- 従来の量子低密度パリティチェック符号では,実用的な誤り率を達成するため符号化率が低い。
- 原子アレイ上で効率的に実装可能な,符号化率1/2を超える符号の設計。
- アフィン置換行列の構造に関する新たな条件を特定し,符号化率1/2を超える超高速量子誤り訂正符号を設計した。
- ノイズモデル下でのシミュレーションにより,[[2304,1156,≤14]]符号で1.3 x 10^-13,[[1152,580,≤12]]符号で2.9 x 10^-11の論理エラー率を達成した。
- これらの結果は,実用的な超高速量子誤り訂正の可能性を示唆しており,テラクォップ領域に近づいている。
3-均一ハイパーグラフにおけるオンラインマッチング [cs.DS, math.OC]目的:オンラインマッチングの競争率
- グラフ理論の発展は,ネットワーク設計や最適化問題に不可欠である。
- オンラインマッチング問題における最適な競争率の決定は困難である。
- 3-均一ハイパーグラフにおけるオンラインマッチングの最適競争率を決定すること。
- 3-均一ハイパーグラフにおいて,競争率(e-1)/(e+1) ≈ 0.4621を達成する最適な分数アルゴリズムを提案した。
- 提案アルゴリズムの最適性を,巧妙に構成された敵対的インスタンスによって証明した。
- オンラインノードの次数が有界な場合,貪欲法よりも性能の良い整数アルゴリズムを提示した。
RAGを用いたLLMベースの量子コード生成を強化するためのPennyLane中心のデータセット [cs.SE, cs.AI, quant-ph]目的:LLMベースの量子コード生成の性能向上
- 量子技術の発展には,ソフトウェア開発の効率化が不可欠である。AI支援による量子プログラミングが注目されている。
- LLMを量子ソフトウェア開発に応用するには,高品質な学習データセットと知識源が不足しているという課題がある。
- PennyLaneに特化した高品質なデータセットを構築し,RAGパイプラインによるLLMの性能向上を目指す。
- PennyLangという3,347個のPennyLane量子コードサンプルを含むデータセットを構築し,オープンソースで公開した。
- RAGを用いることで,Qwen 7Bの成功率は8.7%から41.7%に,LLaMa 4は78.8%から84.8%に向上した。
- PennyLangの使用は,幻覚の低減と量子コードの正確性の向上にも貢献した。
LZ78 ソース [cs.IT, math.IT]目的:LZ78ユニバーサル圧縮器によって誘起される逐次確率割り当てによるプロセス群の特性
- 情報圧縮の理論的基盤を深める上で重要であり,現実のデータ圧縮技術の評価に役立つ。
- 非マルコフ性や非定常性を持つデータに対する確率モデルの性能評価が困難である。
- LZ78ソースの特性を明らかにすることで,逐次確率モデルの性能評価基準を提供する。
- LZ78ソースは厳密には定常ではないが,「ほぼ定常かつエルゴード的」である。
- その実現例の正規化された対数確率がエントロピー率にほぼ確実に収束する。
- 有限状態圧縮率はエントロピー率よりも「Jensen gap」によってほぼ確実に大きくなる。
メモリ安全性の意味的退化 (拡張版) [cs.PL]目的:メモリ安全性のセマンティックな原理の探求
- メモリ安全性は現代のソフトウェア信頼性の根幹であり,システム全体の安定性とセキュリティに不可欠である。
- 既存のメモリ安全性研究は負の制約に焦点を当てがちで,メモリ安全性の本質的な原理が明確ではない。
- アロケータに依存するメモリ安全性の側面を捉え,メモリ安全性の意味的退化という概念を明確に定義すること。
- 本研究では,メモリ安全性と非干渉性の関係性を拡張し,アロケータのメモリ不足やポインタ型変換といった状況を「意味的退化」として捉える。
- 提案する「段階的なアロケータ独立性」の概念は,アロケータがプログラム実行に影響を与えないという直感を洗練させたものである。
- 最新の情報フロー制御技術を用いて,これらの拡張を技術的に適切に処理することに成功した。
TriagerX:内容と相互作用に基づくランキングを用いたバグトリアージタスクのためのデュアルTransformer [cs.SE, cs.AI, cs.LG]目的:バグトリアージにおける開発者候補のランキング精度向上
- ソフトウェア開発において,バグの適切な担当者への割り当ては,開発効率と品質に大きく影響する。
- 従来の機械学習モデルでは,バグ報告書のトークン意味を十分に捉えきれず,精度が課題であった。
- 開発者の過去のバグ対応履歴を考慮することで,より適切な担当者選定を目指す。
- TriagerXは,2つのTransformerを用いることで,バグ報告書のトークン意味をより確実に評価する。
- 開発者の過去の類似バグ対応履歴に基づくランキング手法を導入し,推薦精度を向上させた。
- 5つのデータセットで,既存のTransformerベースの手法を凌駕し,Top-1およびTop-3の推薦精度を10%以上向上させた。
LLMベースの論文タイトル・アブストラクトスクリーニングツール [cs.SE, cs.AI]目的:論文のタイトルとアブストラクトを用いたスクリーニング
- システマティックレビューは研究の質を高める上で不可欠であり,効率的なスクリーニングが課題となっている。
- 論文数が多い場合,スクリーニング作業は膨大となり,人的リソースを圧迫する。
- LLMを活用することで,スクリーニング作業の負担軽減と効率化を目指す。
- 開発したAISysRevは,Gemini,Claude,Mistralなど多様なLLMをサポートし,高速なスクリーニングを実現した。
- LLMによる分類結果は「容易包含」「容易除外」「境界包含」「境界除外」の4つに分類され,境界領域では人間の判断が重要であることが示された。
- LLMはシステマティックレビューにおける人間の判断を代替するものではないが,大量の文献評価の負担を軽減できる可能性が示された。
高階同時実行確率的プログラムの文脈的洗練 [cs.LO, cs.PL]目的:高階同時実行確率的プログラムの文脈的洗練の証明のための最初の高階分離論理
- 同時実行処理と確率的プログラミングの組み合わせは,現代のシステムにおいて重要性を増している。
- 既存の分離論理では,高階関数や確率的要素を組み合わせたプログラムの検証が困難であった。
- 高階分離論理Foxtrotを開発し,複雑な確率分布を持つプログラムの検証を可能にすること。
- Foxtrotは,分離論理の原則と高度な確率的推論原則を統合している。
- Foxtrotの健全性は,Iris論理における選択公理のバージョンに依存している。
- von NeumannコインやSodiumライブラリのrandombytes_uniform関数など,様々な例でFoxtrotの表現力を示した。
地域暖房サブステーションにおける予知保全の実現:ラベル付きデータセットとサービスデータに基づく故障検知評価フレームワーク [cs.SE, cs.AI]目的:地域暖房サブステーションの故障検知評価フレームワークの構築
- 地域暖房は都市部のエネルギー効率を向上させる重要なインフラである。
- 故障検知には,高品質なラベル付きデータセットが不可欠だが,公開されているものは限られている。
- 公開データセットと評価指標により,故障検知技術の開発と比較を促進すること。
- 本研究で構築したフレームワークは,高い正常動作認識精度(0.98)とイベントごとのFスコア(0.83)を達成した。
- データセット内の故障の60%を顧客からの報告の3~5日前までに検知することができた。
- 公開データセット,評価指標,オープンソースコードを提供することで,再現可能なベンチマークを確立した。
盆栽:剪定された木構造の走査へのクエリのコンパイル [cs.PL, cs.DB]目的:クエリ最適化のための木構造走査生成
- 大規模データ集合に対する検索や集計処理において,木構造は高速化に不可欠である。
- 従来のシステムでは,各クエリ述語とデータ構造に対して剪定ロジックを手動で実装する必要がある。
- この研究は,メタデータを用いた木構造の剪定条件を自動的に導出することを目指す。
- 提案手法は,幾何学的述語に対応した記号区間解析により,剪定条件を効率的に生成する。
- 複合クエリを単一の木構造走査に統合するコンパイラを開発した。
- 生成された走査は,手書きのコードと同等の性能を示し,線形スキャンやネストされたループ結合よりも優れている。
可逆問題におけるLLMの幻覚と脱漏の軽減:ハードウェアロジック設計自動化への応用 [cs.LG, cs.AI, cs.AR, cs.PL]目的:可逆問題に対するLLMの幻覚と脱漏の軽減手法
- ハードウェア設計の自動化は,設計期間の短縮とコスト削減に不可欠である。
- LLMは生成時に誤った情報(幻覚)や情報の欠落(脱漏)を起こしやすい。
- LLMの幻覚と脱漏を抑制し,正確なハードウェア設計を支援すること。
- 可逆問題において,LLMをロスのないエンコーダ・デコーダとして利用することで,幻覚と脱漏を大幅に軽減できることが示された。
- LCTからHDLへの変換と,その逆変換を繰り返し行うことで,生成されたHDLの正当性を検証し,設計仕様のエラー発見にも貢献する。
- 2次元ネットワーク・オン・チップルータのHDL生成実験により,本手法の有効性が確認された。
内在的に正しいアルゴリズムと再帰的コアルジェブラ [cs.PL, cs.LO]目的:再帰的アルゴリズムの正当性の内在的な検証
- アルゴリズムの正確性を数学的に保証することが重要である。形式手法による検証は信頼性の高いソフトウェア開発に不可欠である。
- コアルジェブラを用いたアルゴリズムの検証は複雑であり,特に再帰性の証明は困難を伴う。
- 内在的に再帰性を持つコアルジェブラを構築し,形式的な検証を容易にすることを目指す。
- 健全な関係でインデックス付けされた関数の圏上の健全な関手という新しい概念を導入した。
- 健全な関手に対するコアルジェブラはすべて再帰的であることが示された。
- Quicksort,ユークリッドの互除法,CYK構文解析など,主要な結果と選択された事例研究をCubical Agdaで形式化された。
数学の普遍言語(二進法の原理へ) [cs.IT, math.IT]目的:数学の根源的な考え方
- 科学技術の発展には数学が不可欠であり,その基礎理解が重要である。
- 数学が難解で理解しにくいというイメージが広く存在している。
- 数学の根本原理を明らかにし,より直感的で理解しやすい数学教育を目指す。
- 数学を単なる公式や規則ではなく,人間の思考の最も深い表現として捉える視点を提供する。
- 二進法が数学的思考の原始的な構成要素であり,あらゆる理論や応用を生み出す基盤であることを示す。
- 数学の普遍性を強調し,科学,技術,コミュニケーションにおける役割を明らかにする。
保存された活性情報 [cs.DM, cs.NE, cs.CC, cs.HC, cs.IT, math.IT]目的:探索空間全体における正味の情報獲得/損失の定量化
- 情報科学の基礎理論を深め,複雑なシステム理解に貢献する。
- 従来のKLダイバージェンスでは捉えきれない現象が存在する。
- KLダイバージェンスの限界を克服し,新たな知見を提供する。
- 保存された活性情報$I^\oplus$は,KLダイバージェンスでは隠されていた領域を明らかにする。
- 強力な知識がグローバルな無秩序を減少させる場合など,新たな現象を実証的に示す。
- 活性情報への長年の批判を解消し,探索,最適化などへの応用を可能にする。
RepoShapley:Shapley値を用いたリポジトリレベルのコード補完における文脈フィルタリング [cs.CL, cs.SE]目的:リポジトリレベルのコード補完における文脈フィルタリング手法
- 大規模コードリポジトリの活用は,より高精度なコード補完に繋がる重要な研究分野である。
- 関連するコード断片の選択が難しく,組み合わせによっては補完性能を低下させる問題がある。
- Shapley値を活用し,最適な文脈フィルタリングにより,補完精度向上と有害な文脈の削減を目指す。
- 提案手法RepoShapleyは,Shapley値に基づいた文脈フィルタリングにより,コード補完の質を向上させる。
- 有害な文脈や不要な検索を減らすことで,効率的なコード補完を実現する。
- 様々なベンチマークとバックボーンにおいて,その有効性が確認された。
非二進削除チャネルにおける部分列の数 [cs.IT, math.CO, math.IT]目的:非二進文字列における部分列の数
- 削除チャネルは情報理論において重要なモデルであり,ノイズの多い通信における符号化・復号化の理解に不可欠である。
- 部分列の数を正確に計算することは計算量的に困難であり,現実的なサイズの文字列に対しては近似的な評価が必要とされてきた。
- r-run非二進文字列における部分列数の上限を改善し,最大の部分列数を多項式時間で計算することを目指す。
- r-run非二進文字列の族を特定し,任意のt回の削除に対して最大の部分列数を持つことを示した。
- 特定された文字列族の部分列数を多項式時間で計算できるアルゴリズムを開発した。
- この結果は,削除チャネルにおける符号化効率の評価に貢献すると考えられる。
微分プライバシーアルゴリズムの一般化誤差:典型性による考察 [cs.IT, math.IT]目的:微分プライバシーアルゴリズムの一般化誤差に関する情報理論的評価
- 機械学習のプライバシー保護は,個人情報保護の観点から極めて重要である。
- プライバシー保護と学習精度のトレードオフが課題であり,厳密な評価が求められる。
- 典型性に基づくアプローチで情報量を厳密に評価し,一般化誤差の上界を改善する。
- 相互情報量と最大漏洩に関する既存の上界を厳密に改善することに成功した。
- 典型性に基づく議論とプライベートアルゴリズムの安定性を活用した計算可能な公式を導出した。
- 得られた情報量の制約は,直接一般化誤差の保証へとつながる。
SATソルビングを用いたゲート隠蔽化回路における関数復元攻撃 [cs.DC, cs.CR, cs.LO]目的:ゲート隠蔽化回路における関数復元攻撃の実現可能性の検証
- 入力データと関数ロジックを保護する共同計算の重要性が高まっている。
- ゲート隠蔽化回路のセキュリティ定義が,回路トポロジーからの漏洩を考慮していない。
- 回路トポロジーからの漏洩が関数プライバシーに与える影響を評価し,攻撃手法を開発する。
- 回路の公開されたトポロジーから隠されたゲート操作を復元するSATベースの関数復元攻撃を提案した。
- Incremental SATソルビングフレームワークと簡略化定理を組み合わせることで,より大規模な回路への対応を可能にした。
- 実験により,回路トポロジーからの漏洩のみでも実用的な関数復元が可能であることが示された。
フラッグを奪取せよ:意味保持変換によるエージェント型LLMの家族ベース評価 [cs.SE, cs.AI]目的:エージェント型LLMのロバスト性と汎化性能の評価
- サイバーセキュリティは重要性が増しており,LLMの活用が期待されている。
- 既存の評価指標では,LLMのソースコードの変更に対する頑健性が不明確である。
- 意味保持変換を用いて評価指標を強化し,LLMのロバスト性を詳細に分析すること。
- モデルは,リネームやコード挿入といった単純な変換には高いロバスト性を示す。
- 複数の変換や難読化処理を組み合わせると,性能が低下し,高度なツール利用が必要になる。
- 明示的な推論能力の付与は,成功率にほとんど影響を与えなかった。
KRONE:階層的抽象化によるスケーラブルなLLM拡張ログ異常検知 [cs.DB, cs.AI, cs.SE]目的:ログ異常検知のための階層的フレームワークの提案
- システム障害やセキュリティリスクの早期発見は,サービスの安定運用に不可欠である。
- 従来のログ分析では,実行構造が失われ,誤った相関関係を学習しやすい。
- 実行階層を自動的に導出し,モジュール化された異常検知を実現すること。
- KRONEは,既存手法と比較して,精度,F1スコア,データ効率,リソース効率,解釈可能性において大幅な改善を達成した。
- F1スコアは10.07%(82.76%から92.83%へ)向上し,LLMの使用量はテストデータのわずか1.1%から3.3%に抑制された。
- KRONEは,階層構造を活用したモジュール化と,LLMによる異常検知・説明により,効率的かつ解釈可能な異常検知を実現した。
多項式法による暗黙的表現 [cs.IR, cs.CL, cs.CG, cs.DM, cs.DS, math.CO]目的:半代数的グラフに対するコンパクトな隣接ラベルスキームの構築
- グラフ理論は,ネットワーク構造の解析や最適化に応用され,情報科学や工学の基盤技術である。
- 従来のグラフ表現は,頂点数が増加すると表現に必要なビット数が指数関数的に増加する課題がある。
- 半代数的グラフに対する効率的な隣接ラベルスキームを開発し,表現の複雑さを削減することを試みる。
- 半代数的グラフ族に対し,各頂点に$O(n^{1-2/(d+1) + \varepsilon})$ビットのラベルを割り当てることで,ラベルのみから隣接性を判定可能となる。
- 具体的には,単位円グラフやセグメント交差グラフに対し,$O(n^{1/3 + \varepsilon})$ビットのラベルで表現できることを示した。
- また,線形多項式のみで定義される半線形グラフは,$O(\log n)$ビットのラベルで表現可能であり,多角形可視グラフは$O(\log^3 n)$ビットで表現可能である。
拡張されたシナリオのための多チャネル衝突回避符号 [cs.CL, cs.IT, math.IT]目的:多チャネル衝突回避符号の設計
- 無線通信において,複数のユーザが同時にアクセスする状況下での安定した通信確保が重要である。
- 既存の多チャネル衝突回避符号は,チャネル数と符号の重みが同等以上であることを前提としている。
- チャネル数よりも符号の重みが大きい状況下での,より実用的な衝突回避符号を設計する。
- 例外符号という概念を導入し,組合せ論の技術を用いて最適な多チャネル衝突回避符号を導出した。
- 既存の衝突回避符号の結果を一般化し,より広範なシナリオへの適用を可能にした。
- 結果はAM-OPPTS多チャネル衝突回避符号や混合重み多チャネル衝突回避符号にも自然に拡張される。
初心者プログラマのための認知負荷を考慮した自動リファクタリングによるコード理解の向上 [cs.SE]目的:初心者プログラマのコード理解度向上
- プログラミング教育において,コード理解は重要な課題である。理解不足は学習効率を低下させる。
- 初心者プログラマは,曖昧な命名や複雑な構造により,コード理解に苦労しやすい。
- 認知負荷を考慮した自動リファクタリングにより,コードの可読性を高め,理解を助ける。
- CDDRefactorERは,リファクタリング失敗率を54~71%削減し,サイクロマティック複雑度と認知複雑度の増加を抑制した。
- 人間を対象とした実験では,関数識別が31.3%向上し,構造的な可読性が22.0%向上した。
- 認知に基づいたリファクタリングは,初心者プログラマのコード理解を効果的に向上させる実用的な手法である。
基数制約のほぼ最適なエンコーディング [cs.CC, cs.LO]目的:基数制約に対するより少ない節数で済む新しいエンコーディング
- 組み合わせ最適化問題の効率的な解法には,制約充足問題への変換が不可欠である。
- 既存の基数制約エンコーディングは,節数が多く,計算コストが高いという課題があった。
- 基数制約エンコーディングの節数を削減し,より効率的な解法を実現することを目指す。
- AtMostOne制約に対し,$2n + 2 \sqrt{2n} + O(\sqrt[3]{n})$節のCNFエンコーディングを提案し,既存のエンコーディングの最適性に関する仮説を否定した。
- この構成により,閾値2関数のより小さい単調回路が得られ,50年前のAdlemanの構成を改善し,回路複雑性における長年の未解決問題を解決した。
- AtMost_k制約に対し,「グリッド圧縮」という新しい手法を導入し,$k = o(\sqrt[3]{n})$の場合には$2n + o(n)$節,$k = o(n)$の場合には$4n + o(n)$節でエンコーディングできることを示した。
TestDecision:貪欲法と強化学習による逐次テストスイート生成 [cs.SE]目的:テストスイートの生成
- ソフトウェアの品質保証において,自動テストは不可欠であり,その効率化が求められている。
- オープンソースLLMは,コストやプライバシーの観点から重要だが,テスト生成においてスイート全体の視点が不足している。
- テストスイート生成を逐次的な意思決定問題として捉え,効率的なテスト生成を実現する。
- TestDecisionは,オープンソースLLMのテスト生成能力を向上させるための新しい手法である。
- ULTベンチマークにおいて,既存手法と比較して,ブランチカバレッジが38.15-52.37%向上,実行パス率が298.22-558.88%向上した。
- TestDecisionは,GPT-5.2に匹敵する性能を7BのLLMで達成し,より多くのバグを発見し,汎化性能に優れていることが示された。
REST APIテスト生成戦略のログカバレッジによる評価 [cs.SE]目的:REST APIテスト生成戦略の有効性評価
- APIの品質保証は,現代のソフトウェア開発において不可欠であり,信頼性の高いシステム構築に繋がる。
- ブラックボックステストでは,ソースコードへのアクセスが制限されるため,テストの網羅性を評価しにくい。
- ログカバレッジを用いることで,ソースコードにアクセスできない環境でもテストの有効性を定量的に評価する。
- Claude Opus 4.6によるテストは,人間が作成したテストと比較して,平均で28.4%多くのログテンプレートを発見した。
- EvoMasterとGPT-5.2-Codexは,それぞれ26.1%と38.6%少ないログテンプレートを発見した。
- 人間が作成したテストとClaude Opus 4.6を組み合わせることで,全体的なログカバレッジがそれぞれ78.4%と38.9%増加した。
MR-Coupler: 関数結合分析による自動的変異テスト生成 [cs.SE, cs.AI]目的:関数結合分析を利用した変異関係の自動構築と変異テストケースの生成
- ソフトウェアの品質向上において,テストは不可欠であり,特にオラクル問題の解決が重要である。
- 変異テストは有効だが,効果的な変異関係の構築が難しく,専門知識や情報が必要となる。
- ソースコードから容易に得られる関数結合を利用し,変異関係を自動的に構築することで,この課題を解決する。
- MR-Couplerは,関数間の結合を分析し,大規模言語モデルを用いて変異テストケース候補を生成する。
- 生成された変異テストケースの妥当性は,テスト増幅と突然変異分析によって検証される。
- 実験の結果,MR-Couplerは90%以上のタスクで有効な変異テストケースを生成し,実世界のバグの44%を検出した。
プログラミング言語の自己エミュレーション完全性 [cs.PL]目的:プログラミング言語における自己エミュレーションの条件
- プログラム言語の設計において,安全性や移植性が重要であり,エミュレーションはその実現に不可欠である。
- チューリング完全性だけでは,現実的なプログラムが依存する状態(制御フロー,例外など)の再現が困難である。
- 自己エミュレーションに必要な言語とエミュレータ側の要件を明確化し,体系的な分析枠組みを提供する。
- 言語の自己エミュレーション完全性を,ソースレベルとコンパイル済みコードの2つの観点から定義した。
- エミュレーションの完全性を,弱いものと強いものに分類し,再現すべきランタイム動作の範囲を明確にした。
- Erlangの事例を通して,直接実行と自己エミュレーションの間の微妙な不一致を具体的に示した。
LLMエージェントによる自動ソフトウェア分析タスクの評価 [cs.CL, cs.RO, cs.SE]目的:自動ソフトウェア分析タスクにおけるLLMエージェントの有効性
- ソフトウェア品質向上には,多様な分析ツールが不可欠である。しかし,環境構築等の課題が存在する。
- オープンソースプロジェクトへの分析ツール適用は,環境構築や設定の複雑さから困難である。
- LLMエージェントを活用し,分析ツールの自動的な環境構築と実行を可能にすること。
- 新たに構築したベンチマーク AnalysisBench を用いて,4種類のLLMエージェントを評価した。
- 提案手法 AnalysisAgent は,Gemini-3-Flash において94%の成功率を達成し,既存手法を上回った。
- エージェントのアーキテクチャがLLMの能力よりも重要であり,自己検証による成功率は手動検証と乖離する傾向が確認された。
固定された偽発見率を超えて:E変数を用いた事後的適合性選択 [cs.LG, cs.IT, math.IT, stat.ML]目的:適合性選択における,データに基づいた偽発見割合の推定と,ユーザーが指定する有用性を最大化することによる選択点の決定
- 多検定問題において,偽発見率の制御は重要な課題であり,ゲノミクスや神経画像処理等の分野で特に重要である。
- 従来の適合性選択法は,目標とする偽発見率を事前に固定するため,データに応じて選択数と偽発見率のバランスを調整することが困難であった。
- 本研究は,データ駆動型の偽発見割合の推定に基づき,ユーザーが指定した有用性を最大化することで,柔軟な選択を可能にすることを目指す。
- 事後的適合性選択(PH-CS)は,候補選択集合の経路を生成し,各集合とデータに基づいた偽発見割合の推定値を対応付ける。
- PH-CSは,ユーザーが指定する有用性を最大化することで,選択サイズと偽発見率のバランスを自由に調整できる。
- 理論的に,PH-CSは有限サンプルにおける信頼性保証を提供し,推定された偽発見割合と実際の偽発見割合の比率が平均で1以下となることが示された。
最適な述語プッシュダウン合成 [cs.PL]目的:述語プッシュダウンの最適化
- データ処理パイプラインの性能向上は重要であり,特にUDF内の処理を効率化することが求められる。
- UDFは複雑な処理を含むため,述語プッシュダウンの適用は困難であり,最適な変形を見つけることが課題である。
- 状態を持つfold演算に基づく計算における述語プッシュダウンの一般的な基盤を提供し,最適な変形を自動合成する。
- 本研究では,内部状態間の双シミュレーション不変量を用いて,述語プッシュダウンの正当性を保証するフレームワークを開発した。
- 開発したツールPusharooは,既存の手法よりも表現力が高く,150のデータ処理パイプラインで効果的な述語プッシュダウンを実現した。
- 実験結果から,Pusharooは平均で2.4倍,最大で2桁の高速化をもたらし,述語プッシュダウンの最適化が性能向上に寄与することが示された。
流体アンテナ支援全二重ネットワークにおける空中の多機能RIS:自己最適化されたハイブリッド深層強化学習アプローチ [cs.IT, cs.AI, eess.SP, math.IT]目的:第6世代(6G)ネットワークの高トラフィック需要への対応
- 無線通信におけるデータ需要の増大に対応するため,効率的なネットワークアーキテクチャが求められている。
- 既存の無線ネットワークでは,信号干渉やエネルギー効率の低さが課題となっている。
- 再構成可能なインテリジェント表面(RIS)と流体アンテナを活用し,エネルギー効率を最大化する。
- 提案手法は,従来の深層強化学習アルゴリズムと比較して,エネルギー効率において優れた性能を示すことが確認された。
- 空中多機能RISは,半二重通信,固定アンテナアレイ,部分的なエネルギーハーベスティングと比較して,高いエネルギー効率を実現する。
- 自己最適化されたハイブリッド深層強化学習フレームワーク(SOHRL)が,離散・連続パラメータの最適化を効果的に行う。
MatClaw:エンドツーエンド材料探索のための自律型コード優先LLMエージェント [cond-mat.mtrl-sci, cs.SE]目的:材料探索における自律型エージェントの開発
- 材料科学分野では,計算資源と専門知識を効率的に活用した材料開発が求められている。
- 既存のLLMエージェントは,特定のシミュレーションコードに依存し,拡張性に課題がある。
- 本研究は,コード生成能力を活用し,知識の形式化が難しい暗黙知を補完する。
- MatClawは,Pythonコードを直接記述・実行し,既存のライブラリを組み合わせてHPCクラスター上でワークフローを構築する。
- 独自の四層メモリ構造により,複数日におよぶワークフローでも文脈損失を防ぎ,API呼び出しの精度を高めている。
- 文献学習や専門家による制約付与といった介入により,研究者の知識とエージェントの実行を融合する「ガイデッドオートノミー」モデルを提示した。
- 1
- 2
