arXiv雑要約
プログラム - 2026/03/25 公開
リソース制約のある量子スイッチのためのインデックスベースのスケジューリング [cs.CY, eess.SY, cs.SY, physics.app-ph, cs.IT, cs.NI, cs.SY, eess.SY, math.IT]目的:量子スイッチにおける多者間エンタングルメント要求の処理最適化
- 量子通信ネットワークの発展において,量子エンタングルメントの効率的な分配が重要である。
- 量子スイッチのメモリ制約下では,エンタングルメント要求のスケジューリングが困難である。
- メモリ制約下で,平均処理要求数を最大化するスケジューリング手法を確立する。
- 本研究では,スケジューリング問題をレストレス多腕バンディット問題として定式化し,インデックス可能性を示す。
- 全ての要求年齢ペアに対するウィットルインデックスの閉形式表現を導出し,ナップサック問題としてメモリ制約下のスケジューリングを解いた。
- また,修正されたウィットルインデックスを用いた低複雑度な貪欲法スケジューリングポリシーを提案した。
ReqFusion:ソフトウェアドメイン横断的なPEGS分析のためのマルチプロバイダフレームワーク [cs.SE, cs.AI]目的:ソフトウェア要求の抽出,分類,分析の自動化
- ソフトウェア開発において,要求工学は重要な段階であり,その品質がプロジェクト成功を左右する。
- 要求工学は手作業が多く,時間と労力がかかるため,効率化が課題となっている。
- 複数のLLMを活用し,PEGS形式を用いることで,要求抽出の精度と効率を向上させる。
- ReqFusionは,OpenAI GPT,Anthropic Claude,Groqといった複数のLLMプロバイダを統合し,PDF,DOCX,PPTXなどのドキュメントからソフトウェア要求を抽出する。
- PEGS形式に基づいたプロンプトが,汎用的なプロンプトと比較して高いF1スコア(0.88対0.71)を達成し,要求抽出の有効性が確認された。
- 実世界の18件のドキュメントを用いた評価により,手作業と比較して分析時間が78%削減され,要求抽出の精度が向上することが示された。
倍次元距離空間における動的ライトスパンナ [cs.CG, cs.DS]目的:動的点集合におけるスパンナの維持
- 距離空間における近傍探索やネットワーク構築において,効率的なデータ構造が不可欠である。
- 点集合の挿入・削除が頻繁に行われる動的な環境下では,既存のスパンナ維持アルゴリズムは効率が悪い。
- 倍次元距離空間において,軽量なスパンナを効率的に更新するアルゴリズムを開発し,その性能を評価する。
- 本研究では,定数次元の倍次元距離空間において,$(1+\varepsilon)$-スパンナを維持する効率的な動的アルゴリズムを提案した。
- 提案アルゴリズムでは,各更新(挿入または削除)を $\operatorname{poly}(\log \Phi)$ 時間で実行可能であり,スパンナの総重量は最小全域木の重量の定数倍以内に収まる。
- これにより,低次元ユークリッド空間においても効率的な動的スパンナ維持が可能となる。
Infrastructure-as-Codeと大規模言語モデルを用いたマイクロサービスパターンインスタンスの自動検出 [cs.SE, cs.AI]目的:マイクロサービスパターンのインスタンス検出の自動化
- ソフトウェアアーキテクチャ知識の維持は重要であり,特にマイクロサービスのような構造的情報は不可欠である。
- ソースコードだけではパターン検出が難しく,他のアーティファクトの分析が必要となる場合がある。
- IaCアーティファクトとLLMを用いた自動検出により,パターン検出のコストを削減し,適用範囲を最大化することを目指す。
- プロトタイプは22のGitHubプロジェクトで3回実行された結果,検出されたパターンの83%がプロジェクト内に存在することが確認された。
- パターンインスタンス検出のコストは最小限であり,自動化の実現可能性を示唆する。
- 本研究は,パターンインスタンス検出の自動化への参入障壁を下げ,開発者へのアーキテクチャ知識の普及に貢献することが期待される。
2-CNFからOBDDへのコンパイル可能性の閾値 [math.OC, cs.MS, cs.DS, cs.DM, math.CO, math.PR]目的:2-CNF数式のOBDDへのコンパイル可能性に関する閾値の存在
- 論理回路の検証や最適化において,OBDDは重要な役割を果たす。
- 2-CNF数式に対するOBDDのサイズが指数関数的に大きくなる場合があり,実用的な検証が困難となる。
- 2-CNF数式の変数の数に対する節の数の比率によって,OBDDのサイズが多項式か指数関数か判定する。
- 節の数と変数の数の比率$\delta$が$0 \leq \delta < 1/2$または$\delta > 1$であれば,多項式サイズのOBDDが存在する。
- 一方,$\delta$が$1/2 < \delta < 1$であれば,指数関数サイズのOBDDしか存在しない。
- 閾値$\delta = 1/2$と$\delta = 1$は,それぞれ2-CNFの木幅と充足可能性に関する既知の閾値と一致する。
調和変換による偏った量子容量の幾何学的分類 [quant-ph, cs.IT, math.IT]目的:偏った量子容量の幾何学的分類
- 量子情報理論は,量子コンピュータ実現の基礎であり,情報処理の限界を探求する上で重要である。
- 対角局所位相ノイズ下での量子誤り訂正能力評価は,既存手法では厳密な決定が困難であった。
- 位相ノイズモデルに基づく厳密な誤り訂正能力の評価手法を確立し,その限界を明らかにする。
- 対角局所位相ノイズ下では,最大論理次元が古典的なq進パッキング関数Aq(n,2t+1)で決定されることが示された。
- 調和変換の原理により,位相演算子がフーリエ領域での剛体変換と等価となり,Knill-Laflamme条件が簡略化される。
- 混合パウリノイズ下では,共役領域での同時保護にレートペナルティが発生し,離散調和的不確定性原理が明らかになった。
量子シミュレータのバグに関する理解:実証的研究 [quant-ph, cs.SE]目的:量子シミュレータにおけるバグの分析と分類
- 量子コンピュータ開発において,シミュレータはアルゴリズム検証やシステム評価に不可欠である。
- 大規模量子ハードウェアが未発達な現状,シミュレータの信頼性検証が十分ではない。
- シミュレータのバグの根本原因と発生状況を明らかにし,信頼性向上策を提示する。
- 分析の結果,バグの発見は主にユーザーによって行われ,自動テストでの検出は限定的であることが示された。
- 論理的な誤りは広範囲に存在し,クラッシュやエラーメッセージなしに誤った結果を出力することが多い。
- 重大な障害の多くは,量子計算ロジックではなく,メモリ管理や設定などの古典的なシミュレータ基盤に起因する。
ポスト選択分布モデル評価 [math.CO, cs.DM, stat.ML, cs.IT, cs.LG, math.IT]目的:モデル評価における分布の信頼性確保
- モデルの性能評価は,実用的なシステム開発において不可欠である。
- 事前評価でモデル選択を行うと,評価データに対する過剰適合が生じ,性能評価が歪む可能性がある。
- モデル選択後の分布評価におけるバイアスを制御し,信頼性の高い比較を可能にすること。
- 本研究で提案するPS-DMEは,モデル選択後の偽カバー率を統計的に制御する。
- サンプル分割法と比較して,より少ないサンプル数で同等の精度を実現できる。
- 合成データ,テキストSQL変換,通信ネットワーク評価において,PS-DMEの有効性が示された。
q-Caputo分数汎化ツァリスエントロピー:級数表現と非負性領域 [cond-mat.stat-mech, cs.IT, math-ph, math.IT, math.MP]目的:q-Caputo作用子を用いたツァリスエントロピーの分数汎化
- 非平衡系の熱力学において,エントロピーは重要な役割を果たす。
- 従来のツァリスエントロピーでは,分数演算子の適用が限定的であった。
- 分数演算子を導入し,非負性領域を明らかにすることで,ツァリスエントロピーの適用範囲を拡大する。
- q-Caputo作用子を用いた分数汎化ツァリスエントロピー $S_{q}^{\alpha}$ を定義した。
- このエントロピーは,q-ガンマ関数を用いた閉じた級数表現を持つことが示された。
- パラメータαとqの変化に伴う,$S^{\alpha}_q$ の非負性領域を数値的に解析した。
非分解型状態に対する単一文字型の片方向蒸留可能エンタングルメント [quant-ph, cs.IT, math-ph, math.IT, math.MP]目的:非分解型状態における片方向蒸留可能エンタングルメントの計算可能性
- 量子情報理論において,エンタングルメントは量子通信や量子計算の基礎となる重要な概念である。
- 片方向蒸留可能エンタングルメントの計算は困難であり,多くの計算資源を必要とする。
- 分解可能性を超えた設定下でも単一文字型で表現可能な状態の条件を明らかにすること。
- 本研究では,弱化された分解可能性条件(正則化された低ノイズ型と情報分解型)を導入し,それらが単一文字型表現を保証することを示した。
- 直交フラッグ混合状態においては,一方の成分がエンタングルメントを持たない場合,混合状態も単一文字型を維持することが明らかになった。
- テンソル積設定におけるエントロピー最小化のための一般化されたスピン整列原理を提案し,その有効性を検証した。
マイナーを持たないネットワークにおける効率的な分散分解とルーティングアルゴリズムとその応用 [cs.DS, cs.DC]目的:マイナーを持たないネットワークにおける効率的な分解とルーティング手法の開発
- 分散アルゴリズムの分野において,ネットワーク構造の特性を利用した効率的な処理が重要である。
- 従来のアルゴリズムは,複雑なネットワーク構造において計算コストが高くなるという課題があった。
- マイナーを持たないネットワークに特化したアルゴリズムを開発し,計算効率を向上させる。
- 本研究では,CONGESTモデルにおいて,決定的にpoly(log n, 1/ε)ラウンドで完了する分解とルーティングアルゴリズムを提案した。
- 特に,次数制限グラフにおいては,O(ε⁻¹log n) + ε⁻O(1)ラウンドでアルゴリズムが完了する。
- このアルゴリズムを応用することで,最大独立集合の近似計算や,マイナー閉性を持つ性質のプロパティテストを効率的に行うことができる。
算術述語の単項理論の決定可能性について [eess.SY, cs.SY, cs.LO]目的:算術述語の単項二階理論の決定可能性
- 数理論理学は,数学の基礎を厳密に構築し,その体系における演繹可能性を研究する上で重要である。
- 単項二階論理における決定可能性問題は,一般には解決が難しく,特定の算術述語の組み合わせに対する決定可能性が不明である。
- 線形漸化式に関連する算術述語に対する単項二階理論の決定可能性を明らかにし,新たな決定可能性の結果を得る。
- 2の冪集合とフィボナッチ数列を含む構造の単項二階理論は決定可能である。
- 2, 3, 6の冪集合を含む構造の単項二階理論は決定可能である。
- 4の冪集合とNの2乗を含む構造の単項二階理論は決定可能であり,2の冪集合とNの2乗を含む構造の理論は,√2の二進展開に対応する理論と同等である。
単一サンプル多単位預言者不等式の静的価格設定 [eess.SY, cs.SY, cs.RO, cs.GT, cs.DS]目的:単一サンプル多単位預言者不等式における最適な価格設定戦略
- オークション理論やメカニズムデザインにおいて,効率的な資源配分は重要な課題である。
- 不確実な需要に対する最適な価格設定は,情報制限下で難しい問題である。
- 単一サンプル情報のみで,多単位商品の社会厚生を最大化する静的価格設定を解明する。
- $k$個の同一商品を販売する場合,価格を$k$番目に大きいサンプル値に設定することで,競争率1/2を達成できる。
- 商品数$k$が大きくなる場合,価格を$(k-\sqrt{2k\log k})$番目に大きいサンプル値に設定するのが最適である。
- この価格設定戦略は,分布が既知の場合の最適戦略と比較して,僅かな差しかなく,効率的であることが示された。
LOGSAFE:論理的指針による信頼性の高い連合時系列学習の検証 [cs.CR, cs.AI, cs.DC, cs.LO]目的:連合時系列学習における信頼性向上
- サイバーフィジカルシステム等の時間依存データ分析において,連合学習の活用が重要視されている。
- 連合学習は,悪意のある参加者によるデータ汚染攻撃に対して脆弱であるという課題がある。
- LOGSAFEは,論理的推論を用いて悪意のあるクライアントを検出し,連合学習の信頼性を高めることを目指す。
- LOGSAFEは,従来の更新類似性に基づく手法を超え,クライアントの信頼性を評価する。
- クライアント固有の時間特性を抽出し,グローバルなパターンを推論し,それらに対する検証を行う。
- 実験結果から,既存手法と比較して最大93.27%の誤差削減を達成することが示された。
ホモトピー型理論におけるコクライミット [cs.LO, math.CT, math.LO]目的:ホモトピー型理論における(ホモトピー)コクライミットの理論
- 型理論とホモトピー理論の融合により,数学的構造の新しい定式化が可能となる。
- 型理論におけるコクライミットの構成方法と性質は未だ十分に解明されていない。
- 型宇宙のコクライミットと,型宇宙のスライスにおけるコクライミットの関係を明確化する。
- 本研究では,型宇宙におけるコクライミットと,型宇宙のスライスにおけるコクライミットの間のつながりを特徴づける。
- 忘却関手は木上のコクライミットを生成することが示された。
- コクライミットと直交因子系,そしてコホモロジー理論の相互作用が研究された結果,n連結性が保存されることが示された。
短い証明中のバグの発見:Resolution下界のメタ数学 [cs.CC, cs.LO]目的:証明複雑性下界における反駁問題の研究
- 証明複雑性は,計算可能性理論や理論計算機科学において重要な研究テーマである。
- Resolutionシステムに対する下界証明は困難であり,効率的な反駁問題の解決が求められている。
- Resolution下界に対応する反駁問題の複雑さを捉え,下界証明のメタ数学的性質を解明すること。
- 反駁問題の複雑性を捉える新しいクラスrwPHP(PLS)を決定木TFNPに導入した。
- 理論T^1_2(α) + dwPHP(PV(α))が,Resolutionサイズ下界証明に必要な推論能力を特徴づけることを示した。
- 多くのResolutionサイズ下界が,低幅のランダムResolutionで証明可能であることがわかった。
不一致理論による注意機構近似のストリーミング手法 [cs.LG, cs.AI, cs.DS]目的:長文脈トークン生成における注意機構近似のストリーミング複雑性
- 大規模言語モデルの性能向上に伴い,その高いメモリ要件が課題となっている。
- 長文脈処理における計算コストとメモリ消費の増大がボトルネックとなっている。
- 不一致理論に基づき,効率的な注意機構近似アルゴリズムを開発し,メモリ効率を改善すること。
- 提案手法BalanceKVは,KeyとValueトークンのバランスの取れた選択により,注意機構計算を近似する。
- 理論的な保証に加え,既存手法と比較して,注意機構近似と長文脈ベンチマークにおける性能向上が確認された。
- ストリーミング注意機構計算の空間下界も示され,アルゴリズムの効率性が裏付けられた。
トレーニング不要な調整可能多項式グラフフィルタによる超高速マルチモーダル推薦 [cs.IR, cs.AI, cs.IT, cs.LG, cs.SI, math.IT]目的:マルチモーダル推薦システムの効率的かつ正確な推薦
- ユーザーとのインタラクションの希薄性を緩和し,エンゲージメントを高めるため,マルチモーダル推薦システムが重要視されている。
- 既存のニューラルネットワークベースモデルは,複数のモダリティからの情報を学習・統合する複雑な訓練プロセスに大きな計算コストがかかる。
- 本研究は,訓練を必要としないグラフフィルタリングに基づく手法により,計算コストを削減しつつ,推薦精度を向上させることを目指す。
- 提案手法は,既存の最良手法と比較して,最大22.25%の推薦精度向上を達成した。
- また,実行時間を10秒未満に抑えることで,計算コストを大幅に削減することに成功した。
- グラフフィルタの周波数応答を調整することで,多種多様なモダリティからの情報を最適に融合することが可能となった。
工業規模の製品構成への取り組み [cs.SE, cs.PL]目的:製品構成の標準モデル群
- 顧客ニーズの多様化により,製品構成の自動化が重要性を増している。
- 製品構成問題のベンチマークが不足しており,研究間の比較が困難である。
- 製品構成問題の標準的なベンチマークを提供し,研究開発を促進すること。
- COOM言語で記述された製品モデルのベンチマーク群を提案した。
- ベンチマークは,複雑度の異なる3つのフラグメントに分けられ,自転車モデルを例示している。
- ASPに基づく製品構成ワークフローを提示し,その適応性と拡張性を示した。
非コヒーレント大規模MIMO通信における低複雑度検出 [cs.RO, cs.SY, eess.SY, cs.IT, eess.SP, math.IT]目的:大規模MIMO通信における非コヒーレント受信のための低複雑度検出手法
- 無線通信容量の増大のため,基地局に多数のアンテナを配置するMIMO技術が重要視されている。
- 大規模アンテナ数におけるコヒーレント検波は複雑であり,現実的な実装が困難である。
- 基地局におけるフェージングの空間定常性を利用し,低複雑度な非コヒーレント検波を実現する。
- 受信信号の空間・時間表現における巡回定常構造を利用することで,カルーネン・ローブ変換に基づく低複雑度受信機を導出した。
- 提案手法は,中程度のアンテナ数においても最大尤度検波を近似的に実現可能である。
- スペクトル解析は,空間・時間符号の設計に関する洞察を提供する。
相対エントロピー符号化によるデータ圧縮 [cs.IT, math.IT]目的:データ圧縮における相対エントロピー符号化の理論的限界とアルゴリズム開発
- 機械学習の発展により,プライバシー保護やデータ特性に応じた圧縮が可能となり,重要性が増している。
- 古典的な情報理論では,連続空間への適用や機械学習との統合に課題があった。
- 相対エントロピー符号化を用いて,より効率的かつ実用的な圧縮手法を開発することを目指す。
- 相対エントロピー符号化の通信と計算効率に関する新たな理論的限界を証明した。
- ポアソン点過程の理論に基づき,理論的最適値に匹敵する性能を持つ新しいアルゴリズムを開発した。
- ベイズ暗黙的ニューラル表現を用いた画像,音声,動画,タンパク質データの圧縮において,高い実用性能を示した。
文脈から意図へ:推論誘導による関数レベルのコード補完 [cs.SE, cs.AI]目的:関数レベルのコード補完における開発者の意図推論
- 大規模言語モデルの活用がコードリポジトリでの関数補完を促進している。
- 明確なドキュメンテーションがない場合,言語モデルは正確な補完が困難。
- コード文脈から開発者の意図を推論し,より正確な補完を実現する。
- 提案手法は,言語モデルが文脈のヒントを段階的に利用して意図を推論することを可能にする。
- 4万件のデータセットを構築し,中間的な推論過程とドキュメンテーションを付与することで性能向上を促した。
- DevEvalおよびComplexCodeEvalでの実験で,DeepSeekCoderとCodeLLaMA系列においてpass@1が25%以上向上した。
TopoMap:テスト入力空間における地形的領域の特性に基づく意味的識別器 [cs.LG, cs.SE]目的:深層学習モデルのテストにおける,モデルの誤動作を引き起こす入力の特徴に基づく分類
- 深層学習の信頼性確保は重要であり,テスト技術の確立が不可欠である。
- 既存のテスト手法では,誤動作を引き起こす特徴の全体像が捉えられていない。
- 入力空間の特徴に基づき,明確な地形図を作成し,テスト効率を向上させる。
- TopoMapは,入力空間の埋め込みとクラスタリングにより,識別可能な領域を生成する。
- 最適な地形図を自動的に選択するため,DNNによるクラスタ識別可能性評価を導入した。
- 突然変異分析の結果,TopoMapはランダム選択よりも平均35%高いキル率を示した。
課題報告議論における解決策関連コンテンツを特定するための言語モデル応用評価 [cs.SE]目的:課題報告議論における解決策関連コンテンツの特定
- ソフトウェア開発において,過去の議論から解決策を再利用することは,効率的な保守に不可欠である。
- 長文の議論から解決策を見つけるには多大な時間と労力が必要であり,困難を伴う。
- 言語モデルを用いて解決策の特定を自動化し,ソフトウェア開発の効率化を目指す。
- 埋め込みベクトルを用いた機械学習モデルが,従来のTF-IDF特徴量よりも優れた性能を示した。
- ファインチューニングされたLLAMAftは,F1スコア0.716を達成し,最も高い性能を示した。
- 最適なモデルのアンサンブルは,さらに性能を向上させ,F1スコア0.737を達成した。
AI生成コードはまだ再現性がない:LLMベースのコーディングエージェントにおける依存関係のギャップに関する実証研究 [cs.SE, cs.AI, cs.MA]目的:LLMベースのコーディングエージェント生成コードの再現性
- ソフトウェア開発の効率化が求められており,AIによる自動コード生成技術への期待が高まっている。
- 生成されたコードが,環境依存性により再現性がない場合があるという問題が存在する。
- LLM生成コードの依存関係を詳細に分析し,再現性の問題を定量的に評価すること。
- 評価したLLM生成コードの68.3%が,クリーンな環境で即座に実行可能であった。
- 言語によって再現性に差が見られ,Pythonは89.2%である一方,Javaは44.0%であった。
- 宣言された依存関係と実際の実行に必要な依存関係の間に,平均で13.5倍のギャップが存在した。
プライバシーは常に公平性を損なうか? Chernoff情報ニューラル推定によるデータ依存的なトレードオフ [cs.LG, cs.AI, cs.IT, math.IT, stat.ML]目的:公平性,プライバシー,精度の間のトレードオフのデータ依存的な特性評価
- 信頼できる機械学習において,公平性とプライバシーは不可欠な要素である。両者の関係性は重要性が増している。
- 公平性とプライバシーは個別に研究されてきたが,その相互関係については十分な検討がなされていない。
- データ分布に基づいて,公平性とプライバシーの間の根本的なトレードオフを明確にすることを目的とする。
- Chernoff情報を用いて,公平性の新たな指標であるChernoff差分を提案し,ノイズを加えた変種を開発した。
- 簡単なガウス分布の例を通して,ノイズ付きChernoff差分がデータ分布に応じて異なる振る舞いを示すことを示した。
- 未知の分布に対するChernoff情報の最初のニューラルネットワークベース推定器であるCINEを開発し,実データへの適用を試みた。
SEジャーナル2036:必要となる未来を振り返る [cs.SE]目的:ソフトウェア工学ジャーナルの将来像
- ソフトウェア工学の進展は,社会の発展に不可欠である。
- 従来の査読プロセスは,増加する論文数と新しい手法に対応できず,限界に達している。
- 持続可能な査読システムを構築し,革新的な研究を支援することを目標とする。
- 2036年の視点から,ジャーナルアライアンスの形成,査読プロセスの改善,研究文化の変革が提案されている。
- 従来の「モノリシックな査読」の課題を克服するため,査読の細分化とベンチマークの改善が図られている。
- 「カテドラル型」と「バザール型」の文化を融合させ,オープンな研究環境の実現を目指している。
グラフにおける非衝突教授法:アルゴリズム,複雑性,および限界 [cs.CC, cs.DM, cs.DS, cs.LG, math.CO]目的:グラフにおける閉近傍に対する非衝突教授法の効率的な学習アルゴリズムの設計と解析
- 機械学習における能動学習の効率化は重要な課題であり,教授法の設計が鍵となる。
- 従来の教授法では,学習者の共謀を防ぐことが難しく,効率的な学習が阻害される場合がある。
- 共謀回避のベンチマークを満たす非衝突教授法のアルゴリズムを改善し,適用範囲を広げる。
- 閉近傍に対する非衝突教授法において,より一般的なパラメータクラスに対するFPTアルゴリズムを開発した。
- 既存研究と比較して,計算量の面で改善されたアルゴリズムを提案し,より強い下界を示すことができた。
- より広いクラスのグラフに対して,組み合わせ的な上限を導出した。
大規模言語モデルエージェントにおけるツール利用行動の最適化におけるエントロピーの役割の再考 [cs.AI, cs.SE]目的:大規模言語モデルエージェントのツール利用行動の最適化
- 大規模言語モデルの応用範囲拡大のため,ツール利用能力の向上が不可欠である。
- 長時間の推論において,不要なツール呼び出しが多く,性能低下の原因となる。
- エントロピー減少を利用し,効率的かつ高性能なツール利用行動を実現する。
- エントロピー減少と高品質なツール呼び出しの間に強い正の相関が確認された。
- 提案する報酬戦略により,ツール呼び出し回数を平均で72.07%削減した。
- また,性能を22.27%向上させることに成功した。
GitHubの世界への没入:コーディングエージェントの熟練度向上 [cs.RO, cs.SE]目的:大規模なソフトウェアエンジニアリング学習データの構築
- 現実世界のソフトウェア開発において,大規模かつ高品質な学習データが不可欠である。
- 環境構築,ユニットテスト生成,課題設定の複雑さから,学習データの規模拡大が困難であった。
- 自動化されたワークフローにより,高品質なソフトウェアエンジニアリングデータを大量に生成すること。
- ScaleSWEは,600万件のプルリクエストを処理し,10万件の検証済みソフトウェアエンジニアリングインスタンスを生成した。
- このデータセットは,既存のデータセットと比較して,リポジトリの多様性とタスクの複雑さにおいて優れている。
- ScaleSWE Agentは,SWE Bench Verifiedで約3倍の解決率を達成し,LLMベースのソフトウェアエンジニアリングの進歩に貢献する。
CodeT5-RNN:コード理解の向上のための文脈埋め込みの強化 [cs.SE]目的:コード理解のためのLLM埋め込みの改良
- ソフトウェア開発において,コードの理解は品質と生産性に不可欠である。
- LLM埋め込みは構造化されたコードの長距離依存関係を捉えきれない場合がある。
- RNNを用いてLLM埋め込みを強化し,コード理解の性能向上を目指す。
- 提案手法(RoBERTa-BiGRU,CodeBERT-GRU)は,欠陥検出ベンチマークにおいてそれぞれ66.40%,66.03%の精度を達成した。
- CodeT5-GRUとCodeT5+-BiGRUは,ベースモデルを上回り,RoBERTa-BiGRUやCodeBERT-GRUよりも高い精度を示した。
- 実世界のデータセットにおける実験でも,一貫した性能向上が確認された。
アルゴリズムのコンピュータによる設計:結合仕様から実装へ [cs.DB, cs.SE]目的:アルゴリズムの論理的仕様と物理的実装間の翻訳における欠陥の特定と解決
- データベース理論とシステムは近年,確実な理論的保証を備えたクエリ処理システムを構築することを目指している。
- 理論的な抽象化とシステム仮定の乖離が,論理仕様と物理実装の間のギャップを生じさせている。
- 論理から物理への翻訳における微妙な欠陥を特定し,アルゴリズムの最適性を実用的な性能向上として実現すること。
- CODAは,最小限の再現可能な例を合成することで,状態管理の誤りや結合木とブッシープラン間のマッピングの競合といった,微妙な翻訳上の欠陥を効果的に特定した。
- 初期の構造的テストは,TTJの物理的実装を強化しただけでなく,TTJ自体の形式的な前提条件を直接的に洗練させる境界条件を明らかにした。
- これらの翻訳上の課題への取り組みが,CODAのアーキテクチャを結合木に依存するアルゴリズムのための堅牢で構造を意識したテスト生成パイプラインへと進化させた。
要件工学のための産業規模検索拡張生成フレームワーク:自動車製造データによる実証評価 [cs.SE, cs.AI]目的:産業規模の要件工学における検索拡張生成(RAG)フレームワークの性能評価
- インダストリー4.0において,要件工学は,技術仕様,サプライヤーリスト,コンプライアンス基準など,多様で非構造化された文書の処理という重要な課題に直面している。
- 既存の研究では,本物の産業用REワークフローと包括的な生産グレードの性能指標を用いてRAGを評価したものは存在しない。
- 本研究は,自動車製造の実際の文書を用いて,RAGが要件工学の自動化にどの程度貢献できるかを実証的に評価することを目的とする。
- 提示されたフレームワークは,完全なトレーサビリティを備え,98.2%の抽出精度を達成し,BERTベースおよびLLMアプローチと比較してそれぞれ24.4%および19.6%高い性能を示した。
- ハイブリッドな意味的・語彙的検索は,MRR 0.847を達成し,専門家による品質評価の平均は5段階評価で4.32点であった。
- 評価の結果,手動分析時間が83%削減され,マルチプロバイダーLLMオーケストレーションにより47%のコスト削減が実現された。また,要件の件数は55%減少し,ITセキュリティへの焦点は1800%増加した。
LLMを活用した学際的ソフトウェア開発のワークフロー最適化:自動車産業における事例研究 [cs.SE, cs.AI]目的:学際的ソフトウェア開発におけるワークフロー最適化
- 自動車産業等では,多様な専門知識を統合したソフトウェア開発が不可欠である。
- 専門家と開発者の間には形式や成果物の不整合があり,非効率な連携が生じている。
- LLMを活用し,知識と実装を結ぶワークフローを自動化することで,効率化を目指す。
- 提案手法は,自動車APIシステムにおいて93.7%のF1スコアを達成した。
- API開発時間を約5時間から7分以下に短縮し,推定979時間の工数を削減した。
- 実運用では,専門家と開発者双方から高いコミュニケーション効率への満足が得られた。
動的解析が問題解決を強化する [cs.SE]目的:自然言語による問題記述から実行可能なコード修正を生成すること
- ソフトウェアの品質向上は,現代社会におけるシステム安定性の根幹をなすため重要である。
- 従来の静的解析では,複雑なバグの原因特定が困難であり,修正に膨大な時間を要することが課題である。
- 動的解析を組み込むことで,実行時の情報を活用し,効率的な問題解決を目指す。
- DAIRAは,動的解析を組み込んだ新しい自動修正フレームワークであり,テスト駆動型のアプローチを採用している。
- Gemini 3 Flash Previewを利用したDAIRAは,SWE-bench Verifiedデータセットにおいて,79.4%という最高水準の解決率を達成した。
- 既存のベースラインと比較して,複雑な欠陥を克服するだけでなく,推論コストと入力トークン消費量をそれぞれ約10%と25%削減した。
技術的負債から認知・意図的負債へ:AI時代におけるソフトウェア健全性の再考 [cs.SE]目的:ソフトウェア健全性に関するトリプル負債モデルの提案
- ソフトウェア開発は社会基盤であり,その健全性は信頼性と持続可能性に不可欠である。
- AIによる高速開発が進む中で,コード理解の遅れが新たなリスクを生んでいる。
- 認知・意図的負債の概念を導入し,AI時代における健全性の評価と改善を目指す。
- 生成AIの普及により,技術的負債に加え,認知負債と意図的負債が顕在化し始めている。
- 認知負債とは,チーム内での共有理解の喪失,意図的負債とは,コードを安全に扱うための外部化された根拠の欠如を指す。
- トリプル負債モデルを通じて,これらの負債の相互作用と,診断・軽減策について議論した。
生成AIが6GとBeyondに貢献:セマンティック通信のための拡散モデル [eess.SP, cs.IT, cs.LG, cs.MM, math.IT]目的:セマンティック通信における拡散モデルの応用
- 無線システムは理論的上限に近づいており,意味伝達が重要になっている。
- 拡散モデルと通信システム設計を結びつける体系的な指針が存在しない。
- 拡散モデルを次世代無線ネットワークの基盤技術として確立すること。
- 本研究は,拡散モデルを用いたセマンティック通信の包括的なチュートリアルを提供する。
- 条件付き拡散,効率的な拡散,汎用化された拡散という3つの技術的柱を体系的にレビューする。
- 拡散モデルが,セマンティック忠実性と堅牢性を維持しながら極端な圧縮を可能にすることを示す。
高次元不等式の局所化手法 [math.PR, cs.DS, math.FA]目的:高次元における不等式証明のための局所化手法の調査
- 高次元空間における確率的挙動の理解は,情報科学や統計物理学において重要である。
- 高次元における不等式の証明は,解析的な困難を伴うことが多く,新たな手法が求められている。
- 複雑な高次元不等式を,より扱いやすい低次元の問題に変換し,解決を目指す。
- LovászとSimonovits,およびEldanによる局所化手法の概要と応用範囲が整理された。
- この手法は,等周不等式,最適化問題,測度集中現象,マルコフ連鎖の混合率評価など,多様な分野に応用されている。
- 高次元の複雑な不等式を,構造化された低次元の問題に変換する点が特徴である。
- 1
- 2
