arXiv雑要約
プログラム - 2026/02/02 公開
仮想現実アプリケーションにおける一般的な3Dユーザーインタラクションの自動テスト [cs.SE]目的:仮想現実アプリケーションにおける3Dユーザーインタラクションの自動テスト手法
- VR技術は没入型体験を提供し,多様な分野で活用が拡大している。
- 従来のソフトウェアテストとは異なり,VR固有のテストは自動化が困難である。
- 現実的な3Dユーザー入力を自動生成し,インタラクションの網羅性を高める。
- XRintTestは,火,操作,ソケットのインタラクションにおいて93%の網羅率を達成した。
- ランダム探索と比較して,12倍の効率と6倍の性能向上を示した。
- Interaction Flow Graphは,VRアプリケーションの潜在的な設計上の問題を明らかにできる。
モノリスからマイクロサービスへ:分解フレームワークの比較評価 [cs.SE]目的:マイクロサービス分解フレームワークの比較評価
- ソフトウェアの陳腐化対策として,マイクロサービス化が重要視されている。
- 効果的なサービス境界の特定が難しく,分解フレームワークの客観的な比較が困難である。
- 複数の分解手法を統一的な基準で評価し,最適な手法を明らかにすること。
- 階層的クラスタリングに基づく手法,特にHDBScanが,ベンチマーク全体でバランスの取れた分解結果を示した。
- 高いモジュール性と,通信やインターフェースのオーバーヘッドを最小限に抑えることが確認された。
- 既存研究の結果と再現実験の結果を組み合わせ,評価の信頼性を高めた。
貢献すれば長居するのか? 従来のOSSとOSS4SGにおける新規参加者から中核貢献者への移行パターンと予測因子 [cs.SE]目的:新規参加者から中核貢献者への移行に関するパターンと予測因子の分析
- OSSの持続可能性は貢献者の継続的な参加に依存しており,新規参加者の移行が重要である。
- 多くの新規参加者が初期貢献後に活動を停止し,中核貢献者への移行パイプラインが機能していない。
- 社会貢献を重視するOSS4SGプロジェクトが,従来のOSSプロジェクトとは異なる移行パターンを示すかを検証する。
- OSS4SGプロジェクトでは,貢献者の継続率が2.2倍高く,中核貢献者になる確率も19.6%高いことが示された。
- 従来のOSSは単一の経路に集中する一方,OSS4SGは複数の経路を提供し,新規参加者の選択肢を広げている。
- プロジェクトを理解してから貢献を始める「Late Spike」パターンの方が,最初から集中的に貢献する「Early Spike」パターンより中核貢献者になるまでの時間が2.4~2.9倍速い。
名前は重要ではない:オープン語彙学習のための記号不変Transformer [cs.LG, cs.LO, cs.SC]目的:オープン語彙学習における記号不変性の実現
- 自然言語処理において,未知語や多様な表現への対応は重要な課題である。
- 既存のモデルは,意味的に等価な記号を区別できず,未知の記号への汎化が困難である。
- 記号の置き換えに対して不変なTransformer機構を開発し,汎化性能を向上させる。
- 提案手法は,交換可能なトークンの貢献を分離し,並列埋め込みストリームと集約型アテンション機構を用いる。
- 理論的な保証により,実験結果はオープン語彙タスクにおいて,新しい記号への汎化性能が向上することを示した。
- モデルは,記号の置換に強く,意味内容が変わらない場合に優れた性能を発揮する。
条件エントロピーの完全な特徴付け [cs.HC, cs.MA, cs.IT, math.IT]目的:条件エントロピーの公理的特徴付け
- 情報理論や統計学における不確実性の定量化は,科学全体で重要である。
- 条件エントロピーの適切な定義が,確立された公理を満たす形で存在していなかった。
- 操作的に意味のある条件エントロピーの定義を公理的に特徴付けることを目指す。
- 条件エントロピーの最も一般的な形は,条件付き分布のレニーエントロピーの指数平均で表される。
- この研究で得られた条件エントロピーは,条件付き混合チャネルにおける変換速度を決定する。
- エネルギー固有基底で対角な状態に対する,量子熱力学第二法則(側情報を含む)が導かれる。
通信・センシング盗聴に対する安全な統合センシング・通信 [cs.IT, math.IT]目的:通信とセンシングの盗聴に対する安全なISACシステムの性能トレードオフ
- 無線環境におけるセンシングのプライバシーと通信の機密性は重要であり,両者は相互に関連している。
- 統合センシング・通信(ISAC)システムでは,単一の物理層フレームワークで両者を捉えることが困難である。
- 送信機が秘密鍵を抽出,コードワードの内容と構造を隠蔽することで,性能向上を目指す。
- 送信機の秘密率,検出指数,敵対者の検出指数間のトレードオフを部分的に特徴付けた。
- フィードバックによる鍵抽出や,ワイヤータップコード,解決可能性コードの活用がトレードオフを形成する。
- 達成可能な領域を導出し,数値例を通じて設計トレードオフを説明した。
集合差に基づく圧縮された集合表現 [cs.DS]目的:集合の集合の圧縮表現
- データ構造の効率化は,大規模データ処理の性能向上に不可欠である。
- 集合の集合を効率的に表現・操作する手法が十分でない。
- 集合間の差に着目し,より圧縮された表現を構築すること。
- 提案手法は,集合内の集合へのアクセス,メンバーシップ,前駆体,後続体クエリを対数時間でサポートする。
- 新たなMSTに基づく構築アルゴリズムは,既存の手法よりも優れた性能を示す。
GrepRAG:コード補完のためのgrep類似検索に関する実証研究と最適化 [cs.SE]目的:リポジトリレベルのコード補完におけるgrep類似検索の有効性と最適化
- 大規模言語モデルの活用が進む中で,リポジトリ全体のコードを考慮した補完は重要である。
- 既存手法は計算コストが高く,開発者の日常的な検索行動とは乖離がある。
- 軽量なgrep類似検索でどこまでコード補完の性能を向上させられるかを検証する。
- Naive GrepRAGは,複雑な手法と同等の性能を示すことが実証された。
- GrepRAGは,識別子による重み付けと構造を考慮した重複排除により,性能をさらに向上させた。
- CrossCodeEvalおよびRepoEval-Updatedにおいて,最先端手法を上回り,EMで7.04-15.58%の改善を達成した。
結果条件付き推論蒸留によるソフトウェア問題解決 [cs.SE]目的:ソフトウェア問題解決のための推論蒸留フレームワーク
- 大規模ソフトウェアリポジトリでの問題解決は,ソフトウェア開発の効率と品質に不可欠である。
- 既存のLLMベースの修理パイプラインは,過去の修正経験を活かせていないため,非効率である。
- 検証済みの修正履歴から得られる知識を用いて,効率的な問題解決を目指す。
- 提案手法O-CRDは,過去の解決済み問題を教師データとして利用し,推論プロセスを蒸留する。
- これにより,ファイルや関数の特定,パッチ合成において,コストのかかる探索を回避できる。
- SWE-Bench Liteにおける評価で,GPT-4o, DeepSeek-V3, GPT-5においてPass@1のスコアが向上した。
非アルキメデス関数解析の形式化1:球面完備空間 [math.NT, cs.LO, math.FA]目的:非アルキメデス関数解析における球面完備空間の形式化
- 非アルキメデス関数解析は,物理学や数論に応用が広がる重要な分野である。
- 球面完備空間の厳密な定義と性質の理解が,理論の発展を阻害している。
- 球面完備空間の形式化を通じて,非アルキメデス関数解析の基礎を確立すること。
- 球面完備空間の同値な定義,基本的な性質,およびp進複素数体などの具体例を提供した。
- 非アルキメデスバナッハ空間におけるBirkhoff-James直交性,Hahn-Banach拡張定理,球面完備化を形式化した。
- 本研究のコードは公開されており,検証と拡張に利用可能である。
四元数完全系列とアダマール行列 [math.CO, cs.DM, cs.IT, math.IT, quant-ph]目的:四元数完全系列とアダマール行列の構造に関する研究
- 通信技術の発展において,符号の設計は重要な役割を担う。
- アダマール行列の効率的な構成法は未だ十分とは言えない。
- 四元数完全系列を利用して,アダマール行列の構成を効率化する。
- 本研究では,既存のアルゴリズムを大幅に高速化し,対称性の制約を受けない列挙アルゴリズムを開発した。
- このアルゴリズムにより,最大次数21までのウィリアムソン型行列を網羅的に列挙することに成功した。
- ウィリアムソン型アダマール行列のブロックが巡回的である場合,ブロックは必ず相愛的である事を証明した。
終限フラッセ限界の計算可能性について [math.LO, cs.LO]目的:終限フラッセ限界の構成に必要な計算資源
- モデル理論における構造の分類と性質解明に不可欠な概念である。
- 計算可能なエージから終限フラッセ限界を構成する際の計算複雑性が不明であった。
- 終限フラッセ限界の構成に必要な計算量の限界を明らかにすること。
- 終限フラッセ限界の構成はオラクル0'''を用いて可能であることが示された。
- 特定の終限フラッセ限界の構成にはオラクル0''が必要となることが示された。
- フラッセ限界(APを持つ場合)はオラクル0'で構成可能であり,終限フラッセ限界の方が計算量的に厳しいことが示された。
量子チャネル容量の決定不能性について [quant-ph, cs.CC, cs.IT, math.IT]目的:量子チャネル容量の計算困難性
- 古典チャネルと量子チャネルの容量理解における重要な区別は,容量の計算可能性にある。
- 量子チャネル容量が計算不可能であるという強い証拠があるが,形式的な証明は困難である。
- 量子チャネル容量の計算困難性の研究を開始し,その問題を解決することを目指す。
- 一般的な量子チャネルの量子容量を計算することはQMA困難であることが示された。
- 最大エンタングルメント助けられたゼロエラー一次古典容量が計算不可能であることが証明された。
qLDPCコードにおけるネイティブCCZマジックステートファウンテンの構造的条件 [quant-ph, cs.IT, math.IT]目的:ネイティブCCZマジックステートファウンテンをサポートするqLDPCコードの構造的条件の特定
- 量子誤り訂正は,量子計算の信頼性を確保する上で不可欠である。安定した誤り訂正符号の開発が求められている。
- 既存のqLDPCコードでは,定数速度,線形距離,有界スタビライザー重み,そしてネイティブマジックステートファウンテンを同時に備えたものは存在しない。
- 本研究は,CSS qLDPCファミリーが定数深さのCCZマジックステートファウンテンをサポートするための符号理論的条件を明らかにする。
- マジックフレンドリーな三重項の存在と,その支持の量子ビットごとの参加度合いが制限されている場合に,定数深さのCCZゲート回路が実現可能となることを示した。
- 漸近的に良好なqLDPCファミリー(量子タナーコードなど)では,マジックステートファウンテンの存在は,論理X空間におけるマジックフレンドリーな三重項の数え上げ問題に帰着される。
- 本研究は,qLDPCコードの設計における新たな視点を提供し,より効率的な量子計算の実現に貢献する。
プロファンクトリアル代数 [math.CT, cs.LO]目的:プロファンクトリアル代数のbicategoricalな一般化
- 圏論は数学の抽象的基礎であり,様々な分野に応用が広がっている。
- 従来の圏論では関係性や構造の表現に限界があり,より豊かな表現が必要とされている。
- この研究は,より一般的なbicategoricalな枠組みを用いて関係性を表現し,圏論の適用範囲を広げる。
- Barrの古典的な研究をbicategoricalに一般化し,擬モノイドの拡張基準を提示した。
- Set-monadがプロファンクターに拡張されるための条件を明確にし,ultracompletion擬モノイドの構造を解析した。
- プロファンクトリアル拡張のlax代数を特徴づけ,ultracategoriesとultrafilterモノイドの関係を明らかにした。
エルデシュ・レーニィ汚染のあるランダム幾何グラフにおけるノード回帰のためのグラフ注意ネットワーク [stat.ML, cs.IT, cs.LG, cs.SI, math.IT, math.ST, stat.TH]目的:ノード回帰におけるグラフ注意ネットワークの優位性
- グラフ構造データは現実世界の様々な現象をモデル化する上で不可欠である。
- ノイズの多いデータに対するグラフニューラルネットワークの頑健性は十分に検証されていない。
- ノイズ下での回帰性能向上のための注意機構の活用。
- 提案するグラフ注意ネットワークは,ノイズのあるノード特徴量を用いた最小二乗法と比較して,回帰係数の推定誤差を漸近的に低減する。
- ラベルのないノードの応答予測において,バニラグラフ畳み込みネットワークよりも高い精度を達成する。
- シミュレーションデータと実データを用いた実験により,理論的結果が検証された。
対称性によって強制される二次的劣化性:低次元を超えて [cs.HC, cs.IT, math.IT, quant-ph]目的:ノイズの多い量子チャネルの量子容量とプライベート容量の上界
- 量子情報理論において,量子チャネルの性能評価は不可欠であり,情報伝送の限界を理解する上で重要である。
- 厳密な劣化性が成立しない状況下で,近似劣化性の評価が困難であり,正確な容量の上界を求めることが課題である。
- 対称性に着目し,近似劣化性の向上メカニズムを解明することで,より効率的な量子通信システム設計に貢献する。
- 高次元の回転対称ノイズモデルにおいて,ノイズ成分と恒等チャネル間の識別可能性が最大となることが示された。
- 対称な劣化写像を構成し,近似劣化パラメータがノイズパラメータに対して二次的にスケールすることが証明された。
- ノイズ演算子の代数的条件を特定し,近似劣化性の向上が対称性によって生じることを明らかにした。
二元正則符号の反復復号における復号誤り率推定 [cs.CR, cs.IT, math.IT]目的:二元パリティチェック符号に対する反復復号の復号誤り率の閉形式推定
- ポスト量子暗号系で反復復号が利用されるようになり,低い復号誤り率の推定が重要になっている。
- モンテカルロシミュレーションでは,$2^{-128}$以下の低い復号誤り率を推定することが困難である。
- 暗号目的で使用可能な2回の反復ビット反転復号器の正確な復号誤り率推定手法を開発すること。
- 提案手法により,暗号用途に適した2回の反復ビット反転復号器の復号誤り率を高精度に推定することが可能となった。
- 推定された復号誤り率は,従来の推定手法と比較して,$2^{70}$倍以上向上し,128ビットセキュリティを確保できる。
- 本手法の適用により,公開鍵と暗号文のサイズをセキュリティを損なわずに20%削減できる。BIKE暗号系への応用も示された。
シミュレーション仮説に対する計算機科学理論の示唆 [cs.DM, cs.LO, physics.hist-ph]目的:シミュレーション仮説の形式的検証
- 物理学と哲学において,シミュレーション仮説への関心が高まっている。
- シミュレーション仮説は計算機科学の理論的考察を必要とする。
- 物理的チャーチ・チューリング仮説に基づき,自己シミュレーションの可能性を検証する。
- チャーチ・チューリング仮説とクリーネの第二再帰定理により,我々がコンピュータ上でシミュレーションされている可能性が示された。
- 自己シミュレーションの場合,同一の存在が二重に存在し,どちらも等しく「現実」であると考えられる。
- ライス定理を用いてシミュレーションおよび自己シミュレーションに関する不可能性の結果が得られた。
予測あり/なしのオンライン問題に対する複雑性クラス [cs.DS]目的:予測を用いたオンライン問題の複雑性理論の開発
- 機械学習の発展に伴い,予測を利用するアルゴリズムへの関心が高まっている
- オンライン問題における時間・空間資源の計算困難性に関する研究は十分ではない
- 不確実な質の予測に対するオンライン問題の複雑性クラスを定義・分析すること
- 文字列推測を基盤とし,誤差尺度による複雑性クラスの階層を定義した
- パージング問題に対する既知の下限が,階層内のすべての困難な問題に適用されることを示した
- 予測を用いない古典的なオンライン問題に対する対応する複雑性クラスも導き出した
資源の公正な交換に関するポリシー [cs.LO]目的:デジタルプラットフォームにおける資源交換の公正性確保
- デジタル資源交換は増加の一途を辿っており,その信頼性が重要視されている。
- 資源交換のポリシー定義と実施において,悪意のあるユーザーによる不正利用のリスクが存在する。
- 悪意のあるユーザーによる不正利用を防ぎ,公正な資源交換を実現すること。
- 資源交換環境の形式モデルを提案し,ユーザーポリシーの定義と実施方法を明確化した。
- 宣言型ポリシー言語MuACと,その形式意味論を導入し,非線形,線形,契約的側面を組み合わせたMuACL論理を開発した。
- MuACポリシーからMuACLへの意味論を保存するコンパイルを定義し,交換の公正性をMuACLにおける証明可能性に還元した。
大規模言語モデルによるアセンブリコードの超最適化: SuperCoder [cs.CL, cs.AI, cs.PF, cs.PL, cs.SE]目的:アセンブリコードの超最適化
- 現代の計算機システムにおいて,プログラムの実行速度は重要な性能指標である。
- 既存のコンパイラによる最適化には限界があり,さらなる高速化が求められている。
- 大規模言語モデルを活用し,コンパイラでは達成できないレベルの最適化を目指す。
- 本研究では,大規模言語モデルがアセンブリコードの超最適化に利用可能であることを実証した。
- 特に,強化学習によりファインチューニングされたSuperCoderは,gcc -O3を1.46倍上回る平均速度向上を達成した。
- この結果は,プログラム性能最適化の新たな可能性を示唆するものである。
M-コードのランク重み階層について [cs.IT, math.IT]目的:線形コードのランク重み階層の研究
- 通信や情報セキュリティにおける誤り訂正の基礎であり,効率的な符号化技術が求められる。
- 線形符号のランク重み階層は,その構造が複雑であり,完全な理解が難しい。
- 線形エンドモーフィズム安定な符号におけるランク重みに関する条件を明らかにすること。
- 巡回エンドモーフィズムを持つ線形符号の第一ランク重みが1であるための必要十分条件を生成多項式を用いて示した。
- その符号の最終ランク重みの明示的な公式を導出した。
MetaLint:命令追従と易硬度汎化による汎用的な慣用コード品質分析 [cs.SE, cs.CL, cs.LG]目的:慣用コード品質分析の一般化
- コード品質はソフトウェア開発において不可欠であり,保守性や信頼性に大きく影響する。
- 静的学習データだけでは,進化するベストプラクティスを捉えきれず,コード品質分析は困難である。
- 動的に指定されたベストプラクティスを用いて,未知の品質問題への対応を目指す。
- MetaLintは,命令追従と優先順位最適化により,見慣れないベストプラクティスへの汎化性能を向上させた。
- Qwen3-4Bは,検出Fスコアを2.7倍(25.9%から70.4%)に向上させ,高い再現率と局所化Fスコアを実現した。
- これらの改善は,プログラミング言語,モデル,規模,推論設定,リンターソースを横断して一般化されることが確認された。
スパイラルとそれ以降:多速度エージェントによる競争的平面探索 [cs.DS, cs.DM]目的:平面上における,異なる速度を持つ複数の移動エージェントによる隠れた目標地点の探索時間の最小化
- ロボットやセンサーネットワーク等の効率的な探索戦略の確立は,実用上重要な課題である。
- 目標地点の位置が不明な状況下での探索時間の最適化は困難を伴う。
- 多速度エージェントを用いた探索戦略における最適な探索コストの上限を導出する。
- エージェント数nを増やした場合の,単位速度エージェントによる探索コストの上限を導出した。
- 速度の異なるエージェントに対し,速度依存的な角度オフセットを持つスパイラル軌道を割り当てることで,探索コストを一定に保つ枠組みを提案した。
- 幾何平均速度が一定の基準を超える場合,速度の遅いエージェントを除外することが有効であり,スパイラル以外の探索アルゴリズムの必要性を示唆した。
有限幅木のLDPC符号における符号距離とトラップ集合最小サイズの線形時間計算 [cs.IT, math.IT]目的:有限幅木を持つLDPC符号に対する符号距離とトラップ集合最小サイズの計算
- 誤り訂正符号は,通信や情報保存において重要な役割を担う技術である。
- トラップ集合の最小サイズ問題はNP困難であり,効率的な解法が求められている。
- 有限幅木を持つ符号に対して,線形時間で問題を解くアルゴリズムを提案する。
- 有限幅木の制約下では,符号距離と最小トラップ集合サイズを線形時間で計算可能である。
- 既知の木分解を用いることで,特定の\(b\)に対する最小\(a\)と対応するトラップ集合数を線形時間で求められる。
- シミュレーション実験により,提案アルゴリズムの正当性が確認された。
拡散モデルにおける情報の分離可能性について [cs.CL, cs.LG, cond-mat.stat-mech, cs.AI, cs.IT, math.IT]目的:拡散モデルに内在する情報の性質
- 画像生成AIの発展は目覚ましく,その基盤技術である拡散モデルの理解が重要である。
- 拡散モデルがどのように情報を捉え,生成に利用しているかの詳細なメカニズムは未解明である。
- 拡散モデルが学習する情報の内訳と,それが生成品質に及ぼす影響を明らかにすること。
- 拡散モデルは,画像全体の小規模な知覚的詳細の再構成に多くの情報を費やしていることが判明した。
- 画像とクラスラベルの相関は,画像のセマンティックコンテンツに強く依存し,低レベルな詳細には依存しない。
- この特性は,分類器フリーガイダンスの効果を説明するものであり,ガイダンスベクトルは生成初期にセマンティック構造に影響を与え,知覚的詳細が埋められるにつれてその影響が薄れる。
思考を減らし,より良いラベルを付与する:大規模言語モデルのテレコミュニケーションにおけるファインチューニングのための多段階ドメインに基づいた合成データ生成 [cs.CL, cs.AI, cs.IT, cs.NI, math.IT]目的:テレコミュニケーション分野における大規模言語モデルのファインチューニング用合成データ生成手法
- 大規模言語モデルの性能向上には,高品質な学習データが不可欠である。専門知識が必要な分野では特に,その重要性は高い。
- 専門分野の高品質な学習データは,人的アノテーションに多大な時間とコストがかかるという課題がある。
- 本研究は,人的アノテーションへの依存を低減しつつ,高品質な学習データを効率的に生成することを目指す。
- 提案手法は,ドメイン知識に基づいた情報検索と,生成モデル,そして改良モデルを組み合わせた多段階パイプラインである。
- RAGASベースのスコアリングによりデータ品質を確保し,RANトラブルシューティングに特化した高品質なデータセットを生成した。
- 人間の介入なしで,複雑かつ文脈に富んだトラブルシューティング解決策を生成可能であることを示した。
深層学習における一般化情報ボトルネック理論 [cs.LG, cs.IT, math.IT]目的:深層学習の学習原理の理論的枠組み
- 深層学習の汎化性能向上は,その学習過程の理解に基づき重要である。
- 既存の情報ボトルネック理論は,理論的曖昧さや正確な推定の困難さを抱えていた。
- 相乗性の概念を取り入れ,情報ボトルネック理論の限界を克服し汎化性能を向上させる。
- 本研究で提案する一般化情報ボトルネック(GIB)は,既存の情報ボトルネック理論を上回る汎化性能を示すことが確認された。
- GIBは,ReLU活性化関数を持つアーキテクチャを含む幅広いモデルで圧縮段階を示し,情報圧縮と汎化性能の関係をより明確にした。
- 実験結果は,GIBが敵対的ロバスト性に関する理解とも整合性があり,解釈可能な学習ダイナミクスを示すことがわかった。
最大最小制約下における公平な影響力最大化のための効率的な近似アルゴリズム [cs.DS]目的:最大最小制約下での公平な影響力最大化
- 社会的公平性の重要性が高まる中,影響力の偏りを是正する研究が求められている。
- 最大最小制約は直感的だが,部分モジュール性が成り立たず,効率的なアルゴリズム設計が困難である。
- グループ間の影響力の不均衡を解消し,公平性を確保するための近似アルゴリズムを開発する。
- 提案手法は,グループ内最大化とグループ間最大化の二段階最適化フレームワークを用いる。
- グループ内最大化において,影響力伝播が部分モジュール性を維持することを示す。
- グループ間最大化において,Uniform SelectionとGreedy Selectionの2つの戦略を提案し,近似保証を提供する。
Herb.jl:統一的なプログラム合成ライブラリ [cs.PL, cs.AI, cs.SE]目的:プログラム合成のための統一的なライブラリ
- AI研究の根幹であり,プログラミングの自動化に貢献する重要な分野である。
- 既存の合成ツールは多様だが,再利用や適応に手間と時間がかかるという課題がある。
- プログラム合成の基盤となるアルゴリズムを再利用可能な部品として提供し,効率化を目指す。
- Herb.jlはJuliaで実装された統一的なライブラリであり,既存のプログラム合成ツールの再利用性を高める。
- 共通する要素を分割し,拡張可能な再利用可能なサブコンポーネントとして提供する。
- 簡単な問題と文法を用いて,Herb.jlの利点を実証し,数行のコードで解決可能であることを示す。
プランナーとコーダーの間のギャップの理解と解消:コード生成のためのマルチエージェントシステムの堅牢性に関する体系的研究 [cs.SE, cs.AI]目的:マルチエージェントシステムにおける堅牢性の根本的な欠陥の解明と改善
- コード生成の自動化は,ソフトウェア開発の効率化に不可欠であり,その重要性は増している。
- マルチエージェントシステムは性能が向上しているものの,その堅牢性のメカニズムは未解明な点が残る。
- プランナーとコーダーの間の情報損失を特定し,それを軽減することで,システムの信頼性を高める。
- マルチエージェントシステムは,意味的に同等な入力に対して性能が大幅に低下することが明らかになった。
- 性能低下の根本原因は「プランナーとコーダーのギャップ」にあり,これが全体の75.3%の失敗を説明している。
- 提案手法である修復方法は,特定された失敗の40.0%から88.9%を解決することで,マルチエージェントシステムの堅牢性を効果的に向上させた。
TOM-SWE:ソフトウェア工学エージェントにおけるユーザーのメンタルモデル [cs.SE, cs.AI]目的:ソフトウェアエージェントにおけるユーザーの意図推論と追跡
- コーディングエージェントの発展は,ソフトウェア開発の自動化に貢献する重要な分野である。
- 既存のエージェントは,曖昧な指示や文脈依存の意図を理解することが課題となっていた。
- ユーザーのメンタルモデルを組み込むことで,より的確な意図理解と支援を目指す。
- ToM-SWEは,SWEエージェントとToMエージェントの二重エージェント構造を採用している。
- SWE-benchおよびstateful SWE-benchの評価で,タスク成功率とユーザー満足度を向上させた。
- stateful SWE-benchでは,OpenHandsと比較して大幅に高いタスク成功率(59.7% vs 18.1%)を達成した。
間欠的なリンクとエネルギー制約下における最適なサンプリングとルーティング [cs.IT, math.IT]目的:非線形な情報鮮度(AoI)の最小化
- 衛星・地上統合ネットワーク等,現実のシステムではリンク特性が重要であり,効率的な情報伝達が求められている。
- リンクの可用性や遅延のばらつき,エネルギーコストの異質性が,タイムリーかつ省エネな情報更新を困難にしている。
- リンクの可用性制約とルーティング決定のトレードオフを考慮し,最適なサンプリングとルーティング戦略を確立する。
- 提案手法は,複数の経路,確率的なリンク可用性,経路依存的なエネルギー消費を考慮した数理モデルを構築し,効率的な解法を開発した。
- 最適サンプリングポリシーは,経路数Nに対する区分線形待ち行列ポリシーとなり,最大N個のブレークポイントで表現されることが示された。
- 期待ペナルティ順序条件の下では,最適ルーティングポリシーは,閾値に基づくハンドオーバーポリシーとなり,最大N(N-1)/2個の閾値で特徴づけられる。
Move言語向けファジングフレームワークBelobog [cs.CR, cs.PL, cs.SE]目的:実世界のスマートコントラクトにおける脆弱性検出
- ブロックチェーンにおけるデジタル資産管理の安全性確保は重要であり,Move言語はそのための基盤技術である。
- Move言語の型システムは強力だが,型システムでは防ぎきれない脆弱性が存在する可能性がある。
- Moveスマートコントラクトの有効性を検証し,潜在的な脆弱性を発見することを目的とする。
- Belobogは型情報を考慮し,有効なトランザクションを生成・変更することで,従来のファザーの課題を克服した。
- 109の実際のMoveスマートコントラクトプロジェクトで評価した結果,深刻な脆弱性を100%検出した。
- CetusとNemoという過去のインシデントにおいて,先知識なしに完全なエクスプロイトを再現することに成功した。
挿入・削除チャネルに対する関数訂正符号 [cs.IT, math.IT]目的:挿入・削除チャネルにおける冗長性の最適化
- DNAデータストレージや文書交換など,実用的な情報伝達において欠損や挿入といった誤りは重要な課題である。
- 従来の符号化方式では,挿入・削除チャネルにおける冗長性を最小化することが困難であった。
- 関数訂正符号の枠組みを用いて,冗長性を最適化し,特定の関数を保存することを試みる。
- 関数訂正挿入符号,削除符号,挿入・削除符号の3つの定式化が等価であることが示された。
- 挿入・削除距離行列や不規則な挿入・削除距離符号を定義し,最適な冗長性の上限と下限を導出した。
- 局所的に有界な関数,VT症候群関数,ラン数関数など,様々なクラスの関数に対する最適な冗長性の限界が求められた。
正規化ラドン累積分布変換の一般化:限られたデータ認識への応用 [math.NA, cs.CV, cs.IT, cs.NA, math.IT]目的:限られたデータにおける画像認識のための特徴表現
- 画像認識は,コンピュータービジョンの根幹であり,多様な応用分野で不可欠である。
- 限られたデータ環境下では,従来の認識手法は性能が低下しやすいという課題がある。
- アフィン変換に不変な特徴表現を構築し,限られたデータ環境での認識精度向上を目指す。
- ラドン累積分布変換(R-CDT)の正規化を一般化することで,柔軟性を高めた。
- 多次元および非ユークリッド空間における一般化されたラドン変換の利用を検討した。
- 提案手法は,特定の変換に対して不変であり,特徴空間での線形分離を可能にすることを示した。
CloudFix:大規模言語モデルを用いたクラウドアクセス制御ポリシーの自動修正 [cs.DC, cs.CR, cs.SE]目的:クラウドアクセス制御ポリシーの自動修正
- クラウド環境におけるセキュリティ確保は重要であり,アクセス制御ポリシーはその中核を担う。
- 手動によるポリシー作成・更新は,誤りや時間的コストを伴い,セキュリティ脆弱性の原因となる。
- 形式手法と大規模言語モデルを組み合わせることで,クラウドアクセス制御ポリシーの効率的な自動修正を目指す。
- CloudFixは,形式的手法による故障箇所特定と,大規模言語モデルによる修正候補生成を組み合わせることで,アクセス制御ポリシーの自動修正を実現した。
- 282個のAWSアクセス制御ポリシーを用いた実験により,CloudFixはベースライン実装と比較して,修正精度が向上することが示された。
- 本研究は,アクセス制御における大規模言語モデルの有効性を示し,クラウドアクセス制御ポリシーの効率的な自動修正に貢献する。
依存関係決定のベンチマーク構築に向けて [cs.CY, cs.SE, cs.CR]目的:依存関係決定の評価基準
- ソフトウェア開発において,外部ライブラリの依存関係は不可欠であり,その管理は品質とセキュリティに直結する。
- 既存の評価方法は,機能の正当性に偏重し,依存関係の安全性や保守性といった重要な側面が軽視されている。
- 安全で効率的な依存関係決定を行うAIエージェントの評価基準を確立し,開発プロセスを改善すること。
- 本研究では,AIエージェントと人間の依存関係変更を分析し,エージェントがセキュリティ上の脆弱性を含むバージョンを選択する頻度が高いことが示された。
- エージェントによる依存関係変更は,全体としてセキュリティに悪影響を及ぼす傾向があり,人間と比較してセキュリティインパクトが大幅に低いことが明らかになった。
- これらの知見に基づき,安全なバージョン選択,依存関係の再利用,依存関係の肥大化抑制を評価するDepDec-Benchベンチマークを提案する。
遮蔽を考慮したピンチングアンテナ支援ワイヤレス通信の堅牢性と安全性 [cs.CL, cs.CL, cs.IT, eess.SP, math.IT]目的:遮蔽環境下における,安全で堅牢なワイヤレス通信システムの設計
- 無線通信の普及に伴い,通信の安全性と信頼性の確保が重要課題となっている。
- 実際の環境では,建物などによる遮蔽の影響を無視できない。
- 遮蔽環境下でも安全かつ高効率な通信を実現する技術開発が求められている。
- 提案手法は,従来の固定アンテナシステムと比較して,合計レートで4.7dBの性能向上を示す。
- ピンチングアンテナの位置適応により,合法ユーザーへの直視回線を維持しつつ,盗聴者回線を効果的に妨害する。
- ピンチングアンテナシステムにおける遮蔽効果を無視すると,性能低下とセキュリティの低下を招く。
任意のモノイド上の書き換えシステム [cs.FL, cs.LO, math.CT]目的:モノイド的書き換えシステム
- 書き換えシステムは計算の基礎であり,様々な分野で応用されている。
- 自由モノイドに限定された従来の書き換えシステムでは,表現力に限界があった。
- 任意のモノイド上で定義された新しい書き換えシステムを分類し,表現力を拡張すること。
- モノイド的書き換えシステムを2-圏 $\mathbf{NCRS_2}$ として定義し,$\mathbf{Mon}$ との双随伴関係を証明した。
- 与えられた固定モノイドを表現するノイテリ環状モノイド的書き換えシステムを分類した。
- モノイドの生成系をGETT-同値性によって完全に特徴づけるGeneralized Elementary Tietze Transformations (GETTs)を導入した。
Luaの環境側面 [cs.CL, cs.SE, cs.PL]目的:Luaの実行時パフォーマンスと省エネルギー性の実証的分析
- 持続可能な開発目標達成のため,ソフトウェアの省エネルギー化は重要である。
- インタプリタ言語は一般にコンパイラ言語より消費電力が大きい。
- Luaの省エネルギー性を改善するためのJITコンパイルの効果を検証する。
- LuaJITコンパイラは,標準Luaインタプリタを大幅に上回る性能を示す。
- 最も効率的なLuaJITは,最適なLuaインタプリタと比較して,エネルギー消費量を約7分の1,実行速度を約7倍に改善する。
- LuaJITはCの効率に近づき,エネルギー消費量は約6倍,実行速度は約8倍遅い。
AACR-Bench:包括的なリポジトリレベルの文脈を用いた自動コードレビューの評価 [cs.SE, cs.AI]目的:自動コードレビューの評価基準
- 大規模言語モデルのコードレビューへの応用が期待される中で,その性能評価の重要性が高まっている。
- 既存の評価基準は,多言語対応や正確な欠陥情報の不足により,汎用性や信頼性に課題がある。
- 本研究では,より網羅的で信頼性の高い評価基準を構築し,自動コードレビューの性能評価を向上させる。
- AACR-Benchは,複数のプログラミング言語に対応し,ファイル全体の文脈を考慮した包括的な評価基準である。
- 従来の基準と比較して,潜在的な欠陥の検出率を285%向上させている。
- 大規模言語モデルの評価において,文脈の粒度や検索方法が性能に大きく影響することが示された。
IDE-Bench:現実世界のソフトウェアエンジニアリングタスクにおけるIDEエージェントとしての大規模言語モデルの評価 [cs.SE, cs.LG]目的:大規模言語モデルのIDEエージェントとしての性能評価
- ソフトウェア開発の効率化は,現代の技術革新において不可欠である。
- AIエージェントによるソフトウェア開発支援は,まだ十分な評価と改善の余地がある。
- 実際の開発環境下でAIエージェントの能力を客観的に評価し,改善点を明確化すること。
- IDE-Benchは,実際のIDE環境でAIエージェントを評価するための包括的なフレームワークである。
- 80の未発表リポジトリからなるタスクを用いて,C/C++,Java,MERNスタックのマルチ言語,フルスタック環境におけるAIエージェントの性能を評価した。
- エージェントが報告する意図と,プロジェクトレベルでの修正成功との相関関係を体系的に評価した。
SMTソルバーを用いた最適ソフトウェアパイプライン [cs.PL]目的:最適ソフトウェアパイプラインの実現
- VLIWプロセッサの性能向上に不可欠なループ最適化技術である。
- 既存手法はヒューリスティックに頼るため,最適解が得られない場合がある。
- SMTソルバーを用いて,ソフトウェアパイプラインの最適解を導き出す。
- 提案手法は,ヒューリスティックアルゴリズムや手動最適化を大幅に上回る性能を示す。
- SMTソルバーは,特定の開始間隔のスケジュールが実現不可能な理由をプログラム担当者やプロセッサ設計者に提供可能。
線形計画法に対する内点法による量子計算の高速化 [quant-ph, cs.DS, math.OC]目的:線形計画法の量子アルゴリズム
- 線形計画法は,最適化問題の基本的な手法であり,様々な分野で応用されている。
- 大規模な線形計画問題の解法は計算コストが高く,実用上の課題となっている。
- 本研究では,内点法を用いた量子アルゴリズムにより,線形計画法の計算を高速化することを目指す。
- 本研究では,$n$個の制約条件,$d$個の変数を持つ線形計画問題に対して,$\sqrt{n} \cdot \mathrm{poly}(d,\log(n),\log(1/\varepsilon))$の計算時間で,$\varepsilon$-最適解を求める量子アルゴリズムを提案した。
- 提案アルゴリズムは,既存の内点法のNewtonステップを高速化し,特に$n \gg d$の「背の高い」線形計画問題において,計算量の削減効果が期待される。
- ヘッセ行列とバリア関数の勾配の効率的な近似が鍵となり,スペクトル近似と多変量平均推定のための量子アルゴリズムを組み合わせることでこれを実現した。
有界VC次元を持つ超グラフの最小横断集合の列挙 [math.CO, cs.CC, cs.DM, cs.DS]目的:有界VC次元を持つ超グラフの最小横断集合の列挙
- 組合せ最適化の分野において,超グラフの構造解析は重要な課題である。
- 超グラフの最小横断集合の列挙は計算困難であり,効率的なアルゴリズムが求められている。
- 有界VC次元を持つ超グラフに限定することで,この問題を多項式時間で解決することを目指す。
- 有界VC次元を持つ超グラフの場合,最小横断集合の列挙は多項式時間で実行可能であることが示された。
- この結果は,既存の多項式時間で解けるケースを一般化し,部分超グラフで閉じている超グラフクラスにも適用できる。
- 一般的な超グラフに対しても準多項式時間で実行され,超グラフの適合性が有界の場合は多項式時間で実行される。
シンプレクティック変換による耐障害量子シミュレーション [quant-ph, cs.IT, math.IT]目的:耐障害量子シミュレーションの新たな手法
- 量子アルゴリズムの複雑な計算を現実的な時間で実現するため,量子シミュレーションは重要である。
- 従来の耐障害量子計算はゲートごとに処理するため,オーバーヘッドが大きく,効率が悪い。
- 量子アルゴリズムの構造を活かした,ブロック単位での効率的なシミュレーションを実現する。
- シンプレクティック変換とトロッター分解の間に深い構造的対応があることが示された。
- この対応により,論理回路と物理回路がトロッター構造を共有し,安定化子中心化と回路対称性を維持できる。
- 提案手法は良好な量子LDPCコードを含む様々な安定化子コードに適用可能であることがシミュレーションで示された。
一般化楕円,2.5次元加法符号,およびマルチスプレッド [math.CO, cs.IT, math.IT]目的:有限体上の加法符号の構成と上限
- 符号理論は,情報伝送やデータ圧縮の基盤技術であり,現代社会において不可欠である。
- 加法符号の効率的な構成法や,その性能限界の把握が課題となっている。
- 幾何学的対象との関連性を利用し,加法符号の性能向上を目指す。
- 奇数 q に対する PG(2,q) において,3つの hyperplane に含まれない (h-1)-空間の最大数は q^h+1 であることが知られている。
- 本研究では,次元を少し下げることで,q^h+2 の基数を持つ generalized oval の存在を示した。
- GF(9) 上の 2.5 次元加法符号の最小長を完全に決定し,他の小パラメータに対する改良された構成も提示した。
- 1
- 2
