arXiv雑要約
プログラム - 2026/03/26 公開
バースト誤り訂正のための擬似MDP畳み込み符号 [cs.IT, math.IT]目的:バースト誤り訂正性能を有する新しい畳み込み符号の提案
- 通信において,信頼性の高いデータ伝送は不可欠であり,誤り訂正符号はその重要な役割を担う。
- 従来のMDP畳み込み符号は,必要な有限体のサイズがコードパラメータと共に急激に増加する。
- 有限体サイズの増大を抑制しつつ,バースト誤り訂正性能を維持する符号の構築を目指す。
- 本研究では,MDP畳み込み符号の特性を一部保持しつつ,より小さな有限体で構築可能な擬似MDP畳み込み符号を提案する。
- 提案符号は,特定の時間遅延内で大きなバースト誤りを訂正可能であり,MDP符号と同等の性能の一部を維持する。
- 擬似MDP畳み込み符号は,MDP畳み込み符号と比較して,より小さな有限体サイズで構築できる。
耐障害距離オラクル:n・f障壁を下回る [cs.DS]目的:耐障害距離オラクル構築
- グラフにおける距離維持は重要であり,特にネットワークの信頼性確保に不可欠である。
- 既存の耐障害スパナーは,最悪の場合にΩ(nf)のエッジ数が必要となり,大規模グラフでは限界がある。
- サブグラフではない距離オラクルを利用することで,このnf障壁を打破することを目指す。
- 本研究では,ストレッチO(log(n)log(log(n)))のf-耐障害距離オラクルを,~O(n√f)ビットで構築した。
- n≦f≦n^(3/2)の範囲では,ストレッチ7の距離オラクルを~O(n^(3/2)f^(1/3))ビットで実現した。
- 提案手法は,耐障害「oblivious」スパナーや,有界削除ストリームにおける耐障害距離オラクルにも応用可能である。
最適な多次元畳み込み符号 [cs.IT, math.IT]目的:多次元畳み込み符号の構成
- 符号理論は,情報伝送における誤り訂正に不可欠であり,信頼性の高い通信を可能にする。
- 高次元畳み込み符号の構成は難しく,既知の構成法は限られている。
- スーパーレギュラーな行列を利用し,新たな最大距離分離可能な多次元畳み込み符号を構成すること。
- 本研究では,スーパーレギュラーな行列の性質に基づき,新たな最大距離分離可能な多次元畳み込み符号の構成法を開発した。
- 特に,レートが1/nの符号について,特定の行次数条件を満たす生成行列を用いた新しい符号族を構築した。
- この構成法により,既知の最大距離分離可能な多次元畳み込み符号の構成法が大幅に拡張された。
突然変異生成のためのLLMの性能向上 [cs.SE]目的:突然変異生成におけるLLMの性能改善
- ソフトウェアの品質向上には,徹底的なテストが不可欠である。テスト技術の進化が求められている。
- LLMを用いた突然変異テストは有望だが,低品質な変異や冗長性の問題があった。
- 実世界のバグ情報を用いたLLMの適応的チューニングにより,変異の質と効率を改善する。
- SMARTは,突然変異の有効性(加重平均生成率)を42.89%から65.6%に向上させた。
- 非重複率が87.38%から95.62%に,コンパイル可能率が88.85%から90.21%に向上した。
- 実バグ検出率は92.61%(LLMutの57.86%に対し),オチアイ係数は25.61%から38.44%に改善された。
貨物市場におけるスポット供給と契約供給の調整 [cs.DS, math.OC]目的:貨物市場における総調達コストの最小化
- デジタル化が進む貨物業界において,効率的な輸送手段の確保が重要である。
- 契約輸送とスポット輸送の連携が不十分であり,調達コストの最適化が課題である。
- 契約供給とスポット供給を調整し,調達コストを削減することを目的とする。
- 提案するDual Frank Wolfeアルゴリズムは,大規模市場において最適な動的計画法に匹敵する性能を示す。
- このアルゴリズムは計算効率が高く,既存のスポット価格設定プロトコルに容易に適用可能である。
- 主要なデジタル貨物市場からのデータを用いた評価により,既存手法と比較して約10%のコスト削減効果が確認された。
開発者とLLMのコード評価におけるバイアスの比較 [cs.SE, cs.CL]目的:コード評価における開発者とLLMのバイアスの比較
- ソフトウェア開発において,コード品質の評価は重要な課題であり,開発効率や信頼性に直結する。
- LLMをコード評価に利用する際,LLMが持つ潜在的なバイアスが評価結果に影響を与える可能性がある。
- 人間の評価基準とLLMの評価基準のずれを特定し,より公平なコード評価システムの構築を目指す。
- TRACというフレームワークを用いて,LLMのコード評価能力を人間による評価と比較した結果,LLMは人間よりも性能が劣ることが示された。
- LLMと人間の評価基準のずれは,コードの長さや説明の詳しさなど,既存のソフトウェア品質基準に関連する項目で多く見られた。
- 特にチャットベースのコーディングにおいては,LLMは長いコードの説明を好み,人間は短い説明を好むという違いが確認された。
双唇chitz不変理論における近似定理 [math.GT, cs.CG, math.FA, cs.IT, math.IT, math.MG]目的:軌道空間のユークリッド空間への低歪み埋め込み
- 幾何学や解析学に応用があり,多様体の研究に不可欠である。
- 最小歪みを持つ埋め込みが限られた場合にしか知られていない。
- 特定のケースにおける最小歪みをほぼ達成する埋め込み手法を確立する。
- 平面回転,実位相復元,有限反射群の3つの場合において,歪みを最小化する埋め込みが,「maxフィルターバンク」と線形変換の組み合わせでほぼ達成できることを証明した。
- 証明は2段階で構成され,Lipschitz関数空間の包含関係を示すこと,そしてその包含関係を証明することからなる。
- これらのケースが関連する関数空間と異なる相互作用を示すことが確認された。
セマンティック通信のためのHARQを用いた共同ソース・チャネル・チェック符号化 [eess.IV, cs.IT, math.IT]目的:信頼性の高いセマンティック通信を実現するための新たな符号化方式
- 通信効率とタスクレベルの信頼性向上が求められる中で,セマンティック通信が注目されている。
- 既存の信頼性向上手法は再送に依存しており,再送トリガー用のチェック符号語が必要で,オーバーヘッドが大きい。
- チェック符号語をJSCCプロセスに統合し,セマンティック忠実度検証と再構成強化を同時に行うことで,効率化を目指す。
- 提案手法S3CHARQは,既存のHARQベースのセマンティック通信システムと比較して,97パーセンタイルPSNRが2.36dB向上した。
- また,アウトेज確率を37.45%削減することに成功した。
- 強化学習を用いた再送決定モジュールにより,動的なチャネル環境下で回復と改良情報を効果的に調整する。
無制限サンプリングにおける安定性 [math.FA, cs.IT, math.IT]目的:バンドリミット関数のフォールデッドサンプリングからの再構成
- デジタル信号処理において,サンプリングは不可欠であり,信号の忠実な再現に重要である。
- フォールデッドサンプリングは飽和歪みを回避するが,等間隔サンプリングにおける再構成の安定性に問題がある。
- エネルギー制約を課すことで安定性を回復し,非一様サンプリングにも拡張する。
- 等間隔サンプリングパターンでは,再構成問題が本質的に不安定であることが示された。
- 任意の事前エネルギー境界を課すことで安定性が回復し,その正則化効果は非一様サンプリングにも及ぶ。
- フォールデッドサンプリングの安定性は,無限次元格子最短ベクトル問題として捉えられ,フーリエ濃度行列のスペクトルプロファイルを用いて解決された。
ランダムグラフにおける局所的な幾何構造の検出:情報理論的および計算論的限界 [math.OC, cs.SY, eess.SY, physics.plasm-ph, cs.DC, cs.PF, math.ST, cs.CC, cs.DS, math.PR, stat.ML, stat.TH]目的:ランダムグラフにおける局所的な幾何構造検出の限界
- グラフ構造は,ソーシャルネットワークや生物学的ネットワークなど,様々な現実世界のシステムを表現する上で重要である。
- 隠れたコミュニティ構造の検出は難しい課題であり,特にエッジの周辺分布が区別できない場合には困難である。
- エッジの依存関係に内在する局所的な幾何構造を利用して,検出閾値を厳密に決定することを試みる。
- 情報理論的限界は,符号付き三角形カウントに基づく3つの検定と,切断された第2モーメントおよびKLダイバージェンスのテンソル化に基づく2つの方法によって導出された。
- 固定されたpに対して,検出閾値はd = Θ̃(k^2 ∨ k^6/n^3)であることが示された。また,消失するpに対する既存の結果を拡張した。
- 計算統計的ギャップが特定され,低次数多項式フレームワークおよび長さl≥4の符号付きサイクルカウントの最適性の低さを示す証拠が得られた。
有限次数量子LDPC符号がギルバート・バルシャモフ限界に到達 [quant-ph, cs.IT, math.IT]目的:有限次数量子LDPC符号の構成
- 量子誤り訂正は,量子情報の信頼性確保に不可欠である。
- 効率的な量子誤り訂正符号の設計は未だ困難である。
- ギルバート・バルシャモフ限界に到達する符号の構築を目指す。
- Hsu-Anastasopoulos符号とMacKay-Neal符号から,非ゼロの符号レートを持つネストされたCalderbank-Shor-Steane符号対を構成した。
- 固定次数において,高い確率で相対的な線形距離を証明した。
- いくつかの有限次数設定において,厳密なコンピュータ支援証明によりギルバート・バルシャモフ距離を証明した。
大規模MIMOにおける1ビットADCを用いた上りデータ検出の強化:解析と同時検出 [cs.IT, eess.SP, math.IT]目的:1ビットADCを用いる大規模MIMOシステムにおける上りデータ検出に関する解析と,それを用いた新しい検出手法の開発
- 無線通信容量の増大に不可欠な技術であり,次世代移動通信システムにおいて重要性が高まっている。
- 1ビットADCの使用は,ハードウェアコストを削減するが,信号の精度低下による検出性能の劣化が課題である。
- 1ビットADCを用いた環境下でのデータ検出性能を向上させ,実用的なシステム実現を目指す。
- MMSE受信機はMRC受信機と比較して著しい性能向上を示すことが確認された。
- 提案するLMMD受信機は,既存の受信機を大幅に上回る性能を発揮することが示された。
- 提案する同時検出(JD)手法およびその低複雑度変形は,単一UE検出と比較して大幅な性能向上をもたらすことが確認された。
高階バイ代数的な意味論 [cs.LO, cs.PL]目的:高階言語における構成性の保証
- 高階言語の形式的意味論は,プログラムの正当性保証に不可欠である。
- 既存の構成性証明は煩雑であり,一般的なフレームワークが不足している。
- 高階言語への抽象GSOSフレームワークの適用を目指す。
- 本研究では,高階言語のための抽象GSOS仕様の理論を開発した。
- その中で,高階言語の操作意味論は特定のディナチュラル変換(高階GSOS法則)として表現される。
- この理論に基づき,構成性に関する一般的な結果が得られ,組合論理やラムダ計算への応用が示された。
レジリエント分散コンピューティングのための符号化コンピューティング:学習理論的フレームワーク [cs.LG, cs.DC, cs.IT, math.IT]目的:レジリエント分散コンピューティングのための符号化コンピューティングの新たな基盤
- 大規模分散コンピューティングは,現代のデータ処理において不可欠であり,その効率性と信頼性が求められている。
- 従来の分散コンピューティングは,障害や遅延のあるサーバーの存在に脆弱であり,計算効率を低下させる可能性がある。
- 機械学習ワークロードにおける効率と信頼性を向上させるための,符号化コンピューティングの理論的枠組みを構築すること。
- 提案手法は,損失関数を汎化誤差と学習誤差の和で上界化することにより,最適なエンコーダーとデコーダーの探索を可能にする。
- ノイズなしおよびノイズありの計算環境において,推定誤差がそれぞれ$\mathcal{O}(S^3 N^{-3})$および$\mathcal{O}(S^{\frac{8}{5}}N^{\frac{-3}{5}})$の割合で減衰することを示した。
- 様々な機械学習モデルの推論タスクにおける評価により,提案フレームワークが最新技術を精度と収束速度の両面で上回ることが示された。
現実的な路傍物配置による自動運転車への攻撃 [cs.CV, cs.SE]目的:自動運転車の知覚システムの脆弱性評価
- 自動運転技術の発展に伴い,安全性の確保が不可欠であるため,知覚システムの信頼性評価が重要となる。
- 既存の攻撃は,不自然な形状やパッチに依存しており,現実的な状況を再現できていないという課題がある。
- 路傍物の配置を操作することで,現実的かつ効果的な攻撃を可能にし,自動運転車の誤認識を誘発することを目的とする。
- TrashFuzzは,道路設計ガイドラインを遵守しつつ,路傍物の配置を調整することで,自動運転車の知覚システムに対する攻撃を生成する。
- Apollo自動運転システムに対する実験では,TrashFuzzにより,24件の交通法規のうち15件の違反が発生した。
- 本研究は,現実的なシナリオに基づいた攻撃手法を提供し,自動運転システムの安全性を向上させるための示唆を与える。
ワンショット多重アクセスチャネルのシミュレーション [cs.IT, math.IT, quant-ph]目的:積型入力における共有ランダム性支援多重アクセスチャネル(MAC)のシミュレーションコスト領域の特性評価
- 情報伝送における多重アクセスは,複数の送信者が同時に通信を行う上で不可欠な技術である。
- チャネルシミュレーションは,現実のチャネルを近似的に実現するために重要だが,コストの評価が困難である。
- 積型入力に対するチャネルシミュレーションのコスト領域を厳密に評価し,より効率的な通信システムを構築すること。
- 提案手法は,補助変数のサイズを制限することで,ワンショットシミュレーションコスト領域のtightな上限と下限を導出した。
- 漸近的な設定においては,単一文字レートでの厳密な特性化が可能となり,既存研究の結果を拡張した。
- 量子チャネルへの拡張も検討し,量子対古典MACにおけるフィードバックシミュレーションのコスト領域を評価した。
指向性トークンスライディング [cs.DS]目的:配置変換問題における,特定の規則下での2つの配置間の変換可能性
- 配置変換問題は,計算機科学における基本的な問題であり,様々な応用分野で重要である。
- トークンスライディング問題はNP困難であり,効率的な解法が求められている。
- この研究は,様々な向き付けグラフクラスにおけるトークンスライディング問題の複雑性を解明し,効率的なアルゴリズムを開発することを目指す。
- 指向性グラフにおいても,トークンスライディング問題はPSPACE完全であることが示された。
- 指向性スプリットグラフ,二部グラフ,有界トレewidthグラフにおいても,問題はPSPACE完全である。
- 指向性サイクルグラフとコグラフにおいては,多項式時間で解けるアルゴリズムが提示された。
グラフにおける頂点部分集合の連結骨格:奇数ケースと偶数ケース [cs.DS, math.CO]目的:グラフにおける頂点部分集合の$S$-mincut(最小カット)を効率的に求めるための連結骨格の構造
- ネットワークの信頼性や頑健性を評価する上で,グラフの連結性解析は不可欠である。
- 従来,$S$-mincut の連結骨格の証明は,奇数容量の場合に限定されていた。
- 本研究では,奇数ケースと偶数ケースの両方を含む連結骨格の完全な証明を目指す。
- 連結骨格は,$S$-mincut を格納するコンパクトなデータ構造として,全てのケースを網羅する。
- 本研究では,カットの劣モジュラリティを利用した,より簡潔な証明を提示する。
- 連結骨格を用いることで,$S$-mincut に関する基本的なクエリを効率的に解決できる。
ボトルネックトランスフォーマー:汎化推論のための周期的なKVキャッシュ統合 [cs.LG, cs.AI, cs.IT, math.IT]目的:汎化推論能力の向上のためのKVキャッシュ統合手法
- 大規模言語モデルの推論能力は計算資源に依存し,複雑な推論には高い計算コストが必要となる。
- 既存のKVキャッシュ圧縮手法では,推論性能とメモリ効率のバランスが課題となっている。
- 情報ボトルネック理論に基づき,KVキャッシュの再統合によって推論性能と汎化能力を向上させる。
- 提案手法であるBottlenecked Transformerは,KVキャッシュプロセッサを用いて周期的にキャッシュを再統合する。
- 数学推論ベンチマークにおいて,Bottlenecked Transformerは標準的なトランスフォーマーやpause-token拡張ベースラインと比較して一貫した性能向上を示した。
- 特定のタスクとバックボーンにおいて,最大で+6.6ppの性能向上が確認された。
ワイヤレスAIの進化:統計的学習者から電磁波誘導型基盤モデルへ [cs.IT, eess.SP, math.IT]目的:次世代無線通信における電磁波原理に基づいたワイヤレス基盤モデルの構築
- 6Gネットワークはホログラフィック通信やユビキタスセンシングを可能にするため,AIを基盤とした革新的な無線技術が不可欠である。
- 既存のAIモデルは電磁波に関する制約や物理法則を考慮しておらず,現実世界の環境への適応性に課題がある。
- 電磁波情報理論に基づく自己教師あり事前学習によって,AIモデルに電磁波の知識を組み込み,汎化性能とデータ効率を向上させる。
- 電磁波情報理論を導いた自己教師あり事前学習フレームワーク(EIT-SPT)を提案し,ワイヤレス基盤モデルに電磁波物理学の知識を体系的に注入することに成功した。
- EIT-SPTフレームワークは,物理的な整合性,多様な電磁波環境への適応能力,データ効率を向上させ,6Gシナリオでのワイヤレス基盤モデルの応用可能性を広げた。
- 具体的なケーススタディを通じて,提案フレームワークの有効性を検証し,今後のワイヤレス基盤モデルに関する研究課題と展望を提示した。
LLMを用いたデータベース管理システムに対するテストオラクル自動探索 [cs.DB, cs.PL, cs.SE]目的:データベース管理システムに対するテストオラクルの自動探索とインスタンス化
- データベースシステムの信頼性確保は重要であり,自動テストはその効率化に貢献する。
- テストオラクルの設計は手動で行われており,自動テスト全体のボトルネックとなっている。
- LLMを活用し,テストオラクルの自動設計による効率的なバグ検出を目指す。
- Argusという新たなフレームワークを開発し,Constrained Abstract Queryを活用した。
- 5つのデータベース管理システムで評価した結果,40個の未知のバグを発見した。
- 発見されたバグのうち35個は論理バグであり,36個が確認済みで26個が修正された。
リード・ソロモン符号の決定的なリスト復号 [cs.CC, cs.IT, math.IT]目的:リード・ソロモン符号の決定的なリスト復号のアルゴリズム
- 誤り訂正符号は,通信やデータストレージにおける信頼性を確保する上で不可欠である。
- 従来の決定的なリスト復号アルゴリズムは,体の特性に依存する計算コストが高いという課題があった。
- 体のサイズに依存しない効率的な決定的なリスト復号アルゴリズムを開発すること。
- 本研究では,任意の有限体上の次元k,ブロック長nのリード・ソロモン符号に対し,決定的なリスト復号アルゴリズムが開発された。
- このアルゴリズムは,$\sqrt{(k-1)n}$の一致から,時間$\text{poly}(n, \log |\mathbb{F}|)$でリスト復号を可能にする。
- これは,従来のアルゴリズムと比較して,計算時間の面で大きな改善をもたらす。
検索が多いほど逆効果になる:検索拡張コードレビュー生成 [cs.SE]目的:コードレビュー生成における検索拡張の最適化
- 開発効率向上に貢献するコードレビューの自動化が求められている
- 既存手法では,汎用的なレビューや的外れなレビューが生成されやすい
- 検索拡張による文脈学習で,より適切なコードレビュー生成を目指す
- 提案手法RAReは,既存の基盤モデルを上回り,BLEU-4スコアで12.32と12.96を達成した
- 検索数が増加すると性能が低下する傾向があり,上位1件の検索例が最も効果的であることが示された
- 人間による評価と解釈可能性分析により,検索拡張生成がジェネリックな出力の削減とレビューの焦点向上に貢献することが確認された
QLCoder:セキュリティ脆弱性の静的解析のためのクエリ合成器 [eess.SY, cs.SY, cs.CL, cs.CR, cs.PL, cs.SE]目的:セキュリティ脆弱性の静的解析クエリの自動合成
- ソフトウェアのセキュリティ確保は重要であり,静的解析はそのための有効な手段である。
- 静的解析クエリの作成には専門知識が必要であり,その作成は困難である。
- 脆弱性情報から静的解析クエリを自動生成し,クエリ作成の負担を軽減すること。
- QLCoderは,脆弱性情報(CVE)からCodeQLクエリを自動合成するフレームワークである。
- LLMと実行フィードバックを活用し,構文と意味の両面で有効なクエリを生成する。
- 176件のCVEに対して評価した結果,53.4%のCVEで脆弱箇所を正確に検出するクエリを合成できた。
ソフトウェアシステムの能動的検証 [cs.SE]目的:ソフトウェア検証のためのLLMエージェントの実現
- 大規模言語モデルの普及により自動生成コードが増加しており,ソフトウェアの信頼性確保が重要となる。
- 既存手法はLLMの学習に大規模な証明例を必要とし,柔軟性や効率性に課題がある。
- 本研究は,LLMエージェントが動的に学習し,定理証明器との協調によりソフトウェア検証を自動化することを目指す。
- LLMエージェントAutoRocqを開発し,証明例に依存しない自己学習によるプログラム検証を可能にした。
- AutoRocqは,定理証明器Rocqとの反復的なコミュニケーションにより証明を改善し,自律的な証明構築を実現した。
- SV-COMPベンチマークやLinuxカーネルモジュールにおいて,自動プログラム検証の有効性を示す結果が得られた。
カテゴリ変数のトポロジーと代数構造について [cs.IT, math.IT]目的:カテゴリ変数のトポロジーと代数構造の検討
- 情報科学において,確率変数の距離や構造は,データ解析や機械学習の基礎となる。
- カテゴリ変数の間の適切な距離定義や,それに基づく構造化が課題であった。
- エントロピーと対称的確実性に基づいた距離を用いて,カテゴリ変数を構造化する。
- エントロピーと対称的確実性に基づいた距離を定義し,カテゴリ変数の商空間を構成した。
- 構成された商空間に自然な可換モノイド構造が存在することを示した。
- 定義したモノイド演算は,距離から誘導されるトポロジーと整合性を持つことが確認された。
SURA:安全な非同期ランダムアクセス [cs.IT, math.IT]目的:非同期ランダムアクセスにおけるセキュリティ確保
- 無線通信において,効率的なアクセス制御は重要な課題である。
- 従来の非同期ランダムアクセスは,セキュリティ上の脆弱性を抱えていた。
- 本研究は,非同期ランダムアクセスのセキュリティを向上させることを目指す。
- 提案システムは,物理層セキュリティ技術を用いて,機密性を確保する。
- 基地局からのフィードバック信号を利用し,秘密鍵を生成することで安全な通信を実現する。
- シミュレーション結果から,システムの構造を変更せずに有意な秘匿性が得られることが示された。
直線被覆と関連問題 [cs.CG, cs.DS]目的:直線被覆問題の拡張に関する研究
- 幾何学における基本的な問題であり,計算幾何学の発展に寄与する。
- 直線被覆問題はNP困難であり,効率的な解法が課題である。
- 直線クラスタリングや超平面被覆といった問題の計算複雑性を明らかにする。
- 直線被覆問題はパラメータkに関して固定パラメータ扱い可能だが,直線クラスタリングはW[1]-困難である。
- 超平面被覆問題は,d=2の場合でもk=2の場合でもNP困難である。
- 射影クラスタリング問題に対するアルゴリズムを開発し,時間計算量をn^{O(dk(r+1))}と示した。
振幅制約のあるAWGNチャネルにおけるサポートサイズの改良された下限 [cs.IT, math.IT, math.ST, stat.TH]目的:振幅制約AWGNチャネルの容量達成入力分布のサポートサイズ
- 通信システムにおいて,信頼性の高い情報伝送は不可欠であり,チャネル容量の理解が重要である。
- 既存の研究では,サポートサイズの上下限が広く離れており,正確なスケーリングが不明であった。
- 本研究は,サポートサイズのよりタイトな下限を確立し,線形スケーリングの仮説を否定することを目指す。
- 本研究により,サポートサイズの新たな下限が$A\sqrt{\log A}$であることが示された。
- 容量達成出力分布が振幅制約の内側で一様分布に近いという事実を定量化した。
- 有限なガウス混合による一様分布の最良近似に関する理論を開発し,サポートサイズの下限を導出した。
Fixturize:テスト生成におけるフィクスチャギャップの解消 [cs.CG, cs.SE]目的:テストフィクスチャの特定と生成
- ソフトウェアの品質保証において,ユニットテストは不可欠であり,自動化が求められている。
- 大規模言語モデルによる自動テスト生成は進歩する一方,テスト実行環境の構築であるフィクスチャの作成が課題となっていた。
- テストフィクスチャの依存性を診断し,反復的なプロセスで自動生成することにより,テスト品質を向上させる。
- Fixturizeは,テストフィクスチャの依存性を高い精度(88.38%-97.00%)で特定可能であることが示された。
- 自動生成されたフィクスチャを用いることで,Suite Pass rateが平均で18.03%-42.86%向上した。
- 既存のテストツールと組み合わせることで,行/分岐カバレッジがそれぞれ平均16.85%/24.08%および31.54%/119.66%向上した。
オープンソース開発におけるボットの参加パターンと感情への影響 [cs.SE]目的:オープンソース開発におけるボットの参加パターンと,開発者の感情表現への影響
- ソフトウェア開発の効率化と品質向上において,自動化された貢献が重要視されている。
- ボットの活動が開発者コミュニティに与える影響について,十分な理解が得られていない。
- ボットの活動パターンと感情への影響を定量的に分析し,健全なコミュニティ形成に貢献する。
- ボットはプルリクエストに対して迅速に対応する一方,イシューにおいては後段のメンテナンス活動を行う傾向が確認された。
- ボットは中立的な表現が多いものの,ボットの介入後に人間のコメントは感謝,賞賛,楽観といった感情に変化する傾向が見られた。
- 少数のボットであっても,開発者コミュニケーションのタイミングと感情ダイナミクスに変化をもたらす可能性が示唆された。
HalluJudge:コードレビュー自動化における文脈不整合のハルシネーション検出 [cs.HC, cs.SE, cs.AI]目的:LLM生成コードレビューコメントのハルシネーション検出
- コードレビュー自動化は開発効率向上に不可欠だが,LLMのハルシネーションが課題となる。
- LLMが根拠のないコメントを生成すると,開発者の信頼を損ね,レビューの質が低下する。
- 参照なしで,LLM生成コメントの文脈適合性を評価し,ハルシネーションを検出することを目指す。
- HalluJudgeは,直接評価と構造化された推論を含む4つの戦略を用いて文脈適合性を評価する。
- Atlassianのソフトウェアプロジェクトを用いた評価で,F1スコア0.85,コスト$0.009で効果と費用対効果が確認された。
- オンライン本番環境では,HalluJudgeの評価と開発者の選好が平均67%一致し,実用性が示唆された。
エージェント評価におけるランダム性の影響 [cs.LG, cs.AI, cs.SE]目的:エージェント評価の信頼性向上
- エージェントシステムの性能評価は,AI研究開発の進展に不可欠である。
- 現在の評価方法では,単一の試行に基づく結果に依存しており,再現性の問題がある。
- 評価におけるランダム性の影響を定量的に評価し,信頼性の高い評価方法を提案する。
- SWE-Bench-Verifiedにおける実験で,単一試行の結果は大きく変動し,2.2~6.0%ポイントの差が生じた。
- わずかな性能向上(2~3%ポイント)が,評価ノイズによるものである可能性が示唆された。
- 複数回の試行,統計的検出力分析,pass@k等の指標の使用を推奨することで,評価の信頼性を高めることができる。
KRONE:階層的・モジュール型ログ異常検知 [cs.DB, cs.AI, cs.SE]目的:システム障害やセキュリティリスクの発見
- システム運用において,ログは問題特定や原因究明に不可欠である。
- 従来のログ解析では,実行構造が失われ,依存関係の把握が困難である。
- ログの階層構造を自動的に抽出し,高精度な異常検知を実現する。
- KRONEは,実行階層を抽出し,モジュール化された多層的な異常検知を可能にする。
- 公開ベンチマークおよびByteDance Cloudのデータセットで,KRONEは高い精度と効率性を示した。
- LLMの使用量を削減しつつ,F1スコアを大幅に向上させた。
エージェントDiff:状態差分に基づく評価による,LLMエージェントのエンタープライズAPIタスクのベンチマーク [cs.DB, cs.SE, cs.CL]目的:LLMエージェントのエンタープライズAPIタスクにおける性能評価
- LLMは生産性向上に貢献する可能性を秘めているが,その性能を客観的に評価する手法が不可欠である。
- 既存のベンチマークは,環境の制御性と実環境との乖離というトレードオフに直面しており,課題が残されている。
- APIの環境状態変化を評価基準とすることで,より厳密かつ実用的な性能評価を実現することを目指す。
- Agent-Diffは,APIへのアクセスを許可しつつ環境をサンドボックス化することで,これらの課題を克服する。
- 9つのLLMを224のタスクで評価した結果,モデルごとの性能差が明確になった。
- APIドキュメントへのアクセスがベンチマーク性能に与える影響を検証し,その重要性を示した。
Lean 4における真理と美の追求:文法,最適化, matroid の形式的検証された理論 [cs.LO, math.HO]目的:文法,最適化,matroid に関する形式的検証された理論
- 形式的検証は,ソフトウェアや数理論理の信頼性を高める上で不可欠である。
- 既存の数理理論の形式化は,定義の曖昧さや誤りを含む場合がある。
- 可読性と信頼性を重視した形式的検証により,理論の理解と応用を促進する。
- 最適化理論,matroid 理論,文法の理論の3分野において,真理と美の追求を試みた。
- 定義の可読性と信頼性を重視し,理解しやすいコードの作成を目指した。
- Roger Scruton の哲学に基づき,美が世界との関わり方や救済の源泉となることを強調した。
L2ノルムのインスタンス最適推定 [cs.DS]目的:L2ノルム推定におけるサンプル複雑性
- 分布や確率的アルゴリズム解析において,L2ノルムは重要な役割を果たす。
- 既存のアルゴリズムは,インスタンス固有の第二モーメント境界に対して最適ではない場合がある。
- インスタンス固有の第二モーメント解析に一致するサンプル複雑性を持つ推定アルゴリズムを開発する。
- 本研究では,インスタンス固有の第二モーメント解析に一致する,バイアスを持たないL2ノルム推定アルゴリズムを提示する。
- 分布μのノルム推定における,1/ (ε||μ||2) + tμ/ ε^2 の下限が,バイアスの有無に関わらず成立することを示す。
- これにより,L2ノルム推定のサンプル複雑性に関する理論的な限界が明確になった。
漸近推論の熱力学的構造 [cs.IT, math.IT, math.ST, physics.data-an, stat.TH]目的:漸近推論における熱力学的構造
- 統計的推論は,データから知識を導く上で不可欠であり,科学的探求の基礎である。
- 従来の推論方法は,計算コストや情報の損失といった制約を抱えている場合がある。
- 情報効率の限界を明らかにし,最適な推論経路を特定することを目指す。
- サンプルサイズとパラメータ分散を状態空間として定義し,熱力学的枠組みを構築した。
- シャノン情報量をエントロピーとして扱い,第一法則類似のバランス方程式を導出した。
- カルノーサイクル類似の情報効率の限界が,ノイズフロアによって決定されることを示した。
CIRCLE:現実世界の視点からのAI評価フレームワーク [cs.AI, cs.SE]目的:AIの現実世界における成果とモデル中心の性能指標とのギャップを埋めるためのフレームワーク
- AIの社会実装が拡大する中で,その影響を的確に評価する重要性が高まっている。
- 既存の評価手法は,技術的な側面にとらわれ,組織への影響や実用性に関する情報が不足している。
- ステークホルダーの懸念を測定可能な指標に変換し,AIの実際の効果を評価する手法を確立する。
- CIRCLEは,AIシステムのテスト,評価,検証,妥当性の確認(TEVV)における検証段階を具体化する。
- 現場テスト,レッドチーム,長期研究などを統合し,現場固有の状況に配慮した体系的な知識を生成する。
- 理論的な能力ではなく,現実世界での影響に基づいてAIガバナンスを可能にする。
浮動小数点数演算下におけるリプシッツに基づくロバスト性検証 [cs.LG, cs.CV, cs.PL]目的:ニューラルネットワークのロバスト性検証
- ニューラルネットワークの安全性確保は,自動運転や医療など,重要な応用分野において不可欠である。
- 既存の検証手法は実数演算を仮定しており,実際の浮動小数点数演算との乖離が問題となっていた。
- 浮動小数点数演算環境下でのロバスト性を保証する理論と実装を提供し,検証の信頼性を高める。
- 実数演算によるロバスト性保証が,浮動小数点数演算下では破綻するケースが存在することが示された。
- 実数演算のリプシッツ定数に基づく感度解析と,浮動小数点数演算の感度解析を結びつける理論が開発された。
- 理論に基づいた検証器を実装し,その実用性が確認された。
DRESSによる困難な同型性ベンチマークの打破 [cs.DS, cs.DM, cs.LG]目的:グラフ構造の類似性を反復的に洗練し,正準フィンガープリントを得ること
- グラフ構造の比較は,化学,ソーシャルネットワーク分析など,多様な分野で重要である。
- 既存手法では,複雑なグラフの同型性を効率的に識別することが困難である。
- 本研究は,困難なグラフ構造に対して,高い識別能力を持つフィンガープリント手法を開発する。
- Δ-DRESSは,34種類の困難なグラフファミリーに対して,高い識別性能を示した。
- 特に,SRG(40,12,2,4)ファミリーにおける唯一の衝突は,Δ²-DRESSによって解決された。
- ペアワイズ比較可能なフィンガープリントの分離余裕は,少なくとも137×εであり,数値的な安定性も確認された。
ドメイン知識と事例推論を活用したドメイン特化型コード生成 [cs.AI, cs.SE]目的:ドメイン特化型コード生成の性能向上
- ソフトウェア開発において,ドメイン知識は高品質なコード生成に不可欠である。
- 汎用LLMはドメイン知識に乏しく,実世界への適用時に性能が低下することが課題である。
- 知識グラフと事例推論を組み合わせ,LLMのドメイン適応能力を高めることを目指す。
- DomAgentは,知識グラフ推論と事例ベース推論を統合したDomRetrieverを搭載し,ドメイン知識の取得と活用を効率化する。
- データサイエンスのベンチマークデータセット(DS-1000)と実世界のトラックソフトウェア開発タスクにおいて,DomAgentは優れた性能を示した。
- 小規模なオープンソースモデルでも,DomAgentを用いることで大規模なプロプライエタリLLMに匹敵する性能を達成可能となった。
大規模言語モデルを活用した学際的なソフトウェア開発のワークフロー最適化:自動車産業における事例研究 [cs.SE, cs.AI]目的:学際的なソフトウェア開発におけるワークフロー最適化
- 自動車産業を含む複雑なシステム開発では,多様な専門知識の融合が不可欠である。
- 専門家と開発者の間の知識の断絶や,非互換的な形式主義がボトルネックとなっている。
- 大規模言語モデルを用いてワークフローを自動化し,開発効率の向上を目指す。
- 提案手法は,自動車APIシステムにおいて93.7%のF1スコアを達成した。
- APIごとの開発時間を約5時間から7分未満に短縮し,979時間のエンジニアリング時間を削減した。
- 専門家と開発者双方からコミュニケーション効率に対する高い満足度が得られた。
FMEDA安全指標の不確実性定量化:ASIC検証向上のための誤差伝播アプローチ [cs.AR, cs.SE]目的:FMEDA安全指標の不確実性定量化
- 自動車システムにおけるASICの機能安全検証において,正確な安全指標は不可欠である。
- 従来のFMEDA指標は,故障モード分布や診断カバレッジの推定精度に依存し,不確実性が大きくなりがちである。
- 本研究は,FMEDA安全指標の不確実性を定量化し,より堅牢なASIC安全検証を実現することを目的とする。
- 本研究では,誤差伝播理論をFMEDA安全指標の計算に導入し,SPFMおよびLFMの最大偏差と信頼区間を定量化した。
- これにより,分析品質の直接的な指標が得られ,不確実性の主要な原因を特定するエラー重要度識別子(EII)を導入した。
- 本アプローチは,FMEDAの透明性と信頼性を高め,ISO 26262への準拠を支援する。
木構造グラフにおける測地集合問題のアルゴリズムと困難性 [cs.DS, cs.DM]目的:測地集合問題に対するアルゴリズムの開発と計算複雑性の解析
- グラフ理論やアルゴリズム設計において,ネットワークの構造と効率的な問題解決が重要である。
- 測地集合問題はNP困難であり,大規模グラフに対する効率的な解法が求められている。
- 木構造に近いグラフにおける測地集合問題の解法を明らかにすること。
- 木構造グラフ(ditree)においては,多項式時間で測地集合問題を解くアルゴリズムが存在する。
- 2サイクルを持たないグラフにおいて,フィードバックエッジ集合数fenを用いて$2^{\mathcal{O}(\textsf{fen})} \cdot n^{\mathcal{O}(1)}$時間で解ける。
- DAG上では,フィードバック頂点集合数が定数であってもNP困難であることが示された。
非線形ハイゼンベルク・ロバートソン・シュレーディンガー不確定性原理 [math.FA, cs.IT, math-ph, math.IT, math.MP]目的:Banach空間の部分集合へのLipschitz写像に対する不確定性原理の導出
- 量子力学の基礎概念であり,物理現象の理解に不可欠である。
- 線形作用素に限定された従来の不確定性原理の適用範囲が狭い。
- より一般的なLipschitz写像に対する不確定性原理を確立し,適用範囲を広げる。
- Lipschitz写像に対する不確定性原理を数学的に導出した。
- この非線形不確定性原理は,線形作用素に対しては従来のハイゼンベルク・ロバートソン・シュレーディンガー不確定性原理と一致する。
プラトー関数における組合せ構造と値分布 [math.OC, cs.SY, eess.SY, math.CO, cs.IT, math.IT]目的:プラトー関数の組合せ的性質
- 暗号プリミティブの構成要素としてプラトー関数が広く利用されており,その性質理解が重要である。
- プラトー関数の値分布,特に像と逆像のサイズに関する知見が十分ではない。
- ほぼ平衡なプラトー関数の存在条件や線形性,および微分均一性の上界を導出する。
- プラトー関数の中でも特に,逆像のサイズが2つしかない「ほぼ平衡」なプラトー関数に焦点を当てた。
- プラトー $d$-to-$1$ 関数(およびプラトー単項式)が存在するための $d$ の選択肢が非常に限られていることが示された。
- プラトーAPN関数のウォルシュ変換と値分布の関係が明らかになった。
校正された機械学習予測に基づくアルゴリズム [stat.ML, cs.DS, cs.LG]目的:予測に基づくアルゴリズムにおける性能向上
- 実世界の問題解決において,機械学習の活用が不可欠となっている。
- 機械学習予測の信頼性評価が難しく,適切な信頼度設定が課題である。
- 予測レベルの不確実性評価に基づいた,校正によるアルゴリズム改善を目指す。
- 校正された予測を用いることで,スキーレンタル問題においてほぼ最適な性能を達成した。
- 高分散環境下では,校正された予測が不確実性評価において有効であることが証明された。
- ジョブスケジューリング問題において,校正された予測を用いることで既存手法を上回る性能改善が確認された。
情報理論的座標部分集合と多変量マルコフ連鎖の分割選択:サブモジュール最適化によるアプローチ [math.PR, cs.IT, math.CO, math.IT]目的:多変量マルコフ連鎖の遷移行列を低次元状態空間に最適に投影すること,および元の連鎖との情報損失を最小限に抑える最適な座標分割を見出すこと。
- 複雑なシステムを効率的にモデル化するため,高次元データの次元削減は重要な課題である。
- 高次元マルコフ連鎖の解析は計算コストが高く,実用的な応用が難しいという問題がある。
- 情報理論的基準に基づき,サブモジュール最適化を用いて次元削減と分割選択を効率的に行う。
- 提案手法は,エントロピー率,因子化への距離,独立性,定常性など,様々な情報理論的基準を最適化する。
- 目的関数のサブモジュール性/スーパーモジュール性を利用し,理論的保証付きの貪欲法アルゴリズムを開発した。
- ベルヌーイ・ラプラスモデルとキュリー・ワイスモデルを用いた数値実験により,提案手法の有効性を確認した。
盗聴と悪意のある干渉に対するデュアルターゲット搭載RIS支援ISAC [eess.SP, cs.IT, math.IT]目的:盗聴および悪意のある干渉に対する,デュアルターゲット搭載RIS支援ISAC方式
- 次世代無線ネットワークにおいて,統合センシング・通信(ISAC)と再構成可能なインテリジェント表面(RIS)の連携は,新たな応用と高度なサービスを可能とする。
- ISACとRISの導入は新たなセキュリティ上の課題を生み出す。特に,UAVのような機動的な環境では,悪意のある攻撃のリスクが高まる。
- 本研究は,敵対的なUAVによる盗聴と,悪意のあるRISによる干渉という二重のセキュリティ脅威に対処することを目的とする。
- 提案する方式では,基地局が合法的なUAVに搭載されたRISを通じてユーザーと通信しながら,2つのUAVターゲット(合法的なものと盗聴者)のセンシングを行う。
- 最適化問題は,ユーザーの秘匿率を最大化するように定式化され,半定値緩和(SDR)に基づく二段階の解法が開発された。
- シミュレーション結果は,提案方式が様々なシステム設定下で堅牢であることを示し,秘匿率,信号対干渉雑音比,および角度推定の精度によって通信・センシング性能が評価された。
