arXiv雑要約

プログラム - 2026/05/08 公開

  • 連続時間遷移システムのための段階的モナド余代数 [cs.LO]目的:連続時間遷移システムのモデル化
    • プロセス計算や形式手法において,システムの振る舞いを記述する上で重要な役割を果たす。
    • 従来の余代数では離散的なステップでの遷移しか表現できず,時間連続的な振る舞いに対応できない。
    • 時間連続的な遷移システムを表現可能にするための新たな余代数構造を提案すること。
    • 段階的モナド余代数を導入し,その理論を展開することで,連続時間遷移システムの数学的基礎を構築した。
    • 分岐時間論理とトレース意味論を定義し,それらをフェラー・ディンキン過程との関連付けを示した。
    • 余代数的な様相論理を開発し,不変性や表現力の状態基準を定義した。

    Link: https://arxiv.org/abs/2605.06268

  • 有限値変換器間の編集距離 [cs.FL, cs.LO]目的:有限値変換器間の編集距離の計算可能性
    • 形式言語理論において,変換器はオートマトンを一般化した概念であり,文字列間の関係を記述する上で重要である。
    • 一般的な変換器間の編集距離は計算不可能であり,実用的な応用が制限されている。
    • 有限値変換器という,より表現力の高いクラスにおいて編集距離の計算可能性を示す。
    • 有限値変換器間の編集距離は,関数変換器よりも表現力が高いにも関わらず,計算可能であることが示された。
    • 本研究では,編集距離の計算アルゴリズムを提示し,その計算可能性を証明している。
    • この結果は,文字列間の関係を扱う様々な応用において,有限値変換器の利用を促進する可能性がある。

    Link: https://arxiv.org/abs/2605.06269

  • 6G超高信頼低遅延通信に向けたポート切り替え遅延を考慮した流動アンテナシステム [cs.IT, math.IT]目的:6Gにおける超高信頼低遅延通信を実現するための流動アンテナシステムの性能評価
    • 無線通信分野において,より高速・大容量かつ低遅延な通信システムの実現が求められている。
    • 流動アンテナシステムは空間的多様性を活用するが,ポート切り替えに伴う遅延が性能低下の原因となる。
    • ポート切り替え遅延と有限ブロック長符号化が超高信頼低遅延通信に与える影響を解析し,最適なポート数を決定すること。
    • 空間相関,ポート切り替え遅延,有限ブロック長符号化の影響を考慮した解析により,平均ブロック誤り率と平均達成レートの厳密解を導出した。
    • ポート数を増やすと多様性は向上するが,有効ブロック長が減少し,有限ブロック長によるペナルティが大きくなるトレードオフがあることが明らかになった。
    • 信頼性,達成レート,エネルギー効率がポート数に関して単峰性を持つことを理論的に証明し,最適なポート構成が存在することを示した。

    Link: https://arxiv.org/abs/2605.06275

  • 正しいコード,脆弱な依存関係:LLM指定ライブラリバージョンの大規模測定研究 [cs.SE, cs.AI]目的:LLM生成コードにおけるライブラリバージョンのリスク評価
    • ソフトウェア開発におけるLLMの活用が拡大しており,その安全性確保が重要である。
    • LLMが指定するライブラリバージョンが,セキュリティや互換性の問題を引き起こす可能性がある。
    • LLMが選択するライブラリバージョンのリスクを定量的に評価し,対策を検討する。
    • LLMは,プロンプト形式によってバージョン指定の頻度が異なり,26.83%-95.18%の範囲でバージョンIDを指定する傾向がある。
    • 指定されたバージョンには,36.70%-55.70%のタスクで既知のCVEが含まれており,その深刻度は高い場合が多い。
    • CVEの公開時期はモデルの知識カットオフよりも前であることが多く,LLMのバージョン選択にバイアスが存在することが示唆された。

    Link: https://arxiv.org/abs/2605.06279

  • 最短経路ルーティングのための容量制約サブネットワークの設計 [cs.CL, cs.CY, cs.DS, cs.NI]目的:ネットワークのエネルギー効率向上を目的とした,低トラフィック時のネットワーク規模縮小と,全要求のルーティング保証
    • ネットワークのエネルギー消費量は大きく,効率化は環境負荷軽減に繋がる重要な課題である。
    • 既存手法は容量を考慮しない,ルーティング変更を許さない,問題を分割するなど,制約が多い。
    • 最短経路ルーティングにおけるネットワーク設計とルーティング問題を同時に最適化する手法を確立する。
    • 整数計画法とカラム生成法により,問題の最適解を正確に算出するアルゴリズムを提案した。
    • 提案手法を用いて実験評価を行った結果,最も単純な手法でも実用的な解に近づくことが示された。
    • 複数のトラフィック需要を考慮した場合,TOCAと呼ばれる手法が最も優れた性能を発揮することがわかった。

    Link: https://arxiv.org/abs/2605.06319

  • MANTRA:ツール使用LLMエージェントのためのSMT検証済みコンプライアンスベンチマークの自動合成 [cs.CL, cs.LG, cs.LO]目的:ツール使用LLMエージェントのコンプライアンス検証のためのベンチマーク自動合成手法
    • LLMエージェントの利用拡大に伴い,その挙動の信頼性確保が重要になっている。
    • 既存のベンチマークは手動作成かLLM評価に依存しており,規模や信頼性に課題がある。
    • 自然言語マニュアルから形式的に検証可能なコンプライアンスベンチマークを自動生成すること。
    • MANTRAは,自然言語マニュアルとツールスキーマから,実行可能なコンプライアンスチェックを自動生成する。
    • 生成されたベンチマークは,SMTソルバーによる検証を通して,形式的に信頼性が保証される。
    • 実験の結果,既存ベンチマークと比較して,より厳密な制約が課せられたチェックが生成された。

    Link: https://arxiv.org/abs/2605.06334

  • エージェントループから決定論的グラフへ:再現可能なAIネイティブワークのための実行系統 [cs.AI, cs.MA, cs.SE]目的:AIネイティブワークにおける実行系統の確立
    • AIエージェントの活用は増加の一途を辿っており,そのワークフロー管理が重要課題となっている。
    • 従来のAIワークフローでは,状態管理の曖昧さから,安定した成果物の維持や変更の追跡が困難である。
    • AI生成物の変更管理を可能にし,状態の一貫性を保証することで,AIワークフローの信頼性を向上させる。
    • 実行系統を用いた実験の結果,最終成果物の品質と状態維持の品質は明確に異なることが示された。
    • DAGリプレイは,変更の影響範囲を特定し,関係のない部分への影響を排除することに成功した。
    • ループベースラインでは,最終成果物の品質は維持されるものの,状態の一貫性に問題が残ることが示唆された。

    Link: https://arxiv.org/abs/2605.06365

  • 半径和クラスタリングのパラメータ化近似困難性について(マージ可能な制約付き) [cs.DS]目的:半径和問題のパラメータ化複雑性と効率的なパラメータ化近似スキームの存在の解明
    • クラスタリングは,データ分析や機械学習において基本的なタスクであり,様々な応用分野で重要である。
    • 半径和問題はNP困難であり,効率的な解法は知られていない。特にパラメータ化された複雑さについては未解決な点が多かった。
    • パラメータ化された複雑性の位置付けを明確にし,効率的なパラメータ化近似アルゴリズムの限界を示す。
    • 半径和問題はパラメータkに関してW[2]-困難であることが示され,W階層における位置が特定された。
    • マージ可能な制約の下では,($\frac{8}{3}+\epsilon$)-近似FPTアルゴリズムが得られ,既存の結果を改善した。
    • 適切な割り当てサブルーチンを利用することで,($2+\epsilon$)-近似が達成され,制約なしの場合と同等の性能が得られた。

    Link: https://arxiv.org/abs/2605.06398

  • 制約の劣化:バックエンドコード生成におけるLLMエージェントの脆弱性 [cs.SE, cs.AI]目的:バックエンドコード生成におけるLLMエージェントの構造的制約への対応能力
    • ソフトウェア開発において,機能要件だけでなく,構造的制約の遵守は品質確保に不可欠である。
    • 既存の評価指標は非機能要件を軽視し,構造的に不適切な解を許容してしまう場合がある。
    • 機能要件と構造要件を同時に満たすことの難しさを明らかにすること。
    • LLMエージェントは,構造的制約が加わるにつれて,著しく性能が低下する(制約の劣化)。
    • 高性能な設定であっても,制約が全て指定されたタスクでは,アサーション通過率が平均30ポイント低下する。
    • フレームワークの特性が性能に大きく影響し,Flaskのような明示的なフレームワークでは成功する一方,FastAPIやDjangoのような慣習に基づいたフレームワークでは性能が低下する。

    Link: https://arxiv.org/abs/2605.06445

  • エージェント生成コードはどの程度メンテナンスを必要とするか:経験的研究 [cs.SE]目的:AI生成コードと人間が作成したコードのメンテナンス頻度,人的関与,修正の種類に関する比較分析
    • ソフトウェア開発において,AIエージェントの活用が拡大しており,その品質保証が重要である。
    • AI生成コードの長期的な保守性に関する検討が十分ではなく,実態把握が課題となっている。
    • AI生成コードのメンテナンス特性を明らかにし,保守戦略の策定に貢献すること。
    • AI生成ファイルは人間が作成したコードよりもメンテナンス頻度が低いことが示された。
    • AIコードの修正は機能拡張が中心である一方,人間による修正はバグ修正が中心である。
    • AI生成コードのメンテナンスは,大部分を人間による作業が占めていることが明らかになった。

    Link: https://arxiv.org/abs/2605.06464

  • 関係性の双対性と双シミュレーション [cs.LO]目的:関係性の双対性
    • 論理学の基礎として重要であり,様々な論理体系の意味論的基盤を提供している。
    • 関係やシステム間の双シミュレーションと述語の関係性を明確にする理論的枠組みが不足している。
    • システム間の関係と述語間の関係を対応付けることで,この問題を解決することを目指す。
    • タルスキ双対性とトマソン双対性の関係的な拡張を構築することに成功した。
    • これらの双対性は,異なるシステム間の論理式を関連付ける推論システムを導き出す。
    • 関係を述語に,双シミュレーションを述語間の関係に結びつける枠組みが提供される。

    Link: https://arxiv.org/abs/2605.06533

  • 退化を考慮した量子誤り訂正のためのアフィン部分コードアンサンブル復号 [cs.DC, cs.NI, cs.CL, cs.IT, math.IT, quant-ph]目的:量子低密度パリティチェック符号の復号性能向上
    • 量子コンピュータ実現に向け,誤り訂正技術は不可欠である。安定した計算を保証するため。
    • 量子誤り訂正符号の縮退は,復号アルゴリズムの収束を妨げる要因となる。
    • 縮退の影響を軽減し,量子誤り訂正符号の復号性能を改善すること。
    • チェック行列に線形独立な行を追加することで,有効な縮退解の探索空間を削減できることを示した。
    • 古典的なアフィン部分コードアンサンブル復号技術を量子設定に拡張し,過剰完備行列を採用した。
    • トロック符号や一般化自転車符号のモンテカルロシミュレーションで,収束性と論理的エラーレートの改善が確認された。

    Link: https://arxiv.org/abs/2605.06547

  • 森林における高速減少木和 [cs.CL, cs.DS]目的:森林における減少動的グラフ問題の効率的な解法
    • グラフ理論は,ネットワーク分析や最適化問題など幅広い分野で基盤となる。
    • エッジ削除や重み更新が頻繁に発生する場合,効率的なデータ構造が求められる。
    • エッジ削除のみの状況下での,より高速な処理アルゴリズムの実現を目指す。
    • 頂点重みの和を求めるクエリにおいて,O(n) の前処理時間と O(log* n) の操作時間を実現した。
    • 森林が重みなしの場合は,操作時間を O(1) に改善できる。
    • グループモデルにおいて,最適なアルゴリズムの限界に迫る結果を得た。

    Link: https://arxiv.org/abs/2605.06555

  • 一般化された歪み多変量ゴッパ符号 [cs.IT, math.IT]目的:一般化された歪み多変量ゴッパ符号の理論的検討
    • 符号理論は,情報伝送における誤り訂正に不可欠であり,通信やデータストレージの信頼性を高める。
    • 既存の符号では,十分な誤り訂正能力と効率を両立することが課題となっている。
    • 多変量ゴッパ符号のパラメータに関する知見を深め,より優れた符号の設計に貢献する。
    • 一般化された歪み多変量ゴッパ符号は,多変量Ore多項式の理論に基づいて構築される。
    • 歪みゴッパ符号が,ある条件下で歪みリード・ソロモン符号の劣体部分符号となることが示された。
    • これらの符号の次元と最小距離に関する上限が提供された。

    Link: https://arxiv.org/abs/2605.06580

  • 隠れた凸性:非凸低ランク行列推定のための理論的枠組み [stat.ML, cs.IT, cs.LG, math.IT, math.OC]目的:非凸低ランク行列推定問題に対する理論的枠組み
    • 機械学習やAIにおける高次元データ学習・表現に不可欠な低ランク行列推定は,その重要性が増している。
    • 既存研究では,非凸性の緩和に余計な正則化が必要とされる場合がある。また,汎用性に欠ける。
    • 非凸な手法が低ランク推定で良好に機能する理由を説明する根本的なメカニズムを解明すること。
    • 本研究では,既存の更新ルールを変更せずに,局所的に強い凸性を持つ等価な定式化を得る「良性正則化」を導入した。
    • この視点により,非凸手順に隠された凸性が明らかになり,非凸低ランク行列推定に対する理論的保証を導く新たな道が開かれた。
    • 提案手法は,特定のモデルに依存せず,幅広い低ランク行列推定問題に適用可能な汎用性を持つ。

    Link: https://arxiv.org/abs/2605.05446

  • 軌道誘導型プラグアンドプレイ事前分布による疎な無線マップ再構成 [eess.SP, cs.IT, math.IT]目的:疎な無線マップ再構成における精度向上
    • 環境認識型無線ネットワークにおいて,無線マップ再構成は不可欠な技術である。
    • 移動軌跡に沿った測定データは,空間的に不均一な不確実性をもたらし,再構成精度を低下させる。
    • 軌跡に沿った制約と,その他の領域の制約の弱さを考慮し,再構成精度を向上させる。
    • 提案手法TGPPは,解釈可能な入力空間リスク事前分布と,バックボーンの隠れ表現と融合されるガイド特徴を学習する。
    • TGPPは,既存の再構成バックボーンに追加可能であり,様々なモデルで性能向上が確認された。
    • 実験結果から,軌跡サンプリングはランダムな疎な補間とは大きく異なり,TGPPは最大で43.1%のNMSE削減を達成した。

    Link: https://arxiv.org/abs/2605.05844

  • 幾何平均と完備正写像のLebesgue型分解 [math.OA, cs.IT, math-ph, math.FA, math.IT, math.MP]目的:完備正写像の幾何平均と並列和
    • 量子情報理論や作用素代数において,CP写像は重要な役割を担う
    • CP写像の性質に関する既存の研究は,その全体像を捉えるには不十分である
    • CP写像の幾何平均とLebesgue型分解を確立し,その理論的枠組みを構築する
    • CP写像の幾何平均と並列和を,正半双線形形式の理論に基づいて定義した。
    • 有限次元の場合,CP写像の幾何平均はChoi行列のKubo-Ando幾何平均と一致することが示された。
    • この手法を用いて,サブファクター理論における条件期待値に関する指数型不等式を得た。

    Link: https://arxiv.org/abs/2605.06019

  • 量子f-ダイバージェンスの下での原始チャネルのタイトな収縮率 [math.OC, cs.SY, eess.SY, quant-ph, cs.IT, math.IT]目的:原始チャネルの収縮率の上限
    • 情報理論において,確率分布の変化を評価する上で重要である。
    • 量子チャネルの収縮率を厳密に評価する手法が不足している。
    • 量子f-ダイバージェンスを用いた収縮率の上界を導き出す。
    • 量子f-ダイバージェンスが局所的な逆ピンカー不等式を満たすことを示した。
    • 原始チャネルの定常状態への収縮率は,非可換カイ二乗ダイバージェンスのSDPI定数によって上限される。
    • Petz,Matsumoto,Hirche-Tomamichelのf-ダイバージェンスに適用し,新たな結果を得た。

    Link: https://arxiv.org/abs/2605.06452

  • 因果整合性共有メモリにおける依存保証推論 (拡張版) [cs.PL, cs.LO]目的:因果整合性メモリ下での並行プログラムの推論手法
    • 並行プログラムの安全性確保は重要であり,その検証には形式手法が不可欠である。
    • 従来の依存保証推論は逐次整合性メモリを前提としており,より弱い整合性モデルへの適用が困難であった。
    • 因果整合性メモリという新しいメモリモデルに対する形式的な推論手法を確立すること。
    • 提案手法Piccoloは,各スレッドが到達可能な状態の順序付きシーケンスを指定する新しいアサーション言語を採用している。
    • Piccoloを用いることで,複数のリトマス試験や,因果整合性メモリ向けのピーターソンのアルゴリズムへの適応が可能となった。
    • この研究は,依存保証推論を一般化し,因果整合性メモリに対する最初の推論技術を提供する。

    Link: https://arxiv.org/abs/2305.08486

  • コールバイニードの鏡像:愚かな値の振る舞い [cs.LO]目的:ラムダ計算におけるコールバイニード評価の理解深化
    • 計算機科学の基礎であり,プログラムの評価戦略は効率と表現力に影響する。
    • コールバイネームとコールバイバリューの効率性・表現力のトレードオフが課題である。
    • コールバイニードの特性を理解するため,その対比となる「コールバイシリー」を定義する。
    • コールバイシリー計算において,書き換え特性とマルチタイプを用いた検証が行われた。
    • コールバイシリーとコールバイバリューが同一の文脈的等価性を持つことが示され,コールバイバリューの効率性への無頓着さが明らかになった。
    • コールバイシリー戦略と抽象機械が定義され,その戦略が最大長の評価シーケンスを生成することが証明された。

    Link: https://arxiv.org/abs/2402.12078

  • 二重含意点を用いた拡張分解節学習 [cs.LO]目的:二重含意点における拡張分解節学習アルゴリズムの有効性
    • SATソルバーの性能向上は,組合せ最適化問題など様々な分野で重要である。
    • 既存の分解節学習法では,複雑な問題に対して学習効率が課題となっていた。
    • 二重含意点の概念を導入し,より効果的な分解節学習を実現すること。
    • 提案手法xMapleLCMは,TseitinおよびXOR化された問題において,既存ソルバーを上回る性能を示した。
    • xMapleLCMは,ベースラインのMapleLCMや,Kissat,CryptoMiniSat,SBVA+CaDiCaLといったCDCLソルバーと比較して優位性を示した。
    • 別の拡張分解節学習法であるGlucoseERとの比較分析により,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2406.14190

  • 危機管理のためのエンジニアリング:災害用モバイルアプリケーションのユーザー中心分析 [cs.SE]目的:災害用モバイルアプリケーションの機能,ユーザーからの課題,改善の可能性に関する包括的な分析
    • 災害発生時に,迅速かつ適切な情報伝達は人命保護と被害軽減に不可欠である。
    • 既存の災害用モバイルアプリケーションには,信頼性,使いやすさ,アクセシビリティに関する課題が存在する。
    • 災害対応能力の向上を目指し,より信頼性が高く包括的な災害情報システムの設計を支援する。
    • 分析の結果,多くのアプリケーションが災害対応機能に重点を置いており,備えや復旧の支援は限定的であることが示された。
    • ユーザーからのフィードバックでは,技術的な信頼性,使いやすさ,情報の明確さに関する課題が浮き彫りになった。
    • ライフサイクル指向のデザイン,多言語対応の強化,技術的な堅牢性の向上などが,アプリケーション改善のための重要な要素として提案された。

    Link: https://arxiv.org/abs/2407.08145

  • AutoQ 2.0:量子回路の検証から量子プログラムの検証へ(テクニカルレポート) [cs.LO, cs.FL]目的:量子プログラムの検証
    • 量子コンピューティングの実用化には,プログラムの正当性保証が不可欠である。
    • 既存の検証手法は量子回路に限定され,複雑な量子アルゴリズムの検証が困難であった。
    • 古典制御フローを含む量子プログラムの検証を可能にし,より高度な量子アルゴリズムの検証を目指す。
    • AutoQ 2.0は,測定処理,正規化問題,古典ループの量子世界への拡張といった理論的課題を克服した。
    • ループ不変条件の指定をサポートするなど,入力形式の拡張を含むエンジニアリング上の課題も解決した。
    • AutoQ 2.0を用いて,RUSアルゴリズムと弱測定に基づくGroverの探索アルゴリズムなど,量子回路のみでは表現できない高度な量子プログラムの検証に成功した。

    Link: https://arxiv.org/abs/2411.09121

  • 第一・第二高階依存関係と等式における目標駆動型クエリ応答 [cs.AI, cs.DB, cs.LO]目的:第一・第二高階依存関係と等式における目標駆動型クエリ応答技術
    • 知識ベースに対する質問応答は,情報検索やデータ分析において重要であり,効率的な手法が求められる。
    • 既存のクエリ応答技術では,クエリに関係のない推論が行われ,計算コストが高くなるという課題がある。
    • クエリに必要な推論のみを行い,計算コストを削減することで,効率的な質問応答を実現することを目指す。
    • 提案手法は,入力依存関係を変換することで,クエリに関係のない推論を回避し,計算量を削減する。
    • 特異化技術,関連性分析,マジックセットアルゴリズムの変種を導入し,第二高階依存関係と等式にも対応可能にした。
    • 実験結果から,目標駆動型クエリ応答は,完全な普遍モデルの計算と比較して,大幅に高速であることが示された。

    Link: https://arxiv.org/abs/2412.09125

  • LicenseGPT:公開データセットライセンス遵守のためのファインチューニングされた基盤モデル [cs.SE, cs.AI]目的:公開データセットのライセンス遵守分析
    • AI製品開発において,データセットの利用は不可欠であり,そのライセンス遵守は法的リスクを伴う。
    • データセットライセンスの解釈は曖昧さを伴うことが多く,専門家でも正確な判断が難しい。
    • ライセンス遵守分析の効率化と正確性の向上を目指す。
    • LicenseGPTは,既存の法的FMと比較して,予測一致率を大幅に向上させた。
    • ソフトウェアIP弁護士とのA/Bテストとユーザー調査により,ライセンス分析時間を94.44%短縮することが示された。
    • LicenseGPTは,弁護士による人間の監視が必要とされる場合もあるが,効率向上に役立つツールとして評価されている。

    Link: https://arxiv.org/abs/2501.00106

  • DNAストレージにおけるMDSコード化データからの情報検索の信頼性について [cs.IT, cs.ET, math.IT]目的:DNAストレージにおけるMDSコード化データの情報検索成功確率
    • データ量の爆発的増加に伴い,長期保存媒体への需要が高まっている。
    • DNAストレージは高密度だが,読み取りエラーが発生しやすく信頼性が課題である。
    • MDSコードのパラメータ最適化により,DNAストレージの信頼性を向上させる。
    • 本研究では,内側・外側のMDSコードを組み合わせた設計戦略における,情報検索成功確率を理論的に解析した。
    • 成功確率は,シーケンスリード数,リードの分布,内・外側コードのレート,置換エラー確率に依存することが示された。
    • これらの結果は,信頼性の制約下におけるDNAストレージシステムの最適化に役立つ知見を提供する。

    Link: https://arxiv.org/abs/2502.06618

  • 条件付き独立性の交差性と合成性について [cs.DC, cs.IT, math.IT, math.ST, stat.TH]目的:条件付き独立性の交差性と合成性の性質
    • 確率的推論の基礎であり,特にグラフィカルモデルの分野で重要な役割を果たす。
    • 一般的な確率分布では,これらの重要な性質が必ずしも満たされないという課題がある。
    • 離散確率変数の情報理論的ツールを用いて,これらの性質に対する十分条件を導き出す。
    • 交差性と合成性に関する既知の情報を概観し,例と反例を体系的に提示した。
    • 離散確率変数の文脈において,両方の性質に対する新たな十分条件を導出した。
    • これらの性質を満たすための必要条件と十分条件を明らかにした。

    Link: https://arxiv.org/abs/2504.11978

  • 大規模言語モデルは,意味を保持するコード変異に対する理解において頑健か? [cs.SE, cs.AI]目的:大規模言語モデルのコード理解における頑健性の評価
    • プログラミング支援の普及に伴い,大規模言語モデルの信頼性確保が重要である。
    • 既存研究では,コード理解における推論能力の評価が不十分である。
    • 意味を保持するコード変異に対する大規模言語モデルの脆弱性を明らかにする。
    • 大規模言語モデルは,高い予測精度を示す一方で,意味を保持する変異に対して予測が不安定になることが示された。
    • 専門家による評価では,大規模言語モデルは10〜50%のケースで誤った推論に基づいて正解を導き出していることが判明した。
    • プロプライエタリモデルは優れた精度と推論能力を示すものの,脆弱性分析により,変異に対する脆さが見られた。

    Link: https://arxiv.org/abs/2505.10443

  • 効率的なオンラインランダムサンプリングにおけるランダム性再利用 [cs.DS, cs.DM, cs.IT, math.IT, math.PR, stat.CO]目的:オンラインランダムサンプリングにおけるエントロピーコストの削減
    • 確率的アルゴリズムの効率性は,その応用範囲を大きく左右するため重要である。
    • 既存手法は,多くの場合,無限の空間を必要とするか,固定分布に限定される。
    • ランダム性再利用により,限られた空間で効率的なサンプリングを実現することを目指す。
    • 提案手法は,情報理論的な下限にほぼ近いエントロピーコストでランダム変数を生成できる。
    • 特に,Fisher-Yatesシャッフルや離散ガウスサンプリングにおいて,性能向上が確認された。
    • ランダム性再利用は,確率的アルゴリズムのエントロピーコスト削減に有効である。

    Link: https://arxiv.org/abs/2505.18879

  • TSGuard:クラウド上のAIワークロードに対するユーザー中心のインシデント自動診断 [cs.SE]目的:AIワークロードのインシデント自動診断手法
    • AIの普及に伴い,クラウド上でのAIワークロードの安定運用が重要となっている。
    • インシデント対応がプロバイダー中心であり,解決に時間がかかることが課題である。
    • ユーザー自身で迅速かつ正確なインシデント診断を可能にすることを目指す。
    • TSGuardは,過去のオンコール経験から知識ベースを構築し,構造化された推論と試行錯誤により,専門家のような診断を再現する。
    • Microsoft Azureの実際のインシデント記録を用いた評価で,既存手法を大きく上回る診断精度と検証時間の短縮が確認された。
    • 診断精度は19.8%向上し,検証時間は63.4%削減された。

    Link: https://arxiv.org/abs/2506.01481

  • 木構造をサンプリングせずに木重み付き分割をサンプリングする [cs.DS, cs.DM, math.CO]目的:平面グラフの大きなクラスに対する木重み付き分割のサンプリングアルゴリズム
    • 計算区割り分析の分野で,区割りの公平性を評価する上で,木重み付き分割の分布が重要である。
    • 既存のサンプリング手法は,まず spanning tree をサンプリングする必要があり,計算時間がボトルネックとなっていた。
    • spanning tree のサンプリングをせずに直接分割をサンプリングすることで,計算効率を改善することを目指す。
    • spanning tree をサンプリングせずに木重み付き2分割分布から直接サンプリングできることを示した。受容/棄却率は既存手法と同等である。
    • 特定の平面グラフクラスにおいて,アルゴリズムの期待される計算時間は O(n) であり,既存の spanning tree 生成アルゴリズムよりも高速である。
    • アルゴリズムの実装とベンチマークテストの結果,GerryChain ライブラリの標準的な二分法よりも優れた性能を示した。

    Link: https://arxiv.org/abs/2508.11130

  • 効率的な共形的反事実推論のための合成反事実ラベル [cs.RO, cs.SY, eess.SY, cs.LG, cs.IT, math.IT]目的:個々の反事実結果に対する信頼性の高い予測区間の構築
    • 反事実推論は,因果関係の理解や介入効果の評価に不可欠である。
    • 既存手法では,反事実サンプルが不足すると予測区間が保守的になりすぎる。
    • 治療群の不均衡下でも,より狭い予測区間を提供することを目的とする。
    • 提案手法SP-CCIは,事前学習済みの反事実モデルで生成された合成ラベルを活用する。
    • SP-CCIは,リスク制御型予測集合(RCPS)に基づく共形校正手順と予測駆動推論(PPI)を用いて有効性を保証する。
    • 実験結果から,SP-CCIは標準的なCCIと比較して,予測区間の幅を狭めることが確認された。

    Link: https://arxiv.org/abs/2509.04112

  • 省エネ可動アンテナ:機械的電力モデル化と性能最適化 [cs.IT, eess.SP, math.IT]目的:省エネ可動アンテナシステムの電力消費モデル化と性能最適化
    • 通信品質向上に空間的多様性が重要であり,可動アンテナはその有効な手段となる。
    • 可動アンテナの駆動に伴う機械的電力消費が無視できず,省エネ化が課題となっている。
    • 可動アンテナの配置,移動速度,ビームフォーミングを最適化し,エネルギー効率を最大化する。
    • 提案手法は,従来の固定アンテナシステムや既存の省エネ化手法と比較して,優れた性能を示すことが確認された。
    • 可動アンテナの衝突回避制約を緩和することで,最適化問題を効率的に解くことが可能となった。
    • 可動アンテナの移動速度とエネルギー効率の間には単調性が存在することが明らかになった。

    Link: https://arxiv.org/abs/2509.24433

  • RLVRの最適化ダイナミクス:勾配ギャップとステップサイズ閾値 [cs.LG, cs.AI, cs.IT, math.IT, math.OC, stat.ML]目的:強化学習による検証可能な報酬(RLVR)の最適化プロセスに関する理論的基盤
    • 大規模言語モデルの性能向上は重要であり,そのための効率的な学習手法が求められている。
    • RLVRは実証的な成功を収めているが,その動作原理に関する理論的な理解が不足している。
    • RLVRの収束条件とステップサイズの最適な設定を理論的に解明し,安定性を向上させる。
    • 本研究では,応答空間における低報酬領域から高報酬領域への改善方向を示す「勾配ギャップ」を導入した。
    • 収束は,更新方向と勾配ギャップの整合性に依存し,ステップサイズ閾値を超える場合,性能が低下することが示された。
    • 理論的予測は,Qwen2.5-Math-7Bを用いた実験で検証され,その有効性が確認された。

    Link: https://arxiv.org/abs/2510.08539

  • 進化するテストスイートからの経験的考察 [cs.SE]目的:NetBSDオペレーティングシステムの自動テストスイートの経時的分析
    • ソフトウェアの品質保証において,継続的なテストは不可欠であり,信頼性の高いシステム開発に貢献する。
    • 大規模かつ進化するテストスイートのデータから意味のある知見を得ることは,依然として課題である。
    • 本研究は,長期にわたるテストスイートのデータを分析し,故障の原因と傾向を明らかにすることを目指す。
    • テストスイートは継続的に拡大し,現在では1万件以上のテストケースを網羅していることが確認された。
    • 故障したテストケース,ビルド失敗,インストール失敗は全体的な安定性を示す一方で,一時的に故障頻度が高まる期間も存在した。
    • コード変更やカーネル修正は,故障の統計的な説明として一貫した相関性を示さなかった。

    Link: https://arxiv.org/abs/2511.00915

  • PageRank 計算におけるインスタンス最適性 [cs.DS]目的:PageRank の定数相対誤差および定数確率での推定
    • PageRank はウェブページの重要度を測る指標であり,検索エンジン等で広く利用されている。
    • PageRank 計算の効率化は,大規模グラフにおける処理時間の短縮に繋がる課題である。
    • 特定のグラフ構造に対する PageRank 計算の計算量の下限を明らかにすること。
    • 本研究では,定数次数グラフに対し,双方向アルゴリズムがインスタンス最適であることを証明した。
    • 多項式個の頂点が高次数を持つグラフに対しても,同様の最適性が成立することが示された。
    • 高次数の頂点が多数存在するグラフでは,双方向アルゴリズムは最適ではないことが例示された。

    Link: https://arxiv.org/abs/2512.16087

  • 一階ハイブリッド論理における強制と補間:剛性記号付き [cs.LO]目的:一階ハイブリッド論理の多種類変形におけるクレイグ補間性質の類似物
    • 論理学は,妥当性,推論,形式的な証明の基礎となる。
    • 既存の研究では,空領域を持つモデルにおける補間性質が確立されていない。
    • 強制手法を用いて,クレイグ補間性質を満たすための一般的な基準を導出する。
    • 強制手法を開発し,一貫性を保ちつつ基礎的なシグネチャに新たな定数を動的に追加する。
    • 多種類変形の一階ハイブリッド論理におけるクレイグ補間性質の類似物を確立した。
    • シグネチャ二乗がクレイグ補間性質を満たすための十分条件を導出した。

    Link: https://arxiv.org/abs/2601.08432

  • 任意のユーザ-キャッシュアクセス構造を持つマルチアクセスコーディングキャッシュシステムのための低複雑度フレームワーク [cs.IT, math.IT]目的:任意のユーザ-キャッシュアクセス構造を持つマルチアクセスコーディングキャッシュ(MACC)システムの配信設計
    • キャッシュ技術は,ネットワークの遅延を削減し,ユーザ体験を向上させる上で重要である。
    • 従来のMACCモデルは,構造化されたトポロジーに依存しており,柔軟性に欠ける。
    • 本研究は,任意のアクセス構造を持つMACCシステムの効率的な配信手法を開発する。
    • グラフニューラルネットワーク(GNN)を用いた学習駆動型アプローチにより,理論限界に近い性能を発揮するコーディングマルチキャスト伝送を効率的に構築した。
    • 提案手法は,従来のDSaturアルゴリズムやインデックスコーディング(IC)の限界に迫る性能を,大幅な計算量削減と共に実現した。
    • ICの限界を拡張し,低複雑度な貪欲近似アルゴリズムを提案し,IC限界に匹敵する性能を示した。

    Link: https://arxiv.org/abs/2601.10175

  • エッジ推論におけるチャネル誘起劣化のPAC-ベイズ分析 [cs.IT, cs.LG, math.IT]目的:エッジ推論におけるチャネル誘起劣化の評価と限界
    • エッジ学習は,分散型デバイスで推論を行う新たなパラダイムであり,低遅延やプライバシー保護に貢献する。
    • 無線チャネル経由での推論では,訓練時に未知のチャネル状態が性能劣化を引き起こす。
    • 訓練時の情報不足による性能劣化を理論的に評価し,改善策を提案することを目指す。
    • 本研究では,無線チャネルの確率的性質を考慮した無線汎化誤差を定義し,PAC-ベイズフレームワークを用いてその上限を導出した。
    • 導出された上限に基づき,チャネル情報を活用した訓練アルゴリズムを提案し,その有効性をシミュレーションによって確認した。
    • 提案手法は,様々なチャネル環境下でエッジ推論の性能とモデルのロバスト性を向上させる。

    Link: https://arxiv.org/abs/2601.10915

  • SWE-Pruner:コーディングエージェントのための自己適応的コンテキストプルーニング [cs.SE, cs.CL]目的:コーディングエージェントにおける長文コンテキストの効率的なプルーニング
    • LLMエージェントはソフトウェア開発で有用だが,APIコストと遅延が課題。
    • 既存のコンテキスト圧縮手法は固定指標に依存し,コード理解のタスク固有性を無視する。
    • タスクに応じた動的なプルーニングにより,性能低下を抑制し,効率化を目指す。
    • SWE-Prunerは,人間がソースコードを「選択的に読む」ことに着想を得た自己適応的プルーニングフレームワークである。
    • SWE-Bench Verifiedにおいて,トークン数を23-54%削減し,成功率を向上させた。
    • LongCodeQAでは最大14.84倍の圧縮を実現し,性能への影響を最小限に抑えた。

    Link: https://arxiv.org/abs/2601.16746

  • 量子安全ソフトウェアエンジニアリングに向けて:ポスト量子暗号への移行の展望 [cs.SE, cs.CR]目的:ポスト量子暗号への移行における新たなソフトウェアエンジニアリング課題への取り組み
    • サイバーセキュリティにおいて量子コンピュータの脅威が増大しており,暗号技術の安全性が重要視されている。
    • 既存のソフトウェアツールは,ポスト量子暗号特有の確率的挙動や性能トレードオフに対応できていない。
    • ポスト量子暗号に対応した検出,リファクタリング,検証ツールを開発し,量子安全ソフトウェアエンジニアリングを確立すること。
    • 本研究では,AQuAフレームワークを提案し,ポスト量子暗号に対応したツール開発の方向性を示した。
    • AQuAフレームワークは,PQCに配慮した検出,セマンティックなリファクタリング,ハイブリッド検証の3つの柱で構成される。
    • これにより,量子安全ソフトウェアエンジニアリング(QSSE)を新たな研究分野として確立することを目指す。

    Link: https://arxiv.org/abs/2602.05759

  • テスト駆動型コード生成の理論的分析 [cs.SE, cs.AI, cs.LG]目的:テスト駆動型ソフトウェア開発におけるコードアシスタントの環境インタラクション戦略の理論的メカニズム
    • ソフトウェア開発の効率化と品質向上が求められる中,テスト駆動型開発は重要な役割を担う。
    • コードアシスタントの環境インタラクション戦略の理論的根拠が十分に解明されていない。
    • コードアシスタントの戦略を理論的に分析し,その限界と改善策を提示すること。
    • コード選択におけるヒューリスティクスが,環境を考慮したコード正しさの推定器として形式化された。
    • ファジー関数類似度に基づく推定器は,関数等価性に基づくものよりも信号対雑音比が優れていることが証明された。
    • バックプロンプティングは,コンテキスト内でのトムソンサンプリングの近似として捉えられ,タスク記述の曖昧さによる限界が理論的に説明された。

    Link: https://arxiv.org/abs/2602.06098

  • バンドリミットグラフデータの単一ショットノイズシェイピングによる信頼性の高い1ビット量子化 [cs.IT, math.IT]目的:バンドリミットグラフデータの量子化における情報保持
    • 自然科学や機械学習において,グラフデータは不可欠な存在であるため,効率的なデータ処理が重要である。
    • グラフデータの量子化は,情報損失を伴うため,低ビット量子化下での情報保持が課題となる。
    • 本研究では,単一ビットを含む任意のビットレベルでの信頼性の高い量子化手法を提案し,その問題を解決する。
    • 提案手法は,低パスフィルタリング下での情報保持性能において,最先端の結果を達成した。
    • 既存手法とは異なり,単一ビットへの量子化を含む,任意のビットレベルに対応可能である。
    • 厳密な誤差限界も導出され,量子化の信頼性が保証された。

    Link: https://arxiv.org/abs/2602.08669

  • AIコーディングエージェントの比較:プルリクエスト受容のタスク層別分析 [cs.SE]目的:AIコーディングエージェントのプルリクエスト受容率
    • ソフトウェア開発においてAIの活用が急速に進む中,その効果を定量的に評価する重要性が高まっている。
    • AIエージェントの性能はタスクの種類によって異なり,その特性を詳細に把握することが課題となっていた。
    • 異なるタスクタイプにおける各エージェントの性能を比較し,AI導入の指針を示す。
    • Devinは,32週間でプルリクエスト受容率が週あたり0.77%増加し,唯一一貫した改善傾向を示した。
    • プルリクエストのタスクタイプが受容率に大きく影響し,ドキュメントタスクは新機能タスクより16%高い受容率を達成した。
    • OpenAI Codexは全9つのタスクカテゴリで高い受容率を示し,特定のカテゴリにおいて他のエージェントよりも統計的に有意に優れていた。

    Link: https://arxiv.org/abs/2602.08915

  • セマンティック通信におけるレート-歪み-複雑さのトレードオフ [cs.IT, cs.AI, math.IT]目的:セマンティック通信におけるレート-歪み-複雑さのトレードオフの解明
    • 情報伝達の効率化が求められる現代において,意味に着目した通信が重要性を増している。
    • 深層学習モデルの複雑さにより,計算コストが増大し,リソース制約下での実用化が課題となっている。
    • 意味距離とモデル複雑さの制約下における最小達成レートを理論的に導出し,トレードオフを明確化する。
    • 提案手法は,従来のレート-歪み理論を拡張し,意味距離と複雑さの制約を考慮したフレームワークを構築した。
    • 理論的結果から,達成可能なレート,意味距離,モデル複雑さの間に根本的なトレードオフが存在することが示された。
    • 実世界の画像・動画データを用いた実験により,提案手法の有効性と情報理論的複雑さの有用性が検証された。

    Link: https://arxiv.org/abs/2602.14481

  • 指数正則関数 [cs.FL, cs.LO]目的:指数正則関数のクラスの定義と性質の調査
    • 文字列処理の理論において,関数がどのような計算能力を持つかを理解する上で重要。
    • 多項式成長する関数はよく研究されているが,指数成長する関数については未解明な点が多い。
    • 指数正則関数という新しい関数クラスを定義し,その性質を明らかにすることで,計算能力の範囲を拡張する。
    • 指数正則関数をMSO集合解釈,yield-Hennie機械,Ariadne変換器の3つのモデルで定義した。
    • MSO集合解釈からyield-Hennie機械への変換を確立し,MSO集合解釈が正則性を反射することを示した。
    • Ariadne変換器とMSO集合解釈の同値性を証明し,自動構造に関する長年の未解決問題を解決した。

    Link: https://arxiv.org/abs/2602.21019

  • より安全なエージェントのための追跡機能 [cs.AI, cs.PL]目的:AIエージェントの安全性確保
    • AIエージェントの現実世界とのインタラクションが高度化する中で,安全性は重要な課題となっている。
    • ツール呼び出しを通じて悪意のある操作や情報漏洩,意図しない副作用が発生するリスクが存在する。
    • 能力ベースの安全ハーネスにより,これらのリスクを軽減し,安全なAIエージェントを実現すること。
    • Scala 3の型システムとキャプチャチェックを活用することで,きめ細かいアクセス制御が可能となる。
    • 能力を追跡することで,副作用のない局所的な純粋性を実現し,機密データの情報漏洩を防ぐことができる。
    • 実験の結果,能力ベースの安全ハーネスはタスクパフォーマンスを損なうことなく,安全性を確保できることが示された。

    Link: https://arxiv.org/abs/2603.00991

  • エージェントAIにおける障害の特性評価:種類,症状,根本原因の分類 [cs.SE]目的:エージェントAIシステムにおける障害の分類
    • AI技術の発展に伴い,自律的に行動するエージェントAIの重要性が増している。
    • 既存の障害分類では,LLM基盤の複雑なエージェントAIの障害を捉えきれない。
    • エージェントAIシステムの障害の根本原因を特定し,信頼性向上に貢献する。
    • 40リポジトリから13,602件のIssue/PRを収集,385件を分析し,障害の種類,症状,根本原因の分類を導出した。
    • 障害は,構造化出力解釈,ツール呼び出し,実行時,例外処理の失敗として現れ,データスキーマの不一致などが根本原因として特定された。
    • 開発者調査の結果,本分類はエージェントAIの障害を代表しており,マルチエージェント協調や可観測性に関する改善提案があった。

    Link: https://arxiv.org/abs/2603.06847

  • カノニカルシャッフル実験における成長するアルファベット:尤度比の法則,推定限界,低予算等変設計 [cs.IT, math.IT]目的:有限出力ε_0-LDP d進チャネルにおける,アルファベットの増加に伴う頻度推定とメカニズム設計
    • プライバシー保護技術は重要であり,データ分析における個人情報保護のニーズに応える。
    • 既存手法では,プライバシー保護とデータ有用性のトレードオフが課題となっていた。
    • 尤度比の法則に基づき,低予算で効率的なプライバシー保護メカニズムを構築する。
    • カノニカルシャッフル実験が,尤度比の法則によって生成される商多項式実験と同等であることが示された。
    • アルファベットの増加が,カノニカルシャッフルプライバシーを向上させる条件が明らかになった。
    • 低予算環境下では,拡張されたGRRが置換等変チャネルにおいて最適であることが示された。

    Link: https://arxiv.org/abs/2603.18080

  • 圧縮Transformerにおける構造的感受性:相対誤差の伝播と層の削除 [cs.LG, cs.AI, cs.CL, cs.LO]目的:Transformerの圧縮における誤差伝播と層削除の影響の分析
    • 大規模言語モデルの利用拡大のため,計算コストの削減が重要課題となっている。
    • Transformerの圧縮はモデルの精度低下を招く可能性があり,その誤差の蓄積が課題である。
    • 誤差伝播の構造を理解することで,効率的なモデル圧縮手法を開発する。
    • 各層における誤差の増減比 (rho) を計測し,誤差が下流層にどのように伝播するかを定量化した。
    • rhoの値が層削除の順位付けに有効であり,既存手法よりも高い性能を達成した。
    • 層内および層間の圧縮において,構造的感受性を考慮した手法が重要であることが示された。

    Link: https://arxiv.org/abs/2603.20991