arXiv雑要約

プログラム - 2025/10/14 公開

  • 開発者指示とコード補完の架け橋:指示を意識したFIMパラダイム [cs.SE]目的:開発者指示とコード補完を効果的に連携させる手法の開発
    • コード補完は開発効率向上に不可欠だが,LLMでは意図が不明確な場合に性能が低下する。
    • 既存のコードLLMは,開発者による意図を示すコメントなどを十分に活用できていない。
    • FIMの性能を維持しつつ,開発者指示を効果的に活用できるコード補完モデルを構築する。
    • 提案手法IFIMは,Deepseek-CoderおよびQwen2.5-Coderといったベースモデルに適用することで,指示追従能力を大幅に向上させる。
    • HumanEval-infillingおよびRepoMasterEvalベンチマークにおいて,Pass@1スコアを84.6%から93.6%へと改善した。
    • 指示がないFIMコード補完タスクにおけるモデルの元の性能を損なうことなく,この改善を実現した。

    Link: https://arxiv.org/abs/2509.24637

  • AP2O:適応的漸進的嗜好最適化による,人間のように型ごとにLLM生成コードのエラーを修正 [cs.SE]目的:LLM生成コードのエラー削減
    • プログラミング支援において,LLMの能力向上は生産性向上に不可欠である。
    • LLM生成コードには,コンパイルや実行時エラーが依然として存在する。
    • エラーの種類を考慮した,LLMの段階的な修正能力向上を目指す。
    • AP2O-Coderは,エラーノートブックを構築し,エラーの種類ごとにLLMを最適化する。
    • LLMの弱点に応じてエラーの種類を適応的に再学習させることで,精度向上を図る。
    • 0.5Bから34Bのパラメータを持つLLMにおいて,pass@kが最大3%改善されることを確認した。

    Link: https://arxiv.org/abs/2510.02393

  • 一様ランダム弧の下での低リソースアルボrescence森林 [cs.DS, cs.DM]目的:最大弧カーディナリティのアルボrescence森林の維持
    • ネットワークフローや最適化問題において,アルボrescenceは重要な構造である。
    • 動的に弧が挿入される状況下でのリソース(弧の変更数)最小化が課題である。
    • 一様ランダムな弧到着モデルにおける効率的なアルゴリズムを開発する。
    • 敵対的な弧到着シーケンスでは,Ω(m⋅n)のリソースが必要となることが示された。
    • 一様ランダムな弧到着の場合,期待リソースはO(m⋅log^2 n)であるアルゴリズムが提案された。
    • アルボrescence森林の動的維持におけるリソース削減の可能性を示唆する。

    Link: https://arxiv.org/abs/2510.02950

  • 多用者大規模MIMOにおける決定木を用いた悪意のあるパイロット汚染の検出 [cs.CR, cs.IT, cs.LG, eess.SP, math.IT]目的:悪意のあるパイロット汚染の検出
    • 5G/6G等の現代無線通信システムにおいて,大規模MIMOは不可欠な技術である。
    • 大規模MIMOは,アクティブな盗聴攻撃に脆弱であり,特にパイロット汚染攻撃は深刻な問題となる。
    • 本研究は,基地局におけるパイロット汚染攻撃の検出手法を確立し,その有効性を検証することを目指す。
    • 決定木を用いた手法は,古典的な尤度比検定よりも優れた検出性能を発揮することが示された。
    • 特に,ノイズの多い環境や,悪意のあるユーザが低出力で送信する場合において,その効果が顕著である。
    • 決定木は,尤度比検定が要するノイズ電力や信号電力に関する事前知識を必要としない。

    Link: https://arxiv.org/abs/2510.03831

  • マルチモーダルマルチタスク意味通信:分散情報ボトルネックの視点 [cs.IT, cs.LG, math.IT]目的:マルチモーダルマルチタスク意味通信における効率的な意味伝達
    • 通信効率の向上とインテリジェントな通信システムの実現が求められている
    • 既存方式では,送信側が全モーダルデータを活用し,受信タスク全てに参加する必要がある
    • 物理的制約下での冗長な伝送を抑制し,通信レートと推論品質のトレードオフを最適化する
    • 提案手法PoM$^2$-DIBは,分散情報ボトルネック理論を拡張し,最適なモーダル選択を実現する。
    • PoM$^2$-DIBは,物理的制約を考慮しながら,タスク参加に必要なモーダルのみを選択する。
    • 実験結果から,PoM$^2$-DIBはフル参加型ベースラインと比較して高い推論品質を達成することが示された。

    Link: https://arxiv.org/abs/2510.04000

  • 曲線ブール論理:命題論理の文脈的一般化とアルゴリズム的帰結 [cs.LO, cs.AI, cs.CC, quant-ph]目的:曲線ブール論理の形式化と,その複雑性,運用演算子,およびノイズへのモデル化
    • 従来のブール論理の限界を克服し,より柔軟で表現力豊かな論理体系を構築する重要性。
    • 矛盾や曖昧さの存在が,既存の論理システムにおける推論や意思決定の妨げとなっている。
    • 文脈依存の真理値割当を許容することで,より現実的でロバストな論理推論を可能にする。
    • 曲線ブール論理(CBL)は,局所的な真理値割当を許容することで命題論理を一般化している。
    • CBL-SATはNP完全であることが示され,CBL-ACとCBL-CONSといった運用演算子が矛盾の早期排除に貢献する。
    • iid,AR(1)相関,敵対的摂動といったノイズモデルを導入し,ベンジャミニ・ホッホバーグFDR制御による有意性評価を行った。

    Link: https://arxiv.org/abs/2510.04716

  • FreshBrew:Javaコード移行におけるAIエージェントの評価ベンチマーク [cs.SE, cs.AI]目的:Javaコードの移行におけるAIエージェントの性能評価
    • ソフトウェア開発において,コードの移行は常に必要であり,技術革新に不可欠である。
    • 従来の移行手法はルールベースであり,人的介入が必要で,効率と信頼性に課題がある。
    • LLMを活用したAIエージェントの有効性を厳密に評価し,信頼性の高いコード移行システムを開発する。
    • FreshBrewベンチマークを用いて,228のJavaリポジトリでAIエージェントの性能を評価した結果,Gemini 2.5 Flashが52.3%のプロジェクトをJDK 17に移行できた。
    • AIエージェントは,テストカバレッジの高いプロジェクトでプログラムの意味を保持し,報酬ハッキングを回避する能力が重要であることが明らかになった。
    • 本研究は,現実的なJavaモダナイゼーションタスクにおけるAIエージェントの課題を明らかにし,信頼性の高いコード移行システムの評価基盤を提供する。

    Link: https://arxiv.org/abs/2510.04852

  • 量子コンピューティング・アズ・ア・サービス:ソフトウェアエンジニアリングの視点 [cs.SE]目的:量子コンピューティング・アズ・ア・サービス (QCaaS) を実現するためのソフトウェアエンジニアリング的アプローチ
    • 量子コンピューティングは,従来の計算機では困難な問題を解決する可能性を秘めており,科学技術の発展に大きく貢献しうる。
    • 量子コンピューティングの利用は,専門知識や高価なハードウェアが必要であり,普及の妨げとなっている。
    • 量子コンピューティング資源をサービスとして提供することで,より多くの人々が量子コンピューティングを利用できるようにすること。
    • 本研究では,体系的な文献調査とアーキテクチャに基づいた開発を通じて,量子サービス開発ライフサイクルの段階を特定した。
    • その結果,量子サービス開発ライフサイクルは,概念化,モデリング,アセンブリ,デプロイメントの4つの段階で構成されることが明らかになった。
    • また,量子コンピューティング固有の要件,モデリング表記法,パターンカタログ,プログラミング言語,デプロイメントプラットフォームを統合した階層化された参照アーキテクチャを提案した。

    Link: https://arxiv.org/abs/2510.04982

  • 正確な因果注意機構:演算数を10%削減 [cs.CL, cs.LG, cs.DM, cs.DS]目的:演算数を10%削減した正確な因果注意機構の計算手法
    • Transformerモデルの性能向上は,注意機構の効率化に大きく依存する
    • 従来の注意機構計算は,計算コストが高いという課題があった
    • 演算数を削減し,計算効率を高める新たな注意機構を開発すること
    • 本研究では,Strassen法に着想を得たECA(Exact Causal Attention)を提案した
    • ECAは,上三角または下三角行列を含む特定の行列積の演算数を10%削減する
    • GPUにおけるFlashAttentionのような融合カーネルは高速化できないが,計算資源が限られた環境で有用である

    Link: https://arxiv.org/abs/2510.05175

  • 近似最近傍探索のための高速収束近接グラフ [cs.DS]目的:近似最近傍探索における効率的なインデックス構造
    • 高次元データにおける類似検索は,情報検索や機械学習の基盤技術である。
    • 既存の近接グラフ法は,最悪ケースの検索精度が理論的に保証されていない。
    • 本研究は,理論的保証付きの高速な近似最近傍探索を実現する近接グラフを提案する。
    • 提案手法であるα-収束グラフ(α-CG)は,シフトスケールされた三角形不等式を用いたエッジ刈り込み規則により,効率的な近接グラフ構築を実現する。
    • α-CGは,データセットの固有次元が制限されている場合,正確な最近傍を多項式対数時間で検索できる。そうでなければ,近似最近傍を同じ時間で探索可能である。
    • 実データを用いた実験により,提案手法であるα-収束近傍グラフ(α-CNG)が既存の近接グラフよりも優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2510.05975

  • 大規模言語モデルを活用したサイバーセキュリティリスク評価 - 林業サイバーフィジカルシステムの事例 [cs.SE, cs.AI, cs.CR]目的:サイバーセキュリティリスク評価の支援
    • 安全が重要なシステムにおいて,サイバーセキュリティは不可欠であり,リスク評価はその中でも重要である。
    • サイバーセキュリティ専門家が不足しているため,専門家の負担が増大し,エンジニアがセキュリティ業務を担う必要が生じている。
    • サイバーセキュリティ専門家とエンジニアのリスク評価を支援し,脆弱性と脅威を評価するツールを提供する。
    • 大規模言語モデルが初期リスク評価の生成,脅威の特定,冗長性チェックを通じて,サイバーセキュリティ専門家を支援できることが示された。
    • データの保護とプライバシー要件を遵守しながら,林業分野におけるリスク評価の支援が可能であることが確認された。
    • 生成能力への完全な依存ではなく,特定の評価と支援役割において,専門家が大規模言語モデルの利用に意欲的であることが示された。

    Link: https://arxiv.org/abs/2510.06343

  • 重み付き階層構造を持つ人間適合型AIモデルカード [cs.SE]目的:大規模言語モデルの発見と採用を支援する包括的なフレームワーク
    • 大規模言語モデルの急速な発展はイノベーションを加速させる一方で,モデルの選定が困難になっている。
    • 既存のモデルカードは定性的で,厳密なモデル間比較のための定量的な仕組みが不足している。
    • 人間適合型で,技術,倫理,運用上の側面をバランスさせたモデル評価基準を提案する。
    • 包括的な責任あるAIモデルカードフレームワーク(CRAI-MCF)は,静的な開示から実行可能なドキュメントへの移行を可能にする。
    • CRAI-MCFは240のオープンソースプロジェクトの分析に基づき,217のパラメータを8つのモジュールに統合した。
    • 定量的な十分性基準を導入し,統一的なスキームのもとでの厳密なモデル間比較を実現する。

    Link: https://arxiv.org/abs/2510.06989

  • ロボティック・プロセス・オートメーションにおけるルーチンログの正確かつノイズに強い抽出 [cs.RO, cs.SE]目的:ルーチンログの抽出
    • 業務自動化の実現には,人的資源が行う定型的な作業のモデル化が不可欠である。
    • 既存研究は,ルーチンを構成する行動の抽出に留まり,モデル発見を直接的に可能にするルーチンログの提供に焦点を当てていない。
    • 不規則なルーチン実行(ノイズ)が存在する状況下でも,より正確なルーチンログの抽出を目指す。
    • 提案手法は,既存手法と比較して,より正確なルーチンログを抽出できることが,複数のUIログを用いた実験で示された。
    • 特に,ノイズが存在する状況下では,その効果が顕著である。
    • 本研究は,ルーチンログ抽出技術の向上に貢献し,ロボティック・プロセス・オートメーションの発展を支援する。

    Link: https://arxiv.org/abs/2510.08118

  • クリビング符号化器を持つ量子多重アクセスチャネル [quant-ph, cs.IT, math.IT]目的:量子多重アクセスチャネルにおけるクリビング符号化器を用いた通信
    • 量子情報理論は,古典情報理論の限界を超え,新たな通信技術の可能性を拓く重要な分野である。
    • 量子多重アクセスチャネルでは,複数の送信者が同時に情報を送るため,干渉の影響が大きいという課題がある。
    • 本研究は,クリビングを利用した量子多重アクセスチャネルの通信容量を明らかにし,効率的な通信方法を提案する。
    • クリビングのノイズモデルを導入し,因果的および非因果的なクリビングシナリオにおける到達可能領域を導出した。
    • ロバストなクリビングの場合,正則化された容量特性を確立し,チャネル入力に関するすべての情報をクリビングシステムが含む状況を分析した。
    • 古典-量子多重アクセスチャネルにおいて,完全なクリビングとノイズのあるクリビングの場合の容量領域をそれぞれ決定した。

    Link: https://arxiv.org/abs/2111.15589

  • アローの不可能定理とゲーデルの不完全性定理の比較対照 [math.LO, cs.LO]目的:アローの不可能定理とゲーデルの不完全性定理間の関係性の解明
    • 数学および計算機科学の根幹に関わる論理的限界の理解を深めることが重要である。
    • 社会選択理論と論理学における不可能性定理間の関連性が明確でなかった。
    • 自己参照システムという概念を用いて,両定理の共通性と相違性を明らかにする。
    • 社会選択理論における不可能性は,自己参照システムが自身の整合性を解釈できないことに対応する。
    • ゲーデルの第一不完全性定理も同様の枠組みで証明された。
    • 両定理は自己参照的パラドックスから生じるものの,そのメカニズムには微妙な違いが存在する。

    Link: https://arxiv.org/abs/2504.06589

  • 古典・量子チャネル識別におけるクエリ複雑性 [quant-ph, cs.IT, cs.LG, math.IT, math.ST, stat.TH]目的:量子チャネル識別に必要なチャネル使用回数の最小数
    • 量子情報理論において,誤り確率の減衰率を評価することが重要である。
    • 必要なチャネル使用回数の評価が十分に行われていない。
    • 目標とする誤り確率を達成するために必要なクエリ複雑性を厳密に評価する。
    • バイナリチャネル識別におけるクエリ複雑性は,逆誤り確率に対して対数的に,チャネル忠実度の負の対数に対して反比例することが示された。
    • 古典チャネル,古典-量子チャネルを識別する場合のクエリ複雑性を正確に特徴付けた。
    • 事前確率を含む量子仮説検定のサンプル複雑性を最適化することで,固定閾値以下の誤り確率におけるクエリ複雑性をより正確に評価した。

    Link: https://arxiv.org/abs/2504.12989

  • k-meansクラスタリングのための,一様サンプリングによる高速な乱数・量子アルゴリズム [quant-ph, cs.DS, cs.LG]目的:k-meansクラスタリングの高速化
    • ビッグデータ分析において,データ量の増大に伴い計算コストが課題となる
    • 従来のk-meansアルゴリズムは,データ数に比例した計算時間を要する
    • 一様サンプリングを用いることで,既存アルゴリズムよりも性能向上を目指す
    • 提案する乱数および量子アルゴリズムは,既存の手法よりも優れた最悪の場合の性能保証を持つ
    • 一様サンプリングにより,k-means問題の対称性を維持し,効率的な計算を可能にする
    • データ点数に対する計算時間の依存性を低減することで,ビッグデータへの適用性を高める

    Link: https://arxiv.org/abs/2504.20982

  • カルマー基本関数の最小置換基盤 [math.LO, cs.CC, cs.LO]目的:カルマー基本関数の生成方法
    • 計算可能性理論において,計算モデルの基礎をなす関数クラスの理解は重要である。
    • 既存の研究では,カルマー基本関数の生成に必要な演算の最小性が不明確であった。
    • 本研究は,カルマー基本関数生成の最小置換基盤を明らかにすることを目的とする。
    • カルマー基本関数は,加算,整数剰余,2進指数演算によって誘導的に生成できることが示された。
    • この演算による置換基盤が最小であることも証明された。
    • 演算の次数に関する制約下での代替置換基盤についても議論された。

    Link: https://arxiv.org/abs/2505.23787

  • Zak-OTFSを用いた瞬間偏波測定 [quant-ph, cs.DB, eess.SP, cs.IT, math.IT]目的:瞬間偏波測定の実現
    • 無線通信やレーダーシステムの性能向上に,環境の偏波散乱特性の測定は不可欠である。
    • 既存の瞬間偏波測定法は,時間帯域積の二乗に比例する計算量が必要となる。
    • 時間帯域積にほぼ線形な計算量で瞬間偏波測定を可能にすること。
    • Zak-OTFS変調を用いることで,単一の送信フレームで瞬間偏波測定が可能になった。
    • 提案手法は,比較対象手法よりも計算量が少なく,クラッタに強いことが数値シミュレーションで示された。
    • 理想的な偏波ターゲット検出とパラメータ推定が可能であることが確認された。

    Link: https://arxiv.org/abs/2508.19185

  • マルチンゲール射影と量子デコヒーレンス [quant-ph, cs.IT, math.IT, math.PR]目的:マルチンゲール射影の理論的性質と,開放量子系における応用
    • 確率過程の数学的基礎として重要であり,様々な分野に応用が期待される。
    • 量子系の開放性によるデコヒーレンス現象の理論的理解が十分ではない。
    • マルチンゲール射影を用いて,量子デコヒーレンスと情報量の増大の関係を明らかにする。
    • 超/準マルチンゲール射影を用いることで,密度行列の変化がデコヒーレンスと関連することを示した。
    • 系と環境の相互作用が準マルチンゲール射影を示す場合,Shannon-Wiener情報量が増加することが示された。
    • 開放量子系におけるマルチンゲール射影は,量子デコヒーレンスと情報量の増大の両方を引き起こすことが明らかになった。

    Link: https://arxiv.org/abs/2509.19491

  • 量子相対エントロピーの減衰組成が浅い非構造化k-デザインを生み出す [quant-ph, cs.IT, math.IT]目的:量子情報および計算における局所的ランダム回路が,グローバルなランダム性にどれだけ速く収束するかに関する研究
    • 量子情報分野は,量子コンピュータの性能向上や新しい量子アルゴリズムの開発に不可欠である。
    • ランダム回路の収束速度は,量子コンピュータの効率に直接影響するため,その理解は重要である。
    • 様々な回路構造や連結性において,サブ線形深さでの収束が可能か検証する。
    • 並列ランダム回路の各層における相対エントロピーの減衰がO(1/logn)であることを示した。
    • 有界次数を持つ一般の連結性グラフにおいて,O(1/nlogn)の減衰が確認された。
    • これらの結果から,O(polylog(n))深さのランダム回路アンサンブルが近似k-デザインを達成することが示された。

    Link: https://arxiv.org/abs/2510.08537