arXiv雑要約

プログラム - 2026/06/05 公開

  • 拡散言語モデルの損失なしピクセルレベル画像伝送への適応 [cs.IT, cs.AI, math.IT]目的:損失なし画像伝送のための拡散モデルに基づく離散的ソース・チャネル符号化フレームワーク
    • 画像伝送は情報伝達の根幹であり,高画質・高効率な伝送技術が求められている。
    • 従来の画像伝送方式では,ノイズ環境下での正確な画像復元が困難である。
    • 本研究では,拡散言語モデルを用いて,ノイズ環境下でも損失なく画像を伝送する手法を提案する。
    • 提案手法DDM-SSCCは,CIFAR10,DIV2K-LR-X4,Kodakデータセットにおいて,既存の損失なし・意味的通信手法よりも優れた正確な復元性能を示す。
    • 双方向アテンションを用いたピクセル・トークン復元と同期型逆算術符号化により,効率的な符号化を実現。
    • ハルトンガイド型ノイズ除去順序,マスク比率を考慮したコサインスケジュール,軽量な温度較正モジュールが,性能向上に貢献。

    Link: https://arxiv.org/abs/2606.06273

  • ソフトウェアモデリング教育におけるドメインの多様性,動機づけ,包容性,およびフィードバック [cs.SE]目的:ソフトウェアモデリング教育における動機づけ,関与,包容性,およびフィードバックへの影響
    • ソフトウェアモデリングは現代のソフトウェア開発において不可欠であり,効果的な教育が重要である。
    • 従来の教育研究はツールや記法に偏っており,学習体験を形成するドメイン選択への注目が不足していた。
    • 学生の動機づけを高め,包容性を向上させるドメイン選択方法の指針を示す。
    • 学生は社会に関連性の高いドメインに最も動機づけられ,選択肢があることを好む傾向がある。
    • 教育者は学習に関連するドメインへの学生の関心を過大評価する傾向があることが判明した。
    • わずかな設計上の選択が学生を排除する可能性があり,フィードバックは行動に移される場合に有益であると認識されている。

    Link: https://arxiv.org/abs/2606.06275

  • 裁判官以上の役割:クラウドソーシングテスト評価におけるエージェントと人間の相互作用に関する実証研究 [cs.SE]目的:クラウドソーシングテストにおける報告書の質的改善
    • ソフトウェア開発における品質保証は重要であり,クラウドソーシングテストはその効率的な手法として注目されている。
    • クラウドソーシングテストでは,報告書の量が多く質にばらつきがあるため,開発者のレビュー負担が大きいという課題がある。
    • エージェントによる評価とフィードバック提供を通じて,報告書の品質改善と効率化を目指す。
    • エージェントが生成したフィードバックは,報告書の即時的な改善に貢献することが示された。
    • 先行するフィードバック経験は,新しいタスクにおける初期提出物の質を向上させることが確認された。
    • ある程度の知識移転が確認され,後続のアプリケーションへの応用も示唆された。

    Link: https://arxiv.org/abs/2606.06301

  • タングラム:効率的なマルチターンLLMサービングのための非一様KVキャッシュの解放 [cs.LG, cs.SE]目的:マルチターンLLMサービングにおける非一様KVキャッシュの実用化
    • LLMの性能向上は,対話型AIのユーザビリティに不可欠である。
    • KVキャッシュの線形的な増加が,GPUメモリと帯域幅に大きな負荷をかける。
    • 非一様KVキャッシュの課題を克服し,効率的なLLMサービングを実現する。
    • タングラムは,決定論的な予算割り当てにより,動的なスケジューリングオーバーヘッドとプリフィルストールを排除する。
    • ヘッドグループページングにより,物理メモリの回収を最大化し,メモリ断片化を抑制する。
    • AOTロードバランシングにより,ランタイムオーバーヘッドなしでGPU利用率を均一化し,スループットを最大2.6倍に向上させる。

    Link: https://arxiv.org/abs/2606.06302

  • パトロールに基づくHAPネットワークのための球状確率幾何フレームワーク:カバレッジとエネルギー効率の分析 [cs.CL, cs.IT, math.IT]目的:HAPネットワークにおけるカバレッジとエネルギー効率の解析
    • 高高度プラットフォーム(HAP)は,広範囲な通信サービス提供に有用である。
    • HAPネットワークの効率的な設計・運用には,配置の最適化が課題である。
    • パトロール軌道に基づくHAPネットワークのエネルギー効率を最大化する。
    • 球状確率幾何モデルにより,HAP配置の空間統計量を解析した。
    • カバレッジ確率とエネルギー効率の評価指標を導出し,その関係性を明らかにした。
    • パトロール半径,プラットフォーム密度,巡航速度の最適化が重要であることが示された。

    Link: https://arxiv.org/abs/2606.06307

  • 失敗事例から信頼性の高いLLMエージェントへ:ハーネスの欠陥の診断と修正 [cs.RO, cs.SE, cs.MA]目的:LLMエージェントにおけるハーネスの欠陥診断と修正
    • LLMエージェントの普及に伴い,実行環境やツール連携の重要性が増している。
    • 既存手法では,失敗の原因特定が困難で,広範囲な修正になりがちである。
    • 本研究は,失敗事例に基づいたハーネスの的確な診断と修正を目指す。
    • HarnessFixは,実行トレースとハーネスコードをHTIRに変換し,ステップレベルでの因果関係を解析する。
    • これにより,失敗の原因となるステップとハーネス層を特定し,具体的な修正を行う。
    • SWE-BenchやGAIA等のベンチマークテストにおいて,初期ハーネスより15.2%~50.0%の性能向上を確認した。

    Link: https://arxiv.org/abs/2606.06324

  • 連鎖環上の可逆二重巡回符号 [cs.RO, cs.IT, math.IT]目的:連鎖環上の二重巡回符号の構造
    • 符号理論は,情報伝送やデータ保存における誤り検出・訂正に不可欠である。
    • 二重巡回符号の構造は複雑であり,十分な理解が深まっていない。
    • 可逆性という新たな性質に着目し,二重巡回符号の構造解明を目指す。
    • 長さ $(\gamma,\delta)$ の $\mathbb F_q+u\mathbb F_q, u^2=0$ 上の二重巡回符号の構造が明らかにされた。
    • 二重巡回符号が可逆であるための必要十分条件が導出され,可逆・相補可逆二重巡回符号が研究された。
    • これらの符号を用いて,$\mathbb F_4+u\mathbb F_4, u^2=0$ 上のDNA符号が構成され,最適な符号の存在も示された。

    Link: https://arxiv.org/abs/2606.06367

  • 木構造における時間的マッチング [cs.SI, cs.CL, cs.HC, cs.DC, cs.OS, cs.DS, cs.DM, math.CO]目的:時間グラフにおける最大マッチング問題
    • ネットワーク分析において,時間変化を考慮したグラフ構造の解析が重要である。
    • 時間的グラフにおけるマッチング問題は,計算困難であることが知られている。
    • 木構造という特殊なグラフにおいて,時間的マッチングの効率的な解法を模索する。
    • 時間グラフの木構造における最大$\Delta$-マッチングは,$\Delta\geq 2$の場合でもNP困難である。
    • 最大$\gamma$-マッチングについても同様に,NP困難であることが示された。
    • 特定の条件下では,これらの問題が多項式時間で解けるか,近似アルゴリズムが存在することが示された。

    Link: https://arxiv.org/abs/2606.06439

  • スキャフォールドか,語彙か? ポッパーの反証可能性に基づくコード生成能力に関する,統制された二段階の事前登録研究 [cs.SE, cs.CL]目的:ポッパーの反証可能性に基づくコード生成スキルがコード生成に及ぼす影響の検証
    • 大規模言語モデルによるコードの生成・レビュー・評価が重要視されている。プロンプトによるスキル付与が注目を集めている。
    • プロンプトスキルによる性能向上の評価は,大規模言語モデル自身による評価に依存しており,バイアスが懸念されている。
    • スキルに含まれる反証可能性の内容と,スキャフォールド構造がもたらす効果を分離し,真の性能向上要因を特定する。
    • 最先端モデル(Claude Sonnet 4.6)では,どの条件もベンチマークの天井付近にあり,有意な差は見られなかった。事前登録された5ポイントの改善は支持されなかった。
    • 小規模モデル(Qwen2.5-Coder-0.5B)では,構造化された条件が正答率を20-22ポイント向上させたが,完全なスキルはラベルのみのスキャフォールドと変わらない結果だった。
    • 0.5Bモデルによる自己評価はランダム選択よりも優れておらず,特定のインデックスに偏っていた。スキルに含まれる手続き的な内容は,ラベルのみのスキャフォールド以上の効果はなかった。

    Link: https://arxiv.org/abs/2606.06454

  • Code2LoRA: ソフトウェア進化下におけるコード言語モデルのためのハイパーネットワーク生成アダプタ [cs.SE, cs.AI, cs.CL]目的:コード言語モデルにおけるリポジトリ固有の知識注入手法
    • コード言語モデルの性能は,リポジトリレベルのコンテキストに大きく依存する。
    • リポジトリ規模の大きい環境では,従来のファインチューニングやLoRAがコストや柔軟性の面で課題となる。
    • Code2LoRAは,リポジトリ固有の知識を効率的に注入し,ソフトウェア進化に対応することを目指す。
    • Code2LoRA-Staticは,静的なコードベースの理解において,リポジトリごとのLoRAと同等の性能を達成した。
    • Code2LoRA-Evoは,進化するコードベースにおいて,単一の共有LoRAと比較して,クロスリポジトリの正確な一致率を5.2%向上させた。
    • 本研究で開発されたRepoPeftBenchは,コード言語モデルの評価のための新たなベンチマークを提供する。

    Link: https://arxiv.org/abs/2606.06492

  • grand Motzkinパスとgrand Dyckパスの2-Grayコードの定数償却時間での生成 [math.CO, cs.DS]目的:grand Motzkinパスとgrand Dyckパスの2-Grayコード
    • 組合せ数学において,パスの構造と生成は重要な研究テーマである。
    • 既存の生成アルゴリズムは,計算効率の面で課題があった。
    • 効率的な2-Grayコードの生成方法を確立し,計算コストを削減する。
    • grand Motzkinパスとgrand Dyckパス(エアポケット付き)の初の2-Grayコードが提示された。
    • 提案手法は,パスごとに定数償却時間で生成可能であり,O(n^2)のメモリを使用する。
    • grand Motzkinパスとgrand Dyckパス(エアポケット付き)の枚挙公式も新たに導出した。

    Link: https://arxiv.org/abs/2606.05470

  • Econstellar:計算金融計量経済学のためのオープンソースAI拡張型研究エンジン [econ.EM, cs.SE]目的:計算金融計量経済学研究の再現性と検証可能性の向上
    • 金融経済学研究において,計算能力を必要とする高度な分析が不可欠である。
    • 研究結果が検証困難な形式で公開されることが多く,研究の透明性が課題となっている。
    • 研究主張と独立した検証との間の距離を縮小し,研究の信頼性を高める。
    • Econstellarは,ウェブブラウザ上で金融計量経済学分析を実行し,結果の説明を提供する公開された研究エンジンである。
    • AIアシスタントが分析を選択・解釈するが,数値の生成は常に再現可能な計算に基づいている。
    • 17の計量経済手法を実装し,価格の非定常性を前提としてリターンに対して適用する。金融伝播に関する研究結果の再現も可能である。

    Link: https://arxiv.org/abs/2606.05705

  • 多重量子仮説検定:一次対比較限界と鋭い漸近的性質 [quant-ph, cs.IT, math-ph, math.FA, math.IT, math.MP, math.ST, stat.TH]目的:多重量子状態間の識別における最小誤り確率の上界
    • 量子情報理論は,量子系の情報処理能力を理解する上で不可欠である。
    • 量子状態の識別は,特に高次元空間において困難を伴う。
    • 多重量子状態識別における厳密な限界を確立し,その性能を評価すること。
    • 本研究は,対比較誤りの和に関する次元に依存しない一次上界を確立した。
    • 漸近的多数コピー領域において,多重量子Chernoff距離の達成可能性が示された。
    • 二項量子仮説検定において,最小誤り確率はトレース調和平均で特徴付けられる。

    Link: https://arxiv.org/abs/2606.06246

  • 三角形カットスパース化のための量子アルゴリズム [quant-ph, cs.DS]目的:グラフの三角形数を近似的に保持しつつ,グラフのサイズを削減すること
    • グラフ構造は,クラスタリングやネットワーク分析など,様々な応用において重要な役割を果たす。
    • 大規模グラフにおける三角形の効率的な利用が課題であり,計算コストが問題となる。
    • 三角形カットスパース化を通じて,グラフのサイズを削減し,計算効率を向上させる。
    • 本研究では,頂点数n,辺数m,三角形数tを持つグラフに対し,時間複雑度$\widetilde{O}\bigl(\min(n^{5/4}t^{7/12} + n^{7/6}t^{7/9}, m + m^{3/4}t^{1/2}, n^{3/2}t^{1/2})\bigr)$の三角形リストアルゴリズムを提案した。
    • このアルゴリズムを活用し,サイズ$\widetilde{O}(n/\varepsilon^2)$のε-三角形カットスパースファを時間$\widetilde{O}(T_{\mathrm{q\text{-}list}} + \sqrt{mn}/\varepsilon)$で構築する量子アルゴリズムを設計した。
    • 提案アルゴリズムは,三角形に関連する指標に基づくクラスタリングアルゴリズムへの応用可能性を示し,ε-三角形カットスパースファのサイズに関する下限$\Omega(n/\varepsilon^2)$を証明した。

    Link: https://arxiv.org/abs/2606.06287

  • 量子強化された稀少事象の発見とサンプリング [quant-ph, cs.AI, cs.DS]目的:稀少事象の発見とサンプリング手法
    • 金融崩壊やシステム障害など,稀な事象は社会に大きな影響を与えるため,その予測が重要である。
    • 稀少事象は発生確率が低いため,十分なデータを収集するには膨大な計算資源が必要となる。
    • 未知の稀少事象を効率的に発見し,古典・量子アルゴリズムの課題を克服することを目指す。
    • 本研究では,事前に稀少事象を特定することなく,それらを発見・サンプリングする量子アルゴリズムを提案した。
    • 提案アルゴリズムは,稀少性の閾値に対して最適な量子スケーリングを達成することを示した。
    • 特に,裾が重いシステムや定常確率過程において,それぞれ2次加速と多項式加速が期待できる。

    Link: https://arxiv.org/abs/2606.06316

  • 量子低密度パリティチェック符号の損益分岐点のデモンストレーション [quant-ph, cs.IT, math.IT]目的:量子誤り訂正符号による誤り率低減の実験的実証
    • 量子コンピュータの実現には,量子ビットの誤りを訂正する技術が不可欠である。
    • 従来符号では,高い符号化率とハードウェア実装の容易さを両立することが困難であった。
    • トラップイオン量子コンピュータを用いて,多様な量子符号の実装と性能評価を目指す。
    • qLDPC符号において,4論理量子ビットを18物理量子ビットに符号化する実験で,既存の超伝導量子ビット実装と比較して9倍の誤り率改善を達成した。
    • 一部の符号化例では,量子ビットのコヒーレンス時間において,損益分岐点を超え,物理量子ビットの寿命と同等以上の性能を示した。
    • イオン輸送や冷却イオンを必要としないOMGアーキテクチャにより,トラップイオン量子コンピュータにおける実験効率を向上させた。

    Link: https://arxiv.org/abs/2606.06455

  • 離散トポロジー最適化における製造適性形状への取り組み [cs.MA, cs.IT, cs.NA, math.IT, math.NA]目的:離散トポロジー最適化における製造適性形状の実現
    • 製品の軽量化や性能向上に不可欠であり,構造設計の自動化を可能にする重要な技術である。
    • 最適化結果が複雑な形状となりやすく,製造コストの増大や品質低下の原因となりうる。
    • 製造性を考慮した形状の最適化指標を確立し,製造に適した設計を支援すること。
    • グラフ理論に基づき,形状の規則性を定量化するための指標を開発した。
    • 材料使用量,分布の偏り,製造上の課題となる特徴などを評価できるようになった。
    • 孤立した材料や点結合など,具体的な例を通して本手法の有効性を検証した。

    Link: https://arxiv.org/abs/2503.10133

  • 大規模言語モデルにおけるライブラリとプログラミング言語の選好に関する研究 [cs.SE, cs.AI]目的:大規模言語モデルのライブラリとプログラミング言語の選好
    • コード生成AIの発展は目覚ましいが,設計選択の評価は不十分である。
    • 既存の研究では,ライブラリや言語選択の妥当性に着目した評価が不足している。
    • 大規模言語モデルのライブラリとプログラミング言語の選好傾向を明らかにすること。
    • 大規模言語モデルは広く利用されているライブラリ(NumPyなど)を過度に利用する傾向がある。
    • Pythonがデフォルト言語として強く選ばれる傾向があり,適切な言語でない場合でも選ばれやすい。
    • モデルは,適合性やタスク固有の最適性よりも,慣習や人気を優先することが示唆された。

    Link: https://arxiv.org/abs/2503.17181

  • スタタリングとコンテキストを持つ一般化されたHyperLTLの複雑性 [cs.LO]目的:スタタリングとコンテキストを持つ一般化されたHyperLTLの充足可能性,有限状態充足可能性,モデル検査の複雑性
    • 非同期ハイパープロパティの仕様には表現力豊かな論理が必要であり,従来のHyperLTLではカバーできない
    • HyperLTLでは表現できない非同期ハイパープロパティの仕様が課題となっていた
    • スタタリングとコンテキストを持つ一般化されたHyperLTLの計算複雑性の正確な評価
    • 充足可能性問題は$\Sigma_1^1$-完全であり,HyperLTLのそれと同程度の複雑さであることが証明された
    • モデル検査と有限状態充足可能性問題は,第二階算術における真理と同等であり,HyperLTLよりもはるかに難しいことが示された
    • モデル検査と有限状態充足可能性問題の困難度は,スタタリングまたはコンテキストのみを許容する場合でも変わらない

    Link: https://arxiv.org/abs/2504.08509

  • 最適時間で異なる(非)交差部分文字列を数える [cs.DS]目的:文字列内の,ある位置を含む(または含まない)異なる部分文字列の数を効率的に数える手法の開発
    • 文字列処理は,情報科学における基礎的な問題であり,様々な応用分野で重要である。
    • 既存手法では,全ての文字位置に対して計算を行う場合,計算時間が二乗オーダーとなる場合がある。
    • 一般のアルファベットや線形にソート可能なアルファベットに対して,より高速な計算手法を確立すること。
    • 本研究では,一般のアルファベットに対して,ある位置を含む部分文字列の数を全体でO(n)時間で計算するアルゴリズムを提案した。
    • 線形にソート可能なアルファベットに対しては,ある位置を含まない部分文字列の数もO(n)時間で計算可能である。
    • 特定の計算モデル下では,アルファベットのサイズに応じて最適な計算量を示すことができた。

    Link: https://arxiv.org/abs/2506.22728

  • オープンソースAIにおけるオープンな協調の地図化:14のオープン大規模言語モデルプロジェクトにおける実践,動機,ガバナンスの調査 [cs.SE, cs.AI, cs.LG]目的:オープン大規模言語モデルプロジェクトにおける協調の実践,動機,ガバナンス
    • AI技術の発展において,オープンソースLLMの役割が重要性を増しているため。
    • オープンLLM開発における協調方法が体系的に研究されておらず,理解が不足している。
    • オープンLLMエコシステムの発展を促進するための協調のあり方を明らかにすること。
    • オープンLLMの開発・再利用ライフサイクル全体にわたる協調が,モデル,データ,ソフトウェアなど複数の領域に及ぶことが示された。
    • 開発者の動機は,AIへのアクセス民主化,オープンサイエンスの推進,地域エコシステムの構築など多岐にわたることが明らかになった。
    • オープンソースAIにおける「オープン性」は,協調の組織化によって創出される emergent な特性であることが示唆された。

    Link: https://arxiv.org/abs/2509.25397

  • デジタルガバメントの推進:成熟度指標へのオープンソースソフトウェア活用指標の統合 [cs.SE]目的:オープンソースソフトウェア活用を通じたデジタルガバメント成熟度指標の改善
    • デジタル経済において,OSSはGDPや技術成長に大きく貢献し,相互運用性,主権,透明性を高める重要な役割を担う。
    • 政府におけるOSS導入状況を体系的に測定する手法が確立されていないため,政策立案や評価が困難である。
    • デジタル成熟国におけるOSS政策と支援策を分析し,成熟度指標へのOSS指標導入の可能性を探る。
    • OSSの再利用を促進する政策は広く普及しており,中央官庁が主にその役割を担っている。
    • 政策目標は,相互運用性,デジタル主権,透明性,コスト効率などが挙げられ,セキュリティはリスクと強み両面で捉えられている。
    • OSS活用の能力強化,リソース共有,持続可能なプロジェクトガバナンスを促進するOSPOが,政府の様々なレベルで重要な役割を果たしている。

    Link: https://arxiv.org/abs/2510.04603

  • 知識が重要である:LLMベースの単体テスト生成へのプロジェクトとテスト知識の注入 [cs.SE]目的:LLMベースの単体テスト生成の品質向上
    • ソフトウェアの品質保証において,単体テストは不可欠であり,自動化による効率化が求められている。
    • LLMを用いた単体テスト生成は有望だが,実プロジェクトでのテストの正確性や保守性が課題となっている。
    • プロジェクト固有の知識とテストドメイン知識を統合し,より実用的なテスト生成を目指す。
    • KTesterは,既存のLLMベースの手法と比較して,6つの主要な指標で大幅な改善が見られた。
    • 実行パス率が5.69%向上,行カバレッジが8.83%向上し,テストケース数と生成時間を削減することに成功した。
    • 人間による評価においても,KTesterが生成したテストは,正確性,可読性,保守性の点で高い評価を得た。

    Link: https://arxiv.org/abs/2511.14224

  • 盆栽:剪定された木構造の走査へのクエリのコンパイル [cs.PL, cs.DB]目的:大規模データ集合に対するクエリの最適化手法
    • データ分析において,大量データの高速検索・集計は重要課題である。
    • 既存システムでは,各クエリ述語とデータ構造ごとに剪定ロジックを実装する必要がある。
    • メタデータに基づく剪定条件を自動導出することで,クエリ処理の効率化を目指す。
    • 本手法では,木構造の各ノードで利用可能なメタデータを用いて,部分木の剪定条件を導出する。
    • 記号区間解析と幾何述語に対応する新たな規則を導入し,効率的な条件生成を実現している。
    • 複合クエリを単一の木構造走査に統合することで,高度なインデックス結合を自動的に生成する。

    Link: https://arxiv.org/abs/2511.15000

  • コードペアを超えて:LLM コード翻訳のための対話型データ生成 [cs.PL, cs.AI, cs.SE]目的:LLM コード翻訳のためのデータ生成手法
    • LLMはコード翻訳で高い能力を示すが,リソースの少ない言語や新しいフレームワークでは性能が低下する。
    • FortranやCUDAなど,高品質な並列データが不足していることが課題となっている。
    • 対話型データ生成を通じて,リソース不足な言語やフレームワークの翻訳精度を向上させる。
    • デュアルLLM Questioner-Solverパイプラインにより,Fortran-to-C++で3.64k,C++-to-CUDAで3.93kの対話データを生成した。
    • このデータでファインチューニングした結果,C++-to-CUDAタスクにおいてユニットテストの成功率が56%以上向上した。
    • 生成されたデータを用いることで,7Bのオープンウェイトモデルが大規模な商用システムを上回る性能を発揮した。

    Link: https://arxiv.org/abs/2512.03086

  • 回転アンテナを用いたセルフリー通信 [cs.IT, math.IT]目的:セルフリーシステムにおけるユーザ間の合計レート最大化
    • 無線通信容量向上のため,空間的自由度の活用が重要視されている。
    • 従来のセルフリー通信では,アンテナ配置の自由度が限定されていた。
    • 回転アンテナを活用し,アンテナの指向性を最適化することで,通信性能向上を目指す。
    • 提案手法は,既存のベンチマーク方式と比較して,セルフリーシステムの性能を大幅に向上させる。
    • AP-ユーザ間の関連付けと回転アンテナの指向方向を同時に最適化する二段階戦略を提案した。
    • 分数計画法と逐次凸近似法を用いることで,効率的な指向方向最適化を実現した。

    Link: https://arxiv.org/abs/2512.04742

  • 効率的なコード局所化のための適応的並列実行学習 [cs.AI, cs.SE]目的:効率的なコード局所化のための適応的並列実行戦略
    • ソフトウェア開発の自動化において,コード局所化は重要な課題であり,開発効率に大きく影響する。
    • 並列実行による高速化が期待されるものの,現在のツールは無駄な呼び出しが多く,並列性のメリットを活かせない。
    • ツール効率を考慮した適応的な並列実行戦略を学習することで,コード局所化の性能とコスト効率を向上させる。
    • 提案手法FuseSearchは,SWE-bench Verifiedにおいて,ファイルレベルF1スコア84.7%,関数レベルF1スコア56.4%を達成し,最新技術を上回る性能を示した。
    • FuseSearchは,93.6%の高速化を実現し,従来の67.7%以下のターン数と68.9%以下のトークン数で同様の性能を達成した。
    • 効率を意識した学習が,ノイズの多い冗長なシグナルを排除し,自然に局所化の品質を向上させることが示された。

    Link: https://arxiv.org/abs/2601.19568

  • 引用エラーなしに:IO付きF*プログラムの安全な抽出 [cs.PL, cs.CR]目的:IOとリファインメント型を持つ浅く埋め込まれたF*プログラムを,深い埋め込みの単純型ラムダ計算に安全に抽出するフレームワークの構築
    • 形式検証が可能な言語において,効果を表すモナドを用いた浅い埋め込みが一般的であり,検証されたプログラムを実用的な言語に変換することが重要である。
    • 抽出プロセスは完全には検証されておらず,特に引用の検証は大きな課題である。既存手法では,個々の抽出結果を検証する翻訳検証に頼る。
    • 翻訳検証の適用範囲を,プログラムの型付け導出を構築する関係的引用という最初のステップに限定することで,より安全な抽出を目指す。
    • SEIO*というフレームワークを構築し,F*プログラムを安全に抽出することを可能にした。これにより,高度なセキュリティコンパイル基準であるRrHP(Robust Relational Hyperproperty Preservation)が保証される。
    • RrHPは完全抽象化,トレースプロパティとハイパープロパティの保存,および任意の連結された敵対的コードに対する耐性を含む,非常に強力な基準である。
    • 既存の検証・証明抽出技術は主に正当性に焦点を当てていたが,SEIO*はセキュリティの保証にも着目している点が革新的である。

    Link: https://arxiv.org/abs/2602.19973

  • 公共部門におけるオープンソースプログラムオフィス:共通の組織能力を育成するための類型 [cs.SE]目的:公共部門におけるオープンソースソフトウェア(OSS)の採用,開発,協調を促進するための組織支援機能,すなわちオープンソースプログラムオフィス(OSPO)のあり方
    • デジタル基盤の大部分をOSSが支え,その重要性は増している。公共部門におけるデジタル化推進に貢献しうる。
    • OSSの活用を効果的に進めるための組織的支援体制が確立されていない場合が多い。
    • 欧州における公共部門におけるOSPOの類型を明らかにし,OSPOの設計・運用に関する指針を示す。
    • 本研究では,公共部門OSPOの組織構造,役割,OSS採用への貢献に関する6つの類型を特定した。
    • これらの類型と政策提言は,公共部門がそれぞれの状況や目標に合わせてOSPOを設計するための指針を提供する。
    • OSPOを戦略的取り組みと捉え,OSSの活用を通じて戦略目標の達成,デジタル主権の強化,経済成長の促進に貢献する。

    Link: https://arxiv.org/abs/2603.04891

  • 非対称ストリーム割当とMIMO符号化キャッシュにおける線形復号可能性 [cs.IT, eess.SP, math.IT]目的:MIMO符号化キャッシュにおける非対称ストリーム割当の実現
    • ネットワークにおけるデータ配信効率向上のため,キャッシュ資源の有効活用が重要である。
    • 従来の線形復号可能なMIMO-CC設計は,対称的なストリーム割当に依存し,DoFの粒度が粗い。
    • ユーザー毎のストリーム数を最適化し,DoFの利用効率を改善することを目指す。
    • 本研究では,ユーザー毎のストリーム数を任意に割当てる線形復号可能なMIMO-CC配信について検討した。
    • ストリーム数とマルチキャスト符号語の多重度に基づく十分な復号可能性条件を導出した。
    • 提案する貪欲なマルチキャストスケジューラは,DoFの粒度ギャップを埋め,有限SNRにおけるレートを改善する。

    Link: https://arxiv.org/abs/2603.06534

  • 知識の活性化:エージェント型ソフトウェア開発のための組織知識の基本要素としてのAIスキル [cs.CL, cs.AI, cs.HC, cs.SE]目的:組織知識の提供のためのAIスキルを,構造化され,ガバナンスを意識した原子知識ユニット(AKU)に特化するフレームワーク
    • 企業は重要な組織知識を蓄積するが,その活用が困難である。
    • 組織知識が人間が解釈できる形式で保存されており,AIエージェントが利用できない。
    • AIエージェントが組織知識を効果的に活用し,開発効率を向上させる。
    • 知識活性化フレームワークにより,エンジニアは組織のコンテキストを再構築することなく,組織に基づいたガイダンスを受けられる。
    • AKUは,オンボーディングの圧縮,チーム間の摩擦の軽減,修正カスケードの排除に貢献する。
    • Yahooの導入調査では,開発者体験が大幅に向上し,週あたり2.6時間の節約とNPSが+35となった。

    Link: https://arxiv.org/abs/2603.14805

  • 回転アンテナを用いたモバイルエッジコンピューティング [cs.IT, math.IT]目的:モバイルエッジコンピューティングにおける計算遅延の最小化
    • モバイルエッジコンピューティングは,低遅延サービスを実現する上で重要な技術である。
    • 通信信頼性や計算効率が低遅延サービスを支える上で課題となっている。
    • 回転アンテナを用いて,無線チャネル状況を改善し,計算遅延を削減すること。
    • 提案手法は,従来のベンチマーク手法と比較して,最大計算遅延を大幅に削減できることがシミュレーションにより確認された。
    • MECサーバの計算資源配分,受信ビームフォーミング,回転アンテナの偏角を同時に最適化するフレームワークを開発した。
    • 効率的な交互最適化(AO)フレームワークによって,非凸問題を解決する手法を提案した。

    Link: https://arxiv.org/abs/2603.16275

  • オントロジー制約によるニューラル推論:エンタープライズエージェントシステムにおけるドメインに基づいたAIエージェントのためのニューロシンボリックアーキテクチャ [cs.AI, cs.CL, cs.SE]目的:エンタープライズエージェントにおける,オントロジー制約によるニューラル推論アーキテクチャの提案
    • LLMの企業利用は拡大しているが,幻覚やドメインシフト,規制遵守の課題が存在する
    • 既存システムでは,LLMへの入力は制約されるものの,出力側の検証が不十分である
    • LLMの知識不足を補い,出力の信頼性とコンプライアンスを向上させることを目指す
    • 提案アーキテクチャは,役割,ドメイン,インタラクションの3層オントロジーフレームワークを用いる
    • 実験の結果,オントロジー制約を導入したエージェントは,Metric AccuracyとRole Consistencyで有意な改善が見られた
    • 特に,LLMの学習データが少ないローカライズされたドメインにおいて,その効果は顕著であった

    Link: https://arxiv.org/abs/2604.00555

  • CuTeGen:CuTeを用いた高性能GPUカーネルの生成と最適化のためのLLMベースのエージェントフレームワーク [cs.LG, cs.AI, cs.DC, cs.PF, cs.SE]目的:高性能GPUカーネルの生成と最適化
    • 現代の機械学習システムにおいて,高性能GPUカーネルは不可欠である。
    • カーネル開発は専門知識を要し,手動で行われることが多く,効率が課題である。
    • LLMを活用し,カーネル開発の自動化と性能向上を目指す。
    • CuTeGenは,カーネル開発を生成,テスト,改善の反復的なワークフローとして扱うエージェントフレームワークである。
    • CuTe抽象化層をターゲットとすることで,タイリングやデータ移動などの性能に重要な構造を維持し,反復的な改善を可能にする。
    • KernelBenchのタスクにおいて,PyTorchと比較して平均1.71倍の高速化を達成し,CudaForgeを上回る性能を示した。

    Link: https://arxiv.org/abs/2604.01489

  • 代数的多様性:単一観測からの群論的スペクトル推定 [cs.RO, cs.LG, cs.IT, eess.SP, math.IT]目的:単一観測からの群論的スペクトル推定手法
    • 信号処理や機械学習において,効率的な情報抽出と利用は重要課題である。
    • 従来の多観測に基づく手法では,計算コストやデータ取得の制約が存在する。
    • 単一観測から高精度な推定を可能にし,計算コストとデータ取得の制約を克服すること。
    • 群作用の代数的な性質を利用することで,単一スナップショット推定が多スナップショット共分散推定と同等の性能を発揮する。
    • DFT,DCT,KLTなどの既存手法を群に適合した特殊なケースとして統一的に表現できる。
    • モンテカルロ実験により,提案手法の有効性が確認され,様々な応用分野への展開が期待される。

    Link: https://arxiv.org/abs/2604.03634

  • 2種類のビンパッキング問題に対する多項式および擬多項式アルゴリズム [cs.DS]目的:2種類のビンパッキング問題インスタンスに対する効率的な解法
    • ビンパッキング問題は,資源配分やスケジューリングなど,多くの実用的な問題に応用される重要な最適化問題である。
    • 既存の厳密解法は,Integer Round-up Property (IRUP) に依存しており,その限界を示す新たな問題クラスが提案されている。
    • 提案されたAugmented IRUP (AI) と Augmented Non-IRUP (ANI) クラスの未解決インスタンスに対し,より高速な解法を開発すること。
    • AIクラスのビンパッキング問題に対し,多項式時間アルゴリズムを提案し,全てのインスタンスを既存手法よりも大幅に高速に解くことに成功した。
    • ANIクラスのビンパッキング問題に対し,擬多項式時間アルゴリズムを提案し,全てのインスタンスを高速に解くことを示した。
    • 提案手法は,カットストック問題にも容易に適用可能であり,既存の厳密解法の事前処理ルーチンとしても活用できる。

    Link: https://arxiv.org/abs/2604.05152

  • 分割における相乗効果による時空間統合の定量化 [cs.CL, cs.IT, math.IT]目的:分割された時空間における統合の定量化
    • 意識の神経相関を解明するため,情報統合の定量的評価が重要である。
    • 既存の情報統合指標は,複雑なシステムにおける統合を正確に捉えられていない。
    • 相乗効果に基づいた新たな指標を用いて,情報統合のより適切な定量化を目指す。
    • 相乗効果に基づく指標は,現在のIITの実践よりも適していることが示された。
    • 本研究で提案する指標は,離散力学系の複雑性評価にも応用可能であると考えられる。
    • 情報統合理論の数学的基礎を強化する上で,本研究は貢献すると考えられる。

    Link: https://arxiv.org/abs/2604.18635

  • RAT:完全自動環境構築によるRunAnyThing [cs.SE, cs.AI]目的:リポジトリレベルのソフトウェアエンジニアリングタスク自動化
    • 自律的なコードエージェント実現には不可欠であり,開発効率向上に寄与する。
    • 環境構築は手作業に頼る部分が多く,ボトルネックとなっている。
    • 多様なリポジトリでの完全自動環境構築を可能にすること。
    • RAT(RunAnyThing)は,プログラミング言語を問わず,任意のレポジトリで完全自動化された環境構築を実現するモジュール型エージェントフレームワークである。
    • RATは,言語を意識した抽象化,イメージ初期化,特殊な構成ツールセット,堅牢なサンドボックスを統合した多段階パイプラインを採用している。
    • 実験の結果,RATは既存のベースラインと比較して,環境設定成功率(ESSR)を平均36.1%向上させた。

    Link: https://arxiv.org/abs/2604.23190

  • 公開リポジトリにおけるログベースの検知ルール進化 [cs.CR, cs.SE]目的:ログベースの検知ルール進化の分析
    • 現代のセキュリティ運用において,ログベースの検知ルールは不可欠であり,専門知識を反映している。
    • ネットワーク侵入検知シグネチャの進化は研究されているが,ログベースの検知ルールの経時的な変化は十分に調査されていない。
    • 公開リポジトリにおける検知ルール進化の実態を解明し,セキュリティルール作成・展開プロセスの改善に貢献する。
    • SigmaとSSCの6,859件のルール履歴分析から,約56%のルールが少なくとも1回,検知ロジックにおいて修正されていることが判明した。
    • ルールの進化は非単調性が多く,過半数のルールが時間とともに条件を追加・削除している。
    • 構造分析とLLM推論,人間による検証の結果,約25〜33%のルールがカバレッジ拡大と誤検知削減を繰り返していることが示された。

    Link: https://arxiv.org/abs/2605.05383

  • 勾配が衝突するとき:LLMジャッジのための多目的プロンプト最適化の失敗モード [cs.CL, cs.AI, cs.LG, cs.MA, cs.SE]目的:LLMジャッジの多目的プロンプト最適化における失敗モードの特定
    • LLMを活用した評価の自動化が重要視されているため,その性能向上が求められている。
    • 多目的評価基準に対応したプロンプト最適化手法は未確立であり,課題となっている。
    • テキスト勾配法を多目的設定に拡張し,最適化と推論時の問題点を明らかにすること。
    • 多目的プロンプト最適化において,勾配のタスク焦点が平均59%低下することが示された。
    • 単一目的で最適化された指示を組み合わせた場合,Spearmanのローが0.305から0.220に低下した。
    • 最適化時の勾配希釈と推論時の指示干渉という,二つの分離可能な失敗モードが特定された。

    Link: https://arxiv.org/abs/2605.26046

  • 変換されたものと等価なもの:観測可能な等価性によるコードベース変換のベンチマーク [cs.SE, cs.CL]目的:コードベース変換のベンチマーク
    • 近年,コードベース規模での協調作業を行うコーディングエージェントが重要視されている。
    • エージェントは自身の検証ルーチンを過信し,表面的なチェックは満たしても,ユーザーが重視する意味的な契約に違反する可能性がある。
    • 意味的な等価性を保証する固定された検証基準を用いた,より信頼性の高いコードベース変換ベンチマークを確立する。
    • T2J-Benchベンチマークにより,既存システムはSpecを満たす率が高いにも関わらず,全体的な合格率は低いことが示された。
    • トークン予算を増加させても,合格率の向上は限定的であり,エージェントの自己検証の誤りが主な原因であることが示唆された。
    • 固定された検証基準は,表面的な成功判定よりも信頼性のある評価指標となり得る。

    Link: https://arxiv.org/abs/2605.29054

  • MDS楕円符号の最大長について [cs.IT, math.IT]目的:MDS楕円符号の最大長に関する研究
    • 符号理論は,通信や情報ストレージにおける誤り検出・訂正に不可欠な技術である。
    • 楕円曲線から構成されるMDS符号の最大長決定は,未解決問題として残されていた。
    • 符号の次元や体の特性に応じた最大長の厳密な上限を求める。
    • 本研究により,符号の生成行列の支持が$\mathbb{F}_q$-有理点からなるとき,偶数次元$k$における最大長の上限が明確になった。
    • また,その制限がない場合,偶数次元$k$においても最大長に達するMDS符号の構成が示された。
    • さらに,一般的な場合において,最大長$\operatorname{MEC}(k,q)$の厳密な値を$q+1+\lfloor2\sqrt{q}\rfloor$の偶奇性に応じて決定した。

    Link: https://arxiv.org/abs/2605.29439

  • 仮想プロセッサによる無償の昼食の復活 [cs.PF, cs.DC, cs.PL]目的:数値配列プログラムの自動最適化
    • 科学技術計算の高速化は,シミュレーションやデータ解析の精度向上に不可欠である。
    • 並列化は複雑であり,開発者の負担が大きい。また,ハードウェアへの依存性も高い。
    • 開発者による並列化の設計を不要とし,自動的に並列性を活用することを目指す。
    • 提案手法は,中央集権的なスケジューリングや静的なコンパイラ最適化に依存せず,分散的な実行セグメントのネットワークを用いる。
    • 実行セグメントはローカルな情報に基づいて決定を行い,並列性を自動的に活用し,大規模なプログラム領域でスケーラビリティを実現する。
    • ILNumerics ONALを対象とした実装は,低遅延性と強いスケーラビリティを両立し,ヘテロなハードウェア環境で良好な性能を示す。

    Link: https://arxiv.org/abs/2605.30507

  • エージェントによる知識モデルの生成と進化 [cs.SE]目的:知識モデルの生成と進化に関するビジョン
    • 自律走行車やロボットなど,複雑なシステムは動的な環境と相互作用する。
    • 知識モデルは不完全,不整合,または時代遅れになる可能性がある。
    • 変化への追随とシステムへの信頼性を高める知識モデルを維持する。
    • TrustModelは,モデリング,コンフォーム,進化という3つのエージェントサブシステムで構成される。
    • モデルベーステストへの適用例を示し,他のMDE活動への可能性を議論する。
    • TrustModelは,継続的に進化するソフトウェアシステムの信頼性向上に貢献する。

    Link: https://arxiv.org/abs/2606.03662

  • エンタープライズAIエージェントの事前展開保証:オントロジーに基づいたシミュレーションと信頼性認証 [cs.AI, cs.LG, cs.SE]目的:エンタープライズAIエージェントの事前展開における保証
    • AI技術の企業への導入が進む中,安全性と信頼性の確保が重要課題となっている。
    • AIエージェントの展開後の監視や制御だけでは,十分な保証は得られない。
    • 展開前の検証フレームワークにより,AIエージェントの安全性と信頼性を担保することを目指す。
    • オントロジーに基づいた検証フレームワークを開発し,規制遵守,運用,および敵対的テストシナリオを自動生成するパイプラインを構築した。
    • 金融,銀行,保険,医療の4つの規制業界において,1,800のシナリオを125の規制要件と25のフォールト注入に対して評価した。
    • オントロジーベースのシナリオ生成は,従来のペルソナベースの手法と比較して,規制網羅性(48.3%対33.1%)とドメイン固有性(4.77/5.0)で優れていた。

    Link: https://arxiv.org/abs/2606.04037

  • コンテキストをAIサービスとして:LLM生成型開発者向けドキュメントのクロスファイル依存チェーンの可視化 [cs.SE, cs.IR]目的:LLM生成型開発者向けドキュメントの有用性と正確性を向上させるための,クロスファイル依存チェーンの特定
    • LLMによるドキュメント作成が普及する中で,正確かつ有用なドキュメントの提供が重要となっている。
    • LLMはコンテキストに依存するため,複雑な依存関係を特定することが困難である。
    • コードベース全体を効率的に検索し,LLMが依存関係を追跡できるよう支援すること。
    • Context-as-AI-Service (CAIS)は,LLMエージェントがコードベースから証拠を見つけるための検索層を提供する。
    • APIリファレンスのレビューにおいて,CAISはベースラインと同数の修正を提示し,2つの誤った記述と2つの不足したAPIコメントを発見した。
    • チュートリアル検証では,実行可能なバグ,API使用法の改善,および2つの前提条件の欠如を発見し,ベースラインでは検出されなかった。

    Link: https://arxiv.org/abs/2606.04397

  • 量子パッキング問題に対する誤り指数:演算子レイヤーケーキ定理による [quant-ph, cs.IT, math-ph, math.FA, math.IT, math.MP]目的:古典量子チャネル符号化における1ショットランダム符号化限界
    • 量子情報理論は,古典情報理論の限界を超え,安全通信や量子コンピュータ実現に不可欠である。
    • 古典量子チャネルの信頼性を評価する誤り指数は,高次元ヒルベルト空間で未解決な課題であった。
    • 本研究は,古典量子チャネルの誤り指数を解析的に決定し,様々な量子パッキング問題へ応用する。
    • 本研究で示された1ショットランダム符号化限界は,臨界レート以上の古典量子チャネルにおける最適な誤り指数を与える。
    • 演算子レイヤーケーキ定理を確立し,演算子対数の方向微分が特定の射影の積分表現を持つことを示した。
    • これにより,優れた測定がランダム化されたHolevo-Helstrom測定と同等であり,その優位性の理由が説明される。

    Link: https://arxiv.org/abs/2507.06232

  • 黄金比と安定した自己適用について [math.LO, cs.LO]目的:局所的な自己適用とグローバルな自己証明の境界
    • 計算可能性理論において,自己言及はプログラムの検証や複雑性解析において重要である。
    • グローバルな自己証明は,システムの整合性を保証する上で困難を伴う。
    • 黄金比をモデルとして,局所的な安定性と自己適用の限界を明らかにする。
    • 黄金比は,反復更新ルールにおいて唯一の正の固定点を持つ安定した局所的再帰モデルとなる。
    • 原始再帰的な証明検証と局所的な健全性は,有界なチェックと証拠によって正しさを維持するが,内部的なグローバルな自己反射は実現しない。
    • 本研究では,新たな計算複雑性や決定手続き,または新しい自己反射原理は主張しない。

    Link: https://arxiv.org/abs/2510.08934

  • 滑らかなクエリに対するミニマックス最適差分プライバシー合成データ [math.ST, cs.IT, cs.LG, math.IT, stat.ML, stat.TH]目的:滑らかなクエリに対する差分プライバシー合成データの生成
    • 個人情報保護とデータ活用は相反する課題であり,両立が求められている。
    • 既存手法は汎用性を重視するあまり,実用的な統計量の精度が不十分な場合がある。
    • クエリの滑らかさという追加構造を活用し,合成データの精度向上を目指す。
    • 提案手法は,次数$k$までの導関数を持つ滑らかなクエリに対して,ミニマックス誤差率$O_{k,d}(n^{-\min \{1, \frac{k}{d}\}})$を達成する。
    • この結果は,$k=d$における相転移を明らかにし,Chebyshevモーメントマッチングフレームワークを一般化する。
    • また,滑らかなクエリに対する差分プライバシー合成データの有用性の初のミニマックス下限を確立した。

    Link: https://arxiv.org/abs/2602.01607

  • 凸集合のガウス幅:積分分解,射影,および内在体積の分布による考察 [math.PR, cs.IT, math.IT, math.ST, stat.TH]目的:凸集合 $T$ 上で定義されるカノニカルガウス過程の上限値の期待値の評価
    • ガウス過程は,確率的モデリングや機械学習において重要な役割を果たす
    • 凸集合のガウス幅の厳密な評価は,高次元空間における複雑な形状の解析が困難
    • 内在体積の分布を利用し,ガウス幅をより効率的に評価する手法を開発する
    • ガウス幅の分解を2つ提案。一つはガウスの縮小されたコピーへの射影,もう一つは局所幅に基づく固定点を利用
    • 内在体積とガウス幅の関係を明確化し,ガウス幅が内在体積の「ピーク指標」によって制御されることを示す
    • 最悪の場合,古典的なダドリー積分の局所的な形を再現する境界が得られる

    Link: https://arxiv.org/abs/2603.02714