arXiv雑要約

プログラム - 2026/05/29 公開

半径感度近似アルゴリズムによる接続部分モジュラー最大化 [cs.DS]目的：接続部分モジュラー最大化問題における近似解の効率的な探索
- 無線ネットワーク，経路計画，感染症拡散，癌ゲノム研究など，様々な応用分野を持つ重要な問題である。
- 既存のアルゴリズムでは，近似率が十分でなく，特にグラフの規模が大きい場合に性能が低下する。
- 半径とエッジ数kに対する近似率を向上させ，より実用的な解を得ることを目指す。
- 提案手法は，接続部分モジュラー最大化問題に対し，半径rに関する近似率を改善した。
- 定数εに対し，ε > 0を満たす範囲で，近似率Ω(ε^3 / r^ε)を達成する。
- 有向グラフ版の問題に対しても同様の近似率を達成し，サイズ制約の緩和も可能である。
Link: https://arxiv.org/abs/2605.30053
投影的デコーディング：セマンティクスを意識したLLM生成に向けて [cs.SE, cs.AI]目的：LLM生成におけるセマンティックな妥当性の確保
- ソフトウェア開発における自動化の重要性が高まる中で，LLMの活用が期待されている。
- LLM生成された成果物のセマンティックな正当性を保証することが依然として課題である。
- セマンティクスを生成過程に組み込み，セマンティックに有効な出力を導くことを目指す。
- 投影的デコーディングは，テキストと部分グラフモデルを同時に保持し，セマンティックな検証を可能にする。
- 不確実性を明示的に捉え，エラー検出をサポートすることで，セマンティックに正しい出力へと導く。
- プログラム生成タスクでの予備的な結果は，このアプローチの有効性を示唆している。
Link: https://arxiv.org/abs/2605.30054
ランダム低レート線形符号におけるリスト復元 [cs.IT, math.IT]目的：十分大きな素数体上のランダム低レート線形符号のリスト復元保証
- 符号理論は，情報伝送における誤り訂正の基盤であり，通信やデータ保存の信頼性向上に不可欠である。
- 従来の符号化方式では，低い符号レートにおける効率的なリスト復元が困難であり，実用上の制約となっていた。
- 入力リストサイズに関わらず，リスト復元可能な符号の条件を明らかにし，理論的限界に迫る性能を示す。
- 固定次元$d$，誤り率$\alpha$，精度パラメータ$\varepsilon$に対して，ランダム線形符号は高い確率でリスト復元可能であることが示された。
- リストサイズ$\ell \le 2^{O_{\alpha, \varepsilon, d}(n/\log n)}$ の範囲において，符号は $(\alpha,\ell,\frac{1+\varepsilon}{1-\alpha}\ell)$-リスト復元可能である。
- 次元が2以上の線形符号の場合，リストサイズ$\ell \geq 2^{\Omega_{\alpha, \varepsilon}(n)}$ に対して，リスト復元不可能となる下界が示された。
Link: https://arxiv.org/abs/2605.30101
EvoRepair：経験に基づく自己進化を通して脆弱性修復エージェントを強化する [cs.CL, cs.SE]目的：脆弱性修復における経験の蓄積と再利用
- ソフトウェアの安全性確保は重要であり，脆弱性への迅速な対応が求められる。
- LLMを用いた脆弱性修復は有望だが，経験の蓄積・再利用が不十分である。
- 過去の経験を活用し，LLMの脆弱性修復能力を向上させることを目指す。
- EvoRepairは，PATCHEVALで93.47%，SEC-benchで87.00%の修復成功率を達成した。
- 最新のLLMベースラインLoopRepairと比較して，PATCHEVALで39.56%，SEC-benchで33.50%高い性能を示した。
- モデル，プログラミング言語，データセット間の汎用性もVUL4Jを用いた実験で確認された。
Link: https://arxiv.org/abs/2605.30105
RustからLeanへの検証パイプライン：AIプロバーの活用事例 [cs.LO]目的：Rustの暗号コードの正当性証明をLean 4で機械的に検証するパイプライン
- 暗号コードの安全性確保は重要であり，形式検証はその信頼性を高める手段となる。
- 形式検証は手間と専門知識を要し，その導入障壁が高いことが課題である。
- AIプロバーを活用し，形式検証の効率化と自動化を図ることを目指す。
- パイプラインは，RustコードをLean 4に変換し，暗号ライブラリを用いて検証する。
- AIプロバーAristotleとAlephが，検証に必要な証明を自動的に生成した。
- Plonky3とRISC Zeroの暗号プリミティブに対し，パイプラインの適用と検証に成功した。
Link: https://arxiv.org/abs/2605.30106
ニューラルネットワーク検証における部分多ニューロン緩和 [cs.LO, cs.AI]目的：ニューラルネットワークの安全性特性の形式的保証
- 深層学習の重要システムへの組み込みが進み，安全性確保の理論的・実践的関心が高まっている。
- 既存手法は，厳密性と計算コストのバランスが課題であり，検証完了に必要な精度が得られない場合がある。
- 部分多ニューロン緩和により，検証の効率と精度を向上させることを目指す。
- 提案手法をMarabou検証器に組み込み，既存のバウンディング強化手法と比較して良好な結果が得られた。
- 部分多ニューロン緩和は，検証に必要な精度と計算コストのバランスを取る有効な手段である可能性が示された。
- 選択されたニューロン部分集合に対してのみ多ニューロンバウンドを生成することで，計算効率を向上させている。
Link: https://arxiv.org/abs/2605.30155
統計的公開のためのメンバーシップ推論へのベイズアプローチ [cs.CL, cs.CR, cs.PL]目的：統計的公開データに対するメンバーシップ推論
- プライバシー保護は重要であり，データの統計的公開に伴うリスク評価が不可欠である。
- 既存の攻撃手法は，データ分布の複雑さを十分に考慮できていない場合がある。
- 本研究は，属性間の依存関係を考慮したより効果的な攻撃手法を開発する。
- 本研究では，人口をベイズネットワークとして表現し，攻撃者が属性間の依存構造に関する追加情報を持つ状況を考慮した。
- 提案手法は，ベイズ決定に基づき，人口に関する事前情報を組み込み，より効果的な攻撃を可能にする。
- 実験的に，提案手法は，既存の攻撃手法よりも複雑なベイズネットワーク上で優れた性能を示した。
Link: https://arxiv.org/abs/2605.30203
Metaにおける低リスクなコードレビューの自動化：RADAR，リスク調整，レビュー効率 [cs.SE, cs.AI]目的：AI支援によるコードレビュー自動化システムの導入と評価
- ソフトウェア開発におけるAIの活用が進み，コード生成量が急増している。
- コードレビューのボトルネックが深刻化し，レビューの遅延や品質低下が懸念されている。
- AI生成コードのレビューを自動化することで，レビューの効率化と安全性の確保を目指す。
- RADARは535,000件以上のdiffをレビューし，そのうち331,000件以上を自動承認した。
- Diff Risk Scoreの閾値を緩和することで，承認率は60.31%に向上した。
- RADARでレビューされたdiffのリバート率は非RADARdiffの1/3，本番環境でのインシデント発生率は1/50に減少した。
Link: https://arxiv.org/abs/2605.30208
限界下での有界メモリによる言語生成 [cs.DS, cs.AI, cs.CL, cs.LG, stat.ML]目的：有界メモリ下における言語生成の可能性と限界
- 言語生成は，AIにおける重要な課題であり，自然な文章の自動生成を目指す上で不可欠である。
- 従来の言語生成モデルは，過去の情報を全て保持することを前提としており，現実的なメモリ制約を考慮していない。
- 本研究では，メモリ制約下での言語生成の理論的な限界を明らかにすることを目指す。
- メモリを持たない生成器において，ある条件下では無限の言語集合でも生成可能であることが示された。
- 過去W個の例を保持するスライディングウィンドウでは，最悪の場合の密度は改善されない一方，b個の適応的に選択された過去例を保持することで密度が向上する。
- 限界識別においては，わずかな緩和により，有限な言語集合に対して近似的な解への収束が達成可能となる。
Link: https://arxiv.org/abs/2605.30324
マジョリゼーション格子上の超モジュラリティと劣加法性への前駆 [cs.IT, math.IT]目的：マジョリゼーション格子上の超モジュラリティと劣加法性の性質の根底にある構造的なマジョリゼーション関係
- 情報理論におけるエントロピーは，不確実性の定量化に不可欠であり，その数学的性質の理解は重要である。
- 既存のエントロピー関数に対する超モジュラリティと劣加法性の証明は，しばしば複雑で一般的な手法に欠ける。
- マジョリゼーション関係を用いた前駆的な関係を確立し，より簡潔な証明を提供する。
- 本研究では，マジョリゼーションによって誘導される格子上の超モジュラリティと劣加法性を決定する2つの構造的なマジョリゼーション関係を確立した。
- これらの関係を利用し，ツァリスエントロピーやレーニィエントロピー（α>1）が，格子理論的な意味で超モジュラリティと劣加法性を持つことを示した。
- さらに，これらのエントロピー関数は，マジョリゼーション格子上で厳密に劣加法的であり，ツァリスエントロピー（およびシャノンエントロピー）は厳密に超モジュラリティを持つことを示した。
Link: https://arxiv.org/abs/2605.30331
物理学だけで十分か？物理学者によるAI開発の事例研究 [cs.AI, astro-ph.CO, cs.HC, cs.SE]目的：科学ソフトウェア開発におけるAIエージェントの役割評価
- 科学研究におけるAIの活用は，研究効率の向上や新たな発見の可能性を秘めている。
- AIエージェントは，既存の枠組み最適化に終始し，根本的な解決策を見出すことが困難な場合がある。
- 本研究は，物理学者の監督下でAIエージェントが科学ソフトウェアを開発する過程を分析し，信頼性を高める方法を探る。
- AIエージェントは，テストに合格するものの，物理的に意味のない修正を行う事例が確認された。
- 物理学者の介入により，AIエージェントはアーキテクチャの再設計や不適切な修正の置き換えを行った。
- AIの信頼性を確保するには，アーキテクチャの提案能力や物理的妥当性の判断能力が必要であることが示された。
Link: https://arxiv.org/abs/2605.30353
異種帯域幅予算下におけるFederated Probe-Logit Distillationの照合率と最適な割り当て [stat.ME, cs.PF, math.PR, stat.ML, cs.IT, cs.LG, math.IT]目的：異種帯域幅制約下におけるFederated Probe-Logit Distillationのレートと最適な割り当て
- 分散環境での言語モデル構築は，データ集中が困難な場合に有効であり，プライバシー保護にも繋がる。
- 各ノードの帯域幅が異なる場合，効率的な通信とモデル精度のバランスを取ることが課題となる。
- 帯域幅制約下での最適なレートを確立し，異種帯域幅環境に適した割り当て戦略を提案すること。
- 提案手法は，単一ラウンドの照合率下限と一致し，帯域幅依存項のレートが最適であることが示された。
- 複数ラウンドの逐次改良では，帯域幅項の最適化が重要であり，その上限が確立された。
- 最適な割り当ては，対数傾斜ウォーターフィリング則に従い，均一割り当てや逆重み割り当てよりも優れていることが確認された。
Link: https://arxiv.org/abs/2605.29642
時間系列分析におけるエントロピーと代数的転写に基づくツール [math.DS, cs.IT, math.IT]目的：時間系列分析のためのエントロピー的および代数的転写に基づくツールの概要
- 時間系列分析は，経済，気象，医学など，多様な分野で不可欠な手法である。
- 従来の解析では，複雑な結合系における同期現象の検出が困難であった。
- 代数的転写を用いることで，結合系における時間系列間の関係性を定量化し，同期現象をより正確に検出することを目指す。
- 代数的転写に基づくツールは，時間系列間の結合を分析する上で有効であることが示された。
- 特に，平均ケンドール距離に基づく新規の類似度距離が，他のツールと比較して優れた性能を示した。
- 本研究は，複雑な結合系における同期現象の検出手法の改善に貢献する。
Link: https://arxiv.org/abs/2605.29780
トポロジカル安定性指標：持続ホモロジーバーコードに対する分散に基づく尺度 [math.ST, cs.IT, math.IT, physics.data-an, stat.ML, stat.TH]目的：持続ホモロジーバーコードの持続寿命の分散を定量化するスカラー尺度
- トポロジーデータ解析は，データの形状的特徴を捉え，多様な応用分野で重要性を増している。
- 既存の指標は正規化された重みに依存し，絶対的な変動や異質な特徴スケールへの感度が低い場合がある。
- 持続ホモロジーの構造的変動を捉え，ノイズやスケールの影響を受けにくい指標を開発すること。
- トポロジカル安定性指標(TSI)は，分散に基づいて持続寿命のばらつきを定量化する。
- TSIは，持続エントロピーと異なり，絶対的な変動に敏感であり，様々な特徴スケールを捉えることができる。
- 正規化されたTSI(cvTSI)は，スケール不変であり，Renyiエントロピーとの間に明確な関係があることが示された。
Link: https://arxiv.org/abs/2605.29839
測定に対する反論：量子誤り緩和ベンチマークにおける統計的アーチファクト [quant-ph, cs.SE]目的：量子誤り緩和ベンチマークの統計的妥当性の検証
- 量子コンピュータの発展において，誤り緩和は重要な技術である。実用的な量子計算には不可欠な要素と考えられる。
- 量子誤り緩和の評価において，統計的厳密性が欠如しているケースが多い。結果の解釈に誤りが生じる可能性がある。
- 現在の評価方法が持つ問題を明らかにし，より信頼性の高い評価基準を提案すること。
- 既存の量子誤り緩和に関する論文を調査した結果，統計的推論を用いているものが少ないことがわかった。
- ZNEを事例として検証したところ，パラメータ設定や時間ドリフトが結果に大きな影響を与えることが示された。
- 誤り緩和の性能が実際よりも高く評価される可能性があるため，評価基準の改善が必要である。
Link: https://arxiv.org/abs/2605.29872
固定パラメータ計算可能な量子回路シミュレーションのための二乗和 [quant-ph, cs.DS, cs.LO]目的：量子回路シミュレーションの計算複雑性
- 量子コンピュータの実現可能性を検証するため，効率的な量子回路シミュレーションが不可欠である。
- 既存のシミュレーション手法は，回路規模が大きくなると計算量が指数関数的に増加する。
- グラフのランク幅に着目し，回路規模に対して効率的なシミュレーションアルゴリズムを開発する。
- 本研究では，量子回路のパス変数グラフのランク幅がシミュレーションの困難さを決定する主要な要素であることを示した。
- 開発したアルゴリズムは，ランク幅に対してのみ指数関数的な時間複雑度を持ち，既存手法よりも優れた性能を示す。
- 特に，Hadamardゲートと対角ゲートのみで構成された回路に対して有効であり，Clifford+T回路にも適用可能である。
Link: https://arxiv.org/abs/2605.29944
エルフ，変換器，および量子ウォーク [quant-ph, cs.CC, cs.DS]目的：グラフ上の探索，サンプリング，最適化問題解決のためのツール
- 量子ウォークは計算機科学における重要な研究分野であり，古典アルゴリズムを超える可能性を秘めている。
- 量子ウォークアルゴリズムの実装には誤差が生じやすく，その制御が課題となっている。
- 誤差のない変換器を用いることで，量子ウォークの精度と効率を向上させる。
- エレクトリックフローサンプリング(elfs)を実装するための誤差ゼロの変換器が存在することが示された。
- この結果を利用し，有効抵抗の推定やspanプログラムの目撃サイズに関する量子ウォークアルゴリズムが改善された。
- expanderグラフ上での半教師あり学習において，最大で2乗の量子速度向上が得られた。
Link: https://arxiv.org/abs/2605.30013
一般化モーメント法は，低信号対雑音比のガウス潜在変数モデルにおいて（ほぼ）統計的に効率的である [math.ST, cs.IT, eess.SP, math.IT, stat.TH]目的：低信号対雑音比におけるガウス潜在変数モデルの推定
- 潜在変数モデルは，複雑なデータ構造を捉える上で重要であり，様々な分野で利用されている。
- 低信号対雑音比環境下では，推定精度が低下し，モデルの識別が困難になる場合がある。
- モーメント法による効率的な推定手法を確立し，精度向上を目指す。
- 一般化モーメント法（GMoM）が，最大尤度推定法と同等の漸近的効率を持つことが示された。
- 適切なモーメント特徴量と重み付けにより，GMoM推定子は最大尤度推定子と一致する漸近共分散を持つ。
- 低SNR環境における等価性は，層状の局所幾何学によって制御され，GMoMが統計的に効率的な代替手段となる。
Link: https://arxiv.org/abs/2605.30095
植え込まれたハイパーグラフとテンソルPCAにおける低次数推定閾値 [math.ST, cs.CC, cs.DS, math.PR, stat.TH]目的：高次元統計における統計的・計算的ギャップの理解
- 高次元データ分析において，隠れた信号の復元は重要な課題である。
- 信号の復元が理論的には可能でも，計算上困難となる状況が存在する。
- 低次数推定における閾値を特定し，復元の限界を明らかにすること。
- 植え込まれた高密度サブハイパーグラフモデルにおいて，植え込まれた集合の規模によって推定閾値が変化することが示された。
- スパーステンソルPCAにおいても同様の鋭い相転移が確認された。
- 一般的な事前分布を持つテンソルPCAにおいて，臨界信号規模での低次数推定の下限が証明された。
Link: https://arxiv.org/abs/2605.30113
拡散モデルは低次元多峰性分布学習において統計的に最適である [stat.ML, cs.IT, cs.LG, math.IT, math.ST, stat.TH]目的：低次元多峰性分布学習における拡散モデルのサンプル複雑性
- 高次元データのモデリングにおいて，拡散モデルは実証的に成功を収めている。
- 既存の理論は，現実的な分布によく見られる多峰性や低次元構造を捉えられていない。
- 低次元部分空間上に支持された分布に対する拡散モデルのサンプル複雑性を解析し，理論的保証を確立する。
- 拡散モデルは，$\varepsilon$誤差を達成するために，最大で$\widetilde{O}(\varepsilon^{-k \vee 2})$サンプルを必要とする。
- この収束率は，固有次元$k$にのみ依存し，次元の呪いを克服する。
- 本研究は，拡散モデルが固有の低次元構造に適応し，多峰性データを自然に扱うことを理論的に正当化する。
Link: https://arxiv.org/abs/2605.30153
異質的な治療効果推定のための行列補完による保証の改善 [stat.ML, cs.AI, cs.DS, cs.LG, math.ST, stat.TH]目的：異質的な治療効果推定の保証改善
- 近年の因果推論では，平均効果だけでなく，個々の対象への介入効果を把握することが重要である。
- 従来の行列補完の保証は，個々の行の推定精度を求めるには不十分であり，平均効果の推定に留まる場合が多い。
- 本研究は，行列補完による異質的な治療効果推定における，より厳密な行単位の保証を与えることを目指す。
- 提案手法は，介入割り当ての知識を必要とせず，低ランク性や正則性の仮定の下で，行単位の$\ell_2$誤差$\tilde{O}(\sqrt{\frac{1}{n} + \frac{n}{m^2}})$を達成する。
- 本研究は，既存のスペクトル，フロベニウス，およびエントリー単位の摂動理論を補完する，低ランク近似に対する最初の鋭い行単位の$\ell_2$摂動境界を確立する。
- 計算効率が高く，実用的な異質治療効果推定に貢献できると考えられる。
Link: https://arxiv.org/abs/2605.30319
ハイパーグラフを用いた行列補完：鋭い閾値と効率的なアルゴリズム [cs.LG, cs.IT, eess.SP, math.IT]目的：行列補完の達成可能性に関する閾値と，ハイパーグラフを利用した効率的なアルゴリズム
- 推薦システム等の分野で，データが不完全な場合の予測精度向上が重要である。
- 既存手法では，限られたデータから正確な行列を補完することが困難である。
- ハイパーグラフを活用し，より少ないデータで正確な行列補完を可能にすること。
- 行列補完が可能なサンプル確率の閾値が存在し，それを超えることで相転移が起こることを示した。
- ハイパーグラフの「質」を定量化することで，サンプル確率の削減量を評価できることを示した。
- 観測されたグラフとハイパーグラフを効果的に利用する，計算効率の高い行列補完アルゴリズムを開発した。
Link: https://arxiv.org/abs/2401.08197
CompilerDream：汎用コード最適化のためのコンパイラ世界モデルの学習 [cs.PL, cs.LG]目的：汎用コード最適化のためのコンパイラ世界モデルと最適化戦略
- コンピュータとソフトウェア工学において，効率的なコード最適化は不可欠である。
- 最適な最適化パスの探索は計算コストが高く，既存の学習手法は汎化性能に課題がある。
- 最適化パスの特性をシミュレートする世界モデルを用いて，汎用的な最適化戦略を学習すること。
- CompilerDreamは，大規模なプログラムデータセットで学習することにより，様々なアプリケーションシナリオや言語に対応できる汎用コードオプティマイザとして機能する。
- CompilerGymリーダーボードにおいて優れた自動チューニング能力を示し，ゼロショット汎化性能においてもLLVMの最適化や他の最先端手法を上回る。
- 価値予測とエンドツーエンドのコード最適化の両方において，優れた性能を発揮する。
Link: https://arxiv.org/abs/2404.16077
高速GPUベースパンゲノムグラフレイアウト [cs.DC, cs.CE, cs.DS]目的：パンゲノムグラフの高速なレイアウト手法
- ゲノム多様性の理解に不可欠であり，遺伝子研究の進展に貢献する分野である。
- 大規模グラフのレイアウトは計算負荷が高く，ボトルネックとなっている。
- GPUを活用し，計算効率を向上させることで，この問題を解決する。
- 本研究で開発したGPUベースのレイアウト手法は，最先端のCPUベース手法と比較して57.3倍の高速化を達成した。
- レイアウト品質を損なうことなく，実行時間を大幅に短縮することに成功した。
- キャッシュ効率の向上，メモリアクセスの最適化，およびワープマージが高速化に貢献した。
Link: https://arxiv.org/abs/2409.00876
現実世界におけるソフトウェアの設定不備の再考：実証研究と文献分析 [cs.SE]目的：ソフトウェア設定不備の根本原因の分類
- ソフトウェアの信頼性確保には不可欠であり，システム障害の主要因となるため，対策が重要である。
- 既存研究と現実世界の不備との乖離があり，実用的な検出・診断技術が求められている。
- 最新のソフトウェア環境における設定不備の実態を把握し，有効な対策を導き出すことを目指す。
- 772件の実世界の不備事例を分析し，制約違反，リソース不足，コンポーネント統合エラー，設定解釈誤りという新たな分類を提案した。
- 研究対象がシステムソフトウェアからクラウドサービス等の高度なアプリケーションへと変化していることを明らかにした。
- 多くの研究でツールや評価データセットが入手困難であり，再現性の問題が指摘された。不備事例データセットを公開する。
Link: https://arxiv.org/abs/2412.11121
無限状態システムの合成 [cs.LO]目的：無限状態システムの合成手法
- 形式検証の分野において，システムが仕様を満たすか確認する上で重要である。
- 有限状態システムに対する合成は確立されているが，無限状態システムは未解決の課題が多い。
- MSO定義可能なパリティーゲームの合成を通じて，無限状態システムの体系的な合成を可能にすること。
- 本研究では，無限状態システムの合成について体系的な研究を行った。
- MSO定義可能なパリティーゲームの勝者戦略の発見が，合成の主要なステップとなる。
- これにより，無限状態システムの自動的な検証と制御が可能になると考えられる。
Link: https://arxiv.org/abs/2501.08713
CDAWG文法の感度について [cs.RO, cs.DS]目的：CDAWG文法の最悪ケースにおける付加的感度の下限と上限
- 文字列処理は，情報科学における基本的な問題であり，多様な応用分野を持つ。
- CDAWG文法は強力な圧縮技術であるが，その感度に関する明確な理解が不足している。
- CDAWG文法の感度を厳密に評価し，その限界を明らかにすることを目的とする。
- CDAWG文法の最悪ケースにおける付加的感度について，下限が3g-21，上限が8g+4であることが示された。
- この結果は，CDAWG文法の感度特性を理解する上で重要な情報を提供する。
- CDAWG文法を利用した圧縮における性能評価や最適化に役立つと考えられる。
Link: https://arxiv.org/abs/2503.02415
MigrationBench: Java 8 からのコード移行ベンチマーク [cs.SE]目的：Java 8 から最新の LTS バージョン（Java 17，21）へのコード移行
- ソフトウェアの進化において，バージョン移行は不可欠であり，継続的な保守・改善に繋がる。
- 既存のベンチマークはコード生成や問題解決に偏っており，コード移行に特化した評価が不足している。
- 大規模言語モデルを用いたリポジトリレベルのコード移行の自動化と評価手法の確立を目指す。
- MigrationBench は，Java 8 から Java 17/21 への移行を評価するための包括的なベンチマークである。
- Claude-4.5-Sonnet を用いたエージェントフレームワークによる評価で，最小限の移行で 71.67%，最大限の移行で 53.33% の成功率を達成した。
- データセットと評価コードは公開されており，コード移行研究の促進に貢献する。
Link: https://arxiv.org/abs/2505.09569
畳み込みを用いた効率的かつ並列化可能な組み合わせ生成器の機能設計 [cs.DM, cs.DS]目的：効率的かつ並列化可能な組み合わせ生成器の機能設計
- 組合せ最適化問題の効率的なアルゴリズム開発において，網羅的な組み合わせ生成器は不可欠である。
- 既存の生成器は，目的関数との構造的な適合性が課題であり，問題に依存して効率が大きく変動する。
- ハードウェア互換性や並列実行を考慮した，より効率的な組み合わせ生成器の設計を目指す。
- 関数型プログラミングの技術を用いることで，ハードウェア互換性と並列性を考慮した組み合わせ生成器の体系的な構築が可能となる。
- 本研究では，最も基本的な組合せ構造である組み合わせと順列，およびそれらのネストされた生成器について検討する。
- 形式的な正当性と，融合をサポートする代数的にエレガントなアルゴリズム設計の同時達成が可能であることを示す。
Link: https://arxiv.org/abs/2507.03980
LandlockとSeccompによる科学ゲートウェイのセキュリティ強化 [cs.CL, cs.SE]目的：科学ゲートウェイにおけるセキュリティ確保手法の検討
- 科学計算は機密性の高いデータを取り扱うため，セキュリティ対策が不可欠である。
- 従来のセキュリティ対策では，過剰な権限付与や設定ミスによる脆弱性が存在する。
- Landlockを用いて，科学ゲートウェイの起動時のみ必要なネットワークアクセスを制限する。
- Linuxカーネルの新機能Landlockは，アプリケーションのセキュリティ向上に有効であることが示された。
- Einstein Toolkit，Octo-Tiger，FUKAといった科学計算コードへの適用により，その有用性が確認された。
- FUKAの科学ゲートウェイにおいて，Landlockを用いたセキュリティ実装が成功した。
Link: https://arxiv.org/abs/2509.18548
TelecomTS：時系列と言語分析のためのマルチモーダル可視化データセット [cs.AI, cs.IT, cs.LG, math.IT]目的：5G通信ネットワーク由来の可視化データセット
- システム監視における可視化データの重要性が増している。複雑なシステムの状態把握に不可欠である。
- 既存の可視化データセットは，プライバシー保護のため匿名化され，スケール情報が失われている場合が多い。
- スケール情報を保持した，実用的な可視化アプリケーションに適した時系列モデルの開発を目指す。
- TelecomTSは，異常検知，根本原因分析，マルチモーダル質疑応答など，多様なタスクに適したデータセットである。
- 既存の時系列モデルは，可視化データの急激な変動やノイズ，高い分散に対応できていないことが示された。
- 変数の絶対スケールを保持することの重要性が強調され，実世界の可視化アプリケーションにおけるスケール情報の活用が求められる。
Link: https://arxiv.org/abs/2510.06063
既知のパラメータを持つ巡回符号 [cs.IT, math.IT]目的：有限体上の巡回符号の構成
- 誤り訂正符号は，デジタル通信やデータストレージにおいてデータの信頼性を確保する上で不可欠である。
- 既存の巡回符号では，符号長に対する次元や最小距離の性能が十分でない場合がある。
- より良いパラメータを持つ巡回符号を構成し，誤り訂正性能の向上を目指す。
- 有限体上の巡回符号の無限個の族を構成し，次元が符号長の約半分で，最小距離が $cn/\log_q n$ 以上のものを示した。
- 構成された符号は，最適，またはほぼ最適，または既知の最良のパラメータを持つ多くの巡回符号を含む。
- 様々な長さの巡回符号についても検討した。
Link: https://arxiv.org/abs/2511.03323
指示応答における言語モデルの信頼性の再検証 [cs.SE, cs.AI, cs.CL]目的：言語モデルの指示応答におけるニュアンスに敏感な信頼性
- 大規模言語モデルは多様な応用で利用され，その性能向上が期待されている。
- 既存の評価指標は，ユーザーの表現や状況変化に対するモデルの頑健性を十分に評価できていない。
- モデルの指示応答の信頼性を，表現のわずかな違いに対する一貫性という観点から評価・改善すること。
- 既存の言語モデルは，わずかな表現の変化に対して性能が大幅に低下することが示された。
- 新たな評価指標「reliable@k」と自動生成パイプライン「IFEval++」を開発し，モデルの信頼性を定量的に評価した。
- ニュアンスに敏感な信頼性は，信頼できるLLM行動への重要な次のステップであることが強調された。
Link: https://arxiv.org/abs/2512.14754
ランダムモデルとガード断片 [cs.LO]目的：ガード断片の有限モデル性
- モデル理論における重要な問題であり，論理式の検証や知識表現に不可欠である。
- ガード断片のモデルサイズの上界が明確でなく，計算複雑性に影響を与える。
- ガード断片の有限モデル性を確率的に証明し，モデルサイズの上界を定める。
- 確率的証明により，ガード断片の最小モデルサイズの指数関数的な上界を得た。
- この上界は最適であり，特定の文を用いて厳密に達成可能なサイズが示された。
- 確率的証明を決定論的なハッシュ関数を用いて非確率化することに成功した。
Link: https://arxiv.org/abs/2601.05247
文法を意識したリテラテな生成数学計画法：コンパイラ連携によるアプローチ [cs.PL, cs.AI]目的：数学計画モデルの生成
- 産業界の最適化問題を解決する上で，数学計画法は不可欠な手法である。
- 自然言語からの変換は専門知識が必要であり，生成されたモデルの検証が難しい。
- コンパイラ連携により，記述性の高い数理モデルを生成し，修正を容易にする。
- SyntAGMは，読みやすい代数モデリング言語で最適化モデルを生成するシステムである。
- コンパイラからのフィードバックとLLMを活用し，問題記述と整合性のとれたモデルを生成する。
- 既存の手法と比較して，費用対効果のバランスが良い結果が得られた。
Link: https://arxiv.org/abs/2601.17670
HE-SNR: エントロピーを用いた潜在的ロジックの解明 - SWE-benchにおける中間学習の誘導 [cs.LG, cs.CL, cs.SE]目的：大規模言語モデルの中間学習を効果的に誘導するための指標
- ソフトウェア工学における複雑なタスクの自動化は，生産性向上に不可欠である。
- 中間学習段階の評価指標は不十分で，下流タスクとの相関が低い。
- エントロピーに基づく新しい指標HE-SNRを用いて，中間学習を最適化する。
- 本研究では，エントロピー圧縮仮説に基づき，HE-SNRという新たな指標を提案した。
- HE-SNRは，従来のPerplexityの問題点を克服し，下流タスクのパフォーマンスとの高い相関を示すことが示された。
- 最大5600億パラメータのモデルや異なるコンテキストウィンドウで，本手法の有効性を検証した。
Link: https://arxiv.org/abs/2601.20255
歴史的な修正パッチから修理計画へ：リポジトリレベルのプログラム修理のための結果条件付き推論 [cs.SE]目的：リポジトリレベルプログラム修理における結果条件付き推論
- ソフトウェアの信頼性確保は重要であり，自動プログラム修理はその効率化に貢献する。
- 既存手法は過去の修理事例を再利用できず，大規模なリポジトリでの効率的な修理が課題。
- リポジトリ内の解決済み問題を活用し，効率的な修理計画を導き出すことを目指す。
- ConRADは，検証済みのパッチから修理推論を逆構築し，結果整合的な段階的修理計画を抽出する。
- 推論時にこれらの計画を注入することで，誤り特定とパッチ生成を誘導し，探索的な手法よりも効率的である。
- SWE-Bench LiteにおいてPass@1がGPT-4oで10.4％，DeepSeek-V3で8.6％，GPT-5で10.3％向上した。
Link: https://arxiv.org/abs/2601.23257
ノイズを含む問い合わせによる分割不能な物品の羨望フリーな配分 [cs.CL, cs.GT, cs.IT, cs.LG, math.IT, stat.ML]目的：分割不能な物品の羨望フリーな配分問題における問い合わせ回数の最適性
- 公平な資源配分は，経済学，計算機科学など多岐にわたる分野で重要な課題である。
- エージェントの評価値を直接観測できない場合，効率的な配分アルゴリズムの設計が困難である。
- ノイズを含む問い合わせのみで，効率的に羨望フリーな配分を実現することを目指す。
- ２人エージェント環境において，ガウスノイズと評価値の上限を仮定した上で，必要な問い合わせ回数の上限と下限を導出した。
- 最適な問い合わせ回数は，物品数$m$と負の羨望$\Delta$に基づいて，$\frac{m^{2.5}}{\Delta^2}$ のオーダーでスケールすることが示された（対数因子を除く）。
- この上限は，非適応的な問い合わせとシンプルな閾値ベースの配分アルゴリズムに基づくものであり，任意の計算時間，適応的な問い合わせ下でも下限が成立する。
Link: https://arxiv.org/abs/2602.06361
クロスプロジェクトにおける不安定性：OpenStackエコシステムの事例研究 [cs.SE]目的：OpenStackエコシステムにおけるテストの不安定性の実証的研究
- ソフトウェア開発において，回帰テストは品質保証の基礎であり，CI/CDプロセスに不可欠である。
- テストの不安定性は，開発者の信頼を損ない，リソースを浪費し，CIの信頼性を低下させるという課題がある。
- 本研究は，エコシステム全体に影響を及ぼす不安定性に着目し，その原因と影響を明らかにすることを目的とする。
- OpenStackエコシステムにおいて，1,535件のクロスプロジェクト型不安定テストと1,105件の一貫性のない不安定テストが特定された。
- クロスプロジェクト型不安定性がOpenStackプロジェクトの55%に影響を与え，レビュー時間と計算コストを増加させることが示された。
- ユニットテストでクロスプロジェクト型不安定性が頻発することから，ユニットテストは本質的に影響を受けないという従来の考え方への疑問が呈された。
Link: https://arxiv.org/abs/2602.09311
確率的項書き換えにおける（正の）ほとんど確実な停止性の反証：ランダムウォークによる手法 [cs.LO]目的：確率的項書き換えシステムの（正の）ほとんど確実な停止性の反証手法
- 近年，確率的プログラムの停止性を自動的に証明する技術が多数開発されている。
- しかし，確率的プログラムの停止性を反証するための自動化された方法は少ない。
- 本研究は，確率的項書き換えシステムの（正の）ほとんど確実な停止性を自動的に反証することを目指す。
- 非確率的システムにおける停止性の反証には，無限計算の有限表現（書き換えシステムのループなど）を見つける必要がある。
- 本研究では，そのような定性的な手法を確率的項書き換えに拡張し，定量的な分析を行う。
- ループの存在に加えて，適切なランダムウォークを計算に埋め込むために，ループの数を数える必要がある。
Link: https://arxiv.org/abs/2602.16522
クロスバー型インメモリコンピューティングのための新しい幾何学的アナログ誤り訂正符号 [cs.IT, math.IT]目的：クロスバー型インメモリコンピューティングにおける幾何学的アナログ誤り訂正符号の研究
- 機械学習の高速化に貢献するインメモリコンピューティングの重要性が高まっている。
- 既存のアナログ誤り訂正符号は，符号長や次元に制限があり，適用範囲が狭い。
- 本研究では，複数の外れ値に対応可能な幾何学的符号の特性を分析し，その適用範囲を拡大する。
- 提案する幾何学的符号のm-heightプロファイルを幾何学的に解析することで，符号の性能を定量的に評価した。
- この解析により，符号が外れ値に対してどれだけの耐性を持つかを明らかにすることができた。
- 本研究成果は，クロスバー型インメモリコンピューティングにおける信頼性向上に貢献すると期待される。
Link: https://arxiv.org/abs/2603.03723
Pythonアプリケーションのクロスエコシステム脆弱性分析 [cs.CL, cs.CL, cs.CR, cs.SE]目的：Pythonアプリケーションにおける脆弱性分析手法
- Pythonは広く利用されており，そのセキュリティは重要である。サードパーティライブラリの脆弱性は重大な脅威となり得る。
- 既存の脆弱性スキャンツールは，バンドルされたライブラリやOSのセキュリティパッチを考慮せず，誤検知や見逃しが発生しやすい。
- クロスエコシステムにわたる脆弱性分析により，より正確な脆弱性特定と影響範囲の把握を目指す。
- 提案手法は，バンドルされたライブラリをOSパッケージバージョンに紐付け，脆弱性分析の精度を向上させる。
- 10万件のPythonパッケージと10件のCVEを対象とした評価で，直接的に脆弱なパッケージ39件と，依存関係を通じて影響を受けるパッケージ312件を特定した。
- 既存手法と比較して，平均52%の誤検知削減を実現し，特にパッチの適用が進んだライブラリでは最大97%の削減となった。
Link: https://arxiv.org/abs/2603.18693
ORACLE-SWE：SWEエージェントにおけるオラクル情報の貢献度の定量化 [cs.MA, cs.CL, cs.SE]目的：SWEエージェントにおけるオラクル情報の貢献度
- ソフトウェア開発の自動化は，生産性向上やコスト削減に不可欠であり，その重要性は増している。
- SWEエージェントの性能向上には，効果的な情報源の特定が課題となっている。
- 各オラクル情報の貢献度を定量的に評価し，開発の優先順位付けを支援する。
- ORACLE-SWEという手法を導入し，SWEベンチマークからオラクル情報を分離・抽出することで，各信号の貢献度を定量的に評価した。
- 強力なLMによって抽出された信号を基本エージェントに提供することで，性能向上のパターンを検証し，現実的なタスク解決設定を近似した。
- これらの評価は，自律型コーディングシステムの研究優先順位を決定するための指針となる。
Link: https://arxiv.org/abs/2604.07789
イベント系列の頻度に関する線形時間論理 [cs.LO, math.LO]目的：イベント系列の頻度特性の表現
- 複雑化するシステムに対し，形式的な検証が不可欠となっている。
- 既存の論理では，イベント系列の頻度を厳密に表現できない。
- イベント系列の頻度特性を形式的に記述する枠組みを提供する。
- LTLFという新たな時間論理を導入し，イベント系列の頻度特性を自然かつ厳密に表現可能にした。
- 観測された頻度と理想的な分布の関係を単一の論理構造内で調査できるようになった。
- 形式的な論理的推論と実証的な観察との間の隔たりを埋めることを可能にする。
Link: https://arxiv.org/abs/2604.10669
並列機械における最小合計集合被覆問題 [cs.DS]目的：最小合計集合被覆問題の並列機械への拡張に関する近似アルゴリズムの開発
- 組合せ最適化問題は，現実世界の様々なスケジューリングや資源配分問題に応用可能である。
- 最小合計集合被覆問題はNP困難であり，大規模なインスタンスに対する効率的な解法が求められている。
- 並列機械環境における最小合計集合被覆問題に対する近似アルゴリズムを提案し，性能評価を行う。
- 並列最大被覆問題に対するランダム化された二基準近似アルゴリズムを提案した。
- 関係のない機械に対して，最小合計集合被覆問題に対する$O(\log m/\log\log m)$近似アルゴリズムを得た。
- 関係のある機械に対して，$\frac{8e}{e+1}+\epsilon <12.66$近似アルゴリズムを導出した。
Link: https://arxiv.org/abs/2604.11388
閉包忠実度における演繹的ソースに対するレート歪理論 [cs.IT, cs.LO, math.IT]目的：固定された演繹的環境で生成される有限な命題ソースの可逆圧縮
- 知識表現と推論は，AI分野の根幹であり，効率的な情報伝達が不可欠である。
- 従来の圧縮理論は，記号の一致に基づくが，演繹的知識の構造を考慮していない。
- 演繹的閉包の保存という新たな忠実度基準に基づき，効率的な圧縮レートを求める。
- ゼロ歪みレートは，コアのソース質量と，そのコアに対する条件付きエントロピーに等しいことが示された。
- コアが重複する場合，ハイパーグラフエントロピーを用いてゼロ歪みレートを正確に特徴付けた。
- ソース知識ベースの演繹的閉包に含まれる再構成アルファベットに対し，レート歪関数はコアのみに依存することが証明された。
Link: https://arxiv.org/abs/2604.15698
ネストされた定量オートマトンによるQuAKの拡張 [cs.FL, cs.LO]目的：定量オートマトンの機能拡張
- システム特性の定量的な検証は，安全性や性能保証に不可欠である。
- 従来の定量オートマトンでは，平均応答時間のような無限大の値を扱えなかった。
- ネストされた定量オートマトンを用いて，より表現力豊かな特性の検証を可能にする。
- QuAKを拡張し，ネストされた定量オートマトンをサポートするツールを開発した。
- ネストされた定量オートマトンを定量オートマトンに変換するフラット化処理を実装した。
- 実験により，応答時間やリソース消費のベンチマークにおいてQuAKの有効性が確認された。
Link: https://arxiv.org/abs/2605.12418
AgentLens：SWE-Agent評価における幸運合格問題の解明 [cs.HC, cs.IR, cs.SE, cs.AI]目的：SWE-Agentの評価におけるプロセスレベルでの品質評価
- ソフトウェア開発における自動化の重要性が増しており，SWE-Agentの性能評価が不可欠である。
- 従来のSWE-Agent評価は合否のみに注目しており，解決プロセスを考慮していない。
- SWE-Agentのプロセスを詳細に分析し，より正確な評価基準を確立すること。
- SWE-Agentの実行軌跡において，10.7%が「幸運合格」に該当することが判明した。
- AgentLensフレームワークとAgentLens-Benchデータセットを導入し，プロセスレベルでの評価を可能にした。
- 品質スコアに基づいて評価することで，モデルのランキングが大きく変動することが示された。
Link: https://arxiv.org/abs/2605.12925
NOVA：AIによる知識発見の根本的限界 [cs.AI, cs.IT, math.IT]目的：AIによる反復的な自己改善を通じた真に新しい知識の発見可能性とその限界
- AI技術の進展は，科学的発見や問題解決に貢献する可能性を秘めている。
- AIが発見する知識の質や，発見プロセスにおける効率性の問題が残されている。
- AIによる知識発見の限界を理論的に明らかにし，実用的な改善策を提示すること。
- NOVAフレームワークを導入し，知識空間における適応的サンプリングとして「生成，検証，蓄積，再学習」ループをモデル化した。
- 知識の蓄積が有限の領域を覆うための十分条件を特定し，違反時の失敗モード（汚染，忘却，探索失敗，受容失敗）を示した。
- 生成コストと発見数Dの関係について，累積生成コストがR_{\mathrm{cum}}(D)=\Theta(c_{\mathrm{gen}}D^\alpha)で近似されることを証明し，漸近的な収益逓減を定量化した。
Link: https://arxiv.org/abs/2605.15219
中間巡回符号とスカラー剰余リード・ミューラー層 [cs.IT, math.IT]目的：中間巡回符号の最小距離の決定
- 符号理論は，情報伝送やデータ保存における誤り検出・訂正に不可欠である。
- 既存の中間巡回符号の最小距離決定は，未解決問題として残されていた。
- 特定の中間パラメータにおける最小距離の正確な値を求める。
- 本研究により，Sun, Ding, Wangの論文で示された上限が，許容される中間パラメータに対して正確な最小距離であることが証明された。
- スカラー剰余層の最小アフィン支持も決定し，リード・ミューラー符号の重みに関する二分法が示された。
- 評価モデルの隠れたスカラー同質性，軌道計数による制約，および同種な鉛筆構造が証明に利用された。
Link: https://arxiv.org/abs/2605.17022