arXiv雑要約

プログラム - 2025/10/14 公開

離散確率過程における時間依存性の情報理論的分析：降水予測への応用 [physics.data-an, cs.IT, math.IT, physics.app-ph]目的：降水予測の改善と効率的な確率降雨モデルの開発
- 降水量の時間依存性の理解は，気象予測の精度向上に不可欠である。
- 確率過程における記憶効果の定量化手法が確立されていなかった。
- 有限データからのロバストな記憶推定手法を確立することを目指す。
- 本研究で提案する手法は，AICやBICなどのモデル選択基準よりも優れた性能を示すことがシミュレーションで確認された。
- 降水データへの適用により，日々の降雨発生は低次のマルコフ連鎖で十分に説明できることが示された。
- 地域や季節によって相関構造が異なり，西海岸の冬や南東部の夏に強い相関が見られた。
Link: https://arxiv.org/abs/2510.11276
効率的かつプライバシーを重視したeヘルスシステム：統合センシング，計算，セマンティック通信アプローチ [eess.SP, cs.IT, math.IT]目的：eヘルスシステムにおける効率性とプライバシー保護
- 遠隔医療の普及に伴い，リアルタイムな健康状態のモニタリングの重要性が増している。
- 従来の無線通信やセンシングネットワークでは，高精度なセンシング，データ効率，プライバシー保護が課題である。
- センシング，計算，セマンティック通信を統合し，これらの課題を解決することを目指している。
- 提案システムでは，ロボットがレーダーを用いて患者の位置とバイタルサインを検出し，セマンティックに抽出された健康特徴を医療機器に送信する。
- セマンティック処理により，データスループットを向上させ，臨床的に関連性の高い情報を維持しながら，プライバシーを保護する。
- シミュレーション結果は，提案フレームワークが従来の方式と比較して，優れたセンシング精度，効率的なセマンティック伝送，プライバシー保護を実現することを示している。
Link: https://arxiv.org/abs/2510.11514
移動し得るターゲット分布からのロバストなオンラインサンプリング [math.OC, cs.DS, math.ST, stat.TH]目的：ターゲット分布への点群の近似
- 機械学習や統計推論において，確率分布からの効率的なサンプリングは重要な課題である。
- 既存のサンプリング手法では，分布が時間とともに変化する場合に対応が難しい場合がある。
- 動的な環境下でも安定的にターゲット分布に近似できるサンプリング手法を提案する。
- 提案手法は，既存の点群が不足している領域に新しい点を追加し，過密な領域を回避することで，分布への近似を実現する。
- 計算量はO(n)であり，最先端の結果が得られている。
- この手法は興味深い力学系としての性質を持ち，連続平均場モデルによってその振る舞いを分析している。
Link: https://arxiv.org/abs/2510.11571
統計的Max-Min電力制御のための固定点アルゴリズム：Use-and-then-Forgetの限界を超える [math.CA, cs.DM, math.CO, eess.SP, cs.IT, math.IT]目的：統計的Max-Min電力制御における数学的ツールと固定点アルゴリズム
- 無線通信システムの容量向上は重要であり，特にMassive MIMO技術はその鍵となる。
- 既存手法はUse-and-then-Forget (UatF) の下限に依存し，その保守性の高さが問題となる。
- UatFの限界を克服し，より正確なレート下限を用いた電力制御を可能にすること。
- 提案手法は，完全または不完全なチャネル状態情報(CSI)を考慮した情報理論的な下限と適合する。
- UatFベースのアルゴリズムが持つ，スケーリングに対する不変性の欠如という問題を解決する。
- インスタントCSIを利用した標準的な下限を用いたMax-Min電力制御問題を解決することで，有効性を示す。
Link: https://arxiv.org/abs/2510.11582
固定階数の整数行列：数体上の研究 [math.NT, cs.IT, math.IT]目的：数体上の固定階数整数行列の個数に関する漸近公式
- 整数行列は，数論，符号理論，結晶構造など，幅広い分野で重要な役割を果たす。
- 数体上の固定階数整数行列の個数を正確に評価することは困難であった。
- 数体上の固定階数整数行列の個数を漸近的に評価し，関連する問題を解決する。
- 数体K/Q上の固定階数整数行列の個数について，ノルムが有界である場合の漸近公式を証明した。
- 代数的符号の持ち上げから得られるモジュール格子から，離散的な集合に対する近似的なロジャース積分公式を導出した。
- 数体構造を持つランダム格子のモーメント推定が，十分大きなモジュール格子の離散集合に対しても成り立つことを示した。
Link: https://arxiv.org/abs/2510.11673
$\texttt{GF}(p^{n^{2}})$における多レート誤り訂正符号 [cs.IT, math.IT]目的：多レート誤り訂正符号の導出
- 通信の信頼性確保には誤り訂正符号が不可欠であり，その性能向上が常に求められている。
- 従来の誤り訂正符号は固定レートであることが多く，柔軟なデータ長への対応が困難である。
- 任意のデータ長に対応可能な，柔軟な情報伝送レートを持つ符号を構築すること。
- 複合体$\texttt{GF}(q^{n})$上の符号から，多様なレートを持つ符号を生成する手法が提案された。
- $\texttt{GF}(q^{n})$の要素を$\texttt{GF}(q)$上のn組と見なし，子符号を用いて可変レートを実現する。
- 固定長ブロック内で，レート$1/n$から$(k-1)/n$までの範囲の情報伝送レートをサポートすることが可能である。
Link: https://arxiv.org/abs/1909.11296
目標指向型セマンティック通信：新たな指標，フレームワーク，および未解決の課題 [cs.IT, math.IT]目的：目標指向型セマンティック通信の実現
- 通信技術の発展と深層学習の進展により，情報伝達の目的を単なるビット精度から意味や有用性へと拡張することが可能になった。
- 既存の指標（AoI, VoI, UoI, AoII等）はそれぞれ有用性に着目するが，統合的なフレームワークが存在しない。
- これらの指標を統合し，柔軟かつ詳細な目標設定を可能とする新たなアプローチを提案することで，目標指向型セマンティック通信を実現する。
- 提案手法であるGoal-oriented Tensor（GoT）は，既存の指標を統一的に表現し，目標の特性を柔軟に捉えることを可能にする。
- GoTに基づき，情報知覚，伝達，制御を目標に合わせて最適化する包括的なフレームワークを構築した。
- GoTフレームワークのビジョン実現に向けた，今後の課題を提示した。
Link: https://arxiv.org/abs/2304.00848
ChipGPT：自然言語によるハードウェア設計，現時点での到達度 [cs.AI, cs.AR, cs.PL]目的：自然言語によるハードウェアロジック設計の自動化
- 半導体設計の複雑化が進み，設計者の負担が増大しているため，効率化が求められている。
- 従来の設計手法では，設計の最適化に多大な時間と労力がかかるという課題がある。
- LLMを活用することで，設計の自動化と設計空間の拡大を目指す。
- ChipGPTは，LLMを用いて自然言語の仕様からVerilogプログラムを生成する，ゼロコードのロジック設計フレームワークである。
- 生成されたプログラムは出力マネージャーによって修正・最適化され，設計空間が構築される。
- 評価の結果，ChipGPTは既存手法やLLM単体と比較して，プログラマビリティと制御性が向上し，設計空間が拡大することが示された。
Link: https://arxiv.org/abs/2305.14019
セミフレーム：セミトポロジーと実行可能な連合の代数 [cs.LO, math.CT, math.GN]目的：セミフレームとセミトポロジーの関係性に関する代数的・位相的研究
- 分散コンピューティングシステムの理論的基盤として，トポロジーの概念を応用する研究分野である。
- 従来のトポロジーでは，開集合の共通部分も開集合となる必要があったが，分散システムにおける実行可能な連合のモデル化には不向きである。
- 分散システムにおける実行可能な連合の概念を捉え，その数学的性質を明らかにする。
- セミフレームとセミトポロジーの間には，圏論的な双対性が存在することが示された。
- 双対性を介して，分散システム理解に重要な性質がどのように移行するか，あるいは移行しないかを調査した。
- セミフレームはセミトポロジーの代数的構造として定義され，分散システム研究への応用が期待される。
Link: https://arxiv.org/abs/2310.00956
MILP証明の検証のための充足可能性モジュロ理論 [cs.LO]目的：MILP証明の検証手法
- MILPソルバーの正確性は，ハードウェア検証やコンパイラ最適化等に応用され，極めて重要である。
- MILPソルバーの出力結果の検証は難しく，形式的な証明の確立が課題となっていた。
- VIPR証明書の検証を形式的に行い，その正確性を保証することを目的とする。
- VIPRの推論規則を正確に表現する形式化手法を開発した。
- 開発した手法をWhy3を用いて検証し，論理レベルでの正しさを証明した。
- SMT-LIBを用いてVIPR証明書のチェッカーを実装し，その有効性を検証した。
Link: https://arxiv.org/abs/2312.10420
大規模言語モデルはデータ分析者として機能するか？定性データ分析のためのマルチエージェント支援アプローチ [cs.SE]目的：定性データ分析のためのLLMベースのマルチエージェントシステムの設計と開発
- 定性データ分析は研究において不可欠だが，手作業では時間と労力を要し，客観性の確保が課題となる。
- ソフトウェア工学分野においてLLMの活用は進んでいるものの，定性データ分析への応用は未だ十分ではない。
- LLMと人間の協調により，定性データ分析プロセスを効率化し，より信頼性の高い分析を可能にすること。
- LLMベースのマルチエージェントシステムが定性データ分析を加速することが示された。
- テキスト要約，初期コーディング，テーマ抽出などのタスクをシステムが効果的に自動化できることが確認された。
- 公開されたコードにより，検証と更なる評価が可能となり，研究の再現性を高める。
Link: https://arxiv.org/abs/2402.01386
コード翻訳における大規模言語モデルの評価における出力形式の偏り [cs.SE, cs.AI]目的：コード翻訳における出力形式の偏りの軽減
- ソフトウェアの近代化やクロスプラットフォーム対応，パフォーマンス向上に不可欠な技術分野である。
- 既存の研究では出力形式（コードと非コード要素の混在）が評価に影響し，性能評価の偏りを招く可能性がある。
- 大規模言語モデルのコード翻訳における評価の信頼性を高めるため，出力形式の偏りを軽減することを試みる。
- 評価対象の11のオープンソースLLMにおいて，26.4%～73.7%の出力に後処理が必要であることが示された。
- プロンプトエンジニアリングと正規表現の組み合わせにより，平均92.73%のコード抽出成功率（CSR）を達成した。
- 出力形式の偏りが，計算精度(CA)やBLEU，CodeBLEU，CrystalBLEUなどの一般的な評価指標に影響を与えることが確認された。
Link: https://arxiv.org/abs/2403.17214
LineBreaker: 大規模言語モデルを用いたトークン不整合バグの検出 [cs.CR, cs.SE]目的：トークン不整合バグの検出
- ソフトウェア品質の確保は重要であり，潜在的なバグの早期発見が不可欠である。
- 従来の静的解析や動的テストでは，意味レベルで発生するトークン不整合バグの検出が困難である。
- 大規模言語モデルを活用し，トークン不整合バグの検出効率と精度を向上させる。
- GPT-4はトークン不整合バグの検出に潜在力を持つが，精度とスケーラビリティに課題があることが判明した。
- LineBreakerは，より小型で効率的な言語モデルを用いてコードをフィルタリングすることで，精度，再現率，スケーラビリティを大幅に向上させる。
- 154のGitHubリポジトリの評価により，123個の新たな脆弱性を発見し，その45%はプログラム機能の妨害につながる可能性がある。
Link: https://arxiv.org/abs/2405.01668
オーバー・ザ・エア連合メタ学習による事前学習と個別化微調整：収束性と汎化性能のトレードオフ [cs.LG, cs.IT, eess.SP, math.IT]目的：無線環境におけるメタ学習に基づく個別化連合学習の汎化性能
- AIモデルの規模拡大に伴い，事前学習と微調整の重要性が増している。
- データ利用の制限から，連合学習による事前学習の需要が高まっている。
- 無線チャネル特性が収束性と汎化性能に及ぼす影響を解明する。
- 無線チャネルの劣化が収束性を損なう一方で，汎化性能を向上させる可能性がある。
- オーバー・ザ・エア計算の導入により，このトレードオフを詳細に分析した。
- 数値シミュレーションの結果，理論的な予測と整合性があることが確認された。
Link: https://arxiv.org/abs/2406.11569
交差を伴うグラフ埋め込みにおける頂点連結性と辺連結性の計算 [cs.DS, math.CO]目的：グラフの頂点連結性と辺連結性の計算
- グラフ理論における基本的な概念であり，ネットワークの信頼性や効率性を評価する上で重要である。
- 交差を伴うグラフ埋め込みにおける連結性の効率的な計算方法が確立されていなかった。
- 交差を伴うグラフにおいても連結性を線形時間で計算できるアルゴリズムを開発すること。
- 本研究では，交差点からの面距離が小さいという条件を満たすグラフに対し，線形時間で頂点連結性と辺連結性を計算できるアルゴリズムを提案した。
- このアルゴリズムは，最適2平面グラフや最適3平面グラフ，d-mapグラフ，d-framedグラフなど，様々なグラフクラスに適用可能である。
- 提案手法は，交差数や×交差の数に上限があるグラフにおいても有効であり，幅広い応用が期待される。
Link: https://arxiv.org/abs/2407.00586
フェージングチャネルにおける脊髄コードのML復号誤り確率に関する統一的な上限 [cs.IT, math.IT]目的：脊髄コードのブロック誤り率の上限
- 通信理論において，チャネル符号化性能の評価は重要である。誤り率の上界は，実用的な符号設計に不可欠である。
- 有限ブロック長領域における正確な誤り率の上界は得ることが難しく，既存の手法では十分な精度が保証されない場合がある。
- 脊髄コードの誤り率を厳密に評価するための新しい枠組みを確立し，理論的な上限を導出すること。
- 本研究では，脊髄コードの誤り率を評価するために，Gallagerのランダム符号化限界を用いた手法と，それを用いない手法を提示した。
- 提案手法は，幅広いSNR範囲において理論的な厳密性を保証し，レイリー，ナカガミ-m，ライシャンフェージングチャネル等の性能評価を可能にする。
- ML復号された脊髄コードにおいて，テール送信パターン（TTP）が信頼性に関して最適な選択肢であることが理論的に示された。
Link: https://arxiv.org/abs/2407.03741
実世界アプリケーションと文献におけるAndroidパフォーマンス問題の比較研究 [cs.SE]目的：Androidアプリケーションにおけるパフォーマンス問題の比較分析
- モバイル利用者の増加に伴い，アプリケーションのパフォーマンスはユーザー体験に不可欠である。
- パフォーマンス問題は原因が複雑で特定が難しく，解決が遅れることが多い。
- 実世界で発生するパフォーマンス問題と研究の焦点の乖離を明らかにすること。
- 研究者，開発者，ユーザー間で，主要なパフォーマンスに関する懸念に大きな違いがあることが示された。
- 特定された要因の57.14%は学術研究で検討されておらず，76.39%は既存のツールで対処されていない。
- パフォーマンス問題の理解と管理における大きなギャップを指摘し，研究コミュニティへの取り組みを促す。
Link: https://arxiv.org/abs/2407.05090
時間論理における同時チーム意味論 [cs.LO]目的：線形時間論理および計算木論理に対するチーム意味論
- 形式検証の分野において，システムの正確性を保証する上で時間論理は不可欠である。
- 従来の論理では，情報フロー特性のようなハイパープロパティの表現が困難であった。
- ハイパープロパティを表現可能にし，既存の論理の限界を克服することを目的とする。
- チーム意味論によるLTLはハイパープロパティを表現でき，情報フローの検証に有効である。
- LTLの充足可能性，パス，モデル検査問題の計算複雑性を分類した。
- CTLにおける充足可能性問題はEXPTIME-完全であり，モデル検査問題はPSPACE-完全である。
Link: https://arxiv.org/abs/2409.18667
レート適合型ポーラ符号の重みスペクトルについて [cs.RO, cs.IT, math.IT]目的：レート適合型ポーラ符号の重みスペクトルの算出
- 誤り訂正符号の性能評価において，重みスペクトルは重要な指標である。
- レート適合型ポーラ符号の重みスペクトルを求める一般的な枠組みが存在しなかった。
- 準一様穿孔，Wang-Liu短縮，ビット反転短縮減衰ポーラ符号の最小重み符号語数を算出する。
- 準一様穿孔，Wang-Liu短縮，ビット反転短縮減衰ポーラ符号の重みスペクトルを理論的に求めることに成功した。
- ランダム上三角変換短縮・穿孔ポーラ符号の平均スペクトルを計算する効率的なアルゴリズムを提案した。
- 提案アルゴリズムは，符号長に対して多項式時間で動作し，シミュレーション結果により精度が確認された。
Link: https://arxiv.org/abs/2410.19242
編集可能なDeepSC：顔編集のための信頼性の高いクロスモーダル意味通信 [cs.IT, cs.CV, cs.NI, math.IT]目的：顔編集のための新規クロスモーダル意味通信手法
- リアルタイムコンピュータビジョンは，様々な実世界アプリケーションにおいて重要な役割を担う。
- 従来のデータ重視型通信は，リアルタイムCVタスクの特殊なニーズに対応できない場合がある。
- 意味通信の課題，特に顔編集における未開拓の領域を解決することを目指す。
- Editable-DeepSCは，従来の通信手法と比較して，より優れた顔編集性能を発揮する。
- 大幅な帯域幅削減を実現し，高解像度，分布外データにおいても有効性が確認された。
- 編集と通信を統合するJoint Editing-Channel Coding（JECC）により，意味相互情報が維持される。
Link: https://arxiv.org/abs/2411.15702
オーバーレイネットワーク構築：全体およびノード単位のメッセージ複雑度の改善 [cs.DC, cs.DS]目的：分散型オーバーレイネットワークの構築
- ピアツーピアネットワーク構築の基盤技術であり，スケーラビリティと効率性が重要。
- ネットワーク再構成時のメッセージ量が多く，効率的な構築方法が課題。
- メッセージ複雑度を削減し，迅速なネットワーク再構成を実現。
- 提案プロトコルは，WFT構築において$O(n \log n)$のメッセージ複雑度を達成。
- GOSSIP-replyモデルでは$O(\log n)$ラウンド，HYBRIDモデルでは$O(\log^2 n)$ラウンドで構築が可能。
- 両プロトコルは$O(n \log^2 n)$ビットの通信量を使用。
Link: https://arxiv.org/abs/2412.04771
有限ブロック長下でのML復号された脊髄コードのエラーフロア [cs.IT, math.IT]目的：脊髄コードにおけるエラーフロア現象の分析と閾値の導出
- 通信において，信頼性の高いデータ伝送は不可欠であり，誤り訂正符号は重要な役割を果たす。
- 従来の誤り訂正符号では，短いブロック長においてエラーフロアと呼ばれる性能限界が存在する。
- 本研究では，脊髄コードのエラーフロアを解析し，性能向上のための設計指針を示す。
- 脊髄コードは，ラプターコードやLDPCコードよりも優れたレート性能を示すことが知られている。
- 本研究により，高いSNR領域における脊髄コードのエラーフロア現象が明らかになった。
- 複数回のシンボル伝送はエラーフロアを下げる効果があるものの，SNR閾値には影響しないことが示された。
Link: https://arxiv.org/abs/2501.04989
和ランク計量における自己双対符号とLCD符号 [cs.IT, math.IT]目的：和ランク計量における自己双対符号およびLCD符号の存在と構成
- 線形ネットワーク符号や分散ストレージなど，幅広い応用分野を持つため。
- 和ランク符号の双対性理論は確立されつつあるが，自己双対符号やLCD符号の体系的な研究が不足している。
- ユークリッド空間における自己双対符号やLCD符号から，和ランク符号を構成する方法を確立する。
- 本研究では，和ランク計量における自己双対符号とLCD符号の定義を導入し，ユークリッド空間における対応する符号からの構成方法を提示した。
- 具体例として，良いパラメータを持つ巡回型自己双対和ランク符号および巡回型LCD和ランク符号を示した。
- さらに，漸近的に良い自己双対和ランク符号が存在することを示した。
Link: https://arxiv.org/abs/2502.02222
局所ギブスサンプリングにおける局所一様性の範囲外での拡張 [cs.DS]目的：高次元分布に対する局所的なクエリに基づくランダムサンプルの生成手法
- 高次元データの確率分布からの効率的なサンプリングは，統計物理学，機械学習など多くの分野で重要である。
- 既存の局所サンプリング手法は，局所一様性の仮定に依存しており，その適用範囲が限定されていた。
- 局所一様性の仮定なしに，より広範なスピンシステムに対する効率的な局所サンプリング手法を開発すること。
- 本研究では，許容型スピンシステムおよび真に反発的なスピンシステムに対して，線形時間の局所サンプラーを設計した。
- 特に，臨界状態近傍のイジングモデルに対する初の局所サンプラーを提示し，最大次数$\Delta$のグラフ上の$q=O(\Delta)$色の均一な適切な$q$-彩色に対する局所サンプラーを初めて開発した。
- これらの結果は，スピンシステムに対する局所サンプリングが，必ずしもグローバルサンプリングよりも著しく困難ではないことを示している。
Link: https://arxiv.org/abs/2502.10795
PolyVer：多言語システムモデリングと検証のための構成的アプローチ [cs.CL, cs.CL, cs.CL, cs.CL, cs.CL, cs.PL]目的：多言語システムの形式モデル構築と検証手法
- 現代のソフトウェアシステムは多様な言語で記述されることが多く，その検証が重要となっている。
- 既存の検証器は単一言語向けであり，多言語システム全体の検証には限界がある。
- 多言語システムを直接検証するための新しい手法を確立し，その有効性を示す。
- PolyVerは，抽象化，構成的推論，合成を組み合わせ，多言語システムの検証を直接行う。
- CやRustといったターゲット言語で更新関数を実装し，遷移システムとして形式モデルを構築する。
- 構文ガイド付き合成やLLMを用いて事前/事後条件契約を自動生成し，言語固有の検証器とモデルチェッカーを連携させる。
Link: https://arxiv.org/abs/2503.03207
サンドボックス内のエージェント：Minecraftのクラッシュバグ再現に関するエンドツーエンド手法 [cs.SE, cs.AI]目的：Minecraftにおけるクラッシュバグの再現
- ゲーム開発において，バグの迅速な修正は品質向上に不可欠である。特に，継続的に進化するゲームでは，その重要性が増す。
- Minecraftのようなゲームにおけるクラッシュバグの再現は，手動で行う必要があり，時間と労力がかかる。
- ユーザー報告されたバグ報告から，自動的にクラッシュバグを再現するフレームワークを開発し，ゲームテストの効率化を目指す。
- BugCraftは，LLMとMinecraft Wikiを活用し，バグ報告を再現手順に変換するStep Synthesizerと，視覚情報に基づいたLLMエージェントによるAction Modelを組み合わせる。
- BugCraft-Benchデータセットを用いた評価の結果，GPT-4.1を用いて34.9%のクラッシュバグをエンドツーエンドで再現することに成功した。
- 本研究は，複雑なゲーム環境におけるクラッシュバグの自動再現の実現可能性を示し，ゲームテストと開発の新たな道を開く。
Link: https://arxiv.org/abs/2503.20036
インコンテキスト学習による事前学習済みモデルへのコード構造知識の組み込み：コード翻訳への応用 [cs.SE, cs.AI]目的：コード翻訳における事前学習済み大規模言語モデルへのコード構造知識の組み込み
- コード翻訳は，異なるプログラミング言語間でのコードベース移行に不可欠であり，ソフトウェア開発効率向上に貢献する。
- 大規模言語モデルはコード翻訳で進歩する一方，ソースコードの構文構造の扱いは依然として課題である。
- 本研究は，既存モデルの学習を必要とせず，テスト時にコード構造知識を組み込む手法を提案する。
- 提案手法は，情報理論に基づいた例題選択により，従来の類似度・多様性に基づく手法よりも精度の高い知識の伝達を可能にする。
- 抽象構文木の網羅率(CAST)を指標として，効率的な例題選択アルゴリズムを開発し，理論的な近似保証を得た。
- 実験結果から，コード構造知識は学習時に無視されても推論時に効果的に組み込むことができ，モデルの規模拡大だけでは獲得できないことが示された。
Link: https://arxiv.org/abs/2503.22776
エージェント型LM：テストスメルの検出 [cs.SE]目的：テストスイートの信頼性と保守性の向上
- テストはソフトウェア品質保証の要であり，その信頼性維持は不可欠である。
- テストコードの品質劣化は，テストの信頼性を低下させ，保守を困難にする。
- テストスメルの自動検出と修正による，テストスイートの品質改善を目指す。
- 小規模なパラメータ数の言語モデルが，テストスメルの検出とリファクタリングに有効であることが示された。
- 特にPhi-4-14Bは高いリファクタリング精度(pass@5で75.3%)を示し，商用LLMに匹敵する性能をマルチエージェント構成で実現した。
- 生成されたコードを含むプルリクエストがオープンソースプロジェクトに提出され，6件がマージされた。
Link: https://arxiv.org/abs/2504.07277
行動距離の下界に関する証明の構築 [cs.LO]目的：行動距離の下界の構築手法
- 確率的遷移システムにおいて，行動距離は双シミュレーションなどの同値性の概念の堅牢な代替手段である。
- 行動距離の上界は比較的容易に示せるが，下界を示すことは困難である。
- 行動距離の下界を帰納的に導出するシステムを構築し，下界の証明を支援すること。
- ラベル付きマルコフ連鎖に対する行動距離の下界に関する誘導システムを開発した。
- この誘導システムは，行動距離との整合性（健全性）と近似的な完全性を示すことが証明された。
- 誘導システムと量的な意味論を持つ様相論理との間の構築的な対応関係を示し，より簡潔な証明を可能にした。
Link: https://arxiv.org/abs/2504.08639
GitBugs：重複検出，検索拡張生成などに関するバグレポート [cs.SE]目的：ソフトウェア品質向上のためのバグレポートデータセット
- ソフトウェアの品質は重要であり，バグレポートはその重要な指標となる。
- 既存のバグレポートデータセットは範囲が限定的，内容が古く，機械学習に必要なメタデータが不足している場合がある。
- この研究は，質の高いバグレポートデータセットを提供し，ソフトウェアエンジニアリング研究を支援することを目的とする。
- GitBugsは，Firefox，Cassandra，VS Codeを含む9つのオープンソースプロジェクトから15万件以上のバグレポートを含む，包括的で最新のデータセットである。
- Github，Bugzilla，JiraのIssueトラッカーからのデータを集約し，分類タスク用の標準化されたカテゴリカルフィールドと，重複バグ検出用の定義済みのtrain/test分割を提供している。
- 重複率や解決時間などのプロジェクトレベルの統計情報も提供し，自動バグレポート分析のベンチマークに貢献する。
Link: https://arxiv.org/abs/2504.09651
大規模言語モデルを用いたPythonライブラリ移行に関する実証研究 [cs.SE]目的：Pythonライブラリ間の移行における大規模言語モデルの有効性
- ソフトウェア開発において，ライブラリの更新や変更は頻繁に発生し，開発効率に大きく影響する。
- ライブラリ移行は手作業では時間と労力を要し，APIの違いからエラーが発生しやすいという課題がある。
- 大規模言語モデルを活用することで，ライブラリ移行作業の自動化と効率化を目指す。
- Llama 3.1，GPT-4o mini，GPT-4oの3つの大規模言語モデルをPyMigBenchを用いて評価した結果，移行関連コード変更の正答率はそれぞれ89%，89%，94%であった。
- また，開発者の移行時にパスしたテストを，それぞれ36%，52%，64%の移行で再現できた。
- 今回の結果から，大規模言語モデルはライブラリ間のコード移行に有効であることが示唆されるが，解決すべき課題も残されている。
Link: https://arxiv.org/abs/2504.13272
CodeCrash：コード推論における誤解を招く自然言語に対するLLMの脆弱性を明らかにする [cs.AI, cs.SE]目的：コード推論におけるLLMの脆弱性評価
- LLMはコード関連タスクで高い能力を示すが，その頑健性は未解明な点が多い。
- 自然言語のわずかな変化でLLMの推論が誤る可能性があり，信頼性に課題がある。
- LLMが自然言語に過度に依存する傾向を明らかにし，より堅牢なモデル開発を促す。
- 17のLLMを評価した結果，モデルは自然言語のヒントに頼る傾向があり，出力予測の性能が平均23.2%低下した。
- Chain-of-Thought推論を用いても，注意散漫や誤った推論により性能は平均13.8%低下し，批判的思考の欠如が示された。
- 大規模な推論モデルは頑健性が向上するものの，誤ったヒントにより自己矛盾を起こし，トークン消費量が増加し，深刻な認知的不協和が生じる「推論崩壊」現象が確認された。
Link: https://arxiv.org/abs/2504.14119
要求プライバシーを持つ多重メッセージ安全集約 [cs.CL, cs.IT, math.IT]目的：分散された利用者のローカル入力の線形結合の安全集約
- プライバシー保護は情報社会において不可欠であり，データ利用の促進と個人情報保護のバランスが重要である。
- 安全集約では，サーバーが利用者の入力情報を過度に知り得ることや，利用者がサーバーの計算内容を知ることなどが課題となる。
- この研究は，サーバーの要求を秘匿しつつ，ドロップアウトに対してもロバストな安全集約手法を確立する。
- 本研究では，サーバーの要求をランダム変数で暗号化し，オフラインでコード化された鍵を共有することで，効率的な安全集約を実現した。
- 線形結合の数が増加した場合，ロバストな対称秘匿計算を用いることで，計算内容を復元し，安全性を確保した。
- 提案手法は，線形結合数が1の場合に最適な通信レートを，それ以外の場合にもほぼ最適なレートを達成した。
Link: https://arxiv.org/abs/2504.20639
大規模言語モデルは過信しており，人間のバイアスを増幅する [cs.SE, cs.CY]目的：大規模言語モデルにおける過信と人間のバイアスの増幅
- 社会のあらゆる側面に革命をもたらす大規模言語モデルの利用が拡大しているため，その特性理解が重要である。
- 大規模言語モデルは人間が書いたデータで学習するため，人間のバイアスを内在しやすいという問題がある。
- 大規模言語モデルの過信傾向と，それが人間の判断に与える影響を明らかにすること。
- 評価の結果，調査した5つの大規模言語モデル全てが過信しており，正答率を過大評価していることが判明した。
- 人間の正答率は高度な大規模言語モデルと同程度であるが，過信の度合いは遥かに低い。
- 大規模言語モデルへの入力は人間の判断精度を向上させる一方で，過信度を著しく高めるという相反する効果を持つ。
Link: https://arxiv.org/abs/2505.02151
VeriFastの分離論理：粒度細かい並行プログラムのモジュール検証のためのlaterを持たない論理 [cs.PL]目的：粒度細かい並行プログラムのモジュール検証のためのVeriFast分離論理の形式化と健全性証明
- 並行プログラムの検証は，複雑さゆえに誤りが生じやすく，その信頼性確保が重要である。
- 従来の並行プログラム検証手法は，複雑なlaterモダリティを必要とし，実装や理解が困難である。
- laterモダリティを用いずに，粒度細かい並行プログラムの効率的かつ正確な検証を実現すること。
- VeriFastの分離論理の形式化と健全性証明を初めて行った。
- VeriFastの論理は，laterモダリティを持つ最先端の論理Irisと比較検討された。
- Irisライクなlaterなし推論との比較を通じてVeriFastの独自性が示された。
Link: https://arxiv.org/abs/2505.04500
QiMeng-CodeV-R1: 推論能力強化型Verilog生成 [cs.LG, cs.AR, cs.PL]目的：Verilog生成LLMの学習フレームワーク
- EDA分野の自動化は，設計効率向上に不可欠であり，複雑化する現代の電子機器開発を支える。
- 自然言語からのVerilog自動生成は，検証環境の不足，高品質なデータペアの希少性，計算コストの高さが課題である。
- 本研究は，検証可能な報酬を用いた強化学習により，これらの課題を克服し，Verilog生成の精度向上を目指す。
- 提案手法CodeV-R1は，ルールベースのテストベンチ生成器とデータ合成法により，高品質なデータセットを構築した。
- Distill-then-RLパイプラインとDAPOアルゴリズムの導入により，学習コストを削減し，推論能力を強化した。
- VerilogEval v2とRTLLM v1.1において，既存技術を12～20%上回るpass@1を達成し，671B DeepSeek-R1を超える性能を示した。
Link: https://arxiv.org/abs/2505.24183
SysLLMatic：大規模言語モデルはソフトウェアシステム最適化ツールである [cs.RO, cs.MA, cs.RO, cs.SE, cs.PF]目的：ソフトウェアシステムの自動最適化
- ソフトウェア性能向上と省エネルギー化は，現代社会における重要な課題である。
- 既存の最適化手法は手動調整やコンパイラに依存しており，多様なコードベースへの適用が困難である。
- 大規模な実用ソフトウェアシステムにおけるLLMの適用可能性を高める。
- SysLLMaticは，LLMと性能診断フィードバック，そして43の最適化パターンカタログを統合することで，ソフトウェアコードを自動的に最適化する。
- HumanEval_CPP，SciMark2，DaCapoBenchのベンチマークにおいて，SysLLMaticはレイテンシ，スループット，エネルギー効率，メモリ使用量，CPU使用率などの性能を向上させた。
- 大規模アプリケーションコードにおいて，既存のコンパイラ最適化を上回り，レイテンシが平均1.5倍，スループットが1.76倍に向上した。
Link: https://arxiv.org/abs/2506.01249
MLorc：メモリ効率の良い大規模言語モデル適応のためのモーメンタム低ランク圧縮 [cs.LG, cs.IT, math.IT, math.OC]目的：大規模言語モデルの適応におけるメモリ効率の向上
- 近年，大規模言語モデルの規模が拡大しており，自然言語処理の様々なタスクで高い性能を発揮する。
- 大規模言語モデルのフルパラメータでのファインチューニングは，膨大なメモリを必要とするという課題がある。
- 本研究は，メモリ消費量を削減しつつ，フルパラメータ学習の性能を維持・向上させることを目指す。
- MLorcは，パラメータ行列のモーメンタムを圧縮・再構成することで，メモリ使用量を削減する新しい学習パラダイムである。
- LoRAと比較して，MLorcは重み更新行列に固定ランク制約を課さず，フルパラメータ学習を可能にする。
- GaLoreと比較して，勾配ではなくモーメンタムを直接圧縮することで，フルパラメータファインチューニングの学習ダイナミクスをより良く維持する。
Link: https://arxiv.org/abs/2506.01897
合成数における高次の要素の決定的な探索について [cs.DS, math.NT]目的：合成数と目標とする次数に対する高次要素の探索
- 暗号技術の安全性は，大きな合成数の素因数分解の困難性に依存する
- 現在の素因数分解アルゴリズムは，特定の条件下で効率が低い
- より緩い条件下で，高次要素を効率的に探索し，素因数分解を支援する
- 本研究では，合成数Nと目標次数D (D ≧ N^(1/6)) が与えられた場合に，時間計算量 D^(1/2+o(1)) で，次数が少なくともDである要素aまたはNの自明でない因子を見つける決定的なアルゴリズムを提示する。
- このアルゴリズムは，D ≧ N^(2/5)というより強い仮定の下で同様のアルゴリズムを設計したHittmeirの研究を改善する。
- Nがr (r≧2) のべき乗の約数を持つと仮定した場合，D ≧ N^(1/6r)という仮定の下で同じ保証が得られる。
Link: https://arxiv.org/abs/2506.07668
三連結平面グラフにおける潜在的maximal cliqueを生成する多項式遅延アルゴリズム [cs.CL, cs.DS]目的：三連結平面グラフにおける潜在的maximal cliqueの生成
- グラフ理論は，ネットワークや関係性のモデリングに不可欠であり，様々な応用分野で重要である。
- planar graphにおけるmaximal cliqueの効率的な検出は，計算量的に困難な問題である。
- 三連結平面グラフにおける潜在的maximal cliqueを効率的に生成するアルゴリズムを開発すること。
- 三連結平面グラフの潜在的maximal cliqueの新たな特徴付けを開発した。
- 開発した特徴付けを用いて，潜在的maximal cliqueを多項式遅延で生成するアルゴリズムを提案した。
- 提案アルゴリズムは，Bouchitt{\'e}とTodincaの動的計画法アルゴリズムと組み合わせることで，一般平面グラフのtreewidthを計算する効率的な手法を提供する。
Link: https://arxiv.org/abs/2506.12635
強化学習による長文脈・複数ターンソフトウェアエンジニアリングエージェントの学習 [cs.CL, cs.HC, cs.CL, cs.LG, cs.CL, cs.SE]目的：ソフトウェアエンジニアリングにおける強化学習エージェントの性能向上
- ソフトウェア開発の自動化は，生産性向上やコスト削減に不可欠である。
- 従来の強化学習は，単一ターン問題に偏っており，複雑な複数ターン対話に対応できない。
- 複数ターンの対話が必要なソフトウェアエンジニアリングにおけるエージェントの学習方法を確立する。
- Qwen2.5-72B-Instructモデルに提案手法を適用した結果，SWE-bench VerifiedベンチマークのPass@1が11%から39%に向上した。
- SWE-rebenchのMay/Juneスプリットにおいて，Pass@1がそれぞれ35%/31%を達成し，DeepSeek-V3-0324やQwen3-235B-A22Bなどの大規模モデルと遜色ない性能を示した。
- 本手法は，オープンウェイトモデルを用いて，複数ターン対話型タスクに適したエージェントを効率的に学習するための実用的なアプローチを提供する。
Link: https://arxiv.org/abs/2508.03501
投票に基づく半並列作業証明プロトコル [cs.CR, cs.DC, cs.DM, cs.IT, math.IT, math.PR]目的：並列作業証明プロトコルの安全性，トランザクション処理能力，および確認遅延の改善
- ブロックチェーン技術の普及に伴い，コンセンサスプロトコルの効率性と安全性の向上が重要となっている。
- 既存の並列PoWプロトコルは，ナカモトコンセンサスよりもインセンティブ攻撃に対して脆弱であるという問題がある。
- 既存プロトコルの脆弱性を克服し，より安全で効率的な並列PoWプロトコルを提案すること。
- 提案する投票に基づく半並列PoWプロトコルは，通信オーバーヘッド，スループット，トランザクション競合においてナカモトコンセンサスおよび既存の並列PoWプロトコルを上回る性能を示す。
- プロトコルは，投票者とリーダー間のトランザクション手数料の公平な分配を可能にし，インセンティブ適合性を高める。
- 最先端の分析とマルコフ決定過程モデルを用いて，プロトコルの整合性とインセンティブ攻撃に対する耐性を検証した。
Link: https://arxiv.org/abs/2508.06489
ORCASコード：低複雑度復号を持つ極性符号の柔軟な一般化 [cs.CL, cs.IT, eess.SP, math.IT]目的：低複雑度ソフトデシジョン復号アルゴリズムを持つチャネル符号
- 通信の信頼性を高めるため，効率的な誤り訂正符号が不可欠である。
- 極性符号は高性能だが，符号長に制限があり柔軟性に欠ける場合がある。
- 極性符号を超える性能と柔軟性を持つ新しい符号構成を提案する。
- 提案するORCASコードは，極性符号と同等以上の性能を示すことが確認された。
- 実用的なパラメータにおいて，ブロック誤り率で最大0.5dBの性能向上を達成した。
- ORCASコードは，従来の極性符号よりも符号長に関して柔軟性がある。
Link: https://arxiv.org/abs/2508.09744
SaraCoder：リソース最適化されたリポジトリレベルのコード補完のための意味的・構造的ヒントの調整 [cs.SE, cs.CL, cs.IR, cs.PL]目的：リポジトリレベルのコード補完における精度と信頼性の向上
- ソフトウェア開発の生産性向上は重要な課題であり，コード補完はその有効な手段である。
- 従来の検索方法は，限られたコンテキストウィンドウ内で情報の冗長性や多様性の欠如に苦しむ。
- 限られたコンテキスト内で情報の多様性と代表性を最大化し，コード補完の精度向上を目指す。
- SaraCoderは，意味的関係の抽出，重複の排除，構造的類似性の評価，結果の再ランキングにより，検索候補を体系的に改善する。
- 依存性分析によるクロスファイルシンボルの曖昧性解消モジュールを導入し，識別子の曖昧性を正確に解決する。
- CrossCodeEvalとRepoEval-Updatedのベンチマークにおいて，既存のベースラインを複数言語・モデルで上回る性能を示した。
Link: https://arxiv.org/abs/2508.10068
セキュリティを意識したグループ相対ポリシー最適化による，安全で説明可能なスマートコントラクト生成に向けて [cs.CR, cs.AI, cs.SE]目的：安全で説明可能なスマートコントラクト生成のためのフレームワーク開発
- スマートコントラクトは高額な資産管理を自動化するが，脆弱性は甚大な経済的損失に繋がる可能性がある。
- 大規模言語モデル（LLM）は不透明な推論プロセスとセキュリティ脆弱性の蔓延が課題である。
- 人間のセキュリティ分析を模倣し，セキュリティコンパイル成功率，セキュリティ適合性，フォーマット正しさを最適化する。
- SmartCoder-R1は756の現実世界の関数を用いたベンチマークにおいて，5つの主要指標で最先端の性能を達成した。
- 特に，FullRateは最も強いベースラインであるDeepSeek-R1と比較して45.79%の相対的な改善を示した。
- 生成された推論も，機能性(82.7%)，セキュリティ(85.3%)，明確性(90.7%)において高い評価を得た。
Link: https://arxiv.org/abs/2509.09942
符号化回折パターンからの位相復元におけるPhaseLiftの復元性能 [math.NA, cs.IT, cs.NA, math.IT]目的：符号化回折パターンを用いたフーリエ計測における位相復元問題に対するPhaseLiftアルゴリズムの復元性能の評価
- 位相復元は，X線結晶構造解析やMRIなど，様々な画像再構成問題の基礎となる重要な技術である。
- ノイズ存在下におけるPhaseLiftの安定性に関する理論的な保証は十分ではなく，復元誤差の評価が課題であった。
- PhaseLiftの復元誤差が，平均ノイズの大きさに依存するSoltanolkotabiの予想を理論的に証明することを目指す。
- 敵対的ノイズ条件下において，PhaseLiftの復元誤差は$O\xkh{ \sqrt{\frac{\norm{\vw}\log n }{\sqrt m}}}\norm{\vx_0}$で上限されることが示された。
- 平均ゼロの亜ガウスノイズベクトルの場合，復元誤差の上限と対応するミニマックス下限が提供された。
- これらの結果は，Soltanolkotabiの予想に大きく貢献し，ノイズの多い符号化回折パターン計測におけるPhaseLiftの安定性に関する新たな知見を提供する。
Link: https://arxiv.org/abs/2509.10300
研究ソフトウェア科学はメタ科学の一分野であるか [cs.SE]目的：研究ソフトウェア科学の分類
- 科学研究における計算手法の利用増加に伴い，その信頼性がソフトウェアの品質に依存するようになった。
- 研究ソフトウェアの品質，再現性，透明性は課題であり，科学的誠実性や発見に影響を与える可能性がある。
- 本研究は，研究ソフトウェア科学をメタ科学の一分野として認識することの意義を明らかにすることを目指す。
- 研究ソフトウェア科学は，計算再現性の向上など，メタ科学の中核的な目標に貢献している。
- その分類は，メタ科学の定義の広さ（科学改善へのあらゆる取り組みか，または体系的・認識論的構造に焦点を当てるか）に依存する。
- 研究ソフトウェア科学は，メタ科学と整合性があり，場合によってはその範疇に含まれる，独立した学際分野として理解するのが適切である。
Link: https://arxiv.org/abs/2509.13436
AIプログラミング支援の「マシュー効果」：ソフトウェア進化における隠れた偏り [cs.SE]目的：AIプログラミング支援がソフトウェア生態系に与える影響の解明
- ソフトウェア開発は社会基盤であり，その効率化と質の向上が重要である。
- AI支援が既存の人気格差を拡大し，多様性と革新性を阻害する可能性がある。
- AI支援による人気格差の定量的な評価と，将来への影響の考察。
- 大規模な実験の結果，人気のあるプログラミング言語やフレームワークほど，LLM生成コードの成功率が高いことが明らかになった。
- この結果は，AIシステムが既存の優位性を強化し，ソフトウェア生態系の多様性を損なう可能性を示唆する。
- 「マシュー効果」を定量的に特徴付け，今後のソフトウェア進化への示唆を得た。
Link: https://arxiv.org/abs/2509.23261
迷路の攻略：大規模言語モデルを用いたパス依存型ユニットテスト生成 [cs.SE, cs.AI]目的：ユニットテストの自動生成
- ソフトウェア品質を保証する上で，ユニットテストは不可欠である。
- 既存の手法はパス非依存であり，複雑な制御フロー構造を考慮できない。
- 深い制御フロー構造を考慮した高カバレッジなテスト生成を目指す。
- JUnitGenieは，コード知識とLLMのセマンティック能力を組み合わせることで，パス依存型ユニットテスト生成を実現した。
- 10のJavaプロジェクトにおける2,258個の複雑なメソッドを対象に評価した結果，JUnitGenieは既存手法と比較してブランチカバレッジを平均29.60%，行カバレッジを平均31.00%向上させた。
- 生成されたテストケースによって実際にバグが発見され，開発者によって修正されたことを示した。
Link: https://arxiv.org/abs/2509.23812
決定性有限オートマトンの例からの効率的な分解識別 [cs.SE]目的：決定性有限オートマトンの例からの分解識別
- オートマトンの学習は，形式言語理論や計算機科学における基礎的課題である。
- 従来のDFA学習法は，大規模かつ複雑なオートマトンになりやすく，再利用性や可読性に課題がある。
- 複数のDFAの積としてシステムを表現することで，モジュール性と効率性を向上させる。
- 本研究では，3値DFAを導入することで，従来のAPTAに基づくSATエンコーディングの冗長性を削減し，効率を大幅に向上させた。
- パレート最適分解問題に対して著しい効率改善を達成し，状態数最小化を重視した分解問題のスケーラブルな解法を確立した。
- オートマトンの表現に関する近年の進展とDFA分解を結びつける新たなフレームワークを提案した。
Link: https://arxiv.org/abs/2509.24347