arXiv雑要約

プログラム - 2026/05/01 公開

  • データフローを意識した事前学習と制約付きデコーディングによる言語モデルを用いた静的プログラムスライシング [cs.SE, cs.AI, cs.PL]目的:静的プログラムスライシングの自動化
    • ソフトウェアの品質向上に不可欠であり,保守性や信頼性の高いコードを実現するために重要である。
    • 既存の機械学習アプローチは,正確な依存関係のモデリングと,幻覚(事実に基づかない情報の生成)が課題となっていた。
    • データフローを正確に捉え,幻覚を抑制することで,より正確なプログラムスライシングを実現すること。
    • 提案手法Sliceformerは,データフローグラフを活用した事前学習と制約付きデコーディングにより,依存関係モデリングの精度を向上させた。
    • JavaとPythonのベンチマークテストにおいて,最先端の既存手法と比較して,ExactMatchで最大22%の性能向上を達成した。
    • Sliceformerは,静的プログラムスライシングをシーケンス・ツー・シーケンス問題として再構築することで,効率的なスライス予測を可能にした。

    Link: https://arxiv.org/abs/2604.26961

  • リテレート実行 [cs.PL]目的:プログラム実行と説明の統合
    • プログラムの理解と保守性は,ソフトウェア開発における重要な課題である。
    • 従来のドキュメントは静的であり,プログラムの実行状況と乖離しやすい。
    • プログラム実行と連動した動的な説明によって,理解を深めることを目指す。
    • リテレート実行は,ドキュメントや可視化をプログラム実行と並行して計算し,統合する。
    • Fluid言語の開発により,入力と出力間の依存関係を追跡し,インタラクティブな探索を可能にした。
    • 可視化,Provenance,説明を統合することで,プログラムの探索性と自己説明性を向上させる。

    Link: https://arxiv.org/abs/2604.26967

  • Horn DLオントロジーのABoxおよびクエリ例への適合:シミュレーション量化子と有限モデル [cs.LO, cs.AI]目的:記述論理オントロジーの適合問題
    • 知識表現と推論において,オントロジーの自動構築は重要な課題である。
    • 既存研究では,表現力の高いDLが扱われてきたが,軽量なHorn DLの研究は限定的である。
    • EL/ELI等のHorn DLに対する適合問題の計算複雑性を明らかにすること。
    • EL/ELIにおいて,アトミッククエリに対する適合問題はPTimeで解けることが示された。
    • Rooted CQ/UCQに対する適合問題は,ELではSigma_P^2-complete, ELIではExpTime-completeである。
    • 底概念の追加は,これらの複雑性に影響を与えないことが確認された。

    Link: https://arxiv.org/abs/2604.26976

  • 二段階選好に基づく意味論における取消し可能な条件義務 [cs.LO, cs.AI]目的:取消し可能な条件義務のモデリング
    • 規範的推論は,倫理や法律など,社会生活において重要な役割を果たす。
    • 既存の規範的推論アプローチには,情報更新時の柔軟性や正確性に課題があった。
    • 新しい情報に基づいて義務を撤回できる柔軟な規範体系を構築すること。
    • 本研究では,選好に基づく意味論を拡張し,二段階構造を導入することで,取消し可能な条件義務のモデル化を試みた。
    • 理想と正常性の二つの順序付けを用いることで,従来の限界を克服し,より洗練されたアプローチを実現した。
    • 提案する枠組みは,制約入力/出力(I/O)論理との関連性も示され,規範的推論の標準との整合性も確認された。

    Link: https://arxiv.org/abs/2604.26977

  • UCSC-NLP,SemEval-2026タスク13におけるマルチビュー一般化と機械生成コード検出の診断分析 [cs.CL, cs.RO, cs.SE]目的:機械生成コードの検出に関する研究
    • 大規模言語モデルの発展に伴い,コードの真正性の判断は学術的誠実性,採用評価,ソフトウェアセキュリティにおいて重要である。
    • 既存の手法では,言語やドメインが異なるデータに対する汎化性能が課題となっていた。
    • マルチビュー学習によるロバストなコード検出モデルの構築と,クラス不均衡問題への対処を目指す。
    • UniXcoder-baseをマルチビュー学習でファインチューニングし,検証セットで0.993,テストセットで0.845のmacro F1スコアを達成した。
    • 多クラス識別において,クラス不均衡が性能低下を引き起こすことが確認された。
    • クラス重み付き学習により,macro F1スコアが大幅に改善し,不均衡データに対する有効性が示された。

    Link: https://arxiv.org/abs/2604.26990

  • スペクトル疎化を用いた高速かつ忠実なエッジバンドル [cs.DS]目的:エッジバンドルの高速化と忠実性の向上
    • 大規模グラフの可視化において,エッジバンドルは複雑さを軽減する重要な手法である。
    • 既存手法は,歪みや曖昧さを生じさせやすく,計算コストが高いという課題がある。
    • スペクトル疎化を用いて,グラフの構造を維持しつつ高速で忠実なエッジバンドルを実現する。
    • 提案手法SEBは,既存手法と比較して歪みと曖昧さの点で平均46%と17%の改善を達成した。
    • フレームワークFEBは,疎化により元の手法よりも61%高速に処理可能でありながら,同程度の品質を維持した。
    • FBQを用いて評価した結果,FEBは元のエッジバンドルの構造を74%の類似度で忠実に再現できることが示された。

    Link: https://arxiv.org/abs/2604.26994

  • 適応的・AI拡張セキュリティテスト:プログラム解析,フィードバック駆動テスト,およびハイブリッド学習ベースのアプローチに関する体系的サーベイ [cs.SE, cs.CR, cs.PL]目的:適応的・AI拡張セキュリティテストに関する研究の体系的サーベイ
    • ソフトウェア開発の高速化に伴い,リリース前のセキュリティ確保が重要性を増している。
    • 従来の解析ツールは警告が多量で手動での選別が必要であり,非適応的な運用に課題がある。
    • プログラム構造と適応的テスト機構の乖離を解消し,より効率的なセキュリティテストを実現する。
    • 本サーベイでは,プログラム解析,DevSecOps,フィードバック駆動ファジング,LLMベースのテスト生成,ハイブリッドシステムの5つの領域における55の研究を分析した。
    • 構造的プログラム表現と適応的テスト機構の断絶(構造-適応的断片化)が確認された。
    • 既存システムでは,人間の選別シグナルを構造モデルの改善に活用するフィードバックループが存在しない。

    Link: https://arxiv.org/abs/2604.27000

  • LLM生成暗号Rustコードのセキュリティ評価 [cs.CR, cs.SE]目的:LLM生成暗号Rustコードのセキュリティ特性
    • セキュリティを重視するコード生成において,LLMの利用が拡大しており,その安全性評価が不可欠である。
    • LLM生成コードのセキュリティは未検証な部分が多く,脆弱性を含む可能性が懸念される。
    • LLM生成暗号コードの脆弱性を明らかにし,安全な利用のための指針を提供する。
    • 生成されたコードのコンパイル成功率は23.3%に留まり,LLMによる暗号コード生成には課題があることが示された。
    • CodeQLと独自開発の解析器により,コンパイル成功コードの57%に脆弱性が確認され,汎用解析ツールだけでは不十分であることが示された。
    • プロンプト戦略が結果に有意な影響を与え,特に思考連鎖プロンプトは性能が低い傾向にあった。

    Link: https://arxiv.org/abs/2604.27001

  • 精度を超えて:ソフトウェア工学のシステマティック文献レビューにおける証拠スクリーニングにおけるLLMの変動性 [cs.SE, cs.AI]目的:ソフトウェア工学のシステマティック文献レビューにおける証拠スクリーニングにおけるLLMの性能と変動性の評価
    • システマティック文献レビューは信頼性の高い証拠に基づいた意思決定に不可欠であり,その効率化は重要である。
    • 文献スクリーニングはコストと時間がかかり,担当者によるばらつきが生じやすいプロセスである。
    • LLMの性能変動を定量化し,古典的なモデルとの比較を行い,LLM導入の妥当性を判断する。
    • LLMは著しい異質性を示し,温度ゼロでも非決定論的な挙動が見られた。
    • アブストラクトの有無が性能に決定的な影響を与え,タイトルやキーワードの追加は効果が限定的であった。
    • LLMと古典的なモデルの性能差は一貫せず,LLMの優位性を一般化することは難しい。

    Link: https://arxiv.org/abs/2604.27006

  • ACAS-Xuルックアップテーブルのバイナリ決定図による圧縮 [cs.LO, cs.NE]目的:ACAS-Xuルックアップテーブルの圧縮手法
    • 航空機の衝突回避システムは安全性が不可欠であり,そのロジックの正確性が求められる。
    • 従来のルックアップテーブルはメモリ消費量が大きく,組み込みシステムへの実装が課題となる。
    • ルックアップテーブルのメモリ使用量を削減しつつ,正確性と検証可能性を確保すること。
    • バイナリ決定図(BDD)を用いることで,ACAS-Xuルックアップテーブルのメモリ使用量を大幅に削減できることが示された。
    • BDDによる表現は,元のテーブルと完全に同等であり,正確な検証と推論が可能である。
    • 本手法は,低遅延で予測可能な実行を実現し,組み込みプラットフォームへの展開に適している。

    Link: https://arxiv.org/abs/2604.27008

  • 有限ホライズン一次ランクプロファイル:正則言語における研究 [cs.HC, cs.FL, cs.LO]目的:正則言語のメンバーシップを,長さがn以下の全ての単語に対して正しく分類するために必要な最小限の量化子ランク
    • 計算機科学の基礎であり,言語理論は形式言語の構造と性質を研究する上で不可欠である。
    • 量化子ランクの決定は,言語の複雑さを測る上で重要な課題であり,効率的なアルゴリズム設計に影響を与える。
    • 正則言語における量化子ランクの成長率を明らかにすることで,言語の複雑さの理解を深める。
    • 正則言語の有限ホライズン一次ランクプロファイルは,対数関数的に成長するか,定数的に成長するかのいずれかである。
    • 言語の構文的モノイドが非周期的な場合,ランクプロファイルは定数オーダーで成長する。
    • 構文的モノイドが周期的な場合,ランクプロファイルは対数オーダーで成長する。

    Link: https://arxiv.org/abs/2604.27024

  • エネルギー効率の良いモデル推論のためのLLM誘導型ランタイムパラメータ最適化 [cs.SE, cs.LG]目的:エネルギー効率の良いモデル推論のためのランタイムパラメータ最適化
    • 大規模言語モデルの利用拡大に伴い,そのエネルギー消費が大きな課題となっている。
    • 最適なランタイムパラメータの選択には専門知識が必要であり,従来の最適化手法は時間がかかる。
    • LLMを活用し,迅速かつ効率的にエネルギー消費を最小化するランタイムパラメータを特定すること。
    • LLMと人間の協調により,従来の探索手法よりも迅速にエネルギー効率の良い推論パラメータを発見できる。
    • 改良されたプロンプトテンプレートは,ベースラインと比較して平均3.4回のプロンプトで収束し,低いエネルギー消費量/トークンを達成した。
    • 改良されたプロンプトテンプレートは,Sobolサンプリングよりも収束速度が速いことが示された。

    Link: https://arxiv.org/abs/2604.27032

  • オンライン単調距離測度埋め込み [cs.DS]目的:オンライン距離測度埋め込みの歪み
    • オンラインアルゴリズム設計の基礎であり,効率的なデータ処理に不可欠である。
    • 従来のオンライン埋め込みには歪みに関する強い下限が存在する。
    • 単調性を許容することで,既存の下限を打破し,より良い埋め込みを可能にする。
    • 本研究では,距離が時間と共に単調に減少する「オンライン単調距離測度埋め込み」を提案した。
    • この緩和により,HSTへの埋め込み歪みを$O(\log^2 n)$に抑えることが可能になった。
    • 動的変形においては,同時存在点数の上限$l$に対する$O(l \log l)$の歪みを持つ確率的埋め込みを提示した。

    Link: https://arxiv.org/abs/2604.27059

  • 分散型線形符号化配置を持つ符号化キャッシュシステムについて [cs.IT, math.IT]目的:分散型線形符号化配置における符号化キャッシュシステムの限界
    • ネットワーク利用のピーク時負荷軽減が期待され,帯域幅とストレージのトレードオフを実現する技術。
    • 中央集権的な配置は同期が必要となり,スケーラビリティに課題がある。
    • 分散配置における線形符号化配置の性能限界を明らかにする。
    • 各ユーザが独立に線形符号化シンボルをキャッシュする分散型システムを分析した。
    • 最悪時負荷の上限と下限を導出し,特定の条件下で一致することを示した。
    • 提案する限界は,分散型符号化キャッシュシステムの性能評価に役立つ。

    Link: https://arxiv.org/abs/2604.27073

  • どこで失敗したか:組み込み型オープンソースソフトウェアのビルド失敗の再現 [cs.SE]目的:組み込み型オープンソースソフトウェアにおけるビルド失敗の再現性確保
    • 組み込みシステム開発では,ハードウェアとソフトウェアの連携が不可欠であり,継続的インテグレーション(CI)が重要である。
    • CIビルドは,クロスコンパイルやボード設定の複雑さから頻繁に失敗するが,ログの再利用が困難である。
    • CIログの標準化と再現性の高い環境を提供し,ビルド失敗の解析を容易にすることを目指す。
    • PhantomRunを用いることで,4628回の失敗したCI実行のうち91.8%のビルドを再構築できた。
    • 再構築されたビルドは,元のビルドと高い一致度を示し,タイムスタンプや非決定的な並び替えの違いのみであった。
    • PhantomRunは,CI失敗の長期的な研究を可能にする,均一な形式でのビルド成果物とメタデータの提供を実現した。

    Link: https://arxiv.org/abs/2604.27075

  • LLMの寿命到達時:本番システムにおける確信度のあるモデル移行のためのフレームワーク [cs.AI, cs.LG, cs.SE]目的:LLMベースシステムのモデル移行手法
    • LLM技術は急速に進展しており,ビジネスへの応用が拡大している。
    • LLMは陳腐化が早いため,継続的なモデル更新が必要となる。
    • 本番環境でのモデル移行における品質保証と評価効率のバランスが課題である。
    • 本研究では,人間による判断との比較を通して自動評価指標を校正するベイズ統計アプローチを提案する。
    • 実世界の質問応答システムにおいて,正確性,拒否行動,スタイル遵守の評価を通して適切な代替モデルを特定した。
    • このフレームワークは,LLMベース製品を展開する企業にとって,モデル移行を効率的かつ信頼性の高いものにする。

    Link: https://arxiv.org/abs/2604.27082

  • 分子通信のための低複雑度ランレングス制限ISI軽減符号 [cs.IT, math.IT]目的:分子通信における信頼性向上に向けた符号方式
    • 分子通信は,ナノスケールでの情報伝達手段として注目されており,その実現には様々な課題が存在する。
    • 分子通信では,分子の拡散によるシンボル間干渉が深刻であり,信頼性の高い伝送を妨げる要因となっている。
    • 本研究は,計算資源やメモリ制約下でも利用可能な符号方式を開発し,分子通信の性能向上を目指す。
    • 従来の符号方式は,符号ブック全体の生成と保存が必要であり,リソース制約のある分子通信環境には不向きであった。
    • 本研究では,カバーのランキングフレームワークに基づき,符号ブックの保存量を指数関数的に削減することに成功した。
    • シミュレーション結果から,本手法により,より高次元の符号化が可能となり,ビット誤り率の改善に貢献することが示された。

    Link: https://arxiv.org/abs/2604.27104

  • EvoSuiteを用いたモジュールテストの有効性 [cs.SE]目的:Javaオブジェクト指向プログラムに対するモジュール型ランダムテストの有効性
    • ソフトウェアの品質向上には,効率的なテスト手法が不可欠である。特に,大規模システムではモジュールテストが重要となる。
    • EvoSuiteのモジュールテストモードは,非対象メソッドの呼び出し制限により,十分なカバレッジが得られない場合がある。
    • EvoSuiteのモジュールテストを強化し,より高いカバレッジを実現することを目指す。
    • 提案手法\textsc{emote}は,EvoSuiteに非対象メソッドの呼び出しを許可する修正を加えることで,カバレッジ向上を実現した。
    • SF100ベンチマークの一部を用いた評価により,\textsc{emote}は対象メソッドのカバレッジを平均15.15%向上させた。
    • この改善は,開発者が作成するファジングドライバーのアイデアに基づき,状態の適切な初期化を可能にした結果である。

    Link: https://arxiv.org/abs/2604.27112

  • 最大平衡二部完全グラフ近似アルゴリズムの改良 [cs.DS]目的:最大平衡二部完全グラフの発見
    • グラフ理論は,ネットワーク分析や組み合わせ最適化など,様々な分野に応用されている重要な研究分野である。
    • 二部完全グラフの最大化問題はNP困難であり,現実的な規模のグラフに対して厳密解を得ることは難しい。
    • 本研究は,近似アルゴリズムを通じて,より効率的に最大平衡二部完全グラフを見つけることを目指す。
    • 本研究では,既存の近似アルゴリズムよりも改良された,$\left(\frac{n}{\widetilde{\Omega}\left((\log n)^3\right)}\right)$-近似アルゴリズムを提案した。
    • 提案アルゴリズムは,Chalermsookらのアルゴリズム(2020)の近似比を改善し,彼らの未解決問題に答えた。
    • 近似比は,Feige(2004)の最大クリーク問題に対する近似比と,$O(\log \log n)$の係数を除いて一致する。

    Link: https://arxiv.org/abs/2604.27141

  • 距離オラクル技術を用いた新しい直径近似 [cs.DS]目的:グラフの直径近似手法の開発
    • グラフの直径計算は,アルゴリズム研究やファイングレインド複雑性において重要な課題である。
    • 既存の直径近似アルゴリズムは,理論的な下界に追いついていない点が課題である。
    • 距離オラクル技術を応用し,決定的な直径近似アルゴリズムを開発することでこの課題を解決する。
    • 本研究により,既存のCairo, Grossi, Rizzi(CGR)の直径近似手法を決定化することが可能になった。
    • 距離オラクルにおける中心的な技術の決定化も進め,新たな直径近似アルゴリズムを提案した。
    • これらの技術は,最短経路近似の他の分野における決定化にも応用できることが示された。

    Link: https://arxiv.org/abs/2604.27142

  • CI-Repair-Bench:CIワークフローによる自動パッチ検証のためのリポジトリ対応ベンチマーク [cs.SE]目的:CI (継続的インテグレーション)における障害に対するリポジトリレベルのプログラム修理の評価
    • 現代のソフトウェア開発において,CIはリポジトリレベルの正しさを保証する上で不可欠である。
    • CI障害の診断と修理は困難であり,従来のプログラム修理ベンチマークでは対応が不十分である。
    • 実際のCIワークフローに基づく,CI検証されたリポジトリレベルのプログラム修理を評価するベンチマークを提供する。
    • CI-Repair-Benchは,GitHub Actionsの実際の実行から収集された567件のCI障害インスタンスを含む。
    • 自動修理は,フォーマットやリンティングなどのツールで強制される局所的な障害に対して最も有効であることが示された。
    • 環境,依存関係,構成に関連する障害は依然として難しく,最高性能のLLMでも18.9%の修理成功率であった。

    Link: https://arxiv.org/abs/2604.27148

  • 構築途上の理論:仕様が進化する研究ソフトウェアのための言語モデルのオーケストレーション [eess.SY, cs.SY, cs.SE, cs.AI]目的:研究ソフトウェアにおける,仕様が進化する状況下での言語モデルの運用方法
    • 研究ソフトウェアは,コードと理論の両方が重要であり,それらの整合性を保つことが不可欠である。
    • 言語モデルの利用において,誤った主張の蓄積や,コードと理論の不整合といった問題が存在する。
    • 言語モデルを用いた研究ソフトウェア開発において,コード,理論,文書の一貫性を維持し,継続的な改善を可能にすること。
    • Comet-Hという反復的なプロンプト自動化システムを提案し,アイデア出し,実装,評価,根拠付け,論文執筆を統合的に行う環境を構築した。
    • プロンプト選択を文脈的バンディット問題として捉え,透明性の高いスコアリングシステムと未完了タスクの記録により,一貫性のある長期的な追跡を可能にした。
    • Python静的解析ツールA3を開発し,90ケースのベンチマークでF1スコア0.768を達成,既存のベースライン(0.364)を上回る性能を示した。

    Link: https://arxiv.org/abs/2604.27209

  • 接続要件を満たす疎な時間グラフの設計 [cs.DB, cs.RO, cs.CY, cs.DS, cs.DM, math.CO]目的:部分的な接続要件を満たすために必要なエッジ数の最適化
    • 時間グラフの接続性は,グラフ理論とゴシップ理論の両方において重要な研究分野である。
    • すべての頂点を接続するには最低でも $2n-4$ 本のエッジが必要であり,効率的な接続方法が課題である。
    • 特定の接続要求を満たす時間グラフを最小限のエッジで構築する方法を解明する。
    • 要求グラフの接続成分数と最小指向性フィードバック頂点集合のサイズに基づいて,必要な時間的アーク数を決定した。
    • この問題はNP-完全であるが,指向性フィードバック頂点集合問題の固定パラメータ追跡可能性を受け継ぐ。
    • 無向グラフの場合,特定の条件を満たす要求グラフであれば,$n-1$ 本のエッジで接続可能であることを示した。

    Link: https://arxiv.org/abs/2604.27227

  • 今こそその時:コンピュータ科学は,人工知能(AI)を伴うソフトウェアおよびシステムエンジニアリングを重視するように進化すべきである [cs.SE]目的:ソフトウェアおよび人工知能(AI)システムエンジニアリングを支援するためのコンピュータ科学教育の進化
    • コンピュータ科学の基盤技術は,社会の発展に不可欠であり,その重要性は増している。
    • 従来の教育課程では,AIによる自動化が進む中で,ルーチンワークに特化した人材育成に偏っている。
    • AI時代において,複雑なシステムを設計・運用できる人材育成が急務である。
    • 従来のプログラミング中心の教育から,システム・エンジニアリング中心の教育への転換が必要である。
    • 卒業生は,AIとの競争ではなく,AIを活用した複雑なシステムを設計・検証・運用できる能力を身につけるべきである。
    • 変化に対応できる柔軟性と,将来の技術革新を予測・準備できる能力を育成することが重要である。

    Link: https://arxiv.org/abs/2604.27230

  • 自己進化するソフトウェアエージェント [cs.DB, cs.CL, cs.SE, cs.AI]目的:ソフトウェアエージェントの自己進化機構
    • 環境変化への適応が求められる現代において,自律エージェントの重要性は高い。
    • 既存エージェントは設計時の制約に縛られ,真の進化を遂げられない点が課題である。
    • 本研究は,LLMを活用し,エージェントの目標,推論,コードを自律的に進化させることを目指す。
    • BDI推論とLLMを組み合わせた新しいアーキテクチャを提案し,自己進化モジュールが経験から新たな要件を引き出す。
    • 動的なマルチエージェント環境でのプロトタイプ評価により,最小限の事前知識から目標と行動が自律的に生成されることを示した。
    • LLM駆動型進化の実現可能性と,行動の継承および安定性に関する現在の限界が明らかになった。

    Link: https://arxiv.org/abs/2604.27264

  • 非決定過程の行動距離の図式的な公理化 [cs.LO, cs.FL, cs.PL]目的:非決定過程における行動距離の公理化
    • 遷移システムの状態比較において,従来の同値性判断を超えた定量的なアプローチが重要である。
    • 行動距離の形式的な公理化が確立されておらず,定量分析の発展が課題となっていた。
    • ミルナーのチャートを用いた行動距離の健全かつ完全な公理化を目指す。
    • 本研究では,チャートの図構造を反映したストリング図を用いることで,公理化を形式的に実現した。
    • ストリング図は,バインダや置換といった機構を必要とせず,再帰をより自然に分解できる点が特徴である。
    • これにより,行動距離に関する推論が容易になり,オートマトン理論的な同値性の公理化に向けた統一的な図式的枠組みに貢献する。

    Link: https://arxiv.org/abs/2604.27268

  • 差分を出すか否か?効率的なLLMベースのコード編集のための構造を意識した適応出力形式 [cs.SE, cs.CL]目的:LLMベースのコード編集における効率改善
    • コード編集支援の需要が高まる中で,LLMの活用が注目されている。
    • 従来の全文生成方式では,処理速度とコストが課題となっている。
    • 構造を意識した差分形式と適応戦略により,効率的な編集を実現する。
    • BlockDiffとFuncDiffという構造を意識した差分形式を提案した。
    • AdaEditという適応戦略により,LLMが最適な出力形式を動的に選択する。
    • 提案手法は,フルコード生成と同等の精度を維持しつつ,遅延とコストを30%以上削減した。

    Link: https://arxiv.org/abs/2604.27296

  • Pragmos:プロセスエージェントモデリングシステム [cs.SE, cs.AI]目的:ビジネスプロセスモデリングにおけるLLMと人間の協調
    • ビジネスプロセスは企業活動の根幹であり,効率化と最適化が不可欠である。
    • LLMを用いた自動モデリングはブラックボックス化しやすく,複雑な依存関係の処理が困難である。
    • LLMと人間の専門知識を組み合わせ,透明性と説明可能性の高いプロセスモデリングを実現する。
    • 本研究では,モデリングタスクを小さなステップに分解し,各ステップで中間成果物と根拠を明示する。
    • LLMの推論能力の限界を補うため,行動関係に基づいたプロセスモデル構造化ツールを併用するハイブリッドアプローチを採用する。
    • Pragmosは,LLMがドメインおよびモデリングの専門家と協力し,構造化されたワークフローを通じて進化するプロセスモデルを共同作成する様子を示す。

    Link: https://arxiv.org/abs/2604.27311

  • REBench:ストリップされたバイナリ型と名前に関するLLMのための手続き的で,構成により公平なベンチマーク(拡張版) [cs.DL, cs.CR, cs.LG, cs.SE]目的:LLMにおけるバイナリ逆アセンブルタスクの評価のための包括的なベンチマークデータセット
    • LLMはセキュリティ分野を含む幅広い分野で急速に採用が進んでおり,その性能評価が重要である。
    • 既存の研究では,データセット,前処理パイプライン,評価指標が異なり,公平な比較が困難である。
    • 標準化されたデータセットを提供し,LLMのバイナリ解析能力を明確に理解することを目的とする。
    • REBenchは,既存のデータセットを統合し,多様なアーキテクチャと最適化レベルのバイナリを含む大規模なデータセットを提供する。
    • REBenchは,バイトレベルのスタック情報を格納する知識ベース駆動型手法を採用し,タスクの難易度を維持しつつ,普遍的な適用性を保証する。
    • 実験の結果,LLMは複雑なタスクにおいて逆アセンブルの性能に課題があることが示された。

    Link: https://arxiv.org/abs/2604.27319

  • 万能型か? 理解度,ユーザビリティ,採用の容易性に関するADRテンプレートの経験的比較 [cs.SI, physics.soc-ph, cs.SE]目的:ADRテンプレートの理解度,ユーザビリティ,採用の容易性の比較
    • ソフトウェア開発において,設計意図の記録は保守性向上,新規開発者の参入支援に不可欠である。
    • 既存のADRテンプレート間には,実証的な比較研究が不足しているという課題が存在する。
    • プロジェクトの状況に応じた最適なADRテンプレートの選択を支援することを目的とする。
    • 専門家による予備調査では,NygardとMADRのテンプレートが上位にランクインした。
    • 学生実験の結果,NygardのテンプレートがMADRよりも総合評価で優れていた。
    • Nygardは簡潔な記録を,MADRは詳細な構造記述と要件定義に強みを持つことが示唆された。

    Link: https://arxiv.org/abs/2604.27333

  • Buchbinder-Feldmanの決定論的サブモジュラーマトロイドアルゴリズムにおけるパラメータℓに関する注記 [cs.DS]目的:Buchbinder-Feldmanの決定論的サブモジュラーマトロイドアルゴリズムのパラメータℓの最適化
    • 組み合わせ最適化問題において,効率的な近似アルゴリズムの開発は重要である。
    • 既存のマトロイド制約下でのサブモジュラー関数最大化アルゴリズムは,パラメータ設定に改善の余地がある。
    • パラメータℓのより精密な上限を導き出すことで,隠れた定数を改善することを目指す。
    • Pólya-Szegőの不等式を用いることで,ℓの値をℓ = ⌈1/(2eε)⌉とより小さく設定できることを示した。
    • 級数展開によるlog(1+t)の精密な上限を用いることで,さらにℓの値を最適化する補正項を導出した。
    • これらの改善はクエリ複雑度Õε(nr)を変えないが,εに関する隠れた定数を改善する。

    Link: https://arxiv.org/abs/2604.27362

  • ScaleBox:大規模言語モデルの高品質かつスケーラブルなコード検証の実現 [cs.SE, cs.CL]目的:大規模言語モデルのコード検証に関する信頼性の高いインフラストラクチャ
    • 近年,大規模言語モデルのコーディング能力向上は重要であり,検証可能なフィードバックが不可欠である。
    • 既存システムでは,高並行処理下での正確な検証と効率が課題となっていた。
    • ScaleBoxは,大規模なコード学習における検証の精度と効率を向上させることを目指す。
    • ScaleBoxは,自動的な特別採点器の生成・管理,テストケース間のきめ細やかな並列実行,再現性のあるベンチマーク環境を実現した。
    • 実験の結果,ScaleBoxはコード検証の精度と効率を大幅に向上させることが示された。
    • RLVR実験では,LiveCodeBenchの性能と学習の安定性が大幅に改善され,ヒューリスティックマッチングのベースラインを大きく上回った。

    Link: https://arxiv.org/abs/2604.27467

  • k-辺連結な有向グラフにおける(k+2)-辺連結成分の準二次時間計算 [cs.DS]目的:k-辺連結な有向グラフにおける(k+2)-辺連結成分の計算
    • グラフアルゴリズムにおける基本的な問題であり,ネットワーク分析等の応用が重要である。
    • 有向グラフの場合,k>3における線形時間アルゴリズムが存在せず,計算量の削減が課題である。
    • k = o(n^{1/4}/\sqrt{log n}) において,既存の計算量O(mn)を超える改善を目指す。
    • 提案アルゴリズムは,k-辺連結な有向グラフの(k+2)-辺連結成分をO(k^2 m √n log n)時間で計算する。
    • この結果は,k>3におけるNagamochi-Watanabeの古典的な計算量に対する初の改善である。
    • また,一般の有向グラフにおける4-辺連結成分の計算に適用可能なアルゴリズムも開発した。

    Link: https://arxiv.org/abs/2604.27474

  • 人気OSSプロジェクトにおける「Good First Issue」慣行と新規参加者のプルリクエストの経時分析 [cs.SI, cs.CY, cs.SE]目的:人気OSSプロジェクトにおける「Good First Issue」慣行と新規参加者のプルリクエストに関する経時的な変化の分析
    • OSSの発展には,新規参加者のスムーズなオンボーディングが不可欠であるため,その効果的な手法が重要となる。
    • 「Good First Issue」ラベルの利用は一般的だが,その効果や経年変化に関する理解が不足している。
    • 新規参加者のオンボーディングを支援する「Good First Issue」ラベルの利用状況と成果の推移を明らかにすること。
    • 2024年1月以降,「Good First Issue」ラベルが付与された課題の割合が統計的に有意に減少した。
    • 新規参加者の「Good First Issue」課題への関与率は約27%で安定しているものの,プルリクエストのマージ率は61.9%から42.2%に低下した。
    • プルリクエストの記述長やコードサイズはマージ結果と有意な関連性を示さず,初期提出物の定量的な特性だけでは成功が予測できない。

    Link: https://arxiv.org/abs/2604.27532

  • ほぼリアルタイムにおける最小サフィックス集合の維持 [cs.DS]目的:文字列の反復性を測る最小サフィックス集合のオンライン維持
    • 文字列処理において,文字列の反復性を定量的に評価する新たな指標の必要性。
    • 既存手法では,文字列長が大きくなるにつれて処理時間が指数関数的に増加する問題。
    • 各文字の処理時間を短縮し,ほぼリアルタイムで最小サフィックス集合を維持すること。
    • 本研究では,ワイナーのサフィックス木アルゴリズムを基盤とし,効率的な実装のためのアルゴリズム原器を開発。
    • 文字列を右から左または左から右に文字単位で入力する2つのフレームワークにおいて,最小サフィックス集合を維持。
    • 各文字の処理時間を対数時間程度に抑え,ほぼリアルタイムでの維持を実現。

    Link: https://arxiv.org/abs/2604.27548

  • 単一静止型ISACにおける非一様性の活用:アンテナ柔軟性を活用して [cs.OS, cs.IT, eess.SP, math.IT]目的:単一静止型統合センシング通信システムのための柔軟な非一様アレイ設計
    • 通信とセンシングを同時に行うISACは,次世代無線通信の重要な技術要素となる。
    • 従来の均一アレイ設計では,アンテナ数を増やすことによるリソース消費が課題となる。
    • アンテナ配置の自由度を活用し,少ないアンテナ数で性能向上を目指す。
    • 提案手法は,均一アレイと比較して通信レートが向上し,特に有効なアンテナ数が少ない場合に大きな利点を示す。
    • 少ないアンテナ数で均一アレイと同等以上の性能を実現可能であり,アンテナ規模の拡大に代わる有効なアプローチとなる。
    • 重み付き最小二乗誤差,連続緩和ペナルティ,および逐次凸近似を用いた最適化フレームワークにより,効率的な設計を実現した。

    Link: https://arxiv.org/abs/2604.27571

  • 大規模MIMOにおける統計的チャネルフィンガープリント構築:統一されたテンソル学習フレームワーク [cs.LG, cs.AI, cs.IT, eess.SP, math.IT]目的:統計的チャネル状態情報(sCSI)に基づく統計的チャネルフィンガープリント(sCF)の構築
    • 大規模MIMO通信システムにおいて,チャネル状態情報(CSI)の効率的な取得は重要な課題である。
    • 従来のCSI取得方法では,コストやプライバシーの問題が生じやすい。
    • 統計的CSIを活用することで,CSI取得の効率化とプライバシー保護を目指す。
    • 提案手法は,チャネル空間共分散行列(CSCM)とチャネル電力角スペクトル(CPAS)の関係性を明らかにし,統一的なテンソル表現を構築する。
    • Laplacianピラミッド分解とウェーブレット変換に基づくLPWTNetという新しいアーキテクチャにより,効率的な推論と多重スケール特性の捕捉を実現した。
    • 様々なsCF構築シナリオにおいて,最先端のベースラインと比較して,高い再構成精度と計算効率を達成した。

    Link: https://arxiv.org/abs/2604.27574

  • 抽象弁証的フレームワークにおける記号的推論 [cs.LO, cs.LG]目的:抽象弁証的フレームワークの記号的推論
    • 複雑なシステムの挙動を理解し,予測するために,形式的な推論技術が不可欠である。
    • 既存のツールでは,大規模な解空間を持つ問題に対する効率的な解析が困難であった。
    • 大規模なシステムにおける解空間の探索を効率化し,新たな解析を可能にすること。
    • 本研究では,二分決定図 (BDD) を基盤とする新しい解析ツール BAss を開発した。
    • BAss は,既存の BDD ベースツールや SAT/ASP ベース手法と比較して,特に大規模な解空間において優れた性能を発揮した。
    • その結果,既存ツールでは解析が困難であった生物学的ネットワークの解析を可能にし,システム生物学への応用を促進する。

    Link: https://arxiv.org/abs/2604.27576

  • ソフトウェア工学におけるGenAI:技術受容モデルの役割 [cs.NI, cs.SY, eess.SY, cs.SE]目的:GenAI受容に関する将来の研究領域の特定
    • ソフトウェア開発へのGenAI導入が活発化しており,その成功には技術受容の理解が不可欠である。
    • ソフトウェア工学分野では,UTAUTなどの技術受容モデルの利用が限定的である。
    • GenAI受容の障壁を明らかにし,実用的な知見を得るためのフレームワークを提案する。
    • UTAUTはGenAIの特性や変革的影響を考慮した構成要素の特定・改良が求められる。
    • 構成概念の妥当性を高め,研究間の比較可能性を向上させるための運用化方法の改善が必要である。
    • 事前知識や反復的なモデル更新,シナリオシミュレーションを可能にするベイズ分析の組み込みが有効である。

    Link: https://arxiv.org/abs/2604.27642

  • マンニホールドに固定された自己対戦による質問学習:検証可能な推論のためのANCORA [cs.LG, cs.AI, cs.PL]目的:検証可能な問題を生成し,解決し,その結果のフィードバックを人間による監督なしに自己改善に役立てる言語モデルの学習
    • 大規模言語モデルの性能向上には,より効果的な学習方法が不可欠である。
    • 従来の言語モデル学習は,人間が作成したデータに依存しており,スケーラビリティに限界がある。
    • 自己対戦を通じて,言語モデルが自律的に学習し,推論能力を向上させることを目指す。
    • ANCORAは,問題を作成するProposerと解決するSolverを交互に行うアンカー化されたカリキュラムフレームワークである。
    • Verusにおいて,ANCORAはDafny2Verusのpass@1をSFTベースラインの26.6%から81.5%に向上させた。
    • MBPPとHumanEvalのテストにおいても,Dafny2Verusから学習した場合,それぞれ36.2%と17.2%のpass@1を達成した。

    Link: https://arxiv.org/abs/2604.27644

  • 一般的な3x3行列乗算のための正確な56加算,ランク23スキーム [cs.DS, cs.CC]目的:一般的な3x3行列乗算のためのランク23アルゴリズム
    • 行列演算は,科学技術計算において基盤となる演算であり,効率化は重要である。
    • 既存の行列乗算アルゴリズムは,計算量が多く,さらなる効率化の余地が存在する。
    • 計算量を削減し,より効率的な行列乗算アルゴリズムを開発すること。
    • 本研究では,56加算/減算と23乗算を使用するランク23アルゴリズムを提案した。
    • このアルゴリズムは,既存の60,59,58加算のランク23スキームよりも優れている。
    • 係数は{-1, 0, 1}で構成され,729のBrent方程式によって正当性が検証されている。

    Link: https://arxiv.org/abs/2604.27645

  • 信頼性向上のためのテール考慮型Nバージョン機械学習API推薦モデル [cs.SE]目的:API推薦の信頼性向上
    • API推薦は開発効率を向上させるため,重要性が増している。
    • API利用頻度の分布に偏りがあり,頻度の低いAPIの推薦精度が低い。
    • テールAPIに対する信頼性の低い推薦を抑制し,信頼性を高める。
    • NvRecは,複数の機械学習モデルを活用し,テールAPIを含むAPIシーケンス推薦の信頼性を向上させる。
    • 3バージョンのNvRecでは,CodeT5,MulaRec,UniXcoderの組み合わせが83.8%の正解率と80.7%の拒否率を達成した。
    • 5バージョンのNvRecは,単純多数決で83.1%の正解率と69.0%の拒否率を達成し,両者のバランスを改善した。

    Link: https://arxiv.org/abs/2604.27647

  • ほぼ線形時間でハイパーグラフラプラシアンシステムを解く [cs.DS]目的:カットに基づくハイパーグラフラプラシアンのポアソン問題の求解
    • 大規模なハイパーグラフの解析は,様々な分野で重要であり,効率的な求解手法が求められている。
    • 従来の求解手法では,計算時間がハイパーグラフのサイズに比例し,大規模な問題に対しては適用が困難であった。
    • 本研究では,ほぼ線形時間でポアソン問題を解くことで,大規模ハイパーグラフの解析を可能とする。
    • 提案手法は,入力サイズPに対して,$P^{1+o(1)}$時間で実行され,高い確率で最適解に近い解を得る。
    • フェンシェル双対を凸フロー問題に変換し,双対フローのルーティングの詳細を捨象することで,効率的な解法を実現した。
    • 正則化された目的関数からのグラウンド頂点削減により,同じハイパーグラフラプラシアンに対するランダム化されたほぼ線形時間分解能/プロキシマルプリミティブが得られる。

    Link: https://arxiv.org/abs/2604.27651

  • PuzzleMark: ニューラルコード補完モデルにおけるロバストなコードデータセット透かしのための暗黙的なジグソー学習 [cs.HC, cs.SE]目的:コードデータセットの知的財産保護
    • 高品質なコードデータセットは,資源を要し知的財産としての価値が高い。
    • 既存の透かし技術は,共起パターンに依存し,攻撃に脆弱である。
    • コードの複雑性を利用し,ロバストな透かし技術を開発すること。
    • PuzzleMarkは,コードの複雑度に基づいたキャリア選択戦略により,透かしの露出リスクを軽減する。
    • 従来の共起パターンに代わり,変数名連結による新たな連結パターンを採用し,透かしのロバスト性を強化する。
    • Fisherの正確検定を用いて,ブラックボックス環境下でモデルの検証を行い,100%の検証成功率と0%の偽陽性率を達成した。

    Link: https://arxiv.org/abs/2604.27677

  • 大きな奇数回りのグラフに対するオンライン彩色 [cs.NI, cs.DS]目的:大きな奇数回りを持つグラフのオンライン彩色
    • グラフ理論は,ネットワーク構造の解析や最適化に応用され,様々な分野で重要である。
    • オンライン彩色問題は,グラフの構造が逐次的に与えられる状況で効率的な彩色方法を求める難題である。
    • 奇数回りが大きいグラフに対するオンライン彩色アルゴリズムの色の数を削減し,実用性を高める。
    • 任意の正の数εに対し,ある定数g'以上の奇数回りを持つグラフは,O(n^ε)色でオンライン彩色可能である。
    • この結果は,1998年にKiersteadが発見したO(n^{1/2})色のアルゴリズムを改善するものである。
    • より小さな奇数回り(3, 5, 7など)でも同様の結果が得られることが示された。

    Link: https://arxiv.org/abs/2604.27690

  • テンプレートエンジンベースアプリケーションのバグ:症状,根本原因,および修正パターンに関する理解 [cs.SE]目的:テンプレートエンジンベースアプリケーションのバグの症状,根本原因,および修正パターンの特定
    • 現代のソフトウェア開発において,テンプレートエンジンは不可欠であり,様々な分野で利用が拡大している。
    • テンプレートエンジンベースアプリケーション特有の構造が,バグの診断と修正を困難にしている。
    • テンプレートエンジンベースアプリケーションのバグに関する体系的な研究を通じて,開発支援を目指す。
    • バグの最も一般的な症状は,異常なレンダリング結果(期待される出力が得られない,または空白の出力)であり,診断が難しい。
    • 根本原因としては,構文の誤用,データコンテキストの不一致,および互換性のない統合が上位を占める。
    • バグの約67.92%はテンプレート内で修正されるが,20%以上はホスト側のロジックの修正を必要とする。

    Link: https://arxiv.org/abs/2604.27692

  • 次数制限グラフクラスにおけるクラスタ第一階述語論理 [cs.LO]目的:次数不変性の研究に特化した,クラスタ第一階述語論理
    • グラフ理論は,ネットワーク構造や関係性を分析する上で不可欠であり,様々な分野に応用されている。
    • 既存の第一階述語論理では,順序関係の解釈に依存する性質を捉えきれない場合がある。
    • 次数制限グラフクラスにおいて,順序不変性を表現できる論理の限界を明らかにすること。
    • クラスタ第一階述語論理は,一般には第一階述語論理では表現できない性質を定義できる。
    • しかし,次数が制限されたグラフクラスにおいては,その表現力は第一階述語論理に含まれる。
    • この結果は,特定の順序関係を追加することで構造間の類似性を維持し,局所的な性質を大域的に解釈する手法によって得られた。

    Link: https://arxiv.org/abs/2604.27693

  • コード表現がクロス言語LLM脆弱性検出における偽陽性ダイナミクスに与える影響 [cs.CR, cs.SE]目的:クロス言語LLM脆弱性検出における偽陽性の振る舞いに対するコード表現形式の影響
    • ソフトウェアの脆弱性は深刻なセキュリティリスクであり,自動検出技術の重要性が高まっている。
    • クロス言語での脆弱性検出は,言語間の構文や意味の違いから偽陽性の発生が多いという課題がある。
    • 本研究は,コード表現形式が偽陽性に与える影響を明らかにすることで,より正確なクロス言語脆弱性検出を目指す。
    • コードのテキスト表現でファインチューニングすると偽陽性率が上昇する一方,F1スコアは安定しており,偽陽性の増加が隠蔽されている。
    • テキストで学習したモデルをAST形式のコードに適用することで,偽陽性率を大幅に低下させることが可能であり,表面的な特徴の暗記が偽陽性の主要な原因であることが示唆された。
    • ASTによる直接的なファインチューニングでは効果が得られず,AST表現自体にも表面的な特徴が含まれていることが示唆された。

    Link: https://arxiv.org/abs/2604.27714

  • 人間とAIの協調創造のためのLLMを評価者として:コーディングのための信頼性に基づいた評価フレームワーク [cs.SE]目的:人間とAIの協調創造におけるコーディングの評価方法
    • AI支援プログラミングは開発効率向上に不可欠であり,その評価手法の確立が急務である。
    • AIの判断の信頼性や,複数モデル間での比較可能性,多段階インタラクションにおける解釈可能性が課題である。
    • 信頼性を考慮したLLM評価フレームワークを構築し,人間とAIの協調創造の軌跡分析を可能にすること。
    • 人間のAIとの協調成功率は,最初のターンで0.8533に達し,6ターン後には0.8641で安定した。
    • LLMを評価者とした場合,ROC-AUCは0.5937,PR-AUCは0.6904,MCCは0.5000というスコアが得られた。
    • 評価者間の整合性はまだ限定的であり,Cohen's kの平均は0.1592,Fleiss' kは0.0696であった。

    Link: https://arxiv.org/abs/2604.27727

  • 自己教師ありエンコーダが正規性を欲する理由 [cs.IT, cs.AI, cs.LG, math.IT]目的:エンコーダ・デコーダ学習における表現の最適化
    • 機械学習において,データから効率的に特徴量を抽出することは,性能向上に不可欠である。
    • 自己教師あり学習では,ラベルなしデータからの特徴量抽出が課題となる。
    • 情報ボトルネック原理に基づき,効率的な表現学習の理論的枠組みを構築する。
    • 情報ボトルネック原理をレート歪み問題として捉え,最適な表現が予測多様体におけるソフトクラスタリングとなることを示した。
    • 平坦なディリクレ分布から等方性ガウス分布への変換過程を明らかにし,オーバーヘッドを定量化した。
    • 半教師あり学習と自己教師あり学習のための具体的なエンコーダ損失関数を,ミニバッチ周辺を用いて推定した。

    Link: https://arxiv.org/abs/2604.27743