arXiv雑要約

プログラム - 2026/03/06 公開

  • MPBMC:GNN誘導クラスタリングによる多特性有界モデル検査 [cs.LO, cs.AI, cs.LG, cs.SE]目的:多特性検証における有界モデル検査の性能向上
    • 複数の特性を持つ設計の検証は,現代のデジタルシステムの複雑化に伴い,非常に重要となっている。
    • 特性間の関係性を考慮した効率的なクラスタリング手法が,多特性検証のボトルネックとなっている。
    • GNNによる機能的埋め込みと実行時統計を組み合わせ,効率的な特性クラスタリングを実現する。
    • 提案手法は,ハードウェア回路の機能的表現と実行時統計を活用することで,有界モデル検査の速度向上を実現した。
    • HWMCCベンチマークを用いた実験により,最先端手法と比較して有効性が確認された。
    • 機能的埋め込みに基づいて特性をインテリジェントにグループ化することで,検証結果の高速化に貢献する。

    Link: https://arxiv.org/abs/2603.04450

  • LLM安全性評価ベンチマークの影響力とコード品質の比較分析 [cs.CR, cs.AI, cs.SE]目的:LLM安全性評価ベンチマークにおける影響力とコード品質の多面的評価
    • LLMの安全性研究は急速に進展しており,動向把握が困難であるため,ベンチマークによる体系的な比較が不可欠である。
    • どのベンチマークが重要視されるかの明確な根拠がなく,学術的な影響力やコード品質の体系的な評価が不足している。
    • LLM安全性評価ベンチマークの影響力とコード品質を評価し,改善の余地を明らかにすることを目指す。
    • ベンチマーク論文は,引用回数などの学術的影響力において,非ベンチマーク論文と比較して有意な優位性を示さなかった。
    • 著者の知名度は論文の影響力と相関するが,知名度や影響力はコード品質と有意な相関を示さないという乖離が見られた。
    • ベンチマークリポジトリの39%がすぐに利用可能であり,完全なインストールガイドがあるのは16%に過ぎず,倫理的配慮を扱っているのはわずか6%であった。

    Link: https://arxiv.org/abs/2603.04459

  • iScript:物理設計Tclスクリプト生成のためのドメイン適応大規模言語モデルとベンチマーク [cs.SE, cs.PL]目的:物理設計用Tclスクリプトの生成
    • 現代のEDAフローにおいてTclスクリプトは不可欠であり,自動化・効率化が求められている。
    • 汎用LLMは,データ不足やドメイン特有の知識,高い信頼性が要求されるため,この分野での性能が低い。
    • データ合成とドメイン適応によって,EDAスクリプト生成におけるLLMの性能向上を目指す。
    • iScriptは,既存の最先端LLMと比較して,iScript-Benchベンチマークにおいて高いpass@kスコアを示した。
    • 多段階データ合成パイプラインにより,10K組の(要件,CoT,スクリプト)データセットを生成することに成功した。
    • ドメイン適応型事前学習と教師ありファインチューニングの二段階戦略が,効果的であることが示された。

    Link: https://arxiv.org/abs/2603.04476

  • CLARC:堅牢なコード検索のためのC/C++ベンチマーク [cs.SE]目的:C/C++における堅牢なコード検索のためのベンチマーク
    • 開発者の生産性向上には効率的なコード検索が不可欠であり,その重要性は増している。
    • 既存のベンチマークはPythonに偏っており,C/C++における堅牢性を十分に評価できていない。
    • C/C++環境におけるコード検索の堅牢性を評価し,改善策を導くことを目指す。
    • CLARCベンチマークは,GitHubから収集された1,245組のクエリ-コードペアで構成される。
    • 実験結果から,最先端のモデルは,コードの意味理解よりも字句的な特徴に依存していることが示唆された。
    • 識別子の匿名化や低レベル言語へのコンパイルといった条件下で,検索性能が大幅に低下することが確認された。

    Link: https://arxiv.org/abs/2603.04484

  • 一変項一階モダール論理の独立融合 [cs.LO]目的:一変項一階モダール論理の独立融合における保存性
    • モダール論理は,可能性,必然性といった概念を形式化する上で重要であり,哲学,計算機科学に応用される。
    • 複数のモダール論理を融合する場合,その論理的性質(完全性,判定可能性など)が保存されるかどうかが課題となる。
    • 等式を含まないモダール論理の融合における完全性と判定可能性の保存条件を明らかにすること。
    • 等式がない場合,グローバルおよびローカルな論理的帰結関係において,クリプキ完全性と判定可能性が保存されることが示された。
    • 等式と非剛性定数を含む融合においては,クリプキ完全性と判定可能性は保存されないことがディオファントス方程式の符号化によって示された。
    • 等式がない場合でも,有限モデル性質はローカルな場合にのみ保存される。

    Link: https://arxiv.org/abs/2603.04512

  • 相対エントロピーの完全な図式的公理化 [cs.LO, cs.IT, math.CT, math.IT]目的:相対エントロピーの図式的公理化
    • 確率論,統計学,機械学習など広範な分野で利用される基本的な距離の概念である。
    • 確率分布間の距離として,形式的な基礎が十分に確立されていなかった。
    • クロネッカー積と直和という二つの構造に対する公理化を目指す。
    • 相対エントロピーを確率行列の圏の量的な豊穣化として捉え,形式的な公理系を構築した。
    • カルバック・ライブラーの発散と,より一般に任意の次数のレニィ発散に対して,完全な公理化を達成した。
    • 量的なモノイド代数の枠組みと,図式的な言語を用いて公理系を表現した。

    Link: https://arxiv.org/abs/2603.04530

  • サイバーフィジカルシステムにおける堅牢性テストに関する産業調査 [cs.DC, cs.RO, cs.SE]目的:サイバーフィジカルシステムの堅牢性テストに関する産業界の実態
    • 製造,エネルギー,輸送など現代産業において不可欠であり,自動化やリアルタイムな意思決定を可能とする。
    • システムの故障は経済的損失,運用停止,安全上の問題を引き起こす可能性があり,堅牢性の確保が課題である。
    • 産業界における堅牢性テストの実践と,最新手法とのギャップを明らかにすること。
    • 本調査は,ウォロニア地域における幅広い分野の産業界の現状を把握した。
    • 要件定義,システム設計,テスト実行,故障モード,利用可能なツールとの関連性における堅牢性の理解と適用を調査した。
    • 既存の産業調査との比較を通じて,業界における課題とギャップを特定した。

    Link: https://arxiv.org/abs/2603.04587

  • Vibe Code Bench:エンドツーエンドのWebアプリケーション開発におけるAIモデルの評価 [cs.SE, cs.AI, cs.CL]目的:AIモデルのWebアプリケーション開発能力の評価
    • AI技術は目覚ましい発展を遂げており,特にコード生成はその中でも重要な応用分野である。
    • 既存の評価指標は,部分的なタスクに焦点を当てており,アプリケーション全体を構築する過程を評価できていない。
    • 本研究は,Webアプリケーションのゼロから構築という完全なプロセスを評価する指標を提案し,AIモデルの能力を詳細に分析する。
    • Vibe Code Benchは,100のWebアプリケーション仕様と964のワークフローから構成される新しいベンチマークである。
    • 最先端の16モデルを評価した結果,テストセットでの最高精度は58.0%に留まり,エンドツーエンドの開発は依然として課題であることが示された。
    • 生成中の自己テストが性能の重要な予測因子であり,評価者の選択が結果に大きな影響を与えることが明らかになった。

    Link: https://arxiv.org/abs/2603.04601

  • 公平なトップ-$k$選択の一般化:統合的アプローチ [cs.DS, cs.CC, cs.CG, cs.CY, cs.DB, cs.LG]目的:複数保護グループにおける公平な(線形)スコアリング関数の発見
    • 少数派グループの適切な代表は,公正な社会を実現する上で重要である。
    • 既存研究では,単一グループへの対応に限定され,公平性と参照スコアの乖離最小化が不十分である。
    • 複数グループを考慮し,公平性と参照スコアとの乖離を同時に最小化する手法を開発する。
    • 保護グループ数が増加すると計算困難になる場合があるが,小規模な$k$に対しては効率的な解法が存在する。
    • 公平性の評価指標として,従来の「距離」に加えて,ユーティリティ損失という新たな指標を導入した。
    • 実装の複雑さ,安定性,パフォーマンスのバランスを取った手法により,実データ上で高い性能を示した。

    Link: https://arxiv.org/abs/2603.04689

  • 大規模言語モデル推論のためのPrefill-Decode分散コンピューティングリソース割り当て [cs.DC, cs.IT, cs.LG, math.IT]目的:Prefill-Decode分散推論における最適コンピューティングリソース数の決定
    • 近年,大規模言語モデルの利用が拡大しており,効率的な推論技術が不可欠となっている。
    • Prefill-Decode分散推論では,リソース配分が重要だが,最適な構成を決定する手法は確立されていない。
    • スループット,SLO,リクエスト特性を考慮した,効率的なリソース配分方法を提案する。
    • 理論モデルと実証的ベンチマークを組み合わせることで,Prefill-Decodeのリソース数を高精度に予測できる。
    • M/M/1キューイング理論を活用し,TTFTを考慮したPrefillのスループットを正確にモデル化することに成功した。
    • TPOT要件を満たすデコードバッチサイズを決定し,実測値に基づいてデコードスループットを算出する。

    Link: https://arxiv.org/abs/2603.04716

  • 大規模言語モデルを用いた行動駆動開発シナリオ生成 [cs.SE]目的:行動駆動開発シナリオの自動生成
    • ソフトウェア開発において,品質向上と効率化が常に求められている。
    • 行動駆動開発では,シナリオ作成に手間がかかり,開発のボトルネックとなる場合がある。
    • 大規模言語モデルを活用し,高品質なシナリオを効率的に生成することを目指す。
    • GPT-4はテキストと意味的類似性指標で高いスコアを達成したが,人間の専門家とLLM評価の両方において,Claude 3がより評価の高いシナリオを生成した。
    • 特にDeepSeekを含むLLM評価器は,テキストや意味的類似性指標よりも人間の判断との相関性が高かった。
    • プロンプトの工夫はモデルによって異なり,GPT-4はゼロショット,Claude 3は思考連鎖,Geminiは少数ショットで最適な結果が得られた。

    Link: https://arxiv.org/abs/2603.04729

  • MOOSE エコシステム向けドメイン特化型AIエージェント:MOOSEnger [cs.AI, cs.CE, cs.SE]目的:MOOSE エコシステムにおける入力ファイル生成と検証の自動化
    • 多物理現象シミュレーションは科学技術の発展に不可欠であり,MOOSEはその強力なプラットフォームである。
    • MOOSEの入力ファイル記述は複雑であり,初期設定やデバッグに時間がかかるという課題がある。
    • 自然言語による指示から実行可能な入力ファイルを生成し,シミュレーションの効率化を目指す。
    • MOOSEngerは,自然言語による指示をMOOSEの入力ファイルに変換する会話型ワークフローを実現した。
    • Retrieval-augmented generationとMOOSE固有の解析・検証ツールを組み合わせることで,高い精度を実現した。
    • 125件のプロンプトによるベンチマークテストで,実行成功率は0.93と,LLMのみでは0.08と比較して大幅に向上した。

    Link: https://arxiv.org/abs/2603.04756

  • FireBench:企業およびAPI駆動型LLMアプリケーションにおける指示応答の評価 [cs.CL, cs.CL, cs.CL, cs.SE]目的:企業およびAPI駆動型LLMアプリケーションにおける指示応答能力の評価
    • LLMの企業利用が増加しており,信頼性の高いワークフロー構築が重要である。
    • 既存のベンチマークはチャットアシスタント向けであり,企業ニーズに合致しない。
    • 企業におけるLLMの利用状況を反映した評価基準を確立すること。
    • FireBenchは,情報抽出,顧客サポート,コーディングエージェントなど,多様なアプリケーションに対応する2,400件以上のサンプルで構成される。
    • 11のLLMを評価した結果,企業シナリオにおける指示応答能力に差があることが示された。
    • FireBenchはオープンソースとして公開されており,モデル評価や性能改善に役立つ。

    Link: https://arxiv.org/abs/2603.04857

  • レンジ計測による集合メンバーシップ局所化 [eess.SY, cs.SY, cs.CE, cs.IT, math.IT, math.OC]目的:未知の点の位置推定
    • ロボットや測位システムの精度向上に不可欠な技術であり,様々な分野で応用が期待される。
    • 距離計測にはノイズがつきものであり,正確な位置推定が困難な場合がある。
    • 距離計測誤差を考慮し,位置の可能性領域を特定することで,よりロバストな推定を目指す。
    • 本研究では,距離計測誤差を含む場合に整合性のある点の集合(局所化集合)を特徴付ける。
    • 局所化集合は非凸だが,閉球と多角体の交差領域に包含されることを示す。
    • 凸最適化に基づき,局所化集合を包含する単純な構造(箱または楕円体)を効率的に計算する手法を開発した。

    Link: https://arxiv.org/abs/2603.04867

  • 公共部門オープンソースプログラムオフィス:共通の組織能力の育成方法に関する類型 [cs.SE]目的:公共部門組織におけるオープンソースプログラムオフィス(OSPO)の採用,開発,協力の促進方法
    • 現代社会におけるデジタルインフラの基盤であり,その重要性は高まっている。
    • 公共部門におけるOSS導入・活用を推進するための組織体制構築が課題となっている。
    • 欧州の公共部門におけるOSPOの設計・運用に関する指針を提供すること。
    • 本研究により,OSPOの組織構造,役割,OSS採用への貢献に関する6つの類型が特定された。
    • これらの類型と政策提言は,公共部門組織が独自のOSPOを設計する際の指針となる。
    • OSS導入を促進し,デジタル主権の確立,経済成長,デジタルサービスの相互運用性向上に貢献する。

    Link: https://arxiv.org/abs/2603.04891

  • WaterSIC: 情報理論的に(ほぼ)最適な線形層量子化 [cs.LG, cs.IT, math.IT]目的:線形層の低精度化における圧縮率と出力誤差のトレードオフ
    • 大規模言語モデルの効率的な推論には,モデルの量子化が不可欠である。
    • 既存の量子化手法は,情報理論的な限界との間に大きな乖離が存在する。
    • 情報理論的限界に近づく量子化アルゴリズムを開発し,性能向上を目指す。
    • 提案手法WaterSICは,入力活性化の共分散行列に関わらず,情報理論的限界との差を0.255ビット以内に抑える。
    • WaterSICは,古典的な水張り(waterfilling)アルゴリズムの概念を,重み行列の列(in-features)ごとに異なる量子化レートを割り当てることで実現している。
    • LlamaやQwenなどのLLMへの適用により,1~4ビットの全量子化レートで最先端の性能を達成した。

    Link: https://arxiv.org/abs/2603.04956

  • VRアプリストアのユーザーレビューからのペルソナ自動生成 [cs.HC, cs.SE]目的:VRにおけるアクセシビリティ要件の抽出
    • ソフトウェア設計・開発において,アクセシビリティを考慮した設計は重要である。
    • VRプロジェクトにおけるアクセシビリティに焦点を当てたペルソナ活用は限定的である。
    • 自動生成されたペルソナを用いた,アクセシビリティ要件の潜在的なニーズの特定を目指す。
    • 本研究では,VRコースでペルソナ自動生成システムを開発し,アクセシビリティ要件の議論に活用した。
    • その結果,自動生成されたペルソナを用いることで,学生の共感性がより効率的に育まれることが示された。
    • VRコースにおける自動生成ペルソナの活用が,潜在的なアクセシビリティ要件を導き出す手段となることを示した。

    Link: https://arxiv.org/abs/2603.04985

  • 過剰完備QLDPCコードにおける信念伝播復号のLLR不整合について [cs.IT, math.IT]目的:過剰完備安定化表現を用いたQLDPCコードの信念伝播復号におけるLLR不整合の影響
    • 量子誤り訂正は,量子情報の信頼性確保に不可欠であり,その性能向上は重要な課題である。
    • 有限長のQLDPCコードでは,漸近的な符号特性に依存せず,反復回数による挙動が重要となる。
    • LLR不整合が復号性能に与える影響を明らかにし,実用的な復号パラメータ設定に貢献する。
    • LLRの初期値の不整合が,特に低ノイズ環境下でフレーム誤り率に大きな影響を与えることが示された。
    • 最適な性能は,LLR不整合の特定範囲に限定されず,広範囲にわたって比較的安定した性能が維持されることが確認された。
    • LLR不整合は,精密に整合させるべき量ではなく,正則化制御パラメータとして解釈できる可能性が示唆された。

    Link: https://arxiv.org/abs/2603.04991

  • 確率的システムの確率エントロピー正則化制御 [cs.RO, cs.HC, eess.SY, cs.IT, cs.SY, math.DS, math.IT, math.OC]目的:確率的システムの制御におけるエントロピー制御手法
    • 制御システムの予測可能性を調整する上で,エントロピー分析と制御は重要な役割を果たす。
    • 連続状態の確率システムにおいて,正確なエントロピー分析と制御は依然として困難である。
    • 連続システムの形式的な保証を維持しつつ,予測可能性と制御性能のトレードオフを実現する。
    • システムの離散化におけるエントロピーの上界を導出し,連続分布と離散化された分布のエントロピー差の上界を新たに得た。
    • これにより,元の連続システムに対する形式的な保証を維持しながら,エントロピーを考慮した制御器の合成が可能となった。
    • 軌道分布と一様分布間のKLダイバージェンスと累積コストの線形結合を最小化することで,予測可能性と制御性能を調整する。

    Link: https://arxiv.org/abs/2603.05021

  • RepoLaunch:あらゆる言語・プラットフォームにおけるコードリポジトリのビルド&テストパイプラインの自動化 [cs.SE, cs.LG, cs.MA]目的:コードリポジトリのビルドとテストの自動化
    • ソフトウェア開発の効率化は,社会全体の技術革新を加速させる上で不可欠である。
    • ソフトウェアリポジトリのビルドには,依然として多大な手作業が必要とされている。
    • 多様な言語・プラットフォームに対応した自動化ツールにより,その負担を軽減すること。
    • RepoLaunchは,依存関係の解決,ソースコードのコンパイル,テスト結果の抽出を自動化する初のシステムである。
    • 大規模なソフトウェア工学データセット作成パイプラインを自動化し,コーディングエージェントのベンチマークと学習を促進する。
    • 既に複数の研究で,RepoLaunchが自動タスク生成に利用されている。

    Link: https://arxiv.org/abs/2603.05026

  • Stack Overflowへの貢献理由:LLM時代前の異文化間モチベーションと利用パターンの理解 [cs.SE]目的:Stack Overflow貢献者のモチベーション
    • 知識共有は学術の発展と持続に不可欠であり,貢献者の理解がその維持に重要である。
    • 貢献者のモチベーションが,国・文化によってどのように異なるのかが十分に解明されていない。
    • 異文化間のモチベーションの違いを明らかにすることで,ソフトウェアエンジニアリングへの参加促進に貢献する。
    • 貢献者の主なモチベーションは,自己宣伝と利他的な問題解決であることが判明した。
    • アメリカの貢献者は自己宣伝行動が強く,中国の貢献者は学習意欲がより高い傾向が見られた。
    • 詳細なプロフィールを持つ貢献者は自己宣伝や交流活動に積極的で,学習目的のユーザーは自己表現を控える傾向がある。

    Link: https://arxiv.org/abs/2603.05043

  • 様相フラグメント [cs.CC, cs.LO, math.LO]目的:命題論理と様相論理の基底制限フラグメントに関する体系的なアプローチ
    • 論理学は,推論の基礎をなすため,計算機科学や哲学において不可欠である。
    • フラグメントの表現力と計算複雑性の関係が十分に解明されていない。
    • 様相論理フラグメントの表現力と計算可能性を体系的に分析すること。
    • 命題論理のフラグメント研究は,Boolean clone と Post lattice を用いて体系化されている。
    • 様相論理フラグメントは,基底となる「連結詞」によってパラメータ化された枠組みと,Boolean 関数と選択された様相演算子によってパラメータ化された「単純な様相フラグメント」に分類される。
    • 命題論理フラグメントおよび単純な様相フラグメントにおける教え込み可能性と例示学習可能性に関する結果をまとめ,未解決の問題を特定した。

    Link: https://arxiv.org/abs/2603.05055

  • 多タスク学習の漸近的振る舞い:暗黙の正則化とダブル descent 効果 [cs.LG, cs.IT, math.IT]目的:多タスク学習における汎化誤差改善の要因
    • 関連タスク間の共通情報を活用し,学習性能向上を目指す分野であり,機械学習の重要な課題である。
    • 複数の関連タスクから共通情報を適切に抽出するための定式化が困難である。
    • 多タスク学習がもたらす利益の理由を漸近的に解明し,汎化性能向上策を提示すること。
    • 多タスク学習は,追加の正則化項を持つ従来の学習法と同等であり,汎化性能の向上が期待される。
    • 複数のタスクを組み合わせることで,ダブル descent 現象の発生を遅らせ,緩和できることが実験的に示された。

    Link: https://arxiv.org/abs/2603.05060

  • 構成的マスター様相の複雑性 [cs.LO, math.LO]目的:構成的マスター様相論理の複雑性
    • 様相論理は,知識,信念,時間といった概念を形式的に扱う上で重要である。
    • 既存の様相論理では,より精緻な推論やモデル化が困難な場合がある。
    • 構成的マスター様相論理の計算複雑性を明らかにすることで,その応用範囲を広げる。
    • 提案された論理 $\sf CK^*$ と $\sf WK^*$ は,EXPTIME完全であることが示された。
    • これらは,指数サイズの有限モデル特性を持つことが確認された。
    • $\sf CS4$ と $\sf WS4$ がマスター様相論理に埋め込まれ,その妥当性問題がEXPTIME内に存在することが示された。

    Link: https://arxiv.org/abs/2603.05131

  • モデルデータセットのベンチマークフレームワーク [cs.DC, cs.SE]目的:モデルデータセットの品質,代表性,および特定のタスクへの適合性の測定
    • モデル駆動型エンジニアリングの研究において,データセットの重要性が増している。
    • データセットの品質が保証されず,研究結果の比較や再現性が困難である。
    • データセット自体のベンチマークを行い,評価基準と指標を提供する。
    • 本研究では,ソフトウェアモデルのデータセットを体系的に評価・比較するためのベンチマークプラットフォームを提案する。
    • このプラットフォームは,言語や形式に関わらず,定義された基準と指標を用いてデータセットを評価する。
    • データセットの品質,代表性,および特定のタスクへの適合性を系統的に測定することで,研究の信頼性を高める。

    Link: https://arxiv.org/abs/2603.05250

  • 非流束証明探索のための制約学習 [cs.LO]目的:非流束テーブル演算における証明探索の効率化
    • 自動定理証明は,論理的推論を機械化する上で不可欠であり,様々な分野に応用されている。
    • 非流束テーブル演算は,探索空間が広大になりやすく,過剰なバックトラッキングが発生しやすいという課題がある。
    • 制約学習を用いてバックトラッキングを削減し,効率的な証明探索を実現すること。
    • 古典一階述語論理における接続テーブル演算に制約学習を適用し,完全性を維持しつつバックトラッキングを削減することに成功した。
    • 接続駆動探索のための初期制約学習言語を反復的に改良することで,実用上バックトラッキングを大幅に削減することができた。
    • この手法は,他の非流束テーブル演算における証明探索にも応用可能であると考えられる。

    Link: https://arxiv.org/abs/2603.05258

  • 文字列方程式を冪乗とパリク画像を用いて解くことについて [cs.CL, cs.HC, cs.LO]目的:文字列方程式の解法
    • 形式検証やプログラム解析において,文字列に対する制約充足問題は重要な役割を担う。
    • 従来の解法では,複雑な文字列方程式や特定の種類の制約条件に対応できない場合がある。
    • 冪乗演算子とパリク画像の一般化,等式分解を組み合わせることで,複雑な文字列方程式を解く。
    • 本研究では,文字列に対する冪乗演算子,パリク画像の一般化,等式分解を組み合わせた新しいアプローチを提案する。
    • この手法を用いることで,従来の解法では困難であった複雑な文字列方程式,特に文字列上のSMT問題を解くことが可能となる。
    • ニールセン変換の拡張として文字列方程式を解くための新たな道筋を示す。

    Link: https://arxiv.org/abs/2603.05273

  • 大規模言語モデルによる制約ドメイン特化言語のコード生成能力評価フレームワーク [cs.SE]目的:制約ドメイン特化言語のコード生成能力評価フレームワーク
    • ソフトウェア開発におけるLLM活用が期待される中,ドメイン特化言語への適用は課題が多い。
    • LLMは,一般的なプログラミング言語に比べ,ドメイン特化言語のコード生成性能が低いという問題がある。
    • 本研究は,ドメイン特化言語におけるLLMのコード生成能力を体系的に評価する手法を確立する。
    • LLMはPythonに比べ,OCLやAlloyといった制約言語でのコード生成性能が低いことが示された。
    • コンテキストウィンドウサイズの小さいLLMでは,制約関連のコード生成が困難となる場合がある。
    • コード修正や複数回の生成試行といった手法がコード生成品質向上に有効であることが確認された。

    Link: https://arxiv.org/abs/2603.05278

  • ディスクスケーリングによるグラフ修正の再検討:単一半径から区間ベースの半径へ [cs.CL, eess.AS, cs.RO, cs.CL, cs.CG, cs.DS]目的:グラフクラス$\Pi$へのグラフ変換問題における,指定された修正回数 $k$ 以内の変換手法の計算複雑性
    • グラフ修正は,グラフ構造の変換や最適化において基本的な問題であり,様々な応用分野で重要である。
    • 従来のグラフ修正では幾何学的性質が考慮されず,特に幾何グラフの扱う上では限界がある。
    • ディスクスケーリングを一般化し,半径の区間を指定することで,より柔軟なグラフ変換手法を提供する。
    • 任意の多項式時間認識可能なグラフクラス$\Pi$に対し,$\Pi$-Scaling問題はXPに属することが示された。
    • クラスタグラフに対する$\Pi$-Scaling問題はNP困難であり,固定パラメータ多項式時間アルゴリズムが存在することが証明された。
    • 完全グラフに対する$\Pi$-Scaling問題は多項式時間で解けることが示され,連結グラフに対する$\Pi$-Scaling問題はW[1]-困難であることが証明された。

    Link: https://arxiv.org/abs/2603.05358

  • 有界ツリー幅を持つ複体における最適モースマッチングのETHタイトな複雑性 [cs.CL, cs.RO, cs.DB, cs.CG, cs.CC, cs.DM, cs.DS, math.GN]目的:最適モースマッチング問題における計算複雑性の評価
    • 離散幾何学における重要な問題であり,多様体解析への応用が期待される。
    • ツリー幅パラメータ化における厳密な計算複雑度の決定が未解決であった。
    • 任意の有限正則CW複体に対する複雑性の上界と下界を確立すること。
    • 任意の有限正則CW複体に対し,$2^{O(k \log k)} n$時間で解けるアルゴリズムを提案した。
    • ETHが成り立たない限り,$2^{o(k \log k)} n^{O(1)}$時間で解けるアルゴリズムは存在しないことを示した。
    • 3次元多様体の三角測量における既存の上界を改善する結果を得た。

    Link: https://arxiv.org/abs/2603.05406

  • mmWaveネットワークにおける空間認識型二次ライセンス共有 [cs.IT, math.IT]目的:mmWaveネットワークにおける空間認識型二次ライセンス共有の設計と性能評価
    • 周波数資源の有効活用が重要であり,特にmmWave帯域はその潜在力から注目されている。
    • mmWaveは指向性が高く,障害物に弱いという特性があり,干渉範囲が限られている。
    • 空間情報を活用し,二次利用者のアクセス機会を最大化し,効率的なライセンス共有を実現する。
    • 空間認識型二次ライセンス共有により,二次利用者の送信機会が増加し,ライセンス共有の実現可能性と利得が向上する。
    • 障害物の存在はカバレッジプロットの形状を変化させ,結論に影響を与える可能性がある。
    • 指向性と障害物の影響を考慮することで,プライマリとセカンダリの双方のリンク性能を改善できる。

    Link: https://arxiv.org/abs/2603.05427

  • 単純多面体における最短経路探索 [cs.DS, math.CO, math.OC]目的:線形計画法における最短単調経路の計算困難性
    • 最適化問題において,効率的なアルゴリズムの確立が求められている。
    • 単純多面体上の最短経路問題は,その複雑さから未解決問題が残されていた。
    • 単純多面体上の最短経路問題の計算困難性を示すことで,関連する問題の限界を明らかにする。
    • 線形計画法の最適解への最短単調経路の計算はNP困難であることが証明された。
    • その結果として,シンプレックス法における最適基底への最短ピボット列の探索もNP困難である。
    • さらに,単純多面体の直径の計算もNP困難であることが示された。一方で,ある種の多面体では多項式時間で最短経路が見つかる。

    Link: https://arxiv.org/abs/2603.05482

  • NL2GDS:LLMを活用したオープンソースチップ設計インターフェース [cs.AR, cs.CY, cs.LO, cs.SY, eess.SY]目的:自然言語によるハードウェア記述を,合成可能なRTLおよびGDSIIレイアウトへの変換
    • ハードウェア設計の複雑化と高位仕様・RTL実装の乖離が,迅速なプロトタイピングを阻害している。
    • ASIC設計は専門性が高く,設計障壁が高いという課題がある。
    • LLMを活用し,ASIC設計を民主化し,ハードウェアイノベーションを加速すること。
    • NL2GDSは,自然言語によるハードウェア記述から,RTLとGDSIIレイアウトを生成する。
    • ISCAS'85/89ベンチマークにおいて,面積を最大36%削減,遅延を35%削減,消費電力を70%削減した。
    • 本手法は,オープンソースASICフローOpenLaneを活用し,自動合成とレイアウトを可能にする。

    Link: https://arxiv.org/abs/2603.05489

  • 辞書ベースパターンエントロピーによる因果方向の発見 [stat.ML, cs.IT, cs.LG, math.IT]目的:時間的な観測データからの因果方向の発見
    • 因果推論は,科学的発見や意思決定において不可欠な役割を果たす。
    • シンボル系列のようなデータにおいては,関数モデルやノイズの仮定が困難である。
    • 因果方向の特定と,効果変数の変化を駆動する特定のサブパターンを明らかにすること。
    • 提案手法であるDPEは,様々な合成システムにおいて,他のAITベース手法を上回る,あるいは同等の信頼性の高い性能を示した。
    • 生物学的および生態学的データセットにおいても競争力のある性能を発揮し,パターンレベルの不確実性の最小化がロバストな因果探索を可能にした。
    • DPEは,決定論的なパターン構造と確率的な変動性の間に,原理的なつながりをもたらす。

    Link: https://arxiv.org/abs/2603.04473

  • 量子滑らかなエントロピーの再検討:量子プライバシー増幅の厳密なワンショット解析 [quant-ph, cs.IT, math-ph, math.IT, math.MP]目的:量子サイド情報に対するランダム性抽出(プライバシー増幅)の厳密な評価
    • 量子情報理論は,量子コンピュータの安全性や効率的な情報処理に不可欠な基盤技術である。
    • 既存のプライバシー増幅の評価は厳密さに欠け,情報漏洩のリスクが残存する可能性があった。
    • 量子プライバシー増幅における厳密な評価手法を確立し,安全性向上を目指す。
    • 新しい滑らかな条件付きエントロピーの定義により,既存のプライバシー増幅の限界を克服した。
    • レフトオーバーハッシュ補題を強化し,量子プライバシー増幅の最小エントロピー上限を大幅に改善した。
    • 得られた結果は,トレース距離に基づくプライバシー増幅の最適な漸近展開を確立し,既存研究を凌駕した。

    Link: https://arxiv.org/abs/2603.04493

  • 分布の独立性検定のための最適予測拡張アルゴリズム [stat.ML, cs.DS, cs.LG]目的:分布の独立性検定におけるサンプル複雑度の削減
    • 統計的推論の基礎であり,データ分析における重要な課題である。
    • 最悪の場合のサンプル複雑度がサポートサイズに依存し,計算コストが高い。
    • 予測情報を活用することで,サンプル効率を向上させ,より実用的な検定を可能にする。
    • 予測情報を取り入れた独立性検定器を設計し,最悪の場合の信頼性を維持しつつ,予測精度が高い場合にサンプル効率を改善した。
    • 離散分布における二変量独立性検定器は,予測誤差に基づいてサンプル複雑度を適応的に削減する。
    • 高次元多変量設定への一般化を行い,最適なサンプル複雑度を達成することを示した。

    Link: https://arxiv.org/abs/2603.04635

  • ネットワーク信号調整のための量子アルゴリズム [math.OC, cs.SY, eess.SY, quant-ph, cs.CC, cs.DS, cs.NI]目的:ネットワーク信号調整問題に対する量子アルゴリズムの開発
    • 古典計算が困難な問題に対し,量子アルゴリズムによる効率化が期待されている。
    • ネットワーク信号調整問題はNP困難であり,計算量が増大しやすい。
    • 量子アルゴリズムを用いて,ネットワーク信号調整問題の計算効率を向上させる。
    • Groverの探索アルゴリズムを実装し,ネットワーク信号調整問題に対して二次的な高速化を実現した。
    • Robust NSC問題に対する量子アルゴリズムを開発し,その計算量を解析した。
    • シミュレーションと実機量子コンピュータでの実装により,アルゴリズムの有効性を検証した。

    Link: https://arxiv.org/abs/2603.04758

  • DNAへのプログレッシブ画像貯蔵のための適応的サンプリング [eess.IV, cs.IT, math.IT]目的:DNAへのプログレッシブ画像の効率的な符号化と貯蔵
    • データ量の増大と記録媒体の短寿命化により,長期的なデータアーカイブが重要課題となっている。
    • DNAデータストレージはコストと信頼性の問題があり,実用化には符号化率と誤り耐性が不可欠である。
    • 特定の解像度で画像を読み出す際のコストを削減し,ランダムアクセスを可能にすることを目的とする。
    • JPEG2000などのプログレッシブコーデックを利用し,解像度に応じて符号化するオリゴのセットを調整する。
    • ナノポアシーケンサーの適応的サンプリングにより,PCRフリーのランダムアクセスを実現する。
    • これにより,必要な解像度の画像を効率的に読み出すことが可能となり,コスト削減に貢献する。

    Link: https://arxiv.org/abs/2603.05220

  • 動的加重自動マーケットメーカーにおける最適リバランスのリーマン幾何学 [q-fin.MF, cs.IT, math.DG, math.IT, q-fin.TR]目的:動的加重AMMプールにおける最適リバランス戦略の幾何学的性質
    • 分散型金融(DeFi)における自動マーケットメーカー(AMM)は流動性供給の重要な手段となっている。
    • AMMのリバランスコストは最適化が難しく,効率的なリバランス戦略が求められている。
    • リバランスコストを最小化する幾何学的なアプローチを提示し,効率的なリバランス戦略の実現を目指す。
    • リバランスにおける各ステップの裁定損失がKLダイバージェンスと等しく,Fisher-Rao計量が自然なリーマン計量となることが示された。
    • KLコストを最小化する補間は,ヘリンガー座標における球面線形補間(SLERP)であり,これは測地線に相当する。
    • 既存のヒューリスティックが測地線上にあること,また,再帰的なAM-GM二分法により測地線上の点を三角関数なしで到達できることが明らかになった。

    Link: https://arxiv.org/abs/2603.05326

  • 2次元トポロジカル並進不変符号に対する一般化マッチングデコーダ [quant-ph, cs.DS]目的:2次元トポロジカル並進不変符号の効率的な誤り訂正
    • 量子計算の誤り耐性化には,効果的な誤り訂正符号が不可欠である。
    • 既存の符号では,複雑さや性能の限界から実用化が難しい場合がある。
    • トポロジカル符号に対し,計算効率が高く性能保証のあるデコーダを開発する。
    • 本研究では,一般的なトポロジカル並進不変符号のデコードにグラフマッチング手法を適用した。
    • 提案するデコーダは,符号距離の一定の割合までの重みの誤りを訂正可能であり,非ゼロの符号容量閾値を持つことが示された。
    • 特に二変量自転車符号において,信念伝播法と同程度の性能が得られることが数値的に確認された。

    Link: https://arxiv.org/abs/2603.05402

  • 量子タナー符号の復号における汎用チェックノードを用いた復号の改善 [quant-ph, cs.IT, math.IT]目的:量子タナー符号の復号性能向上
    • 量子誤り訂正は,量子情報の信頼性確保に不可欠であり,その効率的な復号アルゴリズムの開発が重要である。
    • 従来の復号アルゴリズムでは,符号の構造を十分に活用できず,復号性能に限界がある場合がある。
    • 汎用チェックノードを導入することで,符号構造をより効果的に活用し,復号性能を向上させることを目指す。
    • 提案手法は,標準的な四進BP復号器やRelay-BP復号器を上回り,同程度のパラメータを持つgeneralized bicycle (GB)符号よりも優れた性能を示す。
    • 他の量子低密度パリティチェック (qLDPC) 符号に対しては,チェック結合の貪欲アルゴリズムを提案し,汎用BP復号を可能にした。
    • 理論的なサイクル解析により,提案手法の有効性を裏付けている。

    Link: https://arxiv.org/abs/2603.05486

  • リアルタイムBDIエージェント:モデルと実装 [cs.MA, cs.SE]目的:リアルタイム制約下におけるBDIエージェントのモデルと実装
    • 自律的なシステム開発において,BDIモデルは有効性が示されている。
    • 既存のBDIモデルは,リアルタイム性の要求下で時間的な制約を考慮していない。
    • リアルタイムシステムにおける時間管理に基づき,BDIエージェントの制御ループを再定義する。
    • 提案モデルは,時間制約とリソース状況を考慮した目標,計画,行動のリアルタイム管理を可能にする。
    • リソース収集ビデオゲームにおける実装を行い,様々なシナリオで検証した結果,有効性が確認された。
    • エージェントの適切な反応と,一般的なリアルタイム領域への応用を保証する。

    Link: https://arxiv.org/abs/2205.00979

  • 正の分離制約を持つ最短経路問題の多項式カーネル化について [cs.RO, cs.DM, cs.DS]目的:正の分離制約を持つ最短経路問題におけるカーネル化
    • 組み合わせ最適化問題は,現実世界の様々な問題をモデル化でき,その効率的な解法は重要である。
    • 最短経路問題はNP困難であり,大規模グラフにおける厳密解の計算は困難である。
    • 正の分離制約を持つ最短経路問題のカーネル化により,問題規模を削減し,効率的な解法を可能とする。
    • 解集合のサイズkをパラメータとした場合,一般グラフに対してO(k^5)頂点のカーネルが得られた。
    • GまたはHが特定のグラフクラスに属する場合,O(k^3)頂点のカーネル化が可能となった。
    • Hの構造的性質(頂点削除数)をパラメータとした場合,固定パラメータ計算可能性の結果が得られた。

    Link: https://arxiv.org/abs/2309.04346

  • 並行決定性スキップリストおよびその他のデータ構造 [cs.DC, cs.DS, cs.PF]目的:並行環境におけるスキップリスト等のデータ構造の設計と性能評価
    • 大規模データ処理において,効率的なデータ構造は不可欠であり,並行処理による性能向上が求められている。
    • NUMA環境下では,メモリへのアクセス遅延が性能に大きな影響を与えるという課題がある。
    • NUMA環境下でのメモリアクセス遅延を軽減し,データ構造の性能を向上させることを目指す。
    • 決定性スキップリストの設計・分析・性能評価を行った結果,多くのコアを持つNUMAノード上での有効性が示された。
    • ロックフリーなキューや,マルチリーダーマルチライターハッシュテーブルの実装を評価し,Intel TBBとの比較を行った。
    • ページフォールトやキャッシュミスを削減するメモリ管理戦略と,NUMAノード間アクセスを減らす階層的なデータ構造利用法を提案した。

    Link: https://arxiv.org/abs/2309.09359

  • P_5-自由グラフにおける最大部分リストH-彩色に関する多項式時間アルゴリズム [cs.IR, cs.CL, eess.SY, cs.FL, cs.RO, cs.SY, cs.DS, cs.CC]目的:P_5-自由グラフにおける最大部分リストH-彩色問題の多項式時間解法
    • グラフ彩色問題は,計算機科学や組合せ最適化において基本的な研究テーマである。
    • 一般グラフにおける最大部分リストH-彩色問題はNP困難であり,効率的な解法が求められていた。
    • P_5-自由グラフという特殊なグラフ構造に着目し,多項式時間で解けることを示す。
    • 本研究により,P_5-自由グラフにおける最大部分リストH-彩色問題が多項式時間で解けることが示された。
    • これにより,最大k-彩色部分グラフ問題についても,P_5-自由グラフに対して多項式時間解法が得られた。
    • 既存のアルゴリズムよりも効率的な解法であり,計算量に関する改善も達成された。

    Link: https://arxiv.org/abs/2410.21569

  • LLMによる自動TEE適応:プログラムにおける機密関数を特定,変換,移植 [cs.CR, cs.SE]目的:プログラム内の機密関数を特定,変換,移植するための自動化手法
    • TEEは,デバイスのセキュリティを向上させ,ソフトウェア攻撃から機密演算を保護する上で重要である。
    • 既存プログラムをTEEに適合させるには専門知識が必要で,開発者の負担が大きい。
    • LLMを活用し,開発者の介入を最小限に抑えながら,機密関数を自動的にTEEに移植すること。
    • AUTOTEEは,JavaでF1スコア0.94,Pythonで0.87を達成し,機密関数の特定において高い性能を示した。
    • GPT-4oを用いた場合,Javaでは91.8%,Pythonでは84.3%の成功率で,機密関数をTEE互換バージョンに変換できた。
    • AUTOTEEは,385個の機密関数からなるベンチマークデータセットを用いて有効性を検証した。

    Link: https://arxiv.org/abs/2502.13379

  • 大規模言語モデルの欠陥局所化能力に対するコード変更の影響評価 [cs.SE, cs.AI, cs.LG]目的:大規模言語モデルの欠陥局所化能力の頑健性に関する大規模な実証的調査
    • ソフトウェア保守におけるLLM活用が拡大しており,欠陥局所化はその重要な応用分野である。
    • 既存のLLM評価ベンチマークはコード生成に偏っており,意味的プログラム推論能力を評価できていない。
    • データ汚染やスケーラビリティ等の課題を克服し,LLMの欠陥局所化能力を正確に評価すること。
    • 意味を保存する変異(SPM)を適用した結果,LLMは以前に局所化された欠陥の78%で失敗する。
    • 関連コードが文脈の先頭に近いほど,LLMの推論能力は向上する。
    • LLMのコード推論は,意味に無関係な特徴に依存している可能性が示唆された。

    Link: https://arxiv.org/abs/2504.04372

  • MioHint:LLM支援によるホワイトボックスAPIテストのための変異 [cs.SE]目的:APIテストの効率化
    • クラウドアプリケーションの信頼性確保にAPIテストは不可欠である。
    • 既存のAPIテスト手法では,十分なテストカバレッジを得ることが困難である。
    • LLMを活用し,システムレベルの依存関係を考慮したAPIテストを実現する。
    • MioHintは,既存手法EvoMasterと比較して,平均で4.95%絶対的な行カバレッジの向上を達成した。
    • 変異精度は67倍に大幅に改善され,難しいターゲットの57%以上をカバーすることに成功した。
    • ベースラインでは10%未満だったカバレッジを大幅に向上させた。

    Link: https://arxiv.org/abs/2504.05738

  • ネットワーク主成分の差分プライバシー保護とスケーラブルな推定 [cs.DS, cs.LG]目的:ネットワーク主成分の推定
    • ネットワーク分析において,影響力のある頂点や拡散過程の制御など,主成分分析は重要な役割を果たす。
    • 多くのネットワークデータは機密性が高く,プライバシーを保護した主成分の計算が求められる。
    • 差分プライバシー保護下での効率的かつ高精度な主成分推定手法を確立すること。
    • 提案手法は,エッジ差分プライバシーを保証しつつ,実グラフの特性に応じてノイズ量を調整することで,高い精度を実現した。
    • Propose-Test-Release(PTR)フレームワークを改良し,プライバシー保護と計算時間の両立を図った。
    • 実験結果から,既存手法と比較して,PTRは平均して180倍の高速化を達成し,大規模グラフ(300万頂点)への適用も可能となった。

    Link: https://arxiv.org/abs/2505.03858

  • リングネットワークにおける符号化分散計算の最適性について [cs.IT, math.IT]目的:リング型通信ネットワークにおける符号化分散計算スキームの最適化
    • 分散計算は,大規模データの処理において重要な役割を担う。効率的な計算手法が求められている。
    • リングネットワークでは,中間値の交換における通信ボトルネックが課題となる。
    • 本研究は,通信負荷を軽減する符号化分散計算スキームを提案し,最適性を検証する。
    • 提案スキームは,ノード間で反対方向に符号化パケットを伝送する「逐次逆相乗り」に基づく。
    • All-gatherの場合,通信負荷,計算負荷,ブロードキャスト距離間の最適なトレードオフを実現する。
    • All-to-allの場合,環状配置において漸近的に最適な通信負荷を達成する。

    Link: https://arxiv.org/abs/2507.00091

  • 1
  • 2