arXiv雑要約

プログラム - 2026/03/20 公開

BenchBrowser：ベンチマーク妥当性評価のための証拠収集 [cs.CL, cs.DB, cs.CL, cs.AI, cs.SE]目的：ベンチマーク妥当性評価のための証拠収集
- 言語モデルの性能評価は，AI開発において不可欠であり，信頼性の高い評価基準が求められる。
- 既存のベンチマークはメタデータが粗雑で，実際のテスト内容が不明瞭な場合がある。
- ベンチマークが意図された能力を適切に評価しているか検証し，妥当性のギャップを定量化する。
- BenchBrowserは，20のベンチマークスイートから自然言語利用事例に関連する評価項目を検索する。
- 人間による検証の結果，高い検索精度が確認された。
- BenchBrowserは，内容妥当性（能力の側面に関する網羅性）と収束妥当性（同一能力測定時の安定したランキング）の低さを診断するのに役立つ。
Link: https://arxiv.org/abs/2603.18019
Quine：LLMエージェントをネイティブPOSIXプロセスとして実現する [cs.OS, cs.AI, cs.PL, cs.SE]目的：LLMエージェントの実現
- LLMエージェントは，AI技術の発展において重要な役割を担う。
- 既存のフレームワークは，OSが提供する機能をアプリケーション層で再実装している。
- OSのプロセスモデルを活用し，LLMエージェントの効率性と堅牢性を高める。
- Quineは，LLMエージェントをネイティブPOSIXプロセスとして表現するアーキテクチャである。
- プロセスIDを識別子，標準ストリームと終了ステータスをインターフェースとして利用する。
- プロセスモデルの限界を明らかにし，タスク固有の世界や修正可能な時間という拡張の方向性を示唆する。
Link: https://arxiv.org/abs/2603.18030
スクリプトごとの機能検出に基づくトランスパイラパスの条件付き実行 [cs.PL, cs.SE]目的：最新のJavaScript言語構文のサポートと多様な実行環境との互換性維持
- JavaScriptコンパイラの重要性が高まるにつれ，最新の言語機能への対応が不可欠となっている。
- 従来のコンパイラは，ターゲット言語レベルに基づいてパスを厳密に選択するため，無駄な処理が多い。
- 入力ソースコードに存在しない機能を下げる高コストなAST走査を回避し，コンパイル効率を改善する。
- コンパイラがスクリプトレベルで機能を正確に追跡・管理することで，不要なトランスパイラパスを動的にスキップする。
- Google Closure Compilerに実装されたこの改善により，コンパイル時間の短縮，計算資源とメモリ使用量の削減が確認された。
- パスの順序の戦略的な配置と，トランスパイルされたコードの機能適合性の動的検証により，安全性を確保している。
Link: https://arxiv.org/abs/2603.18049
ツールオーケストレーションワークフローのためのインフラとしてのガードレール：ポリシー優先型制御 [cs.CR, cs.SE]目的：ツール利用型自動化システムの安全性と信頼性の向上
- 自動化システムの普及に伴い，安全性と信頼性の確保が不可欠となっている。
- 既存の緩和策はモデル依存性が高く，汎用性に欠けるという課題がある。
- モデルに依存しない，ポリシーに基づいたツール呼び出し制御メカニズムを確立すること。
- ポリシーの厳格化により，違反の防止率が大幅に向上した(P0で0.000からP4で0.681へ)。
- タスクの成功率は低下したが，安全性の向上と引き換えにユーティリティとのトレードオフが明確になった。
- 再試行回数の増加が抑制され，秘密情報の漏洩検出精度が向上した(漏洩リコール0.875)。
Link: https://arxiv.org/abs/2603.18059
大規模なプラットフォーム防御の回避：YouTubeからブロックチェーンベースの分散型ストレージへのコンテンツ自動複製 [eess.SY, cs.SY, cs.CR, cs.SE]目的：YouTubeからJoystreamへのコンテンツ抽出と複製システム
- 動画共有プラットフォームは情報伝達の中核であり，そのデータの可用性と永続性が重要である。
- 中央集権型プラットフォームは，検閲やデータ消失のリスクを抱えている。
- 分散型ストレージへの複製により，プラットフォーム依存度を下げ，データの信頼性を高める。
- YouTubeの防御機構は相互に影響し合い，一つの回避策が別の問題を引き起こすことが多いことが判明した。
- データベースのスループット問題，OAuthトークンの大量期限切れ，キュー汚染などがシステム運用上の課題として特定された。
- プロキシスタックの進化，トラストミニマイズドな所有権認証プロトコル，書き込み先ログなどを導入し，信頼性の高い複製を維持した。
Link: https://arxiv.org/abs/2603.18071
コード平滑化の限界に対する新しいアプローチ [cs.IT, cs.CR, math.IT]目的：コード平滑化パラメータの限界
- 暗号システム安全性評価において，平滑化パラメータは重要な指標である。
- 既存研究ではフーリエ変換を用いるが，計算量や適用範囲に限界があった。
- ランダムウォークに基づく新しい不等式を導出し，既存の結果を一般化する。
- 等分配割を用いたランダムウォークの全変動距離に関する不等式を導出した。
- この不等式は有限アーベル群に対する既存の結果を包含する。
- コードベース暗号システムのセキュリティ分析に貢献する新たな手法を示す。
Link: https://arxiv.org/abs/2603.18077
成長するアルファベットは自動的にシャッフルプライバシーを増幅しない：妨害，推定境界，最適なメカニズム設計 [cs.IT, math.IT]目的：成長するアルファベットにおける隣接シャッフル実験および，カノニカルなペアワイズカイ二乗予算下での頻度推定のための最適なメカニズム設計
- データプライバシー保護は，個人情報を秘匿しつつデータ活用を可能にするため，現代社会において不可欠である。
- シャッフルプライバシーは，データ集計時のプライバシー保護手法の一つであるが，アルファベットサイズ増加によるプライバシー劣化が懸念されている。
- 本研究は，アルファベットサイズの増加がシャッフルプライバシーに与える影響を明らかにし，最適なメカニズムを設計する。
- シャッフルヒストグラム実験は，ペアワイズ尤度比のプッシュフォワード法則にのみ依存することが証明された。
- アルファベットサイズが大きくなると，シャッフルプライバシーが単純な二項ランダム応答と同程度になる場合があることが示された。
- 最適なメカニズムは，積極的なGRR（Generalized Randomized Response）に加えて，無効なシンボルを送信する希釈原理に基づくことが明らかになった。
Link: https://arxiv.org/abs/2603.18080
コード骨格で構築：専門家向け低コストなエージェントワークフローのインタラクティブなノーコードノートブック [cs.AI, cs.HC, cs.PL, cs.SY, eess.SY]目的：AIエージェントを用いたワークフローの構築
- AI技術の活用範囲拡大のため，専門知識がなくてもワークフローを構築できる環境が求められている。
- 従来のワークフロー構築は，技術的な知識が必要であり，専門家以外には参入障壁が高い。
- 専門家が容易にワークフローを構築し，低コストで運用できる手段を提供する。
- Skele-Codeは，自然言語とグラフベースのインターフェースにより，技術者でないユーザーでもワークフローを構築可能にする。
- コード生成とエラーリカバリーにエージェントを活用することで，トークンコストを削減し，効率的なワークフロー構築を実現する。
- 生成されたワークフローはモジュール化されており，拡張性や共有性に優れている。
Link: https://arxiv.org/abs/2603.18122
オンライン学習によるk-中央値問題に対する学習拡張アルゴリズム [cs.DS, cs.LG]目的：k-中央値問題における学習拡張アルゴリズムの性能向上
- 機械学習の活用により，過去のデータから効率的な問題解決が期待される分野である。
- 従来のアルゴリズムは，問題の特性変化に追随できず，最適な解が得られない場合がある。
- 過去の事例を学習し，将来の事例に対応可能なアルゴリズムを開発し，性能向上を目指す。
- 提案手法は，オンライン学習の枠組みに基づき，k-中央値問題に適用できる学習拡張アルゴリズムである。
- 実験結果から，提案手法は最適な固定k-中央値解の平均性能に近似できることが示された。
- また，動的に変化するデータ系列に対して，自動的に適応する能力を持つことが確認された。
Link: https://arxiv.org/abs/2603.18157
奇数個の赤い辺を含む二部完全マッチング多面体の複雑性について [eess.SY, cs.SY, cs.CY, cs.DS]目的：奇数個の赤い辺を含む二部完全マッチング多面体の構造の複雑性
- 組み合わせ最適化問題の多面体構造の理解は，効率的なアルゴリズム開発に不可欠である。
- 二部完全マッチング問題の多面体構造は未解明な部分が多く，特に整数計画問題との関連性が課題である。
- この研究は，奇数個の赤い辺を含む二部完全マッチング多面体の複雑な面構造を明らかにすることを目的とする。
- 奇数個の赤い辺を含む二部完全マッチング多面体は，単純な制約だけでは正確に記述できないことが示された。
- この多面体の面構造は非常に複雑であり，従来の緩和法では対応困難であることが判明した。
- 本研究は，二部整数計画問題全体の多面体構造の複雑さを示唆する結果とも繋がる。
Link: https://arxiv.org/abs/2603.18232
キャッシュ支援型非対称MIMO通信における達成可能なDoF限界 [cs.RO, cs.IT, eess.SP, math.IT]目的：キャッシュ支援型非対称MIMO通信における達成可能な自由度(DoF)の限界
- 通信容量向上の鍵は，利用可能な周波数資源の効率的な活用である。MIMO技術とキャッシュ技術の融合は，その有効な手段となる。
- 従来のMIMOシステムでは，各ユーザのアンテナ数が異なる非対称構成におけるDoF解析が困難であった。
- 本研究は，異なる受信アンテナ数を持つユーザ群における最適なMIMO-CC戦略を提案し，DoFの向上を目指す。
- 提案する4つのコンテンツ認識型MIMO-CC戦略（min-G，Grouping，Super-grouping，Phantom）は，様々なシステム構成においてDoFを改善する。
- 各戦略は，DoFとサブパケット化の複雑さの間に柔軟なトレードオフを提供する。
- 既存の対称CC配置・配信ポリシーとの組み合わせにより，DoF性能を最大限に引き出すことが可能である。
Link: https://arxiv.org/abs/2603.18240
LLMエージェントのツール呼び出し安全性の網羅的検証と監査 [cs.SE, cs.CR]目的：LLMエージェントのツール呼び出しにおける安全性
- LLMエージェントの利用拡大に伴い，安全性確保が不可欠である。
- 既存のベンチマークでは，安全性テストの網羅性が十分ではない。
- ベンチマークで検出されない潜在的な危険な挙動を明らかにすること。
- SafeAuditフレームワークにより，既存のベンチマークでは検出されなかった20%以上の危険な挙動が明らかになった。
- テスト予算が増加するにつれて，網羅性が向上することが確認された。
- 現在の安全性評価には不備があり，メタ監査が不可欠であることが示唆された。
Link: https://arxiv.org/abs/2603.18245
ベイズ推定における計算量・有用性・プライバシーのトレードオフ [cs.NI, cs.DS, cs.CC, cs.IT, cs.LG, math.IT, stat.ML]目的：ベイズ推定におけるプライバシー保護と推定精度の両立
- 現代データ科学の根幹をなすベイズ推定は，データ制約下での推定や不確実性の定量化に不可欠である。
- 現実世界での応用において，個人のプライバシー保護が求められるが，プライバシー保護と推定精度の両立は困難である。
- 本研究では，プライバシー保護下でのベイズ推定における最適な推定精度を追求し，計算量との関係を明らかにする。
- ガウス分布の平均推定と線形回帰問題に対し，$(1+o(1))\mathrm{OPT}$ の平均二乗誤差を達成する効率的なアルゴリズムを開発した。
- 両タスクにおいて，計算量と統計的精度の間に興味深いギャップが存在することを示した。
- プライバシー保護されたベイズ推定を実現するため，経験平均やOLS推定器に対するロバスト推定器を設計する必要があることを示した。
Link: https://arxiv.org/abs/2603.18254
不確実な測定値を持つターンパイク：決定的な復元保証を持つ三角形等式ILP [cs.CG, cs.DS, math.OC]目的：不確実なペアワイズ距離から一次元点集合の再構成
- 距離情報のみから点集合を復元する問題は，計量学習やデータ解析において重要である。
- ノイズや丸め誤差を含む距離データからの正確な点集合復元は困難である。
- ノイズや誤差下でも点集合を復元可能な条件とアルゴリズムを確立すること。
- 三角形等式に基づくILPとLP緩和を導入し，組合せ的な入力構造のみに依存するモデルを提案した。
- ノイズと丸め誤差の影響下でも，特定の分離条件が満たされれば正確な復元が可能となることを示した。
- 実験により，提案手法の積分性と，理論的に証明可能な範囲外での性能劣化が示された。
Link: https://arxiv.org/abs/2603.18283
多項式構成と多重集合削除符号のための削除ボール幾何 [cs.IT, math.IT]目的：多重集合削除符号における誤り訂正能力
- 通信路における順序消失や記号多重度の誤りという現実的な問題に対応するため。
- 既存の符号化方式では，多重集合における削除距離の幾何学的構造の理解が不十分である。
- 削除ボールのサイズを正確に評価し，符号のサイズに関する限界を導出すること。
- 有限体上の多項式を用いたSidon型構成により，ブロック長$n$に依存しない冗長度$t+O(1)$の多重集合$t$-削除訂正符号を確立した。
- 削除ボールの幾何学的解析により，極端な多重集合とバランスの取れた多重集合における半径$r$削除ボールの最小化・最大化を証明した。
- 平均ボールサイズに基づく符号サイズの限界を導出し，理想差集合$S_{q-1}(r,r)$との関連性を示した。
Link: https://arxiv.org/abs/2603.18322
LLMはRust検証のための自動定理証明機のように推論できるか？ VCoT-Bench：検証Chain of Thoughtによる評価 [eess.SY, cs.SY, cs.SE, cs.AI, cs.LG]目的：Rustプログラム検証におけるLLMの推論能力の評価
- ソフトウェアの安全性確保が重要視される中，形式検証の自動化が求められている。
- 既存のLLM評価は，検証結果の合否のみに着目しており，推論過程が不明瞭である。
- LLMの検証プロセス理解度を，詳細な推論過程を通して明らかにすること。
- VCoT-Liftフレームワークにより，ソルバーレベルの推論を人間が理解可能な検証ステップとして提示できる。
- VCoT-Benchベンチマークは，1,988のVCoTタスクを用いてLLMの検証プロセス理解度を評価する。
- 評価の結果，現在のLLMは自動定理証明機と比較して，推論能力が著しく劣ることが示された。
Link: https://arxiv.org/abs/2603.18334
盆栽：グラフ分割の独立サンプリングのための効果的な手法群 [cs.DS, cs.CY, cs.SI]目的：グラフ分割空間上の妥当な確率分布からの独立サンプリング
- 地域区分は，政治，都市計画，社会科学において重要な課題である。
- 既存手法では，計算コストが高く，効率的な分割が困難である。
- 独立サンプリングによる効率的な分割手法を開発し，その性能を評価する。
- 本手法は，グリッドグラフや実際の選挙区図において，マルコフ連鎖法と比較して良好な性能を示した。
- 人口バランスが完全に保たれる場合，本手法がサンプリングする分布を明示的に記述した。
- 独立サンプリングは，グラフ分割の分野において有効な選択肢となりうる。
Link: https://arxiv.org/abs/2603.18347
6Gに向けたLEOベース搬送波位相測位：設計に関する考察とGNSSとの比較 [cs.IT, eess.SP, math.IT]目的：LEO衛星を用いたNR-NTNシステムにおける遅延・搬送波位相測位の性能評価
- 高精度な測位・ナビゲーション・タイミング(PNT)サービスは，自動運転やIoT等の発展に不可欠である。
- 従来のGNSSは，都市部や屋内環境において測位精度が低下する課題がある。
- LEO衛星を活用することで，GNSSの課題を克服し，高精度な測位サービスを提供することを目指す。
- LEO衛星の高速軌道運動により，多時間・多幾何学的多様性が生じ，整数曖昧性収束が高速化されることが示された。
- 断続的な測位参照信号(PRS)送信に対応するため，広帯域PRSと連続狭帯域搬送波を組み合わせた二重波形設計が提案された。
- LEOベースの遅延・搬送波位相測位は数秒でセンチメートルレベルの精度を達成し，GNSSよりも優れた性能を示すことが確認された。
Link: https://arxiv.org/abs/2603.18360
量子様相論理の決定可能性 [eess.SY, cs.SY, cs.LO, math.LO]目的：量子様相論理の決定可能性
- 論理学は厳密な推論の基礎であり，計算機科学や哲学にも応用が不可欠である。
- 様相論理の決定可能性は一般に困難であり，量子論の導入で複雑性が増す。
- 量子様相論理の決定可能性を示すことで，理論の応用範囲を広げる。
- ハロープの補題を用いることで，量子様相論理が決定可能であることが証明された。
- 本研究は，量子論と様相論理の組み合わせに対する新たな理解を提供する。
Link: https://arxiv.org/abs/2603.18368
TENSURE：スパーステンソルコンパイラのファジング（登録レポート） [cs.RO, cs.PL, cs.SE]目的：スパーステンソルコンパイラのテストとその脆弱性検出
- 高次元データ解析や機械学習において，スパーステンソルは不可欠なデータ構造となっている。
- 既存のテストフレームワークは，スパーステンソルコンパイラの複雑な最適化機能を十分に検証できていない。
- 本研究は，スパーステンソルコンパイラ特有の脆弱性を効率的に発見するファジングフレームワークを開発する。
- TENSUREは，アインシュタインの総和記法を用いて，複雑なテンソル演算を生成し，コンパイラのコード生成フェーズにおける潜在的な問題を露呈させる。
- TENSUREは，生成されるカーネルのセマンティックな有効性を100%保証する制約ベースの生成アルゴリズムを採用しており，従来の文法ベースファザーを大きく上回る。
- TACOとFinchにおける評価により，特にTACOにおいて，TENSUREが生成したテストケースの多くでクラッシュや誤コンパイルが確認された。
Link: https://arxiv.org/abs/2603.18372
キャリブレーション距離の計算と統計的困難性 [cs.CL, cs.DS, cs.LG, stat.ML]目的：キャリブレーション距離の計算および推定
- 確率的予測モデルの信頼性評価は重要であり，誤ったキャリブレーションは性能低下に繋がる。
- キャリブレーション距離の正確な計算は，計算量が多く困難である場合がある。
- 分布またはサンプルへのアクセス状況下におけるキャリブレーション距離の効率的な計算と推定を目指す。
- 分布が均一でありラベルがノイズレスの場合，キャリブレーション距離を正確に計算する効率的なアルゴリズムを開発した。
- 分布またはラベルの仮定を取り除くと，問題はNP困難となる。
- 一般的なケースに対しては，多項式時間近似スキームを拡張した。
Link: https://arxiv.org/abs/2603.18391
隠れた名所はどこにあるか？デザイン議論検出へのTransformerモデルの応用 [cs.SE]目的：デザイン関連の議論検出
- ソフトウェア工学において，設計決定は重要な要素であり，その記録はプロジェクトの進化に不可欠である。
- ラベル付きデータの不足とアノテーションコストの高さが，機械学習による設計議論検出のボトルネックとなっている。
- Transformerモデルのクロスドメインにおける性能を検証し，設計議論検出の精度向上を目指す。
- BERTとRoBERTaは，ドメインを跨いでも高い再現率を示した。
- XLNetはより高い適合率を達成したが，再現率は低かった。
- ChatGPT-4o-miniは最も高い再現率と競争力のある全体的な性能を示し，LaMini-Flan-T5-77Mは軽量な代替案として，より高い適合率を発揮した。
Link: https://arxiv.org/abs/2603.18393
LLM間のクロスモデルニューロン転移による安全機能の再利用 [cs.CR, cs.SE]目的：大規模言語モデルにおける安全機能の再利用
- 大規模言語モデルの普及に伴い，安全性確保の重要性が増している。
- 既存のモデルに安全機能を後付けするには，コストと労力がかかる。
- 他モデルの安全機能を転移することで，効率的な安全機能の付与を目指す。
- クロスモデルニューロン転移(CNT)により，安全機能を他のLLMへ転移できる。
- CNTは，性能劣化を最小限に抑えつつ，安全機能の追加・削除を可能にする。
- 実験結果は，CNTが5つのベースラインを上回り，汎用性と実用性を示す。
Link: https://arxiv.org/abs/2603.18449
ポーリヤ閾値グラフ [eess.SY, cs.SY, cs.IT, cs.SI, math.IT, math.PR]目的：ポーリヤ閾値グラフモデルの確率的・代数的性質
- 複雑なネットワークの構造を理解し，モデリングする上で重要である。
- 既存のランダムグラフモデルでは，特定のネットワーク構造の表現が難しい場合がある。
- ポーリヤ閾値グラフモデルを用いて，新たなネットワーク構造の解析を目指す。
- ポーリヤ引き出し過程に基づき，グラフの隣接行列の明示的な表現を導出した。
- 任意のノードの正確な次数分布とその平均，分散を解析的に求めた。
- 距離に基づく減衰中心性スコアの期待値を明示的に記述し，グラフのスペクトル特性を明らかにした。
Link: https://arxiv.org/abs/2603.18452
代表集合を用いた腎臓交換のより高速な決定性アルゴリズム [cs.CL, cs.HC, cs.DS]目的：腎臓交換問題に対する決定的な解法
- 臓器移植の効率化は医療において重要であり，特に腎臓交換は多くの患者の命を救う可能性を秘めている。
- 既存のアルゴリズムは計算時間が長く，大規模なデータセットに対しての実用性に課題があった。
- 本研究は，代表集合を用いることで，より高速な決定性アルゴリズムを開発し，移植可能な患者を増やすことを目指す。
- 本研究では，代表集合技術を導入し，腎臓交換問題を$O^*(6.855^t)$時間で決定的に解くことを示した。
- これにより，既存の$O^*(14.34^t)$時間で解く方法よりも大幅に高速化を実現した。
- この高速化は，より多くの患者への移植機会を提供し，医療資源の効率的な利用に貢献する。
Link: https://arxiv.org/abs/2603.18471
大規模言語モデルを活用したピーホール最適化の汎化 [cs.PL]目的：ピーホール最適化の汎化
- 現代の最適化コンパイラにおいて不可欠であり，プログラムの効率を向上させるために重要な役割を果たす。
- 最適化ルールを広く適用可能な形に一般化する作業は困難を伴い，専門知識と多大な労力を必要とする。
- 大規模言語モデルを用いて，ピーホール最適化の汎化を効率的に行う手法を提案し，自動化の促進を目指す。
- LPGは，LLVMエコシステムの実例において，102件の最適化のうち90件を正常に汎化することに成功した。
- 整数に焦点を当てた部分では，Hydraと比較して，81件中74件を汎化し，Hydraの35件を上回る結果を示した。
- LPGは，LLMによる記号定数汎化，構造汎化，制約緩和などを統合したクローズドループのワークフローを採用している。
Link: https://arxiv.org/abs/2603.18477
混合直交配列の構造的性質と冗長性の排除 [cs.IT, math.IT]目的：混合直交配列の構造的性質に関する研究
- 組合せ設計における基礎であり，実験計画法や符号理論など，幅広い分野に応用される。
- 混合直交配列は非対称性から，古典的な手法が適用できず，構造解析が困難である。
- 混合直交配列の構造的限界を明らかにし，効率的な設計方法を確立することを目指す。
- 混合直交配列に対して，Singleton型の限界値を導き出し，MDS型およびほぼMDS型の混合直交配列を特徴づけた。
- $\mathbb{F}_q$線形混合直交配列に対し，トレース双対性を導入し，誤りブロック符号との対応関係を確立した。
- 冗長性のない混合直交配列に関する構造理論を構築し，t-均一および絶対的に最大に絡み合った量子状態の構築への応用を示唆した。
Link: https://arxiv.org/abs/2603.18568
DRESSによる困難な同型性識別ベンチマークの打破 [cs.DS, cs.DM, cs.LG]目的：強正則グラフの識別性能の向上
- グラフ同型性判定は，化学，社会ネットワーク，機械学習など，様々な分野で重要な課題である。
- 既存のグラフ識別手法では，特定のグラフファミリーにおいて識別が困難な場合がある。
- 本研究では，困難なグラフファミリーにおいても高精度な識別を実現する手法を提案する。
- 提案手法である$\Delta$-DRESSは，51,718個の強正則グラフに対して，ファミリー内で一意なフィンガープリントを生成することに成功した。
- $\Delta$-DRESSは，既存の3-WLアルゴリズムでは識別不可能なグラフペアを分離することができた。
- 提案手法は，多項式時間で実行可能であり，メモリ使用量も比較的少ない。
Link: https://arxiv.org/abs/2603.18582
SQL-Commenter：直接選好最適化によるSQLコメント生成のための大規模言語モデルの調整 [cs.SE]目的：SQLコメント生成のための大規模言語モデルの性能向上
- SQLクエリは複雑な構文を持ち，可読性・保守性が課題である。適切なコメントは，コード理解を助ける上で不可欠である。
- 大規模言語モデルはSQL固有のセマンティクスを理解することが難しく，正確なコメント生成が困難である。
- 複雑なSQLクエリに対する高品質なコメントを自動生成し，コード理解を支援すること。
- SQL-Commenterは，SpiderおよびBirdベンチマークにおいて，最先端のベースラインを大幅に上回る性能を示した。
- BLEU-4，METEOR，ROUGE-Lのスコアにおいて，最も強力なベースライン(Qwen3-14B)をそれぞれ9.29%，4.99%，13.23%ポイント上回った。
- 人間による評価においても，SQL-Commenterが生成するコメントは，正確性，完全性，自然さにおいて優れていることが確認された。
Link: https://arxiv.org/abs/2603.18606
相互依存性のあるオークションの複雑性 [cs.GT, cs.CC, cs.DS]目的：真実を誘引するメカニズムの近似比最適化
- オークション設計は，資源配分の効率性向上に不可欠であり，経済学・計算機科学の重要な分野である。
- 従来の近似アルゴリズムは，ドメイン制限や単調性などの仮定に依存しており，現実的な応用が困難である。
- より一般的な条件下での真実を誘引するメカニズムの近似比最適化問題の複雑性を明らかにする。
- 価値設定とコスト設定の両方において，近似比の最適化に関する計算問題に取り組んだ。
- 一部の特殊なケースは古典的な組合せ問題に帰着可能であり，効率的なアルゴリズムが存在することが示された。
- 一般的なケースでは計算困難性を示し，クエリ複雑性下界とNP-Hardnessを証明した。
Link: https://arxiv.org/abs/2603.18668
Pythonアプリケーションにおけるクロスエコシステム脆弱性分析 [cs.PF, cs.CR, cs.SE]目的：Pythonアプリケーションの脆弱性分析手法
- ソフトウェアサプライチェーン攻撃の増加に伴い，依存関係にあるライブラリの脆弱性管理が重要になっている。
- Pythonアプリケーションが利用するネイティブライブラリの脆弱性特定には，PythonとOSの両方の依存関係を考慮する必要がある。
- ベンダー化されたライブラリの脆弱性とOSによるセキュリティパッチの適用状況を正確に把握し，誤検知を減らすことを目指す。
- 提案手法では，ベンダー化されたライブラリをOSパッケージバージョンに紐付け，コンテンツベースハッシュと動的解析を用いて正確なバージョン情報を抽出する。
- Pythonとバイナリのコールグラフを統合し，依存関係を考慮した脆弱性の到達可能性分析を実現した。
- 10万のPythonパッケージと10件のCVEを対象とした評価で，4700万件以上の月間ダウンロード数を持つ脆弱なパッケージを特定し，誤検知を97%削減した。
Link: https://arxiv.org/abs/2603.18693
4x4行列の乗算のための48回の乗算を用いる，より正確な有理数非可換アルゴリズム [cs.DS, cs.SC]目的：2の逆元を含む環における4x4行列の乗算のための48回の乗算を用いるアルゴリズムの，より正確な変種
- 行列乗算は，科学技術計算において基本的な演算であり，効率的なアルゴリズムの開発は重要である。
- 従来の行列乗算アルゴリズムでは，計算量が多く，数値的な誤差が蓄積しやすいという問題がある。
- 本研究は，より少ない乗算回数で，かつ数値的に安定な行列乗算アルゴリズムを開発し，誤差を低減することを目指す。
- 本アルゴリズムのエラー境界指数はlog 4 γ∞,2 ≈ 2.386であり，既存の高速アルゴリズムよりも改善されている。
- 実用的な実験において，最大ノルムに関する精度も向上することが確認された。
- 本アルゴリズムのストレートラインプログラムを提案し，複雑度の境界における主要な定数387 32 n 2+log 4 3 + o n 2+log 4 3 を与えた。
Link: https://arxiv.org/abs/2603.18699
資源制約下におけるべき乗の逆数方策による共同補充 [cs.DS, math.OC]目的：資源制約下での共同補充問題における近似最適解の改善
- 在庫管理は，サプライチェーン効率化の根幹であり，経済活動において不可欠である。
- 資源制約下での共同補充問題は，古典的な手法では近似精度が低いという課題があった。
- 本研究では，新たな丸め手法を用いて，より精度の高い近似解を導くことを目指す。
- 凸緩和の精度向上と，べき乗の逆数方策，ランダムシフト，格子分割などの手法を組み合わせることで，近似精度を向上させた。
- 既存の1.4427から，1.2023という，べき乗の逆数方策を用いた共同補充問題における最良の近似率を達成した。
- 二重グリッド構造と相互干渉政策を用いることで，さらなる精度向上が可能であることを示した。
Link: https://arxiv.org/abs/2603.18720
機械学習システムにおける環境配慮型アーキテクチャ戦略：LLMを用いたリポジトリマイニング研究 [cs.SE]目的：機械学習システムにおける持続可能な慣行の実施状況と，新たな慣行の特定
- 機械学習の利用拡大に伴い，環境負荷への懸念が高まっているため，持続可能な開発が重要である。
- 既存の持続可能な慣行の採用状況や，未記録の慣行の存在に関する理解が十分ではない。
- 実世界の機械学習システムにおける環境配慮型戦略の実装状況を明らかにし，新たな戦略を発見する。
- 既存の研究で報告されている環境配慮型戦略が実際に利用されていることが確認された。ただし，採用率は戦略によって異なる。
- LLMを用いたアプローチにより，9つの未記録の持続可能な慣行が明らかになった。
- 各戦略は，採用と統合を支援するためにコード例とともに提示された。
Link: https://arxiv.org/abs/2603.18734
時空間プログラミング：コードと実行のライブかつ全知的な探索 [cs.SE]目的：コード修正と実行フローの探索のためのプログラミングモデル
- ソフトウェア開発におけるデバッグと理解は，品質と効率に不可欠である。
- コード変更と実行時の挙動の関係性の把握が困難である。
- コードと実行の統合的な探索環境を提供し，開発効率を向上させる。
- 時空間プログラミングは，コードの変更と実行フローを同時に探索できる新しいアプローチである。
- 実行状態とコードの変更履歴を追跡するメカニズムを導入した。
- PythonライブラリSpaceTimePyを実装し，デバッガとゲーム開発ツールで評価した結果，テストスイートのオーバーヘッドは35〜150%であった。
Link: https://arxiv.org/abs/2603.18735
LLM支援セキュリティコードレビューにおける確証バイアスの測定と悪用 [cs.SE, cs.AI, cs.CR]目的：LLM支援セキュリティコードレビューにおける確証バイアスの存在と，ソフトウェアサプライチェーン攻撃におけるその悪用の可能性の評価
- ソフトウェアの脆弱性対策において，コードレビューは重要な役割を担う。効率化と品質向上が求められている。
- LLMを活用したコードレビューツールは，確証バイアスの影響を受けやすく，脆弱性の検出精度が低下する可能性がある。
- LLMが持つ確証バイアスを定量的に評価し，その悪用可能性を検証することで，安全な利用方法を確立することを目指す。
- プロンプトの提示方法によってLLMの脆弱性検出率が大きく変動し，特に変更をバグがないと示唆すると検出率が低下する。
- 悪意のあるプルリクエストにおいて，セキュリティ改善や緊急機能修正といったメタデータによる誘導により，CopilotとClaude Codeに対する攻撃成功率が高まる。
- メタデータの削除や明示的な指示により，確証バイアスの影響を軽減し，脆弱性の検出精度を向上させることが可能である。
Link: https://arxiv.org/abs/2603.18740
コードを超えて：入門プログラミングプロジェクトを通じた専門能力育成のための多角的評価戦略 [cs.CY, cs.SE]目的：入門プログラミングプロジェクトにおける専門能力育成のための多角的評価戦略
- ソフトウェア開発の進化に伴い，技術力とソフトスキル双方を育成することが重要となっている。
- 従来のプログラミング教育では，構文の習得に偏りがちで，実践的な能力育成が不十分である。
- 本研究は，多様な評価方法を導入することで，実践的な能力とコミュニケーション能力の育成を目指す。
- 多角的評価戦略は，プログラミングの基礎知識の定着を促進することが示唆された。
- コミュニケーション能力と批判的思考力の向上に有意な効果が認められた。
- ピアレビューとマルチメディアを活用することで，学習者のエンゲージメントを高めることができた。
Link: https://arxiv.org/abs/2603.18741
並行フリップ操作による中心三角形分割：CG:SHOPチャレンジ2026 [cs.RO, cs.CG, cs.DS]目的：点集合の三角形分割における中心三角形分割の探索
- 計算幾何学は，コンピューターグラフィックスやロボット工学など，幅広い分野で基礎技術として重要である。
- 三角形分割の最適化は計算コストが高く，大規模な点集合に対して効率的なアルゴリズムが求められている。
- 入力された三角形分割群の中で，中心三角形分割を効率的に特定することを目指している。
- 本研究では，2026年の計算幾何学チャレンジの概要を説明し，並行フリップ操作による中心三角形分割問題を扱った。
- チャレンジの目的は，与えられた点集合の三角形分割群の中から，並行フリップ距離の合計が最小となる中心三角形分割を決定することである。
- この課題は，三角形分割の最適化における新たなアプローチを模索する上で重要な貢献をする。
Link: https://arxiv.org/abs/2603.18812
トランシーバハードウェア障害下における不完全SICを用いた実用的なRIS支援RSMAシステムのためのロバストなビームフォーミング [cs.IT, math.IT]目的：実用的なハードウェア障害下におけるRIS支援RSMAシステムのためのロバストなビームフォーミング設計
- 無線通信において，スペクトル効率の向上が常に重要な課題である。
- RISとRSMAは有望だが，理想的なハードウェアを前提とする研究が多い。
- ハードウェア障害や不完全なSICが性能劣化を引き起こす問題を解決する。
- 提案手法は，従来のNOMAアプローチと比較して有意に優れた性能を示すことが確認された。
- ハードウェア障害，不完全SIC，振幅位相結合を無視するベンチマークスキームと比較して，より優れたロバスト性を持つ。
- 理想的なRISモデルに基づくビームフォーミング設計による性能劣化を理論的に定量化した。
Link: https://arxiv.org/abs/2603.18840
BeamAgent：意図解析と交互最適化を分離したLLM支援MIMOビームフォーミングによる基地局選定とプレコーディングの同時最適化 [cs.IT, cs.LG, cs.SY, eess.SP, eess.SY, math.IT]目的：LLM支援MIMOビームフォーミングにおける基地局選定とプレコーディングの同時最適化
- 無線通信の性能向上は，現代社会における情報伝達の基盤であり，その重要性は増している。
- LLMを無線通信に統合する際，物理層最適化の精度不足や無線データ不足が課題となる。
- LLMの持つ意味理解能力と数値最適化を分離し，データに依存しない効率的な最適化を実現する。
- BeamAgentは，LLMを用いて自然言語による記述を空間制約に変換し，その制約下で基地局選定とプレコーディングを最適化する。
- 実験結果から，BeamAgentは既存手法と比較して，目標領域における電力を大幅に向上させることが示された。
- 本手法は，専門家レベルの性能に迫りつつ，高速な最適化を可能にすることを確認した。
Link: https://arxiv.org/abs/2603.18855
平均分散不確実性を持つ加法性雑音路に対する検出器の理論的解析 [cs.IT, math.IT, math.PR]目的：平均分散不確実性下における加法性雑音路の検出器
- 通信システムの信頼性向上には，雑音環境下での信号検出精度の向上が不可欠である。
- 従来の理論では，雑音分布が特定されていることが前提であり，現実の不確実な状況に対応できない。
- 非線形期待値理論を用いて，雑音分布が不確実な状況下での最適な検出器を構築し，性能を評価する。
- 平均不確実性は最適な検出器の形状に大きな影響を与える一方，分散不確実性は影響を与えないことが示された。
- 提案する推定手法により，不確実な雑音パラメータを推定可能となり，よりロバストな検出器設計に貢献する。
- シミュレーション結果から，提案手法が従来の検出器よりも多くのシナリオで優れた性能を発揮することが確認された。
Link: https://arxiv.org/abs/2603.18937
競争的資源配分における後悔限界：内生的なコストを伴う場合 [cs.AI, cs.DS, cs.GT, cs.LG]目的：N個の相互作用するモジュールに対するTラウンドにわたるオンライン資源配分
- モジュール化されたシステムにおける資源配分は，効率的な運用に不可欠である。
- 従来のオンライン最適化では，コストが固定されている前提があり，現実の相互作用を考慮していない。
- 内生的なコストを考慮した資源配分アルゴリズムの性能限界を明らかにすること。
- 均一配分はΩ(T)の後悔を招く一方，ゲート付き配分はO(T^{2/3})，競争的配分はO(sqrt(T log N))を達成する。
- 競争的配分は，相互作用を通じて明らかになる内生的なコスト情報を活用することで，性能向上を実現する。
- 相互作用のトポロジーが計算コストと後悔のトレードオフを決定し，五行（Wuxing）トポロジーが最小化する。
Link: https://arxiv.org/abs/2603.18999
高次元線形分類の困難性 [cs.CG, cs.DS, cs.LG, stat.ML]目的：最大半空間不一致問題に対する次元数に関する指数関数的な下限
- 計算幾何学と機械学習の基盤であり，分類問題への応用が期待されるため。
- 既存の上界と下界に次元数に対する指数関数的な依存関係のギャップが存在する。
- アフィン退化判定問題やk-Sum問題の困難性仮説を用いてこのギャップを埋める。
- 最大半空間不一致問題に対し，$n^d$および$1/\varepsilon^d$に関する整合的な下限が得られた。
- アフィン退化判定問題に基づけば，$\tilde\Omega(n^d)$と$\tilde\Omega(1/\varepsilon^d)$の下限が導かれる。
- 片側判定クエリに制限されたモデルでは，同様の結果が無条件で成立する。
Link: https://arxiv.org/abs/2603.19061
LLMベースのバイナリ解析における暗黙的パターン [cs.AI, cs.CR, cs.SE]目的：LLMベースのバイナリ脆弱性解析における探索の組織化
- バイナリ解析はセキュリティにおいて不可欠であり，自動化の必要性が高まっている。
- LLMの思考過程はブラックボックスであり，解析戦略の理解が困難である。
- LLMのバイナリ解析における暗黙的なパターンを明らかにすること。
- LLMによる多段階の推論過程から，トークンレベルでの明確なパターンが認められた。
- そのパターンは，早期の枝刈り，経路依存型ロックイン，標的型バックトラッキング，知識に基づいた優先順位付けを含む。
- これらのパターンは，LLM駆動のバイナリ解析を特徴づける体系的なシステムを形成する。
Link: https://arxiv.org/abs/2603.19138
複雑ネットワークにおける連続時間量子ウォークの安定性 [quant-ph, cs.IT, math.IT, physics.comp-ph]目的：連続時間量子ウォークの安定性に関する特徴付け
- 量子情報科学は，安全通信や量子計算など，次世代技術の基盤となる重要な分野である。
- 現実の量子システムでは，環境ノイズにより量子状態が劣化しやすく，安定的な量子情報処理が困難である。
- 様々なネットワーク構造における量子ウォークのノイズ耐性を評価し，安定性の向上に貢献する。
- 固有のデコヒーレンスはコヒーレンスを最も長く維持する一方，量子確率ウォークは急速な減衰を引き起こすことが示された。
- ネットワーク構造や初期化ノードの特性によって安定性の順位が変動し，デコヒーレンスの種類に依存することが明らかになった。
- 高次ノードでの初期化は，量子確率ウォークに対する脆弱性を高め，局所化とコヒーレンスの間にはトレードオフが存在することが示唆された。
Link: https://arxiv.org/abs/2507.17880
二目的旅行者強盗問題に対する高度量子アニーリング：ε制約に基づくアプローチ [quant-ph, cs.IT, math.IT]目的：二目的旅行者強盗問題の最適化
- 組み合わせ最適化問題は，現実世界の様々な課題に応用可能であり，その重要性は高い。
- 多目的最適化問題は，計算コストが高く，古典的な計算手法では大規模問題への対応が困難である。
- 量子アニーリングとε制約法を組み合わせ，効率的な解探索と多様性の確保を目指す。
- 提案手法は，εパラメータの柔軟な選択により，広範なパレートフロントを効率的に探索可能である。
- 実験結果から，本手法は二つの目的を効果的に両立し，従来の基盤手法よりも時間効率が良いことが示された。
- 量子アニーリングとヒューリスティック探索の組み合わせにより，問題解決の性能が向上した。
Link: https://arxiv.org/abs/2603.18038
ボソンガウス量子状態のサンプル最適学習に向けて [quant-ph, cs.IT, cs.LG, math-ph, math.IT, math.MP]目的：ボソンガウス量子状態の学習に必要なサンプル数の理論的限界
- 量子計算，通信，センシング等の量子技術において，連続変数系が重要な役割を果たす。
- 未知のボソンガウス量子状態を効率的に特徴づけるためのサンプル数の最小限界が未だ不明である。
- ガウス測定と任意の測定に対するサンプル数の下限を導出し，学習の効率性を明らかにすること。
- nモードガウス状態をεのトレース距離で学習するために必要なコピー数は，ガウス測定でΩ(n^3/ε^2)，任意の測定でΩ(n^2/ε^2)である。
- ガウス状態が純粋または受動的である場合，サンプル数の上限はÕ(n^2/ε^2)となる。純粋状態と受動的状態では最適な学習に必要な測定が異なる。
- 単一モードガウス状態の学習において，非エンタングルメントなガウス測定ではサンプル数はÕ(E/ε^2)であり，適応的な手法が不可欠である。
Link: https://arxiv.org/abs/2603.18136
放射線誘起相関ノイズ下における安定化符号の反復復号 [quant-ph, cs.IT, eess.SP, math.IT]目的：放射線誘起相関ノイズ下での安定化符号の復号性能向上
- 量子計算の誤り耐性化には低誤り率が不可欠であり，超伝導量子ビットアレイが放射線ノイズの影響を受ける
- 放射線による準粒子密度は未知・変動するため，従来の復号器の前提と実際のノイズ統計にずれが生じる
- 準粒子密度を潜在変数としてモデル化し，ノイズ推定と復号を統合することで，性能低下を抑制する
- 準粒子密度推定とシンジドロームに基づく復号を交互に行う反復アルゴリズムを提案した。
- 表面符号および二変数自転車量子メモリのシミュレーションにより，従来の復号器と比較して論理誤り確率が減少することを示した。
- 推定された準粒子密度は，デバイス特性評価，シールド，チップ設計に関する情報を提供する。
Link: https://arxiv.org/abs/2603.18231
ベンフォード数列が収束しない理由 [math.NT, cs.IT, math.IT]目的：ベンフォード数列における多桁相関の解析
- 確率分布の法則性理解に不可欠であり，データ解析の精度向上に繋がる。
- 基数によっては，ベンフォード数列が収束せず，安定した法則性を示さない問題がある。
- 収束しない基数の割合を特定し，その要因を明らかにすること。
- 基数2から1000までを調査した結果，8.4%の基数において持続的な相関が確認された。
- 計算量増加後も5.3%の基数が持続的な相関を示し，真に収束しないことが判明した。
- 収束しない基数の割合は，ガウス・クズミン分布から予測される1/12に収束すると推測される。
Link: https://arxiv.org/abs/2603.18243
量子タナー符号復号のための効率的なソフト出力推測 [quant-ph, cs.IT, math.IT]目的：量子タナー符号の復号性能向上
- 量子誤り訂正は，量子コンピュータの信頼性確保に不可欠な技術である。
- 従来の復号手法では，トラッピングセットやサイクルが復号性能を制限する。
- ソフト出力推測を用いた復号により，これらの問題の解決を目指す。
- ソフト出力推測と整列統計復号の組み合わせにより，従来の復号手法を大幅に上回る性能を示す。
- 論理誤り率が最大3桁程度改善され，スケーラブルな復号の道が開かれる。
- 本研究は，タナー符号に基づく量子符号の実現可能性を大きく高める。
Link: https://arxiv.org/abs/2603.18318