arXiv雑要約

プログラム - 2026/05/12 公開

  • PaperFit: 科学論文の体裁最適化における視覚ループの活用 [cs.CL, cs.AI, cs.SE]目的:科学論文の視覚的な体裁の改善
    • 科学論文の質は,内容だけでなく,体裁によって大きく左右される。
    • LaTeX原稿はコンパイルできても,体裁が整っていない場合が多く,修正に手間がかかる。
    • 視覚的な検証とソースコードの修正を繰り返すことで,体裁を最適化する。
    • PaperFitは,論文をレンダリング,欠陥を診断,そして制約付き修正を反復的に行う視覚ループ型のエージェントである。
    • PaperFit-Benchという,10種類の会場テンプレートと13種類の欠陥を含む200本の論文を用いたベンチマークを構築した。
    • 実験の結果,PaperFitは既存手法を大幅に上回り,視覚ループ型最適化が不可欠であることが示された。

    Link: https://arxiv.org/abs/2605.10341

  • DREAMS:工学および芸術デザイン研究を支援するモデリング [cs.SE, physics.soc-ph]目的:工学および芸術デザイン研究における設計研究方法論(DRM)モデリングの支援
    • 設計研究方法論は,体系的な研究を支援するが,モデルの作成・維持には課題がある。
    • モデル作成は手作業が多く,修正や情報の管理が煩雑になりがちである。
    • DRMモデリングを効率化し,トレーサビリティを向上させるための支援ツールを開発する。
    • DREAMSは,DRMの要素を用いた因果モデルの構築,因果関係の定義,根拠情報の付加を可能にする。
    • DREAMSを用いた評価実験により,モデル作成・修正時間の短縮,視認性の向上が確認された。
    • これらの結果は,DRMモデリング支援の有用性を示す初期的な証拠と解釈できる。

    Link: https://arxiv.org/abs/2605.10382

  • フラクタルソートCPU:CPUにおける帯域幅効率の良い圧縮ラディックスソート [cs.DC, cs.DS]目的:CPU向けラディックスソートのヒストグラム圧縮手法
    • クラウドデータベースにおいて,ソートはクエリ処理,インデックス作成,結合処理の中核となる処理である。
    • 既存のラディックスソートは,データ分布への依存性や並列性の限界という課題を抱えている。
    • 本研究は,データ分布への依存性を軽減し,遅延を削減することを目指す。
    • 提案手法は,ヒストグラム成長を抑制しつつ,最先端の実行時間を実現する。
    • 入力データのバケット化や事前処理が不要となり,遅延がさらに低減される。
    • CPU,GPU,FPGAにおいて,それぞれ6倍,3倍,2.5倍の帯域幅効率の改善が確認された。

    Link: https://arxiv.org/abs/2605.10390

  • メッセージパッシングニューラルネットワークの多項式数え上げ能力 [cs.LG, cs.LO]目的:多項式数え上げ制約を持つ拡張 graded modal logic の表現条件
    • グラフ構造の論理的推論は,情報科学やAIの基盤技術である。
    • 既存のMPNNでは,多項式数え上げ制約の表現能力に限界がある。
    • MPNNによる多項式数え上げ制約の表現可能性を拡張し,より複雑な論理を扱えるようにする。
    • ノードラベル付きグラフにおいて,穏やかな仮定の下,mean MPNNがグローバルな多項式数え上げ制約を検証可能であることが示された。
    • ネストした様相性を持たない数式であれば,sum/max集約または正規グラフに限定することで,局所制約の検証も可能となった。
    • 木構造グラフ上で同様の仮定を用いることで,ネストした様相性を持つ数式もmean MPNNで捉えることができた。

    Link: https://arxiv.org/abs/2605.10393

  • VISOR:ロボットテストのためのビジョン言語モデルベースのテストオラクル [cs.SE, cs.RO]目的:ロボットのテストにおけるテストオラクル問題の自動化
    • ロボットの性能は社会実装において重要であり,その品質保証が不可欠である。
    • 従来のテスト方法は,人手による評価に依存しており,時間とコストがかかる。
    • 本研究は,VLMを活用し,人手を介さずにロボットのテストを自動化することを目指す。
    • VISORは,GPTとGeminiの二つのVLMを用いて評価され,タスクの正確性と品質を自動評価できることが示された。
    • Geminiはリコールが高く,GPTは精度が高いという結果が得られた。
    • ただし,両モデルともに不確実性と正確性の間に低い相関関係が見られた。

    Link: https://arxiv.org/abs/2605.10408

  • 量子LDPC符号のミンサム復号における症候群適応利得制御 [eess.SY, cs.SY, math.OC, cs.IT, eess.SP, math.IT]目的:量子低密度パリティチェック符号のミンサム復号における性能向上
    • 量子誤り訂正は,量子コンピュータの信頼性ある動作に不可欠であり,その効率的な復号アルゴリズムが求められている。
    • ミンサム復号は計算量が少ないが,メッセージの過大評価が発生し,性能劣化の原因となる。
    • 症候群適応利得制御により,符号の特性に応じた最適な利得を動的に調整し,性能を改善することを目指す。
    • 提案手法SAGMSは,固定スケーリングを用いたSMSデコーダと同等またはそれ以上のフレーム誤り率を達成する。
    • SAGMSは,特定の条件下ではBPデコーダの性能に匹敵し,場合によってはそれを上回る。
    • SAGMSは,符号の次数に関わらず安定した性能を示すため,実用的な復号器として期待できる。

    Link: https://arxiv.org/abs/2605.10433

  • CNCプログラムの物理的衝突検証のための分離論理 [cs.LO, cs.SE]目的:CNCプログラムの物理的衝突検証の形式検証フレームワーク
    • CNC工作機械の安全性確保は重要であり,自動化を進める上で不可欠である。
    • 従来のシミュレーション手法は,要件変更時に繰り返しテストが必要であり,効率が悪い。
    • 分離論理を用いて,物理的衝突を論理的なデータ競合として検出し,形式的に安全性を検証する。
    • 本研究では,物理的な作業空間を「空間ヒープ」として概念化し,物理占有を論理的なリソースとして扱う。
    • ツール軌跡と安全バッファを離散的な空間モデルにマッピングすることで,分離論理による形式的な検証が可能となる。
    • 共同作業環境においては,並行分離論理を用いて物理的なハンドオフを形式的な所有権移転として検証する。

    Link: https://arxiv.org/abs/2605.10437

  • 構造化自然言語の形式化による一貫性:FRETishを事例として [cs.CL, cs.LO]目的:形式化による要件の一貫性確保
    • システム要件の検証において,形式化は重要なステップであり,その精度がシステムの信頼性に直結する。
    • 要件の形式化は,自然言語からの変換において難度が高く,人的ミスが発生しやすいという課題がある。
    • 異なる形式化レベル間の一貫性を確保することで,形式化の精度向上とLLMを活用した検証の実現を目指す。
    • 本研究では,形式化レベル間の一貫性確保の指針として「形式化を通じた一貫性」を提案した。
    • NASAの要件抽出ツールFRETとその制御自然言語FRETishを分析し,MTLへの代替自動翻訳を提案した。
    • 提案翻訳と既存翻訳をモデル検査で比較し,同等性を証明,統計的優位性も示唆された。

    Link: https://arxiv.org/abs/2605.10462

  • $(n,n-2,2)$ MDS 配列符号の最適修復帯域幅と修復I/O [cs.IT, cs.DM, math.CO, math.IT]目的:$(n,n-2,2)$ MDS配列符号における線形正確修復の最適最悪ケース修復帯域幅と修復I/Oの厳密な決定
    • データ保存における冗長性は,信頼性と可用性を高める上で不可欠である。符号化技術は,そのための重要な手段である。
    • MDS符号の修復コスト(帯域幅,I/O)を最小化することは,大規模ストレージシステムの効率性に直接影響する。
    • $(n,n-2,2)$ MDS配列符号の修復コストに関する厳密な上限を導き出すことで,より効率的なデータ復旧戦略を可能にする。
    • 修復帯域幅の最適値は,ほとんどの場合,$(5n-8)/4$ の天井関数と $2n-q-3$ の最大値によって決定されることが示された。
    • 修復I/Oについても,同様の厳密な公式が得られ,$(4n-6)/3$ の天井関数が用いられる。n=4 の場合に特別な値を持つ。
    • これにより,冗長性 $(r,\ell)=(2,2)$ における修復帯域幅と修復I/Oに関する問題が完全に解決された。

    Link: https://arxiv.org/abs/2605.10508

  • リスト復号可能な畳み込み量子エルミート符号 [cs.IT, math.IT]目的:畳み込み量子エルミート符号の構成とリスト復号可能性
    • 量子誤り訂正符号は,量子情報の信頼性確保に不可欠であり,量子コンピュータ実現の鍵となる。
    • 既存の量子符号は,符号長やアルファベットサイズが大きくなる傾向があり,実装効率が課題となっていた。
    • より効率的な量子符号の構築を目指し,エルミート符号を用いることで符号長の短縮化を図る。
    • 本研究で構成した畳み込み量子エルミート符号は,量子Singleton界限まで許容できるエラー耐性を持つことを示した。
    • Reed-Solomon符号と比較して,エルミート符号はより小さなアルファベットサイズで同等の符号長を達成可能である。
    • リスト復号可能性を示すことで,実用的な量子誤り訂正の実装への道を開く。

    Link: https://arxiv.org/abs/2605.10534

  • 構造保証Gコード生成:分離論理によるニューロシンボリックアプローチ [cs.LO, cs.SE]目的:Gコード生成のためのニューロシンボリックフレームワーク
    • 製造業における安全性確保が重要であり,特に自律的な製造プロセスにおいては不可欠である。
    • 従来のGコード生成では,物理的な衝突の検証が難しく,手動での確認に依存する部分が多い。
    • Gコード生成における物理的衝突を自動的に検出し,安全性を保証することを目的とする。
    • 本研究では,GLLMと分離論理に基づく検証器を統合したフレームワークを提案する。
    • 物理的な衝突を分離論理における空間データ競合として定義し,検証エラーをGLLMへの修正指示として活用する。
    • この相乗効果により自己修正サイクルが確立され,手動での監視を削減し,検証済みGコードの生成を支援する。

    Link: https://arxiv.org/abs/2605.10568

  • LLARS:LLMプロンプト,生成,評価のためのドメイン専門家と開発者の協働を可能にするシステム [cs.AI, cs.CL, cs.HC, cs.SE]目的:LLMベースシステム構築のためのドメイン専門家と開発者の連携
    • LLMの活用は多様化するが,専門知識と技術力のギャップが課題。
    • LLMの性能を最大限に引き出すには,適切なプロンプト設計と評価が不可欠。
    • 専門家と開発者が円滑に連携し,LLMシステムの開発を効率化すること。
    • LLARSは,リアルタイム共同プロンプトエンジニアリング,バッチ生成,ハイブリッド評価の3つのモジュールを統合。
    • ドメイン専門家と開発者のインタビューにより,LLARSの直感的な操作性と時間短縮効果が確認された。
    • LLARSは,最適なモデル・プロンプト組み合わせの特定を支援し,学際的な協働を促進する。

    Link: https://arxiv.org/abs/2605.10593

  • 一般化二重拡張リード・ソロモン符号の重み2の剰余群の重み分布 [cs.IT, math.IT]目的:有限体上の一般化二重拡張リード・ソロモン符号における,重み2の剰余群の重み分布
    • 符号理論は,通信やデータストレージにおける誤り訂正に不可欠であり,信頼性の高い情報伝達を可能にする。
    • 一般化二重拡張リード・ソロモン符号の重み分布に関する解析は困難であり,完全な理解が求められている。
    • 重み分布の決定を通じて,符号の性能評価や設計に貢献し,誤り訂正能力の向上を目指す。
    • q-1とd-2が互いに素である場合,全ての重み2の剰余群の重み分布が同一となることが証明された(Case S)。
    • Case Sにおいて,一般化二重拡張リード・ソロモン符号は2-正則であることが示された。
    • 有限体および整数環に関する新たな組合せ問題(Problem A)を提示し,これらの問題の解がCase NSの重み分布の決定に繋がることを示した。

    Link: https://arxiv.org/abs/2605.10594

  • CrackMeBench:エージェントのためのバイナリ逆アセンブル [cs.SE, cs.AI]目的:エージェントによるバイナリ逆アセンブル能力の評価
    • サイバーセキュリティ分野において,バイナリ解析は脆弱性発見やマルウェア解析に不可欠である。
    • 既存の評価方法では,複雑な環境設定や主観的な評価基準が存在する。
    • バイナリ逆アセンブルにおけるエージェントの能力を客観的に評価する基準の確立。
    • CrackMeBenchは,教育目的で作成されたCrackMe形式のバイナリ逆アセンブルタスクを評価するためのベンチマークである。
    • GPT-5.5は生成されたタスクにおいて3回試行のうち11/12を,Claude Opus 4.7は7/12を,Kimi K2は5/12を合格した。
    • 本ベンチマークは,再現性のある環境で,バイナリ解析におけるエージェントの進捗を測定するためのテストベッドを提供する。

    Link: https://arxiv.org/abs/2605.10597

  • 有界プリエンプション下での逐次一貫性の検証 [cs.PL]目的:マルチスレッドプログラムの読み書きシーケンスの逐次一貫性検証問題
    • 共有メモリ実装のテストやDPORアルゴリズムなど,並行プログラミングの検証において不可欠な問題である。
    • 逐次一貫性の検証問題はNP困難であり,パラメータを制限しても解決が難しい。
    • プリエンプション回数に上限がある場合における逐次一貫性の検証可能性を明らかにすること。
    • 単一書き込みプログラムにおいては多項式時間アルゴリズムが存在することが示された。
    • 二つの書き込みプログラムではNP困難となり,三つの書き込みプログラムでは指数時間仮説の下での困難性が示唆された。
    • プリエンプション回数に上限がない場合,問題はW[1]-困難であり,固定パラメータ実行可能性は低いことが示された。

    Link: https://arxiv.org/abs/2605.10625

  • ログ和正則化と適応的平滑化を用いた疎信号復元 [cs.IT, math.IT]目的:ノイズを含む線形観測からの疎信号復元
    • 信号処理や機械学習において,高次元データから重要な情報を抽出する技術として重要である。
    • L1正則化は収縮バイアスを持つため,L0正則化に近い性能を得るには課題があった。
    • ログ和正則化の不安定性を緩和し,より正確な信号復元を可能にすること。
    • ログ和正則化では,適応的な平滑化戦略により,プロキシマル演算子が連続性を保つことが示された。
    • AMPアルゴリズムとSE再帰が導出され,最終的な平均二乗誤差を予測できることが確認された。
    • ADMMアルゴリズムによる実験の結果,SE予測との整合性が確認され,L1正則化との比較により,ログ和正則化の利点が明らかになった。

    Link: https://arxiv.org/abs/2605.10626

  • リモートダイレクトメモリアクセスプログラムの検証問題(付録付き拡張版) [cs.LO]目的:RDMAプログラムにおける到達可能性と堅牢性の問題
    • 大規模並列計算クラスタにおいて,高性能・低遅延なネットワークを実現する技術として重要である。
    • RDMAプログラムの検証は一般に困難であり,プログラムの信頼性確保が課題となっている。
    • RDMAプログラムにおける到達可能性と堅牢性の問題を解決し,プログラムの振る舞いを形式的に検証することを目指す。
    • 到達可能性問題は一般に決定不能であることが示された。これは,RDMAプログラムの検証が本質的に困難であることを意味する。
    • 堅牢性問題,すなわちRDMAと逐次整合性の意味論下での振る舞いの同一性は決定可能であることが証明された。
    • 堅牢性違反の正規形が確立され,これを利用して堅牢性問題を有限状態プログラムにおける到達可能性問題に帰着させることで,効率的な決定手続きが実現された。

    Link: https://arxiv.org/abs/2605.10631

  • ステップ拒否ファインチューニング:実用的な蒸留レシピ [cs.LG, cs.AI, cs.CL, cs.SE]目的:LLMエージェントの訓練におけるステップレベルの誤りからの回復学習
    • LLMエージェントの性能向上は,複雑なタスク解決において重要であり,自動化の可能性を広げる。
    • 従来の拒否ファインチューニングでは,未解決の軌跡を廃棄するため,貴重な学習機会を失う可能性がある。
    • 未解決の軌跡を完全に廃棄せず,ステップレベルで評価することで,より効果的な学習を目指す。
    • ステップ拒否ファインチューニング(SRFT)は,未解決の軌跡をフィルタリングすることで,解決率を3.7%向上させた。
    • 従来の拒否ファインチューニング(RFT)と比較して,SRFTはより多くの情報量を保持し,モデルの回復能力を高める。
    • SWE-bench Verifiedにおける評価により,SRFTの総解決率は32.2%に達し,その有効性が示された。

    Link: https://arxiv.org/abs/2605.10674

  • 誤り訂正符号のためのスケーラブルなMambaベースのメッセージパッシングニューラルデコーダ [cs.IT, cs.LG, math.IT]目的:誤り訂正符号のニューラルデコーダの性能向上
    • 信頼性の高い通信には必須であり,特にノイズの多い環境下での重要性が高い。
    • 既存のアテンションベースのデコーダは,コード長が長くなると計算量とメモリ消費量が膨大になる。
    • Mamba構造を活用し,アテンション機構を回避することで,長コードに対するスケーラビリティを改善する。
    • MMPDは,(1056, 880) LDPCコードにおいて,既存のCrossMPTデコーダと比較して0.45dBの性能向上を達成した。
    • メモリ消費量は1.5倍削減され,特に長コードにおいてその効果は顕著に現れた。
    • 実用的な長コードのニューラルデコーディングへの適用可能性を示す結果となった。

    Link: https://arxiv.org/abs/2605.10681

  • ChatGPT:不慣れなコードの理解と変更における協力者か敵か [cs.SE]目的:LLMが開発者に与える影響の認知プロセスに関する理解
    • LLM技術はソフトウェア開発に急速に浸透しており,その影響を理解することが重要である。
    • 既存研究は生産性やコード品質に偏っており,開発者の認知プロセスへの影響は不明である。
    • 本研究は,AI支援下での開発者の問題解決プロセスを分析し,課題解決への影響を明らかにする。
    • AI支援群の参加者は,特定の処理をAIにオフロードする傾向が見られた。
    • しかし,問題解決行動の種類にグループ間差は認められなかった。
    • 停滞の原因は複数存在し,AIが停滞からの脱却を助ける場合も,妨げる場合もあった。

    Link: https://arxiv.org/abs/2605.10702

  • AutoSOUP:コンポーネントレベルのメモリ安全性の検証のための安全志向ユニット証明の自動生成 [cs.RO, cs.SE, cs.CR]目的:コンポーネントレベルメモリ安全性の検証のための安全志向ユニット証明の自動生成
    • 低レベルソフトウェアにおけるメモリ安全性の問題は深刻であり,特に組み込みシステムにおいては脆弱性の主要な原因となる。
    • 既存のメモリ安全性検証ワークフローは手動操作が中心であり,専門知識が必要なため,実用的な普及が課題となっている。
    • AutoSOUPは,検証の選択を自動化することで,メモリ安全性検証の自動化と脆弱性の検出を可能にすることを目指す。
    • AutoSOUPは,安全志向ユニット証明を通じて,コンポーネントレベルのメモリ安全性の検証を自動化するシステムである。
    • LLM-As-Function-Callというハイブリッドアーキテクチャにより,決定論的プログラム合成とLLMを組み合わせることで,ユニット証明の自動生成を実現している。
    • 評価実験により,AutoSOUPがメモリ安全性の検証を自動化し,検証されたコンポーネントの脆弱性を検出できることが示された。

    Link: https://arxiv.org/abs/2605.10712

  • ComplexMCP:動的,相互依存的,大規模ツールサンドボックスにおけるLLMエージェントの評価 [cs.AI, cs.SE]目的:LLMエージェントの性能評価
    • 業務自動化の需要増加に伴い,LLMエージェントの応用範囲が拡大している。
    • 既存のLLMエージェントは,独立したAPIの呼び出しには長けているが,複雑な環境下での自動化には課題がある。
    • 現実世界の複雑なツール連携環境におけるLLMエージェントのボトルネックを特定し,改善策を検討する。
    • ComplexMCPベンチマークによって,最先端モデルでも成功率は60%にとどまり,人間の90%を下回ることが示された。
    • 性能低下の要因として,ツール検索の飽和,過信による環境確認の省略,そして戦略的な諦めが挙げられた。
    • 本研究は,相互依存的なワークフローにおけるLLMエージェントの限界を明確にし,次世代の自律システムの開発に向けた重要な基盤を提供する。

    Link: https://arxiv.org/abs/2605.10787

  • 誤り制約付き言語生成 [cs.LG, cs.DS]目的:言語生成における誤り総数の最小化
    • 言語生成は,自然言語処理の根幹であり,様々な応用への展開が期待される分野である。
    • 従来の言語生成研究では,最終的な正答率ばかりが重視され,学習過程における累積誤りに着目されてこなかった。
    • 本研究は,言語生成アルゴリズムが出力する誤りの総数を最小限に抑えることを目指す。
    • 誤り制約付き言語生成という新たな概念を導入し,累積誤りの重要性を指摘した。
    • 有限クラスにおいては,最適な最終誤り時間と誤り制約の両方を達成するアルゴリズムを提示した。
    • 無限言語ストリームにおいては,誤り制約と収束保証の間にトレードオフが存在することを証明した。

    Link: https://arxiv.org/abs/2605.10809

  • StartFlow:ソフトウェアスタートアップにおけるUXプロトタイピングのメソッド考案から多角的評価まで [cs.HC, cs.SE]目的:ソフトウェアスタートアップ向けUXプロトタイピング手法StartFlow
    • ソフトウェアスタートアップは,リソース不足とUX専門知識の欠如により,MVP開発に課題を抱える。
    • 初期段階では,効率的なUXプロトタイピング手法が確立されていない場合が多い。
    • 非専門家でもMVPプロトタイプを作成できる簡便な手法を提供し,UXプロセスを支援する。
    • フォーカスグループ分析の結果,参加者はStartFlowを直感的で柔軟性があり,ユーザフローの構造化に有用であると評価した。
    • PoC実験では,StartFlow利用者はより明確なプロトタイプを作成し,ユーザーストーリーやビジネスルールに準拠し,ユーザビリティ欠陥が少なくなった。
    • 本研究は,StartFlowがソフトウェアスタートアップにおけるユーザ中心開発を初期段階から支援する可能性を示唆する。

    Link: https://arxiv.org/abs/2605.10824

  • 半環意味論における保存定理 [cs.LO]目的:半環意味論における{\L}os-Tarski定理や準同型保存定理といった保存定理の地位
    • データベースクエリの系統解析に端を発する半環意味論は,データ管理における重要な研究分野である。
    • 古典的なモデル理論の結果が半環意味論においても一般化可能か,その範囲が未解明であった。
    • 半環意味論における保存定理が成立するための半環の代数的性質を明らかにすること。
    • 格子半環という広範なクラスに対しては,これらの保存定理が成立することが証明された。
    • 熱帯半環やViterbi半環など,多くの半環では存在保存定理の変種が成立しないことが示された。
    • 有限解釈においては,格子半環を含む多くの半環で存在保存定理が成立し,ブール代数の場合とは対照的な結果が得られた。

    Link: https://arxiv.org/abs/2605.10829

  • 有限グラフにおける剰余演算を用いた一階論理の定数時間テスト可能性 [cs.LO, math.LO]目的:有界次数グラフにおける一階論理と剰余演算の定数時間テスト可能性
    • グラフ構造の性質判定は計算機科学の重要な課題であり,効率的なアルゴリズム開発が求められる。
    • 従来のテストアルゴリズムは多項式時間や対数時間が必要であり,定数時間でのテストは未解決問題であった。
    • 有界次数グラフにおける一階論理と剰余演算のテスト可能性を定数時間で実現する。
    • 有界次数グラフのクラス$\mathcal C^{c}_d$において,一階論理と剰余演算を用いた定数時間テスト可能性が証明された。
    • FOMODのHanf標準形を調整し,入力グラフの局所サンプルからグローバル情報を推測する「パッチ可能性」条件を導入した。
    • この「パッチ可能性」は,独立した興味を持つ可能性があり,順序不変な一階論理の表現力を用いた結果からCMSOへの拡張が導かれた。

    Link: https://arxiv.org/abs/2605.10841

  • BenchCAD:プログラムによるCADのための包括的な業界標準ベンチマーク [cs.DC, cs.CL, cs.CL, cs.AI, cs.CV, cs.SE]目的:産業用CADコード生成の評価基準
    • 製造業における設計・製造の効率化に貢献するCAD自動化の重要性が高まっている。
    • 既存のベンチマークでは,実務的なCAD環境における性能評価が不十分であった。
    • マルチモーダル大規模言語モデルの産業用CAD分野への応用可能性を探求し,その限界を明らかにする。
    • BenchCADは,106の産業用部品ファミリー,17,900の実行検証済みCadQueryプログラムを含む統一ベンチマークである。
    • 現在の最先端モデルは,外形形状の認識はできるものの,忠実なパラメータCADプログラムの生成には課題があることが示された。
    • ファインチューニングや強化学習は性能を向上させるものの,未知の部品ファミリーへの汎化性能は限定的である。

    Link: https://arxiv.org/abs/2605.10865

  • ローカルプライベート情報検索:グラフベース複製システムにおける新たなプライバシー視点 [cs.IT, cs.CR, cs.NI, eess.SP, math.IT]目的:グラフベース複製システムにおけるローカルユーザープライバシーの定量的評価
    • 複製システムにおけるプライバシー保護は,データセキュリティとユーザー保護の観点から重要である。
    • 従来のプライバシー定義では,サーバーがメッセージを保持しているかどうかにかかわらず,インデックスの秘匿が求められていた。
    • サーバーのストレージ構造に着目し,メッセージ保持の有無に応じてプライバシー要件を変化させることで効率化を図る。
    • ローカルプライバシー要件に基づくPIR(Local PIR)の容量が,従来のPIRと比較して著しく向上することが示された。
    • グラフが異なるグラフの disjoint union である場合,Local PIR容量は従来のPIR容量に比べて乗算的に増加する。
    • エッジ推移グラフや二部グラフにおいて,Local PIR容量の下限が,既存のPIR容量限界よりも大きいことが確認された。

    Link: https://arxiv.org/abs/2605.10872

  • ニューラル重みノルム=コルモゴロフ複雑性 [cs.CL, cs.IR, cs.LG, cs.IT, math.IT]目的:バイナリ文字列を出力するループ型ニューラルネットワークの最小重みノルムと,その文字列のコルモゴロフ複雑性の関係性
    • 機械学習モデルの汎化性能向上は重要課題であり,正則化手法はその鍵となる。
    • 重み減衰が有効である理由が理論的に明確に説明されていなかった。
    • 重み減衰がSolomonoffの普遍事前分布と一致することを示す。
    • 固定精度において,ニューラルネットワークの重みノルムは,出力される文字列のコルモゴロフ複雑性と密接な関係があることが示された。
    • 重み減衰が,計算可能な関数に対する最適な事前分布であるSolomonoffの普遍事前分布と一致することが証明された。
    • 任意の重みノルムにおいて同様の結果が得られ,固定精度が本研究の重要な前提条件であることが強調された。

    Link: https://arxiv.org/abs/2605.10878

  • グラフベースのストレージに対する任意のプライバシー要件を持つプライベート情報検索 [cs.IT, cs.CR, cs.NI, eess.SP, math.IT]目的:プライベート情報検索におけるプライバシーの定義の再構成
    • プライバシー保護は情報セキュリティの根幹であり,データの不正利用を防ぐ上で不可欠である。
    • 従来のPIRでは,全てのサーバからのプライバシー保護が必須であり,柔軟性に欠ける点が課題であった。
    • サーバごとのプライバシー要件を定義し,柔軟なプライバシー保護を実現することを目指す。
    • プライバシー要件をサーバごとに設定することで,従来のPIRの柔軟性を向上させることが示された。
    • パスグラフとサイクリックグラフという2つの具体的なストレージ設定において,容量に関する上限または正確な容量を導出した。
    • 近傍範囲内のメッセージインデックスをプライバシーセットとする設定は,ローカルPIRから標準的なグラフ複製PIRへの移行を可能にする。

    Link: https://arxiv.org/abs/2605.10879

  • MDPにおける確率的安全性を保証するシールド [cs.LO, cs.AI]目的:MDPにおける確率的安全性の保証
    • 自律エージェントの安全性を確保する上で,モデルベースの手法は重要である。
    • 確率的安全性を扱うシールドの設計は,古典的なシールドに比べて複雑である。
    • 確率的安全性の枠組みにおけるシールドの理論的限界と構築手法を明らかにすること。
    • 確率的安全性の保証と許容性の両立には限界があることが示された。
    • 古典的なシールドを拡張した新しいシールドを提案し,安全性の保証を提供した。
    • オフラインおよびオンラインのシールド構築方法が,計算可能性とともに実用性を示す。

    Link: https://arxiv.org/abs/2605.10888

  • CppPerf:パフォーマンス改善C++コミットのための自動パイプラインとデータセット [cs.SE]目的:パフォーマンス改善C++コミットのパイプラインとデータセット
    • ソフトウェアのパフォーマンスは重要であり,その改善は開発効率やユーザー体験に直結する。
    • C++のパフォーマンスベンチマークは競技プログラミング由来が多く,実環境での利用には課題があった。
    • GitHub上のC++リポジトリからパフォーマンス改善コミットを効率的に収集・検証する仕組みを構築する。
    • CppPerf-Mineパイプラインを構築し,GitHubからパフォーマンス改善コミットをマイニングした。
    • 収集された347件のパフォーマンス改善パッチからなるCppPerf-DBを構築し公開した。
    • OpenHandsによるCppPerf-DBの修正率は13.5%であり,実環境C++パフォーマンス改善の難しさを示した。

    Link: https://arxiv.org/abs/2605.10890

  • Min-Sum半径とMin-Sum直径クラスタリングに対するFPT近似スキーム [cs.DS, cs.CG]目的:Min-Sum半径問題とMin-Sum直径問題に対するFPT近似スキームの構築
    • クラスタリングは,データ解析や機械学習において重要な役割を果たす手法である。
    • Min-Sum半径問題とMin-Sum直径問題はNP困難であり,効率的な解法が求められている。
    • パラメータkに対するFPT近似スキームを開発し,実用的な近似解を得ることを目指す。
    • 本研究では,Min-Sum半径問題とMin-Sum直径問題に対し,パラメータkに関するFPT近似スキームを提案した。
    • 提案スキームは,与えられた誤差εに対して,(1+ε)-近似解を(1/ε)^kn^{O(1)}および(1/ε)^{O(k/ε log 1/ε)}n^{poly(1/ε)}の時間で計算する。
    • 既存のFPT近似アルゴリズムと比較して,近似率を大幅に改善し,未解決問題の解決に貢献する。

    Link: https://arxiv.org/abs/2605.10895

  • Shepherd: メタエージェントを正式な実行トレースで強化するランタイム基盤 [cs.CL, cs.AI, cs.PL, cs.SE]目的:メタエージェントの操作の形式化
    • AIエージェントの複雑化に伴い,その挙動の検証と制御が重要になっている。
    • エージェントの実行環境の再現性確保と,効率的なデバッグが課題となっている。
    • エージェントの実行トレースを形式化し,効率的な分岐と再実行を可能にすること。
    • Shepherdは,エージェントと環境の相互作用をGitライクな実行トレースとして記録する。
    • これにより,過去の状態を分岐・再生することが可能となり,Dockerよりも高速にプロセスとファイルシステムを分岐できる。
    • ペアコーディングの合格率向上,メタ最適化,Tree-RLの性能改善といった結果が得られており,メタエージェントプログラミングの効率的な基盤となることが示された。

    Link: https://arxiv.org/abs/2605.10913

  • DNAストレージとファウンテンコードにおけるランダムアクセス期待値 [cs.IT, math.IT]目的:DNAデータストレージにおけるランダムアクセス期待値の解析
    • データ量の爆発的増加に対応するため,DNAストレージが注目されている。
    • DNAストレージでは,データアクセス効率が課題となっている。
    • ランダムアクセス期待値を最小化する符号化方式の検討。
    • 本研究では,完全に対称な生成行列を持つ線形符号に着目し,そのランダムアクセス期待値を解析した。
    • 完全に対称な二値符号とLT符号の同値性を示すことで,解析を深めた。
    • 大規模ブロック長において,ランダムアクセス期待値の正規化値が{\pi}/4以上であることが示された。

    Link: https://arxiv.org/abs/2605.10919

  • プログラミング教育におけるログの活用 [cs.SE]目的:プログラミング教育の改善に向けた学習データ分析
    • ソフトウェア開発では品質評価が重要だが,教育現場での活用は遅れている。
    • 学習状況の可視化が難しく,教育効果の測定が困難である。
    • リアルタイムな学習ログから,教育方法の改善や個別最適化を目指す。
    • 学生のコード開発ログを収集・分析することで,理解度や課題を可視化した。
    • 従来の学習管理システムとは異なり,コードエディタのプラグインで詳細な情報を記録した。
    • 学習パターンやスキル習得に関する研究を支援するオープンアクセスデータベースを構築した。

    Link: https://arxiv.org/abs/2605.10920

  • 適応的対戦相手に対する最適な小集合追跡 [cs.RO, cs.DS]目的:適応的対戦相手に対する小集合追跡問題における最適な決定性オンラインアルゴリズム
    • 距離空間におけるサービスシステムやグラフ探索など,様々な応用分野で重要な問題である。
    • 従来のアルゴリズムでは,競争率に大きな隔たりがあり,効率的な追跡が困難であった。
    • 小集合追跡問題における競争率の理論的限界を明らかにし,最適なアルゴリズムを設計すること。
    • 競争率に関する30年の課題であったΩ(2^k)とO(k2^k)のギャップを解消し,O(2^k)-競争的な決定性アルゴリズムを提示した。
    • 提案アルゴリズムは,ランダム化アルゴリズムに対しても最適であり,決定性下限もわずかに改善した。
    • この結果は,分散非同期集合木探索やk-タクシー問題に対する上界と下界の改善にもつながる。

    Link: https://arxiv.org/abs/2605.10927

  • どこからどこへのチャネルゲインをクロス環境Transformer推定器で学習 [eess.SP, cs.IT, cs.LG, math.IT]目的:チャネルゲインマップ推定手法
    • 無線通信システムの効率的な運用に不可欠であり,資源配分や干渉制御,自律走行車の経路計画等に応用される。
    • 従来の無線マップ推定法と比較して,6次元入力空間への関数であるため推定が困難である。
    • 複数の環境で収集した測定値から共通の空間構造を暗黙的に学習し,新たな環境での測定回数を削減する。
    • 提案手法は,既存手法と比較して,少ない測定回数(実験では5分の1)でチャネルゲインマップ推定を可能にする。
    • Transformerと特徴マップを組み合わせることで,CGMEの不変性(例:相互性)を効率的に学習する。
    • 数値実験により,提案推定器の有効性が確認された。

    Link: https://arxiv.org/abs/2605.08211

  • 量子化モデル交換による分散型新規性検出 [stat.ML, cs.IT, cs.LG, eess.SP, math.IT, stat.ME]目的:分散環境における新規性検出の枠組み
    • プライバシー保護や通信コストの制約下でのデータ分析の重要性が高まっている。
    • データの共有が困難な状況下では,グローバルな誤検出率制御が課題となる。
    • 量子化モデル交換により,効率的な分散型新規性検出と誤検出率制御を実現する。
    • 提案手法は,量子化された代替モデルの交換によって,ローカルに学習された非適合性スコア関数の低精度表現を共有する。
    • この手法は,条件付き交換可能性を維持し,グローバルな誤検出率制御のための厳密な有限サンプル保証を提供する。
    • シミュレーション実験の結果,提案手法は競争力のある統計的検出力を維持しつつ,通信コストを大幅に削減できることが示された。

    Link: https://arxiv.org/abs/2605.08263

  • 潜在ホークスネットワーク復元のための観測時間について [math.ST, cs.IT, cs.LG, math.IT, stat.ML, stat.TH]目的:潜在ホークスネットワークの復元に必要な最小観測時間
    • 工学,社会,自然界における相互作用システムのダイナミクス理解に不可欠である
    • イベントベースの観測データからのネットワーク推論は理論的根拠が乏しい
    • エンティティ数dに対する観測時間の理論的限界を明らかにすること
    • 疎な弱結合を持つ定常ホークス過程において,観測時間log dが復元に十分かつ必要条件であることが示された。
    • 二段階推定器(クリッピングとビニングによるスクリーニング,最小二乗法による改良)を構築し,ポアソンクラスター表現を用いた濃度不等式を適用した。
    • Fanoの不等式とJacodのGirsanov公式を組み合わせ,適切なサブクラスのネットワークに対して下限を導出した。

    Link: https://arxiv.org/abs/2605.08400

  • 証拠隠滅可能な秘密通信 [econ.TH, cs.IT, math.IT]目的:秘密通信における証拠隠滅可能性の条件と限界
    • 情報伝達における秘密性の確保は,プライバシー保護や安全保障において重要である。
    • 受信者の行動が隠された情報を露呈する可能性があり,真の秘密通信が困難となる。
    • 秘密性と証拠隠滅可能性を両立する情報構造を特定し,通信の限界を明らかにすること。
    • 単一交差選好下において,証拠隠滅可能性は,受信者の基盤情報のみで合理化可能な行動に限定される。
    • 証拠隠滅可能性は,基盤メッセージが方向性を持つ場合に通信を制限し,状態に関する情報伝達を最小限に抑える。
    • 方向性メッセージにおける通信は,状態が特定の閾値よりも上か下にあるかを示す程度に限定される。

    Link: https://arxiv.org/abs/2605.09029

  • 保守的統計リーマン面について [math-ph, cs.IT, math.IT, math.MP]目的:情報幾何学とゲージ理論の対応
    • 統計的モデリングの基礎理論を深める上で重要であり,多様な確率モデルの理解に貢献する。
    • 既存の研究では,統計多様体の幾何学的構造と物理的理論との関係が十分に解明されていない。
    • 保守的統計構造の幾何学的性質を明らかにし,モジュライ空間の構成を目指す。
    • 保守的統計構造は,調和形式とホロモルフィック立方微分によって特徴付けられることが示された。
    • この構造は,Higgsバンドル上のスカラーTzitz\'eica方程式の解によって幾何学的に生成されることが証明された。
    • 閉じた向き付け可能な曲面上における保守的統計構造のモジュライ空間は,Teichm\"uller空間上のベクトルバンドルによって完全にパラメータ化される。

    Link: https://arxiv.org/abs/2605.09133

  • 対称性からの量子容量閾値の向上 [quant-ph, cs.IT, math.IT]目的:量子チャネルにおける量子情報伝送の限界
    • 量子通信の基礎をなす分野であり,安全な情報伝送技術に不可欠である。
    • 多くのチャネルに対し量子容量が未解明であり,上限と下限に大きな乖離が存在する。
    • 対称性に着目し,コヒーレント情報の最適化を通じて量子容量閾値を向上させる。
    • 確率的演算子の指数関数的な数の多くが対称空間を消滅させることが示された。
    • 対称空間上の状態における環境エントロピーの減少が,コヒーレント情報の向上を説明する。
    • 非偏向チャネルにおいて,18年ぶりの閾値改善が達成され,ハッシュ界限を超える大幅な向上が見られた。

    Link: https://arxiv.org/abs/2605.09138

  • 位置グラフ抽象化とメモ化による量子ビットマッピングとルーティングのスケーリング [quant-ph, cs.AR, cs.ET, cs.SE]目的:量子ビットマッピングとルーティングの効率化
    • 量子コンピュータの実用化には,量子ビット間の効率的な接続が不可欠であり,マッピングとルーティングはその重要な要素である。
    • トラップイオン量子計算機では,量子ビットの移動制約が厳しく,マッピングとルーティングの最適化が困難である。
    • 位置グラフ抽象化とメモ化により,トラップイオン量子計算機におけるマッピングとルーティングのスケーラビリティを向上させる。
    • 位置グラフ抽象化を用いることで,ハードウェアに特化した制約を考慮したマッピングが可能となった。
    • 反復評価をキャッシュする相対移動スコアリングと,メモ化された輻輳解決により,探索速度が大幅に向上した。
    • 提案手法は,様々な量子アーキテクチャにおいて,スケーラブルな量子ビットマッピングとルーティングへの実用的な道を提供する。

    Link: https://arxiv.org/abs/2605.09237

  • 不確実な時間仕様に対するバリア証明書 [math.OC, cs.LO, cs.SY, eess.SY]目的:確率的動的システムにおける時間論理仕様の充足
    • 確率的システムの時間的性質の検証は,自動制御やロボティクスにおいて重要である。
    • 不確実性の存在により,時間仕様の検証は困難を伴う。
    • 不確実性を含む時間仕様に対する検証手法を開発し,確率的な安全性を保証する。
    • 確率的述語を含む時間論理仕様を,拡張された空間上の決定論的仕様に変換する手法を提案した。
    • バリア証明書を拡張空間に適用することで,効率的な最適化ベースの検証条件を導出した。
    • 線形システムと安全型仕様に対して,バリア証明書が確率的安全性述語違反の確率を保証する条件を解析的に示した。

    Link: https://arxiv.org/abs/2605.09445

  • ミニマックス最適部分行列検出:鋭い非漸近レート [math.ST, cs.IT, math.IT, stat.ML, stat.TH]目的:高次元ガウス行列における隠れた部分行列の検出
    • 高次元データ分析において,信号検出は重要な課題である。特に,ノイズに埋もれた微弱な信号の検出は困難を伴う。
    • 従来の信号検出手法は,行列の次元や部分行列のサイズに制限がある場合が多く,汎用性に欠ける。
    • 本研究は,行列の次元や部分行列のサイズに依存しない普遍的な検出レートを確立し,最適な検出手法を提供する。
    • 本研究では,信号強度 $\mu$ の最小値に関する非漸近的な上限と下限を導出し,その必要十分条件を明らかにした。
    • また,これらの限界に達するミニマックス最適検定法を提案し,未知の疎性レベル $s_1$ と $s_2$ に適応可能な拡張も示した。
    • 提案手法は,独立した関心を持つ新しい検定統計量の組み合わせであり,これまでの研究よりも汎用的な設定で適用可能である。

    Link: https://arxiv.org/abs/2605.09569

  • 完全符号に基づく対称的な数独様ゲームの構成 [quant-ph, cs.ET, math.CO, cs.IT, math.IT]目的:対称的な数独様ゲームの構成法
    • 組合せ的デザインは,暗号理論や誤り訂正符号などに応用され,情報科学において重要な役割を果たす。
    • 従来の数独は,問題の構造が単純であり,多様性に欠けるという課題があった。
    • 完全符号のタイル張り特性を利用し,対称性を持つ新しい数独様ゲームを構成すること。
    • 本研究では,リー距離完全符号と直径完全符号を用いて,対称的な数独様ゲームの構成法を提案した。
    • 5x5数独においては,17個の不等価な解が存在することが示された。
    • 8x8数独(2種類)においては,それぞれ232,735個と304,014個の不等価な解が存在し,生成されたゲームの難易度分布は,従来の数独と同等の範囲であることが確認された。

    Link: https://arxiv.org/abs/2605.09617

  • 線形相補問題におけるハンディキャップの削減 [quant-ph, cs.FL, math.OC, cs.DS]目的:線形相補問題に対するアルゴリズムの効率化
    • 線形相補問題は最適化問題の重要なクラスであり,様々な応用分野で利用されている。
    • 既存手法では,ハンディキャップ数が指数関数的に大きくなり,計算効率が低下する問題があった。
    • ハンディキャップ数の上限を確立し,効率的なアルゴリズムを開発することでこの問題を解決する。
    • 十分行列を持つ線形相補問題のハンディキャップ数$\hat\kappa(M)$の上限を,行列$M$のビット長に関して指数関数的に導出した。
    • 行のスケーリングによる最適化を行い,最適化されたハンディキャップ数$\hat\kappa^\star(M)$を用いるアルゴリズムを提案した。
    • 提案アルゴリズムは,入力サイズと$\hat\kappa^\star(M)$に対して多項式時間で動作し,効率的な解法を提供する。

    Link: https://arxiv.org/abs/2605.10701

  • 品質の代償:混合品質データを用いたスパース復元の十分条件 [eess.SP, cs.RO, stat.ML, cs.IT, cs.LG, math.IT, math.ST, stat.TH]目的:混合品質データを用いたスパース復元に関するサンプルサイズの条件
    • 現代のデータ収集では,ノイズレベルが異なる複数の情報源からのデータが一般的である。
    • 高品質データはコストがかかるため,低品質データの活用が課題となっている。
    • 混合品質データ下でのスパース復元に必要なデータ量を理論的に決定すること。
    • 情報理論的側面から,高品質サンプル1つを代替するために必要な低品質サンプルの数を決定する「品質の代償」という線形トレードオフが十分条件となる。
    • 復元アルゴリズム(LASSO)の解析により,復元閾値が均一ノイズの場合と同等であり,データの不均一性に対するロバスト性を示す。
    • データ品質の変化に対する情報理論的閾値とアルゴリズム的閾値の適応における根本的な違いを明らかにする。

    Link: https://arxiv.org/abs/2605.10713

  • 量子鍵配送と古典通信の共存のための空芯ファイバの選択的配置 [physics.soc-ph, cs.CL, cs.MA, quant-ph, cs.IT, math.IT]目的:量子鍵配送と古典通信の共存における空芯ファイバの利点
    • 通信インフラにおけるセキュリティ向上と大容量化が課題となっている。
    • 量子鍵配送の導入には,コストと伝送距離の制約が存在する。
    • 空芯ファイバを活用し,量子鍵配送システムのコスト削減を目指す。
    • 都市部のネットワークにおいて,40%のリンクを空芯ファイバにアップグレードすることで,量子モジュールの数を最大49%削減できることが示された。

    Link: https://arxiv.org/abs/2605.10724