arXiv雑要約

プログラム - 2026/04/29 公開

ホモトピー型理論における立方体アグダによる実数の形式化 [eess.SY, cs.SY, cs.LO]目的：実数の形式的な構成
- 構成的数学における実数研究は，基礎が重要であり，計算可能性との関連が深い。
- 古典的な構成方法には，選択公理や煩雑な管理，宇宙レベルの追跡など，課題が存在する。
- ホモトピー型理論に基づく実数の構成を形式化し，これらの課題を解決することを目指す。
- ホモトピー型理論の教科書で提示された実数を立方体アグダで形式化することに成功した。
- 立方体アグダの型システムにより，仮定や未解決の部分なしにコードが型チェックされることを確認した。
- この形式化は，構成的解析における機械支援のさらなる研究のための基盤を提供する。
Link: https://arxiv.org/abs/2604.24782
Mathlib のネットワーク構造 [cs.LO, cs.PL, cs.SI, math.HO]目的：Mathlib ライブラリの依存構造の分析
- 形式化された数学の規模拡大に伴い，その構造理解が重要になっている。
- 大規模ライブラリでは，依存関係の複雑さから構造把握が困難である。
- Mathlib の依存構造を可視化し，その特性を定量的に評価する。
- 人間の分類と論理構造が乖離しており，名前空間間で 50.9% の結合が見られる。
- 開発者はインポートされたスコープの平均 1.6% しか利用していない。
- 形式化は意味階層を圧縮し，ネットワークの中心性は言語インフラを反映する。
Link: https://arxiv.org/abs/2604.24797
SWE-QA：複雑なコード理解のためのデータセットとベンチマーク [cs.SE, cs.AI]目的：複雑なコード理解のベンチマーク
- ソフトウェア開発におけるコード理解の重要性が増している。
- 既存のベンチマークはコード断片に焦点を当て，実際の開発現場で必要となる複数箇所に渡る推論を評価できていない。
- 複数ステップのコード理解能力を評価するための新しいベンチマークを提供すること。
- SWE-QAは，SWE-benchの12のPythonリポジトリから生成された9,072個の多肢選択問題を含むデータセットである。
- 15の言語モデル(360Mから671Bパラメータ)の評価の結果，複数ステップの推論に大きな課題があることが明らかになった。最高性能は74.41%の正答率である。
- 密なアーキテクチャはMoEモデルよりも10-14%高い性能を示し，推論能力を強化したモデルの効果は一貫性がないことが示された。
Link: https://arxiv.org/abs/2604.24814
データを用いたプログラミング：未加工コーパスから自己改善型LLMを実現するテスト駆動型データエンジニアリング [cs.SE, cs.AI]目的：LLMへの専門知識の確実な伝達
- LLMは知識獲得に有効だが，その能力向上には改善の余地がある。
- モデルの失敗原因を特定し，訓練データを的確に修正する手法が不足している。
- データエンジニアリングサイクルをソフトウェア開発サイクルにマッピングし，データ修正を可能とする。
- 構造化された知識表現を基盤とすることで，モデルの失敗は概念レベルのギャップや推論チェーンの断絶として明確化される。
- 欠陥のあるデータに対するピンポイントな修正（パッチ）により，モデルの規模やアーキテクチャに関わらず一貫して性能が向上する。
- 本研究は，訓練データとモデルの振る舞いの間の構造的なトレーサビリティと体系的な修正可能性を確立し，言語モデルへの人間専門知識の信頼性高い組み込みのための原則的な基盤を提供する。
Link: https://arxiv.org/abs/2604.24819
Transformerを用いたソフトウェア脆弱性検出に関する系統的文献レビュー [cs.SE, cs.LG]目的：Transformerに基づくソフトウェア脆弱性検出手法に関する研究動向の把握
- ソフトウェアは社会基盤を支える存在であり，脆弱性は深刻なセキュリティリスクとなる。
- 機械学習を用いた脆弱性検出研究は存在するものの，Transformerに焦点を当てた体系的な分析は不足している。
- 本研究は，Transformerを用いた脆弱性検出の現状と課題を明確化し，今後の研究方向性を示す。
- 本レビューでは，2021年から2025年に発表された80件の研究を分析し，Transformerモデルのアーキテクチャ（エンコーダ，デコーダ，組み合わせ）と学習方法（事前学習，ファインチューニング）を分類した。
- 研究トレンド，使用されたデータセット，対象言語，フレームワーク，評価指標などを分析し，主要なベンチマークとベースラインを明らかにした。
- データ不均衡，解釈可能性，スケーラビリティ，プログラミング言語間の汎化性能といった技術的な課題も特定された。
Link: https://arxiv.org/abs/2604.24822
Chain of ThoughtとTree of Thoughtプロンプティングを用いたソフトウェアのバグ検出のための推論認識型マルチエージェントフレームワークFGDM [cs.SE, cs.LG]目的：ソフトウェアのバグ検出
- ソフトウェアの品質確保は重要であり，バグの早期発見が不可欠である。
- 深層学習は局所的な理解に偏りがちで，大規模かつ複雑なコードベースでは性能が低下する。
- LLMを活用し，コード間の依存関係を考慮したバグ検出フレームワークを開発すること。
- 提案フレームワークFGDMは，PythonとCのプログラムにおいて，既存手法を上回る性能を示した。
- Levenshtein距離の平均減少率は，Pythonで24.33，Cで8.37であった。
- コサイン類似度では，Pythonで0.951，Cで0.974の高い類似性を示した。
Link: https://arxiv.org/abs/2604.24831
貪欲法による最大被覆問題の平均的な性能について [cs.DS]目的：最大被覆問題における貪欲法の平均近似比
- 最適化問題において，被覆の概念は広範に現れる重要なテーマである。
- 最悪ケースの近似比は最適だが，実データでは貪欲法が良好な性能を示す。
- 実データにおける貪欲法の性能を理論的に正当化する平均ケース解析を行う。
- 提案された左正規ランダムモデルにおいて，貪欲法の期待近似比は最悪ケースよりも改善される。
- 特定の条件下では，十分大きなグラフにおいて期待近似比が1に近づくことが示された。
- ただし，ある条件下では期待近似比が0.94を超えることはないことも明らかになった。
Link: https://arxiv.org/abs/2604.24884
ファインチューニング後の安全性低下：ハイステークス領域からの証拠 [eess.SY, cs.SY, cs.CY, cs.SE]目的：ファインチューニングされたモデルにおける安全性変化の検証
- 基盤モデルの応用範囲拡大に伴い，特定の領域での安全性確保が不可欠である。
- ファインチューニング後のモデルの安全性評価が十分に行われていない現状がある。
- ファインチューニングが安全性に与える影響を明らかにし，リスク管理の改善を目指す。
- ファインチューニングは，安全性評価において一貫した改善をもたらすとは限らず，評価項目によって結果が変動することが確認された。
- 医療や法律といったハイステークス領域において，安全性低下が顕著であり，実用上のリスクが示唆された。
- 基盤モデルのみの評価に依存したガバナンスは不十分であり，ファインチューニング後の再評価の必要性が強調された。
Link: https://arxiv.org/abs/2604.24902
ファジーパスの論理 [cs.LO, cs.RO]目的：モーションプランニングにおける仕様記述のための新たな時間論理
- サイバーフィジカルシステムやロボティクス分野における安全性の検証が重要視されている。
- 既存の時間論理では，幾何学と論理が混在しており，仕様記述が複雑になる。
- パスを第一級の要素として扱うことで，より簡潔で理解しやすい仕様記述を目指す。
- 提案論理は，幾何学と論理の分離により，従来のSTLよりも直感的な記述が可能である。
- ファジーな時間変化する信号制約を用いることで，ユーザの意図や行動の嗜好を反映できる。
- デモンストレーションからの仕様学習にも適しており，人間協調型モーションプランニングに貢献する。
Link: https://arxiv.org/abs/2604.24907
共分散を考慮したフーリエ曲線変調における復調 [cs.IT, eess.SP, math.IT]目的：フーリエ曲線変調における共分散を考慮した復調手法の実現
- 無線通信において，変調方式の性能向上は常に重要な課題である。特に，複雑な変調方式においては，適切な復調が不可欠となる。
- 曲線変調においては，従来のユークリッド距離に基づく復調では性能劣化が生じる場合がある。ノイズの影響を適切に考慮する必要がある。
- 提案手法は，曲線変調におけるノイズの共分散を考慮することで，復調性能の向上を目指す。
- 提案手法は，従来のユークリッド距離に基づく復調と比較して，BER=10^-1における動作範囲を約5dB拡張できる。
- この性能向上は，LDPC符号を用いたシミュレーションだけでなく，BICM-AIR計算によっても裏付けられている。
- また，提案手法は，LUTの量子化によって性能劣化が生じないことも示されている。
Link: https://arxiv.org/abs/2604.24918
BenchGuard：ベンチマークは誰が守るか？LLMエージェントベンチマークの自動監査 [cs.CL, cs.AI, cs.SE]目的：LLMエージェントベンチマークの評価インフラストラクチャの体系的な監査
- LLMの性能評価において，ベンチマークは重要な役割を担う。
- ベンチマーク自体の不備（仕様の誤り，暗黙の前提，厳格な評価基準）が，エージェントの誤った評価につながることがある。
- ベンチマークの信頼性を高めるため，LLMを活用した自動監査フレームワークを開発し，ベンチマークの問題点を検出すること。
- BenchGuardは，2つの主要なベンチマークにおいて，著者が確認した12件の問題点を発見した。
- BIXBench Verified-50のサブセットにおいて，専門家が特定した問題点の83.3%を正確に特定し，既存の人的レビューでは見逃されていた欠陥を捉えた。
- 50の複雑なバイオインフォマティクスタスクの完全な監査費用は15ドル未満であり，自動監査は実用的かつ価値のある補完策となる。
Link: https://arxiv.org/abs/2604.24955
情報統制と証拠に基づいた終了による，大規模エンタープライズ型深層調査 [cs.CL, cs.HC, cs.CL, cs.SE]目的：エンタープライズ型深層調査の規模拡大と，情報フローの制御，証拠に基づいた終了条件の確立
- 企業活動における意思決定の質は，調査の深さと網羅性に大きく依存する。
- 既存の深層調査は，情報収集の偏りや文脈の複雑さから，十分な情報に基づいた結論に至らない場合がある。
- 本研究は，情報収集の網羅性と質を向上させ，早期終了を防ぐことで，意思決定に役立つ調査報告書の作成を目指す。
- 提案システムは，アウトライン生成と情報共有により，調査対象を網羅的に分解し，文脈を局所化する。
- 証拠に基づいた完了基準により，十分な情報が収集されるまで反復的に調査を行い，早期終了を抑制する。
- 社内セールス支援タスクとDeepResearch Benchベンチマークにおいて，競争的なベースラインよりも優れた性能を示した。
Link: https://arxiv.org/abs/2604.24978
協力すればどうなるか？思弁的デザインによるオープンソースソフトウェアにおけるデザイナー包容性の醸成 [cs.HC, cs.SE]目的：オープンソースソフトウェアにおけるデザイナー包容性の醸成
- オープンソースソフトウェアの普及には，技術力だけでなく，使いやすさやUXデザインが不可欠である。
- オープンソースソフトウェアでは，デザイン専門家の不足と開発者中心の考え方が課題となっている。
- 思弁的デザインを通じて，オープンソースコミュニティの意識変革を目指す。
- 思弁的デザインは，OSSの実践者によるOSSの価値観，課題の根本原因，そして提言された行動に関する深い考察を促した。
- デザイナーが評価される理由や仕事の組み込み方が異なる，集団主義的なHusiaと個人主義的なReetarという2つの思弁的な社会が作成された。
- 本研究は，公平で持続可能，そして包容的なOSS環境を育むための提言を生み出すために，思弁的デザインをどのように活用できるかについての洞察を提供する。
Link: https://arxiv.org/abs/2604.24981
意図の科学へ：オープンワールドAIエージェントにおけるクロージャギャップと委任エンベロープ [cs.AI, cs.SE]目的：オープンワールドAIエージェントにおける意図コンパイルの実現
- AIの能力向上は重要だが，実社会への応用が課題となっている。
- 既存手法では，モデルの堅牢性や説明可能性が不足している。
- 意図のクロージャギャップを解消し，より信頼性の高いAIエージェントを構築する。
- 意図コンパイルは，人間の意図を検証可能な実行に結びつける。
- クロージャギャップは，オープンワールドにおける検証の分散性を捉える。
- 委任エンベロープは，安全な行動範囲を定義し，追加の推論時間による探索との比較指標を提示する。
Link: https://arxiv.org/abs/2604.25000
VC学習における対称化界面での零測度性 [cs.HC, cs.LG, cs.LO, stat.ML]目的：VC次元からPAC学習可能性への対称化経路における測度性の仮説緩和
- 統計学習理論の基礎であり，学習アルゴリズムの理論的保証を与えるために重要。
- 既存の証明では，不必要なほど強い測度性の条件が課せられている。
- 対称化証明で使用される界面における測度性の必要条件を弱める。
- 悪事象が解析的であることが示され，完備化された有限ボレル測度上で測度可能であることが示された。
- 悪事象が零測度性を持つがボレル測度性を持たない概念クラスが構成された。
- パッチング，固定補間，ファイバー積アマルガムといった概念クラス構築子に対して安定性も証明された。
Link: https://arxiv.org/abs/2604.25028
ソフトウェア工学におけるロールモデルの提示を通じた帰属意識の支援 [cs.SE]目的：ソフトウェア工学教育におけるロールモデル提示の有効性
- 多様な人材育成は，工学分野の発展とイノベーションに不可欠である。
- 工学教育において，ロールモデルの視認性が十分ではなく，多様性の欠如が課題である。
- 技術講義に歴史的なロールモデルを組み込み，帰属意識を高める方法を探求する。
- 歴史的な先駆者の事例を技術講義に組み込むことで，多様な貢献者の存在を明確に提示した。
- この取り組みは，学習目標や評価を変更することなく，教育内容に多様性を導入する効果的な方法である。
- 技術内容とロールモデルの関連性を強化することで，工学教育における包容性を高めることが示唆された。
Link: https://arxiv.org/abs/2604.25099
ブラハート・アリモトアルゴリズム：正確なカイ二乗散逸を伴う動力学系 [cs.IT, math.IT]目的：ブラハート・アリモト（BA）フローの正確なカイ二乗散逸恒等性の解明と，その基本的な情報幾何学的構造の確立
- 情報理論における最適化問題は，通信システム設計やデータ圧縮など，幅広い分野で重要である。
- BAアルゴリズムの収束性については， Kullback-Leiblerダイバージェンスの単調減少によって解析されてきたが，十分な理解は得られていない。
- 本研究は，BAフローを支配するカイ二乗ダイバージェンスを明らかにし，動力学的挙動のより深い理解を目指す。
- BAフローにおいて，カイ二乗と対称化されたジェフリーズダイバージェンスの間の差異が立方剰余項によって正確に打ち消されることが示された。
- この結果から，BAフローにおける自由エネルギーのFisher-Raoヘッセ行列が特定され，そのスペクトルギャップが収束率と吸引盆地の安定性を決定することが証明された。
- ガウス源の場合，再生産分散に関する閉じた微分方程式，ガウス分布の唯一の動的アトラクタとしての存在，および高次元におけるスペクトル剛性が明らかになった。
Link: https://arxiv.org/abs/2604.25106
トークンベースのリプレイと準同型暗号を用いたセキュアな適合性検証 [cs.CR, cs.SE]目的：プロセスモデルとイベントログの適合性検証
- 業務プロセスの改善には，実績データに基づいた客観的な分析が不可欠である。
- イベントログには機密情報が含まれる場合があり，分析に際して情報漏洩のリスクがある。
- イベントログの機密性を保護しつつ，適合性検証を可能とする手法の開発。
- 提案手法では，トークンベースのリプレイアルゴリズムと準同型暗号を組み合わせることで，ログの保護を実現した。
- 検証実験の結果，提案手法は実用的な性能を持つことが示された。
- これにより，機密性の高いイベントログに対するセキュアなプロセス分析が可能となる。
Link: https://arxiv.org/abs/2604.25190
DiRe-RAPIDS：大規模なトポロジー忠実な次元削減 [cs.LG, cs.AI, cs.SE, cs.SI]目的：高次元データの次元削減手法の性能向上
- データの可視化や分析において，高次元データの次元削減は不可欠な技術である。
- 既存の次元削減手法は，ノイズを保持し，データの全体的な構造を歪曲する可能性がある。
- データのトポロジー構造をより忠実に保持する次元削減手法の開発。
- DiReは，ノイズの影響を受けにくく，データのトポロジー構造を正確に再現できることが示された。
- ベンチマークテストにおいて，DiReは分類性能においてGPUアクセラレーションされたUMAPと同等かそれ以上の性能を示した。
- arXiv論文の埋め込みデータを用いた実験で，UMAPと比較して3-4倍多くのトポロジー構造を保持することが確認された。
Link: https://arxiv.org/abs/2604.25209
MARD：堅牢なAndroidマルウェア検出のためのマルチエージェントフレームワーク [cs.CR, cs.SE]目的：Androidマルウェアの堅牢な検出
- Androidアプリの進化が速く，マルウェア検出の重要性が増している
- 従来の機械学習モデルは，概念ドリフトや特徴量の浅さに課題がある
- LLMの潜在能力を活かし，効率的かつ解釈可能な検出を実現する
- MARDは，LLMと静的解析を組み合わせることで，効果的なマルウェア検出を可能にする。
- ReActパラダイムに基づく自律的なマルチエージェント相互作用により，解釈可能な証拠チェーンを構築する。
- APKの解析コストを大幅に削減し，F1スコア93.46%という高い精度を達成した。
Link: https://arxiv.org/abs/2604.25264
VisualNeo：ビジュアルクエリインターフェースとグラフクエリエンジンの架け橋 [cs.DB, cs.SE]目的：グラフデータベースに対する効率的なサブグラフクエリシステム
- グラフデータは，複雑な関係性を表現する上で重要であり，様々な分野で活用されている。
- ビジュアルクエリインターフェースとグラフクエリエンジンは独立しており，連携が課題となっていた。
- Neo4j上で動作するVisualNeoにより，グラフクエリのフルスタック運用を容易にすること。
- VisualNeoは，データ駆動型GUIデザインやパターン生成機能を備えたVQIの特徴を受け継いでいる。
- 汎用的なNeo4jデータベースへの接続を可能にするデータベースマネージャモジュールを搭載している。
- Neo4jドライバを通じてクエリ処理を行い，結果を視覚的に探索できる。
Link: https://arxiv.org/abs/2604.25283
NOMA通信を可能にするピンチングアンテナシステムの性能分析 [cs.RO, cs.IT, math.IT]目的：ピンチングアンテナシステムと非直交多重アクセス（NOMA）を組み合わせた通信システムの性能評価
- 通信環境の多様化に対応するため，柔軟なアンテナ構成技術の重要性が高まっている。
- 従来のアンテナシステムでは，電波の干渉や通信距離の制約が課題となっている。
- ピンチングアンテナシステムとNOMAの組み合わせにより，これらの課題を克服し，通信性能を向上させる。
- ピンチングアンテナシステムを導入することで，従来の直交多重アクセス（OMA）システムよりも優れた遮蔽耐性を示すことが確認された。
- ピンチングアンテナシステムとNOMAの組み合わせは，従来のピンチングアンテナシステムとOMAの組み合わせに比べて，より大きなエルゴードデータレートを実現する。
- ピンチングアンテナの数を増やすことで，LoS/NLoS伝搬経路におけるピンチングアンテナシステムとNOMAの性能が向上する。
Link: https://arxiv.org/abs/2604.25285
1つの削除と1つの置換を定数回読み取りで訂正する [cs.IR, cs.RO, cs.SY, eess.SY, cs.IT, math.IT]目的：単一削除単一置換球関数に基づく$(n, N; \mathcal{B})$-再構成符号の設計
- 符号理論は，データの信頼性を確保する上で不可欠であり，誤り訂正符号はその重要な要素である。
- 単一削除・単一置換訂正符号は，冗長性が高く，効率的な設計が課題となっている。
- 少ない冗長性で単一削除・単一置換を訂正する再構成符号の設計を目指す。
- 本研究では，$N=5$の場合に，既存の符号よりも少ない$3\log n+4$ビットの冗長性で再構成符号を構築することに成功した。
- $N$が9, 11に増加した場合にも，冗長性をそれぞれ$2\log n+12\log\log n+O(1)$と$\log n +12\log \log n+O(1)$に改善した。
- $N=14$の場合には，既存の最良の符号と比較してわずか2ビット多い冗長性で再構成符号を提示した。
Link: https://arxiv.org/abs/2604.25294
離散確率プログラムに対する固定パラメータ実行可能な推論：文字列図代数による手法 [cs.DS]目的：離散確率プログラムの推論における計算効率向上
- 確率モデルの表現力と計算量のトレードオフが課題。
- 離散確率プログラムの推論は一般にPSPACE困難であり，実用的な規模での計算が困難。
- 構造的に単純なプログラムにおける効率的な推論手法の確立。
- プログラムの原始グラフのトレewidthが制限されている場合，推論を多項式時間で実行可能となる。
- 提案手法は，既存のアルゴリズムよりも優れた性能保証を提供する。
- 文字列図の分解と代数化により，関係データベースのクエリ評価や攻撃木を用いたサイバーセキュリティリスク評価など，幅広い応用が期待できる。
Link: https://arxiv.org/abs/2604.25321
R$^3$-SQL: ランク付け報酬とリサンプリングによるテキストSQL変換 [cs.RO, cs.SE, cs.AI, cs.CL]目的：テキストからSQLへの変換におけるランキングと候補再サンプリングの改善
- 自然言語によるデータベース操作は，専門知識不要なデータ分析を可能にするため重要である。
- 既存手法では，機能的に等価なSQLクエリのスコアに一貫性がない場合がある。
- 正しいSQLが候補に含まれていない場合，ランキングのみでは対応が難しい。
- R$^3$-SQLは，実行結果に基づいたグループ化とグループ間のランキングにより，一貫性を向上させた。
- グループのスコアリングには，ペアワイズ比較，グループ内の有用性，候補の質を考慮した報酬関数を用いた。
- エージェントによるリサンプリングにより，正しいSQLが不在の場合でも候補の網羅性を高めた。BIRD-devで75.03%の実行精度を達成した。
Link: https://arxiv.org/abs/2604.25325
ゴッパ符号とBCH符号のいくつかの族の最小距離について [cs.IT, math.IT]目的：ゴッパ符号とBCH符号のいくつかの族の最小距離の決定
- 代数的符号理論と暗号化における重要な符号族であり，実用的な応用範囲が広い。
- ゴッパ符号の真の最小距離を決定することは困難な問題である。
- ゴッパ符号が設計距離に達するための必要十分条件を導き，最小距離を特定する。
- ゴッパ多項式の次数tに対し，設計距離δ=t+1となるための条件を明らかに하였다。
- 特定のゴッパ符号族の最小距離を決定し，wildゴッパ符号の下限の厳密性を証明하였다。
- 原始BCH符号の最小距離d=δとなる無限族を特定し，既存の条件を改善하였다。
Link: https://arxiv.org/abs/2604.25354
部分観測性に対するコアルジェブラ的決定化から信念構築へ [cs.LO]目的：部分観測系を完全観測系へ変換する信念構築の理論的基盤
- 部分観測系の解析は，AIや形式検証において不可欠であり，その基盤技術として信念構築が重要である。
- 既存の信念構築法は，特定のモデルに依存し，一般的な枠組みが不足していた。
- コアルジェブラ的枠組みを用いて信念構築を一般化し，部分観測系と完全観測系の意味論の関係を明らかにする。
- コアルジェブラ的決定化と信念分解を組み合わせることで，信念構築の一般化を達成した。
- 部分観測系の意味論が対応する信念コアルジェブラの意味論と一致することを示した。
- POMDPと信念MDP間の標準的な同値関係を再確認し，重み付き遷移系に対する新たな同値関係を導出した。
Link: https://arxiv.org/abs/2604.25355
継続的インテグレーションのためのコミット情報に基づいた学習型テストケース優先度付け [cs.SE]目的：継続的インテグレーションにおけるテストケースの優先度付け
- CIパイプラインのテストコスト増大に伴い，効率的なテスト手法が不可欠である。
- 既存手法は，コード変更の構造的情報を活用できていない点が課題である。
- コード変更情報を用いて，テスト失敗確率を予測し，優先度を最適化する。
- 提案手法は，5つのDefects4Jプロジェクトで，既存手法を上回る性能を示した。
- コミット情報の活用が，回帰テストにおける欠陥検出能力を大幅に向上させる。
- 本研究は，CI環境において堅牢かつ汎用的な学習型テストケース優先度付けを可能にする。
Link: https://arxiv.org/abs/2604.25363
CoRE：出力予測を超えた，詳細なコード推論ベンチマーク [cs.CL, cs.CG, cs.FL, cs.SE]目的：コード推論の評価
- 大規模言語モデルの進化に伴い，コード生成能力の評価が重要になっている。
- 既存のベンチマークは最終的な出力の正誤に偏っており，コード推論能力の深さを測れない。
- 実装の不変性と過程の透明性に着目し，より厳密なコード推論能力の評価を目指す。
- 大規模言語モデル８つに対しCoREを用いた評価を行った結果，実装が変わると性能が大きく変動するという「頑健性ギャップ」が確認された。
- また，モデルが正しい最終出力に到達するものの，中間状態の推論が不正確である「表面的実行」も観察された。
- これらの結果から，出力のみの評価ではコード推論能力を十分に評価できず，CoREのようなベンチマークが必要であることが示された。
Link: https://arxiv.org/abs/2604.25399
グラフレット分布を近似するための効率的なストリーミングアルゴリズム [cs.DS, cs.DB, cs.SI]目的：グラフレット分布の近似
- ネットワーク分析において，グラフの構造を理解するための基礎となる。
- 大規模グラフに対して，全データをメモリに読み込む必要があり，処理が困難である。
- メモリ使用量を削減し，ストリーミング方式で効率的にグラフレット分布を近似する。
- 本研究では，Bourreauらのアルゴリズムのパス数を改善し，より少ないパス数でグラフレット分布を近似するアルゴリズムを提案した。
- 提案アルゴリズムは，メモリ使用量においてBourreauらのアルゴリズムと同等か，より優れていることが実験的に示された。
- 特に，密度の高いグラフにおいて，大幅な性能向上を達成した。
Link: https://arxiv.org/abs/2604.25400
マルチモーダル大規模言語モデルによるユーザビリティ改善提案 [cs.SE, cs.HC]目的：ユーザビリティ改善提案の自動化
- ユーザビリティは，ユーザーインタフェースの品質を左右し，効果的な操作を可能にする重要な要素である。
- 従来のユーザビリティ評価は専門知識とリソースを要し，小規模チームや組織には困難な場合がある。
- 本研究は，大規模言語モデルを用いてユーザビリティ評価を自動化し，改善提案を行うことで，この問題を解決する。
- 提案手法では，アプリケーションの限定的な情報とユーザー操作の画面録画を大規模言語モデルに入力する。
- モデルは，ニールセンのユーザビリティヒューリスティックに基づいてユーザビリティ問題を特定し，説明と改善提案を行う。
- 提案は重要度によってランク付けされ，ソフトウェアエンジニアによるユーザー調査で有用性が確認された。
Link: https://arxiv.org/abs/2604.25420
突然変異システムに対する中心極限定理 [cs.HC, cs.CL, cs.IT, math.IT]目的：突然変異システムの漸近的振る舞い
- DNAストレージは，高密度，長寿命，持続可能性に優れる次世代のデータ保存技術として注目されている。
- 生体内DNAストレージは，突然変異による配列変化がエラー訂正を困難にするという課題がある。
- 本研究は，生体内DNAストレージにおける配列変化の確率的進化をモデル化する突然変異システムの振る舞いを解析する。
- 本研究では，$k$-tuple頻度の極限値に基づいて，その周りの確率的変動を記述する中心極限定理を確立した。
- 置換行列のスペクトル特性を活用し，中心化されたカウントベクトルを射影することで，マルチンゲール差分系列として近似した。
- また，極限共分散行列を明示的に導出した。
Link: https://arxiv.org/abs/2604.25445
中性原子コンパイラの公平な比較と評価のための実用的な考察 [cs.ET, cs.PL]目的：中性原子コンパイラの性能評価に関する統一的かつ再現可能なフレームワーク
- 中性原子量子コンピューティングはスケーラブルな量子計算の有望なプラットフォームであり，その活用にはコンパイラが不可欠である。
- 既存のコンパイラは異なる評価指標や仮定に基づき評価されることが多く，公平な性能比較が困難である。
- 評価の一貫性のない部分を解消し，より正確なコンパイラ性能評価を実現すること。
- 本研究では，ルーティングとスケジュール情報を記録するRSQASMという中間表現を導入し，既存のコンパイラの出力を変換するアダプタスクリプトを開発した。
- HybridMapper，DasAtom，Enolaの3つのコンパイラを比較した結果，以前報告された性能差は小さくなり，再現されない場合もあった。
- これにより，評価における不整合が取り除かれることで，より正確なコンパイラ性能の定量化が可能となる。
Link: https://arxiv.org/abs/2604.25478
BVの証明同一性と圏モデル [cs.LO]目的：BV論理における証明の圏論的意味論を提供するBV圏の数学的基礎
- 論理学と圏論は密接に関連しており，圏論は論理構造を抽象的に捉える強力なツールである。
- BV圏は発展途上であり，一貫性を示すためのコヒーレンス定理や証明の同一性の定義が欠けていた。
- 原子的フローに基づくBVの証明同一性を定義し，BV圏の健全性を確立することで，論理との関係を明確化する。
- 本研究では，原子的フローという特殊な弦図を用いてBVの証明同一性を新たに定義した。
- 定義された証明同一性に基づき，既存のBV圏の定義を強化し，論理に対する健全性を示した。
- これにより，BV圏とBV論理の関係がより明確になり，今後の研究への道が開かれた。
Link: https://arxiv.org/abs/2604.25501
二部グラフにおける因果的および非因果的な状態情報の同等性（状態を認識する受信機を持つ場合） [cs.IT, math.IT]目的：二部グラフにおける因果的および非因果的な状態情報の容量領域への影響
- ネットワーク通信において，状態情報は容量達成に重要な役割を果たすため，その利用方法の検討は不可欠である。
- 状態情報を因果的に利用するか，非因果的に利用するかで容量領域が変化する可能性があり，その解明が求められている。
- 状態情報を因果的または非因果的に利用した場合でも容量領域が変わらないことを示すことで，設計の簡素化に貢献する。
- 状態系列がエルゴード的かつ自律的であり，ネットワーク則がメモリーレスである場合，状態情報の利用方法に関わらず容量領域は同一である。
- 多重アクセスチャネル，ブロードキャストチャネル，干渉チャネルなど，送受信が分離されたネットワークにおいてこの結果が成立する。
- 容量領域の計算を必要とせず，状態情報の利用方法に関する洞察を得ることが可能となる。
Link: https://arxiv.org/abs/2604.25504
AIの消費者および参加者：MBSE基盤と手法の共同設計アジェンダ [cs.CL, cs.HC, cs.SE, cs.AI]目的：MBSE基盤と手法の共同設計
- 現代のシステム開発において，MBSEは複雑なシステムを効率的に構築・運用するための不可欠な手法である。
- 既存のMBSEモデルは，AIによる知識利用を前提として設計されていないため，AIの推論根拠の透明性が低いという問題がある。
- AIがモデルから知識を抽出し，一貫性のある推論を行うためのMBSEモデルと手法の共同設計を目指す。
- 現在のAIツールは，MBSEモデルを知識ベースとしてではなく，プロンプトとして機能させている点が課題である。
- モデルと手法を共同設計することで，AIがモデルから直接知識を取得し，推論根拠を明確にできる可能性が示された。
- AI統合に関するアーキテクチャ決定が手法的な基盤なしに進むことを防ぐため，コミュニティへの共同設計の呼びかけが行われた。
Link: https://arxiv.org/abs/2604.25526
記述論理における部分的に有限なモデル推論 [cs.LO]目的：部分的に有限なモデル推論に関する研究
- 知識表現と推論において，記述論理は重要な役割を担う。
- 有限モデル推論と無限モデル推論の間には隔たりが存在する。
- 有限性と無限性の両立を目指し，部分的に有限なモデル推論を確立する。
- 記述論理Sにおいて，部分的に有限な連言クエリの含意判定問題が2-exptimeで解決可能であることが示された。
- その解法は，複雑な無限モデル操作を必要とし，有限・無限の個別ケースの組み合わせを超えている。
- 閉包述語が存在する場合のクエリ包含問題が，部分的に有限なクエリ含意判定に帰着できることが示された。
Link: https://arxiv.org/abs/2604.25549
再帰型グラフニューラルネットワークにおける停止と収束について [cs.LG, cs.AI, cs.LO]目的：再帰型グラフニューラルネットワークの表現力の関係性
- グラフ構造を持つデータの解析に応用されるため，表現力の高いモデルが求められている。
- 再帰型グラフニューラルネットワークの停止条件や収束条件が，モデルの表現力に影響を与える。
- 異なる停止・収束条件を持つ再帰型グラフニューラルネットワークの表現力の関係を明確にすること。
- 収束型再帰型グラフニューラルネットワークは，ある条件の下で停止型再帰型グラフニューラルネットワークと同等の表現力を持つことが示された。
- 出力収束型再帰型グラフニューラルネットワークは，少なくとも収束型再帰型グラフニューラルネットワークと同等以上の表現力を持つ。
- 異なる停止・収束条件を持つ再帰型グラフニューラルネットワークの表現力は，モノディック2次論理式で表現可能な分類器によって規定される。
Link: https://arxiv.org/abs/2604.25551
二値入力離散無記憶チャネルの劣化について [cs.IT, math.IT]目的：二値入力離散無記憶チャネルにおける劣化の最適化
- 通信効率向上の鍵となる誤り訂正符号の性能評価には重要である。
- チャネル劣化の評価は，計算量の問題から困難を伴う。
- 効率的な劣化スキームの設計により，性能評価の精度向上を目指す。
- 対称的な二値入力離散無記憶チャネルの最適劣化が特定された。
- 最小誤り確率復号を行う劣化と，最大対称容量を持つ劣化の必要条件が導出された。
- 対称容量を最大化する劣化スキームを求める効率的なアルゴリズムが提案された。
Link: https://arxiv.org/abs/2604.25552
グループ化された色削除，ラッセール正確性，およびレインボーマッチングのためのクリックスム局所性 [cs.DS]目的：レインボーマッチング問題における色削除数の最小化
- グラフ理論におけるマッチング問題は，ネットワーク設計やスケジューリングなど，様々な分野で重要な役割を果たす。
- レインボーマッチング問題はNP困難であり，効率的な解法が求められている。
- 色削除によるグラフの簡略化と，それによる問題の効率的な解法を確立することを目指す。
- 色を削除して残ったグラフが特定のグラフクラスに属する場合，ラッセール階層の正確性を保証できることが示された。
- 色交差グラフがグラフの構造に影響を与え，クリックスム分解を誘導することが明らかになった。
- 色交差グラフのブロックサイズが有界である場合，色削除パラメータを正確に計算するための動的計画法アルゴリズムが提示された。
Link: https://arxiv.org/abs/2604.25556
強連結な Steiner 部分グラフに対する新規パラメータ化された正確な指数時間アルゴリズム [cs.DS]目的：強連結な Steiner 部分グラフ問題の効率的な解法
- ネットワーク設計問題として重要であり，通信ネットワークや輸送ネットワークの最適化に応用可能である。
- 従来のアルゴリズムは計算量が指数関数的に増加するため，大規模グラフへの適用が困難であった。
- グラフの木分解幅を利用し，より高速なアルゴリズムを開発することで，大規模グラフへの適用可能性を高める。
- グラフの木分解幅twが与えられた場合，SCSS問題を時間$17^{\mathrm{tw}} n^{O(1)}$で解けることを示した。
- 一般的な有向グラフに対するSCSS問題に対して，既存の結果よりも改善された時間$2^n n^{O(1)}$で解ける正確な指数時間アルゴリズムを提案した。
- 頂点被覆サイズによるカーネル化に関して，SCSS問題は多項式カーネルを持たないことを証明した。
Link: https://arxiv.org/abs/2604.25585
ユーザー構成におけるモバイルエネルギー消費の経験的分析 [cs.SE]目的：ユーザー制御可能なパラメータによるエネルギー消費量の定量化
- モバイルデバイスは不可欠だが，バッテリー駆動時間が課題である。
- 節電情報は一般的で，効果の検証が不十分である。
- 技術分析とユーザーの実際利用を結びつける。
- 画面の明るさやリフレッシュレート等の設定がエネルギー消費に大きな影響を与えることが定量的に示された。
- アプリのビデオ解像度やメッセージサイズもエネルギー消費に影響を与えることが明らかになった。
- ユーザーエクスペリエンスとバッテリー駆動時間のトレードオフが明確になった。
Link: https://arxiv.org/abs/2604.25587
時間的輸送ネットワークのロバスト性の検証：時間間隔分離子によるアプローチ [cs.DS]目的：時間的ネットワークにおける時間間隔分離子の特定
- 現代社会における輸送ネットワークの重要性は高く，その安定性と信頼性が求められる。
- 時間的ネットワークにおける故障の影響を考慮した解析が不足しており，ロバスト性の評価が難しい。
- ネットワークの脆弱性を評価し，時間的な制約下での経路遮断問題を解決する。
- 本研究では，時間間隔分離子問題の変種であるd-MinIntSep問題を提案し，NP困難であることを証明した。
- d-MinIntSep問題を解くための整数計画法（ILP）を提案し，合成データおよび現実の輸送データを用いて評価を行った。
- 実験結果から，実行時間は時間的次元，期限，および時間的経路の密度に大きく影響されることが示された。
Link: https://arxiv.org/abs/2604.25589
PLM-GNNハイブリッドにおけるコード分類と脆弱性検出の重要な要素 [cs.DC, cs.HC, cs.MA, cs.SI, cs.SI, cs.DL, physics.soc-ph, stat.AP, cs.SE, cs.LG]目的：コード分類と脆弱性検出のためのPLM-GNNハイブリッドモデルの性能評価
- ソフトウェアの信頼性確保が重要であり，コードの理解は欠かせない。
- 既存手法では，コードのセマンティクスと構造を同時に捉えるのが困難。
- PLMとGNNを組み合わせることで，コード理解の精度向上を目指す。
- PLM-GNNハイブリッドは，GNNのみのモデルよりも常に優れた性能を示した。
- Devignデータセットでは，PLMのFeature抽出源が性能に大きく影響する。
- 大規模なPLMが必ずしも優れたFeature抽出器とは限らないことが示された。
Link: https://arxiv.org/abs/2604.25599
時間論理における位置的特性 [cs.MM, cs.FL, cs.CE, cs.LO, cs.FL]目的：ゲームベースのリアクティブ合成における位置的特性の研究
- システム検証において，仕様記述の論理は重要な役割を果たす。扱える仕様が広ければ，より複雑なシステムの検証が可能となる。
- 位置的特性の表現力と，効率的な合成の実現は両立しにくいという課題がある。
- $\omega$-正規の位置的特性を線形時間論理で表現することを目指す。
- 全ての$\omega$-正規の位置的特性（状態またはエッジラベル付きゲームグラフに対して）は，線形時間論理で表現可能であることが示された。
- $\omega$-正規特性が位置的であるための必要十分条件と，扱いやすい部分クラスが特定された。
- あるクラスが接頭辞独立性を持つと同時にブール演算で閉じていることは不可能であることが証明された。
Link: https://arxiv.org/abs/2604.25628
FMUベースシミュレーションのブラックボックステストにおける大規模言語モデルの活用 [cs.SE, cs.SY, eess.SY]目的：FMUベースシミュレーションのブラックボックステスト手法
- シミュレーションは，設計段階での検証やリスク軽減に不可欠であり，その品質確保が重要である。
- 従来のテストケース作成は手作業に頼る部分が多く，時間と労力がかかるという課題がある。
- 大規模言語モデルを用いてテストケースを自動生成し，テスト作業の効率化と品質向上を目指す。
- 大規模言語モデルを活用することで，動的シミュレーションモデルに対するテストシナリオの自動生成が可能となった。
- 生成されたシナリオは，Given-When-Then形式で記述され，シミュレーションの入力条件，変化，期待される出力行動を明確に定義する。
- 本手法は，潤滑油冷却システムにおいて有効性が確認され，日常的な利用に適した実用的なアプローチであることが示唆された。
Link: https://arxiv.org/abs/2604.25650
効率的なメッセージパッシングによる排他的走査アルゴリズム [cs.DS, cs.DC]目的：並列走査処理の効率化
- 並列計算において，走査処理は基本的な演算であり，様々なアルゴリズムの性能を左右する。
- メッセージパッシングシステムにおける排他的走査は，包含的走査に比べて効率的なアルゴリズムが少なかった。
- 通信ラウンド数と演算回数の少ない，排他的走査アルゴリズムを提案し，その性能を評価する。
- 本研究では，包含的走査と排他的走査を組み合わせたアルゴリズムと，オールリダクションアルゴリズムを改良したアルゴリズムを提案した。
- 提案アルゴリズムは，入力ベクトルの規模が小さい場合に有効であり，通信ラウンド数を重視した設計となっている。
- 大規模な入力ベクトルに対しては，パイプライン処理や固定次数木などの他のアルゴリズムが適していると考えられる。
Link: https://arxiv.org/abs/2604.25667
SimdQuickHeap：QuickHeapの再検討 [cs.DS]目的：優先度キューの性能向上
- 優先度キューは様々なアルゴリズムで頻繁に使用され，効率的な実装が求められる。
- 従来の二分ヒープはキャッシュミスが多く，SIMD命令による最適化が困難である。
- SIMD命令を活用し，優先度キューの処理速度を向上させることを目指す。
- SimdQuickHeapは，従来のQuickHeapを改良し，ピボットをメモリ上で隣接させることでSIMD命令の効率化を実現した。
- 理論上，操作ごとの期待される平均計算量はO(log n)であり，特定の条件下ではO(1/W log n)まで改善される。
- 実験結果から，SimdQuickHeapは既存の優先度キューと比較して，最速であることが示された。
Link: https://arxiv.org/abs/2604.25681
GPTを活用した小規模問題に対するスプレッドシートモデリング実験と壁課題 [cs.SE, cs.AI]目的：再利用可能な分析用スプレッドシートモデルの構築におけるGPTベースのツールの支援
- ビジネスや研究において，データ分析の効率化は重要な課題である。
- スプレッドシートモデリングは専門知識を要し，誤りが発生しやすい。
- GPTの活用により，モデリングの効率化とスキル要件の低減を目指す。
- Excel AIは，構造化されたモデルを生成できるものの，一貫性と再現性に課題があることが示された。
- 「信頼性の問題」と「ワークフローの問題」の2つの主要な課題が特定された。
- GPTは草案モデル生成の可能性を示すが，現在のツールはプロフェッショナル用途には信頼性が低い。
Link: https://arxiv.org/abs/2604.25689
バグ報告駆動型故障局所化：ABB Roboticsにおける産業ベンチマークと教訓 [cs.CG, cs.RO, cs.AR, cs.SE, cs.LG]目的：バグ報告のみを用いた故障局所化の支援
- 産業環境では大規模システムに欠陥が蓄積しやすく，品質保証が重要な課題である。
- 故障箇所特定には時間がかかり費用も嵩むことが多く，特にバグ報告のみに基づく保守段階で困難が生じる。
- バグ報告のテキスト情報のみから，既存の保守ワークフローに組み込める故障局所化手法を確立する。
- 伝統的な機械学習モデル（ロジスティック回帰，SVM，ランダムフォレスト）が，ファインチューニングされたTransformerベースの言語モデルよりも一貫して高い性能を示した。
- データ拡張はランダムフォレストの性能を向上させた。Transformerモデルが常に古典的手法を上回るわけではないことが示唆された。
- 過去のバグ報告を体系的に活用することで，テキストベースのAI支援故障局所化が可能となり，既存のデバッグ手法を補完できる。
Link: https://arxiv.org/abs/2604.25700