arXiv雑要約

プログラム - 2026/02/03 公開

  • Prior分布情報に基づくMIMO ISAC向けハイブリッドビームフォーミング最適化 [cs.IT, eess.SP, math.IT]目的:MIMO統合センシング通信システムにおけるハイブリッドビームフォーミング最適化
    • 通信とセンシングを統合することで,より効率的なシステム構築が期待されるため。
    • ハイブリッドビームフォーミングの最適化は,複雑であり,最適な設計が困難である。
    • ターゲット位置の事前分布情報を活用し,センシング性能を向上させること。
    • 提案手法により,PCRBを最小化するハイブリッドビームフォーミング設計が実現された。
    • 受信RFチェーン数の方が,送信RFチェーン数よりもセンシング性能に大きな影響を与えることが示された。
    • 通信レート目標の上昇に伴い,最適な送信RFチェーン数が増加するトレードオフが確認された。

    Link: https://arxiv.org/abs/2506.07869

  • 3GPP 5G-Advanced Release 19における低消費電力ウェイクアップ信号設計 [cs.IT, eess.SP, math.IT]目的:低消費電力ウェイクアップ信号の設計
    • IoTデバイスの普及に伴い,低消費電力通信技術の重要性が増している。
    • 従来の5Gページング機構では,消費電力が課題となっていた。
    • 6Gウェイクアップ信号設計の基盤となる低消費電力ウェイクアップ信号の最適化。
    • 3GPP 5G-Advanced Release 19で導入された低消費電力ウェイクアップ信号(LP-WUS)および低消費電力同期信号(LP-SS)について概説した。
    • LP-WUSは,低消費電力エネルギー検出器(ED)による検出を前提とし,メインラジオ(MR)のオフを可能にすることで,大幅な省電力化を実現する。
    • 受信アーキテクチャの評価を行い,省電力性能とカバレッジのトレードオフを明らかにした。

    Link: https://arxiv.org/abs/2507.10207

  • 特異ブール式のユニーク原因MC/DCテストケース生成のための効率的なアルゴリズム [cs.SE]目的:特異ブール式に対するユニーク原因MC/DCテストスイートの最小化
    • 安全性重視のソフトウェアにおいて信頼性を保証する上で,構造的カバレッジ基準は不可欠である。
    • ユニーク原因MC/DCは強力な保証を提供するが,効率的かつスケーラブルなテスト生成が課題となっている。
    • 本研究は,特異ブール式に対するユニーク原因MC/DCテスト生成の効率性と最適化を目指す。
    • 提案手法「Robin's Rule」は,2^Nの真理値表を列挙することなく,N個の条件を持つ特異ブール式に対し,理論上の最小テスト数N+1で100%のユニーク原因MC/DCを保証する。
    • アルゴリズムは,(N+1)xNのテストテーブルを明示的に構築することでO(N^2)の時間で動作し,安定性と効率的な生成時間を実現する。
    • TCAS-II由来の条件やランダムに生成された式を含む25個の特異ブール式を用いた評価により,BDDやSATを用いた最先端手法と比較して,一貫して100%のユニーク原因MC/DCを達成することが示された。

    Link: https://arxiv.org/abs/2507.14687

  • AutoCodeSherpa: AIコーディングエージェントにおける記号的説明 [cs.MA, cs.SE]目的:AIコーディングエージェントにおけるソフトウェア問題の説明の生成
    • AIエージェントの利用拡大に伴い,その行動の影響とリスクが増大している。
    • エージェントの行動に対する信頼性と根拠の提示が不可欠である。
    • ソフトウェア問題の正確な説明を生成し,エージェントの信頼性を高める。
    • AutoCodeSherpaは,ソフトウェア問題を記号式で説明する手法である。
    • 生成された入力条件の精度は85.7%と高く,誤った修正パッチを2倍多く拒否できる。
    • 本手法は,他のLLMベースの修復技術の出力向上にも貢献する。

    Link: https://arxiv.org/abs/2507.22414

  • SWE-Exp:経験に基づくソフトウェア問題解決 [cs.SE, cs.CL, cs.LG]目的:ソフトウェア問題解決における経験の活用
    • ソフトウェア開発において,問題解決は不可欠であり,効率化が常に求められている。
    • 既存のLLMエージェントは,過去の経験を活かさず,毎回問題を独立して探索する傾向がある。
    • 過去の試行錯誤から得られた知識を再利用し,効率的な問題解決を目指す。
    • SWE-Expは,過去の試行記録から簡潔かつ実行可能な経験を抽出する。
    • 抽出された経験を多面的な経験バンクに蓄積し,問題理解からコード変更まで,様々なレベルの知識を再利用する。
    • SWE-Bench Verifiedにおいて,Pass@1の解決率が73.0%を達成し,既存手法を大きく上回る結果を示した。

    Link: https://arxiv.org/abs/2507.23361

  • StoneDetector:Javaの従来型かつ汎用的なコードクローン検出器 [cs.CL, cs.SE, cs.PL]目的:Javaにおけるコードクローンの検出
    • ソフトウェアの品質維持に不可欠であり,保守性向上に繋がる。
    • 類似コードの特定が困難であり,バグや脆弱性の伝播リスクがある。
    • 支配木に基づくテキスト比較により,多様な構文のクローン検出を目指す。
    • StoneDetectorは,Javaソースコードとバイトコードの両方において,従来のクローン検出アプローチで高い性能とスケーラビリティを示す。
    • 支配木に基づくパス比較により,構文の差異が大きいクローンも検出可能である。
    • 様々な文字列メトリクスやハッシュアルゴリズムの設定が可能であり,柔軟なクローン検出を実現する。

    Link: https://arxiv.org/abs/2508.03435

  • プログラムスライシングと論理的削除によるLLMベースの仕様生成の強化 [cs.SE]目的:LLMを用いた仕様生成の精度向上
    • ソフトウェアの信頼性向上には,厳密な仕様が不可欠である。自動仕様合成の重要性が高まっている。
    • 従来の仕様生成手法は特定の型に依存し,複雑な制御フローに対する対応が課題であった。
    • LLMの弱点である複雑な制御フローへの対応と,誤った仕様の除外を解決することを目指す。
    • SLD-Specは,プログラムスライシングと論理的削除を組み合わせることで,既存手法を上回る性能を示した。
    • プログラムスライシングは仕様の関連性と完全性を向上させ,論理的削除は検証成功率を高める上で重要な役割を果たすことが示された。
    • 様々な複雑さのプログラムデータセットにおいて,より多くのプログラムを検証し,より関連性の高い完全な仕様を生成することが確認された。

    Link: https://arxiv.org/abs/2509.09917

  • 評価から改善へ:ゼロ知識証明コード生成のための大規模言語モデル [cs.SE]目的:ゼロ知識証明(ZKP)プログラム生成における大規模言語モデルの能力向上
    • プライバシー保護,検証可能な計算,安全な金融など,ZKPの応用範囲は拡大しており,重要性が増している。
    • ZKPプログラミングは,命令型から宣言型へのパラダイムシフトを伴い,高度な知識と注意を要する。
    • LLMを用いてZKPコード生成を支援し,ZKPプログラミングの障壁を低減することを目指す。
    • LLMは言語構文は得意だが,正確な制約システムを記述するための代数素因子の実装・構成に苦戦していることが判明した。
    • 評価パイプライン「ZK-Eval」と,エージェントフレームワーク「ZK-Coder」を提案することで,ZKPコード生成におけるLLMの能力測定と拡張の基盤を確立した。
    • CircomとNoirにおける実験で,GPT-o3の成功率がそれぞれ20.29%から87.85%,28.38%から97.79%へと大幅に向上した。

    Link: https://arxiv.org/abs/2509.11708

  • LLMを用いた不変条件合成によるプログラム検証の高速化:Quokka [cs.PL, cs.AI, cs.CL, cs.LG]目的:LLMを用いた不変条件合成によるプログラム検証の高速化
    • プログラムの信頼性確保には検証が不可欠であり,自動化技術へのニーズが高い。
    • プログラム検証において,強力な不変条件の自動発見は長年の課題である。
    • LLMを活用し,不変条件合成の効率を向上させることで検証プロセスを加速する。
    • Quokkaは,LLMによる不変条件合成のための初の効果的なフレームワークであり,健全な評価を提供する。
    • Quokkaは,複雑なアルゴリズムに頼らず,単純かつ原理的な検証手順を採用している。
    • 実験の結果,Quokkaは既存のLLMベースの検証器を凌駕し,速度向上を実現した。

    Link: https://arxiv.org/abs/2509.21629

  • TreeMind:LLMを活用したモンテカルロ木探索によるAndroidのバグレポートの自動再現 [cs.SE]目的:Androidバグレポートからのアプリクラッシュの自動再現
    • ソフトウェアの品質向上において,バグレポートの迅速かつ正確な再現は不可欠である。
    • バグレポートが不完全であったり,UIの組み合わせが複雑な場合,再現が困難になりがちである。
    • LLMとモンテカルロ木探索を組み合わせ,UI操作空間の探索を効率化し,再現率の向上を目指す。
    • TreeMindは,LLMとモンテカルロ木探索を統合し,戦略的なUI探索を実現した。
    • 実験結果から,TreeMindは既存の最先端手法と比較して,バグレポートの再現成功率において有意な改善が見られた。
    • 再現タスクを目標駆動型の探索問題として定式化し,動的な環境フィードバックを活用することで,再現パスを効率的に再構築する。

    Link: https://arxiv.org/abs/2509.22431

  • マルチセルISACにおけるレーダー・通信タスクのスケジューリングによるメディアアクセス [cs.IT, math.IT]目的:マルチセル統合センシング通信(ISAC)ネットワークにおける通信,レーダー探索,追跡タスクのスケジューリング
    • 通信とレーダー機能を統合するISACは,次世代無線通信の重要な技術となる可能性を秘めている。
    • 複数のセル間干渉やタスク間干渉が,ISACシステムの性能を制限する主要な課題となっている。
    • 本研究は,干渉を考慮したスケジューリングにより,マルチセルISACにおける資源効率を向上させることを目指す。
    • 提案するフレームワークは,時間領域タスクスケジューリングとビーム選択により,タスク間およびセル間干渉を軽減する。
    • シミュレーション結果は,提案手法が目標とする通信スループット,検知確率,SINRを保証することを示した。
    • これにより,マルチセルISACにおける協調スケジューリングの利点が明らかになった。

    Link: https://arxiv.org/abs/2510.05821

  • FedLoDrop:汎用LLMのファインチューニングのためのFederated LoRAとドロップアウト [cs.CL, cs.IT, cs.LG, math.IT]目的:大規模言語モデルの汎化性能向上と学習コスト削減
    • 大規模言語モデルは様々なタスクに応用可能だが,特定のタスクへの適応にはファインチューニングが不可欠である。
    • ファインチューニングは計算資源を要し,過学習のリスクを伴うことが課題である。
    • Federated LoRAとドロップアウトを組み合わせ,過学習抑制と汎化性能向上を目指す。
    • 提案手法FedLoDropは,Federated LoRAの学習可能な行列にドロップアウトを適用することで,モデルの疎性を高める。
    • 理論解析により,ドロップアウト率と汎化誤差のトレードオフが明らかになり,最適なドロップアウト率の設定が重要であることが示された。
    • 数値実験の結果,提案手法が過学習を抑制し,汎化性能を改善することが確認された。

    Link: https://arxiv.org/abs/2510.12078

  • MalCVE:大規模言語モデルを用いたマルウェア検出とCVEの関連付け [cs.RO, cs.CL, cs.HC, cs.CR, cs.SE]目的:マルウェア検出と脆弱性情報の関連付け
    • マルウェア攻撃は経済的損失が拡大しており,対策の重要性が高まっている。
    • マルウェアとそれが悪用する脆弱性の関連性の特定が困難である。
    • 大規模言語モデルを用いて,マルウェアと脆弱性の関連を自動的に特定すること。
    • MalCVEは,JARファイル内のマルウェアを97%の精度で検出可能である。
    • 大規模言語モデルによるコード要約が,高精度かつ説明可能なマルウェア識別を可能にしている。
    • MalCVEは,バイナリマルウェアとCVEの関連付けを初めて実現し,recall@10で65%の性能を示した。

    Link: https://arxiv.org/abs/2510.15567

  • オープンソースソフトウェアにおけるAIエージェントのためのコンテキストエンジニアリング [cs.SE]目的:AIエージェントにおけるコンテキストファイルの採用状況とその内容
    • ソフトウェア開発において,AIの活用が急速に進んでおり,開発効率向上が期待されている。
    • AIエージェントは自律的に動作するため,プロジェクトの標準や方針を理解した上でコードを生成する必要がある。
    • AGENTS.mdファイルの採用状況を調査し,効果的なコンテキスト記述の構造を明らかにすること。
    • 466件のオープンソースプロジェクトを調査した結果,AGENTS.mdファイルのコンテンツ構造には確立されたものがないことが判明した。
    • コンテキストの記述方法には,記述的,規範的,禁止的,説明的,条件付きなど,多様なアプローチが存在する。
    • AGENTS.mdファイルの変更履歴分析により,コンテキスト記述の進化に関する初期的な知見が得られた。

    Link: https://arxiv.org/abs/2510.21413

  • 不正確な距離指標を超えて:LLM予測のコールスタックによるトレース誘導型指向型グレーボックスファジング [cs.CR, cs.PL, cs.SE]目的:脆弱性箇所の探索効率向上
    • ソフトウェアの脆弱性は深刻なセキュリティリスクであり,早期発見と対策が不可欠である。
    • 既存のファジング手法は,脆弱性箇所の特定に効率性が低い場合がある。
    • 静的解析に基づく距離指標の不正確さを解消し,ファジングの効率を改善すること。
    • 提案手法は,脆弱性トリガー実行の実行情報(ガイダンストレース)を用いてファジングを誘導することで,効率を向上させる。
    • 特に,LLMを用いて脆弱性トリガー時のコールスタックを予測し,ファジングを誘導するフレームワークが有効であることが示された。
    • 実世界のプログラムに対する実験の結果,既存の手法と比較して2.13倍~3.14倍速く脆弱性を発見し,10件の新たな脆弱性と2件の不完全な修正を発見した。

    Link: https://arxiv.org/abs/2510.23101

  • 純粋なプライバシーに基づく共分散行列推定 [cs.IR, cs.LG, cs.DS]目的:高次元共分散行列の純粋な差分プライバシー保護
    • データ分析において,共分散行列はデータの重要な特徴量を捉えるため不可欠である。
    • プライバシー保護とデータ有用性の両立が課題であり,特に高次元データにおける共分散行列推定は難しい。
    • 差分プライバシーを維持しつつ,共分散行列の推定精度を向上させることを目指す。
    • 提案手法は,大規模データセットにおいて,既存手法と同等のフロベニウスノルム誤差を達成する。
    • また,他の$p$-Schattenノルムにおいても最適な誤差を達成し,特にスペクトルノルムでの最適な誤差を初めて実現した。
    • 小規模データセットでは,核ノルムへの射影により,既存手法よりも優れたフロベニウスノルム誤差を達成する。

    Link: https://arxiv.org/abs/2510.26717

  • 単調サブモジュラーコスト配分に対する近似アルゴリズム [cs.CL, cs.FL, cs.DS, cs.DM]目的:単調サブモジュラーコスト配分問題の最適解の近似
    • 資源配分や施設配置など,様々な応用場面でサブモジュラー関数が活用される。
    • サブモジュラー関数の最適化問題はNP困難であり,効率的な解法が求められている。
    • 単調サブモジュラー関数に特化し,より良い近似アルゴリズムを開発する。
    • 単調サブモジュラーコスト配分問題に対する自然なLP緩和の積分ギャップが$k/2$以下であることを示した。
    • これにより,$k/2$-近似アルゴリズムが得られる。
    • 固定された$k$に対して,積分ギャップが少なくとも$k/2 - \epsilon$である下界も示した。

    Link: https://arxiv.org/abs/2511.00470

  • 正多角形における貪欲オンライン施設配置の期待コスト [cs.DS]目的:正多角形における貪欲オンライン施設配置プロセスの期待コストの評価
    • 施設配置問題は,ロジスティクス,通信ネットワーク,サービス配置など,様々な分野で重要である。
    • オンライン配置問題では,顧客到着順序が事前に不明であるため,最適な配置が困難である。
    • 正多角形という構造を利用し,期待コストの計算を効率化することで,問題解決を目指す。
    • 期待コストは,施設配置状態に基づき,有限水平線積分漸化式で正確に表現可能であることが示された。
    • 正多角形の対称性を活用し,漸化式の計算効率を高める手法が開発された。
    • 数値計算とモンテカルロシミュレーションにより,期待コストが多角形の辺数とともに増加することが確認された。

    Link: https://arxiv.org/abs/2512.00506

  • PaperDebugger:エディター内学術論文作成,レビュー,編集のためのプラグインベースマルチエージェントシステム [cs.AI, cs.SE]目的:エディター内での学術論文作成支援
    • 学術論文作成は研究活動の根幹であり,効率化と質的向上が不可欠である。
    • 既存の支援ツールは外部連携が多く,論文の状態や履歴を考慮した高度な支援が困難である。
    • エディター内でLLMを活用し,論文作成プロセス全体を支援するシステムの構築を目的とする。
    • PaperDebuggerは,Chrome拡張機能,Kubernetesオーケストレーション層,MCPツールチェーンによってエディターとLLMを統合した。
    • ローカライズされた編集,構造化されたレビュー,並列エージェント実行,差分ベースの更新を含む統合ワークフローを実証した。
    • 初期分析により,ユーザーエンゲージメントが確認され,エディター内エージェント型ライティングアシスタントの有効性が示された。

    Link: https://arxiv.org/abs/2512.02589

  • 二重偏波固定型インテリジェントサーフェスによる可動信号:対角反射行列の限界を超える [cs.IT, eess.SP, math.IT]目的:二重偏波型インテリジェントサーフェスを用いた無線システムにおける性能比較
    • 無線通信において,電波環境を改善し通信品質を高める技術が重要視されている。
    • 従来のRISは反射行列の調整に複雑さを伴い,性能向上の限界がある。
    • FISによる可動信号を用いることで,RISの性能限界を克服し,通信性能を向上させる。
    • 可動信号とFISの組み合わせは,常にRISよりも優れた性能を発揮し,少なくとも4倍の利得が得られる。
    • 送信機と受信機の偏波が異なる場合,対角反射行列にとらわれないFISがさらに性能を向上させる。

    Link: https://arxiv.org/abs/2512.03872

  • 本番環境におけるエージェントの測定 [cs.CY, cs.AI, cs.LG, cs.SE]目的:本番環境におけるエージェントの導入成功に寄与する技術手法の解明
    • LLMベースのエージェントは多くの産業で利用され,その重要性は増している
    • 本番環境でのエージェント導入における成功要因が不明確である
    • 本研究は,エージェント導入の実態を把握し,課題解決に貢献する
    • 本研究では,20件のケーススタディと306人の実務家への調査を実施した。
    • 本番環境のエージェントは,10ステップ以下で人間の介入を求めるものが68%を占め,市販モデルのプロンプティングに依存するものが70%であった。
    • 信頼性が最大の課題であり,システムレベルでの設計によって対処されている。

    Link: https://arxiv.org/abs/2512.04123

  • DoVer:LLMマルチエージェントシステムに対する介入駆動型自動デバッグ [cs.AI, cs.SE]目的:LLMマルチエージェントシステムのデバッグ手法
    • LLMを活用したマルチエージェントシステムは,複雑なタスクを解決する上で重要性が増している。
    • 既存のデバッグ手法は,ログ分析に依存しており,検証不足で仮説の妥当性が不確かな場合が多い。
    • 介入を通じて仮説を検証し,マルチエージェントシステムの信頼性とデバッグ効率の向上を目指す。
    • DoVerは,対象とするタスクの失敗を18〜28%の確率で成功に転換することが示された。
    • GAIAとAssistantBenchのデータセットにおいて,最大16%のマイルストーン進捗を達成し,30〜60%の失敗仮説を検証または反証した。
    • 異なるデータセット(GSMPlus)とエージェントフレームワーク(AG2)でも,49%の失敗試行を回復させる効果が確認された。

    Link: https://arxiv.org/abs/2512.06749

  • ATLAS:大規模検証済みコード合成のための自動ツールキット [cs.RO, cs.SE]目的:大規模検証済みコード合成パイプライン
    • 安全性が必要な分野では,機械によるチェック可能な証明による形式検証が不可欠である。
    • 形式検証済みコードは主流言語と比較して不足しており,LLMの能力を制限している。
    • LLMの形式検証能力を拡大するための合成データ生成を目指す。
    • ATLASを用いて2.7K個の検証済みDafnyプログラムを生成し,高品質な仕様と機械チェック済みの証明を付与した。
    • TACOデータセットからの19K個の学習サンプルを抽出することにより,Qwen 2.5 7B Coderの性能を向上させた。
    • DafnyBenchで32.4%から56.9%へ,DafnySynthesisで15.8%から65.8%へと性能が改善された。

    Link: https://arxiv.org/abs/2512.10173

  • カーネルモジュール支援によるバイナリプログラムのホローイング解析フレームワークHALF [cs.SE]目的:バイナリプログラム解析の忠実性と実用的な性能の確保
    • 現代のシステムセキュリティにおいて,バイナリプログラム解析は不可欠な基盤技術である。
    • 従来のプロセス内解析ツールは,アドレス空間の競合を引き起こし,ターゲットの本来の動作を妨げる問題がある。
    • HALFは,カーネル支援によるホローイングメカニズムを用いて,このアドレス空間の競合を解消し,解析の忠実性を高める。
    • HALFは,従来のプロセス内ベースラインと比較して,優れた性能を維持することが実証された。
    • HALFは,既存のフレームワークでは実行整合性を維持できない,複雑でステルス性の高い脅威を分解するための独自の機能を提供する。
    • カーネル支援によるプロセスホローイングメカニズムにより,従来のインストルメンテーションツールに特徴的な観測アーティファクトを効果的に排除している。

    Link: https://arxiv.org/abs/2512.22043

  • スレッド毎のロック集合を超えて:マルチスレッド臨界セクションと動的デッドロック予測 [cs.PL, cs.SE]目的:マルチスレッドにおける臨界セクションの新しい定義と,それを用いたデッドロック予測の精度向上
    • 並行プログラムのデッドロックは,システムの信頼性を脅かす深刻な問題であるため,その検出・防止は重要。
    • 従来のデッドロック検出手法は,ロックの取得順序に依存し,誤検出や検出漏れが発生しやすいという課題があった。
    • 複数スレッドにまたがる臨界セクションの概念を導入することで,従来の誤検出・検出漏れを解消し,より正確なデッドロック予測を実現する。
    • 本研究では,従来の臨界セクションの定義を拡張し,複数スレッドにまたがる臨界セクションを考慮したロック集合の構成方法を提案した。
    • 提案手法を導入することで,既存のデッドロック予測器における誤検出を削減し,検出漏れを改善することができた。
    • 標準的なベンチマークスイートを用いた評価により,提案手法が性能に影響を与えないことを確認した。

    Link: https://arxiv.org/abs/2512.23552

  • 正解性は効率性ではない:LLM生成コードにおける実行時メモリの相違 [cs.SE, cs.AI]目的:LLM生成コードの実行時メモリ安定性の評価
    • LLMはプログラム生成に利用されるが,テスト合格と実際の挙動は必ずしも一致しないため,信頼性評価が重要である。
    • テストをパスする正解コード間でも,メモリ使用量や実行時間に大きな差が生じることが問題となっている。
    • LLM生成コードの実行時メモリ安定性を定量化し,運用リスクを軽減する手法を提案すること。
    • 同一タスクに対する複数の正解コードにおいて,実行時メモリ使用量に顕著な差異が認められた。
    • サンプリング温度の上昇により,コードの安定性が低下する傾向が確認された。
    • メモリ安定性と,認知・サイクロマチック複雑さといったソフトウェアエンジニアリング指標との間に関連性が見られた。

    Link: https://arxiv.org/abs/2601.01215

  • MHRC-Bench:多言語ハードウェアリポジトリレベルのコード補完ベンチマーク [cs.PL, cs.AI]目的:多言語ハードウェアコード補完のためのベンチマーク
    • ハードウェア設計は複雑化しており,効率的な開発手法が求められている。
    • 既存のコード補完ベンチマークは主にソフトウェアに偏っており,ハードウェア記述言語への対応が不十分である。
    • ハードウェア記述言語に対応したコード補完ベンチマークを構築し,その性能評価を行う。
    • MHRC-Benchは,リポジトリレベルでの多言語ハードウェアコード補完を目的とした初のベンチマークである。
    • 3つの主要なハードウェア設計スタイルを対象とし,コード構造とハードウェア指向のセマンティックラベルが付与されている。
    • 評価実験の結果から,MHRC-Benchが効果的なベンチマークであることを示した。

    Link: https://arxiv.org/abs/2601.03708

  • AutoMonitor-Bench:LLMベースの不正行為監視の信頼性評価 [cs.CL, cs.SE]目的:LLMベースの不正行為監視の信頼性評価
    • 大規模言語モデルの普及に伴い,その安全性確保が重要課題となっている。
    • 既存の監視システムは,多様な不正行為や潜在的なリスクに対応しきれていない。
    • LLMの不正行為を検知する監視システムの信頼性と実用性を向上させる。
    • AutoMonitor-Benchは,質問応答,コード生成,推論を含む3,010件のテストサンプルで,LLMベースの監視システムの信頼性を評価する。
    • 評価の結果,監視性能には大きなばらつきがあり,見逃し率と誤検知率の間にトレードオフが存在することが示された。
    • Qwen3-4B-Instructionをファインチューニングした結果,既知の不正行為データでの学習が,未知の不正行為の検出に必ずしも繋がらないことが示唆された。

    Link: https://arxiv.org/abs/2601.05752

  • ハーモニカ:持続可能なMLOpsのための自己適応の模範 [cs.SE, cs.LG]目的:機械学習システムにおける実行時不確実性への適応メカニズム
    • 機械学習システムの普及に伴い,運用環境の変化への対応が重要になっている。
    • 従来のMLOpsは,長期的なシステムの持続可能性を脅かす実行時の不確実性への対応が不足している。
    • ハーモニカは,MLOpsパイプラインにおける自己適応の課題を研究するための模範事例を提供する。
    • ハーモニカは,MAPE-Kループを用いた構造化された適応制御を導入し,高レベルの適応ポリシーと低レベルの戦術実行を分離する。
    • 持続可能性指標を継続的に監視し,動的な適応境界と比較することで,閾値違反時に自動的にアーキテクチャ戦術をトリガーする。
    • 時系列回帰とコンピュータビジョンのケーススタディを通じて,システムの安定性の向上と手動介入の削減が確認された。

    Link: https://arxiv.org/abs/2601.11926

  • 一般グラフにおけるラウンド型局所探索のクエリ複雑性 [cs.CC, cs.DS]目的:一般グラフ上での局所的最小値探索のクエリ複雑性
    • 最適化問題は,機械学習などの幅広い分野で重要であり,効率的な探索手法が求められている。
    • グラフ構造を持つ問題空間における局所探索のクエリ複雑性は未解明な点が多く残されている。
    • 本研究では,一般的なグラフにおけるラウンド型局所探索のクエリ複雑性の理論的限界を明らかにする。
    • 頂点数nのグラフにおいて,決定論的なクエリ複雑性の上限がO(t n^{1/t} (s\Delta)^{1-1/t})で示された。
    • また,任意の連結グラフに対して,ランダム化されたクエリ複雑性の下限がΩ(t n^{1/t}-t)で導出された。
    • 分離数が高く,最大次数が制限されたグラフに対しては,ウォームスタートを用いた並列最急降下法が改善された境界値を与えることがわかった。

    Link: https://arxiv.org/abs/2601.13266

  • HELIOS:構造を意識したLLM逆アセンブルのための階層的グラフ抽象化 [cs.CL, cs.SE, cs.AI]目的:LLMを用いたバイナリ逆アセンブルの構造化推論
    • セキュリティ分野において,バイナリ解析はマルウェアの解析や脆弱性の発見に不可欠である。
    • 従来のLLMはコードをテキストとして扱うため,プログラムの制御フローを考慮できず,正確性に課題がある。
    • 制御フローグラフを構造化し,LLMに提供することで,より正確な逆アセンブルを可能にすることを目指す。
    • HELIOSは,Gemini 2.0とGPT-4.1 Miniにおいて,HumanEval-Decompileのオブジェクトファイルのコンパイル成功率を大幅に向上させた。
    • コンパイラからのフィードバックを用いることで,コンパイル成功率は94%を超え,機能的な正しさも改善された。
    • x86,ARM,MIPSといった多様なアーキテクチャにおいて,機能的な正確性のばらつきを抑え,構文的な正確性を維持した。

    Link: https://arxiv.org/abs/2601.14598

  • 木構造へのネスト化および外れ値埋め込み [cs.DS]目的:外れ値埋め込みの効率的なアルゴリズムの設計
    • データ解析や機械学習において,高次元データの次元削減は重要な課題である。
    • 既存手法では,外れ値の存在が埋め込みの精度を著しく低下させる場合がある。
    • 外れ値を効率的に処理し,高い精度で次元削減を行う手法を確立すること。
    • 本研究では,最小の部分集合サイズkを用いて外れ値埋め込みを定式化し,確率的埋め込みの期待歪みを評価した。
    • 歪みを$(32+\epsilon)c$以下,外れ値数を$O(\frac k \epsilon \log^2k)$以下に抑える効率的なアルゴリズムを提案した。
    • 良好なネスト化埋め込みを見つける方法と,Munagalaらの近似アルゴリズムを組み合わせることでこの結果を得た。

    Link: https://arxiv.org/abs/2601.15470

  • Retrieval-Augmented Code Generationにおけるコンテキストポイズニングによる隠蔽的なエネルギー消費攻撃:DrainCode [cs.RO, eess.SP, cs.SE]目的:Retrieval-Augmented Code Generationシステムに対する計算効率を低下させる攻撃手法の開発
    • LLMのコード生成能力は高いが,その計算コスト(遅延やエネルギー消費)のセキュリティ上の考慮は十分ではない。
    • LLMの推論における計算効率の脆弱性が,攻撃によって悪用される可能性がある。
    • コンテキストポイズニングによってLLMの出力長を増加させ,計算コストを増大させる攻撃を提示する。
    • DrainCodeは,コンテキストポイズニングによってLLMの出力長を大幅に増加させ,GPUの遅延とエネルギー消費を増大させることを示した。
    • 実験の結果,遅延は最大85%増加,エネルギー消費は49%増加,出力長は3倍以上増加した。
    • 本攻撃は様々なプロンプティング戦略や防御策に対して有効であり,リソース制約環境におけるLLMセキュリティ評価に役立つ可能性がある。

    Link: https://arxiv.org/abs/2601.20615

  • AI支援ソフトウェア進化における信頼性確立のためのブロックチェーン活用:体系的文献レビュー [cs.SE]目的:AI支援ソフトウェア進化におけるブロックチェーン活用の現状と課題
    • ソフトウェア開発における信頼性確保は,品質向上とリスク軽減に不可欠である。
    • AI活用が進む一方,AIモデルの透明性や説明責任が課題となっている。
    • ブロックチェーン技術を用いて,AI支援ソフトウェア進化における信頼性を高める方法を探求する。
    • 先行研究の多くはAIをソフトウェア工学に統合することに焦点を当てており,信頼性への明確な言及は31%にとどまる。
    • ブロックチェーンは,データの改ざん防止,モデルの透明性確保,ライフサイクルにおける説明責任の向上を通じて,信頼性を強化する。
    • 信頼の定義の不一致や,現実世界での検証の不足が,今後の課題として挙げられる。

    Link: https://arxiv.org/abs/2601.20918

  • KAPSO:知識に基づいた自律的なプログラム合成と最適化のフレームワーク [cs.AI, cs.CL, cs.SE]目的:自律的なプログラム合成と最適化のためのフレームワーク
    • ソフトウェア開発の自動化は,生産性向上や複雑な問題解決に不可欠である。
    • 従来のプログラム合成は,長期的失敗や知識の再利用の弱さに課題がある。
    • 実験管理,知識統合,経験学習により,これらの課題を克服することを目指す。
    • KAPSOは,実験をブランチとして分離し,再現性と追跡可能性を確保する。
    • 多様な知識源を統合し,ワークフローや制約条件の検索を支援する。
    • 実験履歴から得られた教訓を記憶し,エラーの繰り返しを減らし,収束を加速する。

    Link: https://arxiv.org/abs/2601.21526

  • 予測精度と在庫KPIの連携:シミュレーションベースのソフトウェアフレームワーク [cs.IR, cs.AI, cs.SE]目的:予測精度と在庫KPIの関係性の評価
    • 自動車部品アフターマーケットでは,在庫管理が重要であり,高いサービス水準を維持しつつコストを削減する必要がある。
    • 既存の研究では,予測モデルの評価が予測精度の統計的指標に偏っており,実際の在庫管理への影響が不明確である。
    • 予測精度指標とKPIの間の関係を明確にし,実用的なモデル選択の指針を提供することを目指す。
    • シミュレーションにより,予測精度の向上とKPIの改善が必ずしも相関しないことが示された。
    • 類似した予測誤差プロファイルを持つモデルでも,コストとサービス水準のトレードオフが異なることが確認された。
    • 本フレームワークは,予測精度から運用上の関連性へと評価軸を移行させ,自動車部品アフターマーケットにおける在庫管理に貢献する。

    Link: https://arxiv.org/abs/2601.21844

  • 意味の罠:ファインチューニングされたLLMは脆弱性の根本原因を学習しているのか,それとも機能的なパターンを学習しているだけなのか [cs.CR, cs.SE]目的:ソフトウェア脆弱性検出におけるLLMの学習内容の解明
    • ソフトウェアの脆弱性検出は,現代社会における情報セキュリティを維持するために不可欠である。
    • LLMによる脆弱性検出は進歩しているものの,その判断根拠が曖昧であるという課題がある。
    • LLMが脆弱性の根本原因を理解しているか,表面的なパターンを学習しているかを明らかにすること。
    • ファインチューニングされたLLMは,機能ドメインと脆弱性の関連性を学習し,セキュリティの意味論的な理解に欠ける「意味の罠」に陥りやすい。
    • 提案された評価フレームワークTrapEvalにより,脆弱なコードと修正後のコードの区別が困難であることが示された。
    • 現在のファインチューニング手法では,LLMに真の脆弱性に関する推論能力を付与することが難しいことが明らかになった。

    Link: https://arxiv.org/abs/2601.22655

  • 検証可能なソフトウェアエンジニアリングのためのスケーラブルな多言語環境構築:MEnvAgent [cs.SE, cs.AI]目的:検証可能なタスクインスタンスのスケーラブルな生成
    • ソフトウェア開発の自動化には,多様な言語に対応した実行可能な環境が不可欠である。
    • 多様な言語に対応した実行環境の構築は複雑であり,検証可能なデータセットの不足が課題となっている。
    • 多言語環境の自動構築フレームワークによって,検証可能なタスクインスタンスを効率的に生成し,データセットの不足を解消する。
    • MEnvAgentは,計画・実行・検証アーキテクチャと環境再利用メカニズムにより,環境構築の失敗を自律的に解決する。
    • MEnvBenchを用いた評価により,MEnvAgentはベースラインを8.6%上回り,Fail-to-Pass率を改善し,時間コストを43%削減した。
    • MEnvAgentを用いてMEnvData-SWEを構築し,大規模な多言語の検証可能なDocker環境のデータセットを公開した。

    Link: https://arxiv.org/abs/2601.22859

  • スコット開集合の完全な有限型改良型システム [cs.LO]目的:無限データを取り扱う関数の入出力特性の証明
    • データ構造の安全性と信頼性を高める上で,プログラムの特性を形式的に検証することが重要である。
    • 無限データ構造を扱う型システムは,健全性と完全性を両立させるのが難しい。
    • スコット開集合を特徴づける有限型の改良型システムを構築し,その検証能力を高める。
    • 本研究では,アブラムスキーの論理形式におけるドメイン理論に基づき,再帰型を解釈するスコットドメインがスペクトル空間であるという事実を利用した。
    • スコット開集合とコンパクト飽和集合の間の双対性が論理的極性として反映され,正の式は最小固定点を許容しスコット開集合を定義する。
    • 実現可能性の含意を用いることで,関数型における正の式として非自明な入出力特性を定式化することが可能となった。

    Link: https://arxiv.org/abs/2601.23082

  • ワンショット領域における多者間純度蒸留と計器シミュレーション [quant-ph, cs.IT, math.IT]目的:多者間純度蒸留の実現
    • 量子情報における情報処理の安全性確保は重要である。
    • 多者間での純度蒸留の効率的な実現が課題であった。
    • ワンショット領域での多者間純度蒸留の限界を明確化する。
    • 3者間の純度蒸留プロトコルを設計し,性能を分析した。
    • 導出された内部限界は既知の漸近的な内部限界を一般化する。
    • ワンショット計器シミュレーション問題に対する内部限界を得た。

    Link: https://arxiv.org/abs/2109.12586

  • 球内における空間スペクトル局所化 – スペクトル形状の影響に関する研究 [math.CO, cs.DM, math.SP, math.FA, cs.IT, math.IT]目的:球内における空間スペクトル局所化問題に関する研究
    • 地球物理学や医用画像処理など,様々な逆問題において,信号の空間的・周波数的特性の理解が重要である。
    • 球体のような形状では,標準的な帯域幅の定義が存在せず,適切な帯域幅の設定が課題となっている。
    • スペクトル形状が空間スペクトル局所化問題の固有値分布に与える影響を明らかにすることで,より適切な帯域幅の選択を支援する。
    • 球面調和関数とヤコビ多項式を用いることで,球の空間スペクトル局所化問題を解析的に扱う手法を確立した。
    • スペクトル形状の定義方法(全体の多項式次数,球面・半径方向の極限)に応じて,固有値分布の漸近的性質を明らかにした。
    • スペクトル形状とゼルニケ多項式のインデックススキームとの直接的な関係を示し,応用への示唆を得た。

    Link: https://arxiv.org/abs/2308.03543

  • ピンチングアンテナシステム(PASS)のための同時送信とピンチングビームフォーミング:最適化ベースか学習ベースか [eess.SP, cs.IT, cs.LG, math.IT]目的:ピンチングアンテナシステム(PASS)を用いた下り多重入出力シングル出力(MISO)フレームワークの最適化
    • 電波の利用効率向上が求められる現代において,ビームフォーミング技術は重要な役割を担う。
    • 従来のMIMOシステムでは,アンテナ数が増加するとコストや複雑性が増大する課題がある。
    • ピンチングアンテナシステム(PASS)を利用し,低コストで高性能なビームフォーミングを実現する。
    • 提案するPASSフレームワークは,少数のピンチングアンテナでも従来のMIMOシステムを大きく上回る性能を示す。
    • KDL-Transformerアルゴリズムは,MM-PDDアルゴリズムと比較して20%以上のシステム性能向上を達成する。
    • KDL-Transformerは,最新のGPU上でミリ秒レベルの応答速度を実現する。

    Link: https://arxiv.org/abs/2502.08637

  • 核の経路:過パラメータ化された2層二次ネットワークにおけるERMの鋭い漸近的性質 [stat.ML, cond-mat.dis-nn, cs.IT, cs.LG, math.IT]目的:過パラメータ化された2層二次活性化関数を持つニューラルネットワークにおける経験的リスク最小化の漸近的性質
    • 深層学習の理論的理解は,その成功を支える重要な課題である。
    • 過パラメータ化されたニューラルネットワークの汎化性能の理論的解析は困難である。
    • 学習された特徴マップの低ランク構造に着目し,汎化閾値を精密化する。
    • 経験的リスク最小化問題を,核ノルム正則化を用いた凸行列センシング問題にマッピングすることで,鋭い漸近的性質を導出した。
    • そのようなネットワークにおける容量制御は,学習された特徴マップの低ランク構造から生じることが明らかになった。
    • ターゲット関数の幅が学習可能性をどのように決定するかを示す汎化閾値を正確に示した。

    Link: https://arxiv.org/abs/2505.17958

  • 高次元におけるシングルヘッドAttention:汎化,重みスペクトル,スケーリング則の理論 [stat.ML, cond-mat.dis-nn, cs.IT, cs.LG, math.IT]目的:高次元シーケンスタスクにおけるシングルヘッドAttention層の学習と汎化に関する理論的解明
    • 近年,Transformerモデルが自然言語処理等の分野で目覚ましい成果を上げているため,その構成要素の理解が重要である。
    • Attention層の重みスペクトルには特異な構造が見られるものの,その起源と汎化への影響は未だ不明な点が多い。
    • Attention層の重みスペクトルと汎化性能の関係を理論的に明らかにし,スケーリング則の成立メカニズムを解明すること。
    • Attention層の重みスペクトル(低ランク崩壊,スペクトル外れ値など)は,学習データ生成モデルと密接に関連することが示された。
    • ランダム行列理論等のツールを用いて,学習・テスト誤差,閾値,およびキー・クエリ行列のスペクトルを高次元で厳密に特徴づけた。
    • パワーロースペクトルを持つターゲットに対しては,スペクトル回復を通じてスケーリング則が出現することが理論的に示された。

    Link: https://arxiv.org/abs/2509.24914

  • 重ね合わせと量子玉ねぎルーティングにおけるイソジェニーグラフ [quant-ph, cs.IT, math.IT]目的:量子玉ねぎルーティング(QOR)スキームの構築と安全性評価
    • 匿名通信はプライバシー保護に不可欠であり,現代社会において重要な課題である。
    • 量子暗号化では公開鍵暗号の利用が難しく,従来の玉ねぎルーティングの応用が困難である。
    • 複合乗法理論に基づくアベル群作用を利用し,量子環境下でも安全なQORを実現する。
    • 本研究では,各層に複合乗法理論由来のアベル理想類群作用を実装したQORスキームを提案した。
    • 近傍ノード間でのDiffie-Hellman鍵交換に加え,送信者と受信者間の「非局所」鍵交換を導入した。
    • イソジェニーグラフとボーズ・メスナー代数を用いることで,実装の指針と安全性評価を形式化した。

    Link: https://arxiv.org/abs/2510.01464

  • 条件数を超えた新たな量子線形システムアルゴリズムとその多変数多項式系への応用 [quant-ph, cs.DS]目的:多変数多項式系の解法を含む,線形システムの量子計算アルゴリズムの性能向上
    • 量子計算は,古典計算では困難な問題を解決する可能性を秘めており,様々な分野での応用が期待されている。
    • 既存の量子線形システムアルゴリズムは,条件数に依存するため,悪条件な問題に対しては計算時間が長くなるという課題がある。
    • 右辺ベクトルが線形システムの固有空間とどのように整合するかを考慮することで,アルゴリズムの効率を改善する。
    • 本研究で提案されたアルゴリズムは,拡張行列の疎性,逆精度,解のノルムに加え,右辺ベクトルの構造に依存する新たなパラメータによって計算時間が決定される。
    • 提案手法は,既存の左からの事前条件付けとは異なり,右からの再スケーリングを用いることで,線形システムの解法を効率化する。
    • このアルゴリズムと再スケーリングスキームを応用することで,既存の量子線形システムアルゴリズムでは解けなかった多変数多項式系を解くことが可能となる。

    Link: https://arxiv.org/abs/2510.05588

  • 移動性と遅延拡散を持つ無線チャネルにおける整形によるデータレートの向上 [eess.SP, cs.IT, math.IT]目的:無線通信におけるデータレート向上のための整形技術とLDPC符号化の組み合わせ
    • 5G等の次世代通信では,高速・大容量通信が求められており,効率的な符号化・変調技術が重要である。
    • セルエッジ付近では,通信環境が悪化し,データレートが低下しやすいという課題がある。
    • セルエッジにおける通信品質を向上させ,データレートを改善することを目的とする。
    • 整形技術を導入することで,4-QAM変調における送信レートを向上させることができた。
    • シミュレーション結果から,BER $10^{-3}$ で約4dBのゲインが確認された。
    • 5G規格のLDPC符号と組み合わせることで,データレートを約20%改善可能であることが示された。

    Link: https://arxiv.org/abs/2512.06494

  • 最大エントロピー遠隔サンプリングに対する拡張NLP境界 [math.OC, cs.IT, cs.LG, math.IT]目的:最大エントロピー遠隔サンプリング問題における上限の算出
    • 不確実性の下での情報抽出は,機械学習や統計的推論の根幹をなす重要な課題である。
    • 既存の上限算出手法は,計算量が多く,大規模問題への適用が困難であった。
    • より厳密かつ効率的な上限算出手法を開発し,問題解決の精度向上を目指す。
    • 拡張NLP境界は,既存のNLP境界を厳密に上回る条件が理論的に示された。
    • ランク落ちした共分散行列に対しても上限を導出可能であり,適用範囲が拡大された。
    • 対角スケーリング技術と組み合わせることで,ベンチマーク問題において最先端の結果を達成した。

    Link: https://arxiv.org/abs/2601.20970

  • 核融合発電プラントのコスト算出フレームワーク [physics.soc-ph, cs.SE]目的:核融合発電プラントのコスト算出手法の確立
    • エネルギー問題解決のため,実用的な核融合発電の実現が重要視されている。
    • 核融合発電プラントのコスト評価は複雑であり,標準化された手法が求められていた。
    • 核融合発電プラントのコストを詳細かつ透明性高く算出できるフレームワークを構築する。
    • 2017年から2024年にかけて行われたARPA-E支援によるコスト算出作業をまとめ,分析フレームワークの進化を記録した。
    • 初期のコストスケーリング手法から,国際原子力機関(IAEA)の基準に準拠した監査可能なコスト算出能力へと発展した。
    • 開発された手法は,オープンソースのPythonフレームワーク(pyFECONs)として公開され,コスト算出の透明性を高めている。

    Link: https://arxiv.org/abs/2601.21724