arXiv雑要約

プログラム - 2026/02/05 公開

  • 幾何学的情報ボトルネック:統計多様体圧縮によるアプローチ [cs.LG, cs.AI, cs.IT, math.IT, stat.ML]目的:情報ボトルネック問題における情報圧縮の制御と最適化
    • 深層学習において,特徴表現の学習と汎化性能の向上には,情報量の制御が重要である。
    • 従来のIBの実装では,MIの直接的な制御が難しく,近似や推定誤差の影響を受けやすい。
    • 情報幾何学の視点からIB問題を再検討し,MI推定を用いない新たな手法を提案することで,安定した最適化を目指す。
    • 提案手法GeoIBは,予測精度と圧縮率のトレードオフにおいて,既存のIBベースラインよりも優れた性能を示した。
    • 分布レベルのFisher-Rao不一致と,幾何レベルのJacobian-Frobenius項により,効果的な情報圧縮を達成する。
    • 自然勾配最適化器を導出し,その有効性を理論的,実験的に検証した。

    Link: https://arxiv.org/abs/2602.03906

  • 意味レート歪みと事後設計:計算制約,多峰性,戦略的推論 [cs.IT, cs.AI, cs.LG, math.IT]目的:意味圧縮における戦略的ガウス最適化
    • AIの効率化には,データ量と計算資源の制約下での情報伝達の理解が不可欠である。
    • 従来のレート歪み理論では,計算資源の制約や多峰性データへの対応が十分ではない。
    • 計算資源と情報伝達レートの制約下における最適な意味圧縮戦略を確立すること。
    • レート歪み関数を解析的に導出し,計算制約下での水張り法やガウス最適解を提示した。
    • 計算資源の制約が暗黙的なレート制約として機能し,モデルの深さと推論時間によって意味精度が指数関数的に向上することを示した。
    • 多峰性データを用いることで,遠隔符号化における幾何平均ペナルティを解消できることを示した。

    Link: https://arxiv.org/abs/2602.03949

  • 頂点を短いパスに近似的に分割 [eess.SY, cs.RO, cs.SY, cs.DS]目的:頂点分離パスの最小集合
    • グラフ理論は,ネットワーク設計やスケジューリングなど,様々な応用分野で重要である。
    • グラフの頂点を,指定された長さのパスに分割する問題は,NP困難であり,効率的なアルゴリズムが求められている。
    • この研究では,指定された長さのパスでグラフの頂点を近似的に分割するためのアルゴリズムを提案する。
    • 正の整数kと単純な無向グラフGが与えられたとき,頂点分離パスの最小集合を求める問題を扱う。
    • kが9または10の場合,(k+4)/5の近似アルゴリズムを提案し,kが11以上の場合は,より改善された近似アルゴリズムを提案する。
    • 提案アルゴリズムは,kが9から18までの範囲で,現在の最高近似比を達成する。

    Link: https://arxiv.org/abs/2602.03991

  • オープンソースソフトウェアエコシステムの説明責任:ワークショップ報告 [cs.HC, cs.SE, cs.HC]目的:オープンソースソフトウェアエコシステムにおける説明責任の役割
    • オープンソースは現代社会の基盤であり,その健全な発展は不可欠である。
    • 多様な利害関係者の存在により,説明責任の所在が不明確になりがちである。
    • オープンソースコミュニティにおける説明責任のあり方を探求し,今後の研究課題を特定すること。
    • ワークショップでは,非営利団体,貢献者,利用者,企業など,多様な関係者が集まり議論が行われた。
    • 議論の結果,オープンソースコミュニティが関係者を特定し,ニーズを理解し,説明責任を果たす方法について重要な課題が浮き彫りになった。
    • 本ワークショップは,オープンソースソフトウェアエコシステムにおける説明責任に関する研究アジェンダ策定と実務者へのエンゲージメント促進に貢献する。

    Link: https://arxiv.org/abs/2602.04026

  • ベイジアンネットワークと証明網:ベイジアン推論の証明論 [cs.LO]目的:ベイジアンネットワークと線形論理における証明の図式的表現との対応
    • 確率推論は,不確実性下での意思決定において不可欠であり,多くの分野で応用されている。
    • 従来のベイジアン推論のアプローチでは,複雑なモデルの効率的な表現が課題となっている。
    • 本研究は,証明論的アプローチを通して,ベイジアン推論の効率的かつ構成的な方法を開発する。
    • ベイジアンネットワークと線形論理の証明網との間に,密接な対応関係が存在することが示された。
    • グラフの分解が証明木や型導出よりも柔軟であるという利点を活かすことで,構成性の問題を克服した。
    • 本研究は,ベイジアン推論に対する新しい理論的基盤を提供し,計算効率の向上に貢献する。

    Link: https://arxiv.org/abs/2602.04045

  • 加重ランダムサンプリングによるサブ線形時間でのメイクスパン最小化 [eess.SY, cs.RO, cs.SY, cs.RO, cs.SY, eess.SY, cs.DS]目的:メイクスパン最小化問題に対する近似解法の開発
    • スケジューリングは,計算資源の効率的な利用に不可欠であり,様々な分野で重要な課題である。
    • 大規模なジョブ数に対して,最適解を求める計算時間が膨大になることが課題である。
    • 未知のジョブ数に対しても効率的に近似解を求める手法を確立することが目的である。
    • 加重ランダムサンプリングを用いた2つのサブ線形時間近似スキームを開発した。
    • いずれのアルゴリズムも,最適なメイクスパンに対して$(1+3\epsilon)$-近似解を提供する。
    • スケッチスケジュールも生成し,実装では$O(\log n)$の一様乱数サンプルで加重乱数サンプルを生成する。

    Link: https://arxiv.org/abs/2602.04059

  • Simulink-Stateflow変異体生成における大規模言語モデルの可能性探求 [cs.CY, cs.SE]目的:Simulink-Stateflowモデルに対する高品質な変異体の生成
    • サイバーフィジカルシステムにおいて,安全性確保のためにはテストの網羅性が重要である。
    • 従来の変異分析では,冗長,同値,非実行可能な変異体が多く生成される問題がある。
    • 大規模言語モデルを活用し,Simulink-Stateflowモデルにおける変異体生成の効率性と品質を向上させる。
    • 大規模言語モデルは,従来の変異体生成手法と比較して,最大13倍速く変異体を生成した。
    • 生成された変異体は,同値変異体や重複変異体が大幅に少なく,品質が向上した。
    • Few-shotプロンプティングと低温~中程度の温度設定が最適な結果をもたらすことが示された。

    Link: https://arxiv.org/abs/2602.04066

  • QuadRank:高スループットランクの設計 [cs.DS]目的:テキスト中の文字の出現回数を高速に数えるためのデータ構造
    • バイオインフォマティクス分野において,大規模データの高速処理は重要な課題である。
    • 既存のデータ構造は,スループットやメモリ使用量において改善の余地があった。
    • キャッシュミスを減らし,複数のスレッドによる並列処理を効率的に行うデータ構造を開発する。
    • BiRankとQuadRankは,類似のオーバーヘッドを持つ既存手法と比較して,それぞれ約1.5倍と2倍の高速化を実現した。
    • prefetching(事前読み込み)を適用することで,さらに2倍の高速化が可能となり,DDR4 RAMの帯域幅がボトルネックとなる。
    • QuadRankを用いたFM-index(QuadFm)は,既存の最先端実装Genedexと比較して,サイズを小さくしつつ最大4倍の高速化を達成した。

    Link: https://arxiv.org/abs/2602.04103

  • 教師あり学習を損失圧縮として:有限ブロック長解析による汎化性能とサンプル複雑性の特徴づけ [cs.LG, cs.IT, math.IT]目的:機械学習における汎化性能とサンプル複雑性の特徴づけ
    • 機械学習の性能向上には,汎化性能の理論的理解が不可欠である。
    • 既存の手法では,過学習と誘導バイアスの不一致を分離して評価することが困難であった。
    • 有限ブロック長解析を用いて,汎化誤差とサンプル複雑性に関する新たな下限を導出すること。
    • 本研究では,学習問題を損失圧縮の文脈で捉え,教師あり学習を新たな視点から分析した。
    • 過学習の度合いと誘導バイアスとタスクの不一致を分離し,既存の枠組みよりも詳細な分析を可能にした。
    • 過学習項の情報理論的な尺度や安定性理論との関連性を示し,これらの理論的枠組みを統合した。

    Link: https://arxiv.org/abs/2602.04107

  • エッジAIシステムのためのスケーラブルな説明可能性サービス (XaaS) [cs.LG, cs.AI, cs.DC, cs.SE]目的:エッジAIシステムにおける説明可能性の提供
    • AIの社会実装が進む中で,AIの判断根拠を説明する重要性が高まっている。
    • 既存手法では,推論と説明を同時に行うため,計算量や遅延が大きく,スケーラビリティに課題がある。
    • 推論と説明を分離し,分散的に説明可能性を提供するアーキテクチャを構築することで,効率性とスケーラビリティを高める。
    • XaaSは,説明可能性を独立したシステムサービスとして扱うことで,エッジデバイスの負荷を軽減し,遅延を低減する。
    • 提案手法では,意味的類似度に基づく説明キャッシュや軽量な検証プロトコルにより,計算冗長性を削減し,説明の信頼性を確保する。
    • 実世界での評価により,XaaSはレイテンシを38%削減し,高い説明品質を維持することが示された。

    Link: https://arxiv.org/abs/2602.04120

  • 信じられないほど有効な脆弱性攻撃ではない [cs.ET, stat.AP, stat.CO, stat.OT, cs.SE]目的:Javaのセキュリティ脆弱性に対するPoC(概念実証)攻撃生成とその妥当性検証
    • LLMはセキュリティ脆弱性検出に活用されており,その重要性は増している。
    • LLMによるPoC攻撃生成の成功率は,検証方法によっては過大評価される可能性がある。
    • 静的解析ツールによるガイダンスがPoC生成の成功率向上に貢献するか検証する。
    • PoC-Gymを用いて実験した結果,静的解析によるガイダンスは,既存手法(FaultLine)と比較して21%高い成功率を示した。
    • しかし,生成されたPoCの71.5%は無効であり,既存の検証メカニズムでは検出が困難である。
    • LLMによるPoC攻撃生成の成功率の報告は,誤解を招く可能性があり,注意が必要である。

    Link: https://arxiv.org/abs/2602.04165

  • SOGPTSpotter:Stack OverflowにおけるChatGPT生成回答の検出 [cs.SE]目的:Stack OverflowにおけるChatGPT生成回答の検出手法
    • Stack Overflowは技術者にとって重要な知識共有プラットフォームであるため,情報の信頼性が不可欠である。
    • ChatGPTによる回答の増加は,誤った情報が拡散するリスクを高めている。
    • ChatGPT生成回答を正確に識別し,Stack Overflowの信頼性を維持すること。
    • 提案手法SOGPTSpotterは,既存の検出手法(GPTZero等)を凌駕する性能を示すことが確認された。
    • Triplet lossとBigBirdモデルを活用したSiamese Neural Networkが,ChatGPT生成回答の識別において有効であることが示された。
    • 実世界での事例研究により,SOGPTSpotterがStack Overflowのモデレーターによる不適切な回答の削除に貢献することが示された。

    Link: https://arxiv.org/abs/2602.04185

  • セマンティックコンセンサスデコーディング:Verilogコード生成に対するバックドア防御 [cs.SE, cs.CR]目的:Verilogコード生成におけるバックドア攻撃に対する防御策
    • ハードウェア設計においてLLMの利用が増加しており,セキュリティ確保が重要である。
    • バックドア攻撃により脆弱なハードウェアが生成される可能性があり,修正が困難である。
    • 非機能要件に着目し,推論時にバックドア攻撃を検出し抑制する手法を提案する。
    • 提案手法であるセマンティックコンセンサスデコーディング(SCD)は,攻撃成功率を大幅に低下させた。
    • SCDは,ユーザー仕様と抽出された機能要件に基づいて出力分布を融合することで,攻撃を抑制する。
    • 生成品質への影響は軽微であり,実用的な防御策となりうる。

    Link: https://arxiv.org/abs/2602.04195

  • エージェント型プルリクエストが拒否される理由:コーディングエージェントの比較研究 [cs.IR, cs.SE]目的:コーディングエージェントによって生成されたプルリクエストの拒否理由の比較
    • ソフトウェア開発における自動化の重要性が増しており,特にAIエージェントの活用が注目されている。
    • AIエージェント生成プルリクエストは,人間生成プルリクエストに比べて承認率が低いという課題がある。
    • 異なるエージェントの拒否理由の違いを特定し,AIエージェント活用の改善に貢献すること。
    • AI生成プルリクエスト特有の拒否理由として,AI生成コードへの不信感が挙げられた。
    • エージェントごとに異なる拒否パターンが見られ,設定や利用方法の違いが影響していることが示唆された。
    • レビューフィードバックがない拒否理由の割合が高く,それを軽減するヒューリスティクスが提案された。

    Link: https://arxiv.org/abs/2602.04226

  • ProxyWar:ゲーム環境におけるLLMコード生成の動的評価 [cs.SE, cs.AI]目的:LLMコード生成の品質評価
    • LLMは自動コード生成を革新したが,実用的な有効性の評価は限定的である。
    • 従来の評価は静的なベンチマークに依存し,プログラムの動作特性を捉えられていない。
    • 動的な環境下での性能評価を通じて,LLMコード生成の限界と改善点を探る。
    • ProxyWarは,LLM生成エージェントを競争的なゲーム環境に組み込むことでコード品質を評価する。
    • ベンチマークスコアと実際のパフォーマンスに乖離が見られ,LLMの限界が明らかになった。
    • 本フレームワークは,LLM駆動のアルゴリズム発見や適応的な問題解決研究の基盤となる。

    Link: https://arxiv.org/abs/2602.04296

  • 彼女は「ミス」,彼は「教授」と呼ばれる:IT/SE教育における女性ティーチングサポートスタッフの経験 [cs.RO, cs.CY, cs.SE]目的:IT/SE教育における女性ティーチングサポートスタッフの経験
    • 計算機教育において,ティーチングサポートスタッフの役割は重要であり,学生の学習に不可欠である。
    • 女性ティーチングサポートスタッフの貢献が認識されにくく,過小評価されるという問題が存在する。
    • ティーチングサポートスタッフの職務における権力構造を明らかにし,インクルーシブな教育環境の構築を目指す。
    • 女性ティーチングサポートスタッフ15名の経験から,権威の獲得,抵抗,維持のダイナミクスが明らかになった。
    • 非ネイティブ,有色人種,若年層,非正規雇用,キャリア初期のスタッフほど,より多くの労力を要することが示された。
    • 大学の教育モデルや多様性への取り組みを考慮し,インクルーシブな環境構築のための提言がなされている。

    Link: https://arxiv.org/abs/2602.04332

  • 大規模なレガシーシステム近代化におけるモデル駆動アプローチ [cs.SE]目的:レガシーシステム近代化のためのモデル駆動アプローチ
    • レガシーシステムは企業の核となる機能を担う一方で,維持・拡張が困難になっている
    • レガシーシステムの近代化は,コストとリスクが高く,熟練エンジニアの不足も課題である
    • モデル駆動アプローチを用いて,リスクとコストを抑えつつ,レガシーシステムの近代化を可能にする
    • モデル駆動プロセスにより,レガシーコードベースと最新ターゲットプラットフォーム間に技術に依存しない中間モデルを挿入した
    • ユーザーインターフェースコンポーネントやページ構造を,機能と非機能品質を維持しつつ,半自動で最新のウェブスタックへ移行できた
    • アーキテクチャ知識を明示的なモデル表現に統合することで,コードの保守性と拡張性が向上し,開発者体験が改善された

    Link: https://arxiv.org/abs/2602.04341

  • システム工学における生成AI:大規模言語モデルのリスク評価フレームワーク [cs.SE]目的:大規模言語モデルのリスク評価
    • システム工学は,複雑なシステムの開発において信頼性と安全性を確保する上で不可欠である。
    • 大規模言語モデルの活用は進むものの,リスク評価の不備から導入が遅れている。
    • システム工学における大規模言語モデルの安全な導入と運用を支援する。
    • 本研究では,大規模言語モデルのリスク評価フレームワーク(LRF)を提案した。
    • LRFは,自律性と影響度という2つの軸に基づき,リスクレベルを体系的に評価する。
    • LRFは,リスクに応じた検証戦略や対策の策定を支援し,AI技術と工学原則の整合性を高める。

    Link: https://arxiv.org/abs/2602.04358

  • デジタルツインとZeroConf AI:産業応用向け自動知能パイプラインの構造化 [cs.AI, cs.SE]目的:産業応用における自動知能パイプラインの構造化
    • サイバーフィジカルシステムは産業の高度化に不可欠だが,その複雑さが増している。
    • IoT/IIoT技術の断片化が,低レベル層と高レベル知能機能間のギャップを大きくしている。
    • デジタルツインを活用し,AIパイプラインの構成を容易にすることで,その課題を解決する。
    • デジタルツインがデータ管理と知能拡張をオーケストレーションすることで,AIパイプラインのシームレスな統合を実現した。
    • ZeroConf AIパイプラインにより,AI機能の再利用性と拡張性が向上し,構成が簡素化された。
    • MicroFactory環境での実証実験により,動的なデータ処理と並行MLモデルのサポートが確認された。

    Link: https://arxiv.org/abs/2602.04385

  • 近似行列乗算のための改善された疎回復法 [cs.DS]目的:近似行列乗算の誤差の縮小
    • 大規模行列演算は機械学習やデータ分析の基盤であり,効率化が不可欠である。
    • 既存の近似行列乗算法は,計算時間と精度のトレードオフが課題となっていた。
    • 出力ノルムに依存する誤差を持つ,より高速かつ高精度な近似行列乗算アルゴリズムを開発する。
    • 提案手法は,既存のTensorSketchアルゴリズムよりも計算時間が対数因子だけ高速である。
    • 入力行列の擬似乱数回転による新しい手法により,出力行列のフロベニウスノルムを均一に再分配する。
    • アルゴリズムは,バイアス付きおよびバイアスなしの推定の両方を計算可能である。

    Link: https://arxiv.org/abs/2602.04386

  • SPEAR:スマートコントラクト監査のためのマルチエージェント連携の事例研究 [cs.MA, cs.AI, cs.DC, cs.ET, cs.SE]目的:スマートコントラクト監査におけるマルチエージェント連携フレームワーク
    • ブロックチェーン技術の普及に伴い,スマートコントラクトの安全性確保が不可欠となっている。
    • 従来のスマートコントラクト監査は,手動またはパイプライン方式であり,効率性と柔軟性に課題がある。
    • エージェント連携による監査プロセスの自動化と,脆弱性発見時の迅速な復旧を目指す。
    • SPEARは,リスクを考慮したヒューリスティックを用いて監査対象の優先順位付けを行う計画エージェントを備えている。
    • タスクの割り当てにはContract Netプロトコルが用いられ,生成された成果物の脆弱性に対してはプログラムによる自動修復が行われる。
    • 実験の結果,SPEARは連携,復旧,リソース利用の面で,集中型およびパイプライン方式よりも優れていることが示された。

    Link: https://arxiv.org/abs/2602.04418

  • AgenticAKM:エージェント型アーキテクチャ知識管理へ [cs.SE]目的:ソフトウェアアーキテクチャ知識の管理
    • ソフトウェア開発において,アーキテクチャ知識は品質と保守性に不可欠である。
    • 手作業による知識管理は負担が大きく,開発者への普及が進んでいない。
    • LLMを活用し,分散した知識を効率的に管理・文書化することを目指す。
    • エージェント型AKM(AgenticAKM)は,複雑なアーキテクチャの抽出・記録を複数のエージェントに分割し,協調してアーキテクチャ知識を生成する。
    • コードリポジトリからArchitecture Decision Records(ADR)を生成する実験を行い,その有効性を検証した。
    • 29のリポジトリを用いたユーザースタディの結果,生成されたADRの品質が向上し,AKMの自動化に有望であることが示された。

    Link: https://arxiv.org/abs/2602.04445

  • ベンチマークに何が含まれるか:自動プログラム修理におけるSWE-Benchの場合 [cs.SE]目的:SWE-Benchベンチマークにおけるリーダーボードの現状分析
    • 自動プログラム修理はAI技術の進展により急速に進展しており,ソフトウェア品質の向上に貢献する。
    • ベンチマークにおける提出者の偏りや使用LLMの非公開性が,研究の透明性と多様性を阻害する可能性がある。
    • SWE-Benchエコシステムの現状を明らかにし,透明性と多様性の向上に資する情報を提供する。
    • SWE-Benchのリーダーボードへの提出の多くは産業界,特に小規模企業や大手企業からのものであることが判明した。
    • トップの結果は産業界の提出によることが多いが,オープンソースの学術的な貢献も競争力を持つ。
    • ClaudeファミリーのLLM,特にClaude 4 Sonnetが両リーダーボードで最先端の結果を達成しており,その優位性が示された。

    Link: https://arxiv.org/abs/2602.04449

  • 悪い三角形横断に対する単純な2近似と関連問題の困難性に関する結果 [cs.DS]目的:悪い三角形横断問題における近似解の提案と,関連問題の近似困難性の証明
    • グラフ理論はネットワーク分析や組合せ最適化など,様々な分野に応用されており重要である。
    • 悪い三角形横断問題はNP困難であり,効率的な解法が求められている。
    • 既存の近似アルゴリズムの簡素化と高速化,およびより良い近似比の達成を目指す。
    • 本研究では,悪い三角形横断問題に対する単純かつ高速な2近似アルゴリズムを提案した。
    • 提案アルゴリズムは,重み付き問題や,悪い三角形被覆LPの近似解に対しても有効である。
    • 完全グラフにおける悪い三角形横断問題の近似困難性を示し,関連問題への示唆も得られた。

    Link: https://arxiv.org/abs/2602.04463

  • アジャイルソフトウェア開発における成功要因のフレームワーク [cs.SE]目的:アジャイルソフトウェア開発の成功要因
    • ソフトウェア開発の現場では,変化への対応力が重要視されており,アジャイル開発はその代表的な手法である。
    • アジャイル開発の導入は進んでいるものの,プロジェクトの成功は必ずしも保証されているとは言えない現状がある。
    • 本研究は,アジャイルプロジェクトの成功に不可欠な要因を特定し,それらの関係性を明確にすることを目的とする。
    • 本研究により,アジャイルプロジェクトにおける21の成功要因が抽出され,組織,人材,技術,プロセス,プロジェクトの5つのテーマに分類された。
    • 特に,チームの有効性とプロジェクト管理が重要な成功要因として頻繁に言及されており,人材とプロセスの重要性が示唆された。
    • 抽出された要因に基づき,プロジェクト成功に寄与する要因の関係性を示す理論的フレームワークが構築された。

    Link: https://arxiv.org/abs/2602.04467

  • 潜在的真理生成のための意図的意味論 [cs.HC, cs.HC, cs.CL, cs.HC, cs.RO, cs.LO, math.LO]目的:潜在的真理生成のための意味論的枠組み
    • 真理生成は,論理学や哲学における根源的な問題であり,知識や信念の基盤を理解する上で重要である。
    • 従来の真理生成理論は,仮説的な推論と非仮説的な推論の区別を明確に扱えていないという課題があった。
    • 意図的状態という概念を用いて,この問題を解決し,より洗練された真理生成の理論を構築することを試みる。
    • 意図的状態に基づいた意味論的枠組みを構築し,古典論理と直観主義論理の両方に対応できることを示した。
    • この枠組みは,真理生成の拡張関係を自然に表現し,Linneboの潜在的意味論の公理を満たすことを示した。
    • 非仮説的論理がペーノ算術上で決定可能であるという仮説を提示し,その根拠となる証明探索手続きを提案した。

    Link: https://arxiv.org/abs/2602.04488

  • 高度に圧縮された文字列に対する不整合性に基づいたアクセス [cs.CL, cs.ET, cs.RO, cs.DS]目的:高度に圧縮された文字列の部分文字列への高速アクセス
    • データ圧縮は,効率的なデータ保存と伝送に不可欠であり,計算資源の節約に繋がる。
    • 圧縮率が高いほど,特定の文字へのランダムアクセスは困難になるというトレードオフが存在する。
    • 不整合な文字に着目し,高速なアクセスを実現することで,この課題を克服することを目指す。
    • 最長繰り返し部分文字列の長さに対して対数時間で文字にアクセスできるデータ構造を構築できる。
    • 特に,周囲の文字と比べて不整合な文字ほど,高速なアクセスが可能となる。
    • フレーズ間の重複が少ない解析に対しても,同様の強力な結果が得られた。

    Link: https://arxiv.org/abs/2602.04523

  • ソフトウェアエンジニアリングエージェントのための構造化,状態認識,実行に基づいた推論 [cs.SE, cs.AI]目的:ソフトウェアエンジニアリングエージェントの推論能力の向上
    • ソフトウェア開発の効率化と品質向上に貢献するエージェント技術の重要性が高まっている。
    • 既存のエージェントは反応型であり,長期的な推論や状況への適応が困難である。
    • 構造化,状態認識,実行に基づいた推論により,より一貫性のある信頼性の高い推論を実現する。
    • 現在のソフトウェアエンジニアリングエージェントは,会話履歴と最新の応答に依存する反応的な設計である。
    • 本研究では,明示的な構造,永続的な状態,実行に基づくフィードバックの統合が,長期的なタスクにおいてより優れた推論を可能にすると論じる。
    • 次世代のエージェント開発に向けた初期的なロードマップを提示し,実世界のタスクにおける有効性を高めることを目指す。

    Link: https://arxiv.org/abs/2602.04640

  • 全パス到達可能性解析のための抽象的枠組み [cs.LO]目的:全パス到達可能性述語の抽象的枠組みの再検討と拡張
    • プログラムの信頼性確保には,安全性だけでなく活性性の検証も不可欠である。
    • 抽象的還元システムと論理的に制約された項書き換えシステムにおける到達可能性解析の手法に差異が存在する。
    • 安全性と活性性の両方の検証に適用可能な統一的な全パス到達可能性解析枠組みを確立すること。
    • 全パス到達可能性述語の抽象的枠組みを再構築し,抽象的還元システムと論理的に制約された項書き換えシステムにおける推論規則の一対一対応を実現した。
    • 全パス到達可能性解析を安全性検証に応用する方法を示し,その有効性を確認した。
    • 活性性検証のために「完全な有効性」という新たな概念を導入し,有限かつ無限の実行パスでの目標セットへの到達を保証する条件を提示した。

    Link: https://arxiv.org/abs/2602.04641

  • 針は糸なり:ノイズの多いプロセスツリーにおける埋め込まれた経路の発見 [cs.CL, cs.CY, cs.SI, cs.CR, cs.DS]目的:ノイズの多いプロセスツリーにおける埋め込まれた経路の発見
    • サイバーセキュリティ分野において,マルウェア関連イベントのシーケンス特定は重要な課題である。
    • 大量のログデータの中から,意味のあるイベントシーケンスを見つけることは困難である。
    • この研究は,ノイズの多いデータにおけるイベントシーケンスの検出を可能にすることを目的とする。
    • 提案アルゴリズムは,2つのツリー間のファジーマッチングを可能にする。
    • 合成データと実際のACMEサイバーセキュリティデータセットにおいて有効性が確認された。
    • 本アルゴリズムは,より複雑なワークフローの構成要素として利用できる。

    Link: https://arxiv.org/abs/2602.04694

  • エージェントAIによるソフトウェアエンジニアリング支援:ドキュメント検索とテストシナリオ生成のデモンストレーション [cs.SE, cs.AI]目的:ソフトウェアエンジニアリングタスクの支援
    • ソフトウェア開発の効率化と品質向上が常に求められているため。
    • 要求仕様からテストシナリオの自動生成は,手作業による負担が大きく,効率が悪い。
    • エージェントAIを用いて,これらのタスクを自動化し,開発効率の向上を目指す。
    • 詳細な要求仕様からテストシナリオを自動生成するエージェントAIソリューションを開発した。
    • ソフトウェアエンジニアリングドキュメントの検索,質問応答,変更追跡,要約を行うエージェントAIソリューションを開発した。
    • 各ユースケースに特化したLLMベースのエージェントが,関連するサブタスクをすべて実行する。

    Link: https://arxiv.org/abs/2602.04726

  • SV-COMP向けリアリスティックなJavaベンチマークのARG-Vによる生成の検証 [cs.SE]目的:SV-COMPにおけるソフトウェア検証ツール評価のためのJavaベンチマーク
    • ソフトウェア検証技術の進歩は,信頼性の高いソフトウェア開発に不可欠である。
    • 既存のベンチマークだけでは,現実世界のソフトウェアの多様性を網羅できない場合がある。
    • 新たなベンチマークが検証ツールの挙動に影響を与えるかを評価し,妥当性を担保すること。
    • ARG-Vツールを用いて生成した68個のJavaベンチマークにおいて,主要な4つの検証ツール全てで精度と再現率が低下した。
    • この結果は,ARG-Vが検証ツール評価の包括性と現実性を向上させる可能性を示唆している。
    • また,現実世界のソフトウェアへの適用性を高めるための検証ツール開発の指針を提供する。

    Link: https://arxiv.org/abs/2602.04786

  • 制御方程式を超えて:ロボット制御ソフトウェアの実装品質に関する事例研究 [cs.SE, cs.RO]目的:ロボット制御ソフトウェアの実装品質の調査
    • ロボットシステムの安全性と信頼性は,制御ソフトウェアの実装品質に大きく依存する。
    • 理論的な保証が,実際のソフトウェア実装において必ずしも維持されない場合がある。
    • ロボット制御ソフトウェアの実装における問題点を特定し,改善策の必要性を示す。
    • オープンソースのロボットソフトウェアにおける184の実装事例を調査した結果,離散化処理が場当たり的に行われていることが多いことが判明した。
    • タイミングの不整合,エラー処理の不備,リアルタイム制約の考慮不足など,実装上の課題が多数存在することが明らかになった。
    • テストは表面的なものであり,理論的保証の体系的な検証が行われていないため,期待される動作と実際の動作にずれが生じる可能性がある。

    Link: https://arxiv.org/abs/2602.04799

  • 動的なセル負荷を用いた共同スリープモード活性化と負荷分散:複合バンディットアプローチ [cs.IT, math.IT]目的:gNode-B小セルにおけるスリープモードの機会的トリガーと,それに基づくセルレンジ拡張による負荷分散
    • モバイル通信におけるエネルギー効率改善は,ネットワーク運用コスト削減と環境負荷軽減に不可欠である。
    • 小セルを停止すると自セルの消費電力は減るが,近隣セルへの負荷集中を引き起こし,システム全体の効率を損なう可能性がある。
    • ユーザのQoS要件を維持しつつ,動的なセル負荷を考慮してスリープモードを最適化することで,エネルギー効率を向上させる。
    • 提案手法は,既存の単純な戦略や他の最先端の強化学習ソリューションと比較して,パフォーマンスが優れていることが実験的に示された。
    • 本アルゴリズムは,O-RAN近リアルタイムRANインテリジェントコントローラ(RIC)xAppsとして実装可能である。
    • 動的なセル負荷を正確にモデル化することにより,スリープモード活性化による全体的なエネルギー効率への影響を考慮した負荷分散を実現している。

    Link: https://arxiv.org/abs/2602.04808

  • ベクトル値計算のためのコーディングゲーム [cs.IT, math.IT]目的:ベクトル値計算におけるコーディングゲームの均衡戦略の定式化と特性評価
    • 分散型機械学習などの新興分野において,信頼を前提としない安全な計算が不可欠であるため。
    • 従来のコーディング理論は,正当なノード数が多いことを前提としており,多数派攻撃に脆弱であるという課題がある。
    • ベクトル値計算への拡張を通じて,正直な多数派を必要としない安全な分散計算の理論的基盤を確立すること。
    • 本研究は,ゲーム理論とコーディング理論の交差点に位置する「コーディングゲーム」の枠組みをN次元ユークリッド空間に拡張した。
    • ベクトル値計算に対する厳密な問題設定と均衡戦略を導き出し,スカラー計算における耐障害性がベクトル空間でも維持されることを示した。
    • これにより,正直な多数派を必要としない大規模分散コンピューティングの実現に向けた理論的根拠が確立された。

    Link: https://arxiv.org/abs/2602.04810

  • 開発者は型情報を読むか?TypeScriptに関する眼球運動研究 [cs.SE]目的:開発者による型情報の利用状況
    • 静的型付けは開発者の生産性向上に寄与し,ソフトウェア品質の向上に不可欠である。
    • 型アノテーションが実際にどのように読まれているか,その理解が深まっていない。
    • 型アノテーションがコード理解やバグ特定において,開発者によってどのように利用されているかを解明する。
    • 眼球運動実験の結果,型アノテーションの有無に関わらず,開発者の視線は型情報に集中しなかった。
    • コード概要把握やバグ特定タスクにおいて,型アノテーションの行を特に注視する傾向は見られなかった。
    • 型情報の提示方法改善や,型アノテーション利用に関する教育の重要性を示唆する。

    Link: https://arxiv.org/abs/2602.04824

  • コードが豊富になる時代:オーケストレーションと検証を中心としたソフトウェア工学の再定義 [cs.NI, cs.SE]目的:ソフトウェア工学の再定義
    • AIの進化とハードウェア制約により,ソフトウェア工学の役割が変化している。
    • 従来のコード構築中心のソフトウェア工学では,責任の所在が不明確になるリスクがある。
    • 意図の明確化,アーキテクチャ制御,体系的な検証を中心とした新たなソフトウェア工学を確立する。
    • ソフトウェア工学は,コード構築から人間の判断を中心とした分野へ再定義されるべきである。
    • AI自動化の進展下では,意図の表明と検証の重要性が増している。
    • 研究,実践,教育の各側面において,ソフトウェア工学の根本的な変革が求められる。

    Link: https://arxiv.org/abs/2602.04830

  • 線形方程式 Ax=b の行列ベクトル複雑性 [cs.HC, cs.DS, cs.NA, math.NA, math.OC]目的:線形方程式の近似解を得るための行列ベクトル積の回数の下限
    • 大規模線形方程式の解法において,行列ベクトル積は重要な演算であり,その効率性が求められている。
    • 既存の行列ベクトルアルゴリズムの理論的な限界が明確でなかった。
    • 行列ベクトルアルゴリズムの限界を厳密に示し,既存のアルゴリズムの最適性を検証すること。
    • 行列と転置行列との積が可能なアルゴリズムに対し,条件数κ,精度εにおいて,Ω(κ log(1/ε))回の行列ベクトル積が必要であることが示された。
    • 転置行列へのアクセスがない片側アルゴリズムの場合,n×n線形方程式の解法にはn回の行列ベクトル積が必要であることが示された。
    • これらの結果は,行列ベクトルアルゴリズムの限界を明確にし,広く利用されているKrylov部分空間法の最適性を裏付けている。

    Link: https://arxiv.org/abs/2602.04842

  • CSLib:精緻な計算機科学ライブラリ [cs.LO, cs.PL]目的:計算機科学に関連する定理の証明と,Lean証明アシスタントによる形式検証済みコードの記述のためのオープンソースフレームワーク
    • 形式検証は,ソフトウェアやハードウェアの信頼性を高める上で不可欠であり,その重要性は増している。
    • Leanにおける計算機科学の知識ベースは限られており,実用的な検証プロジェクトへの応用が困難である。
    • CSLibは,この知識ベースを大幅に拡張し,形式検証プロジェクトにおける利用を促進することを目的とする。
    • CSLibは,数学のMathlibと同様に,計算機科学分野における知識基盤の構築を目指す。
    • これにより,Leanを計算機科学の教育・研究における広範な利用を促進し,大規模な形式検証システムのエンジニアリングを支援する。
    • AIによる数学的推論の訓練においても,Mathlibが重要な役割を果たしており,同様の効果が期待される。

    Link: https://arxiv.org/abs/2602.04846

  • ドップラーOFDMチャネルの容量限界 [cs.IT, math.IT]目的:ドップラーOFDMチャネルにおける容量限界の導出
    • 低軌道衛星通信は高速移動により大きなドップラー影響を受けるため,その対策が重要である。
    • ドップラーシフトの補正残差はチャネル不確実性となり,通信速度を制限する要因となる。
    • 残差ドップラーによるチャネル不確実性の影響を軽減し,通信容量を最大化することを目指す。
    • 提案手法は,周波数選択性フェージングチャネルモデルに基づき,通信レートの下限と上限を導出した。
    • 重ね合わせ方式と部分空間アライメント(SN)スキームにより,パイロット信号を用いずに効率的な復号を可能にした。
    • シミュレーション結果は,提案手法が低複雑度でほぼ最適なレートを達成することを示した。

    Link: https://arxiv.org/abs/2602.04862

  • 関数的確率的局所化 [math.PR, cs.DS, cs.LG, math.ST, stat.ML, stat.TH]目的:高次元幾何学とサンプリングアルゴリズム設計における確率的局所化の一般化
    • 高次元幾何学や最適化アルゴリズムにおいて,効率的なサンプリング手法の確立が重要である。
    • 既存の局所化手法では,非ユークリッド幾何学への適用や,より複雑な最適化問題への対応が課題となっていた。
    • 本研究では,より広範な幾何学と最適化問題に対応可能な,関数的確率的局所化の枠組みを提案する。
    • 提案手法は,対数ラプラス変換を用いた新しい正則化項を導入することで,ガウス正則化の制約を克服する。
    • 提案手法によって誘導されるマルコフ連鎖の混合時間は,関数的ポアンカレ不等式を満たす場合に保証される。
    • この枠組みを,微分プライバシーを考慮した凸最適化問題($\ell_p$ノルム,p∈[1, 2))に適用し,既存のクエリ複雑性を改善した。

    Link: https://arxiv.org/abs/2602.03999

  • 近傍U-MIMOにおける高所BS向け,偏波ドメイン辞書設計の改良 [math.OC, cs.SY, eess.SY, eess.SP, cs.IT, math.IT]目的:近傍U-MIMO通信における,角度領域と距離領域の最適化されたサンプリンググリッド
    • 近傍U-MIMOは次世代通信技術の中核であり,高スループットと高精度な通信を実現する鍵となる。
    • 既存のグリッド設計法は基地局の高さの影響を無視しており,現実の環境との乖離が生じやすい。
    • 基地局の設置場所を考慮した汎用的なグリッド設計フレームワークを提案し,より正確なチャネル表現を目指す。
    • 提案手法は,最適な正規化平均二乗誤差の最小化に基づいてグリッドを最適化し,従来の相関ベースのアプローチよりも高い精度を実現する。
    • Sub-THz周波数で動作するハイブリッドU-MIMOシステムにおいて,P-SOMPアルゴリズムを用いたチャネル推定性能を評価した。
    • 解析的および数値的な結果は,提案手法が既存の手法と比較して,チャネル推定精度とスペクトル効率を向上させることを示している。

    Link: https://arxiv.org/abs/2602.04331

  • 複数受信機結合アップリンクニューラル復号のためのクロスアテンションTransformer [math.AG, cs.SC, math.DS, cs.SY, eess.SY, eess.SP, cs.IT, cs.LG, math.IT]目的:複数アクセスポイントで受信したアップリンクOFDM信号の結合復号
    • 無線通信において,より多くのデータを効率的に伝送するため,受信側の性能向上が不可欠である。
    • 従来の復号手法では,各受信機チャネルの推定が必要であり,計算量が増加し,誤差の影響を受ける。
    • 受信機間の情報を活用し,チャネル推定なしで効率的な復号を実現することで,システム全体の信頼性を高める。
    • 提案手法は,複数のアクセスポイントからの受信信号を結合し,高い復号性能を発揮する。
    • 特に,チャネル状態が未知の場合や,一部のリンクが劣化している場合でも,従来の方式を上回る結果が得られた。
    • モデルは軽量であり,低遅延で動作するため,次世代Wi-Fi受信機の実用的な構成要素となり得る。

    Link: https://arxiv.org/abs/2602.04728

  • バグ導入変更に関する探索的研究:因果的理解に向けたバグ導入変更における関係性の探求 [cs.SE]目的:バグ導入変更とソフトウェア開発プラクティスの関係性
    • ソフトウェア品質向上は,社会におけるシステムへの依存度増加に伴い,ますます重要になっている。
    • 既存研究では,バグ導入と特定のプロセス要素間の相関関係に焦点が当たりがちで,他の要因との相互作用が考慮されていない。
    • 本研究は,バグ導入変更に関連する開発プロセス全体を分析し,因果関係を解明するための基盤を提供する。
    • バグ導入変更のプロセス内で,複数の重要な関係性が明らかになった。
    • 変数間の論理的なグループ化と関係性は,バグ導入における中間効果や交絡因子を特定するための枠組みを提供する。
    • ソフトウェア開発プラクティスは相互に依存しており,因果モデリングによるバグ導入理由の理解を促進する。

    Link: https://arxiv.org/abs/2304.05358

  • 動的フローに対する分解定理 [cs.DS, math.OC]目的:動的エッジs,d-フローの分解
    • ネットワークにおけるフロー制御は,交通や通信など,様々な分野で不可欠である。
    • 動的フローの解析は複雑であり,効率的な分解手法が求められている。
    • 動的エッジs,d-フローの新しい分解定理を導き,理論的基盤を確立する。
    • 本研究では,任意の積分可能な動的エッジs,d-フローが,s,d-ウォーク流入とゼロ移行時間サイクルへの非負線形結合で分解可能であることを証明した。
    • 古典的なアルゴリズム的アプローチの変形が,動的循環に収束し,その循環はゼロ移行時間サイクルの流入によって誘導可能であることが示された。
    • エッジの最小移動時間に下限が存在し,フローが有限にサポートされている場合,アルゴリズムは有限時間で終了する。

    Link: https://arxiv.org/abs/2407.04761

  • 関係構造における彩色洗練 [cs.RO, cs.SY, eess.SY, cs.IR, cs.DS, cs.DM, cs.LO]目的:関係構造における彩色洗練法の識別力
    • グラフの同型性判定は計算機科学における基礎課題であり,効率的な手法が求められている。
    • 既存の彩色洗練法はグラフに限定され,より一般的な関係構造への拡張が課題であった。
    • 関係構造に対しても彩色洗練法を一般化し,その識別能力を明らかにすること。
    • 本研究で提案する関係構造彩色洗練(RCR)は,グラフ上の彩色洗練法を一般化したものであり,同様の識別能力を持つ。
    • RCRは,ある種の再帰的関係構造からの準同型写像の数によって識別可能な構造を識別できる。
    • RCRは,特定の論理式によって識別可能な構造を識別でき,固定された有限の論理的記号に対して時間計算量はO(N・log N)で実行可能である。

    Link: https://arxiv.org/abs/2407.16022

  • 分散計算における疎グラフ上の1階論理:局所計算可能性の再検討 [cs.DS]目的:分散計算における局所計算可能性の範囲の特定
    • 分散計算は,ネットワークにおける計算の基本原理であり,効率的なアルゴリズム設計に不可欠である。
    • 局所的な情報のみで解決可能な問題の範囲は不明であり,計算可能性の決定は困難である。
    • 疎グラフという制約下で,1階論理による問題が効率的に分散計算で解けるか検証する。
    • 局所的な1階論理式は,有界拡張グラフ上で$O(\log n)$ラウンドで決定可能である。
    • 局所性の制約を緩めると,有界拡張グラフ上での1階論理式の決定には$O(D+\log n)$ラウンドで十分である。
    • Ne\v{s}et\v{r}ilとOssona de Mendezの未解決問題は,肯定的に解決された。

    Link: https://arxiv.org/abs/2411.14825

  • 確実な保証付きの逐次多様化 [cs.DS]目的:情報項目の多様性の最大化
    • 情報探索において,冗長性を減らし,多角的な視点を提供するため,多様化は重要である。
    • 既存の多様性指標は集合に対して定義されており,項目の順序を考慮していない。
    • 項目の順序と関連性を考慮した,逐次多様性の最大化問題を理論的に解決する。
    • 本研究では,逐次多様性最大化問題の困難性を証明し,定数近似保証を持つアルゴリズムを提案した。
    • 提案アルゴリズムは,総多様性とカバレッジ多様性の両方に対して適用可能である。
    • 実験結果から,提案手法が強力なベースラインと比較して競争力があることが示された。

    Link: https://arxiv.org/abs/2412.10944

  • ニューラルネットワーク検証における証明駆動節学習 [cs.LO, cs.LG]目的:ニューラルネットワークの検証における証明生成と効率化
    • 深層学習の安全性確保は重要であり,検証技術の信頼性が不可欠である。
    • 既存の検証器はスケーラビリティ重視で,証明の信頼性が課題であった。
    • 標準的な証明形式を用いて,信頼性の高い検証器を開発し,効率的な証明生成を目指す。
    • PICIDは,標準的なAlethe形式で証明を生成し,複数のチェックツールで検証可能である。
    • 並列CDCL(T)アーキテクチャと最新のSATソルバーを統合し,証明生成を効率化している。
    • 評価実験により,PICIDが有効な証明を生成し,既存ツールを大幅に上回る性能を示すことが確認された。

    Link: https://arxiv.org/abs/2503.12083

  • Reveal-or-Obscureによる差分プライバシーに基づくサンプリング [cs.IT, cs.CR, cs.DS, cs.LG, math.IT]目的:データセットからの単一の代表的なサンプル生成
    • 個人情報保護が重要視される中,データ分析におけるプライバシー保護技術の確立が求められている。
    • 既存手法では,ノイズ付加によりデータ利用可能性が低下する,または計算コストが高いという課題がある。
    • Reveal-or-Obscureメカニズムの改良により,高いプライバシー保護とデータユーティリティの両立を目指す。
    • 提案手法Reveal-or-Obscureは,既存手法よりもサンプリング複雑性に関する厳密な上限を確立した。
    • データ分布に応じて隠蔽確率を調整するData-Specific ROOは,同じプライバシー予算下で,既存手法よりも高いユーティリティを実現する。
    • Data-Specific ROOのTotal Variation Distanceは,データセットサイズnに対して指数関数的に減衰し,優れた性能を示す。

    Link: https://arxiv.org/abs/2504.14696

  • 1
  • 2