arXiv雑要約

プログラム - 2026/04/30 公開

  • スマートコントラクトのパラダイム比較:セキュリティと開発者体験の予備研究 [cs.CL, physics.soc-ph, cs.SE, cs.PL]目的:スマートコントラクトにおけるセキュリティと開発者体験の比較
    • スマートコントラクトは巨額の金銭的損失を引き起こしており,セキュリティの重要性が高まっている。
    • 従来の命令型言語では,開発者がセキュリティチェックを手動で実装する必要がある。
    • 本研究は,リソース指向型言語がセキュリティオーバーヘッドを軽減できるか検証する。
    • Move言語は,Solidityと比較してセキュリティチェックの記述量を60%削減することが示された。
    • Move言語のコードサイズはSolidityより47%大きいものの,サイクロマティック複雑度は同等であった。
    • 開発者アンケートでは,Move言語に対する安全性への信頼感が高く,セキュリティが重要なアプリケーションでの利用希望が示された。

    Link: https://arxiv.org/abs/2604.26727

  • 分散多視点画像のみに基づくRSSI推定 [cs.IT, math.IT]目的:無線リンク管理のためのRSSI推定
    • 無線通信の品質向上は重要であり,RSSI推定はその鍵となる。
    • 従来のRSSI推定は,フィードバック遅延や不安定性といった課題を抱えている。
    • 複数の視点からの情報を活用し,より正確なRSSI推定を目指す。
    • 提案手法MulViT-TFは,Transformerを用いた多視点画像融合により,空間的な補完性を実現した。
    • 実験結果から,MulViT-TFは既存手法と比較してRMSEを最大26.3%削減し,3dBエラーカバレッジを最大13.8%向上させた。
    • MulViT-TFは,計算量とパラメータ数を抑えつつ,高い精度を達成した。

    Link: https://arxiv.org/abs/2604.26738

  • 連合学習における信号レベル統合センシング,計算,通信のための解析的に特徴付けられた最適電力制御 [cs.IT, eess.SP, math.IT, math.OC]目的:AirComp-FLにおける共同ターゲット検出のための,信号レベル統合センシング,計算,通信(Sig-ISCC)の上りリンク設計
    • IoT時代において,通信,計算,センシングの需要増加に対応するため,効率的な機能統合が不可欠である。
    • 分散機械学習フレームワークであるFederated Learningは通信ボトルネックを抱えており,その解決が求められている。
    • AirCompを活用し,ターゲット検出要件を満たしつつ,AirComp集約歪みを最小化する電力制御手法を提案する。
    • 提案手法は,変数変換により非凸問題を等価な凸問題に変換し,解析的な最適性を示すことで,最適な電力制御を実現する。
    • シミュレーション結果は,提案アルゴリズムの最適性と数値的安定性,およびベースライン手法と比較して優れたFL性能を検証する。
    • 本研究は,プライバシー保護とセキュリティを確保しつつ,ネットワークインテリジェンスを実現するAirComp-FLの性能向上に貢献する。

    Link: https://arxiv.org/abs/2604.26741

  • 情報ボトルネックの十分統計量による低次元問題への帰着 [cs.IT, math.IT, stat.ML]目的:情報ボトルネック問題の解法における計算複雑性の低減
    • 情報理論は,データの本質的情報を抽出・圧縮する上で重要である。
    • 高次元データに対する情報ボトルネック問題の計算量は膨大である。
    • 十分統計量が存在する場合,計算量を大幅に削減できることを示す。
    • 条件付き分布が十分統計量を通して因数分解される場合,情報ボトルネック問題は低次元の問題と同等になる。
    • この帰着は損失がなく,IB曲線,ラグランジュ最適解,最適表現を保持する。
    • ガウス型IB解は,この帰着の直接的な帰結であり,非線形ガウス型への一般化も可能である。

    Link: https://arxiv.org/abs/2604.26744

  • ロバストマルコフ決定過程の複雑性とビスミュレーション距離 [cs.LO]目的:不確実性のある遷移確率を考慮するロバストマルコフ決定過程における閾値問題の複雑性
    • 現実世界の制御問題では,環境の遷移確率が完全に分かっていることは稀であり,不確実性への対処が重要である。
    • 既存研究では,近似解や特定のRMDPの部分クラスに限定されており,一般的な複雑性解析が不足していた。
    • 多面体的不確実性を持つRMDPの閾値問題を解析し,計算複雑性の限界を明らかにすること。
    • (s,a)長方形RMDPにおいて,ロバスト方策評価がP時間で可能であり,閾値問題はNPであることが示された。
    • s長方形RMDPにおいては,閾値問題がPSPACEに属することが実数領域の一次論理を用いて証明された。
    • パリティゲームおよびMDP状態間のビスミュレーション距離をRMDPの閾値問題に帰着することで,計算困難性の下限が確立された。

    Link: https://arxiv.org/abs/2604.26748

  • 実行時検証:監視,知識,不確実性 (講義ノート) [cs.LO, cs.FL]目的:実行時検証の理論的基盤と応用
    • システム安全性確保の重要性が増す中,従来の検証手法だけでは限界がある。
    • 部分的にしか観測できないシステムへの適用が困難であるという課題がある。
    • 実行時検証による,不確実性下でのシステム検証手法の確立を目指す。
    • 実行時検証はモデル検査を補完し,システム実行を監視することで検証を行う。
    • オートマトン理論,時間論理,認識論に基づいた基盤を提示し,仕様記述や診断を解説。
    • オフライン分析に基づいた監視器の構築と,実時間システムへの拡張についても議論。

    Link: https://arxiv.org/abs/2604.26753

  • 整数上の符号における局所性 [cs.IT, math.IT]目的:整数上の符号における局所制約
    • データ保存において,信頼性向上が重要である。符号化技術は誤り耐性を高める。
    • 大規模データ保存時の,局所的な障害への耐性が課題である。
    • 局所的な障害に対する耐性を持つ符号の理論的限界と構成を目指す。
    • 整数上の局所性を持つ符号について,Singleton型の限界を導出した。
    • Tamo-Barg符号の整数版を含む,局所回復符号の構成を提案した。

    Link: https://arxiv.org/abs/2604.26756

  • 周波数選択性フェージング下における測距指向型OFDM-ISACシステムのための入力分布設計 [cs.IT, eess.SP, math.IT]目的:周波数選択性フェージング下におけるOFDM-ISACシステム向けの,効率的な入力分布設計手法
    • 次世代6Gネットワークにおいて,ISAC機能の実装はOFDMフレームワークに基づくと予想され,重要性が増している。
    • OFDM-ISACシステムにおいて,通信速度とセンシング性能のバランスが課題であり,入力分布設計が重要となる。
    • この研究は,実用的なセンシング制約下における最適な戦略を明らかにし,コンスタレーションの尖度を資源として活用する。
    • 提案手法は,コンスタレーションの尖度を資源とみなし,サブキャリアに適切に割り当てることで,通信とセンシングのバランスを最適化する。
    • 本研究は,容量歪理論に基づき,計算効率の高い入力分布設計アプローチを提示する。

    Link: https://arxiv.org/abs/2604.26778

  • MISES:効果的なサービスのための最小情報充足性 [cs.GT, cs.IT, math.IT]目的:カテゴリベースの協調メカニズムにおける資源配分効率の評価
    • サービス提供における資源配分は,効率的なシステム運用に不可欠である。
    • 従来の資源配分では,個々の需要を正確に把握できず,最適化が困難であった。
    • 本研究は,最小限の情報で効率的な資源配分を実現するメカニズムを提示する。
    • カテゴリベースの協調メカニズムにおける厚生損失のギャップは,カテゴリ内分配の分散に比例することが示された。
    • 需要に基づいたカテゴリ設定は,厚生損失と虚偽申告のインセンティブを同時に最小化する。
    • 集約的な指標が,サービスレベルの検出において個々の指標よりも優れていることが証明された。

    Link: https://arxiv.org/abs/2604.26808

  • エネルギー監視のコストは何か?RAPLベースのツールによるオーバーヘッドの実験的研究 [cs.CG, cs.SE, cs.PF]目的:RAPLベースのエネルギー監視ツールがもたらすオーバーヘッドの定量化と軽減策の調査
    • ソフトウェアのエネルギー消費量の把握は,環境負荷低減やシステム効率化において重要である。
    • RAPLインターフェースを用いたエネルギー計測では,ツール設計やポーリング頻度によって計測オーバーヘッドが生じる。
    • 高頻度エネルギー監視におけるオーバーヘッドを軽減し,正確なエネルギー消費量計測を可能にすること。
    • 既存のユーザー空間ツールは1kHzにおいて大きな時間的オーバーヘッドをもたらす可能性がある。
    • 本研究で開発したツールは,システムコールとインライン数学演算のオーバーヘッドを大幅に削減することに成功した。
    • RAPL値へのアクセスを高速化するためには,ツール設計の簡素化と低レベル命令の使用が有効である。

    Link: https://arxiv.org/abs/2604.26815

  • HPCにおける動的リソース管理のためのテスト分類と継続的インテグレーション環境 [cs.DC, cs.SE]目的:HPCにおける動的リソース管理および可変MPIアプリケーションのテスト方法論
    • 異種アーキテクチャ,変動するワークロード,エネルギー制約への対応がHPCの重要な課題である。
    • 動的リソース管理を支援するライブラリの正しさを検証する実験は,再現性と維持が困難である。
    • MPI可変ライブラリのテスト分類とHPC向けCI環境を組み合わせ,検証プロセスを効率化する。
    • 提案手法は,早期の障害検出を改善し,進化する依存関係下での保守を簡素化する。
    • このアプローチは,初期化,準備チェック,再構成のための同様のプリミティブを公開する他の可変ソリューションにも適用可能である。
    • 動的リソース管理(DMR)フレームワークを用いたケーススタディで,本手法の有効性が示された。

    Link: https://arxiv.org/abs/2604.26824

  • プロファンクターモデルにおける完全定義可能性 [cs.LO]目的:プロファンクター上の群化カテゴリーに基づくモデルにおける完全定義可能性
    • 意味モデルの理解は,形式言語と意味論の基礎であり,計算機科学と論理学において不可欠である。
    • 関係モデルの変種であるプロファンクターモデルは,より複雑な構造を持つため,定義可能性の判定が難しい。
    • 本研究は,プロファンクターモデルにおける定義可能なプロファンクターの完全な特徴付けを提供し,完全定義可能性を検証することを目指す。
    • プロファンクターは関係より複雑だが,関係モデルのアイデアとプロファンクターの安定性の概念を適用することで,定義可能なプロファンクターを特徴付けられることが示された。
    • 安定性と完全性の両方を満たす論理的なプロファンクター族は,MIXを持つ乗法線形論理の証明網によって定義可能である。
    • 安定性は正当性の基準として機能し,独立した興味深い結果として示された。

    Link: https://arxiv.org/abs/2604.26829

  • 重み付きグラフにおける局所重縁伸張を用いたエミュレータ [cs.DS]目的:無向グラフに対する重み付きエミュレータの構築
    • グラフ構造の近似は,大規模ネットワークの効率的な処理に不可欠である。
    • 既存のエミュレータは,グラフの距離やサイズに関して制約がある場合が多い。
    • より効率的で汎用的なエミュレータを構築し,既存手法の限界を克服すること。
    • 本研究では,任意のkに対して,$\tilde O \left(n^{1+\frac{1}{k}}\right)$エッジを持つエミュレータを提案した。
    • 提案手法は,既存の$+2W_{1}$-スパンナや$+4W_{1}$-エミュレータを一般化し,それらを改善する。
    • 特に,距離が$\delta \leq O\left(3^{k^{2}}\right)$の頂点ペア間において,既存のエミュレータよりも優れた近似精度を実現した。

    Link: https://arxiv.org/abs/2604.26831

  • 差分プライバシーを用いた正線形計画問題の解法 [cs.DS]目的:正線形計画問題に対する差分プライバシー近似アルゴリズム
    • データ分析におけるプライバシー保護は重要であり,個人情報漏洩リスクを抑制する必要がある。
    • 既存手法では,制約条件のわずかな変化で結果が大きく変動し,プライバシー保護が困難であった。
    • 制約条件の変更に対するロバスト性を持ち,プライバシーを保護しつつ近似解を得ることを目指す。
    • 提案手法は,既存のインスタンス依存型保証を改善し,次元数のみに依存するデータ非依存型の上界を提供。
    • 正線形計画問題特有の構造を利用した,正則化された双対視点に基づく乗算重み更新法を開発。
    • この手法により,プライバシーを保護しつつ,許容範囲内の制約違反で近似解を効率的に求めることが可能。

    Link: https://arxiv.org/abs/2604.26838

  • 回転アンテナMIMOにおける送受信器の指向性最適化による容量最大化 [cs.CL, cs.IT, math.IT]目的:回転アンテナMIMOシステムにおけるチャネル容量最大化
    • 無線通信において,電波伝搬環境に適応的に対応することが重要である。アンテナの指向性を制御することで,その可能性が広がる。
    • 従来のMIMOシステムでは,固定されたアンテナ配置しか利用できず,電波環境への適応性が低いという課題があった。
    • 回転アンテナを用いて,送信と受信の両方の指向性を最適化することで,チャネル容量の向上を目指す。
    • 提案手法では,アンテナの指向性と送信共分散行列を同時に最適化するアルゴリズムを開発した。
    • シミュレーション結果から,提案手法が固定アンテナ配置と比較して,チャネル容量を大幅に向上させることが示された。
    • 低SNR環境下では,MISOやSIMOの特殊なケースに対する簡略化された設計も導出した。

    Link: https://arxiv.org/abs/2604.26845

  • AI依存型ソフトウェア工学における認知の衰退とシステム崩壊 [cs.NI, cs.SE, cs.CY]目的:AI依存型ソフトウェア工学における認知機能低下とシステム崩壊のメカニズム
    • ソフトウェア開発におけるAI活用は生産性向上に貢献するが,人間の認知能力への影響は無視できない。
    • AIに頼りすぎることで,エンジニアの論理的思考力や問題解決能力が低下する危険性がある。
    • AI活用による潜在的なリスクを明らかにし,ソフトウェアシステムの長期的な安定性を確保すること。
    • 本研究では「認識的負債」という概念を提唱し,AI検証への依存がエンジニアの理解力を低下させることを指摘した。
    • Amazonの2026年の障害事例分析から,AIによる均質化がシステム全体の脆弱性を高めることが示唆された。
    • AI活用と人間の認知能力維持を両立させるための教育基準の必要性が強調された。

    Link: https://arxiv.org/abs/2604.26855

  • 現場でのホットフィックス [cs.PF, cs.SE]目的:ホットフィックスの現状と特性の分析
    • ソフトウェアの安定稼働には欠かせないホットフィックスの理解が重要である。
    • ホットフィックスに関する大規模な実証研究が不足している。
    • ホットフィックスにおける人間とAIエージェントの行動の違いを明らかにすること。
    • ホットフィックスは,通常のバグ修正と比較して,修正規模が小さく,レビュー担当者数が少ない傾向にある。
    • ホットフィックスは,緊急性の高い状況下で,単一の貢献者による修正が一般的である。
    • 人間とAIエージェントは,ホットフィックスにおいて10以上の異なる修正行動を示す。

    Link: https://arxiv.org/abs/2604.26892

  • 収益最大化の学習曲線について [cs.LG, cs.DS, cs.GT, stat.ML]目的:収益最大化における学習曲線の特性
    • 機械学習において,学習曲線はアルゴリズムの汎化性能を測る上で不可欠である。
    • 収益最大化アルゴリズムの学習曲線は,最悪の場合の分布に依存しており,その形状を捉えられていない。
    • 本研究は,単一アイテム・単一買い手という基本的な設定で学習曲線の減衰率を明らかにすることを目指す。
    • 分布に制限がない場合,任意の分布に対して学習曲線がゼロに収束するアルゴリズムが存在する。
    • しかし,その収束は非常に遅くなる可能性があり,最適な収益が有限である場合でも同様である。
    • 最適な収益が有限の価格で達成される場合,最適な減衰率は概ね $1/\sqrt{n}$ である。

    Link: https://arxiv.org/abs/2604.26922

  • ClassEval-Pro:クラスレベルのコード生成のためのクロスドメインベンチマーク [cs.SE, cs.CL]目的:クラスレベルのコード生成タスクの評価
    • 近年,LLMの発展により関数レベルやリポジトリレベルのコード生成は進んでいる。
    • クラス全体の構造を考慮したコード生成の評価は,手動での作成にコストがかかり,データ汚染のリスクがある。
    • 自動化されたパイプラインにより,多様なドメインを網羅するクラスレベルのベンチマークを構築し,LLMの能力を評価する。
    • ClassEval-Proは,11のドメインにわたる300のクラスレベルタスクで構成され,LLM Judge Ensembleによって検証されている。
    • 最先端のLLM5モデルにおいて,Pass@1は平均45.6%であり,モデル間の性能差は最大17.7ポイントであった。
    • エラー分析の結果,ロジックエラー(56.2%)と依存関係エラー(38.0%)が主な課題であり,メソッド間の連携がボトルネックであることが示された。

    Link: https://arxiv.org/abs/2604.26923

  • 直線と階段状集合におけるソロー・ポラスキー多様性部分集合選択の厳密動的計画法 [cs.CG, cs.DS, math.OC]目的:ソロー・ポラスキー多様性部分集合選択の厳密解法
    • 生物多様性保全や計量幾何学において多様性の評価が重要である。
    • 大規模データにおける厳密解の計算が困難である。
    • 効率的な動的計画法アルゴリズムを開発し,問題を解決する。
    • ソロー・ポラスキー多様性の計算公式と,動的計画法による厳密解法のアルゴリズムを導出した。
    • 線形チェーンの公式を拡張し,階段状集合にも適用できることを示した。
    • アルゴリズムの時間計算量を $O(kn^2)$ とし,計算効率の良さを確認した。

    Link: https://arxiv.org/abs/2604.26929

  • 有限地平線逐次決定問題のためのコヒーレントロールアウトオラクル [quant-ph, cs.DS]目的:有限地平線逐次決定問題におけるコヒーレントロールアウトオラクル構築
    • 強化学習等の分野で,効率的な計画立案が重要視されている。
    • 量子計算を活用した計画立案において,回路規模の解析が課題となっている。
    • ロールアウトオラクルに必要な基盤となるrank-select回路の効率的な構成を目指す。
    • rank-select回路の可逆回路複雑性解析を行い,$O(Nw)$ゲートの低アンシラバウンドスパンスキャンと,$O(N\log w)$ゲートのブロック構築を提示した。
    • 提案手法は,古典的なアームプル法と比較して,クエリ数の点で優位性を示す。
    • SIRエピデミック介入問題への適用とLean 4による検証により,提案手法の有効性を確認した。

    Link: https://arxiv.org/abs/2604.25962

  • セマンティック圧縮のための適応変換符号化 [eess.IV, cs.CV, cs.IT, eess.SP, math.IT]目的:セマンティック特徴圧縮
    • 視覚データ圧縮は,人間中心の復元から機械向けの表現符号化へと変化しつつある。
    • 異質な特徴分布への効率的な符号化が課題であった。
    • セマンティック特徴圧縮におけるレート歪み関数の最適化を目指す。
    • 提案手法は,広く使用されている画像バックボーンおよび基盤モデルの特徴において,最先端のニューラル圧縮手法と同等以上の性能を示す。
    • モード依存変換と量子化を使用することで,異質な特徴分布をより効率的に符号化する。
    • 柔軟性と解釈可能性を維持しつつ,セマンティック特徴の圧縮性能を向上させる。

    Link: https://arxiv.org/abs/2604.26492

  • ハイブリッドデジタル・マイクロ波線形アナログコンピューター(MiLAC)支援マルチユーザーMIMO-OFDMシステム向けビームフォーミング [math.MG, cs.CG, math.CO, eess.SP, cs.IT, math.IT]目的:広帯域マルチユーザーMIMO-OFDMシステムにおけるハイブリッドデジタル-MiLACビームフォーミングの性能評価
    • 無線通信におけるデータ伝送容量拡大のため,ビームフォーミング技術が重要視されている。
    • 従来のデジタルビームフォーミングは消費電力が大きく,アナログビームフォーミングは柔軟性に欠ける。
    • MiLACを用いることで,低消費電力かつ柔軟なビームフォーミングを実現し,性能向上を目指す。
    • 提案手法であるハイブリッドデジタル-MiLACビームフォーミングは,従来のハイブリッドデジタル-アナログビームフォーミングを上回る性能を示す。
    • 特に周波数選択性の高いチャネルにおいて,全デジタルビームフォーミングの89.93%の合計レートを,RFチェーンの12.5%の使用で達成する。
    • 広帯域システムでは,ナローバンドシステムと比較してより多くのRFチェーンが必要となることが示された。

    Link: https://arxiv.org/abs/2604.26532

  • 回路ベース量子プログラムの確率的条件,決定,およびパスカバレッジ [quant-ph, cs.SE]目的:量子プログラムのテスト適合性評価基準
    • ソフトウェアの信頼性確保にはテストが不可欠であり,その妥当性を測る基準が重要である。
    • 量子プログラムに対するカバレッジ基準の有効性は未解明であり,研究が不足している。
    • 量子プログラムに特化したカバレッジ基準を定義し,テストの有効性を評価すること。
    • 条件カバレッジと決定カバレッジは平均して高い値(それぞれ97.56%と97.63%)を示したが,パスカバレッジは低い(71.84%)。
    • 特に多制御ゲートの存在下ではパス爆発が生じ,カバレッジの偏りが顕著であった。
    • 確率的カバレッジを導入することで,条件,決定,パスカバレッジはそれぞれ平均で88.87%,88.65%,37.18%となった。
    • 変異テストの結果,構造的カバレッジと故障検出の間には相関が見られなかった。

    Link: https://arxiv.org/abs/2604.26609

  • 凸順序における鋭い一次元準ガウス比較 [quant-ph, cs.ET, math.PR, cs.IT, math.IT, math.ST, stat.ML, stat.TH]目的:凸順序における準ガウス変数間の支配関係
    • 確率変数の比較は,統計的推論や機械学習の基礎となる重要な研究テーマである。
    • 既存の研究では,確率変数の支配関係を明確化することが困難であった。
    • 本研究は,ガウス変数に支配される確率変数の凸順序における支配限界を明確にする。
    • 任意の準ガウス変数は,ガウス変数によって凸順序において支配されることが証明された。
    • 具体的には,その変数は正規化されたガウス変数によって支配される。
    • 一様分布({-1, 1})と絶対値関数において等価性が確認された。

    Link: https://arxiv.org/abs/2604.26819

  • ユニタリー変換への量子チャネル認証における厳密な階層性 [quant-ph, cs.CC, cs.DS]目的:ユニタリー変換への量子チャネル認証問題
    • 量子情報処理の安全性や信頼性を担保する上で,量子チャネルの性質を検証することは不可欠である。
    • 未知の量子チャネルが目標とするユニタリー変換と一致するかどうかを効率的に判定する手法が課題であった。
    • 様々なアクセスモデルにおいて,量子チャネル認証に必要なクエリ数を厳密に決定し,その階層性を明らかにすること。
    • 非コヒーレントアクセスモデルでは,$\Theta(d/\varepsilon^2)$回のクエリで十分であることが示された。
    • コヒーレントアクセスモデルでは,$\Theta(d/\varepsilon)$回のクエリで十分であることが示された。
    • ソースコードアクセスモデルでは,$\Theta(\sqrt{d}/\varepsilon)$回のクエリで十分であり,アクセスモデル間の厳密な階層性が確認された。

    Link: https://arxiv.org/abs/2604.26900

  • LLMにおける事実誤りのダイナミックな発見手法:反復的アプローチ [cs.SE, cs.AI, cs.CL]目的:大規模言語モデルにおける事実誤りの特定
    • LLMは多様な応用で基盤技術であり,その知識活用が重要視されている。
    • LLMは事実や常識に関する誤りを生じやすく,特に重要な分野での誤情報拡散が懸念される。
    • LLMの事実誤りを効率的かつ効果的に発見するための自動化手法を開発する。
    • 提案手法HalluHunterは,知識グラフを利用して多様な質問を生成し,LLMの事実誤りを系統的に発見する。
    • HalluHunterは,LLMが誤りやすい箇所に焦点を当てて反復的に質問を選択することで,高いエラー検出率(最大55%)を実現した。
    • HalluHunterのテストケースは,LLMの事実性のベンチマークにおける弱点を露呈させ,質問の網羅性を維持する。

    Link: https://arxiv.org/abs/2401.00761

  • 質問することを学習する:LLMエージェントと不明確な指示 [cs.CL, cs.AI, cs.SE]目的:不明確な指示下におけるLLMエージェントのツール利用性能評価
    • LLMは高度な言語能力に加え,外部ツール利用により多様なタスク遂行が可能である。
    • 現実世界では,LLMのツール利用は正確な指示に依存するが,指示は常に明確とは限らない。
    • 不明確な指示に対するLLMの課題を分析し,質問による指示の明確化を目指す。
    • LLMは,次トークン予測学習の特性から,欠損引数を恣意的に生成し,幻覚やリスクを生じさせる傾向がある。
    • 提案手法Ask-when-Needed(AwN)は,不明確な指示に直面した際にユーザーに質問することで,この問題を解決する。
    • AwNは,既存のツール学習フレームワークと比較して,NoisyToolBenchにおいて大幅な性能向上を実証した。

    Link: https://arxiv.org/abs/2409.00557

  • 真のサブナイキスト一般固有値法による高分解能化 [cs.IT, math.IT]目的:スペクトル超解像センシングの実現
    • レーダー,リモートセンシング,無線通信など多様な応用分野で,スペクトル超解像センシングが不可欠である。
    • 圧縮スペクトルセンシングにおいて,スペクトルリーケージやピケットフェンス効果が超解像信号成分の正確な抽出を困難にする。
    • サブナイキストサンプリング条件下での高分解能信号成分パラメータの精密な抽出を実現し,実用的なハードウェア実装を可能にする。
    • 提案手法は,信号成分間の非干渉性と微分演算の線形性保持特性を利用することで,真のサブナイキストアプローチを実現している。
    • 従来の離散フーリエ変換の枠組みから脱却し,スペクトルリーケージとピケットフェンス効果を効果的に抑制する。
    • ランダムサンプリングの悪影響を低減し,信号再構成とハードウェア実装の効率を高め,スペクトル超解像センシングの有効性と実現可能性を向上させる。

    Link: https://arxiv.org/abs/2411.02700

  • 非線形歪み巡回符号のトレース双対 [cs.IT, math.IT, math.RA]目的:非線形歪み巡回符号のトレース双対空間の生成元
    • 量子誤り訂正符号の構築に有用な,有限体上の符号の研究は重要である。
    • 部分体上で線形な符号の双対符号の決定は,必ずしも容易ではない。
    • 有限体拡大上の歪み巡回符号のトレース双対符号を決定することを試みる。
    • 奇数べきの素数冪qに対し,一般化されたFq線形巡回Fq^2符号のトレースユークリッド符号およびトレースエルミート符号が決定された。
    • 一般化されたFq線形歪み巡回Fq^2符号のトレースユークリッド符号およびトレースエルミート双対も決定された。

    Link: https://arxiv.org/abs/2504.09098

  • GitBugs:重複検出,検索拡張生成,トリアージなどにおけるバグレポート [cs.SE]目的:ソフトウェア品質向上のためのバグレポートのデータセット
    • ソフトウェア開発において,バグレポートは品質保証と改善に不可欠な情報源である。
    • 既存のデータセットは,規模,鮮度,メタデータの不足により,機械学習の活用に限界があった。
    • より大規模で最新の情報とメタデータを持つバグレポートデータセットを提供し,研究を支援する。
    • GitBugsは,Firefox,Cassandra,VS Codeを含む9つのオープンソースプロジェクトから15万件以上のバグレポートを収録したデータセットである。
    • Github,Bugzilla,Jira等の複数のトラッカーからデータを集約し,標準化された分類フィールドと分割された学習・テストデータを提供する。
    • 重複検出,検索拡張生成,トリアージ,時間的分析など,多様なソフトウェア工学の研究タスクを支援する。

    Link: https://arxiv.org/abs/2504.09651

  • コンピュータ利用エージェントの安全性とセキュリティ脅威に関する調査:JARVISかUltronか [cs.CL, cs.AI, cs.CR, cs.CV, cs.SE]目的:コンピュータ利用エージェントの安全性とセキュリティ脅威の体系化
    • AI技術の発展により,人間とコンピューターのインタラクションが高度化しており,安全性確保が重要である。
    • コンピュータ利用エージェントは複雑なソフトウェア構成と多様な入力により,新たなセキュリティリスクを抱えている。
    • コンピュータ利用エージェントの潜在的な脆弱性を特定し,安全な設計と展開のための指針を提供する。
    • 本研究では,コンピュータ利用エージェントの安全性分析に適した定義を提示した。
    • 既存の安全性脅威を分類し,防御戦略の包括的な分類を提案した。
    • 安全性と性能を評価するための既存のベンチマーク,データセット,評価指標をまとめた。

    Link: https://arxiv.org/abs/2505.10924

  • 置換を避けたFFTに基づく畳み込み [math.NA, cs.DS, cs.MS, cs.NA]目的:離散畳み込みの高速評価手法
    • 高速フーリエ変換(FFT)は,様々な信号処理に応用され,計算効率が重要視されている。
    • 従来のFFT実装では,インデックス反転置換がボトルネックとなり,算術集約度が低下している。
    • 置換を回避することで,FFTの性能改善が期待できる。
    • 従来のFFT実装における3つのインデックス反転置換が相殺されることを利用した。
    • 多次元ケースにおける置換を避けた畳み込み手順を検討し,性能評価を行った。
    • FFTライブラリ開発者は,置換を避けた畳み込みカーネルのサポートを検討すべきである。

    Link: https://arxiv.org/abs/2506.12718

  • 生成AIアプリの課題と機会の理解:実証的研究 [cs.SE]目的:生成AIアプリの利用者による認識と評価
    • AI技術の急速な発展に伴い,生成AIアプリの利用が拡大している。
    • アプリの利用者視点での評価に関する知見が不足している。
    • 生成AIアプリの能力を最大限に活用し,課題を解決するための示唆を得る。
    • 大規模なレビュー分析フレームワークSARAを提案し,LLMを活用したトピック抽出の信頼性を検証した。
    • AIのパフォーマンスや感情的なつながりなど,上位10個のトピックを特定し,プラットフォーム間比較を実施した。
    • アクセシビリティや創造性向上といった機会と,期待管理やコンテンツモデレーションなどの課題を明らかにした。

    Link: https://arxiv.org/abs/2506.16453

  • 愚者は確信し,賢者は懐疑する:コード補完におけるLLMの確信度に関する調査 [cs.SE, cs.AI]目的:LLMによるコード補完時の確信度の評価
    • ソフトウェア開発における生産性向上は重要であり,コード補完はその有効な手段となる。
    • LLMのコード生成における信頼性評価は難しく,誤ったコード生成のリスクが存在する。
    • コードのパープレキシティを測定することで,LLMの確信度とコード品質の関係を明らかにすることを目指す。
    • 強型付け言語は動的型付け言語よりも低いパープレキシティを示すことが明らかになった。
    • シェルスクリプトは常に高いパープレキシティを示す一方,Javaは低いパープレキシティを示した。
    • コードのパープレキシティはLLMに依存するが,言語レベルのランキングは比較的安定していることが確認された。

    Link: https://arxiv.org/abs/2508.16131

  • 拡散言語モデルのための適応的加速とバックトラッキング強化リマスキングによる効率的なサンプリング手法 Saber [cs.CL, cs.AI, cs.CL, cs.LG, cs.SE]目的:拡散言語モデルにおける効率的なサンプリング手法の開発
    • 拡散言語モデルは並列生成や双方向の文脈モデリングに優れるため,自然言語処理の新たな選択肢として注目されている。
    • 構造制約の強いタスク,特にコード生成において,高速化と出力品質のトレードオフが課題となっていた。
    • モデルの信頼度に応じてサンプリングを調整し,誤りを修正することで,コード生成の性能を向上させる。
    • Saberは,既存の拡散言語モデルのサンプリング手法と比較して,Pass@1精度を平均1.9%向上させた。
    • Saberは,平均251.4%の推論速度向上を実現し,高速化と品質の両立に貢献した。
    • Saberを用いることで,拡散言語モデルと自己回帰モデルの性能差が縮小された。

    Link: https://arxiv.org/abs/2510.18165

  • DeFiにおける価格操作のLLMを活用した検出 [cs.CR, cs.SE]目的:DeFiにおける価格操作脆弱性の検出
    • DeFiは巨額の資金を扱うため,セキュリティの確保は極めて重要である。
    • 既存の検出手法は,既知のパターンに依存しており,新たな攻撃手法に対応できない。
    • 本研究は,LLMを活用し,複雑な経済ロジックを理解することで,未発見の脆弱性を検出することを目指す。
    • PMDetectorは,静的解析とLLMによる推論を組み合わせたハイブリッドフレームワークであり,価格操作脆弱性をプロアクティブに検出する。
    • 73件の脆弱性のあるDeFiプロトコルと288件の安全なプロトコルを対象とした評価では,Gemini 2.5-flashを用いて,88%の適合率と90%の再現率を達成した。
    • GPT-4.1による脆弱性監査のコストは0.03ドル,所要時間は4.0秒であり,手動監査と比較して効率的かつ費用対効果が高い。

    Link: https://arxiv.org/abs/2510.21272

  • EvoDev:LLMベースエージェントによるエンドツーエンドソフトウェア開発のための反復型特徴駆動型フレームワーク [cs.SE, cs.AI]目的:LLMベースエージェントを用いたエンドツーエンドソフトウェア開発のための反復型フレームワーク
    • ソフトウェア開発の自動化は,生産性向上や開発コスト削減に不可欠である。
    • 既存のアプローチは,開発の反復性を捉えきれず,大規模プロジェクトへの適用が困難である。
    • 特徴間の依存関係を明示化し,コンテキスト伝播を行うことで,複雑なソフトウェア開発を支援する。
    • EvoDevは,既存のベースライン(Claude Code)と比較して,56.8%のパフォーマンス向上を達成した。
    • 異なるベースLLMにおいても,16.0%-76.6%のシングルエージェントパフォーマンス改善が確認された。
    • 依存関係モデリング,コンテキスト伝播,ワークフローを意識したエージェント設計の重要性が示された。

    Link: https://arxiv.org/abs/2511.02399

  • 知識グラフ駆動による低リソースソフトウェア開発のためのデータ合成:HarmonyOSケーススタディ [cs.CL, cs.SE]目的:低リソースソフトウェア開発環境におけるコード生成性能向上
    • ソフトウェア開発における生産性向上は重要であり,特に新しいフレームワークの普及には不可欠である。
    • 大規模言語モデルは,リソースの少ないフレームワークの知識が不足しており,そのAPIや構文の生成に課題を抱えている。
    • API知識グラフを活用し,低リソースフレームワーク向けに特化した高品質な学習データを生成することで,この問題を解決する。
    • APIKG4SYNフレームワークを構築し,HarmonyOSを対象とした初のコード生成ベンチマークを作成した。
    • APIKG4SYNを用いてQwenをファインチューニングした結果,pass@1精度が17.59%から25.00%に向上した。
    • API指向のデータが,低リソースソフトウェア開発における大規模言語モデルの性能向上に貢献することが確認された。

    Link: https://arxiv.org/abs/2512.00380

  • PRAXIS:プログラム解析とオブザーバビリティの統合による根本原因分析 [cs.DC, cs.AI, cs.SE]目的:クラウドインシデントの根本原因分析のためのエージェントワークフローの管理と展開
    • クラウドサービスの可用性はビジネスに不可欠であり,その維持には迅速な障害対応が求められる。
    • クラウドインシデントの根本原因特定は複雑で時間がかかり,解決には高度な専門知識が必要となる。
    • 根本原因分析の自動化と効率化を図り,インシデント対応時間を短縮することを目的とする。
    • PRAXISは,サービス依存グラフとプログラム依存グラフを活用し,LLMによる構造化された探索を行う。
    • 最先端のReActベースラインと比較して,根本原因分析の精度を最大6.3倍向上させ,トークン消費量を5.3倍削減した。
    • 30件の実世界のインシデントを用いてPRAXISの有効性を検証し,根本原因分析のベンチマーク構築に貢献する。

    Link: https://arxiv.org/abs/2512.22113

  • スマートコントラクトのゲーム意味論によるオープンワールドアサーション検証 [cs.PL]目的:スマートコントラクトのオープンワールド安全性分析
    • ブロックチェーン技術の普及に伴い,スマートコントラクトの安全性確保が不可欠となっている。
    • 現実のスマートコントラクトは外部環境との相互作用が複雑で,形式的な検証が困難である。
    • 現実世界のスマートコントラクトにおける脆弱性を数学的に保証付きで検出すること。
    • ゲーム意味論に基づくフレームワークを構築し,スマートコントラクトと環境の相互作用をモデル化することに成功した。
    • YulTracerを実装し,実際のSolidityコントラクトに対するアサーション到達可能性ツールとして有効性を示した。
    • 再入攻撃ベンチマークや実際の脆弱性事例において,高い再現率と適合率を達成し,誤検知を回避した。

    Link: https://arxiv.org/abs/2512.22417

  • 線形論理における関係意味論の相互作用改善 [cs.RO, cs.LO, cs.PL]目的:線形論理の関係意味論による資源を意識したラムダ計算のモデル
    • ラムダ計算の理論的基盤を確立し,計算資源の扱いを明確にする上で重要である。
    • 既存の関係意味論では,定量的な側面が反映されず,定性的な不等式に留まっている。
    • チェッカー計算を用いて,関係意味論とコンテキスト的順序の関係を定量的に解明する。
    • 関係意味論が,関連する項とコンテキスト間の相互作用数を制約するコンテキスト的順序を洗練することを示した。
    • チェッカー計算を用いることで,定量的な解釈が可能となり,関係意味論の理解が深まった。

    Link: https://arxiv.org/abs/2601.01638

  • スコット・オープン性質に対する完全な有限型改良型システム [cs.LO]目的:無限データを取り扱う関数の入出力性質の証明
    • 計算機科学において,型システムはプログラムの正当性を保証する上で重要である。
    • 既存の型システムでは,無限データ構造の入出力性質を正確に表現することが困難である。
    • スコット・オープン性質を扱うための完全な有限型改良型システムを開発し,この問題を解決する。
    • 本研究では,アブラムスキーの論理形式におけるドメイン理論に基づき,再帰型を解釈するスコットドメインがスペクトル空間であるという事実を利用した。
    • スコット・オープン集合とコンパクト飽和集合の間の対称性が論理的極性として反映され,正の公式が最小固定点を許容し,スコット・オープン集合を定義する。
    • 非自明な入出力性質を関数型上の正の公式として定式化する,期待される(反)共変性を持つ実現可能性の含意が示された。

    Link: https://arxiv.org/abs/2601.23082

  • ReLoop:信頼性のあるLLMベース最適化のための構造化モデリングと行動検証 [cs.SE, cs.AI, cs.LG, math.OC]目的:LLMによる最適化コードの信頼性向上
    • LLMは自然言語を最適化コードに変換するが,その出力の信頼性が課題となっている。
    • 生成されたコードは実行可能でも,意味的に誤った最適化問題を表現している場合がある。
    • 構造化生成と行動検証により,LLMの出力における妥当性と正確性のギャップを埋める。
    • ReLoopは,コード生成を4段階の推論チェーンに分解することで,最適化問題の誤りを抑制する。
    • ソルバーを用いたパラメータ摂動による行動検証で,LLMの自己レビューに頼らないエラー検出を実現する。
    • RetailOpt-190データセットを公開し,LLMが最も失敗しやすい多制約相互作用のシナリオを提示する。

    Link: https://arxiv.org/abs/2602.15983

  • LLM監視への応用を伴う隠写術の決定理論的定式化 [cs.RO, cs.AI, cs.CL, cs.CR, cs.IT, cs.MA, math.IT]目的:LLMにおける隠写術的能力の検出と定量化
    • LLMの進化に伴い,悪意のある利用を検知する手段が重要になっている
    • 従来の隠写術の検出法は,非隠写術信号の分布を必要とするため,LLMには適用困難である
    • 情報利用の非対称性に着目し,隠写術を定量化する新たな指標を提案する
    • 決定理論的視点から隠写術を捉え,汎化された$\mathcal{V}$-情報という概念を導入した
    • 隠写術信号の有用性を,復号可能か否かによって比較する「隠写術ギャップ」を定義した
    • 提案手法によりLLMにおける隠写術的推論の検出,定量化,軽減が可能であることを実証した

    Link: https://arxiv.org/abs/2602.23163

  • 遅延制約下における価格設定イノベーション:符号化ペイロード配信の平均場解析 [cs.CL, cs.IT, math.IT]目的:低遅延ペイロード配信における価格メカニズムの解析
    • 通信システムにおける低遅延性は,ブロックチェーンやリアルタイム競合など,多くの応用において重要である。
    • ペイロード再構成時間への依存性から,参加者の支払意欲を決定する価格設定の最適化が課題である。
    • 符号化ペイロード配信における,価格と配信レートの境界を平均場解析によって明確化することを試みる。
    • 平均場解析により,単純な確率的到着モデルから価格とレートの境界を導出した。
    • ベースレーンとRLNC高速レーンから構成される2レーンサービスにおいて,高速レーンの価格設定境界を導出した。
    • RLNCによるわずかなレート増加が,ベースレーンの伝播状況に応じて測定可能なユーティリティ向上をもたらすことを示した。

    Link: https://arxiv.org/abs/2603.20426

  • SkillForge:クラウド技術サポートにおけるドメイン特化型,自己進化型エージェントスキル [cs.IR, cs.AI, cs.SE]目的:クラウド技術サポートにおけるドメイン特化型エージェントスキルの作成・評価・改善のサイクル
    • 企業におけるLLMエージェント活用は重要だが,高品質なドメイン知識が必要とされる。
    • 既存のスキル作成ツールはドメイン知識に乏しく,実用的なスキル生成が困難である。
    • 運用データに基づくスキル改善メカニズムがなく,品質が停滞しやすい問題を解決する。
    • ドメイン知識に基づいたスキル作成ツールは,汎用的なツールよりも質の高い初期スキルを生成する。
    • 自己進化型ループにより,様々な初期スキルから継続的に品質が向上することが示された。
    • 自動進化が,専門家による手動キュレーションの知識を超える可能性がある。

    Link: https://arxiv.org/abs/2604.08618

  • 高階プログラムのための支配木を伴わないSSA [cs.PL]目的:高階プログラムに対するSSA形式の新たな基礎
    • SSA形式はコンパイラの基本的な概念であり,様々な解析や変換に不可欠である。
    • 従来のSSA形式は,支配関係に依存しており,精度や高階言語への適用に課題があった。
    • 支配関係に頼らない,より高精度で高階言語に対応可能なSSA形式の構築を目指す。
    • 自由変数に着目した新たなアプローチにより,従来の支配関係に基づく解析を改善する。
    • 可変中間表現における自由変数集合の効率的な管理手法を提案する。
    • 変数依存性に基づくネストツリーを導入し,追加の構造を必要とする解析に対応する。

    Link: https://arxiv.org/abs/2604.09961

  • OpenClawとCodexにおける軌跡安全性評価・診断のためのベンチマーク:ATBench-ClawおよびATBench-Codex [cs.AI, cs.SE]目的:エージェントの軌跡レベルの安全性評価と診断のためのベンチマーク
    • エージェントシステムは多様な環境で動作するため,安全性評価は不可欠である。
    • 既存のベンチマークは,進化する環境に適応できていない場合がある。
    • OpenClawとCodex環境に特化した安全性評価ベンチマークを構築し,対応する。
    • ATBench-ClawとATBench-Codexは,OpenClawおよびOpenAI Codex環境にATBenchを拡張したものである。
    • 各環境に合わせて,リスク源,故障モード,現実世界への影響に基づき,安全性分類をカスタマイズしている。
    • ベンチマークの設計において,分類のカスタマイズ,ドメイン固有のリスクカバレッジに重点を置いている。

    Link: https://arxiv.org/abs/2604.14858

  • LLMエージェントのメッセージシーケンスチャートによる検証可能な協調 [cs.PL, cs.AI]目的:LLMエージェントの協調仕様
    • LLMを活用したマルチエージェントシステムは,複雑なタスクの実現に不可欠である。
    • LLMの不確実性により,デッドロックやメッセージ不整合などの協調エラー検出が困難である。
    • メッセージシーケンスチャートを用いて,LLMの不確実性に依存しない協調の検証を可能とする。
    • メッセージシーケンスチャートに基づくドメイン特化言語を開発し,協調構造とLLMアクションを分離した。
    • この言語を用いて,グローバルな協調仕様からデッドロックフリーなローカルエージェントプログラムを生成できる。
    • 診断コンセンサスプロトコルを通じて,提案手法の有効性を示し,LLMの非決定性に関わらず協調特性を確立できることを示した。

    Link: https://arxiv.org/abs/2604.17612