arXiv雑要約

プログラム - 2026/01/30 公開

  • AtPatch:過剰注意によるTransformerのデバッグ [cs.SE]目的:Transformerの過剰注意を修正するための手法
    • Transformerは様々なタスクで高性能だが,バックドア攻撃や公平性の問題に脆弱である。
    • 既存のニューロン編集手法は柔軟性に欠け,特徴表現を歪める可能性がある。
    • 過剰注意を動的に再配分し,モデルの機能を維持しながら問題を解決する。
    • AtPatchは,推論時に注意マップを動的に再配分することでバックドア攻撃と不公平性を軽減する。
    • 既存手法と比較して,AtPatchはモデルの元の機能をより良く維持しながら,より効果的に問題を軽減できる。
    • モデルパラメータの変更や再学習を必要とせず,デプロイ済みモデルに適している。

    Link: https://arxiv.org/abs/2601.21695

  • EsopeからFortran 2008へのモデル変換による移行 [cs.SE]目的:Fortran 77からFortran 2008への自動移行手法
    • 産業界では古い言語が依然として重要であり,保守・近代化は課題である。
    • 旧来の言語特有の拡張機能のセマンティクスは曖昧で,移行を困難にする。
    • Esopeという拡張機能を持つFortran 77を自動的にFortran 2008に移行する。
    • 本研究では,モデル駆動型エンジニアリングを用いて移行ツールを開発した。
    • 生成されたFortran 2008コードは可読性を重視し,Esopeと同等の抽象化レベルを維持する。
    • 提案手法の利点,限界,保守性,スケーラビリティについて考察した。

    Link: https://arxiv.org/abs/2601.21755

  • 主観的歪み:記憶を持つ歪み関数に対する達成可能性と上限 [cs.IT, math.IT]目的:記憶を持つ歪み関数におけるレート歪みトレードオフ
    • 情報理論は,効率的な情報伝送や圧縮の限界を明らかにする上で重要である。
    • 過去の情報が現在の忠実度に影響する場合,従来のレート歪み理論では対応が難しい。
    • 過去の表現に依存する歪み関数に対するレート歪みトレードオフの上界と下界を確立すること。
    • 過去の行動が影響する歪み関数の問題定義を形式化し,達成可能なレートと上限を導出した。
    • 問題の凸化を検討することで,より容易に限界を見つける方法を提案した。
    • 生物学的情報処理やレコメンデーションエンジンへの応用例を示し,実用性を示唆した。

    Link: https://arxiv.org/abs/2601.21757

  • ソフトウェア工学におけるピアレビューの持続可能な未来に向けて [cs.SE]目的:ソフトウェア工学におけるピアレビューの持続可能性向上
    • 科学的成果の質を保証する上で,ピアレビューは不可欠な仕組みである。
    • 論文投稿数の急増に対し,十分なレビューアーの確保が課題となっている。
    • ピアレビュー体制の拡張と質の維持を目指す。
    • ソフトウェア工学コミュニティにおけるレビューアー不足が深刻化しており,研究の発展を阻害するリスクがある。
    • 新規レビューアーの育成,インセンティブの付与,AIツールの導入によって,よりスケーラブルで強靭なピアレビュープロセスを構築することが重要である。
    • 将来のソフトウェア工学研究環境において,包括的かつ持続可能なピアレビューシステムの実現が不可欠である。

    Link: https://arxiv.org/abs/2601.21761

  • 大規模言語モデルのビジネスプロセスモデリング能力評価 [cs.SE, cs.AI]目的:大規模言語モデルが生成したビジネスプロセスモデルの能力
    • ビジネスプロセスモデリングは,業務効率化や自動化に不可欠であり,企業の競争力向上に貢献する。
    • 既存の研究では,大規模言語モデルが生成したモデルの体系的な評価が不足しており,品質保証が課題となっている。
    • 大規模言語モデルのビジネスプロセスモデリングにおける強みと弱みを特定し,改善の方向性を示す。
    • 大規模言語モデルは,構文品質とプラグマティック品質において優れた性能を発揮する。
    • しかし,セマンティック品質においては,人間の専門家の方が高い性能を示す。
    • この結果は,大規模言語モデルのビジネスプロセスモデリングへの応用可能性と,更なる改善の必要性を示唆する。

    Link: https://arxiv.org/abs/2601.21787

  • ソフトウェア工学における伝承:定義と概念的基盤 [cs.CL, cs.CL, cs.IR, cs.SE]目的:ソフトウェア工学における伝承の定義と概念的基盤
    • ソフトウェア開発はチームワークであり,暗黙知の共有が重要である。
    • 暗黙知は形式的に記録されにくく,誤った情報や迷信が伝承される可能性がある。
    • ソフトウェア開発における伝承を明確化し,有効なヒューリスティクスを維持する。
    • ソフトウェア工学における伝承は,ナラティブ,神話,儀式,ユーモア,非公式な知識を含むものと定義された。
    • 事例研究から,欠陥の発生場所に関する信念や「10倍のデベロッパー」伝説などの伝承項目が抽出された。
    • 伝承は,職業上のアイデンティティ,価値観,集団的知識を形成する役割を担うことが示された。

    Link: https://arxiv.org/abs/2601.21814

  • SMTソルバーを用いた最適ソフトウェアパイプライン構築 [cs.CL, cs.PL]目的:最適ソフトウェアパイプラインの構築
    • VLIWプロセッサの性能向上に不可欠であり,命令レベル並列性を最大限に引き出す技術である。
    • 従来のソフトウェアパイプラインは,経験則に頼ることが多く,最適解が得られない場合がある。
    • SMTソルバーを用いることで,経験則に頼らずに最適解を探索し,パイプラインの限界を明確にすることを目的とする。
    • 提案手法は,経験的な手法や手動最適化と比較して,有意に高い性能を示すことが示された。
    • SMTソルバーは,特定の開始間隔でのソフトウェアパイプラインの実行不可能性に関する情報をプログラマやプロセッサ設計者に提供できる。

    Link: https://arxiv.org/abs/2601.21842

  • 予測精度と在庫KPIの連携:シミュレーションに基づくソフトウェアフレームワーク [cs.AI, cs.SE]目的:予測精度と在庫管理KPIの関連性の評価手法
    • 自動車部品のアフターマーケットでは,需要の変動が大きく,適切な在庫管理が重要である。
    • 従来の予測モデルの評価は,統計的な精度のみに焦点を当て,実際の運用パフォーマンスとの関係が不明確である。
    • 予測モデルの精度向上と在庫管理KPIの改善を結びつけ,運用上の関連性を評価するためのフレームワークを構築する。
    • シミュレーションの結果,従来の精度指標の改善が必ずしも運用パフォーマンスの向上に繋がらないことが示された。
    • 統計的な誤差プロファイルが類似するモデルでも,コストとサービスレベルのトレードオフに大きな違いが生じることが明らかになった。
    • 予測パフォーマンスの特定の側面が在庫結果にどのように影響するかを分析し,モデル選択のための指針を得た。

    Link: https://arxiv.org/abs/2601.21844

  • 共謀下における逐次データ公開の適応的プライバシー [cs.IT, math.IT]目的:逐次データ公開におけるプライバシーと有用性のトレードオフ
    • データ活用とプライバシー保護は重要であり,そのバランスが課題となっている。
    • 単発のデータ公開向けメカニズムは,逐次公開には適用困難である。
    • 複数の主体間の共謀を考慮した,適応的なデータ公開アルゴリズムを開発する。
    • 本研究では,期待される歪みを有用性の指標とした場合,最適なデータ公開が可能となる。
    • また,相互情報量で有用性を評価する場合には,局所的に最適な公開戦略が得られる。
    • 機械学習への応用可能性についても議論しており,今後の発展が期待される。

    Link: https://arxiv.org/abs/2601.21859

  • ノード識別子が存在する場合におけるグラフニューラルネットワークの表現力 [cs.LO, cs.LG]目的:グラフニューラルネットワークの表現力
    • グラフ構造データ分析において,グラフニューラルネットワークは広く用いられている。
    • ノード識別子のような特徴量がグラフに含まれる場合,その影響は明確ではなかった。
    • ノード識別子に依存しないグラフ構造に関するクエリを表現できる範囲を調査する。
    • 本研究では,ローカルmax- or sum-aggregationを持つ様々なクラスのGNNに対する結果が得られた。
    • グラフニューラルネットワークのキー不変表現力に関する初期的な研究を行った。
    • これにより,有限モデル理論における順序不変定義可能性との関連性が示された。

    Link: https://arxiv.org/abs/2601.21882

  • エントロピーに基づく次元に依存しない収束と,拡散モデルのための損失適応スケジュール [cs.LG, cs.IT, math.IT]目的:拡散モデルにおける次元に依存しない収束の理論的限界と,効率的な離散化スケジュールの提案
    • 拡散モデルは高品質なサンプル生成が可能であり,画像生成などの分野で重要な役割を担っている。
    • 従来の収束解析は環境次元に依存し,より良い収束率を得るには幾何学的制約が必要であった。
    • 幾何学的制約なしに次元に依存しない収束を達成し,より効率的なサンプリング手法を開発すること。
    • 提案手法により,目標分布と生成分布間のKLダイバージェンスは$O(H^2/K)$で抑えられることが示された (Hはエントロピー,Kはサンプリングステップ数)。
    • 損失適応スケジュール (LAS) を提案し,訓練損失のみを用いて効率的な逆SDEの離散化が可能となった。
    • 実験的に,LASは一般的なヒューリスティックなスケジュールと比較してサンプリング品質を向上させることが確認された。

    Link: https://arxiv.org/abs/2601.21943

  • 古典的計画におけるドメインモデル設計のエネルギー影響 [cs.AI, cs.SE]目的:ドメインモデル特性と古典的プランナのエネルギー消費の関係
    • AI研究において,エネルギー消費は重要な性能指標として認識されつつある。
    • 自動計画は計算資源を多く消費するが,エネルギー効率への注目は十分ではない。
    • ドメインモデル設計を通じたエネルギー消費量の体系的な分析を可能とする。
    • ドメインレベルの変更は,プランナ間で測定可能なエネルギー消費の差を生み出すことが示された。
    • エネルギー消費量は,必ずしも実行時間と相関しないことが明らかになった。
    • ドメインモデルの要素順序,アクションのarity,デッドエンド状態などが影響を与える。

    Link: https://arxiv.org/abs/2601.21967

  • 適応的に堅牢なリセット可能なストリーミング [cs.DS]目的:リセット可能なストリーミングにおけるアルゴリズム
    • データストリーム処理は,大量データを効率的に分析する上で不可欠である。
    • 既存のストリーミングアルゴリズムは,巧妙な攻撃に対して脆弱である可能性がある。
    • 適応的な攻撃に対する堅牢性を備えたストリーミングアルゴリズムの構築。
    • リセット可能なストリーミングに対する初の適応的に堅牢なスケッチを提案した。
    • 提案手法は,ストリーム長の対数オーダーの空間複雑度を維持する。
    • 差分プライバシーとバイナリツリーメカニズムを組み合わせることで実現した。

    Link: https://arxiv.org/abs/2601.21989

  • 液体インターフェース:自律システムの相互運用性に関する動的なオントロジー [cs.AI, cs.SE]目的:自律システムの相互運用性に関する動的なオントロジー
    • 自律システムの普及に伴い,柔軟な連携基盤の必要性が高まっている。
    • 従来のシステム統合は静的なインターフェースに依存しており,適応性に欠ける。
    • 実行時の意図表明と意味的交渉を通じてインターフェースを生成する。
    • 液体インターフェースは,永続的な技術的成果物ではなく,実行時に出現する関係イベントとしてインターフェースを捉える。
    • 意図に基づく相互作用,交渉による実行,および意味的不確実性下での一時性を規定する液体インターフェースプロトコル(LIP)を提案する。
    • このアプローチのガバナンスに関する考察と,実用的な実現可能性を示す参照アーキテクチャを示す。

    Link: https://arxiv.org/abs/2601.21993

  • Transformer推論におけるレート歪み最適化 [cs.LG, cs.IT, math.IT]目的:Transformer推論の効率化のための損失圧縮手法
    • Transformerは高性能だが,計算資源とメモリを大量に消費する
    • 推論時の計算負荷軽減が課題であり,中間表現の圧縮が求められる
    • レート歪み理論に基づき,精度と圧縮率のトレードオフを最適化する
    • 提案手法は,言語ベンチマークにおいて大幅な計算量削減を実現した。
    • 一部のケースでは,既存手法よりも高い精度を達成した。
    • Transformerのレート歪み特性を分析し,表現符号化における理解を深めた。

    Link: https://arxiv.org/abs/2601.22002

  • 「より良い」プロンプトが逆効果になる場合:LLMアプリケーションのための評価駆動型反復 [cs.CL, cs.AI, cs.IR, cs.SE]目的:LLMアプリケーションの評価方法と改善
    • LLMの進化は,様々な分野で応用を可能にする一方で,その評価方法が確立されていない。
    • LLMの出力は確率的で多次元であり,プロンプトやモデル変更に敏感であるため,従来のソフトウェアテストとは異なる。
    • 評価を通じてLLMの挙動を分析し,プロンプトを改善することで,より信頼性の高いアプリケーションを開発することを目指す。
    • LLMアプリケーションの評価ワークフロー「定義,テスト,診断,修正」を提案し,評価の反復的改善を可能にする。
    • 汎用的な「改善された」プロンプトテンプレートが,タスク固有のプロンプトと比較して,性能を低下させる場合があることを実証した。
    • 評価駆動型のプロンプト反復と,普遍的なプロンプトレシピに頼るのではなく,慎重な性能評価の重要性を強調する。

    Link: https://arxiv.org/abs/2601.22025

  • マルチンゲール推定器を超えて:問い合わせ型更新システムにおける情報鮮度の最大化のための構造化推定器 [eess.SY, cs.SY, cs.IT, cs.SY, eess.SY, math.IT]目的:問い合わせ型更新システムにおける情報鮮度の最大化
    • リモート推定システムは,リアルタイムな情報に基づいた意思決定に不可欠であり,その性能向上が重要である。
    • 従来のマルチンゲール推定器は解析が容易だが,最適性に欠け,特に問い合わせ型システムでは改善の余地がある。
    • MAP推定器の特性を維持しつつ解析可能な構造化推定器を開発し,情報鮮度を向上させることを目指す。
    • 本研究では,マルチンゲール推定器とMAP推定器の中間的な構造化推定器を導入し,その解析可能性を示した。
    • 時間可逆CTMCにおいて,MAP推定器が$p$-MAP推定器に簡約化されることを示した。
    • 構造化推定器を用いた場合,バイナリ鮮度プロセスに基づき,平均バイナリ鮮度を最大化する最適なサンプリングポリシーを導出した。

    Link: https://arxiv.org/abs/2601.22098

  • SWE-Replay:ソフトウェアエンジニアリングエージェントにおける効率的なテスト時スケーリング [cs.SE, cs.AI, cs.LG]目的:ソフトウェアエンジニアリングエージェントのテスト時スケーリングにおける効率化
    • ソフトウェア開発の自動化において,大規模言語モデル(LLM)エージェントの活用が重要となっている。
    • 既存のテスト時スケーリング手法は計算コストが高く,効率性に課題があった。
    • 過去の軌跡を再利用することで,計算コストを削減し,効率的なスケーリングを実現する。
    • SWE-Replayは,SWE-Bench Verifiedにおいて,単純なスケーリング手法を上回り,コストを最大17.4%削減した。
    • パフォーマンスは維持,あるいは最大3.8%向上し,効率性と有効性が確認された。
    • SWE-Bench ProとMultilingualでの評価により,SWE-Replayの汎用性が検証された。

    Link: https://arxiv.org/abs/2601.22129

  • ワークフローの世界:エンタープライズシステムへのワールドモデル導入のためのベンチマーク [cs.AI, cs.SE]目的:エンタープライズシステムにおけるワールドモデルの導入可能性評価
    • 企業活動は複雑なワークフローに依存しており,その最適化は生産性向上に不可欠である。
    • 既存のベンチマークは表面的なタスク達成に偏っており,隠れたワークフローの影響を考慮していない。
    • 隠れたワークフローがもたらす連鎖的な影響を予測し,信頼性の高いエージェントを実現すること。
    • 最先端のLLMは,複雑なエンタープライズシステムにおいて,行動の隠れた連鎖的影響を予測することが困難であることが示された。
    • 信頼性の高いシステム運用には,エージェントが隠れた状態遷移をシミュレートし,可視性のギャップを埋める, grounded world modeling が必要である。
    • 本研究は,システムダイナミクスの明示的な学習を促し,より有用なエンタープライズエージェントの実現を目指す新たなパラダイムを提唱する。

    Link: https://arxiv.org/abs/2601.22130

  • StepShield:逸脱エージェントへの介入時期:介入の有無ではない [cs.LG, cs.AI, cs.CR, cs.SE]目的:エージェントの逸脱検出時期の評価
    • AIエージェントの安全性確保は,社会実装において不可欠であり,その評価基準の重要性が増している。
    • 既存の安全性評価は,単に逸脱の有無を測るのみで,早期介入の可能性を考慮していない。
    • 本研究は,逸脱検出の「時期」を評価することで,より実用的な安全性評価基準を確立することを目的とする。
    • StepShieldは,9,213件のコードエージェントの軌跡データセットであり,リアルな逸脱率8.1%を含む。
    • LLMベースの判定器は,静的解析器と比較して2.3倍高い早期介入率(59%)を示し,標準的な精度指標では見過ごされる差を明らかにした。
    • 早期検出は経済的利益をもたらし,HybridGuard検出器は監視コストを75%削減し,5年間で1億800万ドルの累積節約が見込まれる。

    Link: https://arxiv.org/abs/2601.22136

  • AI 部品表(AI BOM)の作成:SPDX 3.0 を活用した包括的ガイド [cs.SE, cs.AI, cs.CR]目的:AI およびデータセット部品表の作成
    • ソフトウェアサプライチェーンの透明性とセキュリティ確保が重要視されている。
    • AI プロジェクト特有の課題に対応できる部品表の定義が不足している。
    • AI 開発における透明性,セキュリティ,コンプライアンスを向上させる。
    • 本研究では,AI BOM の概念を提案し,従来の SBOM を拡張した。
    • AI BOM は,アルゴリズム,データ収集方法,ライセンス情報などを包含する。
    • これにより,AI プロジェクトの信頼性と安全性を高めることが期待される。

    Link: https://arxiv.org/abs/2504.16743

  • ハイパーグラフサンプラー:典型的な振る舞いと最悪のケース [cs.DS, cs.CC, math.CO]目的:決定問題におけるランダム化アルゴリズムのエラー減少に関する,k-均一ハイパーグラフの有用性と限界
    • ランダム化アルゴリズムの信頼性を高めるために,エラー減少手法の研究が重要である。
    • エラー減少のための効率的なサンプリング手法が十分には確立されていない。
    • ハイパーグラフを用いたサンプリングがエラー減少に及ぼす影響を明らかにすること。
    • 単一側エラー減少において,ハイパーグラフのエッジ数には下限が存在し,エラー減少に必要なランダムビット数にも限界があることが示された。
    • 頂点次数が適切な分布を持つ場合,多くのケースにおいてハイパーグラフを用いたサンプリングは,独立同一分布からのサンプリングとほぼ同等の性能を示すことが示された。
    • この結果は,分散器や頂点拡張器に関する新たな下界を示唆する。

    Link: https://arxiv.org/abs/2601.20039

  • 最大エントロピー遠隔サンプリングにおける拡張NLP境界 [math.OC, cs.IT, cs.LG, math.IT]目的:最大エントロピー遠隔サンプリング問題における上限の改善
    • 不確実性下での情報源の選択は,様々な意思決定問題において重要である。
    • 既存の上限計算手法では,計算効率や適用可能な行列の条件に限界があった。
    • より厳密で,より広範な条件で適用可能な上限を導出すること。
    • 提案手法である拡張NLP境界は,従来のNLP境界を厳密に上回ることが理論的に保証された。
    • ランク落ちする共分散行列に対しても,条件を満たす場合に上限を導出できるようになった。
    • 対角スケーリング技術と組み合わせることで,ベンチマーク問題において最先端の結果が得られた。

    Link: https://arxiv.org/abs/2601.20970

  • 疎なグラスマン多様体設計:シューベルト細胞分解による非コヒーレント符号 [eess.SP, cs.IT, math.IT]目的:非コヒーレント多入力多出力システム向け疎なグラスマン符号の設計
    • 無線通信において,高効率な符号化は通信距離や信頼性を向上させる上で重要である。
    • 従来の符号設計は,信号のランク不足を考慮しておらず,性能劣化を招く可能性がある。
    • シューベルト細胞分解の数学的疎性を利用し,高性能な疎な非コヒーレント符号の設計を目指す。
    • 本研究で提案する疎な非コヒーレント符号は,従来の方式と比較して,誤り率と相互情報量の両方で性能が向上する。
    • 提案手法は,高信号対雑音比領域において,最適なグラスマン多様体星座の性能に漸近的に近づく。
    • また,送信アンテナ数に比例しない計算量とメモリ使用量の削減を実現する。

    Link: https://arxiv.org/abs/2601.21009

  • 積分行列によって生成される符号の重み列挙子の周期性 [math.CO, cs.IT, math.IT]目的:誤り訂正符号の評価における重み列挙子の周期性に関する研究
    • 誤り訂正符号は,デジタル情報の信頼性確保に不可欠であり,その性能評価が重要である。
    • 重み列挙子の計算は複雑であり,効率的な計算手法が求められている。
    • より小さな整数剰余環での計算に帰着させることで,重み列挙子の計算を効率化することを目指す。
    • 重み列挙子を準多項式とみなすことで,最小重みの計算をより簡単な問題に帰着させることができた。
    • Tutte準多項式と重み列挙子の間の変換公式が得られた。
    • matroid $N_k$ と $Z_k$ に関連する符号の最大重み符号語の数を計算し,対応する超平面配置の特性準多項式を算出した。

    Link: https://arxiv.org/abs/2601.21121

  • トムソンサンプリング:正確な腕選択の動態と適応的推論 [math.ST, cs.IT, cs.LG, math.IT, stat.ML, stat.TH]目的:トムソンサンプリング型アルゴリズムにおける腕選択の動態の精密な解析
    • 多腕バンディット問題は,様々な意思決定問題のモデルとして重要であり,効率的な探索と活用戦略が求められる。
    • 適応的サンプリングは複雑な依存関係を生み出し,従来の推論手法の妥当性が損なわれる場合がある。
    • 腕選択の動態を明らかにすることで,不安定な状況下でも信頼性の高い推論を可能にする方法を探求する。
    • トムソンサンプリングにおいて,腕選択回数が漸近的に決定論的となるのは,腕が劣最適または唯一の最適腕の場合に限られることが示された。
    • それ以外の場合,腕選択回数は確率微分方程式の不変則に収束し,安定性と不安定性の二分法が明らかになった。
    • 腕の平均報酬は,安定な腕に対してはガウス分布に従い,不安定な腕に対しては半普遍的な非ガウス分布に従うことが示された。

    Link: https://arxiv.org/abs/2601.21131

  • 弱相互作用量子スピン系の効率的アルゴリズム [quant-ph, cs.CC, cs.DS, math.CO]目的:弱相互作用量子スピン系の分割関数と熱分布の近似計算
    • 量子多体系問題は,物性物理学において基礎的であり,新機能材料の探索に不可欠である。
    • 厳密解が得られない場合が多く,計算コストが高いことが課題である。
    • 弱相互作用系における効率的な近似アルゴリズムを開発し,計算可能性を向上させる。
    • 任意の温度における分割関数に対する全多項式時間近似スキームを確立した。
    • 古典スピン空間上の熱分布に対する効率的な近似サンプリングスキームを開発した。
    • クラスタ展開法と近似計算から近似サンプリングへの標準的な還元を用いた。

    Link: https://arxiv.org/abs/2601.21140

  • 分散型自己調整ランダムウォークの基本的限界 [math.PR, cs.IT, math.IT]目的:分散型自己調整ランダムウォークの安定性限界
    • ネットワークシステムにおける分散制御の重要性が増しており,その安定性評価が不可欠である。
    • 既存研究では,ランダムウォークにおけるトークン制御の安定性条件が十分に解明されていない。
    • 本研究は,トークンベースの分散型システムにおける安定性を保証するための条件を導出することを試みる。
    • 自己調整ランダムウォークの定常的な分岐強度を,グラフ構造に依存するラプラス包絡線を用いて普遍的に評価した。
    • 消滅と爆発を回避するためには,生存可能性と安全性の不等式を満たす必要があることを示した。
    • これらの条件の下で,母集団が有限な範囲内に再帰的に収束することが確認された。

    Link: https://arxiv.org/abs/2601.21489

  • 核融合発電プラントのコスト算出フレームワーク [physics.soc-ph, cs.SE]目的:核融合発電プラントのコスト算出手法の確立
    • エネルギー問題解決のため,核融合発電の実用化が期待されており,コスト評価は不可欠である。
    • 初期のコスト算出手法は不確実性が高く,詳細な検証と標準化が求められていた。
    • より正確で透明性の高いコスト算出フレームワークを構築し,核融合発電の実用化を加速させる。
    • 本研究では,2017年から2024年にかけて行われた核融合発電プラントのコスト算出に関する成果を統合した。
    • コスト算出フレームワークは,初期の設備投資に焦点を当てたものから,国際原子力機関(IAEA)の基準に準拠した監査可能なものへと進化を遂げた。
    • 開発されたコスト算出コード(FECONs, pyFECONs)は,オープンソースとして公開され,標準化された勘定科目へのマッピングとLCOEの計算を可能にする。

    Link: https://arxiv.org/abs/2601.21724

  • ホモトピー型理論におけるライプニッツ随伴と,単体型理論への応用 [math.CT, cs.LO, math.LO]目的:単体型理論における高次コヒーレンスに関する性質の証明
    • ホモトピー型理論は,圏論と型の理論を結びつけ,数学的構造の厳密な基礎付けを提供する。
    • 単体型理論では,高次コヒーレンスの扱いが複雑であり,一般的な証明が困難である。
    • ライプニッツ随伴を用いることで,単体型理論における高次コヒーレンスを効率的に導き出す。
    • 単体型理論は,区間型を持つホモトピー型理論と見なすことができることが示された。
    • $(2,1)$-ホーンに対する一意な埋め込みが存在する場合,すべての内$(n,k)$-ホーンに対する一意な埋め込みが存在する。
    • 型のワイルド圏におけるライプニッツ随伴(プッシュアウト積はプルバックホムの左随伴である)を証明した。

    Link: https://arxiv.org/abs/2601.21843

  • エンタングルメント支援ボソン型MAC:達成可能なレートと隠密通信 [quant-ph, cs.IT, math.IT]目的:エンタングルメント支援ボソン型多重アクセスチャネルにおける隠密通信の達成可能なレート領域
    • 情報理論の発展は,通信システムの性能向上に不可欠であり,特に安全な通信技術の確立が重要である。
    • 従来の隠密通信は,チャネル容量の制限により,通信レートと安全性のトレードオフが存在する。
    • エンタングルメントを利用することで,このトレードオフを軽減し,より高い安全性を実現できる可能性を探る。
    • エンタングルメント支援ボソン型MACにおいて,高次の位相変調キーイング(PSK)を用いて,達成可能なレート領域を導出した。
    • 低光子数領域では,容量領域が長方形に縮小し,多重アクセス干渉が消失するにつれて,点対点容量と漸近的に一致することが示された。
    • エンタングルメント支援により,ブロック長nに対して,両送信者で\(O(\sqrt{n} \log n)\)の隠密スループットのスケーリングが可能となり,点対点の場合よりも優れた性能を発揮する。

    Link: https://arxiv.org/abs/2601.21869

  • 自由ビットを用いたソース符号化と多方向数値分割問題 [cs.DS, cs.IT, math.CO, math.IT]目的:二つの並列チャネルにおけるソース符号化手法
    • 情報伝送において効率的な符号化は,通信コスト削減に不可欠である。
    • コストの異なるチャネルを最適に利用する符号化手法は未確立である。
    • コスト差のある二チャネルにおける最適な符号化戦略を確立すること。
    • コストの異なる二つの並列チャネルを利用した可変長ソース符号化問題を完全に解決した。
    • この問題は数値分割問題と関連があり,二つの新しい目的関数を導入した。
    • 適応されたハフマン符号化アルゴリズムが,一つの目的関数に対して最適解,もう一つの目的関数に対してほぼ最適解を与えることが示された。

    Link: https://arxiv.org/abs/2009.02710

  • 金融ネットワークにおける動的な債務交換 [cs.DS, cs.CC, cs.GT, q-fin.RM]目的:金融ネットワークにおける債務交換の計算複雑性
    • 金融システムは経済活動の基盤であり,その安定性は社会全体に影響を及ぼす。
    • 金融ネットワークの複雑性により,債務交換の最適化は困難である。
    • 債務交換の計算複雑性を解明し,ネットワークの効率化を目指す。
    • 債務交換の系列において,特定の条件を満たす交換は多項式時間で完了することが示された。
    • 全探索が必要となる場合,問題はPLS完全であることが証明された。
    • 特定の債務交換系列における最適化問題は,近似がNP困難であることが示された。

    Link: https://arxiv.org/abs/2302.11250

  • 普遍量化は自動構造の決定を困難にする [cs.LO]目的:自動構造における普遍量化子の除去の困難性
    • 自動構造は,計算可能性理論において重要な役割を果たす構造であり,その決定可能性が研究されている。
    • 普遍量化子の除去は,自動構造の理論決定性を維持するために不可欠だが,指数関数的なコストを伴う場合がある。
    • 本研究は,普遍量化子の除去における計算複雑性の限界を明らかにすることを目的とする。
    • 自動関係を表すNFAにおいて,普遍量化子を一つ除去した後の最小NFAが,二重指数関数的に増大する事例が存在する。
    • 除去後の言語が空であるかを判定する問題は,EXPSPACE完全であることが示された。
    • この結果は,固定数の量化子交代数を持つB\"uchi算術の断片に対する新たな下界の確立にも貢献する。

    Link: https://arxiv.org/abs/2306.10432

  • OD-Stega:最適化された分布に基づくLLMを用いた比較的高セキュリティなステガノグラフィ [cs.IT, cs.AI, cs.CL, cs.CR, cs.LG, math.IT]目的:LLMを用いたテキスト埋め込みによるステガノグラフィ手法
    • 情報セキュリティにおいて,秘密情報を隠蔽する技術は重要な課題である。
    • 従来のステガノグラフィは,埋め込み容量や自然さの点で課題が残されている。
    • LLMの性質を利用し,より効率的かつ自然なステガノグラフィを実現する。
    • 提案手法は,次に来るトークンの生成確率分布の最適化により,少ないトークン数で秘密情報を埋め込むことを可能にした。
    • KLダイバージェンスまたは全変動制約下での解析解を提供し,実用的な課題への対応を示した。
    • トークン化の不一致問題の解決や,既存のステガノグラフィ技術との組み合わせも検討された。

    Link: https://arxiv.org/abs/2410.04328

  • アサインメント問題からゼロサムゲームへのフォン・ノイマン還元式の一般化 [cs.GT, cs.DS, econ.TH]目的:ゼロサムゲームへのアサインメント問題の還元式の一般化
    • ゲーム理論と最適化は,それぞれ重要な分野であり,互いに密接な関係がある。
    • フォン・ノイマンのミンマックス定理の証明は,プレイヤーの役割分担が明確でない点が課題であった。
    • 特定の条件下でのみ適用可能な既存の還元式を拡張し,より一般的な経済シナリオに対応する。
    • 本研究では,LPの目的関数や制約条件において負の要素を許容する還元式を提案した。
    • この還元式では,ゲームのプレイヤーの役割が明確になり,最適解がLPの解と対応することが示された。
    • さらに,還元されたゲームの値が,与えられたLPの値を直接示すことが明らかになった。

    Link: https://arxiv.org/abs/2410.10767

  • 空間結合LDPC符号のためのニューラルウィンドウデコーダ [cs.LG, cs.IT, math.IT]目的:空間結合低密度パリティチェック(SC-LDPC)符号のためのニューラルウィンドウデコーダ
    • 現代通信において,信頼性の高い誤り訂正符号は不可欠であり,SC-LDPC符号はその有力な候補の一つである。
    • 従来のウィンドウデコーダは計算量が多く,特にSC-LDPC符号のような複雑な符号化方式では処理速度が課題となる。
    • ニューラルネットワークを活用することで,デコーディング処理の効率化と性能向上を目指す。
    • 提案手法では,ニューラルウィンドウデコーダ(NWD)に学習可能なニューラル重みを組み込むことで,従来のウィンドウデコーダのプロセスを維持しつつ性能向上を実現した。
    • 損失関数をターゲットとなる変数ノードに制限し,アクティブラーニング技術を用いることで,訓練効率を向上させた。
    • 訓練結果に基づいた非一様なスケジュールを導出し,重要度の低いチェックノードの更新を省略することで,41%のチェックノード更新を削減し,性能劣化を防いだ。

    Link: https://arxiv.org/abs/2411.19092

  • GPUプログラムにおけるレイアウト合成を自動化するコンパイラフレームワークHexcute [cs.HC, cs.LG, cs.AI, cs.PL]目的:GPUプログラムのレイアウト合成の自動化
    • 深層学習の高性能化にはGPUプログラミングが不可欠であり,並列化とメモリ配置が重要である。
    • 既存のフレームワークでは,最適なレイアウトの指定に多大な労力がかかる場合がある。
    • Hexcuteは,レイアウト合成を自動化することで,その負担を軽減することを目指す。
    • Hexcuteは,GEMM,Attentionなどの性能において,cuBLASやFlashAttentionと同等の結果を得ている。
    • CUTLASSと比較して,コード量を1.27倍~7.94倍削減できることが示された。
    • MoE演算子ではTritonを6.46倍,vLLMではDeepSeek-R1-AWQで2.60倍,Mambaモデルで2.04倍の高速化を実現した。

    Link: https://arxiv.org/abs/2504.16214

  • 分配準関係代数とDInFL-代数に対する双対性理論と表現 [cs.MA, cs.DC, cs.LO]目的:分配準関係代数とDInFL-代数の双対性
    • 関係代数や論理代数の基礎をなす重要な代数構造であり,理論的展開が求められる。
    • 完全性や完全性に関する双対性理論が十分に確立されていなかった。
    • 分配準関係代数とDInFL-代数の完全な双対性理論を確立し,表現可能性を考察する。
    • 完全な分配準関係代数と完全な分配的 involution FL-代数の双対性が部分順序フレームを用いて確立された。
    • これらのフレームは,関係代数研究における原子構造と類似性を持つ。
    • ある種の代数は表現可能な関係代数の項部分構造として実現され,表現可能であることが示された。また,6以下のサイズの代数に対する既知の表現が詳細に説明された。

    Link: https://arxiv.org/abs/2505.07789

  • オープンソースソフトウェアサプライチェーンにおけるアクター評価指標システムの展望:ARMS [cs.CR, cs.SE]目的:オープンソースソフトウェアサプライチェーンにおけるアクターのセキュリティ評価指標
    • 現代社会の基盤である情報システムは,オープンソースソフトウェアに依存している。
    • 外部からの貢献者のセキュリティリスク評価は困難であり,脆弱性の温床となりうる。
    • 貢献者のセキュリティ評判を評価する指標体系を確立し,サプライチェーンの安全性を高める。
    • 本研究では,アクター評価指標システム(ARMS)の実現に向け,業界標準に基づく7つのセキュリティ信号を特定した。
    • 既存研究やセキュリティツールから具体的な指標を抽出し,ARMSの有用性を検証するための研究設計を提案した。
    • ARMSの導入による利点と課題を検討し,オープンソースエコシステムへの組み込み可能性を評価した。

    Link: https://arxiv.org/abs/2505.18760

  • 記述に基づいた分岐整合性解析による非回帰テストケース生成フレームワーク [cs.SE]目的:記述に基づいた分岐整合性解析による,欠陥を考慮したテストケース生成
    • ソフトウェアの信頼性確保において,テストは不可欠であり,特に既存機能の回帰テストは重要である。
    • 従来の自動テスト生成は,対象メソッドの正当性を前提としており,欠陥を含む場合のテスト効果が低いという課題がある。
    • 自然言語によるコードの説明を活用し,LLMをより効果的な欠陥検出に導くテスト生成手法を開発することを目指す。
    • DISTINCTは,コンパイル成功率を平均14.64%向上させ,合格率を6.66%向上させた。
    • 特にDefects4J-Descベンチマークにおいて,欠陥検出率が149.26%という顕著な改善を見せた。
    • ステートメントカバレッジは平均3.77%,ブランチカバレッジは5.36%向上し,非回帰テスト生成の新たな基準を確立した。

    Link: https://arxiv.org/abs/2506.07486

  • ソフトウェアはインフラである:失敗,成功,コスト,そして形式検証の必要性 [cs.CL, cs.SE, cs.CY]目的:ソフトウェアの品質管理に関する費用と検証の重要性
    • 現代社会においてソフトウェアは不可欠であり,その品質は社会機能に直結する。
    • ソフトウェアの不具合は甚大な経済的損失や社会的問題を引き起こす可能性がある。
    • ソフトウェアの形式検証による品質向上と,そのコスト削減を目指す。
    • 過去40年間の主要なソフトウェア失敗事例のコストを分析し,その深刻さを明らかにした。
    • ソフトウェアの品質低下によるコストが,形式検証の研究と応用に値することを示した。
    • 産業界での成功事例を通して,形式検証の有効性を裏付けた。

    Link: https://arxiv.org/abs/2506.13821

  • 支配集合ナップサック:支配集合上の利益最大化 [cs.DS, cs.CC]目的:支配集合とナップサック問題を組み合わせた問題の最適解
    • 大規模ネットワークにおいて,限られた予算内で影響力のあるノードを選択し,利益を最大化する必要がある。
    • 選択したノードに隣接するノードへの予算配分を抑制しつつ,全体の利益を最大化する方法が課題である。
    • 予算内で,隣接ノードの選択を回避しつつ,最大の利益が得られるノード集合を見つける。
    • 支配集合ナップサック問題は,二部グラフでも強NP困難であり,スターグラフでは弱NP困難であることが示された。
    • 木構造グラフに対しては,時間計算量 $O(n\cdot min\{s^2, (\alpha(V))^2\})$ の擬似多項式時間アルゴリズムが提案された。
    • 解のサイズをパラメータとした場合,固定パラメータ困難(FPT)である可能性は低いことが証明された。

    Link: https://arxiv.org/abs/2506.24032

  • SDSC:セマンティック信号表現学習のための構造を考慮した指標 [cs.LG, cs.AI, cs.LO]目的:時間系列信号の自己教師あり表現学習のための構造を考慮した指標
    • 信号処理分野において,データの効率的な表現学習は重要であり,その性能は様々な応用分野に影響する。
    • 既存の自己教師あり学習法は,振幅に敏感で波形の極性に不変,スケールが無限大となり,セマンティックな整合性が低下しやすい。
    • 構造に着目した指標SDSCを用いることで,セマンティック表現の質を向上させ,従来の距離ベースの手法に代わる選択肢を提供する。
    • SDSCは,署名付き振幅の交差に基づく構造的合意を定量化することで,信号のセマンティックアライメントを改善する。
    • SDSCを損失関数として利用し,MSEとのハイブリッド損失を提案することで,学習の安定性と振幅の保持を両立した。
    • 予測および分類ベンチマークにおいて,SDSCベースの前学習は,特に同一ドメインおよび低リソース環境でMSEと同等またはそれ以上の性能を達成した。

    Link: https://arxiv.org/abs/2507.14516

  • 様相論理における不動点公式の定義と分離の複雑性 [cs.LO]目的:様相論理における不動点公式の分離可能性
    • 様相論理は,知識,信念,時間などの概念を形式的に扱う上で不可欠な論理体系である。
    • 不動点公式の分離可能性問題は,計算複雑性が高く,解決が困難である。
    • 本研究は,様々なモデルクラスにおける分離可能性の計算複雑性を明らかにすることを目的とする。
    • 単語モデル(アウトディグリー≤1)上では分離可能性はPSpace-完全であることが示された。
    • 制約なしまたは二分モデル上ではExpTime-完全であり,アウトディグリーが$d\geq 3$で制限されたモデル上ではTwoExpTime-完全である。
    • アウトディグリー制限付きモデルでは,クラフト補間特性が成立しないことが示され,補間存在問題の複雑性も解析された。

    Link: https://arxiv.org/abs/2509.24583

  • 棄権と検証:エージェントによるプログラム修理におけるノイズを削減するための二重LLMポリシー [cs.SE, cs.AI]目的:エージェントによるプログラム修理におけるノイズ削減策
    • ソフトウェア開発におけるバグ修正は,品質と効率に不可欠であり,自動化のニーズが高い。
    • 自動プログラム修理システムは,修正候補の精度に課題があり,誤った修正が開発者の負担となる。
    • 本研究は,LLMを用いたポリシーにより,不適切なバグや修正候補を排除し,開発者の時間を節約する。
    • 提案する二重LLMポリシー(バグ棄権と修正検証)は,Googleのコードベースにおけるバグ修正において有効であることが示された。
    • これらのポリシーを適用することで,成功率が最大13%及び15%向上し,組み合わせることで最大39%の改善が見られた。
    • 機械生成されたバグ報告を用いた実験でも,修正検証が単一サンプルの成功率向上に貢献することが確認された。

    Link: https://arxiv.org/abs/2510.03217

  • 統合レンダリング・通信を用いたエッジ協調ガウススプラッティング [cs.CL, cs.IT, cs.CV, math.IT]目的:低コストデバイスにおけるガウススプラッティングのレンダリング品質低下の改善
    • ガウススプラッティングは高品質な3D表現を実現するが,計算コストが高い。
    • 低コストデバイスでは,ガウススプラッティングの品質が低下しやすいという課題がある。
    • エッジコンピューティングを活用し,レンダリングと通信を最適化することで品質向上を目指す。
    • 提案手法(ECO-GS)では,ローカルモデルとリモートモデルを使い分け,リアルタイム性と高品質を両立する。
    • レンダリング要件とリソース状況を考慮し,最適な協調状態とエッジパワー配分を決定する。
    • ペナルティ主要化最小化法(PMM)と模倣学習最適化法(ILO)により,効率的なアルゴリズムを実現した。

    Link: https://arxiv.org/abs/2510.22718

  • クロスバンドチャネルインパルス応答予測:3.5GHzチャネルを利用した上中帯域への応用 [cs.IT, math.IT]目的:6Gネットワークにおけるクロスバンドチャネル予測手法の開発
    • 6Gネットワークの実現には,より高い周波数帯域の活用が不可欠であり,そのためのチャネル特性把握が重要である。
    • 高周波数帯域では電波の減衰や遮蔽が激しく,正確なチャネル測定が困難である。
    • 3.5GHz帯の情報を活用することで,高周波数帯域のチャネル特性を効率的に予測し,測定コストを削減することを目指す。
    • 提案手法CIR-UNextは,未知の環境において,ゲイン誤差の中央値0.58dB,位相予測誤差0.27ラジアンを達成した。
    • CIR-UNextを基盤モデルChannel2ComMapに拡張し,MIMO-OFDMシステムにおけるスループット予測において既存手法を上回る性能を示した。
    • 本研究は,6Gネットワークにおけるローカライゼーション,ビーム管理,デジタルツイン,インテリジェントリソース割り当てなどの応用を可能にする。

    Link: https://arxiv.org/abs/2510.27349

  • 大規模言語モデルの信頼性評価における階層的あいまい確率アプローチ [cs.SE, cs.AI]目的:大規模言語モデルの信頼性評価
    • 多様な分野でのLLM利用拡大に伴い,その信頼性評価の重要性が高まっている。
    • 既存の評価方法は精度統計に偏重し,実運用における確率的挙動の把握が困難である。
    • 実運用環境下でのLLMの信頼性を確率的に評価し,不確実性を定量化することを目的とする。
    • HIP-LLMは,ソフトウェア信頼性工学に基づき,LLMの信頼性を将来のタスクにおける故障確率として定義する。
    • 階層的な依存関係をモデル化し,サブドメインからシステムレベルへの信頼性推論を可能にする。
    • 既存のベンチマークや最先端手法と比較して,より正確かつ標準化された信頼性評価を提供する。

    Link: https://arxiv.org/abs/2511.00527

  • コード言語モデルの知識蒸留に関する変態テストの視点:学生モデルは教師を深く模倣しているか? [cs.SE, cs.LG]目的:コード言語モデルの知識蒸留における行動的な忠実性の評価
    • コード言語モデルはソフトウェア分析タスクで高い性能を示すが,計算コストが大きい。
    • 従来の精度ベースの評価では,教師モデルと学生モデル間の行動のずれを捉えられない。
    • 変態テストを用いて,知識蒸留後の学生モデルの行動的な忠実性を評価する。
    • 提案手法MetaCompressは,知識蒸留された学生モデルの行動的な差異を最大62%検出した。
    • 学生モデルは教師モデルを十分に模倣しておらず,敵対的攻撃に対する性能低下が大きかった。
    • MetaCompressは,知識蒸留パイプラインにおける行動的な忠実性の評価に有用なフレームワークである。

    Link: https://arxiv.org/abs/2511.05476