arXiv雑要約

プログラム - 2025/12/16 公開

  • SE教育のための教育統制・カリキュラム制約型AIチューターの経験報告 [cs.CY, cs.AI, cs.HC, cs.SE]目的:SE教育におけるAIチューターの設計とパイロット評価
    • 教育分野において,個別最適化された学習支援への期待が高まっている。
    • AI技術の教育への導入は,過去の期待外れを繰り返しており課題が残る。
    • 大規模言語モデルを活用し,カリキュラムに沿ったAIチューターを開発し,その有効性を検証する。
    • 生徒は,安心して質問でき,段階的な指導を受けられる点を評価した。
    • 教員は,本システムが認知負荷を軽減し,授業を補完する可能性を指摘した。
    • 本研究は,モデルの再学習を必要としない,構造とプロンプトによるAI統合の現実的なアプローチを示す。

    Link: https://arxiv.org/abs/2512.11882

  • 実践におけるVibe Coding:フロー,技術的負債,そして持続可能な利用のためのガイドライン [cs.SE, cs.AI]目的:Vibe Codingにおけるフローと技術的負債の関係性
    • AI技術の発展により,ソフトウェア開発の効率化が期待されている。
    • Vibe Codingは迅速な開発を可能にするが,技術的負債の蓄積リスクがある。
    • Vibe Codingの持続可能な利用に向けた課題と対策を明らかにすること。
    • Vibe Codingは,自然言語による指示からコード生成を行うため,迅速なプロトタイピングに適している。
    • しかし,その過程でアーキテクチャの不整合やセキュリティ脆弱性など,技術的負債が蓄積される可能性がある。
    • モデル,プラットフォーム,ハードウェアの制約がこれらの問題の原因であり,対策を講じることで持続可能な利用を目指す。

    Link: https://arxiv.org/abs/2512.11922

  • ソフトウェアコンテナにおけるリスクと脆弱性に関する体系的マッピング研究 [cs.SE]目的:ソフトウェアコンテナにおけるリスクと脆弱性の知識体系
    • ソフトウェアコンテナは普及しているが,セキュリティ課題が顕在化している。
    • コンテナベースシステム開発・運用におけるセキュリティに関する体系的な知見が不足している。
    • コンテナシステムのセキュリティ課題の現状を把握し,今後の研究方向性を示す。
    • 本研究により,コンテナライフサイクル全体における主要なリスクと脆弱性が特定され,新たな分類体系が構築された。
    • リスクと脆弱性の原因と影響が明らかになり,それらを軽減するための手法が提示された。
    • コンテナシステムのセキュリティ強化に役立つセキュリティプラクティスとツールがまとめられた。

    Link: https://arxiv.org/abs/2512.11940

  • 研究ソフトウェア工学におけるAIモデル選択のためのエビデンスに基づく意思決定支援 [cs.SE, cs.AI]目的:研究ソフトウェア工学におけるAIモデル選択の支援
    • AI技術の急速な発展により,適切なモデルの選択が研究の質を左右する重要な課題となっている。
    • AIモデル選択は,断片的な情報や個人の経験に頼る傾向があり,再現性や透明性が損なわれる可能性がある。
    • エビデンスに基づいた意思決定支援により,AIモデル選択の透明性と再現性を向上させることを目指す。
    • 提案するフレームワークModelSelectは,専門家の判断と一致する信頼性,解釈可能性,再現性のある推奨を提供する。
    • ケーススタディにおいて,モデルとライブラリの推奨タスクにおいて高いカバレッジと強い根拠の一致を実現した。
    • 本研究は,研究ソフトウェア工学における透明性と再現性のある意思決定支援のための厳密な基盤を確立する。

    Link: https://arxiv.org/abs/2512.11984

  • 情報鮮度コスト最小化のための方策勾配アルゴリズム [cs.NI, cs.IT, cs.LG, math.IT]目的:サイバー物理システムにおける情報更新プロセスの最適化
    • サイバー物理システムにおいて,物理環境に関する情報の鮮度が重要性を増している。
    • IoTデバイスへのアクセス方針を最適化し,情報鮮度を最大化することは困難である。
    • 伝送遅延やコスト関数が不明な状況下でも,情報鮮度コストを最小化する手法を提案する。
    • 提案アルゴリズムは,モデルフリー強化学習に基づき,連続的な状態・行動空間に対応する。
    • 最適値が計算可能な場合,提案アルゴリズムは最適値の3%以内の時間平均コストを達成する。
    • 既存手法と比較して,適用範囲の広さ,時間平均コストの低さ,計算コストの削減において優位性を示す。

    Link: https://arxiv.org/abs/2512.11990

  • AI支援開発によるオープンソース科学の再構築 [cs.SE]目的:オープンソース科学ソフトウェアの再構築
    • 科学研究の透明性と再現性を高める上で,オープンソースソフトウェアは不可欠である。
    • 既存のオープンソース科学ソフトウェアは複雑すぎて,修正が困難な場合が多い。
    • AIを活用し,複雑なコードベースを迅速かつ堅牢に修正することで,科学コミュニティへの再貢献を目指す。
    • AIエージェントチームと人間の協働により,大規模なC++コードベース(STAR-Flex)への機能追加(16,000行)を成功させた。
    • STAR-Flexは,Flexデータ処理機能を備えた初のオープンソースソフトウェアであり,STARの機能を維持しつつ拡張を実現した。
    • 本研究は,NIHのMorPHiCコンソーシアムによって資金提供され,オープンソース科学の発展に貢献する。

    Link: https://arxiv.org/abs/2512.11993

  • エッジ数推定のための最適非適応アルゴリズム [cs.DS, math.CO]目的:グラフのエッジ数推定手法
    • 大規模グラフの分析において,エッジ数は基本的な情報であり,様々な計算の基礎となる。
    • グラフのエッジ数を正確に推定するには,全エッジの探索が必要となり,計算コストが高い。
    • 次数とランダムエッジクエリのみを用いて,少ないクエリ数でエッジ数を推定すること。
    • 提案アルゴリズムは,次数クエリとランダムエッジクエリのみを使用し,$\widetilde{O}(\sqrt{n})$ のクエリ数でエッジ数を推定できる。
    • このクエリ複雑性は,非適応クエリモデルにおいて最適であることが証明された。
    • 本研究は,グラフのエッジ数推定問題に対する非適応クエリ複雑性の限界を明らかにした。

    Link: https://arxiv.org/abs/2512.11994

  • MVP-ORAM:機密BFTストレージのための待機不要型並行ORAM [cs.CR, cs.DC, cs.DS]目的:機密性の高いBFTストレージのための,待機不要型の並行ORAMの実現
    • データのプライバシー保護において,暗号化だけでは不十分であり,アクセスパターンが推論攻撃の対象となりうる。
    • 既存のORAMプロトコルは,並行クライアントやビザンチンフォールトトレランスのサポートに限界があった。
    • 信頼できるプロキシやクライアント間通信による複雑な並行制御を避け,待機不要性を実現すること。
    • MVP-ORAMは,クライアント間の干渉や障害に左右されず,並行リクエストの処理と競合する更新のマージを可能にする。
    • 従来のORAMのセキュリティモデルを緩和することで,実用的なシナリオにおける安全性を証明した。
    • 機密BFTデータストア上にMVP-ORAMを実装したプロトタイプは,最新のクラウド環境で毎秒数百件の4KBアクセス処理が可能であることを示した。

    Link: https://arxiv.org/abs/2512.12006

  • エンタープライズシステムへの量子ソフトウェア組み込みのための参照アーキテクチャ [cs.SE]目的:エンタープライズシステムへの量子ソフトウェア組み込みのための参照アーキテクチャ
    • 量子計算は特定の計算負荷の高い問題に対し,飛躍的な性能向上が期待される分野である。
    • エンタープライズシステムのソフトウェアアーキテクチャは,量子コンピューティングサービスとの連携において特有の考慮事項が必要とされる。
    • 本研究は,エンタープライズシステムへ量子ソフトウェアを組み込むための安定した再利用可能なパイプラインを提供することを目指す。
    • 提案アーキテクチャは,疎結合分散サービスから構成され,量子に依存するタスクとそうでないタスクを実装する。
    • これらのサービスはビジネスドメインや量子アルゴリズムに依存するものの,実行可能なBPMNモデルとして定義されたパイプラインによってオーケストレーションされる。
    • 提案アーキテクチャは,オペレーションズリサーチ分野の組み合わせ最適化問題に対するケーススタディで実証・評価された。

    Link: https://arxiv.org/abs/2512.12009

  • 単一サーバ待ち行列におけるバンディットに基づくレート適応 [eess.SY, cs.IT, cs.SY, math.IT]目的:部分フィードバック構造を持つ単一待ち行列システムにおける,時間平均期待待ち行列サイズの制限
    • 通信システムにおいて,効率的なリソース利用と品質保証は不可欠であり,待ち行列理論はその分析に貢献する。
    • チャネル容量が未知である状況下では,最適なレート制御が困難であり,待ち行列の蓄積が問題となる。
    • 未知の環境下で,待ち行列サイズを抑えつつ,効率的なレート選択を実現することを目指す。
    • 提案アルゴリズムは,レート空間の離散化を段階的に改善し,$\varepsilon$ に関する知識なしに,時間平均期待待ち行列サイズを$\mathcal{O}\!\big(\log^{3.5}(1/\varepsilon)/\varepsilon^{3}\big)$に抑える。
    • 任意のレート選択アルゴリズムにおいて,$\Omega(1/\varepsilon^{2})$の最悪ケースの時間平均期待待ち行列サイズが存在することが示された。
    • $\varepsilon$ が既知の場合,単純なUCB型ポリシーが,対数因子を除き,最適な性能$\mathcal{O}\!\big(\log(1/\varepsilon)/\varepsilon^{2}\big)$を達成する。

    Link: https://arxiv.org/abs/2512.12016

  • 高レベル関係モデルに対するハイパーモデル検査 [cs.SE, cs.CR]目的:高レベル関係モデルにおけるハイパープロパティの検証
    • セキュリティや並行性といったシステム特性の検証は重要であり,より高度な検証手法が求められている。
    • 既存のハイパープロパティのモデル検査手法では,ソフトウェア設計者が早期段階で検証を行うための高レベルな仕様言語が不足している。
    • アロイ言語を用いた設計モデルの早期段階におけるハイパープロパティの検証を可能にすること。
    • 本研究では,アロイ言語のTemporal Logic BackendであるPardinusを拡張した新しいモデル探索手続きHyperPardinusを提案した。
    • HyperPardinusは,既存のハイパープロパティ用低レベルモデルチェッカーを活用し,関係モデル上のハイパープロパティを自動的に検証する。
    • 評価の結果,複雑なハイパープロパティのモデリングと反例探索が可能となり,高度な検証シナリオに対応できることが示された。

    Link: https://arxiv.org/abs/2512.12024

  • h均一超グラフにおける差分プライバシーを用いたコミュニティ検出 [eess.SY, cs.SY, cs.IT, eess.SP, math.IT]目的:h均一超グラフにおける接続のプライバシー保護下での正確な復元閾値
    • グラフ構造の解析は,ソーシャルネットワーク,生物学的ネットワークなど幅広い分野で重要である。
    • プライバシー保護とデータ解析の同時達成は,現実世界のデータ分析における大きな課題である。
    • 超グラフにおけるコミュニティ検出におけるプライバシー保護の限界と最適なメカニズムの特定。
    • 安定性に基づく,サンプリングに基づく,摂動に基づく3つの差分プライバシーメカニズムについて,正確な復元閾値を算出した。
    • プライバシー予算$(\epsilon, \delta)$に起因する正確な復元領域の収縮を調査した。サンプリングに基づくメカニズムは純粋な$\epsilon$-超グラフDPを保証する。
    • プライバシー予算の限界がh均一超グラフのパラメータにどのように依存するかを厳密に証明した。特に,安定性に基づくメカニズムとベイズサンプリングに基づくメカニズムでは,密度比に依存する。

    Link: https://arxiv.org/abs/2512.12031

  • BPMNモデル生成のための指示チューニングされたオープンウェイト言語モデル [cs.SE, cs.AI]目的:BPMNプロセスモデルの自動生成
    • ソフトウェア開発において,ドメインモデルは共通理解の促進や自動化に不可欠である。
    • モデル作成には専門知識と時間が必要であり,現場での実践が滞ることが課題である。
    • 自然言語記述から高品質なBPMNモデルを効率的に生成し,モデリングの障壁を解消する。
    • 指示チューニングにより,既存のオープンウェイトモデルを凌駕する性能を実現した。
    • 生成されたBPMN図は,構造的精度が高く,BPMNのベストプラクティスに準拠している。
    • 軽量なモデルでありながら,大規模なプロンプトを必要とせず,オンプレミスでの利用も可能である。

    Link: https://arxiv.org/abs/2512.12063

  • 公共部門AIにおける説明責任のための神経記号的フレームワーク [cs.CY, cs.AI, cs.LO]目的:公共部門AIの説明責任確保のためのフレームワーク
    • AIの公共サービス利用拡大に伴い,公平性・透明性の確保が重要課題となっている。
    • AIによる判断根拠の説明が法的根拠と乖離し,不当な判断を招く恐れがある。
    • 法的根拠に基づいた説明責任を確立し,AI判断の妥当性検証を可能にすること。
    • 本フレームワークは,カリフォルニア州のSNAP(CalFresh)における法的制約とAIの説明を関連付ける。
    • 州の政策マニュアルから資格要件の構造化オントロジーを構築し,法的論理を形式的に表現するパイプラインを開発した。
    • フレームワークは法的矛盾を検出し,資格規則違反を特定し,自動化された決定の根拠の追跡と異議申し立てを支援する。

    Link: https://arxiv.org/abs/2512.12109

  • 引用に基づくコード理解:ハイブリッド検索とグラフ拡張コンテキストによるLLMの幻覚防止 [cs.SE, cs.LG]目的:LLMのコード理解における幻覚の防止
    • ソフトウェア開発において,コードの理解は効率と品質に不可欠である。
    • LLMはコード理解に役立つが,誤った引用(幻覚)が信頼性を損なう。
    • 引用に基づいた検証可能なコード理解システムの構築を目指す。
    • ハイブリッド検索(BM25,BGE,Neo4j)が,単一の検索モードよりも14~18%高い精度を示した。
    • 特に,ファイル間の依存関係を考慮したグラフ拡張が,引用の完全性に大きく貢献した。
    • 提案手法は92%の引用精度を達成し,幻覚をゼロに抑えることに成功した。

    Link: https://arxiv.org/abs/2512.12117

  • 階層的モノイド理論 [cs.NI, cs.LO, math.CT]目的:複数のレベルでのシステム記述を組み合わせる,モノイド理論の一般化
    • 情報科学や数学において,システムの構造と振る舞いを形式的に記述する枠組みは不可欠である。
    • 従来のモノイド理論では,システムの複数の抽象レベルを統一的に扱うことが困難であった。
    • 異なる抽象レベル間の関係を明確にし,統一的な形式化を可能にすること。
    • 階層的モノイド理論を3つの異なる形式(オプファイブレーション,ファイブレーション,デフレーション)で定義した。
    • これらの形式は,再帰的に生成される構文を持ち,自由・忘却随伴関係を持つことが示された。
    • 有機合成化学における逆合成解析を,階層的モノイド理論を用いて形式化することに成功した。

    Link: https://arxiv.org/abs/2512.12139

  • スマートキャンパスにおけるスケーラブルなデジタルツイン展開のためのフレームワーク [cs.IT, cs.DL, math.IT]目的:スマートキャンパス施設管理におけるデジタルツインのスケーラブルな展開
    • キャンパス環境の効率的な施設管理は,教育・研究活動の基盤であり,重要性が高い。
    • 既存研究では,建物形状やエネルギー解析に焦点を当てがちで,統合的なワークフローが不足している。
    • 建物,設備,運用データを統合し,スケーラブルなデジタルツイン展開を実現することを目的とする。
    • 本フレームワークにより,設備情報の集中管理,システム可視性の向上,予防・是正メンテナンスの効率化が期待できる。
    • 3Dレーザースキャン,BIMモデリング,IoTデータ可視化を統合することで,施設運用・保守を支援する環境を実現した。
    • ジョージア工科大学の事例研究では,509の設備をモデル化し,デジタルツインに組み込んだ。

    Link: https://arxiv.org/abs/2512.12149

  • 空気インタフェースにおける大規模モデルと小規模モデルの協調 [cs.IT, math.IT]目的:空気インタフェースにおける環境適応の効率化
    • 無線通信において,AIモデルの活用が重要視されている。
    • 既存研究では,環境特有の適応が十分でなく,汎用的な知識に依存しがちである。
    • 大規模モデルの学習コストや効率性の問題を,小規模モデルとの協調で解決する。
    • 大規模モデルを普遍的な知識ベースとし,小規模モデルを環境特有の知識を捉えるプラグインとして利用する。
    • 提案手法LASCOおよびE-LASCOは,学習コストを削減し,データ収集量を削減し,適応速度を向上させる。
    • 環境適応により,大規模モデルの性能を大幅に向上させることが示された。

    Link: https://arxiv.org/abs/2512.12170

  • 期間予測を用いた負荷分散 [cs.DS]目的:負荷分散における性能向上
    • 負荷分散は,計算資源の効率的な利用に不可欠であり,システムの性能を最大化する上で重要である。
    • 従来の負荷分散アルゴリズムは,ジョブの正確な処理時間が必要か,あるいは処理時間を全く考慮しないかのいずれかであった。
    • 本研究は,処理時間の予測を利用することで,より現実的かつ効率的な負荷分散を実現することを目的とする。
    • 処理時間予測を単純に既存のアルゴリズムに組み込むと性能が低下するため,予測精度に応じて性能が変化する新しいアルゴリズムを設計した。
    • 設計したアルゴリズムの性能限界を示す下界を証明し,不正確な予測を用いたアルゴリズムの競争率を評価した。
    • 予測の精度が向上するほど,アルゴリズムの性能も向上することを示し,実用的な負荷分散への応用可能性を示唆した。

    Link: https://arxiv.org/abs/2512.12202

  • 合成環境における汎用的なコーディングエージェントの訓練 [cs.CY, econ.GN, q-fin.EC, stat.AP, cs.SE, cs.AI, cs.CL]目的:汎用的なコーディングエージェントの訓練
    • ソフトウェア開発の自動化は,生産性向上やコスト削減に貢献し,社会におけるソフトウェアの重要性が増す中で不可欠である。
    • 既存のGitHubリポジトリに依存した学習アプローチは,柔軟性が低く,ソフトウェアエンジニアが扱う多様なタスクに対応できないという課題がある。
    • SWE-Playgroundは,多様なコーディングタスクに対応できる,柔軟で自律的な学習環境を提供し,その効果を検証する。
    • SWE-Playgroundは,大規模言語モデルとエージェントを用いて,既存のデータソースに依存せずにプロジェクトとタスクを合成的に生成する。
    • 3つのベンチマークにおいて,SWE-Playgroundは,従来の学習方法と比較して,より少ないデータで同等の性能を達成できることを示した。
    • 生成されるデータは学習信号が濃密であり,エージェントの効率的な学習を促進することが確認された。

    Link: https://arxiv.org/abs/2512.12216

  • クラスタ誘導LLMベースのソフトウェア分析データ匿名化:JIT欠陥予測におけるプライバシー・ユーティリティのトレードオフの研究 [cs.SE, cs.CR]目的:ソフトウェア分析データからのプライバシー漏洩に対する匿名化手法
    • 機械学習による欠陥予測の利用増加に伴い,ソフトウェア分析データのプライバシー保護が重要になっている。
    • 既存の匿名化手法は,ソフトウェア指標間の文脈的依存関係を無視し,プライバシーと実用性のトレードオフが最適化されていない。
    • LLMを活用し,文脈と統計的関係を維持するクラスタ誘導匿名化手法を提案し,プライバシー保護と予測精度の両立を目指す。
    • 提案手法は,4つの最先端グラフベース匿名化手法と比較して,プライバシーレベルを18〜25%向上させた。
    • LLMが,類似データ点のクラスタ固有の統計情報に基づき,適応的な匿名化エンジンとして機能することを示した。
    • プライバシーを保護しつつ,予測精度を損なわない文脈に依存したソフトウェア分析が可能になった。

    Link: https://arxiv.org/abs/2512.12224

  • トレースから発見されたレジリエンスモデルにおける非同期セマンティクスの評価:OpenTelemetry Demoのケーススタディ [cs.SE, cs.DC, cs.PF, cs.SY, eess.SY]目的:トレースから発見されたレジリエンスモデルにおける非同期セマンティクスの影響評価
    • マイクロサービスアーキテクチャの普及に伴い,システムの信頼性確保が重要課題となっている。
    • 既存のレジリエンスモデルは手動作成が中心であり,自動化や精度の向上が求められている。
    • トレースデータに基づいたレジリエンスモデルの精度向上を目指し,非同期処理の影響を検証する。
    • モデルは全体的な可用性低下曲線を再現し,非同期セマンティクスが予測可用性に与える影響は非常に小さいことが示された。
    • Kafkaエッジに対する非同期セマンティクスの導入は,HTTP可用性に最大で0.001パーセントポイントの変化をもたらした。
    • 本ケーススタディにおいては,非同期依存関係を明示的にモデル化する必要性は低いと考えられる。

    Link: https://arxiv.org/abs/2512.12314

  • 現代ペネトレーションテストにおけるAIの役割 [cs.SE]目的:現代のペネトレーションテストにおけるAIの役割に関する研究
    • サイバーセキュリティにおいて,ペネトレーションテストは不可欠であり,その重要性は増している。
    • 従来のペネトレーションテストは手作業に頼り,時間と労力がかかるという課題があった。
    • AIを活用することで,ペネトレーションテストの効率化とスケーラビリティ向上を目指す。
    • AI支援によるペネトレーションテストは初期段階にあるものの,特に強化学習の分野で進展が見られる。
    • AIは,ペネトレーションテストの探索・攻撃段階において,反復作業の自動化や攻撃戦略の最適化に貢献する。
    • 実用例は限定的だが,PenBox等の事例からAIの可能性が示されており,今後のLLMの活用が期待される。

    Link: https://arxiv.org/abs/2512.12326

  • 不完全な想起を伴う動的同質性:敵対的ネットワークにおける回復力のモデル化 [cs.SI, cs.AI, cs.CR, cs.IT, math.IT]目的:複雑ネットワークにおける同質性,記憶制約,および敵対的攪乱の影響
    • ネットワーク科学は,社会システムやインフラなど,現実世界の複雑なシステムの理解に不可欠である。
    • ネットワークの回復力は,敵対的な攻撃に対して脆弱であり,その評価と改善が課題である。
    • 記憶の制約と動的な同質性を考慮し,ネットワークの回復力を向上させるモデルを構築する。
    • コサイン類似度は,疎,凸,モジュール構造のネットワークにおいて,安定性指標を最大30%改善した。
    • 戦略的な忘却は,ネットワークの堅牢性と適応性をバランスさせることで,回復力を高めることが示された。
    • 記憶パラメータと類似度パラメータをネットワークの構造と敵対的動向に合わせて調整することの重要性が強調された。

    Link: https://arxiv.org/abs/2512.12332

  • 非ユニタル環上の自由線形符号のハル [cs.IT, math.IT]目的:非ユニタル環上の自由線形符号のハル構造とその構築法
    • 符号理論は,通信や情報セキュリティの分野で不可欠であり,誤り訂正符号の研究は特に重要である。
    • 従来の符号理論は主に単位元を持つ環を対象としていたが,非ユニタル環上の符号は未解明な部分が多い。
    • 非ユニタル環上の自由線形符号のハル構造を明確にし,効率的な符号構築法を開発することを目指す。
    • 非ユニタル環$E$上の線形符号のハル構造を解析し,生成行列の明確な表現を得た。
    • ハル長とハルランクを増加させるための4つの構築法を提案し,具体的な例でその有効性を示した。
    • 長さ8以下の最適な自由$E$-線形符号を分類し,理論的な基盤を確立した。

    Link: https://arxiv.org/abs/2512.12335

  • ElasticVR:マルチユーザー・マルチコネクティビティワイヤレス仮想現実(VR)システムにおける弾力的なタスクコンピューティング [cs.IT, cs.LG, eess.IV, math.IT]目的:マルチユーザー・マルチコネクティビティ環境下におけるVRタスクの弾力的なコンピューティングオフローディング
    • VR技術の発展に伴い,高精細なコンテンツ配信に対する需要が高まっている。
    • 従来のVRシステムでは,通信,計算,消費電力,QoEのバランスが課題となっていた。
    • VRタスクの弾力性を活用し,これらのトレードオフを最適化することを目指している。
    • ElasticVRフレームワークにより,PSNRが43.21%向上した。
    • 応答時間と消費電力は,それぞれ42.35%と56.83%削減された。
    • CPPGとIPPGという二つのマルチエージェント深層強化学習ソリューションを提案した。

    Link: https://arxiv.org/abs/2512.12366

  • AI透明性アトラス:フレームワーク,スコアリング,およびリアルタイムモデルカード評価パイプライン [cs.RO, cs.SI, cs.AI, cs.SE]目的:AIモデルの透明性評価フレームワークの開発
    • AI技術の安全性と信頼性確保は,社会実装において不可欠である。
    • AIモデルのドキュメントが分散・不統一であり,評価が困難である。
    • AIモデルの透明性に関する評価基準を確立し,自動評価を可能にすること。
    • AIモデルの透明性フレームワークを構築し,安全性とリスクに関する情報を重視したスコアリングを導入した。
    • 開発した自動評価パイプラインは,少ないコストでAIモデルの透明性を評価できることを示した。
    • 主要なAIモデルプロバイダーの透明性レベルにばらつきがあり,安全性に関する情報開示が不足していることが明らかになった。

    Link: https://arxiv.org/abs/2512.12443

  • ATLAS:CおよびC++ソースプログラムのための自動ツリーベース言語解析システム [cs.SE]目的:CおよびC++ソースプログラムの制御フローグラフおよびデータフローグラフ生成
    • 現代のソフトウェアは複雑化しており,従来の解析手法では対応が困難になっている。
    • 機械学習やLLMは有望だが,ソースコードの構造的依存関係の解析に課題がある。
    • C/C++特有の問題を克服し,より正確なプログラム理解の基盤を構築する。
    • ATLASは,プログラム全体の文レベルの制御フローグラフと型対応データフローグラフを生成する。
    • ATLASは,コンパイル可能/不可能コード両方に対応し,複数ファイルプロジェクトを解析可能である。
    • 抽象構文木,CFG,DFGを用いて統合的なコード表現を提供し,ソフトウェア工学や機械学習の精度向上に貢献する。

    Link: https://arxiv.org/abs/2512.12507

  • サイバー物理系における空間的レジリエンスのSTRELに基づく定式化 [cs.LO]目的:サイバー物理系における空間的レジリエンスの定式化
    • サイバー物理系は社会インフラ等に不可欠であり,その信頼性確保は重要である。
    • 空間的レジリエンスの形式的な定義が確立されておらず,評価手法も不足している。
    • 空間的レジリエンスを形式的に定義し,定量的な評価を可能にすることを目的とする。
    • 空間的レジリエンスをSTRELの空間的断片SRELに基づいて形式化する枠組みを提案した。
    • 空間的レジリエンス仕様(SpaRS)を導入し,回復性と持続性を距離の単位で定義した。
    • SpaRSの定量的な意味論である空間的レジリエンス値(SpaRV)関数を定義し,その健全性と完全性を証明した。

    Link: https://arxiv.org/abs/2512.12511

  • ある次元のエルミート包絡を持つ線形符号 [cs.IT, math.IT, math.RA]目的:エルミートℓ-補完符号の列挙的・漸近的性質
    • 符号理論は,情報伝送における誤り訂正に不可欠であり,通信の信頼性向上に寄与する。
    • エルミート符号に関する具体的な構造や漸近的性質の理解が十分に進んでいない。
    • エルミート自己直交符号の漸近的な密度と,その最小距離に関する性質を明らかにすること。
    • エルミートℓ-補完符号の個数を数える閉じた形の公式が得られた。
    • エルミート自己直交符号と制限なし符号の漸近的重み分布に類似性が認められた。
    • アルファベットサイズが無限大に近づくとき,エルミート自己直交符号内のMDS符号は漸近的に高密度となることが示された。

    Link: https://arxiv.org/abs/2512.12519

  • 多様なLLMと脆弱性:誰がより良く検出し,修正するか? [cs.SE, cs.AI]目的:ソフトウェア脆弱性検出と修正における多様なLLMの集合的利用の有効性
    • ソフトウェアの安全性確保は不可欠であり,自動化された脆弱性検出・修正技術の需要が高まっている。
    • 個々のLLMは複雑な脆弱性の特定や修正において課題を抱えており,誤検出や誤修正のリスクが存在する。
    • 複数のLLMを組み合わせることで,個々のLLMの弱点を補い,より高精度な脆弱性検出・修正を目指す。
    • DVDR-LLMは,個々のLLMの平均性能と比較して,検出精度を10-12%向上させる。
    • 特に複雑なコードや複数ファイルにまたがる脆弱性において,再現率とF1スコアが大幅に改善される。
    • 合意閾値の設定により,偽陽性を減らすことができる一方,偽陰性が増加する可能性があり,状況に応じた調整が必要である。

    Link: https://arxiv.org/abs/2512.12536

  • Android動的解析ツールによる,アンチ・ランタイム解析対策技術への対抗能力評価 [cs.SE]目的:Androidにおけるアンチ・ランタイム解析対策技術への対抗能力
    • Android OSの普及に伴い,セキュリティ脅威が増加しており,対策が急務である。
    • 悪意のあるアプリケーションがアンチ・ランタイム解析技術を利用し,動的解析を妨害する問題がある。
    • 既存の動的解析ツールの限界を明らかにし,より堅牢な対策技術の開発を促進する。
    • 広く利用されているAndroid動的解析ツールは,様々なアンチ・ランタイム解析技術を回避する能力に限界があることが明らかになった。
    • 既存ツールでは,アンチ・ランタイム解析技術に対抗するには不十分であり,改善が求められる。
    • 本研究は,ソフトウェアセキュリティと動的解析の分野における今後の発展に貢献する。

    Link: https://arxiv.org/abs/2512.12551

  • Cargo Sherlock: ソフトウェアの信頼コストを検証するSMTベースのチェッカー [cs.LO, cs.SE]目的:ソフトウェアサプライチェーンにおける信頼コストの定量化
    • オープンソースソフトウェアは広く利用されているが,セキュリティ上の脆弱性が懸念される。
    • 第三者依存ライブラリの信頼性を評価する客観的な指標が不足している。
    • 信頼性の低い依存ライブラリによるサプライチェーン攻撃を検出し,軽減すること。
    • Cargo Sherlockは,Rustライブラリの依存関係を分析し,潜在的なサプライチェーン攻撃を特定できる。
    • 検証の結果,Cargo Sherlockは,タイポスクワッティングやAIによる劣悪なメンテナンスを受けたクレートなどの既知のインシデントを検出できた。
    • Cargo Sherlockの性能は,多数の依存関係を持つRustクレートに対してもスケーラブルであることが示された。

    Link: https://arxiv.org/abs/2512.12553

  • 5G超えの垂直異種ネットワーク:CoMPによるカバレッジ拡張と最適化 [cs.IT, math.IT]目的:垂直異種ネットワークにおけるダウンリンクカバレッジ拡張
    • 低高度ワイヤレスネットワークは,低高度経済の発展に不可欠であり,これまで無線が届きにくかった場所への接続を可能とする。
    • 動的な3次元空間において,疎に分布する航空機利用者の信頼性の高い接続を確保することが課題である。
    • 航空機利用者の少ない状況下で,CoMPを活用したカバレッジ改善により,低高度ワイヤレスネットワークの接続性を強化する。
    • 提案するCoMP対応VHetNetは,特に航空機利用者が疎なシナリオにおいて,ダウンリンクカバレッジ確率を大幅に向上させる。
    • 確率的幾何学を用いた解析により,ランダムなUAV配置におけるカバレッジ特性を理論的に評価した。
    • カバレッジを考慮した加重K-meansクラスタリングアルゴリズムによるUAV配置最適化が,協調カバレッジを最大化することを示した。

    Link: https://arxiv.org/abs/2512.12563

  • 1つまたは複数の誤りを訂正する線形二進符号 [cs.IT, math.IT]目的:1つ以上の誤り訂正能力を持つ線形二進符号の解析
    • 通信や情報記録において,誤りの訂正は信頼性を確保する上で不可欠である。
    • 線形二進符号のパラメータ設計は複雑であり,効率的な符号の構成が課題である。
    • 線形二進符号のパラメータの下限を導出し,効率的な符号構築を目指す。
    • 単一誤り訂正の場合,Hamming限界を達成する構成法が存在することが示された。
    • 最小符号長に対する正確な表現が導出された。
    • 一般の場合には,coset構造の解析から線形符号のパラメータに対する単純な下限が得られた。

    Link: https://arxiv.org/abs/2512.12591

  • SHERLOCK:ソフトウェア脆弱性を検出する深層学習アプローチ [cs.CY, cs.SE, cs.CR]目的:ソフトウェア脆弱性検出
    • 現代社会におけるソフトウェア依存度の増大に伴い,脆弱性検出の重要性は高まっている。
    • 従来の静的・動的解析では,複数の脆弱性を効率的に検出することが困難であった。
    • 深層学習を用いて,ソフトウェア脆弱性の検出精度向上を目指す。
    • SHERLOCKは,関数レベルでの複数脆弱性の検出に成功した。
    • 特にCWE-199,CWE-120,CWE-Otherに対する性能が高く,高い精度と真陽性・真陰性の値を示した。
    • 標準化されたデータセットの不足により,一部脆弱性に対する性能には課題が残る。

    Link: https://arxiv.org/abs/2512.12593

  • C-PASS:中心給電ピンチングアンテナシステム [cs.IT, math.IT]目的:中心給電ピンチングアンテナシステム(C-PASS)のアーキテクチャ
    • 無線通信におけるスペクトル効率向上の重要性が高まっている。
    • 従来のピンチングアンテナシステムは空間多重化に限界があった。
    • C-PASSによる空間多重化能力の向上と,それによる通信容量の改善。
    • 提案されたC-PASSは,従来のピンチングアンテナシステムと比較して,自由度を2倍にすることができる。
    • C-PASSは,送信電力とアンテナ数に応じて,追加の多重化利得が得られる。
    • 数値シミュレーションにより,C-PASSの向上した自由度と多重化利得による容量改善が確認された。

    Link: https://arxiv.org/abs/2512.12619

  • オランダにおけるソフトウェア工学高等教育の体系的分析 [cs.CL, cs.RO, cs.SY, eess.SY, cs.SE]目的:オランダにおけるソフトウェア工学高等教育の現状分析
    • ソフトウェア工学教育は,常に変化する技術に対応するため,継続的な改善が不可欠である。
    • 各教育機関間の教育内容のばらつきがあり,客観的な比較分析が困難である。
    • オランダの高等教育機関を事例に,ソフトウェア工学教育の体系的な現状を明らかにすること。
    • オランダの大学のカリキュラムにおいて,建設とプログラミングの知識領域が学士レベルで最も多くカバーされている。
    • 要件,アーキテクチャ,設計といった知識領域が密接に関連しており,統合的な学習を促進する可能性が示唆された。
    • ソフトウェア工学経済学のような,教育においてカバーが不十分な分野が特定された。

    Link: https://arxiv.org/abs/2512.12650

  • 非因子化ケースベースにおける言語モデルによる論証推論 [cs.LO]目的:非因子化ケースベースにおけるケースベース推論
    • ケースベース推論は,過去の事例を参考に新たな問題解決を行う重要な手法である。
    • 従来のケースベース推論は,事例の因子化が必要であり,柔軟性やプライバシーの観点で課題があった。
    • 言語モデルを活用し,因子化なしにケースベース推論を実現し,柔軟性とプライバシーを向上させる。
    • 提案手法AAM-CBRは,新しい事例が豊富な因子を持つ場合に,ベースライン手法を上回る性能を示した。
    • 言語モデルは限られた因子のケースベース推論には対応できるが,因子の増加には課題が残る。
    • 言語モデルと記号推論の統合が,多数の因子を含む事例への有効な対応策となることが示唆された。

    Link: https://arxiv.org/abs/2512.12656

  • ソフトウェア工学における実用的な研究課題の定式化を支援する属性 [cs.SE]目的:ソフトウェア工学における研究課題の定式化を支援する属性の重要性と完全性
    • ソフトウェア工学の進歩には,実用的な課題解決が不可欠であるため,研究課題の重要性は高い。
    • 研究課題の定式化段階における体系的な指針が不足しており,実用性と学術性のバランスが課題である。
    • 実用的な研究課題の定式化を支援し,学術研究と産業界のニーズの乖離を縮小することを目指す。
    • 7つの属性(実用的な問題,背景,影響/インパクト,実務家,証拠,目的,研究課題)が,産業界志向の研究課題の定式化において重要であることが確認された。
    • 属性の適用方法に関する定性的なフィードバックから,改善案(ROIの組み込み,実現可能性の考慮など)が示唆された。
    • これらの属性を研究の文脈に合わせて活用することで,学術研究と産業界のニーズの整合性を高めることが可能となる。

    Link: https://arxiv.org/abs/2512.12699

  • コードカバレッジとゲームプレイ意図の相乗効果:LLM誘導強化学習を用いたカバレッジ認識型ゲームプレイテスト [cs.AI, cs.SE]目的:ゲームアップデートテストのための構造的検証と機能的検証の融合
    • ゲームはサービス形態が普及し,頻繁なコンテンツ更新が求められている。
    • 既存の自動テストは,コード中心とプレイヤー中心に分かれ,両方の側面を網羅できない。
    • 変更されたコードの網羅性と機能的な正確性を両立させることを目指す。
    • SMARTは,変更されたコードのブランチカバレッジを94%以上達成し,従来法を大幅に上回る。
    • タスク完了率は98%を維持し,構造的な網羅性と機能的な正確性のバランスを実現した。
    • LLMを活用し,ゲームプレイの意図を抽出することで,効率的なテストを可能にした。

    Link: https://arxiv.org/abs/2512.12706

  • AIエージェントによる研究問題の定式化支援に向けた試み [cs.SE]目的:ソフトウェア工学における研究問題の定式化支援
    • 実務に即した研究を行う上で,適切な問題設定が重要である。
    • 研究問題が実務の複雑さを反映せず,現実離れしている場合がある。
    • AIエージェントを用いて,研究問題の定式化を支援し,実務との乖離を減らす。
    • AIエージェントをLean Research Inception (LRI)に統合することで,問題属性の事前入力やステークホルダーの視点調整が可能となる。
    • AIエージェントは,研究質問の精緻化,多角的評価のシミュレーション,意思決定の支援を通して,研究問題の価値,実現可能性,適用可能性を高める。
    • LRIへのAIエージェント統合は有望であるが,実証的な検証による更なる改良が必要である。

    Link: https://arxiv.org/abs/2512.12719

  • 情報鮮度から情報意味論,そして目的指向型通信へ [cs.IT, cs.NI, cs.SY, eess.SY, math.IT]目的:目的指向型セマンティクスを意識した通信の体系化と設計原則の明確化
    • 次世代無線ネットワークは,センシング,推論,制御,意思決定と緊密に連携するリアルタイムデータ駆動型サイバーフィジカルシステムを支える必要がある。
    • 従来の通信パラダイムは,精度,スループット,遅延に焦点を当てており,情報の価値が特定のタスクへの意味的な関連性に依存するシステムには不十分である。
    • 情報の意味を考慮した通信指標を整理・体系化し,タスク関連情報のみを選択的に生成・伝送する効率的な通信設計を可能にすること。
    • 本研究は,歪みベースの古典的フレームワークから,情報鮮度指標(AoIなど),そしてセマンティクスを意識した通信パラダイムへの移行を統一的に示している。
    • 既存のセマンティクスを意識した指標(コンテンツ,バージョン,文脈依存の歪み,履歴依存の誤差)を整理し,それらが精度や鮮度にのみ焦点を当てた設計の限界を克服できることを示唆している。
    • マルコフ決定過程や Lyapunov 最適化などの分析ツールを用いて,セマンティック性能基準下での最適なタイミング・スケジューリングポリシーを特徴づける方法をレビューしている。

    Link: https://arxiv.org/abs/2512.12758

  • 時間的HAL-API依存性:組み込みソフトウェア開発の形式化への道 [cs.SE]目的:組み込みソフトウェアにおける正当性特性の把握
    • 組み込みソフトウェアの安全性確保は不可欠であり,その品質向上が求められている。
    • 従来の静的解析ではカバーしきれない,より詳細な正当性検証が課題であった。
    • 時間的HAL-API依存性に着目し,形式化手法の導入を容易にすることを目指す。
    • 時間的HAL-API依存性は,プログラム注釈による仕様記述とソフトウェアモデルチェックによる自動検証が可能である。
    • 汎用的な性質と,特定用途の性質の中間的な位置にあり,形式化手法の導入コストを抑える可能性が示唆された。
    • 産業界における組み込みソフトウェア開発への形式化手法の普及を促進する道筋となり得る。

    Link: https://arxiv.org/abs/2512.12788

  • タスク完了を超えて:自律的AIシステムの評価フレームワーク [cs.MA, cs.AI, cs.SE]目的:自律的AIシステムの評価基準
    • AI技術の進歩により,複雑なタスクを自動化する能力が求められている。
    • 既存の評価方法は,AIの非決定的な性質を考慮していない点が課題である。
    • AIシステムの実行時の不確実性を捉えるための評価方法の確立を目指す。
    • 本研究では,LLM,メモリ,ツール,環境という4つの柱を持つ評価フレームワークを提案した。
    • クラウド運用における実験により,従来の評価指標では見過ごされていた行動のずれを検出できた。
    • 本フレームワークは,AIシステムの実行時の不確実性を捉える上で有効であることが示された。

    Link: https://arxiv.org/abs/2512.12791

  • 構造を用いた学習:構造規則グラフにおける整合部分集合の計算 [cs.DS, cs.CG]目的:構造規則グラフにおける最小整合部分集合の計算
    • 教師ありクラスタリングやインスタンス選択において,データ分割を効率的に行うことが重要である。
    • 現代的な大規模データでは,学習に必要なデータ量を削減する計算上の課題が存在する。
    • 頂点被覆数と近傍多様性に着目し,最小整合部分集合問題を効率的に解くアルゴリズムを開発する。
    • 頂点被覆数と近傍多様性に関して,それぞれ$vc^{\mathcal{O}(vc)}\cdot\text{Poly}(n,c)$ および $nd^{\mathcal{O}(nd)}\cdot\text{Poly}(n,c)$の実行時間を持つアルゴリズムを開発した。
    • これらのアルゴリズムは,パラメータ固定可能(FPT)であり,頂点被覆数と近傍多様性でパラメータ化されている。
    • アルゴリズムの計算量は色の数に対して多項式時間であり,多数の色に対しても効率的に機能する。

    Link: https://arxiv.org/abs/2512.12860

  • 単純グラフにおける最小k-カットの決定論的アルゴリズム [cs.DS]目的:最小k-カット問題に対する決定論的正確アルゴリズム
    • グラフ理論はネットワーク設計,データマイニングなどに応用され,その効率的な解法が求められている。
    • 最小k-カット問題はNP困難であり,大規模グラフに対して効率的なアルゴリズムが存在しない。
    • PSPとKT縮約を組み合わせることで,効率的な決定論的アルゴリズムを開発し,計算量を削減することを目指す。
    • 最適なk-カットは,PSPの境界とKT縮約によるカーネルを用いて表現できることを示した。
    • PSPとKT縮約を組み合わせることで,特定の条件下では$n^k$よりも小さい計算量で最小k-カット問題を解くアルゴリズムを開発した。
    • 小さな$\lambda$に対する正確な部分問題を組み合わせることで,ランダム化アルゴリズムの結果と同等の指数を持つ決定論的アルゴリズムを実現した。

    Link: https://arxiv.org/abs/2512.12900

  • データベース研究には抽象関係クエリ言語が必要である [cs.DB, cs.LO]目的:抽象関係クエリ言語の必要性
    • データベースは情報システムの中核であり,効率的なデータ管理が不可欠である。
    • SQLは長年利用されているが,人間が記述するよりも検証・デバッグされることが多くなっている。
    • クエリの意図を明確にし,様々な言語間での比較を可能にする抽象的な基盤を確立すること。
    • 近年,LLMによるクエリ生成が増加しており,SQLは意図伝達のためのインターフェースとしての役割が重要になっている。
    • 本研究では,クエリの意図と構文を分離し,関係パターンを明示化する抽象関係クエリ言語(ARQL)を提案する。
    • ARQLの具体的な実装として,タプル関係計算(TRC)を一般化した抽象関係計算(ARC)を提示する。

    Link: https://arxiv.org/abs/2512.12957

  • ソフトウェア開発チームにおける障害を持つ人々に対するリモートワークの課題と促進要因 [cs.IR, cs.SE]目的:障害を持つ人々がソフトウェア開発チームでリモートワークを行う際の経験
    • IT業界ではリモートワークが増加しており,障害を持つ人々の雇用機会を拡大する可能性を秘めている。
    • チームメンバーの障害に対する理解不足が,リモート環境での協調作業の障壁となっている。
    • リモート環境における障害を持つ人々の課題と,それを克服するための戦略を明らかにすること。
    • 調査の結果,チームメンバーは障害を持つ人々が直面する課題を十分に認識していないことが明らかになった。
    • アクセシビリティツール,コミュニケーション戦略,適応的なマネジメント手法の改善の余地が示された。
    • リモートワークは,障害を持つ人々にとって新たな機会をもたらす一方で,課題も存在する。

    Link: https://arxiv.org/abs/2512.12965

  • 深層学習を用いた生物学的データ圧縮への応用 [eess.SY, cs.SY, cs.LG, cs.IT, math.IT]目的:深層学習によるクライオ電子顕微鏡データの圧縮方法
    • クライオ電子顕微鏡は高分解能な生物構造解析に不可欠であり,生命科学研究の進展に貢献している。
    • クライオ電子顕微鏡データのファイルサイズは極めて大きく,研究者や教育者にとって保管・共有が困難である。
    • 効率的なデータ圧縮手法を確立し,データ管理の負担を軽減し,研究の加速を目指す。
    • 暗黙的ニューラル表現(INR)を用いた圧縮により,高い圧縮率と再構成品質を両立しうることを示した。
    • 位置エンコーディングと重み付き平均二乗誤差損失関数を導入することで,再構成精度が向上した。
    • 本手法は,研究および教育目的における実用的な生物学的データ圧縮ソリューションとなりうる。

    Link: https://arxiv.org/abs/2512.12975