arXiv雑要約
プログラム - 2026/04/28 公開
ステップ反復原始再帰子における直接集約の射影次元障壁 [cs.LO]目的:項書き換え証明システムの次元への依存性と目標質問への制約の不存在
- 計算可能性理論は,計算の限界と可能性を探求する上で不可欠である。
- 証明システムの健全性と完全性の両立は長年の課題である。
- 項書き換えシステムの表現力と限界を明確にすることを目指す。
- 項書き換え証明システムにおいて,特定の次元への依存性と目標質問への制約が両立しないことが示された。
- ステップ反復原始再帰子において,次元の外部委譲というメカニズムが確認された。
- このメカニズムは,証明システムの構造的完全性を維持するために不可欠であることが示された。
グローバル読み出しを持つGNNの表現力の理解に向けて [cs.LG, cs.AI, cs.LO]目的:メッセージパッシング集約-結合-読み出し型グラフニューラルネットワーク(ACR-GNN)の表現力
- グラフ構造を持つデータの解析は,化学,社会科学,機械学習など多岐にわたる分野で重要性が増している。
- GNNの表現力の理論的な理解は十分ではなく,どのような特性を捉えられるのかが明確になっていない。
- GNNが表現可能な一階論理の特性を明らかにし,その限界と可能性を探る。
- 集約関数に総和を用いることで,C2論理では表現できない一階論理の特性を捉えることが示された。
- 局所的な集約を制限するか,次数が制限されたグラフでACR-GNNを実行することで,表現力を特徴づけることが可能となった。
- 集約と読み出しの相互作用が,GNNの表現力をC2論理を超えるレベルに押し上げていることが示唆された。
モジュール格子安全性(第2部):最適な符号選択によるモジュール格子簡約 [cs.CR, cs.IT, math.IT, quant-ph]目的:モジュール格子の簡約手法
- 暗号理論の安全性評価において,格子問題の難易度が重要な役割を果たす。
- モジュール格子に対する効率的な簡約アルゴリズムが未確立であり,安全性の評価が困難である。
- モジュール格子の簡約を通じて,より安全な暗号方式の実現を目指す。
- 理想格子に対するCDPRアルゴリズムをモジュール格子に拡張し,効率的な簡約を実現した。
- 最適な符号選択により,普遍定数δ*≈0.4407を得て,簡約の性能を向上させた。
- 完全に分岐素数を用いたCRTスケーリングにより,精度制御を可能にし,有界精度での実装を実現した。
AutoPyVerifier:大規模言語モデルの出力を検証するコンパクトな実行可能検証器の学習 [cs.CL, cs.LG, cs.PL]目的:大規模言語モデルの出力に対する目標を近似する,最小限のPython検証器集合の自動誘導
- 大規模言語モデルの性能向上には,出力の検証が不可欠である。信頼性と制御が課題となっている。
- 既存の検証器は,表現力と制御の容易さのトレードオフに陥り,十分な性能を発揮できない場合がある。
- 大規模言語モデルの目標をより正確に予測する,コンパクトで実行可能な検証器集合を自動的に生成すること。
- AutoPyVerifierは,数学的推論,コーディング,関数呼び出し,指示追従といった複数のベンチマークで,初期検証器集合と比較して最大55.0F1ポイントの目標予測精度向上を示した。
- 有用な検証ターゲットはベンチマークやモデルによって異なり,DAGベース探索により検証器集合が構造的で意味的に根拠のあるチェックへと変化することが示された。
- 発見された検証器集合を大規模言語モデルに外部ツールとして提供することで,ダウンストリームの精度が最大17.0ポイント向上した。
AnemiaVision:スマートフォン画像を用いた効率的EfficientNet-B3による非侵襲性貧血検出 [cs.HC, cs.CV, cs.LG, cs.SE]目的:スマートフォン画像による非侵襲的な貧血スクリーニングシステムの開発
- 貧血は世界で10億人以上に影響を与え,公衆衛生上の重要な課題である。
- 低資源地域では血液検査へのアクセスが限られており,貧血の診断が遅れることが多い。
- スマートフォン画像から貧血を非侵襲的に検出し,診断の早期化に貢献する。
- 提案システムは,EfficientNet-B3をベースに改良された分類器ヘッドと,データ拡張技術を組み合わせることで高い精度を実現した。
- 検証精度は96.2%,AUC-ROCは0.98に達し,ベースラインと比較して大幅な改善が見られた。
- 貧血患者の検出感度は0.96と高く,遠隔地でのスクリーニングツールとしての有用性が示唆された。
エネルギー制約下ドローン配送パッキング問題:ラストマイル物流への近似 [eess.SY, astro-ph.EP, astro-ph.IM, cs.SY, cs.DS]目的:ラストマイル物流におけるドローンとトラックの連携による配送効率化
- ラストマイル配送はコストと効率性の改善が急務であり,新たな配送手段の導入が求められている。
- ドローン配送はバッテリー制約や配送計画の複雑さなど,解決すべき課題が多い。
- ドローンのバッテリー制約と配送コストを考慮した最適なパッキング方法を提案し,配送効率を向上させる。
- バッテリーステーションがない場合,ファーストフィット減少型ビンパッキングを用いた定数倍近似アルゴリズムを提案した。
- 配送間隔が競合しない場合,$(2+ \psi)$-近似アルゴリズムを設計した。
- バッテリーステーションと競合する配送間隔の両方がある場合,$(4+\psi)$-および$(3+\psi)$-近似アルゴリズムを提示した。
リモートコンコリックマルチバースデバッグ - 付録追加版 [cs.RO, cs.SI, cs.PL]目的:非決定的なプログラムのデバッグ手法
- 組み込みシステムでは外部入力により実行パスが変動し,デバッグが困難である。
- 既存のマルチバースデバッガは状態爆発の問題があり,状態空間が巨大化する。
- コンコリック実行を用いた状態空間削減により,状態爆発を抑制する。
- 本研究では,トレースベースのマルチバースデバッガを提案し,状態空間の削減を実現した。
- コンコリック解析とライブデバッグを組み合わせることで,効率的に冗長なパスを削減する。
- WARDuino VMを用いたプロトタイプ実装により,実用性と効率性を検証した。
SATソルバーを用いたコンウェイ99問題への取り組み [cs.LO]目的:コンウェイ99問題解決の試み
- グラフ理論は,ネットワーク構造の解析に不可欠であり,様々な応用分野で重要である。
- コンウェイ99問題は計算量が膨大であり,既存の手法では解決が困難である。
- SATソルバーの能力を活用し,コンウェイ99問題の解決可能性を探る。
- コンウェイ99問題をSATインスタンスに変換し,実験的に検証した結果,合理的な時間内に解を見つけることはできなかった。
- SATソルバーがこの問題に苦戦する理由を数学的に考察した。
- SATソルバーによるアプローチは,現状ではコンウェイ99問題解決に有効ではない可能性が示唆された。
記憶の形状:二次の最適化手法における機械的アンラーニングの幾何学的分析 [cs.LG, cs.IT, cs.SI, math.IT, stat.ML]目的:二次の最適化手法における機械的アンラーニングの幾何学的性質
- 機械学習モデルは大量のデータを学習するため,プライバシー保護が重要である。
- 既存のアンラーニング定義は,二次最適化手法には不十分である。
- 二次最適化手法における情報の残存と,それを抑制する方法を解明する。
- 一次および二次最適化手法を比較した結果,二次最適化手法は最適化状態に不安定性を示す。
- この不安定性は,削除されたはずの情報が残存していることを示唆する。
- 最適化状態の制御された摂動により,安定性と情報損失が回復することが示された。
OSSプルリクエストにおけるドキュメントがテスト関与に与える影響 [cs.SE]目的:OSSにおけるプルリクエスト時のテスト関与度合いに関する関係性
- OSSの品質維持には自動テストが不可欠であり,持続的な開発に繋がる。
- コード変更に対するテストの追加を促すことが難しく,開発者のモチベーションが課題。
- テストに関するドキュメントが,テスト行動を促進する先行的対策となり得るか検証する。
- テストドキュメントの網羅性とテスト関与度(TER)の間に,弱いながらも有意な正の相関関係が認められた。
- プルリクエストの活動頻度が高いリポジトリでは,相関関係がより強くなる傾向が見られた。
- 「テストの実行方法」や「テストの書き方」といったドキュメントカテゴリが,テスト関与との最も強い相関を示した。
最先端AI開発者は内部展開について何を公開すべきか [cs.CY, cs.SE]目的:最先端AIの内部展開に関する情報公開の必要性
- AI技術の急速な発展は,社会に大きな影響を与える可能性がある。
- 内部展開されるAIモデルの安全性に対する外部からの監視が不足している。
- 内部展開AIモデルの情報公開に関する具体的な指針を提示し,安全性を確保すること。
- 本研究は,能力,利用状況,安全対策,ガバナンスの4つのカテゴリーにおける情報公開の重要性を特定した。
- 各カテゴリーにおいて,情報公開の利点と限界を分析し,関連するリスクの軽減策を検討した。
- 提示されたフレームワークは,モデルシステムカードや規制当局への報告書作成に活用できる。
相対エントロピー符号化における棄却サンプリングの最適性 [cs.RO, cs.IT, math.IT]目的:相対エントロピー符号化のレートに関する下限のタイトさの証明
- 情報理論における符号化の限界を理解する上で重要。効率的な情報伝送技術の開発に繋がる。
- 従来の相互情報量によるレートの下限がタイトでない場合があり,より正確な評価が必要とされている。
- 機能的情報量を用いた下限のタイトさを証明し,符号化の効率の限界を明らかにする。
- 棄却サンプリングを用いるリングトス符号を構成することで,機能的情報量にわずかなオーバーヘッドを加えたビット数で符号化が可能であることを示した。
- この結果は,従来の相互情報量による下限が,一般に$\log(I(X; Y) + 1) + 2.45$ビット以内,特異チャネルでは$1.45$ビット以内であることを意味する。
- また,本研究の成果は,SriramuとWagnerの相対エントロピー符号の二次の冗長性に関する漸近的な結果も再現する。
コードブローカー:自動コード品質評価のためのマルチエージェントシステム [cs.HC, cs.SE, cs.AI, cs.CL, cs.PL]目的:Pythonコードの品質評価報告書の生成
- ソフトウェア開発における品質確保は,システムの信頼性と保守性を高める上で不可欠である。
- 従来のコード品質評価は,手動によるレビューに依存しており,時間とコストがかかる場合がある。
- 自動化されたコード品質評価システムの構築により,効率的かつ客観的な評価を実現する。
- Code Brokerは,Google Agent Development Kitを用いて構築されたマルチエージェントシステムであり,Pythonコードの品質を多角的に評価する。
- このシステムは,正確性,セキュリティ,スタイル,保守性の4つの側面からコードを評価し,MarkdownとHTML形式で報告書を作成する。
- 実験結果は,並列化された専門エージェントが読みやすく開発者向けのフィードバックを提供することを示唆している。
線形化多項式符号のハルについて [cs.IT, math.IT, math.NT]目的:線形多項式符号のハルの構造
- 量子誤り訂正符号において,ハルの次元は必要な事前共有されたエンタングルペア数を決定する。
- ハルの次元を正確に決定することは,符号の性能評価において重要であるが,一般には困難である。
- q-多項式演算子によって定義される線形符号のハルの次元を,統一的な文法行列法を用いて解析する。
- イメージ符号に対し,ハルの次元とランクの関係を示す主公式を導出した。
- LCD(Local Decoding)の軌跡を記述する2次文法鉛筆行列を導出し,分類を行った。
- 巡回文法行列を用いて,ランク距離符号のハルの次元を決定するための閉形式の判別式を得た。
言語から論理へ:LLMと形式表現を架橋しRTLアサーション生成を実現する [cs.CR, cs.AR, cs.LO]目的:RTLアサーションの自動生成
- デジタルハードウェアの検証において,アサーションは不可欠であり,設計品質の向上に貢献する。
- アサーションの作成には専門知識が必要であり,その労力は大きいという課題がある。
- LLMを活用し,形式検証の正確性と効率性を高めることを目指す。
- ProofLoopは,自然言語仕様からSVAを生成するツールであり,反復的な検証により精度を向上させる。
- FVEval Design2SVAベンチマークにおいて,93.7%の構文適合性と82.0%の機能適合性を達成した。
- RAG,JasperGoldツール,検証ループの各コンポーネントがアサーション生成に重要な役割を果たすことが確認された。
テストケース不要:科学ワークフローのための蒸留駆動型コード生成 [cs.SE, cs.AI, cs.MA]目的:科学ワークフローにおけるコード生成
- 科学研究の自動化は,効率向上や新たな発見に不可欠である。
- 既存のコード生成手法は,I/Oテストケースに依存し,科学ワークフローには適用が困難である。
- I/Oテストケースなしで,科学ワークフローのコード生成を可能にすること。
- MOSAICは,I/Oによる監視なしで科学コードを生成する,学習不要なマルチエージェントフレームワークである。
- ドメイン固有の例と構造化された問題分解によって生成を grounded することで,既存手法よりも高い精度,実行可能性,数値精度を実現した。
- 一連の問題における幻覚を軽減するため,一貫した推論を維持する Consolidated Context Window (CCW) を導入した。
層状復号におけるGLDPC符号の効率的なスケジューリング解析 [cs.IT, math.IT]目的:GLDPC符号の効率的な復号を実現するためのスケジューリング順序の特徴
- 通信システムにおいて,信頼性の高いデータ伝送は不可欠であり,誤り訂正符号は重要な役割を担う。
- GLDPC符号の復号性能は,スケジューリング順序に大きく依存するが,最適な順序の決定は困難である。
- GLDPC符号復号の効率を向上させるスケジューリングアルゴリズムの開発を目指す。
- 復号効率が高いスケジューリング順序は,より大きな最小距離を持つ部分符号の制約ノードの更新を優先する必要がある。
- 最小重み符号数が少なく,符号長が短い部分符号に対応する制約ノードの更新も重要であることが示された。
- 提案するスケジューリングアルゴリズムは,シミュレーション実験によってその有効性が確認された。
iFogSimのソースコード解析:分散IoTアーキテクチャシミュレーションにおけるカバレッジ,課題,および拡張 [cs.SE, cs.NI]目的:分散型IoTアーキテクチャのシミュレーションにおけるiFogSimの分析
- IoTの普及に伴い,分散アーキテクチャの設計・検証が重要性を増している。
- iFogSimの非標準的なアーキテクチャへの適用に関するドキュメントが不足している。
- iFogSimの利用可能性向上と,適切な適用範囲の明確化を目指す。
- iFogSimおよびiFogSim2の状態を整理し,IoTアーキテクチャシミュレーションの科学的目標を分類した。
- 4層構造の緊急対応システムをシミュレーションし,約205msの遅延とFPGAによる経路計算の高速化(x10)を確認した。
- 7つのモデリング課題を特定し,ソースコードに基づいた根本原因とバイアスの評価,改善提案を行った。
ArgRE:マルチエージェント要求交渉における対立解決のための形式的議論 [cs.SE, cs.AI]目的:マルチエージェント要求交渉における対立解決のための形式的議論フレームワーク
- ソフトウェアの複雑化に伴い,複数の品質属性間のトレードオフが重要となり,体系的なバランス調整が求められている。
- 既存のマルチエージェントシステムでは,対立解決がヒューリスティックであり,要求の合意形成過程に透明性が欠如している。
- 本研究は,形式的議論を用いて要求交渉における対立を解決し,追跡可能性と説明可能性を高めることを目指す。
- ArgREは,要求,批判,修正を議論としてモデル化し,Dungスタイルの抽象議論を用いて対立を表現する。
- 5つの事例研究において,ArgREは既存フレームワークよりも高いレベルの意思決定根拠を提供し,監査可能性を向上させることが示された(4.32 vs 3.07, p < 0.001)。
- また,ArgREはセマンティック意図の保持率とコンプライアンスカバレッジにおいても高い性能を示した(BERTScore F1 94.9%, コンプライアンスカバレッジ 84.7%)。
RANalyzer:自動継続的RANソフトウェア評価と回帰分析 [cs.NI, cs.SE]目的:RANソフトウェア更新による性能変化の定量化
- O-RANアーキテクチャの進化において,ソフトウェアの迅速な更新が重要である。
- 無線システムの確率的性質により,性能変動の原因特定が困難である。
- ソフトウェア更新による性能への影響を自動的に評価し,回帰分析を可能にする。
- RANalyzerは,LLMを活用したセマンティック抽出と残差分析を組み合わせる。
- 2年以上にわたるO-RANテストベッドでの継続的な無線テストデータ(8,600回以上)を活用。
- 期待性能との乖離をソフトウェア起因の影響と解釈し,コード変更との相関を特定。
スライディングウィンドウモデルにおける最大部分配列和の近似維持 [cs.DS]目的:最大部分配列和の近似維持
- データストリーム処理において,最新の統計量を効率的に維持することは重要である。
- 正確な計算には線形空間が必要であり,空間効率が課題となっている。
- サブ線形空間での近似維持手法を開発し,空間効率を向上させる。
- スムースヒストグラムフレームワークを用いることで,相対誤差の範囲内で近似計算が可能となる。
- 任意の$\epsilon > 0$に対し,$(1 \pm \epsilon)$-近似を$O(\epsilon^{-1}(\log n)^2)$ビットで実現する。
- 空間複雑さは漸近的に最適であり,効率的な更新操作も可能である。
2つの指定頂点を通る奇サイクルを見つける線形時間アルゴリズム [cs.DS, math.CO]目的:2つの指定頂点を通る奇サイクルの発見
- グラフ理論は,ネットワーク分析や最適化問題など,幅広い分野に応用されている重要な研究分野である。
- グラフにおけるサイクル検出は計算量が多く,特に大規模グラフでは効率的なアルゴリズムが求められる。
- 指定された2つの頂点を通る奇サイクルを効率的に見つけるアルゴリズムを開発し,その有用性を示す。
- 無向グラフにおいて,2つの指定頂点を通る奇サイクルを決定論的に線形時間で見つけるアルゴリズムが提案された。
- このアルゴリズムは,任意の群 $\Gamma$ に対して一般化されており,異なるラベルを持つ2つのサイクルが存在するかどうかを線形時間で判定できる。
- グラフにラベル付けを行うことで,より一般的なサイクル検出問題への応用が可能となる。
単一始点最短経路と擬似円グラフにおけるほぼ正確な直径 [cs.CG, cs.DS]目的:平面上の定数複雑度オブジェクトの集合に対応する無向グラフにおける単一始点最短経路問題および直径問題の解決
- 幾何学的データ構造の効率的な処理は,計算幾何学や地理情報システムなど,様々な分野で重要である。
- 交差グラフにおける最短経路問題の計算量は,オブジェクトの種類によっては依然として高いままである。
- 擬似円グラフにおける最短経路および直径問題を,より効率的なアルゴリズムで解決することを目指す。
- 任意のオブジェクトクラスに対して,$O(U(n)\ \mathrm{polylog}\,n)$の期待時間で単一始点最短経路問題を解くアルゴリズムを提案した。
- 擬似円グラフの直径を,加法誤差2以内で$\tilde{O}(n^{2-1/14})$の期待時間で計算するアルゴリズムを開発した。
- 擬似円グラフの交差グラフに対するスターベースの$r$-クラスタリングを提案し,ほぼ正確な距離オラクルを構築した。
スパース復元のための統一的な分数正則化フレームワーク [cs.IT, cs.LG, math.IT]目的:スパース信号復元のための統一的枠組み
- 信号処理や画像処理において,スパース表現は重要な役割を果たす。
- 既存手法では,高コヒーレンスなセンシング行列下での性能が課題となる場合がある。
- 高コヒーレンスなセンシング行列下でもロバストな復元を可能とする。
- 提案手法は,$\ell_1/\ell_p^q$モデルと$\ell_1 - \alpha \ell_p$モデルの等価性を理論的に明らかにした。
- 制限等方性性質(RIP)の下で,十分な復元条件が新たに導出された。
- 数値実験の結果,提案手法は既存手法よりも一貫して優れた性能を示した。
RAT:完全自動環境構築によるあらゆる実行 [cs.SE, cs.AI]目的:リポジトリレベルのソフトウェアエンジニアリングタスク自動化
- 自律的なコードエージェント実現には不可欠であり,開発効率の向上に繋がる。
- 環境構築は手作業に頼る部分が多く,ボトルネックとなっている。
- 実世界の多様なリポジトリに対応可能な環境自動構築フレームワークを提案する。
- RATは,セマンティック初期化,計画メカニズム,ツールセット,堅牢なサンドボックスを統合した言語非依存のフレームワークである。
- 提案するベンチマークRATBenchは,実世界の多様なリポジトリを反映している。
- 実験の結果,RATは既存のベースラインと比較して,環境構築成功率を平均29.6%向上させた。
線形空間における良条件な無自覚摂動 [cs.DS, cs.LG, cs.NA, math.NA, math.PR, stat.ML]目的:線形空間における良条件な摂動手法の開発
- アルゴリズムの平滑化解析において,行列の条件数を改善することが重要である。
- 既存のガウスノイズによる摂動は,計算コストが高いという課題がある。
- 少数の乱数で効率的に条件数を改善し,計算コストを削減することを目指す。
- 提案手法では,O(n)個の乱数のみを用いて,ガウス摂動と同等の条件数改善を実現した。
- これにより,共役勾配法などの線形方程式解法の計算量を削減できることが示された。
- パターン行列と依存的な疎な摂動を組み合わせることで,効率的な手法を実現している。
情報セキュリティマネジメントの運用化:金融テクノロジー組織におけるISO/IEC 27001:2022実装のプロシージャフレームワーク分析 [cs.CC, cs.SE, cs.CR, cs.SI, cs.SY, eess.SY]目的:情報セキュリティマネジメントシステム(ISMS)の運用化に関するプロシージャフレームワーク
- 情報集約型環境では,情報セキュリティのガバナンスの形式化が求められており,その重要性が増している。
- ISO/IEC 27001:2022の要件を組織の運用に落とし込み,実効性のあるISMSを構築・維持することが課題である。
- 金融テクノロジー組織におけるISO/IEC 27001:2022の実装事例を分析し,効果的なISMSの基盤を明らかにすること。
- 本研究では,ITリスク評価,ユーザー行動規範,パスワードポリシーなど8つの主要な運用プロシージャを分析した。
- 各プロシージャがISO/IEC 27001:2022の附属書Aおよび条項6~10の要件をどのように具体化しているかを調査した結果,CIAトライアドが評価基準として有効であることが示された。
- 緊密に統合された多層的なプロシージャ階層,明確な責任構造,測定可能なリスク指標が,金融テクノロジー環境における効果的なISMS実装の基盤を構成することが示唆された。
ソース認識型切断ARQを用いたマルチソース無線ステータス更新における情報鮮度 [cs.CL, cs.IT, math.IT]目的:マルチソース無線IoTステータス更新システムにおける情報鮮度の分析
- IoTデバイスの普及により,リアルタイムなステータス更新の重要性が増している。
- 無線通信の信頼性やエネルギー消費が,情報鮮度に大きな影響を与える。
- ソースごとに最適な伝送時間設定により,情報鮮度とエネルギー効率を向上させる。
- 提案手法SATARQは,ソースに応じた最大伝送時間の設定により,情報鮮度を改善する。
- マルコフ連鎖による解析から,情報鮮度およびピーク情報鮮度の分布と平均を導出した。
- 伝送時間,更新生成確率,送信電力の最適化により,情報鮮度とエネルギー消費のトレードオフを改善する。
AI支援コードレビュー:コード品質と自己調整学習の足場としての経験報告 [cs.RO, cs.SE, cs.AI]目的:AI支援コードレビューの実践を通じたコード品質向上と自己調整学習の促進
- ソフトウェア工学教育においてコードレビューは不可欠だが,大規模な実践は困難である。
- 学生の経験不足や時間制約から,十分な質と量のピアレビューが難しい場合がある。
- AIを活用し,効果的かつ効率的なコードレビュー環境を構築することで課題解決を目指す。
- 2024年度の学生は,プルリクエストの反復回数が大幅に増加し,改善が見られた。
- 2023年度に発生したAIレビューの失敗は,ツールの改良と指導によって完全に解消された。
- AIレビューを受けたプルリクエストの約3割で,追加のコミットが行われ,継続的な改善が確認された。
ソフトウェア工学における知識レバーリスク管理:知識喪失を軽減するための確率的フレームワーク [cs.SE, cs.AI]目的:ソフトウェア工学における知識喪失リスク軽減のためのフレームワーク
- ソフトウェア開発は知識集約型であり,暗黙知の損失はプロジェクト成功に不可欠な要素である。
- 従来のスケジュールや予算重視のリスク管理では,プロジェクト成功を左右する知識リスクへの対応が不十分である。
- 知識をリスク軽減の手段として捉え,知識喪失による悪影響を定量的に評価・抑制すること。
- 提案する知識レバーリスク管理(KLRM)フレームワークは,知識を能動的なリスク軽減メカニズムとして再定義する。
- モンテカルロシミュレーションの結果,知識レバーの完全な活用は期待される知識資本を63.8%増加させ,知識危機発生確率をほぼゼロにする。
- 知識レバーの活用は,プロジェクト管理の鉄の三角形(スコープ,時間,コスト)における整合性を向上させ,手戻りや再発見コストを削減する。
構成的μ-calculus: ゲーム意味論と非整礎証明系 [cs.RO, cs.LO, math.LO]目的:構成的μ-calculusのゲーム意味論と非整礎証明系の研究
- モデル検査等に応用されるμ-calculusは,形式検証における重要なツールである。
- 従来のμ-calculusは,非整礎構造に対する証明系が十分ではないという課題がある。
- 構成的μ-calculusにおける非整礎証明系の健全性と完全性の証明を目指す。
- 構成的μ-calculusに対するゲーム意味論を定義し,双関係クリプケ意味論との同値性を証明した。
- 定義したゲーム意味論を用いて,非整礎証明系の健全性と完全性を証明した。
- この結果を基に,他の非古典様相論理への拡張の可能性を示唆した。
6Gネットワークに向けた自律的テスト駆動型品質保証 [cs.NI, cs.SE]目的:6Gネットワークにおける自律的テスト駆動型品質保証フレームワークの提案
- 次世代6Gネットワークでは,多様なサービス提供と品質保証が不可欠である。
- ネットワークの複雑化に伴い,意図と実装の乖離や品質問題が発生しやすい。
- 意図に基づいた自動テスト生成により,サービスレベル合意(SLA)の遵守を担保する。
- 本研究では,意図とテストを連動させることで,プロアクティブな品質保証を実現するフレームワークを構築した。
- TM Forum(TMF)の標準モデルを活用することで,知識ベースからテスト仕様までの決定的な導出を可能にした。
- LLMバックエンドのツール利用の信頼性やハルシネーションパターンにばらつきが見られ,堅牢な知識統合の重要性が示唆された。
線形最小化問題の妨害に関する考察 [cs.DS]目的:線形最小化問題における妨害戦略の最適化
- ネットワーク設計やサプライチェーンなど,様々な分野で重要な最適化問題である。
- 妨害問題はNP困難であり,大規模な問題に対する効率的な解法が課題である。
- カットを用いないアプローチで,最適解の近似解法を導き出すことを目指す。
- 最適ラグランジュ乗数において,最適な妨害証拠は再重み付けされた問題の厳密な2近似最小化解となる。
- 再重み付けされた問題を最適化できれば,正確なアルゴリズムが得られる可能性がある。
- HuangらのFPTASの議論をより一般化した形で,妨害問題の解法に貢献する。
LLMは効果的なコード貢献者となり得るか?オープンソースプロジェクトにおける研究 [cs.SE]目的:大規模言語モデルによるコード貢献の有効性評価
- ソフトウェア開発において,コード生成AIの利用は増加の一途を辿っており,開発効率化への期待が高い。
- LLM生成コードの品質は十分ではなく,実運用における信頼性が課題となっている。
- オープンソースプロジェクトを対象に,LLMのコード貢献能力の限界と改善点を明らかにすること。
- LLMによるコード修正・機能追加の成功率はプロジェクトによって0%から60%に変動した。
- LLMは構文エラー,静的検証の失敗,テストスイートでの不合格など,様々な問題を起こした。
- 特に,新規コード生成,長文コンテキストの処理が苦手であり,学習データに類似したコードを模倣する傾向が見られた。
複数テスト目的と分布シフト下におけるテスト選択指標の経験的考察 [cs.SE]目的:テスト選択指標の有効性評価
- 安全性確保のため,深層学習システムの事前テストが不可欠である。特に,実環境での予期せぬ挙動を防ぐ必要がある。
- 既存研究では,テスト目的が限定的,OODシナリオの網羅性が低い,データ形式の偏りがあるといった課題が存在する。
- 多様なテスト目的,OODシナリオ,データ形式下での指標性能を評価し,実用的な指標選択の指針を示すことを目指す。
- 15の既存指標を,3つのテスト目的,5種類のOODシナリオ,3つのデータ形式,13の深層学習モデルで評価した。
- 総計1,640の実験シナリオを実施し,指標の性能を統計的に分析することで,包括的な評価を実現した。
- 本研究は,特定の目的と状況において最適なテスト選択指標を見つけるための,実用的な情報を提供する。
Pythonコードにおけるバグ検出のためのローカルLLMの経験的評価 [cs.CL, cs.HC, cs.RO, cs.SE, cs.AI, cs.LG]目的:Pythonコードのバグ検出におけるローカルLLMの性能評価
- ソフトウェア開発において,バグの早期発見は品質向上とコスト削減に不可欠である。
- クラウドベースのLLMはプライバシーやリソース制約の面で課題があり,実用性が制限される場合がある。
- ローカルLLMが実用的なバグ検出に貢献できるか検証し,その限界を明らかにする。
- ローカル実行モデル(LLaMA 3.2,Mistral)は,BugsInPyベンチマークにおいて43〜45%の精度を示した。
- 完全に正しい修正箇所を特定することは困難だが,問題のあるコード領域を特定する部分的に正しい応答を多く生成した。
- 性能はプロジェクト間で大きく異なり,コードベースの特性が重要な影響を与えることが示唆された。
UniAda:エンドツーエンド自動運転システムに対する汎用適応型多目的敵対的攻撃 [cs.SE, cs.LG]目的:エンドツーエンド自動運転システムに対する敵対的攻撃手法
- 深層学習の安全性確保は不可欠であり,信頼性評価手法が求められている。
- 既存手法は操舵角に偏重し,速度制御や微小な摂動への対策が不十分である。
- 操舵と速度の両方を同時に制御可能な敵対的摂動を生成し,システムの脆弱性を評価する。
- UniAdaは,既存の攻撃手法5つと比較して,操舵角のずれを平均3.54度から29度,速度のずれを平均11km/hから22km/hまで引き起こすことが示された。
- 適応型重み付けスキームにより,複数の目的を同時に最適化することで,攻撃性能が向上する。
- シミュレーションと実車データ両方で有効性が確認され,UniAdaが現代の深層学習ベースの自動運転システムに対する実証的な攻撃手法であることが示された。
列挙カーネル化のための,より汎用的なモデル:頂点被覆へのケーススタディ [cs.DS]目的:列挙カーネル化モデルの改善と,頂点被覆問題への適用
- パラメータ化された複雑性理論と列挙アルゴリズムの融合領域として,列挙カーネル化は重要性を増している。
- 既存の列挙カーネル化モデルは,許容範囲が広すぎたり,厳しすぎたりして,発展が遅れている。
- より柔軟で,既存モデルの利点を維持する新しい列挙カーネル化モデルを提案し,その有用性を示す。
- 提案するPDカーネルは,従来のモデルよりも柔軟でありながら,重要な特性を維持していることが示された。
- 頂点集合問題に対する汎用的なフレームワークを設計し,決定カーネルをPDカーネルへ変換可能であることを示した。
- 頂点被覆問題において,頂点削除距離や解のサイズに関するカーネル化二分法を拡張し,簡潔なリフティングアルゴリズムを導出した。
大規模言語モデルにおける文脈学習とプロンプト連鎖による科学テキストの自動分類 [cs.IR, cs.AI, cs.CL, cs.DL, cs.SE]目的:科学テキストの分類スキームに基づいた分析性能評価
- 科学文献の爆発的な増加により,情報探索の効率化が重要となっている。
- 既存の検索システムでは,コンテンツの自動分類が不十分である。
- 大規模言語モデルと高度なプロンプト設計による分類精度の向上を目指す。
- プロンプト連鎖は,純粋な文脈学習と比較して,より高い分類精度を示す。
- プロンプト連鎖を用いた大規模言語モデルは,ドメインおよび主題レベルの予測において既存モデルを上回る。
- しかし,研究分野のトピックレベルの分類精度は50%程度にとどまる。
CUJBench:ブラウザからバックエンドへのクロスモーダル故障診断におけるLLMエージェントのベンチマーク [cs.SE]目的:クロスモーダル故障診断のベンチマーク
- システム障害の自動診断は,可用性向上と運用コスト削減に不可欠である。
- 既存のベンチマークは,ブラウザとバックエンドの情報を組み合わせたクロスモーダルな推論を評価していない。
- ブラウザとバックエンドの両方の情報を用いて,より正確な故障診断を可能にすること。
- CUJBenchは,ブラウザの症状とバックエンドの観測データを組み合わせた初のベンチマークである。
- 実験結果から,既存モデルの平均正答率は19.7%であり,改善の余地が大きいことが示された。
- ツールへのアクセス拡大が必ずしも性能向上に繋がらず,クロスモーダル合成の能力がボトルネックであることが判明した。
LLMベースシステムにおける不確実性の伝播 [cs.SE, cs.AI]目的:LLMベースシステムの不確実性伝播の体系的理解
- LLMの応用拡大に伴い,システムの信頼性確保が重要課題となっている。
- システム全体での不確実性の扱いが不十分であり,エラーの増幅や制御困難性が課題。
- システムレベルでの不確実性伝播メカニズムを明らかにし,課題解決に貢献する。
- 本研究では,不確実性伝播をシステムレベルで捉えるための概念的枠組みを提案した。
- 不確実性伝播メカニズムを,モデル内部,システム全体,社会技術システムに分類する構造化された分類体系を提示した。
- 不確実性伝播に関する5つの未解決研究課題を特定し,今後の研究方向性を示した。
意味駆動型ユニットテスト生成によるビジネスロジックバグの発見 [cs.SE]目的:ビジネスロジックバグの検出
- エンタープライズソフトウェアにおいて,ビジネスロジックバグは頻発しており,その品質保証は重要である。
- 既存のユニットテスト生成技術はコード中心であり,ビジネスロジックバグの検出が困難である。
- 要件定義書からビジネスロジックを抽出し,テストケース生成に活用することで,バグ検出率を向上させる。
- SeGaは,要件定義書からセマンティック知識ベースを構築し,LLMベースのテスト生成を導くビジネスシナリオを生成する。
- 4つのGoプロジェクトで実施した評価により,SeGaは最先端のLLMベース手法よりも22-25個多くのバグを検出した。
- 実稼働リポジトリでの展開により,開発者によって確認・修正された16個の未知のビジネスロジックバグを発見した。
離散分布のクラスタリングのための単純なアルゴリズム [cs.DS]目的:離散分布のクラスタリング手法
- データ分析において,データのグループ化は重要な課題であり,効率的なクラスタリング手法の確立が求められている。
- 従来の離散分布のクラスタリングは,座標に依存した投影に頼るため,回転に対して不安定であり,汎用性に欠けるという問題があった。
- 本研究は,回転不変で汎用的なクラスタリングアルゴリズムを提案し,離散分布および連続分布の両方に適用可能とする。
- 提案アルゴリズムは,データ行列の最良のランクk近似に基づき,k-means計算によって得られた近似中心への投影によって機能する。
- 本アルゴリズムは,McSherryの離散分布に対する幾何学的アルゴリズムの存在に関する予想を解決する。
- クラスタ中心間の分離条件の下で,アルゴリズムが成功することが証明された。
文法制約を用いた言語によるループでの安全動作規則の改良:何が問題となりうるか [cs.IR, cs.MM, cs.SE, cs.AI]目的:サイバー物理システムにおける安全動作規則の改良
- サイバー物理システムの安全性確保は,社会実装において不可欠である。
- 動作環境の変化に伴い,安全規則の維持・更新が困難である。
- 文法制約と反事実推論により,安全性を損なわない規則改良を目指す。
- 提案手法は,従来の基盤手法で検出された安全規則の矛盾を解決し,文法適合性を維持した。
- 大規模言語モデルを用いた実験により,改良品質のモデル依存性や安全性に関する知見が得られた。
- 厳格な文法適用,意味検証の強化,広範な評価が今後の課題として示唆された。
AgentEval:エラー伝播追跡のためのDAG構造化ステップレベル評価 [cs.SE, cs.CL]目的:エージェントワークフローにおけるステップレベルの評価手法
- 複雑なタスクをこなすエージェントシステムの重要性が増しているため,その性能評価が不可欠である。
- 従来の評価方法では,中間段階での失敗が隠蔽され,実際のエラー原因の特定が困難である。
- 本研究は,より詳細なエラー分析と迅速な原因特定を可能にする評価フレームワークを構築することを目指す。
- AgentEvalは,エージェントの実行をDAG(有向非巡回グラフ)として形式化し,各ステップの品質を評価する。
- 従来の評価手法と比較して,エラー検出のリコール率が2.17倍向上し,エラー原因の特定精度も向上した。
- 実際のCI/CD環境でのパイロットテストにより,リリース前の回帰検出と原因特定時間の短縮に貢献した。
いくつかのBCHコード族の最小距離について [cs.IT, math.IT]目的:特定の狭義BCHコード族の最小距離の決定
- 通信やデータ記憶システムにおいて重要な役割を果たす巡回符号の一種である
- BCHコードの真の最小距離を決定することは非常に困難な問題である
- 無限個の狭義BCHコード族の最小距離を具体的に決定することで,この問題の解決を目指す
- 最小重量符号の定位多項式を明示的に構成することで,最小距離が設計距離と等しい無限個の原始および非原始BCHコード族を得た。
- 特に,$\mathbb{F}_3$ および $\mathbb{F}_4$ 上のBCHコードにおいて,$\delta$ が5, 6, 7, 8のときの無限個の族を発見した。
- Dingらの定理における,最小距離とBose距離の一致に関する予想を,$m \equiv 0 \pmod{pt}$ の場合に確認した。
不完全CSI下におけるMA支援OTFSシステムのためのDRLベースアンテナ位置最適化 [cs.RO, cs.IT, math.IT]目的:アンテナ位置最適化
- 無線通信において,信号品質向上のため,電波環境に適応したアンテナ技術が重要である。
- 従来のアンテナ配置では,深フェージングによる通信品質劣化が課題となっていた。
- 不完全なCSI下でも,効率的にアンテナ位置を最適化し,通信品質を向上させることを目指す。
- 提案手法であるSBLVIは,既存手法と比較してチャンネル推定精度を大幅に向上させる。
- 推定されたCSIに基づいたMA位置最適化により,固定位置アンテナよりも大幅に高いチャンネルゲインを達成する。
- これにより,MA支援OTFSシステムの有効性が実証された。
階層型クラスタリングにおける許容可能な目的関数の特徴づけ [cs.DS, cs.LG]目的:階層型クラスタリングのための許容可能な目的関数の特徴
- データ分析の基礎であり,データ構造の理解に不可欠なクラスタリング手法。
- 目的関数の原理的な定義が長らく欠けており,理論的保証が難しかった。
- 許容可能な目的関数を特定し,アルゴリズムの近似率を保証すること。
- 本研究では,特定のクラスの目的関数(sum-type)において,許容性の特徴づけを行った。
- scaling関数が特定の次数を持つ多項式の場合,再帰的なsparsest cutアルゴリズムの近似率を評価した。
- さらに,新しいクラスの目的関数(max-type)についても,許容性の一般的な特徴づけを示した。
MA支援ISACにおけるセンシング支援セキュア通信:CRB解析とロバスト設計 [cs.IT, math.IT]目的:移動アンテナ支援ISACシステムにおけるセンシング支援セキュア通信スキーム
- 物理層セキュリティにおいて,傍受者のチャネル状態情報取得は困難であり,セキュア通信のボトルネックとなっている。
- ISACシステムはセンシング機能を持つが,傍受者の角度推定精度が通信性能に大きく影響する。
- 移動アンテナ配置の最適化とロバストビームフォーミング設計により,推定不確実性を考慮したセキュア通信を実現する。
- 提案スキームは,移動アンテナ位置の最適化と,推定された傍受者角度の不確実性領域を考慮したビームフォーミングにより,秘匿率を最大化する。
- CRB解析により,移動アンテナの位置が角度推定の不確実性に与える影響を定量的に評価した。
- シミュレーション結果から,提案スキームが既存手法と比較して,有意な性能向上を示すことが確認された。
大規模言語モデルによるコードレビューコメントの自動分類 [cs.SE]目的:コードレビューコメントの分類
- ソフトウェア品質維持に不可欠なコードレビューの効率化が求められている。
- コードレビューコメントの冗長性,曖昧さ,建設性の欠如が課題となっている。
- コメントの問題点を詳細に分類する自動化システムの構築を目指す。
- ゼロショット性能はクラスの不均衡下で中程度であった(マクロF1 0.360~0.374)。
- ワンショット事例条件付けはモデルによって異なり,GPT-5-miniとDeepSeek-R1は改善したが,LLaMA-3.3はわずかに低下した。
- 事例は意図境界ラベルに一貫して役立ったが,証拠に依存するラベルの分類は依然として難しい。
