arXiv雑要約
プログラム - 2026/03/25 公開
有限ブロック長ペナルティの統一代数吸収:一般化対数写像による [cs.IT, math-ph, math.IT, math.MP, math.PR]目的:有限ブロック長情報理論におけるチャネル符号化の限界評価
- 通信システムの信頼性向上には,誤り訂正符号の性能評価が不可欠である。符号長が短い場合の正確な評価が課題。
- 既存手法はガウス近似に依存し,高次モーメントの取り扱いに限界があった。精度向上と計算効率化が求められる。
- 有限長ペナルティを代数的に吸収する新しい枠組みを提示し,より正確な性能評価を実現すること。
- 提案手法では,$q$-代数枠組みを用いて有限長ペナルティを吸収し,ガウス基盤への外部誤差項の追加を回避した。
- この枠組みは,第三次モーメントに基づいたスケーリング定数を用いることで,第三次符号限界を再現し,$O(1)$の非ガウスペナルティを吸収する。
- 代数展開の$k$次項は,Edgeworth補正の$(k+1)$次モーメントの漸近的オーダーと一致し,既存手法との整合性を示した。
アルゴリズム研究者I:大規模な証明可能なアルゴリズム合成の可能性 [cs.SE, cs.AI]目的:証明可能な保証を持ち,かつ実用的なアルゴリズムの合成
- アルゴリズム設計は計算機科学の根幹であり,効率と信頼性が求められる。
- 既存手法は事前知識に依存,またはアルゴリズムの範囲が限定されていた。
- LLMを活用し,データセットに応じたアルゴリズムを生成する新たなパラダイムを確立。
- Algorithmistは,GitHub Copilot上に構築された自律研究エージェントである。
- プライバシー,近似,解釈可能性を満たすアルゴリズムを証明的に設計し,実証的な有効性も確認した。
- 既存研究の誤りを発見し,証明に基づいたコード合成の可能性を示唆した。
暗号化移行のためのアーキテクチャ由来のCBOM:セキュリティを意識したアーキテクチャのトレードオフ手法 [cs.CR, cs.SE]目的:暗号化移行計画における情報提供と長期的な暗号化の俊敏性向上
- 暗号アルゴリズムの陳腐化や法規制の変化に対応するため,安全な暗号化移行が重要である。
- 従来のCBOMは,アーキテクチャの意図やセキュリティの文脈を欠き,移行計画の策定に限界がある。
- アーキテクチャに基づいたCBOMを生成し,暗号化移行に必要な情報とセキュリティの文脈を提供する。
- 本研究で提案するSATAMは,セキュリティを考慮したアーキテクチャ評価により,アーキテクチャに根ざした文脈に敏感なCBOMを生成する。
- 生成されたCBOMは,従来のインベントリベースのアプローチでは不足していた移行に関連する文脈を捉えることが示された。
- SATAMは,情報に基づいた暗号化移行計画と長期的な暗号化俊敏性を実現するための情報可用性を向上させる。
SkillClone:エージェントスキルエコシステムにおける多Modalクローン検出とクローン伝播分析 [cs.SE]目的:エージェントスキルのクローン関係の検出と,その伝播状況の分析
- エージェントスキルは急速に増加しており,その管理と品質保証が重要になっている。
- エージェントスキルにはクローンが存在する可能性があるが,それを検出する仕組みが存在しない。
- エージェントスキルの多Modalな構造に対応できるクローン検出手法を開発し,エコシステムの健全性を評価する。
- SkillCloneは,YAML,自然言語,コードの3つのコンテンツチャネルを融合した多Modalクローン検出アプローチである。
- SkillClone-Benchベンチマークにおいて,F1スコア0.939,適合率0.952を達成し,既存手法を上回る性能を示した。
- 2万件のスキルに適用した結果,75%のスキルがクローン関係にあり,エコシステムは3.5倍に膨張していることが判明した。
並列化可能なファインマン・カックモデルによる汎用確率的プログラミング [eess.SY, cs.SY, math.DS, cs.PL]目的:確率的プログラムの推論における逐次モンテカルロ法の正確性と効率性の証明
- 確率的プログラミングは,不確実性を含むモデルを記述する強力なツールであり,様々な分野で応用が拡大している。
- 複雑な確率的プログラムの推論は計算コストが高く,現実的な時間で正確な結果を得ることが困難である。
- ファインマン・カックモデルに基づき,ベクトル化された逐次モンテカルロ法を開発し,推論効率の向上を目指す。
- 確率的プログラムグラフに期待値ベースのセマンティクスを導入し,無限実行トレースを扱うことを可能にした。
- 有限長のトレースに基づく期待値による近似の有限性に関する定理を証明し,ファインマン・カックモデルとの整合性を保証した。
- ベクトル化された逐次モンテカルロ法 VPF を導入し,既存の推論ツールと比較して有望な結果が得られた。
連合学習におけるエネルギーを意識した勾配プルーニングの理論的枠組み [cs.LG, cs.DC, cs.IT, cs.NI, math.IT, stat.ML]目的:連合学習におけるエネルギー効率の最適化
- エッジデバイスの普及に伴い,分散型機械学習の重要性が高まっている。
- 分散環境における通信とエネルギー制約が,学習のボトルネックとなっている。
- ハードウェア特性を考慮したプルーニング手法により,エネルギー効率を改善する。
- 提案手法CWMPは,コストを考慮した勾配プルーニングを実現し,通信量削減とエネルギー消費抑制の両立に貢献する。
- CWMPは,制約付き射影問題に対する最適な貪欲解であることが理論的に示された。
- 非IIDなCIFAR-10ベンチマーク実験により,CWMPが従来のTop-K法よりも優れた性能とエネルギー効率を示すことが確認された。
脆いものから堅牢へ:SE最適化のためのLLMアノテーションの改善 [cs.SE]目的:ソフトウェアエンジニアリング最適化におけるLLMアノテーションの精度向上
- ソフトウェア分析はラベル付きデータに依存しており,その品質が分析結果に大きく影響する。
- LLMによるラベル付けは,特に高次元多目的最適化問題において,盲点を持つことが課題となっていた。
- LLMの意見を統合するアンサンブル学習によって,高次元多目的最適化タスクのアノテーション精度を向上させる。
- 提案手法SynthCoreは,既存の最先端手法(ガウス過程モデル,Parzen Estimatorの木,アクティブラーナー)を上回る最適化結果を達成した。
- この最適化は,人間の意見を一切用いずに,LLMによってラベル付けされたデータのみに基づいて行われた。
- SynthCoreのアンサンブル学習アプローチは,他のFew-Shotプロンプティング結果の強化にも応用可能であると考えられる。
サーバーレスコンピューティングにおける技術的負債の類型,課題,および解決策の調査 [cs.SE]目的:サーバーレスコンピューティングにおける技術的負債に関する理解
- サーバーレスコンピューティングはスケーラビリティ向上と運用コスト削減に貢献する重要技術である。
- サーバーレス環境特有の複雑さから,技術的負債の蓄積とその管理が課題となっている。
- サーバーレスにおける技術的負債の現れ方,課題,解決策を明らかにすることを目指す。
- Stack Overflowの質問データ分析により,サーバーレス関連質問の約37%が技術的負債に関連することが判明した。
- サーバーレス特有の技術的負債に関連する6つの課題が特定された。
- サーバーレスアプリケーションにおける技術的負債を効果的に検出するためのツール開発の必要性が示唆された。
モデルコンテキストプロトコルにおける脅威モデリングと,ツールポイズニングによるプロンプトインジェクション脆弱性の分析 [cs.NI, cs.ET, cs.CR, cs.SE]目的:AIアシスタントと外部ツール・データソース接続のための標準プロトコルであるモデルコンテキストプロトコル(MCP)のセキュリティ脆弱性
- AIアシスタントの普及に伴い,外部ツールとの連携が不可欠となり,その標準化が進んでいる。
- MCPは統合を容易にする一方,クライアント側にセキュリティ上の脆弱性が存在し,悪用されるリスクがある。
- 本研究は,特にツールポイズニングに着目し,MCPのセキュリティ対策の強化を目指す。
- 脅威モデリングの結果,ツールポイズニングが最も重大なクライアント側脆弱性であることが判明した。
- 7つの主要なMCPクライアントの検証では,静的検証とパラメータの可視化が不十分であるというセキュリティ上の問題が明らかになった。
- 静的メタデータ分析,モデルの意思決定経路追跡,行動異常検知,ユーザーへの透明性メカニズムを含む多層防御戦略を提案する。
大規模言語モデルを用いたインコンテキストプロンプティングによるスイス公共部門向け持続可能な調達基準の生成と評価 [cs.SE, cs.CL]目的:スイス公共部門における持続可能な調達基準の生成と評価
- 公共調達は政府や自治体等の活動において重要であり,環境・社会・経済の持続可能性が求められる。
- 高レベルの持続可能性に関する規制を,具体的な調達基準に翻訳するには専門知識と労力がかかる。
- 大規模言語モデルを用いて,調達基準の作成を効率化し,質の高い基準を生成することを目指す。
- 本研究で提案するパイプラインは,スイス政府や欧州委員会の公式ガイドラインを用いて,持続可能性を重視した調達基準カタログを体系的に生成・評価できる。
- 自動品質チェックと専門家による比較の結果,提案手法は基準作成の手作業を大幅に削減し,公式ガイドラインとの整合性を確保できることが示された。
- 生成AIを公共部門のソフトウェアワークフローに組み込む際の限界,エラーモード,設計上のトレードオフについても議論した。
通信効率的な近似勾配符号化 [cs.IT, cs.DC, math.IT]目的:大規模分散学習における通信効率的な近似勾配符号化方式の構築
- 分散学習の効率化は,大規模データセットを用いた機械学習において不可欠である。
- 一部のワーカーが遅延した場合でも学習を継続できる耐障害性が課題となる。
- 通信量を削減しつつ,勾配の近似精度を保つ符号化方式を開発する。
- 本研究では,二部グラフや強正則グラフを利用した符号化方式を提案した。
- 提案方式の近似誤差に関する理論的な上限と下限を導出した。
- 確率的ワーカー故障モデル下で,期待勾配が真の勾配に等しいことを証明し,学習アルゴリズムの収束性を示した。
LLMON:LLMインターフェースにおける構造と意味論を活用するためのLLMネイティブマークアップ言語 [cs.SE, cs.AI, cs.PL]目的:LLMインターフェースにおける構造と意味論の活用
- LLMの性能向上の鍵は,入力データの構造化と意味理解にある。
- LLMへの入力はテキスト形式が一般的で,構造や意味が明確に伝わらない。
- LLMネイティブなマークアップ言語により,構造と意味をLLMに正確に伝達することを目指す。
- LLMONは,LLMに構造と意味的メタデータを自然に伝達するマークアップ言語である。
- LLMONは,モデルの学習,プロンプト,推論実装において,精度,安全性,セキュリティの向上に貢献する。
- LLMONの設計要件と,その有効性を示す初期的な実験結果が提示されている。
ソフトウェア工学における多様性の経済的影響 [cs.SE]目的:ソフトウェア工学チームにおける多様性の経済的影響に関する専門家の認識
- ソフトウェア開発は経済成長の重要な原動力であり,その効率化は社会全体の発展に不可欠である。
- ソフトウェア工学の研究では,社会技術的側面やプロセス改善に重点が置かれ,経済的側面に関する検討は不足している。
- ソフトウェア工学における多様性が,コスト削減や収益向上など,経済活動にどのように貢献するかを明らかにする。
- インタビュー調査の結果,多様性はコスト削減,収益増加,市場投入までの時間短縮など,経済的に関連性があると認識されている。
- 参加者は,抽象的な経済的根拠よりも,具体的なプロジェクト経験に基づいて多様性の有用性を評価している。
- 多様性は,プロジェクトの推進,競争力の強化,組織の存続可能性を支える実践的な資源と捉えられている。
2つの文字列間の最小共通超列の計算と列挙 [cs.DS]目的:2つの入力文字列に対する最小共通超列の計算と,すべての最小共通超列の列挙
- 文字列処理は,情報科学の基礎であり,生物情報学など幅広い分野に応用される。
- 共通超列の計算はNP困難だが,k=2の場合でも,最小共通超列の効率的な列挙は未解決問題であった。
- 2つの文字列間の最小共通超列を効率的に計算・列挙する手法を確立し,その応用可能性を探る。
- 2つの入力文字列の最小共通超列は,O(n)時間で計算可能である。
- すべての最小共通超列は,O(n^2)空間のデータ構造とO(n)時間の遅延で列挙可能である。
- データ構造の構築にはO(n^3)時間がかかる。
非線形期待理論に基づく分布の不確実性と信号多様性を考慮した認知無線におけるエネルギー検出 [cs.IT, math.IT, math.PR]目的:認知無線におけるエネルギー検出の汎化
- 無線環境の多様性に対応するため,信頼性の高い信号検出が不可欠である。
- 従来のエネルギー検出は,確率分布の固定性を仮定し,不確実性への対応が不十分である。
- 分布の不確実性と信号の多様性を考慮した,ロバストな検出手法を確立すること。
- 非線形期待理論に基づき,信号とノイズの分布の不確実性を包括的に表現する汎化されたエネルギー検出の定式化を提案した。
- チャンネルノイズには$G$-正規分布を適用し,信号の多様性を捉えるため,信号絶対値の範囲を $[\underline{\sigma}_X,\overline{\sigma}_X]$ で制限した。
- 最悪ケースにおける検出性能を,許容される分布と信号実現の両方に関して二重上限によって特徴付け,数値シミュレーションで有効性を検証した。
BlindMarket:ゼロトラスト環境における検証可能,機密保持,トレーサブルなIPコア流通の実現 [cs.CR, cs.LO]目的:ハードウェアIPコアの流通フレームワーク
- 知的財産の保護は,半導体業界における競争力維持の鍵である。
- IPコア流通における信頼性の確保と不正利用防止が課題である。
- ゼロトラスト環境下での安全なIPコア取引を実現すること。
- BlindMarketは,検証可能性と機密保持を保証したIP取引を実現する。
- 設計剪定と制御フローガイド型ヒューリスティクスにより,検証のスケーラビリティを向上させている。
- 13種類の設計のうち12種類で検証に成功し,性能改善を実証した。
エッジ分布の特性の検証 [cs.DS, cs.CC]目的:エッジ分布の分布検定
- グラフ上のエッジ分布は,グラフの特性を理解する上で重要である。
- エッジ分布がグラフの特性をどの程度反映しているか不明な点がある。
- エッジ分布の二部性,三角形を含まなさ,正方形を含まなさの検定のサンプル複雑性を明らかにすること。
- 二部性の検定におけるサンプル複雑性は,Θ(n)であることが示された。
- 三角形を含まない分布の検定におけるサンプル複雑性は,n^{4/3±o(1)}であることが示された。
- 正方形を含まない分布の検定におけるサンプル複雑性は,n^{9/8±o(1)}であることが示された。
VLMはどこまで行けるか:ゲームプレイ動画における視覚的バグ検出の研究 [cs.RO, cs.CL, cs.CV, cs.SE]目的:ゲームプレイ動画における視覚的バグの検出能力
- ゲームの品質保証は重要であり,特に長時間プレイにおける安定性と視覚的な正確性の評価が不可欠である。
- 従来のゲームプレイ動画の品質保証は,人手に頼る部分が多く,時間と労力がかかる上に,見落としのリスクもある。
- 本研究では,大規模なゲームプレイ動画データを用いて,既存のVLMがどの程度のバグ検出能力を持つかを評価する。
- 単一プロンプトによるVLMの精度は0.50,正答率は0.72であった。
- 二次的な判断モデルやメタデータを用いたプロンプト改善策は,わずかな改善しか見られず,計算コストや出力のばらつきが増加した。
- 既存のVLMは,ある程度のバグ検出能力を持つが,テキストと視覚的な異常検出を分離するハイブリッドなアプローチが必要である可能性が示唆された。
大規模言語モデルの連携は安全なコード生成を向上させるか?包括的な評価フレームワークMulti-LLMSecCodeEvalを用いた検証 [cs.CY, cs.CR, cs.SE]目的:安全なコード生成の改善
- 自然言語からコードを自動生成する技術は発展しているが,セキュリティ脆弱性が依然として残る。
- 大規模言語モデルの性能向上にもかかわらず,生成されたコードのセキュリティ確保が課題である。
- 複数モデルの連携や協調戦略が,安全なコード生成に貢献するかどうかを検証する。
- アンサンブルパイプラインは,静的解析と組み合わせることで,単一のLLMベースラインと比較してSecLLMEvalで最大47.3%,SecLLMHolmesで19.3%安全なコード生成が向上した。
- LLMベースの協調パイプラインは,わずかな改善にとどまり,8.9%から22.3%程度の向上であった。
- アンサンブル,検出,パッチングを統合したハイブリッドパイプラインは,最高のセキュリティ性能を示し,アンサンブルベースラインと協調ベースラインを上回った。
科学計算ノートブックの品質に関する研究 [cs.SE]目的:科学計算ノートブックの品質評価
- 科学研究の信頼性確保は重要であり,コードの品質が直接影響する。
- 研究コードの再現性,可読性,再利用性が低いという課題がある。
- 科学計算コードの品質向上に貢献する。
- 調査の結果,Nature誌2024年の論文に付属する518個のリポジトリ中,実行可能なノートブックはわずか2つのみだった。
- 再現性の低さは主に,データファイルや依存関係の欠如が原因である。
- コードの重複も多く,特に可視化,データ処理,統計分析タスクで頻繁に見られた。
ハミルトニアンモンテカルロ法のためのアルゴリズム的ウォームスタート [cs.DS, cs.LG, cs.NA, math.NA, math.ST, stat.ML, stat.TH]目的:高次元確率分布からのサンプリング効率改善
- 統計学,工学,自然科学における重要な課題であり,効率的なサンプリング手法が求められている。
- ハミルトニアンモンテカルロ法は広く利用されているが,次元数が高くなると収束に要する反復回数が問題となる。
- ウォームスタートの計算ボトルネックを解消し,高精度サンプリングの効率を向上させる。
- 強ログ凹性および3次微分条件を満たす分布において,ノンメトロポライズドHMCによるウォームスタートが$\tilde{O}(d^{1/4})$で実現可能となった。
- ウォームスタートを利用したメトロポライズドHMCにより,$\tilde{O}(d^{1/4})$という最速のアルゴリズムが実現された。
- これまでの$\tilde{O}(d^{1/2})$を改善し,高精度サンプリングにおける次元複雑性の問題を解決した。
隠れた経路問題の複雑性について [cs.HC, cs.DS]目的:グラフにおける隠れた経路探索の計算複雑性
- グラフ理論は,ネットワーク構造の分析に不可欠であり,様々な応用分野で利用される。
- 経路探索問題はNP困難であることが多く,大規模グラフにおける効率的な解法が求められている。
- パラメータ化複雑性を用いた効率的なアルゴリズム設計を目指す。
- 隠れた経路問題に対し,クリクewidthをパラメータとするXPアルゴリズムを設計した。
- neighborhood diversityやtwin cover numberをパラメータとする固定パラメータアルゴリズムを開発した。
- 最短隠れた経路問題は,非重みグラフ上で多項式時間で解けることが示された。
LLMエージェントにおけるツール利用の進化:単一ツール呼び出しから複数ツールオーケストレーションへ [cs.SE, cs.CL]目的:LLMエージェントにおける複数ツールのオーケストレーションに関する進捗状況の包括的なレビュー
- LLMは,パラメータだけでは解決できない問題を外部情報やソフトウェアシステムを通じて解決可能とする。
- 初期の研究は単一ツールの呼び出しに焦点を当てていたが,複雑なタスク実行には複数ツールの連携が不可欠である。
- 安全性を確保しつつ,リソース制約下で信頼性,拡張性,検証可能な複数ツールエージェントを構築すること。
- 本研究は,タスクの定式化を統一し,単一ツール利用と長期的オーケストレーションを区別した。
- 推論時の計画と実行,学習と軌跡構築,安全性と制御,リソース制約下での効率性,オープン環境での機能完結性,ベンチマーク設計と評価の6つの要素に沿って文献を整理した。
- ソフトウェアエンジニアリング,エンタープライズワークフロー,GUI,モバイルシステムにおける応用事例をまとめた。
低高度ワイヤレスネットワークのためのエージェントAI:LLMとSLMの相乗効果 [cs.IT, math.IT]目的:LLMとSLMを連携させた階層型フレームワークによる低高度ワイヤレスネットワークにおける課題解決
- 6Gの重要な拡張として,UAVとモバイル端末からなる低高度ワイヤレスネットワークの重要性が高まっている。
- LLMの計算資源や通信制約,リアルタイム性・信頼性の問題が,低高度ワイヤレスネットワークへの応用を妨げていた。
- UAV側と基地局側で異なるLLMとSLMを活用し,効率的な連携を実現することで課題を解決することを目指す。
- 提案手法であるAerial Agentic AIは,UAV上のSLMと基地局側のLLMを階層的に統合し,UAVのリアルタイムな意思決定と,基地局の高度な推論を可能にする。
- SLMベースのエージェントは,UAVの限られた環境下で,知覚,短期記憶,リアルタイムな意思決定を行う能力を備えている。
- 実験結果は,提案手法の有効性を示しており,低高度ワイヤレスネットワークにおける新たな可能性を提示する。
ガボウの$O(\sqrt{n}m)$最大カルディナリティマッチングアルゴリズムの再検討 [cs.DS]目的:最大カルディナリティマッチングアルゴリズムの効率化
- グラフ理論における基本的な問題であり,ネットワーク最適化や組み合わせ論に応用が広い。
- 既存のアルゴリズムは,グラフの規模が大きい場合に計算時間が課題となる。
- 最短増加パス探索の効率化により,アルゴリズム全体の性能向上を目指す。
- 本研究では,ガボウのアルゴリズムにおける最短増加パス長の計算部分に新しいアルゴリズムを提案した。
- 提案手法は,エドモンズのプライマル・デュアルアルゴリズムよりも直接的で理解しやすいと考えられる。
- 実装を公開しており,性能評価も行っている(https://people.mpi-inf.mpg.de/~mehlhorn/CompanionPageGenMatchingImplementation.html)。
レート歪み最適圧縮の劣最適性:分散型位置推定の基本的精度限界 [cs.IT, eess.SP, math.IT]目的:分散型位置推定における基本的精度限界
- センサーネットワークの普及により,複数センサー情報の統合が重要視されている。
- レート歪み最適圧縮が,情報損失を招き,位置推定精度を制限する可能性がある。
- レート歪み最適圧縮が精度に与える影響を明らかにし,改善策を検討する。
- レート歪み最適圧縮が,位置推定に重要な周波数成分を削除することが示された。
- 特定の条件下では,レート歪み圧縮よりも,位置推定に配慮した圧縮方式が大幅に性能向上する。
- 本研究は,ネットワークセンシングや統合センシング・通信システムにおける圧縮設計の指針となる。
対称性を活用した最大共通部分グラフ計算の高速化 [cs.DS]目的:最大共通部分グラフ問題における計算の高速化
- 化学情報学,バイオインフォマティクス等の分野で,グラフ間の共通構造の特定が重要である。
- 組み合わせ最適化問題であり,探索空間が広大であるため,計算時間が課題となる。
- 変数グラフと値グラフ双方の対称性を活用し,探索空間を削減することを目指す。
- 提案手法は,変数グラフと値グラフの対称性を同時に扱う包括的な対称性解消フレームワークを導入した。
- 局所的な近傍構造に基づくモジュール対称性を特定し,探索中に同型な部分木を枝刈りすることで計算を高速化した。
- 標準的なMCSベンチマークにおいて,最先端のRRSplitアルゴリズムを大幅に上回り,計算時間と探索空間を削減した。
分散データベース継続的インテグレーションにおける不安定な障害のトリアージのための実用的なフレームワーク [cs.RO, cs.SE, cs.DB]目的:分散データベース継続的インテグレーションにおける不安定な障害のトリアージ
- 分散データベースは大規模になり,継続的インテグレーションの信頼性が不可欠である。
- 不安定な障害の迅速な判断が難しく,CIの効率を低下させている。
- 厳密な因果関係に基づく特徴量とオンライン学習で,迅速かつ正確なトリアージを実現する。
- SCOUTは,過去のテレメトリと履歴データのみを用いてオンラインで判断する。
- 固定閾値による決定をサポートするため,事後キャリブレーションを適用し,ラベルバイアスを低減する。
- P95レイテンシ1.17msで実運用環境にデプロイされ,有効性と有用性が実証された。
ソフトウェア工学における燃え尽き症候群の早期発見のための機械学習モデル:体系的文献レビュー [cs.SE, cs.AI, cs.CY, cs.LG]目的:ソフトウェアエンジニアにおける燃え尽き症候群の早期発見に向けた機械学習手法の精度と有効性に関するレビュー
- ソフトウェアエンジニアの燃え尽き症候群は深刻な問題であり,生産性低下や離職率上昇につながるため,対策が急務である。
- 燃え尽き症候群の早期発見は困難であり,客観的な指標や効果的な検出手法が不足している。
- 本研究は,機械学習手法を用いた燃え尽き症候群の早期発見に関する既存研究を体系的に分析し,今後の研究の方向性を示す。
- 先行研究の多くは,感情の検出または感情的次元の利用を通じて燃え尽き症候群の検出または予測に焦点を当てていることが明らかになった。
- 機械学習アプローチの感情検出性能および,感情を捉えるためのデータセットの潜在力に関する比較分析を行った。
- 感情検出性能に優れる機械学習ツールとデータセットを特定することで,燃え尽き症候群の早期発見研究の進展に貢献できると考えられる。
LLMはマイクロサービスインフラストラクチャパターンのインスタンスを検出できるか [cs.SE, cs.AI]目的:マイクロサービスアーキテクチャパターン検出のLLMの能力
- ソフトウェア開発において,アーキテクチャパターンは再利用性と保守性を高める重要な要素である。
- 既存のパターン検出ツールは,言語やアーティファクトの種類に制限があり,多様な環境での利用が困難である。
- LLMを活用し,言語やアーティファクトの種類に依存しないパターン検出手法を確立することを目指す。
- MicroPADを用いることで,複数の言語とアーティファクトタイプにわたるパターンインスタンスの検出が可能となった。
- パターン検出の性能は,パターンの出現頻度やアーティファクトの識別性に依存し,F1スコアは0.09から0.70まで変動した。
- 著名なアーティファクトに関連するパターンは,より確実に検出された。
リアルタイム深層強化学習システムのための耐障害設計と多目的モデル検査 [cs.DB, cs.SI, cs.CY, cs.RO, cs.SE]目的:リアルタイム深層強化学習システムの耐障害設計と性能・安全性の同時最適化
- 深層強化学習は複雑な意思決定問題を解決する強力な手法であり,リアルタイムシステムでの応用が期待される。
- シミュレーションと現実の乖離や,遅延の影響により,深層強化学習システムの信頼性は依然として課題である。
- 遅延による故障に対する形式手法に基づいた分析と最適化を行い,安全性と性能を両立させる。
- 提案手法は,深層強化学習エージェントと代替コントローラー間の切り替えメカニズムを形式的に設計・分析するフレームワークである。
- タイムドオートマトンを用いてスイッチロジックを明示的に設計し,それをマルコフ決定過程に変換して形式検証を行う。
- GPUアクセラレーションによるツールMOPMCを開発し,モデルサイズと目的数の両方において優れたスケーラビリティを示した。
ワードRAMモデルにおける動的完全索引辞書の圧縮 [cs.DS]目的:動的完全索引辞書(FID)の構築
- データ圧縮技術は,情報検索やデータ分析においてメモリ使用量を削減し,効率的な処理を可能にする上で重要である。
- 既存のFIDは,特に大規模なデータセットにおいて,メモリ使用量が大きいという課題があった。
- 本研究は,情報理論的な下限に近いメモリ使用量でFIDを実現し,その効率性を向上させることを目指す。
- 本研究では,P{\u{a}}tra{\c{s}}cuとThorupの融合木データ構造を改良し,ビット数を削減するとともにselect_0操作をサポートする動的FIDを提案した。
- 提案手法は,パラメータεを用いてFIDのメモリ使用量を$\operatorname{lg}\binom{u}{n}+\mathcal{O}(nw^{\epsilon}/\epsilon)$ビットに抑え,rankおよびselect操作と更新処理を高速化した。
- 特にε=1/√lg wとした場合,メモリ使用量を$\operatorname{lg}\binom{u}{n}+\mathcal{O}(n\log w)$ビットに削減し,標準的なWord-RAMモデルにおいて優れた性能を実現した。
6Gに向けた統一的な符号化方式 [cs.IT, eess.SP, math.IT]目的:次世代6Gシステムのための汎用的な符号化方式の提案
- データレート増加に伴い,無線通信システムの進化が不可欠であるため。
- 5Gでは複数の符号化方式が用いられており,6Gでは更なる効率化が求められているため。
- 6Gの厳しい要件を満たす,高性能かつ低複雑な符号化方式を確立すること。
- 6Gにおける様々な通信シナリオを検討し,新たな符号化の課題を分析した。
- 汎用的な符号化方式の実現に向けたビジョンを提示し,潜在的な解決策を考察した。
- エネルギー効率の高いハードウェア実装を可能にする低複雑な符号化・復号方式が重要である。
量子に着想を得たロバストなマイクロサービス連鎖スケジューリング:Q-GARS [cs.SE]目的:マイクロサービス連鎖スケジューリングのロバスト性の向上
- マイクロサービスアーキテクチャは柔軟性・拡張性に優れるが,非決定的な遅延やリソース制約が課題。
- 従来のスケジューリング手法では,遅延の変動性に対応したロバストな性能を確保することが困難。
- 量子最適化の考え方を導入し,予測の失敗や実行時の乱れに強いスケジューリング手法を開発する。
- Q-GARSは,従来のSRPTと比較して平均完了時間で2.1%の改善を達成した。
- 重い裾を持つ遅延分布において,最大16.8%の性能向上を示した。
- 適応メカニズムにより,高い分散条件下でのテールレイテンシを低減し,ノードリソース利用率は0.817に達した。
セルフリーMassive MIMOダウンリンク電力制御のためのエージェントによるソルバーオーケストレーション [cs.IT, math.IT]目的:セルフリーMassive MIMOダウンリンク電力制御におけるソルバーオーケストレーション
- セルフリーMassive MIMOは,分散型アクセスポイントを通じて均一に強力なサービスを提供可能である。
- 既存手法はオフラインで選択され,チャネルや負荷状況に関わらず一律適用されるため最適ではない。
- 複数のソルバーを活用し,状況に応じて最適なソルバーを選択することで性能向上を目指す。
- 提案手法VISO-PCは,エージェントが信頼できるソルバーをルーティングすることで電力制御を行う。
- 検証機構を導入することで,制約を満たし有効な共通レートを保証する。
- 実験結果から,ソルバーオーケストレーションが従来の固定ソルバーと比較して,受理レートを改善することが示された。
言語モデルはソフトウェアテストの認定試験に合格できるか?事例研究 [cs.SE]目的:ソフトウェアテスト認定試験における言語モデルの能力評価
- ソフトウェアテストは,高品質なソフトウェア開発に不可欠であり,社会への影響も大きい。
- 言語モデルのソフトウェアテストに関する知識や理解度が十分か不明な点がある。
- 言語モデルのソフトウェアテスト能力を定量的に評価し,改善点を探る。
- 60種類の言語モデルをISTQBの認定試験で評価した結果,2つのモデルが全ての試験に合格した。
- 商用モデルの方がオープンソースモデルよりも高い性能を示した。
- 誤答の分析から,試験問題の設計改善に関する提言を行った。
自己主権型ID原則の再考:アクター指向の要求カテゴリ化 [cs.SE]目的:分散型ID/自己主権型IDシステムに対する要求の構造化モデル
- 中央集権的なID管理システムのセキュリティ・プライバシー課題から,ユーザー中心のDI/SSIへの関心が高まっている。
- 既存研究では,SSI原則やDI/SSIシステムの品質要求が整理されてきたが,ユーザー視点の統合が不十分である。
- ユーザー視点を要求工学プロセスに組み込み,DI/SSIシステムアーキテクチャの構造化モデルを提案する。
- 既存のSSI原則に基づき,24の単純な品質要求(NFR)に要求を分解した。
- NFRを,データ所有者,発行者,検証者,システムという主要アクターに責任と所有権に応じてマッピングした。
- アクター間の関係性を形式化するため,依存モデルを導入し,要求充足のための相互作用を明示した。
木構造グラフにおける測地集合問題のアルゴリズムと困難性 [cs.DS, cs.DM]目的:木構造グラフにおける測地集合問題のアルゴリズム的解法と計算困難性の解析
- グラフ理論やアルゴリズム研究において,ネットワークの構造と効率的な情報伝達は重要な課題である。
- 測地集合問題はNP困難であり,大規模グラフに対する効率的な解法が求められている。
- 木構造グラフやそれに近いグラフ構造における測地集合問題の解法を明らかにすること。
- 木構造グラフ(ditree)においては,多項式時間で測地集合問題を解くアルゴリズムが存在することが示された。
- 2サイクルを持たないグラフで,基礎グラフのフィードバックエッジ集合数がfenの場合,2O(fen)・nO(1)時間で解ける。
- DAGにおいても,基礎グラフのフィードバック頂点集合数が定数であっても,問題はNP困難であることが証明された。
非線形期待値理論に基づく収束率を持つ大数の法則とその通信検出への応用 [cs.IT, math.IT, math.PR]目的:特殊な部分和における収束率を持つ大数の法則
- 確率論は,不確実性を数学的に扱う上で不可欠であり,様々な分野に応用されている。
- 従来の確率論では,期待値の線形性が前提とされているため,非線形な現象の解析が困難である。
- 非線形期待値理論を用いることで,従来の線形期待値では捉えきれない不確実性を記述し,大数の法則を拡張する。
- 非線形期待値理論に基づく新しい大数の法則を確立した。
- 通信システムにおける非独立同一分布入力信号の検出問題への応用を検討した。
- 検出エラーの上限確率の収束率を,非線形期待値空間内で解析した。
6GネットワークにおけるSC3閉ループのための共同タスクオーケストレーションとリソース最適化 [cs.CG, cs.IT, math.IT]目的:複数のSC3閉ループにおけるセンサー・アクチュエーターのペアリングとリソース割り当ての最適化
- 危険環境下での安全性と効率性を高めるため,人間を代替するセンサーとアクチュエーターの活用が重要である。
- SC3閉ループを効率的に運用するためには,センサー・アクチュエーターの最適な組み合わせとリソース配分が課題となる。
- 本研究は,複雑な最適化問題を解決し,低コストでの制御を実現する新たなフレームワークを提案する。
- 提案手法であるLOACフレームワークは,ほぼ最適な解を低い計算複雑度で実現する。
- シミュレーション結果から,LOACフレームワークが制御コストを大幅に削減できることが示された。
- LOACフレームワークは,学習と最適化を統合することで,効率的なタスクオーケストレーションを可能にする。
べき乗コードの力:線形同値性問題に対する新しい易解事例クラス [cs.RO, cs.CL, cs.CR, cs.IT, math.IT]目的:線形同値性問題に対する易解事例クラスの特定
- 暗号技術の安全性評価において,線形同値性問題は重要性が増している。
- 線形同値性問題は,解くのが難しい問題が多く,効率的な解法が求められている。
- 代数的弱点を利用することで,線形同値性問題を効率的に解く方法を確立する。
- べき乗コードの概念を拡張し,フロベニウス自己同型やエルミート包絡と組み合わせることで,多くの易解な線形同値性問題事例を特定した。
- これは,線形同値性問題に対する代数的弱点を活用した最初の研究である。
- 単項行列の係数が有限体の乗法群の部分群に含まれる場合,線形同値性問題を置換同値性問題へ効率的に帰着できることを示した。
分散アンテナビームフォーミングのための楕円体多様体最適化 [cs.IT, math.IT]目的:ダウンリンク分散アンテナシステムにおける加重和レート最大化
- 基地局のアンテナ数を増やすことで,通信品質とシステム容量を向上させることが期待されている。
- アンテナ数が増加すると,ビームフォーミング変数の次元が増大し,最適化が困難になる。
- クラスタごとの電力制約下で,効率的な最適化手法を開発し,計算量を削減することを目指す。
- 提案手法は,既存のWMMSE法や従来の多様体最適化と同程度の最適解を達成する。
- 特に,アンテナクラスタ数が増加した場合,大幅な計算効率とスケーラビリティの向上が確認された。
- クラスタごとの電力制約に対しても,低次元部分空間の性質が成り立つことを証明した。
オートエンコーダに基づく多重ユーザ分子混合通信システムの最適化 [cs.IT, cs.ET, eess.SP, math.IT]目的:多重ユーザ分子混合通信システムの端点間最適化
- 分子通信は,電磁波が届かない環境下での通信手段として期待されている。
- 分子間反応など,分子通信チャネルは非線形性が強く,解析的な最適化が困難である。
- 複雑な条件下でのシステム最適化を可能にし,実用化を促進すること。
- 提案手法は,シングルユーザ環境において,従来のスキームよりも低いシンボル誤り率を達成した。
- チャネル状態が不明または変化する場合でも,信頼性の高い通信が可能であることが示された。
- 複数アクセス環境では,ユーザの優先度を考慮したシステム設計が可能である。
ライフタイム付き動的k-centerクラスタリング [cs.DS]目的:動的k-centerクラスタリングにおける近似アルゴリズム
- 機械学習やデータ要約において,クラスタリングは重要な役割を果たす。
- 既存手法では,データ点の到着・削除を十分に扱えていない。
- データ点のライフタイムを考慮した動的クラスタリング問題を解決する。
- ライフタイム付き動的k-center問題に対する,決定論的$(2+\varepsilon)$-近似アルゴリズムを提案。
- このアルゴリズムは,$\tilde{O}(k/\varepsilon)$の償却更新時間と,現在アクティブな点数に線形なメモリ使用量を持つ。
- 穏やかな更新シーケンス下では,$\tilde{O}(k/\varepsilon)$の最悪ケース更新時間と,高度にサブ線形な作業メモリを持つ$(6+\varepsilon)$-近似アルゴリズムも開発。
関数に語らせろ:ドメインとレンジ型による軽量なパラメータ多型性 [eess.SY, cs.SY, cs.PL]目的:ドメイン型とレンジ型による軽量なパラメータ多型性の実現
- 動的言語の機能拡張にデコレータが広く用いられる背景
- TypeScriptにおける型安全性の弱体化:any型の利用
- 関数型に基づく型付けの新たな可能性の探求
- F<:DRという新しい計算体系を提案し,ドメイン型とレンジ型を導入した
- これにより,抽象的な関数型を通して型付けが可能となり,型安全性が向上する
- RocqでF<:DRを形式化し,論理関係とパス選択を用いた意味的な型健全性を証明した
有限環暗号系のためのカノニカルなバイト列エンコーディング [cs.CR, cs.IT, math.IT]目的:有限環暗号系におけるバイト列と剰余の間のカノニカルな変換
- 暗号システムの安全性と効率性は,その基礎となる数学的構造に依存する。有限環は近年注目される構造である。
- 既存のバイト列から剰余への変換は,一意性や効率性に課題がある場合が多い。
- バイト列と剰余の間のカノニカルな変換方法を確立し,安全かつ効率的な暗号処理を実現すること。
- 本研究では,長さ2^64バイト以下のバイト列を法mの剰余のリストへ変換するbase-m length codecを提案した。
- 提案手法は,Dudaによって提案されたrANSベースのシステムを拡張・適応させたものであり,パラメータ条件を満たす全ての法に対して正確に復号可能である。
- Lean 4による形式化により,固定幅プレフィックスの反転,ペイロード状態の範囲,およびストリームレベルでの往復の正しさが検証された。
MuSe:Remix IDE用ミューテーションテストプラグイン [cs.SE]目的:Remix IDE向けミューテーションテストプラグイン
- スマートコントラクトの品質とセキュリティは,ブロックチェーンシステムにおいて極めて重要である。
- Remix IDE向けのミューテーションテストツールが存在せず,テスト品質の評価が困難であった。
- Remix IDEに直接組み込むことで,手軽にミューテーションテストを実施し,テスト品質向上を図る。
- MuSeは,従来のミューテーション演算子に加え,Solidity固有およびセキュリティ重視の演算子を実装した。
- 追加のセットアップが不要で,初心者でも容易にミューテーションテストを開始できる。
- テストスイートの効果評価やスマートコントラクトの潜在的な問題点の特定に貢献する。
LLMによるテスト生成のソフトウェア進化下での評価 [cs.SE, cs.AI]目的:LLMによるテスト生成の性能評価
- ソフトウェアの品質確保にはテストが不可欠であり,自動化による効率化が求められている。
- LLMによるテスト生成は有望視されているが,テストの信頼性や保守性に課題が残る。
- プログラムの変更に対するLLM生成テストの挙動を分析し,信頼性を評価する。
- LLMは元のプログラムに対して高いテストカバレッジ(行:79%, 分岐:76%)を達成する。
- プログラムが変更された場合,LLM生成テストの合格率は低下し,特に意味変更(SAC)下では66%に,分岐カバレッジは60%に減少する。
- 変更された領域を実行しても,失敗したSACテストの99%以上が元のプログラムでは合格する現象から,LLMが表面的なパターンに依存していることが示唆される。
コードレビューエージェントのベンチマーク [cs.SE, cs.AI]目的:コードレビューのためのAIエージェントの評価
- ソフトウェア開発における品質保証の重要性が増しており,AIによる自動コード生成の普及に伴い,コードレビューの自動化が不可欠である。
- 既存のコードレビューエージェントの性能は十分ではなく,人間によるレビューとの乖離が存在する。
- AIエージェントのコードレビュー能力を客観的に評価するためのベンチマークデータセットを構築し,改善の余地を示す。
- 新しいデータセットc-CRABを構築し,既存のコードレビューエージェント(PR-agent, Devin, Claude Code, Codex)の性能を評価した。
- 既存エージェントはc-CRABタスクの約40%しか解決できず,今後の研究で性能向上の余地が大きいことが示された。
- エージェントのレビューと人間のレビューでは焦点が異なる場合があり,人間とエージェントの協調によるレビューの可能性が示唆された。
ConceptCoder:概念学習によるコード推論能力の向上 [eess.SY, cs.SY, cs.SE]目的:コード推論能力の向上
- ソフトウェア開発におけるLLMの活用が期待される中,脆弱性検出等のコード推論能力の向上が課題である。
- 既存のLLMは,コードの脆弱性検出において十分な精度を発揮できていない。
- コードの概念を学習させることで,LLMのコード推論能力,特に脆弱性検出の精度向上を目指す。
- ConceptCoderは,コードを概念として認識させ,その概念に基づいて推論を行うことで,LLMの脆弱性検出精度を大幅に向上させる。
- 9つのオープンソースLLMで平均F1スコアが66.32%から72.15%に向上し,最先端のモデルと比較しても優れた性能を示した。
- 定義された概念は,多様な脆弱性に対応可能であり,ブランチ予測の精度向上にも貢献する。
- 1
- 2
