arXiv雑要約
プログラム - 2026/03/11 公開
SiliconMind-V1: Verilogコード生成のためのマルチエージェント蒸留とデバッグ推論ワークフロー [cs.AR, cs.AI, cs.SE]目的:Verilogコード生成におけるマルチエージェント蒸留とデバッグ推論ワークフロー
- デジタル回路設計の自動化は,設計期間の短縮や設計者の負担軽減に不可欠である。
- 既存手法は主に構文の正しさに焦点を当て,商用モデルや外部検証ツールに依存し,コストやプライバシー,機能保証の点で課題がある。
- テストベンチ駆動の検証を統合した推論指向の学習データ生成により,機能的に正しいVerilogコードを生成すること。
- 提案手法SiliconMind-V1は,VerilogEval-v2,RTLLM-v2,CVDPベンチマークにおいて,最先端のQiMeng-CodeV-R1を機能的正確性で上回る。
- SiliconMind-V1は,少ない学習リソースで高性能を実現する。
- マルチエージェントフレームワークにより,LLMがRTL設計の生成,テスト,デバッグを反復的に行うことを可能にした。
KernelCraft:新興ハードウェアにおけるエージェントによる低レベルカーネル生成のベンチマーク [cs.AR, cs.ET, cs.AR, cs.LG, cs.SE]目的:新興ハードウェア向けの低レベルカーネル生成と最適化能力の評価
- AIアクセラレータの多様化が進み,高性能なハードウェアを迅速に活用することが重要になっている。
- 新しいISAを持つアクセラレータでは,低レベルカーネルを手動で作成する必要があり,開発コストが高い。
- LLMエージェントを活用し,カーネル開発の自動化と効率化を目指す。
- LLMエージェントは,新しいISA向けに数回の反復で機能するカーネルを生成可能であることが示された。
- 生成されたカーネルは,テンプレートベースのコンパイラと同等またはそれ以上の性能を示した。
- この研究は,アクセラレータ設計者とカーネル開発者のカーネル開発コスト削減に貢献する可能性がある。
FormalRTL:大規模な検証済みRTL合成 [cs.AR, cs.SE]目的:大規模なデータパス中心設計における,形式検証済みRTL合成手法
- ハードウェア設計の自動化は,開発効率と品質向上に不可欠である。
- 従来の自動合成は,仕様の曖昧さや形式的な正当性の保証不足が課題である。
- 形式的な仕様に基づいたRTL生成と検証による,信頼性の高い合成手法の確立。
- FormalRTLは,ソフトウェア参照モデルを形式仕様として統合するマルチエージェントフレームワークである。
- 計画,合成,形式同値性チェックを連携させることで,スケーラブルかつ信頼性の高いハードウェアコード生成を実現した。
- 工業グレードのベンチマークを用いた評価で,FormalRTLの有効性と堅牢性が確認された。
マルチコアアーキテクチャ向けACETONE Cコード生成器の拡張 [cs.DC, cs.SE]目的:マルチコアアーキテクチャ向けのACETONE Cコード生成の拡張
- 機械学習の重要性が増す中,安全性が求められるシステムへの組み込み技術が不可欠である。
- 既存のACETONEは逐次コード生成に限定されており,マルチコアアーキテクチャの性能を引き出せない。
- ACETONEを拡張し,並列コード生成を可能にすることで,マルチコアの利点を活かすことを目指す。
- 本研究では,プロセッサ割り当て問題を定式化し,既存の並列化手法を調査した。
- 最終稿では,スケジューリングヒューリスティックの実装,同期機構のテンプレート作成を紹介する予定である。
- また,フレームワークのレイヤーの最悪実行時間評価も行う予定である。
エージェント的計算のための言語:Turn [cs.PL, cs.AI, cs.SE]目的:エージェント的ソフトウェアの実現
- LLMを活用した自律的なソフトウェア開発が重要視されている。
- 既存手法では,LLMの利用における安全性や信頼性が課題となっている。
- 言語レベルで安全性と信頼性を保証することで,問題を解決する。
- Turnは,スキーマ推論のための静的型付けと,値レベルでの動的型付けを行うコンパイル言語である。
- 認知型安全性により,LLMの推論を型付きのプリミティブとして扱い,コンパイラがJSONスキーマを生成し,VMがモデル出力を検証する。
- 能力ベースのIDシステムにより,VMホストから不透明なハンドルを返し,生の認証情報がエージェントメモリに侵入しないようにする。
テスト駆動型AIエージェント定義 (TDAD): 行動仕様からのツール使用エージェントのコンパイル [cs.SE, cs.AI]目的:AIエージェントの行動仕様に基づく,ツール使用エージェントのコンパイル手法
- AIエージェントの活用が拡大する中で,その振る舞いの品質保証が重要課題となっている。
- プロンプトのわずかな変更で予期せぬ挙動が発生し,品質管理が困難である。
- 行動仕様に基づきテストを自動生成することで,エージェントの信頼性と安全性を向上させる。
- TDADは,行動仕様からテストを生成し,プロンプトを反復的に改善することで,高いコンパイル成功率(92%)と隠蔽テストの合格率(97%)を達成した。
- 進化させた仕様でも,高い変異スコア(86-100%)と回帰安全性(97%)を示し,安定した性能を維持している。
- 本手法は,AIエージェント開発における品質保証の新たなアプローチを提供する。
ヘリンガー弾性を用いた時間伸縮 [cs.IR, cs.DS, math.MG]目的:任意の距離空間における時系列データのマッチング
- 時系列データの解析は,気象,金融,医療など,多様な分野で不可欠である。
- 時系列データの形状のずれが,正確なマッチングを困難にすることがある。
- ヘリンガー弾性を用いた時間伸縮により,形状のずれを柔軟に吸収することを目指す。
- ヘリンガーカーネルに基づく伸縮ペナルティを持つマッチング問題を定義した。
- このマッチングを最適化するための「Elastic Time Warping」アルゴリズムを提案した。
- 提案アルゴリズムは,立方時間計算量で動作する。
LDP:マルチエージェントLLMシステムのためのアイデンティティを意識したプロトコル [cs.AI, cs.MA, cs.SE]目的:マルチエージェントLLMシステムの効率性とガバナンスを向上させるプロトコル設計
- AIエージェントの複雑化に伴い,連携プロトコルの重要性が増している。
- 既存のプロトコルは,モデルの特性を十分に活用できていない。
- AIネイティブなプロトコル基盤により,効率的な委任を実現すること。
- アイデンティティを意識したルーティングにより,簡単なタスクで約12倍の低遅延を実現した。
- セマンティックフレームペイロードは,品質を損なうことなくトークン数を37%削減した。
- ガバナンスセッションは,10ラウンドでトークンオーバーヘッドを39%削減し,信頼性の高いProvenance追跡が重要であることが示唆された。
フィードバックは,ほぼ記憶を持たない全射POSTチャネルの容量を増加させない [cs.CL, cs.DB, cs.IT, cs.SY, eess.SY, math.IT]目的:ほぼ記憶を持たない全射POSTチャネルにおけるフィードバック容量
- 情報伝送におけるチャネル容量の理解は,通信システムの性能向上に不可欠である。
- POSTチャネルのような有限状態チャネルでは,フィードバックが容量に与える影響が不明確であった。
- ほぼ記憶を持たない全射POSTチャネルにおいて,フィードバックが容量を増加させないことを証明する。
- 本研究により,ほぼ記憶を持たない全射POSTチャネルにおいて,フィードバック容量と非フィードバック容量が一致することが示された。
- 入力アルファベットサイズが出力アルファベットサイズ以上であるほとんどのチャネルに対して,フィードバックは容量向上をもたらさない。
- この結果は,シャノンの古典的な定理を拡張し,厳密な記憶を持たない場合を超えても同様の現象が成立することを示している。
bsort:整数および浮動小数点数に対する理論的に効率的な非比較ベースのソートアルゴリズム [cs.DS, cs.AR, cs.PF]目的:整数および浮動小数点数のソート手法
- データ処理において,効率的なソートは基礎的な処理であり,性能向上に不可欠である。
- 既存のソートアルゴリズムは,データ型やデータ規模によって性能が大きく左右される場合がある。
- ワードサイズが小さいデータ型に対する,高速かつ省スペースなソートアルゴリズムの提供。
- bsortアルゴリズムは,非比較ベースであり,理論上$O(wn)$の実行時間と$O(w)$の補助空間を達成する。
- このアルゴリズムは,特にワードサイズが小さいデータ型において,既存の最適化されたハイブリッドアルゴリズムと競争力のある性能を示す。
- バイナリクイックソートから派生したアプローチにより,整数値と浮動小数点値を統一的に処理可能である。
ランダム順序ストリームにおける単位区間選択 [cs.DS]目的:単位区間選択問題に対するアルゴリズム開発
- ストリーミングアルゴリズムは,大規模データの効率的な処理に不可欠である。
- 既存研究は,最悪の場合の入力順序を仮定しており,性能向上が限界である。
- 入力順序がランダムである場合に,より良い近似率を実現するアルゴリズムを設計する。
- ランダム順序ストリームにおいて,期待値として0.7401の近似率を持つアルゴリズムを開発した。
- 近似率が8/9を超えるアルゴリズムは,Ω(n)の空間を必要とする。
- 2/3を超える近似率を2/3以上の確率で達成するアルゴリズムも,Ω(n)の空間を必要とする。
ゼロ知識と量子CSSコードの同値性に関する注記 [cs.IT, math.IT]目的:ゼロ知識コードと量子CSSコードの同値性
- 暗号技術の安全性向上に不可欠であり,情報漏洩リスク軽減に貢献する。
- 量子誤り訂正符号の設計は複雑で,効率的な符号構築が課題である。
- 両者の同値性を示すことで,効率的なゼロ知識符号の設計を可能にする。
- 線形かつ完全なゼロ知識コードと量子CSSコードが同値であることが示された。
- この同値性を用いて,漸近的に良好なゼロ知識局所テスト可能符号の構成が可能となった。
差分プライバシー保護安全な乗算:2つ以上の被乗数に対して [cs.IT, math.IT]目的:分散コンピューティングシステムにおける差分プライバシー(DP)保護安全な乗算
- プライバシー保護技術は,個人情報保護の重要性が高まる現代社会において不可欠である。
- 安全な多者計算において,プライバシーと精度の両立が難しいという課題が存在する。
- 複数の被乗数を持つ乗算におけるプライバシーと精度のトレードオフを最適化する。
- 本研究では,任意の数の被乗数に対するDP保護安全な乗算のフレームワークを提案した。
- 提案手法は,既存のスキームを一般化し,低次のノイズ項の系統的なキャンセルを可能にする。
- 特に,N = T+1の場合において,高プライバシー領域での厳密な上限と下限を導出した。
GenAIはソフトウェア工学における質的研究の万能薬ではない [cs.SE]目的:ソフトウェア工学における質的研究へのGenAIの利用可能性と限界
- ソフトウェア工学は社会技術システムであり,人間的側面を理解することが重要である
- 質的研究は多様な手法があり,GenAIの自動化は限定的である
- GenAIの利用はデータや研究戦略に適合させる必要があり,その課題を明確にする
- GenAIは質的研究を完全に自動化できるものではなく,特定のデータや研究戦略への適応が不可欠である。
- GenAIの利点と欠点を考慮し,質的研究の質を維持するための慎重な利用が求められる。
- 今後の研究により,ソフトウェア工学におけるGenAIの有効な活用方法をさらに理解することが期待される。
セルフリーMassive MIMOにおける差分STBCを用いたUEアンテナ較正誤差の軽減 [cs.RO, cs.IT, math.IT]目的:セルフリーMassive MIMOシステムにおけるUEアンテナ較正誤差の軽減
- 無線通信において,より高速で信頼性の高い通信を実現するためには,Massive MIMO技術が不可欠である。
- UE側のアンテナ較正誤差は,セルフリーMassive MIMOシステムの性能を低下させる主要な要因となっている。
- UE側の明示的な較正やチャネル位相情報の推定を不要にし,信頼性の高い通信を可能にすること。
- 提案手法では,差分空間時間ブロック符号(DSTBC)を利用することで,UEアンテナの位相オフセットの影響を効果的に軽減できることが示された。
- シミュレーション結果は,DSTBCに基づく送信が,セルフリーMassive MIMOネットワークにおいて,ほぼコヒーレントな性能を回復することを示している。
- これにより,UE側の複雑な較正作業が不要となり,システムの実用性が向上する。
LLMエージェントシステムプロンプトにおける干渉検出:Arbiter [cs.SE, cs.AI, cs.CR, cs.PL]目的:LLMエージェントシステムプロンプトの干渉パターン検出
- LLMエージェントは急速に普及しているが,その振る舞いを制御するシステムプロンプトの品質保証は重要である。
- システムプロンプトは従来のソフトウェアとは異なり,十分なテスト基盤が存在しないという課題がある。
- システムプロンプトの潜在的な干渉パターンを自動的に検出し,LLMエージェントの信頼性を向上させる。
- Arbiterフレームワークによって,主要なコーディングエージェントのシステムプロンプトにおいて152件の干渉パターンが検出された。
- プロンプトのアーキテクチャと故障クラスの間には相関関係が見られたが,深刻度には影響しないことが示された。
- 複数モデルによる評価は,単一モデルによる評価では発見できない脆弱性クラスを明らかにすることができた。
AIエージェントはマイクロサービスを生成できるか?現状はどこまでか [cs.SE]目的:マイクロサービス生成の可能性と,コンテキスト情報の重要性に関する評価
- マイクロサービスアーキテクチャは,ソフトウェア開発における柔軟性と拡張性を高める上で不可欠である。
- AIによる自動化は進むものの,依存関係やAPI契約を持つ複雑なマイクロサービス生成は課題であった。
- AIエージェントによるマイクロサービス生成の現状を把握し,改善点を見出す。
- 段階的生成では,簡潔なプロンプトが詳細なプロンプトよりも高いユニットテストの合格率を示した。
- クリーンステート生成では,高いインテグレーションテストの合格率が確認され,API契約の遵守性が示唆された。
- 生成されたコードは人間が作成したものと比較して複雑性が低い傾向にあった。
大規模言語モデルのコンテキストウィンドウに対するデマンドページング [cs.OS, cs.AI, cs.SE]目的:大規模言語モデルのコンテキストウィンドウにおけるメモリ階層の欠如
- LLMの性能向上には,コンテキストウィンドウの効率的な管理が不可欠である。
- コンテキストウィンドウは,全ての情報を保持するため,メモリ消費量が課題となる。
- コンテキストウィンドウのメモリ効率を改善し,より大きな情報を扱えるようにする。
- Pichayというデマンドページングシステムを開発し,コンテキストウィンドウのメモリ使用量を削減した。
- 実環境での導入により,コンテキスト消費量を最大93%削減することに成功した。
- LLMにおけるコンテキスト制限,コスト増加といった問題は,仮想メモリの問題と捉えることができる。
ロックボックス:機密クラウドワークロードの安全な処理のためのゼロトラストアーキテクチャ [cs.CR, cs.DC, cs.SE]目的:機密クラウドワークロードの安全な処理のためのゼロトラストアーキテクチャ
- 企業はクラウド利用を拡大しているが,セキュリティリスクも増大している。
- 従来のセキュリティ対策では,クラウド環境における高度な攻撃への対応が困難である。
- 厳格なセキュリティ要件下での機密クラウドワークロードの安全な処理を実現すること。
- ロックボックスは,ユーザー認証から結果の保存まで,アプリケーションライフサイクル全体で明示的な信頼検証,厳格な隔離,最小権限アクセスを適用する。
- ロールベースのアクセス制御,集中鍵管理,暗号化などの最新のクラウドセキュリティ機能を組み込み,機密データの保護とアクセス制御を強化する。
- サイバーセキュリティレポートの処理への応用例を通じて,セキュリティを損なうことなくAI支援処理などの高度な機能を安全に導入できることを示す。
量子ソフトウェアにおける不安定テストの自動検出と根本原因分析 [cs.SE, cs.AI, cs.ET]目的:量子ソフトウェアにおける不安定テスト関連の問題とプルリクエストの検出,およびその根本原因の特定支援
- 量子ソフトウェアの信頼性確保には,古典ソフトウェアと同様に自動テストが不可欠である。量子特有の性質上,テストの不安定性が問題となる。
- 量子ソフトウェアの確率的性質により,テストが不確実にPass/Failし,真の欠陥を隠蔽する不安定テストが存在する。適切なツールが不足している。
- 大規模言語モデルを活用し,不安定テストの検出と根本原因の特定を自動化することで,開発者の生産性向上を目指す。
- 本研究により,新たに25件の不安定テストが特定され,既存のデータセットが54%拡大された。
- Google Geminiが,不安定性検出においてF1スコア0.9420,根本原因特定において0.9643を達成し,実用的な支援能力を示した。
- 拡張されたデータセットと自動パイプラインは,量子ソフトウェアエンジニアリングコミュニティにとって再利用可能な成果物となる。
ソフトウェア工学カンファレンスの未来:ニュージーランドの視点 [cs.SE]目的:ソフトウェア工学カンファレンスの公平性向上策
- 知識共有と連携の場として,ソフトウェア工学カンファレンスは重要である。
- 地理的に遠隔な地域の研究者にとって,参加の障壁が存在する。
- ニュージーランド等の地域研究者の参加促進を目指す。
- 本研究では,高額な渡航費,学期日程の不一致,代表性の低さを障壁として特定した。
- ハイブリッド開催,低コストな会場,ガバナンス改革といった戦略を提案する。
- これらの施策は,世界的な参加の公平性を促進し,ソフトウェア工学コミュニティを強化する。
AI生成マルウェア検出のための相乗的指向実行とLLM駆動型分析 [cs.CR, cs.SE]目的:AI生成マルウェアのゼロデイ検出
- LLMを用いたマルウェア自動生成は,セキュリティ上の新たな脅威である。
- 従来のシグネチャベースや浅いヒューリスティック防御は,AI生成マルウェアの進化に対応できない。
- 本研究は,AI生成マルウェアを確実に検出するハイブリッド分析フレームワークを提案する。
- コンコリック実行とLLMによるパス優先度付け,深層学習ベースの脆弱性分類を組み合わせた新しいフレームワークを開発した。
- LLM誘導コンコリック探索により,探索パス数を平均73.2%削減しつつ,悪意のあるパスのカバレッジを維持した。
- AI-Gen-Malwareベンチマークにおいて,97.5%の精度を達成し,既存手法を8.4~52.2%ポイント上回った。
標準デジタルトランシーバにおける高忠実度アナログ結合ソースチャネル符号化の実現 [cs.IT, cs.IR, math.IT]目的:標準デジタルトランシーバ上での高忠実度アナログ結合ソースチャネル符号化の実現
- セマンティック通信は,チャネル状況の変化に対する緩やかな性能劣化により優れている。実用化には課題が多い。
- アナログJSCCは連続値シンボルを生成するが,デジタルPHYは離散波形しか生成できず,勾配降下が困難。
- 既存のPHYへのアクセスなしで,アナログJSCCを標準デジタルPHYに実装し,性能劣化を抑制すること。
- 提案手法D2AJSCCは,OFDMのサブキャリア構造を利用してアナログ波形をエミュレートする。
- 非微分可能なPHY演算に対する勾配の流れを維持するため,ProxyNetという微分可能な代替ネットワークを開発。
- WiFi PHY上での画像伝送シミュレーションにより,提案手法が理想的なアナログJSCC性能に近づくことを実証。
大規模言語モデルを用いた要件からのクラスモデル生成 [cs.SE]目的:要件からのUMLクラス図の自動生成
- ソフトウェア開発における設計段階は重要であり,クラス図はその中心的な成果物である。
- 従来,クラス図の作成は人的コストが高く,時間も要する。
- 大規模言語モデルを活用し,クラス図作成の自動化による効率化を目指す。
- 大規模言語モデルは,構造的にまとまり,意味的に妥当なUML図を生成可能であることが示された。
- LLMによる評価と専門家による評価の間には高い一致性が認められた。
- LLMは,モデル作成支援だけでなく,自動要件工学ワークフローにおける信頼性の高い評価者としても活用できる可能性が示唆された。
環境バック散乱通信受信機は低雑音増幅器を必要とするか [cs.DC, cs.DB, cs.IT, math.IT]目的:環境バック散乱通信におけるシンボル検出性能の評価
- 無線通信技術の発展に伴い,低消費電力な通信手法への関心が高まっている。
- 環境バック散乱通信では,周囲からの強い電波干渉が信頼性の高い通信を妨げる。
- 低雑音増幅器(LNA)の有効性を検証し,シンボル検出性能の向上を目指す。
- 本研究により,環境バック散乱通信受信機において,ある程度の送信電力下ではLNAの使用がシンボル検出性能を向上させることが示された。
- LNAパラメータを考慮した新たなシンボル検出フレームワークを提案し,ビット誤り率(BER)の導出と偏向係数(DC)を用いた評価を行った。
- BERを最小化するための最適な検出閾値を導出し,タグのパイロットシンボルを用いて必要なパラメータを推定する方法を提案した。
人工ノイズ対人工ノイズ除去:物理層セキュリティのスケーリング則の再定義 [cs.IT, math.IT]目的:人工ノイズおよび人工ノイズ除去が存在する場合における平均および瞬間的な秘匿率のスケーリング則の確立
- 無線通信におけるセキュリティ確保は重要であり,特に盗聴者の存在下では不可欠である。
- 人工ノイズは秘匿率を高めるが,その効果は盗聴者による除去技術によって損なわれる可能性がある。
- 人工ノイズ除去が秘匿率に与える影響を定量的に評価し,効果的なシステム設計の指針を提供する。
- 人工ノイズ除去の存在下におけるスケーリング則を確立し,送信・受信・盗聴アンテナ数の相互制約を明らかにした。
- 盗聴者のアンテナ数が送信機を2倍以上上回る場合,安全な通信が保証されないことが示された。
- 人工ノイズ除去対策が実施された場合でも,人工ノイズが有効であるための十分条件を特定した。
AgenticCyOps:企業サイバーオペレーションにおけるマルチエージェントAI統合の保護 [cs.SI, cs.CY, cs.IR, cs.CR, cs.MA, cs.SE]目的:マルチエージェントAI統合の企業サイバーオペレーションにおけるセキュリティ確保
- AI技術の高度化に伴い,企業におけるサイバー攻撃への対応はますます重要になっている。
- マルチエージェントシステムは柔軟性を持つが,セキュリティ上の新たな脆弱性を生み出す可能性がある。
- 本研究は,マルチエージェントAI統合における攻撃対象領域を特定し,セキュリティ原則を確立することで,その脆弱性を軽減することを目指す。
- 本フレームワークは,ツールオーケストレーションとメモリ管理を主要な信頼境界として捉え,5つの防御原則を定義した。
- SOCワークフローへの適用により,既存の攻撃ベクトルを効果的に防御し,信頼境界を最大72%削減することが確認された。
- AgenticCyOpsは,企業規模でのマルチエージェントAI統合を安全に行うための基盤となり得る。
重み付き三角形を含まない2-マッチングに対するPTAS [cs.DS]目的:重み付き三角形を含まない2-マッチング問題の近似解法
- 巡回セールスマン問題や2-連結ネットワーク設計問題との関連性が示唆されており,実用上・理論上重要な研究分野である。
- 一般の場合において,NP困難性が証明されておらず,多項式時間アルゴリズムも未発見であるという課題が存在する。
- 任意の定数εに対して(1-ε)-近似解を多項式時間で求めるPTASを開発し,問題解決に貢献する。
- 本研究では,単純な局所探索アルゴリズムと高度な解析に基づき,重み付き三角形を含まない2-マッチング問題に対するPTASを提示した。
- 提示されたアルゴリズムは,既存の2/3近似アルゴリズムよりも高性能であり,より良い近似解を効率的に求めることができる。
- この結果は,関連する組合せ最適化問題へのPTASの適用可能性を示唆し,今後の研究の方向性を示す。
高速かつ最適な差分プライバシー頻出部分文字列マイニング [cs.DS, cs.CR]目的:頻出部分文字列の特定
- データ利活用において,プライバシー保護とデータ分析の両立が重要視されている。
- 差分プライバシーを適用した頻出パターンマイニングは計算コストが高い。
- 計算コストを削減し,実用的な頻出部分文字列マイニングを実現すること。
- 本研究では,既存手法よりも空間計算量をO(nℓ+ |\Sigma| ),時間計算量をO(nℓlog |\Sigma| + |\Sigma| )に大幅に削減した新たなアルゴリズムを提案。
- 提案手法は,頻出なプレフィックスとサフィックスの構造的性質を利用した洗練された候補生成戦略と,頻度関係に基づく検索空間の枝刈りにより実現。
- これにより,差分プライバシー下でのスケーラブルな頻出部分文字列マイニングが可能になった。
分散型専門家問題に対するより良い上限 [cs.LG, cs.DS, stat.ML]目的:分散型専門家問題における後悔の最小化
- 機械学習において,複数の専門家からの知識を統合し,最適な意思決定を行うことは重要である。
- 分散環境下では,専門家間の通信コストが課題となり,効率的なアルゴリズムが求められる。
- 通信量を削減しつつ,高い精度で後悔を抑制するアルゴリズムの開発を目指す。
- 提案手法は,既存手法よりも改善された後悔の上限を達成する。
- 後悔は,おおよそ$R\gtrsim\frac{1}{\sqrt{T}\cdot\text{poly}\log(nsT)}$で抑えられる。
- 通信量は,$\mathcal{O}\left(\frac{n}{R^2}+\frac{s}{R^2}\right)\cdot\max(s^{1-2/p},1)\cdot\text{poly}\log(nsT)$ビットである。
オンライン重み付き非交差マッチング問題 [cs.HC, cs.MM, cs.DS]目的:オンライン環境下における重み付き非交差マッチング問題の解析
- 幾何学的な探索アルゴリズムの基礎であり,様々な応用場面が存在する。
- オンラインでの最適なマッチングは困難であり,競争率の向上が課題である。
- ランダム化手法を用いた競争率の改善と,アドバイスの複雑性に関する上界の証明。
- 決定論的アルゴリズムでは非自明な競争率は保証されないが,重み制限下では上限と下限が示された。
- ランダム化を用いることで,任意の重みに対して定数競争率が可能となることが証明された。
- 取り消し可能性や共線点を含む変形問題についても競争率の上界と下限が導かれた。
超対角型RISを用いたISACシステムにおける共同プレコーディングと位相シフト最適化 [cs.MM, cs.IT, math.IT]目的:多重ユーザーISACシステムにおける通信とセンシング性能のトレードオフの柔軟な設計
- 無線通信におけるスペクトル資源の有効活用が求められており,ISACが注目されている。
- 従来のRISでは性能向上の限界があり,より柔軟な制御が可能なRISが求められている。
- 超対角型RISの活用によるISAC性能向上と,そのための最適化手法を確立する。
- 提案手法は,従来のRISと比較して,通信とセンシング性能のトレードオフを大幅に改善できる。
- 多重干渉管理とセンシングビームゲイン近似法を組み合わせた最適化フレームワークが有効である。
- 交互最適化アルゴリズムにより,非凸な最適化問題を効率的に解くことが可能である。
ToolRosetta: オープンソースリポジトリと大規模言語モデルエージェント間の自動ツール標準化 [cs.SE, cs.CE, cs.MA]目的:オープンソースツールの自動標準化
- 既存のコード再利用の重要性が高まっているため,ツールの効率的な活用が求められている。
- ツールのインターフェースが標準化されておらず,LLMによる利用が困難であるという課題がある。
- LLMが利用可能な標準化されたツールを自動的に生成し,タスク完了を支援することを目的とする。
- ToolRosettaは,オープンソースコードをMCP互換のツールに自動変換する統合フレームワークである。
- このフレームワークにより,人間の介入を最小限に抑えつつ,タスクの実行に必要なツールチェーンを自動的に計画・実行できる。
- 多様な科学分野における実験で,ToolRosettaが多くのオープンソースツールを標準化し,コードの再現性とデプロイメントの労力を削減することが示された。
テンソルトレイン分解に基づくMIMO-AFDMシステムにおける分画遅延・ドップラー推定 [cs.IT, math.IT]目的:MIMO-AFDMシステムにおけるチャネル推定手法
- 高速通信システムにおいて,AFDMは有望な技術であり,その性能を最大限に引き出すには正確なチャネル推定が不可欠である。
- 既存研究は整数遅延タップを想定しており,実際の分画遅延を整数で近似すると,遅延推定精度とドップラー周波数推定が劣化する。
- 本研究は,MIMO-AFDMシステムにおける分画遅延・ドップラーを考慮した高精度なチャネル推定アルゴリズムを提案し,その有効性を検証する。
- 提案手法は,時間領域の位相変化を利用するT-AFパイロット構造と,空間・時間領域の回転不変性を活用したテンソルトレイン分解に基づくアルゴリズムを組み合わせる。
- 従来のパラメータ推定法と比較して,計算効率に優れ,Ziv-Zakai下限(ZZB)を導出することで,低SN比領域でのMSE性能の閾値現象を捉えることに成功した。
- シミュレーション結果から,提案アルゴリズムは既存手法よりも優れた通信性能を発揮し,最先端の反復アルゴリズムと比較して実行時間を大幅に短縮できることが示された。
ChatGPTは現実的なシステム要求仕様を生成できるか?ケーススタディの結果 [cs.PF, cs.SE]目的:現実的なシステム要求仕様の合成
- システム開発において,要求仕様は品質を左右する重要な要素である。
- 実際の要求仕様は機密性が高く,研究利用が制限されている場合が多い。
- ChatGPTを用いて,研究利用可能な要求仕様を生成することを目指す。
- ChatGPTを用いて300件の合成システム要求仕様を生成し,10業界を網羅した。
- 専門家調査の結果,62%の専門家が生成された要求仕様を現実的と評価した。
- ただし,矛盾した記述や不備も存在し,専門家による評価の重要性が示された。
真理値表摂動下における回路サイズの変動に関する単純な構成的上限 [cs.CC, cs.LO]目的:真理値表摂動に対する回路サイズの変動の上限
- 回路設計や検証において,回路の複雑さは重要な指標である。効率的な設計や検証のためには,回路サイズの変化を予測する必要がある。
- 真理値表のわずかな変化が回路サイズに大きな影響を与える可能性があり,その影響を正確に評価することは困難である。
- 真理値表の摂動に対する回路サイズの変動の上限を明確にすることで,回路のロバスト性を評価する一助とする。
- 真理値表の1点摂動に対する最適回路サイズの変動は,高々$O(n)$であることが示された。
- この上限は,単位コストゲートを持つ固定完備基底に対して一般化され,さらにテレスコーピング引数を用いて一般のハミング距離に対しても拡張された。
- AIG基底において$n=4$での徹底的な検証により,上限がタイトであることが確認された。987個の変異エッジの中で,最大変動は$4=n$であった。
科学の厳密さと人間的な温かさ:ウラジーミル・シドレンコ(1949-2025)を偲ぶ [cs.IT, math.IT]目的:ウラジーミル・シドレンコ博士の科学的業績と人間性を記念する報告
- 情報通信技術の発展には,優れた研究者の貢献が不可欠である。
- 先駆的な研究者の功績が十分に認識され,次世代に伝えられることが課題である。
- FFCS会議にて,シドレンコ博士の追悼セッションが開催され,多くの関係者によって彼の業績と人柄が偲ばれた。
- 彼の研究は,符号理論,暗号,通信,量子誤り訂正といった幅広い分野に及ぶ重要な貢献であった。
- 厳密な思考,指導力,ユーモア,寛大さなど,彼の人間的な魅力も強調された。
RoadLogicを用いた宣言的シナリオベーステスト [cs.SE, cs.AI, cs.LO]目的:自律走行車の検証のための,宣言的シナリオと実行可能なシミュレーション間の橋渡し
- 自動運転技術の安全性確保は不可欠であり,その検証には効率的な手法が求められている。
- 従来のシナリオベーステストは,網羅性を得るために多くの変数を手動で定義する必要があった。
- 宣言的言語の抽象度を活用しつつ,仕様に準拠したシミュレーションを自動生成すること。
- RoadLogicは,OpenSCENARIO DSL (OS2) の仕様に基づき,数分以内に現実的で仕様を満たすシミュレーションを生成できる。
- パラメータサンプリングにより,多様な行動変種を捉え,系統的なシナリオベーステストを可能にする。
- CommonRoadフレームワークにおいて,RoadLogicの有効性が実証された。
専門家向けカリキュラムへの要求工学コースの適応的統合に関する経験報告 [cs.SE]目的:専門家向けソフトウェア工学教育カリキュラムへの要求工学コース統合
- 技術進化とスキル変化により,専門家へのソフトウェア工学教育の需要が増加している。
- 専門家向けカリキュラムは動的かつモジュール化されており,要求工学コースの統合は困難である。
- 本研究は,専門家向けカリキュラムへの要求工学コースの体系的な統合を支援することを目的とする。
- 3つの専門家向けソフトウェア工学教育カリキュラム開発と要求工学コースの統合経験を報告する。
- コース内容のマッピングに焦点を当てた体系的なアプローチと,統合の基本原則を提案する。
コンプライアンス・バイ・デザインのための,視点中心の成果物ベースの規制要件エンジニアリング [cs.SE, cs.CY]目的:規制遵守のための,視点中心の成果物ベースの規制要件エンジニアリング
- ソフトウェア開発における規制遵守は,ますます重要性を増しており,その複雑化に対応する必要がある。
- 既存の要件エンジニアリング手法では,増大する規制と法的知識の強度への対応が課題となっている。
- 規制要件エンジニアリングの統合を促進し,シームレスかつ法的に有効なコンプライアンス・バイ・デザインを実現すること。
- 本研究の中間結果から,規制要件エンジニアリングは他の要件エンジニアリングとは異なる特性を持つことが示された。
- 多くの組織では,規制要件エンジニアリングプロセスを独立して確立している一方,ソフトウェア開発チームはアドホックなアプローチをとっている。
- 本稿では,統合されたコンプライアンス・バイ・デザインのための成果物モデル(AM4RRE)の構築と将来の評価について報告し,議論を喚起する。
LLMとRAGを用いた組込みソフトウェアテストの高速化:EmbC-Test [cs.SE]目的:組込みCソフトウェアのテスト自動化
- ソフトウェア品質確保は,製品の信頼性や安全性を高める上で不可欠である。
- 組込みソフトウェアのテストは手作業が多く,開発効率のボトルネックとなっている。
- テスト自動化により,テスト工数の削減と開発期間の短縮を目指す。
- 提案手法は,大規模言語モデルにプロジェクト固有の情報を与えることで,幻覚を抑制し,プロジェクトへの適合性を向上させる。
- 生成されたテストは100%構文的に正しく,85%が実行時検証に合格した。
- 手動テスト作成と比較して,テスト時間を最大66%削減し,1時間あたり270件のテストを生成可能である。
ランダム化分散関数計算(RDFC):プライバシーを考慮した超効率的意味通信 [cs.IT, cs.CR, cs.DC, cs.SC, eess.SP, math.IT]目的:入力データに対するランダム化関数を生成するために必要な情報のみを送信者が送信すること
- 情報伝達の効率化が求められる現代において,意味通信は新たなアプローチとして注目されている。
- 従来の通信方式では,プライバシー保護と効率性の両立が課題となっていた。
- RDFCは,プライバシーを保護しつつ,通信量を大幅に削減できる可能性を秘めている。
- RDFCは,共通乱数がない場合でも局所的微分プライバシーを保証できることが示された。
- 十分な共通乱数がある場合,意味通信レートを最大で2桁削減できることが実験的に確認された。
- RDFCは,プライバシーを重視した分散計算システム向けに,省エネな意味通信戦略となりうる。
AI駆動アジャイル開発に対応した人材育成:プロジェクトベースのAIエンジニアリングカリキュラム [cs.SE]目的:AI駆動アジャイル開発に対応できる人材の育成
- ソフトウェア開発はAI技術の進化により急速に変化しており,実践的なスキルを持つ人材が不可欠である。
- 既存の教育カリキュラムでは,アジャイル開発とAI技術を分離して教えている場合が多く,実務的な統合が不足している。
- アジャイル開発とAI技術を統合したカリキュラムを通じて,実践的なAI活用能力を育成することを目指す。
- 本研究で提案するカリキュラムは,アジャイルプラクティスとAIツールを統合し,実践的な学習を重視している。
- ケーススタディの結果,学生はAIツールを活用したソフトウェア開発のプロセスを体験し,実践的なスキルを習得することが示された。
- 急速なツール進化に対応するためのアジャイルな教育方法の適応と,基礎学習の確実性を担保するための口頭検証の重要性が明らかになった。
EsoLang-Bench:難解プログラミング言語による大規模言語モデルの真の推論能力の評価 [cs.AI, cs.LG, cs.SE]目的:大規模言語モデルにおける真の推論能力の評価
- コード生成能力は,AI開発において重要であり,その評価手法の確立が求められている。
- 既存のコード生成ベンチマークは,学習データに含まれる情報の記憶に依存し,真の推論能力を測れていない。
- 学習データ汚染の影響を受けにくい,真の推論能力を評価するベンチマークの構築が課題である。
- 大規模言語モデルは,一般的なベンチマークでは高い性能を示すが,難解プログラミング言語を用いた評価では大幅に性能が低下する。
- 少数ショット学習や自己反省といった手法は,性能向上に繋がらず,学習済みの知識に依存している可能性が示唆された。
- EsoLang-Benchは,人間が新しい言語を習得する過程を模倣し,データ汚染に強い推論能力を測定する初のベンチマークである。
複数ターンの人間とLLMの協調的なコード生成におけるインタラクションスメルの実証的研究 [cs.SE]目的:人間とLLMの協調的なコード生成におけるインタラクションスメルの現象,分布,軽減策の体系的調査
- LLMを活用したコード生成は,ソフトウェア開発の効率化に不可欠であり,その進化が求められている。
- LLMは複数ターンの対話において文脈の一貫性を維持することが難しく,協調的なコード生成の妨げとなっている。
- 対話プロセスに潜む品質問題を「インタラクションスメル」として捉え,その軽減策を提案することで,協調的なコード生成の質を向上させる。
- 実証的研究により,インタラクションスメルをユーザーの意図,過去の指示への準拠,過去の応答の矛盾という3つの主要なカテゴリに分類した。
- GPT-4oをはじめとする6つの主要なLLMにおけるインタラクションスメルの分布を定量的に評価した。
- InCEという軽量な軽減策を提案し,WildBenchにおけるタスク成功率の向上とインタラクションスメルの抑制効果を確認した。
べき等スライスとそのコードサイズ削減への応用 [cs.DB, cs.PL]目的:プログラム内で計算された値に対するべき等逆スライスの抽出
- プログラム最適化において,コードサイズ削減はパフォーマンス向上や省エネルギーに繋がる重要な課題である。
- 既存の逆スライス手法では,一般的な制御フローグラフへの適用に不備があり,正確な抽出が困難であった。
- 形式化されたべき等逆スライス抽出アルゴリズムを用いて,コードサイズの削減を可能にすることを目標とする。
- べき等逆スライスの形式的な定義と,GSA形式のプログラムからの抽出アルゴリズムを提案した。
- 提案手法により,非連続な命令列の統合によるコードサイズ削減が可能となった。
- LLVMテストスイートを用いた実験で,最大-7.24%のコードサイズ削減効果が確認された。
有限格子上の異種ランダム場のレート歪み限界 [cs.IT, cs.DC, math.IT]目的:異種ランダム場のレート歪み特性の解析
- 情報圧縮技術は,科学計算におけるデータ保存や伝送に不可欠である。
- 既存のレート歪み理論は,現実の科学計算で利用される異種ランダム場に対応できていない。
- 有限格子上の異種ランダム場に対するレート歪み限界を導出し,タイルサイズの最適化を目指す。
- 本研究では,空間相関,領域形状,異質性,タイルサイズがレートおよび分散に与える影響を定量化する第二階展開を導出した。
- 異種ランダム場を領域ごとに静止二階統計量を持つ区分的に同質な場としてモデル化し,タイル制約をソースモデルに直接組み込んだ。
- 過剰歪み確率基準の下で,非漸近的達成可能性と逆定理を確立し,有限ブロック長レート歪みフレームワークを提示した。
低次元ユークリッド空間におけるクラスタリングのほぼ最適な上限と下限 [cs.IR, cs.CG, cs.CC, cs.DS]目的:低次元ユークリッド空間におけるk-中央値およびk-平均クラスタリング問題に対する近似アルゴリズムの性能評価
- クラスタリングは,データ分析や機械学習において重要な役割を果たしており,データの構造を理解するための基礎技術である。
- 次元の呪いにより,高次元空間でのクラスタリングは計算コストが高く,効率的なアルゴリズムが求められている。
- この研究は,低次元空間におけるクラスタリング問題の近似アルゴリズムの計算複雑性の限界を明らかにすることを目的とする。
- 提案手法は,既存手法と比較して計算時間において指数関数的な改善を達成した。
- k-平均問題に対する下限は,Gap Exponential Time Hypothesisに基づき,効率的なアルゴリズムの存在可能性に疑問を投げかける。
- 今回の結果は,低次元空間におけるクラスタリング問題の近似アルゴリズムの設計における理論的な限界を示す。
Pythonのためのニューラルデバッガへ [cs.LG, cs.AI, cs.SE]目的:Pythonプログラムのデバッグ手法の研究
- コード生成や理解において,プログラムの動作理解が不可欠である。
- 既存のニューラルインタープリタは,デバッガのようなインタラクティブな制御が欠如している。
- ニューラルデバッガにより,プログラムの実行をステップごとに制御し,変数検査を可能とする。
- 大規模言語モデルをファインチューニング,または小規模モデルを最初から学習することで,ニューラルデバッガを構築した。
- CruxEval評価において,出力予測と入力予測の両方で高い性能を示し,条件付き実行モデリングの堅牢性を実証した。
- 本研究は,ニューラルデバッガをシミュレーション環境のワールドモデルとして活用する,エージェント型コーディングシステムの実現に向けた第一歩となる。
d-DNNF を用いた理論を含むSMTクエリの汎用的なフレームワーク [cs.LO]目的:理論を含むSMTクエリの効率的な解決
- 知識コンパイルは,多数のクエリを効率的に処理する基盤技術である。
- SMTソルバーの複雑さにより,効率的なクエリ処理が課題である。
- d-DNNFを用いて,SMTクエリを効率化し,高速な応答を実現する。
- 本研究では,d-DNNFコンパイルとクエリ技術をSMTレベルに拡張する新しい手法を提案する。
- 入力SMT式を事前計算された理論の補題と組み合わせることで,SMTレベルのクエリを命題レベルのクエリに還元する。
- 実装したツールによる実験評価は,この手法の有効性を示唆している。
- 1
- 2
