arXiv雑要約
プログラム - 2026/03/04 公開
自己合成パイプラインによる学習可能な情報獲得が,自己対戦のみで進化を促進する [cs.LG, cs.AI, cs.CL, cs.IT, math.IT]目的:自己進化ループにおける持続可能な進化の条件
- 大規模言語モデルの発展により,自己改善システムの構築が期待されている。
- 既存の自己対戦型システムは,学習可能な情報増加が伴わないデータ合成により停滞しやすい。
- 学習可能な情報獲得を促進する自己合成パイプラインの設計を提案する。
- 自己進化型LLMは,提案者・解答者・検証者の三つの役割を担うことが明らかになった。
- 役割間の非対称的共進化,容量の成長,積極的な情報探索が持続的な自己進化を可能にする。
- これらのモジュールにより,脆弱な自己対戦ダイナミクスから持続的な自己進化への道筋が示された。
ニューラルネットワーク検証のための自動仕様生成:検証者との対話 [cs.LG, cs.AI, cs.SE]目的:ニューラルネットワーク検証のための仕様の自動生成
- ニューラルネットワークの安全性確保は重要であり,様々な分野での応用が期待される。
- 既存の検証ツールは低レベルな仕様に限定され,高レベルな要件に対応できない。
- 自然言語による仕様記述を形式的な検証クエリに変換し,応用範囲を拡大する。
- 自然言語で記述された仕様を,既存の検証ツールで利用可能な形式に自動変換する手法を提案した。
- 提案手法は,構造化データおよび非構造化データを用いた実験で,複雑な意味的仕様を検証できることを示した。
- 変換プロセスはユーザーの意図を高く維持しつつ,計算コストも低いことが確認された。
Transformerにおける長さ一般化の限界 [cs.LG, cs.FL, cs.LO]目的:Transformerの長さ一般化限界の計算可能性
- 機械学習モデルの汎化性能評価において,入力長の制約を受けないことが重要である。
- Transformerを含むモデルに対し,入力長に関する汎化性能を保証する境界の計算が困難である。
- CRASP言語クラスに対する長さ一般化限界の計算可能性を調査し,限界を明らかにする。
- CRASP言語クラス(Transformerと関連)に対し,長さ一般化限界は計算不可能であることが証明された。
- CRASPの正の断片に対しては計算可能な限界が得られ,固定精度Transformerと同値であることが示された。
- 正のCRASPおよび固定精度Transformerの長さ複雑度は指数関数的であり,限界の最適性が証明された。
エンジニアリング推論・指示 (ERI) ベンチマーク:基盤モデルとエージェントのための大規模なタクソノミー駆動型データセット [cs.AI, cs.SE]目的:エンジニアリング能力を持つ大規模言語モデルおよびエージェントの学習と評価
- 工学分野は社会基盤を支える重要な領域であり,高度な専門知識と問題解決能力が求められる。
- 既存の言語モデルは,具体的な工学問題への対応能力が十分ではなく,専門知識の不足が課題である。
- 本研究は,工学分野における言語モデルの推論能力を向上させ,実用的な問題解決を支援することを目的とする。
- ERIベンチマークは,9つの工学分野と55のサブドメイン,7種類の意図,3つの難易度を網羅する57,750件のデータセットである。
- 評価の結果,最先端モデル(GPT-5,Claude Sonnet 4,DeepSeek V3.1)は高い性能を示したが,中間層および小型モデルは難易度の上昇に伴い性能が低下した。
- LLMベンチマークにおける循環性の問題を解決するため,クロスプロバイダー独立性,複数評価者による平均化,最先端モデルの合意分析を用いた検証プロトコルを開発し,幻覚のリスクを1.7%に抑えた。
例外と副作用の処理のための自動リソース解析 [cs.PL]目的:例外および副作用処理を伴うプログラムのリソース境界自動導出
- プログラムの安全性や効率性を保証する上で,リソース使用量の解析は不可欠である。
- 既存のリソース解析手法は,例外や副作用といった非局所的な制御フローに弱点があった。
- 例外や副作用処理を含むプログラムに対してもリソース境界を導出可能にすることを目指す。
- 本研究では,例外や副作用のハンドラ間の非局所的な制御転送をサポートする自動リソース境界解析を提案した。
- この解析は,アモルタイズド解析を自動化する型に基づく自動アモルタイズド・リソース解析(AARA)の拡張である。
- 実験評価の結果,既存手法では解析できなかったプログラムを解析でき,オーバーヘッドも低いことが示された。
CuTe レイアウト表現と代数 [cs.MS, cs.PL]目的:テンソル表現と操作のための数学的仕様
- 高性能計算と深層学習において,特殊なテンソル命令が重要になっているため。
- これらの命令は複雑なデータレイアウトを必要とし,その管理が困難である。
- CuTeは,複雑なレイアウトを表現し,最適化するための枠組みを提供する。
- CuTeの抽象化により,従来の方式と比較してソフトウェア開発が大幅に容易になる。
- アーキテクチャで規定されたレイアウトのコンパイル時検証が可能となる。
- CuTeはNVIDIAのCUTLASSライブラリの基盤として実運用システムに導入されている。
RIVA:LLMエージェントを活用した信頼性の高い構成ドリフト検出 [cs.HC, eess.SY, cs.SY, cs.SE, cs.AI, cs.MA]目的:インフラ構成のドリフト検出
- クラウド環境の複雑化に伴い,インフラ構成管理の自動化が重要視されている。
- IaCツール導入後も,実際の環境と定義の不一致(構成ドリフト)が発生しやすい。
- 誤ったツール出力に左右されない,堅牢な構成ドリフト検出手法の確立を目指す。
- RIVAは,検証エージェントとツール生成エージェントが反復的なクロスバリデーションを行うことで,誤ったツール出力時でも高いタスク精度を回復する。
- AIOpsLabベンチマークにおいて,RIVAはベースラインReActエージェントと比較して,誤ったツール出力時のタスク精度を27.3%から50.0%に向上させた。
- 誤ったツール出力がない場合でも,タスク精度は28%から43.8%に向上し,信頼性の高いインフラ検証が可能となった。
高々漸増型:多数の目的に対する単純なプログラム的アプローチ (拡張版) [cs.SC, cs.DM, cs.PL]目的:確率的プログラムにおける多様な目的の推論
- ソフトウェアの信頼性向上のため,プログラム検証の自動化が重要視されている
- 従来の検証手法では,目的ごとに異なるアプローチが必要で柔軟性に欠ける
- 単一のアプローチで多様な目的を扱える柔軟な検証手法を確立すること
- 報酬文を言語に追加し,累積報酬に単調関数を適用するプログラム変換を定義した。
- この変換は報酬の漸増的な差分を利用し,高次モーメントや閾値確率などを表現可能にした。
- 確率的wp-推論を用いて分析し,Caesar検証器で自動検証を試みた。
ビデオTokenCom:テキスト意図に基づく多レートビデオToken通信とUEPベース適応ソース・チャネル符号化 [cs.RO, cs.IT, cs.LG, cs.MM, eess.IV, math.IT]目的:テキスト意図に基づいた多レートビデオ通信のための,UEPベース適応ソース・チャネル符号化フレームワーク
- AIモデルの発展に伴い,効率的なセマンティック情報伝送が求められている。
- 帯域制限下でのセマンティック忠実度の確保が課題である。
- ユーザー意図に基づいた重要度に応じた情報伝送を目指す。
- 提案手法は,従来の方式やセマンティック通信のベースラインを上回る性能を示す。
- 知覚的品質とセマンティック品質の両面で,広範囲なSNRにおいて優位性を示す。
- ユーザー意図に合致するトークンは高精度に符号化し,それ以外のトークンは低精度で符号化することで,帯域幅を節約しつつセマンティック品質を維持する。
時間減衰モデルにおける学習増強モーメント推定 [cs.RO, math.OC, cs.HC, cs.RO, cs.DS, cs.LG]目的:時間減衰モデルにおけるノルム/モーメント推定,頻度推定,カスケードノルム,長方形モーメント推定のための学習増強アルゴリズム
- 機械学習の普及と成功により,ストリーミングモデルにおける学習増強アルゴリズムの研究が活発化している。
- アイテムの重みが不均一な場合,特にプライバシー規制により古いデータを除去する必要があるスライディングウィンドウモデルでは,理解が限られている。
- ヘビーヒッターオラクルを活用し,時間減衰モデルにおける基本的な問題に対する学習増強アルゴリズムを提案する。
- ヘビーヒッターオラクルを利用することで,空間効率が向上した学習増強アルゴリズムを実現した。
- 提案アルゴリズムは,ノルム/モーメント推定,頻度推定,カスケードノルム,長方形モーメント推定といった複数の問題に適用可能である。
- 実データと合成データを用いた実験により,提案アルゴリズムの実用的な効率が実証された。
RISを活用した無線チャネル等化:適応型RIS等化器と深層強化学習 [cs.IT, cs.ET, eess.SP, math.IT]目的:RISを用いた無線チャネル等化手法の開発
- 無線通信において,電波環境の制御は通信品質向上の鍵となる。RISはその実現に貢献しうる。
- 大規模なRISを効率的に制御し,信頼性の高い信号等化を実現する手法が不足している。
- チャンネル推定に依存せず,リアルタイムにRISを制御する手法を確立することを目指す。
- 最急降下法(SD)と深層強化学習(DRL)によるRIS制御を検討し,それぞれのリスクとトレードオフを分析した。
- SACアルゴリズムが,ARISEと同等の等化性能を,より低い実装複雑さで実現可能であることを示した。
- DRLは,チャンネル推定に依存しない,実用的かつスケーラブルなRIS制御の有望な解法となりうる。
分布クラスに対するE変数と乱数列の検定 [cs.IT, cs.LO, math.IT, math.LO, math.ST, stat.TH]目的:分布クラスに対する乱数列の検定のためのE変数の構築
- 統計的仮説検定は,科学的根拠に基づいた意思決定に不可欠であり,その精度向上が常に求められている。
- 既存の検定方法では,特定の分布クラスに対して十分な性能を発揮できない場合がある。
- 一般的な分布クラスに対して適用可能なE変数を構築し,乱数列検定の理論的基盤を確立すること。
- E変数近似法を導入し,応用上重要な分布クラスに対するE変数の構築を可能にする一般的な近似手法を開発した。
- 本研究で構築されたE変数は,特定の分布クラスに対する乱数列検定の明示的な構成を提供する。
- この手法は,アルゴリズム情報理論におけるLevinの(平均境界付き)乱数列検定の概念に基づいている。
AI時代における人間認証モジュールリポジトリ [cs.ET, cs.AI, cs.SE]目的:AI支援開発における信頼性のあるソフトウェア構築のための新たなアーキテクチャモデル
- AI技術の進展に伴い,ソフトウェア開発の効率化が期待される一方,その信頼性が重要課題となっている。
- 現在のソフトウェアサプライチェーンには,出所不明なコンポーネントや不十分なレビューが及ぶリスクが存在する。
- AIによる安全で予測可能なソフトウェア組み立てを可能にする,人間による監視と自動分析を組み合わせたモジュール認証の枠組みを提案する。
- 本研究では,人間によるレビューと自動分析を組み合わせた人間認証モジュールリポジトリ(HCMR)の参照アーキテクチャを提示した。
- HCMRは,モジュールの認証と系統の追跡を支援し,モジュール型エコシステムのセキュリティリスクを分析する。
- HCMRが,信頼性と監査可能性の高いAI構築ソフトウェアシステムの基盤となり得ることを議論した。
焦点エントロピーの機能的性質 [cs.IT, cs.CV, cs.LG, math.IT, math.ST, stat.ML, stat.TH]目的:焦点損失の理論的基盤の解明
- 不均衡なクラス分類は,画像認識を含む多くの分野で重要な課題である。
- 焦点損失は実証的に成功しているが,情報理論的な考察が不十分であった。
- 焦点損失の挙動を理論的に理解し,不均衡学習におけるトレードオフを明確化すること。
- 焦点エントロピーの有限性,凸性,連続性に関する条件が確立された。
- 焦点損失が中間確率を増幅し,高確率の結果を抑制することが厳密に示された。
- 極端なクラス不均衡下では,非常に低い確率がさらに抑制される過剰抑制状態が生じることが明らかになった。
衛星・地上ネットワークにおける意味的転送とコードブック拡張型モデル分割多重アクセス [eess.SY, cs.SY, cs.HC, cs.IT, eess.IV, math.IT]目的:衛星・地上ネットワーク向け意味的通信フレームワークの最適化
- 衛星通信は,遠距離による高減衰,限られた帯域,時間変動するチャネル環境が課題である。
- 従来のビットレベル伝送は,特に低SNR環境下で効率や信頼性が低い。
- タスク関連情報の優先度を高める意味的通信により,上記課題の解決を目指す。
- 提案手法は,低SNR環境において既存手法と比較して約7.9dBのPSNR改善を実現した。
- 意味的転送により,衛星における復号・再符号化処理負荷を軽減し,効率的な中継が可能となった。
- コードブック分割型モデル分割多重アクセスにより,スペクトル効率の向上が確認された。
内在的不確実性に対するマイクロサービスファジング [cs.SE]目的:マイクロサービスにおける内在的不確実性への対応
- 現代のソフトウェアシステムはマイクロサービスで構築されることが多く,その信頼性確保が重要である。
- 既存の手法では,マイクロサービスの動的な性質や分散制御による不確実性を十分に捉えられていない。
- マイクロサービスシステム全体を対象とした,不確実性を考慮したテスト手法の開発を目指す。
- 本研究では,サービス仮想化,不確実性シミュレーション,適応的なテスト生成を統合した継続的なファジングアーキテクチャを提案する。
- 不確実性のモデリングと注入,原因推論による障害局所化,多次元分析などの研究課題を提示する。
- 提案アーキテクチャは,不確実性とそれらがシステム品質に与える影響を考慮した,スケーラブルなテスト手法開発の促進を目的とする。
エージェントアッセイ:非決定性AIエージェントワークフローのための効率的な回帰テスト [cs.AI, cs.SE]目的:非決定性AIエージェントワークフローの回帰テストのためのトークン効率的なフレームワーク
- AIエージェントの利用拡大に伴い,その品質保証の重要性が増している。
- AIエージェントの変更による回帰を検出する体系的な手法が存在しない。
- AIエージェントの回帰テストを効率的に行い,品質を保証すること。
- AgentAssayは,既存手法に比べて78-100%のコスト削減を達成した。
- 行動フィンガープリンティングは,バイナリテストでは検出できなかった回帰を86%の精度で検出した。
- トレースベースのオフライン分析により,ゼロコストでのテストが可能になった。
His2Trans:歴史的検索を用いた自己進化型CからRustへの変換のためのスケルトン優先フレームワーク [cs.CL, cs.SE]目的:CからRustへの変換における安定したインクリメンタル移行の実現
- CコードのRustへの移行は,安全性とパフォーマンス向上に貢献し,現代的なソフトウェア開発に不可欠である。
- 大規模プロジェクトでは,ビルドコンテキストの欠如やドメイン知識の不足により,自動移行が困難となる。
- 過去の移行履歴から知識を抽出し,LLMを誘導することで,正確な型定義と適切なAPI対応を実現する。
- His2Transは,コンパイル可能なプロジェクトレベルスケルトングラフを構築し,厳密な型環境を提供することで,ビルドエラーを効果的に修正する。
- オープンハーモニーのモジュールを用いた実験で,99.75%という高いインクリメンタルコンパイル成功率を達成し,ベースラインを上回る結果を示した。
- 知識の蓄積研究により,検証済みのパターンを継続的に統合することで,未知のタスクにおける修正コストを約60%削減できることが示された。
StitchCUDA:評価基準に基づくエージェント強化学習を用いた自動マルチエージェント型エンドツーエンドGPUプログラミングフレームワーク [cs.DC, cs.MA, cs.CL, cs.PL]目的:エンドツーエンドGPUプログラム生成のためのマルチエージェントフレームワーク
- 近年の機械学習はGPUに大きく依存するが,GPUの効率とホスト側の設定の両方を最適化する必要がある。
- 既存研究は単一カーネルの最適化に偏っており,エンドツーエンドプログラムへの拡張が課題であった。
- 評価基準に基づくエージェント強化学習により,エンドツーエンドGPUプログラミングを自動化し,性能向上を目指す。
- StitchCUDAは,プランナー,コーダー,検証者の3つのエージェントで構成されるフレームワークである。
- KernelBenchを用いた実験で,エンドツーエンドGPUプログラミングタスクの成功率がほぼ100%に達した。
- マルチエージェントベースラインと比較して1.72倍,RLモデルベースラインと比較して2.73倍の高速化を実現した。
大規模言語モデルを活用したMassive MIMOシステムにおけるCSIフィードバック [cs.RO, cs.CL, cs.SI, cs.IT, math.IT]目的:Massive MIMOシステムにおけるCSI圧縮とフィードバックの効率化
- 無線通信容量向上には正確なチャネル状態情報が不可欠であり,Massive MIMOはその実現技術として重要である。
- FDD Massive MIMOシステムでは,CSIフィードバックのオーバーヘッドが大きく,通信効率を制限する要因となっている。
- 大規模言語モデルを用いてCSIフィードバックを効率化し,通信容量の向上を目指す。
- 本研究では,CSI圧縮フィードバックタスクをマスク化トークン予測タスクとして再定式化することで,大規模言語モデルの活用を可能とした。
- 自己情報量に基づいたマスク選択戦略を設計し,UEにおいて自己情報量の高いCSI要素を優先的にフィードバックすることで,LLMの予測精度を最大化した。
- 提案手法により,CSIフィードバックの効率化が期待され,Massive MIMOシステムの性能向上が見込まれる。
CONGESTモデルにおける少ない色数での決定論的辺彩色 [cs.DS]目的:少ない色数での決定論的辺彩色アルゴリズムの開発
- 分散アルゴリズムにおいて,効率的なグラフ彩色処理は重要な課題である。
- 既存のCONGESTモデルにおける辺彩色アルゴリズムは,計算時間が大きいという問題点があった。
- 計算時間と色数の両面で効率的な辺彩色アルゴリズムを提案し,問題を解決する。
- 本研究では,最大次数$\Delta$の$n$節点グラフに対し,$(1+\varepsilon)\Delta+O(\sqrt{\log n})$色で辺彩色するアルゴリズムを開発した。
- 提案アルゴリズムは,$\tilde{O}(\log^{2.5} n+\log^2 \Delta \log n)$ラウンドで動作し,既存のアルゴリズムより効率的である。
- 特に$\Delta \geq c\sqrt{\log n}$の場合,2$\Delta$-1色未満で彩色でき,これまでよりも優れた性能を発揮する。
ICSE 2023 サステナビリティ報告書 [cs.SE]目的:ICSE 2023参加者へのアンケート調査結果と,それに基づく会議のカーボンフットプリント推定
- 学術会議の環境負荷が議論されており,その影響評価が重要となっている。
- 移動等による環境負荷が,会議の価値に見合っているか不明である。
- 今後の会議開催における場所選定やイベントの価値判断の指針を示す。
- ICSE 2023の全体評価は5段階で4.4点であり,セッション間の評価に大きな差は見られなかった。
- 回答率が11%と低く,詳細な考察は困難であった。
- 会議参加者の航空移動による二酸化炭素排出量は約5,053.5トンと推定された。
ビームベースMU-MIMOを用いたマルチパネルmmWave無線アクセスネットワークにおけるユーザーのスループット向上:深層強化学習法 [cs.IT, cs.AI, cs.LG, math.IT]目的:マルチパネルmmWave無線アクセスネットワークにおけるユーザーのスループット向上
- mmWave通信は高速・大容量通信を実現する技術であり,5G/6Gなどの次世代通信システムにおいて重要である。
- ビーム選択と管理の複雑さから,mmWave MU-MIMOシステムではユーザーのスループット最適化と低遅延化が課題となっている。
- 本研究は,動的なビーム選択と管理の複雑さを軽減し,ユーザーのスループットを向上させることを目指す。
- 提案手法は,異なるアンテナパネル間のビームのクロス相関,RSRP,ビーム利用統計を組み込むことで,空間領域の特徴を活用する。
- シミュレーション結果から,提案手法は従来のビーム管理と比較して,最大16%のスループット向上と3~7倍の遅延削減を達成することが示された。
- 深層強化学習を用いることで,リアルタイムな観測に基づいた動的なビームフォーミング決定を最適化し,スペクトル効率の向上を実現した。
反射面を活用した車載高速データ交換の伝送能力上限突破 [cs.IT, math.IT]目的:車載とエッジコンピューティング対応基地局間の高速データ伝送の伝送能力向上
- スマートモビリティの普及に伴い,車両と基地局間の大容量かつ断続的なデータ伝送が不可欠となっている。
- 帯域制限下では,従来の通信システムは車両ごとの伝送能力に上限があり,十分なデータレートを確保できない。
- 道路沿いに反射面を配置し,空間的多様性を高めることで,伝送能力上限を突破することを目指す。
- 提案手法では,複数の方向からの電波を車両に集束させることで,空間的多様性を高め,伝送路のランクを向上させる。
- 基地局は,より多くの伝送層を単一車両に割り当てることが可能になり,伝送能力上限を大幅に向上させることができる。
- 3GPP準拠のシステムレベルシミュレーションにより,提案手法の有効性が検証され,著しいスループットの向上が確認された。
有向 Steiner 木問題に対する単純なパスに基づく LP 緩和 [cs.DS]目的:有向 Steiner 木問題の LP 緩和手法
- ネットワーク設計や通信網構築において,重要な最適化問題である。
- 既存手法では,緩和の精度向上に複雑な計算が必要となる場合がある。
- より単純な緩和手法により,既存手法と同等の精度を目指す。
- 提案手法は,O(l log k) の積分ギャップを達成し,既存の最良の結果と同等である。
- 緩和の複雑な階層構造を回避し,より簡潔な証明を提供する。
- Sherali-Adams 階層の適切な丸め回数に関する新しい知見も得られた。
SpecLoop:形式検証フィードバックループを持つエージェント型RTL-to-仕様フレームワーク [cs.AR, cs.PL]目的:RTLから仕様への生成
- ハードウェア設計の複雑化に伴い,仕様の維持・検証コストが増大している。
- RTL実装と仕様の不一致が,設計理解と検証の障害となっている。
- LLMを活用しつつ,形式検証によるフィードバックで仕様の正確性を向上させる。
- SpecLoopは,RTLから生成した仕様に基づいてRTLを再構築し,形式的同値性チェックを行う。
- 不一致が検出された場合,反例を仕様にフィードバックし,反復的に改善する。
- 実験により,形式検証フィードバックがLLM単体よりも仕様の正確性と堅牢性を大幅に向上させることが示された。
論理と型理論:ステファノ・ベラルディ氏への献呈論文集 [cs.LO]目的:数学的証明の構造と計算の基礎に関する研究
- 論理学と計算機科学の根幹をなす分野であり,形式システムやプログラミング言語の理解に不可欠である。
- 構成的論理や依存型といった分野で,さらなる発展の余地がある。
- ステファノ・ベラルディ氏の研究成果と,この分野の将来展望を示すことを目指す。
- 本論文集は,ベラルディ氏と共同研究を行った研究者たちの論文を収録し,その業績を称える。
- 構成的論理,依存型,循環証明など,型理論と証明論における最新の研究動向を把握できる。
- 形式システム,プログラミング言語,構成的数学といった分野の発展に貢献することが期待される。
アーキテクチャ技術的負債検出におけるラベル付け努力の軽減:アクティブラーニングと説明可能なAIの活用 [cs.SE]目的:アーキテクチャ技術的負債の検出におけるラベル付け努力の削減
- ソフトウェア開発における品質維持・改善は重要であり,技術的負債の管理が不可欠である。
- アーキテクチャ技術的負債は抽象的で文脈依存性が高く,手動での検出・特定が困難である。
- キーワードフィルタリング,アクティブラーニング,説明可能なAIを組み合わせ,効率的な技術的負債検出を目指す。
- キーワードフィルタリングにより候補となる課題を10万件以上特定し,ラベル付けの対象範囲を絞り込んだ。
- アクティブラーニングのBreaking Ties戦略が最も高いF1スコア(0.72)を達成し,アノテーション努力を49%削減した。
- SHAPとLIMEを用いたモデルの説明可能性評価の結果,LIMEの方が専門家にとって理解しやすいと評価された。
LLM推論における炭素排出量推定のための参照フレームワーク:マルチベンチマーク駆動型具現化 [cs.SE, cs.AI]目的:LLM推論における炭素排出量推定のための参照フレームワーク
- LLMの利用拡大に伴い,環境負荷の低減が喫緊の課題となっている。
- 既存の手法では,プロンプトレベルでの正確な炭素排出量測定が困難である。
- LLM推論時の炭素排出量を正確に測定し,持続可能性に配慮した意思決定を支援する。
- 本研究では,LLM推論における炭素排出量推定のための参照フレームワークの原則を提示した。
- マルチベンチマーク駆動型アプローチに基づく,初期実装SEALを開発し,その有効性を示した。
- SEALは,LLMエコシステムにおける標準化された持続可能性評価の基盤となる可能性を秘めている。
生きてる!ライブオブジェクト環境がソフトウェア工学の実践に及ぼす変化 [cs.SE]目的:Pharoにおける開発ツール群の活用と,それらが開発者のワークフローに与える影響
- ソフトウェア開発において,開発ツールは開発者の思考と行動に大きな影響を与えるため,適切なツールの選択が重要である。
- 従来のIDEは抽象的なプログラムモデルに焦点を当てがちで,オブジェクトとの直接的なインタラクションが不足している場合がある。
- オブジェクトとの密接な連携を通じて開発効率と理解度を高めるための,新しいIDEのあり方を模索する。
- Pharo環境におけるInspectorのカスタムビュー,Microcommits,Xtreme TDDなどのツールが,開発者のワークフローを改善している。
- これらのツールは,オブジェクトの直接操作,迅速な変更の取り消し,デバッガ内でのコーディングを可能にし,開発体験を向上させる。
- APIの進化をサポートするOn-the-Fly Rewriting Deprecationsや,インスタンス固有のデバッグを可能にするObject-Centric Breakpointsも,Pharoのユニークな特徴である。
多用波 MIMO システムにおける最適化に基づくユーザスケジューリングフレームワーク [cs.RO, cs.DB, cs.IT, eess.SP, math.IT]目的:多用波 MIMO システムにおけるユーザスケジューリング手法
- 無線通信において,ユーザへの高品質なサービス提供には,効率的なリソース配分が不可欠である。
- 既存のユーザスケジューリング手法は貪欲法に依存し,リソース配分問題を全体的に捉えられていない。
- 本研究は,非凸最適化問題を近似的に解くことで,全体的なリソース配分を考慮したスケジューリングを実現する。
- 提案手法は,様々な目的関数(後等化平均二乗誤差,容量,達成可能な合計レートなど)に対応し,リソース数の制御も可能である。
- ミリ波大規模 MU-MIMO および 6 GHz 未満のセルフリー大規模 MU-MIMO システムにおいて,提案手法の有効性が確認された。
- 提案手法は,既存のスケジューリングアルゴリズムを上回り,網羅的探索に近い性能を示す。
REGAL:企業テレメトリにおけるエージェントAIの決定論的根拠付けのためのレジストリ駆動アーキテクチャ [cs.AI, cs.SE]目的:企業テレメトリにおけるエージェントAIの決定論的根拠付けのためのアーキテクチャ
- 企業活動のデジタル化が進み,大量のテレメトリデータが生成されているため,その活用が重要である。
- LLMを活用した自動化において,プライベートテレメトリの文脈,セマンティックな概念,メトリックインターフェースの進化が課題となっている。
- 決定論的なテレメトリ計算とセマンティックコンパイルを重視し,エージェントAIシステムの根拠付けを体系化することを目指す。
- REGALは,再生可能でセマンティックに圧縮されたGoldアーティファクトを生成するMedallion ELTパイプラインと,宣言的なメトリック定義からMCPツールを合成するレジストリ駆動コンパイル層を組み合わせる。
- レジストリは「インターフェース・アズ・コード」として機能し,ツール仕様と実行の一致を保証し,ツールドリフトを軽減し,セマンティック境界にガバナンスポリシーを埋め込む。
- プロトタイプ実装とケーススタディにより,決定論的根拠付けの実現可能性と,レイテンシ,トークン効率,運用ガバナンスへの影響が確認された。
ラムダ計算における双方向補間 – クレイグ-\v{C}ubri\'c補間の再検討と形式化 [cs.LO, cs.PL, math.LO]目的:ラムダ計算における双方向補間定理の証明と形式化
- 数学論理学や計算機科学に広範な応用を持つため,補間定理の理論的基盤の理解が重要である。
- 既存の補間定理の証明は複雑であり,形式的な検証が困難であるという課題がある。
- 双方向型付けの原理に基づき,形式化可能な補間定理の新たな証明を提供する。
- 本研究では,\v{C}ubri\'cの補間定理を双方向型付けの枠組みで再証明することで,より簡潔で形式的な検証を可能にした。
- Rocqを用いて証明を形式化することにより,定理の信頼性と正確性を高めた。
- 本手法は,補間定理の応用範囲を広げ,より複雑な論理システムの検証に貢献することが期待される。
技術的負債管理プロセス確立の実践ガイド [cs.SE]目的:技術的負債管理プロセスの確立に向けた実現可能なアプローチと課題の特定
- ソフトウェア開発における品質維持と迅速な変化への対応は重要であり,技術的負債はその両立を阻害する。
- 技術的負債の管理は重要視されているが,具体的な管理プロセスの確立が現場の課題となっている。
- 本研究は,現場で導入しやすい技術的負債管理アプローチを明確にし,プロセス確立の指針を提供する。
- 複数の企業チームでのワークショップを通じて,技術的負債の予防戦略とドキュメンテーションにおける共通点が見られた。
- 各チームは既存のバックログに加え,技術的負債専用の項目タイプを導入し,属性(関心度,伝播性,再検討日など)を共通して活用した。
- 優先順位付けや返済方法には違いが見られたが,技術的負債管理プロセス確立時の課題と解決策が明らかになった。
AI空間物理学:オープンAI機関のための構成的境界意味論 [cs.AI, cs.LO]目的:オープンAI機関の構成的境界意味論
- AIの進化により,持続的な機関としての振る舞いが重要になっている。
- 境界を越える因果メカニズムが未定義であり,将来的な権限の拡張が問題となる。
- 権限の拡張を重要な境界事象として捉え,証拠責任を明確にすることを目指す。
- AI空間物理学は,型付き境界チャネル,到達範囲制限,膜観察規律を持つ最小限の状態モデルを定義する。
- 権限表面の拡張を,即時的な外部変化がなくてもガバナンスに関連する重要な事象として扱う。
- 境界を越える際の証拠責任を明確化し,拡張トランザクションのガバナンス関連性を強調する。
RippleGUItester:変更を意識した探索的テスト [cs.SE]目的:コード変更による影響範囲の探索とバグ検出
- ソフトウェアの品質確保は重要であり,継続的な変更に対応する必要がある。
- 既存のテスト手法では,変更に起因する問題を網羅的に検出できない場合がある。
- 本研究は,コード変更を起点としたGUIテストで,未検出のバグを発見することを目指す。
- RippleGUItesterは,コード変更を「震源地」とみなし,GUIを通じてユーザーに可視化される影響を探索する。
- Firefox,Zettlr,JabRef,Godotを含む4つのソフトウェアで評価した結果,既存のテストスイートで見逃されていた26個のバグを発見した。
- 発見されたバグのうち16個は修正済み,2個は確認済み,6個は議論中,2個は意図された動作と判断された。
短距離レースの予測を効率的に行う動的アルゴリズム [cs.PL, cs.DS]目的:観測されたトレースにおける短距離レースの検出
- 並行プログラムの安全性確保は重要であり,データ競合の検出が不可欠である。
- 従来のレース検出手法は,トレース全体を処理する必要があり,時間と空間のコストが高い。
- 短距離レースに焦点を当てることで,効率的なレース検出アルゴリズムを開発し,リソース消費を削減する。
- 提案手法は,FastTrackと同等の実行時間で,空間計算量がトレース長ではなくウィンドウサイズに依存する。
- SyncPと比較して,同期保存型レース検出において,より高速かつ少ないメモリ消費を実現した。
- 実験結果から,提案手法は効率的かつ精度の高いレース検出が可能であることが示された。
チャネル適応型エッジAI:チャネル状態に応じた計算複雑度の調整による推論スループットの最大化 [cs.IT, cs.AI, cs.LG, cs.NI, math.IT]目的:チャネル状態に応じた計算複雑度の調整による推論スループットの最大化
- 次世代通信(6G)における効率的なエッジ推論実現に向け,通信と計算の統合が重要視されている。
- 終端間(E2E)推論性能を定量的に評価する理論的フレームワークが不足しており,設計のボトルネックとなっていた。
- チャネル状態と計算複雑度を考慮した解析モデルを構築し,推論スループットを最大化するアルゴリズムを開発することを目指す。
- 提案手法は,送信側特徴圧縮と受信側モデル複雑度をチャネル状態に応じて同時に調整することで,全体的な効率と推論スループットを最大化する。
- 特徴分布をvon Mises分布の混合でモデル化することで,量子化ビット幅とモデル探索深さの関数としての推論精度を閉形式で表現することに成功した。
- 実験結果は,提案手法が固定複雑度のアプローチと比較して優れた性能を発揮することを示している。
依存関係閉包を用いた型認識検索拡張生成によるソルバー実行可能産業最適化モデリング [cs.SE, cs.AI, cs.CL]目的:産業最適化モデリングにおけるソルバー実行可能コード生成
- 産業プロセスの効率化に不可欠であり,コスト削減や生産性向上に貢献する。
- 自然言語からの変換において,構文エラーや型不整合などにより,実行可能なコード生成が困難である。
- 型情報と依存関係閉包を強化することで,実行可能なモデル生成を可能にし,実用的な応用を目指す。
- 提案手法は,型付き知識ベースを構築し,依存関係を考慮した最小限の依存関係閉包コンテキストを計算する。
- バッテリー生産における需要応答最適化と柔軟なジョブショップスケジューリングのケーススタディで有効性が確認された。
- 従来のRAGベースラインと比較して,実行可能なモデルの生成と最適解への到達において優れた性能を示した。
BeyondSWE:現在のコードエージェントは単一リポジトリのバグ修正を超えて生き残れるか [cs.CY, cs.CL, cs.SE]目的:コードエージェントの能力評価
- ソフトウェア開発において,自動化されたコード修正は生産性向上に不可欠である。
- 既存の評価基準は狭範囲に限定され,現実世界の複雑な課題に対応できていない。
- より現実的な課題設定でコードエージェントの能力を評価し,改善を目指す。
- BeyondSWEベンチマークにより,現在の最先端モデルでも45%以下の成功率に留まることが示された。
- 単一モデルがすべてのタスクタイプで一貫して高い性能を示すことは難しく,能力の限界が明らかになった。
- 検索機能の統合は必ずしも性能向上に繋がらず,検索と推論の組み合わせの難しさを示唆している。
無限次元生成センシング [math.NA, cs.IT, cs.LG, cs.NA, eess.SP, math.IT, math.PR]目的:ヒルベルト空間における生成圧縮センシングの理論的枠組み
- 逆問題のモデリングにおいて,従来のスパース性に基づく手法を超越する深層生成モデルの重要性が高まっている。
- 既存の理論的保証は有限次元ベクトル空間に限定されており,物理信号をヒルベルト空間上の関数としてモデル化する際の課題となっている。
- ヒルベルト空間における生成圧縮センシングのための厳密な理論的枠組みを確立し,安定な復元を可能にすること。
- 無限次元における局所コヒーレンスの概念を拡張し,最適なサンプリング分布を導出した。
- 制限された等方性特性の一般化により,測定数が事前分布の固有次元に比例する場合に安定した復元が成り立つことを示した。
- 数値実験により,低解像度ジェネレータが暗黙の正則化として機能し,再構成の安定性を向上させることが示された。
局所彩色グラフに対するイェオの定理:線形論理における逐次化への道 [cs.LO]目的:線形論理の証明ネットにおけるダノス・レニエの正当性基準に関連する逐次化証明
- 線形論理は,計算の資源消費を厳密に扱う理論であり,プログラム検証や自然言語処理に応用される。
- 証明ネットから逐次計算導出を効率的に復元する方法が課題であった。
- 証明ネットのグラフ構造を変更せずに逐次性を抽出する新しい手法を確立する。
- イェオの定理をグラフ彩色に基づいて一般化することで,証明ネットから様々な導出を誘導的に復元できることを示した。
- 本研究で開発した「カスプ最小化」という鍵となる補題は,分割頂点の存在を保証し,より少ないカスプを持つサイクルを構築する。
- 既存のグラフ理論的結果を,グラフ構造の変更なしに,専用の彩色を定義するだけで導出できることを示した。
ハイパーグラフにおけるエッジ彩色クラスタリングのための改良された組合せアルゴリズム [cs.DB, cs.OS, cs.DS, cs.SI]目的:ハイパーグラフにおけるエッジ彩色クラスタリング問題に対する近似解
- 複雑なシステムやデータセットの多方向な相互作用をモデル化する手段として重要である。
- NP困難問題であり,大規模データへの適用が難しいことが課題である。
- 既存手法よりも優れた近似率を持つ組合せアルゴリズムを開発し,実用性を高める。
- 本研究では,近似率が2を下回る初の組合せ近似アルゴリズムを提案した。
- 提案手法は,既存の近似アルゴリズムと比較して,より良好な解を得ることが示された。
物理的カウントの計算複雑性 [cs.CC, cs.LO, math-ph, math.CT, math.MP]目的:最適行動を決定するファクタ化された状態空間の座標
- 複雑なシステムにおける意思決定は,膨大な状態空間を効率的に扱う必要性から重要である。
- 状態空間の次元が増大すると,最適な行動を特定するための計算コストが指数関数的に増加する。
- 決定複雑性の尺度を用いて,意思決定に必要な情報量を最小化し,計算効率を向上させる。
- 座標集合が十分であるならば,同一の最適行動を示す状態は等価であると定義した。
- 決定商 Q は,最適な行動を保存する最小の抽象化であり,その一意なファクタ化を確立した。
- 様々な情報理論的・物理的枠組み(Fisher情報,エントロピーなど)が,決定複雑性尺度 srank を独立に導出することを示した。
低次数法はロバストな部分空間回復の予測に失敗する [stat.ML, cs.CC, cs.DS, cs.LG]目的:ロバストな部分空間回復問題における計算可能性の予測
- 高次元データ分析において,計算と統計のギャップを予測する手法の重要性が増している。
- 低次数法が全ての計算問題を正確に予測できるという仮説に対し,反例が存在する可能性が指摘されている。
- 低次数法では予測できない問題に対し,効率的なアルゴリズムの存在を示す。
- 本研究では,多項式時間で解けるが,低次数法では予測できない問題が示された。
- この問題は,よく研究されているロバストな部分空間回復問題の特殊なケースである。
- 反集中特性を利用したアルゴリズムは,低次数法では捉えられない可能性が示唆された。
スパースPCAの組み合わせ的アプローチ:尖ったアイデンティティモデルを超えて [stat.ML, cs.DS, cs.LG, math.OC]目的:高次元統計におけるスパースPCAの組み合わせ的アルゴリズムの成功条件
- 高次元データ分析において,次元削減は重要な課題であり,スパースPCAはその有効な手法の一つである。
- 既存の組み合わせ的スパースPCAアルゴリズムは,尖ったアイデンティティモデルに限定され,汎用性に課題があった。
- 尖ったアイデンティティモデルに依存しない,より汎用的な組み合わせ的スパースPCAアルゴリズムを開発すること。
- 本研究では,標準的な組み合わせ的アルゴリズムが尖ったアイデンティティモデルを超えた場合に失敗する具体的な反例を提示した。
- 新たに提案する組み合わせ的アルゴリズムは,一般化された共分散行列に対しても理論的な収束性を保証する。
- 提案手法は,s^2の多項式個のサンプルとd^2の多項式個の時間でスパース主成分ベクトルを復元可能であることを示した。
凸集合のガウス幅:積分分解,射影,および内測体積の分布を通じて [math.PR, cs.IT, math.IT, math.ST, stat.TH]目的:凸集合 $T$ 上で定義されるカノニカルガウス過程の期待値上限の評価
- 機械学習や統計的推論において,ガウス過程の複雑さを評価する上で重要な概念である。
- 凸集合のガウス幅を効率的に評価する方法が確立されておらず,計算コストが高い場合がある。
- 内測体積に着目し,ガウス幅の新たな分解と上限を導き,計算可能性の向上を目指す。
- ガウス幅の分解として,ガウスの測地射影と局所幅に基づく2つのアプローチを提案した。
- 内測体積とガウス幅の関係をVitaleやMourtadaの先行研究を利用して明らかにした。
- 最悪の場合には,古典的なダドリー積分の局所的な形を復元できることを示した。
離散変調連続変数量子鍵配送:線形量子チャネルにおける確率的振幅整形 [quant-ph, cs.IT, math.IT]目的:線形量子チャネルを用いた連続変数量子鍵配送における,確率的振幅整形と直交振幅変調の組み合わせによる鍵配送レートの向上
- 量子鍵配送は,理論的に安全な通信を実現する技術であり,情報セキュリティの根幹をなす。
- 既存のGG02プロトコルはガウス変調の技術的難易度が高く,実装が困難である。
- GG02プロトコルと同等の性能を,より実装容易な方式で実現することを目指す。
- 提案プロトコルは,GG02プロトコルに匹敵する理論上の性能に近づき,安全性を確保できる。
- 直交振幅変調と確率的整形は,既存の古典通信機器で実現可能であり,実験的な再現性が高い。
- 鍵配送レート,到達距離,ノイズに対する耐性について,GG02プロトコルとの比較分析を行った。
安定化群外のエンタングルメント支援符号 [eess.AS, cs.CL, quant-ph, cs.AR, quant-ph, cs.IT, math.IT]目的:任意の量子符号と消去チャネル符号の関係性
- 量子情報理論における誤り訂正は,量子コンピュータ実現の鍵となる。
- 既存の符号は安定化群に依存することが多く,その枠組みを超えた研究が求められる。
- エンタングルメント支援符号の構成法を拡張し,安定化群外の符号構築を目指す。
- エンタングルメント支援符号は,消去チャネル符号と関連付けられ構築可能である。
- 誤り訂正可能な物理キュービットの集合が,エンタングルメント支援通信の受信側部分を構成する。
- 縮退符号の場合,受信側部分の圧縮が可能だが,ノイズ下では誤り訂正能力が低下する場合がある。
損失バーコード:損失地形における脱出可能性の位相的指標 [cs.CG, cs.LG, cs.AI, cs.IT, math.DS, math.IT]目的:損失地形の位相的構造
- 深層学習の性能向上には,損失地形の理解が不可欠である。
- 損失関数の非凸性と複雑な幾何学的構造が,学習の妨げとなる。
- 損失地形の位相的特徴に基づき,学習過程を解析する。
- 損失バーコードは,ネットワークの深さと幅が増すにつれて減少する傾向が確認された。
- 損失バーコードにおけるミニマムセグメントの長さと,汎化誤差との間に相関関係が認められた。
- 本研究は,様々なネットワーク構造とデータセットで検証された。
- 1
- 2
