arXiv雑要約
プログラム - 2026/05/06 公開
構造を意識したコード生成のための深層グラフ言語融合 [cs.SI, cs.HC, cs.SE]目的:構造を意識したコード生成性能の向上
- ソフトウェア開発の効率化が求められており,AI技術の活用が不可欠である。
- 既存の言語モデルは,コードの構造的特徴を捉えることが苦手である。
- グラフと言語モデルの深層融合により,コード構造の理解を深めることを目指す。
- 提案手法CGFuseは,グラフ由来の表現を言語モデルの中間層に統合する。
- 複数の言語モデルで実験を行い,BLEUとCodeBLEUが最大10-16%,6-11%それぞれ改善された。
- 深層グラフと言語モデルの統合が,より堅牢なAI駆動型ソフトウェア開発に繋がる可能性を示唆する。
iSMC:インタラクティブ認証を備えたBDDベースのモデルチェッカ [cs.NI, cs.LO]目的:インタラクティブ証明システムの理論に基づく自己認証型モデルチェッカ
- ソフトウェアやハードウェアシステムの検証は,その信頼性を確保する上で不可欠である。
- 従来のモデルチェッカは,結果の正当性を保証する機構が不十分な場合がある。
- 結果の正当性を高い確率で保証する,自己認証型モデルチェッカを開発すること。
- iSMCは,BDDベースのモデルチェッカであり,計算木論理(CTL)の任意の性質に対して検証可能である。
- 検証問題の求解後,iSMCは認証手続きを実行し,結果の正確性を高い確率で保証する。
- CouillardらがCAV 2023で発表したインタラクティブ認証付きQBFソルバの技術を拡張・改良し,CTLモデルチェッカに適応させた。
優先遅延を伴うスケジューリングのパラメータ複雑性:シャッフル積と指向性バンド幅 [cs.DS, cs.CC]目的:優先制制約を持つジョブのスケジューリングにおけるパラメータ複雑性
- 組合せ最適化問題の効率的な解法開発に不可欠な分野であり,実用的な応用が広い。
- 既存の問題設定では,パラメータに基づいた計算複雑性が未解決のものが多く残存する。
- シャッフル積と指向性バンド幅問題に対するXNLP完全性の証明を通じて,スケジューリング問題への示唆を得る。
- シャッフル積問題と指向性バンド幅問題がXNLP完全であることが示された。
- 優先制制約のグラフ幅や最大遅延値をパラメータとしたスケジューリング問題への含意が得られた。
- 指向性バンド幅問題において,木構造の場合でもXNLP完全性が確認された。
ハイブリッド・計算集約型HPC環境における非同期人間-AI協調のためのワークフロー指向フレームワーク [cs.CL, cs.DC, cs.AI, cs.HC, cs.SE]目的:ハイブリッドインフラにおける非同期人間-AI協調の実現
- 防衛・安全保障分野では,AIシステムの訓練・展開に人間の関与が不可欠である。
- HPC環境では計算負荷が高く,リソース制約があるため,リアルタイムな人間とのインタラクションは困難である。
- 計算ジョブを停止させずに人間の入力を可能にし,リソースのアイドル状態を防ぐこと。
- 本フレームワークは,HPCクラスター,ローカルマシン,クラウドプラットフォームを含むハイブリッドインフラにおける非同期人間-AI協調を実現する。
- ワークフローは定義されたチェックポイントで人間の入力のために一時停止でき,非ブロッキングな監視が可能となる。
- MareNostrum 5などのシステムでのモデル訓練への応用を通して,移植性,効率性,運用AIワークフローにおける監視の利点が示された。
ASIC暗号通貨マイナーの攻撃対象領域としてのファームウェア配布 [cs.CR, cs.SE]目的:ASIC暗号通貨マイナーのファームウェア配布におけるセキュリティリスクの評価
- 暗号通貨マイニングはブロックチェーン基盤の根幹であり,経済的価値を生み出す重要なプロセスである。
- マイニングデバイスのセキュリティ評価は体系的に行われておらず,脆弱性が放置されている可能性がある。
- ファームウェア配布メカニズム自体が新たな攻撃対象領域となることを明らかにし,脅威低減を目指す。
- 公開されているファームウェアだけで,内部アーキテクチャの復元やセキュリティ弱点の特定が可能であることが示された。
- ファームウェアフィッシングやStratum V1の脆弱性など,大規模攻撃シナリオを現実的に再現できることが明らかになった。
- 実機を用いた検証により,配布されているファームウェアが実際に動作しているソフトウェアを反映しており,攻撃可能性が裏付けられた。
AIアドボケイト:分隊を未来へと変革するための教育経路 [cs.SI, cs.CL, cs.SE, cs.AI]目的:伝統的なソフトウェア開発分隊を,人間と人工知能(AI)の協働を中心としたハイブリッド構造に移行させるための戦略的教育プロセス
- AI技術の進展により,人間の能力とAIの強みを組み合わせた協働が,生産性向上に不可欠となっている。
- AI導入に伴う組織文化や技術的な変革を円滑に進めるための,人材育成が課題となっている。
- AIアドボケイトという役割を通じて,組織全体の変革を促進し,AI活用を成功させるための教育モデルを提示する。
- AIアドボケイトの育成は,組織文化と技術の両面を変革する触媒として機能することが示された。
- ブラジルの技術企業における教育と能力開発プロセスの事例報告を通じて,重要な教訓と課題が明らかになった。
- AIアドボケイトの教育は,AI活用を促進し,組織の競争力を高めるための有効な手段となりうる。
離散BMSチャネルにおけるチャネル偏波の複素解析 [cs.IT, math.IT]目的:有限ブロック長における離散二値入力無記憶出力対称(BMS)チャネルのチャネル偏波
- 通信システムにおいて,信頼性の高い情報伝送は不可欠であり,チャネル符号化が重要な役割を果たす。
- 既存のチャネル偏波の解析は,多くの場合,漸近的な解析に依存しており,有限ブロック長での性能評価が課題であった。
- 複素解析を用いて,有限ブロック長におけるチャネル偏波を厳密に解析し,より効率的な符号化方式の設計に貢献する。
- 本研究では,複素解析的枠組みであるComponent Evolution (CE)を新たに開発し,離散BMSチャネルにおける有限ブロック長でのチャネル偏波を解析した。
- CEを用いることで,チャネル偏波の任意のレベルにおけるBhattacharyyaパラメータの解析的表現を導出し,二値消去チャネル(BEC)と二値対称チャネル(BSC)の特殊性を明らかにした。
- また,BSCビットチャネルに対する新たなチャネル依存性再帰関係を明らかにすることで,より高度なチャネル符号化設計への道を開いた。
KVerus:Rustコードの堅牢かつスケーラブルな形式検証証明生成 [cs.SE, cs.CR]目的:Rustコードに対する形式検証証明の自動生成
- ソフトウェアの信頼性・安全性の確保が重要視される中,形式検証は最高水準の保証を提供する。
- 大規模かつ変化し続けるシステムへの適用が難しく,複雑な依存関係やツールチェインの変化に対応できない。
- LLMの限界を克服し,形式検証の構造的依存性とLLMのセマンティックなコードパターンの乖離を解消する。
- KVerusは,コードメタデータ,補題の意味,ツールチェインの仕様を動的に管理する知識ベースを構築する。
- 単一ファイルベンチマークで80.2%のタスクを検証し,AutoVerus(56.9%)を上回り,Verusの更新に対しても安定性を維持する。
- クロスファイル依存関係を持つリポジトリレベルのベンチマークで51.0%の成功率を達成し,マルチラウンドプロンプティングベースライン(4.5%)を大きく上回る。
実現可能な一般計量損失に対するベイズ整合性 [cs.LG, cs.IT, math.IT, math.ST, stat.TH]目的:一般計量損失における実現可能な設定下での強普遍的ベイズ整合性
- 機械学習理論において,汎化性能の保証は重要な課題であり,特に損失関数が複雑な場合,その解析が困難である。
- 古典的なベイズ整合性の理論は,0-1分類や実数値回帰に限定されており,より一般的な計量損失に対する適用が課題であった。
- あらゆる実現可能なデータ生成分布に対して,リスクがクラス内最良のリスクにほぼ確実に収束する,分布フリーな学習規則の存在条件を確立すること。
- 本研究は,組み合わせ的な障害項である無限の非減少$(\gamma_k)$-リトルストンツリーを用いて,仮説クラスに対する必要十分条件を特定した。
- この結果は,損失関数が実数値であり,かつ計量空間上で定義されるという,より一般的な状況におけるベイズ整合性の理解を深める。
- 古典的なリトルストンツリー構造を拡張することで,計量損失設定下でのベイズ整合性の新たな視点を提供している。
積分布の混合間の総変動距離の計算について [cs.DS, cs.LG, math.PR]目的:積分布の混合間の総変動距離の近似計算
- 確率モデルの類似度評価は,機械学習や統計推論において重要な課題である。
- 高次元における総変動距離の厳密計算は計算コストが高く,現実的な時間内に行えない場合がある。
- 効率的な近似アルゴリズムを開発し,大規模データへの適用を可能にすること。
- 本研究では,$n$次元離散領域における積分布の混合間の総変動距離を近似するランダム化アルゴリズムを提案した。
- 提案アルゴリズムは,$(1\pm \varepsilon)$の乗法誤差内で,時間$\mathrm{poly}((nq)^{k_1+k_2},1/\varepsilon)$で動作する。
- Boolean subcubeの混合に対しては,厳密計算が可能な決定性アルゴリズムを開発し,計算困難性の結果も示した。
非疎な有向グラフにおける到達可能性と最短経路の並列計算:ほぼ線形な作業量と平方根以下の深さ [cs.DS]目的:非疎な有向グラフにおける到達可能性と最短経路の計算
- グラフ理論は,ネットワーク分析や最適化問題など,幅広い分野で基盤となる重要な研究領域である。
- 大規模グラフの並列計算では,計算効率がボトルネックとなり,既存手法では深さが$\sqrt{n}$以上となる場合が多い。
- 密なグラフにおいても効率的な並列計算を実現し,既存手法の深さの壁を超えることを目指す。
- 本研究では,エッジ数$m$が$n^{1+o(1)}$以上である場合,ほぼ線形な作業量と$o(\sqrt{n})$の深さで到達可能性と最短経路を計算する並列アルゴリズムを提案する。
- 特に,エッジ数$m$が$n^2$のオーダーである場合,到達可能性と最短経路の深さはそれぞれ$n^{0.136}$と$n^{0.25+o(1)}$に抑えられる。
- 既存のほぼ線形な作業量の並列アルゴリズムと比較して,深さの点で大幅な改善を実現した。
大規模共通誘導部分グラフに対するオンラインアルゴリズムの最適硬度 [cs.DS, cs.CC, cs.DM, math.CO, math.PR]目的:2つの独立したエルドシュ・レニーランダムグラフにおける大規模共通誘導部分グラフの効率的な探索
- ネットワーク構造解析において,共通部分グラフの検出は重要な課題であり,様々な応用が期待される。
- ランダムグラフにおける共通誘導部分グラフのサイズを正確に決定することは計算困難である。
- オンラインアルゴリズムの限界を明らかにし,計算と最適化のギャップの存在を示す。
- 単純な貪欲法によるオンラインアルゴリズムが,サイズ$(2-o(1)) \log_2 n$ の共通誘導部分グラフを高い確率で発見できる。
- いかなるオンラインアルゴリズムも,サイズ$(2+\varepsilon) \log_2 n$ 以上の共通誘導部分グラフを,ある確率で発見できない。
- この結果は,問題が計算と最適化のギャップを示す証拠となる。
データリフティングから継続的リスク推定へ:臨床経路の予測モニタリングのためのプロセス認識パイプライン [cs.LG, cs.SE]目的:臨床経路の予測モニタリングのためのプロセス認識パイプライン
- 医療の質向上には,臨床経路の効率的なモニタリングと早期のリスク予測が不可欠である。
- 従来のプロセスマイニングは,過去のデータに依存するため,リアルタイムなリスク評価が困難である。
- 患者の状態変化を継続的に捉え,早期にリスクを推定する手法の開発が求められている。
- データリフティング,時間的再構成,イベントログ構築,および予測モデリングを統合したパイプラインを開発した。
- COVID-19の臨床経路を用いた評価では,ICU入室予測において高い性能(AUC 0.906,F1スコア 0.835)を示した。
- 臨床イベントの進行に伴い予測性能が向上し,早期段階のAUC 0.642から後期段階の0.942へと増加した。
線形サイズ-高さ増加の木変換器(および線形論理の加法結合) [cs.FL, cs.LO]目的:線形サイズ-高さ増加関数クラスの性質と特徴付け
- 文字列処理やデータ構造の変換において,効率的な変換規則のモデルが必要である。
- 既存の木変換器モデルでは表現力に限界があり,より高機能なモデルが求められていた。
- 線形サイズ-高さ増加関数クラスを明確化し,その機能を理論的に理解することを目的とする。
- 木変換器のクラスが線形サイズ-高さ増加マクロ木変換器とMSO集合解釈の中間に位置することが示された。
- このクラスが線形サイズのMTTとの事前結合,線形高さのMTTとの事後結合に関して閉じていることが証明された。
- 線形型を持つラムダ計算を用いた代替的な特徴付けが提示され,加法タプルが重要な役割を果たすことが示された。
ルールを超えて:LLMを活用した量子プログラムのリンティング [cs.SE]目的:量子プログラムにおける問題検出の改善
- 量子計算が理論的実験から実用段階に移るにつれ,ソフトウェアの信頼性が重要になっている。
- 既存のルールベースリンターは,APIの急速な進化に対応できず,複雑な問題を捉えられない。
- LLMを用いて,量子プログラムの問題検出能力を向上させることを目指す。
- LLMベースのアプローチ(CoTプロンプティングとRAG)は,従来のLintQよりも量子プログラムの問題検出の正確性と網羅性で優れている。
- F1スコアはそれぞれ0.70と0.68であり,LintQの0.41を上回る結果となった。
- RAGを活用した変種は,偽陽性を効果的に削減し,わずかに高い精度を示した。
MOSAIC-Bench:コーディングエージェントにおける構成的な脆弱性誘発の測定 [cs.CR, cs.AI, cs.SE]目的:コーディングエージェントにおける構成的な脆弱性誘発の評価
- ソフトウェア開発において,セキュリティは不可欠であり,自動化されたコーディング支援ツールの安全性評価が重要である。
- 既存の安全性評価は単一のプロンプトに対して行われることが多く,一連の指示による悪意のある最終状態を見抜けない。
- 本研究は,複数の段階にわたるプロンプト列に対する脆弱性誘発の可能性を評価し,そのメカニズムを解明する。
- MOSAIC-Benchは,悪意のある目的を無害な一連の指示に変換したベンチマークであり,実際のソフトウェア基盤上で脆弱性を検証する。
- 評価の結果,主要なコーディングエージェントは,段階的な指示に対して53〜86%の確率で脆弱性のあるコードを生成し,レビュー段階での検知率は低い。
- レビュー担当者を攻撃者として捉えることで,脆弱性回避率を低下させることができ,オープンウェイトモデルを用いた場合,88.4%の攻撃を検知可能であった。
複雑なソフトウェアのセキュリティ強化に役立つ脆弱性PoVテストの生成 [cs.CR, cs.SE]目的:ソフトウェアサプライチェーン攻撃に対するアプリケーションの脆弱性評価
- 現代のソフトウェア開発は,第三者ライブラリに依存しており,そのセキュリティは重要である。
- ライブラリの脆弱性がアプリケーションを通じて悪用される可能性があり,具体的な検証が課題である。
- 脆弱性の実証(PoV)テストを自動生成し,脆弱性のリスク評価を効率化することを目指す。
- PoVSmithは,呼び出し経路分析とLLMを活用し,PoVテストの生成,実行,評価を自動化する。
- 33組のJavaアプリケーション・ライブラリペアにおいて,96%の脆弱なAPI呼び出し経路を正確に特定した。
- 生成されたテストの55%が,ライブラリの脆弱性を悪用したアプリケーション攻撃を実証することに成功した。
量子プログラムテストのためのランダムで多様な入力状態生成 [cs.SE]目的:量子プログラムテストにおける入力状態の網羅性向上
- 量子技術の発展に伴い,信頼性確保が重要課題となっている
- 量子状態空間の構造が複雑で,十分なテストが困難である
- 量子状態空間の網羅的な探索を可能にするテスト生成手法の開発
- 提案手法は,状態空間の探索範囲を示す多様性指標を新たに定義した
- ハードウェア互換ゲートを用いたBrick-Circuit (BC) 構成に基づくテスト回路生成器を提案した
- BC生成器は,既存の生成器と比較して,より高い表現性とエンタングルメント性能を示した
マトロイド基底の$\widetilde{O} (n^{3/7})$ラウンド並列アルゴリズム [cs.DS, cs.CC]目的:マトロイド基底探索の並列計算複雑性
- 組合せ最適化の分野において,効率的な基底探索は基本的な問題である。
- 既存手法では,並列ラウンド数に大きな開きがあり,改善が求められていた。
- より少ない並列ラウンド数でマトロイド基底を探索するアルゴリズムを開発する。
- 本研究では,マトロイド基底を$\widetilde{O} (n^{3/7})$ラウンドで探索する新しいアルゴリズムを提案した。
- このアルゴリズムは,ランダム回路の依存性の解析に新たな視点をもたらし,KUWやKPSの既存研究をさらに発展させた。
- 並列計算におけるマトロイド基底探索の効率を大幅に向上させる成果となった。
ピギーバッキング符号における修理帯域幅削減のためのピギーバック関数と共役変換の同時設計 [cs.IT, math.IT]目的:ピギーバッキング符号における修理帯域幅削減のための新たな手法の提案
- 分散ストレージシステムにおいて,ノードの効率的な復旧は重要な課題である。特に,高レート消去符号では,修理トラフィックがネットワーク負荷と復旧コストに直接影響する。
- 既存のピギーバッキング符号は,MDS特性を維持するために制限的なピギーバック関数設計に依存しており,修理帯域幅の削減が制限されている。
- 小規模なサブパケット化を維持しつつ,ピギーバック関数と共役変換を同時設計することで,修理効率を向上させることを目指す。
- 提案手法は,既存のピギーバッキング符号と比較して,全体的な修理帯域幅を削減し,一部のパリティノードで最適な修理帯域幅を実現する。
- $\mathbb{F}_{2^8}$ 上での高符号レート設定下において,提案手法と既存のピギーバッキング符号を比較評価した結果,修理帯域幅の点で優れていることが示された。
- 単一ノード故障を想定した修理トラフィックシミュレーションにより,提案手法が従来のRS修理と比較して,期待される修理トラフィックを削減することが確認された。
Rustプログラムの静的メモリ安全性解析における誤検出の緩和:強化学習によるアプローチ [cs.SE]目的:Rustプログラムの静的メモリ安全性解析における誤検出の分類と抑制
- Rustは安全性重視の分野で利用が増加しており,メモリ安全性の保証は不可欠である。
- 既存の静的解析ツールは誤検出率が高く,開発者の信頼を損ない,手動レビューの負担を増大させる。
- 本研究は,強化学習を用いて誤検出を効果的に削減し,実用的なメモリ安全性検証ツールを開発する。
- 提案手法は,最先端のLLMベースラインを大幅に上回り,65.2%の精度と0.659のF1スコアを達成した。
- 本手法は,真のバグの約75%を特定しつつ,誤検出を大幅に削減し,Rudraの出力における精度を25.6%から59.0%に向上させた。
- 動的ファジングを組み込むことで,精度がさらに10.7%,F1スコアが8.6%向上し,性能が向上した。
イジング合意仮定を用いたSATソルビングのための確率ビット誘導CDCL [cs.HC, cs.CR, cs.LO]目的:SATソルビングにおける探索効率の向上
- ハードウェア検証など広範な分野で利用され,その性能が重要視されている。
- 充足可能なインスタンスにおいて,探索空間の生産的な領域を特定するまでに時間がかかる場合がある。
- 確率的サンプリングによる誘導でCDCLの探索努力を削減し,効率的なソルビングを実現すること。
- 提案手法は,制御されたバックボーンランダム3-SATベンチマークにおいて,CDCLのみと比較して中央値の競合を80.8-85.5%削減した。
- また,中央値の伝播回数を80.2-84.6%削減することに成功した。
- 機械学習ゲートの導入により,ハイブリッドソルビングの有効性を予測し,無駄な呼び出しを回避できる可能性が示された。
汎用二輪コードに対するエッジベース異方性復号 [quant-ph, cs.IT, math.IT]目的:汎用二輪コードの復号性能向上
- 量子誤り訂正符号は,量子情報の信頼性確保に不可欠であり,その性能向上は量子コンピュータ実現への鍵となる。
- 従来の復号手法では,符号の持つ距離情報を十分に活用できず,性能限界が存在する。
- 二輪コードの対称性を解消し,距離情報を効果的に活用する復号手法を開発することで,性能向上を目指す。
- エッジ彩色を用いることで,低次元安定化サブグラフ内のすべての対称性を除去できることが示された。
- エッジ異方性min-sum復号は,等方性およびブロック異方性復号よりも優れた性能を発揮することが実験的に確認された。
- 本研究で提案する手法は,比較的少ない反復回数で性能改善を実現する。
コードコミットダイナミクスにおける長距離相関:ソフトウェア製品の安定性を示す新たな指標 - Detrended Fluctuation Analysis 研究 [physics.soc-ph, cs.SE]目的:ソフトウェア製品の安定性に関するプロセスレベルの指標
- ソフトウェアの品質と信頼性は,開発プロセス全体に影響を与える重要な要素である。
- ソフトウェアの安定性を定量的に評価する有効な指標が不足している。
- コードコミットの長期的な相関性を分析することで,安定性の評価を目指す。
- Detrended Fluctuation Analysis (DFA) を適用した結果,安定期間のalpha値は0.70,不安定期間は0.57であった。
- 不安定期間は安定期間よりもコミットイベント数が3.2倍多いにも関わらず,長期記憶が低かった。
- コミット数だけでは安定性を予測できず,開発活動の時系列的な組織化が重要であることが示された。
離散分布の関数に対する量子マルチレベル推定 [quant-ph, cs.CC, cs.DS, cs.IT, math.IT]目的:離散分布の関数$\sum_{i=1}^n f(p_i)$の推定
- 情報理論において,確率分布の特性を捉えることは重要であり,エントロピーはその代表である。
- 古典計算では,高精度なエントロピー推定には計算コストがかかる場合がある。
- 量子計算を利用し,エントロピー推定の効率化と精度向上を目指す。
- 本研究では,離散分布の関数を量子的に推定するマルチレベル推定フレームワークを提案した。
- q-Tsallisエントロピーに対し,既存手法よりも優れたクエリ複雑度を持つ効率的な量子推定アルゴリズムを開発した(q>1の場合)。
- 0 < q < 1の場合には,古典的な最良推定アルゴリズムに対する量子速度向上を実現した。
ポテンシャルヘシアン上昇法III:β < 1/2におけるSherrington-Kirkpatrickモデルのサンプリング [math.PR, cs.DS, math-ph, math.MP]目的:Sherrington-Kirkpatrickモデルのギブス測度からのサンプリング
- スピンガラスの研究は,複雑系の理解に不可欠であり,物理学,情報科学に応用されている。
- 従来のサンプリング手法では,高温領域(β < 1)での精度に限界があった。
- 本研究は,より広範な高温領域(β < 1/2)で高精度なサンプリングを可能にする。
- 提案手法は,Sherrington-Kirkpatrickモデルのギブス測度から,無視できる全変動距離誤差でサンプリングできることを示した。
- 本研究は,最適化手法として開発されたポテンシャルヘシアン上昇法が,サンプリングアルゴリズムとしても機能することを示した。
- ガウス積分,オーバーラップ集中,正確なキャビティ推定により,ヘシアン上昇法のウォーターシュタイン誤差保証を改善し,KLダイバージェンスにおいても$O(1)$を達成した。
鍵付き多視点ゲーティングによる決定論的疎FFT:O(√N log k)の期待時間 [eess.SP, cs.DS, cs.IT, math.IT]目的:疎な周波数配置下における高速フーリエ変換の効率的な計算手法
- ビッグデータ解析や信号処理において,高速フーリエ変換は重要な役割を担う。
- 従来の疎FFTは,ランダムなバケツ化に依存するため,計算の安定性や確実性に課題があった。
- 決定論的な候補削減と,最悪の場合の安全性保証を両立する疎FFTフレームワークを構築すること。
- 提案手法は,2進法の中国剰余定理を活用し,候補となる周波数ペアを効率的に削減する。
- 再帰的な自己還元により,前処理のボトルネックを解消し,期待計算時間をO(√N log k)に短縮した。
- Parsevalのエネルギー整合性と,ビンごとの残差チェックを組み合わせることで,誤検出を抑制する検証フレームワークを確立した。
ハイブリッド多者セッション型 [cs.PL]目的:分散メッセージパッシングシステムにおける通信プロトコルのモジュール化仕様
- 分散システムの開発において,プロトコルの正確性は信頼性の基礎となる。
- 従来のモジュール化手法では,部分プロトコルの組み合わせが困難であった。
- 複数のコンポーネントからなるプロトコルを,安全に組み合わせる手法を確立する。
- ハイブリッド型を導入し,部分プロトコル間の相互作用を記述可能にした。
- 複数の部分プロトコルを,意味を保ちつつ,全体プロトコルに合成するアルゴリズムを定義した。
- この構成法が,活性性とデッドロックフリーなどのセマンティックな保証を維持することを証明した。
プロトコル解析における知識問題:部分項収束の概念の拡張 [cs.LO]目的:プロトコル解析における知識問題の決定可能性
- 情報セキュリティ確保のため,プロトコルの安全性検証は重要である。
- 既存の項書き換えシステムでは,安全性検証の適用範囲が限られている。
- グラフ埋め込み項書き換えシステムを導入し,決定可能性を拡張する。
- グラフ埋め込み収束システムの一種である縮約収束システムにおいて,知識問題が決定可能であることが示された。
- グラフ埋め込みシステム全体としては,知識問題が決定不能であることが示された。
- 複数の縮約収束システムの組み合わせや,特定の置換等式理論との組み合わせに関する結果が得られた。
部分的な情報を用いた高速かつ単純なソート [cs.DS]目的:既存の比較結果に基づいたソート処理
- データ処理の効率化は,大規模データ分析や情報検索において不可欠である。
- 既存の比較結果を有効活用した効率的なソート手法が課題であった。
- 既存の比較結果を最大限に活用し,高速かつ単純なソートアルゴリズムを開発する。
- 本研究では,既存の$m$回の比較結果に基づき,$O(m + \log T)$時間,および$O(\log T)$回の比較でソートを行う決定性アルゴリズムを提案した。
- 提案アルゴリズムは,既存のアルゴリズムと比較して,時間計算量と比較回数の両面で優れている。
- また,上位$k$要素のソート問題にも適用可能であり,同様に効率的な解法を提供する。
異種エッジデバイスにおける深層学習物体検出モデルの包括的評価 [cs.CV, cs.AR, cs.DC, cs.LG, cs.SE]目的:深層学習物体検出モデルの性能評価
- 自動運転やスマートシティなど,エッジデバイスでの物体検出の需要が急速に高まっている。
- 異種エッジデバイス間でのモデルの挙動や,シーンの複雑さによる性能変化が十分に理解されていない。
- 様々なデバイスとシーンにおけるモデルの性能トレードオフを明らかにすること。
- YOLOv8 Mediumが最も高い精度を達成したが,計算コストも高い。
- SSD MobileNet V1は,最も低いレイテンシと消費電力を示した一方で,精度は低い。
- TPU搭載のRaspberry Piは,SSDとEfficientDet Liteの効率を向上させたが,YOLOv8の精度は低下した。
大規模言語モデル支援ハイブリッドファジング [cs.SE, cs.CR]目的:ソフトウェア脆弱性検出の効率向上
- ソフトウェアの安全性確保は重要であり,脆弱性検出技術の進歩が求められている。
- 従来のファジング手法では,網羅的な探索が難しく,脆弱性の見落としが生じやすい。
- 大規模言語モデルを活用し,ファジングの探索能力を向上させ,より多くの脆弱性を発見する。
- 提案手法HyllFuzzは,最先端のハイブリッドファザーCoFuzz,Intriguer,QSYMと比較して,それぞれ31.43%,44.56%,59.48%多くのコードブランチをカバーした。
- HyllFuzzにおける大規模言語モデルを用いた記号実行は,既存のハイブリッドファジングツールと比較して,3~19倍高速に動作した。
- 実世界のプログラムに対して,HyllFuzzは7つの未知のバグを発見し,大規模言語モデルの有効性を示した。
生成事前分布を用いた効率的な最適化:粗い学習可能性によるアプローチ [cs.HC, cs.LG, cs.DS, stat.ML]目的:生成事前分布に基づいた最適化におけるサンプル効率の向上
- 複雑なモデルや分布を扱う最適化問題において,効率的な探索が重要となる。
- 従来のモデルベース最適化は,複雑な事前分布に対する有限サンプル保証が不足している。
- 粗い学習可能性の概念を用いて,限られたサンプル数で目的分布を近似する。
- 提案手法は,粗い学習可能性という統計的仮定に基づき,多項式個数のサンプルで目的分布を近似する反復モデルベース最適化アルゴリズムを設計した。
- 二次被包を持つ非凸目的関数の最適化において,提案手法は$\widetilde{O}(\log 1/\varepsilon)$のサンプル複雑度を達成し,楽観的な空間分割法と同等の性能を示す。
- 粗い学習可能性は,単純な設定において,最尤推定や過剰平滑化カーネル密度推定が自然に満たすことが理論的に示された。
次数列に基づく時間連結グラフの実現 [cs.DS]目的:次数列の時間連結グラフとしての実現可能性
- グラフ理論は,ネットワーク構造の分析に不可欠であり,様々な応用分野で利用されている。
- 時間連結グラフの判定問題はNP困難であり,効率的な実現方法が課題であった。
- 与えられた次数列から時間連結グラフを構成するアルゴリズムを開発し,実現可能性を判定する。
- 次数列が時間連結グラフとして実現可能であるための完全な特徴付けを得た。
- グラフ的な次数列に対してはO(n)時間,マルチグラフ的な次数列に対してはO(n+m)時間の認識アルゴリズムを開発した。
- アルゴリズムは,実現可能な場合は時間連結グラフを構成可能である。
ゲーム,モバイルプロセス,関数 -- 代替,並行,および適切に括弧化された意味論 [cs.LO]目的:ラムダ計算の2つのモデル間の密接な関係の確立
- 計算モデルの理論的基盤を深めることは,プログラムの振る舞いを正確に理解する上で重要である。
- 異なる計算モデル間の等価性や変換の検証は,複雑で困難な課題である。
- ラムダ計算とπ計算,ゲーム意味論の間の関係を明確にし,技術を相互に転移すること。
- π計算とゲーム意味論の振る舞いに関する操作的な対応関係が,様々なLTSにおいて確認された。
- 様々なLTSによって誘導されるラムダ項に対する同値関係は一致することが示された。
- π計算からゲーム意味論へのup-to技術の導入,および完全トレースの概念の輸送が実現された。
驚くべき反転とそれらを見つける場所:分割問題に対するパラメータ化局所探索の一般的な枠組み [cs.DS, cs.CC]目的:分割問題に対するパラメータ化局所探索の一般的な枠組み
- 局所探索は,組み合わせ最適化問題において広く用いられ,実用的な解を得る手法である。
- パラメータ化局所探索における探索半径$k$と計算時間のトレードオフが未解明である。
- 様々な分割問題に対して適用可能な枠組みを提示し,計算時間の上界を確立すること。
- 提案枠組みは,クラスタ編集,ベクトルビンパッキング,ナッシュ社会厚生などの問題に適用可能である。
- 問題のタイプ数$\tau$を導入し,計算時間を$\tau^k 2^{O(k)} |I|^{O(1)}$とすることで,効率的な解法を実現した。
- 提案アルゴリズムを大幅に改善するアルゴリズムは,ETHと矛盾することが示された。
ヴィジングの平面グラフエッジ彩色定理を$O(n\log n)$時間で [cs.DS]目的:平面グラフのエッジ彩色アルゴリズム
- グラフ理論は,ネットワークやスケジューリングなど,様々な応用分野の基礎となる重要な研究分野である。
- ヴィジングの定理はエッジ彩色に関するもので,効率的なアルゴリズムの構築が課題であった。
- 最大次数が8の平面グラフに対しても,$O(n\log n)$時間でエッジ彩色を行うアルゴリズムを開発する。
- ヴィジングのオリジナルの再彩色手続きを修正することで,最大次数が8の平面グラフに対するアルゴリズムを得た。
- このアルゴリズムは,ChrobakとNishizekiの研究を拡張し,より広い範囲のグラフに適用可能である。
- また,この手法は有界属グラフにも一般化できることが示された。
巨大な近似低ランク行列の主要な固有ベクトルの高速ワンパス疎近似?もちろんだ,$MAM^*$! [cs.DB, cs.IT, cs.DS, cs.NA, math.IT, math.NA]目的:巨大な近似低ランク行列の主要な固有ベクトルの疎近似
- 大規模データ分析において,データの次元削減は計算効率と情報保持のバランスが重要となる。
- 既存手法では,巨大行列の全情報をメモリに格納する必要があり,計算コストが高い。
- メモリ使用量を抑えつつ,大規模行列の主要な固有ベクトルを効率的に近似すること。
- 本研究では,コンパクトな線形スケッチを用いたワンパスアルゴリズムを提案し,理論的な精度を保証した。
- 提案手法は,巨大行列をメモリに格納することなく,求められる疎な固有ベクトル近似のサイズに依存する時間で実行可能である。
- 約10の16乗個のエントリを持つ巨大行列に対する実験により,提案手法の実用的な可能性が示された。
格子簡約はベクトル摂動プリコーディングに必要か [cs.RO, cs.IT, math.IT]目的:ベクトル摂動プリコーディングにおける格子簡約の有効性に関する検討
- 変調符号化方式において,通信速度向上と信頼性確保が重要課題である
- 非線形プリコーディング技術は複雑であり,計算量の削減が求められる
- 相互情報量を評価指標とした際の,格子簡約の効果を明らかにすること
- 相互情報量に着目すると,特定の構造を持つ格子問題において格子簡約は効果がないことが示された
- 一部のアルゴリズムは格子簡約から利益を得る可能性があるものの,既存の結果とは異なる結果が得られた
- Lenstra-Lenstra-Lovász (LLL) 法はTomlinson-Harashima precoding (THP)よりも優位性を示さないことが示唆された
ReCode:推論過程報酬によるコード生成の強化 [cs.SE, cs.AI, cs.CL, cs.LG]目的:コード生成における推論品質の最適化
- 正確なコード生成において,厳密な推論が重要な役割を果たすことが知られている。
- コード生成のための強化学習では,推論品質の最適化が十分に行われていない現状がある。
- 推論過程の質を評価する報酬モデルの学習と,報酬ハッキングの軽減を目指す。
- ReCodeは,最適化・劣化された推論過程を合成的に生成し,推論品質を評価する報酬モデルを学習するCRPLと,実行結果で報酬を制限するCG-GRPOで構成される。
- 実験結果から,ReCodeで学習した7Bモデルはベースモデルより16.1%性能が向上し,GPT-4-Turboと同等の性能に達したことが示された。
- ReCodeは数学ドメインにも一般化可能であり,コード生成以外の分野への応用も期待される。
課題とコミットの関連回復のための自律型LLMベースエージェント LinkAnchor [cs.SE, cs.AI]目的:ソフトウェアリポジトリにおける課題とコミットの関連回復
- ソフトウェアのトレーサビリティとプロジェクト管理において,課題とコミットの関連付けは不可欠である。
- GitHub上の課題の約42.2%しかコミットと正しく関連付けられていない現状がある。
- 文脈を考慮した効率的な関連回復手法を開発し,課題解決の論理を正確に捉えることを目指す。
- 本研究では,課題とコミットの関連回復に特化した自律型LLMベースエージェントLinkAnchorを提案する。
- LinkAnchorは,関連するコンテキストデータを動的に取得するlazy-accessアーキテクチャにより,トークン制限を超えることなく,大規模なリポジトリでも効率的に処理を行う。
- 課題解決の連鎖的な依存関係を考慮することで,既存手法の課題を克服し,より正確な関連回復を実現する。
完全な真実性を持つ較正指標 [cs.LG, cs.DS, stat.ML]目的:較正指標の設計
- 予測の信頼性を評価する上で重要。確率として解釈できるかどうかが鍵となる。
- 既存の較正指標は,真実を歪めてより較正されたように見せることがある。
- 真実を反映し,完全な較正指標を設計すること。
- 平均二値較正誤差(ATB)という,完全かつ厳密な真実性を持つ較正指標を提案した。
- ATBは既存の指標smCalやdistCalと密接な関係があり,計算効率が良い。
- 線形時間で較正をテストするアルゴリズムを初めて開発した。
固定パラメータ時間で解ける線形化可能性監視 [cs.PL, cs.CC]目的:データ構造の同時実行履歴の線形化可能性の検証
- 並行処理システムの信頼性確保は重要であり,データ構造の整合性検証が不可欠である。
- 一般的な線形化可能性監視問題はNP困難であり,効率的なアルゴリズムが存在しない。
- プロセス数をパラメータとした線形化可能性監視の固定パラメータ時間アルゴリズムを開発する。
- スタック,キュー,優先度付きキュー,マップなど広範なデータ構造に対して,線形化可能性監視がプロセス数の固定パラメータ時間で解けることを示した。
- 線形化可能性監視をグラフ上の言語到達可能性問題に帰着させ,効率的な解法を提示した。
- 実装による実験で,既存アルゴリズムと比較して大幅な実行時間改善が確認された。
スパース近傍グラフに基づく近似最近傍探索の再検討:理論的解析と最適化 [cs.DS]目的:近似最近傍探索におけるスパース近傍グラフの解析と最適化
- 大規模ベクトルの高速検索は,機械学習や情報検索において不可欠である。
- スパース近傍グラフの性能はパラメータ設定に大きく依存し,最適な設定を見つけるのが困難である。
- グラフ構築過程の理論モデルに基づき,最適なパラメータ設定を導くことを目指す。
- 提案手法OPT-SNGは,スパース近傍グラフの最大外次数と探索パス長に関する理論的限界を証明した。
- OPT-SNGは,パラメータチューニングにかかる時間を大幅に削減する閉形式のパラメータ選択規則を導出した。
- 実データ実験により,OPT-SNGがインデックス構築時間を平均5.9倍高速化し,検索性能を維持・向上させることを実証した。
リアルタイム構文強調表示のための多言語モデル [cs.SE, cs.AI]目的:多言語のコードに対するリアルタイム構文強調表示の実現
- 現代のソフトウェア開発において,可読性と生産性を向上させる構文強調表示は不可欠である。
- オンライン環境では,時間・メモリ制約から高速かつ正確な構文強調表示が課題となっている。
- 単一言語モデルの維持コストを削減し,多様な言語への対応を効率化することを目的とする。
- 単一のモデルで最大6つの主要なプログラミング言語に対応することで,システム複雑性を低減した。
- 新規の正規化手法によりモデルの汎化性能が向上し,未知の言語に対する性能も改善された。
- 少数の正解サンプルで大規模なデータセットを代替し,遅い生成器への依存を最小限に抑えた。
自然言語推論のためのハイブリッドモデル:三段論理の場合 [cs.CL, cs.LG, cs.LO]目的:三段論理を用いた自然言語推論能力の論理的汎化
- 論理的推論は,応用において不可欠な汎化能力を評価する上で重要な研究分野である。
- ニューラルモデルは汎化能力に課題があり,特に複雑な推論においてその傾向が顕著である。
- ニューラル推論システムの汎化能力の障壁を克服し,信頼性の高い論理的推論器を構築すること。
- 大規模言語モデル(LLM)は再帰性においてはある程度の能力を示すものの,構成性においては苦戦していることが判明した。
- 三段論理の種類によって汎化性能に大きなばらつきが見られ,完璧に近い精度から著しく低い精度まで幅広い結果が得られた。
- 記号推論とニューラル計算を統合したハイブリッドアーキテクチャが,堅牢かつ効率的な推論を可能にし,ニューラル推論の汎化能力の向上に貢献する。
BITを忘れ,TOKENの全て:LLMのための意味情報理論へ [cs.IT, cs.AI, math.IT]目的:大規模言語モデル(LLM)の生成メカニズムと創発的因果能力の解明
- LLMは様々な応用で目覚ましい成果を上げているが,理論的基盤は未だ不十分である。
- LLM研究は,計算資源と大量データに依存しており,原理的な理解が欠けている。
- 意味情報理論を構築し,LLMの理論的理解を深め,次世代アーキテクチャの指針を提供する。
- 従来の「ビット」概念を超え,「トークン」を意味の最小単位として捉える新たな理論的枠組みを構築した。
- 統計物理学,連続信号処理,古典情報理論を統合し,LLMの生成メカニズムを数学的に解明した。
- この理論的基盤は,LLMの将来研究とアーキテクチャ開発を導く強固な足場となる。
直観主義多様式論理のためのネスト化されたセクエント:モジュール性,カット除去,および決定不能性 [cs.LO, math.LO]目的:直観主義文法論理(IGL)と呼ばれる広範なクラスに対する単一結論のネスト化されたセクエント計算
- 古典論理の直観主義的な拡張として,様々な論理体系の基礎となる重要な研究分野である。
- 既存の論理体系では,モジュール性やカット除去の証明が体系的に困難であった。
- IGLにおけるカット除去の統一的な証明と,古典文法論理との関係を明らかにすること。
- ネスト化されたセクエント計算において,シフト規則という新たな構造規則を導入し,カット除去の証明を可能にした。
- 古典文法論理(CGL)をIGLに忠実に埋め込む負の翻訳を定義し,その間の証明変換を確立した。
- CGLの一般妥当性問題の決定不能性がIGLにも適用されることを示した。
独立情報源におけるマルコフチャネル上の経験的協調 [cs.IT, math.IT]目的:マルコフチャネルにおける経験的協調フレームワークを通じた共同ソースチャネル符号化
- 通信システムにおいて,信頼性と効率的な情報伝送は不可欠であるため。
- マルコフチャネルは状態依存性を持つため,古典的な符号化手法では最適性能が得られない場合がある。
- マルコフチャネル構造を活かした新たな符号化手法を開発し,達成可能な共同分布の範囲を明確にすること。
- 経験的協調フレームワークに基づき,達成可能な共同分布の上界と下界を導出した。
- 入力駆動型マルコフ典型性という新たな典型性の概念を導入し,その性質を明らかにした。
- ブロック独立性を仮定する古典的な手法を超え,マルコフチャネル構造を直接活用した解析を行った。
RubberDuckBench:AIコーディング支援ツールのベンチマーク [cs.SE]目的:AIコーディング支援ツールの性能評価
- ソフトウェア開発において,AI支援は生産性向上に不可欠であり,その評価手法が重要である。
- 既存の評価指標では,AI支援ツールの実際の有用性を十分に測ることが難しい。
- AI支援ツールの信頼性と正確性を検証するためのベンチマークの提供。
- RubberDuckBenchは,GitHubのプルリクエストコメントから抽出した現実的な質問群で構成される。
- 20のLLMを評価した結果,最先端モデルであっても一貫した正確な回答が得られないことが示された。
- API費用やパラメータ数と性能の間には相関関係が見られず,誤った情報を生成する割合が高いことがわかった。
