arXiv雑要約
プログラム - 2026/05/12 公開
Unitaria:ブロック符号化による量子線形代数 [quant-ph, cs.ET, cs.NA, cs.SE, math.NA]目的:ブロック符号化に基づく量子アルゴリズムの実装の簡素化
- 量子計算は,従来の計算機では困難な問題を解決する可能性を秘めており,多くの分野で重要性が増している。
- ブロック符号化の実装には,低レベルの回路構築に関する深い知識が必要であり,参入障壁となっていた。
- Unitariaは,そのような知識なしに量子線形代数アルゴリズムを開発,検証,分析することを可能にする。
- Unitariaは,NumPyやSciPyのような古典線形代数ツールキットの使いやすさを,ブロック符号化に基づく量子アルゴリズム実装にもたらすPythonライブラリである。
- 本ライブラリは,行列やベクトルを符号化し,加算,乗算,テンソル積などの標準演算を組み合わせ,量子回路を自動的に抽出するインターフェースを提供する。
- 符号化されたベクトルと行列に対する直接演算,および古典シミュレーションとリソース推定の効率化を実現する。
確率的ブロックモデルにおけるモジュール性のオーバーラップグラフ特性 [math.PR, cs.CC, cs.DS, math.CO, math.ST, stat.TH]目的:確率的ブロックモデルにおけるモジュール性のオーバーラップギャップ特性の存在
- グラフ構造解析は,社会ネットワーク,生物学,情報科学など,多様な分野で不可欠である。
- モジュール性に基づくクラスタリングは広く用いられるが,その理論的な限界は未だ明確ではない。
- 本研究は,確率的ブロックモデルにおけるモジュール性の理論的限界を明らかにすることを目的とする。
- 確率的ブロックモデルにおいて,モジュール性がオーバーラップギャップ特性を示すことを証明した。
- この結果は,モジュール性に基づく局所探索アルゴリズムの性能限界を示唆する。
- また,最適なパーティションが真のパーティションから少ないステップで到達可能であることを示した。
三次元における受動的自己補正量子メモリ [quant-ph, cond-mat.str-el, cs.IT, math-ph, math.IT, math.MG, math.MP]目的:三次元量子メモリの実現
- 量子コンピュータ実現の鍵は,長時間安定な量子ビットの保持技術にある。
- 熱ノイズ等の影響により,量子ビットのコヒーレンス時間が極めて短い。
- 熱浴と結合しても量子ビットを長時間保持するメモリの構築を試みる。
- 三次元のパウリ安定化ハミルトニアンを構築し,有限温度下でも指数関数的に長い時間,量子ビットを符号化可能であることを示した。
- 種ハミルトニアンに変換を再帰的に適用することで,符号化された量子ビットのメモリ寿命を向上させつつ,三次元空間における局所性を維持する。
情報理論的プライバシーと一般化された歪み制約 [cs.IT, math.IT]目的:プライバシー保護メカニズムの最適化
- データ利用におけるプライバシー保護は重要であり,情報漏洩リスクを最小化する必要がある。
- プライバシー保護とデータ有用性の両立が困難であり,トレードオフの関係が課題である。
- 歪み制約下での情報漏洩量を評価し,最適なプライバシー保護メカニズムを設計する。
- 歪みコスト制約下では,凸コスト関数において定常マルコフメカニズムを使用しても漸近的な損失はないことが示された。
- 歪みの累積分布関数の上限制約下では,一般的なメカニズムに対する漸近的な情報漏洩量が導出された。
- 両方のシナリオにおいて,記憶のないメカニズムは一般的に最適ではないことが示された。
視覚的プッシュダウン言語の$\mathsf{AC}^0$-複雑性 [cs.FL, cs.CC, cs.LO]目的:視覚的プッシュダウン言語が$\mathsf{AC}^0$に属するかどうかの判定
- 計算複雑性理論において,言語の効率的な処理可能性を評価する上で重要である。
- $\mathsf{AC}^0$への包含判定は一般に困難であり,特定の言語クラスに対する効率的な判定方法が求められている。
- 新たな中間VPLクラスを導入し,その$\mathsf{AC}^0$への包含を判定するアルゴリズムを開発することで,この問題に取り組む。
- 視覚的プッシュダウンオートマトンが与えられたとき,その言語が$\mathsf{AC}^0$に属するか,$\mathsf{ACC}^0(m)$-困難であるか,または中間VPLの有限直和と同等であるかを正しく出力するアルゴリズムが開発された。
- 特に,入力言語が視覚的カウンタ言語の場合,アルゴリズムは効率的に$\mathsf{AC}^0$への包含を判定できる。
- 中間VPLは,すべて$\mathsf{AC}^0$に属するか,またはすべて属さないかのいずれかであるという仮説が立てられた。
レンズを用いた型付き合成量子計算 [cs.RO, cs.PL, cs.LO]目的:量子計算の記述と性質の証明のための型理論的フレームワーク
- 量子計算は,従来の計算機では困難な問題を解決する可能性を秘めており,その理論的基盤の確立が重要である。
- 既存の量子計算の形式化は複雑になりやすく,大規模な回路の検証が困難であるという課題がある。
- 型理論を用いて量子回路を再帰的に定義し,その正当性を合成的に証明することで,形式化の簡略化を目指す。
- Coqの多相型システムにおける状態のcurryingを活用し,量子ゲートを回路内に直接適用可能にした。
- レンズという概念を導入することで,回路構造の組み合わせ論とゲートの計算内容を分離することに成功した。
- このフレームワークを用いることで,量子回路の正当性を構成的に証明できることを示した。
EDGE言語:グラフアルゴリズムのための拡張一般アインシュタイン総和 [cs.DS]目的:グラフアルゴリズムの統一的な抽象化
- グラフアルゴリズムは,様々な分野で基盤技術として重要であり,その効率化が求められている。
- 既存のグラフアルゴリズム表現は多様で,アルゴリズム間の比較や実装の複雑化を招いている。
- EDGE言語を用いて,グラフアルゴリズムを数学的に表現し,その比較・実装を容易にすること。
- EDGE言語は,グラフを2次元テンソルとして捉えるグラフ-行列二重性の概念と,テンソル代数のアインシュタイン総和記法を活用している。
- この言語を用いることで,アルゴリズムの本質と実装の詳細を分離し,複雑さを軽減できる。
- EDGE表現の代数的操作により,新たなアルゴリズム変種を発見する可能性が示唆されている。
多層強三叉閉包のための整合性のあるタイ強度ラベリング [cs.SI, cs.DS]目的:多層ネットワークにおける整合性のあるタイ強度ラベリング
- ネットワーク分析において,関係性の強さを理解することは重要である。
- 多層ネットワークにおいて,各層ごとに独立して強三叉閉包を適用すると,整合性が失われる。
- 層間の一貫性を保証し,より正確な関係性分析を可能にすること。
- 本研究では,層間一貫性を強制する新しい定式化である多層強三叉閉包とSTC+を提案する。
- 提案手法はNP困難であるが,効率的な2近似および6近似アルゴリズム,そして厳密解を提示する。
- 実世界のネットワークでの実験により,提案手法がベースラインを大幅に上回る整合性のあるタイ強度ラベリングを生成することが示された。
CMSO変換による木構造グラフ分解 [cs.RO, cs.MA, cs.SI, math.OC, cs.LO, cs.CC, cs.DM, cs.FL]目的:グラフのモジュール分解,スプリット分解,バイジョイン分解
- グラフ構造の解析は,様々な応用分野で不可欠である。
- 既存手法では,より表現力豊かな論理を用いる必要があった。
- CMSO論理を用いた効率的な分解手法を確立すること。
- 本研究では,グラフのモジュール分解,スプリット分解,バイジョイン分解を生成するCMSO変換を提示した。
- これにより,Courcelleの先行研究で用いられていたorder-invariant MSOよりも表現力の低いCMSOでの分解が可能となった。
- さらに,弱分割系および弱二部分割系の正準分解を生成するC2MSO変換も導出した。
分散行列乗算のための構造化符号 [cs.IT, math.IT]目的:二つの相関のある情報源 ${\bf A}$ と ${\bf B}$ の二項演算の分散計算の限界
- 分散システムにおける計算能力の限界を理解することは,効率的なリソース活用に不可欠である。
- 情報源間の相関を十分に活用できていないため,分散計算の性能が制限されている。
- 情報源間の相関を考慮した符号化により,分散計算の性能限界を明確にすること。
- 二つのノード間における,二項演算の和レートの上界を確立した。
- 有限体上でのドット積や行列積を含む,重要な非線形関数の性能限界を導出した。
- Slepian-Wolf符号化と比較して,情報源間の相関に依存して圧縮率の向上が確認された。
指向一階論理の教義的意味論 [cs.LO, math.CT]目的:指向一階論理における等号の教義的意味論
- 形式的な意味論は計算機科学や数理論理学の基礎であり,プログラムの意味理解に不可欠である。
- 従来の等号の概念では,対称性による制約や,型理論における順序関係の表現が課題であった。
- 本研究は,非対称な等号の概念を導入し,型を前順序として解釈することで,これらの課題を解決する。
- 本研究では,変数の出現を追跡する極性システムを備えた指向一階論理を提示し,等号を相対的な左随伴として特徴づけた。
- この論理の意味論と分散システムは,指向教義を用いてカテゴリー的に捉えられ,音性と完全性が証明された。
- 古典的な断片においては,前順序における標準的な意味論に対する完全性が証明された。
静的相関クラスタリングから動的相関クラスタリングへ [cs.DS]目的:相関クラスタリング問題に対する動的アルゴリズムの開発
- データマイニングや機械学習において,データの構造を把握する上で重要な問題である。
- 既存の相関クラスタリングアルゴリズムは静的であり,動的に変化するデータに対応できないという課題がある。
- 静的アルゴリズムを動的アルゴリズムへと変換する汎用的な枠組みを提示し,その有効性を示す。
- 既存の効率的な相関クラスタリングアルゴリズムを,適応的な対抗者に対しても機能する動的アルゴリズムへと変換する枠組みを提案した。
- 最新の近似アルゴリズムに適用することで,定数時間での更新に対応した$1.485$-近似動的アルゴリズムを実現した。
- この変換は,既存の最良の近似率を維持しながら,適応的な対抗者に対しても一定の確率で近似解を保証する。
p進スコレム問題について [cs.CL, eess.SY, cs.SY, math.OC, cs.LO, math.NT]目的:線形漸化式のp進零の判定と,それらの正確な表現の計算
- 線形漸化式は,数学,コンピュータサイエンスなど広範な分野で重要な役割を果たす。
- 線形漸化式の零の判定は,長年未解決の問題であり,計算可能性の観点からも重要である。
- p進零の判定アルゴリズムを開発し,線形漸化式の零に関する理解を深める。
- p進スコレム問題および対応する関数問題に対するアルゴリズムが提示された。
- アルゴリズムの出力は無条件で正確であり,p進シャヌエル予想のもとで終了が保証される。
- 提示された結果を用いて,同時スコレム問題の決定可能性が示された (p進シャヌエル予想のもとで)。
ジャイル-ルーLPに基づくエッジ重み付きオンライン確率的マッチング [cs.DS, cs.GT]目的:エッジ重み付きオンライン確率的マッチングの競争率の理論的限界
- オンラインマッチング問題は,リソース配分や割り当てにおいて重要な役割を果たす。
- 既存の手法では,競争率の改善に限界があり,より良いLP緩和が必要とされていた。
- ジャイル-ルーLPに基づく競争率の厳密な上限と下限を導き出す。
- エッジ重み付きオンライン確率的マッチングにおいて,ジャイル-ルーLP下での競争率の上限は0.663,下限は0.662であることが示された。
- 特定のハードインスタンスに対して最適なオンラインアルゴリズムを特定し,そのアルゴリズムを一般化することで,競争率の向上を実現した。
- ポアソン到着モデルとオンライン確率的マッチングの漸近的同等性の一般化を行い,近似単調性の要件を撤廃した。
大規模言語モデルを活用した並列科学コードのエネルギー効率を考慮したリファクタリングの自動化 [cs.AI, cs.DC, cs.PL, cs.SE]目的:並列科学コードのエネルギー効率改善
- 大規模計算システムの電力消費は大きく,エネルギー効率が重要な課題となっている。
- 既存の研究では,コードの機能性や実行時間に焦点が当てられ,エネルギー効率は十分に考慮されていない。
- 大規模言語モデルを用いて,実行時のフィードバックに基づきエネルギー効率の高いコードを自動生成すること。
- 提案手法 LASSI-EE は,ランタイム電力プロファイリング,エネルギー効率を考慮したプロンプティングなどを統合し,平均36%(MI100)と34%(A100)のエネルギー削減を達成した。
- LASSI-EE は,反復的なアプローチと LLM-as-a-Judge エージェントによるコードのスクリーニングを通じて,エネルギー効率の高い並列コードを生成する。
- NVIDIA A100 および AMD MI100 GPU 上の 22 の科学的ベンチマークとアプリケーションで評価された。
有限状態次元とダベンポート・エルデシュの定理 [cs.IT, math.IT]目的:有限状態次元とコプレランド・エルデシュ数列の関係性の解明
- 数論における古典的なハウスドルフ次元の有限状態効果化として重要。
- コプレランド・エルデシュ数列の有限状態次元の決定が困難。
- 多項式変換による有限状態次元の変化を明らかにすること。
- 任意の区間内の値を有限状態次元として実現できる集合と線形多項式が存在する。
- 有理数係数の線形多項式は有限状態次元を変えないが,高次の多項式は変える。
- 正規数列であっても,多項式変換により有限状態次元が1未満になる例が存在する。
ショートカット,ホップセット,行列乗算による高速な多始点到達可能性と近似距離計算 [cs.DS, cs.DC]目的:多始点集合からの到達可能頂点の集合の計算
- グラフ理論はネットワーク分析や最適化問題に応用され,様々な分野で重要な役割を果たす。
- 大規模グラフにおける到達可能性問題は計算コストが高く,効率的なアルゴリズムが求められている。
- 既存手法の計算量を改善し,より大規模なグラフに対しても実用的なアルゴリズムを開発する。
- ショートカット構造を利用した集中型アルゴリズムにより,既存手法よりも優れた計算時間複雑度を達成した。
- バランスの取れた再帰的セパレータを持つグラフや,トレewidthが小さいグラフに対する並列アルゴリズムを提案した。
- 提案手法は,近似距離計算にも拡張可能であり,実用的な応用範囲が広い。
不安定な通信路における準同型状態符号化を用いたロバストなリモート強化学習 [cs.LG, cs.IT, cs.MA, math.IT]目的:不安定な通信路環境下でのリモート強化学習
- ロボット制御や分散システムにおいて,遠隔からの情報に基づいた意思決定は不可欠である。
- 通信路の信頼性が低い場合,状態情報の欠損や遅延が生じ,強化学習の性能が低下する。
- 通信路の不安定性に対処し,効率的な学習を実現する新しいアーキテクチャを提案する。
- 提案手法HR3Lは,勾配情報の交換を必要とせず,分散学習を可能にする。
- 実験結果から,HR3Lはサンプル効率が大幅に向上し,学習速度が向上し,通信オーバーヘッドが削減されることが示された。
- HR3Lは,パケット損失,遅延,帯域幅制限といった様々なシナリオに適応し,性能劣化を抑制できる。
制約論理プログラミングにおける配列のエンコーディングと推論 [cs.LO]目的:配列のエンコーディングと,それを用いた推論手法
- 制約論理プログラミングは,組合せ最適化問題などへの応用が期待され,近年ますます重要となっている。
- 配列の取り扱いは,制約論理プログラミングにおいて,効率的な問題解決を妨げる要因の一つとなっている。
- 配列を集合として表現することで,既存の集合理論に基づく推論手法を適用し,配列処理を効率化することを目的とする。
- 配列を順序対の集合としてエンコードすることにより,配列の推論を集合の推論として扱うことを可能にした。
- この手法を実現するために,配列の仕様記述に適した集合理論の断片を定義し,そのための決定手続きを開発した。
- 開発した決定手続きは,既存の{log}ツールに組み込まれ,集合,関数,配列の推論を統一的に行えるようになった。
大規模言語モデルを用いたソフトウェア工学における実証研究の指針 [cs.CL, cs.SE]目的:大規模言語モデルを用いたソフトウェア工学の実証研究における再現性と複製可能性の確保
- ソフトウェア工学分野では,実証研究の信頼性が重要であり,その再現性が研究の進展を左右する。
- 大規模言語モデルの非決定性や不透明な学習データが,実証研究の再現性と複製可能性を阻害する要因となっている。
- 大規模言語モデルを用いたソフトウェア工学の実証研究における問題点を明確化し,研究の品質向上を目指す。
- 本研究では,大規模言語モデルの利用方法を分類する7つの研究タイプを提示し,研究デザインと報告に関する8つの指針を提案した。
- 提案された指針は,大規模言語モデルの使用状況の開示,モデルのバージョンと設定の報告,プロンプトの詳細な記述などを推奨している。
- これらの指針は,研究タイプに応じて適用要件と推奨事項を区別し,研究の信頼性と透明性を高めることを目的とする。
Scam2Prompt:実運用LLMにおける悪意のある詐欺エンドポイントを監査するためのスケーラブルなフレームワーク [cs.CR, cs.AI, cs.SE]目的:LLMにおける詐欺サイトの悪意を検出し,それを再現するプロンプトを生成することによる脆弱性評価
- LLMはソフトウェア開発に不可欠だが,学習データに含まれる悪意のあるコンテンツのリスクがある。
- LLMが詐欺的なURLを生成する可能性は存在するが,その評価方法が確立されていない。
- 実運用LLMにおける詐欺サイトを模倣したプロンプトに対する脆弱性を定量的に評価する。
- Scam2Promptを用いて4つのLLMを評価した結果,4.24%のケースで悪意のあるURL生成が確認された。
- Innoc2Scam-benchを用いて検証した結果,最新のLLMにおいても高い割合で悪意のあるコード生成が確認された。
- 既存の安全対策では,この脆弱性を効果的に防ぐことは難しいことが示された。
TDDフローに統合された無線位相校正を用いた分散MIMO [cs.IT, math.IT]目的:分散MIMOにおける無線位相校正の実現
- 無線通信容量増大のため,基地局間の協調ビームフォーミングが重要視されている。
- 基地局ごとの発振器の位相ずれが,協調ビームフォーミングの性能を大きく阻害する。
- TDDフローに位相校正を組み込み,効率的な分散MIMOを実現することを目指す。
- 提案手法により,TDDスロット構造の切り替えポイントを調整することで,基地局間無線位相校正が可能となった。
- 校正測定に費やすリソースとシステムのスプクトル効率のトレードオフを解析的に明らかにした。
- 専用の校正スロットを用いる手法と比較して,提案手法の優位性を示すことができた。
リュウベル原子量子受信機のためのチャネル推定:ホログラフィックスナップショットからの展開位相復元 [cs.IT, math.IT]目的:リュウベル原子量子受信機におけるチャネル推定
- 量子情報技術の発展には,高精度な量子チャネル推定が不可欠である。
- 従来のチャネル推定法は,非線形性やノイズの影響を受けやすく,性能が制限される。
- ホログラフィックスナップショットを用いた深層学習フレームワークにより,高精度なチャネル推定を実現する。
- 提案手法URformerは,古典的な反復アルゴリズムや従来のニューラルネットワークと比較して,有意に高い性能を示す。
- URformerは,学習可能なフィルタネットワークとゲート機構により,学習の安定性を高めている。
- URformerは,チャネル間の非局所的な依存関係を捉えることで,残差誤差を効果的に修正する。
ニューロン活性化からの形式的性質の推論 [cs.LG, cs.SE]目的:フィードフォワードニューラルネットワークの形式的性質の自動推論
- 深層学習の安全性・信頼性確保は重要であり,モデルの振る舞いを理解する手段が求められている。
- ニューラルネットワークはブラックボックス性が高く,その内部の動作原理の解明が困難である。
- ニューロンの活性化状態から形式的な性質を推論し,モデルの挙動を説明可能にすることを目指す。
- Prophecyは,ニューロンの活性化状態を前条件とするルールを抽出し,特定の出力特性を導くことができる。
- 抽出されたルールは,隠れ層で捉えられたネットワークの性質を表し,所望の出力動作を保証する。
- 本ツールは,形式的説明の推論,合成検証,ランタイム監視など,多様な応用可能性を示す。
差分プライバシーを持つスペクトルグラフクラスタリング:プライバシー,精度,効率のバランス [cs.IT, cs.CR, cs.LG, cs.SI, math.IT]目的:エッジ差分プライバシー下でのスペクトルグラフクラスタリング
- グラフ構造データの解析は,ソーシャルネットワークや生物学ネットワークなど,様々な分野で重要である。
- プライバシー保護を考慮したグラフ解析は,データ公開に伴うリスクを軽減するために不可欠である。
- プライバシーと精度のトレードオフを解消し,効率的なクラスタリング手法を開発すること。
- 提案手法は,ランダムなエッジ反転と隣接行列のランダム置換を組み合わせた行列シャッフルメカニズムを用いる。
- このメカニズムは,グラフの規模が大きくなるにつれてプライバシーを向上させ,エラーレートを$\tilde{O}(1/n)$に抑えることが示された。
- これは,既存の差分プライバシー手法よりも優れており,理論的および実験的に検証された。
汎用化されたジェンセン・シャノンダイバージェンスを用いたLLM生成テキストのブラックボックス検出 [cs.LG, cs.IT, math.IT]目的:LLM生成テキストのブラックボックス検出手法
- LLMの急速な進化に伴い,生成されたテキストの真偽性の判断が重要課題となっている。
- 既存手法では,参照モデルとの不一致やコストの問題があり,実用性に課題がある。
- 参照モデルの不一致やコスト問題を克服し,よりロバストな検出手法を確立すること。
- 提案手法SurpMarkは,トークンの驚き度の動的な変化を要約し,状態遷移行列を用いてテキストを評価する。
- 人間と機械のテキストから構築された固定された参照との間のジェンセン・シャノンダイバージェンスの差をスコアとする。
- 実験の結果,SurpMarkは様々なデータセット,ソースモデル,シナリオにおいて,既存手法と同等またはそれ以上の性能を示した。
高次元行列のほぼ最適なランク適応推論 [cs.IT, math.IT, stat.ML]目的:高次元行列の推定
- データ解析において,高次元データの効率的な処理は重要な課題である。
- 高次元行列推定では,計算コストと推定精度のバランスが課題となる。
- データに応じてランクを適応的に決定し,推定精度を向上させる。
- 本研究では,行列の特異値と特異ベクトルを推定することで,サンプル複雑度の理論的な下限を明らかにした。
- 提案アルゴリズムは,最小二乗推定とユニバーサルな特異値閾値処理を組み合わせることで,理論限界に近い性能を発揮する。
- 多変量回帰や線形動的システム同定といった応用を通じて,本研究の有効性を検証した。
常に連結なグラフの時系列グラフ再構成 [cs.DS]目的:常に連結なグラフ間の時系列グラフ再構成可能性
- ネットワーク設計は,通信や輸送など様々なシステムにおいて重要な役割を果たす。
- 現実のネットワークでは,変更を段階的に行う必要があり,その過程で常に連結性を維持する必要がある。
- 時系列グラフにおける連結性維持を考慮した再構成問題の解法を明らかにすること。
- 時系列グラフ再構成問題(LCR問題)を定式化し,動的計画法による解法を提案した。
- LCR問題における最短再構成系列の発見はAPX-困難であることが示された。
- LCR問題は,Hanakaらによって提案されたSpanning Tree Sequence Reconfiguration(STSR)問題と同値であることが示された。
古いテストはSWE問題解決に新たな役割を果たせるか? [cs.SE]目的:既存のテストスイートの再利用によるSWE(Software Engineering)問題の再現とパッチの検証
- ソフトウェアの品質向上には,網羅的なテストが不可欠である。大規模プロジェクトでは特に重要。
- 既存のテストスイートでは,全てのバグを検出できず,未解決の問題が残存しがちである。
- 既存のテストを効率的に活用し,SWE問題の解決を支援することを目的とする。
- TestPruneは,課題トラッカーの情報に基づき,テストスイートを最小化することで,再現テストの生成とパッチの検証を効率化する。
- Otterフレームワークにおいて,課題の再現率が6.2%-9.0%相対的に向上し,Agentless,SWE-Agent,Traeエージェントでは解決率が8.0%-12.9%相対的に向上した。
- GPT-4oおよびClaude-3.7-Sonnetモデルを用いた際のAPIコストは,$0.02および$0.05と,そのオーバーヘッドは軽微である。
CPSLint:産業用サイバーフィジカルシステムのためのデータ検証とクレンジングを提供するドメイン特化言語 [cs.PL, cs.SE]目的:産業用サイバーフィジカルシステムのデータ検証とクレンジング
- 産業システムでは,機械学習を活用した故障検知が重要視されている。
- センサーデータは欠損や破損が多く,信頼性のある機械学習モデル構築が困難である。
- データの前処理を自動化し,専門家でなくても容易にデータ準備を行えるようにする。
- CPSLintは,一般的なデータ破損パターンを自動的に検出し,修正できる。
- 従来のデータ準備手法と比較して,手作業の負担を軽減し,データの整合性を保証する。
- 評価実験により,メモリ消費量とCPU時間を測定し,CPSLintの有効性を確認した。
ToolScope:ツールマージと文脈認識フィルタリングによるLLMエージェントのツール利用の強化 [cs.SI, cs.CL, cs.SE]目的:LLMエージェントのツール利用の改善
- LLMエージェントは複雑なタスク解決に外部ツールを利用する点が重要である。
- 実世界のツールセットは冗長なツールが多く,曖昧さを生み,選択精度を低下させる。
- ツールセットの冗長性削減と,文脈制限内での関連ツール選択を実現すること。
- ToolScopeは,ツールマージと自動修正によりツールセットの冗長性を削減する。
- 文脈認識フィルタリングにより,関連性の高いツールを選択し,文脈制限に対応する。
- 3つのLLMと3つのベンチマークで,ツール選択精度が8.38%~38.6%向上した。
LLM駆動による費用対効果の高い要件変更影響分析 [cs.SE]目的:要件変更の影響範囲の自動特定
- ソフトウェア開発において,要件変更は不可避であり,その影響分析は品質確保に不可欠である。
- 手動での影響分析はコストと時間がかかり,見落としのリスクが存在する。
- LLMを活用し,要件変更の影響範囲を効率的かつ正確に特定することを目指す。
- 提案手法ProReFiCIAは,未知の産業データセットにおいて85.7%の再現率を達成し,有効性が示された。
- ProReFiCIAの適用コストは低く,エンジニアは予測された影響要件のみを確認すればよい(全体の3.0%)。
- RAGによるドメイン知識の組み込みにより,再現率は95.7%に向上し,コストはわずかに3.6%に増加した。
学生コードのソクラテス的デバッグにおける推論軌跡:誤解から矛盾,そして信念の更新へ [cs.CL, cs.CY, cs.SE]目的:学生コードのデバッグにおける推論軌跡の生成
- プログラミング教育において,学生の自力での問題解決能力の育成は重要である。
- 初心者のバグは概念誤解が原因であることが多く,効率的なデバッグ支援が課題である。
- ソクラテス的デバッグを支援する推論軌跡を自動生成し,学生の理解促進を目指す。
- 本研究では,手動またはLLM生成された推論軌跡を含むデバッグ問題のデータセットを導入した。
- LLMを用いた推論軌跡生成およびソクラテス的会話の構築に関する解法を提案し,その有効性を示した。
- 大規模なLLM評価の結果,生成された推論軌跡の正答率は最大91%,会話の妥当性は98.7%であった。
BITを忘れよ,全てはTOKENだ:LLMのための意味情報理論へ [cs.CL, cs.IT, cs.AI, math.IT]目的:大規模言語モデル(LLM)における意味情報理論の構築
- LLMは実用的な成功を収めているが,理論的基盤が確立されていないため,さらなる発展には不可欠である。
- 従来のLLM研究は,計算資源とデータに依存しており,根本的な原理に基づいた理解が不足している。
- 本研究は,意味の単位を「ビット」から「トークン」へと置き換えることで,LLMの理論的枠組みを再構築する。
- LLMをエネルギーベースモデルとして再解釈し,意味埋め込みを意味多様体上のベクトル化として捉えた。
- LLMをフィードバック付き状態チャネルとしてモデル化し,自己回帰的生成の因果関係を評価する指標を導出した。
- 次トークン予測をグランジャー因果推論と同一視し,LLMの推論限界をパール因果梯子を用いて明確化した。
GitHub Copilotを用いたコード理解:実力向上,理解度とのトレードオフ,および行動予測 [cs.CL, cs.SE]目的:既存のソフトウェアにおける機能実装タスクにおけるGitHub Copilotの利用によるコード理解とパフォーマンスの変化
- ソフトウェア保守は重要であり,そのために既存コードの理解は不可欠である。
- 生成AIアシスタントがパフォーマンスを向上させる一方で,コード理解への影響は不明である。
- 生成AIツールがコード理解を阻害するのではなく,利用方法に依存することを明らかにする。
- GitHub Copilotの利用はタスク完了速度と正確性を向上させるものの,コード理解度の全体的な向上には繋がっていない。
- パフォーマンスの向上は,リバースエンジニアリングの理解度と負の相関を示し,実装理解度との正の相関を示した。
- 生成されたコードを積極的に検証する行動パターンが,コード理解度を強く予測する。
コード言語モデルの知識蒸留に関する変態テストの視点:生徒は教師を深く模倣しているか? [cs.DC, cs.AR, cs.SE, cs.LG]目的:コード言語モデルの知識蒸留における行動の忠実度評価
- コード言語モデルはソフトウェア分析で高性能だが,計算コストが高いという課題がある。
- 従来の評価指標では,教師モデルと生徒モデルの行動の違いを捉えきれない。
- 行動を保持する変態関係を用いて,生徒モデルの行動の忠実度を評価する。
- MetaCompressは,知識蒸留された生徒モデルにおいて最大62%の行動の乖離を検出した。
- 従来の精度ベースの評価では捉えられない,敵対的攻撃に対する性能低下が大きいことが示された。
- MetaCompressは,知識蒸留パイプラインにおける行動の忠実度評価のための実用的なフレームワークである。
エンドツーエンド深層学習パイプラインにおけるデータフレームライブラリのエネルギー消費量:比較分析 [cs.SE, cs.AI, cs.PF]目的:データフレームライブラリのエネルギー消費量に関する比較
- 深層学習の普及に伴い,データ処理の効率化と省エネルギー化が重要課題となっている。
- データ処理ライブラリの性能が,深層学習パイプライン全体のボトルネックとなる場合がある。
- GPU処理との組み合わせにおけるデータ処理ライブラリのエネルギー効率を評価し,改善策を提示する。
- Pandas,Polars,Daskの3つの主要なPythonデータ操作ライブラリを比較分析した結果,エネルギー消費量に差が見られた。
- 特に,大規模なGPUワークロードにおいて,データローディング,前処理,バッチ供給といった段階でライブラリの性能が影響することが示された。
- データセットや機械学習モデルによって最適なライブラリが異なり,エネルギー効率を考慮したライブラリ選択の重要性が示唆された。
フラクショナル負荷分散における順序ノルムの最小化のための効率的なアルゴリズム [cs.DS, math.OC]目的:順序ノルムの最小化
- 負荷分散は,計算資源の効率的な利用において重要な課題である。
- 一般的なノルムでは近似アルゴリズムの性能が十分でない場合がある。
- 任意の順序ノルムに対して効率的な近似アルゴリズムを開発すること。
- 提案アルゴリズムは,$(1+\varepsilon)$-近似解を計算できる。
- アルゴリズムは,高確率で$\mathcal{O}\left((n+d) (\varepsilon^{-2}+\log\log d)\log (n+d)\right)$回のオラクル呼び出しで動作する。
- 資源価格メカニズムと滑らかなノルム近似を用いることで,安定性と進捗を保証している。
段階的射影再帰 (GPR): 修正,妨害要因,および保守的近似行列乗算 [cs.CC, cs.DS]目的:モデルに忠実な準二次行列乗算のための決定論的パッキング再帰フレームワーク
- 大規模行列計算は,機械学習や科学計算など,多様な分野で不可欠である。
- 従来の行列乗算は計算コストが高く,特に大規模な行列に対して効率性が課題となる。
- より効率的な行列乗算手法の開発により,計算コストの削減を目指す。
- 以前の定理における厳密な行列乗算の主張を取り下げ,より保守的な近似行列乗算フレームワークを提示する。
- 保護されたクエリ部分空間に対しては正確に計算し,残差部分空間に対してのみ近似行列乗算を適用する。
- 結果として得られる推定子は不偏であり,保護されたクエリを正確に保持し,誤差を局所化する。
多面的な電力制約を持つガウスチャネルにおけるチャネル符号化 [cs.IT, math.IT]目的:ガウスチャネルにおける高次符号化性能と入力電力の平均電力および詳細な統計量の関係
- 通信システムの信頼性向上は重要であり,そのために効率的な符号化技術が不可欠である。
- 既存の電力制約モデルでは,入力電力の分布の複雑さを十分に捉えきれていない。
- 多面的な電力制約モデルを用いて,より正確な通信性能の限界を明らかにすること。
- 多面的な電力制約モデルは,従来のモデルを一般化し,最大電力,期待電力,平均と分散の制約を包含する。
- 入力電力の関数に関する成長性と連続性の仮定の下で,ガウスチャネルの最小平均誤り確率を正確に特徴付けた。
- 本研究は,多値変調や確率的整形などの実用的な変調方式のベンチマークとして役立つ。
BRIDGE:ドメインガイド型プログラム合成における表現の構築 [eess.SY, cs.SY, cs.LG, cs.PL]目的:ドメインガイド型プログラム合成のための構造化プロンプトフレームワーク
- 形式検証の重要性が増しており,プログラムの信頼性確保が不可欠である。
- プログラム合成において,実行可能コード,形式仕様,定理文,証明試行の一貫性確保が課題である。
- 複数のドメイン間の連携を強化し,検証済み合成の規模拡大を目指す。
- BRIDGEフレームワークは,コード,仕様,定理/証明の3つのドメインを相互に接続することで,Leanにおける実行可能なコードの正答率を最大1.5倍向上させた。
- 仕様重視のプロンプトは,Pythonのパス率を最大17.5パーセントポイント改善した。
- BRIDGEスタイルの推論トレースによる教師ありファインチューニングは,コードのみのファインチューニングよりもLeanのパス成功率を約1.5倍向上させた。
人工ノイズ支援による近距離場流体アンテナシステムを用いた安全な多入力多出力通信 [cs.IT, math.IT]目的:近距離場流体アンテナシステムにおける物理層セキュリティの向上
- モバイル通信は大規模アンテナ,高周波化,再構成可能なアンテナアーキテクチャへと進化しており,セキュリティが重要課題。
- 従来のセキュリティ手法では,特に大規模アンテナを用いない場合,十分な秘匿性能を確保することが困難。
- 流体アンテナシステムの自由度を活用し,実用的な安全伝送アーキテクチャを提案し,秘匿性能を向上させる。
- 提案手法は,流体アンテナシステムの幾何学的な特性と位置領域の自由度を活用し,秘匿性能を大幅に向上させる。
- 特に,近距離場ビームフォーミング単独では不十分な,大規模アンテナを使用しない場合に高い効果が確認された。
- 本研究は,位置情報認識機能とハードウェア制約を考慮したモバイルコンピューティングシステムにおける安全な通信の実現可能性を示す。
ロバストな部分空間回復への応用を伴う信頼楕円体の学習 [cs.DS, cs.LG, math.ST, stat.ML, stat.TH]目的:高次元における任意の分布に対する信頼楕円体の探索
- 統計的推論や機械学習において,分布の形状を捉え,外れ値の影響を抑制する信頼区間は重要である。
- 高次元空間では,最小体積推定量の計算がNP困難となり,実用的な近似アルゴリズムが求められている。
- 条件数βが無限大に近づく場合でも,効率的に信頼楕円体を近似するアルゴリズムを開発すること。
- 提案手法は,多項式時間で,最適なβ条件付き楕円体の体積に対して,O(β)^γdの乗法的な誤差範囲内の楕円体を見つけ出す。
- 特にγをo(1)に設定することで,体積近似はO(β)^{o(d)}となり,カバレッジの損失を伴う。
- 本研究により,ロバストな部分空間回復問題に対する,近似保証付きの最初の多項式時間アルゴリズムが得られた。
Rényiレート歪み知覚関数と関数表現について [cs.IT, math.IT]目的:Rényi情報理論的枠組みにおけるレート歪み知覚関数の解析
- 情報圧縮の限界を理論的に理解するためには,レート歪み理論の拡張が不可欠である。
- 従来のレート歪み理論では,知覚的品質を定量的に評価する手段が十分ではなかった。
- Rényi情報量を用いて,歪みと知覚制約下での圧縮限界を明確にすることを試みる。
- スカラーガウスソースに対し,Rényiレート歪み知覚関数の閉形式解が得られた。
- 知覚制約が再生分散の実行可能な範囲を規定することが示された。
- 最適な関数表現の複雑さに相転移が存在し,αの値によって符号化コストが変化することが判明した。
多項式写像の固定点に関する問題点 [cs.LO, math.LO]目的:計算可能解析への応用を動機とする,コンテナの圏における特定のエンドファンクタの固定点
- 計算可能解析は,計算可能性の概念を連続的な空間に拡張するものであり,現代的な数学的分析の基盤である。
- エンドファンクタの固定点を計算する効率的な手法が確立されておらず,計算複雑性の分析が困難である。
- 多項式写像によって表現されるエンドファンクタの固定点を計算するための具体的な手法を開発し,Weihrauch複雑度を分析する。
- 初期代数,終端コアルジェブラ,そして$\zeta$と呼ばれる別の種類の固定点を計算する方法を明らかにした。
- $\zeta$-式を$\mu$-双完備圏の構文として導入し,コンテナにおける自然な意味論を確立した。
- 型2の計算可能写像の圏における$\zeta$-式の解釈を通して,Weihrauch次数を捉え,閉じた選択から無限パリティゲームの決定性までを示すことができた。
ステートレス実行環境における複雑な複数ターンツール呼び出しインタラクションのシミュレーション [cs.CL, cs.AI, cs.SE]目的:複数ターンツール呼び出し会話の複雑さに対応できる,小規模で費用対効果の高い言語モデルの調整
- 言語モデルの性能向上には,大規模データセットが必要不可欠であり,その生成が課題となる。
- 従来のツール呼び出しデータ生成は,状態を維持する実行環境を前提としており,現実のセキュリティ要件に対応できない。
- セキュリティ上の制約や仕様の多様性がある環境でも有効なツール呼び出し会話データ生成手法を確立する。
- 本研究で提案するDiGiT-TCは,ユーザーリクエストにツール呼び出しを暗黙的に表現する新しい生成パターンを採用。
- 標準的なツール呼び出しベンチマークにおいて,DiGiT-TCは既存手法と比較して優れた性能向上を示した。
- ステートフルな問題設定においても,DiGiT-TCを用いることで高いパフォーマンスが実現可能であることが示された。
ニューラルネットワーク表現における暗黙的な仮説検定と多様性維持 [cs.LG, cs.IT, math.IT]目的:ニューラルネットワークの学習ダイナミクスにおける仮説検定
- 機械学習の性能向上には,モデルがデータを適切に表現することが不可欠である。
- 学習された表現が,汎化性能にどのように影響するか不明な点が多い。
- 学習過程における表現の多様性維持のメカニズムを解明する。
- 学習が進むにつれて,汎化性能の高いネットワークは,Neyman-Pearson最適決定規則に近づくことが示された。
- 学習された表現がKLダイバージェンスを維持する度合いの単調増加によって測定された。
- モデルの学習収束を体系的に評価するための「Evidence-Error平面」が提案された。
ソフトウェア開発におけるAIツールの利用:開発者の認識と利用パターン [cs.SE]目的:ソフトウェア開発におけるAIツールの利用状況と,開発者の認識
- ソフトウェア開発の効率化は,ビジネスの迅速化とコスト削減に不可欠である。
- AIツールの導入は進んでいるものの,コード品質への影響や開発者の働き方への変化が懸念されている。
- AIツール利用が開発者の認識や行動に与える影響を明らかにすること。
- AIツールの利用頻度と範囲の広さは,開発者の認識する生産性とコード品質の向上と関連している。
- 生産性と品質のトレードオフに関する懸念とは異なり,両者が同時に向上すると開発者は報告している。
- AIツールのテストにおける利用はコーディングほど進んでおらず,生産性の向上も低い傾向にある。
MathlibLemma: 数学的定理の自動生成と形式数学のベンチマーク [cs.LO, cs.AI, cs.LG]目的:形式数学における未整理の定理(folkore lemma)の発掘,形式化,証明
- 形式数学は,数学の厳密な証明を機械的に検証可能にする重要な技術である。
- 形式数学ライブラリMathlibには,数学者が当たり前と考える定理が不足しており,実用上の障壁となっている。
- この研究は,LLMを活用して不足している定理を発掘し,Mathlibの拡張に貢献することを目指す。
- MathlibLemmaパイプラインを構築し,1506個の形式化された定理と証明を生成した。
- 生成された定理の一部はMathlibにマージされ,専門家による品質基準を満たすことが確認された。
- 4028個の型チェック済みのLean文からなるMathlibLemmaベンチマークを構築し,LLMの貢献を評価した。
効率的なコミュニケーションが凸性を説明する [cs.CL, cs.IT, math.IT]目的:効率的なコミュニケーションの観点からの説明の成功要因
- 言語の多様性はコミュニケーション効率によって説明可能であるという仮説の重要性
- コミュニケーション効率に基づいた説明が,なぜ成功するかというメカニズムが不明
- コミュニケーションニーズの分布の凸性が説明の成功に果たす役割の特定
- 情報ボトルネックアプローチを用いて,最適性と凸性の相関が実証された。
- 凸性と最適性の相関を決定する要因として,コミュニケーションニーズ分布の凸性が重要であることが示された。
- これにより,意味類型論における効率的コミュニケーションの説明の理由付けが進む。
