arXiv雑要約
プログラム - 2026/06/17 公開
AIエージェントネットワークの信頼性:密度進化,停止集合,アーキテクチャ最適化 [cs.MA, cs.IT, math.IT]目的:AIエージェントネットワークにおける信頼性評価
- AIシステムの複雑化に伴い,複数のエージェントが協調してタスクを解決する事例が増加している。
- このようなシステムは高性能を示す一方,成功・失敗の要因が不明確であるという課題がある。
- 本研究は,AIエージェントネットワークの信頼性を理論的に分析し,性能限界を予測することを目的とする。
- 提案手法では,AIエージェントネットワークを疎なグラフ構造としてモデル化し,符号理論における密度進化の手法を拡張した。
- 密度進化定理を証明することで,ランダムなネットワークアーキテクチャにおける未解決サブクレームの割合を予測できることを示した。
- XOR演算の場合には古典的なLDPC理論の結果を再現し,AND演算の場合には検証者証明の非対称性を明らかにした。
LSMブルームフィルタ調整における適応性の価値:対数法則と二つのクロックによるフロンティア [cs.DB, cs.DS]目的:LSMツリーにおけるブルームフィルタ調整の適応性の価値の分析
- LSMツリーは現代のストレージシステムにおいて広く利用されており,その性能は効率的なフィルタ調整に大きく依存する。
- 従来のフィルタ調整は静的であり,ワークロードの変化に追従できないため,性能劣化が生じる可能性がある。
- 本研究は,適応的なフィルタ調整が静的な調整と比較して,いつ,どの程度有効であるかを定量的に評価する。
- アクセス頻度当たりの最適なビット数は,アクセス頻度の対数に比例することが示された(対数法則)。
- ホットネスの誤推定による余分な読み込みコストは,対数誤差のサイズ加重分散の半分に抑えられることが確認された(ロバストネス法則)。
- コンパクション周期での再割り当てだけでも,トラッキングの利点の96~99%を捕捉できることが実証された。
Pythonの裏側:AIを支える言語たち [cs.PL]目的:AIシステムにおける実装言語選択の指針
- AI開発はPythonが主流だが,数値計算はC/C++/Rustで行われることが多い。
- ライブラリがない場合や,リソース制約がある場合,どの言語を選ぶべきか明確ではなかった。
- AIにおけるアルゴリズム実装において,各言語の性能を比較し,最適な選択肢を提示する。
- CおよびC++は同等の性能を示し,Rustは9%遅延,Juliaは3.3倍,Goは5.0倍遅かった。Pythonは315倍遅延した。
- メモリ使用量はJuliaが約224MiBと高く,C/C++/Rustは6MiB以下に収まった。
- 言語の性能順位はワークロードによって変動し,Goの遅延はk-NNで2.6倍,k-meansで8.0倍に変化した。
賞金収集順路と関連ルーティング問題を賞金収集TSPに帰着 [cs.DS]目的:賞金収集順路と関連するルーティング問題の近似解法
- 経路最適化問題は,物流,配送,ロボット工学など様々な分野で重要な役割を果たす。
- 賞金収集問題はNP困難であり,大規模な問題に対する効率的な解法が求められている。
- 賞金収集順路問題を含む,より一般的な問題を賞金収集TSPに帰着させることで,既存のアルゴリズムを活用する。
- 賞金収集TSPに対する$\rho$-近似アルゴリズムが存在する場合,賞金収集-$\Phi$-TSPに対する$(\rho+\varepsilon)$-近似アルゴリズムを多項式時間で構築できる。
- この結果を用いて,賞金収集順路問題に対する1.6未満の近似アルゴリズムが得られ,既存の最良の近似保証1.6662を改善する。
オンライン接続性拡張 [cs.DS]目的:故障耐性ネットワーク設計における接続性拡張問題のオンライン設定における最適化
- ネットワークの信頼性確保は重要であり,接続性を高めることは不可欠である。
- 既存手法では,リアルタイムでの接続要求に対応し,効率的なリンク追加が課題である。
- オンラインでの接続要求に対し,最小限のリンク追加で接続性を確保することを目指す。
- 本研究では,オンライン接続性拡張問題に対するタイトな競争率を導出した。
- これにより,既存の手法よりも優れた性能が期待できる。
- 提案アルゴリズムは,オフライン最適解との比較において高い競争力を示す。
エージェント生成テストコードにおける,見せかけの安心感:オラクルシグナルの検証 [cs.SE, cs.AI]目的:エージェント生成パッチの検証強度評価
- ソフトウェア開発において,テストは品質保証の根幹であり,信頼性の高いソフトウェアを開発する上で不可欠である。
- AIエージェントが生成するテストコードの質が十分かどうかの検証が不十分であり,テストファイル存在のみでは検証強度を測れない。
- エージェント生成コードの検証強度を,オラクルシグナルに着目して評価し,品質チェックの改善に貢献すること。
- 80.2%のテストパッチには,弱い,または明示的なオラクルシグナルがほとんど含まれていないことが判明した。
- オラクルシグナルが強いPRは,生のマージ率が低いものの,調整後の回帰分析ではマージの可能性を有意に向上させる(OR = 1.28, p < 0.001)。
- テストファイルの数だけでは検証強度を過大評価する可能性があり,オラクルを意識した品質チェックの採用が重要である。
有向到達可能性保存最小辺カット:近似と平面グラフにおけるNP困難性 [cs.DS, cs.CC]目的:有向グラフにおける3端点到達可能性保存最小辺カット問題の近似解法と困難性の証明
- ネットワークの信頼性や強靭性を評価する上で,重要な問題設定である。
- 到達可能性を維持しつつ特定の到達関係を遮断する辺集合の最小化は,計算困難であることが知られている。
- 有向グラフにおけるこの問題に対し,より効率的な近似解法を確立し,その複雑性を明らかにすること。
- 根付き有向カット関数を用いた経路-カット定式化と,関連するポリマトロイドの根線形近似により,$O(\sqrt r)$-近似解法が得られた。
- 非巡回有向グラフに対しては,さらに単一長アルゴリズムを適用し,$O(\min\{\sqrt r,h\})$の近似保証を得た。
- 有向平面グラフにおける到達可能性保存最小辺カット問題がNP困難である事を,立方体平面グラフ上の独立集合問題からの還元により証明した。
Sign-Rank,Index,およびList Replicabilityの再現性:関連性と分離 [cs.LG, cs.IT, math.IT]目的:二値概念クラスのSign-Rankの最小次元表現に関する研究
- 学習理論において,概念クラスの複雑度を測る指標として重要である。
- Sign-Rankの下限を導出することが極めて困難であるという課題がある。
- IndexやList Replicabilityを用いてSign-Rankの下限を導出する方法を考察する。
- $\mathbb{Z}_2$-IndexがList Replicability数によって線形に上界されることが示された。
- Frick, Hosseini, Vasileuskiらの問いに対し,Sign-Rankと$\mathbb{Z}_2$-Indexの分離が達成された。
- List Replicability数の上限として,heightやminimum star numberが示された。
空中インタフェース型連合学習における内蔵センシング [eess.SP, cs.IT, math.IT]目的:空中インタフェース型連合学習における,オーバーヘッドゼロの内蔵分散ワイヤレスセンシング機能の活用
- ワイヤレス通信技術の発展に伴い,分散型機械学習の効率化が重要課題となっている。
- 既存システムでは,センシングモジュールが連合学習の性能を低下させるリソース競合が発生しやすい。
- 内蔵センシングを活用し,リソース競合を回避することで,学習とセンシング性能の向上を目指す。
- 提案手法は,従来のベースラインと比較して,学習とセンシングの両方の性能を向上させることを示している。
- 勾配信号の自己相関特性を利用し,ターゲット距離推定と協調測位を効率的に行う手法を開発した。
- モデル集約の不完全性やノイズの影響を考慮した,通信と学習を共同設計するアプローチを提案した。
群の剰余類に基づく量子LDPC符号 [quant-ph, cs.IT, math.IT]目的:群の剰余類作用を用いた新しい量子LDPC符号の構成
- 量子誤り訂正は,量子コンピュータの実現に不可欠な技術である。符号化方式の多様性が求められている。
- 既存の量子LDPC符号の構成法では,探索空間が限られており,高性能な符号の発見が課題となっていた。
- 群の剰余類作用を用いることで,より広範な符号空間を探索し,高性能な量子LDPC符号を創出することを目指す。
- 本研究では,新しい量子LDPC符号を複数発見した。具体的には,[[48,8,6]], [[96,8,10]], [[224,12,16]] などのパラメータを持つ符号を含む。
- 最大安定化子重みwを持つ符号に対し,深さw+2の効率的なシンドローム抽出スケジュールを提案した。
- BP-OSDデコーダを用いたシミュレーションの結果,提案符号はBB符号と同程度の性能を示し,閾値を約0.65%(weight-6),約0.35%(weight-8)で達成した。
未知パラメータを持つ弱凸最適化のための適応的近接法:決定論的および確率的保証 [math.OC, cs.DS]目的:弱凸関数の最適化
- 機械学習や信号処理において,非滑らかで非凸な目的関数は多く存在する。
- 弱凸パラメータが未知である場合,効率的な最適化手法が課題となる。
- 未知の弱凸パラメータに対しても安定して収束するアルゴリズムを提案する。
- 提案手法である適応的近接ガイドスキーム(APS)は,近接パラメータをオンラインで適応的に調整する。
- 決定論的設定では,$O(\varepsilon^{-2})$の反復回数で$\varepsilon$-劣勾配定常点を達成する。
- 確率的設定では,モロー包絡勾配を$\varepsilon$以下に抑えるための反復回数は高確率で$O(\varepsilon^{-2})$である。
RIS最適化限界を活用した多重ユーザビームフォーミングと信号抑制 [eess.SP, cs.IT, math.IT]目的:多重ユーザ無線システムにおける再構成可能なインテリジェント表面(RIS)の同時最適化限界の活用
- 無線通信において,電波の効率的な利用と通信品質の向上が重要課題である。
- RIS制御は複雑であり,最適なパラメータ設定には膨大な計算コストを要する。
- RISの最適化限界を考慮することで,計算効率を保ちつつ高性能な無線通信を実現する。
- 提案手法は,様々なチャネル環境やシステムパラメータにおいて,高速な収束性と安定した性能を両立する適応勾配スケーリング機構を実現した。
- 単一ユーザシナリオにおいて,従来法と比較して計算負荷を大幅に削減する低複雑度ビームフォーマ復元法を開発した。
- ユーザ固有の優先度付けを可能にするRIS要素割り当て戦略と,部分パネル最適化を支援する追加・削除機構を構築し,多重ユーザ環境下での性能向上を実証した。
深層学習を活用した部分的なCSIによる移動アンテナ位置最適化 [eess.AS, cs.CL, eess.SP, cs.IT, math.IT]目的:移動アンテナの位置最適化
- 無線通信において,データ伝送速度の向上は重要な課題である。
- 最適なアンテナ位置を特定するには,広範囲なチャネル状態情報が必要となり,推定コストが増大する。
- 部分的なCSIのみから,効率的に最適なアンテナ位置を予測することを目指す。
- 提案手法は,単一ユーザシステムにおいてほぼ最適な性能を達成する。
- 複数ユーザ環境では,従来のCSIベースの最適化アルゴリズムを上回る性能を示す。
- 深層学習モデルが,チャネル特性とアンテナ位置の間の複雑な非線形関係を捉えることを可能にした。
分散実験計画:ベイジアン最適融合による局所計画 [stat.AP, cs.IT, math.IT]目的:分散型ベイジアン実験計画における意思決定ルール
- 実験計画法は,効率的なデータ収集と最適な意思決定を可能にする重要な手法である。
- 分散環境下では,情報が断片化され,全体的な最適化が困難となる場合がある。
- 局所的な設計情報を融合し,集中型計画と同等の性能を実現する手法を提案する。
- 提案手法であるベイジアン最適融合ルールは,集中型計画のオラクルに近似した性能を示すことが実験的に確認された。
- 少数派サイトが不均衡な情報を持つ場合,多数決による融合ルールは最適解から大きく逸脱する可能性がある。
- 期待情報ゲインを損失関数として用いる点が,分散検出における最適融合ルールとの大きな違いである。
色分散路における前方および反復位相雑音補償 [eess.SP, cs.IT, math.IT]目的:色分散路における位相雑音補償手法
- 光通信の高速化に伴い,伝送距離と伝送容量の拡大が求められている。
- 色分散と位相雑音は,高速光通信における性能劣化の主な原因となる。
- 色分散と位相雑音の同時補償による伝送性能の向上を目指す。
- 位相雑音補償を色分散補償の前に行うことで,等化器による位相雑音の増大を抑制できる。
- 提案する前方および反復位相雑音補償アルゴリズムは,100GBaud 64-QAM,10,000kmの光ファイバーにおいて,位相雑音のないチャネルに近い情報伝送レートを達成する。
位相復元における単射性について [math.FA, cs.IT, math.IT, math.PR]目的:位相復元写像の単射性の確率
- 信号処理や画像再構成など,様々な分野で位相情報からの信号復元が重要である。
- 行列の構造によっては,位相復元が一意に定まらず,曖昧な解が生じる可能性がある。
- ある特定の条件における,位相復元写像の単射性が保証される範囲を明確にすること。
- 行列AのサイズがN=4M-5であるとき,位相復元写像が単射でない確率が正であることが証明された。
- この結果は,Cynthia Vinzant氏の予想の一部を肯定し,Afonso S. Bandeira氏の再提示された予想にも合致する。
- 本研究の主要な成果は,生成AIシステムRethlasを用いて得られた。
ボゴリューボフ=久保=森ランダム状態集団の平均エントロピー [math-ph, cs.IT, math.IT, math.MP, quant-ph]目的:ボゴリューボフ=久保=森計量に基づくランダム状態集団の平均エンタングルメントエントロピーの導出
- 現代量子科学の様々な分野において,ランダム状態は基礎的な役割を担う。
- 他のランダム状態集団のエントロピー計算では,相関カーネルの知識が必要とされる。
- 相関カーネルを用いずに平均エントロピーを計算する新しい枠組みを提供する。
- ボゴリューボフ=久保=森ランダム状態集団の平均エンタングルメントエントロピーの厳密な公式を導出した。
- この公式の導出では,相関カーネルの存在下ではなく,集団の正規化定数の性質のみを利用している。
- 本研究は,平均を超えるボゴリューボフ=久保=森集団のより高次のキュムラント計算への道を開く。
混雑しないハイパーグラフの独立数:破砕閾値との整合性 [math.CO, cs.DM, cs.DS]目的:混雑しないハイパーグラフにおける独立数の上限決定
- 制約充足問題,計算複雑性理論,統計物理など,幅広い分野で重要な研究対象である。
- ハイパーグラフの独立数の最適な定数項を決定することは,長年の未解決問題である。
- 破砕閾値との整合性を示すことで,この問題に新たな知見をもたらすことを目指す。
- 混雑しないハイパーグラフは,破砕閾値に達することが証明された。
- これにより,破砕閾値と独立数が一致する初めての擬似ランダムなハイパーグラフクラスが得られた。
- 効率的な独立集合探索アルゴリズム(静的および分散環境)が構築可能であることが示された。
デジタル無線通信における汎用多次元シンボル構成と実用的な側面 [eess.SP, cs.IT, math.IT]目的:デジタル無線通信における任意の対称関数計算のための汎用多次元シンボル構成
- 無線通信の効率化は,情報社会の発展に不可欠である。データ伝送速度の向上とエネルギー消費の削減が求められている。
- 従来の無線通信では,受信側での複雑な処理が必要であり,計算資源の制約が課題となっていた。
- 本研究は,無線通信における計算処理を効率化し,受信側の負担を軽減することを目的とする。
- 本研究では,対称関数を計算するためのシンボル構成のカテゴリ表現を提示し,その有効性を示した。
- 低コストなノードを用いたプラットフォームを構築し,GPSやケーブルに依存しないコヒーレントOAC実験を実現した。
- 提案モデルに基づき,コヒーレントOACにおける位相と振幅の統計的特性を評価し,性能を検証した。
トポロジカル符号の最小重み復号に対する多項式時間近似スキーム [quant-ph, cs.DS]目的:トポロジカル符号の最小重み復号問題に対する多項式時間近似スキームの存在
- 量子誤り訂正は,信頼性の高い量子コンピュータ実現に不可欠であり,トポロジカル符号はその有力な候補である。
- トポロジカル符号の復号問題はNP困難であり,効率的な復号アルゴリズムの開発が課題となっている。
- 本研究は,トポロジカル符号の最小重み復号問題に対し,多項式時間で近似解を得るスキームを提案する。
- 2次元トポロジカル符号の最小重み復号問題に対し,任意の定数ε>0に対して,最小値の(1+ε)倍以内の重みの復元演算子を多項式時間で求められることが示された。
- このアプローチは,巡回セールスマン問題に対するAroraのPTASに基づき,点状励起と紐状誤りによって復号が記述できる場合に適用可能である。
- したがって,2次元を超え,特定の高次元トポロジカル符号や量子メモリにも拡張できる。
CSIに基づくニューラル測位の空間的・時間的汎化性能 [eess.SP, cs.IT, math.IT]目的:CSI測定値からユーザー位置を推定するニューラルネットワークの汎化性能評価
- 無線測位技術は,屋内および屋外環境における位置情報サービスの基盤であり,重要性が高い。
- 既存研究では,データ分割方法が現実の環境を反映しておらず,汎化性能が過大評価される可能性がある。
- 標準規格に準拠したWi-Fiおよび5G NRシステムを用いて,実際のデータセットにおける空間・時間的汎化性能を検証する。
- 空間的・時間的に異なるデータセットに対し,多層パーセプトロン(MLP)とTransformerの両アーキテクチャが良好な汎化性能を示した。
- 提案するTransformerアーキテクチャは,MLPと比較して位置推定精度が高く,モデルパラメータ数も少ないことが示された。
- 実験結果は,実環境でのニューラル測位システムの設計・運用に有用な知見を提供する。
位置と方向推定のためのチャネルチャート [eess.SP, cs.IT, math.IT]目的:ユーザー機器の位置と方向の推定
- 無線通信において,位置情報と方向推定は,ビームフォーミング等の性能向上に不可欠である。
- 高次元なチャネル状態情報から正確な位置と方向を推定することは困難である。
- チャネルチャートを用いて,教師なし学習による位置・方向推定の精度向上を目指す。
- 提案手法は,実世界の5G NRシステムからのCSI測定において,教師あり学習と同等の精度を達成した。
- 新たに提案したorientation triplet lossが,角度の周期性を考慮した方向推定に貢献した。
- alignment lossにより,推定された方向を実世界座標に埋め込み,自己教師あり学習を実現した。
誘導サフィックスソートによる文法インデックス [physics.soc-ph, cs.CY, cs.DS]目的:テキストインデックスにおけるパターンマッチングの効率化
- テキストデータ量は増加の一途をたどっており,高速な検索技術が不可欠である。
- 大規模データセットに対するパターンマッチングは,計算コストが高く課題である。
- 文法圧縮に基づくインデックス構造を構築し,効率的なパターンマッチングを実現する。
- 提案手法は,テキスト文法においてパターンコアと呼ばれる部分文字列の類似解析を活用する。
- これにより,パターン長m,出現回数occ,テキスト長nに対して,O(m lg |\mathcal{S}| + occ_C lg|\mathcal{S}| lg n + occ)の検索時間を達成する。
- 実験結果から,提案手法は繰り返し性の高いテキストにおいて,長いパターンの検索に優れることが示された。
Ant Groupにおける大規模コード分析の原則と実践:データおよび論理指向アプローチ [cs.SE, cs.PL]目的:大規模コード分析のためのデータシステム
- ソフトウェアの規模拡大に伴い,静的コード分析の重要性が増している。
- 既存のツールは,クロス言語分析や大規模データ処理に課題がある。
- 大規模なコードベースに対応できる効率的な分析基盤の構築。
- CodeFuse-Queryは,Datalogと二層スキーマCOREFを用いてソースコードをデータファクトに変換する。
- ドメイン最適化システム設計により,リソース利用効率とデータ再利用性を向上させている。
- 実環境での運用により,1日100億行のコードに対し30万件以上の分析タスクを処理可能であることが示された。
コール・バイ・ニードの鏡像:愚かな値の振る舞い [cs.LO]目的:ラムダ計算におけるコール・バイ・ニード評価の理解深化
- 関数型言語の効率的な評価戦略は,プログラムの性能に大きく影響する。
- コール・バイ・ネームとコール・バイ・バリューにはそれぞれ長所と短所があり,最適な選択が難しい。
- コール・バイ・ニードの特性を理解するため,その対極にある評価戦略を定義し検証する。
- コール・バイ・シリーという,コール・バイ・ニードの対照的な評価戦略を設計し,その性質を検証した。
- コール・バイ・シリーは,コール・バイ・バリューと同等の文脈的等価性を持つことが示された。
- コール・バイ・シリー戦略は,計算における最大ステップ数を達成することが証明された。
ネオ・パース関係の演算 [cs.LO]目的:ネオ・パース関係の演算の完全な公理化
- 関係演算は,論理学の基礎であり,データベース理論や知識表現にも応用が広がっている。
- 関係演算の完全な公理化は未解決問題であり,多くの否定的な結果が存在した。
- 伝統的な構文から図式的な構文へ移行することで,この問題を解決することを目指す。
- 関係演算の完全な公理化が可能であることを,新しい図式的なアプローチによって示した。
- このアプローチは,従来の演算よりも表現力が高く,一階論理と同程度の表現力を持つ。
- カルテシアンと線形二カテゴリの組み合わせによって,公理系を構築した。
設計図優先,モデル後: 決定論的LLMワークフローの枠組み [cs.SE, cs.AI, cs.PL]目的:決定論的なLLMワークフローの枠組み
- LLMは強力だが,その非決定性は厳格な手順遵守が求められる環境での利用を制限する。
- 既存のアーキテクチャは,高レベルな計画と低レベルな実行を単一の生成プロセスで混同している。
- 手順の忠実性と予測可能な実行を保証するLLMワークフローの枠組みを提案する。
- 提案手法「Source Code Agent」は,実行手順をソースコード化し,決定論的エンジンで実行する。
- TravelPlannerベンチマークにおいて,最終合格率が35.56%と,最先端のベースライン(18.00%)を97.6%上回る。
- 制約違反を96.0%削減し,実行効率を27.1%向上させる。ScienceWorldやALFWorldでも同様の結果が得られた。
コードに対する回帰言語モデル [cs.CL, cs.AI, cs.LG, cs.PF, cs.SE]目的:コード実行の数値結果の予測
- ソフトウェア開発における性能評価の自動化が重要である。
- 従来の方式は,専門的な特徴量エンジニアリングに依存していた。
- 大規模言語モデルを用いて,コードの性能予測を自動化する。
- 提案手法は,PythonやC++などの複数言語におけるメモリ使用量を予測できる。
- Triton GPUカーネルの遅延や,ONNX形式のニューラルネットワークの精度と速度も予測可能である。
- NAS設計空間における予測性能が,既存のグラフニューラルネットワークを上回る結果が得られた。
学習を取り入れた形式的推論:契約合成から成果物再利用,形式意味論へ [cs.SE, cs.AI]目的:形式手法と人工知能の交差点における,次世代検証システムの構築
- ソフトウェアの信頼性確保は重要であり,特に複雑化するシステムにおいて形式手法の役割は大きい。
- 従来の形式手法は,知識の再利用が難しく,専門家の負担が大きいという課題がある。
- 過去の検証努力を再利用し,検証プロセスを加速する新しいパラダイムの実現を目指す。
- 大規模言語モデルとグラフ表現を組み合わせたハイブリッドフレームワークを提案し,スケーラブルな意味的マッチングと形式的な健全性を両立した。
- このフレームワークは,異質な表記や抽象レベル間での意味ガイダンスを提供し,検証成果物の原理に基づいた再利用を可能にする。
- 組成的推論に基づき,過去の検証努力を体系的に活用し,進化する検証エコシステムを指向する。
ベクトル量子化における普遍性の代償は最大0.11ビットである [cs.IT, cs.LG, math.IT, stat.ML]目的:ベクトル量子化における普遍的コードブックの性能限界
- 大規模言語モデルの効率化が求められる現代において,重み量子化は重要な技術である。
- 最適な重み量子化は入力データXの統計量に依存し,実用上の課題となっていた。
- 入力データXの統計量に依存しない,普遍的なコードブックの存在可能性を示す。
- ガウス分布に従う重みWに対し,普遍的コードブックはXに適応されたコードブックと比較して,次元あたり0.11ビット以下の性能劣化で済むことが示された。
- 本研究は,あらゆるヒルベルトノルムにおいて,球をほぼ最適に覆う点の集合(ネット)の存在を示す。
- この普遍的コードブックは低精度保存形式として理想的だが,現時点では構成方法が不明である。
差分プライバシーに基づくグラフ彩色 [cs.CL, cs.DS]目的:グラフ彩色における差分プライバシーの実現
- データ分析においてプライバシー保護の重要性が高まっており,差分プライバシーは標準的な手法である。
- グラフ彩色において差分プライバシーを確保すると,完全な彩色(proper coloring)は不可能となる。
- 最小限の色数と最小限の欠陥(defect)を持つ,差分プライバシーを保証する彩色アルゴリズムを設計する。
- 提案アルゴリズムは,色の再サンプリングに指数メカニズムを用いることで,エッジ差分プライバシーを達成する。
- $d$-帰納グラフに対して,$3\epsilon$-差分プライバシーと$O(\frac{\log n}{\epsilon}+d)$の最大欠陥を持つ彩色を$O(\frac{\Delta}{\log n}+\frac{1}{\epsilon})$の色数で実現する。
- ノイズ付き閾値処理を用いることで,全てのグラフに対して$O(\frac{\log n}{\epsilon})$の最大欠陥を持つ彩色を$O(\frac{\Delta}{\log n}+\frac{1}{\epsilon})$の色数で実現する。
プログラムハイパーグラフ:幾何代数,空間計算,物理認識コンパイルのための多方向関係構造 [cs.CL, cs.PL, cs.AR]目的:幾何代数,空間計算,物理認識コンパイルのための多方向関係構造の確立
- 異種計算の効率化が重要であり,従来のコンパイル技術では対応が難しい
- スカラー・テンソル計算以外の構造的表現力不足が課題であった
- 幾何代数の計算や空間データフローアーキテクチャの制約に対応する
- プログラムハイパーグラフは,バイナリエッジを任意の次数を持つハイパーエッジに一般化する。
- クリフォード代数の次数は,既存の次元型システムにおける次元軸として自然に表現される。
- プログラムハイパーグラフは,コンパイルにおける幾何学的正確性,メモリ配置,数値精度選択,ハードウェア分割を統合的に実現する。
構成により決定可能:信頼できるAIのための設計時検証 [cs.PL, cs.AI, cs.LG, cs.LO]目的:信頼性の高いAIシステムの設計時検証手法の開発
- AIの応用が拡大する中,その安全性と信頼性の確保が重要課題となっている。
- 既存手法では,AIモデルの検証を学習後に実施するため,計算コストが高い。
- モデルの設計段階で検証可能にすることで,効率的かつ信頼性の高いAI開発を目指す。
- AIモデルの数値的安定性,計算の正確性,物理法則との整合性を設計時に検証できるフレームワークを提案した。
- このフレームワークは,有限生成アベル群の制約として表現可能な特性を利用し,多項式時間で決定可能な検証を実現する。
- Hindley-Milner unificationを用いた型推論が,Solomonoffの普遍的事前分布に基づく最大事後仮説計算に相当することを示した。
再帰的に微分可能な準群の構成と,再帰的$[4,2,3]_{26}$-コードの例 [cs.RO, cs.IT, math.CO, math.IT]目的:再帰的MDSコードと再帰的に微分可能な準群の構成
- 符号理論において,効率的な誤り訂正はデータ伝送の信頼性確保に不可欠である。
- 特定の有限体サイズにおいて,再帰的MDSコードの存在が未解決であった。
- 有限体サイズ$q=26$における再帰的MDSコードの構成を提供する。
- 本研究では,完全な巡回メンデルゾン設計を利用して,再帰的MDSコードを構成している。
- 特に,有限体サイズ$q=26$において,再帰的$[4,2,3]_{26}$-コードの具体的な構成を提示した。
- さらに,低次数の再帰的に微分可能な準群の存在に関する既知の限界を改善した。
階層型クラスタリングにおける許容可能な目的関数の特徴づけ [cs.DS, cs.LG]目的:階層型クラスタリングのための許容可能な目的関数の性質の解明
- データ分析の基本的なタスクであり,様々な分野で活用されているため。
- 従来の階層型クラスタリング法は,原理に基づいた明確な目的関数を欠いていた。
- 許容可能な目的関数の条件を明確にし,より良いクラスタリング手法の確立を目指す。
- 本研究では,集約型および最大型目的関数について,許容可能性の条件を完全に特徴づけることができた。
- 特に,集約型目的関数のスケーリング関数が2次以下の対称多項式の場合,許容可能性の条件を完全に特定した。
- また,許容可能な目的関数に対する再帰的なスパースカットアルゴリズムの近似率がO(φ)であることを示した。
確率的命令型プロセス代数 [cs.LO]目的:確率的選択演算子を含むプロセス代数の拡張
- 分散システムは現代の情報処理の基盤であり,その設計と検証が重要である。
- 分散アルゴリズムのモデル化には確率的な要素が不可欠だが,既存のプロセス代数では対応が困難である。
- 確率的アルゴリズムのモデル化と解析を可能にするプロセス代数の拡張を目指す。
- 提示されたプロセス代数は,確率的選択を優先的に解決するという原理に基づいている。
- リーダー選出問題に対する確率的アルゴリズムを,このプロセス代数を用いてモデル化することができた。
- この拡張により,分散コンピューティングにおける重要なアルゴリズムのモデリングと解析が可能となる。
複数$b$-バースト削除訂正符号の上界 [cs.IT, math.CO, math.IT]目的:複数$b$-バースト削除訂正符号のサイズに関する上限
- DNAストレージシステム等の応用から,連続削除に耐性を持つ符号の研究が重要視されている。
- 複数回の連続削除を訂正する符号のサイズ上限は未だ明確で,改善の余地があった。
- 削除球の構造的性質を明らかにし,符号のサイズ上限と下限を導出することで,この問題を解決する。
- 符号の削除球の構造に関する性質を特徴付けた。
- 既存の結果を改善する上限および組合せ的な下限を導出した。
- 特定の条件下では,導出された上限が漸近的に最適であることが示された。
Clefプログラミング言語における固定小数点スキャフォールディング [cs.CY, cs.PL, cs.LO, math.CT]目的:Clefプログラミング言語のコンパイラにおける,構造的性質を保持する固定小数点演算子の利用
- 安全性と信頼性が求められるプログラム開発において,コンパイラの正当性保証は重要な課題である。
- 従来のコンパイラは,中間表現における構造情報の損失や,検証の困難さといった問題を抱えている。
- 本研究は,コンパイラパイプライン全体を通して構造情報を保持し,検証を可能にする新たな手法を提案する。
- コンパイラの中間表現としてMLIRを活用し,固定小数点演算子を用いてプログラム意味グラフの構造を保存する。
- コンパイラの低レベル化過程を,コンピレーション poset からターゲットカテゴリへの関子として形式的に表現し,構造的性質を数学的に保証する。
- オホリの機械コード証明論,パラメトリック性,随伴モード論を基盤とし,負と分数の型を拡張することで,型システムと検証ツールを構造的に保存する。
忠実性フレームワークにおける負の型と分数の型 [cs.DB, cs.HC, math.CT, cs.PL]目的:負の型と分数の型を,忠実性フレームワークのネイティブな第一級構成要素として導入する研究
- 汎用計算フレームワークでは実現困難な計算モダリティに対応するため,より表現力の高い型システムの基盤が必要である。
- 既存のソフトウェアエコシステムでは,ベイズ推論や量子計算など,特定の計算領域に直接対応できない場合がある。
- 忠実性フレームワークのNTU(Native Type Universe)を活用し,これらの計算領域を扱える型システムを構築することを目指す。
- 負の型と分数の型は,決定可能性と主型性を維持しつつ,簡潔な解決策を可能にするイソモルフィズムをもたらす。
- ベイズ推論においては,分数の型が条件付けの義務を表現し,量子計算では負の型が型レベルでの随伴を提供する。
- 断熱計算では,負の型と分数の型を組み合わせることで,ハミルトニアン変形を可逆的な制約伝播過程として表現できる。
コード寿命生存率分析(CLSA):ASTを意識したマイニングによるソースコード行の生存予測 [cs.SE]目的:ソースコード行の削除予測
- ソフトウェアの保守性向上は重要であり,削除されやすいコード特定が鍵となる。
- 既存研究はファイルやメソッド単位であり,個々の行のリスク評価が困難である。
- 個々のコード行に着目し,削除リスクを予測する新しいフレームワークを提案する。
- 多くのコード行は削除されず,削除される行の寿命中央値は95.7日である。
- 行のシャノンエントロピーは,新しいコードや成熟したコードに対して保護的に機能する。
- リポジトリ固有の影響が最大であり,モデルの精度向上に貢献する。
Lean4Agent:エージェントのワークフローと軌跡の形式モデリングと検証 [cs.AI, cs.LG, cs.LO, cs.SE]目的:エージェントのワークフローと軌跡の形式モデリングおよび検証
- 大規模言語モデルの活用が進む中,信頼性の高い多段階ワークフローの実行が重要課題となっている。
- 既存のエージェントシステムは,ワークフローや実行軌跡の仕様,検証,デバッグのための形式手法が不足している。
- Lean4を用いた形式手法により,エージェントのワークフローの一貫性を検証し,実行時エラーの特定を可能にすること。
- Lean4Agentは,Lean4という依存型形式言語を用いてエージェントの振る舞いをモデル化・検証する初のフレームワークである。
- 検証に合格したワークフローは,不合格のものと比較して平均11.94%高い性能を示すことが実験で確認された。
- LeanEvolveは,SWEベンチマークにおいて平均7.47%の性能向上を実現し,ワークフローの改善に貢献する。
個別化がん治療のための信念空間制御:能動推論によるアプローチ [cs.RO, cs.CL, cs.AI, cs.IT, math.IT]目的:個別化がん治療における最適な治療方針の決定
- がん治療は患者の状態や反応が多様であり,個別化された治療計画が不可欠である。
- 従来の強化学習は状態遷移の制御に重点を置いており,治療による患者の状態変化を考慮しにくい。
- 能動推論を用いて,測定予算と治療効果を同時に最適化する治療計画を策定すること。
- 実際の臨床データを用いて,患者の分類と高い治療効果を両立できることを示した。
- 提案手法は,測定予算や治療の制約下においても有効であることが確認された。
- 能動推論に基づく信念空間制御が,個別化がん治療の新たな道を示す可能性が示唆された。
DeNovoSWE:最初から完全なリポジトリを生成するための長期間環境の拡張 [cs.SE]目的:完全なリポジトリ生成のための大規模データセット
- LLMを活用したコードエージェントの能力向上に伴い,局所的なバグ修正を超えたソフトウェア開発への期待が高まっている。
- 大規模で検証可能な完全リポジトリ生成データの不足が,長期間のソフトウェアエンジニアリングタスクの学習を困難にしている。
- DeNovoSWEは,高品質なリポジトリ生成データを提供することで,長期的なソフトウェアエンジニアリングタスクの学習を促進する。
- DeNovoSWEは,ドキュメントから完全なリポジトリを生成する4,818件の高品質なインスタンスを含む大規模データセットである。
- 自動化されたサンドボックス化されたエージェントワークフローにより,人的なアノテーションなしに大規模なキュレーションが可能である。
- Qwen3-30B-A3BをDeNovoSWEでファインチューニングすることで,BeyondSWE-Doc2Repoベンチマークのスコアが5.8%から47.2%に大幅に向上した。
型付き拡張決定図によるスケーラブルな確率的プログラム検証 [cs.PL]目的:確率的プログラムの検証におけるスケーラビリティ向上
- 確率的プログラムの安全性や信頼性を保証する検証技術は重要である。
- 確率的プログラムのループ展開による検証コストが指数関数的に増加する問題がある。
- 型付き拡張決定図を用いて,ループ展開時の状態爆発を抑制し検証を効率化する。
- 型付き拡張決定図(TEDD)を用いることで,最弱前提条件(WP)の計算が可能となった。
- SMTソルバーによる枝刈りにより,TEDDの表現を更に縮小することに成功した。
- TEDD上で検証規則を適用することで,従来手法よりも大幅なスケーラビリティ向上が確認された。
ScratchLens: Scratchプログラムの行動的同値性をレンズパラメータで検証 [cs.PL, cs.SE]目的:Scratchプログラムにおける行動的同値性の判定
- 教育的プログラミング環境において,プログラムの理解と評価が重要であるため。
- プログラムの構文が異なっていても行動が同じ場合があり,従来の比較方法では正確な判定が困難である。
- Scratchプログラムの行動的同値性を正確かつ効率的に判定する手法を開発すること。
- ScratchLensは,プログラムの因果関係を明確化し,様々な観点から行動的同値性を検証する。
- 実際のScratchプロジェクトを用いた実験で,444組の検証済みペア全てを判定し,誤った同値性主張はなかった。
- 従来の比較手法では見逃されていた違いを検出できることが示された。
AGENTS.mdファイルの構成スメル:コーディングエージェント設定の一般的な誤り [cs.SE]目的:コーディングエージェント設定ファイルの構成スメルのカタログ
- ソフトウェア開発における自動化の重要性が増しており,コーディングエージェントの活用が広まっている。
- エージェント設定ファイルの定義と維持に関する問題点が十分に解明されていない。
- コーディングエージェント設定ファイルにおける問題点を特定し,検出可能なスメルのカタログを提示する。
- コーディングエージェント設定ファイルにおいて,構成スメルが広く存在することが示された。
- 最も一般的なスメルはLint Leakage (62%) であり,Context Bloat (42%),Skill Leakage (35%) がそれに続いた。
- Context Bloat,Skill Leakage,Conflicting Instructionsなどのスメルが頻繁に共存することが確認された。
強連結性と強二連結性に関する問題 [cs.DS]目的:強連結かつ強二連結なグラフに対する最小辺部分グラフの計算
- ネットワークの信頼性や頑健性を評価する上で,グラフの連結性は重要な指標である。
- グラフの一点を削除しても強連結性が維持されるような最小の辺集合を見つける問題は難しい。
- 特定の頂点集合を削除しても強連結性を保つ最小辺部分グラフの求めを試みる。
- 強連結かつ強二連結なグラフに対し,指定された条件を満たす最小辺部分グラフを求める問題に対する近似アルゴリズムを提案した。
- 提案アルゴリズムは,多項式時間で7-近似解を導出できることを証明した。
圏論的確率における絶対連続性,支持,べき等分割 [math.PR, cs.LO, math.CT]目的:マルコフ圏における確率論に関連する概念の発展
- 確率・統計の高度な枠組みとしてマルコフ圏が注目されている。
- 絶対連続性や支持の定義が未整備であり,べき等分割の構造が不明確である。
- マルコフ圏におけるべき等分割の一般論と,具体的な分割定理を確立すること。
- 標準ボレル空間間の測度可能なマルコフ核は,別の標準ボレル空間を通してべき等分割されることが示された。
- この結果は,マルコフ圏におけるべき等分割の一般的な圏論的基準の帰結として導かれた。
- 絶対連続性や支持の定義が改良され,マルコフ圏における確率論の定式化が促進される。
単純および部分直接既約時間ヘイティング代数の二重特徴づけ [math.LO, cs.LO]目的:時間ヘイティング代数と時間エスキア空間の圏に対するエスキア双対性
- 時間ヘイティング代数は,時間論理の代数的な基盤であり,その性質理解は重要である。
- 時間ヘイティング代数の構造に関する体系的な理解が十分に進んでいない。
- 時間ヘイティング代数の単純性や部分直接既約性に関する特徴づけを明確にすること。
- 時間ヘイティング代数と時間エスキア空間の圏に対し,反変同値性が成立することが示された。
- 関連する空間/フレーム上の「到達可能性」の概念を研究し,有限の場合にその同値性が示された。
- 時間ヘイティング演算の有限モデル特性と関係完全性に関する結果が得られ,論理の有限で理解しやすいフレームが得られた。
量子HPCソフトウェアスタックとopenQSE参照アーキテクチャ:サーベイ [quant-ph, cs.DC, cs.ET, cs.SE]目的:量子HPCソフトウェアスタックの現状分析と統一アーキテクチャの提案
- 高性能計算への量子資源の統合が進む中,ソフトウェア基盤の標準化が重要である。
- 既存の量子HPCスタックは独立性が高く,共通インターフェースが不足している。
- 量子HPCエコシステムの相互運用性と柔軟性を高めるための参照アーキテクチャを提示する。
- 9つの実運用量子HPCスタックを分析し,共通パターンと要件を特定した。
- runtime抽象化,リソース管理,接続セマンティクス,可視化における一貫したニーズを明らかにした。
- openQSE参照アーキテクチャを提案し,量子HPCエコシステムの統一化に向けた第一歩とする。
- 1
- 2
