arXiv雑要約
プログラム - 2026/05/19 公開
推移閉包論理におけるガード付き否定 [cs.CG, cs.LO]目的:ガード付き否定推移閉包論理の充足可能性問題
- 知識表現や推論において重要な役割を担う推移閉包論理の理論的基礎研究。
- ガード付き否定を含む推移閉包論理の充足可能性問題の複雑性解析は未解決であった。
- ガード付き否定推移閉包論理の充足可能性問題の計算複雑性を決定すること。
- ガード付き否定推移閉包論理の充足可能性問題は2ExpTime-完全であることが示された。
- その結果として,UNTCおよびUNFOregの充足可能性問題も$\mathsf{P}^{\mathsf{NP}[\mathcal{O}(\log^2 n)]}$-完全であることが導かれた。
- モデル検査問題についても$\mathsf{P}^{\mathsf{NP}[\mathcal{O}(\log^2 n)]}$-完全であることが示された。
ニューラルCSI圧縮のファインチューニング:モデル更新の通信コストの抑制 [cs.CL, cs.IT, eess.SP, math.IT]目的:ニューラルCSI圧縮におけるレート歪み性能の向上
- FDD-MIMOシステムにおいて,大規模なフィードバックオーバーヘッドが課題であり,効率的なCSI圧縮が不可欠である。
- 深層学習に基づくCSI圧縮技術は高性能だが,無線環境の変化に対する汎化性能が低いという問題がある。
- 標的環境の近年のCSIサンプルを用いて,エンコーダとデコーダを同時に更新することで,汎化性能の向上を目指す。
- ファインチューニングにより,モデル更新のコスト増を相殺しつつ,ニューラルCSI圧縮のレート歪み性能が大幅に向上することが示された。
- モデル更新のビットレートをファインチューニングの目的関数に組み込み,また疎なパラメータ更新を促進する事前分布を用いることで,通信コストを抑制した。
- 評価期間,量子化解像度,標的ドメインデータセットのサイズが,フィードバック効率に影響を与えることが分析された。
コーディング問題における解釈可能な知識トレースのための自動知識コンポーネント生成 [cs.AI, cs.CL, cs.CY, cs.LG, cs.SE]目的:コーディング問題に対する知識コンポーネントの自動生成と知識トレース
- オンライン学習プラットフォームにおいて,学習者の習熟度を詳細に把握し,個別最適化された学習支援を行う上で重要である。
- 知識コンポーネントの作成と問題へのタグ付けは専門家による手作業に頼っており,時間と労力がかかる。
- 大規模言語モデルを用いて知識コンポーネントを自動生成し,より効率的な知識トレースを実現することを目指す。
- 提案手法KCGen-KTは,既存の知識トレース手法や専門家が作成した知識コンポーネントよりも,将来の学生の解答予測において優れた性能を示した。
- 生成された知識コンポーネントの学習曲線分析から,認知モデルへの適合度において,専門家が作成したものより優れていることが示された。
- コースインストラクターによる評価の結果,提案手法が生成する問題と知識コンポーネントの対応関係は妥当な精度を持つことが確認された。
有向グラフにおけるランダムウォーク確率の推定 [cs.DS]目的:有向グラフにおける割引ランダムウォークの終了確率の推定
- ウェブページ間の関連性評価など,ネットワーク構造の分析において重要な概念である。
- 既存研究では,計算量に関する上限と下限の間にギャップが存在する場合が多い。
- 様々な問題設定とクエリ組み合わせに対して,上限と下限をtightに定めることを目指す。
- 本研究では,最悪ケースと平均ケースの両方において,既存のギャップを解消するタイトな上限と下限を確立した。
- 古典的なべき乗法と比較して,提案手法は任意の小さな確率を決定的に,より高速に推定できる。
- 単一ペア問題に対する下限を改善し,最適解に近づけた。
フィードバック頂点数によるツリー幅のパラメータ化 [cs.DS, cs.DM]目的:グラフの最適なツリー分解の計算
- パラメータ化された複雑性理論において,グラフアルゴリズムの効率的な設計に不可欠である。
- ツリー幅に対する単一指数時間アルゴリズムの存在が未解決問題となっている。
- フィードバック頂点数に基づいた,より効率的なツリー分解アルゴリズムの構築。
- 与えられたグラフGに対し,フィードバック頂点数に関して単一指数時間で最適なツリー分解を計算するアルゴリズムを初めて提案した。
- 既存の頂点被覆数によるアルゴリズムと比較し,計算時間が改善された。
- グラフGにおいて,フィードバック頂点数がツリー幅の二乗よりも小さい場合,KorhonenとLokshtanovのアルゴリズムよりも優れている。
Solidityスマートコントラクトに対する脆弱性検出ツールの実証的分析 [cs.SI, cs.SE]目的:Solidityスマートコントラクトの脆弱性検出ツールに関する検出効果の評価
- ブロックチェーン技術の普及に伴い,スマートコントラクトのセキュリティ確保は喫緊の課題となっている。
- 既存の脆弱性検出ツールは,その精度や信頼性にばらつきがあり,十分な対策が求められている。
- 本研究は,複数のツールを組み合わせることで,より精度の高い脆弱性検出を可能にすることを目指す。
- 2,182件のスマートコントラクトのデータセットを用いて,20の脆弱性分析ツールの検出効果を評価した。
- DASP TOP 10の分類に基づき,様々な種類の脆弱性に対するツールの検出能力を比較検討した。
- 3つのツールを組み合わせることで,平均1分以内に76.78\%の脆弱性を検出できることが示された。
NVDレコードと脆弱性修正コミットのマッピング:どれほど難しいか [cs.SE, cs.CR]目的:NVDレコードと脆弱性修正コミットとのマッピング
- 脆弱性分析において,NVDレコードと脆弱性修正コミットの対応付けは不可欠である。
- NVDレコードの参照情報が希薄であり,明示的なリンクが少ないという課題がある。
- Git参照の活用と外部データベース連携によるマッピング率の向上を目指す。
- Git参照を用いることで,86%以上の成功率で脆弱性修正コミットを特定可能であることが示された。
- 構築した自動パイプラインは,20,360件のNVDレコードから31,942件の脆弱性修正コミットを87%の精度で抽出した。
- 外部セキュリティデータベースやGitHubからの情報統合により,NVDレコードの11.3%をマッピングできた。
デコンボリューションによる多参照アライメント [cs.IT, eess.SP, math.IT, math.ST, stat.TH]目的:シフトおよびノイズの影響を受けた観測データからの信号関数の推定
- 信号処理において,複数の参照点からの情報統合は重要である。ノイズ環境下での信号復元は課題である。
- 多参照アライメントは,参照データのずれやノイズの影響を受けやすく,正確な信号推定が困難である。
- 本研究では,デコンボリューションの理論を応用し,多参照アライメントにおける信号推定の精度向上を目指す。
- 多参照アライメントとデコンボリューションの間に新たな関係性が明らかになった。信号は,第二階統計量から推定可能である。
- Kotlarskiの公式を拡張することで,高次元における信号推定が可能となり,デコンボリューション理論に貢献する。
- 理論的考察と数値実験を通じて,提案手法の有効性が検証された。
Leanと理論計算機科学の融合:形式-非形式ペアにおける定理証明問題の拡張的な合成 [cs.LO, cs.AI, cs.CL, cs.LG]目的:形式定理証明の課題を大規模に生成する手法
- 大規模言語モデルの推論能力評価において,形式定理証明が重要な役割を担っている。
- 手動キュレーションのコストが高く,検証済みの形式-非形式対応問題が不足しているため,データセットの拡充が課題である。
- 理論計算機科学の厳密な証明問題を利用し,形式-非形式ペアを自動生成することで,検証問題の大規模データセットを構築する。
- 本研究では,計算機科学の分野(ビジービーバー問題,混合ブール代数問題)で自動的に問題を生成するフレームワークを開発した。
- 最先端モデル(DeepSeekProver-V2-671B)を用いた評価により,ビジービーバー問題では57.5%の成功率であったが,混合ブール代数問題では12%に低下した。
- これは,検証が容易な問題であっても,長編証明の生成が困難であることを示しており,自動推論研究の進展に貢献する。
PseudoBridge:コード検索におけるより良い意味的・論理的整合性のための擬似コードの架け橋 [eess.SY, cs.SY, cs.SE]目的:自然言語のクエリとコードのスニペット間の関連性を特定すること
- ソフトウェア開発において,大規模なコードベースから関連コードを迅速に見つけることは不可欠である
- 既存の手法では,人間の意図と機械の実行ロジック間の根本的な意味的ギャップが存在する
- 擬似コードを導入することで,自然言語の意味とプログラミング言語の論理を整合させることを目指す
- PseudoBridgeは,10種類のPLMと6つの主要なプログラミング言語において,既存のベースラインを常に上回る性能を示した
- 特にゼロショットシナリオ(SolidityやXLCoSTなど)において,汎化性能が大幅に向上することが確認された
- オープンソースLLMや高度な埋め込みを用いた評価により,PseudoBridgeの利点が特定の閉鎖ソースモデルに依存しないことが示された
CからSafe Rustへの翻訳の正確性向上のための敵対的エージェント協調 [cs.SE, cs.AI]目的:CからRustへの翻訳における正確性向上
- レガシーCソフトウェアに存在するメモリ安全性の脆弱性を防ぐ上で,Rustのようなメモリ安全な言語への翻訳は重要である。
- 既存の翻訳ツールでは,テストスイートに含まれない入力に対してRustコードがCソースから逸脱する正確性の問題が存在する。
- 敵対的探索を通じて,翻訳のずれを検出し,その結果を用いてRust翻訳を改善することで,この問題を解決する。
- ACToRは,翻訳エージェントと識別エージェントの敵対的ループを用いて,Cソースからの乖離を検出し,Rust翻訳を反復的に洗練させる。
- 63の実際のCユーティリティにおいて,人間の介入なしで90%以上のテスト合格率を達成した。
- ACToRは,使用する翻訳ツールやLLMに依存せず,既存の翻訳器C2SaferRustの検証合格率を16.6%向上させた。
多クラス予測における真実性に基づく校正誤差 [cs.LG, cs.DS, stat.ML]目的:多クラス予測における校正誤差の測定における真実性の実用的な役割
- 確率的予測モデルの評価・比較・調整には校正誤差が不可欠である。予測値が確率として解釈できるため。
- 従来の校正誤差指標は真実性を持つとは限らず,確率を歪めることで良い結果を示す可能性がある。
- 多クラス予測において真実性を持つ校正誤差を定義し,その意思決定論的含意を明らかにすること。
- 多次元線形特性に対する真実性を持つ校正誤差を導入し,二値予測の枠組みを一般化した。
- 真実性を持つ校正誤差はBlackwell支配を維持し,より情報量の多い校正モデルはより低い誤差を示す。
- ビン分割数変化によるランキングの不安定性問題に対し,真実性を持つ誤差がより安定したランキングを提供する。
辞書式コスト関数を持つPLS完全問題:Max-$k$-SATとアーベル置換軌道最小化 [cs.CC, cs.DS]目的:辞書式コスト関数を持つ最適化問題の複雑性
- 局所探索による最適化は計算機科学における重要な課題であり,様々な応用分野が存在する。
- PLS問題はNP困難であり,効率的なアルゴリズムの発見が難しい。
- 辞書式コスト関数を持つ問題のPLS完全性を示すことで,問題の難易度を明らかにすること。
- Max-Cutにおける辞書式コスト関数下での最適解は容易に求められる一方で,Max-$k$-SAT問題はPLS完全であることが示された。
- アーベル群を生成する置換群による文字列の局所最小値問題が,群の性質が制限されてもPLS完全であることが証明された。
- この結果を利用し,輻輳ゲームにおける純粋な$\alpha$-Nash均衡の計算複雑性をさらに調査し,簡潔な証明を得た。
事前知識があれば可能:サブ線形グラフアルゴリズムからLLMテスト時手法へ [cs.LG, cs.AI, cs.CC, cs.DS]目的:大規模言語モデルのテスト時拡張における事前知識と外部情報の相互作用の理論的基盤の解明
- 事前知識は,大規模言語モデルの性能に大きく影響し,効率的な推論に不可欠である。
- テスト時拡張において,どの程度の事前知識があれば少ない拡張ステップで回答可能か不明である。
- 事前知識の量と,必要な拡張ステップ数の関係を,グラフ理論的に明らかにすること。
- 事前知識グラフが小さな成分に分断されている場合,効率的な推論は難しく,$\Omega(\sqrt{n})$回のクエリが必要となる。
- 正しい知識の密度が閾値を超え,巨大成分が形成されると,定数回のクエリで経路を見つけられる。
- 多段階推論を知識グラフ上の$s$-$t$連結問題として定式化し,事前知識の量と拡張ステップ数の関係を解析した。
移動アンテナを用いたニアフィールドISACにおける加重和レート最適化 [cs.IT, math.IT]目的:移動アンテナを用いたニアフィールドISACシステムにおける,通信ユーザの加重和レートの最大化
- 将来の無線ネットワークにおいて,通信とセンシングを同時に改善する鍵となる技術としてISACが注目されている。
- ニアフィールドにおける移動アンテナ搭載ISACシステムでは,球面波伝搬により性能向上が困難である。
- 本研究では,移動アンテナを活用し,最小限のセンシング要件を満たしつつ,加重和レートを最大化する。
- 移動アンテナをニアフィールドISACシステムに導入することで,固定アンテナのみのシステムと比較して,大幅な性能向上が確認された。
- 加重和レートは,基地局に近い位置に配置されたユーザにより大きな重みを割り当てることで最大化されることが示された。
- センシング性能は,通信性能と比較して,最小センシングSINR閾値の影響をより大きく受けることが示された。
幾何構造を考慮したオーディオ符号化のための二次元量子化 [cs.SD, cs.AI, cs.IT, cs.LG, eess.SP, math.IT]目的:幾何構造を考慮したオーディオ符号化における二次元量子化方式
- 近年,高品質な音声再構成が可能になり,効率的な音声データ処理が求められている。
- 従来の量子化手法では,潜在空間の幾何構造が制限され,特徴量間の相関を捉えにくいという課題がある。
- 特徴量ペアを二次元グリッドに投影・量子化することで,表現学習やコードブック利用効率の向上を目指す。
- 提案手法Q2D2は,既存の量子化手法と同程度のコードブックサイズで,高い音声圧縮効率を実現した。
- Q2D2は,客観評価・主観評価ともに,最先端モデルと比較して競争力のある,あるいはそれ以上の性能を示した。
- 詳細な消去実験により,本研究のデザインの有効性が確認された。
層状集合系における数え上げ量化子の役割 [cs.LO, cs.FL]目的:層状集合系からの層状木の変換
- グラフ分解は,複雑な問題を扱いやすい部分問題に分割し,効率的なアルゴリズム設計に不可欠である。
- 層状集合系から層状木への変換方法が未解決であり,グラフ分解の理論的基盤の構築を阻害していた。
- 単項2階述語論理(MSO)を用いて層状木への変換を可能にし,グラフ分解の理論的理解を深める。
- 本研究により,層状集合系から対応する層状木への変換が,単項2階述語論理(MSO)による変換で実現可能であることが示された。
- この結果は,Courcelleが提起した未解決問題を解決し,グラフ分解におけるMSOの有効性を示唆する。
- 数え上げ量化子の表現力について考察し,層状集合系においてMSOでシミュレート可能かどうかに関する知見を得た。
高多重度ビンパッキング問題に対するタイトな二重指数時間下限 [cs.CC, cs.DS]目的:高多重度ビンパッキング問題に対するアルゴリズムの時間計算量の下限
- ナップサック問題やビンパッキング問題は,組合せ最適化の古典的NP困難問題であり,様々な応用がある。
- 高多重度ビンパッキング問題では,アイテムの種類数が増加すると計算量が指数関数的に増加する課題がある。
- 本研究は,アイテムの種類数に対するアルゴリズムの時間計算量の下限を厳密に定めることを目指す。
- アイテムの種類数$d$に対して,${{|I|}^2}^{o(d)}$時間で高多重度ビンパッキング問題を解くアルゴリズムは,ETHが成り立たない限り存在しないことが示された。
- 3-SATからの新しい帰着を用いて,ILP問題への効率的なエンコーディングを構築することで証明された。
- この結果は,GoemansとRothvossのアルゴリズムが,パラメータ$d$によるXP時間アルゴリズムの文脈において,ほぼ最適であることを確認する。
ニューラルネットワークからアルゴリズムロジックを抽出する検索拡張生成アプローチ [cs.CV, cs.SE]目的:ニューラルネットワークのアルゴリズムロジックの抽出
- 既存のニューラルネットワークコンポーネントの再利用は研究効率に不可欠である。
- オープンソースリポジトリからそのようなモジュールを発見,抽出,検証することが困難である。
- NN-RAGは,大規模で多様なPyTorchコードベースから検証済みのニューラルモジュールの検索可能なライブラリを構築する。
- NN-RAGは,19の主要リポジトリから1,289個の候補ブロックを抽出し,941個(73.0%)を検証した。
- 検証されたモジュールの80%以上が構造的にユニークであることが示された。
- NN-RAGはLEMURデータセットに72%の新規ネットワーク構造を提供し,アーキテクチャパターンのリポジトリ間での移行を可能にした。
ガウス系列の因果的条件付き指向情報量の非漸近的誤差限界 [cs.RO, eess.SY, cs.SY, cs.IT, math.IT, math.ST, stat.TH]目的:ガウス系列における因果的条件付き指向情報量の推定誤差の評価
- 因果関係の測定は,複雑なシステムの理解や制御に不可欠である。
- 実数値データに対する推定誤差の理論的保証が十分ではなかった。
- ガウス系列に対する推定誤差を明確化し,実用的な推定方法を提供する。
- 提案手法による推定誤差は,サンプルサイズNに対して$O\left(N^{-1/2}\log(N)\right)$のオーダーで収束することが示された。
- この結果は,有限のサンプルサイズでも高精度な推定が可能であることを意味する。
- 本研究は,実用的な因果推論における信頼性向上に貢献する。
トーラスパズルにおけるプッシュ数のほぼ最適な上限 [cs.DS]目的:トーラスパズルのプッシュ数の上限決定
- 組合せ最適化問題の一種であり,計算複雑性理論における基礎研究として重要である。
- 既存の上限が粗く,よりタイトな上限の導出が課題となっていた。
- プッシュ数の上限を改善し,理論的なギャップを縮小することを目指す。
- 本研究では,トーラスパズルを$O(mn \cdot \log \max \{m, n\})$回の回転で解くアルゴリズムを提案した。
- この結果は,プッシュ数の新たな上限を示し,既存の上限と比較して改善された。
- 上限と下限の間のギャップを$\Theta(\max\{m,n\})$から$\Theta(\log \max\{m, n\})$に縮小することに成功した。
DevBench:コード生成モデルのための現実的かつ開発者情報に基づくベンチマーク [cs.HC, cs.LG, cs.AI, cs.SE]目的:コード生成モデルの評価基準
- ソフトウェア開発におけるコード生成の自動化は,生産性向上に不可欠である。
- 既存のベンチマークは,現実のコーディング状況を反映しておらず,モデルの性能を正確に評価できない。
- 現実的な開発環境を考慮した,より信頼性の高い評価基準を構築し,モデルの改善を促す。
- DevBenchは,6言語6カテゴリに及ぶ1800件の実データに基づいた評価インスタンスを含む。
- 最先端モデルのPass@1スコアは43.5%に留まり,ベンチマークの難易度が高いことが確認された。
- 構文精度,意味推論,実用性といった要素におけるモデル間の差異が明らかになった。
ベルヌーイ情報源におけるレート歪み分類表現理論 [cs.IT, math.IT]目的:レート歪み分類表現
- 情報圧縮技術は,データ伝送や保存において不可欠であり,効率的な圧縮手法の開発が求められている。
- 損失圧縮においては,圧縮率と歪みの間のトレードオフが課題であり,分類タスクを考慮した研究は少ない。
- ベルヌーイ情報源に対するレート歪み分類表現の限界を明らかにし,普遍的なエンコーダ設計の指針を与える。
- レート歪み分類表現の1ショット限界と,双対的な歪みレート分類トレードオフを閉形式で導出した。
- 固定された表現によって誘起される歪み分類領域の下限を線形計画法を用いて特徴づけた。
- 普遍性を持つエンコーダに必要な最小漸近レートの上界と下界を計算可能に導き出した。
深層ネットワークにおける最小重み摂動の理論とその低ランク活性化バックドア攻撃への応用 [cs.IR, cs.LG, cs.IT, math.IT]目的:深層ネットワークの出力変化に必要な最小ノルムの重み摂動
- 深層学習モデルの脆弱性評価は,安全性確保の観点から重要である。
- 既存手法では,多層におけるロブスト性の厳密な保証が困難である。
- 最小摂動の理論に基づき,バックドア攻撃の成功限界を定める。
- 単層の厳密解と,多層のLipschitz定数に基づくロバスト性保証が同程度の有効性を持つことが示された。
- 特定の圧縮閾値以下ではバックドア攻撃が成功しないことが証明された。
- 低ランク圧縮により,フル精度を維持しつつ潜在的なバックドアを確実に活性化できることが確認された。
OmniCode:ソフトウェアエンジニアリングエージェントの評価ベンチマーク [cs.SE, cs.AI, cs.CL]目的:ソフトウェアエンジニアリングエージェントの能力評価
- ソフトウェア開発は社会基盤を支える重要な活動であり,その効率化が求められている。
- 既存のベンチマークは限定的なタスクに偏っており,現実のソフトウェア開発を十分に反映できていない。
- 現実的なソフトウェア開発タスクを網羅する,より多様なベンチマークを提供することで,課題解決を目指す。
- OmniCodeは,Python,Java,C++の3言語,バグ修正,テスト生成,コードレビュー修正,スタイル修正の4カテゴリーを含む1794のタスクで構成される。
- タスクは手動で検証され,データ漏洩を防ぐため,新規作成または厳選されたデータを使用している。
- SWE-Agent等の既存エージェントはPythonのバグ修正には強いが,テスト生成やC++,Javaにおいては性能が低いことが示された。
文脈的MetaML:構文と完全抽象化 [cs.PL]目的:MetaML様式のメタプログラミング言語における型安全性とプログラム等価性の検証
- コード生成や最適化など,プログラミング言語の高度な機能を実現する上でメタプログラミングは不可欠である。
- 高階参照が存在する場合,自由変数が束縛から逸脱し,型安全性を確保することが難しいという課題があった。
- 文脈的MetaMLは,型安全性を保証しつつ,オープンなコードの保存と実行を可能とする。
- 文脈的MetaMLは,文脈的モーダル型を用いて自由変数を明示的に追跡し,型安全性を保証する。
- プログラムの意味を保存した最適化を行うために,プログラム等価性の概念とそれを検証する技術が重要となる。
- 文脈的MetaMLに対する文脈的等価性を捉える意味モデルを提示し,命令型MetaML言語における初の完全抽象化結果を得た。
正のゼロ未検出エラー容量を持つシーケンシングチャネルを用いた短分子DNAストレージのための連結符号 [cs.IT, math.IT]目的:ノイズのあるシーケンシングを用いたDNAベースのストレージシステムにおける信頼できる情報の保存量
- DNAストレージは,高密度かつ長期的な情報保存の可能性を秘めており,今後の重要性が増す。
- シーケンシングエラーやランダムサンプリングによる情報損失が,DNAストレージの信頼性を損なう。
- 連結符号化方式により,シーケンシングノイズとサンプリングエラーの両方に対処し,情報保存量を最大化する。
- 外符号はランダムサンプリングへの対応,内符号はシーケンシングノイズへの対応を目的とした連結符号化方式を解析した。
- ゼロ未検出エラー復号器を用いることで,最尤復号器の解析が容易となり,信頼できる情報の保存量のスケーリングに関する上限を導出した。
- ランダム線形ブロック符号における平均エラー確率が,ブロック長とともに指数関数的にゼロに収束することが証明された。
Transformerプログラムの合成と検証 [cs.NI, cs.ET, cs.LG, cs.FL, cs.LO]目的:Transformerプログラムの自動検証および学習手法
- Transformerモデルは自然言語処理等の分野で広く利用され,その性能向上は重要な課題である。
- Transformerプログラムの検証は困難であり,信頼性の高いプログラム開発が課題となっていた。
- C-RASPプログラムの検証・学習アルゴリズムを開発し,Transformerプログラムの信頼性向上を目指す。
- C-RASPの検証にLustreの同期データフロープログラムとの関連性に着目し,高度なSMTソルバーを活用したモデルチェッカーを適用した。
- C-RASPプログラムの学習には,局所探索に基づく新しいアルゴリズムを提案し,その有効性を実証した。
- 提案手法をTransformerプログラム最適化や部分仕様に基づいた制約付き学習に応用可能なことを示した。
インゲルトン不等式に対するスペクトル条件 [cs.IT, math.IT]目的:インゲルトン不等式の成立範囲の解析
- 情報理論において,情報量の限界を理解することは,効率的な情報伝達や処理に不可欠である。
- インゲルトン不等式は,表現可能な matroid では成立するが,エントロピーベクトルに対しては普遍的に成立しない。
- 本研究は,インゲルトン不等式の違反の程度を特定し,その成立条件を明確にすることを目的とする。
- 本研究では,広範なクラスの確率変数$(X,Y)$に対し,インゲルトン不等式が小さな加法誤差内で成立することを示した。
- 特に,相互情報量が抽出不可能であっても,大きな違反は起こらないことが示された。
- この結果は,expanderグラフのスペクトルパラメータを用いて定式化されており,expander mixing lemma と集合の分割技術を組み合わせることで証明された。
ポアンカレ円盤上のガウス多様体の等距不変量化 [cs.IT, math.IT, math.PR]目的:ガウス測度の間のダイバージェンスの定量化
- 情報理論において,確率分布間の差異を測ることは重要である。
- 既存のダイバージェンス指標は幾何学的な解釈が不明確な場合がある。
- ポアンカレ円盤上の等距不変量を用いて,ガウス多様体のダイバージェンスを定量化する。
- 球面におけるHellinger距離とポアンカレ円盤上の等距不変量に幾何学的な双対性があることが示された。
- L2埋め込みされた等距不変量を,ガウス測度のダイバージェンスの新たな定量化方法として提案した。
- 本研究は情報理論におけるダイバージェンスの理解に貢献する。
不確実なガイダンスによるオンラインアルゴリズム [cs.AI, cs.DS]目的:機械学習によるオンライン意思決定のモデル
- オンラインアルゴリズムは,データが逐次的に到着する状況で最適な決定を下すために重要である。
- 従来の機械学習支援アルゴリズムは,予測器の選択に依存し,汎用性に欠ける場合がある。
- 予測器に依存しない汎用的な機械学習支援アルゴリズムの分析フレームワークを確立すること。
- 本研究では,予測とアルゴリズムを分離する「不確実なガイダンスによるオンラインアルゴリズム」モデルを提案した。
- 提案モデルに基づき,既存のオンラインアルゴリズムを機械学習支援型に変換する汎用的なコンパイラ「DTB」を開発した。
- DTBコンパイラを用いて,二部マッチング,キャッシュ,一様計量タスクシステムにおいて良好な性能が確認された。
ToolMATH:系統的なツールカタログ制約下における長期的ツール利用の診断ベンチマーク [cs.CL, cs.LG, cs.SE]目的:長期的ツール利用の診断
- 大規模言語モデルのツール利用能力は,現実世界での応用において不可欠である。
- ツールカタログの変動に対するモデルの適応性やロバスト性の評価が困難であった。
- ツールカタログの制約下でのモデルのツール利用能力を診断し,改善に資すること。
- ToolMATHは,段階的な数学問題の解法を再利用可能なPythonツールに変換し,ツールカタログ条件を制御する。
- 適応性,ロバスト性,ツール接続性の3軸でモデルを評価し,詳細な失敗分析を行った。
- その結果,モデルの信頼性,ツール回避,適応的置換といった異なるプロファイルが明らかになった。
自己合成パイプラインによる学習可能な情報利得の確保が,自己対戦型進化を促進する [cs.LG, cs.AI, cs.CL, cs.IT, math.IT]目的:自己対戦型進化における持続的な学習のメカニズム
- 大規模言語モデルの発展により,自己改善ループの実現可能性が高まっている。
- 従来の自己対戦型システムは,学習可能な情報の増加なくデータ量が増加し,停滞しやすい。
- 自己合成データパイプラインを通じて,学習可能な情報の利得を最大化する。
- 自己進化を維持するためには,反復ごとに学習可能な情報を増加させる自己合成データパイプラインが不可欠である。
- 提案者,解者,検証者の三役構造を特定し,この視点から学習可能な情報利得を改善するシステム設計を3つ提示した。
- 非対称的共同進化,能力拡張,積極的な情報探索が,脆弱な自己対戦から持続的な自己進化への道筋を提供する。
AI時代の人間認証モジュールリポジトリ [cs.ET, cs.AI, cs.SE]目的:AI支援開発における信頼性の高いソフトウェア構築のための新たなアーキテクチャモデル
- AI技術の進化に伴い,ソフトウェアの複雑化が進み,信頼性の確保が重要課題となっている。
- 現在のソフトウェアサプライチェーンには,出所の不明確なコンポーネントや脆弱性が存在するリスクがある。
- AIが安全かつ予測可能なソフトウェアを構築するための,人間によるレビューと自動分析を組み合わせたモジュールリポジトリの確立を目指す。
- 人間認証モジュールリポジトリ(HCMR)というフレームワークを提案し,モジュールの認証と安全な組み立てを支援する。
- HCMRの参照アーキテクチャ,認証ワークフロー,およびモジュールエコシステムの脅威を分析した。
- ガバナンス,スケーラビリティ,AIの説明責任に関する考察を通して,信頼性と監査可能性の高いAI構築ソフトウェアシステムの基盤としてのHCMRの可能性を示した。
高性能強化学習環境の自動生成 [cs.LG, cs.AI, cs.SE]目的:高性能強化学習環境の生成手法
- 強化学習は,ロボット制御やゲームAIなど,様々な分野で応用が期待されている重要な技術である。
- 複雑な強化学習環境を高性能に実装するには,専門的な知識と膨大な工数がかかるという課題がある。
- 本研究は,計算コストを最小限に抑えつつ,高性能な強化学習環境を自動的に生成することを目的とする。
- 提案手法では,プロンプトテンプレート,階層的な検証,反復的な修正,そして異なるバックエンド間でのポリシー転送を用いることで,シミュレーション環境間のギャップをなくす。
- Game BoyエミュレータPyBoyからEmuRustへ,Pokemon ShowdownからPokeJAXへの翻訳,既存実装とのスループット検証,そして新たな環境TCGJaxの生成に成功した。
- 生成された環境のオーバーヘッドは,200Mパラメータモデルにおいて,学習時間の4%以下に抑えられた。
公共交通路線の早期枝刈り [cs.RO, cs.DS, cs.AI, cs.RO]目的:公共交通路線の経路探索における性能向上
- 都市の交通渋滞緩和や,環境負荷低減のため,公共交通利用促進が重要である。
- 大規模な公共交通ネットワークでは,最適な経路探索に時間がかかり,実用性が課題となる。
- 経路探索の効率化により,より迅速な経路提示と利用者の利便性向上を目指す。
- 提案手法である早期枝刈りを導入することで,既存の経路探索アルゴリズムの計算時間を短縮できる。
- スイスとロンドンの交通ネットワークにおいて,最速57%のクエリ時間短縮を達成した。
- 本手法は,様々なRAPTORベースの経路探索アルゴリズムに容易に組み込むことができる。
二部グラフにおける二部完全部分グラフの再構成 [cs.IR, cs.CL, cs.DS]目的:二部グラフにおける二部完全部分グラフの再構成問題の複雑性
- グラフ理論は,ネットワーク分析や最適化問題など,様々な分野に応用されている。
- グラフの再構成問題は計算困難性が多く,効率的なアルゴリズムが求められている。
- 二部グラフにおける二部完全部分グラフの再構成問題の計算複雑性を明らかにすること。
- 二部グラフにおけるBalanced Biclique ReconfigurationはPSPACE-完全であることが証明された。
- これにより,$(i, j)$-完全二部グラフであるという性質に対するSubgraph ReconfigurationもPSPACE-完全であることが示された。
- Connected Components Reconfiguration(2つの連結成分)も,すべての既知のルール下でPSPACE-完全であることが証明された。
立方型理論における正規形 [cs.LO, math.LO]目的:立方型理論における正規形の仕様
- 型理論は,プログラムの正当性を保証する強力なツールであるため重要視されている。
- 立方型理論の正規形は,形式的に定義されていなかった。
- 立方型理論における正規形の明確な定義を提示すること。
- 本研究では,立方型理論の正規形の仕様を提示した。
- この定義は,立方型理論の正規化の証明に既に含まれていたものである。
- より参照しやすいように,従来のスタイルで明示的に記述した。
多目的推論を用いた時間論理タスクの時空間的ロバスト性 [cs.AI, cs.LO]目的:時間論理仕様の時空間的ロバスト性
- 自律システムの信頼性は,不確実性下での目的達成能力に依存する。
- 既存研究では,空間的摂動のみを考慮したロバスト性が提案されている。
- 空間的摂動と時間的摂動の両方を考慮したロバスト性評価を目指す。
- 本研究では,空間的摂動と時間的摂動を同時に捉える時空間的ロバスト性(STR)を提案した。
- STRを多目的推論問題として定式化し,パレート最適解として捉えることで,許容可能な摂動範囲を特徴づける。
- 計算上の課題に対処するため,STRを安全に近似するロバストな意味論と監視アルゴリズムを提案した。
オントロジー制約によるニューラル推論:エンタープライズエージェントシステムにおける領域基盤型AIエージェントのための神経記号アーキテクチャ [cs.AI, cs.CL, cs.SE]目的:企業向けエージェントシステムのニューラル推論におけるオントロジー制約の導入
- LLMの企業利用は拡大する一方,その信頼性と正確性が課題となっている。
- LLMは幻覚,ドメインドリフト,規制遵守の欠如といった問題を抱えている。
- LLMの推論過程におけるこれらの課題を,オントロジー制約によって解決することを目指す。
- 提案アーキテクチャは,役割,ドメイン,インタラクションの3層オントロジーフレームワークを導入することで,LLMベースのエージェントを領域に結び付けている。
- 実験の結果,オントロジー制約を施したエージェントは,メトリック精度と役割の一貫性において,制約のないエージェントを大幅に上回った(p < .001)。
- 特にLLMのパラメータ的知識が弱い分野(ベトナムローカライズドドメインなど)において,オントロジーの効果が顕著に現れた。
PCNにおける競争的なトランザクション承認:正負のアイテムを持つオンラインナップサック問題 [cs.IR, cs.DS]目的:PCNにおけるトランザクション承認数の最大化
- 暗号通貨取引の高速化とスケーラビリティ向上にPCNが貢献しうるため,その効率化は重要である。
- PCNのチャネル残高の不均衡が,取引処理能力のボトルネックとなっている。
- オンラインで提示されるトランザクションを効率的に承認するアルゴリズムを開発する。
- 本研究では,PCNチャネルのオンラインナップサック問題を定式化し,決定的なオンラインアルゴリズムを提案した。
- 提案アルゴリズムは,$O(\log B)$-競争率を持ち,ナップサック容量$B$に対して最適な性能を示す。
- 任意のランダム化アルゴリズムに対する下限$\Omega(\log B)$も示され,アルゴリズムの最適性が確認された。
SkillMOO:ソフトウェア工学におけるエージェントスキルに対する多目的最適化 [cs.CE, cs.IR, cs.SE, cs.AI]目的:ソフトウェア工学エージェントのスキルバンドルの多目的最適化
- ソフトウェア開発におけるエージェント利用が拡大しており,その性能向上は重要である。
- 既存手法では,スキルが静的な資産として扱われるか,成功率のみで進化している。
- 成功率と推論コストの両方を考慮したスキルバンドルの最適化を目指す。
- SkillMOOは,12の非ゼロパス率タスクのうち11で最高パス率を達成した。
- 静的バンドルと比較して,最大31.7%のコスト削減と,最大21%のパス率向上を実現した。
- スキルの編集分析から,刈り込みと置換が効果的な操作であることが示された。
正確なデバッグベンチマーク:モデルはデバッグしているのか,それとも再生成しているのか? [cs.SE, cs.CL]目的:大規模言語モデルにおける正確なデバッグ能力の評価
- コード生成AIの進化に伴い,デバッグ能力の評価が重要になっている。
- 既存の評価方法では,モデルが正しいコードを過剰に修正しているかどうかの判断が困難である。
- モデルが局所的な誤りを特定し,ターゲットを絞った修正を行えるかを評価する。
- 新しいベンチマークPDBを導入し,既存のコーディングデータセットを精度を意識したデバッグベンチマークに変換した。
- 編集レベルの精度とバグレベルのリコールという2つの評価指標を新たに定義し,必要な修正数と解決されたバグの数を測定した。
- GPT-5.1-CodexやDeepSeek-V3.2-Thinkingなどの最先端モデルは高いテスト合格率を示すものの,精度は低いことが示された。
分割による時空統合の相乗効果の定量化 [cs.IT, math.IT]目的:時空統合の相乗効果の定量化
- 意識の数学的基盤を理解する上で,情報統合の定量化は重要である。
- 既存の情報統合指標は,複雑なシステムにおける統合を正確に捉えられていない。
- 情報分解に基づく新たな指標を用いて,より適切な統合の定量化を目指す。
- 相乗効果に基づく指標は,現在のIITの実践よりもIITの目的に適していることが示された。
- これらの指標は,離散力学系における複雑性の尺度としても活用できる可能性がある。
部分観測性に対する余代数的決定化から信念構築へ [cs.LO]目的:部分観測性システムを全観測性システムに変換する信念構築の理論的基盤
- 人工知能や形式検証において重要な部分観測性システムの解析に不可欠な技術である。
- 部分観測性システムの状態を効率的に表現し,その振る舞いを解析するための効果的な手法が求められている。
- 余代数的枠組みを用いて信念構築を一般化し,部分観測性システムと全観測性システムの整合性を明らかにする。
- 余代数的な信念分解と決定化を組み合わせることで,信念構築の余代数的一般化を実現した。
- 部分観測性システムの意味論が,対応する信念余代数の意味論と一致することを示した。
- POMDPと信念MDPの標準的な同値性および,半モジュールモノイドを持つ加重遷移システムの新たな同値性を再確認した。
エージェント的ハーネスエンジニアリング:コーディングエージェントハーネスの観察可能性に基づいた自動進化 [cs.CL, cs.HC, cs.CL, cs.SE]目的:コーディングエージェントハーネスの自動進化
- コーディングエージェントはツールとの連携が重要であり,その性能はハーネスに大きく依存する。
- ハーネスエンジニアリングは手動で行われており,自動化は複雑な行動空間と効果の帰属困難性により難しい。
- 観察可能性を高めることで,ハーネスの進化を自動化し,試行錯誤を減らすことを目指す。
- 提案手法AHEは,ハーネスの構成要素,経験,意思決定の観察可能性を高めることで,自動進化を実現した。
- Terminal-Bench 2において,AHEはpass@1を69.7%から77.0%に向上させ,既存手法や人間が設計したハーネスを上回った。
- 進化したハーネスは他のモデルやベンチマークへ転移可能であり,汎用的なエンジニアリング経験をエンコードしていることが示された。
HAAS:人間とAIシステム間の適応的タスク割当のためのポリシーを意識したフレームワーク [cs.AI, cs.HC, cs.SE]目的:人間とAI間の適応的タスク割当に関するポリシーの比較と検証
- 組織設計において,人間とAIの役割分担は重要であり,効率性と人間の能力維持のバランスが求められる。
- 従来のタスク割当は二者択一が中心で,文脈や疲労度,リスクなどの影響を考慮した柔軟性に欠ける。
- HAASフレームワークを用いて,タスクとエージェントの適合性を評価し,最適な割当ポリシーを探索する。
- HAASフレームワークは,ルールベースの専門家システムとコンテキストバンディット学習器を組み合わせることで,柔軟なタスク割当を実現する。
- 製造業においては,強いガバナンスが運用パフォーマンスの向上と疲労の軽減に同時に貢献する効果が確認された。
- 最適なガバナンス設定は文脈に依存し,学習が進むにつれて中程度のガバナンスが競争力を増すことが示された。
離散BMSチャネルにおけるチャネル偏光の複素解析 [cs.IT, math.IT]目的:離散BMSチャネルにおける有限ブロック長でのチャネル偏光
- 情報伝送において,信頼性の高い通信を実現するには,チャネル特性の理解が不可欠である。
- 既存手法では,有限ブロック長でのチャネル偏光の解析が困難であり,性能評価に限界があった。
- 複素関数論に基づき,チャネル偏光を厳密に解析し,性能限界を明らかにすること。
- 複素関数論に基づくComponent Evolution(CE)フレームワークを開発し,BMSチャネルのチャネル偏光を解析した。
- CEを用いることで,任意の偏光レベルにおけるBhattacharyyaパラメータの解析的表現を導出した。
- 二値消去チャネル(BEC)や二値対称チャネル(BSC)の特殊性や,BSCビットチャネルの再帰的関係を明らかにした。
ScarfBench:エンタープライズJavaにおけるクロスフレームワークアプリケーション移行のベンチマーク [cs.SE]目的:エンタープライズJavaアプリケーションのクロスフレームワーク移行に関するベンチマーク
- Javaはエンタープライズソフトウェアの中核であり,長期間にわたり利用されることが多い。
- 既存のソフトウェア工学のベンチマークは,リファクタリングの測定が不十分である。
- 本研究は,エンタープライズJavaアプリケーションのクロスフレームワーク移行における課題を定量化する。
- ScarfBenchは,Spring,Jakarta EE,Quarkusの3フレームワーク間での移行タスクを含むベンチマークスイートである。
- 最先端のコーディングエージェントでも,集約的なテスト合格率は15.3%にとどまり,完全な等価性を持つターゲットは1つのみだった。
- SpringとQuarkus間の移行が最も容易であり,Jakartaへの移行が最も困難であるという非対称性が確認された。
分布シフト下での学習における粗粒度モデルと微粒度モデルの同値性 [cs.DS, cs.LG]目的:分布シフト下での学習における粗粒度モデルと微粒度モデルの同値性
- 機械学習の応用範囲拡大に伴い,未知の分布への汎化性能が重要課題となっている。
- 分布シフトへのロバストな学習アルゴリズム開発が困難であり,理論的な保証も乏しい。
- TDS学習とPQ学習の同値性を示すことで,分布シフト下での学習困難度を評価する。
- TDS学習からPQ学習への効率的な還元が可能であり,両モデルは分布自由な設定で同等である。
- この同値性は,基本的な概念クラス(半空間など)に対する分布自由なTDS学習の困難性を示す最初の結果となる。
- メンバーシップクエリへのアクセスは,これらの困難性を回避し,半空間の効率的な分布自由なPQ学習を可能にする。
