arXiv雑要約
プログラム - 2026/04/02 公開
真の根拠なしでのコールグラフ不正性の検出 [cs.SE]目的:コールグラフ不正性の検出方法
- 静的解析は,ソフトウェアの品質向上に不可欠であり,大規模なコードベースでも効率的にバグを発見できる。
- 既存の静的解析ツールは,解析結果の一貫性や正確性に問題があり,比較評価が困難である。
- 解析アルゴリズム,設定,フレームワークの意味を考慮することで,より正確な評価を目指す。
- 複数のJava静的解析フレームワークにおいて,精度向上によって新たなコールグラフエッジが生じたり,不整合が増幅することが確認された。
- アルゴリズムの精度順序は,ラムダ式やリフレクションなどの現代的な言語機能によって,フレームワーク内で破綻することが明らかになった。
- 異なるフレームワーク間では,互換性のないコールグラフの概念に基づき,解決不可能な意味的なギャップが存在することが示された。
平面グラフにおける重み付き問題に対するパラメータ化された準指数時間・準立方時間アルゴリズムの枠組み [cs.DS]目的:平面グラフにおける重み付き問題に対する準指数時間・準立方時間アルゴリズムの枠組み
- 平面グラフは,現実世界の多くのネットワークをモデル化でき,その効率的なアルゴリズムは重要である。
- 多くの問題において,準指数時間パラメータ化アルゴリズムの存在自体が不明であり,計算複雑性のボトルネックとなっている。
- 既存手法の限界を克服し,より広範な重み付き平面グラフ問題に対し,準指数時間アルゴリズムの設計を可能にする。
- 本研究で提案する枠組みは,これまで知られていなかった多くの重み付き平面グラフ問題に対し,準指数時間パラメータ化アルゴリズムを提供することに成功した。
- 具体的には,重み付き部分頂点被覆,最大重み付き誘導森,最小重み付き根付きマイナーなどに対し,準指数時間アルゴリズムの存在を示した。
- また,最大重み付き独立集合や最大$(k, n-k)$-カットなどの問題に対する証明を簡略化する枠組みの一部も提示し,未解決問題に対する新たな解法を示した。
実環境における自律型エージェントの貢献調査:活動パターンと経時的なコード変更 [cs.SE, cs.AI, cs.LG]目的:大規模言語モデルによるコード生成がソフトウェア開発に変革をもたらしている現状を踏まえた,自律型コーディングエージェントの貢献分析
- ソフトウェア開発において,AI技術の導入が進み,その影響を理解することが重要となっている。
- 自律型エージェントの貢献が拡大する一方で,コード品質やチームダイナミクスへの影響が不明確である。
- 実環境におけるエージェントの活動パターンと,生成コードの長期的な維持・更新状況を明らかにすること。
- オープンソースプロジェクトにおいて,エージェントの活動は増加傾向にあることが確認された。
- エージェントが生成したコードは,人間が作成したコードと比較して,より多くの変更(churn)が発生する傾向がみられた。
- コードの作成とレビューは,ソフトウェアエンジニアリングプロセスの一部に過ぎず,長期的な維持・更新が重要である。
COBOL環境におけるポータブルで安全なCI/CD:産業移行からの教訓 [eess.SY, cs.SY, math.OC, cs.SE]目的:COBOL環境におけるCI/CDパイプラインの移行と改善
- 大規模ソフトウェアの進化維持にはCI/CDが不可欠。規制産業では技術的負債となりやすい。
- 既存のCI/CDパイプラインが脆弱化し,プラットフォーム依存度が高く,保守コストが増大している。
- コンテナ化によるパイプラインの効率化とセキュリティ向上,そしてベンダーロックインの回避を目指す。
- コンテナ化アーキテクチャへの移行により,プラットフォームロジックの抽象化とリポジトリ構造の簡素化を実現した。
- 実行時間を82%削減し,COBOLツールと依存関係を含むOCI準拠イメージの事前構築により,効率が向上した。
- 抽象化,コンテナ化,組織的導入に関する教訓から,レガシー環境でのパイプライン近代化の指針を提供した。
k-Means に対するラウンド効率の良い完全スケーラブルなMPCアルゴリズム [eess.SY, cs.SY, cs.DS]目的:k-Means クラスタリングにおける,高速かつスケーラブルな並列計算手法の開発
- 大規模データ分析において,効率的なクラスタリングは重要な課題である。
- 既存の完全スケーラブルなk-Meansアルゴリズムは,ラウンド数または近似率に課題があった。
- 距離歪みを許容することで,効率的な並列計算を実現し,より良い近似率を達成することを目指す。
- 本研究では,O(1)ラウンドで動作する,O((log n/log log n)^2)-近似の完全スケーラブルなアルゴリズムを提案した。
- このアルゴリズムは,k-Median に対しても O(log n/log log n)-近似という,既存手法を改善する結果を示した。
- また,最適な値に対する O(1)-近似を O(1) ラウンドで達成できることを示唆しており,今後の研究の方向性を示唆する。
正の重みを持つ制限ボルツマン機械における迅速な混合 [cs.DS, cs.LG, math.PR]目的:正の重みを持つ制限ボルツマン機械の交互走査サンプラーの混合時間
- 機械学習モデルの効率的な学習は重要であり,サンプリング速度がその鍵となる。
- 既存のサンプリング手法では,混合時間がボトルネックとなる場合がある。
- 正の重みを持つ制限ボルツマン機械における混合時間の上限を改善する。
- 正の重みを持つ制限ボルツマン機械の交互走査サンプラーにおいて,対数時間オーダーの混合時間上限が示された。
- この結果は,フェロ磁性二スピン系におけるチェイン解析とグラウバーダイナミクスを通じて得られた。
- 臨界閾値付近における新たな混合時間上限が導出された。
義務含意可能性と様相 STIT 論理 [cs.LO]目的:義務含意可能性(OiC)の多様な解釈を考慮した様相 STIT 論理の枠組み
- 複数主体が関わる意思決定を分析する上で,STIT 論理は重要な役割を果たす。
- 既存の様相 STIT 論理における OiC 原則は,哲学的議論において様々な解釈が存在する。
- OiC の多様な解釈を網羅的に扱う様相 STIT 論理の枠組みを提示し,その関係性を明らかにする。
- 本研究では,OiC の十種類の解釈を形式化し,それぞれに対応する完全な順序計算を構築した。
- 異なる OiC 原則間の論理的な関係性を分析し,ある OiC 解釈が別の解釈を内包する条件を提案した。
- 提示された枠組みは,OiC 原則の多種多様な解釈を統一的に扱うことを可能にする。
ℓ∞-縮小写像のより高速な近似固定点探索 [cs.DS]目的:ℓ∞-縮小写像のε-近似固定点
- ゲーム理論や経済学において固定点定理は重要な役割を担う。
- 高次元における固定点探索は計算コストが高く,実用上の課題が多い。
- 高次元空間での固定点探索の計算量を削減する手法を開発する。
- 本研究では,ℓ∞-縮小写像のε-近似固定点を探索する新しいアルゴリズムを提案した。
- 提案アルゴリズムは,既存手法と比較して,実行時間の上界が改善されている。具体的には,$(\log \frac{1}{\epsilon})^{\mathcal{O}(d \log d)}$。
- また,分解定理を用いることで,クエリ数と実行時間のトレードオフを活用し,さらに高速化を実現した。($(\log \frac{1}{\epsilon})^{\mathcal{O}(\sqrt{d} \log d)}$ queries)
線形空間以下のSum-Exclude-Self計算には2回の線形パスが必要である [cs.DS]目的:符号なしdビット整数の配列に対するSum-Exclude-Selfの計算における下限
- データ処理におけるメモリ使用量の削減は,計算コストの低減に不可欠である
- 限られたメモリ内で効率的に計算を行うための理論的限界が不明確である
- 線形空間以下でのSum-Exclude-Self計算に必要な入力データアクセス回数の下限を明らかにする
- 任意のアルゴリズムが線形空間以下でSum-Exclude-Selfを計算する場合,少なくとも2回の線形パスが必要であると証明された。
- アルゴリズムは,出力セルの最終値を得る前に少なくともn-1個の入力要素を読み込む必要があり,その後さらにn - ⌊t/d⌋個の要素を読み込む必要がある。
- この結果は,標準的な2パスアルゴリズムの効率性を示唆し,下限を示すための「ボトルネック」技術の例となる。
複数LLMパイプラインにおける第2段階の改善効果:修正か再解決か [cs.SE, cs.AI, cs.CL]目的:複数LLMパイプラインにおける第2段階の改善効果の要因分解
- LLMの組み合わせによる性能向上が期待される分野であり,そのメカニズム理解が重要である。
- 複数LLMパイプラインの改善効果が,単なるエラー修正によるものなのか不明である。
- 複数LLMパイプラインの改善効果を詳細に分析し,タスクやドラフト品質に応じた設計指針を示す。
- 複数LLMパイプラインの改善効果は,タスク構造,ドラフト品質,およびドラフト情報の種類に依存することが示された。
- 知識集約型MCQタスクでは,より高性能なモデルへの直接ルーティングが,弱いドラフトの修正よりも効果的な場合がある。
- コード生成タスクでは,意味的に空のドラフトでも構造的な足場を提供し,二段階プロンプティングが有効である。
汎用ターゲットおよびセキュリティ関数に対する安全なネットワーク機能計算 [cs.IT, math.IT]目的:ネットワークにおける安全な機能計算の容量上限
- ネットワーク機能計算は,情報セキュリティにおいて重要な研究分野である。データ保護と効率的な情報伝送を両立する。
- 既存研究では,特定のターゲット・セキュリティ関数に限定される場合が多く,汎用的なモデルでの解析が課題である。
- 任意のターゲット・セキュリティ関数とネットワーク構造に対して,安全な計算容量の上限を導出することを試みる。
- 情報理論的アプローチにより,任意のネットワーク,関数,セキュリティレベルに適用可能な容量上限を確立した。
- ターゲット関数が線形,セキュリティ関数が恒等関数である場合,効率的な容量上限計算アルゴリズムを提案した。
- 両関数が線形の場合,線形安全ネットワーク符号の計算可能性とセキュリティに関する条件を明らかにし,具体的な構成スキームを開発した。
SynDe:症候群に基づく生ナノポア読み取りデータのデコード [cs.IT, math.IT]目的:生ナノポア読み取りデータの効率的な誤り訂正
- ナノポアシーケンスはDNAベースのデータストレージに有望だが,高い誤り率が課題。
- 従来の誤り訂正法は,符号化クラス数に制限があり,計算コストが高い。
- 任意の線形符号に対応し,低い計算量で誤り訂正を行う手法を開発。
- PrimerSeekerは既存手法と同等の精度で,リアルタイムなプライマー検出に適している。
- SynDeは,周期的なマーカーを持つ畳み込み符号で高い性能を発揮し,計算量は少ない。
- SynDeの信頼度スコアにより,誤った出力を確実に識別できる。
研究用Jupyter Notebookの再現性ギャップの克服:リポジトリレベルの自動コンテナ化 [eess.SY, cs.SY, cs.RO, cs.SE, cs.CE]目的:研究用Jupyter Notebookの再現性確保に向けた自動コンテナ化パイプライン
- 科学の信頼性は再現性に依るが,現実には再現が困難なケースが多い。
- 環境の変化や依存関係の欠如が,研究の独立した再実行を妨げる。
- リポジトリレベルでの実行環境を自動的に再構築し,再現性を評価する。
- 提示されたパイプラインにより,依存関係の推論,自動コンテナ生成,隔離された実行が可能となった。
- PubMed CentralのGitHubリポジトリ443個のNotebookを評価した結果,依存関係エラーの66.7%が解決された。
- しかし,Notebookの53.7%で出力の忠実度が低く,完全なビット単位での再現性は困難であることが示唆された。
サイバーセキュリティ演習シナリオの自動生成 [cs.AR, cs.CR, cs.SE]目的:サイバーセキュリティ演習シナリオの自動生成手法
- 社会のニーズに応え,新たな基準や規制遵守のため,実践的な知識・経験を持つ人材育成が急務である。
- 演習シナリオ作成は専門知識を要し,多様な規模や難易度に対応したシナリオの作成が課題である。
- 企業ITシステムをモデル化した多様なシナリオを自動生成し,演習環境を提供することで課題解決を目指す。
- 企業ITシステムをモデル化したサイバーセキュリティシナリオの自動生成手法を提案した。
- 規模,範囲,難易度,複雑さ,多様性など,複数の基準で異なる多数のシナリオを生成可能である。
- 生成された10万件のシナリオデータセット,および演習実行環境をオープンソースで公開した。
漸近最適性を持つ異種LLMを用いた逐次仮説検定 [cs.DS, cs.IT, math.IT, math.ST, stat.TH]目的:異種LLMを用いた逐次仮説検定における,クエリコストと待ち時間の期待和の最小化
- LLMの活用は,意思決定の迅速化や精度向上に貢献し,様々な分野で重要性を増している。
- LLMの性能は非対称であり,仮説によって正答率が異なる場合,最適なLLM選択が困難である。
- 異なるLLMの情報を組み合わせ,コストと待ち時間を考慮した最適な逐次検定戦略を確立する。
- 誤差許容度αが0に近づくにつれて,最適なポリシーは最大2つのLLMの使用に漸近的に等価となる。
- 単一のLLMポリシーは一般的に最適ではなく,AとBの仮説下における情報量のトレードオフを活用する必要がある。
- 事後確率に応じて2つのLLMを混合し,その後,特定の仮説に近づくにつれて専門的なLLMに切り替えるポリシーが提案された。
確率的マルチ目的最適化におけるパレート最適解近似:ハッシュ化とランダム化による手法 [cs.LG, cs.AI, cs.LO]目的:確率的マルチ目的最適化におけるパレート最適解の近似手法
- 不確実性下での意思決定において,複数の目的関数間のトレードオフを考慮することが重要である。
- 既存手法は,近似の精度が低いか,計算コストが非常に高くなるという課題がある。
- SATオラクルへのクエリ回数を削減しつつ,厳密な近似保証を持つパレート最適解の探索を実現する。
- 提案手法XOR-SMOOは,確率$1-\delta$で,$\gamma$-近似パレート最適解を,$\gamma$と$\delta$の対数関数回数のクエリでSATオラクルに問い合わせることで得られる。
- XOR-SMOOは,真のパレート最適解と比較して,定数倍の近似誤差範囲内に解を求めることが可能であり,計算困難な問題を効率的に解決する。
- 実世界の問題(道路ネットワーク強化,サプライチェーン設計)における実験結果は,XOR-SMOOが既存手法よりも優れた性能を示すことを示している。
報酬感受性双シミュレーションのためのコアルジェブラ的枠組み(拡張版) [cs.CE, cs.LO]目的:報酬感受性双シミュレーションのモデル化
- システム検証において,行動や状態の等価性を形式的に判断する手法は不可欠である。
- 従来の双シミュレーションでは,報酬のような量的差を考慮できない場合がある。
- 報酬を考慮した双シミュレーションを,コアルジェブラ的枠組みで形式的に定義・解析すること。
- 報酬の差を追跡する段階的双シミュレーションと,それらを抽象化する段階なし双シミュレーションを統合的に扱える枠組みを提示した。
- カテゴリー論的グルーイングを用いて,段階的・段階なし双シミュレーションの関係を明確に表現し,最終コアルジェブラとの整合性も示した。
- 本アプローチは,報酬付きオートマトンやラベル付きマルコフ過程など,多様なシステムへの応用可能性を示唆している。
再帰的に微分可能な準群の構成と再帰$[4,2,3]_{26}$-コードの例 [eess.SY, cs.SY, cs.IT, math.CO, math.IT]目的:再帰的に微分可能な準群の構成と再帰$[4,2,3]_{26}$-コードの存在
- 符号理論は,情報伝送やデータ保存における誤りの検出と訂正に不可欠な役割を担う
- 既存の再帰MDSコードの構成は,特定の有限アルファベットサイズに対して困難が残されている
- アルファベットサイズ$q=26$における再帰MDSコードの構成を完了し,既存の限界を改善する
- 本研究では,完全な巡回メンデルソン設計を用いて,$q=26$に対する再帰$[4,2,3]_{26}$-コードを具体的に構成した
- 再帰的に微分可能な準群の構成手法を確立し,その存在に関する既知の限界を強化した
- 1998年の推測のうち,残されていた$q=26$のケースを解決した
AIコーディングアシスタントを用いた経験的思考の育成:授業実践報告 [cs.SE]目的:AIコーディングアシスタントを用いた授業実践を通じた経験的思考の育成
- ソフトウェア教育において,経験的な手法の重要性が認識されている。
- 理論的な授業では,経験的思考や仮説検証の概念が学生に浸透しにくい。
- AI技術への関心を活用し,経験的思考の学習を促進することを試みる。
- AIコーディングアシスタントという話題性のあるテーマが,学生の好奇心と批判的思考を喚起した。
- 実践的な開発課題と主体的な調査の組み合わせが,学生の積極的な関与を促した。
- 単一のセミナーでも,技術スキルと研究スキルの両方を効果的に習得可能であることが示された。
コミットサイズとハイパー共変グラフ中心性の活用による欠陥予測 [cs.SE]目的:欠陥予測モデルの性能向上
- ソフトウェア品質向上には,プロダクトメトリクスとプロセスメトリクスの両方が重要である。
- 従来のプロセスメトリクスはコミットサイズ(変更ファイル数)を考慮していない。
- コミットサイズを考慮したプロセスメトリクスとハイパーグラフを用いた中心性指標の有効性検証。
- コミットサイズを考慮したプロセスメトリクスベクトルが,従来の単一値のプロセスメトリクスを上回る予測性能を示す。
- ハイパー共変グラフに基づくベクトル中心性は,ソースファイルの重要度をより正確に定量化する。
- 提案手法は,より識別力が高く,校正された,統計的に優れた欠陥予測モデルを構築する。
SERSEM:コード言語モデルにおけるメンバーシップ推論のための選択的エントロピー重み付けスコアリング [cs.SE, cs.CR]目的:コード言語モデルにおけるメンバーシップ推論攻撃手法
- コードLLMの利用拡大に伴い,学習データに含まれるデータの不正利用検出が重要になっている。
- 既存のメンバーシップ推論攻撃は,ノイズの影響を受けやすく,正確性に課題がある。
- ヒューマンが記述したコード特有のパターンに着目し,正確なメンバーシップ推論を実現する。
- SERSEMは,AST解析やスペルチェック等の静的解析を用いて,重要な部分に焦点を当てる。
- StarCoder2モデルにおいて,AUC-ROCが0.7913,0.7867を達成し,既存手法を上回る性能を示した。
- コードの構文的な冗長性を抑制し,特定の記憶信号を増幅することで,ロバストなメンバーシップ推論を可能にした。
Androidアプリケーションの高品質なバグレポートの自動生成 [cs.SE]目的:Androidアプリケーションにおける高品質なバグレポートの自動生成
- モバイルアプリの品質確保は重要であり,バグレポートはその基礎となる情報である。
- 手動作成されたバグレポートは曖昧,不正確,情報不足に陥りがちである。
- LLMを活用し,バグレポートの質を向上させ,開発効率を高めることを目指す。
- 提案手法BugScribeは,既存のバグレポートや他のLLMベースラインよりも高品質なバグレポートを生成することを示した。
- BugScribeは,GUIインタラクションなどのアプリ関連情報をLLMに提供することで,正確で詳細なバグレポートを生成する。
- 本研究で導入された品質評価フレームワークにより,OB,EB,S2Rの正確性と完全性を客観的に評価することが可能になった。
多部間非局所性の限界:偏った非局所性への帰着による [cs.RO, quant-ph, cs.IT, math.IT]目的:多部間非局所性の限界
- 量子情報の基礎理解に不可欠であり,量子計算や量子通信への応用が期待される。
- 多部間の量子相関の理解が不十分であり,その特性を定量的に評価する手法が課題である。
- 多部間非局所性の限界を明らかにし,二部間非局所性との関係性を構築すること。
- 閾値ゲームにおいて,LOCCGモデルを用いた多部間非局所性の限界を最適化できた。
- 多部間非局所性と偏った二部間非局所性ゲームとの間の帰着を証明した。
- この帰着の一般化により,多部間から二部間の原理への架け橋となる可能性が示唆された。
BCH-代数のための最適14記号ハイブリッド基底 [math.LO, cs.LO]目的:BCH-代数に対する最適最小二公理基底
- BCH-代数は,論理学,代数学,情報科学における基礎構造として重要である。
- BCH-代数の標準的な表現は冗長であり,より簡潔な表現が求められていた。
- 14記号の等式と標準準恒等式でBCH-代数を定義し,最小性を証明すること。
- 標準的な3つの公理(2つの等式と1つの準恒等式)を,14記号の等式で完全に置き換えることを示した。
- この新しい等式基底の厳密な最小性を,形式的な証明によって確立した。
- 12記号以下の等式ではBCH-代数を定義できないことを,機械支援による探索で示した。
病的な低ランク行列回復のためのスケーリング勾配降下法:最適なサンプリング複雑性 [stat.ML, cs.IT, cs.LG, math.IT]目的:病的な低ランク行列回復におけるスケーリング勾配降下法の最適なサンプリング複雑性の達成
- 低ランク行列回復は,ビッグデータ解析など多くの分野で重要な役割を果たす。
- 従来の勾配降下法は,病的な行列に対して収束が遅いという問題があった。
- 本研究では,スケーリング勾配降下法の理論的性能を向上させ,実用的な高速化を目指す。
- スケーリング勾配降下法が,最適なサンプリング複雑度O((n_1 + n_2)r)と,改善された反復複雑度O(log(1/ε))を両立することが示された。
- この結果は,正定値半正定行列の設定に限定されず,一般的な低ランク行列回復問題に適用できる。
- 数値実験により,病的な行列に対してスケーリング勾配降下法が収束を加速することが検証された。
ノイズのある古典チャネルにおける確実な識別:超活性化と量子優位性 [quant-ph, cs.IT, math.IT]目的:古典チャネルにおける確実な識別タスクの定量化
- 情報伝達の信頼性向上は,現代社会における重要な課題である。
- 古典チャネルのノイズ存在下では,誤りなく情報を識別することが困難である。
- 古典チャネルの識別能力を向上させ,量子的な利点を示すことを目指す。
- 古典チャネルの確実な識別指標が,古典的な補助チャネルによって劇的に向上する「超活性化」現象を示す。
- 量子チャネルを用いることで,古典的な補助チャネルよりも効率的に識別が可能となる「量子優位性」が存在する。
- チャネルのサポートグラフが,確実な識別において重要な役割を果たすことが明らかになった。
ダイヤモンド距離におけるほぼパウリ疎なユニタリーのクエリ学習 [quant-ph, cs.IT, math.IT]目的:ほぼ(s,ε)-疎なユニタリーの学習
- 量子情報処理におけるユニタリー変換の効率的な表現と操作は,量子アルゴリズムの設計において重要である。
- ユニタリー変換のパウリ分解に基づく表現は高次元になりやすく,学習や近似が困難であるという課題がある。
- パウリスペクトルが限られた成分に集中するユニタリーを効率的に学習することを目指す。
- クエリアクセスのみを用いて,未知のほぼ疎なユニタリーに近接する量子チャネルを効率的に構築するアルゴリズムを設計した。
- このアルゴリズムは,$\tilde{O}(s^6/\epsilon^4)$ の順方向クエリと,関連パラメータに関する多項式時間で動作する。
- 任意のユニタリーのパウリ係数を推定する効率的な量子アルゴリズムを開発し,既存の疎回復技術を拡張した。
6GネットワークにおけるSAR/ISARイメージング [math.AP, cs.SY, eess.SY, eess.SP, cs.IT, math.IT]目的:6G信号を用いた高解像度無線イメージング手法
- 環境再構築や自動運転など,広範な応用が見込まれる重要なセンシング機能である。
- 従来の無線イメージング技術は,ギガヘルツ帯域の広大な帯域幅を必要とし,6GのMHz帯域幅には適用が困難である。
- 6G環境下での帯域幅制限下における高解像度無線イメージングを実現することを目的とする。
- 提案手法は,距離推定に依存せず,ドップラー情報のみを用いてイメージングを行う。
- 異方性散乱関数に対処するため,反復適応的ドップラー関連付け(IAA-DA)アルゴリズムを設計した。
- 実環境実験により,提案する6Gイメージング手法の実現可能性と有効性が確認された。
量子的な優位性がないことは,バイナリ・ペイントショップ問題に対する改良された境界と古典アルゴリズムを意味する [quant-ph, cs.DS, math.OC]目的:バイナリ・ペイントショップ問題の最適解
- 組合せ最適化問題の近似解法は,現実世界の様々な問題に応用可能であるため重要。
- バイナリ・ペイントショップ問題は,古典的なアルゴリズムによる効率的な解法が確立されていない。
- 量子アルゴリズムと比較し,より優れた古典アルゴリズムの存在を示す。
- 量子近似最適化アルゴリズム(QAOA)の性能を上回る古典アルゴリズムの存在が示唆された。
- 平均的なペイント交換比において,Mean-Field Approximate Optimization Algorithm (MF-AOA) が既存の古典および量子アルゴリズムを上回る結果が得られた。
- D-Wave Quantum Annealer Advantage 2 での実験結果も,古典アルゴリズムの優位性を示唆する根拠となった。
DF-3DRME:超解像技術に基づく3D電波マップ推定のためのデータに優しい学習フレームワーク [eess.SP, cs.IT, math.IT]目的:3D電波マップの高解像度推定
- 無線ネットワークの発展において,高精度な電波環境情報の把握は不可欠である。
- 従来の深層学習手法は,学習に大量の高解像度3D電波マップを必要とする。
- 限られたデータでも高解像度電波マップを推定する手法を開発すること。
- 提案手法DF-3DRMEは,低解像度と高解像度の電波マップを組み合わせたハイブリッドデータセットを用いて学習を行う。
- 低解像度マップの予測にはLR-Net,高解像度化にはSR-Netを使用し,データ効率を向上させている。
- データセット中の4%の高解像度マップのみで,実用的な性能を発揮することが実験的に示された。
ロス環境下における平面アレイを用いた3Dユーザ位置特定:位相差和に基づく手法 [eess.SP, cs.IT, math.IT]目的:3次元ユーザ位置特定
- 無線通信において,ユーザの位置を正確に把握することは,ビームフォーミング等の性能向上に不可欠である。
- 従来の線形アレイでは2次元位置特定に限られ,平面アレイの3次元位置特定は課題であった。
- 位相差和を利用することで,ハイパーパラメータ調整なしに高精度な3次元位置特定を実現する。
- 提案手法は,近傍・遠方両領域において,球面波モデルに基づいた3次元ユーザ位置特定を可能とする。
- 位相差和を複数構築し,その解を用いることで,距離,方位角,天頂角を正確に推定する。
- 最小二乗法推定器は,クレーマー・ラオ下限の精度を達成し,既存手法に匹敵する性能を示す。
整数の符号化の統計物理 [cond-mat.stat-mech, cs.IT, math.IT]目的:自然数の圧縮のための符号化
- 情報圧縮は,データ効率化の根幹であり,様々な分野で重要性が増している。
- 従来の符号化方式では,自然数の特性を十分に活かせていない場合がある。
- ゼータ分布に基づいた符号化方法を統計物理的に解明し,効率的な圧縮を目指す。
- ゼータ分布に基づく符号化スキームが,理想的な符号長にほぼ到達することが示された。
- 自然数のベクトルに対するブロック符号化において,マイクロカノニカルエントロピー関数が漸近的に線形であることが確認された。
- Hagedorn型相転移により,アンサンブルの完全な等価性が成立しないことが示された。
逆セルオートマトンの複雑性に関する証明複雑性による下界 [math.OC, cs.DM, math.DS, q-bio.MN, physics.soc-ph, cs.CY, physics.data-an, stat.AP, math.LO, cs.DM, cs.LO]目的:有界サイズの構成における逆セルオートマトンの複雑性
- 計算複雑性理論は,計算可能な問題の難易度を評価し,効率的なアルゴリズムの設計に不可欠である。
- 逆セルオートマトンの決定問題は計算困難であり,効率的な解法が未だ知られていない。
- この研究は,逆セルオートマトンの複雑性に関する新たな下界を確立することを目指す。
- 逆セルオートマトンの注入性のco-NP完全性のより簡単な証明を提示した。
- この簡略化された証明は,UNSATからの直接的な還元に基づいている。
- 有界サイズの構成に対する逆セルオートマトンを命題論理の証明として捉え,そのサイズに関する下界を導出した。
条件チャネルエントロピーが熱力学的量子情報処理の基本的な限界を設定する [quant-ph, cond-mat.other, cs.IT, hep-th, math-ph, math.IT, math.MP]目的:量子チャネルの熱力学的有用性の限界
- 量子情報処理は,情報科学と物理学の融合領域であり,新しい技術への応用が期待されている。
- 量子チャネルの熱力学的性質評価は,効率的な量子情報処理の実現において重要な課題である。
- 条件チャネルエントロピーを用いて,量子チャネルの熱力学的限界を定量的に明らかにすることを目的とする。
- 条件チャネルエントロピーとゲート蒸留率・チャネルシミュレーションコストの間にトレードオフ関係があることを示した。
- テレコバリアントチャネルや非シグナリングチャネルにおいて,条件チャネル最小エントロピーの均等分割特性を確立した。
- テレコバリアントチャネルのアシンプトティック条件アテルマリティ容量が,そのChoi状態の超高密度符号化容量の半分となることを示した。
UCAモデルのループ展開:距離ラベリング [cs.NI, cs.DC, cs.PF, cs.DS, cs.DM]目的:PCAモデルとk倍乗UCAモデルの同値性の判定
- グラフ理論における円弧モデルは,様々なグラフ構造を表現可能であり,その応用範囲は広い。
- PCAモデルがk倍乗UCAモデルと同値であるかどうかの判定は,計算コストが高いという課題があった。
- 効率的なアルゴリズムを開発することで,円弧モデルを用いたグラフ表現の解析を加速させる。
- 線形時間でPCAモデルとk倍乗UCAモデルの同値性を判定するアルゴリズムを設計した。
- アルゴリズムは,同値なUCAモデルを出力するか,線形時間で検証可能な否定証明書を出力する。
- k=1の場合には,古典的な表現問題に対するより簡潔なアルゴリズムが得られた。
多項式力学系の微分消去と代数的剰余 [eess.SY, cs.SY, cs.SC, cs.LO, math.AG, math.DS]目的:多項式力学系の代数的剰余の獲得
- 離散・連続混合系の安全性検証において,不変集合は重要な役割を果たす。
- 従来の剰余計算は,グロブナー基底や量化除去に依存し,計算コストが高い。
- 消去理論に基づくアルゴリズムで効率的に代数的剰余を得て,安全性検証を可能にする。
- 本研究では,グロブナー基底や量化除去を用いずに,多項式力学系の代数的剰余を系統的に得るための消去理論的なローゼンフェルド・グロブナーアルゴリズムを適用した。
- 特に,効率的な不変性検証に重要な役割を果たす完全実多様体を特定した。
経験ソフトウェア工学における遺漏変数バイアスの軽減 [cs.SE]目的:経験ソフトウェア工学における遺漏変数バイアスの影響調査と軽減策
- ソフトウェア工学の研究では実験が難しく,観察研究が主流である。その結果の妥当性が重要となる。
- 観察研究では,影響を与える全ての変数を考慮することが難しく,遺漏変数バイアスが発生しやすい。
- 因果構造モデルを用いて遺漏変数バイアスの存在を検出し,その影響を評価し,軽減することを目指す。
- 遺漏変数バイアスは,ソフトウェア工学の研究において,変数の真の効果を過大または過小評価する原因となる。
- 因果構造モデルに基づく分析手法は,変数の関係性を直感的に理解するのに役立ち,バイアスの調査に有効である。
- 研究設計段階で遺漏変数バイアスを調査・軽減する努力は,研究の妥当性を高めるために重要である。
VT-Former:Varshamov-Tenengolts符号向け効率的なTransformerベースのデコーダ [eess.SY, cs.SY, cs.LG, cs.IT, math.IT]目的:Varshamov-Tenengolts符号の多重誤り訂正能力の調査と,Transformerベースの効率的なデコーダの開発
- DNAベースのデータストレージにおける挿入,削除,置換誤りの訂正は,データ信頼性確保に不可欠である。
- 従来のVarshamov-Tenengolts符号のデコーディング手法は,単一誤り訂正に特化しており,多重誤り訂正には不向きである。
- 本研究は,VT符号の潜在的な多重誤り訂正能力を引き出し,効率的なデコーディング手法を確立することを目的とする。
- VT-Formerは,単一誤り訂正においてほぼ100%の精度を達成した。
- 様々な符号長における多重誤り訂正タスクにおいて,従来のハードデシジョンおよびソフトインソフトアウトデコーディングアルゴリズムと比較して,フレーム精度とビット精度が向上した。
- アーキテクチャの最適化により,従来のソフトデコーダと比較して,より低いデコーディング遅延と計算コストを実現した。
深さと広がり:有界なツリー深さとツリー幅を持つグラフ上のカウント論理と準同型識別可能性 [cs.RO, math.OC, cs.LO, cs.DM, math.CO]目的:グラフ上のカウント論理と準同型識別可能性の関係性に関する研究
- グラフ理論は,ネットワークやデータ構造のモデル化において重要な役割を果たす。
- 論理とグラフ理論の間の表現力に関する問題は,未だ完全には解明されていない。
- 特定のグラフクラスにおける準同型識別可能性を分離することを目指す。
- $\mathsf{C}^k_q$ 文を満たすグラフは,$\mathcal{T}^k_q$ 上で準同型識別可能であることが示された。
- $\mathcal{T}^k_q$ と $\mathcal{TW}_{k-1} \cap \mathcal{TD}_q$ の分離が,特定の条件の下で確立された。
- $\mathcal{TD}_q$ と $\mathcal{T}^k_q$ が準同型識別可能性に関して閉であるという Roberson の予想が証明された。
単一搬送波通信信号に対する極性符号によるスペクトルコム整形 [cs.IT, math.IT]目的:スペクトルコム形状の信号形成のための極性符号における情報インデックス選択
- 無線通信において,周波数資源の効率的利用と干渉抑制は重要な課題である。
- 周期的な干渉は,従来の符号化方式では効果的に除去することが困難である。
- 本研究は,周期干渉からの分離を可能にするスペクトルコム形状信号の生成を目指す。
- 提案手法では,極性符号の情報インデックスをコム整形インデックス集合に限定することで,スペクトルコム形状の信号を生成する。
- シミュレーション結果から,提案手法は従来の極性符号と比較して,有意な信号対雑音比(SNR)の改善を実現することが示された。
- 周期的な干渉環境下やAWGN環境下で有効であり,干渉抑制効果が確認された。
Transformerベースの埋め込みベクトルに対するフィルタ付き近似最近傍探索アルゴリズムのベンチマーク [cs.DB, cs.DS, cs.IR]目的:Transformerベースの埋め込みベクトルにおけるフィルタ付き近似最近傍探索手法の性能評価
- 埋め込みモデルの進歩は,検索拡張生成やレコメンデーションシステムなど,様々な分野の発展を牽引している。
- 現実世界の属性を含む大規模な埋め込みベクトルデータセットの不足が,フィルタ付き近似最近傍探索の研究を阻害している。
- Transformerベースの埋め込みベクトルを用いた新たなデータセットを構築し,効率的な探索手法の選択に資する。
- arXiv論文の抄録を含む,11種類の属性が付与された大規模データセット「arxiv-for-fanns」を新たに構築した。
- 11種類のフィルタ付き近似最近傍探索手法をベンチマークし,フィルタの種類やデータ規模に応じた性能を評価した。
- 評価結果から,最適な手法を選択するための8つの重要な知見を得た。
学習された編集履歴軌跡に基づく,指示不要・低遅延の次編集提案フレームワーク NES [cs.SE, cs.LG]目的:ソフトウェア開発における次編集提案
- ソフトウェア開発において,コード編集は頻繁かつ認知負荷の高い作業である。
- 既存のAIツールは,自然言語指示が必要で遅延も大きく,実用性に課題がある。
- 開発者の意図とコーディング習慣を暗黙的に捉え,迅速な編集提案を実現する。
- NESは,編集位置の予測精度75.6%,完全一致率27.7%という最先端の性能を達成した。
- 提案の遅延は250ms未満であり,高速な応答性を示した。
- Ant Groupでの実運用では,2万人以上の開発者によって利用され,高い受容率(編集位置予測51.55%,編集43.44%)が確認された。
シャープ比率最適化における後悔の上限:トムソンサンプリング [cs.LG, cs.IT, math.IT]目的:シャープ比率の最大化
- 金融工学や投資戦略において,リスク調整後のパフォーマンス評価が重要である。
- 従来のバンディット問題では期待報酬の最大化が中心であり,リスクの考慮が不十分である。
- シャープ比率を最適化することで,リスクとリターンのバランスをとる効率的なアルゴリズムを開発する。
- 提案手法SRTSは,リスク調整探索のためのベイズアルゴリズムであり,平均と精度の不確実性を捉える共役事前分布を採用している。
- SRTSは,リスク許容度に関わらず一貫したサンプリングルールを提供し,異なるリスク体制で異なるアルゴリズムを必要としない。
- 理論的な解析により,期待後悔の上限が$\mathcal{O}(\log n)$であることが示され,情報理論的な下限と一致するため,提案手法は最適である。
静的解析警告の自動分類と修正エージェント:CodeCureAgent [cs.DC, cs.HC, cs.CY, cs.ET, cs.HC, cs.MA, cs.SE, cs.MA]目的:静的解析警告の自動分析,分類,および修正
- コード品質維持には,バグや脆弱性の早期発見が不可欠であるため,静的解析の重要性は高い。
- 静的解析警告の目視確認と修正は手間がかかり,無視されることで品質劣化を招く可能性がある。
- 静的解析警告の自動修正により,開発者の負担を軽減し,コード品質の維持向上を目指す。
- 提案手法CodeCureAgentは,LLMベースのエージェントを用いて,静的解析警告の分析,分類,修正を自動化する。
- 106のJavaプロジェクトにおける1,000件のSonarQube警告データセットで評価した結果,妥当な修正を96.8%の警告に対して生成した。
- 手動検査の結果,修正の正確率は86.3%であり,信頼性の高い静的解析警告の修正が可能であることが示された。
有限ブロック長流体アンテナシステム [cs.IT, math.IT]目的:有限ブロック長制約下における流体アンテナシステムの評価手法開発
- 次世代無線ネットワークでは,信頼性,低遅延,超大規模接続が求められる。
- 流体アンテナシステムの性能は漸近的な条件下で研究されているが,有限ブロック長下での挙動は未解明である。
- 様々な空間相関モデルにおいて適用可能な,流体アンテナシステムの有限ブロック長下における評価ツールを確立する。
- 極値理論を用いて,非直交有限長ユーザシグネチャ設計における相関係数の平均値と最悪値のベンチマークを確立した。
- ブロック誤り率を基本指標として,流体アンテナシステムにおける結合検出と復号を解析し,チャネルモデルに普遍的に適用可能な誤り率式を導出した。
- 有限ブロック長下でのアウトエイジ確率を再検討し,流体アンテナシステムと従来の固定アンテナシステム双方に対する解析解を得た。
スペクトルクラスタリングを超えて:微分可能なグラフ分割のための確率的カット [cs.LG, cs.DS, stat.ML]目的:微分可能なグラフ分割のための確率的カット
- グラフ構造データの解析は,ソーシャルネットワーク分析や画像認識など,多様な分野で重要である。
- 従来のグラフ分割手法は微分不可能であり,深層学習モデルとの統合が困難であった。
- 微分可能なグラフ分割手法を開発し,深層学習モデルとの連携を可能にすること。
- 本研究では,RatioCutを含む幅広いカットを網羅する統一的な確率的フレームワークを提案した。
- 提案手法は,積分表現とガウス超幾何関数を用いて,期待される離散カットに対して厳密な上限を導出した。
- これにより,大規模なグラフに対しても安定した微分可能なグラフ分割を実現する基盤を確立した。
コード変更から品質向上へ:Python 機械学習システムにおけるPyQuを用いた実証研究 [cs.CL, cs.SE]目的:Python機械学習システムのコード変更と品質への影響の関係性の解明
- 生成AIの普及に伴い,機械学習システムの重要性が増しており,ソフトウェア品質の確保が不可欠である。
- 機械学習システムの複雑化により,コード変更が品質に与える影響を正確に把握することが困難である。
- PyQuを用いて,品質を向上させるコード変更を特定し,その傾向を明らかにすること。
- 大規模な実証研究により,3340のオープンソースPython機械学習プロジェクトにおける370万件以上のコミットを分析した。
- PyQuは,低レベルのソフトウェアメトリクスを活用し,品質を向上させるコミットを平均F1スコア0.84,0.85の精度で特定できる。
- 61件のコード変更を分類し,13のカテゴリに整理,その41%は既存のツールでは検出されなかった。
オンラインフロー時間最小化:非先取アルゴリズムに対するタイトな上限 [cs.DS]目的:n個のジョブをm台の同一マシンに割り当てるオンラインスケジューリングにおける総フロー時間最小化
- オンラインスケジューリングは,リアルタイムシステムやクラウドコンピューティングなど,様々な分野で重要な課題である。
- 既存手法では,決定性アルゴリズムにおいて,性能改善の限界が示されていた。
- 本研究では,ランダム化,複数マシン,キル&再起動能力が性能に与える影響を明らかにすることを目指す。
- ランダム化された非先取アルゴリズムにおいて,$\Theta(\sqrt{n/m})$のタイトな競争率を確立した。
- 複数マシンの決定性非先取アルゴリズムに対し,$O(n/m^2 + \sqrt{n/m}\log m)$の上限と$\Omega(n/m^2 + \sqrt{n/m})$の下限を証明した。
- キル&再起動モデルでは,決定性アルゴリズムの明確な転移点を示し,ランダム化による性能向上は限定的であることを示した。
SmartPoC:スマートコントラクトのバグレポートに対する実行可能かつ検証済みのPoC生成 [cs.DC, cs.SE, cs.CR]目的:スマートコントラクトのバグレポート検証のための実行可能PoC(概念実証)の生成と自動的な悪用可能性検証
- スマートコントラクトはセキュリティリスクが高く,脆弱性発見が不可欠である。静的解析では検出されるものの,PoCの生成と検証に手間がかかる。
- 静的解析の結果は多様で再現性が低く,手動での検証にコストがかかる。LLMを利用しても,ノイズ,実行環境との乖離,ランタイムオラクル不足などの課題がある。
- バグレポートからPoCを自動生成し,実行と悪用可能性の検証を行うことで,効率的かつ信頼性の高い脆弱性検証を実現する。
- SmartPoCは,バグレポートから関数の周辺部分を抽出し,ノイズを低減することで,LLMによるPoC生成の精度を高めている。
- 生成・修正・実行のループと差分検証を用いることで,PoCの実行可能性と悪用可能性を検証し,高い精度を実現している。
- SmartBugs-VulとFORGE-Vulのベンチマークにおいて,高い確認精度と再現率を示し,Etherscanのデータでも低コストでバグの確認に成功している。
Lumos:言語モデルシステム認証の実現 [cs.PL, cs.AI, cs.MA]目的:言語モデルシステム(LMS)の振る舞いを規定し,形式的に認証するための枠組み
- 言語モデルの利用拡大に伴い,安全性や信頼性の検証が不可欠となっている。
- 既存のLMS評価手法は網羅性に欠け,複雑なプロンプト分布への対応が困難である。
- Lumosは,LMSの安全性とプライバシーに関する保証を提供し,信頼性の高いシステム構築を目指す。
- Lumosは,グラフ構造を用いた確率的プログラミングDSLにより,プロンプト分布を構造的に記述し,認証を可能にする。
- 最先端の視覚言語モデルQwen-VLにおいて,悪天候下での右折シナリオにおいて,90%以上の確率で安全上の欠陥が確認された。
- Lumosのモジュール構造により,仕様の変更が容易であり,変化する脅威に対応した認証が可能となる。
