arXiv雑要約
プログラム - 2026/04/28 公開
nowhere denseグラフクラスにおける構成的なカノニカルスプリッター戦略に関する考察 [cs.HC, cs.LO, cs.DM, math.LO]目的: nowhere denseグラフクラスにおけるカノニカルスプリッター戦略の構成的な上限
- グラフ理論において,グラフの構造と性質を理解することは,様々な応用分野で重要である。
- nowhere denseグラフクラスの特性評価は難しい。既存の研究では,その判定に抽象的な定理を用いている。
- スプリッターゲームにおける進行可能な手の数を,構成的に評価することで,具体的な上限を示す。
- スプリッターゲームにおいて,Splitterが$k$ラウンドで勝利できる場合,進行可能な手の数は$(2r+1)^{\,2^{k-1}-1}$以下となる。
- 既存研究における上限の証明はコンパクト性定理に依存するのに対し,本研究では構成的な証明を与えている。
- 本結果は,nowhere denseグラフクラスのより具体的な理解に貢献すると考えられる。
SWE-QA:言語モデルはリポジトリレベルのコードに関する質問に答えられるか? [eess.SY, cs.SY, cs.CL, cs.PL, cs.SE]目的:リポジトリレベルのコード質問応答
- ソフトウェア開発の効率化に貢献するため,コード理解と推論能力は重要である。
- 既存のベンチマークはコード断片に偏っており,大規模リポジトリの複雑さを捉えられていない。
- 現実的なコード環境における自動QAシステムの研究を促進すること。
- 本研究では,リポジトリレベルのコード質問応答ベンチマークSWE-QAを提案した。
- SWE-QAは,意図理解,クロスファイル推論,多段階依存関係分析を含む576の高品質な質問応答ペアを提供する。
- 実験の結果,LLM,特にSWE-QA-AgentフレームワークがリポジトリレベルのQAにおいて有望であることが示された。
Clotho:LLM入力に対するタスク固有の事前生成テスト妥当性評価 [cs.SE, cs.LG]目的:LLM入力のタスク固有のテスト妥当性の評価方法
- ソフトウェア開発において,LLMの活用が不可欠となる場面が増加しており,信頼性の高いテストが求められている。
- LLMのテストには正解データが少ない場合が多く,人手による評価に頼らざるを得ないという課題が存在する。
- 入力データ自体からテストの有用性を評価し,効率的なテストデータ選定を実現することを目指す。
- Clothoは,LLMの隠れ状態から入力の難易度を推定し,テスト妥当性を事前評価する手法である。
- 未ラベル入力プールからGMMを用いて情報量の多いケースを人間がラベル付けするための参照セットを適応的にサンプリングする。
- 評価実験の結果,Clothoは平均5.4%程度の参照セットで0.716のROC-AUCで失敗を予測でき,実行コスト削減に貢献する。
CoRaCMG:コンテキストに基づく検索拡張型コミットメッセージ生成フレームワーク [cs.MA, cs.SE]目的:コミットメッセージ生成の性能向上
- コード変更の意図を明確にするコミットメッセージは,ソフトウェア開発における重要なドキュメントである。
- 既存のコミットメッセージは,品質が低い,曖昧,または不完全な場合が多く,有用性が制限されている。
- LLMを用いて,より正確で情報量の多いコミットメッセージを自動生成することを目指す。
- CoRaCMGは,類似のdiff-メッセージペアを検索し,LLMに提供することで,性能を大幅に向上させる。
- DeepSeek-R1では,単一のペアの追加でBLEUスコアが76%,CIDErスコアが71%改善された。
- GPT-4oは,BLEUスコアが89%向上し,最も高い改善率を示した。また,3つ以上の例を追加しても効果は薄れた。
ニューラルモデル拡張型ハイブリッドNMS-OSDデコーダ:短ブロック符号における近ML性能 [cs.IT, math.IT]目的:短線形ブロック符号(LDPC,BCH,RS符号を含む)に対する準最尤(near-ML)性能の達成
- 通信システムの信頼性を向上させるため,誤り訂正符号化技術は不可欠である。
- 従来の復号化手法では,性能と計算量のトレードオフが課題となっていた。
- ニューラルネットワークと伝統的な復号化手法を組み合わせ,性能と効率の両立を目指す。
- 提案手法は,LDPC,BCH,RS符号において,最先端の手法と同等以上のフレーム誤り率性能を達成した。
- NMSデコーダとOSDを組み合わせることで,スループット,遅延,計算量においても優位性を示す。
- OSDにおけるテストエラーパターン(TEP)の平均数を大幅に削減し,並列化に適したアーキテクチャである。
片側局所交差最小化 [cs.DS]目的:グラフにおける交差数の最小化
- グラフ描画は可視化の基本であり,情報の理解を助ける上で重要である。
- 交差数を最小化する問題はNP困難であり,効率的なアルゴリズムが求められている。
- 局所的な交差数を最小化することで,より実用的な描画が可能となる。
- 本研究により,片側局所交差最小化問題がNP困難であることが証明された。
- 高次数スターグラフの森林に対しても同様の結果が得られ,効率的なアルゴリズムの存在が否定された。
- 最大次数2のスターグラフ森林に対しては,2次時間アルゴリズムが提示された。
量子化されたGNNの検証可能性と高い計算困難性 [cs.LO, cs.AI, cs.CC, cs.LG]目的:量子化された集約-結合グラフニューラルネットワーク(ACR-GNN)に関する推論のための論理言語
- グラフニューラルネットワークは,様々な分野で活用されており,その信頼性確保は重要である。
- 量子化されたGNNの検証は,計算量が多く,現実的な時間で完了することが困難である。
- 量子化されたGNNの検証可能性を論理的に特徴づけ,その計算困難性を明らかにする。
- 量子化されたGNNの検証タスクは,(co)NEXPTIME-完全であることが証明された。
- この結果は,量子化されたGNNの検証が計算困難であることを示唆し,安全性確保のための研究を促進する。
- 実験的に,量子化されたACR-GNNモデルは軽量でありながら,非量子化モデルと同等の精度と汎化能力を維持することが示された。
ゴモリー・フー木から最大フローおよびエキスパンダー分解への単純な決定性還元 [cs.CY, econ.GN, q-fin.EC, cs.DS]目的:ゴモリー・フー木と最大フロー計算,エキスパンダー分解間の還元
- ネットワークの信頼性や効率的な情報伝達において,グラフ構造の解析は不可欠である。
- ゴモリー・フー木の計算は,グラフの構造解析において重要な役割を果たすが,計算コストが高い。
- ゴモリー・フー木の計算を,より効率的な最大フロー計算に還元することで計算コストを削減する。
- 本研究では,ゴモリー・フー木から最大フローへの単純かつ効率的な還元法を提案した。
- 非重み付きグラフでは,インスタンスサイズと実行時間が$\tilde{O}(m)$に削減され,既存手法より優れている。
- 重み付きグラフやハイパーグラフへの拡張も可能であり,同様に還元が可能であることを示した。
SpaDA:空間データフローアーキテクチャ向けのプログラミング言語 [cs.DC, cs.PL]目的:空間データフローアーキテクチャのプログラミングの簡素化
- AIや科学計算において,大規模な並列処理による高性能化が求められている
- 空間データフローアーキテクチャは共有メモリを持たないため,データ移動や非同期タスク管理が困難である
- 低レベルなアーキテクチャの詳細を抽象化し,データ配置やデータフローを容易に制御すること
- SpaDAは,Cerebras CSLへのコンパイラを実装し,多段階の変換と最適化パスを用いる。
- SpaDAは,CSLと比較して14.09分の1のコード量で複雑な並列パターンを記述できる。
- 単一のデバイス上で73万個のPEを利用し,260 TFlop/sを超える性能を達成した。
高階同時実行確率的プログラムの文脈的洗練 [cs.LO, cs.PL]目的:高階同時実行確率的プログラムの文脈的洗練の証明
- 現代のソフトウェアは並行性と確率的要素を含むことが多く,その検証が重要である。
- 並行性と確率的要素を組み合わせたプログラムの形式検証は非常に難しい。
- 高階関数と局所状態を持つ確率的並行プログラムの検証を可能にすること。
- Foxtrotは,高階分離論理を用いて,複雑な確率分布を伴う並行処理プログラムの文脈的洗練を証明する。
- Foxtrotは,不変量やゴースト資源といった既存の並行処理推論原理に加え,テープ事前サンプリングや誤差増幅による誘導といった高度な確率的推論原理を統合している。
- このロジックの健全性は,Iris論理内の選択公理のバージョンに依存しており,Rocq証明支援システムで機械化されている。
LLM4SCREENLIT:システマティックレビューにおける文献スクリーニングのための大規模言語モデルの性能評価に関する提言 [cs.HC, cs.SE, cs.AI, cs.LG]目的:システマティックレビューにおける大規模言語モデルの文献スクリーニング評価に関する実践的な提言
- システマティックレビューは,医療や科学研究におけるエビデンスに基づいた意思決定に不可欠である。
- 文献スクリーニングは時間と労力を要する作業であり,大規模言語モデルの利用が期待される。
- 大規模言語モデルの評価指標が,偏った結果をもたらす可能性を解消し,適切なモデル選択を支援すること。
- 従来の評価指標では,文献スクリーニング特有の非対称性やコストが考慮されないことが明らかになった。
- 提案された加重マシューズ相関係数(WMCC)は,見逃しによる損失を最小限に抑える上で有効であることが示された。
- 評価報告には,完全な混同行列を含めること,および未分類出力をポジティブとして扱うことが重要である。
MermaidSeqBench:自然言語からMermaidシーケンス図生成の評価ベンチマーク [cs.SE, cs.AI, cs.LG]目的:自然言語からのMermaidシーケンス図生成能力の評価
- ソフトウェア開発における可視化の重要性が高まっており,自動化された図生成技術へのニーズがある。
- 既存のベンチマークが存在せず,大規模言語モデルのシーケンス図生成の正確性を客観的に評価できない。
- 大規模言語モデルのシーケンス図生成の信頼性を高め,実用的なソフトウェア開発への応用を促進する。
- MermaidSeqBenchは,人間による検証とLLMによる拡張を組み合わせた,132サンプルからなるベンチマークである。
- LLMを評価モデルとして活用し,構文の正確性,アクティベーション処理,エラー処理,実用性などの詳細な指標を用いて評価を行った。
- 評価の結果,モデル間および評価モード間で能力に差があることが明らかになり,ベンチマークの有効性が示された。
連結性維持重要セパレータ:カット・アンカット問題のためのフレームワーク [cs.DS, cs.CC]目的:カット・アンカット問題に対する新しいフレームワークの提案
- グラフ分離はパラメータ化アルゴリズム設計の中核であり,重要セパレータはその重要な構成要素である。
- 従来のフレームワークは,ターミナル集合を分離しつつ特定のグループ内の連結性を維持する必要があるカット・アンカット問題では機能しない。
- 連結性を維持しつつカット・アンカット問題を解決するための,構造化されたセパレータの発見を目指す。
- 提案する連結性維持重要セパレータ族は,サイズ$k$以下のものが$2^{O(k \log k)}$個以下であり,同程度の計算量で列挙可能である。
- このフレームワークを応用し,Node Multiway Cut-Uncut問題に対する固定パラメータアルゴリズムを改善した。
- 特に,同値類の数が一定の場合(2-Sets Cut-Uncutを含む),計算量を$2^{O(k \log k)}$に向上させた。
ショートカット集合とホップセットに対する貪欲アルゴリズム [cs.DS, cs.DM]目的:グラフ距離のスパース化における貪欲アルゴリズムの開発と分析
- グラフ距離のスパース化は,大規模グラフの処理効率化に不可欠であり,様々な応用分野で重要である。
- 既存手法では,サイズと品質のトレードオフが課題であり,最適なバランスを見つけることが難しい。
- 本研究は,ショートカット集合とホップセットにおける貪欲アルゴリズムの性能向上を目指す。
- ショートカット集合に対する貪欲アルゴリズムは,KoganとParter (2022)の結果と同等のサイズ/ホップバウンドのトレードオフを達成する。
- 前処理を加えることで,一部のパラメータ範囲において既存のサイズ上限を改善する。
- ホップセット問題においても,貪欲アルゴリズムの最適性が確認され,予算が $O(m)$ の場合の性能を向上させる。
実行トレースに基づく検証可能な思考過程の生成 [cs.HC, cs.SE, cs.AI, cs.PL]目的:コードに関する言語モデルの正確な推論
- コード理解は,ソフトウェア開発や自動化において不可欠であり,AI技術の応用範囲を広げる。
- 従来の思考過程生成データは,検証可能なプログラム挙動に基づかず,論理的な誤りを含む場合がある。
- プログラムの実行トレースを用いて,検証可能な思考過程を生成し,モデルの推論能力を向上させる。
- 実行トレースを検証済みの思考過程データとして活用することで,言語モデルのコード推論能力が大幅に向上した。
- LiveCodeBench-Exec,CruxEval,HumanEvalといったベンチマークテストで,最高+26.6%の改善が見られた。
- 検証の質が,推論能力とコード生成能力の両方に直接影響することが示された。
属性グラフに対するカスタマイズ可能な不正確な部分グラフマッチングアルゴリズム [cs.DS]目的:属性グラフにおける不正確な部分グラフマッチング
- データ量は増加の一途を辿り,オブジェクト間の関係性の特定は重要である。
- 現実のデータにはノイズやエラーが含まれ,厳密な部分グラフマッチングは困難である。
- ノイズを含むデータセットに対する,柔軟な部分グラフマッチング手法の提供。
- 本アルゴリズムは,ノードとエッジの属性を活用し,探索空間を削減する。
- グラフ編集距離コスト関数を修正可能にすることで,多様なデータセットに対応可能である。
- 家系図や制御フローグラフを用いた実験により,有効性が示された。
フォールバック関数の型付け:型安全なスマートコントラクトへの意味的アプローチ [cs.PL]目的:型安全なスマートコントラクトの実現
- ブロックチェーン技術の安全性確保が重要であり,スマートコントラクトの脆弱性が大きな課題となっている。
- 静的型付けが難しい構文要素を含むスマートコントラクトにおいて,型安全性を保証することが困難である。
- 証明付きコードの仕組みを利用し,型安全性の証明書検証によってスマートコントラクトの安全性を担保する。
- 本研究では,TinySolというSolidityの簡易版に対し,意味的型付けを適用し,情報フロー制御と非干渉性を保証した。
- 型安全性の証明をコンパクトに表現するため,双シミュレーションで用いられるup-to技術を活用した。
- フォールバック関数を用いた一般的な実装パターンへの型付けが可能であり,Parity Multisig Wallet Attackの亜種を拒否できることを示した。
奇特性における低ブーメラン均一性を持つ局所APN二項式 [cs.IT, math.IT, math.NT]目的:奇特性における局所APN二項式の特性
- 暗号技術において,非線形関数は安全性確保に不可欠であり,その特性評価は重要である。
- 既存の局所APN関数のブーメラン均一性解析は困難であり,効率的な評価手法が求められている。
- ブーメラン均一性の低い局所APN関数を特定し,暗号設計への応用可能性を探求すること。
- q≡3(mod 4)のとき,特定のrに対して定義される関数F_r(x)が局所APNとなり,ブーメラン均一性が最大2となることが示された。
- x∈Fqにおいてχ(x)=χ(x+1)=1となるものが最大1つ存在し,gcd(r,q-1)が2で割り切れる場合,F_rはブーメラン均一性最大2の局所APN関数となる。
- F_3およびF_(2q-1)/3の微分スペクトル,およびp=3におけるF_2のブーメランスペクトルが解析された。
PRAXIS:プログラム解析とオブザーバビリティの統合による根本原因分析 [cs.DC, cs.AI, cs.SE]目的:クラウドインシデントの根本原因分析のための手法
- クラウドサービスの可用性は重要であり,インシデントによる損失を最小限に抑える必要がある。
- クラウドインシデントの根本原因の特定は,複雑で時間がかかる場合が多い。
- 根本原因分析の精度向上と,コスト削減を目指す。
- PRAXISは,サービス依存グラフとプログラム依存グラフを活用し,エージェントによるワークフローを調整する。
- 最先端のReActベースラインと比較して,根本原因分析の精度を最大6.3倍向上させ,トークン消費量を5.3倍削減する。
- 30件の実世界のインシデントを用いてPRAXISの有効性を実証し,根本原因分析のベンチマークを構築中である。
大規模推論モデルへのエネルギー効率を考慮したルーティング [cs.AI, cs.IT, cs.SY, eess.SY, math.IT]目的:大規模推論モデルのエネルギー消費削減
- AIモデルの規模拡大に伴い,推論時のエネルギー消費が大きな課題となっている。
- モデル選択や運用方法によってエネルギーコストが異なり,最適なバランスが不明である。
- エネルギー消費と性能の変動性を考慮したルーティング戦略を確立すること。
- 推論時のエネルギーコストはモデルや推論量によって異なり,適切なモデル選択が重要である。
- システム性能は,平均エネルギー供給量と変動性のバランスによって決まる。
- トレーニング計算量と推論計算量のスケーリング則に基づくルーティングポリシーの有効性が示された。
GlycoPy:バイオプロセスモデリング,最適化,制御のためのCasADiベースPythonフレームワーク [cs.SE, cs.MS, math.OC]目的:バイオプロセスにおける階層的モデリング,最適化,制御のためのフレームワーク
- バイオプロセスは医薬品製造等に不可欠であり,高効率化が求められている
- 複雑なバイオプロセスのモデル化,シミュレーション,最適化は困難である
- 複雑なバイオプロセスに対し,階層モデル構築と高度な制御を実現する
- GlycoPyは,CasADiとPythonを組み合わせた階層的モデリングフレームワークである
- 本フレームワークは,記号的微分計算により,最適化と制御を統合的に行うことを可能にする
- 抗体糖鎖化プロセスへの適用により,実用性と再利用性が実証された
効率的なABS+極符号LLRドメイン復号 [cs.CL, cs.IR, cs.IT, math.IT]目的:ABS+極符号のLLRドメインにおけるSCL復号方式
- 通信における信頼性の高いデータ伝送が求められるため,誤り訂正符号の研究が重要である。
- 既存の極符号は復号処理に時間がかかる場合があり,高速化が課題となっている。
- ABS+極符号の復号効率を向上させ,高速な誤り訂正処理を実現することを目指す。
- 本研究では,ABS+極符号のSCL復号器をLLRドメインで実装し,計算量を削減した。
- 提案手法は,従来の極符号と比較して,同等のFERを達成するために必要な演算回数を低減できる。
- 特に高SNR領域において,ABS+極符号の復号効率の向上が確認された。
KOCO-BENCH:大規模言語モデルはソフトウェア開発におけるドメイン知識を活用できるか [cs.NI, cs.HC, cs.CY, cs.SE, cs.AI, cs.CL, cs.LG]目的:ソフトウェア開発におけるドメイン知識の活用に関する大規模言語モデルの評価
- ソフトウェア開発は,経済活動の基盤であり,その効率化は重要である。
- 大規模言語モデルは汎用的なプログラミングには優れるが,特定のドメインに特化したソフトウェア開発には課題がある。
- 既存のベンチマークではドメイン知識の習得・応用能力を評価できず,本研究ではその評価を可能にするベンチマークを開発する。
- KOCO-BENCHは,6つの新たなドメインと11のフレームワーク,25のプロジェクトを含む,実用的なソフトウェア開発を評価するためのベンチマークである。
- 本ベンチマークは,APIやルールなどの多様なドメイン知識の習得・応用を必要とし,大規模言語モデルに有意な課題を提示する。
- 最先端モデルであるClaude Codeでも34.2%の精度にとどまり,より効果的なドメイン特化手法の開発が急務であることが示された。
サブ線形スパース性を持つ信号推定における直接定理と逆定理 [cs.CL, cs.IT, math.IT]目的:サブ線形スパース性を持つ信号推定の理論的限界と最適性
- 信号処理において,スパースな信号の効率的な推定は,データ圧縮やノイズ除去などの基礎となる。
- 従来の信号推定理論は線形スパース性を前提としており,より一般的なサブ線形スパース性への拡張が課題であった。
- サブ線形スパース性における信号推定の限界と,既存の推定器の最適性を明らかにすること。
- サブ線形スパース性限界において,最尤推定量が閾値以下のノイズ分散で消失二乗誤差を達成することが証明された。
- 閾値以上のノイズ分散の場合,すべての推定器は信号電力よりも小さい二乗誤差を達成できないことが示された。
- 提案された非分離推定器は,高SNR領域において分離ベイジアン推定量を上回る性能を示した。
エージェントの失敗時:自動ラベル付けによるLLMエージェントのバグに関する包括的調査 [cs.SE]目的:LLMエージェントにおけるバグの種類,根本原因,および影響の分析
- LLMはアプリケーション開発に変革をもたらしたが,実用的なアクション実行にはツールとの連携が必要である。
- LLMエージェントのデバッグは,分野の初期段階であり,コミュニティが未発達であるため困難かつコストがかかる。
- 本研究は,LLMエージェント開発におけるバグの理解を深め,自動的なバグ特定可能性を探求する。
- Stack Overflow,GitHub,Hugging Faceの1,187件のバグ関連投稿とコードスニペットを分析した。
- Gemini 2.5 Flashを搭載したBugReActエージェントは,バグ特性の注釈付けにおいて優れた性能を示し,平均コストは1件あたり0.01USDであった。
- バグの発生コンポーネント,プログラミング言語,フレームワークなど,詳細な分析を行った。
SWE-Pruner:コーディングエージェントのための自己適応的コンテキストプルーニング [cs.SE, cs.CL]目的:コーディングエージェントにおける長文コンテキストの効率的な削減
- LLMエージェントはソフトウェア開発で有用だが,長いコンテキストはコストと遅延を増大させる。
- 既存のコンテキスト圧縮手法は固定指標に頼り,コード理解のタスク固有性を考慮していない。
- SWE-Prunerは,タスクに応じたコンテキストプルーニングにより,この問題を解決することを目指す。
- SWE-Prunerは,人間のプログラマーがソースコードを「選択的に読み飛ばす」という考え方を模倣した自己適応的コンテキストプルーニングフレームワークである。
- SWE-Bench Verifiedなどのタスクで23〜54%のトークン削減を達成し,成功率を向上させた。
- LongCodeQAなどのシングルターンタスクでは最大14.84倍の圧縮を実現し,パフォーマンスへの影響は最小限に抑えられた。
エッジAIシステムのためのスケーラブルな説明可能性 as a Service (XaaS) [cs.LG, cs.AI, cs.DC, cs.SE]目的:エッジAIシステムにおける説明可能性の提供
- AIの信頼性向上は重要であり,説明可能性はその鍵となる。特にエッジ環境での活用が求められている。
- 既存手法は推論と説明を同時に行うため,計算コストが高く,スケーラビリティに課題がある。
- エッジデバイスのリソース制約下でも,効率的に説明可能性を提供するアーキテクチャを構築する。
- XaaSは,推論と説明生成を分離することで,遅延を38%削減し,説明の質を維持する。
- 分散キャッシュとセマンティック類似性に基づく検索により,冗長な計算を削減する。
- 軽量な検証プロトコルにより,キャッシュされた説明と新規生成された説明の信頼性を保証する。
量子ソフトウェア工学入門コース:経験報告 [cs.SE, cs.CY, cs.ET, quant-ph]目的:量子ソフトウェア工学教育における実践的知識の習得
- 量子計算はプログラミングを通じて発展しており,人材育成が急務である。
- 既存の教育はアルゴリズムやフレームワークに偏り,ソフトウェア工学的な視点が欠けている。
- ソフトウェア工学の観点から量子計算を捉え,実践的な能力を育成することを目指す。
- 基礎的な量子情報とアルゴリズムの理解があれば,学生は量子ソフトウェア工学のトピックに積極的に取り組めることが示された。
- 本研究は,モジュール化されたコース設計と,学年混合型クラスに対応可能な評価モデルを提供する。
- 量子計算カリキュラムを開発するソフトウェア工学教育者への示唆が得られた。
支配集合問題の自己参照的インスタンスは還元不可能である [cs.CL, cs.CC, cs.DS]目的:エルドス・レニイ確率グラフにおける支配数に関するアルゴリズム決定可能性
- グラフ理論は,ネットワーク科学や計算機科学において重要な役割を担う基本的な研究分野である。
- 支配集合問題はNP困難であり,大規模グラフに対する効率的な解法が求められている。
- 確率グラフにおける支配集合問題の困難性が,局所構造ではなく全体構造に由来することを明らかにする。
- 特定の確率$p$において,支配問題は強い還元不可能性を示すことが示された。
- グラフのノード数$n$の対数$k$に依存する支配集合の存在を,限られた部分グラフのみで判定することは不可能である。
- 支配集合の存在は,僅かなエッジの変更により反転し,網羅的な探索が必要となることが示された。
平均移動構造クエリの範囲指定による,より高速で小型なRLBWT置換 [cs.DS]目的:平均移動構造クエリの時間制約
- 圧縮テキストインデックスにおいて,Burrows-Wheeler Transform (BWT) ラン数に比例した空間で重要な役割を果たす。
- 従来の区間分割平衡化による構築には時間がかかり,キャッシュ効率にも課題があった。
- 区間長を制限する単純な分割法により,平均移動構造クエリ時間を最適化し,構築時間を短縮する。
- 区間長制限による分割は,理論上・実用上,優れた結果をもたらす。
- 表現量を$O(r \log r)$-ビット削減し,最悪ケースのクエリ時間を$O(\log \frac{n}{r})$に改善した。
- 実験により,区間長制限による構築が平衡化よりも高速かつ省メモリであり,クエリも高速であることが確認された。
解釈可能なアンサンブル近似と動的分解によるRNA設計可能性の確率的評価 [cs.SI, cs.DL, cs.RO, cs.DS]目的:RNA設計可能性の確率的評価方法
- RNAは生命活動において重要な役割を担うため,その構造設計は生命科学研究において不可欠である。
- RNAの二次構造を折り畳む配列の設計は困難であり,全ての構造が設計可能とは限らないという課題がある。
- アンサンブルに基づく設計可能性の評価という未開拓の領域に着目し,設計困難性の原因を解析することを目的とする。
- 提案手法は,既存手法と比較してRNA構造の確率的上限をより厳密に算出できることが示された。
- 本研究では,RNA構造の解析ツールを提供し,設計困難性の要因をモチーフレベルで理解するための洞察が得られた。
- 実装されたソースコードとデータは公開されており,RNA設計研究の発展に貢献する。
最小最大連結多方向カット [cs.DS, math.CO, math.OC]目的:最小最大連結多方向カットの定義と解析
- ネットワーク設計において,重要な最適化問題の一つであり,信頼性の高いネットワーク構築に不可欠である。
- 標準的な多方向カット問題では,各部分グラフの連結性が保証されない場合がある。
- 部分グラフの連結性を保証しつつ,最大境界サイズの最小化を目指す。
- 本研究では,最小最大連結多方向カット問題の計算複雑性を明らかにした。弱NP困難性,W[1]-困難性を示すとともに,制限された条件下での多項式時間アルゴリズムを提示した。
- 最小最大多方向カット問題が,3つの端点を持つグラフに対してもNP困難であることを示した。
- この問題は,spanning tree congestion問題と密接に関連しており,その問題への新たなアプローチを提供する可能性がある。
大規模なプラットフォーム防御の回避:YouTubeからブロックチェーンベース分散ストレージへの自動コンテンツ複製 [cs.CR, cs.SE]目的:YouTubeからJoystreamへの自動コンテンツ抽出および複製システム
- 動画配信プラットフォームの信頼性確保は重要であり,検閲耐性やデータ永続性の課題がある。
- プラットフォームは,API制限やボット検出など様々な防御策を施しており,大規模なデータ複製が困難である。
- プラットフォームの防御機構を回避し,安定したクロスプラットフォーム複製を実現すること。
- YouTubeの防御層は相互に作用しており,一つの制御を回避すると別の制御が作動し,連鎖的な障害が発生することが判明した。
- 3.5年間の運用事例から,アーキテクチャの継続的な適応が,大規模なクロスプラットフォーム複製を維持する上で不可欠であることが示された。
- OAuthに代わる信頼を最小限に抑えたチャンネル制御プロトコルや,状態整合性を保つ書き込み先ログなどの技術が開発された。
SEVerA:自己進化型エージェントの検証合成 [cs.CL, cs.SI, cs.LG, cs.PL, cs.SE]目的:自己進化型エージェントの安全性と正確性の形式的保証
- プログラム修復や科学的発見において,自己進化型LLMエージェントの有効性が示されている。
- 既存のフレームワークには,安全性や正確性の形式的な保証がなく,信頼性とセキュリティ上の懸念がある。
- 形式的な仕様とタスクの有用性を組み合わせた制約付き学習問題としてエージェントのコード生成を定式化する。
- SEVerAは,Dafnyプログラム検証,記号的数学合成,ポリシー準拠のエージェントツール使用において,制約違反ゼロを達成した。
- 形式的な行動制約は正確性を保証するだけでなく,より高品質なエージェントの合成を導くことが示された。
- 既存のベースラインと比較して,性能が向上しており,形式的な制約が有用であることが示唆される。
AIブームの裏側:実環境におけるAI生成コードの大規模実証研究 [cs.SE]目的:AI生成コードによる技術的負債の発生と推移
- ソフトウェア開発においてAI利用が拡大中であり,その影響を評価する必要がある。
- AI生成コードの品質問題が指摘されているが,実環境での長期的な影響は不明である。
- AI生成コードがもたらす技術的負債の現状を明らかにし,対策の必要性を示す。
- 30万件以上のAI生成コミットを分析した結果,コードスメルが最も多く,全体の89.3%を占めた。
- AIアシスタントの15%以上のコミットで少なくとも1つの問題が発生し,その一部は長期間残存していることが判明した。
- AI生成コードは長期的な保守コストを生み出す可能性があり,品質保証の強化が求められる。
コード生成における随時思考 [cs.SE, cs.LG]目的:コード生成時の思考メカニズム
- 近年のLLMの発展は目覚ましいが,特にコード生成においては,問題の複雑さが増すにつれて思考の限界が明らかになっている。
- 既存手法は,事前の思考に依存しており,コード実装中に問題の全容が明らかになる場合に適応できないという課題があった。
- コード生成プロセスにおける思考の必要度に応じて,動的に思考を割り当てるメカニズムを開発し,性能向上を目指す。
- 提案手法「Think-Anywhere」は,コード生成中の任意のトークン位置で思考を呼び出すことを可能にし,最先端の性能を達成した。
- 多様なLLMに対して一貫した汎化性能を示し,既存の思考手法や後学習アプローチを上回る結果が得られた。
- 分析の結果,Think-Anywhereはエントロピーの高い箇所で思考を適応的に呼び出すことができ,解釈可能性の向上に貢献している。
アトミックスキルによるコーディングエージェントのスケール拡大 [cs.SE, cs.AI]目的:アトミックスキル習得を通じたコーディングエージェントのスケール拡大
- ソフトウェア開発の効率化が求められる中,AIエージェントの活用が不可欠となっている。
- 既存のコーディングエージェントは特定のタスクに特化し,汎用性に課題がある。
- アトミックスキルを向上させることで,多様なタスクへの適応能力を高めることを目指す。
- 本研究では,コードの局所化,編集,テスト生成など,5つの基本的なアトミックスキルを定義した。
- これらのスキルを共同で強化学習することで,スキル間の干渉を避けつつ,一貫して性能を向上させた。
- アトミックスキルの向上は,バグ修正やコードリファクタリングなどの複合タスクにおいても有効性が確認された。
Arch:レジスタ・トランスファ・クロックドハードウェア設計のためのAIネイティブなハードウェア記述言語 [cs.PL, cs.CL]目的:マイクロアーキテクチャ仕様とAI支援コード生成のためのハードウェア記述言語
- 現代のデジタル回路設計において,効率的かつ正確なハードウェア記述が不可欠である。
- 既存のHDLでは,複雑な構造をパターンとして記述する必要があり,エラーが発生しやすい。
- AIを活用し,構造的に正しい,型安全なハードウェア記述を容易に生成することを目指す。
- Archは,パイプライン,FSM,FIFOなどの構造を第一級オブジェクトとして提供し,エラーを削減する。
- クロックとリセットをパラメータ型として扱うことで,CDCやリセットドメイン分析をコンパイル時に行う。
- Archコンパイラは,クリーンなSystemVerilogを生成し,Verilator等による検証を自動化する。
距離から角度へ:等方多変量コーシーノイズ下でのワンショット検出 [cs.IT, math.IT, math.PR]目的:等方多変量コーシーノイズ下におけるワンショット検出の記号レベル信頼性に関する幾何学的メカニズム
- 通信システムの信頼性確保は重要であり,特に重い裾を持つノイズ環境下での性能評価が不可欠である。
- 重い裾を持つノイズ(例:コーシーノイズ)は,ガウスノイズとは異なる幾何学的特性を持つため,従来の設計手法が適用できない場合がある。
- 本研究は,重い裾を持つノイズ環境下における信頼性記述子の変化を明らかにし,適切な設計指針を提供する。
- 等方コーシーノイズ下では,尤度最大化則により,ガウスノイズ時と同様のユークリッド・ボロノイ決定領域が誘導される。
- 小ノイズ領域では,記号誤り確率の上限が星座全体の幾何学的構造に依存することが示された。
- 大ノイズ領域では,正しい決定確率が対応するボロノイ再帰円錐の角度的尺度によってのみ決定されることが証明された。
AIコードベース成熟度モデル:支援コーディングから完全自律システムへ [cs.SE, cs.AI]目的:AIコードベースの進化段階と,その成熟度を測るためのフレームワーク
- AIコーディングツール普及が進む中,チームの成長を体系的に促進する基準が必要とされている。
- 多くのチームがAI支援コーディングで停滞し,継続的な改善のための指針を欠いている。
- コードベースがAIによって完全自律的に進化するための道筋と,各段階での課題を明確化する。
- AI駆動型開発システムの知性は,AIモデル自体ではなく,それを囲む指示,テスト,指標,フィードバックループのインフラストラクチャにある。
- レベルをスキップすることは不可能であり,次のレベルの鍵は常に新たなフィードバックメカニズムの導入である。
- テストの量,カバレッジ,信頼性は,AIコードベース成熟度向上の上で最も重要な投資であることが示された。
エージェント的コンパイル:LLM再実行危機を軽減し,最小限の推論コストでウェブ自動化を実現 [cs.HC, cs.DC, cs.PL, cs.SE]目的:LLMを活用したウェブエージェントの推論コスト削減
- ウェブ自動化の重要性が増しているが,LLMの推論コストがボトルネックとなり,大規模な自動化が困難になっている。
- 継続的な推論ループによるLLMのトークン消費量とAPIレイテンシが,実行頻度に応じて線形に増加する点が課題である。
- LLMの推論とブラウザ実行を分離し,推論コストを大幅に削減することで,経済的に実行可能なウェブ自動化を実現する。
- コンパイルと実行のアーキテクチャにより,ワークフローごとの推論コストを0.10USD以下に削減することに成功した。
- DOMサニタイゼーションモジュール(DSM)から生成されるトークン効率の良いセマンティック表現を一度のLLM呼び出しで処理し,決定論的なJSONワークフローブループリントを出力する。
- JSONの中間表現のモジュール性により,人間による介入を最小限に抑えつつ,実行信頼性をほぼ100%に向上させることが可能となった。
一般化ロース・レンプル符号:NMDS特性,エルミート自己直交性,量子構成 [cs.IT, math.IT]目的:一般化ロース・レンプル符号のNMDS特性,エルミート自己直交性,および量子構成に関する研究
- 符号理論は,通信やデータ保存において信頼性を確保する上で不可欠な分野である。
- 既存の符号では,古典的および量子誤り訂正における性能限界が存在する。
- 本研究は,一般化ロース・レンプル符号の特性を明らかにし,新たな符号構成法を提案することで,この問題を解決することを目指す。
- 本研究において,広く利用される一般化ロース・レンプル符号のサブクラスのNMDS特性に関する必要十分条件を導出した。
- 一般化ロース・レンプル符号から,4つの新しいエルミート自己直交符号族を構成し,そのうち2つはNMDS特性を持つ。
- 提案されたエルミート自己直交符号に基づき,量子一般化ロース・レンプル符号を構成し,量子単調境界に近づく量子NMDS符号を得た。
Vibeコーディングは未来か?建設安全のためのLLM生成コードの実証的評価 [cs.SE, cs.AI, cs.HC]目的:建設安全に関するLLM生成コードの信頼性,ソフトウェアアーキテクチャ,およびドメイン固有の安全性の忠実性の評価
- 建設業界におけるデジタル化の進展と,それに伴うソフトウェア開発のニーズが高まっている。
- LLMによるコード生成は便利だが,その確率的性質から,安全性を損なう潜在的なエラーが含まれる可能性がある。
- LLM生成コードの安全性に関する問題を定量的に評価し,安全な利用のためのガイドラインを提示すること。
- LLM生成コードは高い実行可能性を示す一方で,論理的な欠陥や防御的なプログラミングの欠如が明らかになった。
- 特にGPT-4o-Miniは,機能するコードの約56%で数学的に不正確な出力を生成し,深刻な誤り率を示した。
- 現状のLLMは,単独での安全工学には不十分であり,決定的なAIラッパーと厳格なガバナンスが必要である。
最適な述語プッシュダウン合成 [cs.PL]目的:述語プッシュダウンの最適化
- データ処理パイプラインの性能向上は,大規模データ分析において不可欠である。
- ユーザー定義関数(UDF)内の複雑な処理がボトルネックとなりやすい。
- UDF 実行前のフィルタリング最適化により,処理効率を向上させる。
- 本研究では,状態を持つfoldベース計算に対する述語プッシュダウンの理論基盤を確立した。
- 最適なプッシュダウン分解を自動的に構築する合成アルゴリズムを開発した。
- 実装したツールPusharooは,実際のデータ処理パイプラインにおいて平均2.4倍の高速化を実現した。
純粋借用:線形HaskellとRust風借用の融合 [cs.PL]目的:Rust風借用機構を線形Haskellで実現すること
- 関数型と命令型プログラミングの統合は重要である。両者の利点を組み合わせることで,より柔軟で効率的なプログラム開発が可能となる。
- 既存の線形Haskell APIでは,Rustのような非ローカルな借用が安全に実現できるか不明であった。
- 純粋な関数型言語であるHaskellにおいて,Rustスタイルの借用を安全に実現し,並行状態変異を可能にすること。
- Pure Borrowは,線形HaskellにおいてRustスタイルの借用を実現する新しいフレームワークである。
- 既存のIOやSTモナドとは異なり,Pure Borrowは純粋な計算内でアフィンな可変参照による並行状態変異を可能にする。
- Pure Borrowの核となる部分の形式化と,安全性,リークフリー,収束性を確立するための新しい履歴ベースの借用モデルを構築した。
制御フローコード難読化解除における思考連鎖(CoT)アプローチの分析 [cs.SE, cs.AI]目的:制御フローコード難読化解除の品質向上
- ソフトウェアの安全性確保や脆弱性分析において,コードの理解は不可欠である。
- コード難読化は解析を困難にし,手動での解析には時間とコストがかかる。
- 大規模言語モデルを用いた思考連鎖による難読化解除の自動化を目指す。
- 思考連鎖(CoT)プロンプティングは,単純なプロンプティングと比較して,難読化解除の品質を大幅に向上させる。
- GPT5は,制御フローグラフ再構築において約16%,意味的保存において約20.5%の平均的な改善を示した。
- モデルの性能は,難読化レベルや元の制御フローグラフの複雑さに依存する。
閉包忠実性における演繹的ソースに対するレート歪理論 [cs.IT, cs.LO, math.IT]目的:固定された演繹的環境で生成される有限な命題ソースの可逆圧縮
- 知識表現や推論における効率的な情報伝送は,AIや知識工学の発展に不可欠である。
- 従来の圧縮理論では,記号の一致を重視するため,演繹的構造の保存が考慮されていない。
- 演繹的構造を考慮した新しい圧縮理論を構築し,通信の根本的な限界を定量化すること。
- ソースを演繹的核と冗長な結果に分解し,ゼロ歪レートが核の質量と条件付きエントロピーに等しいことを示した。
- 再構成アルファベットがソース知識ベースの演繹的閉包に含まれる場合,レート歪関数は核のみに依存する。
- 推論深さに制限がある場合,レート・深さ・歪みの関係を厳密に特徴付け,古典的な圧縮と演繹的圧縮の間の関係を示した。
有限ピンホイールスケジューリング変種の困難度,計算可能性と密度閾値 [cs.DS]目的:有限ピンホイールスケジューリングの困難度,計算可能性,密度閾値に関する研究
- タスクスケジューリングは,計算資源の効率的な利用に不可欠であり,様々な応用分野で重要である。
- ピンホイールスケジューリング問題の計算困難性は未解決な部分が多く,効率的なアルゴリズム開発が課題である。
- 2-Visits問題の困難度を明確にし,パラメータに基づく計算可能性の向上を目指す。
- 2-Visits問題は,最大マルチプリシティが2であっても強NP困難であることが証明された。
- 異なる締切数の数が定数である場合,2-Visits問題はRPに属することが示された。
- k-Visits問題の密度閾値の下限が$\sqrt{2}-1/2\approx 0.9142$であることが示され,kが無限大に近づくにつれて5/6に収束することが証明された。
開発者とAIの相互作用:開発者のプログラミング行動のモデル化に関する探索的研究 [cs.SE, cs.HC]目的:開発者のプログラミング行動に関するモデル
- AI技術はソフトウェア開発の現場を変革しており,開発者の行動理解が重要である。
- 従来のAI-開発者間の相互作用研究では,行動面のみに着目し,意図や感情が考慮されていなかった。
- AI支援下での開発者の行動特性を多角的に捉え,より詳細なモデルを構築することを目指す。
- AI支援群は,コード生成,評価,検証といった能動的なコーディングに集中する傾向が見られた。
- AI支援群は,非AI支援群と比較して,感情の起伏が少ない安定した開発フローを示した。
- 一部の参加者からは,AIへの依存に対する罪悪感や自己不信感といった感情が報告された。
CARLA環境におけるシナリオベーステストのためのOpenSCENARIO 2.1のコンパイル [cs.RO, cs.PL, cs.SY, eess.SY]目的:OpenSCENARIO 2.1 DSLをCARLAで実行可能な挙動に変換するコンパイラの開発
- 自動運転システムの安全性評価において,シナリオベーステストは不可欠な手法である。
- 既存のOpenSCENARIOパーサーはレガシーであり,CARLAのようなオープンソースシミュレータとの統合が制限されている。
- OpenSCENARIO 2.1をCARLAで直接実行可能にするコンパイラを開発し,再現性のある大規模テストを実現する。
- 本研究では,ANTLR4フロントエンド,セマンティックミドルエンド,py_trees挙動木合成ランタイムバックエンドからなるコンパイラを提案した。
- 提案手法により,標準化されたドメインオントロジーをCARLAのAPIに直接マッピングし,外部ロジックソルバーを不要とした。
- カットインや回避機動といった検証済みシナリオを用いて,コンパイラが並行アクション,動的数式,非同期シグナリングを処理できることを確認した。
