arXiv雑要約
プログラム - 2026/04/28 公開
多項式階層とω-カテゴリカルCSP [cs.LO]目的:多項式階層の各レベルに対するω-カテゴリカル制約充足問題の完備性
- 計算複雑性において,問題の難易度を測る上で多項式階層は重要な役割を担う。
- ω-カテゴリカルCSPの構成は,特定の複雑性クラスを特徴付ける上での課題であった。
- 多項式階層の任意のレベルにおいてω-カテゴリカルCSPが存在することを示す。
- 2008年のBodirskyとGroheの研究を踏まえ,より広範なレベルでの完備性を示すことができた。
- Bodirsky, Kn\"{a}uer, Rudolphの結果を利用し,MSO論理式からのω-カテゴリカルCSP構成を応用した。
- 特定の保存特性を持つMSO文を生成するための新しい手法を開発した。
反例誘導型区間弱化 [cs.LO]目的:MTL仕様におけるタイミング区間の自動弱化
- 長期間運用されるシステムにおいて,タイミング保証の劣化は重大な問題となるため,検証が重要である。
- システムの経年劣化により,当初のタイミング仕様を満たせなくなる場合がある。
- タイミング仕様を弱化することで,システムが運用可能な範囲を維持することを目指す。
- 本研究で提案するCEGIWアルゴリズムは,MTL仕様のタイミング区間を反例に基づいて反復的に弱化する。
- CEGIWは,仕様の論理構造を保持しつつ,区間境界のみを弱化する。
- 実世界の事例を用いた実験により,CEGIWの有効性と実用性が示された。
Mono2Sls:静的解析を用いた多段階パイプラインによるモノリスからサーバーレスへの自動移行 [cs.SE]目的:モノリス型バックエンドをAWS SAMアプリケーションに変換する自動パイプライン
- クラウド利用の拡大に伴い,既存システムを効率的にクラウドへ移行する重要性が高まっている。
- モノリス型システムのクラウド移行には,コード改修やインフラ設定変更など,手作業による多大な労力が必要である。
- 静的解析とLLMエージェントを活用し,モノリスシステムのクラウド移行を自動化することで,移行コストの削減を目指す。
- Mono2Slsは,6つのベンチマークアプリケーションにおいて,手動修正なしで100%のデプロイ成功率を達成した。
- エンドツーエンドの正答率は66.1%,APIカバレッジF1スコアは98.7%であり,既存の商用ツールよりも高い性能を示した。
- 移行されたシステムは,AWSネイティブ認証と非同期パターンの使用がより一貫しており,静的解析に基づくアーキテクチャ計画が正答率向上に貢献する。
MEG-RAG:RAGにおけるエビデンス選択のためのマルチモーダルエビデンス接地量の定量化 [cs.CL, cs.IR, cs.IT, math.IT]目的:RAGにおけるエビデンス選択のためのマルチモーダルエビデンス接地量の定量化
- マルチモーダルLLMの課題解決が急務であり,その性能向上は学術的・実用的に重要である。
- 既存のMRAGシステムは,取得したマルチモーダルデータが回答の根拠として適切かどうかを判断できない。
- 回答のセマンティックコアを捉え,より適切なエビデンスを選択することを目指す。
- MEGは,セマンティックに注目した指標により,取得されたエビデンスの貢献度を定量化する。
- MEG-RAGは,MEGに基づいてマルチモーダル再ランク学習を行い,エビデンスと回答のセマンティックアンカーを整合させる。
- 実験の結果,MEG-RAGは既存手法を上回り,様々な教師モデルで頑健な汎化性能を示した。
多様性要件を持つスパニング木のための多項式カーネル [cs.DS, cs.DM]目的:多様性制約付きスパニング木のカーネル化
- ネットワーク設計や通信網において,信頼性や効率性を高めるため,多様なスパニング木が求められる。
- 多様性制約付きスパニング木問題はNP困難であり,大規模グラフへの適用が難しい。
- この研究では,パラメータ化されたカーネル化によって,問題を効率的に解くことを目指す。
- 葉と内部ノードの数に関する制約付き多様性スパニング木問題に対して,多項式カーネルが構築された。
- 非終端ノード集合を含む制約付き多様性スパニング木問題に対しても,同様の多項式カーネルが構築された。
- パラメータ数に応じて計算量を削減し,より大きなグラフへの適用可能性を高めた。
ハイブリッド量子プログラムに対するハイブリッドパスサム [cs.CY, cs.PL]目的:ハイブリッド量子プログラムの自動形式検証の基盤
- 量子計算が現実のものとなるにつれて,効率的な量子プログラミング能力の設計が不可欠となっている。
- 既存の量子プログラムの静的解析・形式検証手法は,古典制御との連携が不十分である。
- 古典・量子制御を含むハイブリッド量子プログラムの形式検証を可能にする。
- ハイブリッドパスサム(HPS)という,ハイブリッド量子/古典状態の集合を表現・操作するための新しい記号表現を提案した。
- HPSを簡略化し推論するための豊富な機構を提供する,一連の書き換えルールを定義した。
- ハイブリッド量子プログラムの等価性や状態の特性を検証するためのアサーション言語を開発し,その正当性を証明した。
測定不能なものを測定する:LLMエージェントのマルコフ連鎖信頼性 [cs.SE]目的:LLMエージェントの信頼性評価手法
- LLMエージェントの利用拡大に伴い,その信頼性評価が重要となっている。
- 従来の評価指標は,成功までの時間分布の推定や不確実性の定量化が困難である。
- エージェントの実行トレースをマルコフ連鎖に適合させ,信頼性評価の改善を目指す。
- 提案手法TraceToChainは,エージェントの実行トレースをマルコフ連鎖に適合させることで,詳細な信頼性診断と不確実性の定量化を可能にする。
- 7つの制御されたフレームワークにおいて,実測された信頼性低下曲線と解析的に得られた曲線が良好に一致し,良好な精度を示した。
- 適合度の検定や信頼区間の算出においても,提案手法は良好な結果を示し,その有効性を確認した。
NeSyCat:ニューロシンボリックULLERフレームワークの圏論的意味論(モナドに基づく) [cs.AI, cs.LO, math.CT, math.LO]目的:ニューロシンボリックULLERフレームワークの意味論の圏論的定式化
- 知識表現と推論はAIの根幹であり,様々なシステムで共通の基盤が求められている。
- 既存のニューロシンボリックシステムは,異なる意味論が独立して存在し,柔軟性に欠ける場合がある。
- モナドに基づく圏論的枠組みを用いることで,多様な意味論の統合と拡張を可能にする。
- 古典論理,ファジー論理,確率論理といったULLERの異なる意味論が,モナドのインスタンスとして統一的に表現できることを示した。
- モナドを用いることで,新しい意味論の追加や意味論間の体系的な変換が容易になる。
- ロジックテンサーネットワークにおける一般化量化を,Giryモナドを用いて拡張し,無限領域への適用を可能にする方法を示した。
LLMベースのソフトウェア工学ツール評価:現状,課題,および将来の方向性 [cs.CL, cs.SE]目的:LLMベースのソフトウェア工学ツールの評価方法
- ソフトウェア開発の効率化と品質向上に貢献するAI技術の重要性が増している。
- LLMの非決定性や多様な正解の存在により,従来の評価方法では信頼性の高い評価が困難である。
- LLMベースのツールの信頼性と効果を測るための,より堅牢でスケーラブルな評価手法を確立すること。
- LLMベースのツールは,コード生成,レビュー,バグ分類などのタスクに活用されている。
- 既存の評価手法には,正解の安定性,主観性,非決定性による評価の不安定性といった限界がある。
- 信頼性の高い評価手法の確立が,ツールの普及とソフトウェア工学におけるLLMの活用を促進する上で不可欠である。
モバイルアプリにおけるオンデバイス小規模言語モデル統合の課題 [cs.RO, cs.SE, cs.AI, cs.CL]目的:モバイルアプリケーションへのオンデバイス小規模言語モデル統合におけるエンジニアリング課題
- モバイルAI需要の高まりに伴い,プライバシー保護とオフライン処理が可能なオンデバイスLLMへの関心が増している。
- オンデバイスLLMは,計算資源の制約やモデルの信頼性,出力の安定性といった課題を抱えている。
- 本研究は,実用的なモバイルアプリへの統合における課題を明らかにし,解決策を提示することを目的とする。
- オンデバイスSLMの統合は可能だが,LLMに過度な役割を期待せず,できる限りLLMの負担を軽減することが重要である。
- 出力フォーマット違反,制約違反,コンテキスト品質の低下,遅延,モデル選択の不安定性など,固有の障害カテゴリが特定された。
- 防御的な解析,失敗からのフィードバック,セッションローテーション,プロンプトの段階的な強化,責任の系統的な削減などが有効な対策として示された。
ウォーカー星座における明示定数と再利用スケーリング則を用いた密度化逆定理 [cs.IT, math.IT]目的:ウォーカーLEO星座における密度化逆定理の確立
- 宇宙通信システムの性能向上には,衛星コンステレーションの設計が不可欠である。
- コンステレーションを密度化すると,干渉が増加し,通信品質が低下する可能性がある。
- 衛星数を増加させた場合の干渉増大と通信品質の限界を定量的に示す。
- 総衛星数Nの増加に伴い,集約干渉はNに線形に比例して増加し,有用信号は一定の上限で抑えられることが示された。
- その結果,ダウンリンクSINRのカバー率とエルゴードスペクトル効率は,Nが無限大に近づくにつれて消失する。
- 独立希薄化による周波数再利用においては,密度化崩壊を避けるためにはqN=O(1)が必要であり,再利用率はNに比例する必要がある。
大規模言語モデルを用いた複数ファイルDSLコード生成:産業界における事例研究 [cs.RO, cs.SE, cs.AI]目的:複数ファイルのDSLコード生成
- 企業におけるDSL利用が拡大しており,効率的なDSLコード生成手法が求められている。
- 既存のコード生成手法では,複数ファイルにまたがる大規模な変更に対応することが困難である。
- 大規模言語モデルを活用し,複数ファイルにわたるDSLコードの変更を自然言語指示から自動生成すること。
- ファインチューニングにより,モデルの性能が大幅に向上し,高い正解率と構造的忠実性を実現した。
- ワンショット学習もベースラインプロンプトと比較して一貫した改善を示した。
- 専門開発者による評価と既存のコードジェネレーターを用いた実行チェックにより,実用性が確認された。
LLMベースのコード生成における不備のあるタスク記述:検出と分析 [cs.SE, cs.AI]目的:LLMベースのコード生成におけるタスク記述の不備の検出と分析
- LLMはコード生成に広く利用されているが,その性能はタスク記述の質に大きく依存する。
- タスク記述が不備を含む場合,生成されるコードの正確性に悪影響を及ぼす可能性がある。
- 不備のあるタスク記述を自動的に検出することで,より信頼性の高いコード生成を可能にする。
- 開発したSpecValidatorは,軽量な分類器であり,F1=0.804,MCC=0.745という高い検出性能を示した。
- SpecValidatorは既存モデル(GPT-5-mini,Claude Sonnet 4)を大幅に上回り,未知の不備の検出にも汎化可能であることが示された。
- タスク記述の不備に対するLLMの頑健性は,モデルの規模よりも不備の種類と記述の特性に依存し,特にUnder-Specificationが深刻である。
プロンプトの不十分さがコードの正確性を向上させる場合:LLMベースのコード生成におけるプロンプトの表現と構造の効果に関する探索的研究 [cs.SE]目的:LLMによるコード生成におけるプロンプトの表現と構造が正確性に与える影響の解明
- LLMによるコード生成は効率化に貢献するが,その出力の正確性はモデルの能力だけでなく,タスクの指定方法にも左右される。
- プロンプトの記述不足はコードの正確性を低下させる可能性があるが,既存研究は単純なベンチマークに基づいている場合が多い。
- 構造的に豊富なタスク記述が,プロンプトの不十分さによる悪影響を軽減し,場合によっては正確性を向上させる可能性を示す。
- プロンプトの構造がLLMの堅牢性に大きく影響し,同じプロンプトの変更がHumanEvalとLiveCodeBenchで異なる結果をもたらすことが明らかになった。
- LiveCodeBenchでは,記述,制約,例,I/O規約間の冗長性により,プロンプトの不十分さが性能にほとんど影響を与えない場合がある。
- LiveCodeBenchにおいて,プロンプトの変更によって誤解を招く手がかりが排除され,検索ベースの誤った解決策が抑制されることで,正確性が向上することが確認された。
北極オークションに対する強力な多項式時間アルゴリズム [cs.GT, cs.DS]目的:北極オークションの均衡計算
- 資源配分の効率化は経済学における重要な課題であり,オークション設計はその解決策の一つである。
- 既存のアルゴリズムはパラメータ設定に依存し,実用的な時間内で均衡を求めることが困難な場合がある。
- 北極オークションにおける効率的な均衡計算アルゴリズムを開発し,迅速なパラメータ調整を可能にすること。
- 本研究では,線形フィッシャー市場モデルの準線形拡張である北極オークションに対し,強力な多項式時間アルゴリズムを開発した。
- このアルゴリズムは,Orlin (2010) の線形フィッシャー市場に対する強力な多項式時間アルゴリズムを基盤としている。
- 本アルゴリズムにより,銀行等における実用的なオークション設計とパラメータ調整がより迅速に行えるようになる。
CODESIM:シミュレーション駆動型計画とデバッグによるマルチエージェントコード生成と問題解決 [cs.CL, cs.AI, cs.SE]目的:マルチエージェントコード生成フレームワークによるプログラム合成の計画,コーディング,デバッグの各段階の改善
- 近年のLLMの進歩は目覚ましいが,その能力を最大限に引き出すためには,効果的なコード生成手法が不可欠である。
- 既存手法は初期コード生成の品質に依存するため,誤りを含む粗雑なコードを改善することに課題がある。
- 入力と出力の段階的なシミュレーションによる計画検証と内部デバッグを通じて,コード生成の精度向上を目指す。
- CODESIMは,HumanEvalで95.1%,MBPPで90.7%,APPSで22%,CodeContestsで29.1%という,最先端の結果を達成した。
- 本フレームワークは,外部デバッガと組み合わせることで,さらなる性能向上が期待できる。
- フレームワークは公開されており,今後の研究開発に貢献することが期待される。
ファジー・ドレブ-ヤオ攻撃者モデルによる段階的記号検証 [cs.CR, cs.FL, cs.LO, cs.SC]目的:段階的記号検証手法
- 暗号プロトコルの安全性検証は情報セキュリティの根幹をなす重要な研究分野である。
- 従来の検証手法は,攻撃者の知識を単純な二値化で扱っており,側路攻撃のような累積的な情報漏洩を考慮できない。
- 側路攻撃における知識の累積過程をモデル化し,より現実的な検証を可能にすること。
- 提案手法は,攻撃者の知識を0から1の間の値で表現し,側路攻撃による知識の漏洩をT-normを用いてモデル化する。
- 従来の二値モデルで安全と判定されたプロトコルが,累積的な情報漏洩を考慮すると脆弱になる場合があることを示す。
- Needham-Schroeder-Loweプロトコルを含む複数のプロトコルに対し,提案手法の有効性を確認した。
AIエージェントはどのように資金を使うか? エージェントによるコーディングタスクにおけるトークン消費の分析と予測 [math.MG, cs.DM, math.CA, math.CO, cs.CL, cs.AI, cs.CY, cs.HC, cs.SE]目的:エージェントによるコーディングタスクにおけるトークン消費パターン
- AIエージェントの利用拡大に伴い,LLMのトークン消費量が急増しているため,コスト管理が重要である。
- トークン消費量はタスクによって大きく異なり,その予測は困難である。
- エージェントによるトークン消費パターンを分析し,トークン消費量の予測精度向上を目指す。
- エージェントによるコーディングタスクは,従来のコード推論やチャットと比較して,トークン消費量が1000倍以上も高くなることがわかった。
- トークン消費量はタスクごとにばらつきが大きく,高いトークン消費量が高精度に繋がるとは限らない。
- モデルによってトークン効率に差があり,Kimi-K2やClaude-Sonnet-4.5はGPT-5と比較して150万トークン以上消費する傾向にある。
ボソンチャネルにおける決定論的マルチユーザ識別 [quant-ph, cs.IT, math.IT]目的:ボソンチャネルにおける決定論的マルチユーザ識別の性能
- 量子通信における情報伝送容量の限界を理解する上で重要である。
- 既存のマルチユーザ識別モデルは共有符号帳に依存しており,柔軟性に欠ける。
- 各受信機に幾何学的署名を関連付け,より効率的な識別を可能にする。
- コヒーレント状態署名を用いることで,決定論的マルチユーザ識別が可能になることが示された。
- 識別容量は,k log k に近いスケーリング振る舞いを示すことが,距離エントロピーの限界を用いて示された。
Lean 4 における $A_1^{(1)}$ 曲線近傍の形式化 [math.CO, cs.DM, math.NT, cs.DM, math.CO, math.CO, cs.LO, math.AG]目的:アフィン旗多様体における量子シューベルト計算の基礎となる曲線近傍の形式化
- アフィン旗多様体の量子シューベルト計算は,表現論や幾何学において重要な役割を果たす。
- 曲線近傍の組み合わせ的な定義は複雑であり,形式的な検証が困難であった。
- 無限二面体群 $D_\infty$ を用いて,曲線近傍の組み合わせ論的な公式を厳密に検証すること。
- 本研究では,Lean 4を用いて曲線近傍を公理的に形式化することに成功した。
- 無限二面体群 $D_\infty$ をコクセター系として直接形式化し,長さ関数と次数写像を計算した。
- 有限集合に探索範囲を制限することで,計算可能な曲線近傍の表現を抽出した。
形式化における画期的な出来事:8次元球充填問題 [math.MG, cs.AI, cs.LO, math.NT]目的:8次元球充填問題の形式的検証
- 球充填問題は,数学における古典的な未解決問題であり,様々な分野に影響を与える。
- 複雑な数学的構造のため,形式的な検証は非常に困難であった。
- 人間の数学者と自動形式化モデルの協調による検証プロセスの確立。
- 2016年にViazovskaが8次元球充填問題をモジュラー形式を用いて解決した。
- 2026年2月,その解はLean Theorem Proverを用いて形式的に検証された。
- 検証の最終段階は,Math, Inc.の自動形式化モデル'Gauss'によって行われた。
劣モジュール関数における単一要素比の至高値について [math.CO, cs.IT, math.IT]目的:劣モジュール関数における単一要素比の至高値の特性
- 組み合わせ最適化の分野において,劣モジュール関数は重要な役割を果たす。
- 劣モジュール関数の構造や性質に関する理解は十分とは言えない。
- 単一要素比の至高値の限界を定めることで,劣モジュール関数の制約を明らかにする。
- 単一要素比の至高値が,n/log nのオーダーに達することが例によって示された。
- 至高値の上界として,指数関数の指数関数的な制限が導かれた。
- この上限と下限のギャップを狭めることは未解決の問題である。
離散化された状態空間における輸送力学の量子予測 [quant-ph, cs.IT, math.IT, stat.CO]目的:離散化された位置・速度状態空間における Fokker-Planck 方程式に基づくベイズ状態推定の予測ステップ
- ベイズ状態推定は,不確実性下でのシステムの状態を推定する上で重要な手法である。
- 高次元状態空間における確率密度の表現と伝播は,古典計算機では計算コストが大きくなる。
- 量子計算機を用いてベイズ状態推定の効率化を図り,高次元問題への適用可能性を探る。
- 確率密度を量子状態の振幅にエンコードすることで,高次元分布をコンパクトに表現することが可能になった。
- 有限差分演算子の巡回構造を利用し,量子フーリエ変換と位相回転により,効率的な伝播を実現した。
- Wick 回転に基づいたユニタリ近似を導入することで,拡散項を量子計算機上で実装できることを示した。
小規模なHに対するH誘起部分グラフの検出について [math.CO, cs.CC, cs.DS]目的:H誘起部分グラフ問題の解決
- グラフ理論は,ネットワーク構造の解析や最適化に応用され,様々な分野で重要である。
- H誘起部分グラフ問題はNP困難であることが知られており,小規模なグラフHに対する計算複雑性が未解決であった。
- 頂点数が5以下のグラフHに対するH誘起部分グラフ問題の分類を完了し,未解決問題に答える。
- 特定の7頂点木に対するH誘起部分グラフ問題が多項式時間で解けることを示した。
- その過程で,いくつかの部分構造の検出がNP困難であることを証明した。
- 頂点数が5のグラフH(木でないものも含む)に対する3つのケースに対して,多項式時間アルゴリズムを開発した。
高次元実験データからの動力学の位相空間学習における情報ボトルネック [physics.data-an, cs.AI, cs.IT, math.IT]目的:高次元観測データからの動力学系の状態変数の同定
- 物理科学において,系の状態変数の特定は重要な課題である。直接観測できないため,教師なしで推論する必要がある。
- 高次元データから状態変数を推論することは困難であり,適切な表現方法が確立されていない。
- 潜在空間における予測相互情報量を最大化することで,解釈可能な動的座標を直接抽出することを試みる。
- DySIBは,過去と未来の観測ウィンドウ間の予測相互情報量を最大化しつつ,表現の複雑さを抑制する。
- 実験データを用いた検証の結果,DySIBはペンデュラムの位相空間の次元,トポロジー,幾何学構造を再現した。
- 学習された座標は,正準角と角速度とスムーズに整合し,潜在空間の情報から解釈可能な動的座標を回復できることを示した。
コストが示すもの:自己申告型テクニカルデットの返済努力の予測と分析 [cs.SE, cs.AI]目的:自己申告型テクニカルデットの返済努力の予測と分析
- ソフトウェア開発において,長期的な保守性を損なう短期的な判断が常に行われており,その影響を考慮する必要がある。
- テクニカルデットの返済努力を定量的に評価する手法が不足しており,効果的な優先順位付けが困難である。
- 自己申告型テクニカルデットのテキスト記述に基づいた返済努力の自動推定アプローチを確立し,ソフトウェア開発の効率化を目指す。
- テクニカルデットの種類によって返済努力が異なり,コード/設計,要件,テスト関連のデットは,そうでないものよりも大きな努力を要する。
- BERTやTextCNNといった深層学習モデルが,従来の機械学習手法やベースラインモデルを上回り,返済努力の推定精度が高いことが示された。
- 返済努力レベルに関連するキーワードを特定し,テクニカルデットの優先順位付けとリソース配分を改善するための知見を提供した。
自己申告型テクニカルデット検出手法:10年間の系統的レビュー [cs.SE, cs.AI]目的:自己申告型テクニカルデット検出手法の動向
- ソフトウェア開発において,迅速なリリースを優先するあまり,将来的なコスト増を招くテクニカルデットが蓄積される。
- 自己申告型テクニカルデットの検出は困難であり,効率的な検出手法の確立が求められている。
- このレビューは,検出手法の進展と課題を明らかにすることで,今後の研究を促進する。
- 2014年から2025年初頭までの研究を分析した結果,ヒューリスティック手法から機械学習,深層学習,Transformerモデルへと検出手法が進化した。
- 深層学習やTransformerモデルは検出精度を向上させたものの,モデルの汎用性や説明可能性,大規模な産業利用に向けたスケーラビリティに課題が残る。
- データセットの異質性が課題として指摘されており,より堅牢で実用的な検出ツールの開発に向けた方向性を示す。
時系列データの同時記号近似のための二段階並列アプローチ [cs.DS, cs.DB, cs.DC, cs.SC]目的:大規模時系列データに対する同時記号近似手法
- 時系列データ分析の応用が拡大する中で,コンパクトかつ正確で,多くの信号と計算資源に拡張可能な記号表現が求められている。
- 既存のABBAに基づく記号近似手法は高品質だが,各時系列を個別に処理するため,系列間の整合性が保証されない。
- 本研究は,大規模時系列データに対し,一貫性のある記号表現を効率的に得ることを目指している。
- 提案手法は,局所圧縮と大域的デジタル化を分離することで,並列処理を可能にしている。
- 二段階の並列デジタル化スキームにより,大規模データセットにおける処理時間を大幅に削減している。
- 実験結果から,提案手法は再構成品質を維持しつつ,効率的な並列処理ツールとなりうることを示唆している。
分離可能行列に対する確率的下限の改善 [cs.IT, math.IT]目的:分離可能行列のレートに関する新たな下限導出
- 欠陥要素の効率的な特定は,信頼性向上や情報セキュリティ等,様々な分野で重要である。
- 分離可能行列のレート限界が明確でなく,最適なテスト数を決定できない問題がある。
- 分離可能行列およびリストデコーディング分離可能行列のレート下限を厳密化し,テスト数の削減を目指す。
- 分離可能行列のレート下限を改善し,既存の結果をより強めることに成功した。
- 欠陥要素数$d$が事前に分かっている場合とそうでない場合の両方について,下限を導出した。
- リストデコーディング分離可能行列を含む,様々な分離可能行列のレート下限を包括的に示した。
AIモデル品質に関する実務家からの視点:認識,課題,および解決策 [cs.SE]目的:AIモデル品質に関する実務家の認識,課題,および解決策の特定
- AIはあらゆる産業で活用され,信頼性のあるシステム構築にはAIモデル品質が不可欠である。
- 従来の正当性評価に加え,効率性やスケーラビリティなど多様な品質属性への対応が求められている。
- 実務家が重視する品質属性を明確にし,研究開発の方向性を示す。
- 実務家は,状況に応じて品質属性の優先順位を変えて評価していることが判明した。
- データ不均衡がモデルの正確性と堅牢性を維持する上での大きな障害となっている。
- アクティブラーニング等の緩和策がデータ不均衡への対策として一般的に用いられていることが確認された。
歴史的な特徴頻度によるパッチの優先順位付け [cs.SE]目的:妥当なパッチの優先順位付け手法
- 自動プログラム修理は進展しており,以前は不可能だったバグ修正が可能になっている。
- 正しい修正パッチが存在する場合でも,誤ったパッチよりも低い順位になる可能性がある。
- 修正履歴に基づき,正しいパッチの順位を向上させること。
- PrevaRankは,過去のプログラマーによる修正との特徴類似性でパッチをランク付けする。
- 81のJavaプロジェクトの修正履歴で学習し,168のDefects4Jバグで評価した結果,正しい修正パッチの上位3位内へのランク付けが27%向上した。
- 様々なAPRツールやバグに対して堅牢に機能し,オーバーヘッドは無視できる程度である。
変動する状況下での公平な分割 [cs.GT, cs.DS]目的:エージェントやアイテムの集合が時間とともに変化する状況下における,アイテムの公平な分割の復元
- 資源配分は,社会の公平性を実現する上で不可欠な課題であり,幅広い分野で重要視されている。
- 従来の公平分割問題では,エージェントやアイテムの集合が固定されていることが前提であり,現実の動的な状況に対応できない。
- 本研究は,エージェントやアイテムが変動する状況下でも,公平性を維持するための効率的なアルゴリズムを開発することを目的とする。
- エージェントの評価が一様で単調増加であり,アイテムが全て利益となるか,全て負担となる場合,EF1復元問題に対する効率的なアルゴリズムが存在する。
- 一様で加法的な評価関数であっても,有効な転送回数を最小化する問題はNP困難であることが示された。
- バイナリ加法的な評価関数においては,EF1復元が可能かどうかを判定する問題はNP困難であり,可能な場合でも最小転送回数の計算も困難である。
重複エッジを持つストリーミング二部グラフにおけるバタフライ数のカウント [cs.DS]目的:二部グラフにおけるバタフライ(2x2バイクリーク)の正確なカウント手法
- 二部グラフは,ユーザーと製品の関係など,現実世界の様々な関係性をモデル化する上で重要である。
- 既存手法は重複エッジを考慮せず,正確なカウントが困難であるという課題があった。
- 重複エッジを考慮した,高効率かつ高精度なバタフライカウント手法を開発すること。
- 提案手法DEABCは,バケットベースの優先サンプリングを用いることで,重複エッジを考慮したバタフライ数の正確な推定を実現した。
- DEABCは,既存手法と比較してメモリ使用量を大幅に削減しつつ,高い精度を維持している。
- 実世界のストリーミング二部グラフを用いた実験により,DEABCがメモリ効率,精度,スループットにおいて既存手法を上回ることが示された。
非漸近的無自覚中継と可変長ノイズ損失圧縮符号化 [cs.IT, math.IT]目的:情報ボトルネックチャネルにおける有限ブロック長での達成可能性
- 通信システムの信頼性向上には,限られた情報から効率的に情報を伝達する技術が不可欠である。
- 中継チャネルにおいて,復号機が直接チャネル出力を観測できないという制約が実用上の課題となる。
- 固定長・可変長コードを用いた中継による,有限ブロック長における情報伝達限界を明らかにすること。
- 本研究では,KostinaとVerdúの非漸近的ノイズ損失圧縮符号化の結果を利用して,有限ブロック長での達成可能性を証明した。
- 固定長コードと可変長コードのそれぞれに対して,情報ボトルネックの第二階近似版を導出した。
- 可変長ノイズ損失圧縮符号化に関する新たな非漸近的な結果も提示した。
クラスター頂点削除数によるパラメータ化された公平な頂点問題 [cs.DS, cs.CC, cs.LO]目的:公平性制約を満たすMSO$_1$定式化可能な問題の複雑性
- グラフ問題は情報科学の根幹であり,実世界の問題に応用されている。
- 既存研究では,公平性制約下の問題の計算困難性が十分に解明されていない。
- クラスター頂点削除数パラメータ化における公平な問題の計算可能性を検証する。
- 公平なMSO$_1$定式化可能な問題が,一般的にクラスター頂点削除数によるFPTアルゴリズムを持たないことを示した。
- 特定の条件を満たす場合,公平なMSO$_1$定式化可能な問題がFPTアルゴリズムを持つことを示した。
- 公平なフィードバック頂点集合問題など,多くのグラフ問題に対してアルゴリズムを適用できることを示した。
上りリンクISAC受信機設計のフレームワーク:性能解析とアルゴリズム開発 [cs.RO, cs.IT, eess.SP, math.IT]目的:上りリンクにおける統合センシングと通信システムの受信機設計
- 通信とセンシングの融合は,新たな応用分野の開拓に不可欠である。
- 上りリンクISACにおける信号検出とターゲットセンシングの同時最適化が課題である。
- 動的な環境変化に対応可能な柔軟な受信機設計を目指す。
- 柔軟な投影(FP)型受信機は,投影型受信機と逐次干渉除去(SIC)型受信機を統合する。
- FP型受信機は,トレードオフ係数を調整することで,SINRの向上と信号の相関低減を両立する。
- 最適トレードオフ係数は,検出アルゴリズムとセンシング・通信信号の電力比に依存する。
大規模言語モデルによる安全制約適合線形時間論理の自動生成:自己教師ありフレームワーク [cs.LO, cs.FL]目的:安全制約を遵守した線形時間論理(LTL)仕様の自動生成
- サイバー物理システム(CPS)の安全性保証には,自然言語による高レベルなタスクを形式仕様に変換することが不可欠である。
- 既存研究は自然言語と形式仕様の一貫性のみに焦点を当てており,CPSに課される安全制約への適合性が十分に考慮されていない。
- 本研究は,生成されたLTL仕様が安全制約を遵守することを保証する手法を開発し,CPSの安全性を向上させることを目指す。
- 提案手法AutoSafeLTLは,大規模言語モデル(LLM)を活用し,論理的な整合性と意味的な正確性を保ちつつ,安全制約に適合するLTL仕様を自動生成する。
- 言語包含チェックと自動反例誘導修正メカニズムを統合することで,生成されたLTL仕様の安全制約適合性を効果的に保証する。
- 実験結果から,提案手法は安全制約に対する違反率0%を達成し,AIと形式検証技術の相乗効果が示された。
エントロピー最適範囲における効率的な棄却サンプリング [cs.DS, cs.DM, cs.IT, math.IT, math.PR, stat.CO]目的:有限離散確率分布からの乱数生成
- 情報理論において,確率分布の効率的な生成は重要な課題である。
- 既存手法は,空間計算量と時間計算量の間でトレードオフが生じている。
- 空間,時間,エントロピーの全てで優れた性能を発揮するサンプラーを開発する。
- 提案手法は,対数線形空間で動作し,サンプルあたりの計算オーバーヘッドが非常に小さい。
- 期待されるコインフリップ回数は,エントロピー最適範囲$[H(P), H(P)+2)$に収まる。
- 数値実験により,提案手法が有名なエイリアスメソッドよりも実行時間とエントロピーにおいて改善が確認された。
unsafe Rust の安全性特性のアノテーションと監査 [cs.PL]目的:unsafe Rust における安全性特性に関するドキュメントの整合性と完全性の監査手法
- Rust はメモリ安全性を重視する言語だが,unsafe コードは未定義動作を引き起こす可能性がある。
- 既存の安全性に関するコメントやドキュメントは,標準化されておらず,不完全な場合が多い。
- 安全性ドキュメントの標準化と,unsafe API の安全性向上を目指す。
- 安全性タグの分類体系を確立し,自然言語による要件を形式化することに成功した。
- API の健全性は構造的不変性に依存するため,静的解析ツール safety-tool を開発し,ドキュメントの一貫性を自動的に検証する。
- Rust 標準ライブラリに適用した結果,27 の API で 61 の安全性タグに関する問題を修正し,libstd の 96.1% の unsafe API に適用可能なタグを特定した。
深掘りと広がり:有界樹深および樹幅を持つグラフ上のカウント論理と準同型識別可能性 [cs.LO, cs.DM, math.CO]目的:有界樹深および樹幅を持つグラフにおけるカウント論理と準同型識別可能性の関係性
- グラフ理論は,ネットワーク構造の分析に不可欠であり,情報科学,社会科学など幅広い分野に応用されている。
- グラフの複雑度を測る指標と,論理式の表現力との関係が十分に解明されていない。
- 特定のグラフクラスにおける論理式の表現力を明確にし,識別可能性の境界を定める。
- 近年,グラフが$k$-ペブル森林被覆を持つ場合,特定の論理式が一致することと,準同型識別可能であることが同値であることが示された。
- 本研究では,その結果を初等的に再証明し,グラフクラスの理論的分析を行った。
- グラフの樹深と樹幅という異なる概念を用いて分離を示し,準同型識別可能性の関係を分離することに成功した。
LLMプロンプトにおける未定義性の理解と管理 [cs.CL, cs.SE]目的:LLMプロンプトの未定義性問題の分析と改善策
- 大規模言語モデルの利用拡大に伴い,プロンプトの品質管理が重要となっている。
- プロンプトが曖昧な場合,モデルの出力が不安定になり,期待通りの結果が得られないことがある。
- プロンプトの未定義性を特定し,より安定したLLMアプリケーションの構築を目指す。
- LLMはデフォルトで未定義の要件を推測するが,その挙動はモデルやプロンプトの変更に弱いことが判明した。
- 要件を全て明示しても,モデルの指示理解能力や要件の矛盾により,必ずしも改善につながらない。
- 要件を意識したプロンプト最適化により,平均で4.8%の性能向上が確認された。
UAV群による二層可動アンテナシステムを用いた低高度経済圏向け無線通信 [cs.IT, eess.SP, math.IT]目的:低高度経済圏における無線通信の性能向上
- 低高度経済圏では,UAVの活用が重要であり,その無線通信技術の発展が不可欠である。
- 従来の無線通信では,UAVの機動性とアンテナ配置の柔軟性が十分に活用されていない。
- UAV群と二層可動アンテナシステムにより,最適な無線通信環境を構築し,性能向上を目指す。
- 提案手法は,UAV群の3次元配置,アンテナ位置,ビームフォーミングを最適化することで,地上ユーザーの最小達成レートを最大化する。
- 特に2ユーザーの場合,干渉のない通信を実現するUAV群の最適な配置を解析的に導出した。
- シミュレーション結果から,提案手法が既存手法と比較して,大幅な性能向上を示すことが確認された。
MLorc:メモリ効率の良い大規模言語モデル適応のためのモーメンタム低ランク圧縮 [cs.LG, cs.IT, math.IT, math.OC]目的:大規模言語モデルの適応におけるメモリ効率の向上
- 大規模言語モデルは高性能だが,その巨大なサイズが学習資源の制約となる。
- 全パラメータのファインチューニングは膨大なメモリを消費し,実用上の課題となっている。
- MLorcは,メモリ消費量を削減しつつ,高性能な適応を可能とする。
- MLorcは,行列パラメータのモーメンタムを圧縮・再構成することで,メモリ効率を向上させる。
- LoRAと比較し,固定ランク制約を設けないため,全パラメータ学習が可能となる。
- GaLoreと比較し,勾配ではなくモーメンタムを圧縮することで,学習ダイナミクスをより良く維持する。
有限精度重みを持つ動的離散分布からの正確かつ効率的なサンプリング [cs.DS, math.PR, stat.CO]目的:動的離散分布からのサンプリング手法
- 機械学習等の分野で確率分布からのサンプリングは重要な計算処理である。
- 動的環境下では,既存手法はテーブル再構築等のコストが高く,現実的な実装が困難である。
- 有限精度環境下でも正確なサンプリングを可能とする手法を提案し,数値的な誤りを回避する。
- 提案手法EBSUは,表現された重みに正確に比例した確率でインデックスを返すことを保証する。
- ワードRAMモデルにおいて,O(1)の最悪ケース期待サンプリング時間,O(1)の償却更新時間,O(n)の空間および構築時間で動作する。
- IEEE 64ビット浮動小数点数を用いた実装は,既存の不正確な手法と比較して競争力があり,数値的な失敗モードを回避する。
勾配誘導による適応型抽象解釈のための進化する抽象変換器 [cs.CL, cs.PL]目的:勾配誘導による適応型抽象解釈を実現する抽象変換器の進化
- 数値抽象解釈は,プログラムの安全性や信頼性を保証する上で重要な技術である。
- 従来の抽象変換器はドメイン固有であり,再利用性や効率性に課題があった。
- ドメインを横断し,精度と効率を調整可能な抽象変換器を開発し,既存手法の性能を向上させる。
- 提案手法は,Zones,Octagons,Polyhedraの3つの数値抽象ドメインで有効であることを示した。
- 勾配ステップ数を調整することで,精度と効率のトレードオフが可能となった。
- 既存手法と比較して,最大3.2倍高速に高精度の不変条件を導出した。
調整可能負荷を持つ再構成可能アンテナアレイ:結合制御による解空間の拡大 [cs.IT, eess.SP, math.IT]目的:再構成可能アンテナアレイにおける解空間の拡大
- 通信容量向上の鍵となる再構成可能アンテナ技術の発展が重要である。
- 従来の設計では結合を避けるため配置に制約があり,解空間が限定されていた。
- 結合制御により配置自由度を高め,解空間を最大限に活用することを目指す。
- 提案手法により,既存手法と比較して20-56%の合計レート向上を達成した。
- 量子化誤差に対して約60%の性能回復が見られた。
- 貪欲法やメタヒューリスティック法等の効率的なポート選択アルゴリズムを開発した。
半環チューリング機械に対するファギン定理 [cs.CC, cs.LO]目的:半環チューリング機械の計算複雑性クラスと論理的表現力の関係性の解明
- 近年,半環を用いた定量的な複雑性理論が活発に研究されている。
- 半環加重遷移を持つチューリング機械の計算能力と論理表現力の関係は未解決だった。
- 半環チューリング機械に対するファギン定理を証明し,その計算能力を明確化する。
- 改良された半環チューリング機械モデルにおいて,非決定性多項式時間計算クラスNP∞(R)が,半環注釈付きの関係を解釈する述語を許容する重み付き存在第二階論理によって捉えられることが示された。
- 新たなモデルは,EiterとKiesel(2023)の研究における一部の誤りを修正し,重要な結果を再構築する。
- 本研究は,半環チューリング機械の理論的基盤を強化し,AI分野への応用を促進する。
マルチモーダルリモート推論 [eess.SY, cs.SY, cs.LG, cs.IT, cs.NI, math.IT]目的:マルチモーダル機械学習モデルにおける推論誤差最小化のためのスケジューリング
- リモートセンサからのデータを用いたリアルタイム推論は,様々な分野で重要性が高まっている。
- 限られたネットワークリソース下では,全てのモダリティからの特徴量の適時な配信が困難である。
- データ鮮度を考慮したスケジューリングにより,推論誤差を最小化することを試みる。
- 提案手法は,既存の単純なヒューリスティクスと比較して,推論誤差を最大44.8%削減できることを示した。
- 特に,五つのモダリティの場合,EATとFTはそれぞれEASTと比較して計算時間を6.6倍と3000倍削減した。
- ただし,推論誤差はそれぞれ20.2%と38.6%増加した。
AIによるコードレビューはコード変更につながるか:GitHub Actionsのケーススタディ [cs.CL, cs.SE]目的:AIコードレビューツールによるコード変更への影響評価
- ソフトウェア開発における品質向上は,信頼性や保守性の確保に不可欠である。
- AIコードレビューツールの導入は進むものの,実際の効果に関する実証的な知見は乏しい。
- AIコードレビューツールによるコード変更の促進要因を特定し,ツールの改善に貢献すること。
- AIコードレビューツールの利用は増加傾向にあるものの,その有効性はツールの種類や設定によって大きく異なる。
- 簡潔でコード例を含むコメント,特にhunkレベルのレビューツールからの手動トリガーによるコメントは,コード変更につながりやすい。
- ツールの設計における注意点と,AIコードレビューシステムの改善方向性が示唆された。
ゴモリー・フー木からポリログ最大フローへの単純かつ高速な還元 [cs.DS]目的:ゴモリー・フー木からポリログ最大フロー計算への還元
- グラフ理論はネットワークの構造を分析する上で不可欠であり,様々な応用分野で活用されている。
- ゴモリー・フー木の計算は,ネットワークの信頼性や効率を評価するために重要だが,計算コストが高い場合がある。
- 本研究は,ゴモリー・フー木の計算をより効率的に行うための新しい還元手法を提案する。
- 非重み付きグラフにおいて,提案手法は$\tilde{O}(m)$のインスタンスサイズと追加時間で最大フロー計算に還元できる。
- 本還元は,ポリログ要因までタイトな初の成果であり,計算効率の向上に貢献する。
- 本手法は重み付きグラフやハイパーグラフにも拡張可能であり,幅広い応用が期待できる。
