arXiv雑要約
プログラム - 2026/06/16 公開
医療画像分類器の局所感度分析のための入力依存フィッシャー情報 [math.OC, cs.SY, eess.SY, q-bio.PE, math.OC, cs.SY, eess.SY, eess.IV, cs.AI, cs.IT, math.IT]目的:医療画像分類器の局所的な感度分析手法
- 医療画像診断における深層学習の利用が拡大しており,その信頼性確保が重要視されている。
- 深層学習モデルはブラックボックス性が高く,予測根拠の説明が困難である。
- モデルの予測分布の変化に対する入力の局所的な影響を定量化する手法を開発する。
- 提案手法では,入力依存フィッシャー情報行列(iFIM)を用いて,入力画像の微小な摂動に対する分類器の予測分布の変化を特徴づける。
- iFIMの高感度成分は,予測確信度および分類性能の変化と強く相関することが示された。
- 本手法は,既存の解釈可能性手法を補完し,医療画像における局所的な決定感度を分析するための原理的なツールとなりうる。
無線システムにおけるCSI圧縮のための文脈認識マルコフVAE [eess.SP, cs.IT, cs.LG, math.IT]目的:無線システムにおけるCSI圧縮
- 無線通信において,CSIは通信品質を左右する重要な情報である。
- CSIのデータ量は膨大であり,限られたフィードバック資源での効率的な伝送が課題である。
- CSIの時間的相関を利用し,効率的な圧縮を実現することを目的とする。
- 提案手法は,既存の無記憶および弱系列ベースラインと比較して,CSI再構成性能を向上させる。
- 特に,低~中程度の圧縮率において,その効果が顕著に現れる。
- これは,潜在的な時間的モデリングが,限られたフィードバック制約下でのCSI圧縮に有効であることを示唆する。
線形符号の一般化被覆半径に対する幾何学的アプローチ [math.CO, cs.IT, math.IT]目的:線形符号の一般化被覆半径の幾何学的考察
- 符号理論は,情報伝送やデータ保存において重要な役割を果たす。誤り訂正能力の評価が不可欠である。
- 従来の被覆半径では,符号の誤り訂正能力を十分に評価できない場合がある。
- 一般化被覆半径を幾何学的に捉え,符号の性能評価に新たな視点を提供すること。
- 一般化被覆半径が$\rho$以下の線形符号は,$(\rho,t)$-飽和集合と幾何学的に対応することが示された。
- $\rho=t$の場合には,$t$-強遮断集合と一致し,飽和集合と強遮断集合の間の関係が明確になった。
- アフィン幾何や双対グラスマン幾何を用いた判定基準や,サイズの下限,構成法が提示された。
干渉による大気光通信における乱流誘発された回線切断の低減 [physics.ed-ph, cs.CY, physics.optics, cs.IT, math.IT]目的:大気光通信における回線切断確率の低減
- 大気光通信は,低コストかつ大容量の通信手段として期待されている。
- 乱流の影響により,通信品質が不安定になり,回線切断が発生しやすい。
- データインターリーブにより,乱流の影響を軽減し,安定した通信を実現する。
- 実験により,データインターリーブによって回線切断確率が2桁以上低減することが示された。
- 乱流強度,インターリーブ長,達成可能なデータレートの間に依存関係があることが明らかになった。
- この依存関係により,より堅牢なシステム設計が可能となる。
量子一様ノルムは行列値一様ノルムの引き戻しである [math.GR, cs.IT, math-ph, math.IT, math.MP]目的:量子一様ノルムと行列値一様ノルムの関係性
- 量子情報理論における重要な概念であり,量子系の状態を特徴づけるために不可欠である。
- 量子一様ノルムの数学的性質が十分に解明されておらず,厳密な評価が困難である。
- 量子一様ノルムの基礎的な性質を明らかにし,その数学的構造を理解すること。
- ブ,グ,ジャフェによって導入された量子一様ノルムが,ゴワーズとハタミの行列値一様ノルムの引き戻しであることが示された。
- この同一視により,量子一様ノルムに対するゴワーズ・コーシー・シュワルツ不等式と三角不等式が導出された。
- 極限的な状況下では,ゴットスマンとチュアングのクリフォードレベルが,有限ベクトル空間上の特定のユニタリ値ライマン多項式写像を用いて記述される。
量子回路には何ショット必要か [quant-ph, cs.DC, quant-ph, cs.ET, cs.SE]目的:量子回路の出力分布を正確に推定するための最小ショット数の決定
- 量子アルゴリズムの実用化には,計算資源の効率的な利用が不可欠である。
- 現在の量子ハードウェアはノイズが多く,高価であるため,ショット数の最適化が課題となっている。
- 回路構造やノイズモデルに依存しない汎用的なショット数最適化手法を確立すること。
- 提案手法IncremetalExecutionは,追加ショットによる分布変化が小さくなる「限界点」に着目し,動的にショット数を決定する。
- 33,750種類の構成で実験を行い,180の量子回路とバックエンドの組み合わせで730万回の独立した実験を実施した。
- 既存研究とは異なり,特定のアルゴリズムや問題に依存せず,静的回路に対して広く適用可能である。
シミュレーテッドアニーリングとマルコフ連鎖モンテカルロのための型付き成分代数 [cs.CY, cs.SE, physics.comp-ph, physics.data-an]目的:シミュレーテッドアニーリングおよびマルコフ連鎖モンテカルロの効率的な実装と検証
- 最適化問題解決において,シミュレーテッドアニーリングやモンテカルロ法は重要な役割を担う。
- 既存の実装は,修正が困難なモノリシックな構造を持つため,改善が難しい。
- 共通のカーネルを型付き代数として表現することで,再利用性と検証性を高める。
- 提案手法は,目的関数,冷却スケジュール,近傍探索,移動カーネル,受容規則を型付き代数として定義し,それらを組み合わせることで様々なソルバーを構築する。
- SymPyによる解析的検証,TLA+によるモデル検査,有限精度監査により,提案手法の正当性が確認された。
- CUTEstデータセットでの実験により,提案手法が既存のCMA-ESヒューリスティクスよりも優れた性能を示すことが示された。
リアクティブシステムにおける独立変数集合を特定するための正しいアルゴリズム [cs.LO]目的:リアクティブシステムの仕様分解手法
- 複雑なシステム設計において,モジュール化と検証の効率化が重要である。
- 既存の分解アルゴリズムは完全性を欠き,すべての独立変数を特定できない場合がある。
- リアクティブシステムの仕様を正確かつ網羅的に分解し,検証を容易にすること。
- 既存のDecomposeContractアルゴリズムの不完全性を示す反例を提示した。
- モデル検査に基づく性質を維持しつつ,完全性を保証する改良された分解手順を提案した。
- この手法の背後にある原理を明らかにし,限界を明確にする厳密な意味論的分析を行った。
区間予算不確実性下における回復可能なロバスト最短経路問題 [cs.DS]目的:区間予算不確実性下における回復可能なロバスト最短経路問題の解決
- ネットワーク最適化の基礎であり,交通,物流,通信など様々な分野で応用が広がっている。
- 不確実性を考慮したロバスト最適化は計算量が大きく,特に一般グラフでは近似解法も困難である。
- 無サイクルグラフに限定することで,多項式時間で解ける効率的なアルゴリズムを開発し,問題解決を目指す。
- 従来の区間不確実性に対しては,様々な近傍構造において多項式時間で問題を解くことができる。
- 無サイクルグラフの様々なクラスに対して,効率的なアルゴリズムが構築された。
- 予算付き区間不確実性下での問題解決のための,厳密解法と近似解法が提案された。
高次共通情報 [cs.IT, math.IT]目的:複数の確率変数が共有する情報量の定量化
- 情報理論は,通信や機械学習など,幅広い分野で不可欠な基盤技術である。
- 既存の情報量指標では,複数の変数の共通情報を十分に捉えられない場合がある。
- 複数の確率変数が共有する情報をより正確に捉えるための新たな指標を提案する。
- 本研究では,高次共通情報(HCI)という新しい概念を導入し,その定義と性質を明らかにした。
- ガウス分布やベルヌーイ分布の確率変数の場合,HCIの閉形式解が得られた。
- HCIは既存の手法よりも冗長性を厳密に表現し,数値近似も可能であることを示した。
予測あり/なしのオンライン問題に対する複雑性クラス [cs.DS]目的:予測を用いたオンライン問題の複雑性理論
- 機械学習の発展に伴い,予測を活用するアルゴリズムへの関心が高まっている。
- オンライン問題における時間・空間資源の計算困難性は未解明な点が多い。
- 予測の質が不確実な場合におけるオンライン問題の複雑性を明らかにすること。
- 文字列推測を基本とし,誤差尺度に基づいた複雑性クラスの階層を定義した。
- 定義した枠組みを用いて,様々な特性を持つ問題の分析を行った。
- ページング問題に対する既知の下界が,階層内のすべての困難問題に適用できることを示した。
最小後悔による最良腕の識別 [cs.LG, cs.IT, math.IT, stat.ML]目的:最小後悔を伴う最良腕の識別
- 現実の実験においては,効率性と安全性の両立が重要であり,探索と活用のバランスが求められる。
- 最良腕の識別問題において,後悔を最小限に抑えつつ効率的に最良腕を特定する手法が不足している。
- 信頼水準を保証しつつ,累積後悔を最小化する識別アルゴリズムの開発を目指す。
- 単パラメータ指数分布族において,累積後悔に関する事例依存型の下限を確立した。
- 固定信頼水準下での最良腕識別における累積後悔とサンプル複雑性のトレードオフを示す不可能性結果を提示した。
- Double KL-UCBアルゴリズムを設計し,信頼水準がゼロに近づくにつれて漸近最適性を示すことができた。
DynNPC:シミュレーションテストにおける動的NPC行動生成を通じたADS誘発の違反事例の発見 [cs.SE, cs.RO]目的:自動運転システム(ADS)誘発の違反事例発見
- 自動運転技術の安全性確保は重要であり,シミュレーションによる検証が不可欠である。
- 従来のシミュレーションではNPC行動が事前に定義され,ADSのバグ検出が困難である。
- 動的なNPC行動生成により,より現実的な違反事例を発見し,ADSの信頼性向上を目指す。
- 提案手法DynNPCは,交通信号やエゴ車両の行動に応じてNPCの行動を動的に生成する。
- DynNPCは既存手法と比較して,より多くのADS誘発の違反事例を発見できることが示された。
- シミュレーションテストの効率性と有効性を向上させることが確認された。
現実世界のIn-Context Learningに基づくText-to-SQLエラーの理解,検出,および修正 [cs.RO, cs.SY, eess.SY, cs.CL, cs.AI, cs.SE]目的:In-Context Learningを用いたText-to-SQLエラーのタイプと,その検出・修正手法
- 自然言語をSQLに変換する技術は,データベース操作を容易にし,データ分析の効率化に貢献する。
- In-Context Learningは強力だが,変換精度に課題があり,誤ったSQLクエリが生成される可能性がある。
- 既存の修正手法は改善が限定的であり,計算コストが高いという問題があるため,より効率的な手法が求められる。
- 本研究では,In-Context LearningによるText-to-SQLエラーを包括的に分析し,7つのカテゴリに分類した27種類の誤りタイプを特定した。
- 提案手法MapleDoctorは,既存手法と比較して13.8%多くのクエリを修正し,誤修正の数を最小限に抑え,修復遅延を67.4%削減した。
- MapleDoctorは,Text-to-SQLエラーの検出と修正において,高い性能と効率性を実現する。
順序集合被覆問題に対するSATソルバーの適用 [cs.LO, cs.DM]目的:順序集合被覆問題の最小解の探索
- 組み合わせ最適化問題の分野において,効率的な解法が求められている。
- 既存手法では,問題規模の拡大に伴い計算量が指数関数的に増加する。
- SATソルバーを活用し,より効率的な解法を確立することを目的とする。
- 順序集合被覆問題を,スワップグラフを用いた手法でBoolean充足可能性問題に変換した。
- この手法は,単純な方法に比べて計算量の爆発を抑制し,現実的な規模の問題を効率的に解ける。
- Z3定理証明器を用いた実験により,提案手法の有効性が確認された。
選択的生成による大規模コードモデルの機能的正確性への取り組み [cs.SE, cs.LG]目的:コード生成モデルの機能的正確性の向上
- 安全性が求められるシステムにおいて,コード生成モデルの信頼性が重要である。
- コード生成モデルの幻覚(誤ったコード生成)の検出が困難である。
- 動的コード解析とテスト生成により,幻覚を抑制し,正確性を高める。
- 動的コード解析を用いて自動的にユニットテストを生成する手法を提案。
- 生成されたユニットテストに基づき,不確実なコード生成を抑制する選択的コード生成器を開発。
- 生成されたテストを評価と学習に活用する「FuzzEval」というパラダイムを提案し,有効性を実証。
LLMにおける第一階述語論理の定理証明を通じた高度な数学的推論 [cs.AI, cs.CL, cs.LO]目的:LLMの数学的推論能力向上
- LLMは様々な分野で応用される第一階述語論理の推論能力を示している。
- 多段階の第一階述語論理による演繹を伴う複雑な数学的推論は未だ研究が不十分である。
- 多様な証明戦略の探求と早期の誤りを防ぐことで,LLMの数学的推論の精度向上を目指す。
- 本研究では,LLMの多様性と合理性を高める自己適応型ソリューションDREAMを提案した。
- DREAMは,多様な戦略的成果を促進する公理駆動型戦略多様化メカニズムと,LLMが自身の証明を反省・修正するのを支援する小命題エラーフィードバックを組み込んだ。
- 提案手法により,LLMの数学的推論性能が0.6%~6.4%向上し,評価用のLean 4形式の数学定理447個からなるデータセットを新たに提供した。
共鳴・発火ニューロンを用いたニューロモーフィックワイヤレス分割計算 [cs.LG, cs.IT, cs.NE, math.IT]目的:ニューロモーフィックワイヤレス分割計算アーキテクチャの提案
- リアルタイム時系列データ処理において,従来の深層学習アクセラレータと比較して低消費電力な代替手段として注目されている。
- 従来のリーキー積分・発火(LIF)ニューロンでは,ワイヤレスセンシングや音声認識などの豊富なスペクトル特徴を持つストリーミング信号の効率的な処理が課題である。
- 発振ダイナミクスを持つ共鳴・発火(RF)ニューロンを用いることで,高コストなスペクトル前処理を不要とし,効率的な信号処理を実現する。
- 提案アーキテクチャは,従来のLIF-SNNやANNと同等の精度を達成しつつ,スパイクレートと総消費エネルギーを大幅に削減した。
- RFニューロンは,調整可能な周波数で共鳴することで,時間局所的なスペクトル特徴を抽出し,スパースなスパイク活動を維持する。
- OFDMベースのアナログワイヤレスインターフェースを用いたシステム設計と,音声分類および変調分類タスクでの性能評価を行った。
Stack Overflowの投稿に対するコードコメントの有用性への影響 [cs.SE]目的:Stack Overflow投稿の有用性に対するコードコメントの影響
- ソフトウェア開発において,知識共有は重要であり,Stack Overflowはその主要な手段の一つである。
- コードの理解不足な再利用は,バグやセキュリティ脆弱性といった問題を引き起こす可能性がある。
- Stack Overflowの回答におけるコードコメントが,有用性の認識に及ぼす影響を明らかにすること。
- ブロックコメントとインラインコメントの両方が,コメントのないコードよりも有意に有用であると認識された。
- 初心者にとっては,ブロックコメントが付いたコードが,インラインコメントが付いたコードよりも有用であると評価された。
- 回答の位置や評価などの表面的な特徴は,有用性の認識において重要視されなかった。
リバランスを超えて:リバランス手法を用いない不均衡データにおけるバイナリ分類器のベンチマーク [cs.MA, cs.RO, cs.LG, cs.AI, cs.IT, math.IT]目的:不均衡データ下におけるバイナリ分類器の性能評価
- 不均衡データは,医療診断や異常検知など,重要な分野での課題である。
- 既存研究はリバランス手法に焦点を当てており,リバランスを用いない場合の分類器性能評価は不足している。
- リバランス手法に依存せず,分類器のロバスト性を評価するための指針を提供する。
- データ複雑性が増加し,少数クラスのサイズが減少するにつれて,分類は困難になることが確認された。
- 従来の分類器は極端な不均衡下で性能が低下する一方,TabPFNやブースティングベースのアンサンブルは比較的高い性能を維持した。
- 本研究は,不均衡学習におけるモデル選択のための貴重な知見を提供する。
危機的システムのための人間中心要件エンジニアリング:災害早期警報アプリケーションからの示唆 [cs.SE]目的:災害弱者層のニーズを,インクルーシブデザインガイドラインから要件,プロトタイプ機能,検証証拠へと明確化・追跡可能にするための人間中心要件エンジニアリングプロセス
- 医療,防衛,交通,災害管理など,危機的システムの安全性と信頼性は社会にとって不可欠である。
- 既存の厳格な要件エンジニアリングは技術的保証に偏り,人間や社会的なコンテキストへの配慮が不足している。
- アクセシビリティやユーザビリティの失敗が深刻な安全上の問題を引き起こす可能性のある災害早期警報システムのインクルーシブデザイン要件を統合・検証する。
- 高齢者やデジタルリテラシーの低い利用者,地方の利用者,色覚異常の利用者といった4つの脆弱なコミュニティに対して,62のインクルーシブデザインガイドラインを特定した。
- これらのガイドラインを,包括的な早期警報システムのための67の機能要件と非機能要件のカタログに翻訳し,実現可能性を検証した。
- 適応型災害早期警報プロトタイプを用いて6回のインタビューと8回の認知ウォークスルーを実施した結果,4つの脆弱なグループ全体で肯定的な証拠が得られた。
DualGauge:LLMとコーディングエージェントによる仕様書のみからのコード生成のセキュリティ・機能性の同時ベンチマーク自動化 [cs.SE, cs.AI, cs.CR]目的:LLMとコーディングエージェントによる仕様書のみからのコード生成の,セキュリティと機能性の同時評価
- LLM等のコード生成技術は開発効率を向上させるが,その信頼性確保が重要である。
- 生成されたコードの機能性だけでなく,セキュリティ上の脆弱性の評価が課題となっていた。
- 機能性とセキュリティを同時に評価する自動化されたフレームワークの構築とその有効性検証。
- 機能的正確性はコード生成の信頼性を過大評価しており,最も高性能なモデルでも,どの言語においてもセキュリティと機能性を両立する成功率は15%を下回る。
- モデルの規模やチューニング等の要素は,セキュリティと機能性を両立する性能向上に繋がらないことが示された。
- 反復的なスキャフォールドは,仕様書のみのタスクにおいて直接生成と比較して優位性を示さなかった。
有限抽象とその基本的なスケーラビリティ限界に関する情報理論 [cs.CL, eess.SY, cs.IT, cs.SY, math.DS, math.IT, math.OC]目的:有限抽象の精度とサイズのトレードオフ
- 動的システムの解析において,抽象化は複雑さを軽減し,計算コストを削減する上で不可欠である。
- 既存の抽象化手法は,システム次元が増加すると抽象化サイズが指数関数的に増加し,実用性に課題がある。
- 動的システムの複雑さを考慮した,抽象化のサイズと精度の理論的な限界を明らかにすること。
- レート歪み理論を用いて,抽象化の精度とサイズのトレードオフを定量的に分析し,スケーラビリティの限界を導出した。
- 抽象化の最小限の歪みと,与えられた歪みに対する最小サイズの下限を,軌道のエンタルピーを通じて定式化した。
- カオスシステムにおける例を通して,この理論に基づいた最小限の抽象化の構築可能性を示した。
フィードバック支援型非同期ランダムアクセスにおける秘密鍵ベースの物理層セキュリティ [cs.IT, math.IT]目的:非同期ランダムアクセスにおける物理層セキュリティの実現
- 無線通信において,セキュリティは不可欠であり,プライバシー保護とデータ改ざん防止が重要である。
- 従来の非同期ランダムアクセスは,セキュリティ対策が不十分であり,傍受や不正アクセスを受けるリスクがある。
- 本研究は,効率性を損なわずに非同期ランダムアクセスにセキュリティを付与することを目的とする。
- 提案システムは,フィードバック信号を利用して秘密鍵を生成し,データの暗号化に用いることで,セキュリティを確保する。
- 受信側は,スリーピアン・ウォルフ復号を用いて暗号化されたデータと秘密鍵を復元できる。
- 理論解析とシミュレーションの結果から,標準的な非同期ランダムアクセスシステムと比較して,無視できる程度のオーバーヘッドで有意な秘匿性が実現できることが示された。
FasterPy:LLMベースのコード実行効率最適化フレームワーク [cs.SE, cs.AI]目的:Pythonコードの実行効率最適化
- コード性能は重要であり,最適化はソフトウェア開発の不可欠な要素である。
- 従来の最適化手法はルール設計に手間がかかり,汎用性に欠ける点が課題である。
- LLMを活用し,低コストかつ効率的にPythonコードの実行効率を向上させる。
- FasterPyは,既存のパフォーマンス改善コードペアと測定値から構築された知識ベースを用いたRAGとLoRAを組み合わせている。
- PIEベンチマークにおける実験結果は,FasterPyが既存モデルよりも複数の指標で優れた性能を示すことを示している。
- FasterPyツールと実験結果は,https://github.com/WuYue22/fasterpy で公開されている。
真並行性に対する構造的演算意味論 [cs.LO]目的:真並行性に対する構造的演算意味論の拡張
- 並行処理システムの正確なモデリングと検証には,形式的な意味論が不可欠である。
- 従来の構造的演算意味論は,状態遷移を逐次的に記述するため,真の並行性を捉えきれない。
- 真並行性を表現できる形式意味論を確立し,並行処理システムのより正確な分析を目指す。
- 構造的演算意味論を真並行性に拡張する枠組みを提示した。
- ラベル付き遷移システムをポムセット遷移システムへ,遷移システム仕様をポムセット遷移システム仕様へと一般化した。
- 従来の概念である保守的拡張や仕様の意味は維持されている。
AlignCoder: ターゲット意図に合致したリポジトリレベルのコード補完 [cs.SE, cs.AI]目的:リポジトリレベルのコード補完における性能向上
- 大規模なコードベースを扱う開発効率向上の鍵となるため,コード補完技術の重要性が高まっている。
- 既存のコードLLMは,リポジトリ固有の文脈やドメイン知識の理解が不十分であるという課題がある。
- クエリとターゲットコードのミスマッチ,および推論情報の活用不足を解決し,より正確なコード補完を目指す。
- AlignCoderは,クエリ拡張メカニズムと強化学習ベースのリトリーバー学習手法を導入することで,コード補完の精度を向上させている。
- CrossCodeEvalベンチマークにおいて,ベースラインと比較してEMスコアが18.1%改善された。
- 様々なコードLLMやプログラミング言語に対して高い汎用性を示すことが確認された。
分散の制御が,疎に活性化されたDNNおよびCNNの学習安定性を向上させる方法 [cs.RO, cs.LG, cs.IT, math.IT]目的:疎に活性化されたDNNおよびCNNの学習安定性向上
- 深層学習は高い性能を示すが,学習の安定性が課題。初期値設定が重要となる。
- 従来の初期値設定では,活性化関数の非線形性による影響が十分考慮されていない。
- 高い疎性を持つ活性化関数下での最適な初期値設定手法を確立すること。
- 初期化分布の分散を大きくすることで,学習の安定性が向上することが示された。
- 隠れ層で90%もの疎性を実現しつつ,DNNおよびCNNの学習が可能となった。
- エッジ・オブ・カオス理論に基づき,新しい初期値設定戦略が提案された。
プレシェーブ,ノミナル集合,名前変更集合などに対する置換の統一的取り扱い [cs.LO]目的:プレシェーブ,ノミナル集合,名前変更集合における置換の構造
- 構文解析などにおける自由変数・束縛変数を扱う上で,抽象モデルの重要性が増している。
- 既存の研究では,プレシェーブとノミナル集合における置換の扱いに違いが見られる。
- プレシェーブの置換テンソルに着想を得て,ノミナル集合にも同様の構造を導入し,統一的な理解を目指す。
- プレシェーブに対する置換テンソルを一般化する方法を提示し,様々なプレシェーブカテゴリへの適用を可能にした。
- ノミナル集合やその関連概念(名前変更集合など)に対しても,置換テンソルの概念を新たに導出した。
- プレシェーブとノミナル集合の間の新たな対応関係を明らかにし,両者の理解を深めることに貢献する。
セミリダンドムハイパーグラフにおける独立数に関する証明書の改善 [cs.DS]目的:セミリダンドムモデルにおける,$\ell$-均一ハイパーグラフの独立数に関する上限を効率的に証明すること
- ハイパーグラフの独立数は,組み合わせ最適化やグラフ理論において重要な概念であり,様々な応用分野で利用される。
- 最悪の場合,独立数を $n^{1-\epsilon}$ の範囲内で近似する効率的なアルゴリズムは存在せず,証明が困難である。
- 既存の証明書の限界を打破し,最適に近い上限 $O(\sqrt{n}/p^{1/\ell})$ を実現すること。
- 証明書は,次数-$2\ell$ の和の二乗(SoS)緩和を利用した証明からアルゴリズムへのパラダイムに基づき設計されている。
- 特に奇数次数のハイパーグラフに対し,テンソルベースの解析により,ランダムカオス行列の作用素ノルムを制約する問題に帰着させた。
- 独立集合サイズ $k=o(\sqrt{n}/p^{1/\ell})$ をサポートする「静かな」植え込み分布を構築し,疎な領域での植え込み分布の構築問題を解決した。
科学的プロセスにおける事前学習済み深層学習モデルの再利用に関する実証的研究 [cs.SE, cs.AI]目的:科学的プロセスにおける事前学習済み深層学習モデルの再利用パターンと影響
- 深層学習は自然科学分野に大きな影響を与えているが,モデルの学習コストが課題となっている。
- モデルのゼロからの学習コストが,深層学習の導入を妨げる要因となっている。
- 自然科学分野における事前学習済みモデルの再利用パターンを定量的に評価し,その影響を明らかにする。
- 生化学,遺伝学,分子生物学の分野が,他の自然科学分野を上回る事前学習済みモデルの再利用率を示した。
- 「適応」再利用が,すべての自然科学分野で最も一般的なパターンであることが明らかになった。
- 科学的プロセスの「検証」段階が,事前学習済みモデルの統合による影響を最も受けていることが示された。
ReSyn:汎用的な再帰的正規表現合成フレームワーク [cs.PL, cs.SE]目的:複雑な正規表現の自動合成
- 正規表現はテキスト処理の基盤であり,多様な応用分野で不可欠である。
- 既存のPBEシステムは,複雑な正規表現に対応できず,実用性に課題がある。
- 複雑な正規表現合成問題を解決し,実用的なPBEシステムの実現を目指す。
- ReSynは,複雑な合成問題を管理可能なサブ問題に分割する分割統治型フレームワークである。
- Set2Regexは,例の順序に依存しない特性を捉えた,パラメータ効率の良い合成器である。
- 実験結果から,ReSynは様々な合成器の精度を大幅に向上させることが示された。
「終わりのないAIのゴミ」:開発者がAI支援ソフトウェア開発の負担について語る方法 [cs.CL, cs.SE]目的:開発者によるAI支援ソフトウェア開発に関する議論
- ソフトウェア開発におけるAI利用は増加の一途を辿っており,開発効率向上への期待が高い。
- AIが生成する低品質なコンテンツ(AI slop)が,開発者の負担を増大させているという懸念がある。
- AI slopがもたらす問題点を明らかにし,その影響を軽減するための対策を探る。
- 開発者は,AI slopがレビュー作業の摩擦を生じさせ,信頼を損ない,対策を促していると認識している。
- AI slopは,コードベースの質の低下,知識リソースの毀損,開発者の能力低下を引き起こす可能性がある。
- AI slopは,共通の悲劇として捉えられ,個人の生産性向上とコミュニティへの負担という構造的な問題が示唆されている。
俳句から大作まで:10ビットでLLMが大きな圧縮率を実現 [cs.RO, cs.HC, cs.LG, cs.AI, cs.IT, math.IT]目的:LLM生成テキストの圧縮
- LLMの利用拡大に伴い,データ転送・保存コストが課題となっている。
- 既存の圧縮手法では,LLMの複雑なテキストを効率的に圧縮できていない。
- 計算コストと圧縮率のトレードオフを明らかにし,効率的な圧縮手法を開発する。
- ドメイン適応型LoRAアダプタにより,LLMベースの算術符号化が2倍に改善。
- モデルへの要約を求めるプロンプトと算術符号化の組み合わせで,約0.03の圧縮率を達成。
- 質疑応答圧縮(QA)プロトコルは,従来のLLMベースの圧縮よりも100倍以上高い効率で知識伝達を実現。
基質特異的な分子ケージの計算機による生成 [cs.DS, physics.chem-ph]目的:基質特異的な分子ケージの設計
- 分子認識や触媒反応において,特定の分子を捕捉するケージ構造が重要である。
- 既存の方法では,複雑な分子ケージの効率的な設計が困難である。
- 特定の基質に結合可能な分子ケージを自動的に生成する手法を開発する。
- 分子ケージを空間座標を持つ原子のグラフとしてモデル化し,結合パターン配置法を提案した。
- 結合パターン間の接続方法を検討するアルゴリズムを開発し,最小の分子経路を構築した。
- 100原子以上の分子ケージを生成可能な効率的なアルゴリズムの探索を行った。
パス頻度クエリのための高速線形空間データ構造 [cs.ET, cs.DS]目的:木におけるパス頻度クエリに対する線形空間データ構造
- グラフ構造の頻度クエリは,様々な応用分野で重要であり,効率的なデータ構造が求められる。
- 既存のデータ構造は,空間効率またはクエリ時間において限界があり,改善の余地があった。
- パス頻度クエリを線形空間で効率的に処理し,既存手法の性能向上を目指す。
- パスモード,パス最小頻度要素,パス$\alpha$-少数派クエリに対し,初の線形空間データ構造を提案した。
- 提案手法は,従来の最良手法よりも高速な$O(\sqrt{n/w})$時間でのクエリ実行を可能にする。
- パス最大$g$-値色クエリについても,同様の線形空間データ構造を提案し,$O(\sqrt{n/w})$時間でのクエリを達成した。
階層的クラスタリングにおける許容可能な目的関数の特徴付け [cs.DS, cs.LG]目的:階層的クラスタリングのための許容可能な目的関数
- データ分析の基礎であり,多様な応用分野で利用されている。
- 従来のクラスタリング手法は,明確な原理に基づいた目的関数が不足していた。
- 許容可能な目的関数の明確化と,その近似アルゴリズムの開発。
- 本研究では,合計型目的関数について,対称多項式の次数が2以下の範囲で完全な特徴付けを行った。
- また,最大型目的関数について,許容性の判定条件を導出し,次数が2以下の多項式の場合の完全な特徴付けを示した。
- さらに,提案された目的関数に対する近似アルゴリズムの性能評価を行った。
選択された定理証明器における構成的ニューロ・サイバー・フィジカルシステム検証 [cs.PL]目的:ニューロ・シンボリックサイバー・フィジカルシステムの形式検証方法論
- ドローン等の安全性確保は重要であり,形式検証が不可欠である。
- ニューラルコンポーネントと記号モデルの統合的な検証が困難である。
- Vehicleフレームワークによる構成的な検証手法の確立を目指す。
- Vehicleフレームワークが,ニューラルコンポーネントの仕様,学習,検証を可能にする。
- Vehicleを複数の定理証明器(Rocq, Isabelle/HOL, Agda, Imandra)と統合し,無限時間水平方安全性証明を実証した。
- Vehicleの機能的インターフェースにより,医療機器の無限時間水平方安全性証明をRocqで実現した。
マイクロサービスにおける根本原因分析のための言語エージェント木探索 (LATS-RCA) [cs.SE]目的:マイクロサービスシステムの根本原因分析
- マイクロサービスアーキテクチャの普及に伴い,障害発生時の迅速な原因特定が重要になっている。
- 従来の根本原因分析は,人的リソースに依存し,時間とコストがかかるという課題がある。
- LLMを活用し,根本原因の仮説を木構造で探索することで,効率的な原因特定を目指す。
- 提案手法LATS-RCAは,公開ベンチマーク(LO2)において91.3%の診断精度を達成した。
- 異なるLLM(Claude Sonnet 4.5, GPT-5, Gemini 3 Pro)を使用しても,診断精度に大きな差はなかった。
- 実環境のインシデント分析では平均65.1%の診断率であり,複雑な要因や観測性の限界が課題であることが示された。
自律性への支援:ソフトウェア開発ライフサイクルにおけるエージェントAIの系統的文献レビュー [cs.SE]目的:エージェントAIのソフトウェア開発ライフサイクルにおける採用状況の体系的な分析
- ソフトウェア開発におけるAI活用は進んでいるが,体系的な知識の整理が求められている。
- エージェントAIの採用状況,アーキテクチャパターン,課題と対策に関する統合的な理解が不足している。
- ソフトウェア開発におけるエージェントAIの現状と課題を明らかにし,今後の発展に貢献する。
- エージェントAIの導入は,実行可能フィードバックによる客観的評価が可能な後半のSDLC段階で成熟している。
- プランナー・実行者・レビューアーの役割分担が支配的なアーキテクチャパターンとして特定された。
- 産業界での課題解決策は,エージェントの行動範囲を検証可能で限定的な領域に制限することに収斂する。
EF1 分割における並列アルゴリズムの改善 [cs.IR, cs.DS, cs.GT]目的:EF1分割のための並列アルゴリズムの性能向上
- 公平な資源配分は,経済学,計算機科学など様々な分野で重要な課題である。
- EF1分割の並列アルゴリズムは,効率的な資源配分を実現するためには不可欠だが,計算複雑性が高い。
- 本研究は,EF1分割における並列アルゴリズムの計算効率を向上させることを目指す。
- 2エージェントの場合,深さをO(log^2 m)からO(log m),作業量をO(m log m)からO(m)に大幅に改善した。
- エージェント数が定数であれば,NCアルゴリズムを適用可能であると示した。
- さらに,エージェントがpolylog(m)個以下の商品を評価し,各商品がO(1)個以下のエージェントに評価される場合,NCアルゴリズムが利用可能となる。
ノイズ性置換チャネルにおける体積洗練された到達可能性と逆近似 [cs.IT, math.IT]目的:厳密な正のDMCによって生成されるノイズ性置換チャネルの体積洗練された到達可能性と逆限界
- 情報伝送理論において,チャネル容量の厳密な評価は,通信システムの性能限界を理解する上で重要である。
- 既存の研究では,到達可能な出力多面体の内在するアフィン幾何学が考慮されておらず,容量評価の精度に限界がある。
- 本研究では,到達可能な出力多面体に適合したアフィン座標系を用いた到達可能性解析と逆近似を開発し,より正確な容量評価を目指す。
- 到達可能性解析において,アフィン座標系を用いたsimplex-lattice構成と最近傍復号器により,ガウス近似の余剰項をo(1)にすることが示された。
- 逆近似においては,メタ逆定理とKL覆いを用いることで,固定誤差逆定理を得て,対数ε容量がd/2であることが示された。
- さらに,層状Jeffreys混合補助出力分布を用いることで,定数次逆近似をo(1)の余剰項と共に導出した。
Metaにおける低リスクなコードレビューの自動化:RADAR,リスク調整,レビュー効率 [cs.SE, cs.AI]目的:AI支援によるコードレビュー自動化システムの開発と評価
- ソフトウェア開発の効率化が重要であり,AIの活用がその鍵となる。
- AIによるコード生成量の増加に伴い,レビューリソースが逼迫している。
- レビュー遅延を解消し,AI生成コードの安全性を確保すること。
- RADARは535,000件以上のdiffをレビューし,331,000件以上を承認した。
- Diff Risk Scoreの閾値を緩和することで,承認率は60.31%に向上した。
- RADARでレビューされたdiffのリバート率は非RADARdiffの1/3,本番環境でのインシデント発生率は1/50に減少した。
抽象的なコールパターンを活用した実行時チェックの最適化 [cs.DB, cs.PL]目的:実行時チェックの最適化
- 静的型付け言語と動的型付け言語の特性を理解し,両者の利点を活かす研究は重要である。
- 動的言語におけるアサーションの導入は表現力を高めるが,実行時オーバーヘッドを増大させる。
- アブストラクト解釈を活用し,実行時チェックの回数を減らすことで,オーバーヘッドを最小限に抑える。
- アサーションプロパティの実行時意味論を多変量,トップダウンのゴール指向型アブストラクト解釈アルゴリズムに統合する手法を研究した。
- 複数推論された呼び出しパターンを活用することで,実行時チェックが必要なプロパティ数を削減できることを示した。
- Ciaoシステムへの実装と性能評価により,従来の手法よりも優れた結果が得られることを確認した。
時系列と時間イベントシーケンス間の相互情報量の多様な分析タスクにおける推定 [cs.LG, cs.AI, cs.IT, math.IT]目的:時系列と時間イベントシーケンス間の依存性の定量化
- 時間データマイニングにおいて,相関や因果関係といったペアワイズ依存性尺度は基礎的である。
- 異種データ型,特に連続時系列と離散時間イベントシーケンス間の依存性を定量化する原理的で堅牢な方法が存在しない。
- 既存手法の偏りや不安定性を克服し,時系列とイベントシーケンス間の依存性を直接定量化すること。
- 提案手法は,データ変換,学習,または恣意的な離散化なしに,時系列とイベントシーケンス間の依存性を直接測定する。
- 連続-離散の二重性をモデル化することで,量子化や繰り返し値の影響を処理し,イベントの共起と冗長性によるバイアスを軽減する。
- 実験結果は,既存手法と比較して,精度,堅牢性,解釈可能性において一貫した改善を示した。
STC:BWT系列テキスト圧縮のための可逆的数字文脈分解 [cs.IR, cs.IT, math.IT]目的:BWT系列テキスト圧縮における数字文脈分解による圧縮効率向上
- テキストデータ圧縮は,ストレージ容量の削減やデータ転送時間の短縮に貢献するため重要である。
- 従来のBWT圧縮は,数字列のような特殊な文脈の変化に対応しきれていないという課題があった。
- 本研究は,数字列を分離することで,BWT圧縮の効率を向上させることを目指す。
- STCは,自己進化型AIシステムzeelinによって発見された新しい圧縮アルゴリズムである。
- enwik9データセットにおいて,STCは2,629,561バイトの圧縮率向上を実現した。
- 復号化の検証とSHA-256による整合性確認により,STCの有効性が確認された。
タングラム:効率的なマルチターンLLMサービングのための非一様KVキャッシュ圧縮の解錠 [cs.LG, cs.SE]目的:マルチターンLLMサービングにおけるメモリ制約の緩和
- LLMの性能向上には,計算資源だけでなく,メモリ効率が不可欠である。
- KVキャッシュのサイズが拡大し,メモリがボトルネックとなっている。
- 非一様KV圧縮によるメモリ効率化を,実用的なシステムに組み込む。
- タングラムは,ヘッドごとの予算予約,ラギッドページング,事前ロードバランシングにより,ページ回収を削減。
- 既存の非一様圧縮手法と同等の精度を維持しつつ,エンドツーエンドのスループットを最大2.6倍に向上。
- ヘッドごとの保持順位は入力に依存せず,オフラインで較正可能であることが示された。
自然言語要求からのAI駆動型テストケース生成:技術と研究のギャップの調査 [cs.DM, math.CO, cs.SE, cs.AI]目的:自然言語要求からのテストケース生成技術の現状と課題
- ソフトウェアの品質確保において,テストは不可欠であり,開発コストの大部分を占める。
- 自然言語で記述された要求からテストケースを自動生成することは,曖昧性により困難である。
- AI技術を活用し,自然言語要求からのテストケース生成における課題を克服すること。
- 本調査では,2000年から2025年までの主要な学術データベースを検索し,21件の一次研究を特定した。
- 既存のアプローチは,自動化,曖昧性への対処,適用範囲,トレーサビリティ,評価,幻覚制御の6つの品質次元を同時に満たしていないことが判明した。
- AIベースのテスト生成の進化を3つの時代にまとめ,今後の研究の指針として,幻覚,トレーサビリティ,複雑さ,コンプライアンスの4つの課題を提示した。
スペクトル衝突下における境界集中としての超指向性 [cs.IT, math.IT]目的:超指向性の現象の幾何学的解釈
- 電波の指向性を高める技術は,通信範囲拡大や干渉抑制に不可欠である。
- 従来の超指向性アレイ設計は,計算負荷が高く,数値誤差の影響を受けやすい。
- スペクトル衝突の視点から超指向性を捉え,より普遍的な理論的枠組みを確立すること。
- 超指向性は,スペクトル衝突によって誘発される集中効果として幾何学的に解釈できる。
- アレイ間隔がゼロに近づくとき,関連する有限次元部分空間は,再生カーネルにおいて多項式ジェット空間に収束する。
- 古典的な平坦な幾何学において,クリストッフェル関数は境界集中を示し,超指向性則を導出する。
素数イベント言語:双子素数イベント構造の情報理論的考察 [cs.IT, math.IT]目的:素数イベント言語の構築と,その統計的特性の調査
- 素数は数学の基礎であり,その性質の理解は数論の発展に不可欠である。
- 素数の分布に関する問題は長年未解決であり,効率的な解析手法が求められている。
- 素数のイベント系列を情報理論的に解析することで,新たな構造的知見を得ることを目指す。
- 双子素数イベント言語において,一次マルコフモデルによるテストセットのクロスエントロピーを減少させることに成功した。
- 相互情報量分析により,その依存性はラグ1に集中しており,ラグ2以降では急速に減少することが確認された。
- 素数イベント言語は無記憶ではなく,かつ強い予測可能性も持たない,弱いが再現性のある短距離の統計的構造を示すことが示唆された。
