arXiv雑要約
プログラム - 2026/03/09 公開
任意の線形サンプルからの非線形モデルクラスの学習のための統一的枠組み [cs.LG, cs.IT, math.IT]目的:非線形モデルクラスからの学習に関する統一的枠組み
- データから未知の対象を学習することは,機械学習や統計学における基盤的な課題である。
- 既存の研究では,特定のモデルクラスや測定方法に依存しており,汎用性に欠ける場合がある。
- モデルクラスの構造的性質と必要なデータ量を結びつける統一的枠組みを提示し,汎化性能を向上させる。
- 本研究では,任意のヒルベルト空間における対象,線形測定,非線形モデルを包含する統一的な枠組みを提案した。
- モデルクラスの変動とエントロピー積分を組み合わせることで,新たな学習保証を確立し,既存の結果を一般化・洗練させた。
- マトリックススケッチングや圧縮センシングなど,様々な問題に対して,既存の結果を直接的な帰結として導出した。
異種機械におけるオンラインビジータイムスケジューリング [cs.DS]目的:異種機械環境下におけるオンラインビジータイムスケジューリングの最適化
- クラウドコンピューティング利用の普及に伴い,異なる能力とコストの機械環境での効率的なジョブスケジューリングが重要である。
- 既存研究では,均一な機械を前提としていることが多く,異種機械環境下での理論的な理解が不十分である。
- 異種機械環境下でのオンラインビジータイムスケジューリング問題に対し,実用的なアルゴリズムを開発し,性能評価を行う。
- 均一長のジョブに対し,8-競争型アルゴリズムを設計し,競争比2の下限を証明した。
- ジョブが非ネスト区間を形成する場合,下限がタイトであることを示した。
- すべてのジョブが均一長pを持つ場合,競争比が8(2p-1)/p < 16のアルゴリズムへ一般化できる。
パス被覆,ハミルトニシティ,独立数:FPTの視点 [cs.DS, cs.DM]目的:グラフの最小パス被覆の決定問題
- グラフ理論は,ネットワーク分析や最適化問題など,様々な分野に応用される重要な研究領域である。
- グラフのパス被覆問題はNP困難であり,大規模グラフに対する効率的な解法が求められていた。
- 独立数に着目し,パラメータ化されたアルゴリズムを用いてパス被覆問題を効率的に解くことを目指す。
- 本研究では,独立数α(G)をパラメータとするFPTアルゴリズムを開発し,パス被覆問題の効率的な解法を提案した。
- このアルゴリズムは,2^{2^{O(k^4\log{k})}} \cdot n^{O(1)}の計算時間で,最小サイズのパス被覆または独立集合を導出する。
- また,独立数が3以下のグラフに対するハミルトンパスの判定問題を多項式時間で解くアルゴリズムも新たに発見した。
ソフトウェア開発ライフサイクルからの視点:コード大規模言語モデルとエージェントのベンチマーク調査 [cs.SE, cs.AI]目的:コード大規模言語モデルとエージェントのベンチマークに関する体系的なレビュー
- ソフトウェア開発において,AIの活用が重要性を増しており,その性能評価が不可欠である。
- 既存のベンチマークは,ソフトウェア開発ライフサイクル全体を網羅的にカバーしていない。
- ソフトウェア開発ライフサイクル全体におけるベンチマークの偏りを明らかにし,今後の研究方向性を示す。
- 現在のベンチマークの約61%は,ソフトウェア実装段階に集中しており,要件定義や設計段階は著しく少ない。
- 多くのベンチマークにおいて,データ漏洩のリスクを高める汚染対策が欠如している。
- コード大規模言語モデルとエージェントの実用的な有効性を高めるための課題と今後の方向性が特定された。
ツインシステムのシステム:系統的文献レビュー [cs.ET, cs.SE]目的:ツインシステムのシステムに関する既存研究のレビュー
- システムは規模,相互接続性,デジタル・物理コンポーネントの多様性により複雑化している。
- システム・オブ・システムズとデジタルツインはそれぞれ異なる側面を扱うため,統合が課題である。
- システム・オブ・システムズとデジタルツインを統合し,より包括的なシステム設計方法を確立する。
- 2,500件以上の研究から80件を選定し,ツインシステムのシステムの現状を詳細に調査した。
- システム・オブ・システムズとデジタルツインの既存理論と互換性のある分類フレームワークを提案した。
- このレビューは,ツインシステムのシステムに関する知識体系の発展に貢献すると考えられる。
線形レイアウト:効率的なテンソル計算のための堅牢なコード生成($\mathbb{F}_2$を使用) [cs.PL, cs.AR, cs.DC, cs.PF]目的:テンソルレイアウトの効率的なコード生成
- 現代の深層学習の基盤であり,計算効率に直結する重要な研究分野である。
- テンソルレイアウトの柔軟性と性能を両立した設計・実装が困難である。
- 線形代数を用いてテンソルレイアウトを表現し,効率的な変換を実現する。
- 線形レイアウトを$\mathbb{F}_2$上の線形代数でモデル化することで,汎用的なレイアウト定義と変換が可能になった。
- 既存のシステムで問題となっていたレイアウト間の変換における計算量爆発を解消した。
- Tritonへの統合により,個々の演算やカーネルの最適化,コンパイラバックエンドの改善に貢献した。
Vモデルに基づくMeROSメタモデルの適用によるROS関連ロボットシステム開発 [cs.CL, cs.RO, cs.SE]目的:ROSを用いたロボットシステム開発における体系的な手法
- ロボットシステムの複雑化に伴い,システム全体の品質保証が重要課題となっている。
- ROSの柔軟性はシステム構築を容易にするが,大規模システムの整合性維持が困難である。
- ROSとMBSEを統合し,ロボットシステムの設計・検証プロセスを体系化する。
- 本研究では,ROSベースのロボットシステムに焦点を当てたMBSEワークフローを実現するMeROSメタモデルを提案した。
- Vモデルを適用することで,ロボットシステムのライフサイクル全体にトレーサビリティと検証機能を組み込むことが可能となった。
- 提案手法は,複雑なロボットシステムの設計におけるエンジニアリングチームの慣習的な手法と親和性が高い。
意味的デジタル通信における不均一誤り保護 [cs.IT, eess.SP, math.IT]目的:デジタル意味的通信における不均一誤り保護の最適化
- 意味的通信は,効率的な情報伝達を可能にするため,近年注目を集めている。
- 従来の誤り保護方式は,全てのビットを均等に保護するため,非効率な場合がある。
- 意味的に重要なビットのみを高信頼化することで,通信効率を向上させることを目指す。
- 意味的に重要なビットの誤り保護レベルは,重要度の差により大きく異なることが示された。
- 総ブロック長を最小化する2つの不均一誤り保護フレームワークが提案された。
- 画像伝送実験により,提案手法が従来の均一保護方式よりも性能・効率で優れていることが確認された。
Δモチーフ:表形式演算による部分グラフ同型判定 [cs.DC, cs.DC, cs.CL, cs.DS]目的:部分グラフ同型判定の高速化
- グラフ解析は,生物学的ネットワーク,ソーシャルネットワークなど,多様な分野で不可欠である。
- 従来のアルゴリズムは逐次処理に依存し,並列ハードウェアの性能を活かせない場合が多い。
- データベース演算を用いて,グラフ処理の並列化を実現し,高速な同型判定を実現する。
- Δモチーフは,グラフを表形式に変換し,データベース操作(結合,ソート等)を通じて部分グラフ同型判定を行う。
- NVIDIA RAPIDSやPandasフレームワークを活用し,大規模な並列処理を実現し,VF2等の既存アルゴリズムを最大595倍上回る性能を示す。
- 量子回路コンパイルへの応用により,量子計算におけるボトルネックを解消し,デバイスのスケーリングに貢献する。
形式検証済み線形時間可逆字句解析 [cs.CL, cs.PL, cs.FL]目的:可逆な線形時間字句解析のフレームワーク
- プログラムの信頼性確保は重要であり,特にコンパイラの字句解析部はその根幹をなす。
- 従来の検証済み字句解析器は,正規表現のセマンティクスと最長一致の保証に焦点を当てていた。
- 字句解析と出力が相互に逆演算となることを保証し,線形時間での処理を実現する。
- ZipLexは,最長一致セマンティクスに従う可逆な線形時間字句解析の検証済みフレームワークである。
- 検証済みメモ化により,文字列の字句解析が文字列サイズに対して線形であることが保証される。
- JSON処理などの現実的なアプリケーションをサポートし,Verbatim++と比較して2桁高速である。
初到達位置チャネルの尾部遷移:コーシー分布から指数分布への移行 [cs.RO, cs.IT, eess.SP, math.IT, math.PR]目的:初到達位置チャネルの尾部分布の変化
- 通信システムの性能評価において,信号到達位置の分布は重要な指標となる。
- 従来の理論は,ドリフトがない場合に特化しており,現実のシステムにおけるドリフトの影響が不明確であった。
- ドリフトが導入された場合に,到達位置の分布がどのように変化するかを明らかにすること。
- ドリフトが存在する場合,到達位置の分布はコーシー分布から指数分布へと移行することが示された。
- 特徴的な伝播距離が,拡散支配領域とドリフト支配領域を区切る境界となることが明らかになった。
- 低ドリフト環境下では,分散一致ガウス近似が通信ポテンシャルを過小評価し,コーシー分布がより適切なベースラインとなる。
UniCoR:ロバストなクロス言語ハイブリッドコード検索のためのモダリティ協調 [cs.SE]目的:ロバストなクロス言語ハイブリッドコード検索のための統一的なコード表現の学習
- コード検索は不可欠であり,自然言語とコードスニペットを組み合わせたハイブリッド検索が重要になっている。
- 既存のアプローチでは,特にクロス言語環境において,ハイブリッドクエリを効果的に活用できていない点が課題である。
- セマンティクスがロバストで,モダリティが協調し,言語に依存しない統一的なコード表現を学習することで,この課題を解決する。
- UniCoRは,コード間の類似性,自然言語-コード間の対応,自然言語間の類似性を考慮した多角的コントラスティブ学習モジュールを設計した。
- 表現分布の一貫性学習モジュールを導入し,異なるプログラミング言語の表現分布を一致させることで,言語に依存しない表現学習を実現した。
- 大規模なベンチマークにおいて,UniCoRは既存モデルを凌駕し,MRRで平均8.64%,MAPで11.54%の改善を達成した。
外れ値に対するロバストな疎信号復元:LADに基づくハード閾値化追求アプローチ [cs.IT, cs.CV, math.IT]目的:外れ値を含む測定値からの疎信号復元
- 信号処理や機械学習において,疎信号の復元は,データの圧縮や特徴抽出に不可欠である。
- 従来の復元手法は,ノイズの範囲が限定されているか,信号の疎性の事前知識を必要とする場合が多い。
- 事前知識なしに,外れ値に汚染された測定値から疎信号を効率的に復元することを目指す。
- 提案手法GFHTP$_1$は,信号の疎性レベルに関する事前知識を必要とせず,理論的な収束性を示す。
- GFHTP$_1$は,s-疎な信号を最大s回反復で正確に復元できることが証明され,効率的な復元保証を提供する。
- 数値実験により,GFHTP$_1$は,信号の疎性や外れ値のサポートサイズが変化した場合でも,競合するアルゴリズムを上回るロバスト性と計算時間の短縮を示す。
AIシステムに対する安全ケース構築の構造化アプローチ [cs.SE]目的:AIシステムの安全ケース構築手法
- AI技術の発展に伴い,安全性確保の重要性が増している。社会実装における信頼性向上が求められる。
- 従来の安全ケース構築手法は,AIシステムの動的な特性に対応できていない。予測不能な挙動が課題となる。
- AI固有の課題に対応できる,再利用可能な安全ケーステンプレートの提案。
- AIシステムの安全ケースに必要なクレーム,議論,証拠の分類体系を提示した。
- AIシステムの特性に合わせた安全ケーステンプレートを提案し,具体的なパターンを示した。
- 提示されたアプローチは,AIシステムの安全性評価,監査,適応性を高めることが期待される。
SWE-MiniSandbox:ソフトウェア工学エージェント構築のためのコンテナフリー強化学習 [cs.RO, cs.SE, cs.AI, cs.LG]目的:ソフトウェア工学エージェントの強化学習におけるスケーラビリティ向上
- ソフトウェア開発の自動化は,生産性向上や品質確保に不可欠であり,そのための新たな手法が求められている。
- 従来の強化学習パイプラインでは,タスク分離のためにコンテナが用いられ,ストレージの肥大化や環境構築の遅延が課題となっていた。
- 本研究は,コンテナに依存しない軽量な環境構築により,スケーラブルな強化学習環境の実現を目指す。
- SWE-MiniSandboxは,カーネルレベルのメカニズムを用いた隔離ワークスペースにより,システムオーバーヘッドを大幅に削減した。
- ディスク使用量はコンテナベースのパイプラインの約5%,環境準備時間は約25%に短縮された。
- 評価性能は従来のコンテナベースのパイプラインと同等であり,リソース制約のある環境でも実用的な強化学習環境を提供できる。
大規模言語モデルにおける長文脈推論の限界:自動バグ修正に着目して [cs.SE, cs.LG]目的:長文脈におけるコードのデバッグと修正生成能力の評価
- ソフトウェア開発の効率化と品質向上において,自動バグ修正技術は重要な役割を担う。
- 大規模言語モデルの文脈長は伸びているが,実際に長文脈を有効活用できるかは不明である。
- 現在のLLMが,真に長文脈の情報を利用してバグ修正を行えるか検証する。
- エージェント機構を用いることで,モデルの性能は向上するものの,成功する軌跡のトークン数は2万~3万程度に留まる。
- 文脈長を人工的に増加させた実験では,性能が著しく低下し,64kトークンでは解決率が7%にまで低下した。
- LLMには,名目上の文脈長と実際に利用可能な文脈容量との間に大きなギャップが存在することが示唆された。
コード空間の理論:コードエージェントはソフトウェアアーキテクチャを理解しているか [cs.SE, cs.AI]目的:ソフトウェアアーキテクチャ理解の評価
- AIによるソフトウェア開発の自動化は,生産性向上に不可欠である。
- 現在のAIコードエージェントは,大規模なソフトウェアアーキテクチャの理解が不足している。
- コードエージェントのアーキテクチャ理解能力を定量的に評価する手段が求められている。
- 新たなベンチマーク「コード空間の理論(ToCS)」を開発し,コードエージェントのアーキテクチャ理解能力を評価した。
- 積極的な探索戦略がモデルによって効果が異なり,モデル固有の能力が明らかになった。
- 構造化された信念マップの保持が,モデルによっては自己学習を促進する一方で,別のモデルでは逆効果になることが示された。
一変数一階様相論理の独立融合 [cs.LO]目的:一変数一階様相論理の独立融合における保存性
- 様相論理は,知識,信念,時間などの概念を形式的に扱うために重要である。
- 複数の様相論理を組み合わせる際,その性質(完全性,決定可能性など)がどのように保存されるか不明である。
- 一変数一階様相論理の融合における完全性と決定可能性の保存条件を明らかにすること。
- 等式がない場合,拡大解釈と定域解釈の両方において,クリプキ完全性と決定可能性が保存される。
- 等式や非剛性定数を含む場合,拡大解釈と定域解釈の下で,クリプキ完全性と決定可能性は保存されない。ディオファントス方程式の埋め込みにより証明される。
- 等式がない場合でも,有限モデル性質は局所的な場合のみ保存される。
MOOSE エコシステムのためのドメイン特化型 AI エージェント:MOOSEnger [cs.AI, cs.CE, cs.SE]目的:MOOSE エコシステムにおける入力ファイル生成とデバッグの効率化
- 科学技術計算において,シミュレーションの高速化と効率化は,研究開発の進展に不可欠である。
- MOOSE の入力ファイルは複雑で厳密な構文規則があり,初期設定やデバッグに時間がかかるという課題がある。
- 自然言語による指示から実行可能な入力ファイルを生成し,デバッグ作業を効率化することを目指す。
- MOOSEnger は,自然言語による指示を MOOSE の入力ファイルに変換する会話型ワークフローを提供する。
- Retrieval-augmented generation と MOOSE 固有の解析・検証ツールを組み合わせることで,高い入力生成精度を実現した。
- 125 のプロンプトを用いたベンチマークテストでは,実行成功率 90% を達成し,LLM 単体では 6% に留まった。
情報コストの単調性について [econ.TH, cs.IT, math.IT]目的:情報コストの単調性
- 合理的な意思決定において,情報の収集にはコストが伴うという前提が重要である。
- 情報の質とコストの関係が十分に理解されていないため,最適な情報収集戦略の設計が困難である。
- 情報量が増加するにつれてコストが単調に増加するという性質を明らかにすること。
- ブラックウェルおよびレーマンによる情報順序に対するコスト関数の単調性の必要十分条件を提示した。
- これらの条件は,情報の劣化という考え方に基づいている。
- 既存のコスト関数がこれらの条件を満たすかどうかを検証した。
線形最適化における双対性理論とその拡張 ― 正式検証付き [math.OC, cs.LO]目的:線形最適化における双対性理論の形式的な証明
- 線形最適化は,資源配分や決定問題など,様々な分野で基盤となる重要な理論である。
- 双対性理論の厳密な形式的証明は,計算可能性や信頼性の観点から課題であった。
- 線形順序付けられた体における双対性定理の形式的な証明と拡張を目指す。
- ファルカスは,線形不等式系が解を持つことと,矛盾を導く線形結合が存在しないことが同値であることを示した。
- 本研究では,Lean 4を用いて,ファルカス型の定理を形式的に証明した。
- さらに,一部の係数が「無限大」を取りうる場合への双対性理論の拡張を行った。
ホモトピー基数とエントロピー [math.CT, cs.IT, math-ph, math.IT, math.MP]目的:ホモトピー型理論と情報理論の関係性
- 計算機科学と数学の根幹をなす分野であり,その発展は現代社会の様々な応用を促進する。
- 型理論と情報理論の間の橋渡しが不十分であり,形式的な関係性の確立が課題となっている。
- ホモトピー基数を用いてエントロピーを型理論的に定義し,情報理論の基礎を再構築する。
- ホモトピー基数は,ある種の仮定の下で依存和において保存されることが証明された。
- ホモトピー基数は一般に依存積を保存しないことが示された。
- 対数関数の冪級数展開を利用し,エントロピーを型として表現し,エントロピーの連鎖律を導出した。
無線ネットワークにおける有用領域解析のための統一的フレームワーク:セル型,非セル型,およびその中間 [eess.SP, cs.IT, math.IT]目的:無線ネットワークの有用領域解析に関する統一的フレームワーク
- 無線通信は現代社会の基盤であり,その効率的な運用が重要である。
- 大規模MIMOや非セル型ネットワークなどの複雑化により,干渉パターン解析が困難になっている。
- 非線形写像のスペクトル半径を用いて,有用領域を簡潔に特徴付ける手法を確立する。
- 本研究は,非線形写像のスペクトル半径を用いて有用領域を特徴付けることで,弱パレート境界の既存の定式化を簡潔な表記で一般化することを可能にした。
- 得られた十分条件は,凸最適化問題として解ける加重和レート最大化問題のクラスを特定し,効率的なソルバーの開発を可能にする。
- また,本理論は,大規模MIMOにおける良好な伝搬条件の概念に対する新たな視点を提供し,自己干渉とビームフォーミング戦略を考慮した検討を促す。
制約充足問題,コンパクト性,および非可測集合 [math.LO, cs.LO]目的:有限関係構造のコンパクト性に関する証明可能性と非可測集合の存在の関連性
- 制約充足問題は,計算機科学や数学の様々な分野で基礎的な役割を果たしている。
- コンパクト性の証明には,集合論的な公理系の選択が影響し,独立性問題が存在する。
- 幅が1である有限関係構造のコンパクト性の証明可能性と,それ以外の場合の非可測集合の存在を明らかにする。
- 幅が1の構造については,Zermelo-Fraenkelの公理系内でコンパクト性が証明可能である。
- 幅が1でない構造のコンパクト性は,3次元空間における非可測集合の存在を示唆する。
- コンパクト性の証明可能性と非可測集合の存在の間に,密接な関係があることが示された。
- 1
- 2
