arXiv雑要約
プログラム - 2025/12/16 公開
仕様を明確化し,コードを削減する:SYSSPECによる生成型ファイルシステムの提案 [cs.OS, cs.SE]目的:生成型ファイルシステムの研究
- ファイルシステムはOSの中核であり,ハードウェアやアプリケーションの進化に対応する必要がある。
- 従来の開発手法では,複雑化するシステム維持に大きな負担がかかる。
- LLMを活用し,曖昧さを排除した仕様に基づきファイルシステムを生成・進化させる。
- SYSSPECは,曖昧な自然言語ではなく,形式手法から得られた原則に基づいた多部構成の仕様を用いる。
- この仕様はLLMを導き,期待されるコードを柔軟に生成する明確な設計図として機能する。
- 生成されたSPECFSは多数の回帰テストに合格し,手動でコーディングされたベースラインと同等の性能を示した。
準同型識別可能性,多重性オートマトン同値性,多項式恒等性判定 [cs.MA, cs.CC, cs.DM, cs.DS, cs.LO]目的:グラフクラスにおける準同型識別可能性の複雑性
- グラフ同型性問題は計算複雑性において重要な課題であり,近似問題の解明が求められている。
- 準同型識別可能性問題の複雑性は,グラフクラスによって大きく異なり,一般解法は未確立であった。
- 特定条件下における準同型識別可能性問題の計算複雑性の限界を示すことを目指す。
- グラフクラスの有界トレewidthに対する準同型識別可能性問題は,多項式時間でランダムに解けることが示された。
- このアルゴリズムの非決定化は,多項式恒等性判定が多項式時間で解ける場合にのみ可能である。
- 有界パス幅のグラフクラスに対しては,準同型識別可能性問題の複雑性をC=Lに改善し,これが限界であることが示された。
亜多項式時間で実行可能な,超対数サイズの最小カットの決定的な完全動的アルゴリズム [cs.DS]目的:超対数サイズの最小カットを亜多項式時間で求める完全動的アルゴリズム
- グラフ構造の動的な変化に対応した最小カットの維持は,ネットワーク分析等に応用が期待される。
- 既存のアルゴリズムは,最小カットサイズの制約が厳しく,実用的なグラフへの適用が困難であった。
- 最小カットサイズの制約を緩和し,より広範なグラフに対して適用可能なアルゴリズムを開発する。
- 本研究では,最小カットサイズが $2^{\Theta(\log^{3/4-c}n)}$ 以下のグラフに対し,決定的な完全動的最小カットアルゴリズムを亜多項式時間で実行可能であることを示した。
- グラフの疎化と組み合わせることで,重み付きグラフに対する$(1+\epsilon)$-近似完全動的最小カットアルゴリズムを,同様の時間計算量で実現した。
- ランダム化されていた局所最小カットアルゴリズムを,決定的なアルゴリズムに置き換えることで,上記の結果を達成した。
確率的プログラミングとオートマトン理論:重み付きオートマトンによる厳密推論 [cs.RO, cs.SY, eess.SY, cs.FL, cs.PL]目的:確率的プログラムの厳密推論手法
- 機械学習や自律システムのモデリング等,確率モデルの利用が不可欠である。
- 確率的プログラムの事後分布の厳密な計算は困難である。
- 重み付きオートマトンを用いて,確率的プログラムの厳密推論を可能にすること。
- 確率的プログラムの変数の分布を重み付きオートマトンとして表現する。
- オートマトン理論の構成(積,連結など)をプログラミング言語のセマンティクスに対応させる。
- これにより,特定の離散的確率的プログラムに対して厳密推論が可能となる。
構造パラメータ化におけるマイナー削除のカーネル化二分法 [cs.DS, cs.CC, math.CO]目的:マイナー削除問題に対するカーネル化の存在条件
- グラフ問題の分野において,問題サイズの縮小は計算効率化に不可欠である。
- 既存の研究では,特定のグラフ族に対するカーネル化の条件が不明確であった。
- 特定条件下におけるマイナー削除問題のカーネル化の有無を明確化することを目指す。
- 平面グラフを含むグラフ族に対しては,正確な多項式カーネルの存在が示された。
- 平面グラフ頂点削除問題に対する近似多項式カーネルの存在が導かれた。
- NP ⊆ coNP/polyを仮定した場合,無限個の二分法が導出された。
ソフトゴールに基づくブロックチェーンパターン選択のための意思決定支援フレームワーク [cs.SE]目的:ブロックチェーンパターン選択のための意思決定支援
- ブロックチェーン技術は多くの分野で普及が進んでいる。ビジネスへの貢献は大きい。
- ブロックチェーンパターンの多様性と標準化されたフレームワークの欠如が課題である。
- ビジネス目標と技術的設計を結びつけ,最適なパターン選択を支援すること。
- 本研究では,ブロックチェーンパターンとドメイン非依存のソフトゴールを組み合わせたBC-TEAEMを提案する。
- BC-TEAEMは,ドメイン専門家と技術専門家の連携により,整合性とトレーサビリティを確保する。
- プロトタイプツールを開発し,医薬品企業のサプライチェーン追跡システムを事例研究で検証した。
双偏波16QAMにおける多次元アーキテクチャによる低複雑度送受信機IQインバランス監視・補償 [eess.SY, cs.SY, cs.NI, cs.IT, math.IT]目的:送受信機のIQインバランスを監視し,補償する低複雑度アーキテクチャ
- 高速光通信の普及に伴い,偏波多重方式の性能向上が不可欠である。
- 送受信機のIQインバランスは,偏波多重通信における信号劣化の主要因となる。
- IQインバランスの影響を低コストで軽減する技術が求められている。
- 提案アーキテクチャは,IQスキュー推定と低複雑度MIMOイコライザを組み合わせることで,IQインバランスを効果的に補償する。
- 受信側IQスキュー推定により,従来の方式と比較して実数乗算量を70%以上削減できる。
- 低複雑度MIMOイコライザにより,4x4 MIMOと比較して実数乗算量を51%削減できることがシミュレーションと実験で示された。
有限学習能力を持つ統合センシング・通信における情報理論的限界 [cs.IT, math.IT]目的:人工知能(AI)支援型統合センシング・通信(ISAC)における情報理論的限界
- 通信とセンシングの統合は,次世代無線システムの重要なトレンドであり,新たな応用を可能にする。
- AIの活用はISACの性能向上に不可欠だが,AIモデルの学習能力には制約があるという課題がある。
- AIモデルの学習能力が通信・センシング性能に与える影響を定量的に評価し,性能限界を明らかにすること。
- AIの学習能力の制約は,等価な付加ノイズとして表現でき,通信レートとセンシング歪みを解析的に導出した。
- レイリー,ライシャンフェージング,MIMOシステムへの拡張も行い,行列不等式とAI容量と有効ノイズ共分散の対応関係を構築した。
- センシングと通信の資源配分を最適化し,学習能力制約下での性能トレードオフ則を確立した。
パラメータ化問題に対する空間効率の良いアルゴリズム [cs.DS, cs.CC, cs.DM, math.CO]目的:グラフ問題における空間効率の良いFPTアルゴリズム
- 大規模データ処理の重要性が増しており,メモリ消費量の削減が求められている。
- 従来のアルゴリズムはメモリ消費量が大きく,大規模データには適用が困難である。
- メモリ消費量を抑えつつ,効率的に問題を解くアルゴリズムを開発すること。
- k-Path,MaxLeaf SubTree,Multicut in Treesに対して,時間計算量はf(k)*poly(n),空間計算量はg(k)*polylog(n)となるアルゴリズムを提案した。
- 提案アルゴリズムは,メモリ使用量を抑え,大規模な問題インスタンスに対応可能である。
- 頂点や辺の削除といった標準的な手法が利用できない状況下で,新たなアプローチを開発した。
UCRBench:ユースケース復元のためのLLMのベンチマーク [cs.SE]目的:ユースケース復元におけるLLMの性能評価
- ソフトウェア開発において,機能要件を明確化するユースケースの重要性が増している。
- 既存のベンチマークは不足しており,実際のシステム挙動とのずれが生じやすい。
- ソースコードからユースケースを生成するLLMの評価を厳密に行うためのベンチマークを提供する。
- LLMはシステム機能を部分的に復元できるものの,プロジェクトによって性能に大きな差が見られた。
- 特に,ドメイン固有のシステムや多層モジュールシステムにおいて,LLMの性能不足が顕著であった。
- LLMは省略率が高く,サブ機能をユーザー目標のユースケースに集約する際に一貫性を保つことが困難であった。
機械学習による新たなチャンピオン符号の発見 [cs.SC, cs.IR, cs.IT, math.CO, math.IT]目的:チャンピオン線形符号の発見
- 現代のデジタル通信・記憶システムの数学的基盤であり,信頼性向上に不可欠である。
- チャンピオン符号の同定は困難であり,探索空間が広大であるという課題がある。
- 機械学習と遺伝的アルゴリズムを組み合わせ,効率的なチャンピオン符号探索を目指す。
- トランスフォーマーモデルを用いて線形符号の最小ハミング距離を予測し,探索空間を削減する手法を開発した。
- この手法は,トーリック符号,リード・ミューラー符号など,様々な誤り訂正符号の探索・構築に応用可能である。
- 機械学習と組み合わせることで,従来の探索方法では困難だったチャンピオン符号の発見に貢献する。
PSALM:変異テストにおける比例的サンプリング戦略の適用 [cs.SE]目的:変異テストにおけるソーステストケース選択と変異グループ選択のための比例的サンプリング戦略の適応
- 変異テストは,オラクル問題を緩和する有効な手法であり,ソフトウェアの品質向上に不可欠である。
- ソーステストケースおよび変異グループの選択方法については,体系的な研究が不足している。
- 既存の選択戦略よりも効果的な,変異テストのための理論的根拠に基づいた選択戦略を提案する。
- PSALMは,ソーステストケースと変異グループの選択において,ランダム選択と比較して性能が劣ることがないことが証明された。
- 特定の条件下では,PSALMを適用することでソーステストケース選択と変異グループ選択の効果が同等になることが示された。
- 8つのプログラムと184の変異体を用いた実験により,PSALMがARTやMT-ARTなどの既存戦略よりも一般的に効果的であることが確認された。
量子回路の実行監視:中間測定とリセットを用いたQMon [cs.SE]目的:量子回路の実行状態の監視手法
- 量子計算の発展に伴い,量子プログラムのデバッグや実行状況の把握が重要になっている。
- 量子状態の複製禁止原理などにより,古典的な方法での量子回路の内部状態の直接観測が困難である。
- 中間測定とリセット操作により,量子状態への影響を最小限に抑えつつ,回路の実行状態を監視する。
- QMonは,開発者が指定した場所で監視演算を挿入し,期待される量子状態確率と観測された確率を比較する。
- 154の量子回路を用いた実験の結果,QMonによる計測は回路の本来の機能を損なうことなく,様々なプログラミングエラーを検出・特定できた。
- 量子エンタングルメントなどのデリケートな量子特性を維持する必要があるため監視範囲は限定されるが,量子状態への影響は無視できる程度である。
非GRS MDSコードを含む2つの線形符号族 [cs.IT, math.IT]目的:非GRS MDSコードを含む線形符号族の構成
- 符号理論は,通信やデータ保存における誤り検出・訂正に不可欠であり,その効率的な符号の探求が重要である。
- GRS符号は強力だが,構造が限られるため,より多様なMDS符号の構成が求められている。
- GRS符号の生成行列を修正することで,新たなMDS符号を構築し,その特性を明らかにする。
- GRS符号の生成行列を修正することで,2つの新しい線形符号族を構成した。
- これらの符号に対して,パリティチェック行列を明示的に導出し,MDS特性の必要十分条件を確立した。
- 特に,これらの構成における非GRS MDSコードの部分族を特定し,自己直交性や自己双対性についても特性を調べた。
ユーザーインターフェースからエージェントインターフェースへ:LLMエージェントのためのUI表現の効率最適化 [cs.SE, cs.AI]目的:LLMエージェントにおけるUI表現の効率化
- LLMエージェントはUI自動テストやAIアシスタント等,多様な分野での応用が期待されており,その性能向上が重要である。
- UI表現の非効率性が,LLMエージェントの性能ボトルネックとなることが課題となっている。
- UI表現を自動的に変換するプログラムを生成することで,効率と完全性の両立を目指す。
- UIFormerは,UI変換プログラムを合成するための自動最適化フレームワークであり,複雑な合成タスクを構造的に分解する制約ベースの最適化を用いる。
- UIFormerは,UI固有の操作を捉えたドメイン固有言語(DSL)を使用し,プログラム空間を制限することで効率的な探索を実現する。
- 3つのUIナビゲーションベンチマークで,UIFormerはトークン消費量を48.7%~55.8%削減し,エージェントの性能を維持または向上させた。
データアノテーション要件の表現と仕様 (DARS) [cs.SE]目的:データアノテーション要件の表現と仕様
- AI搭載サイバーフィジカルシステムの普及に伴い,データアノテーションの重要性が増している。
- 既存の要件工学ではAIシステムとデータ要件を表現するが,データアノテーション特有の課題に対応できていない。
- データアノテーションの完全性,正確性,一貫性の問題を解決し,安全性が求められるシステムの信頼性を向上させる。
- DARSは,アノテーション交渉カードとシナリオベースのアノテーション仕様により,関係者の合意形成と要件の明確化を支援する。
- 自動車認識の事例研究と18種類の実際のアノテーションエラーとの対応付けにより,DARSの有効性が示された。
- DARSを要件工学に統合することで,データアノテーションに依存するシステムの信頼性が向上する。
ソフトウェア関連排出量と共有責任の体系的マッピング [cs.CL, cs.SE]目的:ソフトウェア関連排出量とICTセクターの責任の体系的マッピング
- 地球温暖化は深刻化しており,ICTセクターはその温室効果ガス排出量増加に寄与している。
- ICTセクターにおける環境負荷の認識と削減が不十分であり,対策が急務である。
- ソフトウェアライフサイクル全体における排出源と責任範囲の明確化を目指す。
- 本研究は,ICTセクターにおけるソフトウェア関連排出量と各ステークホルダーの責任を体系的にマッピングした。
- マッピングにより,ICT領域における主要な炭素排出源とエネルギー消費源が特定された。
- 企業が環境フットプリントを認識し軽減するための法規制(CSRD,CSDDなど)への対応に貢献する。
Zipfの法則からヒープの法則,ヒルベルグの仮説を通じたニューラルスケーリングへ [eess.SY, cs.SY, eess.SP, cs.CL, cs.DC, cs.CL, cs.IT, cs.LG, math.IT, math.ST, stat.TH]目的:ニューラルスケーリング則とZipfの法則の関係性
- 機械学習モデルの性能向上には,学習データ量やパラメータ数との関係を理解することが重要である。
- 既存研究では,Zipfの法則とニューラルスケーリング則の関連性が十分に解明されていない。
- Zipfの法則からニューラルスケーリング則を導き出すことで,モデルのスケーリングに関する理解を深める。
- Zipfの法則からヒープの法則,ヒルベルグの仮説を経て,ニューラルスケーリング則が導き出されることが示された。
- この導出過程は,広範な仮定のもとで体系的に明らかにされた。
- Santa Feプロセスという簡単な例を用いて,これらの統計法則が全て満たされる様子が示された。
ファインチューニングされたLLMベースのコード移行フレームワーク [cs.RO, cs.SE, cs.CL, cs.LO]目的:SQLベースシステムの移行における課題解決
- データベースシステムの老朽化に伴い,移行の自動化が重要な課題となっている。
- 異なるデータベース間の構文や機能の違いにより,移行作業は複雑かつエラーが発生しやすい。
- LLMを活用し,SQLコードの構文マッピングや差異解決を自動化することで移行効率を向上させる。
- ファインチューニングされたLLMの活用が,SQLコード移行において重要な役割を果たすことが示された。
- 本フレームワークは,構文エラー率の低減,機能アライメントの改善に貢献し,移行ワークフローの効率化を実現する。
- 自動SQL機能検出,半教師ありエラー分析,専門家のフィードバック統合により,継続的な改善を可能にする。
データ量が少ない環境下でのソフトウェアエンジニアリング課題 [cs.SE]目的:ソフトウェアエンジニアリングにおけるデータ量の必要性に関する検討
- ソフトウェアエンジニアリング研究は,進歩のために大規模データセットと高性能な最適化手法に依存する傾向がある。
- データと計算資源への過度な依存が,研究のボトルネックとなっている可能性がある。
- 少ないデータでも十分な性能を発揮できるソフトウェアエンジニアリング課題の特定を目指す。
- 多数の最適化問題において,わずかなラベル数でも既存手法の90%程度の成果が得られることが示された。
- 単純な手法(多様性サンプリング,ベイズ学習,ランダムプローブ)が,SMACなどの高度な最適化手法と同等の性能を発揮することが確認された。
- 迅速かつ低コストなガイダンスが必要な多くの工学的ニーズにおいて,軽量なアプローチが有効である可能性が示唆された。
ハイパーミニランク:マルチ送信者インデックス符号化の統一ハイパーグラフ特性化 [cs.IT, math.CO, math.IT]目的:マルチ送信者インデックス符号化問題に対する最適なスカラー線形ブロードキャスト長の決定
- 情報理論における符号化技術は,通信効率を向上させる上で不可欠である。
- マルチ送信者インデックス符号化問題は,最適解の探索が困難である。
- ハイパーグラフを用いて,この問題に対する厳密な特性化と効率的な解法を提供する。
- 本研究では,マルチ送信者インデックス符号化問題に対する新しいハイパーグラフモデルを提案した。
- このモデルを用いることで,線形符号とハイパーグラフ適合性の間に厳密な同値性が成立することが示された。
- 提案手法は既存の近似解法よりも計算効率が良い場合があり,様々な応用分野への展開が期待される。
大規模言語モデルの拒否解除手法の比較分析:クロスアーキテクチャ評価 [cs.CL, cs.SE]目的:大規模言語モデルにおける拒否解除手法の有効性比較
- 言語モデルの安全性確保は重要だが,同時に研究利用の阻害要因となる。
- 拒否解除手法の性能には差があるものの,客観的な比較評価が不足している。
- モデルアーキテクチャに応じた最適な拒否解除手法の選択基準を提示する。
- 単一パス方式のツールは,ベンチマークされたモデル群において能力維持に優れていた。
- ベイズ最適化による手法は,モデルに依存した能力変化と分布シフトを示した。
- 数学的推論能力は,拒否解除介入に対して最も敏感であることが示された。
SEDULity:分散型・安全なブロックチェーンのための学習証明フレームワーク - 効率的な有用な作業を伴う [cs.CR, cs.DC, cs.IT, cs.LG, math.IT]目的:分散型かつ安全なブロックチェーンにおける効率的な有用な作業のための学習証明フレームワーク
- 既存のブロックチェーンはPoWで安全性を確立。しかし,そのエネルギー消費が持続可能性への懸念を高めている。
- PoUWやPoLの研究が進むも,セキュリティ,分散化,効率性の問題が残されている。
- セキュリティと分散性を維持しつつ,効率的に機械学習モデルを学習するフレームワークを提案する。
- 提案フレームワークSEDULityは,ブロックテンプレートを学習プロセスに組み込み,PoWパズルに代わる有用関数を設計する。
- 理論的に,適切なシステムパラメータ下では,合理的なマイナーは正直に学習するインセンティブがあることを示す。
- シミュレーション結果から,フレームワークの性能が検証され,分析結果と整合性があることが確認された。
モデル発見とグラフシミュレーション:カオスエンジニアリングへの軽量な入り口 [cs.SE, cs.DC, cs.DM, cs.ET, cs.SY, eess.SY]目的:可用性推定のためのモデル発見とシミュレーション手法
- システム全体の信頼性確保は,ビジネス継続において不可欠である。
- カオスエンジニアリングはリスクを伴い,モデルベース分析はモデル作成の困難さが課題である。
- 既存のアーティファクトから自動的にモデルを生成し,迅速かつ安全な可用性評価を実現する。
- サービス依存グラフとレプリカ数のみから構成されるシンプルなモデルが,可用性推定に有効であることが示された。
- DeathStarBenchの実験において,抽出されたモデルは実際の障害注入結果と高い一致性を示した。
- この手法により,カオス実験の範囲縮小と,リアルタイムな信頼性監視が可能になる。
スペクトルグラフ理論における非対称性:バイ直交基底による有向ネットワークの調和解析(隣接作用素による定式化) [q-bio.QM, cs.HC, math.RA, cs.IT, math.IT]目的:有向ネットワークにおける調和解析の枠組み
- ネットワーク構造は社会システムや情報伝達など,様々な現実世界の問題をモデル化する上で不可欠である。
- 従来のグラフ理論は対称性を前提とするため,非対称な有向ネットワークの分析には限界があった。
- 非対称な有向ネットワークにおける安定性とフィルタリング性能の評価と改善を目指す。
- バイ直交グラフフーリエ変換(BGFT)を提案し,非エルミート系における有向ネットワークの周波数解析とフィルタリングを可能にした。
- BGFTの合成・解析恒等式を証明し,BGFTバンドリミット信号のサンプリング・再構成保証を確立した。
- 非対称性と非正規性の影響を条件数と非正規性からの逸脱関数を用いて定量化し,数値シミュレーションでBGFTの有効性を実証した。
ウェーブレットパケットに基づく高次統計量を用いた異常予測のためのノイズ特性 [quant-ph, cs.SY, eess.SY, eess.SP, cs.IT, math.IT]目的:離散時間信号におけるノイズ特性を用いた異常予測手法
- 信号処理において,ノイズは重要な情報源となり得る。異常検知への応用が期待されている。
- 従来の異常検知は信号自体に焦点を当てており,ノイズの特性を十分に活用できていない。
- 本研究は,ノイズ特性を分析することで,より高精度な異常予測を実現することを目指す。
- ウェーブレットパケット変換により,信号の構造と残差を分離し,ノイズ特性を抽出する。
- 高次統計量,特に3次キュムラントを用いて,残差の非ガウス性や非線形結合を定量化する。
- 解析的に較正されたMahalanobis検出器を用いて,非中心カイ二乗分布に従う決定則を導出する。
ミッドバンド超大規模MIMOの消費電力とエネルギー効率:モデル化,スケーリング則,性能に関する考察 [eess.SP, cs.IT, math.IT]目的:ミッドバンド超大規模MIMOシステムにおける消費電力とエネルギー効率の分析
- 次世代通信システムにおいて,より高いスループットを実現する上で,超大規模MIMOが不可欠な技術となっている。
- システム規模の拡大に伴い,消費電力の増加が大きな課題となっており,効率的なシステム設計が求められている。
- システム構成要素ごとの消費電力モデルを構築し,エネルギー効率のスケーリング則を導き出すことで,効率的なシステム設計に貢献する。
- 提案するモデルと解析により,ミッドバンド超大規模MIMOのエネルギー効率が,他の多アンテナ技術と比較して優れていることが示された。
- スループット分析とエネルギー効率評価の結果は,ミッドバンド超大規模MIMOシステムのエネルギー効率の可能性を明らかにした。
- 近傍場伝搬特性を考慮したスループットの近似式を導き,エネルギー効率評価のための分析的枠組みを提供した。
半位相的重心代数 [math.FA, cs.LO]目的:半位相的および位相的重心代数の研究
- 凸集合の抽象化であり,関数解析や最適化問題に応用される重要な代数構造である。
- 半位相的・位相的重心代数の性質は十分解明されておらず,その構造解析が求められている。
- Keimelの研究を一般化し,半位相的・位相的重心代数の構造を詳細に考察する。
- 本研究では,Keimelによる半位相的・位相的錐の研究を踏まえ,より一般的な重心代数について考察した。
- 半位相的および位相的重心代数の定義と性質を明確にし,錐との関連性を示した。
群平均マルコフ連鎖 II:有限状態空間における群作用の調整 [physics.soc-ph, cs.CY, math.PR, cs.IT, math.GR, math.IT, stat.CO]目的:群作用による状態空間の軌道核を用いた,$\pi$-定常遷移行列 $P$ を拡張した群平均マルコフ連鎖の解析
- マルコフ連鎖は,統計物理学,機械学習など幅広い分野で確率過程をモデル化する上で基礎となる理論である。
- 既存のマルコフ連鎖は,状態空間の構造や群作用を考慮した効率的なサンプリングが難しい場合がある。
- 群平均マルコフ連鎖における最適な群作用の選択方法を明らかにし,効率的なサンプリングを可能にすること。
- Metropolis-Hastings 核と Barker 核は,適切な条件下で Gibbs 核へ収束することが示された。
- 軌道平均化は,遷移行列 $P$ が可逆的である場合,絶対スペクトルギャップや漸近分散を悪化させないことが証明された。
- キュリー・ワイス模型において,群平均化はグロボー力学と比較して,大幅な混合時間の短縮を実現することが示された。
線形ランク距離符号の非ゼロ重みの最大数 [math.CO, cs.IT, math.IT]目的:線形ランク距離符号における非ゼロランク重みの最大数
- 符号理論は,情報伝送やデータ圧縮における誤り訂正に不可欠であり,通信システムの信頼性を向上させる。
- ランク距離符号のパラメータ決定は困難であり,特に最大非ゼロ重みの数の評価は未解決の問題が多い。
- 本研究は,線形ランク距離符号のパラメータ範囲における非ゼロランク重みの最大数を厳密に決定することを目的とする。
- 関数 \( L_{\mathrm{rk}}(n, m, k, q) \) の値を許容される全てのパラメータ \( n, m, k, q \) に対して決定した。
- コードが完全な重みスペクトル(FWS)を持つための必要十分条件を明らかにし,FWSコードの具体的な構成法を示した。
- 2次元コードの分類結果と,これらの最適コードの双対性に関する性質についても考察した。
F4+vF4 上の可逆および逆補完二重巡回符号とDNA符号への応用 [math.RA, cs.IT, math.IT]目的:F4+vF4 上の二重巡回符号の代数的構造
- 符号理論は,通信や情報セキュリティにおいて重要な役割を担う分野である。
- 既存の符号では,DNAなどの生物学的データへの適用が困難な場合がある。
- DNA符号への応用を可能にする新たな二重巡回符号の構造を解明すること。
- F4 上の二重巡回符号が可逆であるための必要十分条件が特定された。
- F4+vF4 上の二重巡回符号において,可逆制約と逆補完制約を満たす代数的構造が決定された。
- 16種類のDNA二重対とF4+vF4 の16要素の間に,一対一対応関係ψが存在することが示された。
量子チャネルのトモグラフィと局所的テストによる推定 [quant-ph, cs.ET, quant-ph, cs.IT, math.IT]目的:未知の量子チャネルの推定
- 量子情報処理において,量子チャネルの正確な特性評価は不可欠である。
- 量子チャネルのトモグラフィは,計算資源を多く必要とする。
- 効率的な量子チャネル推定手法を開発すること。
- 量子チャネルのダイヤモンドノルム誤差ε以内でトモグラフィを行うには,O(rd_1d_2/ε^2)個のクエリで十分である。
- rd_2=d_1の場合,ユニタリチャネルでなくても,O(1/ε)のハイゼンベルクのスケーリングが達成可能である。
- 状態|0⟩⟨0|のトモグラフィには,O(d_1^{1.5}/ε)個のクエリで十分である。
密度推定における最適近似係数 [cs.LG, cs.CC, cs.IT, math.IT, math.PR, stat.ML]目的:密度推定における近似の最適性
- 統計的推論や機械学習において,確率分布の近似は重要な課題である。
- 未知の分布に対する近似分布の選択は,一般に困難を伴う。
- 近似係数の理論的限界を明らかにし,最適な近似手法を開発すること。
- ヤトラコスによる先行研究では,近似係数3が達成可能であることが示されている。
- 本研究では,近似候補集合からの出力に限定する場合,係数3が最適であることを証明した。
- 任意の密度を出力可能とする場合,係数を2に改善でき,これが最適であるを示した。
ソフトウェアエンジニアリングコミュニケーションにおける感情認識の向上に向けたデータ拡張 [cs.CG, math.CO, cs.SE]目的:ソフトウェアエンジニアリングコミュニケーションにおける感情認識性能の改善
- ソフトウェア開発活動において,感情は生産性を示す重要な指標であり,その分析が重要視されている。
- 汎用的な感情分析ツールをソフトウェアエンジニアリング分野に適用すると精度が低下する課題がある。
- データ拡張によって学習データを自動生成し,アノテーションコストを削減することで,感情認識の精度向上を目指す。
- 提案手法によるデータ拡張は,既存の感情分析ツール(ESEM-E, EMTk, SEntiMoji)の平均micro F1-Scoreを9.3%向上させた。
- データ拡張戦略は,ソフトウェアエンジニアリング特有の感情認識ツールのエラー分析に基づいて最適化された。
- 異なるコミュニケーションチャネル間での性能劣化を抑制するために,チャネル固有のデータ拡張を施すことが有効である。
わずかに非線形な高階木変換器 [cs.ET, cs.SY, eess.SP, eess.SY, physics.optics, cs.FL, cs.LO]目的:高階木変換器の計算能力
- 木構造の変換は,プログラム言語の解析やデータ構造の処理など,様々な分野で重要である。
- 従来の木変換器では,複雑な木構造の変換や大規模なデータに対する処理が困難な場合がある。
- アフィンλ-項を用いた木変換器の表現力を明らかにし,変換能力の限界を探る。
- アフィンλ-変換器は,木ウォーク変換器に変換可能であり,メモリが完全にアフィンであれば可逆的な木ウォーク変換器となる。
- これにより,アフィンλ-calculusにおけるNguy\^enとPradicの「暗黙のオートマトン」に関する非表現力予想が証明された。
- MSOリラベル前処理と限定的な非線形性を加えた変種は,invisible pebble tree transducersと同等の表現力を持つことが示された。
プレーンコードにおけるJavaオブジェクトのシリアライズ [cs.SE]目的:Javaオブジェクトのプレーンコードによるシリアライズ手法
- ソフトウェア開発において,オブジェクトの状態保存は不可欠であり,テストや設定など多様な場面で利用される。
- 従来のシリアライズ形式は,可読性の低さや構文の複雑さから,ソースコードへの埋め込みが困難であった。
- 実行時におけるオブジェクトを,プログラミング言語のネイティブな構文でシリアライズすることで,可読性と埋め込みの容易性を実現する。
- 提案手法ProDJは,JavaオブジェクトをJavaソースコードとしてシリアライズすることで,オブジェクトの完全な再現を可能にした。
- ProDJを用いて,4つのオープンソースJavaアプリケーションから観察された174,699個のオブジェクトをプレーンコードシリアライズすることに成功した。
- 性能測定の結果,提案手法によるパフォーマンスへの影響は無視できる程度であることが示された。また,ユーザー調査により,自動生成されたテストにおけるプレーンコードシリアライズ形式がXMLやJSONよりも好ましいことが確認された。
純粋サブタイプシステムの型安全性に向けて (完全版) [cs.LO]目的:純粋サブタイプシステムの型安全性証明
- 依存型や高階サブタイピングを支える基盤として,型システムの研究は重要である。
- 純粋サブタイプシステムでは,型安全性の証明が長年未解決問題となっていた。
- 新たな定式化により,型安全性の証明に必要な関係式の可換性を証明する。
- 本研究では,継続スタック機構を導入した機械ベースの純粋サブタイプシステム(MPSS)を提案した。
- MPSSにおける等価性とサブタイピングの簡約が可換であることを直接証明した。
- この結果により,型安全性の証明に必要な推移律の除去が確立され,型安全な言語実現への道が開かれる。
計算と並行性 [cs.LO]目的:計算と並行性の関係の明確化
- 計算機科学の基礎であり,現代の並列処理システムの設計に不可欠である。
- 従来の計算モデルでは,並行性の表現と検証が困難であった。
- pomsetcオートマトンに基づき,並行性の代数構造を確立すること。
- pomsetcオートマトンに通信と演算子を導入した。
- 言語同値性および真の並行ビスミリティによる代数を確立した。
群の直積の代数における符号 [cs.IT, math.IT, math.QA, math.RA]目的:有限群の直積に関連付けられた半単純群代数のウェダーバーン・アルティン分解
- 符号理論は,情報伝送における誤り検出・訂正に不可欠であり,現代通信技術の根幹を支えている。
- 群代数における符号の構成や特性は十分に解明されておらず,効率的な符号の設計が課題となっている。
- 群代数内で構築可能な全ての群符号の数と次元を決定し,符号理論の発展に貢献する。
- 有限群の直積に関する群代数のウェダーバーン・アルティン分解を得ることに成功した。
- 群代数内で構成可能な全ての群符号の数と次元に関する公式を導出した。
- 特に,巡回群,二面体群,一般化クォータニオン群の直積の群代数を完全に記述した。
コードスメルの検出におけるパラメータ効率的なファインチューニングの包括的評価 [cs.SE]目的:コードスメル検出のためのパラメータ効率的なファインチューニング手法の性能評価
- ソフトウェア品質の維持は重要であり,コードスメルはその指標の一つである。
- 従来のコードスメル検出手法は,主観性や性能の限界といった課題を抱えている。
- 大規模言語モデルの導入コストを削減し,コードスメル検出の精度向上を目指す。
- パラメータ効率的なファインチューニング手法は,フルファインチューニングと同等以上の性能を示す。
- これらの手法は,GPUメモリ使用量を大幅に削減しながらコードスメルの検出に貢献する。
- ファインチューニングされた大規模言語モデルは,既存の検出手法を上回り,MCCを0.33%~13.69%向上させた。
MSOにおける順序数位取りに関する二分定理 [cs.RO, cs.IR, cs.LO]目的:全二分木上の単一モノadic二階論理における順序数位取りの最小上限
- 計算機科学において,論理学とデータ構造の関係を理解することは重要である
- MSO論理における位取りの評価は,しばしば複雑であり,効率的な決定が困難である
- MSO論理式における位取りの境界を決定し,その計算可能性を明らかにすること
- 論理式によって,位取りはω^2より小さくなるか,ω_1に達するかの二分性を示す
- どのケースに該当するかを決定できるアルゴリズムが存在する
- この結果は,固定点公式の閉包順序数に関する問題への応用可能性がある
グラフAPIにおけるアクセス制御の脆弱性を対象とした汚染解析 [cs.DM, math.CO, cs.CR, cs.LO, cs.SE]目的:グラフAPIのアクセス制御に関する脆弱性の検出
- APIの利用拡大に伴い,API経由の攻撃リスクが増加しており,セキュリティ確保が重要である。
- 既存の解析手法では,グラフAPI特有の複雑なデータフローを正確に追跡することが困難である。
- グラフAPIにおける汚染解析を通じて,アクセス制御の脆弱性を効率的に検出することを目指す。
- 本研究では,静的解析と動的解析を組み合わせた体系的な汚染解析手法を提案した。
- 提案手法は,GitHub GraphQL APIへの適用により,アクセス権限の不備による脆弱性を網羅的に検出できることを示した。
- 静的解析で検出されたリスクを動的解析で検証することで,誤検知を低減し,より信頼性の高い結果が得られる。
ブルームフィルタのパラメータ制約緩和による適用範囲の拡大 [cs.DS]目的:ブルームフィルタのパラメータ最適化
- 大規模データ管理において,効率的なデータ構造の重要性が高まっている。
- 従来のブルームフィルタでは,ハッシュ関数数やフィルタ長の制約が存在する。
- ハッシュ関数数の整数制約とフィルタ長の2の累乗制約を緩和し,最適化を図る。
- Rational Bloomフィルタは,非整数個のハッシュ関数を許容することで,より最適化されたフィルタを実現する。
- Variably-Sized Block BFは,柔軟なフィルタ長を可能にし,特に大規模フィルタにおいて効率的な計算を実現する。
- 提案手法により,ブルームフィルタの適用範囲が拡大し,より効率的なデータ管理が可能となる。
非シグナル化アシスタンスは無線ネットワークの自由度を向上させ得るか [cs.IT, math.IT]目的:無線ネットワークにおける非シグナル化アシスタンスによる自由度の向上
- 無線通信の容量拡大は,高度な通信サービス提供において不可欠であり,その限界突破が求められている。
- ブロードキャストチャネルの容量には限界があり,特に複数の受信機への同時送信においてボトルネックとなる。
- 非シグナル化アシスタンスを用いることで,この容量限界を打破し,通信効率を向上させることを目指す。
- Coordinated Multipoint (CoMP) ブロードキャストチャネルにおいて,非シグナル化アシスタンスが容量と自由度に多倍数の改善をもたらすことが示された。
- 特定の条件下では,K倍の自由度向上が達成され,2受信機ブロードキャストチャネルにおいても効果が確認された。
- 接続性行列の三角形数と最小ランクによって,非シグナル化アシスタンスを用いた合計容量の上下限が決定された。
オンラインランダム化された双対法における最適性能の上界決定 [cs.DS]目的:オンラインランダム化された双対法の最適性能の上界
- オンラインアルゴリズム設計と解析において重要な手法であるため。
- 最適な更新関数を探索するための関数空間の選択が難しい。
- 関数空間の選択におけるトレードオフを克服し,性能上界を精密化する。
- 補助LPベースのフレームワークにより,様々な関数空間における最適競争率を近似的に評価できる。
- 確率的バランスが少なくとも0.5796の競争率を達成することが示され,Huang and Zhangの先行研究を改善した。
- Huang and Zhangよりも広い関数空間に対して,0.5810という競争率の上界を導出した。
バグ報告に基づく入力生成のための大規模言語モデルの調査 [cs.SE]目的:バグ報告からの故障誘発入力の抽出性能評価
- ソフトウェアの品質保証において,故障誘発入力はバグの特定と修正に不可欠である。
- バグ報告は自然言語で記述されるため,入力の自動抽出は困難を伴う。
- 大規模言語モデルを用いて,バグ報告からの入力抽出の自動化と精度向上を目指す。
- LLaMA,Qwen,Qwen-Coderの3つのオープンソースLLMを用いてバグ報告からの入力抽出性能を実験的に評価した。
- 206件のバグ報告データセットを用いて,モデルの精度と有効性を検証した。
- 本研究は,LLMを用いた自動バグ診断の可能性と限界に関する洞察を提供する。
キミナLeanサーバー:技術報告 [cs.LO]目的:強化学習パイプラインの高効率な検証
- 近年,ニューラル定理証明の研究が盛んであり,大規模な検証が求められている。
- 従来のLean相互作用ツールでは,検証速度がボトルネックとなり,大規模な検証が困難であった。
- 本研究は,大規模な検証とデータ抽出を効率的に行うための基盤を提供する。
- キミナLeanサーバーは,従来のLean相互作用ツールと比較して,検証時間を1.5~2倍高速化した。
- サーバー側の並列処理とLRUキャッシュ機構により,効率的な検証を実現した。
- この効率性により,最先端モデルKimina-Proverの大規模な学習が可能となった。
オブリビウス・リレーにおけるエラー指数とヘルパーを用いたソース符号化との関連性 [cs.CY, cs.IT, math.IT]目的:オブリビウス・リレーにおけるエラー指数とその限界の解明
- 通信システムの信頼性評価において,エラー指数は重要な指標となる。
- オブリビウス・リレーは,リレーが符号化情報を知らないため,効率的な通信が困難。
- リレーの圧縮・転送戦略を最適化し,エラー指数を向上させることを目指す。
- 定数組成符号を用いたオブリビウス・リレーのエラー指数について,達成可能な上限を導出した。
- 情報ボトルネックチャネルとヘルパーを用いたソース符号化(WAK問題)の間に密接な関係があることを示した。
- WAK問題に対する既知の最良達成可能なエラー指数を,本研究のアプローチを用いて再現した。
属性付きパッチ意味グラフを用いたパラメータ効率的なファインチューニングによる自動パッチ正当性評価 [cs.SE]目的:自動パッチ正当性評価の精度向上
- プログラム自動修復は,人的介入なしにプログラムのエラーを修正することを目指しており,その重要性が高まっている。
- 既存の自動パッチ修復技術は,パッチの過学習の問題を抱えており,テストをパスしても真に正しいとは限らない。
- 本研究は,コードの形式的構造を考慮し,パッチの属性を明示的に捉えることで,この過学習問題を解決することを目指す。
- 提案手法では,属性付きパッチ意味グラフ(APSG)を設計し,パッチの意味と重要な属性を捉える。
- APSGのグラフ情報を有効活用するために,LLMのパラメータ効率的なファインチューニング手法であるGraph-LoRAを提案する。
- 実験結果から,提案手法は最先端手法と比較して,精度とF1スコアをそれぞれ3.1%~7.5%,3.0%~7.1%改善する。
階層的なマッピングのコード生成のためのレイアウト表現言語LEGO [cs.PL, cs.DC, cs.PF]目的:GPU向け並列コードとデータ移動のための複雑なインデックス表現の導出
- GPUの性能を最大限に引き出すためには,データ配置と計算の最適化が不可欠である。
- データ配置の探索は,他の最適化と組み合わせることが難しく,効率的な手法が求められている。
- データ配置とインデックス表現の生成を自動化し,最適化プロセスを効率化することを試みる。
- LEGOは,Tritonと同等の性能を達成できることが示された。
- LEGOはCUDAおよびMLIRとの統合により,データとスレッドのレイアウトマッピング最適化への広範な適用性を示す。
- 既存のコンパイラやコードテンプレートに容易に組み込むことが可能である。
