arXiv雑要約
プログラム - 2026/05/19 公開
ソフトウェア工学教育における大規模言語モデル統合の動機付け・阻害要因予測モデル:実証研究 [cs.MA, cs.CL, cs.SE]目的:大規模言語モデルのソフトウェア工学教育への統合戦略のコスト効率を予測するためのモデル
- ソフトウェア工学教育において,大規模言語モデルの活用が急速に拡大しており,教育の質向上に貢献する可能性を秘めている。
- 大規模言語モデルの教育への統合は,コストや倫理的な問題,学習効果への懸念など,多くの課題を抱えている。
- 本研究は,ステークホルダーの認識とコスト分析に基づき,費用対効果の高い統合戦略を提案することを目指す。
- 回答者は,プログラミング支援,デバッグ支援,個別化学習において強いメリットを認識した。
- 一方,剽窃や知的財産権,AIへの過度な依存,批判的思考力の低下などが主な懸念事項として挙げられた。
- 最適化の結果,コスト制約下では,倫理的保護やガバナンス体制の確立が優先されるべきであることが示唆された。
RubricRefine:事前実行でのリファインメントにより,ツール使用エージェントの信頼性を向上 [cs.LG, cs.SE]目的:ツール使用エージェントの信頼性向上
- 大規模言語モデルによるツール使用は,複雑なタスク解決の可能性を広げる。
- 現在のツール使用エージェントは,ツール間の契約違反といった問題に弱く,実行時フィードバックだけでは不十分。
- 事前実行での意味的契約検証により,実行前にエラーを検出し,修正することで信頼性を高める。
- RubricRefineは,7つのモデルでM3ToolEvalにおいて0.86のスコアを達成し,既存の推論時ベースラインを大幅に上回った。
- RubricRefineは,実行を必要とせず,最大2.6倍低いレイテンシを実現した。
- 単一ステップのAPI-Bankでは性能が横ばいであり,ツール間契約構造への依存性を示唆している。
有界属グラフに対する準線形時間汎用シンコーンアルゴリズム [cs.DS, stat.ME]目的:有界属グラフにおける近似汎用シンコーンアルゴリズムの計算手法
- グラフ理論は,ネットワーク分析や幾何学的モデリングなど,様々な分野で不可欠な役割を担っている。
- 汎用シンコーンアルゴリズムは計算コストが高く,大規模グラフへの適用が困難であるという課題がある。
- 属が限定されたグラフに対する効率的なシンコーンアルゴリズムを開発し,計算時間を大幅に短縮することを目指す。
- GenusSinkは,グラフの分解,計算幾何,高速行列ベクトル積などの技術を用いて,計算複雑度を削減する。
- 実験結果から,GenusSinkは既存の効率的なシンコーンアルゴリズムと比較して,大幅に高精度な計算が可能であることが示された。
- GenusSinkは,特定の条件下ではブルートフォース幾何シンコーンアルゴリズムと数値的に同等であることが示された。
エージェントAIエコシステムにおけるツールクローニングの評価 [cs.SE, cs.CR]目的:エージェントAIエコシステムにおけるツールクローニングの現状把握
- LLMエージェントの能力向上には,外部ツールとの連携が不可欠であり,ツールの多様性が重要である。
- 公開マーケットプレイスにおけるツールの増加は,クローンや派生形によって実質的な多様性を過大評価する可能性がある。
- ツールのクローニングが普及している現状を明らかにし,データセットやベンチマークへの影響を評価する。
- 大規模なツールリポジトリを分析した結果,ツールクローニングがエージェントAIエコシステムにおいて広範かつ深刻な問題であることが判明した。
- MCPエコシステムにおいて,Jaccard係数とssdeepに基づく類似度が高いリポジトリペアの多くが,手動検証の結果クローンとして確認された。
- ツール多様性の測定や評価分割の構築においては,リポジトリの出自や実装の類似性を考慮する必要があることが示唆された。
VISOR:ロボットテストのためのVision-Languageモデルベースのテストオラクル [cs.SE, cs.RO]目的:ロボットのテストオラクル自動評価手法
- ロボットの性能向上には,正確で信頼性の高いテストが不可欠である。
- 従来のテスト方法は,時間とコストがかかり,主観的になりやすい。
- 人間による評価に頼らず,自動でロボットのテストを可能にすること。
- VISORは,GPTとGeminiの二つのVLMを用いて評価を行った結果,Geminiはリコールが高く,GPTは精度が高いことが示された。
- 両モデルとも,不確実性と正解との間には低い相関関係が見られ,不確実性を正解予測に使用することは困難である。
- 既存のシンボリックテストオラクルが抱える課題,タスク特化性と品質評価の定量化の欠如を克服する。
DNAストレージとファウンテンコードにおけるランダムアクセス期待値 [cs.IT, math.IT]目的:DNAデータストレージにおけるランダムアクセス期待値の解析
- DNAストレージは,大容量かつ長期保存可能な次世代のデータ保存技術として注目されている。
- 効率的なデータ検索のためには,ランダムアクセス性能の向上が課題となっている。
- 符号化方式の最適化により,ランダムアクセス期待値を最小化することを目指す。
- 完全対称符号とLT符号の等価性が示され,完全対称符号のランダムアクセス期待値解析に貢献した。
- 大規模ブロック長における二値完全対称符号のランダムアクセス期待値の下限がπ/4であることが示された。
- 理論的な下限値に接近する,約0.7869の達成可能な値も示された。
ocLTL:ω-カテゴリ構造におけるLTL実現可能性と合成 [cs.LO]目的:ω-カテゴリ理論におけるLTL+Pの実現可能性と合成
- 形式的検証は,システムの正当性確認に不可欠であり,安全性や信頼性の高いシステム開発に貢献する。
- 既存手法では,無限構造や抽象的なデータ型への適用が難しく,表現力に限界がある。
- ω-カテゴリ構造におけるLTL+Pの実現可能性と合成問題の解決を目指し,応用範囲の拡大を図る。
- ocLTLにおける実現可能性と合成問題を,命題LTL+Pの対応する問題に帰着させる手法を提案した。
- データ部分式を完全型に基づく有限個の選言で置き換えることで,還元を実現している。
- 計算量は2-EXPTIMEのままであり,付加的なコストは理論にのみ依存し,式には依存しない。
LFPL:再検討と機械化 [cs.PL, cs.CC, cs.LO]目的:多項式時間計算可能な関数を特性づけるための関数型言語LFPLに関する研究
- 関数型プログラミングの型システムは,プログラムの正当性保証や効率的な実行に不可欠である。
- LFPLは影響力があるものの,自立した説明や完全な機械化が存在しなかった。
- LFPLとその理論を現代的に再構築し,機械化することで,型システムの理解を深める。
- 本研究では,LFPLとその理論の現代的な記述と機械化を行った。
- 健全性証明では,LFPL+という拡張言語を用いて,式のコストを制限する多項式を構築した。
- 完全性証明では,LFPLプログラムが多項式時間チューリング機械をシミュレート可能であることを示した。
ドキュメント駆動によるCからRustへのコードベース移行 [cs.SE]目的:CからRustへのリポジトリレベルの移行
- レガシーコードの安全性を高める必要性から,CからRustへの移行が重要視されている。
- 既存の翻訳ツールはファイルや関数レベルに留まり,アーキテクチャ全体の意図を捉えきれない。
- ドキュメントを活用し,リポジトリ全体の構造を考慮した移行を可能にすることを目指す。
- RustPrintは,オープンウェイト(Kimi-K2-Instruct)とクローズドウェイト(GPT-5.4)のバックボーンの両方で,全てのターゲットリポジトリのコンパイルに成功した。
- Kimi-K2-Instructバックボーンを用いた場合,RustPrintは機能保存率(93.26%)とクロス評価テスト合格率(95.17%)において,他のエージェントベースライン(Claude Code)を上回った。
- ドキュメント駆動による連携が,大規模なコードベース移行において有効なアプローチであることを示唆する。
安定化と変換器を用いた文字列ソルビング (技術報告) [cs.FL, cs.LO]目的:文字列制約ソルビングにおける効率的な手法
- ソフトウェア検証やプログラム解析において,文字列制約は重要な役割を果たす。
- 従来の自動機に基づく文字列ソルビングは,連結除去処理がボトルネックになりやすい。
- 変換器を用いた関係制約を効率的に処理し,文字列ソルビングの性能向上を目指す。
- 安定化に基づく手法を変換器に対応させ,文字列制約ソルビングの範囲を拡張した。
- 連結除去の回数を減らすことで,自動機に基づく文字列ソルビングの効率を向上させた。
- 実装した手法は,既存のソルバーと比較して,関係制約を含むベンチマークで大幅な性能向上を示した。
構成的ハイアシェーフモデル:合成数学への応用 [cs.LO, math.LO]目的:合成数学のためのハイアシェーフモデルの構築
- 数学基礎論において,型理論は形式的な数学的構造の基盤として重要である。
- 従来の型理論では,数学的な概念の自然な表現に限界があった。
- 型理論にハイアシェーフモデルを導入し,合成数学における問題解決を目指す。
- 本研究では,構成的なメタ理論に基づき,型理論のハイアシェーフモデルの基礎を確立した。
- シムplicialホモトピー型理論,合成代数幾何,合成ストーン双対性といった形式体系の構成的なモデルを構築した。
T回避球面符号と設計の普遍的最適性 [math.CO, cs.IT, math.IT, math.MG]目的:T回避球面符号および設計の普遍的最適性
- 符号理論は,情報伝送や誤り訂正において重要な役割を果たす。最適な符号の構成は長年の課題である。
- 特定の条件下での符号の最適化は困難であり,既存の符号が常に最適な性能を発揮するとは限らない。
- 特定の集合Tを回避する符号の普遍的最適性について考察し,新たな最適符号の存在を示す。
- リーチ格子やバーンズ=ウォール格子から得られる符号が,T回避符号のクラスにおいて普遍的に最適であることが示された。
- デルサルテ,ゴータールズ,サイデルの結果を拡張し,特定の3つの内積を持つ符号に関する考察を深めた。
- これらの符号は,固定された次元と強さを持つ最小のT回避球面設計であることも示された。
両方向エンタングルメントを用いたボソンチャネルにおける同時通信とセンシング [quant-ph, cs.IT, math.IT]目的:同時通信とセンシングのトレードオフ
- 量子ネットワークの実現に向け,通信とセンシングの同時最適化が不可欠である。
- 通信とセンシングはリソース配分においてトレードオフの関係にあり,その最適化が課題である。
- エンタングルメントを活用することで,通信とセンシングの性能向上を目指す。
- 提案手法は,時間分割法を上回り,量子的な優位性を示す達成可能なレート/エラー指数領域を特徴付ける。
- エンタングルメントを通信とセンシングに適切に配分することで,両方の性能を向上させることが可能である。
- バック散乱信号のタイミングがターゲットの位置に依存することをモデル化し,センシング性能を考慮した通信設計を行う。
二次APN関数のウォルシュスペクトルについて [math.CO, cs.IT, math.IT]目的:二次APN関数のウォルシュスペクトルに関する強い条件
- APN関数は,差分攻撃への耐性において最適であり,多くのブロック暗号の構成要素として重要。
- APN関数の線形性はウォルシュスペクトルと密接に関連するが,その解析は困難を伴う。
- 二次APN関数のウォルシュスペクトルを制限する新たな関係性を確立し,その性質を解明する。
- 二次APN関数のウォルシュ変換は,$\mathbb{F}_2^n$ のベクトル空間分割と射影空間 $PG(n-1,2)$ のブロッキングセットと一意に関連する。
- 二次APN関数 $F$ は,振幅が $2^{3n/4}$ より大きい成分関数を最大で一つしか持たないことが示された。
- 二次APN関数のベント成分関数の個数に関する初めての非自明な上限が得られ,その個数に基づくCCZ同値性の条件が提示された。
生成拡散におけるFöllmerプロセスの変分最適性 [math.ST, cs.IT, cs.LG, math.IT, math.PR, stat.ML, stat.TH]目的:有限時間ホライズンにおける点質量から所定のターゲット分布への輸送
- 生成モデルは,複雑なデータ分布を学習し,新たなサンプルを生成する上で重要な役割を担う。
- 拡散モデルの性能は,推定誤差の影響を受けやすく,その軽減が課題である。
- 推定誤差が経路空間のカルバック・ライブラー情報量に与える影響を最小化する拡散係数を求める。
- Föllmerプロセスは,経路測度が参照プロセスに対する相対エントロピーを最小化する拡散として,閉形式で導出される。
- 最適な拡散係数を用いることで,経路空間のカルバック・ライブラー情報量が補間スケジュールに依存しなくなる。
- 確率的予測やデータ同化といった応用において,Föllmerプロセスの経路空間における変分最適性の影響が示された。
代数的多様性:信号処理への群論的アプローチの原理 [eess.SP, cs.IT, math.IT]目的:信号の対称性を活用し,観測当たりの情報量を増やす代数的多様性(AD)の原理
- 信号処理は,通信,画像処理,音声認識など,現代技術の根幹をなす重要な分野である。
- 従来の信号処理手法は,時間的・空間的多様性に依存しており,信号の対称性を十分に活用できていない。
- 信号の対称性に着目した群論的アプローチにより,より効率的な信号処理を実現することを目指す。
- 代数的多様性(AD)は,信号の統計が不変である変換群を利用し,群作用による平均化で分散を低減する。
- ADは,標本数と群軌道の平均化を組み合わせる$(G, L)$連続体により,スカラーデータストリームにも適用可能である。
- ADは,信号の構造的容量$\kappa$を定義し,信号の情報がどのように組織化されているかを定量化する。
ランダムアクセス符号:明示的構成,最適性,古典・量子間のギャップ [quant-ph, cs.IT, math.IT]目的:古典的および量子ランダムアクセス符号の最適性に関する幾何学的特徴付け
- 情報伝送において,効率的かつ信頼性の高い情報符号は不可欠である。
- ランダムアクセス符号の設計において,符号長と復号成功確率の最適化は課題である。
- 古典符号と量子符号の性能差を明らかにし,量子計算の優位性を示す。
- 古典的ランダムアクセス符号の最適性を,平均および最悪の場合の両方で幾何学的に特徴付けた。
- (2^k-1,k)のパラメータ族において,量子符号が古典符号を上回る性能を示す古典・量子分離を証明した。
- (L,L-1)のパラメータ族においては,平均基準下で最適解となる古典符号の構成を特定した。
信号変換理論の統一 [eess.SP, cs.IT, math.IT]目的:様々な信号変換の理論的統一
- 信号処理は現代の情報技術の基盤であり,その効率化は重要である。
- 既存の信号変換は個別最適化されており,統一的な理論がない。
- 共分散不変性に基づく表現論的原理を用いて,信号変換を統一的に記述する。
- 離散フーリエ変換,コサイン変換,ウォルシュ・アダマール変換など,多様な変換が有限群またはコンパクト群の固有基底として表現できる。
- 代数的多様性(AD)フレームワークにより,共分散に対応する群が信号処理の基礎となることが示された。
- 実データに基づくカルーネン・レーベ変換は,特定の群の極限として導出され,効率的な信号変換の設計を可能にする。
