arXiv雑要約
プログラム - 2026/06/18 公開
雰囲気コーディングが宿題を食べてしまった:新規ソフトウェアエンジニアリングとプログラミングにおけるAIアプローチの評価 [cs.SE, cs.AI]目的:新規ソフトウェアエンジニアリングにおける雰囲気コーディングの実現可能性の評価
- プログラミングの抽象化レベル向上は,より直感的でアクセシブルな開発を可能にするため重要である。
- 従来のプログラミングには,専門的な知識と構文の理解が必要であり,学習コストが高い。
- 自然言語による指示だけでソフトウェアを生成する「雰囲気コーディング」の可能性を探求し,その限界を明らかにする。
- 大規模言語モデル(LLM)を用いて,Pythonにおけるシンプルな新規プログラミングタスクの実行能力を評価した。
- 評価スイートを開発することで,LLMのプログラミング能力を限定的な範囲で詳細に分析することができた。
- 雰囲気コーディングは,人間のコード構文の知識を不要にし,母国語でのプログラミングを可能にする可能性を示す。
ASTRA:自律型シミュレーションパイロットを備えた,次世代の航空管制官訓練シミュレーター [cs.LG, cs.AI, cs.HC, cs.SE]目的:航空管制官の訓練能力向上
- 航空交通の安全確保には,熟練した航空管制官が不可欠であり,継続的な訓練が重要である。
- 従来の訓練は熟練したシミュレーションパイロットに依存しており,その育成がボトルネックとなっている。
- シンガポールにおける航空管制訓練に特化した,自律的なシミュレーションパイロットの開発。
- ASTRAは,航空管制官の音声認識,指示の解釈,適切な応答の生成を自動化するパイプラインを導入した。
- ファインチューニングされた音声認識パイプラインにより,語彙誤り率を大幅に削減し,既存の手法を凌駕した。
- また,AIによる評価フレームワークを組み込み,訓練生の通信スキル(正確性,簡潔性,完全性)を評価する。
傾多項式を用いた除算代数と最大ランク距離符号の構成に関する枠組み [cs.IT, math.IT]目的:除算代数および線形最大ランク距離符号の構成
- 符号理論や代数構造の研究は,情報セキュリティや通信技術の発展に不可欠である。
- 既存の符号構成法では,パラメータの選択肢が限られており,性能向上の余地がある。
- 傾多項式を用いることで,より多様な符号の構成を可能にし,性能向上を目指す。
- 傾多項式を用いることで,Jha-Johnson半体やAlbertの一般化されたツイスト体に関連する半体を一般化した非ユニタルな除算代数を構成できる。
- 本研究で得られた線形MRD符号は,Lobillo,Santonastaso,Sheekeyの構成を一般化するものである。
- 除算代数が除算代数となるための条件や,符号が最大ランクを持つための条件を提示し,最近の研究と古典的な研究における同位体的な除算代数を比較した。
Mozillaにおけるパフォーマンス異常検知のための統計的変化点検出手法の探求 [cs.RO, cs.SE]目的:パフォーマンス異常の検知における変化点検出手法の評価
- ソフトウェアのパフォーマンス劣化はビジネスに影響するため,自動検知はCIパイプラインの重要な要素である。
- 既存の検知システムでは,誤検知が多く,見逃されるパフォーマンス劣化も存在する。
- 変化点検出手法を評価し,誤検知率と見逃し率の改善を目指す。
- 25種類の変化点検出手法と15種類のアンサンブル手法を評価した結果,既存手法よりもリコールは改善された。
- ただし,精度とのトレードオフが存在し,アンサンブル投票戦略がそのバランスを改善し,F1スコアが11%向上した。
- 実験結果を実務者調査で検証し,Mozillaのパフォーマンスエンジニアリングシステムへの統合から得られた教訓を報告した。
深層学習パイプラインにおけるコンパイラ・プラットフォーム相互作用バグの検出:クロスレイヤー制約によるアプローチ [cs.SE]目的:深層学習コンパイラのバグ検出と動作同値性パーティショニング
- AIの普及に伴い,TVMやONNX-MLIRなどの深層学習コンパイラの信頼性が不可欠となっている。
- 既存のテスト手法は型制約に依存しており,コンパイラとプラットフォーム間の相互作用によるバグを見落としがちである。
- コンパイラとハードウェアプラットフォーム間の相互作用から生じる問題を特定し,より網羅的なテストを実現することを目指す。
- XCheckというツールを用いて,3つの主要な深層学習コンパイラ上で2,034件のバグを検出した。
- 検出されたバグには,メモリオーバーフロー,整数オーバーフロー,予期せぬコンパイルなどが含まれ,コンパイラ・プラットフォーム間の相互作用に起因するものだった。
- 本研究では,コンパイルパス全体とハードウェアプラットフォームにまたがる制約を導き出し,相互作用に敏感な動作を露呈するモデルを生成することで,バグ検出を可能にした。
YouTubeのソフトウェア工学教育動画におけるジェンダー表象の批判的談話分析 [cs.SE]目的:ソフトウェア工学教育動画におけるジェンダー表象
- ソフトウェア工学分野におけるジェンダーギャップの解消は重要課題である。
- オンライン学習空間におけるジェンダーに関する隠れたカリキュラムが不明確である。
- YouTubeの教育動画におけるジェンダー表象が及ぼす影響を明らかにすること。
- 動画の登場人物や言語表現において,男性および男性的なデフォルトが優勢であることが示された。
- 技術的・意思決定の役割はほぼ男性に割り当てられ,女性は存在しないか,受動的な役割に限られる傾向が確認された。
- YouTubeのソフトウェア工学教育がジェンダー規範を再生産し,潜在的な障壁となっている可能性が示唆された。
仕様から実行へ:AI支援科学ワークフロー管理 [cs.SE, cs.AI, cs.DC]目的:科学ワークフローの管理におけるAI支援手法
- 科学研究の再現性と規模拡大には,ワークフロー管理が不可欠である。
- ワークフローの設計,実装,デバッグは専門知識を要し,負担が大きい。
- AIを活用し,ワークフロー設計の自動化とデバッグの効率化を目指す。
- 本研究では,意図,設計,実装を分離する構造化された仕様段階を導入した。
- LLMベースのデバッグエージェントが,システム全体の障害を診断・解決する。
- Pegasus WMSとMCP層を統合し,大規模なワークフローの実行と監視を実現した。
限定された放射振幅を持つホログラフィック統合センシングおよび通信:必要な量子化ビット数はいくつなのか [cs.IT, math.IT]目的:ホログラフィック統合センシングおよび通信(ISAC)システムにおける量子化ビット数の決定
- 大規模アレイの実現に不可欠であり,通信とセンシングの性能向上に貢献する技術である。
- 既存研究では,放射振幅の連続的な制御を前提としているが,実装上の制約がある。
- 有限な放射振幅がISACシステム性能に与える影響を明らかにし,必要な量子化ビット数を決定する。
- 提案手法により,通信レートとセンシングSINRの下限を導出し,最小放射振幅の量子化ビット数の上限を確立した。
- 通信とセンシングの性能トレードオフが量子化ビット数に与える影響について検討を行った。
- 数値結果は,理論的解析の妥当性を検証している。
L5の設計:クリエイティブ・コーディングへのパーマコンピューティングアプローチ [cs.SE, cs.CY, cs.HC]目的:クリエイティブ・コーディングにおけるパーマコンピューティングの適用
- 創造性を刺激し,技術的な障壁を下げることで,幅広い層へのアクセスを可能にする。
- 既存のライブラリは,持続可能性への配慮が十分ではない場合がある。
- 持続可能性とユーザビリティのバランスを取りながら,リソース効率の良いツールを開発する。
- L5は,LuaとLOVEフレームワークを用いて実装され,パーマコンピューティングの原則を取り入れている。
- シンプルさと内部構造の可視化,リソース消費の抑制,長期的な安定性の確保などの課題に取り組んだ。
- 持続可能なクリエイティブツールは,単一の指標ではなく,複数の価値観を透明性を持ってナビゲートする必要がある。
分離情報の実装:凸集合間の分離構造のレート歪み再構成 [cs.GR, cs.IT, math.IT]目的:凸集合間の分離構造の再構成
- シーン理解において,形状だけでなく物体間の関係性も重要であるため。
- 既存手法では,分離構造を効率的に符号化・伝送する手段が不足している。
- 分離構造を保全しつつ,効率的なレート歪み最適化を実現する。
- 凸集合間の分離構造は,単なる形状情報以上の意味を持つことが示された。
- 分離構造のみからシーンを99.9%のビット精度で復元可能であることが実験的に確認された。
- 視点ロバスト性を高めることで,分離構造の符号化レートをわずかに増加させつつ,より頑健な分離が可能になった。
ビットから混合基数鍵へ:ホーナー分解,一様サンプリング,そしてMR-OTPの情報理論的QKDインタフェース [cs.CR, cs.IT, math.IT]目的:混合基数ワンタイムパッドにおける,量子鍵配送からのバイアスフリーな混合基数鍵生成手法
- 情報セキュリティの根幹であり,絶対安全な暗号化方式であるワンタイムパッドの拡張研究。
- 量子鍵配送からの鍵生成において,バイアスが発生し,安全性を損なう可能性がある。
- 量子鍵配送から生成されたバイナリエントロピーを,一様混合基数鍵へと効率的に変換すること。
- ホーナー法とその逆変換が,バイナリ整数と混合基数タプルの間の自然な写像であることが示された。
- 単純なモジュロ演算による還元がバイアスを誘発し,リジェクションサンプリングが均一性を回復することが証明された。
- 単一および複数セッションパイプラインに対する,終端から終端までの情報理論的セキュリティが確立された。
AIサンドボックス:脅威モデル,分類,および測定フレームワーク [cs.CR, cs.AI, cs.RO, cs.SE]目的:AIサンドボックスの脅威モデル,分類,および測定フレームワークの構築
- AIシステムの安全性と信頼性確保は,社会実装において不可欠であるため,検証技術の確立が急務。
- 既存のAI検証手法では,物理的な相互作用やサイバー物理システム特有の脅威への対応が不十分である。
- AIサンドボックスにおける検証範囲,リスク封じ込め,証拠の信頼性を明確化し,安全性を高める。
- AIサンドボックスを,デジタルAI,自律型システム,サイバー物理システムにおけるテスト環境として捉え,その境界を形式化。
- サンドボックスのタイプを分類し,物理的な攻撃を含む脅威モデルと,検証に必要な測定指標を定義。
- 実際のサンドボックス事例に基づき,本フレームワークの有効性と適用範囲を実証した。
CEO-Bench:エージェントは長期的な戦略を実行できるか [cs.AI, cs.CL, cs.SE]目的:長期的な不確実性下での情報収集,変化への適応,目標達成のための複数要素の調整能力の評価
- 現実世界の複雑な課題解決には,高度なスキルセットが不可欠であり,その評価が求められている
- 既存のエージェントは,短期的なタスクに特化しており,長期的な戦略実行能力が検証されていない
- エージェントの持続的な進捗を可能にする知能の測定に向けた第一歩を踏み出す
- CEO-Benchは,仮想的なスタートアップを500日間運営するシミュレーションを通じて,エージェントの能力を評価する
- Claude Opus 4.8とGPT-5.5のみが初期資金100万ドルを上回る成績を収めたが,安定的に利益を上げるには至らなかった
- 最良のエージェントは,顧客層をシミュレーションして将来のキャッシュフローを予測したり,交渉履歴から隠れた顧客の嗜好性を発見したりする
DeFAb:基盤モデルにおける帰納的推論の検証可能なベンチマーク [eess.SY, cs.SY, eess.SP, cs.AI, cs.LG, cs.LO]目的:基盤モデルにおける帰納的推論能力の評価
- 知識ベースに基づく推論は,AIの信頼性と説明可能性を高める上で重要である。
- 既存の言語モデルは,帰納的推論のような論理的推論において課題を抱えている。
- 厳密な論理検証を通じて,AIの創造性と理論的推論能力を定量的に評価することを目指す。
- DeFAbベンチマークは,複数の知識ベースから生成された37万件以上のインスタンスを提供する。
- 最先端の言語モデルは,このベンチマークにおいて,記号論理ソルバーと比較して著しく低い性能を示した。
- DeFAb-HardやCONJUREといった難易度の高いバリアントも公開され,AIの推論能力をより厳密に評価することが可能となった。
コードの予言者:仕様推論によるエージェント型脆弱性検出 [cs.CR, cs.AI, cs.SE]目的:エージェント型脆弱性検出における,仕様の明示化と継続的な改良
- ソフトウェアの安全性を確保する上で,脆弱性の早期発見は不可欠である。
- AIエージェントによる脆弱性検出は進歩しているが,その推論過程が不透明であるという課題がある。
- エージェントの暗黙の仮定を明確化し,実行時検証を通じて仕様を改善することで,信頼性を高める。
- Code-Augurは,脆弱性のあるコードを分析し,安全と判断した場合,その根拠をアサーションとしてソースコードに埋め込む。
- ファジングによるアサーションの反証を試み,脆弱性の発見または仕様の修正を行うことで,エージェントの理解を深める。
- 実世界のコードベースにおいて,既存のエージェントよりも多くの脆弱性を検出し,主要なオープンソースプロジェクトで22個の新たな脆弱性を発見した。
自己双対格子と符号の(非)同型性について [cs.DS, cs.CC]目的:自己双対格子における格子同型性問題の複雑性
- 暗号応用に不可欠な格子暗号の安全性評価において,格子同型性問題の解明は重要である。
- 自己双対格子の同型性判定は計算量が多く,効率的なアルゴリズムが求められている。
- 自己双対格子の構造的性質を利用し,同型性判定の効率化を目指す。
- 自己双対格子に対する格子同型性問題について,時間計算量$2^{n/2 + o(n)}$のランダム化アルゴリズムを提案した。
- 広範な自己双対格子クラスに対し,$\mathsf{coNP}$プロトコルを構成し,同型性問題の複雑性クラスを明らかにした。
- 自己双対符号におけるPermutation Code Equivalence (PCE)についても研究し,特定の符号クラスでは多項式時間アルゴリズムが存在することを示した。
熱損失ボソンチャネルにおける逐次検知を用いた隠密ブロック符号化 [cs.IT, math.IT, quant-ph]目的:熱損失ボソンチャネルにおける隠密通信のための受信者中心のブロック逐次検知フレームワークの設計
- 情報セキュリティの重要性が増す中,傍受者を欺く隠密通信技術の開発が求められている。
- 既存の隠密通信は,理論的な保証と現実的な受信機設計のギャップが存在する。
- 物理的に実現可能な受信機を用いた隠密通信システムの設計指針を提供すること。
- 本研究では,各ブロックを二値超シンボルとして扱い,隠密性を維持しつつブロックを検知する最小検知セグメント長を決定する。
- 受信者の情報増加率は小信号領域で線形に増加する一方,傍受者の検知可能性は量子相対エントロピー則に従うという非対称性を利用する。
- その結果,ブロック内の均一な信号伝送が漸近的に最適であり,CUSUM検出器がブロック内で閾値を超える条件が導出された。
公平なオンライン資源配分 [cs.DS, cs.GT, cs.LG, math.OC]目的:公平性と資源制約を考慮したオンライン資源配分問題の最適化
- 難民移住や航空機スケジュールなど,資源配分は社会的重要課題であり,効率性と公平性の両立が求められる。
- 従来の資源配分では,公平性が十分に考慮されておらず,類似するエージェント間で結果に差が生じやすい。
- 本研究は,資源制約下で公平性を確保しつつ,全体的な厚生を最大化する配分アルゴリズムを開発する。
- 本研究で提案するアルゴリズムは,バッチ内での公平性制約を満たしつつ,最適な双対変数を推定する。
- オンライン環境において,最適なオフライン流体ベンチマークに対して亜線形後悔を達成することが証明された。
- 難民経済プログラムの現実データを用いた検証により,アルゴリズムの性能と厚生最大化と公平性確保のトレードオフが示された。
微分方程式のロバスト性に対する公理化 [cs.LO, math.LO]目的:多項式微分方程式を持つ動的システムのロバスト性安全性の公理化の完全性
- 自動制御やロボティクス等,現実世界のシステム設計において,安全性の保証は極めて重要である。
- システムの不確実性や外乱に対する安全性の検証は困難であり,既存手法では限界がある。
- 外乱の影響下でも安全性を保証できる動的システムの検証方法を確立すること。
- ロバスト安全性の検証を,多項式不変量の健全な公理化へ帰着させることで,信頼性の高い論理的証明を可能にした。
- 摂動パラメータδに対し,ロバスト安全性の証明または不安全性を正確に判定する計算可能アルゴリズムの存在を示した。
- 亜解析幾何学の成果を活用し,境界における分離性がない場合でも証明可能性と決定可能性を確立した。
円形カルテシアンツリーマッチングのためのコンパクトな複数テキストインデックス [cs.DS]目的:カルテシアンツリーマッチングのためのインデックス構造
- データ構造解析は,複雑なデータにおけるパターン認識に不可欠である。
- 既存のアルゴリズムは理論的検証が中心で,実用的な実装の評価が不足している。
- 実用的なカルテシアンツリーマッチングの実装と評価を提供する。
- カルテシアン拡張バロウズ・ホイーラー変換(ceBWT)に基づくインデックスの実装を提示した。
- 動的に拡張可能なインデックスと,静的に圧縮されたインデックスのバリアントをサポートしている。
- これにより,自然な変動性を持つデータに対して,効率的な構造パターンマッチングが可能となる。
高密度アイゼンシュタイン・ヤコビネットワークにおける再ルーティングに基づく耐障害性全宛先ブロードキャスト [cs.DC, cs.IT, cs.NI, math.IT]目的:高密度アイゼンシュタイン・ヤコビネットワークにおける耐障害性全宛先ブロードキャスト手法の開発
- 並列処理やオンチップ通信システムにおいて,全宛先ブロードキャスト等の集団演算は頻繁に利用され,効率的なネットワーク構成が重要である。
- 既存のブロードキャストアルゴリズムは,無故障環境下での最適化に偏っており,ノード故障時の堅牢性に欠けるという課題がある。
- 本研究は,ネットワーク内の故障ノードによるメッセージ伝播の中断を回避し,確実にブロードキャストを完了させることを目指す。
- 提案手法では,故障ノードがネットワーク直径からの距離でリーフレベルノードとなるように,ブロードキャストの有効な送信元を再配置する。
- 1つまたは2つのノード故障に対して,送信元を選択するアルゴリズムを提示し,任意の故障ノードペアに対して適切な再ルーティング送信元が存在することを示す。
- 再ルーティングにかかる時間はネットワーク直径に比例し,ブロードキャスト全体の遅延は最大でネットワーク直径の2倍に抑えられる。
耐障害ブロードキャストのための閉形式かつ定数時間的新ソース選択:高密度アイゼンシュタイン・ヤコビネットワークにおける [cs.DC, cs.IT, cs.NI, math.IT]目的:高密度アイゼンシュタイン・ヤコビネットワークにおける耐障害ブロードキャストのための新ソース選択
- ネットワークの信頼性確保は,データ伝送や分散システムにおいて不可欠であり,特に障害に対する耐性が必要とされる。
- 既存手法では,ネットワーク全体をスキャンする必要があり,計算コストが高いという課題があった。
- 2つの障害ノードが発生した場合でも,有効な新ソースを効率的に特定し,ブロードキャストを継続すること。
- 本研究では,高密度アイゼンシュタイン・ヤコビネットワークにおいて,2つのノード障害下で有効な新ソースを数え,選択するための閉形式かつ定数時間アルゴリズムを提案した。
- 障害ノードの位置とネットワーク構造に基づき,境界交差問題を解くことで,新ソースの探索を効率化している。
- 50万組の障害ノードペアと4万回の再ルーティング試行による計算検証により,提案手法の正当性が確認された。
稠密ガウスネットワークにおける耐障害ブロードキャストのための,閉形式かつ定数時間的新ソース選択 [cs.DC, cs.IT, cs.NI, math.IT]目的:稠密ガウスネットワークにおける耐障害ブロードキャストのための新ソース選択手法
- 通信ネットワークの信頼性は重要であり,障害に対する堅牢性が求められる。
- ネットワーク障害発生時に迅速かつ効率的にブロードキャストを再開することが課題である。
- 障害ノードからの最大グラフ距離にある新ソースを,効率的に選択することを目指す。
- 商用格子を考慮した代数的な構築により,定数時間での新ソース数カウントを可能にした。
- 2つの障害ノードに対して,シフトされた直接選択子を用いることで,O(1)での選択を実現した。
- シミュレーション結果から,境界探索と比較して5.92倍の高速化を達成し,ネットワーク規模に依存しないことが示された。
SWE-Future:将来志向型ソフトウェア工学エージェントのための予測条件付きデータ合成 [cs.SE, cs.AI]目的:将来のコーディングタスクのためのデータ合成手法
- ソフトウェア開発エージェントの性能向上は,開発効率と品質の向上に不可欠である。
- 既存のベンチマークは過去のデータに依存しており,モデルの過学習や評価の偏りを招く可能性がある。
- 過去のデータに依存せず,将来のソフトウェア開発ニーズに対応したデータセットを生成すること。
- 提案手法SWE-Futureは,リポジトリの進化予測に基づき,将来のタスクを合成する。
- 予測ステップの検証により,58.1%の将来の作業との関連性が確認された。
- SWE-Futureは,過去のプルリクエストへの依存度を軽減し,現実的で将来志向型のコーディングタスク合成を可能にする。
学習増強型厳密指数時間アルゴリズム [cs.DS, cs.LG]目的:学習による予測を用いた厳密指数時間アルゴリズムの効率化
- NP困難問題に対し,現実的な時間で最適解を求めることは重要である。
- 既存の厳密アルゴリズムは最悪計算時間が指数時間であり,問題規模に限界がある。
- 機械学習による予測を用いて探索空間を削減し,計算時間を短縮することを目指す。
- 機械学習による予測が,ランダムよりもわずかに優れているだけでも,探索空間を削減できることが示された。
- 予測精度と計算時間の短縮が滑らかにスケールすることが確認された。
- 予測の独立性や精度に関する強い仮定を必要とせず,現実的な設定でも有効であることが示された。
ソフトウェア成果物間の意味に基づいたグラフ伝播型影響分析:展望 [cs.SE]目的:ソフトウェア成果物の変更が他の成果物に及ぼす影響の特定
- ソフトウェア開発において,変更による影響範囲の迅速かつ正確な把握は,品質と効率の維持に不可欠である。
- 既存の変更影響分析ツールは,意味的類似性または構造的依存性のいずれか一方に偏りがちで,両方の弱点を克服できていない。
- 意味的類似性と構造的依存性を融合した,解釈可能な影響分析手法を提案し,従来のツールが捉えきれない影響を特定することを目指す。
- 意味的類似性と構造的依存性の両方を考慮することで,テキスト的な重複がない成果物や,構造的な繋がりがない補助関数も影響範囲に含めることが可能になった。
- 提案手法は,調整可能なパラメータlambdaを通じて,適合率と再現率のバランスを調整できる。
- 実際の事例や過去の障害事例に基づき,本手法がコードだけでなく,運用時の成果物にも適用可能であることを示唆している。
複雑事象認識のための取り扱い可能なギャップ制約言語 [cs.DS, cs.DB, cs.FL]目的:ギャップ制約を用いた部分文字列マッチング問題の効率的な解決
- 複雑事象認識は,時系列データから意味のあるイベントを抽出する上で重要である。
- 部分文字列マッチング問題はNP困難であり,制約を設けても効率的な解法が限られていた。
- 左凸言語という性質を持つギャップ制約において,効率的な部分文字列マッチングを可能にする。
- 左凸言語を用いることで,時間計算量O(|D|(|u| + |C|))で部分文字列マッチングを最適に解決できる。
- 長さ制約など,現実世界の複雑事象認識で利用可能な制約を表現できることを示した。
- 左凸でない言語を許容した場合,問題は再びNP困難となることを明らかにした。
ピンチングアンテナ支援EDMA-NOMAシステムにおける環境認識型リソース割当て [cs.IT, math.IT]目的:ピンチングアンテナ支援EDMA-NOMAシステムにおける,環境地図に基づいたユーザマッチングと電力割当て
- 無線通信環境の特性を活かすことで,干渉を抑制し,通信効率を向上させることが重要である。
- 既存手法では,環境による遮蔽が干渉抑制にのみ寄与すると仮定し,現実的な環境を十分に考慮できていない。
- 本研究では,環境地図を用いて,望ましい通信と干渉の両方に影響を及ぼすことを考慮し,リソース割当てを最適化する。
- 提案手法は,環境地図を用いないベースラインと比較して,合計レート,公平性,スループット-公平性の動作領域において一貫した改善を示す。
- 高SNR領域においては,EDMA-OMAベンチマークが競争力を持つことが示され,本研究の目的はEDMA-NOMAのリソース割当てにおける環境情報の利点を検証することであることが確認された。
- NOMAが必ずしもOMAを上回るわけではないが,異質環境情報がEDMA-NOMAのリソース割当てに有益であることを示している。
還元構造からの単調依存性,および配向グラフの双子幅への応用 [cs.LO, cs.DM, math.CO, math.LO]目的:少なくとも一つの反対称関係を含む二項関係構造の単調依存性
- 構造的性質の理解は,計算複雑性理論やデータベース理論において不可欠である。
- 単調依存性の判定は,構造が複雑になるほど困難となる。
- 還元構造を利用し,単調依存性の判定を効率化すること。
- 本研究では,構造の一部還元のみを考慮することで単調依存性を証明するための十分条件を提示した。
- 双子幅の有界性と,線形順序への拡張可能性との等価性を一般化した結果を得た。
- 配向スプリットグラフや局所トーナメントなど,新たな配向グラフクラスに対する双子幅による区別可能性を示した。
Graph-ESBMC-PLC:SMTベースモデルチェッカを用いたグラフィカルPLCopen XMLラダー図プログラムの形式検証 [cs.DC, cs.PL, cs.CL]目的:グラフィカルPLCopen XMLラダー図プログラムの形式検証手法
- PLCは産業オートメーションの中核であり,安全性と信頼性が不可欠である。
- PLCプログラムの誤りは重大な事故につながるため,厳密な検証が必要である。
- グラフィカルラダー図の形式検証を可能にし,検証の網羅性を高める。
- Graph-ESBMC-PLCは,ラダー図の接続グラフをDFSで解析し,論理パスを抽出する。
- これにより,グラフィカルなラダー図プログラムを中間表現に正確に変換できるようになった。
- CONTROLLINO/OpenPLC Editor由来の3つのグラフィカルラダー図プログラムにおいて,SAFE検証を70ms以内に完了した。
CAPRA:ソフトウェアアーキテクチャ成果物に対するフィードバックを多エージェントLLMシステムで拡張 [cs.SE, cs.AI]目的:ソフトウェアアーキテクチャ成果物の評価
- ソフトウェア開発におけるアーキテクチャの品質は,システムの成功に不可欠である。
- アーキテクチャ成果物のレビューは手作業に頼ることが多く,時間と労力を要する。
- LLMを活用し,アーキテクチャ成果物の自動評価を実現し,効率化を目指す。
- CAPRAは,複数の専門エージェントと,テキストとUML図の抽出を行うマイクロサービスを用いて,構造と要件のトレーサビリティを分析する。
- 評価基準8項目において88.8%の基準を満たし,人間の評価者との間には中程度の合意率(kappa = 0.582)が確認された。
- レポート1件あたり4分強で処理が可能であり,LLMによるアーキテクチャフィードバックの実現可能性が示された。
PaSTTeL:ラッソプログラムの終端性と非終端性の並列解析フレームワーク [cs.LO]目的:ラッソプログラムの終端性および非終端性解析のためのフレームワーク
- プログラムの信頼性確保は不可欠であり,特に無限ループの検出は重要な課題である。
- 既存の終端性解析手法は分散しており,統合的なフレームワークが不足している。
- 多様な解析アルゴリズムを統合し,並列実行による効率化を目指す。
- PaSTTeLは,既存の終端性解析手法を統一的に扱うためのモジュール性と柔軟性を備えている。
- 複数の解析戦略を並列実行することで,解析効率の向上を実現している。
- 初期実験の結果,PaSTTeLは既存のツールと比較して競争力のある性能を示している。
${\mathbb R}^{12}$における接吻配置の構造と$841$番目の球の配置場所 [cs.ET, cs.AR, cs.ET, cs.IT, math.IT]目的:${\mathbb R}^{12}$におけるサイズ$840$の接吻配置の構造解析およびサイズ$841$の接吻配置の構築
- 高次元空間における球の充填率は,符号理論や情報理論など様々な分野で重要な問題である。
- 高次元空間における最適な球配置(接吻数)の決定は,未解決問題であり,計算量の問題も存在する。
- 接吻配置の構造的自由度を利用し,新たな接吻配置を効率的に生成することで,最適配置探索を加速する。
- サイズ$840$の接吻配置において,ブリッジベクトルの固定下で,各$60$点ブロックが大きな柔軟性を持つことが示された。
- 特に,$12$個のベクトルは符号付き座標ベクトルとして選択可能であり,残りの$48$個のベクトルは正次元の多様体内で変動する。
- 構造的に情報に基づいた初期化スキームを用いることで,${\mathbb R}^{12}$におけるサイズ$841$の接吻配置を数値的に構築することに成功した。
確率的ブールテープの完全性 [cs.LO, math.CT]目的:確率的ブール回路のセマンティクスに対する公理系の完全性
- 近年,有限確率的プログラミングの基礎として確率的ブール回路が注目されている。
- 確率的ブール回路のセマンティクスを形式的に記述するための完全な公理系が未確立であった。
- 確率的ブール回路のセマンティクスをマルコフ核を用いて記述するための完全な公理系を構築する。
- 本研究では,部分ブール回路と確率的ブールテープに対する完全性が中間結果として示された。
- 確率的ブールテープは,厳密圏の図式的な言語であり,その完全性が確立された。
- これにより,確率的ブール回路のセマンティクスに対する完全な公理系が提供される。
変動はどこへ行ったのか?バイブコーディングからリジェネレーションによるプロダクトラインへ [cs.SE, cs.AI]目的:バイブコーディングによるプログラム生成時の変動の扱い
- ソフトウェアの信頼性向上のためには,多様な状況に対応できるソフトウェア開発が不可欠である。
- 従来のソフトウェア工学では変動をコードに組み込むが,AIによる自動生成では変動が失われる可能性がある。
- AI生成ソフトウェアにおける変動を仕様に集中させ,効率的なプロダクトライン工学を実現すること。
- バイブコーディングによるC/C++プロジェクトの分析から,生成時に全ての変動が決定されることが示された。
- リジェネレーションによる変動(VbR)を提案し,LLMを派生エンジンとして活用する新たなプロダクトラインアプローチを確立した。
- VbRのパイプラインをwcプロダクトファミリーで実証し,AI生成ソフトウェアにおける変動はコードではなく仕様に存在すべきであることを示した。
AIによる執筆・AIによる管理:391回の連続セッションにおける意味空間の制御とインデックス病の解消 [cs.SE, cs.CL, cs.HC]目的:長期間にわたるLLM連携における概念ドリフトへの対処
- LLMを長期間活用する上で,意味理解の維持は重要である。しかし,そのメカニズムは未解明な点が多い。
- 従来の対策は,形式的な制約を強めることで信頼性を高めようとするが,必ずしも有効ではない。
- 意味空間の複雑化が限界を超えると,LLMは本質的な意味理解を放棄し,現実との乖離が生じる問題を解決する。
- 従来の対策が逆効果となる「インデックス病」という現象を特定し,「Pangの原理」としてその原因を説明した。
- 「Baseline-Log物理的分離」という具体的な対策を設計・検証し,AI指示量を75%削減することに成功した。
- その後の150回のセッションにおいて,「インデックス病」の再発は確認されなかった。
単純さのパラドックス:なぜ進化は普遍的に複雑な主体を生み出さないのか [cs.IT, math.IT]目的:進化における認知経済の理論
- 社会組織の拡大には,個人の認知能力に限界があることが影響する。
- 知識は有益であるにもかかわらず,人間は複雑さを避け,単純な選択を好む。
- 普遍的な複雑さへの収束がなぜ起こらないのか,その理由を説明すること。
- 情報取得,処理,調整のコストを考慮することで,単純さの進化的な利点を説明した。
- 複雑な環境下では,単純なヒューリスティックを用いる多数派と,情報処理を専門とする少数派が共存する。
- 分散型単純さによるコスト削減が,普遍的な複雑さによる効用損失を上回る場合,社会は単純な構造となる。
光線アンテナアレイを用いた低高度ISAC:性能解析とビームフォーミング設計 [cs.IT, math.IT]目的:低高度ISACシステムの性能向上とビームフォーミング設計
- 低高度経済は航空機に依存するが,環境・安全上のリスクがあり,空域監視の必要性が高まっている。
- 従来のアンテナアレイは,コスト,拡張性,カバレッジに限界があり,特に基地局直上での分解能が低い。
- 光線アンテナアレイにより,低コストで高性能な低高度ISACシステムの実現を目指す。
- 光線アンテナアレイは,位相シフターを必要とせずハードウェアコストを削減し,柔軟なビームフォーミングを可能にする。
- 提案手法は,通信制約下でのセンシングカバレッジ向上のための光線選択とビームフォーミング問題を最適化する。
- 解析とシミュレーション結果から,光線アンテナアレイは従来のアンテナアレイよりも高いセンシングSNRを達成することが示された。
LLMとMCP統合によるソフトウェア工学教育:教室から産業界の実践へ [cs.SE]目的:LLMおよびMCPを統合したソフトウェア工学教育モデルの構築
- 近年のソフトウェア開発におけるAI技術の急速な進展に伴い,実践的な教育が不可欠となっている。
- 従来のソフトウェア工学教育では,最新のAI技術や産業界のニーズに対応できていない課題がある。
- AI技術を活用した教育モデルを確立し,学生の実践的な問題解決能力を向上させる。
- LLMとMCPを教育に組み込むことで,学生のプログラミング能力と問題解決能力が向上した。
- 教育モデルは,従来の講義と実際の開発ワークフローの間のギャップを効果的に埋めることができた。
- 産業界とのインターンシップを通じて,学生はこれらの技術を実際の現場で活用し,実践的なスキルを習得した。
より多くの特性を組み合わせる:ELbotにおける修理意味論下でのABox仮説生成 [cs.LO, cs.AI]目的:ABox仮説生成における特性の組み合わせ
- 知識ベースからの演繹の欠如を説明する上で,仮説生成は不可欠である。
- これまでの研究では,複数の特性や最適化基準を組み合わせた仮説が検討されていない。
- ELbot環境下で,複数の特性や最適化基準を満たす仮説生成手法を開発すること。
- 追加の特性を要求することが,必ずしも計算量の増加につながらないことが示された。
- 勇敢な意味論とAR意味論の双方において,検討を行った。
- より望ましい仮説を生成するための基盤となる。
スライディングウィンドウメンバーシップのためのガード付きエポックブルームフィルタ [cs.DS]目的:ストリームにおける近似メンバーシップクエリの,全項目に対するメンバーシップではなく,最近のウィンドウに対するセマンティクス
- ストリームデータ処理において,メンバーシップクエリは頻繁に必要であり,効率的なデータ構造が求められる。
- 既存のカウントブルームフィルタや安定ブルームフィルタでは,スライディングウィンドウの要件を満たすことが難しい。
- 本研究では,ガード付きエポックブルームフィルタを用いて,スライディングウィンドウにおけるメンバーシップクエリを効率的に解決することを目指す。
- ガード付きエポックブルームフィルタは,固定されたビット予算をローテーションするエポックに分割し,現在のエポックにのみ挿入を行う。
- これにより,最新のW個の位置に挿入された項目が確実に表現され,かつ,ターゲットウィンドウを超える古い項目の保持が抑制される。
- 実験結果から,14ビット/生項目において,ガード付きエポックフィルタは合成データにおける偽陽性を大幅に削減できることが示された。
開発者の思考は多様:Copilotとの対話における問題解決スタイルと経験がニーズを形成する仕組み [cs.SE, cs.HC]目的:Copilotとの対話における開発者のニーズの多様性
- ソフトウェア開発の生産性向上には,開発者の多様なニーズに対応した支援ツールが不可欠である。
- プログラミング支援ツールの設計では,個々の開発者の特性や思考様式が考慮されておらず,効果が限定的である。
- 開発者の問題解決スタイルと経験が,Copilotとの対話におけるニーズにどのように影響するかを明らかにすること。
- 本研究により,開発者とCopilotの対話における5つの「相互作用モード」と10の根底にあるニーズが特定された。
- これらのモードとニーズは,開発者の問題解決スタイルや経験プロファイルと関連性があることが示された。
- 多様な開発者のニーズに対応するため,支援ツールの設計,研究,利用に関する洞察と提言が提供された。
AIエージェントの実行時コンプライアンス検証 [cs.SE]目的:AIエージェントのGDPR遵守状況の検証
- AIエージェント利用拡大に伴い,個人情報保護の重要性が増している。
- 従来の検証手法では,実行時の遵守状況を保証できないという課題がある。
- 実行時にエージェントの行動が規制遵守しているかを検証する枠組みを提案する。
- 提案手法C-Traceは,GDPR要件を形式的なポリシー述語として表現し,実行時監視を行う。
- 攻撃的な対話テストにより,C-Traceは既存手法と比較して攻撃成功率を12%以下に抑制し,誤検知率も16%以下に抑えた。
- 抽出精度が完璧な場合,攻撃成功率は0%に達し,高いコンプライアンスを達成した。
繰り返し差分プライバシー集約の再構成限界:クエリ幾何学に関するクレーマー・ラオの視点 [cs.DC, cs.IT, math.IT]目的:繰り返し差分プライバシーによる情報漏洩のリスク評価基準
- プライバシー保護技術は,データ利用と個人のプライバシー保護の両立に不可欠である。
- 繰り返し差分プライバシーの評価指標は,必ずしも局所的な再構成リスクを正確に反映しない。
- クエリの幾何学構造を考慮することで,情報漏洩リスクのより正確な評価を目指す。
- ガウス較正された繰り返し統計クエリにおいて,情報漏洩リスクは,リリース系列のヌーサンプロファイル化されたフィッシャー幾何学によって決定される。
- 固定背景のIN/OUT平均を用いたラベル付きターゲット再構成では,繰り返しによりターゲットと背景のコントラストが明確化される。
- 多変量データのソートされた参加型マルチセットでは,特徴量の多様性により局所的な識別が可能となる。
NeSyCat Torch:ニューロシンボリック学習のための圏論的意味論の微分可能なテンソル実装 [cs.AI, cs.LG, cs.LO, math.CT, math.LO, math.PR]目的:ニューロシンボリック学習のための圏論的意味論の実装
- 古典論理,ファジー論理,確率論理,ニューラルシステムがそれぞれ異なる真理の定義を持つ点が課題
- 既存のNeSyCatには,ニューラルネットワークで学習された述語と関数を扱える仕組みが欠如していた
- NeSyCat Torchによって,ニューラルネットワークを介した記号の解釈を可能にし,その枠組みを補完すること
- NeSyCat Torchは,HaskTorch,JAX,PyTorchで実装され,MNIST加算タスクにおいてLTNやDeepProbLogよりも高速かつ高精度
- DeepStochLogの精度に匹敵する結果を達成しつつも,多くのNeSyアプローチに適用可能な統一的な枠組みを維持
- 特に,構成がモナドに依存することから,モナドをGiryモナドに置き換えることで連続確率にも拡張可能
ノードベースの敵対的エラーを持つネットワークにおける秘密鍵配布 [cs.IT, math.IT]目的:ネットワークコーディング下における複数鍵キャスト問題
- ネットワークセキュリティは,情報通信における重要な課題であり,データの機密性・完全性を確保する必要がある。
- 既存研究ではエッジベースの敵対モデルが多いが,ノードを標的とする攻撃に対する検討は十分ではない。
- ノードベースの敵対モデル下における,安全かつ信頼性の高い複数鍵キャストの実現可能性を調査する。
- 単一ソースネットワークにおいて,完全な接続性を持つ場合,完全秘匿な複数鍵キャストが鍵容量\(d-\ell_o-\ell_e-2\ell_{oe}\)で漸近的に達成可能となる。
- 終端ノードのみ接続性を持つネットワークに対しては,ソース頂点接続性とネットワーク構造に基づく安全な複数鍵キャスト容量を確立した。
- 結果はマルチソース環境やセキュアマルチキャストネットワークコーディング,ネットワーク秘密分散にも適用可能であり,[Zhang et al., IEEE Trans. Comm., 2023]のスキームのセキュリティも向上させた。
QDSV:量子指向計算のための意味的表現とマルチバックエンド実行フレームワーク [cs.RO, cs.CL, cs.MA, eess.SY, cs.SY, cs.PL]目的:量子指向計算のための意味的表現とマルチバックエンド実行フレームワークに関する研究
- 量子計算の発展には,問題記述と具体的な実装を分離する柔軟なフレームワークが不可欠である。
- 既存の量子計算フレームワークは,回路形式に依存する場合が多く,柔軟性に欠けるという課題がある。
- 問題記述を重視した表現を用いて,シミュレータとハードウェア間での一貫性を確保し,解釈可能な実行トレースを得ることを目指す。
- QDSVフレームワークは,宣言的な問題意図を構造化された意味的表現に変換し,様々なバックエンドで実行可能にする。
- 回路形式に限定されず,必要に応じて回路互換性のある成果物も生成できる。
- 脳波データを用いた ictal/interictal 分類実験で,古典機械学習や量子回路を用いた手法との比較検証を行った。
条件付きシンコーン・ドリフトによるワンショット学習チャネルシミュレーション [eess.SP, cs.IT, math.IT]目的:ワンショット学習チャネルシミュレーションのための手法
- 通信システムの性能評価において,チャネルシミュレーションは不可欠である。効率的なシミュレーションが求められている。
- 拡散モデルのような反復サンプリングは計算コストが高い。特に学習ループ内での繰り返し評価は課題となる。
- 計算コストを抑えつつ,チャネル特性を正確に捉えたシミュレーション手法を確立することを目指す。
- 提案手法である条件付きシンコーン・ドリフトは,送信シンボルを保持しつつ,条件付き出力分布のみを輸送する。
- AWGN,Rayleighフェージング,SSPA非線形性,TDLチャネルの実験で,他の手法と比較して優れた性能を示した。
- 条件付き診断やシンボリックコーディングチェックにおいて,条件付きシンコーン・ドリフトは最も有効であり,高速なシミュレーションを実現する。
LLM生成器・調整者ゲームの変分的枠組み [stat.OT, cs.AI, cs.IT, math.IT]目的:言語生成の制御に関する理論的枠組み
- 大規模言語モデルの普及に伴い,その生成内容の制御が重要になっている。
- 言語モデルの生成する有害なコンテンツや誤情報の拡散が問題となっている。
- 生成モデルと規制モデルの相互作用を解析し,制御の最適化を目指す。
- 提案手法は,言語生成における有用性,エントロピー,規制適合性,検出可能性のトレードオフを明確化する。
- 検閲フィルタリングとフィッシング防御の事例研究を通して,理論の評価指標(有用性,エントロピー,発散度など)の有効性を示す。
- 本研究は,モデレーション,検閲,AI欺瞞検出,コンプライアンス監査,フィッシング防御など,広範な応用可能性を持つ。
階層構造のコンパクトな幾何表現 [stat.ML, cs.CG, cs.CL, cs.DS, cs.IR, cs.LG]目的:階層構造の到達可能性を表現するコンパクトな埋め込み
- 機械学習において,データの幾何表現は重要な役割を担う。
- 深層階層構造において,既存の埋め込み次元数がノード数に依存する。
- グラフ構造のパラメータに基づく埋め込み次元の理論的保証を与える。
- 任意の木構造に対し,サイズや深さに依存しない定数次元3の埋め込みが存在することを証明した。
- 幅$t$のグラフに対し,次元$O(t \log n)$の埋め込みを構築できることを示した。
- 実世界のデータセットにおいても,提案手法は既存手法よりも小さい次元数で高い再現率を実現した。
- 1
- 2
