arXiv雑要約
プログラム - 2026/04/28 公開
AIにおける情報理論的尺度:実践的な意思決定ガイド [cs.AI, cs.IT, cs.LG, cs.MA, math.IT]目的:AIにおける情報理論的尺度の適切な選択
- AI分野において,情報理論的尺度は意思決定,不確実性の定量化,表現学習などに不可欠である。
- 尺度選択が推定方法や限界,誤用のリスクから切り離されている場合がある。
- 各尺度の用途,適切な推定方法,潜在的な誤用を明確化し,実践的な意思決定を支援する。
- 7つの尺度それぞれに対し,その用途,適切な推定方法,最も危険な誤用に関する3つの問いを提示するフレームワークを構築した。
- フローチャートと決定テーブルという2つの成果物を用いて,AI/MLと意思決定エージェントの両方の応用分野を網羅する。
- 表現学習,時間的影響分析,進化型エージェントの複雑性といった具体的なシナリオを通して,フレームワークの実用性を示す。
物理的に許容可能なスケジューラを採用する量子プロトコルの検証 [cs.LO]目的:量子プロトコルの検証手法
- 量子通信はコストが高く,重要な場面で利用されるため,信頼性の高い検証が不可欠である。
- 既存のプロセス計算では,物理的な量子システムと整合しない非決定的な機能が導入され,同値なプロセスを区別してしまう。
- 物理的に許容可能なスケジューラを導入し,非決定的な動きを制限することで,より正確な検証を実現する。
- lqCCSというプロセス計算を提案し,物理的に許容可能なスケジューラを用いて確率的合成を制約した。
- lqCCSにおける飽和双シミュレーションの適切な性状を検証し,量子力学の既知の結果をlqCCSに適用した。
- 並列演算子に関する合同性として,行動的同値性を特徴づけ,構成的推論を可能にした。
ClawMark:マルチターン,複数日,マルチモーダルな共同作業エージェントのためのリビングワールドベンチマーク [cs.CV, cs.SE]目的:マルチターン,複数日,マルチモーダルな共同作業エージェントの性能評価
- 職場環境は常に変化するため,それに適応できるエージェントの重要性が高まっている。
- 既存のベンチマークは,静的な環境での評価に偏っており,現実世界の動的な変化に対応できていない。
- 現実的な職場環境を模倣し,エージェントの環境変化への適応能力を評価するベンチマークを提供する。
- ClawMarkベンチマークは,ファイルシステム,メール,カレンダーなど,5つの状態を保持するサービス環境で100のタスクを提供する。
- 最良のモデルは75.8の加重スコアを達成したが,厳密なタスク成功率はわずか20.0%であり,完全なワークフロー完了は稀である。
- 環境の変化後,パフォーマンスが低下する傾向があり,変化する状態への適応が課題であることが示唆された。
複数APを持つ無線LANにおける情報鮮度の最適化 [cs.NI, cs.IT, math.IT]目的:多AP無線LANにおけるネットワーク全体の情報鮮度(AoI)の最小化
- 屋内WLANの利用拡大に伴い,遅延に敏感なアプリケーションをサポートする重要性が増している。
- 複数のAPが干渉し合う環境下では,最適なスケジューリングが困難であり,情報鮮度を低下させる。
- 集中制御可能なソフトウェア定義WLANのアーキテクチャを活用し,干渉を考慮した情報鮮度の最適化を目指す。
- 提案手法では,任意のスケジューリングポリシー下でのAoIの下限値を導出している。
- 定常ランダムポリシーを設計し,下限値に対する定数倍の最適性保証を確立した。
- シミュレーションにより,分散型ベースラインと比較して約50%のAoI削減効果が確認された。
コンパイル時のテンソル形状チェック:段階的形状依存型によるアプローチ [cs.PL]目的:テンソル形状の一貫性検証
- 行列やテンソルを扱うプログラムにおいて,計算前に形状の整合性を保証することは重要である。
- 既存の依存型やリファインメント型は理論的には成熟しているが,型等価性やサブタイピングの証明が必要で,実用性に課題がある。
- コンパイル時に形状の一貫性を検証し,実行時のエラーを未然に防ぐことを目指す。
- 段階的形状依存型を用いることで,コンパイル時にアサーションとして形状の一貫性を検証する。
- 型証明の負担を軽減するため,形状引数の暗黙的な推論と,通常の依存型言語に似た表面言語を提供する。
- プロトタイプ実装により,言語の表現力と実用性を確認し,ocaml-torchの例も検証できた。
クエリから図へ:UML図による開発者からの質問への回答 [cs.CL, cs.SE, cs.AI]目的:開発者からの質問に対応するUML図の生成
- ソフトウェアの複雑化に伴い,コード理解を助けるドキュメントの重要性が増している。
- 既存のドキュメントは古くなりがちで,開発者がコードの意図を理解するのに不十分な場合が多い。
- 大規模言語モデルを用いて,開発者の質問に特化した簡潔なUML図を自動生成し,ドキュメント作成の負担を軽減する。
- ファインチューニングにより,構造的欠陥検出のF1スコアが向上し,既存のLLMよりも欠陥率が低下した。
- 生成されたUML図は構造的に健全であり,開発者からの質問に対して意味的に忠実であることが示された。
- 大規模言語モデルを用いた,スケーラブルな文脈に沿ったオンデマンドドキュメント生成の実現可能性を確立した。
KISS Sorcar:極めて単純な汎用およびソフトウェアエンジニアリングAIアシスタント [cs.IR, eess.SY, cs.SY, cs.ET, quant-ph, cs.DL, cs.SE]目的:実用的なソフトウェアエンジニアリング支援のためのAIアシスタントの構築
- 大規模言語モデルの利用が進む中で,ソフトウェア開発におけるAI支援の需要が高まっている。
- 既存のAIアシスタントは,コンテキストウィンドウの制限やエラー発生時の対応に課題がある。
- コンテキスト維持,エラー回復,作業ブランチの分離により,安定したAI支援を実現すること。
- KISS Sorcarは,約1850行のコードで構成されるKISS Agent Framework上に構築されたAIアシスタントである。
- 本研究では,出力品質を重視し,モデルが自己検証を行う時間を十分に確保することで,低品質コードの生成を抑制している。
- Terminal Bench 2.0において,KISS SorcarはClaude Opus 4.6を用いて62.2%の正答率を達成し,他のモデルと同等以上の性能を示した。
科学ソフトウェアにおけるコードレビューコメントの有用性の特徴づけ [cs.HC, cs.AR, cs.SY, eess.SY, cs.SE]目的:科学ソフトウェアにおけるコードレビューコメントの有用性
- 科学的進歩は科学ソフトウェアに依存しており,質の高いレビューは信頼性と影響力を高める。
- 汎用ソフトウェアとは異なり,科学ソフトウェアにおけるコードレビューの有効性は未解明な点が多い。
- 科学ソフトウェアにおけるコードレビューコメントの有用性を明らかにし,開発を支援する。
- 科学ソフトウェアにおけるコードレビューコメントの有用性は,汎用ソフトウェアにおける先行研究の結果と一致する点が多いことが確認された。
- 主観的または否定的なコメントは科学ソフトウェアにおいても有用性が低い。
- 否定的な絵文字反応とコメントの有用性の相関は低いが,肯定的な絵文字反応は相関が混在する。対象リポジトリの6〜33%のコメントは有用ではない。
企業顧客サポートワークフローにおけるCopilotフィードバックからの選択的LLM自律学習 [cs.CL, cs.SE]目的:企業顧客サポートワークフローにおける選択的LLM自律性の学習
- 顧客サポートの自動化は,コスト削減と効率化に貢献し,企業の競争力強化に不可欠である。
- 従来の自動化システムは,複雑なワークフローへの適応が難しく,柔軟性に欠けるという課題があった。
- Copilotフィードバックを活用し,LLMによる自律的な顧客サポートの実現を目指す。
- 本システムは,企業BPMプラットフォーム内でエンドツーエンドの顧客サポートワークフローを自動化する。
- CopilotフィードバックとUI操作記録を活用することで,2週間以内に新しいプロセスに対する選択的自動化を達成した。
- 実運用では,セッションの45%を自動化し,平均処理時間を39%削減,サポート品質を維持した。
Optimas:パフォーマンス最適化のためのインテリジェントな分析情報に基づいた生成AIフレームワーク [cs.PF, cs.SE]目的:パフォーマンス最適化のための生成AIフレームワーク
- 高性能計算において,パフォーマンスは重要な課題であり,計算資源の効率的な利用が求められる。
- パフォーマンスボトルネックの特定は可能だが,それを踏まえたコード修正は専門家でも手間のかかる作業である。
- パフォーマンス診断と既存のコード変換を連携させ,自動的にパフォーマンスを改善することを目指す。
- Optimasは,複数のレポートからパフォーマンス診断情報をコード変換にマッピングする生成AIフレームワークである。
- 3410回の実験の結果,生成されたコードは100%正確であり,98.82%以上の実験でパフォーマンスが向上した。
- NVIDIA GPU上で平均8.02%~79.09%のパフォーマンス改善が確認された。
グリッドグラフにおけるサイクル検出の下限 [cs.DS]目的:グリッドグラフにおけるサイクル検出アルゴリズムの計算量
- グラフ理論は,ネットワークや関係性の分析において基盤となる重要な分野である。
- グラフのサイクル検出は,効率的なアルゴリズムが存在しない場合がある。
- 本研究は,特定の条件下におけるサイクル検出の計算量の下限を明らかにすることを目的とする。
- 格子状グラフのサイクル検出において,最悪の場合全てのセルを読み取る必要があることが証明された。
- 証明は,サイクルを含む場合と含まない場合の両方を維持する敵対的アルゴリズムを用いたものである。
- このアルゴリズムは,特定のブロック構造を用いて構築され,格子状グラフのサイクル検出の限界を示す。
タスク指向型セマンティック通信のための分散電磁ニューラルネットワーク [cs.IT, math.IT]目的:タスク指向型セマンティック通信における分散電磁ニューラルネットワーク
- 従来のビット中心システムと比較し,タスク関連情報の伝送を優先するセマンティック通信は,通信効率向上に貢献する。
- 既存のセマンティック通信システムは,計算効率と空間的柔軟性の点で課題がある。
- 計算効率と柔軟性を高め,画像認識タスクにおけるセマンティック通信の性能向上を目指す。
- 提案する分散電磁ニューラルネットワークは,複数機搭載されたメタサーフェスと地上受信局で構成され,波域での画像セマンティック符号化と受信電力分布に基づく復号化を実現する。
- 温度適応勾配最適化アルゴリズムにより,勾配消失を緩和し,学習の安定性を向上させる。
- 数値シミュレーションの結果,複数のデータセットで単一メタサーフェスをベースラインとして平均8%の精度向上が確認された。
制約誘導マルチエージェントによる実行可能バイナリからの逆アセンブル [cs.CL, cs.SE, cs.AI]目的:実行可能バイナリからのソースコード復元
- セキュリティ分析,マルウェア解析,レガシーソフトウェア保守において,ソースコード復元は不可欠な技術である。
- 既存の逆アセンブラは,コンパイルや実行に失敗するコードを生成することが多く,実用性が制限されている。
- 本研究は,実用的なソースコードを生成するために,逆アセンブルの精度と信頼性を向上させることを目指す。
- マルチレベル制約誘導逆アセンブル(MCGD)フレームワークにより,逆アセンブルされたコードを実行可能なソースコードに変換した。
- ExeBenchの1,641個の実世界バイナリで84-97%の再実行可能性を達成し,既存の逆アセンブラの出力と比較して28-89%改善した。
- GPT-4oをバックボーンとするLLMベースの逆アセンブル手法(LLM4Decompile, SK2Decompile, SALT4Decompile)と比較して,より高い性能を示した。
相互接続された複数情報源の活用による脆弱性特定 [cs.DC, cs.SE]目的:脆弱性特定と脆弱性タイプ分類の有効性向上
- 現代のソフトウェア開発において,オープンソースライブラリの利用が不可欠であり,セキュリティリスクの低減が重要である。
- ライブラリの脆弱性は,依存関係を通じてソフトウェアに影響を与え,依存ソフトウェアへの明示的な通知がない場合がある。
- 多様な情報源間の意味的な繋がりを活用し,脆弱性特定と分類の精度を向上させることを目指す。
- VPFinderは,複数ヘッド注意機構を用いて,多様な情報源から高レベルな意味情報を抽出する。
- 脆弱性特定タスクにおいて0.941のF1スコア,脆弱性タイプ分類タスクにおいて0.610のF1スコアを達成し,最先端の手法を5.4%上回る結果を示した。
- バグレポート,コミットメッセージ,コード変更など,複数の情報源が密接に関連しており,脆弱性の症状,根本原因,修正戦略に関する高レベルな意味情報を提供する。
AgentPulse:デプロイにおけるAIエージェントを評価するための継続的なマルチ信号フレームワーク [cs.AI, cs.CL, cs.SE]目的:AIエージェントのデプロイにおける評価
- AI技術の急速な発展に伴い,実用的な評価手法の確立が重要である。
- 従来のベンチマークは,デプロイ後のAIエージェントの利用状況や課題を捉えきれない。
- デプロイ状況を継続的に評価し,AIエージェントの改善に役立つ情報を提供する。
- AgentPulseは,GitHub等のリアルタイムデータに基づき,AIエージェントを多角的に評価するフレームワークである。
- ベンチマーク性能と採用状況,コミュニティの評価,エコシステムの健全性等の要素を統合的に評価する。
- ベンチマークと採用状況の相関関係から,AIエージェントの真価を測る新たな指標となりうる可能性を示唆している。
表形式データの検索における表現の安定性によるロバスト性向上 [cs.CL, cs.AI, cs.IR, cs.IT, math.IT]目的:表形式データの検索における表現の安定性
- 表形式データは情報検索において重要な役割を担うが,その活用には課題が多い。
- 表のシリアライズ方法の違いが,検索結果に大きな影響を与える問題が存在する。
- シリアライズ方法に依存しない安定した表現を獲得し,検索のロバスト性を高める。
- 複数のシリアライズ形式(csv, tsv, html等)から得られる埋め込み表現は大きく異なり,検索結果に影響することが示された。
- シリアライズ埋め込みをノイズのある視点と捉え,その中心ベクトルを正準表現とすることで,形式特有の変動を抑制できる。
- 中心ベクトルを用いた表現は,既存モデル(MPNet, BGE-M3等)において,個々の形式よりも優れた性能を示すことが確認された。
一般化された最大平均不一致:カーネル化された関数型ブレグマンダイバージェンス [cs.LG, cs.CV, cs.IT, math.IT]目的:関数型ブレグマンダイバージェンスの一般化
- 統計学,機械学習,計算情報幾何学において重要な役割を果たすブレグマンダイバージェンスの研究。
- 関数を点とする関数型ブレグマンダイバージェンスに対する,カーネル法とヒルベルト空間幾何学の体系的な適用が不足している。
- カーネル平均埋め込みを用いたブレグマン生成子により,関数型ブレグマンダイバージェンスの推定を容易にすること。
- 提案手法は,クラスタリング,汎用推定,ロバスト推定,生成モデリングなどへの応用が可能である。
- 他のタイプのブレグマンダイバージェンスと比較して,本手法はカーネル法との親和性が高い。
- ヒルベルト空間上の自己双対ペアリングとリース表現子を用いることで,都合の良い計算が可能となる。
開発者が移行ガイドをどのように利用するか:Log4j の事例研究 [cs.CL, cs.SE]目的:開発者による移行ガイドの利用状況の解明
- ソフトウェアの進化は避けられず,ライブラリの更新に伴う互換性のない変更への対応は重要である。
- 移行ガイドは重要なドキュメントだが,その利用状況に関する研究は十分ではない。
- 移行ガイドの提供方法と開発者の利用方法の実態を明らかにすることで,改善に貢献する。
- プルリクエストの説明で移行ガイドへの言及が最も多く,全体の82.81%がガイド全体へのリンクであった。
- 移行ガイドは,メジャーバージョン更新時だけでなく,その後のメンテナンス作業でも利用されていることがわかった。
- 移行ガイドは,移行プロセス全体を通じて参照されるリソースとしての役割を果たしていると考えられる。
動的文法圧縮自己インデックスにおけるδ最適空間 [cs.DS]目的:δ最適空間を達成する動的自己インデックスの構築
- ウェブクローリングデータ等,反復性の高い文字列の効率的な処理が求められている。
- 既存の動的自己インデックスは,空間効率,検索時間,更新時間のいずれかで課題があった。
- 空間効率と検索・更新性能を両立した動的自己インデックスを開発する。
- 動的RR-indexは,期待値としてδ最適空間を達成する初の動的自己インデックスである。
- locateクエリは期待値でO(m + log m log² n + occ (log n / log log n))時間を要し,更新はO(m' log² n + log³ n)時間で完了する。
- 実験結果から,既存の動的インデックスと比較して,更新速度が最大77倍,locate速度が最大11倍に向上することが示された。
Goにおける暗号APIの誤用検出器の評価 [cs.CR, cs.SE]目的:Go言語における暗号APIの誤用検出の現状と課題
- 現代ソフトウェアの安全性を支える暗号化技術において,APIの誤用は重大な脆弱性となりうる。
- Go言語はセキュリティ基盤で広く利用されるが,暗号API誤用の検出研究は遅れている。
- Goにおける暗号API誤用の検出器の性能を評価し,改善の方向性を示す。
- 最先端の4つのツール(CodeQL,Gopher,Gosec,Snyk Code)を評価し,14種類の誤用クラスを分類した。
- 328のセキュリティ重要プロジェクトを分析した結果,7,473件の暗号API誤用を発見した。
- ツールの検出範囲には大きな差があり,セキュリティエンジニアへの実践的な示唆と今後の研究課題を示唆した。
ベクトル加算システムにおける到達可能性の向上:パンプ可能性によるアプローチ [cs.FL, cs.LO]目的:ベクトル加算システムの到達可能性問題の計算複雑性の改善
- 計算機科学における計算モデルの基礎であり,並行処理系の検証に不可欠である。
- ベクトル加算システムの到達可能性問題は,一般に決定困難であり,効率的な解法が求められている。
- 固定次元におけるベクトル加算システムの到達可能性問題をより効率的に解決すること。
- パンプ可能性の分析を用いることで,d次元ベクトル加算システムの到達可能性問題に対する上限をF_{d-2}に改善した。
- 特に,4次元ベクトル加算システムの到達可能性問題に対する上限をPSPACEに,5次元ベクトル加算システムの到達可能性問題に対する上限をELEMENTARYに確立した。
- 幾何学的に2次元のベクトル加算システムに対する簡略化された投影技術を開発し,その到達可能性問題が2-VASSと同値であることを示した。
SemML 2.0:LTLに対するコントローラ合成 [cs.AI, cs.FL, cs.LO]目的:線形時間論理(LTL)で与えられた仕様から,リアクティブシステムを合成すること
- 安全性が重要なシステム設計において,形式手法による検証・合成が不可欠である。
- LTLからコントローラを自動合成する際,計算量が多く,効率が課題となっていた。
- 既存のツールよりも効率的に,より多くのインスタンスを解くことを目指す。
- SemML 2.0は,既存の最先端ツール(Strix, LtlSynt, SemML 1.0など)を大きく上回り,より多くの問題を解決することが示された。
- 部分探索や機械学習による誘導を用いることで,効率的な解探索を実現している。
- SYNTCOMPのデータセットを用いた評価により,解の質を維持しつつ,高速かつ高精度なコントローラ合成が可能であることが確認された。
AIによるビジネス意思決定支援のためのソフトウェアフレームワーク [cs.CL, cs.SE, cs.MS, stat.AP]目的:ビジネス意思決定を支援するAIのためのソフトウェアフレームワーク
- ビジネスにおける迅速なイテレーションと学習速度の向上が重要視されている。
- アイデア出しから評価までの一連の流れをAIで完結させるシステムが不足している。
- AIエージェントがビジネスの実験フレームワーク内で学習し,反復するのを支援する。
- 本フレームワークは,数学的還元により複雑さを抑制し,ソフトウェア設計によってオーケストレーション,安全性,多様性を最適化する。
- 平均値の差だけでなく,異質効果,ポリシーアルゴリズム,メディエーション分析,効果予測などを組み込んだ因果分析を充実させている。
- コードの正確性の向上,コード量の削減,およびパフォーマンスの向上が,様々な実験分析の目標において示された。
ナッシュ社会厚生とスケジューリングのための新しい凸計画法 [cs.DS]目的:ナッシュ社会厚生問題に対する新しい凸計画緩和法
- 資源配分問題は,経済学,オペレーションズ・リサーチ等の分野で重要であり,効率的な資源利用が求められる。
- 既存手法では,規模の大きい線形計画問題が必要となり,計算コストが高いという課題があった。
- 本研究は,より効率的な凸計画緩和法を提示し,計算コストを削減することを目的とする。
- 提案手法は,FengとLiの丸めアルゴリズムにより,$(e^{1/e}\approx 1.445)$-近似解を与える。
- 従来の指数サイズの線形計画法と異なり,提案手法は多項式サイズのコンパクトな線形計画問題に変換可能である。
- 本手法は,標準的な線形計画ソルバーを用いて直接解くことができ,計算効率の向上が期待される。
独立集合多面体における最短再構成系列の発見 [cs.DS]目的:独立集合多面体から派生する隣接関係の下での独立集合の最短再構成問題
- 組合せ最適化の分野における多面体上の経路探索は,様々な問題に応用可能であり重要である。
- 独立集合多面体上の最短経路問題は,計算困難性が示唆されているものの,具体的な計算複雑さは不明であった。
- 本研究は,独立集合多面体上の最短再構成系列問題の計算複雑性を明らかにし,効率的な解法を開発することを目的とする。
- 平面グラフや分割グラフにおいて,この問題がNP困難であることが証明された。特に,平面グラフにおいては,2ステップ以内で到達可能かどうか判定する問題も困難である。
- 分割グラフに関しては,ステップ数をパラメータとした場合のW[2]-困難性,および最適長の近似困難性が示された。これは,0/1多面体上の最短経路問題の近似困難性にもつながる。
- ブロックグラフ,コグラフ,二部鎖グラフに関しては多項式時間アルゴリズムが開発され,パスやサイクルにおいては最適な再構成系列長が容易に算出できることが示された。
ほぼ最適ヒープとポインタマシン上のダイクストラ法 [cs.DS]目的:ポインタマシン上でのワーキングセットヒープの実現
- ヒープは動的なデータ構造として,効率的なデータ管理に不可欠である。
- ワーキングセットヒープは,PushやDecreaseKey操作のオーバーヘッド削減が課題である。
- ポインタマシン上でのワーキングセットヒープの効率的な実現を目指す。
- 本研究では,ポインタマシン上で償却定数時間でPush操作,逆アッカーマン時間でDecreaseKey操作をサポートするワーキングセットヒープの構成を提示した。
- この分析の結果,ダイクストラ法がポインタマシン上でほぼ普遍的に最適な性能を発揮することが示唆された。
- ダイクストラ法は,距離順序法と比較して,$O(m \, \alpha(m))$ の付加的なオーバーヘッドで済む。
ZFLean:Leanにおける集合レベル数学のためのフレームワーク [cs.LO, cs.MS]目的:集合レベル数学の形式化
- 数学の厳密な基礎付けは,信頼性の高い計算機システムに不可欠である。
- 集合論に基づいた数学の形式化は,労力と煩雑さが課題であった。
- Lean環境下での集合レベル数学の形式化を容易にすることを目的とする。
- ZFLeanは,型付きMathlib開発と同等の使いやすさを備えたZFCモデル内での数学の実践を可能にするLean 4ライブラリである。
- 本フレームワークは,集合に対する関係演算,書き換え指示,標準的な集合論的構成を提供し,ZFCオブジェクトとLeanネイティブ型間の連携を可能にする。
- ZFLeanは,拡張的推論の冗長性を削減しつつ,既存のMathlibとの互換性を維持している。
効率的な動的解析による自律型デバッグエージェントの能力向上 [eess.SY, cs.SY, cs.SE]目的:自律型デバッグエージェントの効率化
- ソフトウェアの品質向上には,自動化されたテストやデバッグが不可欠である。
- 既存のデバッグ手法は,LLMベースのエージェントにとってコストがかかり,非効率である。
- エージェント中心のデバッグインターフェースによって,効率的なデバッグを可能にすること。
- 提案手法であるADIは,SWE-benchの検証セットにおいて63.8%のタスクを解決することに成功した。
- ADIは,高機能なClaude-Toolsエージェントを凌駕し,コストはタスクあたり1.28USDで済んだ。
- ADIは既存のエージェントに組み込むことができ,解決タスク数を6.2%~18.5%向上させた。
RefEvo:共進化検証によるエージェント設計を用いたアジャイル参照モデル生成 [eess.SY, cs.SY, cs.SE, cs.AI]目的:SoC設計における迅速な参照モデル開発
- SoCの複雑化に伴い,早期検証とアーキテクチャ探索が重要視されている。
- 既存の静的なワークフローは設計の複雑さに対応できず,LLMのコンテキストウィンドウ制限も課題である。
- 誤ったモデルを検証する検証失敗問題を解決し,信頼性の高い参照モデル生成を目指す。
- RefEvoは,動的な設計プランナーと共進化検証メカニズムにより,参照モデル生成の効率と信頼性を向上させる。
- 20のハードウェアモジュールで95%のパス率を達成し,既存手法を大幅に上回る性能を示した。
- コンテキスト最適化によりトークン消費量を平均71.04%削減し,仕様の再現性を100%維持した。
MEMCoder:プライベートライブラリ指向コード生成のための多次元進化型メモリ [cs.SE, cs.AI, cs.CL]目的:プライベートライブラリを活用したコード生成の性能向上
- 企業内システムでは,公開されていない独自のライブラリが頻繁に利用される。
- 大規模言語モデルは,これらの非公開ライブラリの知識が不足しているため,性能が低下する。
- API利用のパターンやパラメータ制約に関する知識を自動的に獲得・進化させる。
- MEMCoderは,静的ドキュメントと過去の利用実績から得られた知識を組み合わせることで,APIの理解を深める。
- 実行結果に基づき,自己学習ループを通して知識の衝突を解決し,メモリを動的に更新する。
- NdonnxEvalとNumbaEvalでの評価により,既存のRAGシステムを大幅に改善し,pass@1の平均絶対改善率は16.31%である。
ハッピーグラフにおける最小時間スパナー [cs.DS]目的:時間変化するグラフにおける最小時間スパナーの存在
- 時間変化するグラフは現実世界のネットワークをモデル化する上で重要であり,交通網やソーシャルネットワーク等の分析に不可欠である。
- 既存研究では,時間スパナーの最小化問題の困難性が様々な設定で示されているが,それらの難易度を統一的に評価する枠組みが不足していた。
- 本研究は,時間スパナー問題が最も制限された設定(ハッピーグラフ)でもNP困難であることを証明し,既存の結果を包含する。
- 時間スパナー問題は,ハッピーグラフという非常に制限された設定においてもNP困難であることが示された。
- ハッピーグラフにおいて,頂点被覆サイズが定数である場合,多項式時間で解けることが示された。これは一般的な時間スパナー問題における最初の肯定的結果である。
- ハッピーグラフでない場合,フィードバック頂点数でパラメータ化するとW[1]-困難であることが示された。
H非包含グラフにおける辺分割の複雑性について [cs.DS, math.CO]目的:グラフ中の誘導部分グラフとしてHが現れる全ての箇所を,高々k回の辺分割によって取り除く可能性
- グラフ理論は,ネットワークやシステムのモデリングにおいて不可欠であり,計算複雑性の研究は効率的なアルゴリズム開発に繋がる。
- グラフの構造に対する制約(H非包含)下での辺分割問題は,NP困難であることが知られており,効率的な解法が求められている。
- 特定条件下における辺分割問題の計算複雑性を明らかにすることで,より現実的な問題への適用可能性を評価する。
- Hが特定の構造(分割星や分割二重星)を持つ場合,問題は多項式時間で解けることが示された。
- その他の多くのHに対しては,問題はNP困難であり,仮定された指数時間仮説の下では,効率的なアルゴリズムは存在しないことが証明された。
- 単純な探索木アルゴリズムの計算量は,上記困難事例において指数時間仮説の下で最適であることが示された。
ハノイオメガオートマトンとゲームの理論 [cs.LO, cs.FL]目的:ハノイオメガオートマトン(HOA)で符号化されたオートマトンとゲームに関する決定問題の理論的複雑性
- 現代の合成ツールにおいて,$\omega$正則オートマトンを符号化する標準としてHOAが確立されている。
- HOAの簡潔な表現は広く採用されているが,その計算コストは十分に研究されていない。
- HOAの構造的特徴が古典的な問題の複雑性を高める点を明らかにし,複雑性の限界を示す。
- HOAで符号化されたオートマトンの非空性問題は,すべての標準的な受理条件に対してNP困難であることが示された。
- 言語包含問題は,ほとんどの条件下でPSPACE完全であるが,Emerson-Lei受理条件の場合はEXPSPACE完全となる。
- ハノイオメガゲーム(HOG)の複雑性限界は,パリティや安全性条件に対して$\Pi_2$完全,MullerやEmerson-Lei条件に対してPSPACE完全であることが示された。
区間順序問題の計算複雑性 [cs.DS]目的:区間順序問題の計算複雑性
- バイオインフォマティクス等の応用があり,効率的な順序決定が重要である。
- コスト関数によっては,計算量が指数関数的に増加する可能性がある。
- 特定のコスト関数に対する多項式時間アルゴリズムの存在と,下限を明らかにする。
- 動的計画法により,コスト関数への$O(2^n\text{poly}(n))$回のオラクルアクセスで問題を解くアルゴリズムを開発した。
- コスト関数$f$が準加法性または超加法性を持つ場合,多項式時間アルゴリズムが存在することを示した。
- 任意のコスト関数に対するアルゴリズムの下限として,$2^{n-1}$の実行時間が必要であることを証明した。
分散のための彩色:カーディナリティ制約付き2-アンチクラスタリングの多項式時間アルゴリズム [cs.DS]目的:カーディナリティ制約付き2-アンチクラスタリング問題の解法
- 心理学研究,バイオインフォマティクス,データ科学など,多様な分野で異質性のあるグループ作成が重要視されている。
- カーディナリティ制約付き最大分散問題はNP困難であり,効率的な解法が求められていた。
- カーディナリティ制約付き2-アンチクラスタリング問題を多項式時間で解くアルゴリズムを開発する。
- カーディナリティ制約付き2-アンチクラスタリング問題は,カーディナリティ制約付き2-彩色問題に変換することで多項式時間で解けることが示された。
- 特に制限されたクラスのsubset sum問題に変換し,疑似多項式動的計画法を用いることで,効率的な解を得る。
- 公開されている実装は,従来の整数線形計画法解法よりも大幅に高速であり,大規模データセット(n=10,000)も1秒未満で処理可能である。
球面上の局所性敏感フィルタリングの遍歴 [cs.DS]目的:高次元データにおける近似最近傍探索
- 情報検索やデータマイニングなど,高次元データ分析において不可欠な技術である。
- 局所性敏感ハッシュ(LSH)や局所性敏感フィルタリング(LSF)には多数の変種が存在し,理解が難しい。
- LSH/LSFに基づくアプローチの主要なアルゴリズム要素を統一的に理解することを目指す。
- 角度距離に対するLSFに基づくデータ構造を設計・分析し,基本的な技術と結果を体系的に解説する。
- 既存の研究成果を組み合わせることで,提案されたデータ構造の最適性を証明し,主要な技術補題を強化する。
- 近傍探索の核となるメカニズムを明確にし,研究者にとっての入門点と現状の洗練された見通しを提供する。
コードグラフ部分クラスの識別 [cs.DS, cs.CC, math.CO]目的:グラフの識別可能性
- グラフ理論は,ネットワーク分析や最適化問題に応用される重要な分野である。
- グラフの識別問題は,NP困難であり,効率的な解法が求められている。
- コードグラフの部分クラスにおける識別問題の複雑性を解明する。
- 特定のコードグラフの部分クラスにおいて,$k$と$n-k$をパラメータとした場合の計算複雑性がほぼ完全に決定された。
- グラフ$G$からグラフ$H$への識別可能性を判定する問題についても,パラメータ化された複雑性が示された。
- 特に,$H$の単純頂点の数をパラメータとした場合の複雑性が明らかになった。
順序グラフの遺伝的クラスにおける最大重み独立集合 [cs.DS]目的:順序グラフの遺伝的クラスにおける最大重み独立集合問題の複雑性分類
- グラフ理論において,誘導部分グラフを禁止することで定義されるグラフクラスの計算問題の複雑性は重要な研究テーマである。
- これまでの研究は主に彩色問題に焦点を当てており,最大重み独立集合問題に関する研究は不足していた。
- 単一の禁止誘導部分グラフで定義される順序グラフクラスにおける最大重み独立集合問題の複雑性をほぼ完全に分類することを目指す。
- 特定の構造を持つ$H$のファミリーを除き,最大重み独立集合問題は多項式時間またはNP困難であることが示された。
- 特に,準多項式時間で解ける$H$のファミリーは限定的であり,それ以外はNP困難となることが明らかになった。
- 本研究は,順序グラフにおける最大重み独立集合問題の計算可能性に関する理解を深める上で貢献する。
拡散テンプレート:制御可能な拡散のための統合プラグインフレームワーク [cs.LG, cs.AI, cs.CV, cs.SE]目的:制御可能な拡散モデルの統合と拡張性向上
- 拡散モデルは画像生成において高い性能を示すが,制御方法の多様性が課題となっていた。
- 制御手法が拡散モデルごとに異なり,再利用性や組み合わせが困難であった。
- 拡散モデルの制御機能を共通化し,柔軟な拡張と多様なタスクへの適用を目指す。
- 拡散テンプレートは,ベースモデルと制御機能を分離するプラグインフレームワークである。
- これにより,異なる制御方法を容易に組み合わせ,様々な拡散モデルに適用可能となる。
- 構造制御,明るさ調整,超解像など広範なタスクにおいて,高いモジュール性と拡張性を示した。
インタラクティブ定理証明器のための自動証明合成の理解と改善 [cs.LO]目的:自動証明合成の課題分析と,ヒューマンエキスパートの証明パターンに沿った戦術探索手法の提案
- ソフトウェアの品質保証において,厳密な検証が不可欠であり,インタラクティブ定理証明はその有力な手段である。
- 定理証明器を用いた証明スクリプトの作成は専門知識を要し,労力もかかるため,自動化へのニーズが高い。
- 既存の自動証明合成技術が解決困難な定理を分析し,成功率向上に資する要因を特定すること。
- 現在の自動証明合成技術が苦手とする定理の特性を分析し,その限界を明らかにした。
- 人間が用いる証明パターンに沿った戦術選択が,証明成功率を高めることを実証した。
- 提案手法PGTSにより,既存のツールで証明できる定理数が平均8.05%向上,未証明定理が平均20%増加した。
原始再帰の構成なし:ダイナミカルな特徴づけ - ニューラルネットワークから多項式ODEへ [cs.CC, cs.LG, cs.LO, cs.NE]目的:原始再帰のダイナミカルな特徴づけ
- 計算モデルの基礎理論を深める上で,再帰的関数論は重要な役割を果たす。
- 従来の再帰的関数論では,関数構成が基本的な操作として用いられる点が課題となる。
- 関数構成を用いずに,原始再帰をダイナミカルなシステムで表現することを目指す。
- 再帰型ニューラルネットワーク,多項式ODE,離散多項式写像の全てにおいて,原始再帰と同等の特徴づけが存在することが示された。
- 各形式は,時間制約が原始再帰的に定まる範囲で,ダイナミクスによって構成が実現される。
- 多項式ODEは,丸め誤差や位相選択を連続時間フローによってロバストに行うことができ,各形式の限界を補完し合うことが明らかになった。
人間-人間-LLM協調ソフトウェア設計における創造性の探求 [cs.SE]目的:人間とLLMの協調によるソフトウェア設計における創造性の発生状況
- ソフトウェア開発は,技術革新の源泉であり,社会の発展に不可欠である。
- LLMの活用は進むが,創造性を伴う協調作業への影響は未解明な点が多い。
- LLMがソフトウェア設計者の創造性をどのように促進・阻害するかを明らかにすること。
- 全てのペアで設計プロセスに創造性が認められ,13ペアが創造的な設計書を作成した。
- 創造性の源泉は主に人間の設計者にある。経験,共感性,類推などが創造性を引き出した。
- LLMは新規アイデアの生成やアイデアの具体化に貢献する一方,複雑な解決策の提案や不必要な議論を招く可能性もある。
脆弱性導入コミット特定のためのマルチエージェントSZZアルゴリズム [cs.CR, cs.SE]目的:脆弱性導入コミットの特定
- ソフトウェアセキュリティ対策の基礎となる技術であり,脆弱性検出や影響範囲分析に不可欠である。
- 既存のSZZアルゴリズムは,アンカー選択の誤りやバックトラッキング能力の不足により,実用レベルの精度に達していない。
- マルチエージェントによる協調により,アンカー選択とバックトラッキングの精度を向上させ,脆弱性導入コミットの特定を改善する。
- 提案手法MAS-SZZは,CVE記述と修正コミットから脆弱性の根本原因を要約し,パッチの変更意図に基づき脆弱性関連ステートメントを特定する。
- 特定されたステートメントをアンカーとして,リポジトリの履歴を遡り,脆弱性を最初に導入したコミットを自動的に特定する。
- 実験結果から,MAS-SZZは既存手法を大幅に上回り,最良のSZZアルゴリズムと比較して最大65.22%のF1スコア改善を達成した。
ナイキストレート以下のサンプリングによる理論的最小サンプリングレート限界への到達 [cs.IT, math.IT]目的:広帯域スペクトルセンシングにおけるサブナイキストサンプリングアーキテクチャ
- 広帯域スペクトルセンシングの需要が高まっており,効率的なサンプリング技術が不可欠である。
- 従来のサブナイキストサンプリングは,サブバンドの位置が不明な場合,理論的最小レートの2倍以上のサンプリングレートが必要となる。
- サブバンド位置の事前知識なしに,理論的最小レートでのサブバンド局在化と波形復元を実現すること。
- 提案する二重周波数エイリアシング広帯域コンバータ(DAWC)は,信号とシステムの条件の下で,完全なサブバンド局在化と波形復元を理論的最小レートで達成する。
- 共通のサポート構造を利用する革新的な補助情報支援サブスペース探索(MSSP)アルゴリズムは,スペクトルサポートセットの正確な復元を可能にする。
- 制限等方性特性(RIP)に基づき,MSSPのノイズ存在下における安定した復元を保証し,シミュレーションで最先端手法と比較して優れたスペクトル復元精度を示す。
OSS GitHubリポジトリにおけるエージェント型プルリクエストに対するレビューBotのフィードバック [cs.SE]目的:エージェント型プルリクエストに対するレビューBotのフィードバックとプルリクエストの成果の関係性
- ソフトウェア開発において,AIエージェントによる自動化が進んでおり,その品質管理は重要である。
- レビューBotのフィードバック品質と量,そしてプルリクエストの成果との関係が不明である。
- レビューBotのフィードバックがプルリクエストの成果に与える影響を明らかにすること。
- レビューBotのコメントは主にバグ修正,テスト,ドキュメントに関するもので,丁寧な口調で指示的な傾向がある。
- レビューBotのコメント数は多いほど,プルリクエストの解決に時間がかかり,フィードバックの質が低下する傾向が見られた。
- レビューBotのフィードバック品質は,プルリクエストのワークフロー成果に有意な影響を与えなかった。
課題に顔を付ける:PersonaFlowによるオープンソースソフトウェア開発者のユーザー共感性育成 [cs.HC, cs.SE]目的:オープンソースソフトウェア開発者のユーザー共感性
- OSS開発は,ユーザーの理解が重要である。しかし,技術的な議論に偏りがちである。
- ペルソナの作成は有効だが,リソースやUX専門知識が不足し,規模拡大が困難である。
- OSSリポジトリからユーザーペルソナを自動生成し,課題報告に統合することで,共感性を高める。
- ユーザー調査の結果,多くの開発者がユーザー理解に変化を感じ,半数以上が応答を修正した。
- ペルソナへの感情的な共感と,優先順位付けへの実用的な活用という2つの経路が確認された。
- どちらの経路も,よりユーザー中心的な行動につながることが示唆された。
線形制約付き最適化のためのスケーラブルな一次 Interior Point Trust Region アルゴリズム [cs.HC, cs.CE, cs.RO, cs.DS, math.OC]目的:制約付き非凸計画問題における近似Karush-Kuhn-Tucker点計算
- 数理計画における根幹技術であり,現実の最適化問題を解く上で不可欠である。
- 大規模問題への適用において,計算コストがボトルネックとなり,効率的な解法が求められている。
- 低ランク更新を用いた近似射影により,計算コストを削減し,スケーラビリティを向上させる。
- 提案手法は,既存の一次IPTRアルゴリズムと比較して,最大で2.48倍の高速化を達成した。
- 厳密なトラストレジオン部分問題の解法を近似射影に置き換えることで,反復ごとの計算コストを大幅に削減する。
- 勾配ベースの負の曲率ルーチンを組み込むことで,ヘッセ行列計算を回避し,一次情報のみで近似二次KKT点を算出する。
フィッシャー情報と動的サンプリング I [cs.IT, math.IT, q-bio.PE, stat.AP]目的:動的システムの再構成精度評価
- 多自由度システムの理解には情報理論が不可欠である。システムの複雑な振る舞いを定量的に捉える上で重要。
- 時間的データからシステムを再構成する際,サンプリングによるバイアスが無視できない問題となる。
- サンプリングデータから得られるシステムのダイナミクス記述の精度向上を目指す。
- 大規模なサンプルサイズにおいてフィッシャー情報のバイアスを計算し,システムの再構成精度を定量的に評価した。
- 自由度のクラスタリングがバイアスを軽減し,再構成精度を向上させることを示した。
- クラスタリングによる情報損失を定量的に評価し,抽出可能なダイナミクス情報を推定する指標を提供した。
ソフトウェア工学の学生が現実世界の卒業研究で生成AIをどのように活用しているか:実証的ベースライン研究 [cs.SE]目的:ソフトウェア工学の学生による生成AIの活用状況の把握
- ソフトウェア工学教育において,現実世界のプロジェクトは実践的なスキル習得に不可欠であるため,その重要性は高い。
- 生成AIの急速な普及は,教育現場に新たな課題をもたらしており,その影響は十分に理解されていない。
- 本研究は,生成AIの適切な教育的活用に向けた基盤となる実証的データを提供する。
- 生成AIの活用状況は,ソフトウェア開発ライフサイクル全体にわたって観察され,新たなワークフローが生まれていることが明らかになった。
- 学生からは,検証と自律的な理解の維持を重視した生成AIの責任ある活用に関する提言がなされた。
- クライアント側からは,生成AIの活用に対する肯定的な姿勢が見られた一方で,理解度,品質,データ保護への期待が示された。
実践におけるコードレビューボットの自動評価の限界理解 [cs.SE, cs.AI]目的:コードレビューボットの自動評価の実現可能性と限界
- ソフトウェア開発における品質向上と効率化が重要であり,コードレビューはその不可欠な要素である。
- ボットによるコードレビューの有用性を客観的に評価する方法が確立されていない。
- 開発者の行動データに基づいた自動評価の限界を明らかにし,より適切な評価手法を模索する。
- LLMを活用した自動評価手法(G-Eval,LLM-as-a-Judge)と開発者による評価の合致率は,モデルや評価方法によって異なり,0.44から0.62の範囲であった。
- 開発者のコメントに対する対応(修正,無視)は,コメントの質だけでなく,状況や組織の制約に左右されるため,客観的な評価指標として用いることには限界がある。
- 開発者へのインタビューからも,評価行動がワークフローの圧力や組織的な制約の影響を受けることが確認された。
