arXiv雑要約
プログラム - 2025/10/13 公開
ユーザー意図解決のための大規模言語モデルの比較分析 [cs.SE, cs.AI, cs.CL, cs.HC]目的:ユーザー意図解決を機械支援する大規模言語モデルの性能評価
- 自然言語処理技術の進展により,人間とコンピューター間の直感的な対話が求められている。
- 既存のクラウドベースの言語モデルは,プライバシー,自律性,スケーラビリティの課題を抱えている。
- ローカル環境で利用可能なオープンソースLLMの有効性を評価し,次世代OSの基盤技術を確立する。
- 本研究では,複数のオープンソースLLMとOpenAIのGPT-4を比較し,ユーザー意図に基づくワークフロー生成能力を評価した。
- その結果,オープンソースLLMは,特定のタスクにおいてGPT-4に匹敵する性能を示す可能性が示唆された。
- 本研究は,AIインフラの分散化と民主化に向けた議論を深め,よりシームレスでプライバシーに配慮したユーザー体験の実現に貢献する。
Psiチューリング機械:複雑性障壁とオラクル分離のための限定的な内省 [cs.CC, cs.FL, cs.LO]目的:複雑性障壁とオラクル分離のための限定的な内省機能を持つPsiチューリング機械の研究
- 計算複雑性理論は,アルゴリズムの限界と可能性を理解する上で不可欠である。効率的なアルゴリズム設計の基礎となる。
- 複雑性クラス間の関係は未解決の問題が多く,証明は困難である。オラクル分離の構築も課題である。
- 標準化された最小限の内省インターフェースと明確な情報予算によって,これらの問題を解決することを目指す。
- Psiチューリング機械を導入し,情報理論的な下界ツールキット(予算カウント,Ψ-Fooling,Ψ-Fano)を開発した。
- オラクル相対的な分離PΨ ≠ NPΨと厳密な深さ階層を証明し,反シミュレーションフックを用いて多項式的なエミュレーションを排除した。
- Psi決定木やインターフェース制約回路IC-AC0/IC-NC1などの独立したプラットフォームを提示し,機械,木,回路間の境界を移行した。
依存関係のバージョン固定とフロート:どちらが古くなった依存関係と脆弱性の軽減に適しているか [cs.SE, cs.CR, cs.LG, cs.PL]目的:依存関係のバージョン制約の種類ごとの,依存関係が古くなったり脆弱になったりする可能性の評価
- ソフトウェア開発において,依存関係の管理は不可欠であり,そのバージョン管理戦略がセキュリティと安定性に大きく影響する。
- 依存関係のバージョン固定はセキュリティリスク軽減に有効だが,更新作業が煩雑になり,結果的に古い依存関係が残存しやすいという課題がある。
- バージョン制約の種類が依存関係の鮮度やセキュリティに与える影響を定量的に評価し,開発者が適切な選択を行うための情報を提供する。
- npm,PyPI,Cargoのエコシステムにおいて,依存関係のバージョン制約の使用傾向と変更パターンを分析した結果,floating-minorが最も一般的に使用されていることがわかった。
- 生存分析モデルを用いた結果,floating-majorは古くなった依存関係になりにくく,floating-minorは脆弱な依存関係になりにくい傾向があることが示された。
- バージョン固定(pinning)は,floating-minorに次いでよく使用されているが,その使用頻度に対する鮮度・セキュリティリスクのバランスを考慮する必要がある。
リポジトリレベルのコード補完タスクにおける相対位置に基づくコードチャンク分割手法 [cs.SE, cs.AI, cs.LG]目的:リポジトリレベルのコード補完における効果的なコンテキスト収集戦略
- コード補完は開発効率を向上させる重要な技術であり,開発ライフサイクルを円滑に進める上で不可欠である。
- 大規模言語モデル(LLM)を用いたコード補完において,その性能を最大限に引き出すための適切なコンテキストの定義が課題となっている。
- リポジトリ内のコードをチャンクに分割し,相対位置情報を活用することで,より効果的なコンテキストを提供し,コード補完の精度向上を目指す。
- コードをチャンク分割し,構文・意味的な類似度に基づいてチャンクを検索する手法が有効であることが示された。
- チャンクの相対位置情報をコンテキストに含めることで,コード補完タスクの性能が向上することが確認された。
- 本研究で提案する手法は,大規模言語モデルを活用したコード補完の精度向上に貢献する可能性がある。
ソフトウェア開発におけるチームコラボレーションへのLLMの影響 [cs.SE, cs.AI]目的:ソフトウェア開発ライフサイクルにおけるチームコラボレーションへのLLMの影響
- ソフトウェア開発は経済社会の基盤であり,その効率化は重要である。チーム開発では,コラボレーションが不可欠となる。
- チーム開発において,コミュニケーション不足や意思決定の遅延が課題となり,開発効率を阻害することがある。
- LLMを活用することで,これらのコラボレーション課題を解決し,ソフトウェア開発の生産性を向上させることを目指す。
- LLMは,反復作業やドキュメント作成の自動化により,開発効率を大幅に向上させることが示された。
- コミュニケーションの明確化,クロスファンクショナルなコラボレーションの促進といった利点が確認された。
- 一方で,モデルの限界やプライバシーに関する懸念といった新たな課題も浮き彫りになった。
Text2Stories:ステークホルダーインタビューと生成されたユーザーストーリー間の整合性の評価 [cs.CL, cs.CL, cs.CL, cs.SE]目的:ステークホルダーインタビューと生成されたユーザーストーリー間の整合性評価タスクと指標
- ソフトウェア開発において,要件定義は品質を左右する重要な段階である。
- 要件定義の評価は手作業が中心であり,規模が大きくなると効率が低下する。
- ステークホルダーのニーズを忠実に反映した要件を自動的に評価する方法を確立する。
- 提案手法Text2Storiesは,インタビュー内容とユーザーストーリーの整合性を定量的に評価する。
- LLMベースのマッチャーは,保持データ上で0.86のmacro-F1スコアを達成した。
- 本指標を用いることで,人間が作成したストーリーと生成されたストーリーの比較が可能となる。
Androidビルド修復の自動化:LLMエージェントにおける推論と実行のギャップをドメイン固有ツールで埋める [cs.SE, cs.AI]目的:Androidビルドエラーの自動修復
- Androidは最大のモバイルプラットフォームであり,そのアプリケーションの自動ビルドは重要である。
- LLMはコード修復に有望だが,Androidビルドエラーの修正への応用は未開拓である。
- LLMによるAndroidビルドエラーの自動修復を可能にする手法の開発。
- 本研究では,43のオープンソースAndroidプロジェクトから収集した1,019のビルドエラーのベンチマークAndroidBuildBenchを新たに作成した。
- ドメイン固有ツールを用いたLLMエージェントGradleFixerは,汎用シェルに頼る最先端のコーディングエージェントを大きく上回り,81.4%の解決率(pass@1)を達成した。
- この成功は,LLMが高レベルの知識を持つ一方で,汎用シェルを用いて効果的な低レベルアクションに変換することに苦労することを示唆している。
Faver:関数抽象化検証ミドルウェアによるLLMベースRTL生成の性能向上 [cs.SE, cs.AI]目的:LLMベースRTL生成の精度向上
- チップ設計における自動化の遅れを解消し,設計効率を向上させる必要性
- 高レベル仕様とRTL間のセマンティックギャップと,学習データ不足による精度低下
- 検証データ不足を克服し,LLMがRTLの機能と低レベルの詳細を両立させること
- FaverはLLMが回路検証の詳細を気にせず機能に集中できるよう,LLMに優しいコード構造とルールベースのテンプレートを組み合わせる。
- 実験の結果,FaverはSFTモデルやオープンソースモデルにおいて,最大14%の生成精度向上を実現した。
- 本研究は,LLMベースのRTL生成ワークフローにおける検証プロセスを効率化する。
RA-Gen:ReActを用いたマルチエージェントタスク実行のための制御可能なコード生成フレームワーク [cs.SE, cs.AI]目的:マルチエージェントタスク実行のための制御可能なコード生成
- 大規模言語モデルのコード生成は進展しているが,安全性,正確性,制御可能性が課題である。
- 既存手法では,外部ツールとの動的統合,透明な推論,安全性のユーザー制御が不足している。
- ReActパラダイムを用いて,安全性と制御性を高めたコード生成を目指す。
- 本フレームワークは,タスク分解,推論とツール統合,コード生成,データ抽出の4つのエージェントで構成される。
- ReActベースのSearcherが内部知識と外部ツールを統合し,正確性とユーザー制御を向上させる。
- SVENデータセットにおいてCodeQLを用いて94.8%のセキュリティ率を達成し,既存手法を上回った。
RAG4Tickets:JIRAおよびGitHubデータを用いた検索拡張生成によるAIを活用したチケット解決 [cs.SE, cs.AI]目的:JIRAおよびGitHubデータの検索拡張生成によるチケット解決
- ソフトウェア開発における課題解決の効率化は,開発速度と品質に直結する重要な要素である。
- 課題解決に必要な情報がJIRA,議論,GitHub PRなど分散しており,迅速な解決を阻害する。
- 過去の類似事例を迅速に検索し,AIが解決策を提案することで,課題解決を支援する。
- 提案システムは,JIRAとGitHubのデータを統合し,セマンティック検索とLLMによる解決策提案を実現した。
- 実験結果から,提案システムは解決精度,修正品質,知識再利用を大幅に向上させることが示された。
- 特に,Precision,Recall,解決時間短縮,開発者の受容性において有意な改善が見られた。
BigCodeArena:コード生成における信頼性の高い人間の選好を,実行を通して明らかに [cs.SE, cs.AI, cs.CL]目的:コード生成における人間の選好データの収集と分析
- 大規模言語モデル(LLM)の性能評価において,人間の評価は重要である。特にコード生成では,専門知識が求められる。
- コードの品質評価は難しく,コードの理解と実行シミュレーションが必要となるため,効率的な評価方法が課題である。
- 実行環境を用いて人間の選好を収集し,コード生成モデルの理解度と生成能力を評価するベンチマークを構築する。
- BigCodeArenaは,LLMが生成したコードを実行可能とし,人間がその結果を評価するプラットフォームである。
- 14,000件以上の会話セッションと4,700件以上のペアワイズ選好データが収集され,LLMの細分化された特性が明らかになった。
- 実行結果に基づく報酬モデルは,人間の選好と高い一致性を示し,AutoCodeArenaによる自動評価の有用性が示された。
Pythonユニットテスト生成のための探索的ハイパーパラメータ調整 [cs.SE]目的:Pythonユニットテスト生成におけるハイパーパラメータ最適化手法
- ソフトウェアの品質向上にはテストが不可欠であり,自動テスト生成はその効率化に貢献する。
- 探索的テスト生成アルゴリズムは設定項目が多く,最適な設定を見つけるのが困難である。
- DynaMOSAとMIOのハイパーパラメータを調整し,テストスイートのカバレッジ向上を目指す。
- 調整されたDynaMOSAアルゴリズムにより,生成されるテストスイートのカバレッジが大幅に向上した。
- 差分進化アルゴリズムは,基本的なグリッドサーチよりも効率的にハイパーパラメータを調整できることが示された。
- メタヒューリスティック探索アルゴリズムによるハイパーパラメータ調整の有効性が確認された。
Neptune:GPUにおける局所性と並列性を実現する高度なMLオペレータ融合 [cs.PL, cs.LG]目的:深層学習オペレータの高度な融合
- 深層学習の計算効率向上の鍵となる技術であり,特に大規模モデルで重要性が増している。
- ループ依存性を持つ複雑な削減計算(アテンション機構など)の融合が困難であった。
- 既存の依存関係を意図的に崩し,代数的な補正式で正しい結果を得る手法を確立する。
- Neptuneは,Triton,TVM,FlexAttentionを含む既存のコンパイラを上回り,FlashAttention実装よりも優れた性能を示した。
- 10種類の注意機構ベースのベンチマークで,平均1.35倍の高速化を実現した。
- NVIDIAとAMDの4種類のGPUアーキテクチャで有効性が確認された。
単一静止ISACにおける瞬時送信CSIなしでの到来角推定について [cs.CY, cs.IT, eess.SP, math.IT]目的:単一静止ISACにおける到来角推定の限界
- 通信とセンシングの統合により,効率的な情報伝達と環境認識が期待されるため。
- 従来のISAC研究では完全なCSIを仮定しており,現実的な統計CSI環境下での性能評価が課題である。
- 統計CSIのみで到来角推定の性能限界を明らかにし,実用的なISACシステム設計に貢献する。
- ベイズCramer-Rao下限(BCRB)を用いて,センシングと通信のレートトレードオフ領域を導出した。
- ターゲット固有のセンシング行列の主固有ベクトルを利用したビーム割当戦略が,個々のAoA推定誤差を最小化する。
- 通信受信機の低いチャネル不確実性を活用することで,通信レートが大幅に向上することが示された。
PyMigTool:Pythonライブラリ移行のためのエンドツーエンドツール [cs.SE]目的:Pythonライブラリ間のコード移行
- ソフトウェア開発において,ライブラリの更新や変更は頻繁に発生し,効率的な移行が重要である。
- 手動移行は時間がかかり,API理解の誤りやコード変換ミスが発生しやすいという課題がある。
- LLMを活用し,APIマッピングからコード変換までを自動化することで,移行作業の負担を軽減する。
- PyMigToolは,LLM,静的解析,動的解析を組み合わせることで,Pythonライブラリ間の正確な移行を実現する。
- 717件の実プロジェクトでの評価により,移行の32%を完全に正しく実行できることが示された。
- 残りの移行に関しても,半数以上のプロジェクトで,開発者が修正すべき変更が14%以下に抑えられた。
学生のコードにおける誤解の自動検出:McMining [eess.SY, cs.SY, cs.CL, cs.SE, cs.AI, cs.CL, cs.CY]目的:学生のコードに現れるプログラミングの誤解のマイニング
- プログラミング学習において,概念理解の誤りは学習の妨げとなるため,早期発見が重要である。
- 学生のコードに潜む誤解を特定する手段が限られており,効率的な学習支援が困難である。
- 学生のコードから誤解を自動的に検出し,個別化された学習支援を可能にすること。
- McMiningというタスクを定義し,誤解のベンチマークデータセットを開発した。
- Gemini,Claude,GPTモデルを基盤とするMcMinerアプローチを提案した。
- 提案手法は,学生のコードにおける誤解の検出において高い有効性を示した。
ビデオゲームのデバッグボトルネックの特定:業界の視点 [cs.SE]目的:ビデオゲームのデバッグにおけるボトルネックの特定
- ゲーム開発は複雑性を増しており,効率的なデバッグ手法の確立が不可欠である。
- 従来のソフトウェアデバッグ手法では,ビデオゲーム特有の問題に対応しきれない。
- ゲーム開発者のデバッグ活動の実態を把握し,ボトルネックを解消すること。
- ゲーム開発者は,ゲーム成果物の検証に平均でデバッグ時間の36.6%を費やしている。
- バグの再現に,デバッグ時間の35.1%が費やされていることが判明した。
- 技術職がデバッグの中心的な役割を担い,様々な職種が連携してデバッグに取り組んでいる。
ファインチューニングされたLLMによるリポジトリを意識したファイルパス検索 [cs.SE, cs.AI]目的:自然言語のクエリから関連するファイルパスを予測すること
- 現代のコードベースは巨大化し,開発者やAIコーディングアシスタントがコードを理解することが困難になっている。
- 従来のコード検索はセマンティックな文脈やファイル間の関連性を捉えきれないという課題がある。
- LLMの自然言語理解能力とリポジトリ固有の詳細を組み合わせ,正確なファイルパス検索を実現すること。
- 強力なLLM(Qwen3-8B)をファインチューニングすることで,高いファイルパス検索精度を達成した。
- 特に,複数のコード認識戦略を組み合わせた学習データを用いることで,91%の完全一致率と93%の再現率を達成した。
- 大規模コードベース(PyTorch)に対しても59%の再現率を示し,スケーラビリティも確認された。
課題駆動型ファイル検索のためのベクトルグラフベースのレポジトリ理解 [cs.SE, cs.AI]目的:課題に起因するファイル検索
- 大規模ソフトウェア開発におけるコード理解の効率化が重要である。
- 複雑なレポジトリ構造から,必要なファイルを迅速に見つけることが困難である。
- レポジトリを知識グラフとして表現し,効率的なファイル検索を可能にすること。
- レポジトリをベクトル化された知識グラフに変換し,プロジェクトのアーキテクチャと意味構造を反映した。
- セマンティック検索とグラフ認識型拡張を組み合わせたハイブリッド検索パイプラインを開発した。
- LLMを活用して,制約付きグラフリクエストの生成と人間が理解しやすい説明を可能にした。
オンライン部分モジュラカバー問題 [cs.DS]目的:部分モジュラ関数を最小コストでカバーする集合の選択
- ネットワーク監視やリソース配分など,現実世界の様々な問題に応用可能な分野である。
- 既存のオフラインアルゴリズムは貪欲法に基づき,オンラインでの実装が困難である。
- オンライン環境下で,指数規模の線形計画緩和を近似的に解き,それを丸める手法を確立する。
- 本研究では,このオンライン部分モジュラカバー問題に対し,多対数オーダーの競争率を持つアルゴリズムを提案した。
- 提案アルゴリズムの競争率は,$O(\ln n \ln (T \cdot f(N) / f_{\text{min}}))$ であり,入力系列の長さ$T$に依存する。
- オンライン集合カバー問題においては,既存の最良アルゴリズムと同等の競争率を達成した。
高密度MIMOチャネル推定のための2次元アイスフィリングによる観測行列設計 [cs.RO, cs.CY, cs.CL, cs.CE, cs.IR, cs.IT, cs.IR, cs.SY, eess.SP, eess.SY, math.IT]目的:高密度MIMOチャネル推定性能の向上のための観測行列の設計
- 近年,通信容量増加のため,多入力多出力(MIMO)の密度増加が注目されている。
- 高密度アンテナ間には強い相関があり,チャネル状態情報(CSI)の事前知識を活用する必要がある。
- CSIの事前知識を活用し,受信パイロットと高密度MIMOチャネル間の相互情報最大化を目指す。
- 提案手法である2次元アイスフィリング(2DIF)は,MIMOチャネル共分散行列の固有空間を分離し,最適な観測行列を生成する。
- 2DIFは,送信・受信アンテナの相関に対応する部分固有空間の固有ベクトルをそれぞれプレコーダ,コンバイナとして設定する。
- シミュレーション結果から,2DIFおよびTS-2DIFは,既存手法と比較して優れたチャネル推定精度を達成することが示された。
可撤回可能な機能による型状態 [cs.HC, cs.CY, cs.PL]目的:状態を持つリソースの安全かつ表現力豊かな管理
- プログラムにおける状態管理は長年の課題であり,特にエイリアシングの存在下では重要である。
- 従来の型状態分析は複雑で,プログラマに明示的な状態追跡を強いる場合がある。
- 機能ベースのアプローチにより,型状態の管理を簡素化し,より安全でエルゴノミックな状態管理を実現する。
- 本研究では,フロー依存の機能メカニズムをフローに依存しない機能メカニズムに拡張することで,両方のパラダイムの長所を統合する新しいアプローチを提案している。
- Scala 3コンパイラへの拡張によって,簡潔で静的に安全,かつ表現力豊かな型状態プログラミングが可能になった。
- ファイル操作,高度なロックプロトコル,DOM構築,セッションタイプなど,幅広い状態パターンをサポートする。
多腕バンディット問題の周波数領域解析:探索と活用間のトレードオフに関する新たな視点 [cs.CL, cs.LG, cs.AI, cs.IT, math.IT, math.OC, stat.ML]目的:多腕バンディット問題における探索と活用間のトレードオフの解析
- 意思決定問題の基礎であり,様々な分野で最適化問題として応用されている。
- 従来の解析は時間領域に偏っており,学習過程の動的な性質を捉えきれていない。
- 周波数領域解析により,学習過程の解釈可能性向上とアルゴリズム設計の基盤を確立する。
- 本研究では,バンディット問題を信号処理問題として捉える周波数領域解析フレームワークを提案した。
- UCBアルゴリズムの信頼区間は,周波数領域において不確実なスペクトル成分に適用される時間変化するゲインと等価であることが証明された。
- これにより,探索率の減衰に関する動的限界を導出し,古典的なアルゴリズムの物理的解釈と次世代アルゴリズム設計の理論的基盤を提供した。
非対称セルラー下りリンクにおける多重入出力を用いた認知無線 [eess.SY, cs.IT, cs.SY, math.IT]目的:認知無線によるスペクトル効率の向上
- 電波資源の有効活用が重要視される中,未利用帯域の活用が求められている。
- 5G環境下では,従来の認知無線研究の仮定が現実と乖離している。
- 基地局位置が不明確な環境下での干渉確率とスループットを評価する。
- 提案手法では,二次基地局の送信が一次ユーザに干渉する可能性を確率に基づいて評価した。
- 「壊滅的な干渉」と「送信機会の逸失」の確率,およびスループットを解析した。
- 本研究は,5Gインフラにおける認知無線システムのスペクトル効率をより現実的に評価する一助となる。
自由に移動:安全なメモリ解放と所有権移転のためのフロー依存型効果 [cs.PL]目的:安全なメモリ解放と所有権移転を可能にするフロー依存型効果システム
- 高階関数型言語における安全なメモリ管理は,プログラムの信頼性確保に不可欠である。
- 既存のメモリ管理手法では,所有権の追跡やライフタイムの管理が複雑になりがちである。
- この研究は,より精密な型システムと効果システムを用いて,安全な手動メモリ管理を実現することを目指す。
- 到達可能性型に,参照の読み書き,移動,解放を記録するポリモーフィックな「使用」と「消去」効果を導入した。
- このシステムは,所有権移転,文脈的新鮮さ,破壊的更新を,リージョンや線形性なしで表現できる。
- 形式化された計算,型付け規則,および操作意味論は,ユースアフターフリーの安全性を検証し,機械的に検証された。
C++におけるコンセプトに基づくジェネリックプログラミング [cs.PL, cs.SE]目的:C++のコンセプトを用いたジェネリックプログラミングの機能と原理の解説
- C++は現代的なプログラミング言語として広く利用されており,その能力を最大限に引き出すことが重要である。
- C++のジェネリックプログラミングは,型安全性の確保やコードの再利用性の向上において課題があった。
- コンセプトを用いることで,より明確な型制約を表現し,コンパイル時のエラー検出を可能にする。
- 本研究では,コンセプトを用いて数値変換の制限や範囲チェックを実装し,型システムを拡張する手法を提示した。
- コンセプトは,C++におけるジェネリックプログラミングの中核であり,言語機能と密接に連携していることが示された。
- コンセプト設計の背景や設計思想,オブジェクト指向プログラミングとの関係についても解説した。
SEER:ソフトウェア要求の持続可能性向上エンジニアリング [eess.SY, cs.SY, cs.SE, cs.AI]目的:ソフトウェア要求における持続可能性の向上
- ソフトウェア開発の拡大は,環境,技術,社会,経済に大きな影響を与える。
- 既存手法は抽象的な指針にとどまり,実装に時間がかかり,チームの適応力に依存する。
- ソフトウェア開発の初期段階から持続可能性を考慮する手法を確立する。
- SEERフレームワークは,ソフトウェア要求段階における持続可能性への対応を可能にする。
- このフレームワークは,一般的な分類から関連する持続可能性要求を特定し,システム要求の持続可能性を評価する。
- Gemini 2.5を用いた実験により,多様なドメインにおける広範な持続可能性に関する懸念を正確に特定できることが示された。
ソフトウェア設計における持続可能性要件の分類に関する試み [cs.CL, cs.FL, cs.SE]目的:ソフトウェア設計における持続可能性要件の体系的な分類
- ソフトウェアは世界の持続可能性問題に大きく影響するため,開発段階から考慮が重要である。
- 既存の研究は断片的で,特定の側面に偏っていたり,適用範囲が限られており,統一的な分類が不足している。
- ソフトウェア開発者が持続可能性を考慮した設計を効果的に行うための参照情報を提供することを目指す。
- 本研究では,環境,技術,社会,経済の4つの側面から持続可能性要件の包括的な分類を提案する。
- 各カテゴリーについて,明確な定義,関連する指標,測定方法を提示する。
- 異なる側面におけるカテゴリー間の相関関係を示すマトリクスを作成し,シナジーと競合を明らかにした。
SWE-Benchの改善:現実的なエージェント評価のためのベンチマーク変異アプローチ [cs.SE, cs.AI]目的:ソフトウェアエージェントの現実的な評価
- ソフトウェア開発エージェントの性能評価は,開発効率向上に不可欠である。
- 既存のベンチマークは,実際のIDEでの利用状況と乖離しており,エージェント能力を過大評価する。
- IDE利用状況に基づいた変異ベンチマークにより,より正確な能力評価を目指す。
- 既存のベンチマークは,エージェントの能力を最大で50%以上過大評価していることが示された。
- 社内ベンチマークにおいても,約10〜16%の過大評価を確認した。
- ベンチマーク変異技術により,対話型ソフトウェアエージェントの評価パラダイムを確立した。
平面グラフにおける長さ制約最小全域木 [cs.CL, cs.DS]目的:長さ制約を満たす最小全域木の探索
- ネットワーク設計やルーティング問題など,様々な応用において重要な最適化問題である。
- 一般的なグラフでは,近似アルゴリズムの性能限界が知られており,効率的な解法が困難である。
- 平面グラフに限定することで,より高性能な近似アルゴリズムを開発し,その性能限界を明らかにする。
- 平面グラフにおいて,任意の定数ε>0に対してO(log^(1+ε) n)近似解を多項式時間で求めるアルゴリズムを提案した。
- 提案アルゴリズムは,長さ制約版の平面グラフセパレータに基づき,長さ制約 Steiner 木にも適用可能である。
- 一般的なグラフにおける長さ制約最小全域木に対する近似アルゴリズムの限界を示し,平面グラフとの近似性能の違いを明確にした。
対数損失とエラーを許容するソフト推測と可変長ソース符号化 [cs.RO, cs.SY, eess.SY, cs.CL, cs.IT, math.IT]目的:対数損失歪み尺度下でのソフト推測における最適推測戦略
- 情報理論において,効率的な情報伝達と圧縮は重要な課題である。
- ソフト推測は,不確実性を考慮するが,最適な戦略は未解決であった。
- エラーを許容するソフト推測の最適戦略と限界を明らかにすること。
- 本研究では,エラーを許容するソフト推測における最適な推測戦略を導出した。
- 単一ショットの推測モーメントの上界と下界,および独立同一分布ソースに対する漸近展開を得た。
- この結果は,推測者が側情報を持つ場合に拡張され,ソフト推測と可変長損失圧縮の関連性を示した。
頂点被覆問題に対する高速な乱択アルゴリズム:自動化されたアプローチ [cs.DS, cs.CC]目的:頂点被覆問題に対するより高速な乱択アルゴリズムの設計と分析
- グラフ理論は,ネットワーク分析や最適化問題に応用され,現代社会の様々な課題解決に不可欠である。
- 頂点被覆問題はNP困難であり,大規模グラフに対する効率的な解法が求められている。
- 自動化された分岐規則生成とMeasure & Conquer法による分析を通じて,既存のアルゴリズムを改善すること。
- 本研究では,次数が制限されたグラフ(次数6まで)および一般的なグラフにおける頂点被覆問題に対して,既知の最速の乱択アルゴリズムを達成した。
- 特に,3次グラフに対するアルゴリズムの計算量はO^*(1.07625^n)であり,次数4のグラフではO^*(1.13735^n)を達成した。
- 一般的なグラフに対しても,O^*(1.25281^k)という良好な結果が得られた。
局所化された指示による正規表現脆弱性の修復 [cs.RO, cs.AI, cs.PL]目的:正規表現脆弱性の修復手法
- 現代コンピューティングの基盤であり,入力検証やデータ解析など重要なタスクに使用される。
- 正規表現拒否サービス(ReDoS)という脆弱性が存在し,自動修復が求められている。
- 記号的アプローチとLLMの弱点を克服し,信頼性の高い修復を実現する。
- 提案手法「LRR」は,脆弱な部分パターンを特定する決定論的モジュールと,その部分パターンを修復するLLMを組み合わせる。
- ルールベースの手法では解決が困難な複雑なケースを修復しつつ,LLM単独のアプローチによる意味エラーを回避する。
- 最先端の手法と比較して,修復率を15.4%p向上させることを実証した。
超大規模MIMO上りリンク向け低複雑度検出器:クロス分割に基づく情報幾何学的アプローチ [cs.IT, math.IT]目的:超大規模MIMOシステムにおける上り信号復調のための,低複雑度な反復検出手法
- 次世代通信システムにおいて,多数のアンテナを用いる超大規模MIMOが重要な技術となる。
- 従来の反復検出器は,基地局アンテナ数に比例して計算量が増加し,処理がボトルネックとなる。
- 自然パラメータのクロス行列分割により,計算量を削減し,実用的な検出手法を確立する。
- 提案手法CS-IGAは,線形および非線形検出において,従来のAMPやIGAと同等またはそれ以上のビット誤り率性能を示す。
- CS-IGAは,少ない反復回数で,大幅に低い計算コストで信号検出を可能にする。
- 本研究は,次世代超大規模MIMOシステムにおける高スループット信号検出のための実用的な解決策を提供する。
LLMを用いた識別子置換による,費用対効果の高い長コード翻訳 [cs.SE, cs.AI, cs.IR, cs.LG]目的:長コード翻訳における費用対効果の向上
- ソフトウェア開発において,コード翻訳は生産性向上に不可欠であり,その自動化ニーズは高い。
- LLMは長大なコードを扱う際にコンテキストウィンドウの制限に直面し,翻訳精度が低下する問題がある。
- 識別子置換によりLLMの負担を軽減し,長コードの論理構造に基づいた翻訳を可能にすること。
- 提案手法は,構文および階層情報を維持しつつ,翻訳結果のトークン数を削減することを示した。
- 識別子を汎用的なプレースホルダーに置き換えることで,LLMはコードの論理構造に集中しやすくなる。
- 本研究は,長コード翻訳における効率性と費用対効果の改善に貢献する。
MEC$^3$O:コードの時間計算量予測における多専門家コンセンサス [cs.AI, cs.SE]目的:コードの時間計算量予測のための多専門家コンセンサスシステム
- ソフトウェア開発やアルゴリズム分析において,コードの複雑度予測は不可欠である。
- 単一のLLMでは,特定の複雑度クラスにおいて性能がばらつき,全体的な予測精度が課題となる。
- LLMを専門分野に特化させ,議論を通じて予測精度を向上させる。
- 提案手法MEC$^3$Oは,既存のオープンソースベースラインと比較して,少なくとも10%高い精度とマクロF1スコアを達成した。
- 平均マクロF1スコアにおいて,GPT-4o-miniを上回り,GPT-4oおよびGPT-4o-miniと同等のF1スコアを示した。
- 多専門家による議論と重み付きコンセンサス戦略が,最終的な予測精度向上に有効であることが示された。
ビラボード広告における複数製品の影響力最大化 [cs.DS, cs.DB]目的:複数製品に対する影響需要を満たすビラボード広告枠の選択
- ビラボード広告は,多くの人々にブランドを認知させる効果的な屋外広告手法である。
- 限られた広告枠で,いかに効果的に影響力を最大化するかが課題である。
- 複数製品の需要に応じた最適な広告枠の組み合わせを求める。
- 本研究では,問題を多サブモジュールカバレッジ問題としてモデル化し,近似アルゴリズムを適用した。
- もう一つの変形問題に対しては,サンプリングに基づく近似アルゴリズムを提案した。
- 実際のデータを用いた実験により,提案手法の有効性と効率性が確認された。
非連結環上の$\mathcal{C}_{D}$コードから得られる最適二値コード [cs.IT, math.IT]目的:非連結環上の$\mathcal{C}_{D}$コードの小体コード$\mathcal{C}_{D}^{(2)}$の構造
- 符号理論は,通信や情報セキュリティにおいて重要な役割を担っており,誤り訂正能力の向上が常に求められている。
- 既存の符号では,効率的な誤り訂正と実装の容易さの両立が課題となっている。
- 新たな符号の構成を通して,より高性能な誤り訂正符号の実現を目指す。
- 本研究では,特定の$\mathcal{C}_{D}$コードの小体コードのハミング重み分布とパラメータを決定した。
- その結果,距離最適となる無限個の符号族を特定し,最小性と自己直交性の十分条件を示した。
- 構成された二重重み符号の応用として,2つの強正則グラフが得られた。
LLMを用いたコーディングにおけるソフトウェア技術者の認識と実践 [cs.SE]目的:LLMを用いたコーディングにおけるソフトウェア技術者の認識と実践
- ソフトウェア開発においてLLMの活用が急速に進んでおり,その影響を理解することが重要である。
- LLMの実際の利用状況や,技術者が感じるメリット・デメリットに関する理解が不足している。
- LLMの導入と利用に関する技術者の視点を明らかにすることで,今後の研究と責任ある利用を促進する。
- LLMは,生産性の向上,認知負荷の軽減,学習の迅速化に貢献すると報告されている。
- しかし,LLMの不正確な出力,文脈理解の限界,倫理的なリスクに対する懸念も存在する。
- 多くの開発者はLLMを独立した解決策ではなく,あくまで支援ツールとして捉えている。
リテレート・トレーシング [cs.SE, cs.PL]目的:プログラムの動作説明
- システム規模の拡大に伴い,専門家から初心への知識伝達の重要性が増している。
- コードコメントは文脈が不足し,設計ドキュメントは具体性に欠けるという課題がある。
- 具体的な実行トレースを用いたプログラム説明により,上記の課題解決を目指す。
- リテレート・トレーシングは,プログラムの動作を注釈付きの実行トレースで説明する。
- TReXというツールを開発し,インタラクティブで視覚的に忠実なリテレート・トレーシングを実現した。
- Linuxカーネル,Git,GCCといった大規模システムソフトウェアへの適用事例がある。
ビラボードおよびソーシャルメディア広告における近似ビス準凸後悔最小化 [cs.GT, cs.DB, cs.DS]目的:ビラボード広告における後悔最小化
- 広告市場の効率化が求められており,限られた広告枠を最適に配分することが重要である。
- 広告主の要求と提供する影響力のずれによる損失(後悔)を最小化する手法が課題である。
- ビラボード広告における後悔を最小化するための離散最適化問題の解決を目指す。
- 予算効率の良い貪欲法と,乱数を用いた貪欲法という2つのアプローチを提案した。
- 提案手法は,計算時間と後悔の最小化のバランスが取れていることが実験的に確認された。
- 乱数を用いた貪欲法は,実データを用いた実験で,現実的な計算時間で後悔を最小化できることが示された。
機械学習ライブラリのための制約条件に基づく単体テスト生成 [cs.SE]目的:機械学習ライブラリの単体テスト生成の有効性向上
- 機械学習ライブラリは現代の多様なアプリケーションに不可欠であり,その品質保証が重要である。
- 既存の自動テスト生成ツールは,機械学習APIの複雑な入力制約を考慮できず,テストの早期失敗や網羅性の低下を招く。
- APIドキュメントから抽出した制約条件を活用し,より適切なテストケースを生成することでテストの質を向上させる。
- PynguinMLは,Pynguinと比較して,テストの有効性を大幅に向上させることが示された。
- 評価の結果,PynguinMLは最大63.9%高いコードカバレッジを達成した。
- 機械学習APIに対する制約条件を考慮することで,より徹底的なテストと高いコードカバレッジが可能となった。
ランダムシフトの再検討:木埋め込みとL1非依存ルーティングに対するタイトな近似 [cs.DS]目的:グラフの木埋め込みとL1非依存ルーティングの近似率向上
- グラフ理論において,大規模グラフの効率的な処理は重要課題であり,距離を保存する木埋め込みが鍵となる。
- 従来の木埋め込み手法では,近似率と計算時間のトレードオフが存在し,特に並列分散環境での高速化が困難であった。
- ランダムシフト分解の新たな解析により,距離の歪みを抑えつつ,高速な木埋め込みとルーティングを可能にすることを目指す。
- ランダムシフト分解が,距離の中心からの距離と分離確率の間にタイトな定数レベルのトレードオフを持つことが示された。
- この結果を利用することで,グラフ距離を期待値でO(log n)の歪みで保存する木を構成できる。
- 提案手法は,逐次,並列,分散環境で最適な計算量,深さ,ラウンド数で実装可能である。
慢性疾患ケアのための患者デジタルツインのセマンティックフレームワーク [cs.SE, cs.ET]目的:慢性疾患ケアにおける患者デジタルツインのセマンティックフレームワーク
- 個別化医療の重要性が高まる中,多様な健康データを統合する枠組みが求められている。
- 既存のデジタルツインは特定の臓器やデータに限定され,統合性とプライバシー保護が課題である。
- 断片化されたデータを統合し,セマンティック標準化を実現することで,次世代のデジタルヘルス生態系を構築する。
- 患者医療デジタルツイン(PMDT)は,生理学的,心理社会的,行動的,ゲノム情報を統合した,拡張可能なモデルである。
- PMDTはOWL 2.0で実装され,セマンティック相互運用性,自動推論,そして多様な臨床コンテキストでの再利用を可能にする。
- 評価の結果,PMDTは異種データの統合,コンピテンシー質問の運用,そして記述的・予測的・処方的分析を可能にすることが示された。
癌免疫療法のための連合データ分析:患者管理のためのプライバシー保護協調プラットフォーム [cs.CY, cs.AI, cs.LG, cs.SE]目的:癌免疫療法を受ける患者の管理のためのプライバシー保護協調プラットフォーム
- 患者中心の医療が重要視される中で,医療データ統合による個別化医療の実現が期待されている。
- データアーキテクチャ,アプリケーションの相互運用性,セキュリティなどの課題が,データ統合の障壁となっている。
- 患者データプライバシーを保護しつつ,データ分析による意思決定支援と医療の質向上を目指す。
- 開発された協調デジタルフレームワークは,医療関係者間の連携を促進し,癌患者管理におけるデータ分析を可能にする。
- フェデレーションされたビッグデータ分析と人工知能を活用することで,治療推奨や有害事象予測の精度向上を実現した。
- パイロット研究において,70%~90%の精度でその有効性が確認され,実臨床での応用可能性を示唆した。
宣言的なマッピングルールを用いたCodeMeta生成:ShExMLによるオープンエンドなアプローチ [cs.DL, cs.SE]目的:研究ソフトウェアのメタデータ生成手法
- 科学研究においてソフトウェア利用が不可欠であり,再現性を担保するためにはメタデータの整備が重要である。
- 研究ソフトウェアのメタデータは多様なモデルで表現され,散在しているため,相互運用性が課題となっている。
- CodeMetaを用いて研究ソフトウェアメタデータを標準化し,FAIR原則への適合を促進することを目的とする。
- 宣言的なマッピングルールを用いてCodeMetaファイルを生成するShExMLの実装例を示した。
- 既存のソフトウェア成果物に対して2つのCodeMetaファイル生成クロスウォークを拡張・統合した。
- 生成されたCodeMetaファイルはSHACLとShExで検証され,ワークフロー全体が自動化された。
RepDL:ビットレベルで再現性のある深層学習の学習と推論 [cs.LG, cs.SE]目的:深層学習の学習と推論における再現性の確保
- 深層学習は高い性能を発揮するが,再現性の問題が実用上の課題となっている。
- ランダム性制御は可能だが,浮動小数点演算の非一貫性が再現性を阻害する。
- 浮動小数点演算における丸め誤差と演算順序依存性を解消し,ビットレベルでの再現性を実現する。
- RepDLは,様々な計算環境において決定論的かつビットレベルで再現可能な深層学習を可能にするオープンソースライブラリである。
- 正しい丸め処理と演算順序の不変性を強制することで,浮動小数点演算の非一貫性を克服している。
- RepDLを用いることで,異なるプラットフォーム間での学習・推論結果の一致性が保証される。
Zak-OTFS受信機のためのハイブリッドI/O関係推定方式 [cs.IT, eess.SP, math.IT]目的:Zak-OTFS変調における遅延-ドップラー領域の入出力(I/O)関係の推定
- 無線通信において,信頼性の高い信号検出は重要な課題である。I/O関係の正確な推定は,そのために不可欠である。
- 従来のモデル依存型アプローチは複雑であり,モデルフリー型アプローチは推定領域に制限があるという課題があった。
- モデルフリー型アプローチの推定領域の制限を克服し,I/O関係推定の精度を向上させることを目指す。
- 提案手法は,モデルフリー推定領域外の粗推定値をモデル依存型方式で取得し,モデルフリー推定値と組み合わせることで,I/O関係の推定精度を向上させる。
- Vehicular-A,TDL-A,TDL-Cチャネルモデルを用いたシミュレーションにより,提案手法が純粋なモデルフリーアプローチよりも優れた性能を発揮することが示された。
- 提案手法は,排他的および埋め込みパイロットフレームの両方に対して適用可能である。
物理的に複製不可能な関数に対する逐次偏極自己同型アンサンブル復号器 [cs.IT, eess.SP, math.IT]目的:物理的に複製不可能な関数(PUF)向けに,極めて低い誤り率を実現する効率的な超低レート誤り訂正符号の設計
- PUFはセキュリティデバイスの重要な要素であり,その信頼性向上が求められている。
- PUFの入力ビット誤り率が高いにも関わらず,極めて低い誤り率が要求されるため,効率的な誤り訂正符号が必要である。
- 偏極符号と自己同型アンサンブル復号(AED)を組み合わせることで,PUFに適した低複雑な符号化方式を提案し,その効率性を検証する。
- 提案手法は,既存のBCH符号と同等の誤り率($10^{-6}$)を維持しつつ,符号語ビット数を1.75倍削減することに成功した。
- ビット数削減により,ヘルパーデータストレージ量とチップ面積の削減に貢献する。
- 逐次AED方式は,単一の逐次キャンセル(SC)復号器を再利用し,低コストで効率的な復号を実現している。
ノード支配とエッジ支配ハイパーグラフ書き換え規則の一致 [cs.DS]目的:ハイパーグラフに対するエッジ支配およびノード支配の書き換え規則の一致性
- ハイパーグラフは,様々な計算機科学分野でモデル化に利用され,その効率的な処理が重要である。
- ハイパーグラフの最小ヒット集合の計算において,書き換え規則の適用順序依存性が課題となる場合がある。
- エッジ支配とノード支配の書き換え規則が一致することを示し,最小化過程の安定性を保証することを目指す。
- エッジ支配とノード支配の規則は,同型を除いて一致することが証明された。
- この一致性により,書き換え規則の適用順序に関わらず,一意な最小ハイパーグラフが得られることが示唆される。
- この結果は,最小ヒット集合計算の効率化に貢献する可能性がある。