arXiv雑要約
プログラム - 2026/03/10 公開
GraphSkill:ドキュメント誘導型階層的検索拡張コーディングによる複雑なグラフ推論 [cs.SE, cs.AI, cs.CL, cs.LG]目的:複雑なグラフ推論のための手法
- グラフアルゴリズムの自動推論の需要が高まっており,LLMコミュニティで注目されている。
- 既存手法では,技術ドキュメントの階層構造が無視され,ノイズの多い検索結果となる。
- 技術ドキュメントの階層構造を活用し,論理エラーを修正することで推論精度向上を目指す。
- 提案手法GraphSkillは,ドキュメント階層構造を上位から下位へ辿ることで,ノイズを削減し,高品質なコード生成を実現した。
- 自己デバッグコーディングエージェントにより,自動生成された小規模テストケースを用いてコードを反復的に改良した。
- 新たなデータセット{\dataset}を用いて評価を行い,既存手法と比較して高いタスク精度と低い推論コストを達成した。
探索空間理論:前提知識を考慮した位置情報ベース推薦の形式的基礎 [cs.IR, cs.AI, cs.DS, cs.LG]目的:位置情報ベース推薦における前提知識依存性の形式的表現
- 位置情報推薦は高度化しているが,場所の体験には前提知識が不可欠である。
- 場所間の前提知識の依存関係を形式的に表現する枠組みが存在しない。
- 前提知識を考慮した推薦の形式的保証を提供する理論を構築すること。
- 探索空間理論(EST)は,位置情報推薦に知識空間理論を応用した形式的枠組みである。
- ESTにおいて,有効なユーザー探索状態は有限分配格子を形成し,段階的な学習空間を提供する。
- ESTに基づいた探索空間推薦システム(ESRS)は,形式的な妥当性保証を提供する。
部分情報分解の数学的景観:性質と測度の包括的レビュー [cs.IT, math.IT]目的:部分情報分解の数学的構造と特性
- 複雑なシステムの情報を記述する上で,情報理論的枠組みの重要性が高まっている。
- 部分情報分解の構築方法に一意な解が存在せず,多様な形式主義が存在する。
- 既存の測度を統合し,部分情報分解の数学的構造を体系的に調査する。
- 既存の部分情報分解測度を共通言語に統合し,各測度が既知の性質を満たすかを系統的に評価した。
- これらの性質間の関係性や両立不能性を明らかにする定理のネットワークを導出した。
- この枠組みの歴史的変遷を整理し,理論的洗練と実証的応用への道筋を示した。
ブール値を超えて:データ変換と時間仕様の学習 [cs.LO, cs.AI, cs.FL, cs.PL]目的:データ変換と時間仕様の学習
- システムの振る舞いを自動的に捉え,仕様を抽出する技術は,複雑化するシステム開発に不可欠である。
- 既存手法はブール値抽象化に限定され,データ依存性の高いシステム仕様の表現に課題があった。
- より豊かなデータ型を扱うことで,データに依存するシステムの振る舞いを正確に捉えることを目指す。
- 提案手法は,構文誘導合成(SyGuS)を利用して候補関数を特定し,トレーサビリティを向上させた。
- 時間仕様の形式化言語TSL$_f$を導入し,時間的制約とデータ変換を統合的に学習することを可能にした。
- OpenAI-Gymnasium環境での実験により,汎化性能とサンプル効率の高さが実証された。
PolyBlocks:AIチップおよびプログラミングフレームワークのためのコンパイラ基盤 [cs.PL, cs.LG]目的:AIチップおよびプログラミングフレームワーク向けコンパイラ基盤の設計と実装
- AI処理の高性能化が求められる現代において,ハードウェアとソフトウェアの協調が不可欠である。
- AIチップの多様化に伴い,各チップに最適化されたコンパイラの開発が課題となっている。
- 新たなAIチップへの対応を容易にし,高性能なコード自動生成を実現することを目標とする。
- PolyBlocksは,MLIRを基盤とするモジュール性と再利用性に優れたコンパイラ基盤である。
- PyTorchおよびJAX向けのJITコンパイル実験において,Torch InductorやXLAと同等以上の性能を示す場合がある。
- 行列積や畳み込みなどの演算において,ベンダー提供のライブラリや手動最適化されたカーネルに匹敵する性能を発揮する。
量子論理における3種類の固定次元充足可能性の意味論:含意と明示的な分離子 [cs.LO, cs.CC, math.LO]目的:量子論理における充足可能性の意味論の比較
- 量子情報処理の基礎理論であり,量子コンピュータ実現のための論理的枠組み構築に不可欠である。
- 古典論理との整合性や,量子特有の現象を論理的に記述する際の課題が存在する。
- 異なる意味論が充足可能性に与える影響を明確にし,それぞれの意味論の特徴を捉える。
- 固定次元ヒルベルト空間における3つの充足可能性の意味論間の包含関係が明らかになった。
- 標準意味論は,グローバル可換射影意味論と部分ブール意味論を含むことが示された。
- 特定の論理式SEP-1は,標準意味論では充足可能だが,他の2つの意味論では充足不可能であることが証明された。
エージェント狩り:LLMエージェントによる報酬ベースの協調的自動形式化 [cs.LO, cs.AI, cs.SC]目的:大規模な代数的トポロジーの自動形式化
- 形式化された数学的理論は,信頼性の高いソフトウェアやハードウェアを構築する上で不可欠である。
- 自動形式化は計算コストが高く,既存の方法では大規模な理論を効率的に形式化できない。
- LLMエージェントの協調的な活用により,自動形式化のスケールと効率を向上させる。
- 複数のLLMエージェントが,報酬に基づいた市場メカニズムを通じて,自動形式化のタスクを分散して処理する実験を行った。
- エージェントは,新しい補題の提案,報酬の設定,証明義務の履行競争を行うことで,協調的な証明探索と理論構築を実現した。
- 提案された証明は,基盤となる証明アシスタントによって検証され,その結果,大規模な自動形式化の可能性が示唆された。
ResearchEnvBench:研究コード実行のための環境合成におけるエージェントのベンチマーク [cs.SE, cs.AI]目的:研究コード実行のための環境合成におけるエージェントの性能評価
- 科学研究の自動化が求められており,エージェントの活用が期待されている。
- 既存のベンチマークは環境構築を前提としており,その能力評価が不足している。
- 研究に必要な環境を自動構築するエージェントの開発を促進する。
- ResearchEnvBenchは,研究リポジトリと実行設定から環境を構築するベンチマークである。
- 現状の最先端エージェントは,依存関係の解決やバージョン管理の脆さから失敗が多い。
- 本ベンチマークは,再現性のある科学研究を可能にするエージェント開発のテストベッドとなる。
下部構造報酬を用いたマルチエージェント強化学習 [cs.LG, cs.DS]目的:下部構造報酬を持つ環境における協調型マルチエージェント強化学習
- 複数のエージェントが協調してタスクを達成する場面は現実世界で多く,その重要性は高い。
- 従来の強化学習はエージェント間の貢献が重複する場合に対応が難しく,計算量が指数的に増加する。
- 下部構造報酬の特性を利用し,エージェント数の増加に対するスケーラビリティを改善すること。
- 下部構造報酬環境に対する強化学習の形式的な枠組みと,サンプル効率と後悔境界を持つアルゴリズムを提案。
- 既知のダイナミクスにおいて,貪欲な方策最適化は$1/2$-近似を多項式時間で達成する。
- 未知のダイナミクスに対しては,UCBに基づく学習アルゴリズムが$O(H^2KS\sqrt{AT})$の後悔を達成する。
エージェント型AIにおける障害の特性評価:種類,症状,根本原因の分類 [cs.SE]目的:エージェント型AIシステムにおける障害の種類,症状,根本原因の分類
- AI技術の進展に伴い,複雑なタスクを自律的に実行するエージェント型AIの重要性が増している。
- エージェント型AIシステムの信頼性に関する実証的な理解が不足している。
- 実世界のシステムで発生する障害の発生源,現れ方,伝播を明らかにすること。
- 大規模な実証研究により,13,602件の障害とプルリクエストを分析し,385件を詳細に調査した。
- 障害の種類,症状,根本原因の分類を導き出し,障害間の関連性を統計的に明らかにした。
- 生成された分類は,開発者調査で高い代表性と網羅性が評価された (平均3.97/5, 83.8%が遭遇した障害を網羅)。
Twitch:等式定理証明のための抽象化学習 [cs.LO, cs.AI]目的:等式定理証明における興味深い項のパターン(抽象化)の自動発見
- 自動推論の成功には,人間による適切なガイダンスが重要である。効率的な探索のため,有用な情報に着目する必要がある。
- 有用な項や節の形状を人間が手動で特定する必要があり,その作業は煩雑で時間がかかる。
- 自動的に有用な項のパターンを発見し,定理証明の効率を向上させることを目指す。
- Twitchは,Stitchの技術を活用し,失敗した証明や既存の証明から抽象化を生成する。
- TPTPのUEQ問題を用いて評価した結果,12個の難易度1の問題を証明することに成功した。
- また,他の多くの問題においても証明時間の短縮が確認された。
自動脆弱性修復におけるパッチの検証 [cs.HC, cs.MA, cs.SE]目的:自動脆弱性修復システムのパッチ検証手法の信頼性向上
- ソフトウェアの安全性確保は重要であり,脆弱性への迅速な対応が求められている。
- 既存の自動脆弱性修復システムは,パッチの基本的なテストに合格するのみで,開発者が追加する詳細なテストは考慮されていない。
- 詳細なテスト(PoC+テスト)を検証に組み込むことで,パッチの成功率をより正確に評価することを目指す。
- 構築したベンチマークPVBenchを用いて評価した結果,基本的なテストを通過したパッチの40%以上がPoC+テストに失敗することが判明した。
- これは,既存の自動脆弱性修復システムがパッチの成功率を過大評価している可能性を示唆している。
- 誤って正しいと判定されたパッチの分析から,根本原因分析,プログラム仕様への準拠,開発者の意図の把握が改善すべき点として示唆された。
並列チャネルにおける目標レート最小二乗電力割当 [cs.IT, math.IT]目的:並列ガウスチャネルにおける目標スペクトル効率下での電力割当
- 無線通信システムの容量を向上させるため,効率的な電力割当が重要である。
- 従来の電力割当手法では,目標レートを正確に達成できない場合がある。
- 目標レートを最小二乗誤差で最適化し,目標達成精度を向上させる。
- 提案手法は,目標レートを超過することなく,未使用電力が発生する場合があることが示された。
- チャネルごとの閉形式解が得られ,二分探索により効率的な計算が可能となった。
- 数値実験により,提案手法はウォーターフィリングや比例公平性よりも優れた目標追跡性能を示すことが確認された。
LLM2SMT:人間が書いたコードなしでSMTソルバーを構築する [cs.RO, cs.RO, cs.LO]目的:大規模言語モデルによるSMTソルバーの構築
- 形式検証や自動推論において,SMTソルバーは重要な役割を担っている
- SMTソルバーの開発には専門知識と膨大な労力が必要とされる
- 大規模言語モデルを用いて,人間が書いたコードなしでSMTソルバーを構築する
- 大規模言語モデルを用いて,QF_UFのDPLL(T)スタイルのSMTソルバーが構築された。
- ソルバーは,Nieuwenhuis-Oliveras合同閉包アルゴリズムを実装し,前処理機能も備えている。
- ベンチマークテストの結果,既存のソルバーと競争力のある性能を示した。
Elenchus:反証的対話から知識ベースを生成する [cs.CL, cs.AI, cs.LO]目的:反証的対話を通じた知識ベースの構築
- 知識獲得は,専門家の証言やテキストからの抽出が主流だが,より根本的な推論構造の明示が重要である。
- 既存の知識獲得手法では,推論関係が暗黙的で,知識の構造的な整合性が確認しづらいという課題がある。
- 本研究は,対話を通じて推論関係を明示化し,構造的に整合性のある知識ベースを構築することを試みる。
- Elenchusは,推論主義的意味論に基づき,人間とLLMの反証的対話を通じて知識ベースを構築するシステムである。
- 対話状態をNMMS論理の素材基底にマッピングすることで,推論関係を形式的に表現し,知識の構造化を実現している。
- PROV-Oオントロジーへの適用により,Elenchusが設計上の緊張を抽出し,形式的な推論と整合することを示した。
手動変異分析と管理のための宣言的フレームワーク [cs.RO, cs.HC, cs.SY, eess.SY, cs.SE]目的:手動変異分析と管理のための宣言的フレームワーク
- ファジングやプロパティベーステストの評価において,手動変異体の重要性が増している。
- 既存のツールは断片的で,可読性,変異体保持,実行コストのトレードオフを強いられる場合がある。
- 変異体の表現と操作に関する統一的なフレームワークを提供し,効率的な実験を可能にすること。
- 本研究では,コメント,プリプロセッサ,パッチ,マッチ&リプレース,AST内変異の5つの変異表現を特徴づけた。
- 変異表現を共通の中間形式に変換する損失のないパイプラインを定義し,AST内変異の抽出と正規化戦略を提示した。
- Marauderというプロトタイプシステムを実装し,変異体の注入,活性化,リセット,合成を様々な表現で実現した。
ソフトウェアアーキテクチャにおける小規模言語モデルの推論能力の探求:ソフトウェアエンジニアリング2.0に向けた多次元評価フレームワーク [cs.SE]目的:ソフトウェアアーキテクチャにおける小規模言語モデルの推論能力の評価
- ソフトウェア開発の効率化が求められる中で,AIによる支援が不可欠となっている。
- 大規模言語モデルは高性能だが,コストやプライバシーの問題がある。
- 小規模言語モデルの推論能力の限界を明らかにし,実用的な活用方法を模索する。
- 30億パラメータ以上のモデルはゼロショットで高い能力を示すことが明らかになった。
- 20億パラメータ以下のモデルはファインチューニングによるBERTScoreの改善が期待できるが,必ずしもコンプライアンス向上に繋がらない。
- Few-Shotプロンプティングは,特定のモデルの性能を効果的に調整する手段となり得る。
定数冗長性を持つアナログ誤り訂正符号 [cs.IT, math.IT]目的:アナログ誤り訂正符号の性能向上
- アナログ回路におけるノイズやばらつきは性能低下の主要因である。
- ベクトルの行列乗算をアナログ実装する際,誤りが発生しやすい。
- 高度プロファイルを最小化し,単一誤り訂正能を向上させる。
- 高さプロファイルの上限値を導出し,単一誤り訂正のための簡素な復号器を提案した。
- 冗長度3のアナログ誤り訂正符号族を構築し,既存のMDS構成よりも小さい高さプロファイルを達成した。
- 任意の符号長に対して,単一誤り訂正が可能な符号を設計した。
二層RSMAにおけるユーザ公平性の向上:移動アンテナアプローチ [cs.RO, cs.IT, math.IT]目的:ユーザ公平性の向上
- 高度な多重ユーザシステムにおいて,ユーザ公平性は重要な課題である。
- 二層RSMAのようなシステムでは,ユーザ間の公平性を確保することが難しい。
- 移動アンテナを用いることで,ユーザ間の公平性を改善することを目指す。
- 提案手法は,ビームフォーミング,ユーザクラスタリング,共通レート割り当て,アンテナ位置ベクトルを同時に最適化する。
- 動的近傍プルーニング粒子群最適化法により,効率的にアンテナ位置ベクトルを探索する。
- シミュレーション結果は,提案手法が既存手法と比較して有意な公平性向上を実現することを示している。
SATソルバーの初期分岐順序のランキング学習 [cs.AI, cs.LO]目的:SAT問題解決における効率的な分岐順序の予測
- SAT問題の効率的な解決は,現代の計算機科学における重要な課題である。
- 最適な分岐順序を見つけることは計算量的に困難であり,SATソルバーの性能を大きく左右する。
- グラフニューラルネットワークを用いて初期分岐順序を予測し,SATソルバーの性能向上を目指す。
- グラフニューラルネットワークによる初期分岐順序の予測は,ランダムな3-CNFおよび準産業用ベンチマークにおいて,大幅な高速化をもたらすことが示された。
- しかし,より難易度の高い産業用インスタンスにおいては,予測の効果は限定的であることが判明した。
- これは,ソルバーの動的なヒューリスティクスが初期化を上書きすること,および複雑なインスタンスに対する予測の困難さに起因すると考えられる。
状態変化から創造的決定へ:創造的領域における痕跡の記録と解釈 [cs.HC, cs.AI, cs.PL]目的:創造活動の痕跡分析
- 創造性は社会や文化の発展に不可欠であり,そのメカニズム解明が求められている。
- 既存手法では,状態変化のみを記録し,創造的な意図や関係性を捉えられない。
- 創造活動における意図や関係性を明示化し,より深い分析を可能にすること。
- 状態変化を記録するだけでなく,創造的な意図を考慮する新たなアプローチを提案。
- GenAI,可視化,プログラミング環境の3領域で,創造的な動きを捉える手法を開発。
- ノードベースのインターフェース,視覚的合図の語彙,意味的履歴を埋め込んだプログラミングモデルを提示。
開発者コミュニティにおけるソフトウェアバグ解決策推薦のための社会コンテキスト埋め込みを用いたハイブリッドLTRシステム [cs.SE, cs.AI]目的:ソフトウェアバグ解決策の推薦
- ソフトウェア開発において,エラーやバグの解決は不可欠であり,開発効率に大きく影響する。
- Stack Overflow等のQ&Aサイトは有用だが,回答数が多く最適な解決策を見つけるのに時間がかかる。
- Stack Overflowの情報を活用し,開発者が迅速かつ正確にバグ解決策を見つけられるようにすること。
- 提案モデルは,Stack Overflowの特徴を埋め込んだ学習ランキング(LTR)モデルを使用することで,ソフトウェアバグに対する解決策を推薦する。
- テキストマイニング,自然言語処理,推薦アルゴリズムを組み合わせ,最適なバグ解決策を抽出・評価・推薦する。
- 上位10件の回答推薦において,約78%の正答率を達成した。
スケッチ指向データベース [cs.LO, cs.DB]目的:データベースパラダイムの定式化
- データ管理は情報システムの根幹であり,その効率性と柔軟性が重要である。
- 既存のデータベース理論は多様であり,異なるモデル間の統合が課題となっていた。
- データベースモデル間の共通基盤を提供し,モジュール性と拡張性を実現すること。
- 本研究では,データベースパラダイムを有限限界スケッチとして符号化する「スケッチ指向データベース」を提案した。
- RDFトリプルストアやプロパティグラフといったグラフ指向パラダイムを通じて,形式主義を説明した。
- パス計算のための推論規則と,モジュール化とスケーラブルなモデル成長を可能にする「スタタリングスケッチ」を紹介した。
有限体上の小行列乗算の複雑度下界:バックトラッキングと置換による証明 [cs.HC, cs.DB, cs.CC, cs.DS]目的:有限体上の行列乗算における双線形複雑度の下界
- 行列乗算は線形代数の基礎であり,計算科学の多くの分野で不可欠である。
- 既存の手法では,行列乗算の複雑度を厳密に評価することが困難であった。
- バックトラッキングと置換法を用いて,より厳密な下界を導出すること。
- 本研究により,2元体$\mathbb{F}_2$上での$3 \times 3$行列乗算の双線形複雑度が少なくとも20であることが証明された。
- これは,2003年のBläserによる既存の下界19を改善するものである。
- 証明は自動的に生成され,短時間で検証された。
展開制約はLLMに幻覚的な引用を生じさせるか?4つのモデルと5つのプロンプト戦略による実験的研究 [cs.CL, cs.IR, cs.AI, cs.SE]目的:LLMにおける幻覚的な引用の検証可能性
- 学術論文作成やソフトウェア工学における証拠統合においてLLMの利用が拡大している。
- LLMは,一見正当に見える参考文献を幻覚することが多く,信頼性の問題がある。
- 展開制約がLLMの引用生成に与える影響を検証し,幻覚を抑制する。
- 17,443件の生成された引用において,どのモデルも存在率は0.475を超えなかった。
- TemporalおよびCombo条件は,形式に準拠しつつ,存在率の低下が最も顕著であった。
- 未解決の引用が多数を占め,その多くは捏造されたものであることが示唆された。
証明の複雑さが同程度の練習問題の自動生成法 [cs.LO]目的:証明の複雑さが同程度である練習問題の自動生成
- 教育現場における課題解決能力向上のためには,多様な難易度の練習問題が不可欠である。
- 手動での練習問題作成には時間と労力がかかるため,教育者の負担が大きい。
- 機械的に生成された練習問題の難易度制御を可能にし,教育への自動化を促進すること。
- 本研究では,与えられた練習問題と同程度の証明の複雑さを持つ練習問題を自動生成する方法を提案している。
- その方法は,一階述語論理で記述された離散数学の練習問題に焦点を当て,論理記号を含まないカットベースのトーブル証明を用いて証明の複雑さを評価する。
- 提案手法を実装するための計算手順を導出し,自動生成の実現可能性を示した。
Echo:グラフを用いた検索と実行フィードバックによる再現テスト生成 [cs.SE]目的:再現テストケースの生成
- バグの原因特定は開発者の課題であり,迅速な解決が求められる。
- バグレポートが再現テストケースを欠いていることが多く,手動作成には労力がかかる。
- 再現テストケースの自動生成による開発効率の改善を目指す。
- Echoは,コードグラフとクエリ改善戦略により,コンテキスト検索を強化する。
- 生成されたテストケースを自動実行し,開発ワークフローへの統合を実現する。
- SWT-Bench Verifiedでの実験で,オープンソース手法の中で最高の結果(66.28%の成功率)を達成した。
テンソルネットワーク縮約のスケッチによる近似 [cs.DB, cs.DS]目的:テンソルネットワーク縮約の近似手法
- テンソルネットワーク縮約は,様々な分野で基盤となる演算であり,応用範囲が広い。
- 既存のスケッチ手法は,非巡回テンソルネットワークにしか対応していないという課題がある。
- 巡回テンソルネットワークを含む任意のテンソルネットワーク縮約を近似する手法を開発する。
- 本研究では,巡回テンソルネットワークを含む任意のテンソルネットワーク縮約を近似する新しい手法を提案した。
- 既存の手法は縮約回数に対して指数時間的な計算量が必要だが,提案手法は多項式時間で済む。
- 非巡回テンソルネットワークに対しては,より効率的な手法を提示し,計算量と空間量を大幅に削減した。
コンテキストチャネル容量:破滅的忘却を理解するための情報理論的枠組み [cs.LG, cs.AI, cs.IT, math.IT]目的:継続学習における破滅的忘却のメカニズム解明
- 継続学習は,AIの柔軟性と適応性を高める上で不可欠な研究分野である。
- 既存の継続学習手法では,新しいタスクを学習する際に過去の知識が失われる現象(破滅的忘却)が課題となっている。
- 本研究は,情報理論的枠組みを用いて破滅的忘却を定量的に評価し,その回避策を提示することを目的とする。
- 継続学習アーキテクチャの「コンテキストチャネル容量」と忘却の度合いの間に強い相関関係が示された。
- コンテキストチャネル容量が低い手法では破滅的忘却が発生し,高い手法では忘却が抑制されることが実験的に確認された。
- ハイパーネットワークのような手法は,パラメータを状態ではなく関数値として定義することで,この制約を回避できることが示された。
リモートおよびハイブリッド型ソフトウェアチームにおける回帰テスト:プロセス,ツール,およびプラクティスの探索的研究 [cs.RO, cs.SE]目的:リモートおよびハイブリッド環境下における回帰テストの実施と経験
- ソフトウェア開発における品質保証は,顧客満足度と信頼性を高める上で不可欠である。
- リモートワークの普及に伴い,チーム間の連携や情報共有が困難になり,品質保証プロセスに課題が生じている。
- リモート環境下における回帰テストの効率的な実施方法と,品質保証の維持・向上策を明らかにすること。
- 回帰テストの主要な段階は安定しているものの,非同期的なコラボレーションを支援するため,ドキュメント,自動化,ツール連携への依存度が高まっている。
- 標準化されたレポート,共有リポジトリ,トレーサビリティ機構を通じて,コミュニケーションおよび調整の課題が軽減されている。
- 回帰テストは,人的コラボレーションとデジタルインフラストラクチャの相互作用によって形作られる社会技術的実践であることが明らかになった。
ソフトウェア工学教育における共感性:エビデンス,実践,そして機会 [cs.SE]目的:ソフトウェア工学教育における共感性の利用,教育,議論の実態
- ソフトウェア開発において,協調性,倫理観,ユーザー中心設計が不可欠であり,共感性はそれらを支える重要な能力である。
- 共感性は他の分野で専門教育の一環として探求されてきたが,ソフトウェア工学教育への組み込みは断片的である。
- 本研究は,共感性をカリキュラムに構造的に統合するための教育実践や成果,分野間の違いを明らかにすることを目的とする。
- 工学系プログラムでは共感性を倫理的・内省的な能力と関連付けて捉える一方,ソフトウェア工学では構造化された設計指向の実践へと翻訳されている。
- 両分野において,共感性教育は協調性,倫理的思考,偏見の認識,そしてモチベーションの向上に貢献する。
- 共感性は,ソフトウェア工学教育において,評価可能な教育的要素へと進化しつつあり,継続的かつ評価可能な要素として組み込むことが重要である。
二元マルコフ情報源における単一文字d-傾斜和の変動について [cs.IT, math.IT]目的:二元マルコフ情報源における,ハミング歪み下でのBlahut-Arimoto動作点によって誘起されるd-傾斜和
- 有限ブロック長レート歪み理論において,d-傾斜情報は重要な役割を果たす。
- 有限ブロック長における正確な分布の導出が困難である。
- d-傾斜和の変動を解析し,有限ブロック長での正確な分布を求める。
- 中心化されたブロック和 $J_n(D) - n\mu_D$ は,マルコフ連鎖の占有数 $N_n$ のアフィン変換として正確に表現されることが示された。
- 歪みレベル $D$ に依存しない累積量,有限-$n$分散の閉じた形,および正確な有限-$n$分布が導出された。
- これらの結果は,$2 \times 2$ 転送行列によって記述される累積量生成関数によって特徴付けられる。
サブ波長スケールにおける高精度な双方向無線センシングの追求 [cs.IT, cs.ET, cs.HC, cs.LG, math.IT]目的:双方向無線センシングにおける高精度化手法
- 無線通信を利用した非接触センシングは,インフラの普及と非侵襲性から注目されている。
- 無線通信の双方向配置による時計の非同期性が位相オフセットを生み,高精度なセンシングを妨げる。
- 既存手法の整数波長分解能の限界を克服し,サブ波長レベルの検出を可能にすること。
- 歪んだチャネル比と理想的なチャネル特徴の間の定量的な関係を初めて導出した。
- チャネル応答の振幅を利用して,歪んだ比から理想的なチャネル特徴を復元するロバストなフレームワークを開発した。
- Wi-FiとLoRaを用いた実環境実験で,サブ波長分解能での変位の詳細な再構築と,精度の大幅な向上が確認された。
深層学習に基づく自動パッチ正当性評価におけるコード表現の有効性 [cs.SE]目的:自動パッチ正当性評価におけるコード表現の性能評価
- プログラムの自動修復は,ソフトウェア開発における重要な課題であり,開発効率の向上に貢献する。
- 弱いテストスイートにより,パッチの過学習が頻発し,修復の信頼性が低いという問題が存在する。
- コード表現の性能を向上させ,過学習を抑制し,より信頼性の高い自動修復を実現することを目指す。
- グラフベースのコード表現が,他の表現と比較して一貫して優れた性能を示すことが明らかになった。
- ASTを用いたTREETRAINによる過学習パッチの除外率が87.09%に達し,有効性が確認された。
- シーケンスベース表現をヒューリスティックベース表現に統合することで,複数の指標において平均13.5%の性能向上が見られた。
ORBGRANDの有限ブロック長解析 [cs.IT, math.IT]目的:ORBGRANDにおける有限ブロック長での性能評価
- 信頼性の高い通信システム構築には,符号化技術の性能向上が不可欠である。
- 既存のORBGRANDに関する研究は漸近的な解析に偏っており,短~中程度のブロック長での性能評価が困難であった。
- 本研究は,有限ブロック長におけるORBGRANDの性能限界を明確化し,実用的なシステム設計に貢献する。
- 提案手法であるORB-RCU boundが,最大尤度に基づくRCU benchmarkとの比較で良好な一致性を示すことが確認された。
- ORBGRANDの性能は,一般化相互情報量と分散によって特徴付けられることが示された。
- 導出された正規近似が,実用的な動作領域において高い精度を持つことが検証された。
平均報酬ゲームに対する対称的な再帰的アルゴリズム [cs.GT, cs.DS]目的:平均報酬ゲームの解法
- ゲーム理論は,経済学や計算機科学など,幅広い分野で重要な役割を果たしている。
- 平均報酬ゲームの解法は,計算複雑性が高いことが課題であった。
- 本研究では,効率的な解法を提供する対称的な再帰的アルゴリズムを提案する。
- 平均報酬ゲームを解くための,新しい決定的な対称的な再帰的アルゴリズムを提案した。
AgentRaft:LLMエージェントにおけるデータ過剰暴露の自動検出 [cs.SE]目的:LLMエージェントにおけるデータ過剰暴露(DOE)のリスク検出
- LLMエージェントの利用拡大に伴い,クロスツールデータフローにおけるプライバシー保護が重要課題となっている。
- ツール設計の広範なデータパラダイムとLLMの粗粒なデータ処理が,意図しないデータ漏洩を引き起こす可能性がある。
- ユーザー意図と機能要件を超えた機密データの伝送を防ぎ,LLMエージェントのプライバシーコンプライアンスを向上させる。
- AgentRaftは,クロスツール関数呼び出しグラフ構築,テストプロンプト合成,ランタイム汚染追跡,複数LLMによる投票機能を組み合わせることで,DOEリスクを自動的に検出する。
- 6,675の現実世界のツール環境での評価により,DOEが57.07%のツール連携経路で確認され,その存在が明らかになった。
- AgentRaftはベースラインを87.24%上回る高い検出精度と効果を達成し,わずか150のプロンプトでほぼ100%のDOEカバレッジを実現した。
KCoEvo:知識グラフを活用した進化的コード生成フレームワーク [cs.RO, cs.RO, cs.SE, cs.CL]目的:API進化に対応したコード移行の精度向上
- ソフトウェア開発においてコードの進化は不可避であり,その品質維持が重要である。
- APIの変更により既存コードが破損し,保守が困難になるという課題が存在する。
- API進化の構造的推論を可能にし,最新APIを利用したコード生成を目指す。
- 本研究では,API進化の経路検索と,それに基づいたコード生成の二段階構成のフレームワークを提案した。
- 静的・動的なAPIグラフを構築することで,API進化の構造をモデル化し,推論を可能にした。
- 実世界のAPI差分から自動的に生成された疑似教師データを用いて学習を行い,既存のLLMよりも高い移行精度と実行成功率を示した。
コード難読化が人間のプログラム理解に与える影響 [cs.SE]目的:コード難読化が人間のプログラム理解に及ぼす影響の評価
- ソフトウェアの安全性確保が重要であり,難読化はその手法の一つとして注目されている。
- 難読化の度合いとプログラム理解の容易さの関係は十分に解明されていない。
- 様々な難読化手法がプログラム理解に与える影響を定量的に明らかにすること。
- 難読化は一般的に,コードの理解に必要な時間を増加させ,予測精度を低下させる傾向にある。
- 難読化の強度とパフォーマンスの関係は一様ではなく,プログラミング言語によって異なる。
- JavaScriptでは難読化強度が増すにつれて難易度が増す一方,Pythonでは特定のリネーム変換が元のコードと同等またはそれ以上の性能を示す場合がある。
有限体上の長さ $n=\lambda(q^m+1)$ のBCH符号 [cs.IT, math.IT]目的:有限体上の長さ $n=\lambda(q^m+1)$ のBCH符号のパラメータ決定
- 通信システムにおいて重要な役割を果たす巡回符号であり,誤り訂正能力が高い。
- BCH符号のパラメータ決定は困難であり,最適な符号の構成が課題である。
- 特定の長さのBCH符号の次元や最小距離を決定し,最適な符号を構築する。
- 長さ $n=\lambda(q^m+1)$ のBCH符号のパラメータを決定するための十分条件と必要条件が確立された。
- いくつかのBCH符号族の次元を決定し,最小距離の下限を改善し,最適な符号が構成された。
- 奇数 $m$ の場合,BCH符号が双対BCH符号となるための条件が導出された。
単位円上のテンソル変調:符号化の視点 [cs.IT, math.IT]目的:非同期ランダムアクセスにおけるブラインド多重ユーザ分離のためのテンソル変調の符号化構造
- 無線通信において,効率的な多重アクセス技術は通信容量向上の鍵となる。
- 従来の多重アクセス方式では,ユーザ分離の複雑さと干渉の問題が残存する。
- テンソル変調の数学的構造を解析し,効率的な符号化スキームを設計すること。
- テンソル変調は,$\mathbb{Z}_M$上の非二進線形ブロック符号に基づいた符号化変調であると示された。
- 生成行列を明示的に導出し,ランク不足を特徴付け,テンソル識別用の参照シンボルが符号短縮に対応することを示した。
- シミュレーションにより,単一ユーザAWGNおよび多重ユーザ非コヒーレントフェージングチャネルにおいて高いロバスト性と干渉耐性を示すことが確認された。
AIシステム開発におけるチームの多様性の役割 [cs.RO, cs.HC, cs.RO, cs.SE]目的:AIシステム開発におけるチーム多様性の影響
- AI技術の普及に伴い,公平性や偏りへの懸念が高まっている。社会への影響が大きい分野である。
- ソフトウェア工学研究は技術的解決策に偏りがちで,AI成果を左右する社会的な側面が未解明である。
- AI開発におけるチーム多様性が偏りを軽減し,公平性を促進する可能性を探る。
- チーム多様性は,偏りを特定するための視点の多様化,共感的なAI開発,組織的な差別の是正に貢献する。
- 包摂的で参加型の意思決定を支援し,偏りに対する保護策として機能し,問題解決における思考の幅を広げる。
- AIプロジェクトに多様な視点を取り入れ,ソフトウェア開発プラクティスに公平性の考慮を組み込むための提言を行う。
構造化ゴシップ:インターネット規模の動的ネットワーク向けパーティション耐性DNS [cs.NI, cs.DB, cs.DC, cs.DS, cs.OS]目的:インターネット規模の動的ネットワークにおけるパーティション耐性DNSの実現
- モバイルアドホックネットワークやエッジコンピューティングにおいて,分散型名前解決は不可欠である。
- 既存手法は,スケーラビリティの限界や過剰なオーバーヘッドといった問題を抱えている。
- パーティション発生時でも安定的に動作し,大規模ネットワークに対応できるDNSを開発する。
- 提案手法は,DHTのフィンガーテーブルを利用することで,アクティブな調整を必要とせずパーティション耐性を実現する。
- メッセージ複雑度をO(n)からO(n/log n)に削減し,収束時間をO(log^2 n)に維持する。
- バージョンベクターを用いることで,グローバルな調整なしに,数十億ノード規模のネットワークでの運用が可能となる。
Apply2Isar:Isabelle/HOLの適用スタイル証明を構造化Isarに自動変換 [cs.DC, cs.CL, cs.LO]目的:Isabelle/HOLにおける適用スタイル証明の構造化Isarへの自動変換
- 形式検証において,証明の可読性と堅牢性は非常に重要である。
- 適用スタイル証明は記述が速いが,可読性や堅牢性に課題がある。
- 適用スタイル証明を自動的に可読性の高いIsar形式に変換すること。
- Apply2Isarは,適用スタイル証明を構造化Isarに変換するツールである。
- Isabelle Archive of Formal Proofs由来のベンチマークセットで有効性が確認された。
- 複雑で不安定な適用スタイル証明を,より可読性と堅牢性のあるIsar証明に変換できる。
ハダマール変換を用いたスペクトル領域スプレッディングによる堅牢なダウンリンク非直交多重アクセス [cs.IT, eess.SP, math.IT]目的:ダウンリンク非直交多重アクセスにおける堅牢性の向上
- 将来の無線システムにおいて,大量アクセスを可能にするためにスペクトル効率の向上が重要である。
- 非直交多重アクセスは,電力配分係数,フェージング,不完全なチャネル状態情報に敏感であるという課題がある。
- 本研究は,ハダマール変換を用いることで,フェージングや不完全なCSIの影響を軽減し,信頼性を向上させることを目指す。
- 提案手法は,ハダマール変換を送信側で利用することで,フェージングやCSIの不完全性による悪影響を抑制し,ビット誤り率を低減する。
- Nearユーザにおいては,BER $10^{-2}$で15dBのゲイン,FarユーザにおいてはBER $10^{-1}$で10dBのゲインを既存手法と比較して実現した。
- 不完全なSIC環境下では,ユーザ1はユーザ2と比較して,BER $10^{-3}$を達成するために14dB低いSNRで済むことが示された。
バスファクターの理論と計算の実践 [cs.CL, cs.HC, cs.RO, cs.SI, cs.CC, cs.DS]目的:プロジェクトのバスファクター推定
- プロジェクトの成功には人材の継続性が重要であり,リスク評価が不可欠である。
- 既存のバスファクター測定法は定義が曖昧で,汎用性や比較可能性に課題がある。
- プロジェクトの断絶や遅延を引き起こすリスクを定量的に評価する手法を確立する。
- プロジェクトを人々とタスクの二部グラフとしてモデル化し,最適化問題としてバスファクターを計算する枠組みを提案した。
- 冗長性と重要性の二つの解釈を形式化し,それらの計算がNP困難であることを証明した。
- ネットワークの堅牢性に着想を得た新しいバスファクター測定法を導入し,既存の手法よりも情報量が多く安定していることを示した。
IOTEL:IoTエンリッチメントされたオブジェクト中心イベントログ生成ツール [cs.SE]目的:IoTエンリッチメントされたオブジェクト中心イベントログの生成
- ビジネスプロセス分析において,IoTデータの統合は不可欠であり,プロセス改善に繋がる重要な要素である。
- IoTデータとビジネスプロセスイベントログは抽象レベルが異なり,データソースが分離しているため,統合が困難である。
- 既存のイベントログにプロセス関連のIoTデータを統合し,プロセス分析を容易にすることを目指す。
- 本研究で開発したIOTELは,オブジェクト中心イベントログ(OCEL)スキーマを基盤とし,構造化されたIoTデータ統合を可能にする。
- 既存のプロセスマイニングツールとの互換性を持ち,IoTエンリッチメントされたビジネスプロセス分析を支援する。
- 実際のシナリオを通じて,その有効性が実証されている。
ソーシャルプルーフは幻想か:ソフトウェアダウンロードへの影響 [cs.CY, cs.SE]目的:ソフトウェアダウンロードにおけるソーシャルプルーフの影響の検証
- オープンソースソフトウェアは広く利用され,開発者は選択時にソーシャルプルーフを参考にしている。
- 悪意のある者がソーシャルプルーフを操作し,悪質なソフトウェアの利用を促す懸念がある。
- ソーシャルプルーフ操作がソフトウェアダウンロードに及ぼす影響を明らかにすること。
- GitHubリポジトリのスター数を購入した実験では,パッケージのダウンロード数やリポジトリ活動に目に見える影響はなかった。
- Pythonパッケージのダウンロード数を操作した実験でも,後続のダウンロード数やリポジトリ活動に検出可能な影響は確認されなかった。
- 結果から,現在のところソーシャルプルーフはソフトウェアダウンロードに有意な影響を与えていないと考えられる。
SWE-Fuse:問題のない軌跡学習とエントロピーを考慮したRLVR訓練によるソフトウェアエージェントの強化 [cs.SE, cs.AI]目的:ソフトウェア問題解決エージェントの訓練のためのフレームワーク
- ソフトウェア開発における自動化の需要が高まっており,LLMベースのエージェントが注目を集めている。
- 実際のソフトウェア問題データセットには,問題記述と解決策の不整合が存在し,エージェントの性能を阻害している。
- 問題記述の誤誘導を軽減し,ソフトウェア問題解決エージェントの信頼性と効率を向上させる。
- SWE-Fuseは,問題記述を考慮した訓練フレームワークであり,問題記述に基づくサンプルと問題のないサンプルを融合する。
- SWE-Fuseは,SWE-bench Verifiedベンチマークにおいて,既存のベースラインモデルをそれぞれ43.0%と60.2%上回る解決率を達成した。
- テスト時スケーリング(TTS)と組み合わせることで,さらに性能が向上し,8Bモデルと32Bモデルでそれぞれ49.8%と65.2%の解決率を達成した。
6G測位のための組合せデータ拡張によるハード/ソフトNLoS検出 [cs.CL, cs.IT, cs.NI, math.IT]目的:非線視界(NLoS)環境下における測位精度向上
- 6Gにおける高精度な位置情報取得は,様々なサービス実現の基盤となるため重要である。
- NLoS環境下では,電波の減衰や遅延が発生し,測位誤差が大きくなるという課題がある。
- 基地局の組み合わせによるデータ拡張を用いて,NLoS環境を検出し,高精度な測位を実現する。
- 提案手法(CDA-ND)は,工場環境において96.6%と91.1%の高いNLoS検出精度を達成した。
- CDA-NDを測位に組み込むことで,LoS環境とNLoS環境においてそれぞれ20.04%と65.99%の平均絶対誤差削減を実現した。
- 基地局のNLoS状況をハード判定とソフト判定の2モードで検出し,測位アルゴリズムを最適化する。
