arXiv雑要約
プログラム - 2026/03/12 公開
一つのモデル,多様なスキル:マルチタスクコード分析のためのパラメータ効率的なファインチューニング [cs.SE, cs.AI, cs.LG]目的:マルチタスクコード分析におけるパラメータ効率的なファインチューニングの有効性評価
- 近年のLLMの進歩はコード生成に顕著だが,他のコード分析タスクへの適用は未だ不明な点が多い。
- LLM全体をファインチューニングすると計算コストが膨大になるため,実用上の制約となる。
- パラメータ効率的なファインチューニング(PEFT)による,マルチタスク学習の可能性を探求する。
- マルチタスクPEFTは,完全なマルチタスクファインチューニングと同等以上の性能を示すことが確認された。
- マルチタスクPEFTは,単一タスクファインチューニングに近い精度を維持しつつ,ストレージ要件や計算コストを大幅に削減する。
- タスクの安定性,モデルアーキテクチャ,タスクの相補性などが,共同ファインチューニングの成否を左右する。
LWM-Temporal:ワイヤレスチャネル表現学習のための疎な時空間注意機構 [cs.LG, cs.IT, math.IT]目的:ワイヤレスチャネルの時空間的性質を捉えた汎用的なチャネル埋め込み表現
- 無線通信システムの性能向上には,チャネルの正確なモデル化が不可欠である。
- 従来のチャネルモデルは,計算コストが高く,多様なシナリオへの適用が困難である。
- 移動に伴うチャネル変化を効率的に捉え,様々なタスクに適用可能なモデルを開発する。
- LWM-Temporalは,角度-遅延-時間領域で動作し,物理的に妥当な近傍に注意を限定する疎な時空間注意機構(SSTA)を導入することで,計算量を大幅に削減する。
- 物理情報に基づいたマスキングカリキュラムを用いた自己教師あり学習により,現実的な遮蔽やパイロットスパース性,測定誤差をエミュレートすることで,汎化性能を高める。
- 様々な移動シナリオにおけるチャネル予測実験において,LWM-Temporalは強力なベースラインと比較して一貫した改善を示し,幾何学を考慮したアーキテクチャの重要性を強調する。
足場の下の安全性:評価条件が測定される安全性にどのように影響するか [cs.SE, cs.AI, cs.CL, cs.LG]目的:大規模な制御実験による,足場(スキャフォールド)が言語モデルの安全性評価に与える影響の定量化
- 言語モデルの安全性評価は,社会実装において不可欠であり,その信頼性が求められている。
- 既存の安全性評価は,単独のモデルを対象としており,実際の運用環境を十分に反映していない。
- 本研究は,足場による安全性評価の変化を明らかにし,より現実的な評価方法の確立を目指す。
- 足場構造の一つであるMap-Reduceは,安全性評価を低下させる傾向が確認された。
- しかし,他の2つの足場構造では,実用上許容できる範囲内で安全性が維持された。
- 評価形式(多肢選択式から記述式への変更)が安全性スコアに大きな影響を与えることが示され,足場の効果よりも大きいことが明らかになった。
エピステミック安定に向けて:産業用LLMのハルシネーション低減のための整合性のある手順の設計 [cs.SE, cs.AI, cs.HC]目的:大規模言語モデルにおけるハルシネーション低減のためのプロンプトエンジニアリング戦略
- 産業分野では,LLMの信頼性は重要であり,誤った情報によるリスクを回避する必要がある。
- LLMは,事実に基づかない,または文脈に合わない内容を生成するハルシネーションを起こしやすい。
- LLMの出力のばらつきを減らし,再現性と根拠に基づいた結果を得るための手法を確立する。
- 拡張データレジストリ(M4)は,100回の試行全てで「より良い」と評価され,最も効果的であることが示された。
- 反復的類似性収束(M1),分解的モデル非依存プロンプティング(M2),単一タスクエージェント専門化(M3),ドメイン用語集注入(M5)も評価された。
- M2の改良版(v2)は,初期の34%から80%へと大幅に改善し,最も大きな改善を示した。
情報幾何におけるリッチ曲率の量子化 [cs.IT, cs.LG, math.IT, quant-ph]目的:情報幾何におけるリッチ曲率の量子化に関する研究
- 情報幾何は,確率モデルの幾何学的構造を分析する上で重要な役割を担う分野である。
- 離散的な確率モデルのリッチ曲率の性質は未解明な部分が多く,理論的な理解が求められていた。
- ベイズネットワークのリッチ曲率が特定の条件を満たすかを検証し,その普遍性を明らかにすることを目的とする。
- 2004年の著者による予想を,20年後に解決した。木構造および完全グラフのベイズネットワークにおいて,リッチスカラーが正の半整数に量子化されることを証明した。
- 一般のネットワークにおいては,反例を示すことで予想が成り立たないことを示した。ループ構造が量子化を妨げる要因となることが判明した。
- ガウスDAGネットワークにおいても研究を拡張し,離散ネットワークとガウスネットワークで曲率の符号が異なる二分性を見出した。
OAuthHub:ローカルデータハブによるOAuthデータ過剰アクセス緩和 [cs.CR, cs.NI, cs.SE]目的:OAuthベースのデータ共有における過剰アクセス問題の解決
- ユーザーのプライバシー保護は重要であり,最小限のデータアクセスが求められる。
- 既存のOAuthプロバイダーは粒度の粗いデータアクセスしか提供せず,不要なデータアクセスが発生しやすい。
- OAuthHubは,ユーザーのデバイスを介してデータアクセスを制御し,過剰なデータアクセスを抑制する。
- OAuthHubを用いることで,開発者は意図したデータアクセスを明示的に宣言し,3つの一般的なアクセスパターンに対応できる。
- OAuthHubは,従来のOAuth APIと比較して,アプリケーションコードの変更を最小限に抑え,性能への影響も少ない。
- 開発者実験の結果,OAuthHubを使用することで,プログラミングタスクの完了時間が大幅に短縮され,コード量も削減された。
SBOMからエージェント型AIBOMへ:スキーマ拡張,エージェントによるオーケストレーション,再現性評価 [cs.CR, cs.AI, cs.SE]目的:ソフトウェアサプライチェーンセキュリティにおける,再現性と脆弱性評価を支援するProvenanceメカニズム
- ソフトウェアサプライチェーン攻撃の増加により,ソフトウェアの構成要素と依存関係の透明性が不可欠となっている。
- 従来のSBOMは静的な依存関係リストであり,実行時の挙動や環境の変化,脆弱性の状況を捉えられないという課題がある。
- 実行時の情報を組み込み,脆弱性評価を可能にする,より動的でインテリジェントなProvenanceメカニズムを構築すること。
- 本研究では,自律的かつポリシー制約された推論を通じて,SBOMをアクティブなProvenanceアーティファクトであるAIBOMへと拡張するフレームワークを提案した。
- 提案フレームワークは,実行時の依存関係や環境の変化を監視し,脆弱性に関するコンテキストに基づいた判断を行う複数のエージェントで構成される。
- 実験結果から,本フレームワークは,既存のProvenanceシステムと比較して,実行時の依存関係の把握,再現性の忠実度,脆弱性解釈の安定性を向上させることが示された。
グローバル多施設医療研究のためのプライバシーとセキュリティに焦点を当てた連合学習基盤の構築 [cs.CR, cs.SE]目的:国際的な多施設医療研究における連合学習基盤
- 医療研究の発展には,多様な臨床データが不可欠である。しかし,データ共有には法的制約がある。
- 既存の連合学習フレームワークは,不正アクセスや濫用を防ぐためのガバナンス機能が不十分である。
- 本研究は,法的義務を遵守し,制度の独立性を保護するガバナンス機能を連合学習に組み込むことを目指す。
- FLA$^3$は,認証,認可,会計(AAA)機能を連合学習のオーケストレーション層に統合することで,実行時のポリシー施行を実現した。
- 5カ国の5つのBloodCounts!コンソーシアム機関にインフラストラクチャを導入し,運用可能性を実証した。
- INTERVALスタディの54,446サンプルを用いて臨床的有用性を評価した結果,中央集権的な学習と同等の予測性能を維持しながらガバナンス制約を厳格に施行できた。
認識的サポート点フィルタ:ジェインズの最大エントロピーとポッペルの反証可能性の融合 [cs.IT, cs.AI, cs.SY, eess.SY, math.IT, stat.ME]目的:認識的不確実性への対処における最適なフィルタの構築
- 知識獲得において,不確実性の管理は常に重要な課題である。効率的な意思決定には不可欠。
- 従来のフィルタは,事前知識に依存し,誤った仮定に基づくバイアスを生み出す可能性がある。
- 証拠のみに基づき,最悪の場合の認識的無知を最小化するフィルタを開発すること。
- 認識的サポート点フィルタ(ESPF)は,無知を速やかに受け入れ,確実性を慎重に主張するという認識論的立場を数学的に最適化する。
- ESPFは,最大エントロピー原理(ジェインズ)と反証可能性原理(ポッパー)を統合し,証拠のみに基づくフィルタとして,最悪の場合のエントロピーを最小化する。
- 軌道追跡シミュレーションの結果は,ESPFが期待通りに機能し,従来のカルマンフィルタと同等の性能を示すことを確認した。
信念伝播による量子LDPC符号の復号学習 [cs.IT, math.IT]目的:量子LDPC符号の復号手法
- 量子情報処理において,誤り訂正は重要な役割を担う。符号化技術の性能向上が不可欠である。
- 従来の信念伝播法は,量子縮退や短サイクルにより収束性が低い場合がある。
- 強化学習を用いて,より効率的な量子LDPC符号の復号手法を確立すること。
- 提案手法は,強化学習により復号軌跡を学習することで,従来の信念伝播法の収束問題を改善する。
- シミュレーション結果から,提案手法はフラッディングやランダムな逐次スケジュールと比較して,性能と収束速度が優れていることが示された。
- 提案手法は,同程度の複雑さで最新の信念伝播ベースの復号器と同等の性能を達成する。
ループ局所性の完全記号的解析:仮想再利用による実パフォーマンスの推論 [cs.PL]目的:ループ局所性に関する理論とそのコンパイラサポート
- 近年の科学技術計算の発展に伴い,メモリ階層構造の効率的な利用が重要となっている。
- 従来のキャッシュ性能予測は経験則に依存しており,精度と適用範囲に限界があった。
- 記号的解析を用いて局所性を多項式として導出し,より正確なキャッシュ性能予測を実現する。
- 本研究では,ループ局所性を多項式として導出する新しい理論と,それをサポートするコンパイラを提案した。
- 41の科学計算カーネルとテンソル演算を対象とした評価により,局所性多項式の導出に平均41秒を要した。
- 導出後,入力サイズやキャッシュ構成に対するキャッシュミス数の予測は1ミリ秒以下で可能であり,予測精度は99.6%に達した。
重み付きモデル列挙におけるCDCLに基づくモデル列挙の拡張 [cs.LO]目的:重み付きモデル列挙のアルゴリズム
- 充足可能性問題の解探索において,解の評価が必要となる場面が増加している。
- 従来のモデル列挙手法では,重みを考慮した選択的列挙が困難であった。
- 重みを考慮した効率的なモデル列挙手法を確立し,ソルバーレベルでの推論タスクとして確立すること。
- CDCLに基づいた重み付きモデル列挙アルゴリズムを提案し,重み伝播,重みベースの枝刈り,重み考慮型競合分析を統合した。
- 時間的バックトラッキングと非時間的バックトラッキングの双方において,アルゴリズムの実行可能性と補完性を示した。
- 重みによる枝刈りの効果と,それぞれのバックトラッキング手法が最適なパフォーマンスを発揮する条件を明確にした。
IIDリスト更新における転置はほぼ最適である [cs.CL, cs.DS]目的:IIDモデルにおけるリスト更新問題に対する転置ルールの性能評価
- オンラインアルゴリズムの基礎問題であり,データアクセス効率の向上に不可欠である。
- アクセス確率が未知である場合に,効率的なリストの並び替え方法が課題となっていた。
- 転置ルールによるアクセスコストの上限を導出し,確率の近似的なソート手法を確立すること。
- 転置ルールは,定常分布において,期待アクセスコストが最適解OPT$+1$以下となることが示された。
- これは50年前のRivestの予想を,無視できる定数項を除いて肯定するものである。
- 本研究は,標本抽出による確率の近似的なソート手続きを提供する。
製品開発におけるエージェントによる工学解析のオーケストレーション:DUCTILE [cs.RO, cs.SE, cs.AI, cs.HC]目的:製品開発における工学解析の自動化支援
- 製品開発の効率化と品質向上には,工学解析の自動化が不可欠である。
- 既存の自動化システムは,ツールやデータ形式の変更に弱く,柔軟性に欠ける。
- 変化に強いLLMを活用し,工学解析のプロセスを適応的にオーケストレーションする。
- DUCTILEは,LLMエージェントによる適応的なオーケストレーションと,検証済みの工学ツールによる決定論的な実行を分離する。
- エージェントは設計慣習を解釈し,入力データを確認し,処理経路を適応的に変更する。
- 航空宇宙メーカーにおける実務での評価により,DUCTILEは正確かつ標準に準拠した結果を繰り返し生成することが確認された。
MALTA:保守を考慮した技術的遅延,ソフトウェアの放置への対処を見積もる [cs.RO, cs.SE]目的:ソフトウェアの放置を区別するためのリポジトリレベルのシグナル,Version Lagの大きさや持続性の違い,保守を考慮した指標によるハイリスク依存関係の特定
- オープンソースの生態系は,パッケージの継続的な保守に依存している。放置されるとセキュリティリスクが高まる。
- 既存のVersion Lag指標では,積極的な保守と放置されたパッケージを区別できず,リスクを過小評価する。
- Version Lagだけでは見過ごされる放置されたパッケージを特定し,より正確なリスク評価を実現する。
- MALTAは,活発な保守と衰退的な保守を分類する際のAUCが0.783を達成した。
- Version Lagだけで「低リスク」と分類されたパッケージの62.2%が,MALTAのシグナルにより「高リスク」に再分類された。
- 再分類されたパッケージは,最終コミットからの平均経過日数が2019日であり,その9.8%はアーカイブされたリポジトリである。
Fly-PRAC:ランダム線形ネットワークコーディングのためのパケット復旧 [cs.IT, cs.NI, math.IT]目的:パケット復旧手法Fly-PRACの提案
- ネットワーク効率向上の鍵となる技術であり,データ伝送の信頼性向上に貢献する。
- ノイズ環境下ではパケット損失が発生し,ネットワーク性能が低下する問題がある。
- 既存手法の遅延とノイズへの弱点を克服し,実用的なパケット復旧を実現する。
- Fly-PRACは,従来のS-PRACと比較して,ビット誤り率10^-4で900Bのペイロードにおいて2倍の性能向上を示した。
- 二ホップ通信において,中間ノードでの復旧を可能にすることで,16%の送信量削減を実現した。
- スパースネットワークコーディング環境では,復号遅延を平均31%削減することに成功した。
実環境GUIにおける全自動AIエージェントテストフレームワークSpecOps [cs.SE]目的:実環境GUIにおけるAIエージェントのテスト
- 大規模言語モデルを利用したAIエージェントの実用化が進む中で,信頼性・堅牢性の評価が重要になっている。
- 既存の評価フレームワークは,手動での作業が多い,シミュレーション環境に限定される,複雑なエージェントに対応できないといった課題がある。
- 実環境GUIにおけるAIエージェントのテストを自動化し,信頼性の高い評価を実現することを目指している。
- SpecOpsは,テストケース生成,環境設定,実行,検証の4段階をLLMベースの専門エージェントが担当する構造を持つ。
- 5つの実環境エージェントを用いた評価で,AutoGPT等の既存手法を上回り,計画の精度,実行成功率,バグ検出率で優れた結果を示した。
- 164個の真のバグをF1スコア0.89で検出し,テストコストは0.73USD以下,実行時間は8分未満と実用性も高い。
移動アンテナシステムにおけるロバストな方向感知のための3次元軌跡最適化 [cs.IT, eess.SP, math.IT]目的:移動アンテナの3次元軌跡最適化による方向感知性能の向上
- 無線通信技術の発展に伴い,高精度な方向感知へのニーズが高まっている。
- 従来の固定位置アンテナでは,方向感知性能に限界があり,特にエンドファイア方向で課題がある。
- 移動アンテナの軌跡を最適化することで,方向感知性能のロバスト性を高めることを目指す。
- 提案手法では,移動アンテナの3次元軌跡を最適化することで,最悪の場合における角度誤差を最小化する。
- 理論的解析により,3次元移動が全角度領域において等方的な感知性能を実現できることが示された。
- 数値実験の結果,提案手法は従来の固定アンテナや2次元移動アンテナと比較して,方向推定の精度とロバスト性を大幅に向上させる。
有界ツリー長グラフの線形対数最短経路距離クエリによる再構成 [cs.DS]目的:有界次数と有界ツリー長を持つ連結グラフのエッジ再構成
- グラフ構造の理解は,ネットワーク,情報科学,生物学など広範な分野で不可欠である。
- グラフのエッジを効率的に再構成することは,特に大規模グラフにおいて計算量的に困難な問題である。
- 効率的なエッジ再構成アルゴリズムの開発により,グラフ構造の理解が加速される。
- 本研究では,次数$\Delta$とツリー長$\mathrm{tl}$が有界な連結グラフに対し,決定的なアルゴリズムで$O_{\Delta,\mathrm{tl}}(n \log n)$ クエリで再構成が可能であることを示した。
- これは,このグラフクラスに対する既存の最良アルゴリズム(決定論的またはランダム化)よりも$\log n$ のオーダーで改善された結果である。
- また,この結果は,有界コダリティグラフ(有界ツリー長グラフのサブクラス)に対する既知の下限と一致する。
検証から誘導へ:ソフトウェアの支配変数の少なさを活用する [cs.CL, cs.SE]目的:ソフトウェアの支配変数の発見
- ソフトウェアの品質確保は重要であり,開発コストの大部分を占める。
- 複雑なシステムでは,従来の検証手法は高コストで非効率である。
- 支配変数を効率的に発見し,テストを目標達成のための探索へと変革する。
- 本研究では,効率的なゼロ知識ランキング手法EZRを提案し,支配変数を直接発見することに成功した。
- EZRは,従来の重いソルバーの代わりに,わずか32サンプルでピーク結果の90%を達成した。
- これは,ソフトウェアのテストをモデルフリーの探索問題として捉える「誘導」という新しいアプローチの有効性を示唆する。
静的解析レポートの誤検知予測器 [cs.DC, cs.SE]目的:静的解析レポートの真偽判定
- ソフトウェアの安全性を高めるため,静的解析は不可欠である。しかし,誤検知が多いことが課題。
- 静的解析ツールは誤検知が多く,開発者の負担を増やし,ツールの信頼性を損ねる。
- 誤検知を予測し,開発者のレビュー効率を向上させることを目指す。
- 提案手法は,コードの構造と意味的関係を捉えたグラフ畳み込みネットワークを使用。
- CamBenchCAPデータセットでテストした結果,テストセットで100%の精度を達成。
- CryptoAPI-Benchベンチマークでは最大96.6%の精度を示し,実用性も確認された。
QuantumX:量子コンピューティングと量子ソフトウェアエンジニアリングの融合を目指す新たな分野の確立 [cs.RO, cs.CL, cs.SE]目的:量子コンピューティングとソフトウェアエンジニアリングの交差点における研究動向の統合
- 量子技術は,計算能力の飛躍的な向上をもたらし,様々な分野に革新をもたらす可能性を秘めている。
- 量子ソフトウェアエンジニアリングは黎明期であり,ソフトウェア品質保証や開発手法の確立が急務である。
- 量子ソフトウェアエンジニアリングの課題を整理し,今後の研究方向性を明確にすることを目的とする。
- 第1回QuantumXトラックは,スペインの研究グループによる量子コンピューティングとソフトウェアエンジニアリングの融合を促進した。
- 本イベントでは,ソフトウェア品質,ガバナンス,テストといったソフトウェアエンジニアリングの原則を量子パラダイムに適用する議論が行われた。
- QuantumXは,スペインを量子ソフトウェアエコシステムにおける重要な貢献者として位置づけ,持続的な研究コミュニティの基盤を築いた。
スケーラブルなMPCにおける密度依存グラフの方向付けと彩色 [cs.DS]目的:グラフの密度に応じた方向付けと彩色
- 大規模グラフ処理の効率化が求められており,並列計算による高速化が重要である。
- 既存の並列計算アルゴリズムは,計算量やメモリ使用量に課題があり,スケーラビリティが低い。
- 高密度な部分グラフに着目し,計算効率の良いアルゴリズムを開発することでスケーラビリティを向上させる。
- 本研究では,エッジの方向付けと頂点の彩色において,従来の計算量制限を超える結果が得られた。
- 特に,計算ラウンド数は,既存の密度依存アルゴリズムの壁を打ち破る$\text{poly}(\log\log n)$という結果となった。
- この成果は,大規模グラフ処理における並列計算の可能性を広げるものと期待される。
大規模言語モデルとAIエージェントによるESG報告ライフサイクル管理 [cs.SE]目的:ESG報告における課題解決と自動化
- 企業の倫理的・社会的責任が重要視され,ESG基準の採用が進んでいる。
- 非構造化データや用語の不統一により,ESG基準に沿った報告書作成が困難である。
- AIエージェントを活用し,ESG報告を動的かつ適応的なシステムに変革する。
- 本研究では,ESGの識別,測定,報告,エンゲージメント,改善の各段階を統合する,エージェント型ESGライフサイクルフレームワークを提案した。
- 複数のAIエージェントがESG情報を抽出し,パフォーマンスを検証し,組織の結果に基づいてESG報告書を更新する。
- 報告書検証,複数報告書の比較,報告書生成,知識ベースの維持といったESGタスクを支援する3つのアーキテクチャアプローチを提案した。
断続的なコーシー歩行が,対象の形状と大きさに依存しない最適な3次元探索を可能にする [cs.DS, math.PR]目的:対象の形状と大きさに対する最適な3次元探索戦略の解明
- 探索効率は,生物学的および工学的システムにおいて重要な課題である。
- 従来の探索戦略では,対象の形状が探索効率に与える影響が十分に理解されていなかった。
- コーシー歩行の最適性と,形状と大きさの関係を数学的に明らかにすること。
- 3次元空間における探索において,対象の形状が検出時間に顕著な影響を与えることが示された。
- コーシー歩行(μ=2)が,対象の大きさや形状に関わらず,ほぼ最適な探索戦略となることが数学的に証明された。
- μの値によって,対象の形状に対する探索性能が変化することが明らかになり,次元駆動型形状脆弱性の存在が示唆された。
教育から証拠へ:AI統合アジャイル開発のための共同実践研究プラットフォーム [cs.SE]目的:AI統合アジャイル開発における共同実践研究のプラットフォーム
- ソフトウェア開発の進化は速く,研究が追いつくのが困難。特にAI技術の導入により,その課題は深刻化している。
- 先行研究では理論と実践の隔たりや時間的遅延があり,結果の再利用性や実用性が低い場合がある。
- 本研究は,制御された研究と実務の間のギャップを埋め,実践に即した証拠を効率的に生成することを目指す。
- プロジェクトベースのAI統合アジャイル教育プラットフォームが,迅速な調査を可能にすることが示された。
- スプリントリズム,品質ゲート,ステークホルダーの関与により,実践的な証拠を効率的に生成し,再利用可能なコンテキストを提供する。
- 複数の学期にわたる結果から,プロジェクトパイプライン,コホートの成長,ステークホルダーの参加が確認された。
二層積層型インテリジェントメタサーフェス:性能と複雑さのバランス [cs.IT, math.IT]目的:電磁波制御に関する研究
- 次世代無線通信システムの発展に不可欠な電磁波制御技術の高度化。
- 従来の多層メタサーフェスは構造が複雑で計算負荷が高く,電力損失が大きい。
- 電力損失と最適化の負担を軽減しつつ,良好な信号処理性能を維持すること。
- 二層構造のメタサーフェス(MF-SIM,FILM)が,柔軟性と電力効率のトレードオフを明らかにしている。
- MF-SIMとFILMを用いたポイントツーポイントMIMO/多重ユーザ通信システムにおいて,電力損失の低減と最適化負担の軽減が確認された。
- 適切に設計された二層メタサーフェスは,実用的な6Gシステムへの道を開く可能性を示唆している。
LabConstrictorを用いたJupyterノートブックのインストール可能なデスクトップアプリケーションとしてのパッケージ化 [cs.SE, q-bio.QM]目的:ライフサイエンス研究におけるオープンソースソフトウェアの利用促進
- ライフサイエンス研究はオープンソースソフトウェアに依存するが,導入障壁が高い。
- Jupyterノートブックは環境依存性が高く,共有・実行の容易性に課題がある。
- LabConstrictorはDevOpsの知識なしに,ノートブックの配布・実行を容易にする。
- LabConstrictorはCI/CDのような自動化パイプラインにより,ノートブックをワンクリックでインストール可能なデスクトップアプリケーションにパッケージ化する。
- インストール後,ユーザーはドキュメント,ノートブックへのリンク,バージョンチェックを含む統一されたスタートページにアクセスできる。
- コードセルを非表示にしたり,実行コントロールとウィジェットを組み合わせることで,アプリのような操作感を提供する。
プログラマブルマターの関節運動による亜線形時間再構成 [cs.DS, cs.CG, cs.RO]目的:幾何学的アモボット構造の集中型再構成
- 自己組織化ロボットの研究は,複雑なタスクを達成するための柔軟性とロバスト性を提供する。
- 従来の再構成アルゴリズムは,計算コストが高く,大規模システムへの適用が困難である。
- 関節運動モデルにおける効率的な再構成アルゴリズムを開発し,時間計算量を削減することを目指す。
- 本研究により,補助的な仮定なしに亜線形時間での再構成が可能であることが示された。
- あらゆる構造を$O(\sqrt{n}\log n)$ラウンドで標準的な線分構造に再構成するアルゴリズムを開発した。
- また,任意の螺旋構造を線分に再構成するための定数時間アルゴリズムも提示した。
サンプルと探索:高次元学習拡張k-中央値クラスタリングのための効果的なアルゴリズム [cs.DS, cs.LG]目的:学習拡張k-中央値クラスタリングにおける計算効率の向上
- 機械学習とデータマイニングの発展に伴い,大規模データの効率的なクラスタリングが重要視されている。
- 従来のk-中央値クラスタリングは,高次元データにおいて計算コストが指数関数的に増加する課題を抱えている。
- 本研究では,効率的なサンプリング手法を用いたアルゴリズムを提案し,高次元データにおける計算コストの削減を目指す。
- 提案手法は,既存のアルゴリズムと比較して時間計算量を大幅に改善し,高次元空間への依存度を低減することを示した。
- 実験結果は,提案手法が実用上計算量を削減し,クラスタリングコストを低減できることを示唆している。
- 特に,エラーレートαを持つ予測器を用いた学習拡張k-中央値クラスタリングにおいて有効であることが確認された。
深層ランダム分散関数計算(DeepRDFC):ニューラル分散チャネルシミュレーション [cs.IT, cs.AI, cs.LG, math.IT]目的:分散関数計算における性能向上
- 分散処理と機械学習の応用範囲拡大に不可欠であり,効率的な計算手法が求められている。
- 共通のランダム性が限られる場合や,厳密な関数計算保証が必要な場面で課題が生じる。
- ランダム分散関数計算(RDFC)の性能向上と,その利用促進を目指している。
- オートエンコーダ(AE)を用いて確率分布の総変動距離を最小化し,高精度な分散チャネルシミュレーションを実現した。
- 提案手法は,データ圧縮手法と比較して,通信負荷の軽減に貢献する。
- 本研究は,深層学習に基づくRDFC手法の確立に貢献し,限られたランダム性下での利用を促進する。
勾配の符号の優先順位付け:ワイヤレス連合学習のための重要度を考慮したフレームワーク [cs.LG, cs.IT, eess.SP, math.IT]目的:ワイヤレス連合学習における勾配情報の重要度に応じた資源配分による性能向上
- エッジデバイスにおけるAIモデルの共同学習を可能にし,ユビキタスな知能化アプリケーションを支える重要な技術である。
- 無線リソースの制約により通信が不安定になりやすく,ワイヤレス連合学習の課題となっている。
- 勾配の符号を優先的に伝送することで,限られた無線資源下での学習性能を向上させる。
- 提案手法SP-FLは,符号の伝送を優先し,残りの勾配の大きさの回復が困難な場合でも再利用を可能にする。
- パケットレベルとデバイスレベルにおける重要度の差を考慮した階層的な資源配分問題を定式化し,帯域幅と電力の最適化を行う。
- シミュレーション結果から,リソース制約下において,既存手法と比較してCIFAR-10データセット上で最大9.96%高いテスト精度を示すことが確認された。
MDS-TPIR設定およびそれ以上のための偽装と圧縮型PIRスキーム [cs.CL, cs.PF, cs.IR, cs.CL, cs.DC, cs.IT, math.IT]目的:MDSコード化されたデータベースにおけるプライベート情報検索(PIR)の効率向上
- 情報セキュリティの重要性が増す中,データへのプライバシー保護のニーズが高まっている。
- 複数のサーバに分散されたデータから情報を安全に取得する際の効率性とセキュリティのトレードオフが存在する。
- 共謀可能なサーバが存在する環境下で,PIRのレートを最大化するスキームを開発し,既存の限界を超えることを目指す。
- 提案スキームは,Freij-Hollantiらの提唱したMDS-TPIR容量の反例を拡張し,より一般的なケースに対応する。
- GRSコード化システムにおいて,既存の最先端の結果を上回るPIRレートを達成し,K=2の場合には線形MDS-TPIR容量に到達する。
- 実装に必要なフィールドサイズを小さくし,マルチファイルMDS-TPIRなど,より汎用的なPIRモデルへの適応性も有する。
育成優先エージェント開発:対話型知識結晶化によるドメイン専門家AIエージェントの構築 [cs.AI, cs.HC, cs.SE]目的:ドメイン専門家AIエージェント構築のための新たなパラダイム
- LLMベースのエージェント開発が活発化しており,その性能向上の鍵はドメイン知識の有効な組み込みにある。
- 従来のコード優先型やプロンプト優先型では,知識が固定化され,専門家の持つ暗黙知や継続的な進化に対応できない。
- 対話を通じて知識を徐々に結晶化させることで,専門知識の獲得と進化を可能にする。
- 本研究では,エージェントを最小限の構成で初期化し,ドメイン専門家との対話を通じ段階的に成長させる「育成優先開発」を提案する。
- 「知識結晶化サイクル」を導入し,対話中に得られた断片的な知識を構造化された再利用可能な資産に定期的に変換する。
- 金融調査エージェントの事例を通じて,本パラダイムの有効性,限界,そして人間とエージェントの共同進化への影響を議論する。
水中光ワイヤレス通信におけるエネルギー効率的な受信のためのオフセット指向:モデル化と性能解析 [cs.IT, math.IT]目的:水中光ワイヤレス通信リンクの微分エネルギー分析
- 将来の空中・地上・海中統合ネットワークの基盤技術として重要性が高まっている
- 空間的なランダム性と厳しいエネルギー制約がネットワークの寿命と持続可能性を制限する
- 受信機のわずかなずれ(オフセット指向)によるエネルギー効率の最適化を目指す
- オフセット指向戦略は,アパーチャ全体での受信電力を最大化し,従来の完全なアライメント追求とは異なる
- 最適なオフセット角を用いることで,目標BERを達成するために必要な送信電力を約20%削減可能
- 本研究は,堅牢で費用対効果が高く持続可能な水中光ワイヤレス通信ネットワーク設計の新たなパラダイムを提供する
学生ソフトウェアプロジェクトにおける開発者の感情認識の指標の探求 [cs.SE]目的:開発者の感情認識に関する要因の関連性
- ソフトウェア開発におけるコミュニケーションは,チームの協力やプロジェクト成功に不可欠である。
- 感情認識は主観的であり,個人の特性や状況によって大きく左右される可能性がある。
- 感情認識の変動要因を明らかにすることで,より適切なコミュニケーション支援に繋げる。
- 個人の感情認識は一貫性が低く,曖昧な文言を含むメッセージで変化が集中する傾向が見られた。
- 気分の特性や反応性は,よりポジティブな感情認識と関連する一方,ネガティブな感情認識との関連性は限定的であった。
- プロジェクトの段階は感情認識に明確な影響を与えないことが示された。
ハフマン・バケット・スケッチ:カーディナリティ推定のための単純なO(m)アルゴリズム [cs.DS]目的:カーディナリティ推定のためのデータ構造
- 大規模データセットにおけるカーディナリティ推定は,データ分析やネットワーク監視等,様々な分野で重要である。
- 従来のカーディナリティ推定手法は,メモリ使用量が多く,計算コストが高いという課題があった。
- 本研究は,メモリ使用量を削減しつつ,効率的なカーディナリティ推定を実現することを目的とする。
- ハフマン・バケット・スケッチ(HBS)は,HyperLogLog (HLL) スケッチを圧縮し,最適な空間効率O(m+log n)ビットを実現する。
- HBSは,マージ可能性を維持しつつ,メモリ要件を大幅に削減するHLLのドロップイン置換として機能する。
- 実験結果から,HBSは実用的であり,最先端の手法と競合しうる可能性が示唆された。
Agdaにおける抽象書き換えの形式化 [cs.LO, math.LO]目的:抽象書き換えシステムの形式化
- 計算可能性の基礎理論を厳密に検証するため,形式的なシステムが必要である。
- 古典論理に依存した証明が多く,構成的な証明が課題となっていた。
- 構成的な証明に基づく,抽象書き換えシステムの形式化を目指す。
- Agdaを用いて,抽象書き換えシステムの終了性と合流性に関する標準的な結果を形式化した。
- 古典論理の使用を可能な限り排除し,証明の構成性を高めた。
- 終了性の複数の概念間の論理的関係を調べ,ラムダ計算の形式化例を示した。
自動運転エージェントのための仕様に基づくテスト手法 STADA [cs.SE, cs.RO]目的:自動運転エージェントの検証のためのテスト生成
- 自動運転技術の安全性確保は重要であり,実世界での運用前に徹底的な検証が不可欠である。
- 既存のテスト生成手法は,手動作成やランダム生成に依存しており,安全要件の網羅的な検証が困難である。
- 形式的な仕様に基づくテスト生成により,安全要件を満たすシナリオを効率的に網羅することを目指す。
- STADAは,時間論理(LTLf)で表現された形式仕様に基づいて,テストシナリオを系統的に生成する。
- SCENEFLOWを用いて検証した結果,STADAは既存手法と比較して,2倍以上のカバレッジを達成した。
- また,STADAは既存手法と同等のカバレッジを,6分の1のシミュレーション数で実現した。
2-CNFにおける単純な最小充足不能部分集合 [cs.DS]目的:2-CNFブール公式の最小充足不能部分集合(MUS)の構造
- 充足可能性問題は計算複雑性理論において基礎的であり,様々な応用分野で重要である。
- 大規模なブール公式において,充足不能な部分集合を見つけることは計算量的に困難である。
- 2-CNFにおけるMUSの構造を理解することで,充足可能性問題の効率的な解決に繋がる可能性がある。
- 2-MUSを線形時間で認識するアルゴリズムを提示した。
- 欠損1のMUSが存在するかどうかの判定問題はNP完全であることを拡張した。
- 1つまたは2つの単一節を含むMUSの判定/探索は多項式時間で可能であることを示した。
TOSSS:大規模言語モデルのためのCVEベースのソフトウェアセキュリティベンチマーク [cs.LG, cs.CL, cs.CR, cs.SE]目的:大規模言語モデルの,安全なコードと脆弱なコードの選択能力の測定
- LLMは様々な分野で活用され,ソフトウェア開発を支援するツールとして重要性が増している。
- LLMを開発ワークフローに組み込むことで,新たな脆弱性が生じる可能性があり,セキュリティが懸念される。
- 既存のベンチマークの限界を克服し,CVEデータベースに基づいた,より包括的なセキュリティ評価を行う。
- TOSSSは,LLMに安全なコードと脆弱なコードの選択を促し,その性能を0から1のセキュリティスコアで評価する。
- C/C++およびJavaコードにおいて14のLLMを評価した結果,スコアは0.48から0.89の範囲であった。
- TOSSSは,LLMプロバイダが公開するベンチマークスコアにセキュリティの観点を加えるための補完的な指標となりうる。
ソフトウェア工学における革新の触媒としての人工知能 [cs.SE, cs.AI]目的:ソフトウェア工学における人工知能の革新促進効果
- 現代のソフトウェア開発は複雑化の一途を辿り,迅速な対応が不可欠である。
- アジャイル開発は普及しているが,要件変更への対応と品質維持が課題である。
- 本研究は,AIによるアジャイル開発の最適化と新たな能力の創出を目指す。
- AI(特に機械学習と自然言語処理)の統合は,要件管理からコード生成,テストに至るまでの反復作業の自動化を促進する。
- AIは,既存のアジャイルプラクティスを最適化するだけでなく,将来のソフトウェア開発において品質,速度,革新を維持するために不可欠な新たな能力をもたらす。
- 調査の結果,ソフトウェアエンジニアリングの専門家は,AI駆動型ツールに対する認識,導入,影響について肯定的な評価を示している。
線形スケールテンソルトレインスケッチング [cs.IR, cs.CL, math.NA, cs.DS, cs.NA]目的:テンソルトレイン形式に特化した構造化ランダム射影
- 大規模テンソルデータの効率的な処理が重要であり,次元の呪いを克服する必要がある。
- 既存のテンソルスケッチ手法は,テンソル次数が増加すると計算量が指数関数的に増加する問題がある。
- テンソル次数に対して線形にスケーリングする新しいスケッチ手法を開発し,計算効率を向上させる。
- 提案手法であるBSTTは,パラメータPとRを調整することで,既存のスケッチ手法を統合する。
- BSTTは,無意識部分空間埋め込み(OSE)および無意識部分空間注入(OSI)の性質を持つことが証明された。
- 理論的結果は,合成テンソル,アダマール積,量子化学アプリケーションを用いた数値実験によって支持されている。
継続観測下における,気付かないDPと適応的DPの分離 [cs.MA, cs.IR, cs.CL, cs.CR, cs.DS]目的:気付かないDPと適応的DPの分離問題
- データプライバシー保護は,個人情報を取り扱う現代社会において不可欠な課題である。
- ストリーミングアルゴリズムにおけるプライバシー保護の理論的限界が明確でなかった。
- 気付かないDPと適応的DPの間のプライバシー保護能力の差を明確にすること。
- 気付かないDPアルゴリズムは,入力次元の指数関数的な数の時間ステップにおいて正確性を維持する。
- 適応的DPアルゴリズムは,定数個の時間ステップの出力公開後には正確性を失う。
- Jainらの未解決問題に対し,気付かないDPと適応的DPの分離問題を示す問題例を提示した。
グラフ表現のための命令セット [cs.HC, cs.IR, cs.MM, cs.SI, cs.CL, cs.AI, cs.DS]目的:有限の単純グラフの構造を9文字の命令アルファベットによるコンパクトな文字列として表現する方法
- グラフ構造は,様々な分野でデータ表現の基本であり,その効率的な表現が重要である。
- 従来のグラフ表現は,計算コストが高い場合や,グラフの類似性評価が困難な場合がある。
- IsalGraphを用いて,グラフ構造をコンパクトかつ効率的に表現し,類似性評価を容易にすること。
- IsalGraphは,任意のグラフを9文字の命令アルファベットによる文字列に変換可能である。
- 文字列の編集距離とグラフ編集距離の間に強い相関が認められた。
- IsalGraphは,グラフの類似性検索,グラフ生成,グラフ条件付き言語モデリングへの応用が期待される。
普遍的シャッフル漸近的性質(その2):シャッフルプライバシーにおける非ガウス限界 - ポアソン,スケラム,複合ポアソン領域 [math.ST, cs.IT, math.IT, math.PR, stat.TH]目的:シャッフルプライバシーにおける非ガウス限界の理論的特性
- プライバシー保護技術は,個人情報保護において不可欠であり,データ利活用との両立が求められている。
- 既存のシャッフルプライバシー研究では,ガウス分布を仮定しており,より広範な分布への対応が課題となっていた。
- 古典的なリンデベルク条件が満たされない,集中度の高いローカルランダマイザーにおける限界を明らかにすること。
- 局所的プライバシーパラメータε0(n)のスケールにおいて,ポアソンシフト限界とスケラムシフト限界への実験レベル収束が証明された。
- 有限アルファベットの場合,スパースエラー臨界領域において,多変量複合ポアソン / 独立ポアソンベクトル限界が導かれた。
- ガウス/GDP,臨界ポアソン/スケラム/複合ポアソン,そしてプライバシー喪失の3つの領域に分類することで,包括的な理解を促進する。
変分量子RFセンシングを用いた無線電波からの学習 [quant-ph, cs.AI, cs.IT, eess.SP, math.IT]目的:量子回路で最適化された量子センシングプローブを用いた環境学習
- 無線通信は情報伝達に加え,環境構造の知識源となり得る。
- 従来の環境学習は,チャネル測定や多くの情報が必要とされる。
- 量子センシングによる電波からの学習で,効率的な環境理解を目指す。
- 量子センサーを用いた学習は,展開時にチャネル測定を必要としない。
- 微弱・遮蔽されたRF信号に対しても感度を維持し,古典的な手法を超える学習が可能となる。
- シミュレーションによる実験で,現実的な条件下での局所化タスクでの有効性が示された。
マルコフ連鎖の高速化のための二分ブロック平均化カーネルの最適化 [math.CO, cs.DM, math.PR, cs.IT, math.CO, math.IT, math.OC, stat.CO]目的:有限マルコフ連鎖の混合を加速するための最適な二分ブロック分割の選択
- マルコフ連鎖は,統計物理学,機械学習など幅広い分野で利用され,その効率的な計算が重要である。
- マルコフ連鎖の混合速度が遅い場合,計算コストが増大し,実用上の問題となることがある。
- グループ平均化変換によるマルコフ連鎖の混合を加速するための最適な分割方法を明らかにすること。
- KLダイバージェンスの場合,対数ソボレフ定数を用いた明示的な減衰率が得られた。
- フロベニウス距離の場合,最適なカットを特徴づけるチーガー型汎関数が特定された。
- 提案する近似アルゴリズムは,実用上有効であり,定常分布への全変動距離を大幅に減少させることが示された。
近傍無線センシングのための最適可動アンテナ配置 [eess.AS, cs.CL, eess.SP, cs.IT, math.IT]目的:近傍無線センシングにおける,最悪の場合の位置誤差二乗限界の最小化戦略
- 無線センシング技術は,様々な分野で利用が拡大しており,その性能向上が求められている。
- 固定アンテナ配置では,位置推定精度に限界があり,特に近傍領域では課題が残る。
- 可動アンテナ配置によって空間的自由度を増やし,位置推定精度を向上させることを目指す。
- 提案手法では,アンテナ配置の対称性を利用することで,最悪ケースにおける位置の特定が容易になる。
- モーメントベース解析により,中心とエッジの3点にアンテナを配置する閉形式の最適解を導出した。
- シミュレーションにより,提案手法が従来の固定アンテナアレイと比較して優れた性能を発揮することが示された。
整数値対称サブモジュラ関数における小値カットの多項式サイズエンコーディング [eess.SP, cs.SY, eess.SY, physics.soc-ph, cs.CY, physics.soc-ph, cs.SI, math.CO, cs.DS]目的:有限集合上の整数値対称サブモジュラ関数における,指定された値を持つ部分集合の多項式サイズ表現
- 組み合わせ最適化問題において,関数構造の理解は効率的なアルゴリズム設計に不可欠である。
- 大規模な集合における関数値の計算は,計算コストが高く,実用上の課題となる。
- 関数値が特定の閾値となる部分集合を効率的に表現し,探索する手法を確立すること。
- 整数値対称サブモジュラ関数fに対し,f(X)=kとなる部分集合Xの族を,高々O(n^{4k})個の要素からなるリストで表現可能。
- この表現構築アルゴリズムの計算時間はO(n^{2k+7}\gamma+n^{2k+8}+n^{4k+2})であり,効率的である。
- 固定されたkに対し,特定のサイズ制約を満たすf(A)=kとなる集合Aを多項式時間で見つけるアルゴリズムが得られた。
- 1
- 2
