arXiv雑要約
プログラム - 2025/12/19 公開
LOOPRAG:検索拡張大規模言語モデルによるループ変換最適化の強化 [cs.PL, cs.AI, cs.DC, cs.PF]目的:ループ変換最適化における性能向上
- ループ並列化など,プログラム性能向上のために不可欠な技術である。
- 最適なループ変換の組み合わせを見つけることは,コストモデリングの複雑さから困難である。
- 大規模言語モデルの性能を向上させ,効率的なループ最適化を実現すること。
- 提案手法LOOPRAGは,PolyBench, TSVC, LOREベンチマークにおいて,既存コンパイラに対し最大11.20倍,14.34倍,9.29倍の高速化を達成した。
- LOOPRAGは,ベースとなる大規模言語モデルと比較しても,最大11.97倍,5.61倍,11.59倍の高速化を示した。
- ループ特性に基づいた検索アルゴリズムとフィードバック機構により,正確かつ効率的なコード生成を可能にした。
クロスデバイス対応性評価によるWebユーザーインターフェース設計の高度化:HCI統合型DLスキームの改良 [cs.HC, cs.AI, cs.LG, cs.MM, cs.SE]目的:Webユーザーインターフェースの最適化
- デジタル時代において,ユーザー満足度向上は重要であり,UIはその鍵となる。
- 既存のUI最適化モデルは,クロス応答性(CR)の評価を軽視しており,ユーザーインタラクション効率に影響を与えている。
- CR評価を通じて動的なWeb UI最適化を実現し,ユーザーエクスペリエンスを向上させる。
- 有限指数連続状態機械(FECSM)とクオッカ非線形差分スウォーム最適化アルゴリズム(QNDSOA)を用いてCR評価を実施。
- 提案するBidirectional GLMRUにより,ユーザーエクスペリエンス(UX)の変化タイプを分類し,ユーザーインターフェース変化予測インデックス(UICPI)に基づいてラベル付け。
- 新規QNDSOAによりUI設計を最適化し,平均適合度98.5632%を達成。最適化後のUIに対してフィードバック監視を実施。
構造化自然言語からの確率的要件の自動形式化 [cs.PL, cs.FL, cs.SE]目的:確率的要件の形式化
- 自律・適応システムは複雑性を増しており,不確実性の明示的な捕捉が不可欠である。
- 確率的構成要素を含む要件の明確な記述が困難であり,誤りが生じやすい。
- 構造化自然言語で記述された確率的要件を自動的に形式論理に変換する。
- NASAのFRETツールを拡張し,確率的要件の記述を支援する。
- 構造化自然言語の要件を確率的時相論理の公式に自動変換する手法を開発した。
- 生成された公式の妥当性と意味的整合性を保証する自動検証フレームワークを備えている。
クロスブラウザ視覚的不一致の特定におけるVision Language Modelsの活用:XBIDetective [cs.SE]目的:クロスブラウザ視覚的不一致の特定
- ウェブサイト品質確保上,ブラウザ間の表示差異を早期に発見することは不可欠である。
- 動的要素を含むウェブページの不一致検出は既存手法では困難であった。
- Vision Language Modelsを用いて,動的要素を含む不一致を高精度に検出すること。
- XBIDetectiveは,FirefoxとChromeのスクリーンショットをVLMで分析し,クロスブラウザの差異を検出する。
- ファインチューニングされたVLM使用時,検出精度は79%であり,動的要素・広告はそれぞれ84%,85%を達成。
- 自動回帰テスト,ウェブサイト大規模監視,不一致バグの迅速トリアージ等への応用が期待される。
CodeMem: 動的MCPと手続き的メモリによる再現可能なエージェントのアーキテクチャ [cs.SE, cs.AI]目的:再現可能なエージェントの構築
- AIエージェントの自動化ニーズは高まる一方であり,その性能向上が求められている。
- 既存のエージェントは,行動空間の制限やコンテキスト効率の低さ,確率的不安定性に課題がある。
- 手続き的メモリを用いて,エージェントの一貫性と信頼性を向上させることを目指す。
- CodeMemは,コードを介した手続き的メモリを実装するアーキテクチャである。
- これにより,再利用可能なエージェントワークフローを決定的に信頼性の高い形で構築できる。
- LLMの確率的性質による軌道変化を抑制し,一貫性を確保する。
ループ不変式の生成におけるニューロシンボリックアプローチ:最弱前提条件推論による手法 [cs.PL, cs.AI, cs.LO]目的:ループ不変式の生成
- 自動プログラム検証において,ループ不変式の生成は不可欠な要素である。
- 既存のLLMを用いた手法は,信頼性や構造に課題があり,検証理論との整合性が低い。
- LLMとHoare論理を組み合わせ,最弱前提条件推論を用いて不変式を生成・改良する。
- NeuroInvは,150のJavaプログラムのベンチマークにおいて,99.5%の成功率を達成した。
- 既存手法を大幅に上回り,複雑な検証シナリオへの拡張性も実証された。
- OpenJMLからの反例を用いて不変式を反復的に修復することで,検証をガイドする。
推測型ツール呼び出しによるエージェント言語モデル推論の最適化 [cs.PL, cs.AI, cs.DC, cs.PF, cs.SE]目的:エージェント言語モデル推論の性能向上
- 言語モデルは外部ツールへの依存度が高まっており,その活用は重要である。
- ツール利用は性能ボトルネックとなり,推論速度を低下させる問題がある。
- ツール呼び出しの推測とキャッシュ活用により,推論の高速化を目指す。
- 推測型ツール呼び出しとキャッシュ最適化により,推論スループットが大幅に向上した。
- 数百トークン/秒の性能改善が確認され,エージェント言語モデルの効率的な運用に貢献する。
- 推測設定に関する理論的分析を行い,最適な性能を引き出すための指針を提示した。
資源を最大限に活用:行列計算のための効率的なランダム化アルゴリズム [math.NA, cs.DS, cs.NA, stat.CO]目的:限られたデータ量で,高速かつ高精度な行列計算を可能とするランダム化アルゴリズムの設計
- 計算線形代数は,科学計算,機械学習,量子情報科学など,幅広い分野で基盤技術として重要である。
- ランダム化アルゴリズムの精度や安定性は,浮動小数点演算環境において課題となる場合がある。
- 限られたデータ量で効率的に情報を活用し,既存手法の課題を解決する。
- 正定値行列の低ランク近似において,ランダムピボットCholesky (RPCholesky)アルゴリズムが高い速度と信頼性を示す。
- 行列ベクトル積のみでアクセス可能な行列の属性推定において,leave-one-outアプローチに基づいた最適化アルゴリズムを開発した。
- 過決定線形最小二乗問題に対し,後方安定性を保証する高速なランダム化アルゴリズムを開発し,浮動小数点演算における問題点を解決した。
実証ソフトウェア工学における堅牢なLLMベースのアノテーションフレームワーク:OLAF [cs.SE, cs.AI]目的:LLMベースのアノテーションにおける信頼性,較正,ドリフト,合意,集約,透明性のための主要な構成要素
- 実証ソフトウェア工学は,ソフトウェア開発の改善に不可欠であり,その質を客観的に評価する必要がある。
- LLMを用いたアノテーションの信頼性や再現性が検証されておらず,標準化された評価指標が不足している。
- LLMベースのアノテーションを測定プロセスとして捉え,透明性と再現性を高めるための議論を促す。
- 本研究では,LLMベースのアノテーションフレームワークOLAFを提案し,主要な構成要素を整理した。
- OLAFは,信頼性,較正,ドリフトなどの評価指標を明確化し,LLMアノテーションの品質向上を目指す。
- 本研究は,ソフトウェア工学におけるLLMベースのアノテーションに関する今後の研究の方向性を示す。
ソフトウェアの意図を埋め込む:軽量なJavaモジュール復元 [cs.SE, cs.AI]目的:Javaシステムのモジュール復元
- ソフトウェア規模の拡大に伴い,コードレベルの抽象化だけでは管理が困難になっている。
- 既存のアーキテクチャ復元技術では,Java9のJPMSモジュールへの効果的な移行が難しい。
- JPMSモジュールへの移行を容易にするための,軽量かつ効率的なモジュール復元手法を提案する。
- 提案手法ClassLARは,パッケージ名とクラス名から意味情報を抽出し,構造と機能の両方の意図を捉える。
- 20のJavaプロジェクトの評価において,ClassLARは既存手法よりもアーキテクチャレベルの類似度が高く,実行時間も速かった。
- ClassLARは,最先端の手法と比較して,3.99〜10.50倍の速度で処理を完了した。
継続的公開におけるプライバシー下限の改善 [cs.DS]目的:変化するデータセットの統計量の継続的な公開におけるプライバシー保護の限界
- データプライバシー保護は,個人情報保護の観点から重要であり,現代社会におけるデータの利用と保護のバランスを保つ上で不可欠である。
- 継続的なデータ公開におけるプライバシー保護は困難であり,特にデータセットが動的に変化する場合,プライバシーと精度のトレードオフが課題となる。
- 本研究は,挿入のみのグラフ問題や同時ノルム推定におけるプライバシー保護の限界を明確にし,より効率的なプライバシー保護メカニズムの設計に貢献することを目指す。
- 挿入のみのグラフ問題(最大マッチング,次数ヒストグラム,$k$-コア)において,加法誤差に関する初の多項式下限が示された。これはFichtenbergerらの結果を指数関数的に改善するものである。
- 最大マッチングと$k$-コア問題においては,小さな乗法近似を許容することで,加法誤差を対数関数的に抑えることが可能であることが示された。
- 項目レベル設定では,多くのグラフ問題に対して,乗法誤差と加法誤差の積に関する多項式下限が示され,乗法誤差を含む継続的公開メカニズムに対する初の限界を示した。
一般重ね合わせからの特徴量の確実な抽出 [cs.LG, cs.AI, cs.DS, stat.ML]目的:重ね合わせられた特徴量の抽出
- 機械学習モデルの解釈可能性向上は重要であり,その鍵はモデルがどのように特徴量を表現しているかの理解である。
- 複雑なモデルでは特徴量が重ね合わされ表現されるため,個々の特徴量を特定することが困難である。
- 本研究は,特徴量の重ね合わせから,特徴方向と関数を効率的に復元することを目的とする。
- 提案アルゴリズムは,ノイズを含む関数へのクエリアクセスから,非退化的な応答を持つすべての特徴方向を特定する。
- 既存研究よりも一般的な設定で機能し,ほぼ任意の特徴量の重ね合わせを扱うことができる。
- フーリエ空間における探索により,隠れた特徴方向を反復的に絞り込むことで実現している。
ニューラルネットワークの時間周波数解析 [math.NA, cs.IT, cs.LG, cs.NA, math.IT]目的:ニューラルネットワークの近似理論
- 機械学習の性能向上には,ニューラルネットワークの理論的理解が不可欠である。
- 標準的なニューラルネットワークの近似能力には限界があり,より効率的なネットワーク構造が求められている。
- 時間周波数解析のツールを用いて,ニューラルネットワークの近似性能を定量的に評価し改善を目指す。
- 重み付き変調空間における近似率が,Sobolevノルム上で次元に依存しない形で証明された。
- 変調ベースのネットワークは,ReLUネットワークよりもSobolev近似において優れた性能を示すことが数値実験で確認された。
- Feichtinger代数やFourier-Lebesgue空間など,様々な関数空間における近似定理が導かれた。
情報理論と識別的サンプリングによるモデル発見 [cs.IT, cs.LG, math.AP, math.DS, math.IT]目的:モデル発見のための情報理論的アプローチ
- 複雑な動力学系の理解と解析には,情報理論が不可欠である。
- データ駆動型モデル発見では,効率的なデータサンプリングが課題となる。
- 情報量に基づいたサンプリングにより,効率的なモデル学習を目指す。
- フィッシャー情報行列とシャノンエントロピーの分析を通じて,情報パターンを可視化した。
- 情報に基づいたサンプリングは,単一または複数の初期条件において,モデル性能を向上させた。
- 統計的バギングの利点が,フィッシャー情報行列のスペクトル分析によって明らかにされた。
LLM4Perf:多目的性能モデリングのための大規模言語モデルの効果的なサンプラー [cs.DC, cs.HC, cs.RO, cs.SE]目的:多目的性能モデリングのための大規模言語モデルのサンプラーとしての有効性
- 現代のソフトウェアシステムの性能は,複雑な設定オプションに大きく依存する。
- 既存のサンプリング手法は,多目的最適化に苦戦し,ドキュメントからの意味情報を活用できない。
- 大規模言語モデルを用いて性能モデリングのサンプリング効率を向上させる。
- LLM4Perfは,112の評価シナリオのうち77で従来のベースライン手法を上回る性能を示した。
- LLMの構成空間の剪定とフィードバックに基づく戦略の改良が,その有効性の要因である。
- LLM4Perfにおけるコンポーネント選択とハイパーパラメータが有効性に影響を与えることを示した。
PageRank中心性の推定におけるインスタンス最適性 [cs.DS]目的:PageRank中心性の推定におけるインスタンス最適性
- PageRankはWebページの重要度評価に不可欠であり,検索エンジン等の基盤技術である。
- 大規模グラフにおけるPageRank計算は計算コストが高く,効率的な推定アルゴリズムが求められている。
- 本研究は,PageRank中心性推定アルゴリズムの計算量限界を明らかにし,最適性を検証する。
- 提案アルゴリズムは,最大次数が$n$の定数分以下のグラフに対し,インスタンス最適性を持つことが示された。
- 多項式個の頂点が高次数を持つスパースグラフに対しても,同様の最適性が成り立つことが確認された。
- しかし,次数が$n$に近いグラフでは,インスタンス最適性を満たさない反例が示された。
任意の共謀と異質セキュリティ制約を持つ分散安全集約における最適な鍵レート [cs.IT, math.IT]目的:任意の共謀と異質セキュリティ制約を持つ分散安全集約における最適な通信レートとソース鍵レートの特性評価
- プライバシー保護は重要であり,特に分散環境ではデータの安全な集約が不可欠である。
- 従来のDSAは,共謀者からの情報漏洩を防ぐために大きな鍵サイズを必要とする点が課題である。
- セキュリティ集合と共謀集合を定義し,最適なソース鍵レートを導出することで,鍵サイズのオーバーヘッドを軽減する。
- セキュリティ集合と共謀集合が任意に与えられた場合,最適な通信レートとソース鍵レートを線形計画問題として定式化した。
- ソース鍵レートの特性評価により,分散安全集約の実現に必要な鍵ビット数の最小値を明らかにした。
- 本研究は,分散環境におけるプライバシー保護の効率性と安全性を向上させるための基盤を提供する。
Apache Kafka イベントストリーミングシステムにおけるデザインパターンとベンチマーク手法の分析 [cs.SE]目的:Apache Kafkaシステムのデザインパターンとベンチマーク手法に関する体系的分析
- リアルタイム分析や大規模データ処理など,現代のデータ駆動型システムにおいてKafkaは不可欠な存在である。
- Kafkaの設計パターンとベンチマーク手法に関する研究が散在しており,体系的な整理が求められている。
- 再現可能なベンチマークと高性能なKafkaシステム設計のための指針を提供すること。
- 42件の論文を分析した結果,Kafkaにおける9つの主要なデザインパターンが特定された。
- パターン間の組み合わせの傾向や,特定のドメインでの利用状況が明らかになった。
- ベンチマーク手法における設定の開示不足や再現性の問題点が指摘され,改善の必要性が示された。
盲点を超えて:LLMベースの評価における落とし穴を軽減するための分析的ヒント [cs.SE, cs.AI]目的:LLMを評価者として利用する際の課題とその改善策
- コード生成パイプラインの規模拡大にLLMの利用が増加しており,評価の自動化が重要である。
- LLMはドメイン固有の問題を見落とす傾向があり,重要な評価タスクにおける信頼性が懸念される。
- LLMの評価における盲点を明らかにし,専門知識に基づいた分析的ヒントによって改善を目指す。
- LLM単独ではコードのエラーの約45%しか検出できない。
- 開発した分析的チェッカーとLLMを組み合わせることで,エラー検出率が最大94%に向上した。
- LLMとヒントの組み合わせは,より詳細で正確な説明を生成し,評価の信頼性を高める。
ナットを金槌で割るか?コンパイラ障害隔離の再検討 [cs.SE]目的:コンパイラ障害隔離における,BICベース戦略とスペクトルベース障害局所化技術との比較
- コンパイラはソフトウェア開発の根幹であり,その品質はシステム全体の信頼性に直結する。
- 既存のスペクトルベース障害局所化技術の実用性について,実際の開発プラクティスとの比較検証が不足している。
- 開発者が日常的に利用するBICベース戦略と,高度なSBFL技術の有効性を比較し,実用的な評価を行う。
- BICベース戦略Basicは,最新のSBFL技術と同等以上の性能を示すことがわかった。
- 特に,Top-1およびTop-5ランキング指標において,BasicはSBFL技術を上回る結果が得られた。
- 本研究は,SBFL技術の実用的な有効性に関する新たな知見を提供し,今後の研究におけるBaselineとしてのBasicの採用を推奨する。
Event-Bによるオペラドの機械化 [eess.SY, cs.SY, cs.DL, cs.DB, cs.LO, cs.SC]目的:オペラドの機械化による応用可能性の提示
- 自然や産業システムの厳密なモデリングは,抽象化の難しさを抱える
- オペラドの具体的な実装が不足しており,技術的応用に繋がりにくい
- Event-Bを用いてオペラドと基本演算を実装し,応用を促進する
- Event-Bによるオペラドの完全な改良連鎖を開発し,代数的オペラドを実装した。
- この研究成果は,記号計算に関する同様の実装手法の確立に貢献し得る。
- オペラド構造に支えられた記号計算アプリケーションの検証にも応用可能である。
マルチバースの制覇:効率的な並行宇宙決選による河川投票法 [cs.DS]目的:公正な選挙の勝者決定における中立性と計算可能性の両立
- 民主主義は投票を通して集団決定を行う。また,投票手続きはAI訓練等にも応用され,重要性が増している。
- 従来のランキングペア投票法では,中立性を保証しつつ計算可能性を維持することが困難であった。
- 新たに提案された河川投票法と並行宇宙決選を組み合わせ,効率的な計算手法を確立すること。
- 河川投票法と並行宇宙決選の組み合わせは,多項式時間で計算可能であることが示された。
- 勝者候補の判定には,特殊に構成された辺の順序で河川投票法を実行することで実現する。
- また,河川投票法の計算量を改善し,$\mathcal{O}(n^4)$から$\mathcal{O}(n^2 \log n)$へと短縮することに成功した。
2つの異なる一般化リード・ソロモン符号を用いた一般化単項カルテシアン符号からの新しい量子安定化符号 [cs.IT, math.IT]目的:新しい量子符号の構成
- 量子情報処理の発展には,信頼性の高い量子符号が不可欠である。
- 既存の量子符号は,符号のパラメータや構成方法に限界がある。
- 一般化単項カルテシアン符号を用いて,新しい量子符号を構築し,その性能を向上させる。
- 一般化単項カルテシアン符号(GMCC)の定義と,2つの異なる一般化リード・ソロモン符号からのGMCCの構成方法を示した。
- GMCCがエルミート自己直交となるための十分条件を確立し,新たな量子符号の構築を可能にした。
- これにより,量子情報処理における誤り訂正性能の向上に貢献することが期待される。
生成アートにおけるパラメータ探査のためのフレームワーク [cs.AI, cs.HC, cs.SE]目的:生成アートのパラメータ空間における探査
- 生成アートの表現力向上には,パラメータの最適化が不可欠である。
- パラメータ空間が広大であるため,手動での試行錯誤に限界がある。
- 人間と連携したパラメータ探査を効率的に行う手法の確立。
- ParamExplorerは,強化学習に着想を得たインタラクティブなフレームワークである。
- p5.jsプロジェクトへの組み込みが容易であり,既存のツールとの連携が可能である。
- 複数の探査戦略(エージェント)を実装し,その有効性を評価した。
シャンファー距離に対する完全動的アルゴリズム [cs.DS]目的:シャンファー距離の効率的な動的維持
- 点群間の類似度評価として広く利用され,機械学習等の応用範囲が拡大している。
- 動的に変化するデータセットに対して,効率的にシャンファー距離を再計算する手法が課題であった。
- 動的な点挿入・削除操作に対応し,シャンファー距離の近似値を効率的に維持することを可能とする。
- 本研究では,$\ell_p$ノルムにおけるシャンファー距離の動的維持に対する初のアルゴリズムを提案した。
- 提案アルゴリズムは,近似最近傍探索を基盤とし,少ないオーバーヘッドで実現される。
- 実験結果から,提案手法が既存手法と同等以上の性能を示すことが確認された。
部分情報分解における新たな不整合性結果 [cs.IT, math.IT]目的:部分情報分解の公理系の整合性に関する検討
- 情報理論の発展は,複雑なシステム理解に不可欠である。情報源間の関係性を明らかにする必要がある。
- 部分情報分解は様々な手法が存在し,統一的な解決策が見出されていない現状がある。
- 部分情報分解の基礎的公理の整合性を検証し,実現可能な範囲を明確にすること。
- 部分情報分解において,非負性,連鎖律,可逆変換不変性という古典情報理論の基本性質は,拡張すると互いに矛盾することが示された。
- この結果は,部分情報分解フレームワークが情報理論の基本的な性質の少なくとも1つを放棄する必要があることを明らかにする。
- Rauhらの古典的な結果を強化し,非負性,恒等性,Williams-Beer公理の同時成立の不可能性を再確認した。
有限ブロック長における誤り範囲ブロック誤り訂正器の混乱と消去 [cs.IT, math.IT]目的:有限ブロック長下における誤り範囲ブロック誤り訂正器の混乱と消去の特性
- 通信システムの信頼性向上は重要であり,誤り訂正符号は不可欠な要素である。
- 誤り率だけでは,訂正器が生成する混乱と消去の違いを区別できない。
- 誤り訂正器が生成する混乱と消去の確率を解析的に評価し,その影響を検証する。
- 誤り率制約下最大尤度復号における混乱と消去の確率について,球面積近似を用いて解析的な上限を導出した。
- 得られた結果は,ブロック消去チャネル抽象化の理論的根拠となり,MAC層やネットワーク層プロトコル設計を支持する。
- 実用的な有限ブロック長符号において,ブロック長が長く,SNRが高い場合,混乱の確率は消去に比べて無視できる程度に小さいことが確認された。
タイプ理論の圏モデルにおけるユニヴァレンス [cs.LO, math.CT, math.LO]目的:タイプ理論の圏モデルにおけるユニヴァレンス公理の定式化
- 圏論とタイプ理論は,現代数学の基礎として重要であり,その関係性の理解が求められる。
- ユニヴァレンス公理の検証は,ホモトピー理論的な設定において困難であった。
- ホモトピー理論的な設定において検証しやすいユニヴァレンス公理の定式化を目指す。
- 本研究では,ユニヴァレンス公理を圏モデル上で検証しやすい形で定式化した。
- さらに,計算可能性と意味論的な自然さを両立する「尖ったユニヴァレンス」と呼ばれる強化された公理を開発した。
- 尖ったユニヴァレンス公理は,Artin-Wraith gluingや逆図の形成の下で閉であることを確認した。
二重の計算的限界:知能システムにおける不完全性と予測不能性 [cs.AI, cs.LO]目的:アルゴリズム知能を制約する形式的不完全性と動的予測不能性
- 知能システムの根幹をなす推論と予測能力の限界理解は重要である。
- 既存研究では,自己予測能力の計算可能性が明確でなかった。
- 知能システムにおける推論,予測,自己分析間の本質的なトレードオフを解明する。
- 形式的不完全性と動的予測不能性は,知能システムの構造的な限界を定める。
- アルゴリズムエージェントは,一般的に自身の予測可能な最大範囲を計算できない。
- これは,自己分析能力の限界を示す重要な知見である。
深層学習におけるミュータントの現実性の実証研究 [cs.SE]目的:深層学習におけるミュータントの現実性評価
- ソフトウェア品質保証において重要であり,テストの有効性を評価する手段として確立されている。
- 深層学習への適用は進んでいるものの,ミュータントが現実の欠陥をどの程度反映しているか不明である。
- 深層学習におけるミュータントの現実性を検証し,より効果的なミューテーション手法の開発を目指す。
- 事前学習によるミュータントは,事後学習によるミュータントと比較して,現実の欠陥との結合強度および行動的類似性が高いことが示された。
- この結果は,事前学習ミューテーションが高い現実性を持つことを示唆している。
- しかし,事前学習の計算コストが高いことから,現実性を向上させる事後学習演算子の開発が求められる。
セキュアなイベントトリガー型分子通信:情報理論的視点と最適性能 [cs.RO, cs.IT, math.IT]目的:離散時間ポアソンチャネルにおけるランダム化識別およびセキュアランダム化識別容量の導出
- 生体内の細胞間通信を模倣する分子通信は,医療応用への期待が高まっている。
- 従来のシャノン情報理論は分子通信のイベント駆動型特性に適していない。
- 生体内の通信におけるセキュリティ確保が課題となっている。
- 離散時間ポアソンチャネルにおけるランダム化識別容量の公式を導出した。
- セキュアランダム化識別容量の公式を導出し,セキュリティとの関連を明らかにした。
- 識別パラダイムは,シャノン伝送符号に比べエネルギー効率とハードウェア要件で優れている。
カルタンニューラルネットワークのためのケーラー非コンパクト対称空間におけるスリアの熱力学 [cs.IT, math-ph, math.DG, math.DS, math.IT, math.MP]目的:カルタンニューラルネットワークの隠れ層の数学的モデルである非コンパクト対称空間U/Hにおける熱力学の抽象幾何学的定式化に関するいくつかの問題を明確化すること
- 情報幾何学と熱力学幾何学は根底を共有しており,その関係性の解明は両分野の発展に不可欠である。
- 非コンパクト対称空間上でのギブス分布の確立は困難であり,適切な温度空間の決定が課題となっている。
- ケーラー対称空間に限定することで,ギブス分布をサポートし,収束する温度空間を決定することを試みる。
- U/H 上のギブス分布はケーラー空間でのみ存在することが証明された。
- 温度空間は,コンパクト部分代数Hのカルタン部分代数Ccの正値領域に対するUの随伴作用下の軌道として明確化された。
- ラオ,チェンツォフ,アマリの情報幾何学と,ルペイナーとリャチャギンによる熱力学幾何学が同一であることが主張された。
ASPを用いた質量スペクトル分析 [cs.LO, cs.AI]目的:化学試料の元素および構造断片の相対的な存在量に基づく分子構造の発見
- 質量分析は物質の分子構造を特定する上で重要な役割を担う。
- 分子構造の探索は組み合わせ最適化問題であり,計算コストが高い。
- ASPを用いて効率的に分子構造を特定し,探索空間を削減すること。
- 本研究では,Answer Set Programming (ASP) を用いた新しい分子構造解析手法を提案した。
- 提案手法は,分子構造の標準的な表現と,それをASPで実装した対称性解消法を用いる。
- 既存手法や市販ツールとの比較により,提案手法の有効性と性能が確認された。
内部から:コメントの内部化がLLMの性能を左右する仕組みの解明 [cs.SE]目的:大規模言語モデルにおけるコメント内部化のメカニズムと,それがソフトウェア工学タスクの性能に与える影響
- ソフトウェア開発において,コードの理解と保守は不可欠であり,その過程でコメントが重要な役割を果たす。
- 大規模言語モデルがコメントをどのように利用しているのか,その内部的な仕組みが未解明であった。
- LLMにおけるコメントの内部表現を解明し,性能向上に繋げる。
- LLMはコメントを明確な潜在概念として内部化し,Javadoc,インラインコメント,複数行コメントなど,その種類も区別することが示された。
- コメント概念の活性化・非活性化により,モデルやタスクによって性能が-90%から+67%まで大きく変動した。
- コード要約タスクがコメント概念の活性化を最も強く引き起こし,コード補完タスクは最も弱かった。
任意のチャネル入力分布に対する枚挙的球形状化の拡張 [cs.CL, cs.CC, cs.CC, cs.IT, math.IT]目的:任意のチャネルの容量達成のための非一様チャネル入力分布の実現
- 通信容量を最大化するには,チャネルの特性に合わせた入力分布が重要である。
- 既存の分布マッチングアルゴリズムでは,柔軟な入力分布の生成が課題であった。
- 本研究は,ガウス分布に限定されないチャネルへの適用を可能とする。
- 拡張された枚挙的球形状化は,従来のCCDMと比較して,最大伝送レートを0.0425ビット/シンボル向上させた。
- 光通信チャネルにおいて,フレームエラーレート10^{-4}以下で性能改善が確認された。
- 提案手法により,より広範なチャネルへの適用が可能となった。
大規模言語モデルの反実仮想的公平性評価のための体系的アプローチ:CAFFEフレームワーク [cs.SE]目的:大規模言語モデルにおける反実仮想的公平性評価の体系化
- 現代社会におけるLLMの重要性が増す中で,公平性の確保は不可欠である。
- 既存の公平性評価手法では,網羅的なバイアス検出が困難である。
- 本研究は,LLMの公平性をより確実に評価するためのフレームワークを提案する。
- CAFFEフレームワークは,プロンプトの意図,会話の文脈などを明確に定義することで,LLMの公平性テストケースを体系化する。
- CAFFEは,ターゲットを絞ったテストデータを自動生成し,セマンティック類似度指標を用いてモデルの応答を評価する。
- 実験の結果,CAFFEは既存のメタモフィックテストよりも広範なバイアスをカバーし,より信頼性の高い不公平な挙動の検出が可能であることが示された。
エッジ向け時間論理誘導大規模言語モデル圧縮 [cs.PF, cs.AI, cs.LO]目的:大規模言語モデルの圧縮手法
- 自然言語処理の進化により,大規模言語モデルの重要性が増している。
- エッジデバイスの計算資源の制約から,モデルの展開が困難である。
- 時間論理を用いてモデルの言語的性質を維持しつつ圧縮を実現する。
- TOGGLEは,最大3.3倍の計算コスト削減と68.8%のモデルサイズ削減を達成した。
- 時間論理を用いて言語的制約を形式的に満たすことで,モデルの信頼性を確保する。
- 大規模言語モデルの圧縮に形式手法を初めて統合し,エッジデバイスへの効率的な展開を可能にする。
6GダウンリンクNOMAに向けたCRC支援GRAND:Beyond 5Gネットワークにおける耐ノイズ性NOMA復号 [cs.IT, math.IT]目的:次世代無線ネットワークにおける多重接続とスペクトル効率の向上を目的としたNOMAフレームワークの提案
- 無線通信における利用者の増加に対応するため,周波数利用効率の向上が喫緊の課題である。
- 従来のNOMA復号手法は,ユーザ間パワー差が小さい場合に誤り伝搬の影響を受けやすいという問題がある。
- CRCとGRANDを組み合わせることで,誤り伝搬を抑制し,NOMAシステムの信頼性を高めることを目指す。
- 提案手法は,CRCを用いて誤り検出と復号を支援し,従来のFECコードを不要とすることでシステム全体のオーバーヘッドを削減する。
- シミュレーション結果から,提案手法がAWGNおよびRayleighフェージングチャネルにおいて,最新のNOMA復号技術と比較してBER性能を大幅に改善することが示された。
- GRANDのような汎用的な復号手法を,干渉環境下での多重ユーザ環境に適用することで,将来の無線ネットワークの堅牢性を高める可能性が示唆された。
信頼楕円体の学習とロバストな部分空間復元への応用 [cs.DS, cs.LG, math.ST, stat.ML, stat.TH]目的:任意の分布における信頼楕円体の探索
- 高次元データ分析において,分布の形状を捉え,外れ値に強い推定を行う上で重要である。
- 楕円体の条件数が大きくなると,体積の近似計算がNP困難となる点が課題である。
- 有限の条件数を持つ楕円体に対する体積近似保証付きの信頼楕円体を効率的に探索することを目指す。
- 提案アルゴリズムは,多項式時間で,最適な条件数βの楕円体の体積に対してO(β^γd)の乗法誤差以内で確率質量を少なくとも1-O(α/γ)以上カバーする楕円体を見つける。
- この結果は,最悪ケースのインスタンスに対するロバストな部分空間復元問題に対する近似保証付きの多項式時間アルゴリズムを初めて提供する。
- 計算困難性の結果も示され,提案アルゴリズムの指数部の依存性はほぼ必要であることが示唆される。
ハードウェア抽象化層インタフェース仕様の継続的かつ初期段階からの検証 [cs.LO, cs.SE]目的:組み込みアプリケーションにおけるハードウェア抽象化層インタフェースの適切な使用
- 組み込みシステムの信頼性は重要であり,ハードウェア抽象化層はその実現に不可欠である。
- モデル検査の成功は予測不可能であり,産業利用の妨げとなっている。
- 開発初期段階から継続的に検証することで,モデル検査の安定性を高める。
- 本研究では,開発初期の段階からHALインタフェース仕様を継続的に検証するアプローチを提案した。
- プログラムの骨格から開始し,段階的に機能を追加していくことで,モデル検査の成功率を向上させた。
- 実験評価の結果,提案手法を用いることで,各段階および最終的なアプリケーションプログラムにおいて検証が成功した。
チャープ遅延ドップラー領域変調に基づく自律走行車向け通信・レーダー統合 [eess.SP, cs.IT, math.IT]目的:自律走行車における通信とレーダーの統合手法
- 自動運転技術の発展には,周囲環境の正確な認識と車両間通信が不可欠である。
- 従来のレーダーシステムでは,動的な環境下での高精度なパラメータ推定が課題であった。
- 遅延,ドップラー,振幅の各領域を利用した変調により,通信とセンシングの同時実現を目指す。
- チャープ波形を用いたDD-QAM変調方式を提案し,遅延・ドップラー・振幅次元にデータを変調することで,通信性能を向上させた。
- 拡張カルマンフィルタを用いた4次元パラメータ推定スキームを導入し,動的な環境下での高精度な姿勢および接線速度推定を可能にした。
- 受動車両側でのデータ復調を可能にする二重補償に基づく復調・追跡スキームを提案し,センシング機能との両立を実現した。
6G統合知覚・通信・計算ネットワークのための大規模モデルによる具現化知能 [cs.DC, cs.NI, cs.OS, cs.PF, eess.SP, cs.AI, cs.IT, math.IT]目的:6Gにおける知覚,通信,計算の統合を実現するための大規模モデル搭載型インテリジェント基地局エージェントの実現
- 次世代6Gでは,通信インフラに知能を組み込み,知覚・通信・計算を一体化することが重要である。
- 従来の基地局は機能が限定的であり,高度な知覚・推論・行動能力が求められている。
- 大規模モデルを活用し,基地局に知能を付与することで,より高度なサービス提供を目指す。
- 本研究では,基地局を知覚・認知・実行パイプラインとクラウド・エッジ・エンド連携によって構成されるインテリジェント基地局エージェントとして提案した。
- 自動運転における協調的な車両・路面知覚や,低高度無人航空機の安全監視といったシナリオを通して,その有効性を示した。
- 大規模モデルの設計・学習,効率的なエッジ・クラウド推論,マルチモーダル知覚と行動,そして信頼性の高いセキュリティなど,キーとなる技術要素を分析した。
量子誤り訂正符号の圧縮 [quant-ph, cs.AR, quant-ph, cs.IT, math.IT]目的:量子安定化符号の長さを短縮する手法
- 量子計算の実現には,量子ビットの誤り耐性確保が不可欠である。
- 誤り訂正符号の符号長が長いと,量子資源の消費が大きくなる。
- 符号長を効率的に短縮し,量子資源の消費を抑えること。
- 本研究では,複数の量子ビットを同時に削除する「圧縮」という手法を提案した。
- 圧縮により,量子符号のパラメータを制御できることが示された。
- 古典線形符号と比較して,圧縮はより大きな自由度と利点をもたらすことが示唆された。
クロネッカー積による累積和 [quant-ph, cs.DS]目的:累積和の計算手法と回路設計
- 累積和は,データ処理や信号処理など,多くの分野で基礎的な演算として利用されている。
- 従来の累積和回路は,回路規模や遅延時間が課題となっており,効率的な設計が求められている。
- クロネッカー積を利用することで,より高速で効率的な累積和回路の実現を目指す。
- 本研究では,クロネッカー積を用いて累積和を計算する新しい手法を提案した。
- 提案手法に基づく回路は,ゼロ欠損性,定数ファンアウト,および$2\log(n)$より漸近的に小さい深さを同時に実現する初の回路である。
- この回路を用いて量子加算器を設計し,既存の手法よりもToffoli深度と/またはToffoliゲート数を改善した。
付加符号の一般化ハミング重みと幾何学的対応 [math.CO, cs.IT, math.IT]目的:射影空間における $(h-1)$-空間の最大数および最小数
- 符号理論や暗号理論において,符号の性能を評価する上で重要な指標となる。
- 射影空間における幾何学的構造と符号の構造の関係性は未だ十分に解明されていない。
- 特定のパラメータにおける $(h-1)$-空間の数を決定し,符号の性能向上に貢献する。
- 2元体における $b_2(5,2,2;s)$ を $s$ の関数として完全に決定した。
- 他のパラメータについても上限値と構成例を与えた。
ベント関数に基づくNOMA方式のコードブック設計について [math.CO, cs.DM, cs.IT, math.IT]目的:NOMA方式における低PAPRかつ低自己相関性を持つ拡散系列を多数含むコードブックの設計
- 多数のデバイスを低遅延かつ高効率で接続するNOMA技術の重要性が高まっている。
- NOMAコードドメイン方式では,低PAPRと低自己相関性を両立するコードブック設計が課題である。
- ベント関数を利用し,最適に低い自己相関性を持つNOMAコードブックを構築する。
- 本研究では,再帰的手法を用いて,特定のベント関数に基づいたNOMAコードブックの理論的な構築を提案する。
- 提案手法により,長さ$N=2^{4m}$ (mは正の整数) のゴレイ系列を$6\cdot N$個含むコードブックが得られる。
- 構築されたコードブックは,最小限の自己相関性$1/\sqrt{N}$を達成する。
自己随伴符号の組合せ的記述による,算術的にゴレンシュタインでない点集合の判定 [math.CO, cs.IT, math.IT]目的:自己随伴符号の算術的ゴレンシュタイン性に関する組合せ論的判定方法
- 符号理論は,情報伝送や誤り訂正において重要な役割を果たす学問分野である。
- 自己随伴符号の算術的ゴレンシュタイン性を判定することは,難しい問題である。
- 自己随伴符号の構造と算術的ゴレンシュタイン性の関係を明確にすること。
- 比例列を持たない自己随伴符号が分解不可能な場合,かつその場合に限り,算術的にゴレンシュタインである。
- 生成行列の零一対称化を通じて,自己随伴符号のシュール二乗の次元を組合せ的に計算する手法が開発された。
- この手法により,ゴレンシュタイン欠陥を計算し,代数閉体上の算術的にゴレンシュタインな点集合を組合せ的に特徴づけることが可能となった。
量子ホッケー棒ダイバージェンスに対する非線形強データ処理 [quant-ph, cs.CR, cs.IT, cs.LG, math.IT]目的:量子ホッケー棒ダイバージェンスに対する非線形強データ処理不等式の確立
- 情報理論において,量子チャネルを通じた状態識別性の変化を測ることは重要である。
- 従来の線形強データ処理不等式は必ずしも最適ではなく,改善の余地がある。
- ノイズ条件を満たすチャネルにおける,よりタイトな不等式を導出すること。
- 本研究では,ノイズのあるチャネルに対する量子ホッケー棒ダイバージェンスの非線形強データ処理不等式を確立した。
- この結果は,既存の線形不等式や古典ホッケー棒ダイバージェンスに対する非線形不等式を改善する。
- これらの非線形不等式は,線形不等式では達成できない,より短い有限混合時間を導き出すことができる。
自身の正当性を証明するモデル [cs.LG, cs.CC, cs.SE]目的:モデルの正当性証明
- 機械学習モデルの信頼性は重要であり,特に安全性や公平性が求められる場面で不可欠である。
- 既存のモデル評価は平均的な精度に留まり,特定の入力に対する保証は存在しない。
- 特定の入力に対してモデルの正当性を証明する手法を確立し,信頼性を高めることを目指す。
- 自己証明モデルは,与えられた分布からサンプリングされた入力に対して,高い確率で正しい出力を生成し,検証アルゴリズムVに対して正当性を証明できる。
- Vの健全性は,すべての入力において,誤った出力に対してVを欺くモデルは存在しないことを保証する。
- トランスクリプト学習(TL)と検証者からのフィードバックによる強化学習(RLVF)という2つの汎用的な自己証明モデル学習手法を提案・分析した。
小さな挿入確率を持つ挿入チャネルの容量近似 [cs.IT, math.IT]目的:小さな挿入確率における挿入チャネルの容量の主要項の決定
- DNAストレージなどへの応用が期待され,情報伝送における信頼性確保が重要である。
- 挿入・削除エラーはメモリ特性を生み出し,容量解析を複雑にするという課題がある。
- 低挿入確率における挿入チャネルの容量を近似的に求め,容量の存在を示す。
- ランダム挿入チャネルとGallager挿入チャネルの容量を解析し,漸近的な差を定量化した。
- Bernoulli(1/2)入力を用いた達成可能レートと,定常・エルゴード過程を用いた逆伝達定理により証明された。
- ランダム挿入チャネルの容量がGallager挿入チャネルよりも高いことが示された。
- 1
- 2
