arXiv雑要約

プログラム - 2026/06/11 公開

テキストにおける意味情報の幾何学的プロファイル：フレーム条件付き一意性とスカラー要約のトレードオフ三角形 [cs.CL, cs.IT, math.IT]目的：テキストの意味内容の幾何学的構造に基づく測定手法の開発
- 自然言語処理において，テキストの意味内容を定量的に評価することは重要な課題である。
- 既存の研究では，意味の不確実性やテキスト間の比較に焦点が当たり，単一テキストの意味内容を捉えることは困難であった。
- テキストの文埋め込み構造から意味内容を測定する幾何学的フレームワークを構築し，その特性を明らかにする。
- テキストの意味内容を特徴付けるスカラー測定は，特定のフレームワーク下で一意に定まることが証明された。
- 新規性，広がり，統合性という三つの座標による意味プロファイルが提案され，トレードオフ三角形の存在が示された。
- 提案手法は，既存手法と比較して優れた性能を示し，テキストの意味内容の評価において有効であることが確認された。
Link: https://arxiv.org/abs/2606.11222
設計源の削減とセマンティックレート歪のデュアルパーパス実現可能性バンド [cs.RO, cs.IT, eess.SP, math.IT]目的：セマンティック通信におけるデュアルフィデリティのトレードオフに関する分析
- セマンティック通信は，情報伝送の効率化と意味理解の最適化を目指す重要な研究分野である。
- 従来のレート歪理論は，設計源（決定論的オラクル割り当て）に対する適用が限定的であった。
- 設計源におけるセマンティック通信の実現可能性範囲を明確化し，レート歪の限界を特定すること。
- 設計源と滑らかな凹型効用関数を用いることで，SK（Stavrou and Kountouris）フレームワークが簡略化され，条件付き平均復号とロイド-マックス定常性が得られる。
- 第二フィデリティが単調な単一文字歪みの場合は，SK共通カテゴリレートが対応するシャノンレート歪関数で下限が与えられ，最適条件が明らかになった。
- 第二フィデリティが集合検証の場合は，SK単一文字クラスから逸脱し，実現可能性バンドの幅がパーティションのカーディナリティに依存することが示された。
Link: https://arxiv.org/abs/2606.11280
差分プライバシー下における合成データ生成の固定パラメータ計算可能性 [cs.DS, cs.LG, stat.ML]目的：差分プライバシーを考慮した合成データ生成問題
- プライバシー保護の重要性が高まる中，データ利用とプライバシー保護の両立が課題となっている。
- 既存手法では，合成データの品質とプライバシー保護のバランスが十分でない場合がある。
- クエリ系列のインシデンスグラフのツリー幅をパラメータとした計算可能性を明らかにすること。
- 本研究では，クエリ系列のインシデンスグラフのツリー幅をパラメータとする合成データ生成問題に対し，固定パラメータ計算可能性を確立した。
- 線形計画法と双対問題の分離問題の固定パラメータ計算可能性に基づくアプローチ，およびギブス分布からのサンプリングの固定パラメータ計算可能性に基づくアプローチの二つを提案した。
- 両アプローチは，ツリー分解に基づく動的計画法フレームワークによって統一されている。
Link: https://arxiv.org/abs/2606.11283
ゲーム理論におけるハイブリッド連携のためのエントロピーに基づくフレームワーク：第I部人間による仲裁 [cs.GT, cs.IT, math.IT]目的：人間とAIのハイブリッド連携における意思決定権の移行
- AIおよびマルチエージェント研究の基盤であり，複雑なシステムにおける合理的行動を分析する上で不可欠である。
- 従来のゲーム理論は，人間とAIが協調するハイブリッドシステムにおける権限委譲を扱えない。
- 人間とAIが連携する状況下で，効率的かつ公平な意思決定を可能とするフレームワークを構築すること。
- 本研究では，人間の政策とAIの政策間のJensen-Shannonダイバージェンスに基づく委任ルールを導入したNeoGame Theoryを提案。
- 人間の最終的な実行権限を維持しつつ，AIが観察学習と頻度マッチングによって学習する「人間による仲裁」という最初の体制を開発。
- フレームワークの公理的基盤を確立し，頻度収束均衡を特徴づけることで，さらなる拡張と計算による検証の基礎を築いた。
Link: https://arxiv.org/abs/2606.11288
MJSAC：同時検知通信のためのマコーミック緩和に基づく波形設計 [cs.CL, cs.IR, cs.IT, math.IT]目的：同時検知通信における波形設計手法
- 次世代通信技術において，ハードウェアと周波数資源の効率的な利用が重要である。
- 既存手法では，通信性能を犠牲にして検知性能を向上させている場合がある。
- 通信と検知の両性能を向上させる波形設計が求められている。
- 提案手法MJSACは，マコーミック緩和を利用して，検知性能と通信性能のバランスを最適化する。
- MJSACは，共用ビームパターンを維持しつつ，共分散行列間の距離を最大化することで，従来のアルゴリズムを上回る性能を示す。
- MJSACは，チャネル情報なしで共分散行列を生成可能であり，実用性に優れる。
Link: https://arxiv.org/abs/2606.11351
閾値群検査における情報理論的解析 [cs.IT, math.IT, math.PR]目的：疎な二値ベクトルの正確な復元
- 群検査は，限られた検査資源で効率的に不良品を特定する手法であり，様々な応用分野で重要である。
- 従来の群検査では，不良品の数が少ない場合に効率が低下する問題がある。
- 閾値群検査における検査回数の理論的限界を明らかにすることで，より効率的な検査方法の設計を目指す。
- 閾値群検査において，一定の列設計における情報理論的な相転移点が，古典的群検査と同程度であることが示された。
- ただし，不良品の割合が高い場合，閾値を導入することで検査回数を大幅に削減できることが明らかになった。
- 一方，不良品の割合が正である場合，閾値群検査は古典的群検査よりも困難になる可能性があることも示唆された。
Link: https://arxiv.org/abs/2606.11353
組み合わせメモリにおけるカラー・ルール・関数エンコーディング [cs.IT, cond-mat.other, math.IT]目的：組み合わせメモリにおける情報表現のための体系的なエンコーディングフレームワーク
- データ集積密度向上への要求が高まる中，次世代メモリ技術の探求が重要である。
- 従来のメモリ技術では，データ集積密度に限界があり，さらなる高密度化が課題となっている。
- カラー・ルール・関数(CRF)エンコーディングを用いて，データ集積密度を向上させることを目指す。
- CRFアプローチは，パス選択，セルへの値割り当て，ルール定義，ブール関数構築の4段階で構成される。
- CRFエンコーディングは，従来のメモリと比較して，設計空間のスケーリングが大幅に速いことが示された。
- カスタマイズされたモジュール設計と組み合わせることで，実用的なデータ集積密度（Exabit/cm²超）を実現する可能性が示唆された。
Link: https://arxiv.org/abs/2606.11365
光インターコネクト向け最大カバレッジ追跡デコーダ [cs.IT, math.IT]目的：光インターコネクトにおけるテストパターン選択の最適化
- データ伝送量増加に伴い，高速光インターコネクトの信頼性確保が重要となっている。
- 従来のデコーダでは，テストパターン数が多く，複雑性が高いという課題がある。
- テストパターン数を削減し，デコーダの複雑性を低減することで，効率的な誤り訂正を目指す。
- 提案手法は，RS-BCHとoFECの連結符号において，標準的なChaseデコーダと同等の性能を実現する。
- テストパターン数を，それぞれ25%と61.3%削減することに成功した。
Link: https://arxiv.org/abs/2606.11401
書誌情報と形式化された数学知識の架け橋に向けて [cs.DL, cs.AI, cs.LO]目的：書誌情報と形式化された数学知識の間の関連付け
- 数学研究は発展が速く，成果の体系的な管理とアクセスが重要である。
- 書誌データベースと形式化された証明ライブラリが分断され，連携が困難である。
- 出版された結果と形式化の間のつながりを確立し，知識の統合を促進する。
- 書誌メタデータと形式化された成果を関連付ける関係データベースを提案する。
- 論文レベルの形式化スコアを導入し，形式化の網羅度を測定する。
- 非公式テキストとLean形式化の間の文書アラインメントを用いて，形式化のカバー率を推定する。
Link: https://arxiv.org/abs/2606.11430
テスト時学習による近似サンプリングの可能性 [cs.CL, cs.DS, cs.AI, cs.LG, stat.ML]目的：近似サンプリングのためのテスト時学習の理論的枠組み
- 生成AIの発展に伴い，複雑な確率分布からの効率的なサンプリングが重要課題となっている。
- LLMと特定のサンプリングタスク間の関係性が，サンプリングアルゴリズムの性能を制限する。
- テスト時学習による適応を通して，この制限を克服し，サンプリング効率を向上させる。
- テスト時学習を，既知の分布クラスFに属する確率測度μ^＊からのサンプリング問題として定式化した。
- 十分大きなクラスFに対して，μ^＊からのサンプリングにおけるクエリ複雑度の下限を二次関数として示した。
- Fのサイズが適切に制限されれば，この下限を回避できることを示し，テスト時学習の理論的基盤構築への道を開いた。
Link: https://arxiv.org/abs/2606.11437
WebネイティブなグラフィカルEMFモデルエディタ [cs.SE, cs.PL]目的：WebネイティブなEMFモデル編集フレームワークの設計と実装
- モデル駆動開発の普及に伴い，モデル編集環境の重要性が増している。
- 従来のデスクトップベースのエディタは，導入やメンテナンスに手間がかかる。
- Webベースで容易にカスタマイズ可能なEMFモデルエディタの提供。
- EMFularというWebベースのフレームワークを開発し，Ecoreモデルからグラフィカルエディタを生成可能にした。
- 生成されたエディタはAngularプロジェクトとして提供され，拡張ポイントを通じて容易なカスタマイズが可能である。
- EMFの一貫性を維持し，既存のEMFツールとの相互運用性も確保されている。
Link: https://arxiv.org/abs/2606.11442
ブール関数のノイズ付きクエリ複雑性に対する統一的な下界 [cs.CL, cs.DS, cs.CC, cs.IT, math.IT]目的：ブール関数のノイズ付きクエリ複雑性の下界
- 計算複雑性理論において，問題解決に必要なクエリ回数を評価することは重要である。
- ノイズ付きクエリモデルでは，従来のクエリモデルよりも複雑な解析が必要となる。
- ブール関数のノイズ付きクエリ複雑性に対する一般的な下界を確立し，既存の結果を統合する。
- ブール超立方体の部分グラフの次数統計に基づく，一般的な下界を証明した。
- これにより，既存の多くの下界が統一的に説明され，証明が簡略化される。
- Gu, Li, Xuらの未解決問題が肯定的に解決され，いくつかの新しい関数に対するタイトな下界が得られた。
Link: https://arxiv.org/abs/2606.11448
有限幾何符号のLDPC表現のための持ち上げガビドゥリン構成 [cs.IT, math.IT]目的：有限幾何符号のLDPC表現におけるデコード行列の疎化
- 有限幾何符号は，古典的なブロック符号の代数特性とLDPC符号の反復信念伝播デコード能力を併せ持つ。
- 標準的なインシデンス行列は高密度であり，短いサイクルが多く，実用的な活用が困難である。
- 鉛筆選択に基づき，持ち上げガビドゥリン符号を用いてデコード行列を疎化し，この問題を解決する。
- アフィン幾何および射影幾何に対し，最大長1024のFG符号に対し，疎なパリティチェック行列を構築・検証した。
- 4つのFG符号を用いたシミュレーションでは，目に見えるエラーフロアは確認されず，ブロック誤り率10のマイナス7乗で，対応する5G LDPC符号に比べて約0.5dBの利得が得られた。
Link: https://arxiv.org/abs/2606.11454
敗北カード：安全アシュアランスケースにおける敗北要因の特性化と管理 [cs.SE]目的：安全アシュアランスケースにおける敗北要因の特性化，考察，管理のための構造化された文書化手法
- 安全重要システムにおいて，安全要求を満たす根拠を明確化する安全アシュアランスケースの重要性が高まっている。
- 既存の敗北要因の記述は，標準化されておらず，レビューが困難であり，一貫性に欠けるという課題があった。
- 敗北要因を体系的に分析・管理することで，安全アシュアランスケースの信頼性と進化を支援することを目指す。
- 本研究で提案する「敗北カード」は，5W1Hフレームワークに基づいて構造化されており，情報に基づいた分析と進化を促進する。
- 事例研究を通じて，隠れた前提や推論のギャップを明らかにし，継続的な安全アシュアランスケースの進化を支援することが示された。
- 研究成果として，敗北カードのリポジトリを公開し，コミュニティでの再利用と学習の促進に貢献する。
Link: https://arxiv.org/abs/2606.11462
ヘリンガー距離における密度推定：最小距離推定法，ガウス混合，対数凹関数など [cs.DS, cs.LG, math.ST, stat.TH]目的：確率密度関数の正確な推定
- データ分析や機械学習において，データの分布を把握することは，予測や意思決定に不可欠である。
- 総変動距離の推定手法は確立しているものの，ヘリンガー距離における推定法の理論的保証は十分ではなかった。
- ヘリンガー距離における最小距離推定法のレシピを確立し，高速な推定アルゴリズムを開発すること。
- ヘリンガー距離における最小距離推定法のレシピが，VC次元の評価によって導き出された。
- 総変動距離向けに設計された既存のアルゴリズムを修正することで，ガウス混合や対数凹密度混合クラスの推定が可能になった。
- 提案手法は，ほぼ線形時間で動作し，サンプル複雑度はほぼ最適である。
Link: https://arxiv.org/abs/2606.11469
SentTrack：GitHub issueリポジトリにおける感情駆動型ボトルネック検出 [cs.SE]目的：GitHub issue議論からの社会技術的ボトルネック検出
- ソフトウェア開発において，GitHub issueが重要なコミュニケーション手段となっている。
- 従来のツールはコード指標に偏重し，議論の質に着目したものが少ない。
- リアルタイムな会話データから非効率性を検出し，早期にリスクを特定すること。
- SentTrackは，大規模言語モデルとクラスタリング技術を用いて，issue報告を要約し，懸念事項を抽出した。
- issueスレッドの49％が停滞し，解決に至ったのは13％に過ぎないことが明らかになった。
- 感情，停滞，解決ギャップ，スレッド長さを組み合わせたスコアリングエンジンが，ボトルネックの特定に有効であることが示された。
Link: https://arxiv.org/abs/2606.11476
合計スループット最大化のための移動アンテナ配置とRIS分割の同時最適化 [cs.IT, math.IT]目的：合計スループットの最大化
- 無線通信における通信品質向上は，社会における情報伝達の基盤であり，重要な課題である。
- 従来の固定アンテナ配置では，干渉の抑制や信号強度の最適化に限界がある。
- 移動アンテナとRISを活用することで，柔軟な信号制御と干渉抑制を実現し，通信性能を向上させる。
- 提案手法では，移動アンテナの配置，ビームフォーミング，RIS素子選択を同時に最適化する枠組みを構築した。
- シミュレーション結果から，提案手法は従来の固定アンテナ配置や他の手法と比較して，大幅なスループット向上を実現することが示された。
- この枠組みは，ネットワークの自由度を高め，所望の信号を強化し，ユーザ間干渉を軽減する効果がある。
Link: https://arxiv.org/abs/2606.11519
RISアシストUAVネットワークの接続性最大化 [cs.IT, math.IT]目的：RISアシストUAVネットワークにおける接続性の最大化
- UAVネットワークは，通信インフラの代替や拡張に不可欠であり，その性能向上が重要である。
- UAVネットワークの接続性は，電波環境に左右されやすく，安定的な通信確保が課題である。
- RISを活用し，UAV配置とRIS分割を最適化することで，接続性向上を目指す。
- 提案手法は，RIS支援リンク選択，RIS分割，UAV配置を最適化し，ネットワーク接続性を最大化する。
- RIS分割とUAV信頼性に影響されるSINR制約を維持しつつ，Fiedler値を最大化する。
- シミュレーション結果から，既存手法と比較して提案手法がUAV配置とRIS分割において潜在的な利点を示す。
Link: https://arxiv.org/abs/2606.11523
再帰的パターンの階層的再利用による言語複雑度の測定 [cs.CL, cs.IT, math.IT]目的：言語複雑度の指標
- 言語の複雑性は，言語学，認知科学において重要な研究課題である。
- 既存の言語複雑度指標は，計算可能性や言語普遍性の検証が困難であった。
- アルゴリズム情報理論に基づき，言語の複雑度を客観的に測定することを試みる。
- ラダーパス指数は，言語間の変動が小さく，テキスト長との相関が低いことが示された。
- 二値表現に変換することで，ラダーパス指数の言語間不変性がより明確になった。
- 再利用可能な部分構造が自然言語の語彙や形態素と重なることから，認知的なチャンキングとの関連性が示唆された。
Link: https://arxiv.org/abs/2606.11531
スキル審査員：エージェントのスキル編成が実行時動作に及ぼす影響の測定 [cs.AI, cs.SE]目的：エージェントのスキル編成の変化と実行時動作の関係性の評価
- LLMエージェントの能力向上には，推論時の手続き的知識の活用が不可欠である。
- 既存の評価指標では，スキルの内容と編成の違いが明確に区別されていない。
- スキル編成がエージェントの知識探索と適用方法に影響を与える点を検証する。
- プログレッシブ・ディスクロージャーは，実行時に参照するスキル資源数を増加させる。
- プログレッシブ・ディスクロージャーは，検証をパスする試行回数をわずかに増加させる。
- スキル編成の効果は，タスクの種類によって異なり，資源の活用可能性が重要となる。
Link: https://arxiv.org/abs/2606.11543
視覚・言語・行動モデルとワールドモデルの融合：低高度ワイヤレスネットワークにおける具現化されたエージェントAI [cs.IT, math.IT]目的：低高度ワイヤレスネットワークにおける自律制御
- 低高度ワイヤレスネットワークは，多様なサービスを提供する重要な基盤技術である。
- 大規模生成モデルの展開には，行動マッピングの限界，物理環境のモデル化不足，閉ループ最適化の不十分さが課題となる。
- 視覚・言語・行動モデルとワールドモデルを統合し，環境に適応的に最適化するフレームワークを開発することで，上記の課題を解決する。
- 本研究では，視覚・言語・行動モデルを中核とした具現化されたエージェントUAVフレームワークを提案した。
- ワールドモデルを導入することで，UAVの行動と環境変化の関連性を捉え，環境予測と方針検証，動的な最適化を可能にした。
- 実験結果は，本フレームワークがLAWNsにおける堅牢で予測可能かつ持続可能な自律制御を実現することを示した。
Link: https://arxiv.org/abs/2606.11618
周波数行進を超えて：双面群および投影型多参照アライメントにおける軌道回復 [cs.IR, cs.DS]目的：双面群および投影型多参照アライメントにおける軌道回復手法
- 分子構造解析などに応用され，ノイズ下での信号復元は科学技術において重要である。
- 従来のアルゴリズムでは，一般的な信号に対して双面群や投影型アライメントの軌道回復が困難であった。
- 双面群および投影型アライメントにおいて，一般的な信号に対する軌道回復アルゴリズムを開発する。
- 信号長が2の累乗である場合に，問題を再帰的に分割するアルゴリズムを提案した。
- 提案手法は，ある特定の多項式行列のランクに関する予想が成り立つことを条件に，一般的な信号に対して成功することが証明された。
- 提案アルゴリズムは，問題サイズに応じて計算機上で検証可能な予想に基づいている。
Link: https://arxiv.org/abs/2606.11701
Acoda：LLMによるコード解析に対する敵対的コード難読化 [cs.SE]目的：LLMによるコード解析への防御策としての敵対的コード難読化手法
- ソフトウェア開発においてLLMの利用が拡大しており，コード理解や脆弱性検出への応用が進んでいる。
- LLMの強力な意味解析能力は，知的財産の漏洩につながる可能性があり，セキュリティ上のリスクとなる。
- LLMによるコード解析を妨害し，コードのセキュリティとプライバシーを保護することを目的とする。
- Acodaは，LLMの安全性調整とトークンベースの情報処理メカニズムを活用し，8種類の意味を保持する難読化手法を設計する。
- 遺伝的アルゴリズムを用いて難読化戦略を最適化し，LLMのコード解析を拒否または誤らせる効果を最大化する。
- GPT-4oを含む7つの最先端LLMに対し，最大70%の攻撃成功率を達成し，高いモデル間転送性と低い実行時オーバーヘッドを示す。
Link: https://arxiv.org/abs/2606.11755
逐次観測下における高速ガウスメカニズム：応用 [cs.DS, cs.CR, cs.DB]目的：逐次観測データに対するプライバシー保護付きベクトル公開
- データプライバシー保護は，個人情報を含むデータ分析において不可欠であり，その重要性は増している。
- 従来の逐次公開手法では，計算時間がデータ量に比例し，大規模データには不向きな場合がある。
- 本研究は，計算効率を向上させ，より実用的なプライバシー保護技術の確立を目指す。
- 本研究では，特定の要素を定数時間でサンプリング可能な高速ガウスメカニズムを提案した。
- 提案手法は，二分木メカニズムと同等の分布を再現しつつ，既存手法よりも計算時間を大幅に短縮する。
- 動的範囲カウントクエリや結合サイズ推定など，データ管理への応用も示した。
Link: https://arxiv.org/abs/2606.11760
非特殊除数，コードの最小公倍数，クマー拡大上のLCDコード [cs.IT, math.IT]目的：関数体上の線形相補対(LCP)および線形相補双対(LCD)コードの構成
- LCPやLCDコードは幅広い応用があり，その構成手法の研究が重要である。
- LCPやLCDコードの構成には，次数が$g$と$g-1$の非特殊除数が必要だが，その構成は容易ではない。
- クマー拡大上の非特殊除数の構成を可能にし，LCPやLCDコードの構成を促進すること。
- 非特殊除数のサポートに非完全分岐位点を含む場合の特徴付けを算術的に行った。
- GK曲線上の次数$g-1$の非特殊除数を明示的に構成した。
- クマー拡大上の次数$g$の有効な非特殊除数の族を，純ギャップを利用して明示的に与えた。
- AGコードのLCPを構成するための一般的な枠組みを開発し，セキュリティパラメータ決定を可能にした。
Link: https://arxiv.org/abs/2606.11764
セグメント化されたソフトロボットに触発されたフレキシブルアンテナアレイ：設計と最適化 [cs.IT, math.IT]目的：セグメント化されたソフトロボットアンテナシステムの設計と最適化
- 通信環境の多様化に対応するため，柔軟性と再構成可能なアンテナ技術が重要視されている。
- 従来の再構成可能アンテナは，構造が複雑であり，柔軟性に欠けるという課題があった。
- ソフトロボットの柔軟性を利用し，より高効率なアンテナシステムの実現を目指す。
- 本研究で提案するアンテナシステムは，固定アンテナアレイや従来の再構成可能アンテナと比較して，大幅な性能向上を示した。
- 特に，SEACとHEIACは，従来の3D再構成可能アンテナに対して，それぞれ37.9％と32.1％の合計スループットの向上を達成した。
- また，SEACはコンパクトなアレイ配置において，最大49.3％のゲインを実現した。
Link: https://arxiv.org/abs/2606.11771
量子化は高密度トップ-$k$検索にどのような制約を与えるか：理論的研究 [cs.IR, cs.AI, cs.IT, math.IT]目的：高密度トップ-$k$検索における量子化の限界
- 情報検索の効率化は，大規模データセットの処理において不可欠である。
- 量子化による次元削減は，計算コスト削減に有効だが，精度低下を招く可能性がある。
- 量子化精度と次元数の関係を理論的に解明し，実用的な限界を明らかにすること。
- 無限精度では次元数を$k$に抑えられるが，有限ビット数では$N$に依存した次元数が必要となる。
- 量子化のビット数$B$が一定の場合，次元数は対数的に$N$と共に増加する。
- 量子化精度が閾値$B^{*} = O(\ln \ln N)$を下回ると，どのような次元数でもトップ-$k$検索は不可能になる。
Link: https://arxiv.org/abs/2606.11780
大規模分散システムにおけるスケーラビリティ障害の理解と検出 [cs.CL, cs.SE]目的：大規模分散システムのスケーラビリティ障害に関する理解と検出手法
- 現代の計算インフラを支えるが，規模拡大に伴い複雑性が増す。
- スケーラビリティ障害は潜在的で，大規模展開でのみ顕在化し，特定が困難。
- スケーラビリティ障害の根本原因と共通パターンを特定し，検出手法を開発する。
- 444件の障害報告を分析し，スケーラビリティ障害の反パターンと根本原因を特定。
- 障害の多くは，次元コードと関連する反パターンの相乗効果によって引き起こされることが判明。
- 動的・静的解析を組み合わせたScaleLensを開発し，既知の障害に関連する次元コードを4.2倍多く検出。
Link: https://arxiv.org/abs/2606.11815
文法制約デコーディングがLLMを悪意のあるコード生成に誘導する [cs.CR, cs.AI, cs.CL, cs.SE]目的：LLMによる悪意のあるコード生成の誘導メカニズムの解明と安全対策の提案
- LLMはコード生成に利用が増加しており，その安全性確保は重要な課題である。
- 文法制約デコーディングは信頼性向上に貢献する一方，新たな攻撃対象となるリスクが認識されていない。
- 文法制約デコーディングが悪意のあるコード生成を誘発する脆弱性を解消すること。
- 本研究で提示したCodeSpear攻撃により，LLMが文法制約によって悪意のあるコードを生成することが示された。
- 提案手法CodeShieldは，攻撃者が制御する文法制約下でも安全性を維持し，有用性を損なわないことを確認した。
- 文法制約デコーディングの潜在的なセキュリティリスクを明らかにし，今後の安全対策の必要性を示唆した。
Link: https://arxiv.org/abs/2606.11817
STCC：意味通信のための統一されたソース・チャネル意味トークン符号化フレームワーク [cs.RO, cs.IT, math.IT]目的：意味通信におけるソース・チャネル意味トークン符号化
- 無線通信において「崖効果」を克服する技術として，深層結合ソース・チャネル符号化が注目されている。
- 既存の深層結合ソース・チャネル符号化は，基礎モデルが要求する離散的な意味トークンではなく，生のデータで動作する。
- 基礎モデルの離散的な意味トークンをノイズの多いチャネル上で伝送するためのフレームワークを構築し，性能向上を目指す。
- STCCは，意味空間とチャネルトポロジーを整合させる幾何学的な構造を持つ星座を学習することにより，ノイズを意味的な変動に変換する。
- 実験の結果，STCCは低SNR環境において従来のシステムを大幅に上回り，受信側の修正を必要とせずに性能を発揮する。
- 意味的モダリティにおける「意味ドリフト」や，知覚的モダリティにおける「構造的歪み」を理論的・実験的に特徴づけることに成功した。
Link: https://arxiv.org/abs/2606.11819
要件品質がトレーサビリティリンク回復を成功させるか否か [cs.SE]目的：要件品質とトレーサビリティリンク回復の関係性
- ソフトウェア保守において，要件とコード間のトレーサビリティは不可欠である。
- トレーサビリティリンクの手動作成は負担が大きく，誤りも生じやすい。
- 要件品質がトレーサビリティリンク回復に与える影響を定量的に明らかにすること。
- 特定の要件品質の欠陥（例えば，名詞句で始まらない文）が，トレーサビリティリンク回復の性能を低下させる。
- 一方，実装詳細を含むユースケースなど，他の欠陥は回復性能を向上させる可能性がある。
- 最適なトレーサビリティリンク回復手法の選択は，要件の品質に依存する。
Link: https://arxiv.org/abs/2606.11834
LLMベースのコード翻訳における，検証済みの多義性意味表現による性能向上 [cs.SE]目的：LLMベースのコード翻訳の成功率向上
- ソフトウェア開発において，コードの自動翻訳は生産性向上に不可欠である。
- 既存手法は統計的パターンに依存し，プログラムの意味理解が不十分である。
- ソースコードから豊富な意味情報を構築し，翻訳の信頼性を高める。
- Multisageは，データフローグラフ，型制約，API情報などの構造化された意味表現を抽出する。
- 生成された多様な意味表現を，意味を保持する変異と一貫性検証で校正・改良する。
- HumanEval-Xベンチマークで，Multisageは多様なバックボーンモデルで最大2.22倍の成功率向上を示した。
Link: https://arxiv.org/abs/2606.11863
エージェントを最初から最後まで：基盤から本番環境までカスタムAIエージェントを構築する方法論 [cs.SE, cs.AI]目的：カスタムAIエージェントの構築方法論
- AIエージェントの活用は，業務効率化や自動化に不可欠であり，その需要は高まっている。
- カスタムAIエージェントの構築に関する体系的な手法が確立されておらず，開発は試行錯誤の域を出ない。
- 本研究は，カスタムAIエージェントを効率的に構築・運用するための標準的な方法論を提案する。
- 本研究で提案する「エージェントを最初から最後まで」という方法論は，LLMをソフトウェアコンポーネントとして捉え，ツール，システム，メッセージとしてフレーム化することを前提とする。
- プロトタイピング，収穫・整形・デプロイ，エージェントによるテストというサイクルを繰り返すことで，カスタムAIエージェントを開発・改善する。
- 本方法論は，特定のフレームワークに依存せず，言語やフレームワークに依存しない汎用的な手法として活用可能である。
Link: https://arxiv.org/abs/2606.11869
GPUベースLLMサービングシステムにおけるソフトウェア老化の特性評価 [cs.SE, cs.AI]目的：GPUベースLLMサービングシステムにおけるソフトウェア老化の特性
- LLMの利用拡大に伴い，安定的なサービス提供が重要となっている。
- LLMサービングは，多様な負荷と複雑なソフトウェア構成のため，老化現象の把握が困難である。
- 本研究は，LLMサービングにおけるメモリ老化の実態を定量的に明らかにする。
- 全デプロイメントで統計的に有意なメモリ老化が確認された。
- メモリリーク率は，サービングランタイムとデプロイメント構成に強く依存することが示された。
- ソフトウェア老化とリジュビネーション研究分野への貢献が期待される再現可能なフレームワークを公開した。
Link: https://arxiv.org/abs/2606.11916
ニューロ・リレーショナルプログラム：構造化データに対するクエリとニューラル計算の統合 [cs.DC, cs.PF, cs.CL, cs.IR, cs.DB, cs.CC, cs.LG, cs.LO]目的：構造化データに対するクエリとニューラル計算を統合するための宣言的クエリ言語
- リレーショナルデータベースは多くの分野でデータを効率的に管理するために不可欠である。
- 従来の深層学習はグラフ表現に依存し，データベースの直接処理が課題であった。
- リレーショナル推論と学習可能なニューラルコンポーネントを統合するフレームワークを提供する。
- ニューロ・リレーショナルプログラム（NRP）は，数値ベクトル埋め込みを持つリレーショナルデータベースのための宣言的クエリ言語として提案された。
- NRPはDatalogスタイルのルールを拡張し，埋め込みの組み合わせ，集約，変換を可能にする。
- NRPは，訓練可能なコンポーネントを持つクエリプランと，関係構造を持つニューラルアーキテクチャの両方として解釈できる。
Link: https://arxiv.org/abs/2606.11946
次元8における自己同値性部分空間を用いた2次APN関数のGröbner基底探索 [cs.CR, cs.IT, math.CO, math.IT]目的：次元8における2次APN関数の探索
- 暗号技術において，APN関数は高い非線形性を持つため，耐差分攻撃性に優れる。
- APN関数の数は限られており，新たなAPN関数の発見は重要な課題である。
- 特定の構造を持つ部分空間において，効率的なAPN関数探索手法を確立すること。
- 自己同値性部分空間において，65,536個の超平面のうち0.65%を探索した結果，566個の2次APN関数を発見した。
- 発見されたAPN関数は，6つのCCZ同値クラスを形成し，そのうち4つのクラスは既存のデータベースに存在しなかった。
- 新たなクラスはGold関数を中心に発生し，Gröbner基底計算の重要性を裏付けている。
Link: https://arxiv.org/abs/2606.11967
グラフの低い樹木度におけるほぼ最適な分散2支配集合 [eess.SY, cs.SY, math.OC, cs.DS, cs.DC]目的：グラフにおける2支配集合の効率的な分散アルゴリズム
- グラフ理論は，ネットワーク設計やデータ構造など，様々な分野で基礎となる。
- 分散アルゴリズムの計算量は，ネットワーク規模によって指数関数的に増加しうる。
- 低い樹木度を持つグラフにおける2支配集合の計算量を改善することを目指す。
- 提案アルゴリズムは，ノード数がnのグラフにおいて，O(log log n)ラウンドで2支配集合を計算する。
- この計算量は，既存のアルゴリズムよりも指数関数的に優れており，理論的な下界に近い。
- 本研究の結果は，分散計算以外にも，並列計算モデルにも応用可能である。
Link: https://arxiv.org/abs/2606.11974
LLMエージェントによる複数ファイル変更局所化のための探索構造 [cs.SE, cs.AI]目的：ソフトウェア問題解決のための変更対象ファイルの局所化
- ソフトウェア開発において，変更が必要なファイルを効率的に特定することは，開発効率と品質に不可欠である。
- 既存のAIエージェントは，リポジトリを線形に探索するため，複数のサブシステムにまたがる変更には不向きな場合がある。
- LLMエージェントの探索構造を改善し，より迅速かつ正確なファイル局所化を実現することを目指す。
- ドメイン範囲を考慮した並列エージェント探索が，Haikuクラスモデルにおいて高いmicro F1スコアを達成した。
- 拡張ベンチマークにおいて，ドメインエージェントはCodex 5.5 Highに次いで高い性能を示した。
- ドキュメントの進化やファイルシステムアクセスが局所化精度に影響を与えること，また複数エージェントによる協議は効果が限定的であることが示された。
Link: https://arxiv.org/abs/2606.11976
リフテッド積コード構造のグラフ的解析 [cs.HC, cs.IT, math.CO, math.IT]目的：リフテッド積コードのパリティチェック行列およびタナグラフの構造
- 量子誤り訂正符号の性能向上は，量子コンピュータ実現の不可欠な要素である。
- リフテッド積コードの構造解析は複雑であり，効率的な復号化が困難な場合がある。
- タナグラフの構造を明らかにし，復号性能に影響する要因を特定すること。
- H_XとH_Zのタナグラフが同型であることが示された。
- これらのグラフの連結性条件が確立され，最小吸収集合の上界が導出された。
- 復号性能に影響を与える組み合わせ構造に関する新たな知見が得られた。
Link: https://arxiv.org/abs/2606.11987
ランクを保存するガイフマン標準形 [cs.LO, math.LO]目的：一階述語論理におけるランク測度の導入と，ガイフマンの定理の「ランクを保存する」バージョン
- 計算複雑性理論において，一階論理式の複雑さを測ることは，問題の解決可能性を判断する上で重要である。
- 従来のランク保存性局所定理は複雑であり，ガイフマンの元の標準形との整合性が課題であった。
- より簡潔な定理を通じて，一階論理式の標準形をガイフマンの元の定理と一致させることを目指す。
- 本研究で示された定理は，以前の定理よりも単純であり，同じ標準形を生成することが確認された。
- この定理の応用として，ノウウェア・デンス構造における一階述語の性質をほぼ線形時間で決定する結果の簡略化された証明が得られた。
Link: https://arxiv.org/abs/2606.11993
マルチユーザーセマンティックMIMO通信のためのゲーム理論的潜在空間アライメント [eess.SY, cs.SY, eess.SY, cs.SY, cs.CL, cs.GT, cs.IT, math.IT]目的：マルチユーザーセマンティックMIMO干渉ネットワークにおける潜在空間アライメント
- AI技術の活用により，無線システムはデータ本質を伝達するセマンティック通信へと進化している。
- エージェント間で潜在空間が異なり，意味的な不一致が生じやすく，通信性能を低下させる。
- 干渉抑制とセマンティック表現のアライメントを同時に実現し，通信効率とタスク性能を向上させる。
- 提案手法は，セマンティックアライメントを非協力ゲームとして定式化し，線形セマンティックMIMOトランシーバーの最適化解を導出した。
- 問題を低次元の電力配分ゲームに変換し，反復的なセマンティック水張りアルゴリズムを開発した。
- ナッシュ均衡の存在，一意性，大域的収束に関する十分条件を確立し，セマンティックアライメントと物理チャネルの関係を明確化した。
Link: https://arxiv.org/abs/2606.12005
CおよびC++における未定義動作：デスクトップ利用ケースに関する実験 [cs.SE, cs.CR]目的：CおよびC++における未定義動作の頻度と実態
- C/C++は広範に利用され，ソフトウェアの基盤を担うため，その安全性確保は重要である。
- 未定義動作は予測不能な挙動を引き起こし，セキュリティ脆弱性やシステム不安定化を招く可能性がある。
- デスクトップ環境における未定義動作の発生状況を把握し，その対策を検討することを目的とする。
- 実験の結果，CおよびC++プログラムにおいて未定義動作が頻繁に発生することが確認された。
- 特に，MesaグラフィックスライブラリやGNOMEデスクトップ環境において，多くの未定義動作警告が検出された。
- 警告の多くは仮想テーブルポインタに関連しており，複雑な呼び出しスタックを持つことが示唆された。
Link: https://arxiv.org/abs/2606.12064
次世代移動通信ネットワーク向け再構成可能アンテナ：包括的調査とチュートリアル [cs.IT, math.IT]目的：次世代移動通信ネットワークにおける再構成可能アンテナの現状と将来展望
- 6Gなどの次世代通信では，低遅延，大容量，高信頼性などの高度な性能が求められている。
- 従来の固定アンテナでは，変化する通信環境への柔軟な対応が困難である。
- 再構成可能アンテナを用いることで，環境変化に適応し，通信性能を向上させることを目指す。
- 再構成可能アンテナは，ゲイン，放射パターン，インピーダンス，偏波などのRF特性を動的に調整可能である。
- 流体アンテナ，可動アンテナ，ピンチングアンテナ，再構成ホログラフィックアンテナなど，様々な種類が存在する。
- 各アンテナ方式のチャネルモデリング，性能分析，リソース割り当て戦略について検討されている。
Link: https://arxiv.org/abs/2606.12139
行列ベクトル積からのほぼインスタンス最適疎行列近似 [cs.DS, cs.NA, math.NA]目的：暗黙的行列の近似学習
- 大規模データ処理において，明示的に行列を保持せずに計算を行う重要性が増している。
- 既存手法は，疎行列の特性を捉えきれず，必要な行列ベクトル積の数が多くなる場合がある。
- 行列ベクトル積の数を最小化し，効率的な疎行列近似学習を実現することを目指す。
- 本研究では，疎行列近似に必要な行列ベクトル積の数を，行列の「退化度」を用いて厳密に評価した。
- 近似学習に必要な行列ベクトル積の数は，疎行列の退化度にほぼ比例することが示された。
- グラフ彩色に基づかない，多項式時間で実行可能な手法を提案した。
Link: https://arxiv.org/abs/2606.12179
LLM API認証情報のiOSアプリにおける漏洩に関する実証研究 [cs.CL, cs.SE, cs.CR]目的：iOSアプリにおけるLLM API認証情報の漏洩の実態
- LLMのモバイルアプリへの組み込みが進み，API認証情報のセキュリティリスクが重要になっている。
- 既存研究は主にAndroidアプリに焦点を当てており，iOSアプリのAPIキー漏洩に関する体系的な調査は不足している。
- iOSアプリにおけるLLM APIキーの漏洩パターンを特定し，その改善策を評価すること。
- 444のiOSアプリを分析した結果，282アプリでLLM API認証情報がネットワークトラフィックを通じて漏洩していることが判明した。
- 漏洩パターンは，JWTトークンの漏洩(48%)，認証されていないバックエンドプロキシアクセス(33%)，プレーンテキストAPIキー送信(19%)の3種類。
- 脆弱性報告から3ヶ月後の再分析では，28%のみが修正され，72%が依然として悪用可能であり，対策の遅れが確認された。
Link: https://arxiv.org/abs/2606.12212
AI IDEにおけるルール分類と進化：マイニングと調査研究 [cs.SE, cs.AI]目的：AI IDEにおけるルールの分類，進化，および実用的な影響の解明
- AI IDEは開発効率を向上させる重要なツールであり，その効果的な活用が求められている。
- AI IDEにおけるルールの体系的な分類や進化の過程は未だ十分に解明されていない。
- AI IDEのルールを理解し，開発者の意図とAIの振る舞いを一致させるための指針を示す。
- 7,310個のルールをマイニングした結果，5つの主要カテゴリと25の二次カテゴリを含む包括的な分類体系が確立された。
- 調査の結果，開発者はアーキテクチャ制約を重視する一方で，実際のルールは低レベルな設定が主流であることが判明した。
- ルールの更新は頻繁に行われ，更新後のソフトウェア成果物の適合率は平均で22.99%向上することが示された。
Link: https://arxiv.org/abs/2606.12231
本番AIエージェントの実行時ガバナンスのための五面参照アーキテクチャ [cs.AI, cs.CC, cs.CR, cs.SE]目的：本番AIエージェントの実行時ガバナンスのための参照アーキテクチャ
- 企業セキュリティはデータ境界の管理が基本。AIエージェントの普及により，リスク管理のあり方を変える必要が生じている。
- 既存のポリシーエンジンは，AIエージェントのような複合的な主体に対する状態に基づいた評価に対応できていない。
- エージェントの委譲チェーンにおける権限減衰を考慮した，実行時ガバナンスアーキテクチャを確立すること。
- 本研究では，意思決定を行う推論面と，それを実現する4つの強制面（ネットワーク，ID，エンドポイント，データ）からなる五面分解に基づくアーキテクチャを提案。
- 中断プリミティブの分類，4つの正当性不変量，7つの本番エージェントの脅威を具体的に定義し，それらに対処できることを示した。
- 実装されたポリシーエンジンのコアは，権限減衰の正確性，証拠の再構築可能性を確認。判断はマイクロ秒単位で実行され，監査基盤も設計通りに機能。
Link: https://arxiv.org/abs/2606.12320
準同型量子誤り訂正 [quant-ph, cs.CR, cs.IT, math.IT]目的：準同型量子暗号と量子誤り訂正の代数的整合性
- クラウド量子コンピューティングの安全な実装には，データ保護と計算の正確性が不可欠である。
- 量子データの秘匿性と信頼性を両立する技術が不足している。
- 暗号化された量子データに対する誤り訂正の実現可能性を検証すること。
- 安定化符号が，制限された横断ブロック・パウリ掩蔽と整合性を持つための必要十分条件が確立された。
- ビット反転符号やShor符号などの標準的な例において，この条件が検証された。
- 非Cliffordゲートの実装における課題を回避する2つの方法が提示された。
Link: https://arxiv.org/abs/2605.25692
個別化がん治療のための信念空間制御：積極的推論によるアプローチ [cs.AI, cs.IT, math.IT]目的：個別化がん治療における意思決定最適化
- がん治療は，患者の状態変化と治療介入の繰り返しであり，最適な治療戦略が重要である。
- 患者の多様性や治療による状態変化を考慮した，効果的な意思決定手法が課題である。
- 測定予算と治療制約下で，患者の状態を考慮した最適な治療計画を立案すること。
- 本研究では，積極的推論を用いて，がん治療を信念空間計画問題としてモデル化し，期待自由エネルギーを最大化する。
- 実際の臨床データを用いた結果，患者の分類と高い治療効果が同時に実現された。
- 測定および治療の制約条件を考慮することで，臨床現場への応用可能性を示した。
Link: https://arxiv.org/abs/2606.10376
大規模言語モデルによる海洋モデルの移植：FESOM2（FortranからCへ，そしてC++/Kokkosへ）の経験と教訓 [physics.ao-ph, cs.DC, cs.SE, physics.comp-ph]目的：大規模言語モデルによるコード移植の物理特性維持可能性の検証
- 地球温暖化などの気候変動問題解決のため，高精度な海洋モデルの利用が不可欠である。
- 既存の海洋モデルは，計算資源の制約や性能向上の困難さに直面している。
- 大規模言語モデルを活用し，高性能計算環境への移植を効率的に実現することを目指す。
- 大規模言語モデルによるコード移植は，海洋モデルの物理特性を損なうことなく，最新の性能ポータブルな形式への移行を可能にすることが示された。
- FortranからCへの移植，そしてC++ / Kokkosへの移植の二段階アプローチが有効であり，厳密なリテラル翻訳と各段階での検証基準が重要であることが分かった。
- GPU環境下では，CPU環境と比較して1.6〜3.7倍の高速化が実現し，実用的な計算速度（1日あたり2年分のシミュレーション）を達成した。
Link: https://arxiv.org/abs/2606.11356