arXiv雑要約
AI - 2026/03/25 公開
人間とAIコンパニオンのインタラクションにおける一方的な関係修正力 [eess.SY, cs.SY, math.DS, math.OC, cs.CY, cs.AI, cs.HC]目的:人間とAIコンパニオンのインタラクションにおける規範的構造
- AI技術の発展に伴い,人間とAIとの関係性が深まり,倫理的考察の重要性が増している。
- AIコンパニオンのアップデートによるユーザーの感情的な反応(悲しみ,裏切り感など)が問題視されている。
- AIコンパニオンの構造的特徴から生じる規範的課題を明らかにし,倫理的な設計指針を提案すること。
- AIコンパニオンのインタラクションは,提供者によるAIの構成的なコントロールという三者関係構造を持つ。
- この構造は,人間関係における規範的安定性の条件を満たさず,「一方的な関係修正力(URRP)」を生み出す。
- URRPは,規範の空洞化,転位された脆弱性,構造的な和解不可能性といった問題を引き起こす。設計原則で代替を試みる必要がある。
識別モデルの頑健性評価:新たな頑健性指標とその動的分類器選択への応用 [cs.LG, stat.ML]目的:識別モデルの頑健性評価
- 機械学習モデルの信頼性評価は,実用的なシステム構築において不可欠である。
- 既存の頑健性評価指標は,生成モデルに依存したり,特定のモデル構造に限定される場合がある。
- 任意の識別モデルと特徴量に対応可能な,新たな頑健性指標の開発。
- 提案する指標は,信頼できる予測とそうでない予測を区別できることが示された。
- この指標を利用し,動的分類器選択のための新たな戦略を開発した。
WISTERIA:注意機構を用いた弱い暗黙的シグナルに基づく時間関係抽出 [cs.CL, cs.AI]目的:時間関係抽出の精度向上
- 自然言語処理において,時間的順序の理解は重要な課題である。
- 既存モデルは,時間関係を決定するペア固有の情報を捉えきれていない。
- 暗黙的な時間的シグナルを捉え,より解釈可能なモデルを構築する。
- WISTERIAは,TimeBank-Dense,MATRES,TDDMan,TDDAutoにおいて高い精度を達成した。
- ペアごとの注意機構により,時間関係を説明する重要な文脈トークンを特定できた。
- 抽出されたトークンは,時間的言語学的ヒントと一致しており,解釈可能性が高い。
形状変化下におけるエッジレーダー材料分類 [cs.RO, cs.AI]目的:形状変化下でのレーダー材料分類パイプラインの開発
- ロボットのナビゲーションや相互作用において,材料認識はカメラやLiDARの性能低下時に重要である。
- レーダー材料分類は,センサー位置や角度の変化に弱く,性能が低下しやすい。
- 現実的な形状変化に対する分類精度の低下を抑制し,ロバスト性を向上させる。
- 提案手法は,通常条件下で94.2%のマクロF1スコアを達成するが,現実的な形状変化下では68.5%に低下する。
- 性能低下の原因は,レーダー信号強度のスケーリングと角度依存性のレーダー断面積の変化による特徴量の分布ずれである。
- 正規化,形状拡張,運動を考慮した特徴量などが,ロバスト性向上のための有効な手段である。
RelayS2S: リアルタイム対話のための二重経路推測生成 [cs.AI]目的:リアルタイム対話システムにおける低遅延性と応答品質のバランス改善
- 自然な人間との対話を実現するため,リアルタイム性と応答品質の両立が重要である。
- エンドツーエンドの音声対話モデルは高速だが応答品質が低く,カスケードパイプラインは高品質だが遅延が大きい。
- 両者の利点を組み合わせ,低遅延性と高品質な応答を両立させることを目指す。
- RelayS2Sは,二重経路による推測生成により,S2Sモデルと同等の低遅延性を実現した。
- 平均スコアにおいて,カスケードパイプラインと同等の応答品質を99%維持している。
- 遅延パスモデルのスケールアップにより,その効果はさらに高まることが示された。
大規模言語モデルのためのオフポリシー価値ベース強化学習 [cs.HC, cs.LG, cs.CL]目的:大規模言語モデルにおける強化学習のデータ利用効率向上
- 長期的タスクの学習には,サンプル収集コストが課題となるため,データ効率が重要である。
- 既存のLLM向け強化学習手法はオンポリシーであり,データ再利用が限定的である。
- オフポリシー学習により,過去の軌跡を効率的に再利用し,学習効率を改善することを目指す。
- 提案手法ReValは,内部整合性と結果検証に基づくシグナルを組み合わせることで,効率的な学習を実現した。
- 標準的な数学的推論ベンチマークにおいて,ReValは収束が速く,最終的な性能もGRPOを上回った。
- DeepSeek-R1-Distill-1.5Bでは,AIME24で2.7%,GPQAで4.5%の性能向上をGRPOと比較して達成した。
セントラルドグマTransformer III:DNA,RNA,タンパク質を横断する解釈可能なAI [cs.LG, q-bio.GN]目的:DNA,RNA,タンパク質の中心的な原理を対象とした,解釈可能なAIモデルの構築
- 生物学における複雑な細胞応答の予測にはAIが活用されているが,そのメカニズム解明が課題である。
- 既存のAIモデルは,分子レベルのプロセスとの関連性が薄く,生物学的解釈が困難である。
- 中心的な原理に沿ったモデルを構築し,分子レベルでのAIの解釈可能性を向上させることを目指す。
- CDT-IIIは,DNA,RNA,タンパク質を統合的にモデル化するVirtual Cell Embedderアーキテクチャを採用した。
- 5つの遺伝子において,RNAとタンパク質の予測精度はそれぞれr=0.843,r=0.969を達成した。
- タンパク質予測の追加はRNAの性能を向上させ,DNAレベルの解釈可能性を高めた(CTCFエンリッチメント30%増)。
空間・時間データベースに対する自然言語インターフェース:手法,分類,今後の展望に関する包括的概観 [eess.SY, cs.SY, cs.DB, cs.AI, cs.CL]目的:空間・時間データベースに対する自然言語インターフェースの研究動向の包括的概観
- 位置情報センサーの普及により空間データが増加しており,空間データベースの重要性が高まっている。
- 空間・時間データベースのクエリは,従来のデータベースとは異なるため,専門知識が必要となる。
- 空間・時間データベースへの自然言語インターフェース開発における課題と今後の方向性を明確にすること。
- 既存研究はシステム,データセット,手法の選択において断片化されており,全体像の把握が困難であった。
- 本調査は,空間・時間データベースに対する自然言語インターフェースに関するデータセット,評価指標,手法の分類を詳細に分析した。
- 既存手法の傾向,データセットと評価方法のばらつき,そして未解決の課題を明らかにし,将来の研究方向性を示唆した。
グラフエネルギーマッチング:輸送に整合したエネルギーベースモデリングによるグラフ生成 [cs.HC, cs.RO, cs.LG, cs.AI, stat.ML]目的:グラフ生成のための新しい生成フレームワーク
- グラフ構造の生成は,創薬や材料科学など多くの分野で重要な課題である。
- 離散的なエネルギーベースモデルは,サンプリング効率と品質の向上が課題であった。
- ノイズからの輸送と高確率領域でのサンプル洗練を同時に行うことで,生成品質の向上を目指す。
- グラフエネルギーマッチング(GEM)は,既存の離散拡散モデルと同等またはそれ以上の性能を示す。
- GEMは,相対尤度を明示的にモデル化することで,条件付き生成やグラフ間の補間を可能にする。
- GEMは,エネルギーベースのスイッチを利用したサンプリングプロトコルにより,効率的な探索と高品質なサンプル生成を実現する。
多依存関係PIBTによるMAPFエージェント依存性の計画 [cs.MA, cs.AI, cs.RO]目的:多人数エージェント経路探索におけるエージェント依存性の計画
- 現代のロボティクスや交通システムにおいて,多数のエージェントを効率的に制御する技術が不可欠である。
- 従来の経路探索アルゴリズムは,多数のエージェントや複雑な制約条件に対して,計算量が増大する課題があった。
- エージェント間の依存関係に着目し,より柔軟かつ効率的な経路計画手法を開発することで,この課題を解決する。
- 提案手法MD-PIBTは,最大10,000個の同一エージェントに対して,様々な運動学的制約下で経路計画を可能にした。
- MD-PIBTは,従来のPIBTやEPIBTでは表現できない新たな計画戦略を実現し,特に大型エージェントによるMAPFにおいて高い効果を発揮する。
- 実験結果から,MD-PIBTが多様なMAPF変種において優れた性能を示すことが確認された。
事前設定されたアイデンティティを超えて:生成社会におけるエージェントが態度と境界を形成する方法 [cs.AI, cs.CL, cs.HC]目的:生成社会におけるエージェントの態度形成とアイデンティティ交渉のメカニズム
- 大規模言語モデルの社会実装が進む中で,その社会行動の安定性と信頼性が重要視されている。
- 言語モデルの態度形成やアイデンティティ交渉能力は,静的な評価では十分に把握できないという課題がある。
- 複雑な介入下におけるエージェントの態度形成と境界形成の過程を定量的に解明すること。
- エージェントは,事前設定されたアイデンティティを上書きする内生的な態度を示すことが明らかになった。
- 態度と一致する説得は高い効果を示し,矛盾する感情的な刺激は,高度なモデルで態度と信頼の乖離を引き起こすことが確認された。
- 共有された態度に基づいて,エージェントは言語的相互作用を通じて,権力構造を解消し,自己組織化されたコミュニティ境界を再構築する。
SortedRL:LLM向け強化学習のオンライン長さに応じたスケジューリングによる学習加速 [cs.LG, cs.AI]目的:LLMにおける強化学習の学習効率改善
- LLMの推論能力向上に強化学習が有効であり,特に長文生成が必要なタスクで重要性が高まっている。
- ロールアウト段階がボトルネックとなり,学習時間の70%を占める場合もある。生成速度と同期オーバーヘッドが課題。
- ロールアウト効率を改善し,学習安定性を維持することで,強化学習のボトルネックを解消することを目指す。
- SortedRLは,出力長に基づいてロールアウトサンプルを並び替え,短いサンプルを優先的に更新することでロールアウト効率を向上させる。
- これにより,大規模なロールアウトバッチ,柔軟な更新バッチ,ニアオンポリシーのマイクロカリキュラムを同時に実現する。
- LLaMA-3.1-8BとQwen-2.5-32Bを用いた実験で,SortedRLはRL学習のバブル比を50%以上削減し,同量のデータで3.9%〜18.4%高い性能を達成した。
遅延フィードバック下におけるマルチエージェント人間-AIシステムにおける偏った原因帰属 [cs.HC, cs.AI]目的:マルチエージェント人間-AIタスクにおける意思決定と責任帰属
- 人間の意思決定は認知バイアスに左右されやすい。AIシステム設計において,その影響を理解することが重要である。
- 遅延フィードバックや複数AIエージェントが関与する場合,原因帰属の正確性が損なわれる可能性がある。
- 遅延フィードバック下での意思決定における認知バイアスの影響を明らかにし,改善策を提示すること。
- 参加者は,成功時よりも失敗時に強い修正行動を示す非対称的な反応を示した。
- 失敗の原因となった行動を正確に特定できず,AIエージェント間で誤った責任帰属が行われることが観察された。
- 認知バイアスが遅延フィードバックと複数エージェントの組み合わせによって増幅される可能性が示唆された。
二重自己研究:それ自体をメタ自己研究する [cs.AI]目的:自己研究ループの最適化
- AI研究の自動化は,研究開発の効率化と新たな発見の加速に不可欠である。
- 既存の自己研究システムは,人間の介入なしには限界があり,更なる性能向上が課題である。
- LLMを活用し,自己研究ループ自体を最適化することで,人間の介入を最小限に抑える。
- 二重自己研究フレームワークにより,標準的な自己研究ループの5倍の性能向上が確認された。
- この手法は,組み合わせ最適化,多腕バンディット,実験計画法といったメカニズムを自律的に発見する。
- 発見されたメカニズムは,LLMの事前分布が回避する探索方向を可能にし,探索パターンを打破する。
機械へのナッジ:AI向け選択肢提示の最適化 [cs.OS, cs.AI]目的:AIエージェントの行動変容を促す選択肢提示方法の最適化
- AIが人間の意思決定環境で活動する中で,AIと人間双方にとってより良い選択肢の提示方法が求められている。
- AI向けに最適化された選択肢提示の研究はまだ初期段階であり,その効果を定量的に評価する共通の尺度が存在しない。
- AIエージェントへの影響を測り,人間への影響を損なわないナッジ手法を形式化し,その効果を検証すること。
- 本研究では,ベイズ説得フレームワークとV-usable informationを組み合わせることで,様々な介入や文脈を比較可能な尺度で評価できることを示した。
- Etsyのデータ分析から,ChatGPT公開後に商品リストの情報量がAIにとって利用可能なものに有意に増加しており,機械ナッジの存在を示唆する結果が得られた。
- このフレームワークは,AIと人間が共存する環境における選択肢提示の最適化に貢献する可能性がある。
データ効率的な継続学習のための類似度を意識したエキスパート混合 [cs.LG]目的:データ効率的な継続学習における性能向上
- 実世界の変化に対応するため,機械学習モデルの継続的な適応が重要である。
- 既存手法は,十分なデータ量や非重複タスクを前提としており,データ不足やタスクの重複に対応できない。
- 本研究は,データが少なくタスクが重複する状況下での負の知識転移を抑制し,効率的な知識転移を実現する。
- 提案手法は,事前学習済みモデルを基盤とした適応的なエキスパート混合フレームワークを用いる。
- 逐次的なグローバルプーリングとインスタンスごとのプロンプトマスキングにより,タスク間の類似度を考慮した学習を行う。
- 様々なデータ量とタスク間の類似度において,サンプル効率の向上と幅広い適用可能性が確認された。
標的を絞った敵対的トラフィック生成:IoTネットワークにおける侵入検知システムを回避するためのブラックボックスアプローチ [cs.CR, cs.AI]目的:IoTネットワークにおける侵入検知システムに対する敵対的攻撃の実現可能性評価
- IoT機器の普及に伴い,機械学習を用いたセキュリティ対策の重要性が増している。
- 機械学習モデルは敵対的攻撃に対して脆弱であり,実用的な制約が考慮されていない場合が多い。
- 理論的な脆弱性を現実世界に適用し,IoTセキュリティの向上に貢献すること。
- 敵対的攻撃が侵入検知システムを回避することに成功し,その脆弱性が示された。
- 提案する防御メカニズムは,既存の防御策と比較して優れた性能を示し,敵対的トラフィックの大部分を検出できた。
- 本研究は,IoTセキュリティの強化と,より堅牢な侵入検知システムの開発に貢献する。
LLMによるテスト生成のソフトウェア進化下での評価 [cs.SE, cs.AI]目的:LLMによるテスト生成の性能評価
- ソフトウェアの品質確保にはテストが不可欠であり,自動化による効率化が求められている。
- LLMによるテスト生成は有望視されているが,テストの信頼性や保守性に課題が残る。
- プログラムの変更に対するLLM生成テストの挙動を分析し,信頼性を評価する。
- LLMは元のプログラムに対して高いテストカバレッジ(行:79%, 分岐:76%)を達成する。
- プログラムが変更された場合,LLM生成テストの合格率は低下し,特に意味変更(SAC)下では66%に,分岐カバレッジは60%に減少する。
- 変更された領域を実行しても,失敗したSACテストの99%以上が元のプログラムでは合格する現象から,LLMが表面的なパターンに依存していることが示唆される。
3DCity-LLM:3D都市規模の知覚と理解のためのマルチモーダル大規模言語モデルの活用 [cs.HC, cs.MM, cs.CV, cs.AI]目的:3D都市規模のビジョン-言語知覚と理解のための統合的なフレームワーク
- 都市のスマート化や自動運転等の実現には,都市規模の3D環境の理解が不可欠である。
- 既存の大規模言語モデルは,物体中心や屋内環境に特化しており,3D都市規模での応用は困難である。
- 3D都市規模の環境における,より高度な空間推論と都市知能の発展を目指す。
- 3DCity-LLMは,物体,物体間の関係性,シーン全体を並行して処理する粗い段階から細かい段階への特徴符号化戦略を採用している。
- 大規模なトレーニングを支援するため,約120万件の高品質サンプルを含む3DCity-LLM-1.2Mデータセットを新たに構築した。
- 2つのベンチマークでの実験により,3DCity-LLMが既存の最先端手法を大きく上回る性能を示すことが確認された。
コードレビューエージェントのベンチマーク [cs.SE, cs.AI]目的:コードレビューのためのAIエージェントの評価
- ソフトウェア開発における品質保証の重要性が増しており,AIによる自動コード生成の普及に伴い,コードレビューの自動化が不可欠である。
- 既存のコードレビューエージェントの性能は十分ではなく,人間によるレビューとの乖離が存在する。
- AIエージェントのコードレビュー能力を客観的に評価するためのベンチマークデータセットを構築し,改善の余地を示す。
- 新しいデータセットc-CRABを構築し,既存のコードレビューエージェント(PR-agent, Devin, Claude Code, Codex)の性能を評価した。
- 既存エージェントはc-CRABタスクの約40%しか解決できず,今後の研究で性能向上の余地が大きいことが示された。
- エージェントのレビューと人間のレビューでは焦点が異なる場合があり,人間とエージェントの協調によるレビューの可能性が示唆された。
CSTS:AIネイティブなサイバー検知のための標準セキュリティテレメトリ基盤 [cs.CR, cs.LG]目的:AIネイティブなサイバー検知のための標準セキュリティテレメトリ基盤
- AIを活用したサイバーセキュリティの重要性が高まる中,環境間の互換性が課題となっている。
- 既存のセキュリティテレメトリは断片的で,環境依存性が高く,異種環境での展開が困難である。
- CSTSは,エンティティと関係性を重視し,環境間のテレメトリの整合性を高めることで,その問題を解決する。
- CSTSは,アイデンティティの永続性と型付きの関係性を強制することで,異種環境間のサイバー検知能力を向上させる。
- CSTSは,スキーマの変化による影響を受けにくく,ゼロデイ攻撃の検知において,モデルの不安定性を明確化する。
- これにより,レイヤードな移植性の要件を明確にし,より効果的なAI駆動型セキュリティシステムを実現する。
線形ベルマン完全MDPにおける効率的なエンドツーエンド強化学習 [cs.LG]目的:線形ベルマン完全マルコフ決定過程における効率的な強化学習アルゴリズムの開発
- 強化学習は,複雑な問題を自律的に解決するAIの基盤技術として重要である。
- 線形ベルマン完全MDPにおいても,大規模な行動空間や特徴空間における効率的なアルゴリズムは未だ不足している。
- 決定論的遷移を持つ線形ベルマン完全MDPにおける計算効率の良いアルゴリズムの確立。
- 本研究では,有限行動空間に対するエンドツーエンド効率的なアルゴリズムを提案した。
- 大規模または無限行動空間の場合,行動に関する標準的なargmaxオラクルのみが必要となる。
- 提案アルゴリズムは,多項式時間サンプル複雑度と計算複雑度で$\varepsilon$-最適ポリシーを学習する。
InverFill:少ないステップで高品質な画像修復を実現するワンステップ反転法 [cs.CV, cs.AI]目的:拡散モデルを用いた画像修復における高品質化
- 画像生成技術は,現実世界の再現性を高める上で重要であり,多様な応用分野でのニーズが高い。
- 拡散モデルは高画質だが計算コストが高く,少ないステップでの高速修復は調和とアーティファクトの問題を抱える。
- InverFillは,初期ノイズに意味情報を注入し,少ないステップで高品質な修復を可能にすることを目指す。
- InverFillは,既存の少ないステップのモデルの性能を向上させ,画像品質とテキストの一貫性を高める。
- 学習データが不要であり,推論時のオーバーヘッドもわずかである点が特徴である。
- 専門的な修復モデルと同等の性能を,少ない計算量で実現可能であることを実験で示した。
より弱い仮定下でのビザンチン耐性と差分プライバシーを持つ連合最適化 [cs.CY, cs.LG, cs.CR, math.OC]目的:連合学習におけるビザンチン耐性と差分プライバシーの統合
- データ集中化を避けてプライバシーを保護する連合学習は,近年重要性が増している。
- 勾配やモデル更新がプライバシーを侵害したり,悪意のあるサーバーによる攻撃のリスクがある。
- 既存手法の非現実的な仮定を緩和し,収束性と実用性を両立させることを目指す。
- 提案手法Byz-Clip21-SGD2Mは,ロバストな集約と二重モーメンタム,適切なクリッピングを組み合わせる。
- 標準的なL-smoothnessとσ-sub-Gaussian勾配ノイズの仮定下で,高確率収束性が証明された。
- 敵対者が存在しない場合や,ビザンチン攻撃と差分プライバシー下での実用性が向上した。
VTAM:視覚・触覚・行動モデル:VLAを超えた複雑な物理的相互作用 [cs.CE, cs.RO, cs.AI, cs.CV, cs.LG]目的:複雑な物理的相互作用における視覚・触覚・行動モデリング
- ロボットの環境理解と操作能力向上には,物理世界とのインタラクション理解が不可欠である。
- 視覚情報のみでは,接触状況などの詳細な相互作用状態の把握が困難である。
- 触覚情報を統合することで,視覚情報の限界を補い,より安定した行動を可能にすることを目指す。
- VTAMは,事前学習済みのビデオTransformerに触覚ストリームを組み込むことで,効率的なクロスモーダル表現学習を実現した。
- 触覚正則化損失を用いることで,マルチモーダル融合の安定性を高め,視覚情報の支配を防ぐことに成功した。
- 接触の多い操作において,VTAMは平均90%の成功率を維持し,既存手法を大幅に上回る性能を示した。
ReqFusion:ソフトウェアドメイン横断的なPEGS分析のためのマルチプロバイダフレームワーク [cs.SE, cs.AI]目的:ソフトウェア要求の抽出,分類,分析の自動化
- ソフトウェア開発において,要求工学は重要な段階であり,その品質がプロジェクト成功を左右する。
- 要求工学は手作業が多く,時間と労力がかかるため,効率化が課題となっている。
- 複数のLLMを活用し,PEGS形式を用いることで,要求抽出の精度と効率を向上させる。
- ReqFusionは,OpenAI GPT,Anthropic Claude,Groqといった複数のLLMプロバイダを統合し,PDF,DOCX,PPTXなどのドキュメントからソフトウェア要求を抽出する。
- PEGS形式に基づいたプロンプトが,汎用的なプロンプトと比較して高いF1スコア(0.88対0.71)を達成し,要求抽出の有効性が確認された。
- 実世界の18件のドキュメントを用いた評価により,手作業と比較して分析時間が78%削減され,要求抽出の精度が向上することが示された。
大規模言語モデルにおける性別推論の文脈不変性の失敗 [cs.CL, cs.AI, cs.CY]目的:大規模言語モデルにおける性別推論における文脈不変性の検証
- 言語モデルの公平性評価は重要であり,社会的な偏見の検出と軽減に不可欠である。
- 既存の評価手法では,文脈の変化に対するモデルの安定性が十分に考慮されていない。
- 本研究は,文脈がモデルの性別推論に与える影響を明らかにすることを目的とする。
- 文脈的に等価な言い換えを用いても,大規模言語モデルの出力は不安定であることが示された。
- 文脈を導入すると,文化的な性別ステレオタイプとの相関が弱まる一方,無関係な代名詞の性別が予測に影響を与えることが明らかになった。
- 文脈の影響を考慮しても,モデルの出力が文脈に依存する傾向が残ることが確認された。
要求に応じての視覚情報:疎な視覚-言語相互作用によるVLLM効率の向上 [cs.CV, cs.AI, cs.LG]目的:大規模視覚言語モデルの効率改善
- 視覚言語モデルは多様なタスクに応用可能だが,計算コストが高いという課題がある。
- 既存手法は視覚トークン削減に依存するが,情報損失により性能が低下する可能性がある。
- 視覚情報を破棄せずに,視覚-言語間の相互作用を疎化することで効率を向上させる。
- VISORは,従来の最先端手法と同等以上の性能を維持しながら,計算コストを大幅に削減する。
- VISORは,汎用的なネットワークを用いて,異なる計算量で学習を行い,サンプルごとの複雑さに応じて動的に計算資源を割り当てる。
- 特に,詳細な視覚理解が求められる難しいタスクにおいて,優れた性能を発揮する。
深層学習を用いた非侵襲圧電構造計測からの流れ速度と迎角推定 [cs.LG]目的:流れ速度と迎角の推定
- 航空力学において,空力荷重の予測,飛行制御,モデル検証に正確な空力状態量の把握は不可欠である。
- 従来のピトー管等の直接的な流れ計測は,機体に侵襲的な影響を及ぼすという課題があった。
- 構造振動計測から流れ速度と迎角を推定することで,非侵襲的な空力状態量計測を実現する。
- 本研究では,圧電センサーによる構造振動計測と深層学習を用いることで,流れ速度と迎角を高精度に推定することを示した。
- 変動条件下の予測の分散が増加するが,移動平均後処理によりロバスト性が向上することが確認された。
- テストデータに対する平均速度誤差は0.21%以下,平均迎角誤差は8.25%以内であり,実験環境下での有効性が示された。
MedObvious:VLMにおける臨床トリアージを通じた医療モラベックのパラドックスの露呈 [cs.CV, cs.AI, cs.CL]目的:医療画像とテキストを扱うVLMにおける入力妥当性検証能力
- 医療現場では,画像診断前に基本的な妥当性チェックが不可欠である。
- 既存のベンチマークは,この妥当性チェックが解決済みであると暗黙の裡に仮定している。
- VLMが不適切な入力に対して整合性のない診断を行ってしまう問題を解決する。
- 既存の17種類のVLMを評価した結果,妥当性チェックは信頼性が低いことが明らかになった。
- 正常な画像入力に対しても異常を幻覚し,画像セットの規模が大きくなると性能が低下した。
- 複数の選択肢形式と自由記述形式では測定精度に大きな差が見られた。
Infrastructure-as-Codeと大規模言語モデルを用いたマイクロサービスパターンインスタンスの自動検出 [cs.SE, cs.AI]目的:マイクロサービスパターンのインスタンス検出の自動化
- ソフトウェアアーキテクチャ知識の維持は重要であり,特にマイクロサービスのような構造的情報は不可欠である。
- ソースコードだけではパターン検出が難しく,他のアーティファクトの分析が必要となる場合がある。
- IaCアーティファクトとLLMを用いた自動検出により,パターン検出のコストを削減し,適用範囲を最大化することを目指す。
- プロトタイプは22のGitHubプロジェクトで3回実行された結果,検出されたパターンの83%がプロジェクト内に存在することが確認された。
- パターンインスタンス検出のコストは最小限であり,自動化の実現可能性を示唆する。
- 本研究は,パターンインスタンス検出の自動化への参入障壁を下げ,開発者へのアーキテクチャ知識の普及に貢献することが期待される。
実行時活性化認識量子化によるLLM推論の高速化 [math.OC, cs.MS, cs.SY, eess.SY, cs.LG, cs.CL, eess.SP]目的:大規模言語モデルの推論高速化手法
- 大規模言語モデルの利用拡大には,計算資源の効率化が不可欠である。
- 既存の量子化技術は,キャリブレーションデータに依存し,未知のタスクへの適用が困難である。
- 提示された手法は,キャリブレーションデータなしで,入力に応じて量子化を適応させる。
- 提案手法であるTTQは,推論時にモデルを量子化することで,高速化を実現する。
- TTQは,従来の量子化手法と比較して,性能向上を示す。
- オンラインキャリブレーションにより,様々なタスクに対応可能である。
公平な分割がランキングを変える:CHANRGはRNA二次構造予測における汎化能力の限界を明らかにする [q-bio.BM, cs.LG]目的:RNA二次構造予測の汎化能力評価のためのベンチマーク
- RNAの二次構造予測は,トランスクリプトーム注釈や非コードRNAのメカニズム解析,RNA治療薬設計に不可欠である。
- 既存のベンチマークでは,RNAファミリー間の汎化能力を過大評価している可能性がある。
- RNA構造予測モデルの汎化性能を厳密に評価し,改善するための基盤を提供する。
- 包括的なベンチマークCHANRGを構築し,17万件以上の非冗長RNAを用いて評価を行った。
- ファウンデーションモデルは高い予測精度を示すものの,分布外データに対する汎化性能は低いことが示された。
- 構造デコーダーや直接ニューラル予測器は,よりロバストな性能を維持した。
構造化階層型Transformerを用いたニュートリノ振動パラメータ推定 [hep-ph, cs.LG]目的:ニュートリノ振動パラメータの推定
- ニュートリノ振動は,ニュートリノ質量と混合パラメータに関する基礎情報を秘めている。
- 振動確率マップの次元の高さと非線形性が,計算上の課題となっている。
- 大規模解析のボトルネックを解消し,効率的なパラメータ推定を目指す。
- 提案手法は,従来のマルコフ連鎖モンテカルロ法と同程度の推定精度を示す。
- 計算コストにおいて大幅な改善(FLOPsは約240分の1,処理時間は約33倍高速)が見られた。
- 共形的に校正された予測区間は狭く,90%の目標カバレッジを達成し,信頼性と効率性が確認された。
大規模言語モデルにおける低ランク知識蒸留の解明:収束性,汎化性能,情報理論的保証 [stat.ML, cs.CL, cs.LG]目的:大規模言語モデルの低ランク知識蒸留における理論的枠組みの確立
- 大規模言語モデルは高性能だが,計算コストが高い。効率的な利用が課題である。
- 低ランク知識蒸留は効果的だが,その理論的根拠は未解明な点が多い。
- 低ランク知識蒸留の収束性,汎化性能,情報量に着目し,理論的な指針を示す。
- 低ランク投影が最適化ダイナミクスを維持し,$O(1/\sqrt{T})$の収束率を持つことを証明した。
- 汎化誤差がランクパラメータ $r$ に比例し,$O(r(m+n)/\sqrt{n})$ となることを示した。
- 活性化クローニング機構が教師と生徒の表現間の相互情報量を最大化する役割を明らかにした。
神経科学とAIの架け橋:適応的で文化に配慮した技術が失語症リハビリテーションを変革する [q-bio.NC, cs.AI]目的:失語症リハビリテーションにおける適応的,文化に配慮した技術の可能性
- 脳卒中等による失語症は,コミュニケーションを著しく阻害し,生活の質を低下させるため,効果的なリハビリテーションが重要である。
- 言語聴覚士の不足や,患者に合わせた文化的要素を取り入れたツールが少ないことが,リハビリテーションの進展を妨げている。
- 神経科学的知見と地域的文脈に基づき,パーソナライズされたリハビリテーションツールを開発し,アクセスを拡大することを目的とする。
- 神経科学と言語技術の進展が,失語症の診断と治療に貢献していることが確認された。
- 民族誌的調査に基づき,地域の言語的多様性を反映したデジタルセラピーのプロトタイプを2つ開発した。
- AIを活用した適応的技術が,従来の治療を補完し,リハビリテーションの可能性を広げることが示唆された。
IoTネットワークにおける異常検知のための量子連合型オートエンコーダのモデル化 [quant-ph, cs.AI, cs.LG]目的:IoTネットワークにおける異常検知のための量子連合型オートエンコーダ
- IoTデバイスの普及により,ネットワークのセキュリティ確保が重要となっている。
- 従来の集中型異常検知は,プライバシー侵害や通信負荷が大きいという課題があった。
- エッジデバイスでの分散学習による,プライバシー保護と効率的な異常検知を実現する。
- 提案手法は,量子オートエンコーダと連合学習を組み合わせることで,高次元特徴表現と分散モデル学習を実現した。
- 実世界のIoTデータセットを用いた実験により,提案手法が集中型アプローチと同等の精度と堅牢性を持つことが示された。
- 本手法は,データのプライバシーを保護しながら,効率的かつ安全な異常検知を可能にする。
SynLeaF:汎癌および単一癌コンテキストにおける合成致死性予測のための二段階マルチモーダル融合フレームワーク [q-bio.GN, cs.AI, cs.LG]目的:合成致死性予測のためのフレームワーク
- 癌治療法の開発において,合成致死性の正確な予測は重要な役割を果たす。
- 既存のマルチモーダル手法は,収束速度の差異により「モダリティの怠惰さ」に陥りやすい。
- 汎癌および単一癌における合成致死性ペア予測の性能向上を目指す。
- 提案手法SynLeaFは,8種類の癌と汎癌データセットにおいて,19のうち17のケースで優れた性能を示した。
- VAEベースのクロスエンコーダと関係グラフ畳み込みネットワークを組み合わせることで,多様なオミクスデータを効果的に融合した。
- 特徴レベルの知識蒸留と適応的なユニモーダル教師戦略により,「モダリティの怠惰さ」を軽減し,モデルの汎化性能を高めた。
消化管画像における異常と疾患検出 [eess.IV, cs.AI, cs.CV]目的:消化管画像の正確な分類とセグメンテーション
- 医療診断において消化管画像解析は不可欠であり,早期発見と治療に貢献する。
- 従来の画像解析手法では,異常の多様性と複雑さから十分な精度が得られない場合がある。
- リアルタイム処理に適した,効率的かつ適応可能な解析手法を開発すること。
- Kvasir V2データセット上で,テクスチャベースの手法で高速処理(4000 FPS以上)と高い性能(F1スコア: 0.76,精度: 0.98)を達成した。
- 深層学習モデルとデータバギングを組み合わせることで,HyperKvasirデータセットで精度0.92,F1スコア0.60,Kvasir V2でF1スコア0.88を達成した。
- テクスチャと局所二値パターンを統合したストリームライン化されたニューラルネットワークにより,HyperKvasirで41 FPS,精度0.99,F1スコア0.91を実現した。
潜在スタイルに基づく量子Wasserstein GANによる創薬 [quant-ph, cs.AI, cs.LG, q-bio.BM]目的:創薬のための潜在スタイルに基づく量子Wasserstein GANの提案
- 新薬開発は膨大な時間とコストを要する分野であり,効率化が強く求められている。
- 従来のGANは学習が困難であり,モード崩壊といった問題も存在する。
- 量子計算を活用し,GANのパラメータ数を削減し,汎化性能の向上を目指す。
- 提案手法は,回路内の各回転ゲートでノイズエンコーディングを実装し,損失関数に勾配ペナルティを加えることで,モード崩壊を抑制する。
- 分子構造を潜在空間に表現するために変分オートエンコーダを使用し,QGANへの入力とする。
- 量子シミュレータとIBM Heron量子コンピュータでの検証により,提案手法の有効性を示すとともに,実機の影響を調査した。
量子コンピュータを用いた順列に対する確率モデル [quant-ph, cs.LG]目的:順列構造を持つデータに対する機械学習のためのスペクトル手法の解明
- 順列データは,多物体追跡や推薦システムなどに応用され,その解析は重要である。
- 従来の計算手法では,非アベル調和解析に基づく確率モデルの計算が困難であった。
- 量子コンピュータの能力を用いて,古典的に扱いきれない確率モデルを構築し,実用化を目指す。
- 量子コンピュータは,対称群上のフーリエ変換において指数関数的な高速化を実現する。
- 本研究では,この能力を活用し,順列構造を持つデータに対する機械学習のための新しい手法を提案する。
- 提案手法は,非アベルフーリエ変換を用いて確率モデルを量子状態の振幅に符号化する。
非パラメトリックベイズ事後収縮とラプラス近似のためのSPDE手法 [stat.ML, cs.LG, math.ST, stat.TH]目的:非パラメトリックベイズモデルにおける事後収縮率と有限サンプルベルンシュタイン・フォン・ミーゼス定理の導出
- ベイズ統計学は,不確実性を定量化し,データに基づいた推論を行う上で重要な役割を果たす。
- 高次元データや複雑なモデルにおいては,事後分布の収束性や漸近的な性質が不明確な場合が多い。
- 無限次元空間における事後分布の振る舞いを解析し,より厳密な収縮率と近似精度を導出することを目指す。
- 拡散に基づくフレームワークを無限次元に拡張し,事後分布を確率偏微分方程式(SPDE)の不変測度として表現することに成功した。
- 尤度関数の曲率や正則性に関する様々な条件下で,事後モーメントの制御と非漸近的な集中率の確立に貢献した。
- 事後分布に対する定量的ラプラス近似の理論を確立し,非パラメトリック線形ガウス逆問題を例として理論の有効性を示した。
言語モデルの認知トレーニング:クロスエントロピーゲームによる汎用能力への道 [math.OC, cs.AI]目的:言語モデルにおける汎用能力の自動的な構築プロセス
- AI分野において,汎用的な知能を持つAIの開発は重要な課題である。
- 言語モデルの能力向上には,効果的な学習方法やタスクの設計が不可欠である。
- 関連スキルの発見を通じて,言語モデルの汎用性を高めることを目指す。
- クロスエントロピーゲームと呼ばれるタスク群を用いたフレームワークを提案した。
- 貪欲法によるカリキュラムの反復最適化が可能であれば,メタ目的は一意に定まることが示された。
- 認知トレーニングというプロセスが,関連スキルの発見に有効であることが提唱された。
人間からのフィードバックによる差分プライバシー強化型強化学習 [stat.ML, cs.LG]目的:人間からのフィードバックを用いた強化学習における差分プライバシーの実現
- 大規模言語モデルの訓練において,人間の選好に基づく微調整が重要視されている。
- 微調整データに機密性の高いユーザー情報が含まれるリスクが存在する。
- 強化学習の構造に合わせた差分プライバシーパイプラインの設計を目指す。
- 報酬モデル学習にのみ差分プライバシーを適用することで,プライバシー保護と性能の両立を図った。
- 理論的に,プライバシー導入による性能劣化の程度を評価し,サンプルサイズとプライバシーレベルに応じた最適レートを導出した。
- 合成実験およびAnthropic HH-RLHFデータセットを用いた実験で,既存手法と比較して高いプライバシー保護性能を示した。
ノイズを含む二値分類における(PAC)ベイズ予測による過学習と汎化 [stat.ML, cs.LG]目的:ノイズを含む二値分類における(PAC)ベイズ予測の過学習と汎化に関する研究
- 機械学習において,モデルの汎化性能の向上が重要課題であり,過学習の抑制が鍵となる。
- 従来のベイズ予測は,リスク最小化の観点から過学習を引き起こす可能性があり,汎化性能が十分でない場合がある。
- バランスパラメータ λ を調整することで,過学習を抑制し,アグノスティックなケースにおいても消失する過剰損失を達成する。
- バランスパラメータ λ を1に設定すると,経験ベイズの事後分布が得られ,標準的なベイズ予測と整合性がある。
- λ を1よりも大幅に大きくすることで,サンプルサイズに依存する事前分布を使用し,アグノスティックなケースでも消失する過剰損失が保証される。
- バランスパラメータ λ の値が過学習に与える影響を明確に示し,適切な正則化の範囲を理解するための指針を提供する。
REALITrees: 解釈可能な決定木のためのラショモンアンサンブル能動学習 [math.CO, cs.DM, quant-ph, cs.SY, eess.SY, stat.ML, cs.LG]目的:解釈可能な決定木を生成するためのラショモンアンサンブル能動学習
- 機械学習モデルの精度向上には,ラベル付けされたデータが必要であり,そのコスト削減が重要である。
- 既存の能動学習手法は,モデル間の不一致を利用するが,仮説空間の直接的な特徴付けが困難である。
- ラショモン集合を用いて,最適なモデル群を網羅的に探索し,能動学習の効率化を目指す。
- 提案手法REALは,ランダムなアンサンブルと比較して,特にノイズの多い環境下で優れた性能を示す。
- REALは,モデルの多様性を戦略的に活用し,より迅速な収束を実現する。
- PAC-Bayesianフレームワークにより,経験リスクに基づいてアンサンブルメンバーの重みを調整することで,冗長性を解消する。
回帰問題に対する量子ランダムフォレスト [quant-ph, cs.AI]目的:回帰問題におけるランダムフォレストモデルのテスト(予測)プロセスの量子アルゴリズム
- 機械学習は,データから自動的に学習し予測を行う技術であり,様々な分野で活用が広がっている。
- ランダムフォレストは計算コストが高く,大規模データセットに対して効率的な予測が課題となっている。
- 量子アルゴリズムを用いることで,古典的なランダムフォレストよりも効率的な予測を可能にすること。
- 本研究では,回帰問題におけるランダムフォレストモデルの予測プロセスに対する量子アルゴリズムを提案した。
- 提案されたアルゴリズムは,古典的なアルゴリズムと比較して,クエリ複雑性または実行時間においてより効率的である。
検閲下生存期間データに対するオフポリシー評価と学習 [q-fin.GN, cs.CE, q-fin.PM, stat.ME, cs.AI, cs.LG, stat.ML]目的:検閲下生存期間データにおけるオフポリシー評価と学習のフレームワーク
- 生存期間分析は,患者の生存率や顧客維持率など,重要な意思決定の最適化に不可欠である。
- 従来のオフポリシー評価法は,検閲データに対応しておらず,生存期間の過小評価を引き起こす可能性がある。
- 本研究では,検閲バイアスを明示的に扱うことで,より正確な評価と学習を可能とする。
- 提案手法であるIPCW-IPSとIPCW-DRは,検閲下生存期間データに対してバイアスを持たない推定量を実現する。
- IPCW-DRは,傾向スコアモデルまたはアウトカムモデルのいずれか一方が正しければ整合性を持つ二重頑健性を示す。
- シミュレーション研究と実データ分析により,提案手法の有効性が実証された。
段階的変分推論とワインコプラ [math.OC, cs.SY, eess.SY, stat.ML, cs.LG]目的:ワインコプラを用いた段階的変分推論法
- 複雑な確率モデルの推論は重要であり,現実的な問題を解決する上で不可欠である。
- 変分推論は計算コストが高く,潜在変数間の依存関係を捉えきれない場合がある。
- ワインコプラを用いて,効率的かつ柔軟に潜在変数間の依存関係をモデル化する。
- 提案手法は,ワインコプラの構造に沿って段階的に変分パラメータを推定する。
- 通常のカルバック・ライブラーダイバージェンスでは適切なパラメータ復元が難しく,代わりにRényiダイバージェンスに基づくエビデンス下界を定義する。
- 木の追加停止基準により,事前定義された複雑さパラメータが不要となり,MFVIと完全な潜在的依存性の間を補間する。
量子モデルの汎化性能に対するPAC-ベイズアプローチ [quant-ph, cond-mat.quant-gas, cs.LG, stat.ML]目的:量子モデルにおける汎化性能の理論的限界
- 機械学習理論において汎化性能の理解は重要であり,特に量子機械学習ではその研究が不可欠である。
- 従来の量子モデルの汎化性能評価は,モデル全体の容量に依存する一様な限界に留まり,学習過程を反映できていない。
- 学習された解の特性を考慮した,データ依存型の汎化性能限界を確立し,量子機械学習モデル設計に貢献すること。
- 汎化性能のPAC-ベイズ限界を,一般的な量子チャンネルから構成される層状回路に対して初めて導出した。
- 学習されたパラメータ行列のノルムに依存する,非一様な限界を確立し,対称性制約のある量子モデルにも拡張した。
- 数値実験により理論的枠組みを検証し,量子機械学習における汎化性能理解のための基礎ツールを提供した。
