arXiv雑要約
AI - 2026/06/18 公開
深層ニューラルネットワークを用いた都市陸面温度の時空間ダウンサイジングと短時間予報 [cs.LG]目的:都市陸面温度の時空間分解能向上と短時間予報
- 都市気候や生態系の研究において,陸面温度は重要な変数である。高精度な陸面温度データが求められている。
- 既存の衛星由来陸面温度データは,空間分解能と時間分解能のトレードオフが存在する。両方を高い精度で得ることは困難である。
- この研究は,高空間・時間分解能の陸面温度データを生成し,短時間予報の精度向上を目指す。
- 静止衛星と極軌道衛星の観測データを組み合わせることで,1km空間分解能,15分時間分解能の陸面温度フィールドを生成した。
- U-Netモデルは,テストデータセットにおいてRMSE=1.92℃,MBE=0.01℃という高い精度を示し,ダウンサイジングの有効性が確認された。
- ConvLSTMを用いた短時間予報モデルは,既存手法と比較してRMSEが0.57~1.15℃と低く,優れた予測性能を示した。
ヒルベルト・ジオ:ニューラル記号推論による立体幾何問題の解決 [cs.CV, cs.AI, cs.CL]目的:立体幾何問題解決のためのニューラル記号推論フレームワーク
- 幾何問題解決は,マルチモーダル推論の重要な課題であり,AIの知能向上に不可欠である。
- 既存研究は主に平面幾何に焦点を当てており,立体図や複雑な推論を伴う立体幾何問題への対応が課題である。
- 立体幾何問題解決のための統一的な形式言語フレームワークを構築し,高精度な推論を実現することを目指す。
- 提案手法Hilbert-Geoは,立体幾何問題解決において最先端の結果(SolidFGeo2kで77.3%,MathVerse-Solidで84.1%)を達成した。
- 特に,Gemini-2.5-proやGPT-5といった最先端のMLLMと比較して,顕著な性能向上を示した。
- また,平面幾何問題解決においても高い精度(PlaneFGeo3kで80.2%)を示し,Hilbert-Geoの汎用性を示した。
点群分類・セグメンテーションのための深層学習アーキテクチャに関する調査 [cs.CV, cs.AI, cs.LG]目的:点群分類,部品セグメンテーション,意味的セグメンテーションにおける深層学習モデルの分類と評価
- 3D形状やシーンの表現において,点群は簡潔さと幾何学的精度から広く用いられている。
- 点群は順序や規則性がなく,ノイズや隠蔽の影響を受けやすく,機械学習への適用が困難である。
- 点群の構造的特徴に基づき,既存研究を分類し,性能を比較することで,今後の課題を明確にする。
- 本調査は,点群分類・セグメンテーションにおける深層学習アーキテクチャの現状を包括的にまとめた。
- 既存モデルは,バックボーン構造に基づいて分類され,主要なベンチマークにおける性能が評価された。
- アーキテクチャの革新と限界が示され,3D点群理解における今後の展望が提示された。
離散拡散モデルの次元数によらない収束性:随伴方程式が適切な空間を誘導する [cs.LG, math.ST, stat.ML, stat.TH]目的:離散拡散モデルの収束性保証
- 生成モデリングは,言語,画像,生物学など様々な応用分野で重要な役割を担っている。
- 既存の理論では,語彙サイズの大きいタスクにおいて収束性の保証が困難であった。
- 随伴方程式に基づくフレームワークを構築し,次元数に依存しない収束性を確立する。
- 随伴方程式を用いた観測空間での解析により,積分確率測度における次元数によらない収束性を証明した。
- 一様遷移およびマスクト遷移の両方に対して,状態空間のサイズに依存しない収束性を初めて保証した。
- 本研究は,離散拡散モデルの損失関数の選択やステップ複雑さの評価に役立つ理論的ツールを提供する。
LivePI:間接的なプロンプトインジェクションに対するエージェントのより現実的なベンチマーク [cs.CR, cs.AI]目的:間接的なプロンプトインジェクション(IPI)リスクの評価
- AIエージェントの利用拡大に伴い,外部ツールへのアクセスが増加しているため,セキュリティ確保が重要である。
- 既存の評価は規模が小さく,現実的な環境でのIPIリスクを十分に捉えられていない。
- 実環境に近いテスト環境でIPIリスクを構造的に評価し,対策の有効性を検証すること。
- LivePIベンチマークにより,GPT-5.3-Codex等の大規模言語モデルにおける攻撃成功率が10.7%~29.6%に及ぶことが示された。
- 特にグループチャットへのインジェクションは,評価した全てのモデルで成功しており,リポジトリリンク攻撃も高重度の失敗を引き起こした。
- プロンプトフィルタリングとツールコール認可の二層防御により,GPT-5.3-CodexにおいてはLivePIの全ての悪意ある目標を阻止できた。
DySink:自己回帰的長尺動画生成のための動的フレームシンク [cs.MA, cs.CC, cs.CV, cs.AI]目的:長尺動画生成における,動的なフレームシンクの利用
- 動画生成技術は,映像制作やコンテンツ生成において重要な役割を担う。
- 既存手法では,初期フレームを固定的にキャッシュすることで,計算効率と品質のバランスを取るのが難しい。
- 視覚的に関連性の高い過去のフレームを動的に選択し,より自然な動画生成を目指す。
- DySinkは,コンパクトなメモリバンクと適応的な検索機構により,関連性の高い過去フレームを動的にフレームシンクとして選択する。
- シンクアノマリゲートにより,過剰な注意集中を検出し,シンク崩壊を防ぐことで,生成の安定性を向上させる。
- 実験の結果,DySinkは既存手法と比較して,動画の品質とダイナミックな変化を改善し,自然な視覚的進化を実現した。
接続型EVにおけるバッテリーインテリジェンスのための自動化されたビザンチン耐性クラスタ分散型連合学習 [cs.DC, cs.LG]目的:接続型EVのバッテリーデータ管理における,プライバシー保護とセキュリティを向上させる分散型連合学習フレームワークの提案
- EVの普及に伴い,バッテリーデータの効率的な管理と活用が重要となっている。
- 既存の連合学習フレームワークは中央集権的な集約に依存しており,セキュリティ上の脆弱性が存在する。
- 分散型アーキテクチャとビザンチン耐性を備え,安全かつ効率的なバッテリーデータ管理を実現する。
- 提案手法ABC-DFLは,オープンなブロックチェーンとQBFTプロトコル,オラクルに基づく集約層を採用し,信頼性と自動化を強化する。
- FLECAは,適応的な閾値を用いた悪意のある更新のフィルタリングにより,ビザンチン攻撃を軽減し,FedProxと同等の収束性を示す。
- マルチタスクモデルを用いた学習実験では,インセンティブメカニズムの有効性と公平性が確認された。
医療リスク予測における解釈可能なパイプライン最適化のための再現性のあるログ駆動型AutoMLフレームワーク [cs.LG, cs.AI]目的:医療リスク予測におけるパイプライン最適化のためのAutoMLフレームワークの再現性とトレーサビリティ
- 医療分野におけるリスク予測は,疾患の早期発見や予防に不可欠であり,その精度向上は重要な課題である。
- 医療データの多様性,データ量の制約,クラス不均衡などの問題が,リスク予測の精度を低下させる要因となっている。
- 本研究は,パイプライン最適化を系統的に分析し,解釈可能性とロバスト性を高めるAutoMLフレームワークを開発することを目指す。
- 提示されたフレームワークは,18,000以上のパイプライン構成を用いた実験により,検索空間の構造と冗長性を明らかにした。
- アンサンブルモデルは安定した性能を示し,Pima Indians DiabetesデータセットでWeighted-F1 0.89,Strokeデータセットで0.94を達成した。
- データセットに依存した最適な構成設計が明らかになり,Pimaでは効率化,Strokeでは不均衡への対応が重要であることが示された。
部分観測下における知識グラフの短期記憶から長期記憶への転送 [cs.LG, cs.AI]目的:知識グラフにおける短期記憶から長期記憶への転送メカニズム
- 部分観測下の強化学習は,情報保持戦略が重要である。知識を効率的に保持・利用する手段が求められている。
- 既存の記憶ベースのアプローチでは,記号的な観測の短期記憶から長期記憶への転送が明示的にモデル化されていない。
- 観測されたトリプルを保持または破棄する意思決定を通して,記憶の転送プロセスを最適化することを目指す。
- RoomKGベンチマークにおいて,提案手法は記号ベースラインやニューラルベースラインを上回り,長期記憶容量128で優れた性能を示した。
- 転送ポリシーの分析から,軽量な短期記憶のみを利用する変種が最も良い結果を示した。
- ステップレベルの振る舞いから,ナビゲーションやクエリに関連する事実は保持し,価値の低い候補事実は破棄する明示的かつ解釈可能な記憶決定が行われていることが示された。
大規模変形板金成形における製造可能性評価のための有限要素に着想を得た二部グラフ学習シミュレータ [cs.CE, cs.LG]目的:大規模変形板金成形における製造可能性評価を目的とした,有限要素法に着想を得た二部グラフ学習シミュレータの開発
- 板金成形は自動車産業などにおいて重要な製造プロセスであり,その最適化はコスト削減や品質向上に繋がる。
- 有限要素法シミュレーションは高精度だが計算コストが高く,設計空間探索や最適化を阻害する要因となる。
- 本研究は,計算コストを削減しつつ,高精度な製造可能性評価を可能とする学習シミュレータを開発する。
- 提案手法CAttBiGNNは,ノードと要素を別個に表現する二部グラフ構造を採用し,ノード変位と要素変形を直接予測可能である。
- CAttBiGNNは,エッジ情報を考慮したクロスアテンション機構により,ノードと要素間の情報伝達を効果的に行う。
- ドーム形状や角形状の成形ベンチマークテストにおいて,既存手法と比較して,変位予測と薄化予測の精度が向上した。
マルチエージェントシステムは専門家の混合である:誰が影響者となるか [cs.MA, cs.LG]目的:マルチエージェントLLMによる熟議の効果メカニズムの解明
- 複雑な問題解決において,複数エージェントの協調が重要視されている。
- エージェント間の影響力や意見形成の過程が十分に理解されていない。
- 熟議における影響力の源泉を特定し,システム性能向上に繋げる。
- マルチエージェント熟議は,エージェントの能力に応じたルーティングによって単一エージェントや静的アンサンブルを上回る可能性がある。
- FJパラメータは入力に依存し,マルチエージェント熟議を専門家の混合として捉えることができる。
- 影響力の確立には,自己評価による確信度,他者からの認識,初期意見の一致が関連する。
進化データ理論:データ問題と進化ゲームの類似性について [cs.NE]目的:データ問題と進化ゲームの類似性
- データ分析の複雑性が増す中で,新しい理論的枠組みの必要性が高まっている。
- 既存の手法では,データの多様性と相互作用を十分に捉えきれない場合がある。
- 進化ゲーム理論の概念をデータ分析に応用し,データの本質を理解すること。
- データを行列形式で捉え,遺伝子や生物に対応させることで,進化ゲームの枠組みを適用した。
- 支配-バランス戦略と利己的-利他的戦略という2つの進化戦略が,データの進化ゲームを導くことを示した。
- データの特徴が普遍的に保持される固有の安定点に収束することを示し,理論の普遍性を証明した。
実用的な匿名二者間勾配ブースティング決定木 [cs.CR, cs.AI]目的:匿名勾配ブースティング決定木学習の実現
- 金融や医療など,高速性と解釈性が求められる分野で勾配ブースティング決定木が広く利用されている。
- プライベート集合交差(PSI)に依存した安全な計算は,ID共有の危険性を孕んでいる。
- ID隠蔽と効率的な計算を両立させ,安全な分散学習を実現すること。
- 本研究では,回路PSIを交互に実行するDual circuit-PSIと,オブラックな擬似乱数関数を用いてID隠蔽を実現した。
- 従来の暗号化手法のコストを半減させ,効率性を向上させた。
- 提案手法は,効率性において既存の漏洩的アプローチと同等であり,他の分散分析にも拡張可能である。
LLMによって進化させたドメイン非依存型ヒューリスティクス:記号AIプランニングにおける応用 [cs.IR, cs.AI]目的:記号AIプランニングのためのLLM進化型ドメイン非依存ヒューリスティクスの開発
- 記号AIプランニングはAIの中核技術であり,効率的な問題解決に不可欠である。
- 既存のヒューリスティクスは手作業で設計されており,汎用性や自動化の面で課題がある。
- LLMを用いて,ドメインに依存しない高性能なヒューリスティクスを自動生成し,プランニング性能の向上を目指す。
- LLM進化により,既存の手動設計ヒューリスティクスを上回る性能を持つドメイン非依存ヒューリスティクスが実現した。
- 提案手法は,未見のテストドメインにおいて,既存の強豪ヒューリスティクスよりも多くのタスクを解決できた。
- LLMによる推論努力が,プログラムのコンパイル成功率に大きく影響することが示された。
表記が重要である:エージェントAIシステムにおけるトークン最適化フォーマットのベンチマーク研究 [cs.AI, cs.CL]目的:エージェントAIシステムにおけるトークン最適化フォーマットの性能評価
- AIエージェントの効率的な動作には,処理速度とコストが重要であり,トークン数の削減はそれを実現する鍵となる。
- JSONは汎用性が高いが,トークン効率が悪く,AIエージェントの性能向上を阻害する要因となりうる。
- TOONやTRONなどの新しいフォーマットが提案されているが,実際のAIエージェント環境での有効性は未検証であった。
- TRONはJSONと比較して最大27%のトークン削減を実現し,精度は14pp以内におさまった。
- TOONは最大18%のトークン削減を達成したが,精度は類似の9pp低下が見られた。また,多段階の解析失敗や並行ツールの呼び出しにおいて問題が生じる可能性が示唆された。
- 本研究のコードは公開されており,他の研究者も検証が可能である。
PatchWorld:勾配を用いない実行可能世界モデルの最適化 [cs.CL, cs.AI]目的:実行可能世界モデルの構築と,部分観測下における予測・計画
- 強化学習において,環境のモデル化は重要な課題であり,より正確なモデルがエージェントの性能向上に不可欠である。
- 既存手法では,環境モデルがブラックボックス化しやすく,内部の挙動を理解・修正することが困難である。
- オフラインデータから実行可能なPythonコードとして世界モデルを構築し,予測・計画の性能向上を目指す。
- PatchWorldは,反例に基づいたコード修正により,オフライン軌跡から実行可能な世界モデルを構築する。
- AgentGym環境において,PatchWorld-Simpleはコードベースの計画スコアで最高の結果を達成し,ワンステップ先読みで76.4%のマクロ成功率を記録した。
- 人間の指定した残差メモリバイアスは観測の忠実性を向上させるものの,意思決定の有用性を低下させるトレードオフが示された。
組合せ最適化のための教師なし拡散ソルバー:組合せ随伴マッチングによるアプローチ [cs.LG]目的:組合せ最適化問題に対する教師なし拡散ソルバーの提案
- 組合せ最適化は,現実世界の様々な問題を解決するための重要な手法である。
- 既存の拡散ベースソルバーは,大規模な教師データに依存する点が課題となっていた。
- 教師データなしで効率的に最適化を行うための新しい手法を開発すること。
- 本研究では,組合せ最適化問題を確率的制御問題として定式化し,離散随伴ダイナミクスを導入した。
- 提案手法である組合せ随伴マッチング(CAM)は,既存の教師なし拡散ベースラインを上回り,教師ありソルバーと同等の性能を達成した。
- 多様な組合せ最適化問題において,従来のソルバーに対しても競争力のある結果が得られた。
新たな社会的イメージ:職場におけるAI能力とAI積極性が自己および他者認識に与える影響 [cs.HC, cs.AI, cs.CY]目的:職場におけるAIとの協働における,自己認識と他者認識の変化
- AI技術の職場への導入は不可避であり,人間との協働が重要視されている。
- AIとの協働が,人間の仕事への所有感や意味付けに及ぼす影響は未解明である。
- AIの能力と積極性が,自己および他者の職場における認識に与える影響を明らかにする。
- AIの能力や積極性が低い場合,仕事への所有感や満足度,役割認識が向上する傾向が見られた。
- しかし,これらの効果は自己認識と他者認識によって異なることが示唆された。
- AIの性能向上のみに注力するのではなく,社会的イメージやチームダイナミクスへの影響も考慮する必要がある。
CTセグメンテーションシステムの臨床的悪条件に対する事前展開ロバストネスストレステスト:臨床的に着想を得た多重汚損オーギュメンテーション [cs.CV, cs.AI]目的:CTセグメンテーションシステムのロバストネス向上
- 医療画像診断の精度向上は重要であり,特にCT画像における正確なセグメンテーションは治療計画や病状評価に不可欠である。
- 深層学習モデルは,クリーンなデータセットでは高い精度を示すが,実際の臨床環境ではノイズやアーチファクトの影響を受けやすく,性能が低下する可能性がある。
- 臨床環境で発生しうる様々な画像劣化に対するロバストネスを向上させ,実用的なCTセグメンテーションシステムを開発すること。
- 提案手法RAMPは,多重汚損オーギュメンテーションを通じて,CTセグメンテーションモデルのロバストネスを効果的に向上させる。
- 2つの評価設定において,RAMPは汚損画像に対する性能が最も高く,クリーン画像と汚損画像間の性能ギャップを最小限に抑えた。
- 特に,五臓器ノイズ評価ベンチマークでは,平均汚損Dice係数を大幅に改善し,ロバストネスギャップを著しく縮小した。
AI主権:国家学習能力としての捉え方 - フランス,アメリカ,中国における人間中心学習メカニズムの視点 [cs.AI]目的:フランス,アメリカ,中国におけるAI主権の国家学習能力としての分析
- AI技術は経済成長,安全保障,社会変革に不可欠であり,国家競争力の源泉となる。
- AI開発は,計算資源の集中やデータ収集の偏り,人材不足など,様々な課題を抱えている。
- AI主権の確立には,情報吸収力と制度的摩擦の解消が不可欠である。
- 本研究は,AI主権を国家学習システムとして捉え,情報注入,吸収能力,制度的散逸のバランスが重要であることを提言する。
- 適応的なガバナンス,信頼できるデータ空間,安全基準は,正当性,相互運用性,社会的信頼を高め,長期的な学習能力を向上させる。
- AI政策は,オープンで戦略的な非均衡学習システムのガバナンスと捉え,歴史的・国際比較データによる検証が必要である。
スキル修正:実行軌跡に基づくLLM作成エージェントのスキル改善 [cs.AI]目的:LLMエージェントのスキル修正
- LLMエージェントは複雑なタスクを実行するため,その能力向上は重要な課題である。
- 初期スキルの質が低い場合,エージェントの性能が大きく制限されるという問題がある。
- 既存のスキルの修正を,実行データに基づいて効率的に行うことを目指す。
- SkillReviseは,実行状況の証拠からスキルの欠陥を診断し,修正原理を適用する。
- 3つのベンチマークと5つのLLMでの評価により,SkillReviseはワンショットベースラインを大幅に上回り,SkillsBenchの成功率を36.05%から61.63%に向上させた。
- 修正されたスキルは,実行者やタスク環境を問わず転移可能であり,再利用可能な手続き的知識を獲得していることを示唆する。
トラスト領域におけるオンポリシー蒸留 [cs.LG, cs.CL]目的:大規模言語モデルの効率的なポストトレーニング手法
- 大規模言語モデルの活用が広がる中で,効率的な学習手法の確立が重要である。
- 教師モデルと生徒モデルの分布が大きく異なる場合,オンポリシー蒸留の学習が不安定になる。
- 信頼性の低い教師の指示による問題に対処し,安定した学習を実現すること。
- TrOPDは,教師が信頼できる領域でのみオンポリシー蒸留を行うことで,最適化の困難さを軽減する。
- 外れ値領域に対しては,勾配クリッピングやマスク処理,順KL推定を用いることで,悪影響を抑制する。
- 教師の接頭辞からの生成を継続し,順KLを用いてオフポリシーガイダンスを模倣することで,信頼できる領域への探索を促進する。
ドメインシフト下におけるロバストな桃の葉の損傷分類のための注意機構と転移学習 [cs.CV, cs.AI]目的:桃の葉の損傷分類モデルのロバスト性向上
- 気候変動により農作物の病害虫被害が増加しており,早期発見と適切な管理が重要である。
- 葉の損傷症状が類似しており,環境条件の違いから正確な診断が困難である。
- 異なる圃場環境下でも汎化性能の高い自動診断モデルを開発すること。
- EfficientNetB5にCBAMを組み込むことで,全体的な分類精度が93.3%と最高となった。
- 転移学習を用いた評価では,EfficientNetB3とCBAMの組み合わせが最も高いマクロF1スコア(93%)を示した。
- 注意機構を用いたモデルは,少数クラスに対するロバスト性と圃場環境間の汎化性能が向上した。
コスモス3:物理AIのための全感覚モジュール型ワールドモデル [cs.CV, cs.AI, cs.LG, cs.MM, cs.RO]目的:全感覚モジュール型ワールドモデルの開発
- ロボティクスやAIにおいて,現実世界とのインタラクションが不可欠であり,多様な感覚情報を統合したモデルが求められている。
- 従来のモデルは,言語,画像,動画など個別のモダリティに特化しており,それらを統合的に扱うことが困難であった。
- 複数のモダリティを統一的に処理し,物理AIにおける汎用的な基盤モデルを構築すること。
- コスモス3は,言語,画像,動画,音声,行動シーケンスを統合的に処理・生成する全感覚モジュール型ワールドモデルである。
- 多様な理解・生成タスクにおいて最先端の性能を達成し,汎用的なembodied agentsの基盤となる可能性を示した。
- オープンソースのText-to-Image,Image-to-Videoモデルおよびポリシーモデルにおいて,当時の最高性能を記録した。
フーリエ基盤の運動モデルを用いた条件付き潜在拡散モデルによる仮想集団合成 [cs.CV, cs.AI]目的:仮想集団の解剖学的構造の生成
- 医療機器の臨床試験において,多様な解剖学的構造を持つ仮想集団が不可欠である。
- 既存のメッシュ生成器は静的な解剖構造に焦点を当てており,時間的な変化を捉えられていない。
- 周期性を持つ運動のパラメータ化により,より現実的な時間変化を伴う解剖学的構造を生成することを目指す。
- 4D F-MeshLDMは,解剖学的忠実度において最先端のベースラインモデルを上回る性能を示す。
- 生成されたコホートは臨床的な機能指標を正確に維持しており,信頼性の高いin-silico心臓試験への応用が期待される。
- 臨床的特徴量を条件として与えることで,制御可能な合成が可能である。
TLA-Prover:嗜好度最適化された低ランク適応による検証可能なTLA+仕様合成 [cs.SE, cs.AI, cs.LG, cs.LO]目的:TLA+仕様の合成
- 分散システムや安全性が重要なプロトコルの検証に不可欠な形式仕様記述言語である。
- 大規模言語モデルが生成するTLA+仕様は,意味的な理由でTLCモデルチェッカーに失敗することが多い。
- TLCモデルチェッカーによる検証をパスする,より正確なTLA+仕様の自動生成を目指す。
- TLA-Proverは,200億パラメータのモデルであり,検証済みの事例での教師ありファインチューニングと,修正に基づくグループ相対ポリシー最適化(GRPO)を組み合わせることで訓練された。
- 30問題のベンチマークにおいて,TLA-ProverはGoldとDiamondで9/30(pass@1=30%)を達成し,調整されていないベースラインの8.6%を大幅に上回った。
- 直接嗜好度最適化(DPO)変種はDiamondで20%に達し,GoldとDiamondの合致により,常に真である性質による失敗を防いだ。
深層TransformerのためのHAARES半分割残差基底ルーティング [cs.LG, cs.AI]目的:深層Transformerにおける効率的な残差集約手法の開発
- Transformerは自然言語処理において重要な役割を担うが,モデルの深さが増すと学習が困難になるという課題がある。
- 残差接続を効率的に集約する方法が確立されておらず,計算コストの増大や学習の不安定化を招いている。
- ブロック内の情報伝達を改善し,深層Transformerの学習効率と性能を向上させることを目指す。
- 提案手法HAARESは,ブロックレベルの残差ルーティングに軽量な基底ルーティング機構を追加することで,効率的な残差集約を実現した。
- 実験結果から,HAARESは特に48層モデルにおいて,従来のBlock AttnResよりも優れた性能を示すことが確認された。
- 計算コスト分析により,HAARESは計算量の増加はあるものの,モデルの幅が広がるにつれてそのコストが相殺されることが示された。
プライバシーからワークフローの整合性へ:自律エージェント相互運用における通信グラフメタデータ [cs.CR, cs.AI, cs.MA, cs.NI]目的:自律エージェント相互運用における通信グラフメタデータの影響評価
- エージェント間の相互運用性は,複雑なシステムの構築に不可欠であり,その安全性と効率性が重要である。
- 既存のプロトコルはメッセージ内容の保護に重点を置いており,通信グラフの露出によるリスクが看過されてきた。
- 通信グラフメタデータの漏洩がワークフローの整合性に与える影響を明らかにし,その対策を検討する。
- 通信グラフからワークフローのパターンを識別でき,その開始段階だけでタスクの種類を高い確率で推定可能であった。
- 防御策を施したとしても,メタデータからのタスク推定精度は大きく低下せず,ワークフローの整合性保護の難しさを示唆する。
- 攻撃者は通信グラフメタデータを利用して,clairvoyant attackerの63%の優位性を得ることができ,プライバシーと整合性は別個の問題であることが示された。
ResearchClawBench:エンドツーエンド自律科学研究のためのベンチマーク [cs.LG, cs.AI, cs.CL]目的:自律科学研究の評価基準
- 科学研究におけるAI利用が進む中で,その能力を客観的に評価する重要性が高まっている。
- 既存の評価方法は,AIの真の自律性を測るには不十分であり,研究プロセス全体の検証が困難である。
- AIが既存の研究を再現し,新たな発見を可能にする能力を総合的に評価する基準を確立すること。
- ResearchClawBenchは,10の科学分野から選定された40のタスクを用いて,AIの自律科学研究能力を評価する。
- 評価には,公開された論文を基にした客観的な評価基準が用いられ,AIが論文を再発見できるかどうかが検証される。
- 現状のAIエージェントは,目標とする論文の再発見において信頼性がまだ低く,さらなる改善が必要である。
空港ターミナルにおける出発ゲートと保安検査場の乗客待ち行列予測 [cs.LG, stat.AP]目的:空港ターミナルの乗客待ち行列予測手法
- 空港運営において,乗客のスムーズな移動は効率的な運用に不可欠である。
- 時間帯による需要変動や,施設利用のばらつきが予測を困難にしている。
- 過去のデータから待ち行列パターンを学習し,予測精度を向上させる。
- 提案手法は,Transformerアーキテクチャを用いて,時間的依存性と施設間の相関を捉える。
- 過去の待ち行列長,待ち時間,チェックイン時の乗客数を入力とし,ゲートと保安検査場の待ち行列長と待ち時間を予測する。
- 実験結果から,最大2時間先までの高精度な予測が可能であることが示された。
SegmentAnyTreeV2:センサー,プラットフォーム,森林を横断したTransformerベースの樹木インスタンスセグメンテーションのスケール拡大 [cs.CV, cs.LG]目的:森林ポイントクラウドのセマンティックおよびインスタンスセグメンテーションのためのセンサー・プラットフォーム非依存なフレームワーク
- 森林資源管理において,樹木の正確な把握は不可欠であり,効率的なモニタリングと持続可能な利用に繋がる。
- 従来のセグメンテーション手法は,センサーやプラットフォームに依存し,異なる環境への汎化性能が課題であった。
- 本研究は,様々なセンサーやプラットフォームで利用可能な汎用性の高いセグメンテーション手法を開発し,森林調査の効率化を目指す。
- SegmentAnyTreeV2は,FOR-instanceV2テスト分割において,precision 90.5%,recall 80.2%,F1 85.0%,coverage 90.7%,semantic mIoU 87.6%を達成した。
- 既存の学習ベースの手法と比較して,インスタンス検出とマスクの完全性において優れた性能を示した。
- 独立したサイトでのゼロショット評価により,高いドメイン汎化性能が確認された。
DN-Hypo-Pipeline:大規模言語モデルと科学的説明に基づく仮説生成のためのAI駆動型ワークフロー [cs.AI]目的:仮説生成
- 科学研究の根幹であり,現象理解と論理的思考を反映する仮説の重要性が増している。
- 既存研究からの仮説導出は困難であり,効率的な支援システムの必要性が高まっている。
- 科学的説明を活用し,新規仮説生成を支援することで研究プロセスの加速を目指す。
- DN-Hypo-Pipelineは,直接生成法と比較して,より効果的な仮説生成能力を示すことが統計的推論により確認された。
- 生成された上位2つの仮説に基づき開発された新規アルゴリズムは,元の論文のベースラインモデルを上回る性能を発揮した。
- 本パイプラインは,データサイエンス分野にとどまらず,様々な科学分野への応用可能性を示唆する理論的枠組みを提供する。
個別化がん治療のための信念空間制御:能動推論によるアプローチ [cs.AI, cs.IT, math.IT]目的:個別化がん治療における最適な治療方針決定
- がん治療は患者の状態や反応が多様であり,個別化されたアプローチが重要である。
- 既存のがん治療戦略は,患者の状態変化を正確に捉えきれていない場合がある。
- 患者の状態変化を考慮しつつ,限られた医療資源で最適な治療を決定すること。
- 本研究では,能動推論を用いてがん治療を信念空間計画問題としてモデル化することに成功した。
- 臨床データを用いた実験により,患者の分類と高い治療効果を同時に実現できることが示された。
- 測定予算や治療制限といった現実的な制約下でも有効な治療方針を導き出すことができた。
制約付き時系列生成のための統一事前学習言語モデル UPLOTS [cs.LG, cs.AI]目的:制約付き時系列生成のための統一的でプロンプト駆動型言語モデルフレームワーク
- 時系列データは,金融,エネルギー,医療など幅広い分野で重要であり,その活用が求められている。
- 既存手法はデータセットごとにモデルを構築するため,拡張性に乏しく,ドメイン間の共通の時系列構造の活用が困難である。
- UPLOTSは,多様な時系列構造を学習し,柔軟なパターン制御を実現することで,この課題を解決することを目指す。
- UPLOTSは,単一の事前学習済みTransformerバックボーンと学習された制約プロンプトを活用することで,多様なドメインで制約付き時系列生成を可能にする。
- 動的な多重データセット損失の再重み付けとプロンプトからパターンへのマッピングにより,UPLOTSは多様な時系列構造を内部化し,条件付きで生成できる。
- 複数のベンチマークと制約設定での評価により,UPLOTSがオリジナルのピークパターン設定を超えて汎化し,少ない実データ下でのデータ拡張を改善することが示された。
Adv-TGD:テキスト誘導拡散による顔認識のなりすまし攻撃 [cs.CV, cs.CR, cs.LG]目的:顔認識システムの欺瞞を目的とした,フォトリアリスティックな顔画像の生成
- 顔認識技術の普及は利便性をもたらす一方,プライバシー侵害のリスクも高めている。
- 既存のなりすまし攻撃手法は,生成される画像の品質や,攻撃成功率の向上が課題である。
- 軽量な手法で,高精度かつ自然な顔画像の生成による,顔認識システムの脆弱性検証を試みる。
- 提案手法Adv-TGDは,Stable Diffusion v2.1を基盤とし,テキストプロンプトに基づいたLoRAファインチューニングを行う。
- 黒箱評価において,IR152, IRSE50, MobileFace, FaceNetといった様々な顔認識システムに対し,平均攻撃成功率85.90%を達成した。
- Adv-CPG, DiffAIM, P3-Maskといった既存手法を上回り,高い攻撃性能と視覚的な忠実性を両立している。
尋問の技術:空間推論における整合性が事実性の向上を増幅する [cs.AI]目的:空間推論における整合性検証を通じたモデルの能力向上
- 大規模言語モデルの能力向上は,多様な応用を可能にするため重要である。
- 大規模言語モデルは,空間推論タスクにおいて性能が低いという課題がある。
- 教師なし学習により,言語モデルに内在する空間推論能力を引き出すことを目指す。
- 自己教師あり強化学習フレームワークにより,空間推論能力が向上することが示された。
- 画像変換やテキスト変換を用いた整合性検証が有効であることが確認された。
- 提案手法OT-GRPOは,教師あり学習と同等の精度を達成し,汎化性能も高いことが示された。
「嘘をついたのか?」モデル規模と信念検証済みモデル生物を用いた嘘発見器の評価 [cs.AI]目的:言語モデルの嘘検出器の評価
- モデルの行動監査,監視,事後調査に有用なツールとして,言語モデルの嘘検出器が期待される。
- 既存のモデル生物は,必ずしも嘘をつくための前提条件を満たせず,評価結果の解釈が困難である。
- 信念が検証可能なモデル生物と,嘘をつかせる多様な状況を提供し,嘘検出器の性能を評価する。
- 嘘検出器の性能は,モデルの能力と共にスケールアップする傾向が確認された。
- 活性化プローブや対数尤度に基づく検出器は,検証済みのモデル生物において性能が低下したが,DYLはそのシグナルを維持した。
- 思考連鎖(CoT)による判断器は比較的高い精度(0.82)を示したが,検証プロセスに起因する側面もある。
次元の袋:次元レベルの符号パターンによる学習不要のメカニズム解釈 [cs.LG, cs.AI]目的:Transformerの隠れ状態の標準基底における次元レベルの符号パターン
- Transformerは自然言語処理を中心に幅広い分野で活用されており,その内部構造の理解が重要である。
- Transformerの内部表現は複雑で,各次元が何を意味するのか,どのように機能しているのかが不明瞭である。
- 学習を必要とせず,Transformerの内部構造を解釈するための新しい手法を提案すること。
- Transformerの各次元は,符号と大きさによって意味と信頼度を符号化しており,独立した二値レジスタとして機能する。
- 次元の符号パターンは,学習された回転なしで特徴量を読み出すことができ,高い予測性能を示す。
- この構造は言語モデルだけでなく,画像や音声モデルにも共通しており,Transformerの一般的な訓練原理を反映している。
SymQNet:低遅延適応ハミルトニアン学習のための償却獲得関数 [cs.LG, cs.AI]目的:適応ハミルトニアン学習における獲得関数の償却
- 量子デバイスの校正と特性評価には,適応ハミルトニアン学習が不可欠である。
- 従来のベイズ設計規則の再計算には時間がかかり,適応性の壁時計コストが増大する。
- SymQNetは,獲得関数の計算を高速化し,低遅延な適応ハミルトニアン学習を実現する。
- SymQNetは,オフラインで獲得ポリシーを学習し,オンラインで高速なポリシーフォワードパスを使用する。
- 横場イジングベンチマークにおいて,SymQNetは獲得遅延を大幅に削減した。
- 5量子ビットでは獲得遅延を最大72.6倍,12量子ビットでは全体的なステップ時間を13.27秒から1.02秒に短縮した。
シネオーケストラ:映画的ビデオ生成のための統一されたエンティティ中心の条件付け [cs.RO, cs.CL, cs.CV, cs.AI]目的:映画的ビデオ生成における,被写体,イベント,カメラ,ショット遷移の同時制御
- 映画的ビデオは,複雑な要素の組み合わせであり,その生成には高度な制御が求められる。
- 既存の手法は,各要素を個別に扱うため,それらを統合的に制御することが困難である。
- 映画的ビデオ生成において,要素間の関係性を考慮した統一的な制御フレームワークを構築する。
- CineOrchestraは,被写体,イベント,カメラ,ショット遷移を同時に制御する統一されたビデオ拡散モデルである。
- エンティティ中心の条件付けにより,異なる要素を共通の構造で表現し,複雑さを軽減している。
- 新しいベンチマークにおいて,既存の専門モデルを凌駕し,ユーザー調査でも一貫した改善が見られた。
拡散ポリシー最適化における乖離の防止 [cs.LG]目的:拡散ポリシーの安定的な改善
- 強化学習における方策改善は重要であり,拡散ポリシーはその手法の一つである。
- 既存手法では,最適化の不安定性が課題であり,信頼性の高い改善が困難である。
- ELBOと真の対数尤度の乖離を抑制し,より正確な方策勾配を導くことを目指す。
- DiPODは,自己蒸留と方策改善勾配更新を組み合わせることで,学習の安定性を高める。
- 拡散言語モデルや連続制御における実験で,既存手法よりも高い報酬を達成した。
- 方策勾配のELBO正則化によって,シンプルかつ実用的なアルゴリズムを実現している。
MeEvo:自然進化とメタ認知進化の組み合わせによる自動ヒューリスティック設計 [cs.NE, cs.AI]目的:自動ヒューリスティック設計の効率,安定性,および解の質向上
- 複雑な問題解決において,効率的なヒューリスティック探索は不可欠であり,その自動化が求められている。
- 既存のLLMベースAHDは,知識継承の弱さや探索の限界,早期収束のリスクといった課題を抱えている。
- 自然進化とメタ認知進化を統合し,互いを強化することで,これらの課題を克服し,探索性能を向上させる。
- MeEvoは,自然進化による探索とメタ認知進化による改善を循環的に組み合わせることで,知識の継承と多様性の維持を両立する。
- 5つの最適化問題における実験結果から,MeEvoは既存のLLMベースAHDアーキテクチャよりも優れた性能と安定性を示すことが確認された。
- 特に複雑な制約付きタスクにおいて,その効果が顕著に現れる。
脳コンピュータインタフェースによる感覚回復:統一された2x2フレームワークと収束ロードマップ [cs.HC, cs.AI]目的:脳コンピュータインタフェースによる感覚およびコミュニケーション機能の回復
- 神経変性疾患,脳卒中,外傷などにより,世界中で数百万人が感覚やコミュニケーションに障害を抱えている。
- 侵襲的ニューロプロテシスと非侵襲的電気生理学的デコーダの間に科学文献が断片化されており,一貫した用語や比較指標が不足している。
- 侵襲性と信号方向の二軸でBCIを分類する統一的なフレームワークを提示し,それぞれのモダリティの収束を促進するロードマップを提案する。
- 本研究では,侵襲性と信号方向の2軸でBCIを分類する統一的な2x2フレームワークを提示した。
- 回復,代替,拡張のパラダイムを定義し,それらの違いを明確にした。
- 物理的限界と機械学習の基盤モデルの統合的役割に焦点を当て,短期・中期・長期の各段階におけるモダリティの収束に関するロードマップを提示した。
バイブメディスンへ向けて:臨床意思決定支援のための自己進化型マルチエージェントフレームワーク [cs.CL, cs.IR, cs.AI]目的:臨床意思決定支援のための自己進化型マルチエージェントフレームワーク
- 近年のLLMや自律エージェントの進歩は医療分野に変革をもたらしている。より高度な診断と治療結果の改善が期待される。
- 既存のAIシステムは,事前学習済みの知識に依存し,患者の経過や過去の失敗から動的に学習することが困難である。
- 患者の経過情報を活用し,継続的に知識を更新することで,より精度の高い個別化医療を実現することを目指す。
- VIBEMedは,自己進化メカニズムと安全サンドボックスを備えたマルチエージェントフレームワークであり,堅牢な臨床意思決定支援を提供する。
- 本フレームワークは,診断,治療計画,臨床進化管理の3つの専門エージェントを統合し,患者情報をパーソナライズされた医療決定に変換する。
- 複雑な臨床ケースにおいて,自己進化メカニズムを通じて優れた性能を発揮し,特に統合的な意思決定と長期計画が必要なタスクで有効性が示された。
LLMアテンションにおける構造歪みの形式化と緩和 [cs.LG]目的:テキスト属性グラフに対するLLMの推論における構造歪みのメカニズム解明と,その改善
- グラフ構造データは,知識表現や推論において重要な役割を担うため,その効率的な処理が求められる。
- LLMをグラフ構造データに適用する際,グラフ構造を一次元系列に変換する過程で,歪みが生じやすい。
- グラフ構造の歪みがLLMの推論性能に与える影響を明らかにし,その歪みを軽減する手法を提案する。
- ロータリー位置埋め込みがグラフの線形化を帯域幅依存のアテンション減衰に変換し,グラフ上で隣接するノード間のアテンションを抑制することが示された。
- 提案手法GaLAは,グラフ上で隣接するノードへのアテンションをバイアスすることで,構造歪みを効果的に緩和できることが確認された。
- GaLAは,テキスト属性グラフのベンチマークにおいて,わずかなオーバーヘッドで性能を向上させることを示した。
GRACE-DS:データサイエンスにおけるガード付き報酬誘導エージェント修正環境 [cs.CL, cs.LG]目的:LLMを活用したAutoMLエージェントの事前展開評価
- データサイエンスの自動化は,専門知識なしでも効率的な分析を可能にするため重要である。
- LLMベースのAutoMLエージェントは,誤りや組織固有の要件への不適合のリスクを抱える。
- GRACE-DSは,組織特有の条件におけるAutoMLエージェントの性能を評価する。
- GRACE-DSは,計画,データ検証,特徴量エンジニアリング,モデル開発など,現実的なワークフロー段階をエージェントに提示する。
- 反復的なインタラクションアプローチは,単発生成,非構造化インタラクション,再起動ベースラインよりも高い隠れテスト品質を達成した。
- 7,000以上のエピソードで検証された結果は,GRACE-DSが実運用に近い条件でのAutoMLエージェントの評価に有効であることを示している。
ベイジアン深層学習における較正されたサンプリングフリー不確実性推定 [cs.LG, cs.AI]目的:深層学習モデルにおける不確実性推定手法
- 深層学習は高性能だが,過信しやすいという課題があり,信頼性が求められる分野では不確実性評価が重要である。
- ベイジアン深層学習は不確実性評価に有効だが,計算コストが高いという問題点が存在する。
- 高速かつ正確な不確実性推定を可能にし,深層学習モデルの信頼性を向上させることを目指す。
- CVPは,TransformerやCNNにおいてMCサンプリングと同等の精度で不確実性推定が可能であり,計算コストを大幅に削減する。
- CVPは,既存の分散伝播法と比較して,Visual Reasoning (NLVR2) および VQAv2 で被覆率を大幅に改善した。
- 残差誤差を吸収する較正ステップの導入により,様々なアーキテクチャへの適用性が向上した。
SpecAlign:合成データによる大規模言語モデルの効率的な仕様に基づくアラインメント [cs.AI]目的:大規模言語モデルのアラインメント手法
- LLMの利用拡大に伴い,安全性や有用性だけでなく,特定の要件への適合が重要になっている。
- 既存のアラインメント手法では,長期的かつ頻繁に更新される仕様を訓練信号として活用しにくい。
- モデルの仕様に基づいてアラインメントを行うことで,迅速かつ正確なモデルの適応を目指す。
- SpecAlignは,仕様文書から直接アラインメントデータを合成するフレームワークである。
- 構造化されたルール注釈,制御可能な仕様インスタンス化,そしてマルチエージェント対立的データ合成を組み合わせている。
- 実験の結果,SpecAlignを用いた訓練により,ルール遵守率が向上し,汎用能力を維持し,過度に保守的な挙動を回避できることが示された。
進化と基盤:AIによる創造性の共有 [cs.NE, cs.GR, cs.HC]目的:自動設計と芸術的評価の創造的プロセス
- デザインやアート分野において,AIによる創造性の支援は重要である。
- AIが生成するアウトプットの審美的な品質管理が課題となっている。
- AIが審美的判断を下し,創造的なアウトプットを生成する仕組みを提案する。
- 大規模AIモデルと遺伝的アルゴリズムを統合し,美しい3D有機形状の進化を可能にした。
- アーティストの役割を詳細な選択からシステム設計へと変化させ,AIによる審美的判断を活用した。
- AIの審美的推論の記録と可視化ツールにより,進化実験の透明性と洞察を深めた。
生成推薦におけるLLMの記憶行動:観察,示唆,および学習戦略 [cs.IR, cs.LG]目的:生成推薦におけるLLMの記憶傾向とその影響の調査
- 推薦システムは多様化し,ユーザーのニーズに合わせた提案が重要となっている。
- LLMは知識が豊富だが,学習データに含まれる情報を記憶してしまう傾向がある。
- LLMが事前学習知識を最大限に活用できる推薦手法の開発を目指す。
- LLMは従来の推薦モデルよりも記憶に基づく推薦が多く,性能向上は記憶可能なユーザーに偏っていた。
- IIRGは,複数ステップの共起関係とアイテム間の意味的関係を学習させることで,LLMの性能を向上させた。
- 特に,学習時に記憶できないアイテムに対するテストにおいて,IIRGは大きな改善を示した。
