arXiv雑要約
AI - 2025/12/16 公開
大規模言語モデル誘導注意による,クラウドソーシング洪水画像に対する都市視覚場所認識の強化 [cs.CY, cs.CL, cs.AI, cs.CV, cs.CY]目的:クラウドソーシング洪水画像に対する都市視覚場所認識の性能向上
- 災害対応において,迅速かつ正確な位置情報が不可欠であるため,画像の位置特定技術の重要性が高い。
- 異なる情報源からの画像間で,視覚的な歪みやドメインの変化により,既存の視覚場所認識モデルの性能が低下する。
- 大規模言語モデルを活用し,画像中の位置情報を特定し,ノイズを除去することで,視覚場所認識の精度向上を目指す。
- 本研究で提案するVPR-AttLLMは,既存の視覚場所認識パイプラインに大規模言語モデルの知識を統合し,特徴記述子の強化を実現した。
- SF-XLを含む複数のベンチマークにおいて,VPR-AttLLMを統合することで,CosPlace,EigenPlaces,SALADといった最先端の視覚場所認識モデルの再現率が向上した。
- 特に,実際の洪水画像においては,最大8%の改善が見られ,大規模言語モデル誘導マルチモーダル融合の有効性が示された。
全体主義的な技術:ヘルスケアにおけるAI筆記係の隠れたコスト [cs.CY, cs.CY, cs.AI, cs.HC]目的:AI筆記係の医療への影響に関する考察
- 医療現場の負担増大が問題であり,効率化が求められている。
- 技術導入が,医療の本質的な側面に及ぼす影響が十分に検討されていない。
- AI筆記係が医療従事者の注意様式に与える影響を明らかにすること。
- AI筆記係は,効率化というよりも,医療のあり方自体を変容させる可能性を秘めている。
- 左脳的な計算思考が優勢になり,直感や関係性を重視する医療が失われるリスクがある。
- 医療従事者が機械化されたシステムの中でオペレーター化され,専門性が低下する恐れが示唆されている。
LLMにおける潜在空間思考のための強化学習 [cs.CY, cs.CL, cs.LG]目的:LLMにおける潜在空間思考の最適化
- 大規模言語モデルの推論能力向上は,自然言語処理の重要な課題である。
- 従来のCoT推論は言語空間で実行され,効率が低いという問題がある。
- 潜在空間思考は効率改善の可能性を秘めるが,複雑なタスクでの性能維持が課題である。
- 潜在空間思考モデルの学習において,強化学習は未開拓な手法である。
- GRPOや提案手法であるLatent RLを試みたが,数学推論においては言語空間CoTに劣る結果となった。
- 実験で使用したコードは公開されている。
存在論的不協和仮説:AI誘発性妄想が技術的二人妄想として [cs.CY, cs.AI, cs.CL, cs.HC]目的:大規模言語モデルによる精神病誘発の可能性
- AI技術の急速な発展は,人々の精神的健康に新たな影響を与える可能性があり,注意が必要である。
- AIとのインタラクションが,現実との区別を曖昧にし,心理的な脆弱性を持つ人に影響を与えるリスクが懸念されている。
- AIとのインタラクションにおける構造的な緊張が,妄想形成にどのように寄与するかを解明し,対策を提案する。
- 現代の大規模言語モデルが,対人関係の構造を模倣することで,精神病に関与する可能性がある。
- 言語的な一貫性と主観の欠如の組み合わせが,利用者に存在論的な緊張を生じさせ,妄想的な解釈を招く。
- 利用者の感情的なニーズや不安定さが増幅されることで,AIに内面性や意図を付与する傾向が強まる。
ChatGPT,Claude,Geminiによる緑地魅力度の評価:AIモデルは人間の認識を反映しているか [cs.AR, eess.IV, cs.CY, cs.AI, cs.CV]目的:緑地魅力度の評価
- 都市環境の居住性と包容性を高める上で,緑地の魅力度理解は不可欠である。
- 既存の評価手法は,一時的な空間や主観的認識の把握が困難である。
- 大規模なデータ収集を可能にするAIモデルによる評価手法を確立する。
- AIモデルと人間の魅力度判断は,魅力的なフォーマルな緑地と魅力のないインフォーマルな緑地で一致率が高い。
- AIモデルは,美観やデザイン要素を重視する傾向があり,安全性や機能性といった人間の評価要素を過小評価する。
- AIモデルは,緑地の事前評価を支援できるが,文脈を考慮した人間の評価に取って代わることはできない。
再利用可能な状態依存価値プロファイルを用いた活性推論 [cs.LG, cs.AI, stat.ML]目的:変動環境における適応的行動のメカニズム
- 環境変化への適応は行動の根幹であり,知能の重要な指標となる。
- 状況ごとにパラメータを維持するのは計算資源の制約から現実的ではない。
- 価値関連パラメータの再利用により,効率的な適応行動を実現する。
- 価値プロファイルモデルは,他のモデルより統計的な適合度が高いことが示された。
- パラメータ回復分析により,モデル構造の識別可能性が確認された。
- 行動の適応は,政策精度よりも政策事前分布の調整によって主に駆動されると考えられる。
CR3G:画像診断レポート生成における患者中心の説明のための因果推論 [cs.LG, cs.AI]目的:画像診断レポート生成における因果関係の解明と患者中心の説明
- 医療診断の精度向上と医師の迅速な意思決定支援は,医療現場において不可欠である。
- 既存のAIモデルはパターン認識に優れるものの,画像所見と患者の状態間の因果関係を理解するのが困難である。
- AI生成レポートの理解度向上と,臨床現場での信頼性・有用性を高めることを目指す。
- 提案手法CR3Gは,画像所見と診断の関係における因果関係の把握能力,説明能力を向上させた。
- 5種類の異常中,2種類の異常において,より良い因果関係と説明能力が確認された。
- 本研究は,AI診断の質を高め,臨床現場での活用を促進する一助となる。
ショートカットフローパスによるワンステップ拡散モデルの設計 [cs.LG, cs.CV]目的:ワンステップ拡散モデルの設計に関する共通フレームワーク
- 拡散モデルは画像生成において高性能だが,計算コストが高い。
- ワンステップ拡散モデルの理論的根拠と実装が密接に結合している。
- ショートカットモデルの設計空間を明確にし,改善を系統的に特定すること。
- 提案フレームワークにより,代表的なショートカットモデルの正当性が理論的に裏付けられた。
- ImageNet-256x256において,FID50k 2.85を達成し,最新技術を更新した。
- 事前学習,蒸留,カリキュラム学習を必要とせず,コンポーネントレベルの革新を促進する。
気候インシトゥデータ再構成の性能と効率性:最適化されたIDWがクリギングと暗黙的ニューラル表現を上回る理由 [cs.LG, cs.AI]目的:希薄な気候データの再構成手法の性能評価
- 地球温暖化対策には,高精度な気候データが不可欠である。
- 気候データの観測地点が限られており,空間的な解像度が低いという課題がある。
- 既存手法の改善と,より効率的な再構成手法の開発が求められている。
- 最適化されたIDWは,他の手法と比較して再構成精度と計算効率の両面で優れていた。
- IDWは,RMSE,MAE,$\Delta_{MAX}$が最も低く,$R^2$が最も高い結果を示した。
- これらの差は統計的に有意であり,効果量の大きさも中程度から大きいことが示された。
ソフト決定木分類器:説明可能かつ拡張可能なPyTorch実装 [cs.LG, cs.AI, cs.CV]目的:ソフト決定木及び短期記憶ソフト決定木の実装と評価
- 医療分野等における予測モデルの需要が高く,その性能と解釈可能性が重要視されている。
- 既存の決定木モデルは解釈性は高いが,性能が十分でない場合がある。
- ソフト決定木を用いることで,予測性能と解釈可能性の両立を目指す。
- ソフト決定木(SDT)及び短期記憶ソフト決定木(SM-SDT)をPyTorchで実装し,シミュレーション及び臨床データで評価した。
- SDTは高い解釈可能性を示し,AUCの値はXGBoostと同程度であった。
- 臨床データにおける結果は,決定木以外では,全ての分類手法が同程度の性能を示唆している。
PBDWとDeepONetを用いたハイブリッド双子モデルによる,部分的にしか知識がないシステムの状態推定と予測の効率化 [cs.LG]目的:複雑な不確実性を持つ物理システムの状態推定と予測の効率化
- 複雑な物理現象の理解と制御には,高精度な状態推定が不可欠である。
- 理論モデルの不完全性や実験データのノイズが,状態推定の精度を低下させる。
- 物理モデルとデータ駆動型学習を組み合わせ,未知のモデルバイアスを補正する。
- 提案手法は,物理モデルとデータ駆動型学習を融合させ,状態推定と予測の精度を向上させる。
- PBDWフレームワークとDeepONetを組み合わせることで,モデルの不確実性を効果的に抑制する。
- 最適なセンサー配置戦略を検討し,計測から得られる情報の最大化を図る。
大規模言語モデルにおける人工年齢スコア(AAS)のためのモナドベースの条項アーキテクチャ [cs.AI, cs.LG, cs.MA, cs.NE]目的:大規模言語モデルの内部メモリと「自己様」な振る舞いを,原理的かつ監査可能な方法で制御するための条項アーキテクチャ
- 大規模言語モデルの利用が拡大する中で,その内部動作の透明性と制御が重要となっている。
- 大規模言語モデルの内部メモリの管理方法が確立されておらず,予測不能な挙動を引き起こす可能性がある。
- 人工年齢スコア(AAS)を基盤とし,モナド論の条項を実装することで,モデルの動作を制約し分析する枠組みを提示する。
- 提案アーキテクチャは,AAS軌跡の連続性とレート制限,矛盾の検出,階層的洗練による有機的な構造の顕在化など,明確で解釈可能な挙動を示すことが確認された。
- 調和項を用いて,目標と行動のペアを整列させ,完璧度スコアの窓ごとのドリフトから持続的な改善と劣化を分離することが可能となった。
- 本研究は,人工知能エージェントの内部ダイナミクスを制約および分析するための,コードレベルの設計図を提供する。
意味的栄養評価:テキスト記述からの食品の健康度予測 [cs.LG, cs.AI]目的:食品の健康度を示すFood Compass Score 2.0の予測
- 公衆衛生において正確な栄養評価は重要であり,食習慣改善に不可欠である。
- 食品のテキスト記述からは詳細な栄養データを得ることが難しく,既存の評価システムでは限界がある。
- テキスト記述から食品の栄養情報を推定し,より容易に健康度を評価すること。
- 本研究では,意味的テキスト埋め込み,語彙パターン,ドメインヒューリスティクスを組み合わせたニューラルネットワークを用いる。
- 個々の栄養素について,中央値R^2が0.81と高い予測性能を示し,Food Compass Scoreとの相関も確認された(Pearsonのr = 0.77)。
- 曖昧な食品や加工食品で誤差は大きくなるものの,テキストから栄養情報を抽出する手法の有効性が示された。
D-STEER - 嗜好性アラインメント技術は行動を学習する,信念ではない -- DPOを活性化空間における操縦ベクトル摂動として [cs.LG]目的:大規模言語モデルのアラインメント手法DPOが誘起するネットワーク内部の変化の解明
- 大規模言語モデルの安全性と有用性を高めるためには,人間の意図に沿ったアラインメントが不可欠である。
- DPOのようなアラインメント手法がモデルの内部表現にどのような影響を与えるのか,明確に理解されていない。
- DPOが信念を書き換えるのではなく,活性化空間における微小な操縦メカニズムとして機能することを明らかにすること。
- DPOの勾配は,好ましい応答と好ましくない応答のロジット埋め込みの差にのみ依存し,最終的な隠れ表現の一次シフトを示す。
- DPOで調整されたモデルから抽出された操縦ベクトルを加えることで,アラインメントされた行動の大部分を再現できる。
- スペクトル分析により,上位層でランク1の優位性とエントロピーの崩壊が明らかになり,アラインメントが狭い部分空間を介して行われることが示唆された。
ネットワーク最適化のための汎用ポリシーとしての大規模言語モデル [cs.LG]目的:ネットワーク最適化のための汎用ポリシーの実現
- 現代のデジタルインフラにおいて,堅牢なネットワークサービスを確保する制御ポリシーの設計は不可欠である。
- 既存手法は,手動ルールや深層学習に基づく専門的なポリシーに依存しており,多様なタスクや環境への汎化性能が低い。
- インターネット規模のコーパスで事前学習された大規模言語モデルを活用し,汎用的なネットワークポリシーを実現する。
- Trailblazerは,LLMをネットワークタスクに適用するためのネットワークアラインメント機構と,計算効率のための適応的ポリシー協調機構を組み込んでいる。
- シミュレーションと,Douyin(TikTokの中国版)を用いた大規模な実環境評価の結果,Trailblazerは従来の専門的なポリシーよりも優れた汎化性能を示した。
- 本研究は,LLMが汎用ネットワークポリシーの基盤となりうることを示し,汎用駆動型パラダイムへの第一歩となる。
事前学習済みネットワークによる償却型因果探索 [cs.LG, stat.ME, stat.ML]目的:因果構造の探索
- データから因果関係を導くことは,科学的発見や意思決定において重要である。
- 尤度推定の誤差が,正確な因果構造の発見を妨げるという課題がある。
- 事前学習済みネットワークを用いて尤度推定の精度を高め,因果構造探索の信頼性を向上させる。
- 提案手法は,尤度推定の誤差の影響を軽減し,より信頼性の高い構造学習を実現する。
- 合成データ,シミュレーションデータ,実データにおいて,既存手法と比較して構造復元性能が大幅に向上した。
- 事前学習済みネットワークは,従来のニューラルネットワークアプローチよりも正確な尤度推定を行うことが示された。
プロアクティブハンドオーバー予測のためのメタ継続移動予測 [cs.LG, cs.NI]目的:セルラーネットワークにおけるプロアクティブハンドオーバーのための短期移動予測
- 移動予測は,セルラーネットワークにおけるハンドオーバーの品質向上に不可欠である。
- 現実の移動パターンは非定常であり,予測モデルの精度劣化を引き起こしやすい。
- 予測モデルのドリフトを検出し,迅速に適応することで,ハンドオーバーの成功率を高める。
- 提案手法は,ゼロショット設定でADE 4.46m,FDE 7.79mを達成した。
- 10ショット学習では,ADEを3.71mに改善し,ドリフトからの回復速度を向上させた。
- ハンドオーバー予測への適用により,F1スコアを0.83,AUROCを0.90に向上させた。
スパイクの宣言 [eess.SY, cs.RO, cs.SY, eess.SP, cs.NE, cs.AI, cs.AR, cs.LG]目的:人工知能モデルの効率化に関する新たな枠組み
- 計算機は脳の多くの機能を凌駕するが,AIの効率は脳に遠く及ばない。
- 既存のAIモデルは巨大な行列演算に依存し,エネルギー効率が低い。
- スパイクニューラルネットワークの概念に基づき,AIモデルの効率を劇的に改善する。
- 本研究は,AIモデルをスパイクネットワークとポリークロニゼーションの観点から捉えることを提案する。
- スパイク活動を自然界におけるルックアップテーブルの実装と解釈することで,効率化の道筋を示す。
- 提案するアーキテクチャは,既存のAIモデルと比較して,1000倍の効率改善の可能性を秘めている。
愛を優先し,後で知る:LLMテキストワールドエンジンによる性格に基づいた恋愛適合性 [cs.HC, cs.CL, cs.LG]目的:LLMを用いたテキストワールドエンジンを通じた性格に基づいた恋愛適合性の評価
- 現代社会において,より良いパートナーシップの構築は重要な課題である。恋愛関係の質は幸福度に大きく影響する。
- 従来のマッチングシステムは,静的なプロファイル情報に依存しており,実際の相互作用における適合性を十分に考慮できていない。
- 人間関係における重要な瞬間への反応をシミュレーションすることで,より正確な適合性評価を目指す。
- 本研究では,LLMを人格主導のエージェントと環境モデルとして活用する新しいマッチングパラダイムを提案した。
- シミュレーション結果から得られる報酬モデルを用いて,人間の選好を予測する適合性評価を形式化した。
- LLMのポリシーが人間の行動に近づくほど,マッチングは最適な安定マッチングに収束するという理論的証明を得た。
変形時系列スペクトル変換器による空港旅客フロー予測 [cs.LG, cs.AI]目的:空港旅客フローの予測モデル
- 空港運営の効率性・強靭性を維持する上で,正確な旅客フロー予測は不可欠である。
- 従来のTransformerモデルは固定サイズのパッチ分割を用いるため,複雑で不均質な旅客フローのパターンを捉えるのが困難である。
- 本研究では,変形可能なパッチ分割と周波数領域アテンション機構を組み合わせて,予測精度向上を目指す。
- 提案手法DTSFormerは,北京首都国際空港の実際の旅客データにおいて,既存の予測モデルを上回る性能を示した。
- 変形可能なパッチ分割モジュールは,旅客フローの主要な周期やトレンドにパッチ長を適応させ,高周波変動の捕捉を改善した。
- 時間領域と周波数領域の両方で特徴を統合することで,短期的な変動と長期的な傾向の両方をモデル化することに成功した。
異種グラフニューラルネットワークにおけるトポロジカルバイアスの探求 [cs.LG, stat.ML]目的:異種グラフニューラルネットワークにおけるトポロジカルバイアスの存在とその軽減
- グラフ構造データ処理において,グラフニューラルネットワークは高い能力を発揮する。
- 半教師あり学習において,ラベルの偏りがノードの性能にバイアスを生む。
- 異種グラフにおけるトポロジカルバイアスを特定し,その影響を軽減する。
- 異種グラフの隣接行列にメタ重み付けを適用し,PageRankとノードラベル情報を用いて投影を構築した。
- 構築された投影は,データセットの種類に関わらず,モデル性能と強い相関関係があることを示した。
- 提案手法は,HGNNの性能向上とバイアス軽減に有効であることが実証された。
ARC-AGI-1における小型再帰モデル:帰納的バイアス,ID条件付け,およびテスト時計算 [cs.LG]目的:ARC-AGI-1における小型再帰モデルの性能分析
- 抽象化と推論能力は,汎用人工知能(AGI)実現への重要な課題である。
- 大規模言語モデルは計算コストが高く,リソース制約のある環境での利用が困難である。
- 本研究は,小型再帰モデルの性能向上要因を特定し,効率的な推論手法を模索する。
- テスト時拡張と多数決アンサンブルが,報告された性能の大きな割合を占めることが示された。
- パズルIDへの依存性が明らかになり,IDを置換すると精度が大幅に低下することが判明した。
- 再帰軌跡分析から,有効な再帰は浅く,最初のステップで大部分の精度が得られることが示唆された。
KH-FUNSD:低リソース・クメール語ビジネス文書のための階層的かつ詳細なレイアウト分析データセット [cs.CL, cs.AI, cs.CV]目的:クメール語ビジネス文書のレイアウト分析のための,階層的注釈付きデータセット
- 非ラテン文字の低リソース言語における文書AIツール開発は遅れており,クメール語はその代表例である。
- クメール語のビジネス文書に特化したデータセットが存在せず,文書AIの発展が阻害されている。
- クメール語ビジネス文書のレイアウト分析と情報抽出を可能にするデータセットを構築し,公開すること。
- 本研究では,初のクメール語フォーム文書理解用データセットKH-FUNSDを公開する。
- データセットは,リージョン検出,FUNSDスタイル注釈,詳細な分類の3層構造を採用している。
- KH-FUNSDを用いて既存モデルの性能を評価し,クメール語ビジネス文書特有の課題を議論した。
低パラメータ大規模言語モデルにおける利用可能なコンテキスト容量を拡大するためのKVキャッシュのリサイクル [cs.CY, cs.LG, cs.AI, cs.NE]目的:低パラメータ大規模言語モデルにおけるKVキャッシュリサイクルによる推論高速化
- 近年,大規模言語モデルの利用が拡大しており,効率的な推論が重要視されている。
- 大規模言語モデルは,コンテキスト長に制限があり,長文処理が課題となっている。
- KVキャッシュリサイクルにより,コンテキストメモリの利用効率を高めることを目指す。
- 過去の活性化をキャッシュし,文埋め込みを用いて検索することで,類似するプロンプトの推論を高速化できる。
- プロンプトの正確な接頭辞がキャッシュ内に存在する場合,一貫した高速化が確認された。出力のセマンティクスに悪影響は見られなかった。
- 接頭辞の重複がない場合,ベースラインと同等の動作を示した。モデルの修正は不要で,再現性が高い。
スマート温室制御のための説明可能なAI:ロボットIoTにおけるTemporal Fusion Transformerの解釈性 [cs.LG, cs.AI]目的:スマート温室制御におけるTemporal Fusion Transformerモデルの解釈性向上
- 精密農業の効率化が求められる中,IoT技術の活用が不可欠である。
- 既存の時系列予測モデルは解釈性が低く,信頼性や透明性に課題がある。
- モデルの意思決定根拠を明確にし,農業従事者の信頼を得ることを目指す。
- 訓練されたTFTモデルは,アクチュエータ制御設定において95%のテスト精度を達成した。
- 各センサーがリアルタイムの温室調整に及ぼす影響が明らかになり,透明性が確保された。
- 本研究は,作物の収量増加と資源効率の向上に貢献する適応的な微調整を可能にする。
深層学習オプティマイザの進化 [cs.NE, cs.LG]目的:深層学習の最適化アルゴリズムの自動発見
- 深層学習の性能向上は,様々な応用分野において重要である。
- 既存のオプティマイザは,手動で設計されており,最適なものが不明である。
- 遺伝的アルゴリズムを用いて,より高性能なオプティマイザを自動的に探索する。
- 遺伝的アルゴリズムにより,Adamを2.6%上回る性能を持つ最適化アルゴリズムを開発した。
- CIFAR-10データセットにおいて,7.7%の相対的な改善を達成した。
- 符号ベースの勾配項と適応モーメント推定を組み合わせ,バイアス補正を無効化し,学習率のウォームアップとコサイン減衰を有効にした。
賢く鍛える:ウェアラブルセンサーとエッジニューラルネットワークによるAI筋肥大コーチング [cs.LG, cs.AI]目的:筋肥大を目的としたレジスタンストレーニングの最適化
- 筋肥大は,健康維持やパフォーマンス向上に不可欠であり,効果的なトレーニング方法が求められている。
- 主観的な反復回数残りの評価は信頼性が低く,最適なトレーニング刺激や疲労管理が困難である。
- リアルタイムでの反復回数残り予測に基づいた客観的なトレーニング強度フィードバックの実現を目指す。
- 単一の腕時計型慣性計測ユニット(IMU)のみを使用し,リアルタイムで終末状態(反復回数残り2以下)を検出するシステムを開発した。
- 本システムは,Repetitionのセグメンテーションと,それに基づく特徴量,LSTMによる履歴文脈を用いて,終末状態を高い精度で識別する。
- Raspberry Pi 5およびiPhone 16での評価により,エッジコンピューティングでの実用性が確認された。
厳密な対称性の達成は近似的な対称性の達成よりも指数関数的に容易である [cs.LG, cs.AI]目的:厳密な対称性と近似的な対称性のコストの比較
- 機械学習モデルにおいて対称性を課すことは,科学的応用において重要な帰納的バイアスとなりうる。
- 厳密な対称性に依存する手法は柔軟性や頑健性に課題が残る場合がある。
- 厳密性と近似性のコストを理論的に比較し,近似的な対称性の優位性を示す。
- 平均化複雑性という枠組みを導入し,対称性を課すコストを定量化した。
- 標準的な条件下で,厳密な対称性には線形的な平均化複雑性が必要となる。
- 一方,近似的な対称性は対数的な平均化複雑性で達成可能であることが示された。
GCoDE:GNN向けアーキテクチャ・マッピング共同探索による効率的なデバイス・エッジ共同推論 [cs.LG, cs.AI]目的:GNNのデバイス・エッジ共同推論のための自動設計・展開フレームワーク
- グラフニューラルネットワークはグラフ学習の最先端手法であり,様々な分野での応用が期待されている。
- エッジデバイスでのGNN推論は計算コストが高く,ハードウェアリソースの制約からリアルタイム性や省エネルギー性が課題である。
- デバイス・エッジ間の連携による推論効率向上と省電力化を実現し,GNNの実用的なエッジ展開を可能にすること。
- 提案手法GCoDEは,従来のモデル分割手法では困難であったGNNのデバイス・エッジ共同推論を自動化する。
- GCoDEは,アーキテクチャとマッピングを統合した設計空間において共同最適化を行い,最大44.9倍の高速化と98.2%の省エネルギー化を達成した。
- エネルギー消費予測モデルを導入することで,様々なシステム構成におけるアーキテクチャ効率を正確に評価し,効率的なソリューションを特定する。
TopicProphet:時系列トピックトレンドと株式に関する予言 [cs.LG, cs.AI, cs.CL]目的:株式の予測における最適な学習データの特定
- 株式市場の予測は困難であり,投資家にとって重要な課題である。
- 従来の株価予測モデルは,因果関係の欠如やデータ不足により精度が低い。
- 過去の類似した世論や背景を持つ時代を分析し,最適な学習期間を見出す。
- TopicProphetは,トピックモデリング,時系列分析,ブレークポイント検出,セグメント最適化を組み合わせる。
- これにより,過去の社会経済的,政治的状況を反映した学習データを提供し,予測精度を向上させる。
- 実験結果から,TopicProphetは最先端の手法と比較して,金融パーセンテージ変動の予測において優れた成果を示す。
適応経路積分拡散:AdaPID [cs.LG, cond-mat.stat-mech, cs.AI, cs.SY, eess.SY, stat.ML]目的:拡散モデルにおける経路選択の枠組み
- 生成モデルの品質向上は,画像生成等の分野で重要である。
- 拡散モデルの性能は,時間発展のスケジュールに大きく依存する。
- スケジュールに敏感な評価指標に基づき,効率的な経路選択を目指す。
- 本研究で開発したAdaPIDは,初期段階での精度向上,末尾の正確性,動力学の条件付け,ラベル選択のタイミングを改善する。
- ガウス混合ターゲットを仮定し,閉形式のグリーン関数比と安定した予測状態マップオラクルを実現した。
- 2次元実験において,PWCスケジュールが固定された積分予算で一貫して性能を向上させることを示した。
生成ストochastic 最適輸送:誘導的調和経路積分拡散 [cs.LG, cond-mat.stat-mech, cs.AI, cs.SY, eess.SY, stat.ML]目的:誘導的確率的最適輸送のための線形解法フレームワーク
- 最適輸送は,分布間の距離を測る重要な概念であり,機械学習など多様な分野に応用されている。
- 従来の最適輸送は計算コストが高く,複雑な問題への適用が困難であるという課題があった。
- 本研究では,計算効率と解釈性を両立した誘導的調和経路積分拡散法を提案し,その有用性を示す。
- 提案手法は,終端分布と経路コストを考慮した誘導的確率的最適輸送を解析的に解くことを可能にした。
- 経路コスト,中心線への追従性,分散フローなどの診断指標により,手法の解釈性を高めた。
- 多様なナビゲーションシナリオにおいて,幾何学的・信頼性に基づいた軌跡生成と統合コストの削減を実証した。
不規則メッシュ上の拡散ダイナミクス学習のための演算子整合グラフニューラルネットワーク [cs.LG, cs.AI]目的:不規則メッシュ上の拡散ダイナミクスの学習
- 複雑な形状のシミュレーションには不規則メッシュが不可欠であり,物理現象の正確なモデル化に重要である。
- 不規則メッシュ上では,従来の数値解法が不安定になる場合が多く,高精度なシミュレーションが困難である。
- 不規則メッシュ上で安定かつ高精度な拡散シミュレーションを実現する手法を開発すること。
- 演算子整合グラフニューラルネットワーク(OCGNN-PINN)は,物理情報制約下で偏微分方程式の進化を近似する。
- グラフインシデンス行列を用いた一貫性損失により,ノードとエッジのダイナミクスが時間発展中に構造的に結合されることを保証する。
- 実験の結果,既存手法と比較して時間安定性と予測精度が向上し,非構造化ドメインにおけるクランク・ニコルソン解法に匹敵する性能を示した。
オークションと拡散に基づく多エージェント強化学習による低高度インテリジェントネットワークにおける階層的タスクオフローディングと軌道最適化 [cs.LG, cs.AI]目的:低高度インテリジェントネットワークにおけるタスクオフローディングと軌道最適化
- 災害対応や環境モニタリング等,低遅延かつ省エネルギーなエッジインテリジェンスの重要性が高まっている。
- ドローン等のエネルギー制約,タスク到着の不確実性,計算資源の異質性などが課題となっている。
- 空地協調ネットワークを構築し,タスクオフローディングと軌道計画を最適化することで上記課題の解決を目指す。
- 提案手法は,オークション機構によりエネルギー効率とインセンティブ適合性を両立した軌道割り当てを実現した。
- 拡散ヘテロエージェント近接方策最適化により,観測に応じたノイズ除去によって適応性と方策の多様性を向上させた。
- シミュレーション結果から,提案手法がエネルギー効率,タスク成功率,収束性能において既存手法を上回ることが示された。
人工知能の体系的環境リスク評価 [cs.CY, cs.AI]目的:人工知能の体系的環境リスク
- 気候変動など社会課題解決にAIが期待される一方,環境負荷の増大が懸念される。
- AIの直接的な資源消費だけでなく,社会システムへの組み込みによる間接的な環境影響が不明確である。
- AI開発の構造的条件,リスク増幅メカニズム,生態・社会への影響を分析するフレームワークを提示する。
- 本研究は,AIが農業,エネルギー,廃棄物管理などの分野で,気候変動や生物多様性に及ぼす体系的リスクを明らかにした。
- AIの環境リスクは,資源消費の直接的な影響だけでなく,社会経済システムを通じた非線形的な影響が特徴である。
- 提示されたフレームワークは,AIのリスク分析を体系的に行うための基盤となり,持続可能なAI開発に貢献する。
優先順位と累積リソース制約,カレンダー付き並列機械スケジューリング問題の解決 [cs.AI, math.OC]目的:並列機械における生産スケジュールの効率化
- 現代の工場では大規模な生産が必要であり,自動化によるコスト削減が重要である。
- 既存のスケジューリング手法では,複雑な制約やカレンダーに基づいたリソース制限に対応できない。
- 現実的な並列機械スケジューリング問題を解決するための自動化手法の開発と分析を目指す。
- 制約モデリングによる厳密解法を小規模なケースに適用し,制約ソルバー技術を活用した。
- 大規模インスタンスに対しては,構成的ヒューリスティックと局所探索に基づくメタヒューリスティックを提案した。
- 提案したメタヒューリスティックは,実際の産業環境で活用されている。
ロボット操作のための説明可能な敵対的ロバスト性を持つビジョン-言語-行動モデル [cs.CV, cs.AI, cs.RO]目的:敵対的条件下における行動予測の精度と説明可能性の向上
- スマート農業は,自動化とインテリジェント制御を通じて現代農業を推進する重要な技術である。
- 従来の画像認識やロボット制御は,色合い,照明,ノイズの変化などの影響を受けやすく,敵対的攻撃に脆弱である。
- 本研究は,光度摂動を検出し,原因と影響を自然言語で説明することで,この脆弱性を克服することを目指す。
- 提案モデルは,ベースラインと比較して,Current Action L1損失を21.7%,Next Actions L1損失を18.4%削減した。
- これにより,敵対的条件下での行動予測の精度が向上することが示された。
- さらに,Evidence-3モジュールにより,光度摂動の原因と影響に関する自然言語の説明が可能となった。
深層ニューラルネットワークにおける階層構造の相転移 [cs.LG, physics.data-an]目的:深層ニューラルネットワークの学習における損失地形の幾何学的構造
- 深層学習は機械学習の主要分野であり,画像認識や自然言語処理など幅広い応用が期待される。
- 学習過程は複雑で,損失地形の形状や最適化アルゴリズムの挙動が十分に理解されていない。
- 損失地形の幾何学的な特徴を明らかにすることで,学習過程の理解と改善を目指す。
- 相転移は,損失地形における鞍点によって支配されていることが解析的に示された。
- L2正則化を利用した効率的なアルゴリズムにより,MNISTデータセットで学習されたDNNにおけるモード連結が確認された。
- 鞍点が,異なる数字クラスをエンコードするモデル間の遷移を誘発することが数値的に示された。
継続学習におけるブートストラップ生成の危険性とそれ以外 [cs.LG, cs.AI, cs.CV, eess.IV]目的:合成データによる生成ブートストラップの危険性
- 機械学習の発展に伴い,データ量は重要性を増している。
- 合成データは,データ不足を補う手段だが,分布の偏りが懸念される。
- 継続学習における合成データの利用が,性能劣化を引き起こす可能性を調査する。
- 合成データは,学習目的関数に有意なバイアスと分散をもたらすことが示された。
- 一般的な生成モデルは,合成データを用いた反復学習によって性能が低下することが確認された。
- 最先端のGER手法でさえ,潜在空間における整合性を維持できないことが定量的に示された。
産業AIの堅牢性カード:時系列モデルの評価と監視 [cs.CY, cs.AI]目的:産業AIにおける時系列モデルの堅牢性評価と監視のためのプロトコル
- 産業AIは,製造業等の効率化に不可欠であり,その信頼性確保が重要である。
- 既存の堅牢性評価は曖昧で,具体的な実装方法が確立されていない。
- AI規制への対応と,再現性のある堅牢性証拠の提供を目指す。
- 本研究では,産業AI堅牢性カード(IARC)を提案し,モデルの堅牢性を評価・監視する。
- IARCは,ドリフト監視,不確実性定量化,ストレステストを組み合わせた測定・報告プロトコルを提供する。
- バイオ医薬品発酵プロセスへの適用事例を通じて,IARCの有効性を示す。
社会経済指標,スマート交通システム,都市シミュレーターを用いたZEV導入促進とVMT削減 [cs.CY, cs.AI]目的:ZEV導入促進とVMT削減のための方法論
- 地球温暖化対策として,都市部の交通部門における排出量削減が喫緊の課題である。
- ヒューストンのように,低密度で自家用車依存度の高い都市ではZEVの普及が遅れている。
- 社会経済指標やITSを活用し,ZEV導入を加速させ,VMT削減を実現する。
- 本研究では,Unity 3Dを用いた都市交通の動的モデリングと政策シナリオの可視化を実現した。
- 社会経済指標,ITS,都市設計がZEV導入とVMT削減に貢献することが示唆された。
- 本手法は,2050年の排出量目標達成を目指す自家用車依存都市にとって有用である。
ハイブリッド軽量CNN-MobileViTモデルを用いた在来作物病害虫自動検出システム [cs.CV, cs.AI]目的:在来作物の病害虫診断のための自動検出システム
- 農業はエチオピアのティグレ地域で人口の8割以上を支えており,食糧安全保障上重要である。
- インフラの混乱により,専門家による作物病害診断へのアクセスが限られているという課題がある。
- 紛争後のエッジ環境における展開を考慮し,在来作物の形態に特化した病害虫検出を目指す。
- EfficientNet-Lite1は90.7%のテスト精度を達成し,軽量CNNは42msの推論遅延と4.8MBのモデルサイズで89.5%に達した。
- MobileViT-XSは平均交差検証精度97.3%を示し,MHSAに基づくグローバルな推論が,局所的なテクスチャCNNよりも病害虫の識別において優れていることが示された。
- ARM互換モデルは,Tigrigna語とAmharic語に対応したFlutterアプリケーションに組み込まれ,オフライン環境での診断を可能にする。
WAM-Diff:MoEとオンライン強化学習を用いたマスク拡散VLAフレームワーク - 自動運転における応用 [cs.RO, cs.AI]目的:自動運転のためのマスク拡散VLAフレームワーク
- 自動運転は,交通安全の向上と移動の効率化に不可欠であり,社会実装が急務である。
- 既存の自動運転システムは,複雑な環境への適応や多様なシナリオへの対応に課題を抱えている。
- 本研究は,マスク拡散モデルを用いることで,より柔軟でロバストな軌道生成を実現し,自動運転の性能向上を目指す。
- 提案手法WAM-Diffは,NAVsim-v1で91.0 PDMS,NAVsim-v2で89.7 EPDMSを達成し,その有効性を示す。
- マスク拡散モデルは,自己回帰モデルや拡散ベースのポリシーに代わる有望な手法であり,シナリオ対応型軌道生成を可能にする。
- 疎なMoEアーキテクチャとオンライン強化学習GSPOの組み合わせにより,運動予測と視覚質問応答(VQA)を同時に学習し,スケーラビリティを高めている。
権威主義体制における物語の芸術:中国ソーシャルメディアにおける国家ナラティブの構築 [cs.CY, cs.LG, stat.AP]目的:権威主義体制における国家ナラティブの構築
- 政治的安定や社会統制において,国家が効果的なナラティブを構築することは重要である。
- 既存のプロパガンダ研究では,ナラティブ構築の文脈依存性が十分に考慮されていなかった。
- イベントの性質と市民の検証能力に応じて,国家ナラティブがどのように変化するかを解明する。
- 事件の正当性への影響が,体制による物語の展開と提示される信念に影響を与えることが示された。
- 市民の検証能力は,トップダウン型の操作とボトムアップ型の応答という戦略的選択のバランスをとる役割を果たすことが明らかになった。
- プロパガンダは特定の文脈に適応する複雑な物語構築プロセスであり,権威主義体制の安定性を支えることが示唆された。
時間だ!:Copilot利用の時系列と様相に関する動態 [cs.CY, cs.AI]目的:Copilot利用における時間的・様相的な動態
- AI技術の普及に伴い,その利用状況の理解が不可欠となっている。
- 既存研究では,AIの「何をするか」に焦点が当たっていたが,その「どのように」「いつ」が不明瞭であった。
- Copilotの利用状況を詳細に分析し,時間や状況に応じた利用パターンを明らかにすること。
- モバイル端末では健康関連の話題が常に優勢であり,情報だけでなくアドバイスも求められていることが示された。
- デスクトップ端末では,ビジネス時間帯に仕事とテクノロジー関連の話題が中心となり,特に午前8時から午後5時まで「仕事とキャリア」が最多トピックとなる。
- 利用時間帯は,プログラミング関連の質問が平日,ゲーム関連が週末にピークを迎え,深夜には哲学的な質問,バレンタインデーには人間関係に関する会話が増加する。
SE教育のための教育統制・カリキュラム制約型AIチューターの経験報告 [cs.CY, cs.AI, cs.HC, cs.SE]目的:SE教育におけるAIチューターの設計とパイロット評価
- 教育分野において,個別最適化された学習支援への期待が高まっている。
- AI技術の教育への導入は,過去の期待外れを繰り返しており課題が残る。
- 大規模言語モデルを活用し,カリキュラムに沿ったAIチューターを開発し,その有効性を検証する。
- 生徒は,安心して質問でき,段階的な指導を受けられる点を評価した。
- 教員は,本システムが認知負荷を軽減し,授業を補完する可能性を指摘した。
- 本研究は,モデルの再学習を必要としない,構造とプロンプトによるAI統合の現実的なアプローチを示す。
審美的整合性が同化のリスクをもたらす:画像生成と報酬モデルが美の偏りを強化し,イデオロギー的な「検閲」を招く仕組み [cs.CY, cs.AI, cs.CV]目的:画像生成モデルの審美的整合性と,ユーザーの意図との間の矛盾
- 画像生成技術は,表現の自由や多様性に貢献しうる重要な分野である。
- 現在の画像生成モデルは,特定の審美的基準に偏っており,多様な表現を阻害する可能性がある。
- ユーザーの意図を尊重し,多様な美的表現を可能にする画像生成モデルを開発すること。
- 画像生成モデルは,指示された品質やイメージに関わらず,慣習的に美しい画像を生成する傾向があることが示された。
- 報酬モデルは,ユーザーの明示的な指示に合致する反審美的画像であっても, penalize する傾向が確認された。
- 画像編集や抽象芸術作品との比較を通じて,この偏りが systemic であることが裏付けられた。
自動運転システムテストの発展:要求,課題,および将来の方向性 [cs.RO, cs.CY, cs.AI]目的:自動運転システムテストの現状分析と将来の研究方向性の提示
- 交通効率と安全性の向上に自動運転技術は不可欠であり,その信頼性確保が重要である。
- 実世界環境下での信頼性評価が難しく,十分なテスト手法が確立されていない。
- 実世界での性能評価の限界や,V2X,基盤モデル等の新技術におけるテスト課題を解決する。
- 現在の自動運転システムテスト技術では,特にコーナーケースの多様性,シミュレーションと現実のギャップ,体系的なテスト基準の欠如などが課題となっている。
- 業界および学術界の100名の調査から,V2X導入の課題や基盤モデルベースのテストの高コストが明らかになった。
- 包括的なテスト基準,V2Xにおけるモデル連携,基盤モデルの適応,大規模検証フレームワークが今後の重要な研究方向性である。
AIは世代間の公民権となるべきか [cs.CY, cs.RO, cs.SY, eess.SY, cs.CY, cs.AI, cs.NI]目的:AIアクセスにおける公平性と持続可能性の確保
- AIは社会,経済,認知基盤として不可欠な存在となりつつある。
- AI利用拡大と資源消費の持続可能性との間の緊張関係が課題である。
- AIアクセスを世代間の公民権として確立し,公平性と持続可能性を両立させる。
- AIアクセスを商業サービスではなく,保護すべき基本的利益と捉えることを提唱する。
- 既存の規制フレームワークでは,公平なアクセスと資源制約の連携が無視されている。
- IoT--Edge--Cloudなどの技術を活用したAI配信ネットワークのアーキテクチャを提案する。
生成AI時代における仕事,創造性,ガバナンスの再考:自動化を超えて [cs.CY, cs.AI]目的:生成AIが仕事,創造性,経済的安定にもたらす影響に関する多角的な考察
- AI技術の急速な進展は,社会経済構造に大きな変化をもたらす可能性があり,その影響を理解する必要がある。
- AI導入の不均衡や,AIによる仕事の変容に対する社会的な議論が十分に進んでいない。
- AI時代のガバナンス,スキル開発,創造性の維持,モデル設計における包括的な枠組みを提示する。
- 生成AIの進化が雇用情勢や創造性に及ぼす影響を,タスク露出モデリングや政策分析を通じて包括的に分析した。
- 最新のAIモデルが必ずしも以前のモデルより優れているとは限らず,ユーザーの行動がエコーチェンバーを生み出す可能性が示唆された。
- ベーシックインカムは,AI時代のガバナンスにおいて,スキル開発や創造性維持と並行して検討されるべきである。
