arXiv雑要約
画像・音声 - 2026/04/06 公開
静止した注意は静止し続ける:認知的な幻覚の軽減に向けた視覚的慣性の打破 [cs.CV, cs.AI]目的:マルチモーダル大規模言語モデルにおける視覚的注意の慣性とその認知的な幻覚への影響
- マルチモーダルLLMの性能向上には,視覚情報の効果的な活用が不可欠である。
- 既存手法では,対象物の存在や属性に関する知覚的幻覚は軽減されるものの,認知的な推論を伴う幻覚は未解決である。
- 視覚的注意の慣性を打破し,動的な注意配分を促すことで,認知的な幻覚を軽減することを目指す。
- マルチモーダルLLMにおいて,視覚的注意が初期段階で固定化し,関係推論を妨げる「視覚的慣性」を特定した。
- 学習不要な手法「IVE」を提案し,視覚的注意の動的な応答性をモデル化することで,この慣性を打破する。
- IVEは様々な基盤モデルとベンチマークで有効であり,特に認知的な幻覚の軽減に効果的であることが示された。
走査電子顕微鏡における多検出器信号からのニューラルフィールドに基づく微細構造の3D表面再構成 [eess.IV, cs.CV, physics.ins-det]目的:走査電子顕微鏡画像からの高精度3D表面再構成手法
- 機能性材料の理解と設計には,微細構造の3次元的特徴解析が不可欠である。
- 既存の再構成手法は,テクスチャのない領域や影の影響,較正への依存性が課題であった。
- SEM画像の物理特性に基づき,自己較正と影へのロバスト性を実現する再構成を目指す。
- 提案手法NFH-SEMは,多視点・多検出器SEM画像から高忠実度の3D表面を再構成する。
- 二光子リソグラフィー試料の478nm層状構造や花粉の782nm表面テクスチャ,炭化ケイ素粒子の1.559μmの破断ステップを高精度に復元した。
- 様々な試料に対し,高い精度と広範な適用可能性を示すことができた。
U-Netセグメンテーションによる磁気迷路状ストライプ進化の幾何学的解析 [cond-mat.mtrl-sci, cs.CV]目的:磁気迷路状ストライプパターンの進化に関する幾何学的解析
- 多様な物理システムに共通するストライプパターンは,その定量的な特性評価が困難であった。
- ストライプパターンの長距離秩序の欠如が,定量的な解析を妨げていた。
- 磁気ストライプパターンの幾何学的・トポロジカル特性を定量的に分析し,その局所的な構造進化を解明する。
- Bi:YIG薄膜における磁場焼鈍処理後のストライプパターンの進化を,U-Netセグメンテーションと幾何学的解析によって定量的に評価した。
- ストライプパターンの長さと曲率を測定することで,局所的なストライプ伝播を定量化するパイプラインを開発した。
- 焼鈍状態への遷移において,磁場極性に関連した2つの異なる進化モード(タイプA,タイプB)を特定した。
