arXiv雑要約
画像・音声 - 2026/03/19 公開
3クラス化とLLRを用いたスプーフィング対策型自動話者認証統合システム [eess.AS, cs.SD]目的:スプーフィング対策型自動話者認証の統合
- 話者認証は,セキュリティシステムにおいて重要な役割を果たす技術である。
- 既存手法は解釈性に乏しく,評価指標の変更に柔軟に対応できない。
- 解釈可能な意思決定パイプラインを構築し,柔軟性を高める。
- 提案手法は,ASVSpoof5において既存手法と同等の性能を示す。
- SpoofCelebにおいては,より良い結果が得られた。
- 3クラス化により,より解釈性の高い結果が得られることが示された。
3Dへの途中:2.5Dモデルと3Dモデルのアンサンブルによる堅牢なCOVID-19 CT診断 [eess.IV, cs.CV, cs.LG]目的:COVID-19のCT画像からの検出と疾患分類
- 感染症診断において,CT画像は重要な役割を担う。迅速かつ正確な診断は,治療効果に大きく影響する。
- CT画像診断は,画像取得条件や患者の状態によって画質が変化しやすく,診断精度が左右される場合がある。
- 異なる特徴を持つ2.5Dと3Dモデルを組み合わせることで,より堅牢な診断モデルを構築し,診断精度を向上させる。
- 提案手法は,PHAROS-AIF-MIHベンチマークにおいて,二値分類で94.48%の精度と0.9426のMacro F1スコアを達成した。
- 多クラス疾患分類では,2.5D DINOv3モデルが最高の性能を示し,79.35%の精度と0.7497のMacro F1スコアを達成した。
- スライスベースの表現とボリュームモデリングの組み合わせが,多源医療画像解析において有効であることが示された。
