arXiv雑要約

画像・音声 - 2026/03/19 公開

3クラス化とLLRを用いたスプーフィング対策型自動話者認証統合システム [eess.AS, cs.SD]目的：スプーフィング対策型自動話者認証の統合
- 話者認証は，セキュリティシステムにおいて重要な役割を果たす技術である。
- 既存手法は解釈性に乏しく，評価指標の変更に柔軟に対応できない。
- 解釈可能な意思決定パイプラインを構築し，柔軟性を高める。
- 提案手法は，ASVSpoof5において既存手法と同等の性能を示す。
- SpoofCelebにおいては，より良い結果が得られた。
- 3クラス化により，より解釈性の高い結果が得られることが示された。
Link: https://arxiv.org/abs/2603.13780
3Dへの途中：2.5Dモデルと3Dモデルのアンサンブルによる堅牢なCOVID-19 CT診断 [eess.IV, cs.CV, cs.LG]目的：COVID-19のCT画像からの検出と疾患分類
- 感染症診断において，CT画像は重要な役割を担う。迅速かつ正確な診断は，治療効果に大きく影響する。
- CT画像診断は，画像取得条件や患者の状態によって画質が変化しやすく，診断精度が左右される場合がある。
- 異なる特徴を持つ2.5Dと3Dモデルを組み合わせることで，より堅牢な診断モデルを構築し，診断精度を向上させる。
- 提案手法は，PHAROS-AIF-MIHベンチマークにおいて，二値分類で94.48%の精度と0.9426のMacro F1スコアを達成した。
- 多クラス疾患分類では，2.5D DINOv3モデルが最高の性能を示し，79.35%の精度と0.7497のMacro F1スコアを達成した。
- スライスベースの表現とボリュームモデリングの組み合わせが，多源医療画像解析において有効であることが示された。
Link: https://arxiv.org/abs/2603.14832