arXiv雑要約

画像・音声 - 2026/03/19 公開

  • 3クラス化とLLRを用いたスプーフィング対策型自動話者認証統合システム [eess.AS, cs.SD]目的:スプーフィング対策型自動話者認証の統合
    • 話者認証は,セキュリティシステムにおいて重要な役割を果たす技術である。
    • 既存手法は解釈性に乏しく,評価指標の変更に柔軟に対応できない。
    • 解釈可能な意思決定パイプラインを構築し,柔軟性を高める。
    • 提案手法は,ASVSpoof5において既存手法と同等の性能を示す。
    • SpoofCelebにおいては,より良い結果が得られた。
    • 3クラス化により,より解釈性の高い結果が得られることが示された。

    Link: https://arxiv.org/abs/2603.13780

  • 3Dへの途中:2.5Dモデルと3Dモデルのアンサンブルによる堅牢なCOVID-19 CT診断 [eess.IV, cs.CV, cs.LG]目的:COVID-19のCT画像からの検出と疾患分類
    • 感染症診断において,CT画像は重要な役割を担う。迅速かつ正確な診断は,治療効果に大きく影響する。
    • CT画像診断は,画像取得条件や患者の状態によって画質が変化しやすく,診断精度が左右される場合がある。
    • 異なる特徴を持つ2.5Dと3Dモデルを組み合わせることで,より堅牢な診断モデルを構築し,診断精度を向上させる。
    • 提案手法は,PHAROS-AIF-MIHベンチマークにおいて,二値分類で94.48%の精度と0.9426のMacro F1スコアを達成した。
    • 多クラス疾患分類では,2.5D DINOv3モデルが最高の性能を示し,79.35%の精度と0.7497のMacro F1スコアを達成した。
    • スライスベースの表現とボリュームモデリングの組み合わせが,多源医療画像解析において有効であることが示された。

    Link: https://arxiv.org/abs/2603.14832