[태그:] Grad-CAM
-
Vision Transformer vs CNN Attention Map 비교 분석: 모델 해석 가능성을 높이는 5가지 핵심 기법
들어가며 딥러닝 모델이 왜 그런 예측을 했는지 이해하는 것은 실무에서 매우 중요합니다. 특히 의료 영상 진단이나 자율주행처럼 신뢰성이 필수적인 분야에서는 모델의 해석 가능성(Interpretability)이 성능만큼 중요합니다. Vision Transformer(ViT)와 CNN은 각각 다른 방식으로 이미지를 처리하며, Attention Map을 통해 모델이 어디를 보고 있는지 시각화할 수 있습니다. 이 글에서는…