카테고리 없음

[논문리뷰] Hformer: highly efficient vision transformer for low-dose CT denoising

kstar2 2024. 4. 21. 20:49

https://link.springer.com/article/10.1007/s41365-023-01208-0

 

Nuclear Science and Techniques Vol. 32 No. 61 (IF 2.8)

Author : Shi-Yu Zhang, Zhao-Xuan Wang, Hai-Bo Yang, Yi-Lun Chen, Yang Li, Quan Pan, Hong-Kai Wang,
             Cheng-Xin Zhao (현대물리연구소, 사이버 보안 학교, 의과대학)

Publish : 2023 April 26

 

1. Introduction

  • 환자는 CT 검사 동안 유해한 방사선에 노출되며, 방사선량이 너무 높으면 건강에 부정적인 여향을 미칠 수 있음
  • X선  선량을 줄이기 위한 대안으로 저선량 CT가 개발되었지만 잡음과 인공물에 의해 영향을 받을 수 있어 임상 진단에 적용하기 전에 반드시 해결해야 할 중요한 문제임
  • 전통적인 방식은 physical models과 priori information을 사용함. 이는 HW의 제한과 높은 계산 비용으로 상업용 CT에서 구현이 어려움
  • CNN을 이용한 방식은 pooling layer에서 상당한 양의 정보를 손실하고 local간의 상관 관계를 무시하는 등 한계가 제안됨
  • Transformer 모델이 컴퓨터 비전 분야에서 뛰어난 성능을 보임

2. Relative Work

[전통적인 방법]

  • (이미지 재구성전 전처리하는 방식) IR 기반 알고리즘을 사용함. 하지만 IR은 확장성이 떨어지며 정보 검색 기술과 관련된 계산 오버헤드가 발생함
  • 재구성된 이미지를 후처리하는 방식은 이미지 여역의 노이즈 분포를 정확하게 결정하지 못해 사용자가 구조 보존과 노이즈 대체 간의 최상의 절충안을 결정하는데 어려움이 발생함

[딥러닝 기반 방법]

  • CNN 기반 방법을 사용 (CycleGAN, AttRDN, NCS-Unet, REDCNN, FBP 등) 했지만 이는 전체 이미지의 구조적 유사성을 모델링하는 데 효율성이 떨어짐
  • Transformer를 사용하거나 Transformer + CNN 연구도 많이 제안됨

※ 본 연구에서는 Transformer와 CNN을 결합한 방식을 제안함

3. Method

  • Filtered Back Projection로 재구성된 저선량 스캔 데이터에서 시작함
  • CT 이미지의 noise 분포에는 일반적으로 "양자 포아송 노이즈"와 "전자 가우스 노이즈"의 조합이 포함됨
  • 2개의 Conv layer, 3개의 Hformer block 및 4개의 scale layer를 포함
  • Auto Encoder, CNN, Transformer 결합해 사용
  • 패치 추출 : CT영상의 중첩된 슬라이스를 사용해 샘플 수를 늘림
  • 잔여 학습 : 항등 및 잔여 매핑을 제공. 순방향 신경망과 단축 연결을 통해 구현
  • Convoultion Block : fig 2 참고
  • Hformer block : fig 3 참고

4. Result

  • RMSE, PSNR, SSIM 지표를 사용함. 육안평가도 진행함 (RED-CNN, Uformer, DU-GAN, CTformer, SCUNet)
  • Hformer과 Sole-ViT Loss 비교