카테고리 없음

[논문리뷰] CDC_Net: multi-classification convolutional neural network model for detection of COVID-19, pneumothorax, pneumonia, lung Cancer, and tuberculosis using chest X-rays

kstar2 2024. 4. 16. 16:41

https://link.springer.com/article/10.1007/s11042-022-13843-7

  • Jounral : Multimedia Tools and Applications (IF 3.6)
  • Scope : 멀티미디어 개발 및 시스템 지원 도구에 대한 연구
  • Author : Hassaan Malik, Tayyaba Anees, Muizzud Din, Ahmad Naeem (컴공 or 소웨 전공)
  • Publish : 2023.04

1. 연구 배경

[질환 선정과 질환 분류를 위한 선택 이유]

  • COVID-19는 약 2억 8천명이 감염되고 5백여명이 사망하였다. 이는 PCR 키트 사용의 증가로 결과 확인이 지연되거나 false negative도 포함되는 문제가 제기되었다
  • 폐렴은 1년에 인구 7%가 감염되며, 초기에 약물치료를 하지 않을 경우 사망에 이를 수 있다
  • COVID-19 환자에게 나타나는 증상(발열, 기침, 미각상실 등)은 폐렴, 기흉, 폐암, 결핵 환자에게도 흔히 발생
  • 보건 전문가와 연구자들은 COVID-19 식별을 위해 X-ray 영상 분석을 선택함. 이는 빈민 국가에서도 촬영 장비를 쉽게 구입 가능하며, 결핵, 폐렴 등 광범위한 사용이 가능
  • CXR의 조직의 중첩된 구조로 올바른 분석이 어려워 졌으며 본 연구에서는 일를 AI를 통해 해결하고자함

[딥러닝 방법]

  • 기존 연구에서는 다양한 질환에 분석에 CNN 기반 모델이 획기적인 개선을 보임
  • 흉부 질환 분류 네트워크(CDC Net)를 본 연구에서는 제안함. 이는 VGG-19, ResNet-50, Inception v3와 성능 비교함
  • Radiopaedia.org, SIRM DB 등 8개의 저장소에서 X-ray와 CT 데이터를 수집함
  • CDC Net은 염증부분에서 저해상도, 부분 중첩이란 딜레마를 효율적으로 해결함

2. 최근 연구

  • 본 연구의 저자는 BDCNet을 개발해 COVID-19, 폐렴, 폐암을 분류하는 모델을 제안해 ResNet-50, Vgg-16, Vgg-19 및 Inception v3 모델 비교
  • MobileNet-V2, Inception V3 등 다양한 모델을사용해 폐질환 분류 연구를 진행해옴

3. Method

[전처리 및 파라미터]

  • 229*229 크기로 resize와 normalization함 (w = 1350~2800 pix, h = 690~1340 pix)
  • COVID-19 훈련 및 검증 데이터가 적어 SMOTE(Synthetic Minority Oversampling Technique) 사용
  • 10 fold cross valication 사용해 train/validation/test 범주로 나누어 사용
  • batch size : 64, epoch : max 500

[Dataset]

  • 12개의 서로 다른 DB 사용
  • train = 90%, test = 10%

[CDC Net]

CNN Model -> Reshape -> Residual Network -> Dilated Vonvolution -> Flatten -> dense layer -> softmax fucntion

  • 229*229*3 shape의 이미지가 input으로 들어오면 Conv2D layer를 4번을 거치게된다
  • 첫 Conv2D layer에선s 3*3 크기의 filter에서 stride=1, 그 뒤로는 3*3 크기의 filter에 stride=2
  • 4번에 filter를 거쳐진 값을 13*13*32 shape로 바꾸고 Residual Network라는 거에 넣음
  • Residual Network는 3*3 conv -> ReLu -> 3*3 Conv -> ReLU
  • Dilated Conv는 7*7*556(Conv2D, ReLU), 5*5*128(Conv2D, ReLu, Batch Normal), 2*2*128(max pooling)
  • 두번째 Dense layer는 learning rate 0.5, 마지막 layer에서 sigmoid 함수로 분류 Adam  optimizer
  • CDC_Net 및 기존 연구에서 사용된 사전학습 모델은 lr은 0.05로 하며 20 epoch 이후에도 훈련이 진행되지 않을 경우 0.1씩 낮춤

4. Result

  • Keras 라이브러리, 11GB NVIDIA GPU, 32GB RAM, Linux
  • CNC_Net 특징 맵의 부분 출력을 사용해 시각화된 것과, Grad-CAM 시각화된 것 결과제공
  • 10-fold cross validation 결과를 VGG-19, ResNet-50, Inception V3와 비교함
  • confusion matrix와 ROC Curves도 제시함