논문편명 : Canonical correlation between body information and lipid-profile: A study on the National Health Insurance Big Data in Korea
연구 목적 : 신체 정보와 혈액 내 지질 농도의 연관성을 다변량 분석하여 주요 요소들 사이의 영향력 정도를 정준상관 기법으로 비교 분석해 한국인의 이상지질혈증 예측 모델 개발 근거 제시
연구 대상 : 2009 – 2016 건강검진정보 자료 3,312,971명
연구의 필요성 :
- 미국의 NCEP는 국가와 인종, 성별 등 차이를 고려하지 않았다. 또한 혈액 검사를 동반해야 하는데 이는 가벼운 음식물 섭취도 검사 결과에 영향을 준다.
- 특정 지표가 정상 범위라 하더라도 체내 지방량이 다를 수 있고 여러 혈관 질환 위험인자가 발 생할 수 있다.
- 따라서 비침습적 방법으로 측정 가능한 정보로 한국인 고유에 예측모델 개발과 여러 지표들을 다차원적으로 고려해 상호 영향력 정도를 상호비교할 수 있는 다변량 분석 연구가 필요하다.
연구의 가정 : 신체 정보와 혈액검사 항목들 사이에 유의한 다차원적 연관성이 있다
데이터셋 :
- 2009-2016 건강검진을 수진한 국민건강보험 가입자 중 100만 명 무작위 추출
- 신체 정보와 혈액검사 항목에 해당하는 8개 feature 사용 (평균에서 표준편차의 세 배 이상 벗어나는 데이터 값을 보이는 검진자 제외)
- 흡연 및 음주자도 연구에서 제외
- 각 feature를 Z-score정규화
|
Indices (unit of measure) |
Body indices |
Age group (1-14)
|
Height (5 cm) |
|
Weight (5 kg) |
|
Waist circumference (cm) |
|
Dyslipidemia factors |
Total cholesterol (mg/dL) |
Triglycerides (mg/dL) |
|
HDL cholesterol (mg/dL) |
|
LDL cholesterol (mg/dL) |
결과 분석 방법 :
- 일관성 확인을 위해 연도별, 성별, 연령별로 분석
- 정준상관분석으로 도출된 정준상관계수(r)의 통계적 유의성은 순열검정법으로 검증
- 신체 정보 항목을 무작위로 재정렬하고 항목의 정렬 순서가 혈액검사 항목과 랜덤 배치되게 하여 랜덤 정준상관계수를 10,000번 반복하여 계산해 추출된 정규분포에서 정준상관계수(r)의 정규성을 검증
- 통계적 유의성은 p<0.05로 정의
- 다중 비교에서 생길 수 있는 오류는 Bonferroni 교정함
결론 :
- 허리둘레가 크고 체중이 많이 나가면 중성지방이 높아지고 HDL 콜레스테롤 수치가 낮아진다.
- 나이에 따른 혈액 내 지질 농도 변화는 남성보다 여성에게 뚜렷이 나타남
- 체중에 따른 변화는 남성에게서 더 뚜렷이 나타남
- 신장과 LDL 콜레스테롤 항목은 남성과 여성 모두에게서 상대적으로 작은 영향력
- 여성에게서 체중, 허리둘레, HDL 콜레스테롤 항목의 영향력은 연령에 따라 급격하게 변했다.
- 따라서 한국인의 이상지질혈증을 예측하는 모델에 성별과 연령에 따른 각 지표의 영향력 정도를 반영할 필요가 있다.
연구의 한계 및 제한점 :
- 건강검진정보 자료에 의존하여 임상 결과에 대한 정보가 부족하여 건강 검진 상태의 변화로 인해 허리둘레나 체중이 변화했을 가능성이 있다.
- 20세 이상 건강검진을 수진한 국민건강보험가입자를 대상으로 하였기 때문에 모든 연령층에 일반화 하는데 한계가 있다.
- 단면연구의 특성상 신체 정보와 혈액 내 지질 수치의 인과관계를 단언할 수 없다.
- 이상지질혈증의 위험인자인 고혈압, 당뇨, 가족력 등과의 관련성에 대한 조사가 이루어 지지않아 추가적인 연구 필요
- 50대 이상 연령대에서 정준상관계수 값이 줄어들어 고연령대에서 다차원적 연관성을 해석하는 데 유념할 필요가 있다.
'정리필요 > 논문리뷰' 카테고리의 다른 글
[논문리뷰] 초진환자 재방문 예측모형 개발 (0) | 2021.03.29 |
---|---|
[논문리뷰] 유방암 분류를위한 적층 앙상블 기법 (0) | 2021.03.25 |
[논문리뷰]머신 러닝 알고리즘을 이용한 만성 질환 관련 입원 환자의 장기 입원 예측 (0) | 2021.03.24 |
[논문리뷰] 응급실 환자의 한국인 분류 및 시력 척도 수준의 머신 러닝 기반 예측 (0) | 2021.03.23 |
[논문리뷰]SCIBERT: A Pretrained Language Model for Scientific Text (1) | 2021.03.15 |