대장암 환자의 CEA수치와 나이와의 관계

대장암 환자의 CEA수치와 나이와의 관계

2019 12 13

  1. 활용데이터

  2. 건수: 2014년 대장암 환자 암 병기 데이터 중, 측정되지 않은 값을 나타내는 코드의 환자 데이터를 제외한 1197건

  3. 활용 속성: AGE, SSF3

  4. 설명

본 시각화는 2014년 대장암 암병기 데이터를 활용한 시각화로, 환자의 연령대 별 대장암 종양표지자인 CEA에 대한 분포와 상관관계를 시각화를 통해 나타내고자 하였다.

대장암 환자 나이 별 종양표지자(CEA) 수치 분포

대장암 환자의 나이와 종양표지자 수치의 상관 관계를 알아보기 위해, X축 변수를 나이(AGE), y축 변수를 종양표지자 수치(SSF3)로 놓고 산점도를 그려보았다.

분포도를 보았을 때, 실제로 두 변수의 중앙 부분 값(x축 기준 35~85)은 나이에 따라 CEA 수치가 전반적으로 증가하는, 우상향 분포를 보였다. 특히 CEA 수치가 높은 환자군의 경우, 그 특징이 도드라지게 나타났다. 해당 시각화 결과로 미루어 볼때, 나이가 많은 대장암 환자일수록 CEA수치가 높은 경향이 있다고 결론 내릴 수 있다.

ggplot(colonCS, aes(y=SSF3, x=AGE)) + geom_point(shape=18, size=2, color="darkblue") + ggtitle("대장암 환자 나이에 따른 CEA수치 분포도") + theme(plot.title = element_text(family = "serif", face = "bold", hjust = 0.5, size = 15, color = "darkblue"))+ labs(y="CEA 수치", x="진단시나이")

상관관계 확인

실제로 상관계수 테스트를 실시해본 결과, P Value는 2.2e-16으로 유의수준이 매우 낮았으며, 상관계수는 약 0.345로 꽤 높은 양의 상관관계를 보였다.

cor.test(colonCS$T_SIZE, colonCS$LNEXAM, method = "pearson")

## ## Pearson's product-moment correlation ## ## data: colonCS$T_SIZE and colonCS$LNEXAM ## t = 12.724, df = 1195, p-value < 2.2e-16 ## alternative hypothesis: true correlation is not equal to 0 ## 95 percent confidence interval: ## 0.2945325 0.3943703 ## sample estimates: ## cor ## 0.3454284

Last updated