대장암 환자의 CEA수치와 나이와의 관계
Last updated
Was this helpful?
Last updated
Was this helpful?
대장암 환자의 CEA수치와 나이와의 관계
2019 12 13
활용데이터
건수: 2014년 대장암 환자 암 병기 데이터 중, 측정되지 않은 값을 나타내는 코드의 환자 데이터를 제외한 1197건
활용 속성: AGE, SSF3
설명
본 시각화는 2014년 대장암 암병기 데이터를 활용한 시각화로, 환자의 연령대 별 대장암 종양표지자인 CEA에 대한 분포와 상관관계를 시각화를 통해 나타내고자 하였다.
대장암 환자의 나이와 종양표지자 수치의 상관 관계를 알아보기 위해, X축 변수를 나이(AGE), y축 변수를 종양표지자 수치(SSF3)로 놓고 산점도를 그려보았다.
분포도를 보았을 때, 실제로 두 변수의 중앙 부분 값(x축 기준 35~85)은 나이에 따라 CEA 수치가 전반적으로 증가하는, 우상향 분포를 보였다. 특히 CEA 수치가 높은 환자군의 경우, 그 특징이 도드라지게 나타났다. 해당 시각화 결과로 미루어 볼때, 나이가 많은 대장암 환자일수록 CEA수치가 높은 경향이 있다고 결론 내릴 수 있다.
ggplot(colonCS, aes(y=SSF3, x=AGE)) + geom_point(shape=18, size=2, color="darkblue") + ggtitle("대장암 환자 나이에 따른 CEA수치 분포도") + theme(plot.title = element_text(family = "serif", face = "bold", hjust = 0.5, size = 15, color = "darkblue"))+ labs(y="CEA 수치", x="진단시나이")
실제로 상관계수 테스트를 실시해본 결과, P Value는 2.2e-16으로 유의수준이 매우 낮았으며, 상관계수는 약 0.345로 꽤 높은 양의 상관관계를 보였다.
cor.test(colonCS$T_SIZE, colonCS$LNEXAM, method = "pearson")
## ## Pearson's product-moment correlation ## ## data: colonCS$T_SIZE and colonCS$LNEXAM ## t = 12.724, df = 1195, p-value < 2.2e-16 ## alternative hypothesis: true correlation is not equal to 0 ## 95 percent confidence interval: ## 0.2945325 0.3943703 ## sample estimates: ## cor ## 0.3454284