유방암 환자의 종양 크기와 분화도

유방암 환자의 종양 크기와 분화도

2019 12 13

  1. 활용데이터

  2. 건수: 014년 유방암 환자 암 병기 데이터 중, 측정되지 않은 값을 나타내는 코드의 환자 데이터를 제외한 663건

  3. 활용 속성: AGE, T_SIZE, GRADE

  4. 설명

본 시각화는 2014년 유방암 암병기 데이터를 활용한 시각화로, 환자의 연령대 별 종양 크기에 대한 분포와, 암 분화도 별 비율을 시각화를 통해 나타내고자 하였다.

유방암 환자 나이 별 종양크기 정도 분포

유방암 환자의 나이와 종양크기(Tumor Size)의 유관 관계를 알아보기 위해, X축 변수를 나이, y축 변수를 종양 크기로 놓고 산점도를 그려보았다.

분포도를 보았을 때, 두 변수는 강한 상관관계를 나타내는 않는 것처럼 보인다. 그러나 55세~65세 구간을 기준으로, 20세에서 55세 구간에선 나이가 많을수록 종양이 작은 경향을 보이며, 65세부터는 나이가 많을수록 종양의 크기가 큰 경향을 보인다. 결론적으로, 전체 연령 분포 기준 나이가 비교적 어리거나, 혹은 비교적 많을수록 종양의 크기는 상대적으로 크다고 대략적으로 추측할 수 있다.

ggplot(brstCS, aes(y=T_SIZE, x=AGE)) + geom_point(shape=18, size=2, color="darkblue") + ggtitle("유방암 환자 나이 별 종양크기 정도 분포도") + geom_vline(xintercept=55, linetype = 'dotted', color='red', size = 1) + geom_vline(xintercept=65, linetype = 'dotted', color='red', size = 1) + theme(plot.title = element_text(family = "serif", face = "bold", hjust = 0.5, size = 15, color = "darkblue"))+ labs(y="종양크기(mm)", x="진단시나이")

유방암 분화도 별 환자수

총 세단계로 나뉘어진 종양 분화도(GRADE)에 대해, 분화도 별 유방암 환자수를 파악할 수 있는 시각화를 수행하였다.

그 결과, 중간정도로 분화된 정도를 나타내는 grade2가 약 43%로 가장 많이 차지하는 것을 확인할 수 있었으며, 그 다음으로 많이 차지하는 비율은 Grade3, Grade2 순으로 나타났다.

csgrade <- brstCS$GRADE

csgrade1 <- table(csgrade)

waffle(csgrade1, rows = 22, size=1.0, title="유방암 환자의 분화도 비율", legend_pos = "bottom", xlab="1square=1person") + theme(plot.title = element_text(family = "serif",size=15, face="bold", hjust = 0.5)) + scale_fill_manual(values = c("#FFCC00","#FF9900","#FF6600", "#FFFFFF"))

## Scale for 'fill' is already present. Adding another scale for 'fill', ## which will replace the existing scale.

Last updated