1. 코드
%matplotlib inline import pandas as pd import seaborn as sns
1. 결측치 확인
attendance_df.isnull().sum()
2. 결측치 평균값으로 대체
attendance_df.fillna(attendance_df.mean().round(), inplace=True)
3. 시각화 그래프
attendance_df.plot(x='연도')
2. 발견한 인사이트
1. '여자농구', '남자농구', '배구' 참석자 수는 큰 변화가 없지만, '축구' 참석자 수는 2010년 이후로 급격하게 감소했고, '야구' 참석자 수는 증감을 반복하고 있음을 알 수 있음
3. 한 줄 평가
- 결측치를 삭제하지 않고 다른 값으로 대체할 경우에 평균값, 중간값 등 여러 통계값 중에서 어떤 기준으로 어떤 값을 선택해야 하는지 알고 싶음
'DA' 카테고리의 다른 글
#22. beer.csv (0) | 2021.07.28 |
---|---|
#21. dust.csv (0) | 2021.07.28 |
[seaborn을 이용한 데이터 시각화] #03. barplot, boxplot, pointplot (0) | 2021.07.27 |
[seaborn을 이용한 데이터 시각화] #02. jointplot, pairplot, heatmap (0) | 2021.07.26 |
[seaborn을 이용한 데이터 시각화] #01. rugplot, kdeplot, distplot, countplot (0) | 2021.07.23 |