#23. attendance.csv

1. 코드

%matplotlib inline import pandas as pd import seaborn as sns


1. 결측치 확인

attendance_df.isnull().sum()


2. 결측치 평균값으로 대체

attendance_df.fillna(attendance_df.mean().round(), inplace=True)


3. 시각화 그래프

attendance_df.plot(x='연도')

2. 발견한 인사이트

1. '여자농구', '남자농구', '배구' 참석자 수는 큰 변화가 없지만, '축구' 참석자 수는 2010년 이후로 급격하게 감소했고, '야구' 참석자 수는 증감을 반복하고 있음을 알 수 있음


3. 한 줄 평가

  • 결측치를 삭제하지 않고 다른 값으로 대체할 경우에 평균값, 중간값 등 여러 통계값 중에서 어떤 기준으로 어떤 값을 선택해야 하는지 알고 싶음