1. 코드 %matplotlib inline import pandas as pd import seaborn as sns 1. 결측치 확인 attendance_df.isnull().sum() 2. 결측치 평균값으로 대체 attendance_df.fillna(attendance_df.mean().round(), inplace=True) 3. 시각화 그래프 attendance_df.plot(x='연도') 2. 발견한 인사이트 1. '여자농구', '남자농구', '배구' 참석자 수는 큰 변화가 없지만, '축구' 참석자 수는 2010년 이후로 급격하게 감소했고, '야구' 참석자 수는 증감을 반복하고 있음을 알 수 있음 3. 한 줄 평가 결측치를 삭제하지 않고 다른 값으로 대체할 경우에 평균값, 중간값 등 여러 통계..
1. 코드 %matplotlib inline import pandas as pd import seaborn as sns 1. 결측치 처리 결측치 수 확인 → 'abv'의 결측치는 전체 데이터(2252개)의 약 3%이고, 'ibu'의 결측치는 전체 데이터의 42%이므로 결측치를 제거하는 것보다 다른 통계값(중간값/평균값)으로 대체하는 것이 낫다고 판단함 beer_df.isnull().sum() 결측치 중간값으로 대체 → 'abv'의 중간값은 0.055, 평균값은 0.060이므로 'abv'의 결측치는 중간값(0.055)으로 대체함 / 'ibu'의 중간값은 35, 평균값은 40이므로 'ibu'의 결측치도 중간값(35)으로 대체함 beer_df.fillna(beer_df.median(), inplace=True..
1. 코드 %matplotlib inline import pandas as pd import seaborn as sns 1. 중복치 제거 dust_df.drop('강원.1', axis=1, inplace=True) ▶ Before ▶ After 2. 꺾은선 그래프 plt.xticks(rotation=45) plt.plot(dust_df['날짜'], dust_df['서울']) 3. 데이터프레임 행/열 역순으로 변경하기 dust_df.loc[::-1] dust_df = dust_df.loc[::-1].reset_index(drop=True) 인덱스도 역순으로 변경하기 4. matplotlib 파라미터 dust_df.plot('날짜', figsize=(10, 6), grid=True) 5. 그래프를 이미지 파..