1. 코드
%matplotlib inline import pandas as pd import seaborn as sns
1. 중복치 제거
dust_df.drop('강원.1', axis=1, inplace=True)
▶ Before
▶ After
2. 꺾은선 그래프
plt.xticks(rotation=45) plt.plot(dust_df['날짜'], dust_df['서울'])
3. 데이터프레임 행/열 역순으로 변경하기
dust_df.loc[::-1] dust_df = dust_df.loc[::-1].reset_index(drop=True)
인덱스도 역순으로 변경하기
4. matplotlib 파라미터
dust_df.plot('날짜', figsize=(10, 6), grid=True)
5. 그래프를 이미지 파일로 저장하기
dust_df.plot('날짜', figsize=(10, 6), grid=True) plt.savefig('dust.png')
6. 행열 전환하기
new_df = dust_df.transpose()
▶ Before
▶ After
2. 발견한 인사이트
1. '서울'의 미세먼지 농도 변화 분석 결과 7월 말과 8월 초에 가장 높았음을 알 수 있음
2. 전체적으로 지역별로 미세먼지 농도 변화는 비슷한 것을 알 수 있음 (7월 20일, 7월 28일, 8월 3일에 대체적으로 증가하고 7월 22일, 7월 30일에 대체적으로 감소함)
3. 지역별 평균 미세먼지 농도 분석 결과 '울산', '부산', '경남'이 다른 지역에 비해 눈에 띄게 평균 미세먼지 농도가 많았고, 다른 지역은 대체적으로 비슷한 것을 알 수 있음
4. 날짜별 평균 미세먼지 농도 분석 결과 7월 16일~7월28일에 미세먼지 농도가 높았고, 7월 30일~8월 11일에 낮았음을 알 수 있음
3. 한 줄 평가
- 날짜별로 x축에 grid를 설정하는 방법을 알고싶음
cf. pandas 행/열 전환
cf. matplotlib
cf. 데이터프레임 행/열 순서 뒤집기
'DA' 카테고리의 다른 글
#23. attendance.csv (0) | 2021.07.28 |
---|---|
#22. beer.csv (0) | 2021.07.28 |
[seaborn을 이용한 데이터 시각화] #03. barplot, boxplot, pointplot (0) | 2021.07.27 |
[seaborn을 이용한 데이터 시각화] #02. jointplot, pairplot, heatmap (0) | 2021.07.26 |
[seaborn을 이용한 데이터 시각화] #01. rugplot, kdeplot, distplot, countplot (0) | 2021.07.23 |