1. 코드
%matplotlib inline import pandas as pd import seaborn as sns
1. 그래프 한글 깨지지 않게
# 사용자 운영체제 확인 import platform platform.system() # 파이썬 시각화 패키지 불러오기 import matplotlib.pyplot as plt %matplotlib inline if platform.system() == 'Darwin': # Mac 환경 폰트 설정 plt.rc('font', family='AppleGothic') elif platform.system() == 'Windows': # Windows 환경 폰트 설정 plt.rc('font', family='Malgun Gothic') plt.rc('axes', unicode_minus=False) # 마이너스 폰트 설정 # 글씨 선명하게 출력하는 설정 %config InlineBackend.figure_format = 'retina'
2. 그룹별로 count 하기
parks_df.groupby('시도').size()
3. 특정 문자열을 포함하고 있는지 확인하기
boolean1 = Gwangju_df['관리번호'].str.contains('29170')
2. 발견한 인사이트
1. 공원 중에서는 '어린이공원'이 제일 많았고, '근린공원', '소공원'이 그다음으로 많았음
2. '소재지도로명주소' 칼럼을 '시도'와 '시군구'로 나누고, '전화번호' 칼럼에서 '지역번호' 칼럼을 생성함
-> 가장 많은 공원이 위치한 시도는 '경기도'이고, 그다음은 '경상남도', '전라북도', '울산광역시'임을 알 수 있음
3. 광주광역시 공원 관리번호를 분석한 결과, '시도'별, '시군구'별로 공원 관리번호가 다름을 알 수 있음
+ 광주광역시에서는 '북구', '서구', '남구' 순서로 공원이 많이 위치하고 있음
+ 광주광역시에는 '어린이공원'이 제일 많고, '체육공원'이 제일 적음을 알 수 있음
4. 공원 중에서 가장 많았던 '어린이공원', '근린공원', 소공원'이 어느 지역에 위치하고 있는지 분석한 결과
-> '어린이공원'은 경기도에 가장 많았음
-> '근린공원'과 '소공원' 역시 경기도에 가장 많았음
-> 애초에 경기도에 다른 지역의 2배 이상의 공원이 위치하고 있어서 위와 같은 결과가 나온 것 같다는 생각을 함
3. 한 줄 평가
- 막대그래프, 원그래프 외에 더 다양한 그래프를 활용할 수 있도록 공부가 필요함
'DA' 카테고리의 다른 글
#20. young_survey.csv (0) | 2021.07.22 |
---|---|
#19. survey.csv (0) | 2021.07.22 |
#17. occupations.csv (0) | 2021.07.21 |
#16. museum_1.csv / museum_2.csv / museum_3.csv (0) | 2021.07.21 |
#15. albums.csv (0) | 2021.07.21 |