BSA03_Dashboard-CO2.ipynb
패키지 불러오기
import pandas as pd
import numpy as np
import panel as pn
import hvplot.pandas
pn.extension("tablulator",css_files=[pn.io.resources.CSS_URLS['font-awesome']])
df = pd.read_csv("D:\Bigdata\owid-co2-data.csv")
데이터 전처리
# 변수명 변경
df.rename(columns = {'co2':'CO2','co2_per_capita':'인당CO2','country':'국가','year':'연도'},inplace=True)
df.rename(columns = {'coal_co2':'석탄','oil_co2':'석유','gas_co2':'가스'},inplace=True)
# Fill NAs with 0s and create GDP per capita column
# 결측값은 0으로 대체
df = df.fillna(0)
# 1인당GDP가 없고, 전체 인구와 전체GDP가 있는 경우, 전체GDP/전체인구수=1인당GDP
# 위에서 결측값을 0으로 대체했기 때문에 '전체인구수'(분모)가 0이 되는 경우에 발생하는 에러를 해결하기 위해
# '전체인구수'가 0이 아니면 공식 적용, '전체인구수'가 0이면 '인당GDP'=0
df['인당GDP'] = np.where(df['population'] != 0, df['gdp']/df['population'],0)
# Make DataFrame Pipeline Interactive
idf = df.interactive()
대륙별 CO2 배출량 시각화
# Define Panel Widgets
# 처음값=1750, 마지막값=2021
# step=5 : 한 번 이동할 때마다 5년씩 이동하도록 함
# value=1850 : 초기값 설정
연도스라이더 = pn.widgets.IntSlider(name = "연도 스라이더", start=1750, end=2021, step=5, value=1850)
# Radio buttons for CO2 measure
Y축_co2 = pn.widgets.RadioButtonGroup(
name = "Y축",
options = ["CO2", "인당CO2"],
button_type = "success"
)
대륙 = ["World", "Asia", "Oceania", "Europe", "Africa", "North America", "South America"]
Korea = ["South Korea","North Korea"]
파이프라인_co2 = (
# 연도스라이더보다 이전의 연도에 해당하는 데이터만 가져옴
idf[(idf.연도 <= 연도스라이더) & (idf.국가.isin(대륙))]
# 국가별, 연도별 데이터의 평균 'Y축_co2' ("CO2", "인당CO2") 계산
.groupby(["국가", "연도"])[Y축_co2].mean()
.to_frame()
.reset_index()
.sort_values(by="연도")
.reset_index(drop=True)
)
# bokeh를 사용해 그림을 그림
시계열그림_co2 = 파이프라인_co2.hvplot(x="연도",by="국가", y=Y축_co2, line_width=2, title="대륙별 CO2 배출량")
# 시계열그림_co2
표_co2 = 파이프라인_co2.pipe(pn.widgets.Tabulator,pagination="remote",page_size=10,sizing_mode="stretch_both")
# 표_co2
CO2 vs. GDP 비교 시각화
파이프라인_co2_vs_gdp = (
idf[(idf.연도 == 연도스라이더) & (~(idf.국가.isin(대륙)))]
.groupby(["국가", "연도","인당GDP"])['인당CO2'].mean()
.to_frame()
.reset_index()
.sort_values(by="연도")
.reset_index(drop=True)
)
# 파이프라인_co2_vs_gdp
# scatterplot
# alpha=0.7 : 농도
산점도_co2_vs_gdp = 파이프라인_co2_vs_gdp.hvplot(x="인당GDP",y="인당CO2", by="국가",
size=80, kind="scatter", alpha=0.7, legend=False, height=600, width=700)
# 산점도_co2_vs_gdp
막대그래프
Y축_co2_source = pn.widgets.RadioButtonGroup(
name = "Y축",
options = ["석탄", "석유", "가스"],
button_type = "success"
)
세계제외 = ["Asia", "Oceania", "Europe", "Africa", "North America", "South America"]
파이프라인_co2_source = (
idf[(idf.연도 == 연도스라이더) & (idf.국가.isin(세계제외))]
.groupby(["국가", "연도"])[Y축_co2_source].sum()
.to_frame()
.reset_index()
.sort_values(by="연도")
.reset_index(drop=True)
)
막대그래프_co2_source = 파이프라인_co2_source.hvplot(kind='bar', x="국가", y=Y축_co2_source, title="대륙별 CO2 배출 소스")
# 막대그래프_co2_source
templates
# markdown(####) : 글자크기 설정
CO2와기후변화 ="#### 이산화탄소 (CO2)는 기후 변화의 주요 원인 중 하나이다. CO2는 인간 활동, 특히 고도의 산업화와 교통, 에너지 생산 등에 의해 많이 배출되고 있다. 이산화수소와 같은 탄소 기질 배출물이 대기중에 집중되면서 기상 이변, 바다 수위 상승, 등의 기후 변화의 원인이 되고 있다."
template = pn.template.FastListTemplate(
title = "세계 이산화탄소 배출 대시보드(World CO2 emission dashboard)",
sidebar=[pn.pane.Markdown("# 이산화탄소 배출과 기후변화"),
pn.pane.Markdown(CO2와기후변화),
pn.pane.JPG('기후변화.jpg',sizing_mode='scale_both'),
pn.pane.Markdown("## 연도 설정"),
연도스라이더],
main=[pn.Row(pn.Column(Y축_co2, 시계열그림_co2.panel(width=800),margin=(0,25)),
표_co2.panel(width=400)),
pn.Row(pn.Column(산점도_co2_vs_gdp.panel(width=600),margin=(0,25)),
pn.Column(Y축_co2_source, 막대그래프_co2_source.panel(width=600)))],
accent_base_color="#88d8b0",
header_background="#88d8b0",
)
template.servable();
'Statistics > BSA' 카테고리의 다른 글
230501 / BSA09. pyspark에서 탐색적 데이터 분석 (EDA) (0) | 2023.05.03 |
---|---|
230501 / BSA09. pandas에서 탐색적 데이터 분석 (EDA) (0) | 2023.05.03 |
230426 / BSA08. 데이터 시각화 라이브러리 (0) | 2023.05.03 |
230424 / BSA08. matplotlib 한글 처리 (0) | 2023.05.03 |
230419 / BSA05. Housing 데이터로 전처리, 회귀 모델 적용, 시각화 (0) | 2023.04.23 |