BSA02_SNS-Twitter.ipynb
패키지 불러오기
# !pip install snscrape
import pandas as pd
import snscrape.modules.twitter as sntwitter
# !pip install tqdm
from tqdm.notebook import tqdm
트위터 데이터 가져오기
스크레이퍼 = sntwitter.TwitterSearchScraper("#python")
for 트위 in 스크레이퍼.get_items():
break
트위자료 = [트위.date, 트위.id, 트위.rawContent, 트위.user.username, 트위.likeCount, 트위.retweetCount]
print(트위자료)
스크레이퍼 = sntwitter.TwitterSearchScraper("#python")
트윗묶음 = []
for i, 트윗 in enumerate(스크레이퍼.get_items()):
트윗자료 = [트윗.date, 트윗.id, 트윗.rawContent, 트윗.user.username, 트윗.likeCount, 트윗.retweetCount]
트윗묶음.append(트윗자료)
if i > 50: break
len(트윗묶음)
트윗_df = pd.DataFrame(트윗묶음,columns=["date","id","content","username","likeCount","retweetCount"])
트윗_df.head()
진행바(progress bar) 추가
스크레이퍼 = sntwitter.TwitterSearchScraper("#python")
트윗묶음 = []
n_트윗묶음 = 1_000
for i, 트윗 in tqdm(enumerate(스크레이퍼.get_items()),desc="진행률",total=n_트윗묶음):
트윗자료 = [트윗.date, 트윗.id, 트윗.rawContent, 트윗.user.username, 트윗.likeCount, 트윗.retweetCount]
트윗묶음.append(트윗자료)
if i > n_트윗묶음: break
트윗_df = pd.DataFrame(트윗묶음,columns=["date","id","content","username","likeCount","retweetCount"])
트윗_df.head()
'Statistics > BSA' 카테고리의 다른 글
230327 / BSA04. 다양한 형태의 자료 파일 작업 속도 비교 (0) | 2023.04.02 |
---|---|
230322 / BSA03. 데이터 분석 주요 과정 살펴보기 (0) | 2023.03.26 |
230320 / BSA03. 가상환경에서 주피터랩 설치하기, 주피터노트북에서 자동완성 기능 구현하기 (0) | 2023.03.26 |
230320 / BSA03. 효율적인 메모리 관리와 프로그램 작성 (0) | 2023.03.26 |
230315 / BSA02. 다양한 금융자료들 간 환율 비교, 1분 단위로 사이트 접속하여 데이터 가져오기 (0) | 2023.03.26 |