비즈니스 문제를 해결하고 예측하는 데이터 사이언티스트가 되고 싶다면?
#소프트웨어 

파이썬 금융 데이터 알아보기(feat: finance-datareader)

파이썬 금융 데이터 알아보기(feat: finance-datareader)

2022-08-17 | 우성우

안녕하세요 저는 모두연의 TQA 우성우 입니다.!

이번시간에는 파이썬 라이브러리중 finance-datareader 를 활용하여 2022년 현재 치솟는 환율과 국민주식인 삼성전자와의 관계에 대해서 간단하게 파이썬으로 알아보는 시간을 가져보겠습니다.! 

편한 실습을 위해서 코랩링크에서도 확인해보실수 있습니다.

link:

Google Colaboratory

No Description

# finance-datareader 설치
!pip install finance-datareader

# 글꼴 설치
!apt -qq install fonts-nanum*

# matplotlib 환경 설정
import matplotlib.pyplot as plt
plt.rcParams["font.family"] = 'Malgun Gothic'
plt.rcParams["axes.grid"] = True
plt.rcParams["figure.figsize"] = (12,6)
plt.rcParams["axes.formatter.useoffset"] = False
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams["axes.formatter.limits"] = -10000, 10000

# 금융 데이터 리더 사용하기
import FinanceDataReader as fdr

# 삼성전자(005930) 데이터 불러오기
df = fdr.DataReader('005930') 

# 위에 데이터 5개
df.head()
 
# 아래 데이터 5개
df.tail() 

# 삼성전자(005930) 데이터 불러오기 1월1일은 공휴일이여서 제외
df = fdr.DataReader('005930', '2019-01-02', '2022-08-01')['Close']  

# 차트 그려보기
df.plot()

# 원달러환율 데이터
usdkrw = fdr.DataReader('USD/KRW', '2019-01-02', '2022-08-01')['Close']  

# 데이터 확인
usdkrw

# 원달러 환율 데이터 차트 그려보기
usdkrw.plot() 

# 삼성전자, 원달러 환율 데이터 리스트에 넣기
df_list = [df,usdkrw] 

# 열 기준으로 데이터 합치기
import pandas as pd df = pd.concat(df_list, axis=1)  

# 데이터 확인
df

# 그래프 그려보기 
# 그래프를 그렸지만 2개의 가격 단위 차이가 많이나서 조금 수정이 필요하다.
df.plot() 

# 조금 더 보기 좋게 컬럼명 변경
df.columns = ['samsung close','won/usd close']  

# 데이터 확인
df

# 데이터 결측치 확인해 보기
df.isnull().sum() 

# 판다스 기능 중 보간법을 이용해서 빈 값을 채워 준다.
df['samsung close'].interpolate(method='time')  

# 데이터 확인
df

# secondary_y 축을 두어서 진행해 본다.
df[['samsung close','won/usd close']].plot(secondary_y=['won/usd close']) 

# 판다스에서 제공해주는 피어슨 상관 관계로 간단하게 상관 관계를 알아본다.
print(df.corr(method='pearson')) 
결론은 음의 상관 계수를 가진다. 하지만 -0.28 정도이므로 달러와 삼성전자 주가는 반대적인 비선형 관계를 가지고 있다. 즉 삼성전자 주가가 상승하는 시기는 원달러 환율이 낮은 시기일수 있다고 생각해 볼 수 있습니다!

 

 

피어슨 상관 관계란?
통계학에서 , 피어슨 상관 계수(Pearson Correlation Coefficient ,PCC)란 두 변수 X 와 Y 간의 선형 상관 관계를 계량화한 수치다. 피어슨 상관 계수는 코시-슈바르츠 부등식에 의해 +1과 -1 사이의 값을 가지며, +1은 완벽한 양의 선형 상관 관계, 0은 선형 상관 관계 없음, -1은 완벽한 음의 선형 상관 관계를 의미한다. 일반적으로 상관관계는 피어슨 상관관계를 의미하는 상관계수입니다.

 

조금더 자세한 내용은 링크를 확인하기 바랍니다!

 

다음에는 조금더 흥미로운 주제로 글을 포스팅 하겠습니다!

 

참고자료: