업무에 파이썬 활용할 줄 알기

10. 판다스 데이터프레임 연산 복습 본문

Python/[유튜브] Pandas & NumPy

10. 판다스 데이터프레임 연산 복습

SEO 데이터분석가 2023. 11. 8. 15:29

브로드 캐스팅

데이터프레임 필터링

컬럼시프트

 

브로드 캐스팅

하나의 연산이 한 컬럼의 모든 데이터에 적용됨

import pyupbit
df = pyupbit.get_ohlcv("KRW-BTC")

df['open'] + 100

 

100을 더해준걸 df에 고정시키려면 어떻게 해야하나?

데이터프레임 필터링

비교 연산자의 결과는 Boolean 값을 갖고있는 시리즈 객체임

예) 종가가 고가보다 높았던 거래일만 필터링 해보기

import pyupbit
df = pyupbit.get_ohlcf("KRW-BTC")

cond = df['close'] > df['open']
cond
df['cond']	#각 인덱스에 대해서 True인 로우만 필터링

 

컬럼시프트

동일 컬럼의 위 아래로 빼야할 때

즉, 당일 저가와 전일 저가를빼려면 어떻게 해야하는가?

 

문제점: 데이터 프레임의 연산은 기본적으로 같은 인덱스에 있는 컬럼과 컬럼 사이에 적용됨

해결책: 특정 컬럼의 데이터를 아래로 하나씩 이동시킨다

 

df['컬럼명'].shift(1)

df[close_shift1']= df['close'].shift(1)

 

복습 자료

데이터 분석 입문자를 위한 파이썬 판다스 300제

wikidocs.net/book/4852