업무에 파이썬 활용할 줄 알기
10. 판다스 데이터프레임 연산 복습 본문
브로드 캐스팅
데이터프레임 필터링
컬럼시프트
브로드 캐스팅
하나의 연산이 한 컬럼의 모든 데이터에 적용됨
import pyupbit
df = pyupbit.get_ohlcv("KRW-BTC")
df['open'] + 100
100을 더해준걸 df에 고정시키려면 어떻게 해야하나?
데이터프레임 필터링
비교 연산자의 결과는 Boolean 값을 갖고있는 시리즈 객체임
예) 종가가 고가보다 높았던 거래일만 필터링 해보기
import pyupbit
df = pyupbit.get_ohlcf("KRW-BTC")
cond = df['close'] > df['open']
cond
df['cond'] #각 인덱스에 대해서 True인 로우만 필터링
컬럼시프트
동일 컬럼의 위 아래로 빼야할 때
즉, 당일 저가와 전일 저가를빼려면 어떻게 해야하는가?
문제점: 데이터 프레임의 연산은 기본적으로 같은 인덱스에 있는 컬럼과 컬럼 사이에 적용됨
해결책: 특정 컬럼의 데이터를 아래로 하나씩 이동시킨다
df['컬럼명'].shift(1)
df[close_shift1']= df['close'].shift(1)
복습 자료
데이터 분석 입문자를 위한 파이썬 판다스 300제
wikidocs.net/book/4852
'Python > [유튜브] Pandas & NumPy' 카테고리의 다른 글
03/04. 판다스 시리즈(Series) 인덱싱과 슬라이싱 / 추가, 삭제, 수정 (0) | 2023.11.08 |
---|---|
02. 판다스 시리즈(Series) 생성 (0) | 2023.11.08 |
06. 판다스 데이터프레임 생성 (0) | 2023.11.08 |
07/08. 판다스 데이터프레임 인덱싱과 슬라이싱 / 값과 영역 접근 (0) | 2023.11.08 |
09. 판다스 데이터프레임(DataFrame) 추가 삭제 복습 (0) | 2023.11.08 |