데이터파이프라인
-
PySpark와 Pandas 연동으로 배우는 대규모 데이터 파이프라인 구축 실전 가이드
PySpark와 Pandas를 연동하여 대규모 데이터 파이프라인을 구축하는 방법을 소개합니다. 로컬 개발부터 클러스터 배포까지, Pandas UDF와 Arrow 최적화를 활용한 실전 ETL 파이프라인 구축 가이드입니다.
PySpark와 Pandas를 연동하여 대규모 데이터 파이프라인을 구축하는 방법을 소개합니다. 로컬 개발부터 클러스터 배포까지, Pandas UDF와 Arrow 최적화를 활용한 실전 ETL 파이프라인 구축 가이드입니다.