본문 바로가기

소프트웨어-이야기/데이터 저장소 + 시각화

[Spark]DataFrame을 Parquet으로 저장하기


파케이파일로 데이터프레임이 저장되면, 스키마 정보를 유지한 채로 데이터를 저장할 수 있다.
위의 코드 예시를 보면, 데이터프레임을 파케이로 저장한 후 => 해당 파케이파일을 읽어들이면 스키마를 유지하고 있어 TempVIew를 생성할 수 있다.