람다 아키텍처
람다 아키텍처란 실시간성 데이터를 처리하는 스피드레이어와 지난 데이터를 다루는 배치레이어를 별도로 두어서
실시간으로 대용량 데이터를 안정적으로 관리하는 방법론이다. 람다 아키텍처 공식 사이트
람다 아키텍처의 특성
- 시스템에 문제가 있어도, 전체적인 기능은 정상적으로 작동된다.
- 다양한 종류의 작업에서도 잘 작동한다.
- 처리해야하는 양이 많아도 잘 버텨낸다.
- 레이턴시가 짧다.
- 확장성이 높다.
요 5가지 특성을 목표로 만들어진 아키텍처라고 한다. 확장성 높은 아키텍처라는 점에서 귀가 솔깃하다. @ㅂ@
리서치를 하면서 들었던 생각
그리고 스피드 레이아웃으로 스파크 스트리밍을 주로 사용하는 걸로 보인다.
읽을 만한 글
스파크 기반으로 배치처리를 만든 사례에 대한 포스팅 => SACK(Spark,Akka,Cassandra,Kafka) 스택으로 만들었다고 한다.
'소프트웨어-이야기 > 데이터 저장소 + 시각화 ' 카테고리의 다른 글
[DB] 갈레라 클러스터 주의사항 - 테이블 변경하기 (0) | 2017.10.16 |
---|---|
[SPARK] 클러스터 환경 (0) | 2017.09.06 |
[Spark]User Define Function (0) | 2017.03.11 |
[Spark]DataFrame을 S3에 CSV으로 저장하기 (0) | 2017.03.11 |
[Spark] 여러개의 로그 파일 한번에 읽어오기 (0) | 2017.02.21 |