Kinesis Overview
Makes it easy to collect, process, and analyze streaming data in real-time
Ingest real-time such as: Application logs, Metrics, Website clickstreams, IoT telemetry data. . .
실시간으로 스트리밍 데이터를 쉽게 수집, 처리 및 분석할 수 있습니다.
애플리케이션 로그, 메트릭, 웹 사이트 클릭 스트림, IoT 원격 측정 데이터 등의 실시간 수집
Kinesis Data Streams: capture, process, and store data streams
데이터 스트림 캡처, 처리 및 저장
Kinesis Data Firehose: load data streams into AWS data stores
데이터 스트림을 AWS 데이터 저장소에 로드
Kinesis Data Analytics: analyze data streams with SQL or Apache Flink
SQL 또는 Apache Flink를 사용하여 데이터 스트림 분석
Kinesis Video Streams: capture, process, and store video streams
비디오 스트림 캡처, 처리 및 저장
Kinesis Data Streams
Retention between 1 day to 365 days
Ability to reprocess (replay) data
Once data is inserted in Kinesis, it can't be deleted (immutability)
Data that shares the same partition goes to the same shard (ordering)
Producers: AWS SDK, Kinesis Producer Library(KPL), Kinesis Agent
1일에서 365일 사이의 보존 기간
데이터 재처리(재생) 기능
일단 Kinesis에 데이터가 삽입되면 삭제할 수 없습니다(불변성)
동일한 파티션을 공유하는 데이터가 동일한 샤드로 이동(순서 지정)
생산자: AWS SDK, Kinesis Producer Library(KPL), Kinesis Agent 사용할 수 있음
Consumers:
-Write your own: Kinesis Client Library(KCL), AWS SDK
-Managed: AWS Lambda, Kinesis Data Firehose, Kinesis Data Analytics
-소비지가 원하는 대로 직접 작성: Kinesis Client Library(KCL), AWS SDK
-Managed 되는 서비스: AWS 람다, Kinesis Data Firehose, Kinesis Data Analytics
Kinesis Data Streams - Capacity Modes
Provisioned mode:
-You choose the number of shards provisioned, scale manually or using API
-Each shard gets 1MB/s in (or 1000 records per second)
-Each shard gets 2MB/s out (classic or enhanced fan-out consumer)
-You pay per shard provisioned per hour
-프로비저닝된 샤드 수, 수동 확장 또는 API 사용 수를 선택할 수 있습니다.
-각 샤드는 1MB/s(또는 초당 1000개의 레코드)를 받습니다.
- 각 샤드는 2MB/s(기존 또는 향상된 팬아웃 소모 장치)를 출력합니다.
- 시간당 제공된 샤드당 비용 지불
On-demand mode:
-No need to provision or manage the capacity
-Default capacity provisioned (4 MB/s in or 4000 records per second)
-Scales automatically based on observed throughput peak during the last 30 days
-Pay per stream per hour & data in/out per GB
- 용량을 프로비저닝하거나 관리할 필요 없음
- 프로비저닝된 기본 용량(4MB/s 또는 초당 4000개 레코드)
-지난 30일 동안 관찰된 처리량 피크를 기준으로 자동 확장
- 스트림당 시간당 비용 지불 및 GB당 데이터 입출력
Kinesis Data Firehose
Fully Managed Service, no administration, automatic scaling, serverless
완벽한 관리 서비스, 관리 기능 없음, 자동 확장, 서버리스
-(중요)AWS: Redshift / S3 / ElastiSearch
-3rd party partner : Splunk / MongoDB / DataDog / NewRelic / . . . (계속 추가됨)
-Custome: send to any HTTP endpoint
Pay for data going through Firehose
Firehose를 통과하는 데이터 비용만 지불
Near Real Time 거의 실시간에 가까움
-60 seconds latency minimim for non full batches
-Or minimum 32 MB of data at a time
-전체 배치가 아닌 경우 지연 시간 최소 60초
-또는 한 번에 최소 32MB의 데이터
Supports many data formats, conversions, transformations, compression
Supports custom data transformation using AWS Lambda
Can send failed or all data to a backup S3 bukcet
다양한 데이터 형식, 변환, 압축을 지원
AWS 람다를 사용한 사용자 지정 데이터 변환 지원
실패한 데이터 또는 모든 데이터를 백업 S3 버킷으로 보낼 수 있습니다.
Kinesis Data Streams / Firehose 차이점
Kinesis Data Streams
-Streaming service for ingest at scale
-Write custom code (producer/consumer)
-Real-time (~200ms)
-Manage scaling (shard splitting / merging)
-Data storage for 1 to 365 days)
-Supports replay capability
-규모에 맞는 수집을 위한 스트리밍 서비스
- 커스텀 코드 작성(생산자/소비자)
- 실시간(~200ms) 속도로 처리
- 확장 관리(샤드 분할/병합)
-1~365일간 데이터 저장
-재생 기능 지원
Kinesis Data Firehose
-Load streaming data into S3 / Redshift / ES / 3rd party / custom HTTP
-Fully managed
-Near real-time(buffer time min. 60sec)
-Automatic scaling
-No data storage
-Doesn't support replay capability
-스트리밍 데이터를 S3 / Redshift / ES / 타사 / 사용자 지정 HTTP로 로드
-완전 관리형 서비스
-실시간에 가까움(버퍼 시간 최소값. 60초)
-자동 스케일링
-데이터 저장소 없음
-재생 지원하지 않음
Kinesis Data Analytics (SQL application)
Perform real-time analytics on Kinesis Streams using SQL
Fully managed, no servers to provision
Automatic scaling
Real-time analytics
Pay for acutal consumption rate
Can create streams out ot the real-time queries
Use cases:
-Time-series analytics
-Real-time dashboards
-Real-time metrics
SQL을 사용하여 Kinesis 스트림에 대한 실시간 분석 수행
완전한 관리, 프로비저닝할 서버 없음
자동 스케일링
실시간 분석
실제 소비율에 대한 지불
실시간 쿼리에서 스트림을 생성할 수 있습니다.
사용 사례:
- 시계열 분석
- 실시간 대시보드
- 실시간 지표 기준
'Cloud > AWS' 카테고리의 다른 글
클라우드의 보안 거버넌스 (0) | 2023.01.10 |
---|---|
Amazon SNS (0) | 2022.12.02 |
Amazon SQS (0) | 2022.12.01 |
Storage Comparison / AWS 모든 스토리지 비교 (0) | 2022.11.28 |
AWS Storage Gateway 개요 (0) | 2022.11.28 |