Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- airflow
- linux
- 데브코스
- 파이썬
- 가상환경
- 데이터 웨어하우스
- Django
- 자료구조
- TIL
- 데이터베이스
- Go
- HADOOP
- TCP
- 컴퓨터 네트워크
- http
- 컴퓨터네트워크
- PYTHON
- 데이터엔지니어링
- AWS
- dockerfile
- 데이터 엔지니어링
- airflow.cfg
- Docker
- 운영체제
- sql
- 종류
- 정리
- S3
- redshift
- 데이터 파이프라인
Archives
- Today
- Total
홍카나의 공부방
데이터 엔지니어링 트렌드와 변화 본문
2017년 | 2023년 | 비고 |
Hive(Hadoop) | Spark | 여전히 SQL을 사용한다는건 동일 |
Data Warehouse | Data Lake | Data Mesh |
On-premise | Cloud, Container | Snowflake, BigQuery, Databricks를 주로 사용 |
Batch Processing | Streaming Processing | Spark 스트리밍, Kafka 사용 |
ETL 자체개발 및 운영 | ETL SaaS (FiveTran) | ETL SasS가 완전 대체한다기 보다는, 보완하는 형태로 |
Central Data Org | Decentralized Data Org | Citizen Data 인력의 등장 |
의사결정 관련한 데이터 활용 | ML/AI를 이용한 제품 개선 | SageMaker 등을 사용하여 여러 과정을 자동화하는 시도 |
특별한 개인정보 보호법이 없었음 | GDPR, CCPA 등 | 개인정보 보호는 기본이 될만큼 중요해짐 |
AlphaGO(2016) | ChatGPT(2022) | 여전히 대중들에게 임팩트를 끼치는 인공지능 기술 |
반응형
'Data Engineering' 카테고리의 다른 글
[DE 데브코스] 06.21 TIL - Airflow, backfill, start_date와 execution_date, catchup (0) | 2023.06.21 |
---|---|
[AWS] 다른 계정의 Redshift로 나의 S3 버킷 파일을 적재하고 싶을때 (0) | 2023.05.31 |
데이터 웨어하우스 옵션들 (1) | 2023.05.22 |
[DE 개념 정리] 데이터 파이프라인 개요, ETL과 ELT (0) | 2023.05.22 |
CSV 파일을 데이터 웨어하우스(redshift)에 로드할 때 주의사항 (0) | 2023.05.14 |