Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
Tags
- PYTHON
- airflow.cfg
- TIL
- 자료구조
- 가상환경
- Docker
- 데이터 엔지니어링
- 데이터 웨어하우스
- linux
- 컴퓨터 네트워크
- dockerfile
- redshift
- 데이터베이스
- 운영체제
- 데이터엔지니어링
- S3
- 데브코스
- 컴퓨터네트워크
- TCP
- 파이썬
- 정리
- 데이터 파이프라인
- 종류
- Go
- Django
- airflow
- HADOOP
- http
- sql
- AWS
Archives
- Today
- Total
목록Pig (1)
홍카나의 공부방
Why Pig? 하둡 에코시스템 내부의 Pig는 분산 데이터 처리를 목적으로 사용하는 프로그램이다.Hadoop의 기본 데이터 처리 구조인 Mapper와 Reducer의 프레임에 맞춰서 개발하기 쉽지 않은 문제들도 있을 것인데, 이럴 때 사용할 수 있는 대안중 하나가 바로 Pig다. Pig는 맵리듀스 위에서 작동하고, Pig Latin이라는 새로운 프로그래밍 언어를 사용한다. 그리고 절차형 언어로, 언어 자체가 SQL과 굉장히 유사한 특징을 가지고 있어 SQL에 익숙하다면 쉽게 배울 수 있는 언어다. Pig Latin은 내부적으로 맵리듀스 작업으로 변환되어 Hadoop 클러스터에서 실행된다. Pig의 사용법 Pig를 사용할 수 있는 방법은 여러 가지가 있다.첫 번째로는 명령줄 해석 프로그램인 Grunt를..
Data Engineering/Hadoop
2024. 5. 19. 14:19