Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- S3
- 데브코스
- Docker
- airflow
- 정리
- 데이터엔지니어링
- linux
- 데이터 엔지니어링
- 컴퓨터네트워크
- PYTHON
- 파이썬
- 자료구조
- redshift
- 컴퓨터 네트워크
- TCP
- Go
- TIL
- 운영체제
- dockerfile
- 데이터베이스
- AWS
- HADOOP
- 가상환경
- 데이터 웨어하우스
- airflow.cfg
- 데이터 파이프라인
- 종류
- http
- Django
- sql
Archives
- Today
- Total
목록하둡 (1)
홍카나의 공부방

HDFSHDFS(Hadoop File System)는 분산 처리에 사용하는 파일 시스템이다. HDFS는 데이터를 클러스터 전체에 걸쳐 분산시키고, 여러 컴퓨터에 걸쳐 저장한 데이터는 각 컴퓨터가 동시에 처리한다. 데이터는 블록 단위로 나누며, 블록은 기본 128MB를 가지게 된다. 모든 블록은 2개 이상의 복사본으로 저장이 된다. 단일 노드가 다운되더라도 블록을 잃어버리지 않기 위함이다. 노드의 종류Node의 종류는 크게 다음 3가지 노드로 나눈다.Name Node(네임 노드)Client Node(클라이언트 노드)Data Node(데이터 노드) 네임 노드는 쉽게 말하면 관리자 노드로, 어떤 데이터가 어디에 저장되어 있는지를 관리한다. 도서관 관리자가 어떤 책이 어느 선반에 있는지 알고 있는 것처럼,..
Data Engineering/Hadoop
2024. 5. 12. 15:44