일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 데이터 파이프라인
- HADOOP
- dockerfile
- Docker
- airflow.cfg
- 자료구조
- 데이터베이스
- redshift
- airflow
- TCP
- TIL
- 운영체제
- PYTHON
- Django
- sql
- S3
- http
- 파이썬
- Go
- 컴퓨터네트워크
- 데이터 엔지니어링
- 데이터엔지니어링
- 데이터 웨어하우스
- 정리
- AWS
- 종류
- 데브코스
- 컴퓨터 네트워크
- linux
- 가상환경
- Today
- Total
목록Data Engineering (95)
홍카나의 공부방
SQL의 중요성 데이터 관련 3개의 직군(DA, DE, DS) 모두에게 SQL은 중요한 기술이다. DE ( Python, Java/Scala, SQL, DB, ETL/ELT, Airflow, DBT, Spark/Hadoop ) DA ( SQL, Domain Knowledge, Stats ) DS ( ML, SQL, Python, Stats ) 이렇게 주요 기술 스택을 나열해 봤을 때 SQL은 빠지지 않는다. 그런데 데이터가 점점 커지고 있는 상황에서, SQL의 시대는 과연 저물고 있는 것일까. 관계형 데이터베이스 개요 https://hongcana.tistory.com/83 따로 정리했다. [데이터베이스] 릴레이션, 스키마, 관계형 데이터베이스 개요와 SQL 관계형 데이터베이스 개요 구조화된 데이터를 저..
데이터 웨어하우스 여전히 SQL 기반 관계형 데이터베이스의 형태지만, 프로덕션 데이터베이스와 별도로 저장되는 DB다. 회사에 필요한 모든 데이터를 저장하는 DB다. (분석용으로 자주 쓰이는 DB인거지, 분석용 DB요! 라고 답변하면.. 망함) 보통 프로덕션 DB로 만들어놓은 MySQL을 복사하여 AWS Redshfit, BigQuery, Snowflake 등으로 별도 저장한다. 데이터 웨어하우스는 OLAP(Online Analytical Processing) 방법론을 이용하여 분석할 수 있다. 데이터 웨어하우스는 서비스 운영이 아닌 기업 내부의 팀을 위한 데이터 집계/분석/요약용 데이터베이스이므로, 처리속도가 아닌 처리 데이터의 크기가 더 중요해진다. 외부에 존재하는 데이터를 읽어다가 데이터 웨어하우스로..
관계형 데이터베이스 개요 구조화된 데이터를 저장하고 질의할 수 있도록 해주는 저장소다. 엑셀 스프레드시트 형태의 테이블 구조로 데이터를 정의하고 저장한다. 각 행은 테이블에 저장된 특정 데이터 레코드를 나타낸다. 각 열은 특정 유형의 데이터를 저장하는 데 사용된다. 릴레이션 강의에서 언급되지는 않았지만, 릴레이션의 개념을 짚고 넘어갈 필요가 있다. 릴레이션(relation)은 하나의 개체(entity)에 관한 데이터를 2차원 테이블의 구조로 저장한 것이다. 릴레이션은 튜플(행, 데이터 레코드)의 집합으로 구성되며, 각 튜플은 속성(attribute)의 값으로 구성된다. 그리고 하나의 속성이 가질 수 있는 모든 값의 집합을 도메인(domain)이라고 정의한다. 하나의 릴레이션에서 속성의 전체 개수를 차수(..
어린이날 기념 제시간에 올리는 TIL이다. 프로젝트 이번 한 주는 팀 프로젝트를 진행하느라 바빴다. 그래도 기간 안에 프로젝트를 마무리하는 데 성공했다. 모든 작업을 마치고 main branch에 통합시켰다. 팀원분들 모두 고생하셨고 다음 프로젝트는 더 많이 노력해야겠다. 아마 부족했던 부분이 피어리뷰로 전달될 텐데, 그 부분은 보완해야겠다. 개인적으로, 내가 제일 프로젝트에서 재밌어했던 부분은 서비스 기획이었던 것 같다. 기획이 익숙해서 그런가 싶다. 코드 구현보다는 서비스의 요구사항을 정리하고, ERD를 설계하고, IA나 플로우차트를 설계하는 것이 더 흥미롭다. 네트워크 https://hongcana.tistory.com/80 [컴퓨터 네트워크] 16. URL과 URL, HTTP 개요와 응답코드 UR..