일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- sql
- 정리
- TCP
- Docker
- 자료구조
- PYTHON
- airflow.cfg
- 데이터엔지니어링
- airflow
- Go
- http
- 데이터 엔지니어링
- 운영체제
- S3
- 데이터베이스
- HADOOP
- 데브코스
- 파이썬
- 데이터 파이프라인
- Django
- 가상환경
- 컴퓨터네트워크
- TIL
- linux
- dockerfile
- 컴퓨터 네트워크
- 종류
- 데이터 웨어하우스
- AWS
- redshift
- Today
- Total
목록데이터 엔지니어링 (24)
홍카나의 공부방

SQL의 중요성 데이터 관련 3개의 직군(DA, DE, DS) 모두에게 SQL은 중요한 기술이다. DE ( Python, Java/Scala, SQL, DB, ETL/ELT, Airflow, DBT, Spark/Hadoop ) DA ( SQL, Domain Knowledge, Stats ) DS ( ML, SQL, Python, Stats ) 이렇게 주요 기술 스택을 나열해 봤을 때 SQL은 빠지지 않는다. 그런데 데이터가 점점 커지고 있는 상황에서, SQL의 시대는 과연 저물고 있는 것일까. 관계형 데이터베이스 개요 https://hongcana.tistory.com/83 따로 정리했다. [데이터베이스] 릴레이션, 스키마, 관계형 데이터베이스 개요와 SQL 관계형 데이터베이스 개요 구조화된 데이터를 저..
데이터 웨어하우스 여전히 SQL 기반 관계형 데이터베이스의 형태지만, 프로덕션 데이터베이스와 별도로 저장되는 DB다. 회사에 필요한 모든 데이터를 저장하는 DB다. (분석용으로 자주 쓰이는 DB인거지, 분석용 DB요! 라고 답변하면.. 망함) 보통 프로덕션 DB로 만들어놓은 MySQL을 복사하여 AWS Redshfit, BigQuery, Snowflake 등으로 별도 저장한다. 데이터 웨어하우스는 OLAP(Online Analytical Processing) 방법론을 이용하여 분석할 수 있다. 데이터 웨어하우스는 서비스 운영이 아닌 기업 내부의 팀을 위한 데이터 집계/분석/요약용 데이터베이스이므로, 처리속도가 아닌 처리 데이터의 크기가 더 중요해진다. 외부에 존재하는 데이터를 읽어다가 데이터 웨어하우스로..
어린이날 기념 제시간에 올리는 TIL이다. 프로젝트 이번 한 주는 팀 프로젝트를 진행하느라 바빴다. 그래도 기간 안에 프로젝트를 마무리하는 데 성공했다. 모든 작업을 마치고 main branch에 통합시켰다. 팀원분들 모두 고생하셨고 다음 프로젝트는 더 많이 노력해야겠다. 아마 부족했던 부분이 피어리뷰로 전달될 텐데, 그 부분은 보완해야겠다. 개인적으로, 내가 제일 프로젝트에서 재밌어했던 부분은 서비스 기획이었던 것 같다. 기획이 익숙해서 그런가 싶다. 코드 구현보다는 서비스의 요구사항을 정리하고, ERD를 설계하고, IA나 플로우차트를 설계하는 것이 더 흥미롭다. 네트워크 https://hongcana.tistory.com/80 [컴퓨터 네트워크] 16. URL과 URL, HTTP 개요와 응답코드 UR..

User Django의 Settings.py에 있는 django.contrib.admin과 django.contrib.auth 덕분에 기본적인 운영자 생성,인증 과정이 가능했다. shell에서 이를 더 자세히 살펴볼 수 있다. 위와 같은 'User'를 사용자가 임의로 만든 app에서도 사용할 수 있도록 model에 추가할 수 있다. 다음은 특정 app의 models.py 코드 예시다. from django.db import models from time import timezone from datetime import timedelta # Create your models here. class Question(models.Model): question_text = models.CharField(max_l..