일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 데이터엔지니어링
- dockerfile
- sql
- TIL
- AWS
- 데이터베이스
- 정리
- 가상환경
- PYTHON
- 자료구조
- S3
- Docker
- airflow.cfg
- 데이터 웨어하우스
- 종류
- 컴퓨터 네트워크
- 운영체제
- 파이썬
- HADOOP
- Go
- Django
- 컴퓨터네트워크
- redshift
- TCP
- airflow
- linux
- 데브코스
- http
- 데이터 파이프라인
- 데이터 엔지니어링
- Today
- Total
목록PYTHON (12)
홍카나의 공부방
동기와 비동기코드가 순차적으로 진행되는 방식을 동기적 처리라고 하고, 그렇지 않은 방식을 비동기적 처리라고 한다. 루틴(routine)루틴은 일련의 명령, 코드의 흐름을 의미한다. 즉, 메인 루틴은 프로그램의 주요 실행 흐름을 담당하는 코드 부분을 의미한다. (보통 프로그램이 실행될 때 가장 먼저 시작되는 루틴이다.) 서브 루틴은 메인 루틴이 아닌 루틴을 의미한다. 일반적으로 메인이 아닌 함수나 메소드를 생각하면 된다. 서브루틴은 특정 작업을 수행하기 위해 호출되며, 하나의 진입점과 탈출점을 가지고 있다. 코루틴(Coroutine)다양한 진입점과 다양한 탈출점이 있는 루틴을 의미한다. 중간에 실행을 멈추고 다른 작업을 수행한 후, 다시 원래 상태로 돌아와서 실행을 이어갈 수 있는 루틴이다. 비동기 프..
DuckDB? DuckDB는 C++로 작성된 오픈소스 컬럼 기반(columnar) 데이터베이스 관리 시스템으로, 인메모리(in-memory)와 OLAP(온라인 분석 쿼리)에 최적화 되어있다는 특징을 보유하고 있다. 표준 SQL을 지원하므로 데이터에 대해 쿼리, 집계, 조인 등의 연산을 수행할 수 있다. SQLite처럼 파일 기반 데이터베이스로, 어플리케이션 내에서 임베디드 되어 실행된다. 별도의 서버 설치가 필요하지 않아 가볍다는 특징이 있다. Python에서의 DuckDB API 사용법DuckDB의 장점은 API를 이용하여 여러 프로그래밍 언어에서 손쉽게 사용할 수 있다는 점이다. 이 글에서는 Python을 통한 DuckDB 사용법을 간단하게 알아보자. 먼저 DuckDB를 사용하여 SQL 쿼리를 실행..
로컬 컴퓨터의 파이썬 가상환경에서 DAG를 개발하기 위해 필요한 라이브러리를 설치하고자 한다. (단, Airflow는 Docker에 설치했다고 가정한다.) Airflow에서는 Python 라이브러리 설치에 대한 가이드를 제공하고 있다. 아래 링크를 참고하자. https://airflow.apache.org/docs/apache-airflow/stable/installation/installing-from-pypi.html Installation from PyPI — Airflow Documentation airflow.apache.org 참고로 단순하게 pip install로 Airflow를 설치하면 저사양의 아키텍처로 설치되어 여러 한계점이 존재한다. 그래서 Airflow는 Docker에 설치했다고 가..