일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- TCP
- 데이터베이스
- 데이터 파이프라인
- 종류
- dockerfile
- Go
- AWS
- TIL
- 컴퓨터 네트워크
- 데이터 웨어하우스
- 자료구조
- 가상환경
- airflow
- 운영체제
- airflow.cfg
- Docker
- 데이터엔지니어링
- redshift
- linux
- 데이터 엔지니어링
- S3
- 데브코스
- PYTHON
- 파이썬
- sql
- HADOOP
- http
- 정리
- Django
- 컴퓨터네트워크
- Today
- Total
목록분류 전체보기 (183)
홍카나의 공부방

컴퓨터 네트워크의 학습 목표는 TCP/IP를 중심으로 Network, Transport, 그리고 Application Layer Protocol에 대한 이해력을 제고하는 것이다. Divide & Conquer와 TCP/IP 5계층 컴퓨터에서 대부분의 문제 해결은 분할 & 정복으로 이뤄진다. 통신 시스템에서의 분할 & 정복은 계층적 구조로 진행된다. 국제 표준기구인 ISO에서는 OSI 7 Model을 도입하였으나, 이번에는 실질적인 통신에 많이 사용되는 TCP/IP 5계층을 중심으로 살펴보겠다. (기회가 되면 Layer 1,2에 해당하는 내용을 커버하는 Data Communication도 공부하겠다.) Physical Network 물리 계층과 데이터 링크 계층은 물리적 연결(물리 네트워크 만들기)을 위한..

If you are a beginner interested in reinforcement learning, here are a few steps you can take to get started: Start by learning the basics of machine learning and artificial intelligence. You can do this by reading introductory texts or taking online courses to learn about the fundamental concepts and algorithms used in reinforcement learning. Practice implementing simple reinforcement learning ..

모델을 모를 때 Prediction 문제를 푸는 방법을 알아본다. 더보기 Model은 강화 학습에서 환경의 모델(model of enviornment)의 줄임말로, 에이전트의 액션에 대해 환경이 어떻게 응답할지 예측하기 위해 사용하는 모든 것을 가리킴. 에이전트의 액션에 대하여 환경이 어떻게 반응할지 알 수 있다면, 에이전트 입장에서는 여러가지 Planning을 세워볼 수 있기에 모델을 아는 것이 큰 도움이 된다. Prediction은 Policy가 정해져있는 상태에서 Value Fuction을 찾는 문제, Control은 Optimal Policy 그리고 Optimal Value Fuction을 찾는 문제다. ( 컨트롤은 정책이 정해져있지 않다. ) Monte-Carlo Reinforcement Lea..

Planning -> MDP가 어떻게 동작하는지 알 때 최적의 policy를 찾는 문제! What is Dynamic Programming? - 큰 문제를 작은 문제로 나눠서 해결하는 방법 - 작은 문제에 대한 솔루션을 찾고, 큰 문제를 해결하는 방법론 ( 학부에서 알고리즘 수업을 들었으면, 바로 알만한 방법 ) - Optimal Substructure가 필요하다. - subproblem들이 Overlapping 해야 한다. ( soultion들을 분할-정복 방법처럼 reuse할 수 있어야 한다. ) Prediction vs. control: - Prediction은 MDP 와 정책Pi를 input으로 준다. - 그래서 가치 함수 V_pi를 찾는 것이다. - control은 MDP 를 input으로 줬을..