Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- Docker
- 컴퓨터 네트워크
- 데이터엔지니어링
- PYTHON
- 데이터 파이프라인
- Django
- redshift
- airflow.cfg
- 데이터베이스
- 종류
- 데이터 엔지니어링
- 정리
- http
- 데이터 웨어하우스
- S3
- linux
- TIL
- airflow
- 운영체제
- 자료구조
- TCP
- 컴퓨터네트워크
- sql
- 파이썬
- dockerfile
- 가상환경
- 데브코스
- HADOOP
- AWS
- Go
Archives
- Today
- Total
목록AI/Reinforcement Learning (5)
홍카나의 공부방
[강화학습] 기초 이론 1강 학습노트
강화학습은 지도학습, 비지도학습과 달리 인공지능에서 따로 한 분야를 차지하는 기술이다. 강화학습의 특징 - 지도학습과 달리 Supervisor가 없다. 오로지 Agent가 reward(보상)라는 시그널을 줄 뿐이다. - 피드백(곧, reward)이 즉시 발생하지 않을 수 있다. - 강화학습은 sequential data로, 시간이 중요하다. ( Time really matters ) - Agent의 action이 data에 영향을 미친다. Rewards(보상) - 스칼라 피드백 시그널이다. (즉, 숫자 하나다. R_t ) - agent의 목적은 cumulative reward를 최대화하는 것이다. ( maximise cumulative reward ) - 보상을 스칼라 하나로 치환하기 쉬운 문제일수록 강..
AI/Reinforcement Learning
2022. 11. 26. 13:57