'분류 전체보기' 카테고리의 글 목록 (45 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/08 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

목록분류 전체보기 (183)

홍카나의 공부방

[컴퓨터 네트워크] 0. 컴퓨터 네트워크 개요, 무엇을 배우나?

컴퓨터 네트워크의 학습 목표는 TCP/IP를 중심으로 Network, Transport, 그리고 Application Layer Protocol에 대한 이해력을 제고하는 것이다. Divide & Conquer와 TCP/IP 5계층 컴퓨터에서 대부분의 문제 해결은 분할 & 정복으로 이뤄진다. 통신 시스템에서의 분할 & 정복은 계층적 구조로 진행된다. 국제 표준기구인 ISO에서는 OSI 7 Model을 도입하였으나, 이번에는 실질적인 통신에 많이 사용되는 TCP/IP 5계층을 중심으로 살펴보겠다. (기회가 되면 Layer 1,2에 해당하는 내용을 커버하는 Data Communication도 공부하겠다.) Physical Network 물리 계층과 데이터 링크 계층은 물리적 연결(물리 네트워크 만들기)을 위한..

Computer Network 2022. 12. 20. 18:13

hey chatGPT, 강화학습을 배우려면 어떻게 해야해?

If you are a beginner interested in reinforcement learning, here are a few steps you can take to get started: Start by learning the basics of machine learning and artificial intelligence. You can do this by reading introductory texts or taking online courses to learn about the fundamental concepts and algorithms used in reinforcement learning. Practice implementing simple reinforcement learning ..

AI/Reinforcement Learning 2022. 12. 6. 14:47

[강화학습] 4강 - Model-Free Prediction

모델을 모를 때 Prediction 문제를 푸는 방법을 알아본다. 더보기 Model은 강화 학습에서 환경의 모델(model of enviornment)의 줄임말로, 에이전트의 액션에 대해 환경이 어떻게 응답할지 예측하기 위해 사용하는 모든 것을 가리킴. 에이전트의 액션에 대하여 환경이 어떻게 반응할지 알 수 있다면, 에이전트 입장에서는 여러가지 Planning을 세워볼 수 있기에 모델을 아는 것이 큰 도움이 된다. Prediction은 Policy가 정해져있는 상태에서 Value Fuction을 찾는 문제, Control은 Optimal Policy 그리고 Optimal Value Fuction을 찾는 문제다. ( 컨트롤은 정책이 정해져있지 않다. ) Monte-Carlo Reinforcement Lea..

AI/Reinforcement Learning 2022. 12. 4. 18:15

[강화학습] 3강 학습 노트 - Planning by DP

Planning -> MDP가 어떻게 동작하는지 알 때 최적의 policy를 찾는 문제! What is Dynamic Programming? - 큰 문제를 작은 문제로 나눠서 해결하는 방법 - 작은 문제에 대한 솔루션을 찾고, 큰 문제를 해결하는 방법론 ( 학부에서 알고리즘 수업을 들었으면, 바로 알만한 방법 ) - Optimal Substructure가 필요하다. - subproblem들이 Overlapping 해야 한다. ( soultion들을 분할-정복 방법처럼 reuse할 수 있어야 한다. ) Prediction vs. control: - Prediction은 MDP 와 정책Pi를 input으로 준다. - 그래서 가치 함수 V_pi를 찾는 것이다. - control은 MDP 를 input으로 줬을..

AI/Reinforcement Learning 2022. 12. 4. 16:49

이전 Prev 1 ··· 42 43 44 45 46 Next 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

홍카나의 공부방

목록분류 전체보기 (183)

홍카나의 공부방

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역