홈
태그
방명록

분류 전체보기 (29)

ABOUT ME

-

트위터
인스타그램

Today: -

Yesterday: -

Total: -

白手의 블로그 白手의 블로그

컨텐츠 검색

Machine Learning/기타 참고 및 저장용

Visual Studio Code 자동 완성 Enter키로 선택 안 되게 하기
Machine Learning/기타 참고 및 저장용 2022. 7. 5. 15:12

1. settings.json 파일 수정 %AppData%\Roaming\Code\User\settings.json 또는 %AppData%\Code\User\settings.json 에 있으며 이걸 열던지 또는 Visual Studio Code에서 Ctrl Shit P 를 눌러서 "settings.json"을 검색하면 표시된다. 이걸 선택하면 된다 json에 "editor.acceptSuggestionOnEnter": "off" 를 추가하면 된다2. Settings 탭에서 수정하기 Visual Studio Code에서 Ctrl ,(쉼표)를 누르면 Settings 탭이 표시되고 여기에 "acceptSuggestionOnEnter"를 검색하면 Accept Suggestion On Enter 항목이 표시되고 ..

그냥 DQN 한글 번역 (2)
Machine Learning/기타 참고 및 저장용 2021. 8. 10. 17:31

2. Background agent가 actions, observations and rewards의 연속에서 환경 $\epsilon$(이 경우엔 Atari emulator) 와 상호작용하는 tasks를 고려했다. 각 time step에서 agent가 허용되는 행동들 $A=\{1,...K\}$ 중에서 행동 $a_t$을 선택한다. 그 행동은 emulator에 전달되고 emulator 내부 상태와 게임 점수를 바꾼다. 일반적으로 $\epsilon$는 확률적이다. emulator의 내부 상태는 agent에게 관측되지 않는다. 대신 agent는 emulator로부터 이미지 $x_t \in \mathbb{R}^d$를 관측한다. 이것은 현재 화면을 표현하는 raw pixel 값의 vector이다. 추가적으로 agen..

그냥 DQN 한글 번역 (1)
Machine Learning/기타 참고 및 저장용 2021. 8. 9. 16:13

우리는 강화학습을 사용하여 고차원의 감각 입력으로 정책을 제어하는 딥러닝 모델을 제시한다. 그 모델은 입력을 원본 픽셀로 하고 출력은 미래 보상을 추정하는 가치 함수로 하는 변형된 Q-learing이 학습된 CNN이다. 아키텍처나 학습 알고리즘 조정 없이, 우리의 방법을 Arcade Learning Environment에서 Atari 2600의 7개 게임에 적용했다. 게임들 중 6개에서는 모든 이전의 방식(접근)보다 더 뛰어났고, 그 중 3개의 게임에서는 사람의 숙련도를 능가했다. 1. Introduction vision과 speech와 같은 고차원의 감각 입력으로 agent를 직접적으로 통제하는 학습은 강화학습의 오래된 도전 과제들 중 하나였다. 이 분야에서 운용되는 대부분의 강확학습 결과물들(appl..

이전

1

다음

인기포스트

ABOUT ME

LINK

ADMIN

admin 글쓰기

Designed by Tistory.

티스토리툴바