Machine Learning/기타 참고 및 저장용
-
Visual Studio Code 자동 완성 Enter키로 선택 안 되게 하기Machine Learning/기타 참고 및 저장용 2022. 7. 5. 15:12
1. settings.json 파일 수정 %AppData%\Roaming\Code\User\settings.json 또는 %AppData%\Code\User\settings.json 에 있으며 이걸 열던지 또는 Visual Studio Code에서 Ctrl Shit P 를 눌러서 "settings.json"을 검색하면 표시된다. 이걸 선택하면 된다 json에 "editor.acceptSuggestionOnEnter": "off" 를 추가하면 된다2. Settings 탭에서 수정하기 Visual Studio Code에서 Ctrl ,(쉼표)를 누르면 Settings 탭이 표시되고 여기에 "acceptSuggestionOnEnter"를 검색하면 Accept Suggestion On Enter 항목이 표시되고 ..
-
그냥 DQN 한글 번역 (2)Machine Learning/기타 참고 및 저장용 2021. 8. 10. 17:31
2. Background agent가 actions, observations and rewards의 연속에서 환경 $\epsilon$(이 경우엔 Atari emulator) 와 상호작용하는 tasks를 고려했다. 각 time step에서 agent가 허용되는 행동들 $A=\{1,...K\}$ 중에서 행동 $a_t$을 선택한다. 그 행동은 emulator에 전달되고 emulator 내부 상태와 게임 점수를 바꾼다. 일반적으로 $\epsilon$는 확률적이다. emulator의 내부 상태는 agent에게 관측되지 않는다. 대신 agent는 emulator로부터 이미지 $x_t \in \mathbb{R}^d$를 관측한다. 이것은 현재 화면을 표현하는 raw pixel 값의 vector이다. 추가적으로 agen..
-
그냥 DQN 한글 번역 (1)Machine Learning/기타 참고 및 저장용 2021. 8. 9. 16:13
우리는 강화학습을 사용하여 고차원의 감각 입력으로 정책을 제어하는 딥러닝 모델을 제시한다. 그 모델은 입력을 원본 픽셀로 하고 출력은 미래 보상을 추정하는 가치 함수로 하는 변형된 Q-learing이 학습된 CNN이다. 아키텍처나 학습 알고리즘 조정 없이, 우리의 방법을 Arcade Learning Environment에서 Atari 2600의 7개 게임에 적용했다. 게임들 중 6개에서는 모든 이전의 방식(접근)보다 더 뛰어났고, 그 중 3개의 게임에서는 사람의 숙련도를 능가했다. 1. Introduction vision과 speech와 같은 고차원의 감각 입력으로 agent를 직접적으로 통제하는 학습은 강화학습의 오래된 도전 과제들 중 하나였다. 이 분야에서 운용되는 대부분의 강확학습 결과물들(appl..