Loading [MathJax]/jax/output/CommonHTML/jax.js

본문 바로가기

Machine Learning6

[강화학습] Q 러닝 이해하기 강화학습이란? 강화학습의 목표는 환경(environment)과 상호작용하는 임의의 에이전트(agent)를 학습시키는 것입니다. 에이전트는 환경 속에서 상태(state)를 인식하여 행동(action)하며 학습해 나갑니다. 에이전트가 취한 행동의 응답으로 환경은 양수 혹은 음수 또는 0을 보상(Reward)으로 돌려줍니다. 에이전트의 목표는 초기 상태부터 종료 상태까지 받을 수 있는 보상을 최대화하는 것입니다. 따라서 에이전트가 좋은 행동을 했을 때는 큰 보상을 주어 그 행동을 강화하고 그렇지 않은 행동을 했을 때는 작은 보상 혹은 음의 보상을 줍니다. Q 러닝? Q 러닝은 강화학습 기법 가운데 하나입니다. Q 러닝은 지금은 너무나도 유명한 알파고가 나오기 전부터 존재했던 알고리즘입니다. 여러 가지 한계점으.. 2022. 1. 9.

딥러닝 개발 환경 구축하기 아나콘다(anaconda) 설치 아나콘다 공식 사이트에서 설치파일 다운로드 다운로드한 파일을 실행 후 디폴트 설정대로 Next를 누르고 아래 그림에서 체크 박스 2개를 체크 한 후 Install 설치 완료 후 시작버튼 > Anaconda prompt를 클릭하면 윈도우 cmd 비슷한 화면이 나온다. conda --version을 입력하여 버전이 제대로 출력되면 잘 설치된 것이다. 가상 개발 환경 만들기 새로운 가상환경을 만든다.. 가상 환경 이름은 프레임워크 버전에 맞게 만든다. (tensorflow2_py37, pytorch17_py38, ..)

$conda create -n tensorflow1_py37 python=3.7 가상 환경 확인하기 생성된 가상환경은 다음 명령어로 확인 가능하다.$ con.. 2022. 1. 7.

OpenAI GYM 간단한 사용법 (feat. FrozenLake) * 해당 자료는 김성훈 교수님의 모두를 위한 강화학습을 참고하여 작성하였습니다. OpenAI GYM 강화학습에는 에이전트와 환경이 있습니다. 에이전트는 어떤 행동을 하고 에이전트가 행동을 할 때마다 환경 속에서의 상태는 바뀌게 됩니다. 강화학습을 하려면 에이전트와 환경이 있어야 되는 데 이 때 환경을 만드는 일은 복잡하고 귀찮은 일입니다. OpenAI GYM은 강화학습 환경을 만들어주는 프레임워크입니다. OpenAI GYM으로 강화학습 환경을 만들어 사용하면 환경을 구성하는 데 신경쓸 것 없이 주어진 환경에서 강화학습 알고리즘에 집중할 수 있습니다. GYM은 다음 명령어로 설치할 수 있습니다. pip install gym FrozenLake FrozenLake는 OpenAI GYM에서 제공하는 환경 중 .. 2021. 11. 9.

scikit-learn에서는 왜 fit을 사용하는가 scikit-learn에는 모델을 학습시킬 때 fit 이라는 메소드를 사용합니다. 문득 왜 fit 이라는 단어를 사용하지 궁금해져서 찾아봤습니다. fit이라는 말이 별로 와닿지 않았거든요. 'fit이 좋다 할 때 그 fit인가..' 이런 생각이나 하면서 scikit-learn 공식 홈페이지에 가면 이런 말이 있습니다. "Scikit-learn provides dozens of built-in machine learning algorithms and models, called estimators. Each estimator can be fitted to some data using its fit method." scikit-learn은 estimator라고 하는 머신러닝 알고리즘과 모델을 제공합니다. es.. 2021. 5. 5.

테슬라가 데이터를 다루는 법, 딥러닝을 차별화 하는 데이터 품질 딥러닝을 처음 배울 때는 딥러닝 모델에 집중해서 배웁니다. 이미지 처리에 사용되는 CNN 모델은 어떻게 동작하고 또 RNN 모델은 어떻게 동작한다든지. 간단한 프로젝트를 진행해볼 때도 잘 가공된 데이터가 보통 주어집니다. 이러한 데이터로 프로젝트를 진행하다 보면 데이터의 소중함을 잊게 되곤 합니다. 하지만, 실제 딥러닝을 활용하여 프로젝트를 진행하게 된다면 집중해야할 부분은 데이터가 될 것입니다. 이를 잘 정리한 영상이 있어 공유합니다. www.youtube.com/watch?v=k3zzHLBVJq8&list=LL&index=1 테슬라가 데이터를 다루는 방법 아래는 영상에 관한 간단한 정리이며 영상을 직접 보시는 걸 추천드립니다. Andrew Ng 교수는 많은 딥러닝 구축의 문제들에 대해 코드를 개선하기.. 2021. 4. 28.

딥러닝에서 중요한 것 Intro '딥러닝을 잘한다는 건 무엇을 잘하는 거지?' 친구와 이 주제로 얘기를 한 적이 있었는 데 당시엔 결론 없이 이런 저런 이야기를 주고 받았던 기억이 있습니다. 아래의 영상이 이에 대해 좀 더 생각해 볼 거리를 주는 것 같아 정리를 해두려 합니다. 길지 않은 영상이니 관심 있다면 보시는 걸 추천드립니다. www.youtube.com/watch?v=A1rhMGibVc8&t=1s 딥러닝이 많은 걸 바꿔 놓았다. 딥러닝이 많은 걸 바꿨고 앞으로 더 많은 걸 바꿔 갈 것으로 보인다. 딥러닝을 활용하지 않은 방식보다 딥러닝을 활용한 경우가 결과가 훨씬 좋은 경우가 자주 보이고 또 테슬라의 Full Self Driving과 같은 딥러닝의 결과물도 속속들이 나오고 있다. 딥러닝의 성공적인 프로젝트가 많이 나.. 2021. 2. 1.

이전 1 다음

티스토리툴바