티스토리 뷰
<아래 글은 '만들면서 배우는 기계학습' 을 읽고 쓰는 글입니다.>
4. 강화학습(1990년대 ~)
강화학습은 심리학에서 20세기 초에 시작된 생물의 학습에 관한 연구가 응용된 방법입니다.
유전자 알고리즘이 생물집단의 진화를 모델로 만든 학습 방법이라면,
강화학습은 생물 개체가 환경과 상호작용하면서 지식을 획득하는 과정을 모델로 합니다.
생물의 행동이 환경에 적합하면 생물은 환경에서 보상을 얻습니다.
생물은 보상에 따라 자신의 내부상태를 변경하여 더욱 환경에 적합하도록 변화합니다.
강화학습은 매번 환경에서 주어지는 보상에 따라 학습을 진행합니다.
하지만 최종적으로 보상 합계가 최대가 되는 것을 지향합니다.
이 덕분에 강화학습은 관측시 진동이나 잡음이 있어도 학습을 진행할 수 있습니다.
5. 데이터 마이닝(1990년대 말~)
데이터 마이닝은 네트워크에 축척된 대용량 데이터에서 경향과 규칙을 자동으로 찾아냅니다.
데이터 마이닝은 인터넷 발전과 맞물려 기계 학습의 구체적인 적용 사례로 발전했습니다.
예를 들어 편의점의 POS 시스템에는 어떤 고객이 어떤 물건을 샀는지 실시간으로 쌓입니다.
이런 데이터는 그 양이 방대해 그곳에서 의미를 찾기 쉽지 않습니다.
하지만 데이터 마이닝 기법을 이용하면 매출의 일정한 규칙성을 읽을 수 있습니다.
6. 신경망(1940년대~)
신경망은 생물의 신경조직 움직임을 모델로 하여 정보를 처리하는 구조입니다.
생물의 신경조직은 신경세포가 서로 접속해서 구성됩니다.
다른 신경세포에서 받아들인 정보를 처리해서 다른 신경세포로 전달합니다.
하지만 이 접속 관계는 한결같지 않아서 접속 후의 값이 신경세포에 따할 달라집니다.
이런 신경세포 네트워크가 전체적인 생물의 다양한 정보처리를 실현합니다.
신경망 연구 역사는 1940년에 그 기초가 만들어졌습니다.
1960년대 로진블라트에의 '다층 신경망' 즉, '퍼셉트론' 이 제안되었습니다.
이는 3개의 층으로 나뉘어져 자극층(입력층), 연상층(중간층), 응답층(출력층)이 있습니다.
자극층과 연상층의 '연결강도' 와 정보를 전달하는 정도를 결정하는 '임계치' 가 정해집니다.
퍼셉트론은 1968년 민스키와 패퍼트에 의해 그 한계가 드러났습니다.
하지만 학습방법에 따라 더 높은 능력을 지닐 수도 있다는 연구도 같은 시기에 밝혀집니다.
'기계학습' 카테고리의 다른 글
감독학습 1 (0) | 2014.09.24 |
---|---|
귀납학습 (0) | 2014.09.24 |
파라미터 조정의 의한 학습 (0) | 2014.09.24 |
기계학습의 역사 1 (0) | 2014.09.19 |
기계학습이란? (0) | 2014.09.18 |
- Total
- Today
- Yesterday
- 추상화
- Linux
- Android
- Object Oriented Programming
- Encapsulation
- 크롤링
- markdown
- 마크다운
- ContentResolver
- 평창
- 올림픽
- 파이선
- 동계
- media
- 입장권
- 리눅스
- Video
- player
- abstraction
- 캡슐화
- 클래스
- Class
- Polymorphism
- OOP
- 다형성
- ubuntu
- Multimedia
- 우분투
- readme.md
- 객체지향
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |