그럼 이번엔 실제 앞에 내용들을 활용해 기계 학습하는 과정을 알아봅시다. '의사결정 트리의 기계 학습 알고리즘'(1) 주어진 학습 세트가 비어 있으면 학습 종료(2) 주어진 학습 세트의 요소가 모두 단일 카테고리에 속해 있으면 학습 종료(3) 학습 세트를 적절히 분류하는 속성을 선택해 학습 세트를 서브 세트로 분류,각 서브 세트에 대해 학습 과정을 재귀적으로 적용한다.(4) 적용할 수 있는 속성이 없는데 분류가 끝나지 않았다면 학습을완료하지 않은 채 종료 여러 분류 기준 중 앞에서 활용한 p1 ~ p4를 활용해 설명하자면,최초 학습 데이터 세트에 대해서 p1 ~ p4 까지 속성을 모두 테스트 해봅니다.그 후, 이들 중, 학습 세트의 요소가 모두 단일 카테고리에 속해 있을 경우, ( 이때 모두 단일 카테고..
이번 장의 주제는 '감독학습' 입니다.'감독 학습' 은 감독 혹은 지도받은 지식에 기초해 학습하는 방법입니다.'감독 학습' 에서는 어떤 데이터가 올바른지 아닌지 가르쳐주는 '교사'가 있습니다.그런 의미에서 '감독 학습' 은 '교사 학습' 이라고도 불립니다.이와 반대로 개개의 학습 사례와 학습 방법에 대해 지시를 받지 않은 학습을보통 '비교사 학습' 이라고 합니다. 일반적으로 교사학습 비교사학습보다 효율적이고 정밀하게 학습할 수 있습니다.하지만 교사학습은 비교사학습보다 일반화하는 능력이나 데이터에 없는 상황에대해서 대처하는 능력이 뒤쳐질 가능성이 있습니다. 여기서 감독 학습의 알기 쉬운 적용 분야로 '분류 지식 학습' 을 설명합니다.이는 주어진 데이터가 어느 카테고리에 해당하는지 분류하는 지식을 학습하는 ..
이번 장의 주제는 구체적인 사례들을 통해 '법칙'이나 '원리'를 끌어내는 '귀납학습' 입니다. 여기서는 그 구체적인 사례를 텍스트를 받아 그 특징에 관한 지식을 '암기 학습' 을 통해추출하는 '텍스트 마이닝' 방법에 대한 간략한 설명을 하고 있습니다. 보통 웹상의 데이터를 분석 할 때는 앙케트 조사 같은 방법을 사용합니다. 하지만, 이 방법은 시간과 비용의 제약이 상당한 측면이 있습니다. 이와 비교하여, '텍스트 마이닝'을 통해 웹사이트나 블로그에서 텍스트 데이터를 수집해수집한 데이터를 분석하여 결과를 도출하는 편이 더욱 용이합니다. 웹상에 올라오는 사람들이 적은 글은 '자연어' 라고 합니다. 이런 '자연어' 를 컴퓨터가 분석해서 그 의미를 파악하는 과정을 '자연어 처리' 라고 합니다.여기서 그 방법에 ..
- Total
- Today
- Yesterday
- ubuntu
- markdown
- 캡슐화
- ContentResolver
- 올림픽
- player
- Polymorphism
- 평창
- Encapsulation
- Video
- 입장권
- abstraction
- Android
- readme.md
- OOP
- Linux
- Multimedia
- 객체지향
- 동계
- media
- Class
- 우분투
- 리눅스
- 클래스
- Object Oriented Programming
- 파이선
- 추상화
- 마크다운
- 크롤링
- 다형성
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |