'Machine Learning/[Book]Build Machine Learning System with Python' 카테고리의 글 목록

'Machine Learning/[Book]Build Machine Learning System with Python'에 해당되는 글 2건

2015.05.09 3. 군집화: 관련된 게시물 찾기
2015.04.18 2. 실제 예제를 이용한 분류법 학습

3. 군집화: 관련된 게시물 찾기

Machine Learning/[Book]Build Machine Learning System with Python 2015. 5. 9. 11:00

1. 군집화 : 유사한 아이템을 같은 군집에 넣고 유사하지 않은 아이템을 다른 군집에 넣음

- 문제 : 텍스트를 유사도를 계산할 수 있는 대체물로 변형해야 한다는 점

- scikit-learn : 군집화를 지원하는 라이브러리

2. 게시물의 관련도 측정

(1) 하지 말아야 하는 방법 : levenshitein distance

(2) 어떻게 해야 하는가

- 단어 주머니(bag-of-words) : 게시물의 모든 단어에 대해, 각 단어의 출현을 세어 벡터(vector)로 나타낸다.

scikit-learn라이브러리를 사용하여 군집화 예제 설명

3. K-means clustering 방법

   >>> num_clusters = 50
   >>> from sklearn.cluster import KMeans
   >>> km = KMeans(n_clusters=num_clusters, init='random', n_init=1,
   verbose=1)
   >>> km.fit(vectorized)

'Machine Learning > [Book]Build Machine Learning System with Python' 카테고리의 다른 글

2. 실제 예제를 이용한 분류법 학습 (0)	2015.04.18

Posted by 공놀이나하여보세

2. 실제 예제를 이용한 분류법 학습

Machine Learning/[Book]Build Machine Learning System with Python 2015. 4. 18. 11:28

2장은 분류법에 대한 소개 정도를 하는 챕터이다.

(1) 홀드 아웃 : 하나는 모델을 훈련시키고 다른 하나는 테스트에 사용

(2) 교차 검증(cross-validation) :

- 단일 잔류 : 극단적인 교차 검증의 형태로 하나의 예를 제외한 모든 데이터로 모델을 학습하고, 이 모델이 남은 하나의 예를 잘 분류하는지 보는 것. 100배 더 가중된 일을 해야함

- x중첩(x - fold) 교차 검증 : x는 작은 숫자로 예를 들면 5 정도이다. 5개의 중첩 교차 검증을 수행하고자 전체 데이터를 다섯 그룹으로 나눈다. 즉 전체 데이터의 20% 정도를 남겨둔다.

(3) 최근접 이웃 분류

- 먼저 데이터 셋을 나누어 두고 새로운 데이터가 들어오면 이 데이터와 가장 가까운 데이터셋 몇개를 찾아 대충 어느 범주에 들어 있는지 찾는다..

- k최근접 이웃 분류 : 가장 가까운 하나의 점이 아닌 k개 만큼 가까운 점들을 고려함. 일반적으로 k는 작지만 데이터셋이 매우 크다면 큰 숫자로 할 수도 있다.

'Machine Learning > [Book]Build Machine Learning System with Python' 카테고리의 다른 글

3. 군집화: 관련된 게시물 찾기 (0)	2015.05.09

Posted by 공놀이나하여보세

이전 1 다음

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

空놀이

'Machine Learning/[Book]Build Machine Learning System with Python'에 해당되는 글 2건

3. 군집화: 관련된 게시물 찾기

'Machine Learning > [Book]Build Machine Learning System with Python' 카테고리의 다른 글

2. 실제 예제를 이용한 분류법 학습

'Machine Learning > [Book]Build Machine Learning System with Python' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바