웹서버 만들기

Python 2015.02.27 23:52

http://www.berrycracker.net/archives/1573

Posted by 공놀이나하여보세

scikit-learn을 이용하여 hmm을 사용해보려 하였으나

이런 저런 삽질 끝에 사용하기 쉽지 않다는 것을 확인했다


'패턴인식 - 오일식 저' 책을 읽다 보니 Cambridge대학에서 만든 HMM Toolkit이 있다는 것을 확인했고 이것을 C용으로 작업한게 있다고 해서 작업을 해 보려고 한다.


hmmpytk 인데 주소는 아래와 같다.

https://code.google.com/p/hmmpytk/wiki/Tutorial




Posted by 공놀이나하여보세

7.4.3 학습

관측 벡터 O의 확률을 최대로 하는 모델 ⓗ를 찾는 문제

O로 ⓗ를 직접 구할 수는 없고 중간에 '숨어서' 매개 역할을 하는 변수가 필요하다. 이러한 변수는 이미 3.4.2절의 EM알고리즘에서 등작하였고 은닉 변수(latent variable)라 불렀다.

가우시안 혼합에서는 샘플이 독립 동일 분포에서 발생했다는 가정 하에 요소 분포들을 독립적으로 취급하는 반면 HMM은 분포들이 시간에 따라 관련성을 갖는다고 간주하고 상태 이전 확률을 개입시키는 근본적인 차이가 있다.

알고리즘에서 기대값을 구하는 단계와 우도를 최대화 하는 (Maximum likelihood) 단계로 구성된다.

좌우 모델은 온라인 필기 인식이나 음성 인식 같은 응용에 주로 사용되는데 이런 응용에서는 T가 작다. 대신 하나의 관측이 주어지는 것이 아니라 여러 개가 주어진다. 따라서 다중 관측을 위한 학습이 가능하도록 알고리즘을 변경해야 한다. 이에 대해서는 [Davis02, Rabiner93, Rabiner89]를 참고

일단 책을 읽고 대충 이해는 했는데 양이 워낙 방대하여 쓰지는 못하겠다.

파이썬으로 코드를 짜봐야겠다.


Posted by 공놀이나하여보세