한글 형태소 분석2009. 2. 26. 12:55

형태소 분석을 하면서, 가장 먼저 만들어야 할 클래스는 자소를 분리 하는 클래스를 만드는 것 입니다.

 

예전에 형태소 분석기를 만들면서, 만들어둔 클래스 입니다. VB.NET 코드로 되어 있어서 약간 보기 힘들 수 있으나

어떤 구조로 되어 있는지와 한글의 charcode의 범위가 어디부터 어디 까지인지 확인하는데 좋은 자료가 될것 같아 포스팅 합니다.

Posted by dotnetpower

댓글을 달아 주세요

  1. 윤지송

    음 전 키보드 만든다고 혼자 쑈할땐..

    배열에 모두 가져다 놓고 꺼내왔던기억이...

    음.. VB를 몰라서 어떤건지 감은 안오지만... 주석들만 보면 왠지...

    만들어보고 싶어지네요 ^^;;;

    2009.02.26 13:52 [ ADDR : EDIT/ DEL : REPLY ]
  2. 다시한번 해 보시죠? :)

    2009.02.26 18:54 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 현재 기술로는 UTF-8 문자열인 경우 byte code값 분석으로 가능하지 않나요?
    조사 붙이는 모듈 (은,는,이,가) 붙일때 그런식으로 처리했지 싶습니다(물론 조사 붙일때는 받침이 있나 없나 정도만 검사하면 되지만요)

    2014.01.27 17:32 [ ADDR : EDIT/ DEL : REPLY ]
  4. 아참 올려주신 자료는 잘 보고 있습니다. 근데 기초가 없어서 어렵네요 OTL

    2014.01.27 17:33 [ ADDR : EDIT/ DEL : REPLY ]