최근 연구를 하면서 일본어 형태소 분석기 MeCab을 사용하고 있습니다.
MeCab을 기반으로 한 한국어 형태소 분석기 온전한닢은 국내에 자료가 엄청 많지만,
모토가 되는 일본어 형태소 분석기는 그렇게 많지가 않았습니다. 아예 없다고 말해도 무방할 정도였습니다.
그렇게 검색엔진 설정을 일본으로 두고 정말 많은 자료를 찾아봤습니다.
어제는 특히 MeCab 유저 사전 추가하는 방법을 위해 한 6시간 가까이 자료를 찾아보고 시도해봤지만 결국 실패했고,
오늘 드디어 CSV 형식이라던지 명령어를 파악해서 유저 사전을 추가하는데 성공하였습니다.
국내에는 일본어를 중점으로 한 형태소 분석의 연구 사례가 극히 드물다는 점을 느꼈습니다.
그나마 진전이 있다는 게 워드클라우드를 통한 JLPT 단어 출현 및 연관성 분석 면에서 일본어도 형태소 분석기가 사용이 되는구나 느꼈지만
턱없이 부족하다는 게 제 생각입니다.
오히려 저에겐 좋게 작용할 수 있는 걸까요?
누군가가 개척하지 않은 길을 나아가는 것은 무척이나 힘들지만
고통이 수반되는 만큼 돌아오는 가치도 무척이나 소중할 것이라 생각합니다.
어느정도 논문이 정리되고나면 꼭 블로그에 일본어 형태소 분석기에 대한 정리를 올려두도록 하겠습니다.
'일상' 카테고리의 다른 글
논문 작업도 끝이 보인다! (0) | 2023.08.15 |
---|---|
[내돈내산] KeyChron K3 레트로 적축 후기 (0) | 2023.07.03 |
수고했다 나 자신! (0) | 2023.06.29 |
3년 만의 일본여행은 친구들이 있어 행복했다 (하) (0) | 2023.06.10 |
3년 만의 일본여행은 친구들이 있어 행복했다. (상) (0) | 2023.06.04 |