Python/Library
2023. 8. 27.
[MeCab] 일본어 형태소 분석기 유저사전 설정(Unidic)
형태소 분석기를 조금이라도 다뤄보신 분들은 한 번쯤 이런 생각을 해 보실겁니다. '내가 원하는 고유어를 하나의 형태소로 인식하게끔 만들 수는 없을까?' 이번 포스팅에서는 MeCab 일본어 형태소 분석기, 사전으로는 Unidic을 사용하는 경우 유저가 원하는 단어를 인식하게끔 만들어주는 유저사전을 구현하는 방법을 알아보도록 하겠습니다. 제가 재학하고 있는 부경대학교를 예로 테스트해보겠습니다. 결과물을 보시면 부경대학(釜慶大学)의 형태소 분석이 엄청 이상하게 된 것을 볼 수 있습니다. 그럼 위 형태소 분석이 원활하게 되기 위해서 우리는 부경대학(釜慶大学)을 유저사전에 추가한 뒤, 컴파일까지 마치고, 초기화 과정에서 유저사전 지정하는 방법까지 알아보도록 하겠습니다. 1. CSV 파일 생성 먼저 유저사전을 만들..