形態素 分析器는 自然語 處理(NLP) 分野에서 活用되는 프로그램의 한 種類로, 텍스트를 品詞에 따라 分析해주는 機能을 遂行한다. 形態素 分析器는 어떤 處理도 되어 있지 않은 原文 그대로의 텍스트나 若干의 前處理만 遂行한 텍스트를 投入 데이터로 받아서, 名詞, 動詞, 形容詞, 副詞, 調査, 語尾 等의 品詞 및 形態素 情報가 붙어 있는 算出 데이터를 낸다. 韓國語에서 形態素 分析器가 지니는 役割과 機能은 英語에서보다 더 重要하다. 英語의 POS(part-of-speech) tagger는 形態素 分析器와 비슷한 機能을 遂行하지만, 그 活用 分野가 理論的인 分野에 조금 더 置重되어 있다. 英語에서는 이미 單語 單位로 띄어쓰기가 되어 있고, 띄어쓰기로 區分된 單語 單位에서는 形態의 變化가 아주 다양하지는 않다. ‘apple-apples’처럼 複數型이 될 때 名詞에 ‘-s’를 붙이거나, ‘play-played-plays’처럼 時祭나 人稱에 따라 動詞에 若干의 變化를 줄 수 있다. 그렇기에 띄어쓰기로...