こんばんわ!Keisukeです!
今日は, Pythonの形態素解析ツールJanomeについてです!
形態素分析は, 文章の解析ツールです。
ここからインストールできるようです!
pipを使える方は
pip instrall janome
でインストール可能です!
英語 https://mocobeta.github.io/janome/en/
日本語 http://mocobeta.github.io/janome/
上記のページに記述してある例では..
>>> from janome.tokenizer import Tokenizer
>>> t = Tokenizer()
>>> for token in t.tokenize(u’すもももももももものうち’):
… print(token)
…
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
すもももももももものうちって何か意味があるのかと思ったら早口言葉の一種なんですね!
スモモ
も
桃
も
桃
の
うち
ちゃんと最小単位に分割されていますね!
ぜひポジティブワードとネガティブワードを取り組みたいですね!
既にあるのかな??
本格的にライブラリが見つかちゃうと元カノとのLINEの履歴をかけれてしまうんだよな…
umm..(笑)
[今日の達成]
・Janomeを知った!
[今日の未消化]
・ネガティブワード作成
・ポジティブワード作成