maruiblogに登場する単語

形態素解析システム茶筌データマイニング用コマンド群Musashiを使ってmaruiblog内に出てくる名詞の出現回数を調べてみました。参考記事はYet Another 仕事のツール 第46回 茶筌とMUSASHIで純和風テキストマイニング

アルファベットはうまく単語として認識されなかったので省いてあります。これを見ると、もちろん投稿者名の「時間+蠅」が大量に出てきますが、接続詞の「の」を名詞だと勘違いしているところもあります。あとは投稿日を表す「年/月/日」も大量に出ています。

自分が書いた文章の中には「人」「僕/自分」「日本」「円」「研究」「仕事」「音」「開発」「必要」「家」「メール」などがたくさん入っています。だから何だというわけじゃないんですが、自分の考え方の一端が見えてくるような気がして、ちょっと気味悪いですね。

単語品詞出現回数順位
名詞13031
時間名詞7812
名詞6703
こと名詞6584
名詞6405
よう名詞3956
名詞3387
もの名詞2998
名詞2229
自分名詞21110
そう名詞20511
それ名詞17512
名詞15513
とき名詞14114
名詞14015
名詞12216
名詞12017
ところ名詞11418
これ名詞11219
名詞11220
日本名詞10821
名詞9222
名詞9023
名詞8924
名詞8025
研究名詞7726
ため名詞7627
名詞7128
名詞6929
名詞6830
仕事名詞6731
名詞6732
名詞6633
名詞6634
名詞6635
開発名詞6536
名詞6537
わけ名詞6438
名詞6339
名詞6040
必要名詞6041
名詞5942
たち名詞5843
メール名詞5744
个ア名詞5445
みたい名詞5446
名詞5347
名詞5348
日記名詞5349
名詞5250