Twitter Botの改善を目指して機械学習勉強中

http://gihyo.jp/dev/serial/01/machine-learning/0003 を参考に勉強中です。
元記事のコード例はPythonですが、ためしにGroovyで実装してみました。

ほとんどがMapの処理なので、GroovyでもPythonとほぼ同じくらいのコード量で実装できますね。
目標は、http://twitter.com/hatena_groovy に混入してくるノイズの除去です。(PCの周辺機器の情報とかね。。。)