Processing有Javascript版本了!虽然这已经是个很老很老的新闻,但今天突然看到有款WordPress插件,可以直接在Wordpress里写Processing程序,于是果断装上试试。下面是一段示例(Processing的JS库比较大,需要等它下载完毕,所以可能得过一段时间才出现):
月度存档: 三月 2011
东风何处是人间
作者: yixuan
日期: 2011年03月2日
61 条评论
再次神经短路,突然想看看宋词里面什么样的意象是最常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。比如“犹解嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。
当然里面会有很多无意义的字的组合,不过这类“词语”本身的出现就是一个偶然,所以可以预期的是它们整体的频数会很低,是入不了“大雅之堂”的。话不多说,直接上代码和结果。
