用R读取Excel的新方法

还在纠结用如何用R读取Excel的同学有福了。昨天逛CRAN的时候发现了一个xlsx包,它给出的介绍是可以读取、写入Excel 2007/2003文件并支持格式的设置。简单地来说,将Excel读取为数据框,以及将数据框写入为Excel文件都不是问题,而更加强大的是它能处理Excel中的格式,比如合并单元格,设置列的宽度,设置字体和颜色等等。

如果只需要基本的读取/写入操作,那么其中的read.xlsx()和write.xlsx()应该就能满足大部分的需求了,其用法也很简单,看看帮助文档就了解了。此外,还有两个相应的函数read.xlsx2()和write.xlsx2(),按作者的话说,这两个函数使用了不同的实现方式,效率上会更高一些。

阅读全文——共1724字

手写识别,50行R代码

标题当然是唬人的,不过代码真的是50行正好(不算注释和空行啊),可以玩简单的数字识别。玩法很简单,先把附加的RData文件加载到R空间中(就是load("train.RData")这句),然后调用函数guess(),会打开一个空白的图形窗口。按住鼠标左键画一个0到9范围内的数字,然后右击鼠标确认,R会把猜测的结果输出出来。

阅读全文——共385字

一些澄清,致歉,和广告

事情的源起是果壳的这个帖子:http://www.guokr.com/post/74433。帖子中转载了我之前写的一篇博客,主要内容是对宋词进行了一些词频的统计,然后各位网友纷纷发挥了自己的创造力,利用这些高频词语来“写词”。看到大家热情这么高我当然非常高兴,因为这至少说明我做的一些东西是有意义的。我学的专业是统计和精算,平时会和各种类型的数据打交道,之前写那篇博文也是出于兴趣,想利用学到的专业知识来对一些实际的问题进行分析。

而我没有意料到的是大家对这件事的关注度会这么高,以至于果壳网把那篇帖子推到了首页,甚至还有一些朋友说希望能有进一步的采访等等,这都是我始料未及的。对此我觉得有必要对其中的一些细节进行解释,以避免不必要的误会。

阅读全文——共2200字

近日见闻

最近这个月是在各种奔波忙碌中度过的。各种考试,报告,赶场,一度有抓狂的感觉。不过好在都熬过来了,现在面临的是新的战斗。至于这段时间到底值还是不值,或许只有以后才清楚。

上周五给数据挖掘小组做了关于大型计算的报告,讲了讲R调用数据库、R对象缓存和并行计算等方面的内容。讲完之后发现自己演讲的能力还是有待提高。充分的准备是一方面,与观众的互动是一方面,总体来说还是要提高自身的素质。

阅读全文——共910字

rationalfun

刚刚向CRAN提交了一个新包,名字叫rationalfun。这个包顾名思义,是处理有理函数的。毕业论文里面有一块内容是要求有理函数的积分,数学分析课本中给出的方法是部分分式,但这个在程序中不好实现;而如果用数值积分,则速度又太慢,不划算。后来费尽千辛万苦(这里是夸张的修辞手法),终于在一篇计算机的论文中找到了解决的办法,于是索性把算法写成了包,也就是rationalfun。本来想把论文放到博客上的,但听说要坐牢,心想还是算了。论文的信息是

T. N. Subramaniam, and Donald E. G. Malm, How to Integrate Rational Functions, The American Mathematical Monthly, Vol. 99, No.8 (1992), 762-772.

阅读全文——共1217字

烧香

这次考试得过啊……

当时只道是寻常

纪念那些无忧的岁月。

My English site

Well, just to save my terrible English, I have to find a place to practice writing that way. Please visit my English site http://yixuan.cos.name/en, another place where I share my ideas and thoughts.

Welcome you all!

新的开始

前两天收到雅虎邮箱的一封邮件,大意是说,嘿,老伙计,你已经用我们邮件9年了,怎么还在用9年前的界面呢,我们给你换个新的吧。于是一时手滑,看了看新的主题,结果发现没法切换回老的界面了。有时候过去的事就像这样,不经意间就找不回来了。

换就换吧,干脆来得更彻底些,于是把博客的模版也一并更换了一个。不过怎么说呢,现在的这个模版还是多多少少有些怀旧的意味在里面的。:-)

阅读全文——共191字

中秋献礼——Layer图形设备

你在用R画图的时候,是否会遇到以下的麻烦:

阅读全文——共743字