我们在第一篇提到的《集体智慧》英文名为《Programming Collective Intelligence》,这边书不仅实战型超级强大,而且很多复杂的机器学习算法被解释的异常的浅显易懂,很是让我惊叹!其中包括协作过滤算法,聚类算法,分类算法,数据挖掘算法etc。好了,废话不讲,今天就让我们来看看被一堆公式堆积起来的欧几里得距离和皮尔森相关系数,是如何被这本书用大众化的方式描述出来的。ps:本书是使用python
首先,来一段python code,其实python现在用来教学的最好语言了,如果对python不熟悉的话,推荐先看《a byte of python》下载 然后看,Dive Into Python 下载 dive into Python的代码 下载
guwendong 的一篇 《Programming Collective Intelligence》书评让我对个性化技术产生了极大的兴趣,并一口气看完了他blog上的所有文章,让我受益匪浅,并使自己疯了似的狂看了两周的collaborative recommendation,之后立马向老板推荐,我的研究方向就是协作过滤了,还blabla想了一堆以后如何利用这个技术创业(天~~别忘了我的人生目标就是创业,在成熟的时候周游四海~),很多idea比如建立一个健康知识的专业推荐社区,一个以省钱为目标的咨询、知识推荐网…不过,后来发现这个论题有些大,我现在的研究领域进过压缩,变成了网上社区的热点话题发现。但我还是会关注协作过滤!为什么呢?
1. 未来的咨询只为海量的爆发,但是每个人的时间和精力都是有限的,如何在有限的时间内获得自己感兴趣的最合适的资讯,我觉得第一是靠自己的主动获取,但最终要的也是发展前景非常好的推荐技术,借他人(一般与你兴趣相仿或相近的人)的意见来产生自己感兴趣的内容
2.未来的社会更加互联。如何理解?就像现在蓬勃发展的SNS(social network service),你可以随时掌握到好友的各种信息,但是现在缺乏的是如何来利用这些信息为自己主动提供帮助,这个时侯协作推荐也必有用武之地。
另外,guwendong还专门研究了一些列新兴的个性化应用,供参考。
今后,本博客今后将关注个性化方面的相关技术和应用:)并且,接下来,我会就《Programming Collective Intelligence》写一些实践性的文章,一方面把技术落地,一方面也为我的小论文铺铺路,希望大家多多监督,多多分享:)