学习资料!
有两个建议吧。 完成《building machine learning systems withpython》书上的所有projects, 这本书除了封面其他里面的内容还是挺实用的。中文书名为 《机器学习系统设计》 完成kaggle playground和 101上的所有比赛,具体tutorial可以戳
https://www.kaggle.com/wiki/GettingStartedWithPythonForDataScience
https://www.kaggle.com/c/titanic-gettingStarted/details/getting-started-with-python-ii
https://www.kaggle.com/c/titanic/details/getting-started-with-python-ii 另外补充一个用scikitlearn构建文本挖掘系统的教程,个人觉得写的很好,基本上做一遍大概的流程就很清晰了:
[http://www.threedweb.cn/article-12-1.html]scikit-learn文本挖掘系统学习(已完成)
另外可以看这篇blog:
http://blog.csdn.net/u012162613/article/details/41929171 https://github.com/wepe/Kaggle-Solution/tree/master/Digit%20Recognizer 入门 ——————————— 分割线补充: 我做过的比较好玩的应该是下载了豆瓣某一个爆照组的所有照片,然后结合发布者ID在其主页上找寻相关信息,然后按照地域进行统计算分布,然后在google map上画了出来… 不过这个就没什么含金量了,现在在水推荐系统。