数据科学资源
存放一些DS学习的资源
[toc]
数据
统计数据
企业提供
Amazon Web Services(AWS) datasets
Google Datasets 里面也有商用的数据库
世界银行 免费并公开获取世界各国的发展数据.
门户网站
竞赛平台
Kaggle 提供一个数据搜索引擎
工具
Data world 有很多公开数据集,很方便管理协作,提供许多数据管理工具的API
可视化
业务
数据科学语言
python、R、Scala、Clojure、Haskell
NoSQL工具
NoSQL、MongoDB、Couchbase、Cassandra
传统数据库/数据仓库
SQL、RDMS、DW、OLAP
大数据计算工具
HadoopHDFS&MapReduce、Spark、Storm
大数据管理、存储、查询
HBase、Pig、Hive、Impala、Cascalog
数据采集、聚合、传递
Webscraper、Flume Avro、Sqoop、Hume
数据挖掘
Weka、KNIME、RapidMiner、SciPy、Pandas
数据统计分析
SAS、SPSS、Matlab