DS-Source


数据科学资源

存放一些DS学习的资源

[toc]

数据

统计数据

企业提供

加州大学欧文分校机器学习库

Delve数据库

Amazon Web Services(AWS) datasets

Google Datasets 里面也有商用的数据库

Youtube labeled

image-20210609194747163


NASA

世界银行 免费并公开获取世界各国的发展数据.

门户网站

列出了全世界许多开放数据库

各国开放数据集集成

机器学习数据库大集成!!

论坛提供的数据库

竞赛平台

Kaggle 提供一个数据搜索引擎

KDD Cups

工具

Data world 有很多公开数据集,很方便管理协作,提供许多数据管理工具的API

namara数据搜索引擎

可视化

Tableau

业务

  • 数据科学语言

    python、R、Scala、Clojure、Haskell

  • NoSQL工具

    NoSQL、MongoDB、Couchbase、Cassandra

  • 传统数据库/数据仓库

    SQL、RDMS、DW、OLAP

  • 大数据计算工具

    HadoopHDFS&MapReduce、Spark、Storm

  • 大数据管理、存储、查询

    HBase、Pig、Hive、Impala、Cascalog

  • 数据采集、聚合、传递

    Webscraper、Flume Avro、Sqoop、Hume

  • 数据挖掘

    Weka、KNIME、RapidMiner、SciPy、Pandas

  • 数据统计分析

    SAS、SPSS、Matlab

论坛、平台

Kaggle

KDD 数据挖掘、数据科学和分析社区

Driven Data


文章作者: Darren
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Darren !
评论
  目录