https://www.toutiao.com/a6674749880616878596/

 

80+机器学习数据集,还不快收藏

 

整理 | suiling

出品 | AI科技大本营(ID:rgznai100)

对于从事机器学习的小伙伴来说,机器学习必须以大量的数据为基础,否则构建再好的模型也不能达到你想要的效果。同时,不同质量的数据集也会影响到模型训练的效果。之前营长就为大家推荐过一款机器学习数据集集合项目,如今该项目的作者已经如他所言更新内容啦!不信你看~

该项目包含了计算机视觉、自然语言处理、医疗等数据集,此外作者还很贴心地放上了每个数据集的时间、描述以及相关的Paper。

80+机器学习数据集,还不快收藏

 

以下是该列表中的部分数据集

  • 计算机视觉数据集

80+机器学习数据集,还不快收藏

 

  • 自然语言处理数据集

 

80+机器学习数据集,还不快收藏

 

  • 问答数据集

 

80+机器学习数据集,还不快收藏

 

 

  • 医疗数据集

 

80+机器学习数据集,还不快收藏

 

更详尽的数据集列表,请见:https://www.datasetlist.com/

下边给大家推荐两个查找数据集的网站:

  • UCI machine learning repository:https://wordnet.princeton.edu/

 

UCI数据集是一个常用的机器学习标准测试数据集,经常出现在各种机器学习论文当中。

关于如何使用该数据集,可参考CSDN博客上的一篇文章:https://blog.csdn.net/qq_32892383/article/details/82225663

  • Kaggle datasets:https://www.kaggle.com/datasets

Kaggle,一个数据科学竞赛网站,大家都很熟悉了。

相关文章:

  • 2021-11-03
  • 2021-05-28
  • 2021-09-11
  • 2022-02-07
  • 2022-02-22
  • 2021-09-26
  • 2021-04-19
  • 2021-07-02
猜你喜欢
  • 2021-08-20
  • 2021-08-12
  • 2021-08-26
  • 2021-09-01
  • 2021-11-08
  • 2021-10-27
相关资源
相似解决方案