一、数据对于模型来说是基础,是数据成就了模型,而现在的又是一个数据时代,比如:淘宝等。通过对用户数据的分析挖掘,预测用户的消费习惯等,再比如:人工智能。通过提取摄像头的图片帧数,通过分析图片,得出具体的行为等。这些都离不开再最开始的数据。

  二、数据的获取方式有很多种:

  1)kaggle(推荐):一个免费的数据获取网站,地址:https://www.kaggle.com/

  2)爬虫:通过爬取别人的网站或者其他途径来获取大量的数据,网站爬虫学习:scrapy爬虫

  3)numpy:手动生成数据,分隔等。

  三、在Python中,我们通过读取其他格式数据,来转换成特征数据。常用方式pandas

    支持的数据格式

    Python之原始数据-1

    常用的格式,csv、excel、json

    代码过程:

    orders = pandas.read_csv("market/orders.csv")
    prior = pandas.read_csv("market/order_products__prior.csv")
    products = pandas.read_csv("market/products.csv")
    aisles = pandas.read_csv("market/aisles.csv")

相关文章:

  • 2021-10-19
  • 2021-12-10
  • 2022-01-04
  • 2022-03-13
  • 2022-02-13
  • 2022-12-23
  • 2021-05-12
  • 2021-11-17
猜你喜欢
  • 2022-01-12
  • 2021-09-01
  • 2021-10-22
  • 2021-07-21
  • 2021-06-25
  • 2022-12-23
相关资源
相似解决方案