前言

快期末了,数据挖掘的大作业需要用到python的相关知识(这太难为我这个以前主学C++的人了,不过没办法还是得学?),下面是我在使用pandas时总结的一些东西,我对于python不是很熟悉,如果下面的一些知识点有哪里出问题或者有不同理解的,请一定一定要在评论区提出来,让我这个菜鸡学习学习~~/(ㄒoㄒ)/~~

Pandas读取数据的几种方式

Pandas需要先读取表格类型的数据然后进行分析

Pandas提取数据的三种方式

1. read_csv

1.1 读取csv,使用默认的标题行逗号分隔
先来看数据文件吧(myTest1.txt)?

Pandas提取数据的三种方式

相关代码:

Pandas提取数据的三种方式

1.2 读取txt文件,自己指定分隔符,列名

有些.txt文件不一定是使用","进行分隔,也有可能使用"\t","-","/"进行分隔,这就需要自己指定分隔符了,而有些数据文件可能不会给咱们列名,那么我们自己其实也是可以指定列名。
先看数据文件吧(myTest.txt)?

Pandas提取数据的三种方式

相关代码:

Pandas提取数据的三种方式

2. read_excel

读取excel表应该是最常见的了,咱们可以直接使用read_excel进行数据读取,下面的代码用于展示的是一个excel文件中包含多个sheet,咱们可以选择读取某个sheet

先看下数据文件吧?

Pandas提取数据的三种方式

相关代码:

Pandas提取数据的三种方式

3. read_sql

想要读取数据库表的方法,就可以使用read_sql对表数据进行读取,操作步骤为:

①链接数据库(指定好各种信息,host,user,password…),需要下载包pymysql

Pandas提取数据的三种方式

②读取数据库中表的数据

先来看下我的数据文件吧?

Pandas提取数据的三种方式

相关代码:

Pandas提取数据的三种方式

原文地址:https://blog.csdn.net/Jacksqh/article/details/128373356

相关文章: