Pandas主要先读取表格类型的数据,然后进行分析。
import pandas as pd
# 由于是用pandas模块操作数据,因此不用在路径前加open,否则就是python直接打开文件,可能还会打不开出错
# file_path_excel = open('E:\\学习\\Python\\Pandas模块的导入及学习-数据分析\\bank.xls')是错的
# 文件所在的位置,文件路径用双杠\\,或是反方向单杠/, 或在文件路径前加一个r即可直接使用原路径的单杠\即:r'\'
# 'E:\\学习\\bank.csv' 或 'E:/学习/bank.csv' 或 r'E:\学习\bank.csv' 都是正确的
1.读取纯文本文件 --使用pandas.read_csv
1.1 读取csv,使用默认的标题行、逗号分隔符--有时csv文本中的数据编码不兼容,打开时出错,read_csv(..,encoding=’换一种更通用更高级的编码如gbk,gb18030等即可’)
1 file_path_csv = 'E:\\学习\\Python\\Pandas模块的导入及学习-数据分析\\bank.csv' # 文件路径为\\或/或r'\'都可 2 bank_csv = pd.read_csv(file_path_csv) # 使用pandas.read_csv读取文件 3 print(bank_csv.head()) # 查看前几行数据,默认显示前5行数据 4 print(bank_csv.shape) # 查看数据的形状,返回(行数,列数) 5 print(bank_csv.dtypes) # 查看每列的数据类型