1. 导入csv文件
### python导入csv文件的三种方法 ```python #原始的方式 lines = [line.split(\',\') for line in open(\'iris.csv\')] df = [[float(x) for x in line[:4]] for line in lines[1:]] #使用numpy包 import numpy as np lines = np.loadtxt(\'iris.csv\',delimiter=\',\',dtype=\'str\') df = lines[1:,:4].astype(\'float\') #使用pandas包 import pandas as pd df = pd.read_csv(\'iris.csv\') df=df.ix[:,:4]
这三种方法中最后一种最简单,不过花费时间比较长一点,第一种最麻烦,不过用时最短。这个可以通过ipython中的magic函数%%timeit来看。
2. 导入txt文件
数据:
将数据转为DataFrame格式,代码如下:
def read_file(path,is_test=False):
fp = open(path,encoding=\'utf-8\')
dataset = []
for line in fp.readlines():
line = line.strip().split(\'\t\')
if is_test:
line.append(\'-1\')
dataset.append(line)
data = pd.DataFrame(dataset)
data.columns = [\'prefix\',\'query_prediction\',\'title\',\'tag\',\'label\']
return data
参考文献: