nxf-rabbit75

 1. 导入csv文件

### python导入csv文件的三种方法

```python

#原始的方式

lines = [line.split(\',\') for line in open(\'iris.csv\')]
df = [[float(x) for x in line[:4]] for line in lines[1:]]

#使用numpy包

import numpy as np
lines = np.loadtxt(\'iris.csv\',delimiter=\',\',dtype=\'str\')
df = lines[1:,:4].astype(\'float\')

#使用pandas包

import pandas as pd
df = pd.read_csv(\'iris.csv\')
df=df.ix[:,:4]

这三种方法中最后一种最简单,不过花费时间比较长一点,第一种最麻烦,不过用时最短。这个可以通过ipython中的magic函数%%timeit来看。

 

2. 导入txt文件

数据:

将数据转为DataFrame格式,代码如下:

def read_file(path,is_test=False):
    fp = open(path,encoding=\'utf-8\')
    dataset = []
    for line in fp.readlines():
        line = line.strip().split(\'\t\')
        if is_test:
            line.append(\'-1\')
        dataset.append(line)
    data = pd.DataFrame(dataset)
    data.columns = [\'prefix\',\'query_prediction\',\'title\',\'tag\',\'label\']
    return data

  

 

 

 

 

参考文献:

【1】numpy.loadtxt()

分类:

技术点:

相关文章: