【问题标题】:CSV to LIBSVM converterCSV 到 LIBSVM 转换器
【发布时间】:2016-04-19 21:21:45
【问题描述】:

我正在尝试使用 LibSVM 学习一些机器学习。我有一些 Excel CSV 格式的“testingset.csv”文件中的测试数据,但我必须转换这个数据集才能在 LibSVM 中工作。我有以下代码,但似乎无法转换它:

import sys
import csv
from collections import defaultdict

def construct_line( label, line ):
    new_line = []
    if float( label ) == 0.0:
        label = "0"
    new_line.append( label )

    for i, item in enumerate( line ):
        if item == '' or float( item ) == 0.0:
            continue
        new_item = "%s:%s" % ( i + 1, item )
        new_line.append( new_item )
    new_line = " ".join( new_line )
    new_line += "\n"
    return new_line

# ---

input_file = sys.argv[1]
output_file = sys.argv[2]

try:
    label_index = int( sys.argv[3] )
except IndexError:
    label_index = 0

try:
    skip_headers = sys.argv[4]
except IndexError:
    skip_headers = 0

i = open( input_file, 'rb' )
o = open( output_file, 'wb' )

reader = csv.reader( i )

if skip_headers:
    headers = reader.next()

for line in reader:
    if label_index == -1:
        label = '1'
    else:
        label = line.pop( label_index )

    new_line = construct_line( label, line )
    o.write( new_line )

【问题讨论】:

  • 你能告诉我们你的数据文件吗?

标签: python svm libsvm


【解决方案1】:

我认为代码是多余的 svm输入文件格式为

l 1:x 2:y 3:z 4:...
l 1:x 2:y 3:z 4:...

其中 l 是标签

我认为您可以将输入文件准备为由 \t 分隔的 txt 文件(使用 excel 将文件另存为 txt)

    A   B   C   D
1   l   x   y   z
2   l   x   y   z
...

比使用代码

import sys
f=[i.split() for i in open(sys.argv[1]).readlines()
open(sys.argv[1]+'_4libsvm','w').writelines([i[0]+" "+" ".join(pstr(k+1)+":"+j for k,j in enumerate(i[1:])])+"\n" for i in f])

然后执行 python pythonfile.py input1.txt input2.txt ... 它将转换所有输入文件

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-04-10
    • 1970-01-01
    • 2014-09-06
    • 2015-10-05
    • 2018-11-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多