【发布时间】:2014-03-12 00:07:24
【问题描述】:
我有一个看起来像这样的规范文件"PC DELL OptiPlex 3010MT i3 3220/2GB/500GB/DVD-RW/FREE DOS / 5Y NBD
Intel i3 3220 (Dual Core, 3.30GHz, 3MB, w/ HD2500 Graphics), 2GB (1x2GB) DDR3 PC3-1600MHz, 500GB HDD SATA III 7200rpm, DVD+/-RW (16x), FREE DOS, Warranty: 5Yr Basic Warranty NBD on site"
所以我需要填充一个 html 表格,然后将其放入 .csv 文件中进行上传 到目前为止,我已经设法使用以下脚本“清理”文件
for f in $(ls *.csv)
do
#fix newline from file
sed -i ':a;{N;s/NBD \n/NBD,/};ba;s/"//g;' "$f"
#fix csv & and remove strings
sed -i 's/"PC/PC/g;s/Core\,/Core/g;s/3\,/3./g;s/3MB\,//g;s/6MB\,//g;s/6MB//g;s/w \///g;s/7,200/7200/g;s/site\"/site/g;s/3MB//g;s/3\,/3\./g;s/w\///g;s/3\,/3\./g;s/Cache\,)/Cache/g;s/ Internal Dell Business Audio Speaker\,//g;' "$f"
#don't know how to remove symbols with sed using awk
awk 'NR==FNR {a[$1]=$2;next} {for ( i in a) gsub(i,a[i])}1' template $f >temp.txt
mv temp.txt $f
done
然后使用这个脚本来填充 html 表格
#!/bin/bash
for f in $(ls *.csv)
do
#split csv into 1line .csv files
split --additional-suffix=.csv -d -l 1 "$f" output/data_
#populate html file and create .html files
for file in $(ls output/*.csv)
do
IFS=","
while read f1 f2 f3 f4 f5 f6 f7 f8 f9 f10
do
echo "<table cellspacing=\"0\" cellpadding=\"0\" border=\"0\" width=\"100%\"> "
echo "<tbody>"
echo "<tr> "
echo "<td class=\"specsTitle\">Box</td> "
echo "<td class=\"specsDescript stripeBottom\">$f2</td> "
echo "</tr> "
echo "<tr> "
<snip>
done <$file > output/temp.txt
mv output/temp.txt $file.html
done
done
#remove not important .csv
rm output/*.csv
所以此时我在输出文件夹中有几个 .html 文件
问题是: 1.上面的代码有多糟糕? :-) 2. 如何将 .html 文件中的代码放入如下所示的 .csv 文件中
col1,col2,col3,HERE SHOULD BE THE HTML CODE FROM FILE1,col5,
col1,col2,col3,HERE SHOULD BE THE HTML CODE FROM FILE2,col5,
我正在考虑使用模板文件并以某种方式添加几个 .html 代码。有什么帮助吗? 亲切的问候
--编辑-- 这是原始输入 原始输入:
"PC DELL OptiPlex 3010MT i3 3220/2GB/500GB/DVD-RW/FREE DOS / 5Y NBD
Intel i3 3220 (Dual Core, 3.30GHz, 3MB, w/ HD2500 Graphics), 2GB (1x2GB) DDR3 PC3-1600MHz, 500GB HDD SATA III 7200rpm, DVD+/-RW (16x), FREE DOS, Warranty: 5Yr Basic Warranty NBD on site"
"PC DELL OptiPlex 3010MT i5 3470/2GB/500GB/DVD-RW/FREE DOS / 5Y NBD
Intel i5 3470 (Quad Core, 3.20GHz Turbo,6MB, w/ HD2500 Graphics), 4GB (1x4GB) DDR3, PC3-1600MHz, 750GB HDD SATA III 7200rpm, DVD+/-RW (16x), FREE DOS, Warranty: 5Yr Basic Warranty NBD on site"
CSV 模板
price,product code, SPECS,other things,
300.00,CODE 2112334, ,OTHER STRINGS,
500.00,CODE 2222222, ,OTHER STRINGS,
所需的 .csv 输出:
price,product code, SPECS,other things,
300.00,CODE 2112334, <table style="width:300px"><tr><td>Proccessor</td><td>Intel i3 3220 (Dual Core, 3.30GHz</td></tr><tr><td>Memmory</td><td> 2GB (1x2GB) DDR3 PC3-1600MHz</td>tr><td>Hard Disk</td><td>500GB HDD SATA III 7200rpm</td></tr><tr><td>VGA</td><td>HD2500 Graphics</td></tr><tr><td>Warranty</td><td>5Yr Basic Warranty NBD on site</td></tr><tr><td>Ohter features</td><td>THIS IS NOT FROM THE SPECFILE</td></tr><tr><td>Ohter features 2</td><td>THIS IS ALSO NOT FROM THE SPECFILE</td></tr></tr></table>,OTHER STRINGS,
500.00,CODE 2222222, <table style="width:300px"><tr><td>Proccessor</td><td>Intel i5 3470 (Quad Core 3.20GHz)</td></tr><tr><td>Memmory</td><td> 4GB (1x4GB) DDR3 PC3-1600MHz</td>tr><td>Hard Disk</td><td>750GB HDD SATA III 7200rpm</td></tr><tr><td>VGA</td><td>HD2500 Graphics</td></tr><tr><td>Warranty</td><td>5Yr Basic Warranty NBD on site</td></tr><tr><td>Ohter features</td><td>THIS IS NOT FROM THE SPECFILE</td></tr><tr><td>Ohter features 2</td><td>THIS IS ALSO NOT FROM THE SPECFILE</td></tr></tr></table>,OTHER STRINGS,
--编辑--
【问题讨论】:
-
解析
ls的输出为not a good idea。在您的情况下,只需执行for f in *.csv即可。另外,您能否根据您提供的示例输入发布您想要的输出? -
您好,感谢您的快速回复,我应该用于上传文件的最终 .csv 文件是:col1、col2、col3,这里应该是来自 FILE1、col5、col1 的 HTML 代码, col2,col3,这里应该是来自 FILE2,col5 的 HTML 代码,其中 col1 等是在 template.csv 上预定义的
-
这与帖子中的信息相同;我的要求是让您将所需的处理应用于您提供的示例输入,然后发布最终输出(您可以编辑您的帖子,这比将其添加为评论更好)。换句话说,给出一个完整的例子,从头到尾,以便有人可以根据它编写一个(新的)处理脚本。
-
谢谢,我已经编辑了原帖