【发布时间】:2015-12-08 00:12:03
【问题描述】:
我在文件夹 a、b、c 和 d 中有 4,000 个 xml 文件 每个文件夹包含 1000 个文件。所有文件夹都在名为 library 的主文件夹中 我需要使用
检查 xml 文件的格式是否正确xmllint --noout 100.xml"
命令或可能有更好的东西。 现在以防万一,将文件名和文件夹名记录在日志文件中。
记录“库/a/100.xml”
下面是伪代码。我需要构建脚本以在 shell 脚本中运行或更快
#program check xml format
#!/bin/bash
echo Please, get ready to process
for i in $(cat "/home/thrinity/library/);
do
xmllint --noout "$i" ;
if error
#log filefolder & file name
print error to errorlog.txt
else
end do
我正在寻找缺少标签的错误.. 类似.. 038339 此处缺少发票结束标签或任何我可以捕获的方式
对于那些可能感兴趣的人。下面的代码在 Ubuntu 14.04 机器上为我工作
find /YourMainFolder -name '*.xml' -print | xargs -I "{}" sh -c 'File="{}";xmllint --noout "${File}" || readlink -f {} >> errorlog.txt
【问题讨论】: