【发布时间】:2017-06-19 11:06:38
【问题描述】:
背景信息:
我有一个 XML 文件,我的供应商每晚都会上传新产品和更新的库存数量等。
但是他们把我缝合了,他们在 XML 文件中没有描述,他们有一个指向他们网站的链接,其中包含原始文本的描述。
我需要做的是有一个脚本循环遍历我从他们那里下载的文档,并将 URL 替换为 URL 的内容。
例如,如果我有
<DescriptionLink>http://www.leadersystems.com.au/DataFeed/ProductDetails/AT-CHARGERSTATION-45</DescriptionLink>
我希望它最终成为
<DescriptionLink>Astrotek USB Charging Station Charger Hub 3 Port 5V 4A with 1.5m Power Cable White for iPhone Samsung iPad Tablet GPS</DescriptionLink>
我已经尝试了一些东西,但我对脚本或循环不是很精通。 到目前为止,我得到了:
#!/bin/bash
LINKGET=`awk -F '|' '{ print $2 }' products-daily.txt`
wget -O products-daily.txt http://www.suppliers-site-url.com
sed 's/<DescriptionLink>*/<DescriptionLink>$(wget -S -O- $LINKGET/g' products-daily.txt
但同样,我不确定这一切是如何真正起作用的,所以它一直在反复试验。 任何帮助表示赞赏!!!
更新为包含示例 URL。
【问题讨论】:
-
您能提供一个网址示例吗?否则很难测试...
-
添加 URL 例如:)