【发布时间】:2011-06-04 17:03:52
【问题描述】:
我正在编写一个 vbscript 从网页中提取一些数据,剥离一些关键信息并将其写入文件。
目前我访问页面并将文件内容保存到字符串的脚本是这样的:
Set WshShell = WScript.CreateObject("WScript.Shell")
Set http = CreateObject("Microsoft.XmlHttp")
'Load Webpage where address is URL
http.open "GET", URL, FALSE
http.send ""
'Assign webpage contents as a string to variable called Webpage
WEBPAGE = http.responseText
我需要将内容保存为字符串,以便可以在其上使用正则表达式来提取我需要的内容。
此脚本运行良好,除非页面包含非标准字符(例如 é)。当页面包含这样的内容时,脚本会抛出错误并停止。
我猜这与编码有关,但我不知道如何解决它。谁能指出我正确的方向?谢谢大家
编辑
感谢这里的帮助,我意识到我问错了问题!事实证明我下载的内容很好 - 问题是,之后我试图编辑它并将其写入文件,但文件格式错误。我有这个:
Set objTextFile = objFSO.OpenTextFile(OutputFile, 8, True,)
改成这样:
Set objTextFile = objFSO.OpenTextFile(OutputFile, 8, True, -1)
似乎已经解决了。多么疯狂的世界,嗯?感谢您的帮助。
【问题讨论】:
标签: vbscript character-encoding