【发布时间】:2019-12-04 08:33:38
【问题描述】:
我想解析整个网站的文本,所有文本都像原始文本一样出现在文本文件中。我想让它按原样格式化。
我正在使用 HTML Agility Pack 来解析文本,我尝试了可以在互联网上找到的任何解决方案,但没有任何帮助。这是我的代码。
var headerNames = doc.DocumentNode.SelectNodes("//[@id='wrap']/div[2]/div/div/div[3]").ToList();
foreach (var item in headerNames)
{
var completeReplace = item.InnerText.Replace("<br>, </b>","\n");
Console.WriteLine(completeReplace);
}
似乎替换不起作用,或者我错过了一些关于它的东西。或者你们可以帮助我用另一种方式来解析文本,我很感激。
【问题讨论】:
-
Replace 不需要替换字符串数组,只需 1 个文字字符串。打两个电话。
-
嗨,你能告诉我更具体的方式吗?我真的不明白。
标签: c# html html-agility-pack text-parsing