【发布时间】:2014-08-15 00:36:59
【问题描述】:
所以基本上我想删除href,即:
<td class="name"><a href="/leagues/euw/633">Apdo Dog2</a></td>
所以我只想要文本的Apdo Dog2 部分。有什么想法吗?
这是我的代码:
private void button1_Click(object sender, EventArgs e)
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create("SITE");
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
StreamReader stream = new StreamReader(response.GetResponseStream());
string final_response = stream.ReadToEnd();
Regex r = new Regex(@"\<[^\>]+\>(.[^\<]+)</[^\>]+\>", RegexOptions.Singleline);
Match m = r.Match(final_response);
richTextBox1.Text = m.Value;
【问题讨论】:
-
你真的应该使用像HtmlAgilityPack 这样的东西。有大量的 HTML 会破坏普通的正则表达式。