【问题标题】:Greek characters from a webpage网页中的希腊字符
【发布时间】:2014-03-07 06:21:02
【问题描述】:

我遇到了希腊字符的问题。我导航到具有文本框和 Go 按钮的网页,并以编程方式在文本框中输入一个数字,然后以编程方式单击“go”按钮。然后我从网页中获取 HTML。这些有一些希腊字符。这是我写的代码。

HttpWebRequest request = (HttpWebRequest)WebRequest.Create(mainURL);
request.Headers.Set(HttpRequestHeader.AcceptLanguage, "en-US");
request.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705;)";
request.Timeout = 100000;
request.ContentType = "charset=iso-8859-7;windows-1253;charset=iso-8859-8;windows-1254;";
WebClient wc = new WebClient();
WebBrowser b = new WebBrowser();
wc.Encoding = Encoding.UTF8;
try
{
    b.Navigate(mainURL);
    while (b.ReadyState != WebBrowserReadyState.Complete)
    {
         Application.DoEvents();
     }
string searchNum="10002";
HtmlElement userName = b.Document.GetElementById("ctl00$cphMyMasterCentral$ucSearch$txtNumber");
userName.SetAttribute("value", searchNum);
userName.RemoveFocus();
b.Document.GetElementById("ctl00_cphMyMasterCentral_ucSearch_lbtnSearch").InvokeMember("click");
string url = "https://www.example.com";
html = wc.DownloadString(url);
html = HttpUtility.HtmlDecode(html);

在网页上,当我不以编程方式执行此操作时,这是输出。

Name                        Reg. Number Type            NameStatus  OrgStatus
ΑΔΑΜΟΣ ΓΑΒΡΙΗΛΙΔΗΣ & ΣΙΑ    Σ   10002   Partnership     Current Name    Active

但是当我以编程方式执行此操作时,我得到了这个

Name                        Reg. Number Type            NameStatus  OrgStatus
αδα??Σ Γα?????? δ?Σ & Σ?α   Σ   10002   Partnership     Current Name    Active

我如何存储它,因为它显示在原始网页上(例如 ΑΔΑΜΟΣ ΓΑΒΡΙΗΛΙΔΗΣ & ΣΙΑ)?

【问题讨论】:

  • 你试过Encoding.Unicode吗?
  • 将页面编码设置为 UTF-8 并尝试使用 N'FOO' 从 db 获取数据
  • @Maysam,我不知道什么是 N'FOO'。能详细点吗??
  • @Rashmi 你的 sql 代码是什么?
  • @Maysam,我只是使用 HTMLAgilitypack 解析 HTML 以获取 Name、RegNumber ...并使用 sqlbulkcopy 复制到 sqlserver 表。

标签: c# html sql-server


【解决方案1】:

将数据库表中的varchar改为nvarchar,并将页面编码改为UTF-8

【讨论】:

    【解决方案2】:

    如果您确定是 javascript 弄乱了您的代码,并且您的数据库和页面本身设置为 UTF8,那么如果我记得很清楚,您需要对希腊字母表使用十六进制字符 See this page.

    κουράγιο

    【讨论】:

      猜你喜欢
      • 2016-04-02
      • 2013-09-30
      • 2011-08-28
      • 1970-01-01
      • 2013-08-17
      • 2021-10-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多