mic86

写的一个小工具需要获取指定URL的顶级域名,就写了这么个方法:

private static string GetBaseDomain(string host)
        {
            List<string> list = new List<string>(".com|.co|.info|.net|.org|.me|.mobi|.us|.biz|.xxx|.ca|.co.jp|.com.cn|.net.cn|.org.cn|.mx|.tv|.ws|.ag|.com.ag|.net.ag|.org.ag|.am|.asia|.at|.be|.com.br|.net.br|.bz|.com.bz|.net.bz|.cc|.com.co|.net.co|.nom.co|.de|.es|.com.es|.nom.es|.org.es|.eu|.fm|.fr|.gs|.in|.co.in|.firm.in|.gen.in|.ind.in|.net.in|.org.in|.it|.jobs|.jp|.ms|.com.mx|.nl|.nu|.co.nz|.net.nz|.org.nz|.se|.tc|.tk|.tw|.com.tw|.idv.tw|.org.tw|.hk|.co.uk|.me.uk|.org.uk|.vg".Split(\'|\'));
            string[] hs = host.Split(".".ToCharArray(), StringSplitOptions.RemoveEmptyEntries);

            if (hs.Length > 2)
            {
                //传入的host地址至少有三段
                int p2 = host.LastIndexOf(\'.\');                 //最后一次“.”出现的位置
                int p1 = host.Substring(0, p2).LastIndexOf(\'.\');//倒数第二个“.”出现的位置
                string s1 = host.Substring(p1);
                if (!list.Contains(s1))
                    return s1.TrimStart(\'.\');

                //域名后缀为两段(有用“.”分隔)
                if (hs.Length > 3)
                    return host.Substring(host.Substring(0, p1).LastIndexOf(\'.\'));
                else
                    return host.TrimStart(\'.\');
            }
            else if (hs.Length == 2)
            {
                return host.TrimStart(\'.\');
            }
            else
            {
                return string.Empty;
            }
        }

 

调用方式(以下代码中的 url 为实际访问的网址):

string baseDomain = GetBaseDomain((new Uri(url)).Host);

 

因为写的程序是.NET 2.0 的,如果是高版本的话可以把List改为HashSet,效率应该会高一点(虽然基本感觉不出来,但处理上万行数据的话还是建议用HashSet,效率提升很明显,元素数量在10个以内的话两个是基本没区别的)

 

分类:

技术点:

相关文章:

  • 2021-11-01
  • 2021-12-18
  • 2021-12-19
  • 2021-11-01
  • 2021-11-01
  • 2021-11-11
  • 2021-12-27
  • 2021-11-25
猜你喜欢
  • 2021-11-01
  • 2021-08-09
  • 2021-07-09
  • 2021-05-09
  • 2021-12-28
  • 2021-12-18
  • 2021-11-01
相关资源
相似解决方案