【发布时间】:2013-03-14 05:44:31
【问题描述】:
给定一个公司名称,比如 Google,我希望能够识别到公司资料页面的链接
- Google 财经(例如https://www.google.com/finance?q=NASDAQ%3AGOOG)
- 彭博社 (http://www.bloomberg.com/quote/GOOG:US)
并提取公司信息,例如。 “Google Inc. 是一家全球技术公司,通过其网站提供基于网络的搜索引擎。该公司提供广泛的搜索选项,包括网络、图像、群组、目录和新闻搜索”
我该怎么做,我想我需要一些 API 来根据公司名称识别股票代码,然后以某种方式构建到相应网站的 URL?彭博社似乎有一个 API,但它非常大,有人能指出我正确的方向吗?
对于第一个要求,从另一个问题看来,查询 Yahoo Finance API 可以解决问题:
http://autoc.finance.yahoo.com/autoc?query=yahoo&callback=YAHOO.Finance.SymbolSuggest.ssCallback
但它似乎没有提供构建彭博 URL 所需的信息(缺少国家信息?)。
【问题讨论】:
-
您希望使用哪种编程语言来执行此操作?您是否希望股票始终在美国上市?
-
@Omnisite,我认为可能不仅仅是美国
-
@Jiew Meng :在这种情况下,您需要考虑更多。例如,谷歌在许多交易所上市。关于彭博;你可以像这样进行符号查找:bloomberg.com/apps/data?pid=symsearch&Query=google 然后你需要你需要的正则表达式。
-
仅供参考:抓取 Bloomberg 的网站违反了他们的 TOS