【问题标题】:Grab content from another website once every 30 minutes每 30 分钟从另一个网站抓取一次内容
【发布时间】:2013-11-30 09:05:04
【问题描述】:

我想从 A 参考网站接收外汇汇率,但每 30 分钟它们就会改变一次 如何自动获取并将其归档到我的数据库中,例如:从表中获取并导入到特定的 div 标签?

【问题讨论】:

  • 使用 file_get_contents 并检查:stackoverflow.com/questions/8847663
  • 我希望每 30 分钟接收一次所有表格并将其导入容器类以显示相同并将它们的信息保存到我的数据库我的网站基于 html、sql 和 css [1] :sarafijalalii.com

标签: php jquery ajax yui


【解决方案1】:
  1. 如果您在 Linux 主机上,请使用 crontab 设置每 30 分钟运行一次的脚本。如果您在 Windows 主机上,则可以使用 Task Scheduler
  2. 使用file_get_contents读入URL的内容。
  3. 解析所述内容(将取决于数据类型 - 它们是否具有 XML 或 JSON 格式的数据,或者您是否需要使用 DOM Parser 解析 HTML?)。
  4. 将相关数据保存到您的数据库中。

【讨论】:

    【解决方案2】:

    您的问题相当模糊,因为您没有具体说明要从哪个站点获取数据。

    除非该网站提供程序化 API(这对于外汇来说似乎不太可能),否则您还有很多选择。

    • 在PHP中使用file_get_contents()下载页面的HTML,使用正则表达式获取你需要的数据
      • 请注意,这非常棘手,您必须编写正则表达式,这取决于网站在页面加载后是否通过 JavaScript 加载内容(因此可能不像建议的那么简单)
    • 使用外部服务将页面转换为数据,例如http://import.io(我在那里工作)。您可以使用 PHP 直接提取这些数据,然后使用 cron 脚本或其他调度程序将其放入数据库中。

    【讨论】:

      猜你喜欢
      • 2011-03-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-05-09
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多