【发布时间】:2011-09-23 03:35:16
【问题描述】:
我想通过 matlab 脚本自动从 Google Scholar 获取一些数据。我最感兴趣的是 Google Scholar 的 Bibtex 条目和前向引用功能等数据。但是,似乎有no API for Google Scholar,有没有办法使用Matlab从Google Scholar自动获取书目数据?是否有一些工具或代码已经可用?
【问题讨论】:
-
由于没有 API,也没有结构化格式,因此您最终会得到大量重复数据,并且没有可靠地提取数据的好方法。 Here's the same question 但使用 Mathematica。 Sjoerd C. deVries 在他的回答中展示了它如何导致许多可疑的结果。
-
@yoda 我正在构建这个工具主要是因为我正在领导一个调查团队(后来供我自己使用),这是确保我们不会错过任何重要论文的好方法那里。如果有重复,那很好,因为我们最终将主要查看人类大小的数据块。但是,如果您知道比与 Google Scholar 抗争更好的方法,那么我也很想知道这一点。
-
我建议您尝试一个在您的研究领域中广为人知的出版物数据库。比如IEEE Explore/SPIRE/WebOfScience/ScienceDirect/CiteSeer等。我相信大部分都有API,但都是商业化的,收费高,所以如果你的意图是开发一个低成本/免费的工具,那么这些可能没有帮助。我认为谷歌学术仍然可以,只是由于缺乏结构,它需要更多的努力。尽管如此,Mac 应用程序“Papers”还是设法从 Google Scholar 中返回了不错的结果,所以这并非不可能:)
标签: matlab google-scholar