【问题标题】:In Rmarkdown, is there a way to create a .bib file for only those keys cited in a document?在 Rmarkdown 中,有没有办法只为文档中引用的那些键创建一个 .bib 文件?
【发布时间】:2020-12-15 12:38:23
【问题描述】:

我在 Rstudio 中使用 bookdown 为一个引用 bibtex 文件中引用的特定项目写了一篇手稿。这是我用于许多文档的单个 .bib 文件,因此它位于我的项目文件夹之外,并且包含许多本手稿中未引用的参考资料。为了便于分享,我想制作一个较小的 .bib 文件,仅显示我在手稿中实际引用的那些参考资料。

其他问题已经解决了如何做到这一点:

  1. pure Tex 使用.aux 文件中给出的引用。我可以通过设置options(tinytex.clean = FALSE) 生成一个.aux 文件,但它不包含任何引用。
  2. pandoc/markdown,但我不知道如何将其应用于 Rmarkdown。

有没有人知道为 Rmarkdown 文档执行此操作的方法?谢谢!

我正在使用这个 YAML 标头并在 Rstudio 中编织:

output:
  bookdown::pdf_book:
    keep_tex: yes

完整的会话信息:

> sessionInfo()
R version 3.6.3 (2020-02-29)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 18.04.5 LTS

Matrix products: default
BLAS:   /usr/lib/x86_64-linux-gnu/blas/libblas.so.3.7.1
LAPACK: /usr/lib/x86_64-linux-gnu/lapack/liblapack.so.3.7.1

locale:
 [1] LC_CTYPE=en_GB.UTF-8       LC_NUMERIC=C               LC_TIME=en_GB.UTF-8       
 [4] LC_COLLATE=en_GB.UTF-8     LC_MONETARY=en_GB.UTF-8    LC_MESSAGES=en_GB.UTF-8   
 [7] LC_PAPER=en_GB.UTF-8       LC_NAME=C                  LC_ADDRESS=C              
[10] LC_TELEPHONE=C             LC_MEASUREMENT=en_GB.UTF-8 LC_IDENTIFICATION=C       

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
 [1] compiler_3.6.3  bookdown_0.20   htmltools_0.4.0 tools_3.6.3     yaml_2.2.0     
 [6] Rcpp_1.0.3      rmarkdown_2.3   knitr_1.29      xfun_0.15       digest_0.6.25  
[11] packrat_0.5.0   rlang_0.4.7     evaluate_0.14  

【问题讨论】:

    标签: r-markdown bookdown bibtex


    【解决方案1】:

    由于您使用 .Rmd 编​​写,因此您可以使用以下 R 函数来清理您的 bib 文件:

    library(stringr)
    
    clean_bib <- function(input_file, input_bib, output_bib){
      lines <- paste(readLines(input_file), collapse = "")
      entries <- unique(str_match_all(lines, "@([a-zA-Z0-9]+)[,\\. \\?\\!\\]\\;]")[[1]][, 2])
    
      bib <- paste(readLines(input_bib), collapse = "\n")
      bib <- unlist(strsplit(bib, "\n@"))
    
      output <- sapply(entries, grep, bib, value = T)
      output <- paste("@", output, sep = "")
    
      writeLines(unlist(output), output_bib)
    }
    # now call the function
    clean_bib(...)
    

    只需在设置块中调用它。

    函数有什么作用?它首先搜索输入文件中的所有引用,即以 @ 开头、包含字母和数字并以逗号、点、问号、感叹号、空格或 ] 结尾的字符串——根据您的需要进行调整。

    然后它构造一个只包含这些条目的新 bib 文件。

    【讨论】:

    • 很好的答案,我对entries 的正则表达式进行了小改动,以允许引用以分号结尾,您可以同时引用几个引用:“@([a-zA-Z0 -9]+)[,\\.\\?\\!\]\\;]"
    • 是的,这很有帮助。我在自己的工作中使用逗号,所以我没有想到分号。我将更改答案中的正则表达式。谢谢!
    • @JohannesTitz 这太棒了。在我的输入围兜中,我有两篇同一作者在同一年(Greenwood 2015)发表的论文,尽管它们有不同的引用键。它产生了一个错误,似乎这两个引用已被制作成一个向量:@c("article{Greenwood2015,\nabstract = {...", "article{Greenwood2015f,\nabstract = {...\nyear = {2015}\n}")。如何避免这种情况?我的文档中只使用了一篇文章
    猜你喜欢
    • 2011-09-25
    • 1970-01-01
    • 2016-04-04
    • 2023-03-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多