【发布时间】:2017-07-31 16:01:44
【问题描述】:
因此,在 R 中的文本文件中,我需要扫描许多文档以查找其中提到的“折扣率”段落。然后我想提取它所在的整个段落,仅此而已。每个段落的前后都有一个空白行,在文本文件中写为“”。我提供了一些我尝试过但不起作用的示例代码和一个 txt 文件的几段,其中一个包含关键字“折扣率”
t <- c(grep(" discount rate ",txt,ignore.case = T),grep(" discounted cash flow",txt,ignore.case = T))
temp <- unlist(str_extract_all(txt,"\r\r. discount rate .\r\r"))
所以我的方法是尝试提取“”和“”之间的所有行,允许它们包含“折扣率”,但这段代码显然不成功。
""
" (9) 任何财产或设备的出售或处置"
“已损坏、磨损、过时或无用或无用”
“ Armor Holdings 与 Armor 业务相关的使用时间更长”
" 控股或其受限子公司。"
""
" \"可归属债务\"关于售后租回交易"
“指在确定时,该义务的现值”
"包括在剩余租赁期内的净租金支付的承租人"
“在此类售后回租交易中,包括此类交易的任何期间”
“租约已经延长,或者可以根据出租人的选择延长。这样的”
"现值应使用等于"折现率的折现率计算"
“此类交易中的隐含利益,根据公认会计原则确定。”
""
" \"受益所有人\" 具有规则 13d-3 中赋予该术语的含义"
“以及《交易法》第 13d-5 条,但在计算收益时除外”
“任何特定“人”的所有权(该术语在第 13(d)(3) 节中使用)
《交易法》),该“人”应被视为拥有实益所有权”
“该“人”有权通过转换获得的所有证券中的“或”
“行使其他证券,无论该权利目前是否可以行使”
“仅在发生后续条件时才可行使。条款”
"\"Beneficially Owns\"和\"Beneficially Owned\"应具有相应的含义。"
""
" \"董事会\" 的意思是:"
""
" (1) 就公司而言,董事会是"
“公司;”
""
” (2) 关于合伙企业,“
“合伙企业的普通合伙人;以及”
""
" (3) 关于任何其他人、董事会或委员会"
“具有类似功能的此类人员。”
""
【问题讨论】:
标签: r string text-extraction