【发布时间】:2019-02-13 05:17:27
【问题描述】:
我一直在尝试从具有嵌套列表的数据框中提取数据,但在尝试使用字符串函数 (str_detect) 后,我只能处理变量 Abstract 这里是我的数据示例
{r setup, include=FALSE}
library(RISmed)
library(reticulate)
library(dplyr)
library(tibble)
library(stringr)
RCT_topic <- 'Randomized Clinical Trial'
RCT_query <- EUtilsSummary(RCT_topic, mindate=2005, maxdate=2015, retmax=2000)
summary(RCT_query)
RCT_records <- EUtilsGet(RCT_query)
RCT_data <- data_frame('PMID'=PMID(RCT_records),
'Title'=ArticleTitle(RCT_records),
'Abstract'=AbstractText(RCT_records),
'Year Published'=YearPubmed(RCT_records),
'Month Published'=MonthPubmed(RCT_records),
'Country'= Country(RCT_records),
'Grant' =GrantID(RCT_records),
'Acronym' =Acronym(RCT_records),
'Agency' =Agency(RCT_records),
'Mesh'=Mesh(RCT_records))
#Latino
RCT_data$Latino <- grepl("Latino|latino|Hispanic|hispanic",RCT_data$Abstract)
table(RCT_data$Latino)
RCT_true = RCT_data[RCT_data$Latino == "TRUE",]
RCT_true %>% str_detect("Hispanic Americans")
RCT_true %>% mutate(Latino_Mesh = ifelse(Mesh %>% str_detect("Latino|latino|Hispanic|hispanic"), "yes", "no"))
此代码将创建 R 已读取的 11 个观察值的子集,在变量 Abstract 中包含 latino 或 hispanic 这个词,我试图找到一种方法让 R 读取变量 Mesh 但它没有似乎能够阅读整个嵌套列表,即使当您看到每个变量时,您也可以清楚地看到列表中有西班牙裔美国人这个词
{r}
RCT_true$Mesh
我正在尝试找到一种方法,以便 R 可以读取 RCT_true$Mesh 并返回是的,在新列中有一个单词“西班牙裔美国人”,就像我之前使用抽象变量所做的那样
【问题讨论】:
标签: r mesh stringr text-extraction