【发布时间】:2019-01-07 16:51:36
【问题描述】:
我有一个脚本,用于删除一些推文并将结果保存到 Google BigQuery。当我看到存储的数据时,➕、♂️、Ñ、áéíóú 等特殊字符会正确显示,但是当我尝试再次将数据导入 R 时,它们会被一些奇怪的字符替换。这是一个例子。
# Create df
id_tweet <- 1023985670224785408
tweet <- "◉ Neuroeducación y entornos digitales de aprendizaje: un paso obligado para educadores, pedagogos y psicólogos"
descripcion <- "Desde las alturas se ve todo de otra manera... ️ ➕ ♂️"
data <- data.frame(id, tweet, description)
# Save to Google BQ
library(bigrquery)
insert_upload_job("project-id", "dataset", "table", data , write_disposition = "WRITE_APPEND")
#Load from Gooble BQ
sql <- paste("SELECT *", "FROM", "`project-id.dataset.table`")
data <- query_exec(sql, project = "project-id", use_legacy_sql = FALSE)
我的输出如下:
> data
id_tweet
283 1023985670224785408
tweet
283 ◉ Neuroeducación y entornos digitales de aprendizaje: un paso obligado para educadores, pedagogos y psicólogos
descripcion
283 Desde las alturas se ve todo de otra manera... ï¿½ï¿½ï¸ âž• ��<U+200D>â™‚ï¸ ï¿½ï¿½ ��
我想要的是保持原来的格式。
我该怎么办?
谢谢,
【问题讨论】:
-
我可以在最后尝试这段代码,一切对我来说都很好。我在
id_tweet和descripcion的数据框构造中更改了id和despcription,但我认为这是您的问题中的错字。你可以在执行这个命令data <- data.frame(id, tweet, description)之后输出数据吗?还要检查 BQ 表的架构
标签: r twitter google-bigquery