【问题标题】:how to identify locations from text如何从文本中识别位置
【发布时间】:2018-03-03 16:58:02
【问题描述】:

这是我获取代码的函数的示例

df= read.csv("secondary.csv",header = TRUE)

【问题讨论】:

    标签: r api for-loop while-loop geocoding


    【解决方案1】:
    S <- "s / O sk hungu 101 / 90 MODEL HOUSE TALAB GAGNI SHUKUL LUCKNOW UTTAR PRADESH LUCKNOW UTTAR PRADESH 226001"
    

    我建议制作所有可能的 N-x 个字符串,其中 N 是字符串的长度,x 是可变长度

    allchr <- unlist(strsplit(S, ""))
    listsubstr <- sapply(1:length(allchr), function(I) paste0(allchr[I:length(allchr)], collapse=""))
    
      # [1] "s / O sk hungu 101 / 90 MODEL HOUSE TALAB GAGNI SHUKUL LUCKNOW UTTAR PRADESH LUCKNOW UTTAR PRADESH 226001"
      # [2] " / O sk hungu 101 / 90 MODEL HOUSE TALAB GAGNI SHUKUL LUCKNOW UTTAR PRADESH LUCKNOW UTTAR PRADESH 226001" 
      # [3] "/ O sk hungu 101 / 90 MODEL HOUSE TALAB GAGNI SHUKUL LUCKNOW UTTAR PRADESH LUCKNOW UTTAR PRADESH 226001"  
      # [4] " O sk hungu 101 / 90 MODEL HOUSE TALAB GAGNI SHUKUL LUCKNOW UTTAR PRADESH LUCKNOW UTTAR PRADESH 226001" 
    

    您可以遍历此列表以检查有效的地理编码。我必须提供伪代码,因为我不确定如何检查字符串是否是有效的地理代码。

    sapply(listsubstr, function(I) is.geocode(I))     # contains pseudocode
    

    你也可以通过递归来做到这一点。

    myfun <- function(x) {
                 if (x is gecode) { # contains pseudocode
                       return(x)
                 } else {
                       myfun(substr(x, 2, nchar(S)))
                 }
             }
    

    【讨论】:

    • 这里的 myfun 是什么以及如何将其应用于数据集中的整个列 我正在尝试类似 allchr
    • 使用您的数据格式和对您想要的解决方案的更多限制来编辑您的原始帖子。
    • 能否请您看一下我编辑的问题并指导我,我将非常感谢您
    猜你喜欢
    • 1970-01-01
    • 2010-11-15
    • 1970-01-01
    • 2020-10-25
    • 1970-01-01
    • 2017-02-14
    • 1970-01-01
    • 2011-03-04
    • 1970-01-01
    相关资源
    最近更新 更多