【问题标题】:How do I remove rows with special characters from Google Sheets?如何从 Google 表格中删除带有特殊字符的行?
【发布时间】:2018-04-21 18:37:48
【问题描述】:

感谢您的帮助。我有一个大型数据集,我正在尝试查询一长列包含 2-3 个单词的短语。

我正在使用以下代码来尝试找出重复单词的频率。下面的示例数据。

我的问题是代码无法解析 - 我认为这是因为数据中有一些特殊字符。

一些日语、一些版权标志、URL 和希腊符号。

1) 有没有办法轻松删除带有特殊字符的行?

2) 我做错了什么吗?

3) 我将如何执行与此处相同的频率公式 - 但使用两个单词短语和三个单词阶段?

=ArrayFormula(QUERY(TRANSPOSE(SPLIT(JOIN(" ";B3:B);" ")& . 
{"";""});"select Col1, count(Col2) group by Col1 order by count(Col2) 
desc limit 10 label Col1 'Word', count(Col2) 'Frequency'";0))

顺便说一句,我从这里收到了代码。 Google Docs spreadsheet formula for most frequent keywords

【问题讨论】:

    标签: google-sheets special-characters google-sheets-query


    【解决方案1】:

    除了额外的“。”该公式似乎引用了错误的列。试试这个:

    =ArrayFormula(QUERY(TRANSPOSE(SPLIT(JOIN(" ",A:A)," ")&{"";""}),"select Col1, count(Col2) group by Col1 order by count(Col2) desc label Col1 'Word', count(Col2) 'Frequency'",0))
    

    这也算全部,而不仅仅是前 10 名。

    我认为这种方法不适用于两个单词短语。

    【讨论】:

    • 谢谢 - 感谢您的帮助。我提供的代码适用于其中没有特殊字符的数据。我只需要知道如何在不手动操作的情况下删除带有特殊字符的行。您建议的代码也不起作用
    • 我尝试的任何特殊字符都可以正常工作。你能举个例子说明什么是行不通的吗?
    猜你喜欢
    • 2018-01-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-09-11
    • 2018-05-31
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多