【发布时间】:2018-04-21 18:37:48
【问题描述】:
感谢您的帮助。我有一个大型数据集,我正在尝试查询一长列包含 2-3 个单词的短语。
我正在使用以下代码来尝试找出重复单词的频率。下面的示例数据。
我的问题是代码无法解析 - 我认为这是因为数据中有一些特殊字符。
一些日语、一些版权标志、URL 和希腊符号。
1) 有没有办法轻松删除带有特殊字符的行?
2) 我做错了什么吗?
3) 我将如何执行与此处相同的频率公式 - 但使用两个单词短语和三个单词阶段?
=ArrayFormula(QUERY(TRANSPOSE(SPLIT(JOIN(" ";B3:B);" ")& .
{"";""});"select Col1, count(Col2) group by Col1 order by count(Col2)
desc limit 10 label Col1 'Word', count(Col2) 'Frequency'";0))
顺便说一句,我从这里收到了代码。 Google Docs spreadsheet formula for most frequent keywords
【问题讨论】:
标签: google-sheets special-characters google-sheets-query