【问题标题】:Finding the likelihood of a string across multiple columns?查找跨多个列的字符串的可能性?
【发布时间】:2022-01-01 12:26:32
【问题描述】:
我正在处理电影制作租赁数据,并有兴趣根据 4 个类似客户的租赁历史生成理想的租赁包。
我已将他们的租金分成 4 个表格,并希望根据他们再次租用的可能性对新的“项目”列表进行排序......我假设这将基于“项目”相交的频率所有 4 个出租历史?即使仅找到这个百分比也会有很大帮助。
之前没有统计经验,就最佳实践而言,我不知所措,如果有任何见解,我将不胜感激。下面的示例有 4 个租用历史记录,租用次数为 # 次。我在 M 列中生成了一个唯一的项目列表。
Example spreadsheet
【问题讨论】:
标签:
google-sheets
multiple-columns
probability
percentage
similarity
【解决方案1】:
你可以试试QUERY:
=QUERY({A3:B;D3:E;G3:H;J3:K},
"SELECT Col1, SUM(Col2), COUNT(Col1), COUNT(Col1)/4*100
GROUP BY Col1
ORDER BY COUNT(Col1) DESC
LABEL Col1 'Item',
SUM(Col2) 'Sum Of Rentals',
COUNT(Col1) 'Count in Lists',
COUNT(Col1)/4*100 'Percentage in Lists'")