【发布时间】:2023-03-26 14:55:01
【问题描述】:
我正在尝试比较销售数据中的数据,其中数据集 1(A 列)在数据集 2(B 列)之前出现。通常,这些数据按时间顺序排列,但并排粘贴时并不总是也不会逐行排列。这是因为 A 列只是交易总额,而 B 列包含拆分为产品总额的交易。例如:
Bob 购买了 2 美元的小部件、3 美元的球和 5 美元的棍子。在我看来,数据输入将是 A 列 $10 和 B 列 $2、$3 和 $5。
但是,这些事务并不经常发生,我需要将它们与整个数据集和任何不匹配的数据隔离开来。大多数数据通常具有一对一的事务。例如:
Fred 购买了 5 美元的小部件。 A栏$5 B栏$5。
突出显示匹配的 1 对 1 数字单元格并将赔率填充空白将是最佳选择。
我尝试了一些公式,并且获得了近 90% 的成功率,这很接近,但令人沮丧。基本上只需要一个公式来格式化在两列中具有 1 对 1 唯一匹配的单元格,并突出显示没有伙伴的单元格。也必须按时间顺序完成(所以说 A 列第 112 行不能匹配 B 列第 56 行)。
所以如果有人能帮助我,那就太棒了。我唯一的其他选择是手动分析 10,000 多行。拯救我的互联网!
ps - 抱歉格式化,无法排成一行,因为它认为我在编码。
【问题讨论】:
-
您将需要超过 2 列来解决这个问题。您需要提供密钥和金额 - 密钥可以是时间戳,也可以是名称(例如 Bill)。您在两组数据中都需要这个,所以 A = Bill,B = 5,C = Bill D = 5。如果你能做到这一点,(并且你的关键数据必须是唯一的),那么你可以正确解决这个问题.如果您有这些信息,我相信我或其他人可以提供解决方案。问题是目前没有办法防止匹配相同值的不适当重复。即使在您的问题中,您也提到了有关日期的内容。
-
有日期,但 80% 的时间它们没有对齐。 A 列中的数据总是首先出现(其网站数据),然后 b 列是与我们系统交互的网站。有时可能会有延迟,但 80% 的时间是正确的。如果使用日期可以消除仍然有帮助的好块。我有两个日期数据集。一种是白天,另一种是计时到秒,有时在记录到 B 数据时会有延迟。
-
如果有帮助,数据将按时间顺序排序 99.9%。因此,一个刚刚抓住下一个匹配项的公式可以说 20 行应该可以工作。
-
看来我们需要使用vba。但首先要提供一个样本。
-
docs.google.com/spreadsheets/d/… 我没有副本,也无法共享数据本身的副本(机密,失业等)。但我已经准确地重新创建了它的样子,只是多了 30,000 行的图像。
标签: excel duplicates formula