【发布时间】:2021-09-06 14:02:23
【问题描述】:
我正在尝试找到一种方法来汇总大型数据集(15,000 行/50 列。50 列是 ID、类别(5 个唯一类别)和 4 年的每月总数。
每个 ID 可以多次具有相同的类别(因为每月总计来自 3 个不同的数据源。
我最终需要的是每个 id 最多可以有 5 行。有些会有 2 或 3 或 4 个。不是每个 ID 都会有 5 个。
我正在考虑为每个类别的每个 id 找到开始行和结束行。然后将 50 列中的每一列 1 与 1 相加,将总数写在起始行并删除每个类别的剩余行。
重复下一个 ID/类别组合。
以下是我想要达到的以下示例。我想我可以做一个数据透视表,然后通读数据透视表(在写入数据之前),但我不确定这会快得多。我对在 Excel 数据集上使用 SQL 非常陌生,并且只根据特定标准进行了选择。我曾尝试使用 SQL 并汇总数据,但运气不佳(因为我不知道自己在做什么)。
任何建议将不胜感激。提前感谢您提供的任何帮助.....
【问题讨论】:
-
您可以在 Power Query 中轻松做到这一点(在 Windows Excel 2010+ 和 Office365 中可用)。
-
@RonRosenfeld..........我将其添加到宏中。当我第二次运行它时,它说查询已经存在。所以,经过一番研究。我找到了一些代码来刷新我认为可行的查询。我担心的是我希望每次运行宏时行数都会改变。一次可能是 16,000 行,然后是 12,000 行。我不希望每次都一样。第一次跑的时候。我设置了确切行数的范围。下次会有所不同。我该如何解决。完成后是否删除查询。然后下次加?谢谢
-
查询使用表名引用访问数据。添加/删除行时,表格将自动调整大小。只要你的代码不绕过它,应该不是问题。
-
@RonRosenfeld .....感谢您的帮助....感谢您的建议...