昨天我的文章「请中国联通给个解释」发出不多久之后,中国联通大数据就把微博上的报告给删了。然后今天早上看的时候自己也悻悻地把微信公众号发布的那份报告也删了。所以简言之就是自己也意识到了数据的问题,然后给删除了。

昨天文章发出之后,很多人说是不是有人花钱买榜单,老实说这事情没必要。另外因为之前我有一些事情求助,也认识了Blued的一位朋友,他们表示自己也是躺枪,没有什么Py交易的。

也有人问是不是统计口径的问题,但是一个MAU数据首先统计口径就应该是类似的,另外同一榜单上面QQ和微信的的数据显然是对的,所以100%不是统计口径的问题。

所以问题归结到底是联通自己数据的问题,昨天读者「呜邶勒硌剌」在后台给我留言:联通的数据都是用自己的过网数据去反推全网数据,数据差异大应该是算法出了问题。这玩意儿只能说见怪不怪,给我们这百万级人口的城市推出面向政务的人口流动数据统计系统,自己内部两个子公司打架,两个系统给出的数据差距达到了几十万。

读者「嘉祥」同时留言:联通的数据是根据通过联通移动用户的访问量按照联通移动用户在全国移动用户占比推算出来的。

到这里我就有点不懂了,如果联通使用自己的流量占比去反推全网的流量,联通的份额是20%,以易观的数据Blued的月活数据是300万为准,中国联通估算出来的数据是6000万,则联通的数据是实际数据的20倍。

联通心虚了~

那么相当于Blued中使用联通的MAU就达到了300万/20%=1500万,只有当联通中Blued的月活达到1500万的时候,他才能反推出整个市场Blued的流量是6000万。但光光是是1500万这个数据就肯定不对。

所以,我更倾向于联通大数据自己搞错了数据,不是一个计算算法的问题,即不是联通所解释的反推的问题。那么到底联通大数据搞错了什么?我看着联通大数据也不会出来解释的样子,默默删除了文章就当没事发生了。

哦,说到了最后,我突然想起来昨天后台有一位读者说:一份榜单没必要较真,错了就错了,影响也不大。

其实如果是小厂出的报告,错了就是错了,但是像联通出的这种报告看到的人是很多的(昨天我在朋友圈看到不少数据大V都转发了这个报告,另外我在的一些数据分析群有讨论这个报告),这就说明这份报告在圈内是有影响的。

而且因为是联通这种巨型公司出的报告,人们认为更有权威性。在日后很多人文章、文献等可能都会引用,最后得出的一些结论都是错的,影响决策和推断,这是很可怕的事情。

所以作为一个数据人一个互联网人,我所做的是希望大家在做数据出口的时候认真审核自己的数据,避免造成不必要的误解,尤其是大厂对数据出口更应该严谨。

相关文章:

  • 2021-07-14
  • 2021-04-01
  • 2022-01-05
  • 2021-08-12
  • 2021-10-18
  • 2021-10-17
  • 2021-11-11
  • 2022-01-24
猜你喜欢
  • 2021-06-22
  • 2021-09-03
  • 2021-06-17
  • 2022-03-03
  • 2021-06-19
  • 2021-07-13
  • 2021-03-27
相关资源
相似解决方案