在一个越来虎重视大数据的市场上,你要谨记:品牌需要的是大数据后面的大洞察,而非“大数据”本身。十多年来,快递承运商和包裹运送公司UPS一直在尽量避免让运输车辆左转弯。
对追踪系统数据进行分析发现,避免车辆左转弯,可以节省时间和汽油。类似这样的洞察可以帮助企业更好地改进自己的服务,但是这样的洞察却很难发现,即使你拥有许多可用的数据。
UPS最早的数据分析要追溯到2001年,当时大数据还没有被大肆宣传。但是当时的确有事实表明,如果能够对企业经营和营销中获得的大量数据进行研究分析,企业将因此受益。2004年,UPS提出“不左转策略”,至今已节省1000万加仑汽油,为此减少的碳排放量超过10万吨。
在UPS分析中用到的追踪数据是否能称之为现在人们据说的“大数据”呢?这要看你对大数据怎么定义。如果UPS所有的运输车辆追踪数据都运用到分析中——当时大约是9万辆——那么根据牛津大学维克托·梅耶尔教授(Viktor Mayer)的说法,可以将它称为大数据。他在发表于《金融时报》的一篇文章中提到,他认为判断是不是大数据,要看运用的数据集是不是全部的数据集(N=All)。换句话说,你要避免样本偏差导致错误的结论,就必须分析所有数据。
当然,这仍然是今天大数据面临的一个主要问题。事实上,我们很少能让所用的数据集等于全部数据集。在《大数据:我们是否犯了大错?》(Big data:are we making a big mistake)一文中,维克托强调为什么大数据有可能让我们误入歧途,他引用样本偏差的例子,说明这种做法带来的后果,从而得出大数据可能让我们犯大错的结论。
他说:“大量新的廉价数据工具和强有力的分析工具将带来许多好处,对于这一点没人怀疑。已经有一些案例证明大数据分析工具的确能够带来非凡的业绩……但是问题在于,所有数据的重要性——不管是大数据还是小数据——都取决于数据来源的可靠性,以及对于分析者的信赖和预期。即使我们能够成功地解决先入为主的问题,并且了解研究中的所有运用,仍然有一个最大的问题:对于分析结果我们应该如何利用?如何让事情变得更好?”