
随着互联网的深入发展,全球进入数据驱动经济社会发展的时代。什么是数据?数据对我们有用吗?如何实现从数据到价值的转化?北大光华学院教授王汉生在他的这本《数据思维》(中国人民大学出版社出版)为我们解答了上述问题。本书可以被看作商业分析领域入门级通俗且有趣的读物,深入浅出,雅俗共赏。
数据产业实践的核心任务是产生价值
当其他数据科学书籍都在谈论算法模型的时候,这本书选择了研究数据、价值,以及从数据到价值的可实现路径。在这一方法论的指引下,作者分享了一系列非常有趣的案例,横跨很多重要的新兴行业,例如车联网、消费金融等。作者在第一章介绍了朴素的数据价值观,解读数据与价值的逻辑关系。他认为,“凡是可以电子化记录的其实都是数据。”
“大数据”时代,人们渴望通过数据找到解决问题的思路,把数据当作资产和生产力要素,通过对数据资料进行透视,提炼出有价值的信息。培养数据素养或数据思维,要有意识地利用数据资料,学会从数据资料中提炼出有价值的信息。因此,作者认为,数据产业实践的核心任务是让数据产生价值。更确切地说,是在真实的产业环境中,让数据产生可被产品化的商业价值。
数据的商业价值三要素是收入、支出和风险。任何数据产品,如果可以帮助客户,在这三个方面中的任何一个方面实现可量化的改进,那么这个数据的商业价值就比较明朗。例如一个开发者开发数据产品后需要问自己:我的数据产品能否为客户带来额外的收入?我的数据产品能帮助用户节省成本么(减少支出)?我的数据产品能帮助用户降低风险么?如果上述任意一个问题的回答是“是”,那么这个数据产品就是可以帮助用户把数据转变为价值的产品。这个数据价值观很朴素,以终为始,确保数据是有价值的,而不是理论、技术、框架、PPT或其他。
回归分析是梳理大数据业务的核心
当有了数据以后,我们就要“看到数据”。当我们面对一大堆黑麻麻的数据报表时,是很难产生兴趣并得出结论的。随着大数据行业的发展,用户对数据可视化的要求越来越高,好的可视化能力能够使用户更快地理解所要表达的内容,更加形象生动。所谓“字不如表,表不如图”,图表的重要性可见一斑。
文中,作者介绍了最基本的数据可视化方法(统计图表)的规范与有趣应用,他认为,要学会将数据通过图表的方式传递出来,让用户能够快速、准确地理解所要表达的信息,从而提高沟通效率。
学过统计学的人都知道一件事,回归分析是数据分析的一个非常重要的模型方法。而且这些模型很可能是线性的、非线性的,也可能是参数的、非参数的,不尽相同。所以,把数据转化为价值,需要回归分析这个非常重要且精妙的思想方法。文中,作者用了最简单的形式讲解这个部分,即Y=f(x)。把Y定义为问题和核心关注点,把x定义为变量,把f()定义为原因、形式、增量等;几乎所有的问题(Y)都会有无数个原因(x)和无数种形式(f())出现。回归分析是抽象出所有大数据业务的模型核心,即理论上来说可以围绕核心问题寻找引起核心问题变化的因素和方式。
当我们有了数据分析和模型之后,下一个问题就是如何把它产品化。所谓的产品,不一定是一个物理存在的实体,它可以是一个优化的流程,可以是一项制度,可以是一款软件或者小程序,任何在商业环境中被实施而且产生价值的,都叫作产品。该书在最后章节就介绍了这部分内容,即“数据模型如何产品化”,作者用这些基础知识推演和分析现实生活中的具体问题,通过各行各业的案例进行详解,行业分布包括互联网金融、车联网、学校、企业、电影、电商等。(王晗)