TUhjnbcbe - 2021/4/30 1:08:00
大数据中的因果关系及其哲学内涵王天思摘要:在大数据中,数据化使因果关系量化为变量之间的关系,在获得关系强度和正负性质的同时,丧失了原有的必然性和方向性。大数据的相关关系,进一步展开了因果概念的重新刻画:因果关系是对因素相互作用过程与其效应之间关联的描述;而相关关系所描述的则是因果派生关系。作为因果派生关系,相关关系根植于因果性;作为未进入相互作用过程凝固为因果关系的因素关系,相关关系提供了由因素创构结果的广阔空间,这正是数据物化的因果性根据;而作为因素分析,相关定量分析的因果派生依据则构成大数据分析的因果基础。大数据中因果关系的厘清,晓示了其深层哲学内涵。因素关系的未来空间凸显创构认识论,因果派生关系的全数据定量分析呈现量的整体把握,而因果关系从描述到创构则彰显哲学以满足人的需要为最终目的。关键词:大数据;相关关系;因果关系;数据物化“大数据”(big data)概念最早出现于《科学》杂志刊载的《大数据的处理程序》(1998)一文,此后《自然》杂志于2008年9月出版“大数据”专刊,短短十数年,“大数据”浪潮以人们难以想象的速度和让人始料未及的方式袭来。大数据一方面对传统的因果关系理论提出了挑战,另一方面又给因果概念的进一步展开提供了更高层次的整体观照。作为一种信息存在方式,大数据中因果关系和相关关系问题的错综交织,成为当前需要面对和思考的哲学课题。一、相关关系的因果性根基关于大数据的看法,最引人注目的观点无疑是强调要注重相关关系而忽略因果关系,甚至某种程度上认为相关关系可以取代因果关系。(一)因果性和相关性的关系问题当人们正掂量“依赖模型的实在论”还有多少实在感时,有人基于大数据,从“模型都是错的,只是有些有用”,推出了理论终结的结论。30年前基于统计模型得到的模型观,今天在大数据时代被赋予了新的含义:模型的过时,意味着“理论的终结”。2008年,美国《连线》杂志主编克里斯·安德森(Chris Anderson)以《理论的终结》为题发表论文,认为“有了足够的数据,数字会自己说话”,因而“相关关系足够了”。“相关关系取代因果关系,而科学甚至可以没有连贯一致的模型、统一的理论,或者实际上可以完全没有任何机制性解释而发展”。一些被看作是从大数据推出,因而影响广泛的观点认为,“大数据时代最惊心动魄的挑战,就是社会将需要从对因果关系的某种痴迷中蜕出,而代之以简单的相关关系。在大数据基础上建立起来的模型没有关于‘为什么’的理解,只有‘是什么’。大数据是关于‘是什么’而不是‘为什么’的”。这种观点甚至断言,“确认因果机制是一种自诩得意的幻相,大数据推翻了这个假象。我们又一次陷入一个历史绝境:在这里‘上帝死了’。”这些现在比较流行的观点,既涉及大数据时代的重要观念转变,同时也与因果关系的认识迷雾密切相关,而且往往两方面相互交织。迷雾出自因果关系的传统理解,而重要识见则源于信息时代认识的深化。因果关系是人类理性行为与活动的基本依据,人类理性本身不可能否定因果关系,但大数据所凸显的相关关系,的确从实践层面实质性地推进了对传统因果概念的深入反思。随着思考的深入,重重迷雾中的问题所在日渐明确:“大数据中一个耳熟能详的说法是:大数据长于分析相关关系,而非因果关系。但这可能是一个伪命题。如何从相关关系中推断出因果关系,才是大数据真正问题所在。”目前亟待探索和解决的,正是有关大数据的这一问题。而这一问题的解决,还在于因果性和相关性问题的澄清。对于因果关系来说,物的数据化过程意味着特殊的遭遇。因果关系的这种遭际,无疑是大数据的发展带来的,但问题的根源却还在因果观念本身的发展困境。由于“本原”的辉映,古希腊哲人认为智慧是关于原因的科学,因而关于因果观念,最先