在哲学界,关于因果关系的争论已经持续了几个世纪。争论的焦点在于:如果因果关系是普遍存在的,每一个果都有一个因和他相对应,世界上的所有事情都有因果的话,我们就没有决定任何事情的自由了。尽管哲学领域的争论很热烈,但并不耽误人们在日常生活中通过因果关系来思考问题。不仅如此,由于掌握的数据过少,人们还容易从线性关系的角度找寻事物之间的因果关系。在物理学中,有一种处理数据的方式之一就是“化曲为直”,设法找到两个变量之间的线性因果关系,从而进行定量的描述。事实上,由于很多事情之间的关系是很复杂的,简单的线性处理容易导致人们对事物本质属性的误解。
在大数据时代,相关关系比因果关系重要。2009年甲型H1N1流感发生之后,美国的卫生系统极力想从因果关系上来找到流感的源头,但信息反馈的速度太慢,让专家们束手无策。谷歌公司做出了快速反应,把5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行比较,研究特定检索词条的频繁使用与流感在时间和空间上的传播之间的联系,很快就确定了流感是从哪个地方传播出来的。谷歌采取的就是相关关系分析的方法,而不是因果关系分析的方法。这是大数据时代,对数据进行处理的一种典型方法。
第三,数据化比数字化更加重要
数字化是将模拟数据转化成0和1的二进制码,以便电脑进行数据处理的过程。过去的很长时间,我们所做的事情,就是对文本进行数字化。很多书籍包括教材,通过PDF等格式,变成了数字形态的资料,存入了电脑或者网路之中。
但是,这些数字化的资料要查询起来并不方便。首先你要知道所需的资料在那本书中,其次你还要仔细地去翻阅这些数字化的资源,以便找到你所需要的信息。这和到书本里去找没有本质的区别。
如果这些数字文本能够被数据化,文本中的字、词和段落能够一一被识别,利用搜索殷勤加以检索就会方便很多。所谓数据化就是将一种现象转化为可以制表分析的可量化的过程,量化,是数据化的核心。信息只能被数据化,其巨大的潜在价值才有可能被释放出来。
数字化带来了数据化,但数字化不能替代数据化。今天,很多学校都在进行“电子书包”的课程教学实践,但有不少实践者认为,所为电子书包,就是将纸质的课本和教辅资料数字化,装入电脑中让学生上课中使用,这其实是对电子书包最大的误解。电子书包的核心在于数据化,要通过对学生学习过程所记录的大数据分析,把握学生的个性化学习特征,以便给予更有针对性的指导。
三、需要关注的一些问题
从教育的角度看,大数据时代的来临,对教育的变革将带来巨大的影响。
首先是教育内容要进行革新。大数据使得传统的因果思维方式、科学研究方式不再是生活、工作起主导地位的方式,这必然要求我们在教学中要将这些变化和学生讲清楚,以便他们能够在今后走上社会的时候有足够的能力迎接挑战。
其次是教学方式要进行革新。过去的教学,因为没有大量数据的支撑,该教什么全凭教师自己跟着感觉走。今天,我们可以将教师的教学视频挂在晚上,通过深度分析学生在观看视频的过程中在哪些地方停顿或者重放的频次比较高,来找出学生不明确或者课程吸引人的地方,帮助教师改进教学、确定教学重点。这必然导致教师教学方式的变革。
第三是学习路径会发生变化。在过去,如果你想成为一个优秀的生物学家,一定要认识很多生物学家。今天,要解决一个生物难题,可能与天体物理学家或者数据视图设计师联系就可以实现。
第四是要防止对数据的痴迷。一方面,我们要研究学校长期以来储存下来的大量数据,同时积累学校每天的教育数据,为进入大数据时代做好充分的思想准备;另一方面,要唤醒学校里沉睡的数据,让其在学校管理和教师教学中发挥更大的作用;再一方面,也要防止出现另一个极端,那就是对数据的痴迷。能仅仅为了收集数据而收集数据,要让数据在如何全面反映一个学生的能力、全面反映教师的教育质量等方面做出实践和探索。