澳门新葡京网址入围中国欧盟商会第五届企业社会责任奖
澳门葡京娱乐  > 企业文化
more

《大数据将改变外语教学研究方法》

发布日期:2015-03-17 10:22:06 浏览量:510

    维克托·迈尔-舍恩伯格享有“大数据时代的预言家”美誉,由浙江人民出版社出版、盛阳燕和周涛翻译他的《大数据时代》在我国反响巨大,人们热议大数据并期待着他预言的生活、工作与思维的大变革。

    复旦大学计算机研究所所长施伯乐认为,数据在未来社会中具有革命性作用,大数据将是下一个社会发展阶段的“石油”和“金矿”。无论是个人、企业还是国家,谁能更好地抓住数据、理解数据、分析数据,谁就能在下一波的社会竞争中脱颖而出。关于数据的知识将成为个人知识结构中的必备要素和基础。

    宽带资本董事长田溯宁在《大数据时代》序言中写道:这“是我看到的最好的大数据著作,不管对于产业实践者,还是对于政府和公众结构,都是非常具有价值的”。他还说:“现代历史上的历次技术革命,中国均是学习者。而在这次云计算与大数据的新变革中,中国与世界的距离最小,在很多领域甚至还有着创新与领先的可能。重要我们以开放的心态、创新的勇气拥抱‘大数据时代’,就一定会抓住历史赋予中国创新的机会。”

    该书翻译得也好,译者是懂行的人,是大数据领域的专家,而且译者时不时在脚注里写出自己的看法或解释。排版也花了心思,把重要观点专门排成黑体,把例证变换字体排在方块内。

    维克托·迈尔-舍恩伯格和肯尼思·库克耶在《大数据时代》中谈到三大变化:第一,现在的科学研究技术能分析更多的数据,有时甚至是关于某个现象的全部数据,因此不再依赖随机采样。他们提出的目标是“样本=总体”。第二,数据如此之多,所以研究者不再热衷于追求精确度,在宏观层面有更好的洞察力。第三,不再热衷于寻找因果关系,而更注重相关关系。这三条也许会彻底改变外语澳门新葡京官网研究领域的科研方法。

    从前,因为我收集的数据少,所以依赖随机抽样,也因此而讲究精准。因为观察范围小,只能人工设计实验以求得因果关系。但是,抽样再精确,推理出的总体统计也有偏差;实验设计再好,也是人工控制了某个或某些变量,跟真实状态有差异。迈尔-舍恩伯格和库克耶在书中说:“大数据对个人的影响是最惊人的。在一个可能性和相关性占主导地位的世界里,专业性变得不那么重要了。行业专家不会消失,但是他们必须与数据表达的信息进行博弈。如同在电影《点球成金》里,棒球星探们在统计学家面前相形见绌———直觉的判断被迫让位于精准度数据分析。这将迫使人们调整在管理、决策、人力资源和澳门新葡京官网方面的传统理念”。

    在电影《点球成金》里发生了什么?该电影改编自2003年出版的《魔球———逆境制胜的智慧》,它被《财富》杂志推荐为75本商业必读书之一。这本书记录了美国体育界一个真实的商业奇迹:“烂队”奥克兰运动家队自从采纳了一种基于精算、概率论等的计算程序后,横空出世,拉扯着一帮“哀兵败将”型球员,创下103场比赛连胜的纪录。这是一部财经电影:统计学、会计学、经济学、管理学、矩阵计算、矢量计算、精算、概率论……搭建起一个传说中的完美数学模型。

    下面就根据迈尔-舍恩伯格和肯尼思·库克耶的论断,引申出几个问题。

    1. 如何取得大数据

    既然大数据这么重要,那么大数据在哪里?我们如何获得大数据呢?有关外语澳门新葡京官网和学习的大数据从何而来?不可否认,现阶段,有关外语澳门新葡京官网和学习的数据还是有限的。但是,每天产生的数据是巨量的,收集和存储就显得非常必要和迫切。一旦开始网络教学、网上辅导、网上考试、网上报名、网上缴费、网上取得毕业证书等等,人们就可以有意识地对有关信息开展物联网、云储存、云端分析、云端分享等,为开展各式各样的科研提供条件。英语教师和英语语言学习的研究者应该阅读关于大数据的文献,深刻了解大数据时代的特点及其可能性。

    2.随机抽样由盛而衰

    对于一个曾经用量化方式做过语言教学研究的来说,随机抽样是必不可少的方法。随机抽样使得数字时代前的大量数据分析成为可能。但是,抽样研究有局限性,许多信息丢失了。迈尔-舍恩伯格举了一个例子。具有革新性的Lytro照相机把大数据运用到了基本的摄影中,与传统相机只能记录一束光不同,它能记录整个光场里所有的光,达到1100万束光。具体生成什么照片则可在拍摄后根据需要而定。这就等于收集了全部数据,“样本=总体”。因此,这些照片就更具有“可循环利用性”。普通照相机就像随机抽样,拍摄前必须决定聚焦点。

    随机抽样虽然优点突出,但是它是没有办法的办法。从前我们没有能力调查研究10亿人,所以只好随机抽样200人。现在的大数据常常包括几百亿、甚至几千亿的被研究者。在人们有能力全面利用大数据开展外语科研之前,只能采用随机抽样的方法。但随着大数据的普及,人们可能会在某项研究中达到或接近“样本=总体”的境界,那个时候就不在需要随机抽样了。当然,这个过程可能会很漫长。迈尔-舍恩伯格说:“要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不是应该竭力避免的”。他还说,世界上只存在一个唯一真理的想法已经过时了;再去追求它是对注意力的分散。传统数据库的设计要求在不同的时间提供一致的结果。但是,随着数据量的大幅增加以及系统用户的增加,此类一致性将难以保持。以后的大数据库不再固定在某个地方,而是分散在多个硬盘和多台电脑上。为了确保其运行的稳定性和速度,一个记录可能分开存储在两三个地方。当服务器上每秒钟都接受成千上万条搜索指令时,同步更新记录就不太现实了。因此,承认多样性是解决问题的办法。我们也许要学会容忍模糊性和不确定性———只要能对事物有个清楚的、完整的概念,其中掺杂点模糊也可以接受。

    3. 因果关系和相关关系

    相关关系比较容易发现,因果关系很难判定。人们也许能预测许多事情,但无法解释其背后的原因。例如书中提到的,医生依靠大数据取得了病理分析,制定出治疗方案,但却无法说明其病学干预的合理性。迈尔-舍恩伯格说:“大数据标志着人类在寻求量化和认识世界的道路上前进了一大步。过去不可计量、存储、分析和共享的很多东西都被数据化了。拥有大量的数据和更多不那么精确的数据为我们理解世界打开了一扇新的大门。社会因此放弃了寻找因果关系的传统偏好,开始挖掘相关关系的好处”。

    已有许多例证说明相关关系重于因果关系。谷歌也能预测流感:在某个特定的地理位置,越多的人通过谷歌搜索跟流感相关的词条,就表明该地区有越多的人患上了流感。还有沃尔玛通过分析无数个年轻女客户的购物趋势,便可预知哪些女孩成准妈妈了,于是提前给她们寄去孕妇必需品说明书。这些例子都说明,“知道是什么就够了,没必要知道为什么。”这等于说,知道相关关系就够了,没必要知道因果关系。在大数据背景下,相关关系大放异彩,它让我们能够更容易、更快捷、更清楚地分析事物。

    相关关系分析本身意义重大,它也为探讨因果关系奠定基础。如果存在因果关系,我们可以进一步找出背后的原因。我们还可以从相互联系中找出某些重要变量,将它们用到验证因果关系的实验中去。

    4. 研究者要学统计和计算方法

    统计学、会计学、经济学、管理学、矩阵计算、矢量计算、概率论、正态分布等知识和原理揭示出世界的某些自然规律,也许不会发生颠覆性的变化。但是,为应对大数据,计算技术和范式会向前跨出一大步。现在云计算、云存储等方兴未艾,以后肯定还会出现更多、更完美的计算方式。目前,很多研究者在用诸如SPSS之类的计算软件。随着大数据时代的到来,研究者就需要进一步学习统计方法,尽可能多地掌握计算方法。

    迈尔-舍恩伯格他们在书中说:“行业专家和技术专家的光芒都会因为统计学专家和数据专家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音……大数据的先锋们通常并不是来自他们做出极大贡献的领域。他们是数据分析家、人工智能专家、数学家或统计学家,但他们把自己掌握的技能运用到了各个领域。”这就意味着研究者们需要学习大数据分析。

随着数据规模的不断扩大,研究者将会开展许多过去无法开展的研究。在大数据时代,教授和学习行为将被记录为信息,然后被加以分析和利用,创造出不同的价值。

上一篇:《从新首富想到的》

下一篇:《大数据,大忽悠?—读大数据时代有感》