算法,一种无情的霸权

齐鲁晚报     2020年09月12日
  《算法霸权:数学杀伤性武器的威胁》 [美]凯西·奥尼尔 著 中信出版集团
  近日,一篇名为《外卖骑手,困在系统里》的文章在朋友圈刷屏,文章称在外卖平台智能算法的深度学习下,外卖骑手送餐的时间被平台逐渐压缩。人们忍不住开始思考这样一个问题:数字经济的时代,我们究竟应该如何看待“算法”?数据学家凯西·奥尼尔在《算法霸权:数学杀伤性武器的威胁》一书中指出,我们生活在一个依赖“算法”的时代,大数据不仅影响着个人,也影响着整个社会,我们必须警惕——它们的存在,很有可能威胁到我们的社会结构。
  □凯西·奥尼尔

  2008年的金融危机使数学不仅卷入了世界问题中,还助推了其中的许多问题。房地产危机,重大金融机构倒闭,失业率上升,数学家通过运用神奇的公式成为这些问题的帮凶。而且,数学的功能特别强大,一旦数学与科技结合,系统的效率会提高,规模扩大,混乱和不幸就会倍增,我现在意识到这是一种缺陷。
  要是我们当时头脑清醒的话,就会后退一步思考,数学是怎么被我们误用的?我们该如何防止未来发生同样的灾祸?但是,金融危机以后,数学新技术比以往更热门,甚至延伸到更多领域,每时每刻都在搅动着海量信息,大多数数据都是由社交媒体或者电子商务网站搜刮而来。而且,数学逐渐不再关注全球金融市场动态,而是关注我们人类。数学家和统计学家一直在研究我们的欲望、行动和消费能力。他们一直在预测我们的信用,评估学生、职员、情人以及罪犯的潜力。
  这是大数据经济,收益前景非常可观。一个电脑程序可以在1-2秒内快速扫描成千上万份简历或是贷款申请,然后整理成清晰的列表,最有潜力的求职者位居前列。这不仅节约时间,而且还公平客观。毕竟,电脑程序不像人类带有个人偏见,只是一种处理无情数字的机器。到2010年左右,数学破天荒地介入人类事务,公众热烈欢迎数学这一工具。
  但是,我看到了麻烦。数学应用助推数据经济,但这些应用的建立是基于不可靠的人类所做的选择。有些选择无疑是出于好意。但是,其中有许多模型把人类偏见、误解和偏爱编入软件系统,这些系统日益操控我们的生活。这些数学模型像上帝一样模糊不清,只有该领域的最高牧师即数学家和计算机科学家才能明白模型是如何运作的。人们对模型得出的结论毫无争议,从不上诉,即使结论是错误的或是有害的。而且模型往往会惩罚社会中的穷人和受压迫的人,而富人因此更加富有。
  我为这些有害模型提出了一个名称:数学毁灭武器。接下来我将用一个例子向你们阐明这种模型的破坏特点。
  2007年,华盛顿特区新上任市长下定决心改善本市教学质量不佳的学校。当时流行的理论是学生学得不够好是因为老师教得不好,所以,教育总督李阳熙落实开除教学表现差的教师的计划,开发了一个叫做IMPACT的教师评估工具,在2009-2010学年底,华盛顿特区开除了得分垫底的2%的教师。第二年年底,又开除5%。
  五年级教师萨拉·韦索基似乎没有任何理由担心。她在麦克法兰中学仅任教两年就得到校长和学生家长的好评。校长表扬她对孩子专心,学生家长称她是“接触过的老师中最好的一个”。
  但是在2010-2011年年底,韦索基得到IMPACT的评分很惨。她的问题来自一个叫做增值模型的新评分系统,该系统用于评估数学和语言技能教学的效果。这个系统算法得出的分数占她总评分的一半,并且重要性超过学校领导和社区的好评。华盛顿特区别无选择只好开除她,以及IMPACT得分在最低限度之下的另外205名教师。
  韦索基当然觉得这些数字极其不公平,她想知道这些分数怎么得来的。
  华盛顿特区聘用麦斯迈提卡政策研究机构,该机构提出这套评估体系,测量特区学生的进步,然后计算学生的进步或退步多少能够归因于他们的老师。这当然不容易。研究人员知道,许多变量包括学生的社会经济背景、学习障碍影响等,都能影响学生学习成绩。评估算法必须要考虑到这些差异,这就是复杂的一个原因。
  如果你想要理解麦斯迈提卡政策研究机构处理的是什么问题,可以想象一个住在华盛顿特区东南部贫民区里的10岁小女孩。一学期以后,她要参加五年级标准化测试。然后她的生活继续。她可能有家庭矛盾或是家庭经济困难,也许她正在搬家或是在担心触犯了法律的哥哥,也许她不满意自己的体重或是在学校被欺辱。无论她的生活经历了什么,下一学年她要参加六年级学生的标准化测试。
  如果比较这两次测试的结果,分数应该会持平,或者希望是提高了。但是如果分数下降,很容易计算她和那些优秀学生之间的分数差距。
  但是,老师该为这一差距负多大责任呢?
  萨拉·韦索基在麦克法兰中学任教最后一年开学之前,她发现了五年级新生入学成绩的造假行为,这样一来,来年的成绩就会对他们不利,他们的老师也会成为表现不佳者。而韦索基认为这正是她现在的遭遇。
  但是,你不能状告一个数学毁灭武器。这也是数学毁灭武器可怕破坏力的原因之一。模型不会倾听,也不会屈服,对吸引力、威胁和哄骗以及逻辑通通充耳不闻,即使有充足的理由怀疑得出结论的数据。没错,如果自动化系统明显出错或者系统整体出错,程序师会修改算法。但多数情况下,程序的裁决不容置疑,而操作程序的人只能耸耸肩,好像在说,“嘿,你能怎么样?”
  如今,不严谨的数学模型掌控着诸多领域的经济。这些数学毁灭武器和迫使萨拉·韦索基结束华盛顿公立学校职业生涯的增值模型有很多相同特点:不透明,不被质疑,解释不通,这些模型按一定规模分类、定位或者“最大化利用”数百万人。大多数数学毁灭武器把运算结果和实际情况混淆,导致恶性循环。
  但是学区增值模型和寻找高额发薪日贷款潜在客户的数学毁灭武器之间有一个重要的区别。这二者有不同的结果。学区得到的是一种政治货币,即教师评估得以完成;企业得到的是本位货币:钞票。对于许多运用数学毁灭武器的公司来说,热钱涌入似乎证明模型奏效了。站在公司的角度,这是有意义的。当公司构建模型寻找客户或者操控绝望的借款人时,越来越多的盈利表明他们走对路了。问题是利润最后成了真理的象征,认为赚钱就是真理。
  这是因为数据学家经常忽视交易接收端的民众。他们当然明白数学毁灭武器必然会误解民众一段时间,把人群归错类,剥夺他们找到工作或者买房的机会。但是一般来说,数学模型操作者不会思考那些错误。他们的反馈是金钱,这也是他们的动机。他们设计的模型就是要吸收更多的数据,微调分析,让更多的热钱涌入。投资者当然尽享收益,继续将更多的钱投入数学模型公司。
  那么受害者呢?
  内行数据学家也许会说,没有数学模型是完美的,那些民众是附带受损。像萨拉·韦索基这样的人常常会被认为没有价值,不值得惋惜。他们也许会说,暂时忘记这些人,主要看那些从推荐引擎上获得有益建议的人群,或是在潘多拉上找到自己热爱的音乐的人,或者那些在领英上找到理想工作的人,还有在婚恋交友网站上找到爱情的人。想想这令人惊讶的方面,忽略那些不完美。



上一篇 下一篇