Tuesday, May 31, 2016

大数据时代的美国竞选——桑德斯和克林顿之间的数据囧事

这届美国大选,共和党一方因为商界大亨川普(Donald J Trump)出战并意外地领先群雄而吸引了绝大部分眼球。民主党这边稍逊风骚。虽然他们也有异军突起的参议员桑德斯(Bernie Sanders)高举起社会主义大旗,但其势头始终无法逼近风头稳健的主流希拉里·克林顿(Hillary Clinton)。因此民主党的初选,无论是政见还是辩论,都未能引起广泛注意。

倒是前些天突然发生的一起数据泄露“丑闻”,才让人们醒悟到民主党内部也在进行着激烈的初选博弈。

而这起所谓的丑闻,其实不过囧事一桩。


俗话说,一个人的能力常常体现在他的通讯录上。在与人打交道的政坛和商界,通讯录便是关系网,缺之寸步难行。而在民主选举的社会里,政客的通讯录不只是身边的朋友和敌人,更扩展到广泛的选民:哪些选民有可能对哪些主张支持或反对?哪些选民有可能会在选举日去为自己投一票?更重要的是,哪些选民更有可能为自己的竞选捐款献金?这些至关重要的信息都收集在政客的广义“通讯录”里,或者用现代的语言,数据库里。

前些天的丑闻,便是桑德斯的竞选班子成员“无意间”看到了克林顿班子的“通讯录”,因而“窃取”了对方最宝贵的政治情报。


美国只有总统的选举是全国性的。联邦参议员选举在各州范围举行、众议员在州内划出的选区内进行,而州一级或以下官员的选举则在更小的选区范围进行。在小选区里,候选人及其团队对当地的选民——至少是通常积极投票的那部分选民——有一定的切身了解,比较容易建立直接的联系,说服选民为自己捐款和投票。

这样的“零售式”竞选不适用于全州或全国性的选举。竞选总统更必须学会“批发式”地联系选民。大规模地联系选民方式主要有两种,其一是通过媒体广告、演讲、电视辩论等大众传播手段让选民认同自己;其二是组建庞大的竞选机构,发动大量的代言人和志愿者在各州各地为自己联络选民。如同战场,前者通常被称为“空中作战”,而后者则是“地面作战”。为了取胜,两者不可或缺。

“空战”为人熟知,它的成败主要取决于候选人的知名度、媒体形象和为了支付巨额广告费用的筹款能力。“地面作战”则相对隐蔽,比较不引人注意。其实,竞选中更多的人力物力是投入在地面部队。毕竟,选战的胜利最终取决于一个个的选民被说服成为自己的支持者,并在选举时为自己投出他们手中的那一票。

全国性的选举选民数量巨大,不可能漫天撒网去争取每一个选民,即使能做到也是浪费资源。有效的地面作战是知己知彼、有的放矢的运作,即对各选区、居民区的选民诸如政治倾向、关心的问题、参与热情等等基本情况事先有充足的了解,然后遴选可争取的对象,有针对性地进行游说、动员。要做到这一点,需要收集整理、不断更新大量琐碎的选民信息,加以各种数据分析手段,使之成为有效实用的工具。这正是当前“大数据”时代的拿手好戏。

最早在竞选中运用大数据技术的是这行业中的职业操作手。他们不是政客,而是在每个选举期时选择合适的候选人,加入其竞选阵营提供民意调查和数据分析等方面的咨询服务。因为他们的贡献,候选人的多数决策不再是靠直觉或猜测,而是在以数据支持的基础上做出,即根据确实情报来调整候选人的演讲措辞、辩论策略以及日程安排——去什么地方访问、会见哪一部分选民等等。

久而久之,这些职业咨询人各自积累了大量的选民资料,拥有相当规模的“通讯录”,成为竞选中不可或缺的力量,更是候选人不惜重资聘请的专家。2004年,共和党的布什总统在不利的形势下险胜民主党凯瑞的挑战,以极其微弱的优势获得连任。这一胜利在很大程度上归功于共和党旗下的咨询专家对选民信息的掌握和因此对竞选资源的有效分配。

痛定思痛,民主党在2005年决定建立他们自己的竞选大数据运作。与他们推崇集体协同的政治理念相符,民主党认为他们可以比共和党更高出一筹,在党内采用“民主集中制”:建立统一的选民“通讯录”,为该党所有候选人服务。每次选举开始时,每个候选人都会得到一份党部所掌握的最及时、详尽的选民信息数据库。党内初选期间,各候选人在此基础上各自进行自己的选民调查、访问、游说、动员等行动,其间所掌握的选民信息归自己所有,对其他候选人保密。一旦选举结束,所有这些信息全部上交,由党部汇总对统一的数据库进行修正和更新,形成新的版本供下一轮选举候选人使用。

这一资源共享的安排卓有成效。民主党在2008和2012两届大选中,在大数据的运用上已经超过共和党。他们党内初选结束后,所有候选人所收集到的数据均汇总提供给胜出的提名人,全党在资源上得以团结一致对外,为奥巴马两次赢得总统席位立下汗马功劳。尤其是2012年,奥巴马与罗姆尼的选战非常接近,最后结果取决于俄亥俄等一两个摇摆州,而这些州的结局又取决于其中几个摇摆选区,甚至是几个小镇。民主党的数据库精确地预测了几个关键选区在选举前夕的走向,引导奥巴马派出大批人马到那里走家访户,敦促、协助己方支持者前往投票站投票。正是这样的地面部队确保了那次选战的获胜。


民主党的这一战略决策在技术层面的具体实施上却也不是没有漏洞。为了数据共享和汇总的方便,民主党将他们的数据库外包给一家技术咨询公司,要求所有候选人自己的操作都在该公司的平台上进行。党内初选期间,各候选人在统一的数据库基础上建立自己的数据空间,它们之间由安全系统设立“火墙”隔离,互相之间无法串访。

今年12月18日,该技术公司在更新软件系统时意外地导致安全系统失效。在一个几十分钟期间,候选人的数据之间暂时不再有隔离。桑德斯竞选班子的成员因此看到了克林顿竞选班子所收集、分析的一部分数据文件。

克林顿竞选班子的人很快获知这一消息,大骇,立即举报指控桑德斯的人使用了黑客手段偷窃他们的私密情报,大有“水门事件”再现的架势。民主党党部风声鹤唳,干脆利落地冻结了桑德斯人员在整个系统的帐号,导致他们无法存取自己的数据材料,竞选行动几近瘫痪。舆论一时大哗。

桑德斯诉诸法庭,控告民主党党部,终于迫使对方在48小时后恢复了他们对自己数据资料的使用权。同时,他也在随后的民主党候选人辩论会上当众向克林顿道歉,并解雇了在该事件中负有直接责任的三名助手。似乎很快地平息了这场纠纷。

然而在幕后,波动还在继续。桑德斯的助手坚持他们是无辜的,只是在发现系统故障后想核实情况准备向党部报告,并没有盗用克林顿资料的企图。他们认为党部不分青红皂白冻结他们的帐户的行为才是对竞选行动的最大祸害,是党部偏袒克林顿一方的又一表现。(克林顿夫妇在民主党内根深蒂固,无论是党部还是那家管理民主党数据库的咨询公司高层都有很多是他们夫妇俩的旧部。)


2015年可以说是美国的数据安全灾年,从联邦政府到商界巨头都曾因为计算机系统的疏漏或被攻击造成多起重大数据外泄事件。克林顿本人一直无法摆脱她在国务卿任期内使用私人电邮帐户处理政府事务的不当行为的阴影。相比之下,民主党内部数据库管理中出现的纰漏并不是什么大事。但也正是这么一件囧事,又一次提醒人们大数据时代的威力和风险。

(12/29/2015)


米帝囧事

No comments:

Post a Comment