提供的爬取软件来源于:52pojie.cn@夜泉 免费下载使用

《纽约时报》怎样玩“众包”?

方可成 新闻实验室 2015-01-18


「这里是方可成的新闻实验室,微信公众账号newslab」


§本文首发于2015年1月18日,这是新闻实验室的第52篇文章

§本文归属栏目:#显微镜#(详细介绍国内外可资借鉴的模式与案例)


作者:方可成

供《中国传媒科技》专栏稿件,转载需获授权


走在新闻业创新前沿的《纽约时报》研发实验室最近又推出了新玩意:一款叫“蜂巢(hive)”的众包开发平台。


要解释2014年12月问世的这款“蜂巢”,就得先回到该报此前在10月推出的另一款产品“Madison”。简单来说,Madison就是邀请千千万万的普通读者一起来帮《纽约时报》把老报纸里面的广告识别出来、分类妥帖,并录入信息至数据库。


1851年9月18日创刊的《纽约时报》,至今已经以每天一期的频率出版了一百六十多年,积累了极其庞大的过刊数据。都说新闻是历史的初稿,《纽约时报》的这些过刊数据不仅是报社自身的财富,也是供全世界回顾、研究历史的重要资料库。报社投入了巨大的人力物力将这些过刊进行电子化,展现在网站的“时光机(Time Machine)”栏目中,供大家“穿越”回到一个半世纪中的任何一个时间节点。


不过,“时光机”里的内容都是新闻报道,并没有包括广告。原因很容易理解:广告往往是图文结合,而且大小不一、形状各异,没有固定格式,机器难以自动从中提取信息,更难将其进行自动归类——将新闻报道归类是很容易的,一般只需要看它出现在哪个版面就可以了,但是广告的类型和位置之间并没有明确的对应关系,一款电视机的信息既可能出现在国际新闻旁边,也可能被放在体育赛事的信息下面。


此外,广告毕竟不是报社自行生产的内容,不被收入数据库也是再正常不过。但偏偏在对过刊进行电子化的过程中,《纽约时报》的研发实验室对广告产生了愈发浓厚的兴趣。他们认为,广告中实际上也是一个数据宝库,因为它们同样蕴含了相当丰富的信息,且能为它们环绕的新闻报道提供很有意思的时代背景作为参照。曾经到图书馆翻阅过老报刊的人相信都有同感:最有意思的往往不是报刊的文字内容,而是透出浓郁时代气息的广告:某款当时是“爆款”、现在土掉渣的眼镜,某台当时高科技、现在老掉牙的电子设备……还有那设计风格、广告语用词、零售价格,都是可供感知的历史细节,也是具有研究价值的数据。


于是研发实验室决定对广告也电子化,但是由于上面提到的种种困难,这项工作很难交给机器完成。他们决定借助人力,进行众包(crowdsourcing)。打开Madison的页面,任何人都可以立即参与这项历史资料的整理工作。从易到难有三种任务可供选择:判断某块内容是不是广告;给一则广告加上分类标签;录入一则广告的信息。



这些工作完全是无偿的,所以工作本身的社会价值及其趣味性就至关重要。幸运的是,这两点得到了许多普通网友的认可,他们既觉得这件事有价值,又发现翻看老报纸上的广告很有意思。首批上线供网友识别的广告都来自1960年代的报纸,这些数据有望于2015年初整理完毕,到时候《纽约时报》会将数据公开分享,同时1970年代的报纸广告会上线,继续众包给网友整理。


说回“蜂巢”——Madison是基于蜂巢平台开发的第一款众包产品。形象的说,蜂巢就好像一台3D打印机,Madison是它打出来的第一件产品。有了这台打印机,其他人也可以很方便地根据自己的需求生产出其他众包项目,邀请人们参与。你可以根据自己的需要选择项目特性:是需要注册才能参与呢,还是可以匿名参与。它还可以详细记录每个人的参与数据:完成了多少,合格了多少,跳过了多少。


实际上,西方新闻界的众包实践已经有若干年头了——它们往往是将工程量巨大、参与门槛相对较低的任务分包给网友。例如,2012年总统大选前,曾获普利策奖的网站ProPublica就推出过“Free the files”项目,请大家一起整理联邦通讯委员会(FCC)发布的大量且复杂的电视竞选广告数据,从中提取出广告的购买者等关键信息——在美国政治中,购买竞选广告是一种隐蔽的通过金钱支持某个政党、影响选举结果的方式,这个众包项目的宗旨就是要让这些暗处的钱现身在阳光下,而这依靠一个新闻机构的人力是无法完成的。此外,鼎鼎大名的维基解密,也是将巨量的加密文件众包给网友进行整理再发布的。


如今,《纽约时报》推出这款众包开发平台,无疑会进一步促进这种新型生产模式的普及。更重要的是,该报研发实验室已经将蜂巢的源代码上传到Github网站进行免费、开源的分享,这就让其他新闻机构和个人利用这个平台的门槛大大降低。推出这样一款蜂巢,既显示出《纽约时报》当仁不让的业界老大气派,也是互联网开放、共享精神的体现。从这一点上说,这家一百六十多岁的传统媒体,比很多乳臭未干的新媒体都更有互联网思维。




这里是方可成的新闻实验室,欢迎关注,期待与你产生化学反应

方法1:点击右上角的按钮,选择“查看公众账号”,点击关注

方法2:在添加朋友中搜索newslab

精选留言

暂无...
我的博客