提供的爬取软件来源于:52pojie.cn@夜泉 免费下载使用

未来,搜索引擎如何站着挣钱?|文末有福利

Stefan Weitz 新闻实验室 2017-07-07

作者/Stefan Weitz
翻译/任颂华

支撑搜索的商业模式是否足够灵活,足以抛弃当前用来资助这些巨兽的模式?为了让我们获得这些新的体验,需要获取用户的信息,我们能平衡权利和自由吗?

系统中遍地黄金

赤裸裸的现实是,在线搜索系统的设计、建造和运作每年要花费数十亿美元。在今天,为这些研发提供资金的主流模式是网页上的文字广告。如果我们进入到下一代的搜索,页面上结果的排列不会单纯一致,右边也不再有广告。那么我们如何在资助如此庞大的企业和推动技术水平发展的需要之间找到平衡?

举个例子来说,2013年谷歌555亿美元的收入中有505亿美元来自广告。我们这么说不是指责公司的模式,而只是简单陈述一个事实。如果你的收入中有将近91%(你的大部分利润也是如此)是单一来源,你就不愿意抛弃那种模式。

不靠文本广告来创收的模式又如何呢?我们都见识过在在线媒体中插入传统媒体广告模式。比如“横幅广告条”(其实就相当于杂志或者报纸上的一小条印刷广告),还有“前置”视频(谁喜欢为了看45秒钟的视频先收看一段30秒的泛目标广告呢?)。随着我们的网络不再只是文本和视频而转向“完成任务”,为这些数十亿美元的开销找到资金的模式也要变化。现实是,这些企业如果想要持续提供服务,就需要庞大的资金。而营收可以直接来自使用这些服务的人们或者其他一些间接的方式。哪怕一个相对较小、只有5万个服务器的数据中心每个月至少也要花费350万美元来运作(假定服务器3年折旧,基础设施10年折旧)。我们还没有考虑互联网访问或者其上运行的软件费用。到了谷歌这个级别,一年花费150亿美元以上来运作是很有可能的。

未来搜索的商业模式

有人会说,完美的广告就是那种广告人有充分信心激发消费者采取行动的广告。这个行动不一定是购买产品或服务。实际上,人们在将形象与公司或产品加以关联的“品牌广告”上花费了数十亿美元。归根到底,广告有归属问题的困扰,也就是基本上很难从一位消费者可能收到的那么多消息中分辨出哪条对希望的结果做出了贡献(不论是购买行为、观念改变,还是感知度提升等)。

支撑搜索的系统怎样帮我们处理类似归属这样的问题呢?有人会这么认为,最终搜索会编织成一块纵横交错的整体。它理解你,理解你在现实世界和虚拟世界的行为。而你在日常生活中之所见能帮助连接你的行为和你所接触的市场。换句话说,在不久的将来,搜索有可能跟踪你什么时候第一次看到某个广告,同时也跟踪你看到该广告的所有场合,或者能注意到你在看到电子布告栏的一周后,在社交媒体上发布了购买该产品的消息。

我知道这听起来有点儿毛骨悚然。公众会喜欢这样的跟踪和追踪,只是为了帮助广告商了解他们花在广告上的回报吗?我也没有被完全说服。但除此之外还有别的方法吗?如今我们用来捕捉广告是否对购买或者观点产生影响的方法确实很不精确。类似“重定向”这样的动作使得看起来好像有人在整个网络上对你进行追踪。你有没有注意到,要是你在某个八卦网站点击了一个Leggs长筒袜的广告,你会在你的电子商务网站和其他网站看到更多Leggs长筒袜的广告?对我来说,这不光很傻,而且如果我正在CNN上阅读一篇关于伊朗的文章的话,这么做也完全脱离了上下文。

在我看来,下一代的广告模式将依赖于不同的频道,能根据需要的结果——无论是用户购买一个产品还是向她的好友推荐了某个品牌——向广告方收费。

另一种搜索付费方式

另外一种有可能解决为更先进的搜索付费的挑战的方法是让人们支付他们实际使用的服务。如今,每个人基本上不用支付任何搜索费用,但是这样并不公平。有人可能会认为,某人如果更多地使用搜索服务,就能产生更加有针对性的数据和广告点击,因此产生了更多的收入来冲抵他们使用这些服务而产生的费用。事实上,这个模式有一定的逻辑,但不是唯一的方式。

用户为服务付费的业务模式使搜索的快速发展充满希望。

事实上,一个随意、偶尔为之的搜索者在搜索律师或者医疗信息时,相比一个频繁搜索者在搜索名人新闻时,可能产生更多的收入。为什么呢?大部分搜索页面右侧的广告是竞拍而来的,这也意味着某些词语的费用要比别的词语高。而对于那些有可能从客户那里获取高额收入的词语(比如“医疗”或者“赌博”等类似的词语),每次点击可能要花上这位广告商35美元。这本质上没有什么不对的地方,但这似乎和基于用途的模型背道而驰,因为一个搜索者的“产值”并不一定与他们(以针对性的数据和广告点击的形式)“支付”给引擎多少收入相关。

有个方法在过去15年间一直被讨论,那就是微支付的概念。不是通过向用户展现广告作为支付服务的方式,而是为每个在线任务支付几分钱甚至一分钱都不到。一次搜索可能花费0.2分,一次即时聊天花上0.1分钱……本质上说,你采取的任何行动都要收费,这和生活中很多别的领域是一样的。大部分人和公司不会免费提供服务。搜索系统一样可以从用户那里收费,而不再依靠对其进行分析再交换这些数据来获得收入或者投放针对广告。这个模式对那些认为对人进行数据搜集是一个负面的举动、有着巨大滥用风险的人特别有吸引力。确实,我们已经看到有人愿意付钱来移除广告。像Spotify(音乐服务平台)和Pandora(音乐服务平台)这样的服务也有无广告的版本,只要你愿意付钱。最近有一家初创公司TrueVault筹集了250万美元种子投资。它为健康应用、网络应用和可穿戴设备提供一个符合《HIPAA(健康保险携带和责任)法案》的API,并对每次数据调用收费0.001美元。

但是在现如今,搜索对用户来说更像是氧气,他们不会考虑立即付费。反过来说,业界领袖中有越来越多的共识,认为在线服务可以穿针引线,生成所需的产值,并同时保护隐私、推进新的模型,让下一代的搜索蓬勃发展。

广告的再思考

也许是时候重新思考我们该如何为我们使用的在线服务进行支付了。如果有方法让广告商直接联络到用户,并因此而支付那些庞大的系统,且不会使用大量的个人数据会怎样?我想再次强调,定向广告不是天生就那么糟糕,反而很不错。搜索结果页面带有广告(只要是高质量的广告)时,人们表示出更高的满意度。但有些用户(当然还有很多监管机构)要求有另外的方式来资助这些他们乐于使用的服务。

按照True[x](一家广告技术公司)的首席执行官乔·马其斯的说法,太多的在线体验妨碍了我们当今的广告模式。他举了一个例子,其中讲到美国南加州大学的一个电视剧编剧课。课上,老师教学生以三幕体来编剧。为什么呢?不是因为这样讲故事的方式最好,而是因为编剧时要考虑商业广告的插播。电视剧行业由广告支撑,所以电视剧需要配合这种广告模式。没有任何研究表明,将一个故事分成3段,每段加上悬念让你不能释怀才是处理叙事弧的最佳手段。事实上,如今不少受好评的剧本都打破了这个规则。正如马其斯所说:“看看如今都是谁在赢取所有这些奖项吧:Showtime、Cinemax、HBO和Netflix。它们没广告,没广告,就是没广告。成功采用传统广告模式并还能播出有获奖水平内容的唯一一例是AMC(美国经典电影有线电视台)。基于这一点,人们可以在Netflix上批量观看没有广告的剧目。”

我们再想想如何将这个主意用到搜索上。我们之所以有今天这样的结果,不是因为这就一定是正确的模式,而是因为诸如搜索和电子邮件这样的在线服务投资方就是那些根据历史消息在页面右侧放入相关广告的人。还有没有更有效的方法,确保这些运行搜索引擎的公司既能保持运作又同时让用户和广告商受益呢?

马其斯认为,突然在页面上跳出信息不一定是吸引他人注意力的最有效的方法,特别是对某种类型的广告而言。他说:“我的一天中有24小时。如果我一天大概睡4个小时,那么在剩下的20小时内有很多空白时间和慵懒时间,没有什么事情要做。这时的我更有接受力,也对那些对我而言有意义的广告更开放。”

马其斯向我介绍了所谓“注意力银行”的概念。在这一模式中,如果消费者关注于某个广告,他就得到一个点数。这些点数可以用来“支付”在线服务。他说:

人们认为广告需要实时插入,但实际上,你可以有个银行。广告业缺失的一环是对情境的尊重。移动广告那么难做不只是因为屏幕小,操作系统分散—那是个主要的原因,情境才是主要原因。如果我准备去跑步,我真不会去在乎广告是什么。或者如果我试图找到一家餐厅的电话,准备打过去看看有没有位置,请不要用广告来打断我。但要是我无所事事或者正等着开会,这个时候就是我可以聆听一些我关心的东西的时候。这时我可以向银行存入广告点。于是我在使用我想用的服务时,就不会被打断。

广告模式需要加以调整来适应媒介。媒介不会进行演化,它所经历的是革命。先是发明了收音机,突然之间发明了电影,然后是广播、有线电视,再到如今的YouTube。媒介—在本例中是搜索系统—将首先演化,且已经首先演化。广告会落后一段时间,因为媒介是需求驱动,但广告是供给驱动,而且我们在系统里投了那么多钱。事情就是这样发展着,直到某些别的东西到了质量临界点。

换句话说,我们现在能看到搜索中的创新:可穿戴设备、语音搜索、视觉搜索、代理……很多这样的事物推进着技术水平的发展。但是搜索发生了革命,我们不再看到熟悉的链接和关键词的界面。这就要求广告模式能为任何时间、任何地点、任何设备上的搜索提供支持。

其他赢利模式

还有另外一个模式,看起来越来越能对抵消大型在线业务的运作费用有帮助,那就是分散收入来源,其目的是创建多边市场。如果看一下谷歌最近的财务报告,你会发现2013年第4季度的收入中有差不多10%来自硬件、应用和服务。考虑到一年前这个比例还是微不足道的个位数,那将是一个具有深远意义的转变。为什么要转变?至少对谷歌来说,似乎这是最传统的多边市场战略。

双边网络效应可以让你在市场的某一边放弃一些东西去建立网络效应,从而让你在另一边销售服务或产品。谷歌免费开放他们为设备互联而设计的操作系统,将这些廉价硬件的用户连接到他们的服务中,并在服务中通过广告获利。我们已经看到在短短4年里安卓的崛起。这样的网络效应为后来者建立了壁垒。比如,安卓获得了巨大的市场份额,谷歌没有必要再允许设备上存在别的服务。这样一来,它所提供的免费产品让它有效地屏蔽了竞争对手,充分地收获了付费段的价值。在某些情形下,这股力量大到足以使整个市场向某个单一公司“倾斜”,而到那时也就没有什么市场可言了。所以说,尽管我们看到谷歌的收入源出现多元化,可能的情形倒不是纯粹为了多元化的目的,而更多是要锁定更高利润的在线服务。

但免费服务不只是一种锁定广告的方式。任何免费的东西对人们都有一种不理性的吸引力。想要利用这一点,免费服务也是重要的因素。网络的“免费+升级”模式(用户可以免费得到一些东西,但是也可以付费升级获取更好版本的服务)可能是一个方案,能产生足够的收入让搜索服务运行。如今我们看到这种模式出现在诸如Dropbox(免费网络同步工具)这样的服务中。Dropbox很少付费给自己打广告,但是它用免费空间作为吸引用户尝试产品的诱饵。因为它的服务质量高,而且用户介绍自己朋友加入还有返利,这使得公司获取付费用户的成本远远低于该服务刚启动时的水平。

隐私

虽说搜索在广告资助的业务模式下也孕育了了不起的创新,在一个高效的市场连接了数亿计的用户和广告商,但是随着数据爆炸以及能跟踪一切的廉价传感器的无所不在,某些人开始有了迟疑。尽管用户能接受搜索引擎呈现与他们输入的查询相关的广告—毕竟,微软内部的研究表明,如果在页面上出现高质量的广告,人们对搜索页面的满意度会更高一些—但当他们知道在线服务拥有了那么多数据后还是有点儿担忧。而随着我们将我们的行为、爱好和想法更多地放入云端,对我们加以描述的能力只会进一步提高。

马克·戴维斯作为一名数字自我方面的卓越思想家,就我们有多少在线数据提出了一个有趣的观点:

假定我们成为智人有差不多100万年,所以我们对于成为一个物理自我、一个自然人的意义有了100万年的经验,围绕此诞生了现象学,并有了相关的文化活动。不同的文化处理方式不同,但是空间关系学—你和别人可以站得多近,我们居住时如何进行组织以及其他的学问—却惊人一致。对于如何作为自然人,我们已具备大量的知识和经验。

大约1万年前—这取决于你怎么算,或者是不是要追溯到确实还要比《汉谟拉比法典》还要早的《乌尔纳姆法典》—我们有了法人的概念。它定义了什么可以做、什么不可以做,所以在行为和行动上有了某种层次的功能性和结构。

而就在过去15年间,有一种新类型的人被创造出来—数字人。还没有解决的问题是:数字人会怎样发展、谁来控制,以及自然人、法人和数字人之间的关系如何。有太多的问题悬而未决:谁监视和存取数据,谁拥有你的信息,谁在何时何地能看到你。

最基本的问题—隐私和控制,其实是关于人格的本质。所以如果你从大历史的角度来看待这个问题,那么所有这3种人(自然人、法人、数字人)都是共存的。他们之间的相互关联非常复杂,我们才刚刚开始去厘清这样的关系。这将是一个漫长的历史过程,但是哪怕只是未来几年内确定下来的东西会对更远的将来有着深远的影响。

我们的数字自我需要得到保护,就像我们的物理自我需要得到保护一样。

我们在审视个人数据现如今的状态时,很容易将那些主要的互联网玩家看成是类似政府的角色。很多以前的公共基础设施被网络或者移动服务替代(比如信件被电子邮件和脸谱网替代,联邦政府控制的无线电广播被推特替代等),运行这些服务的公司开始看起来像是准公共部门。当然,问题是它们并不像公共部门那样运作。

这当然不是说在处理个人的私有数据上,它们怀有恶意。但是管理这些公共领域数据存储和使用的法律却是空白。这意味着我们更有可能缺少在私密小镇广场上拥有的安全保证。

技术、社交、个人及社会维度

隐私就是一大块氪星石头,威胁并阻挡着搜索取得重大突破。很多人认为,如果有一个全能的代理对我们了如指掌,这样的世界将疑虑丛生,也是危险的。悖论在于:这一新世界将赐予我们的自由,需要我们给出更多的自我信息方能得到。一旦我们关闭这些数据的存取,它们代我们行事的能力也就被废止了。我们怎样来解决这个矛盾呢?这里有不少问题要考虑,而这些问题涵盖了技术、社交、社会以及个人等方面。

搜集和使用个人数据的技术障碍也许是最容易被解决的。从任何方面看,存储基本上都是免费的,计算也非常便宜。所以,获得个人信息节点的交叉关联也很便宜。系统中花费最高的部分可能在于数据科学家和开发人员。他们要形成洞见和得出算法,然后用到这些海量数据上,为的是让这些数据有意义,为人们的生活增加价值。

比技术面更麻烦的是社交圈对于进行高阶搜索(以及一般意义上的专家系统)并能浏览个人生活每个领域的态度。但是我们已经看到,对于人们在网上做些什么有了态度上的改变,也越来越有人愿意分享数据(特别是在年青一代中)。根据皮尤研究中心2012年的报告:

总体来说,40%的十几岁的社交媒体用户说他们“非常”或者“有点儿”担心某些他们共享在社交网络网站的信息可能在他们不知情的情况下被第三方(比如广告商或者公司)获取。但是很少有人说“非常”担心。31%的人说“有点儿”担心,但只有9%的人说“非常”担心。报告中另外60%的人说他们“不太担心”(38%)或者“根本不”担心(22%)。

本·立夫谢茨是关注隐私问题的一位前沿思想家。按照他的说法,关键的挑战之一在于,作为搜索服务的消费者,我们不能理解我们信息的价值。换句话说,我们已经习惯了得到免费的服务,但现实是世上没有免费的午餐。要想支撑新一代在线服务所需的耗费数十亿美元的基础设施,必须要有一些价值的交换。如今,公司在“兑现”用户档案的时候就获得了报偿。比如,系统知道我是男性,“奔四”的年纪,可能住在西雅图,还有一些特性使得我对某一类广告商或者一个用来培养回头率的服务中的某个功能很有吸引力。在线公司中那些最能赚钱的公司知道所有这些档案数据,能理解“我”的价值,因为他们能持续地测试并验证他们所认为的“我”(以及我对他们的广告客户的价值)是不是真实的。但是我们作为消费者在理解我们信息的价值方面并不擅长。

我的隐私值多少钱

现如今,用户没有什么确切的方法去理解他们的信息值多少钱。诸如BlueKai(数据管理平台)这样的公司以及他们的产品Registry尝试让所有人都知道在线广告商对他们有多了解。其他的服务,比如PrivacyFix向那些主要在线服务(如谷歌和脸谱网)提供了客户的价值评估。但是,相比你每天要访问的海量网站,对你的真正的网络价值进行粗略的评估也很不可信。随着对数据搜集的揭示逐渐进入大众意识,对此的关注看起来也在逐渐增长。

按照立夫谢茨的说法:

我认为我们已经开始调整我们信息的价值了,但是进展很慢,逐步地往前走。我认为总体来说这是个发现的过程。在大部分时间里,我们确实不知道人们如何衡量名字和电话号码,更不用说众多爱好的价值了—比如他们喜欢看哪种类型的电影,在Comcast(有线电视公司)上倾向于看什么样的频道。我认为需要一点儿时间去确定自己的价值,而且我认为大部分时间基本上会是对服务讨价还价:“好吧,我给你这个来换你的那个。”如果这个服务本身是免费的,那么你就将付出自己的价值。

目前为创新提供资金的模式依赖于公司利用个人数据创造出比提供服务更高的收入。这本不一定是件坏事,但在这里,它就是坏事。

而且还不只是钱的问题。人们渴望去创造对终端用户有吸引力,个性化且对他们有用的东西,但如果对用户一无所知,这么做的难度也是很大的。风险在于,人们越来越对挖掘数据不感兴趣,因为他们觉得他们信息的价值超过了他们得到的服务。不过要想在搜索技术中获得突破,还需要更多的数据挖掘。很少有公司会认为量化一个用户的信息对公司的价值是有好处的。如今的公司没必要这么做。他们可以随心所欲地提供给客户或多或少的价值,根本没有讨价还价的余地。

作为用户,我知道我的地址或者我的爱好对于某个服务来说值4美元的时候,整个工业的状况就改变了。立夫谢茨将当前的市场状况和伊斯坦布尔的大巴扎相提并论。随便哪个商品都有大概25个卖家,除非你讨价还价,否则你就不会知道该商品的真正价值。考虑一下那些比价引擎,它们算是非常新的发明了。它的出现是为了服务于这个低效市场中的需求。在这类引擎出现之前,你不得不访问若干网站或者给实体店打电话来比价。如今,这一任务很大程度上是由所有的站点自动化处理的。

用户与公司交换他们的个人数据,得到足够的价值回报了吗?

福利

本文摘自《搜索:开启智能时代的新引擎》(中信出版集团,2017年5月出版)。

你对搜索引擎的商业模式有何见解?来留言聊聊吧!截至7月13日23:59获得点赞最多的5位将获得出版社赠书一本~


精选留言

暂无...
我的博客