作为世界上最有影响的搜索引擎,Google不仅仅把我们需要检索的东西准确无误地反馈给我们,还为我们提供了另一种基于互联网的思考方式。每天接收86种文字、来自100多个国家的1.5亿条搜索条目,洞察世间万象,把握时代风云,世界的集体意识在这里汩汩流过……
这个世界在想什么?
在加州101高速路附近的Google总部,坐在大厅的访客都怔怔地盯着服务台后面墙上不断刷新的词条:思想和诗歌(法文)……哈里·波特(英文)……巴西技术标准协会(葡文)……美国公民的人均支出(英文)……
这个显示词条的投影叫做“实时搜索”,它显示的是每时每刻世界各地的人正在往Google搜索引擎里输入的词语。
这些词条不断滚动刷新,有英文、中文、西班牙文、日文、韩文、法文、芬兰文、意大利文———Google所支持的86种文字的每一种都会出现:不应该嫁(娶)的人……“她吸了一支雪茄”……长岛的马铃薯先生……俘获女人芳心的话……汽车诈骗基本知识……盯着“实时搜索”时间长了,你会觉得世界的集体意识正在你面前汩汩流过。
每行字都代表某个人从某个有网络连接的地方发出的一个想法。Google把每天来自100多个国家的1.5亿条搜索条目收集进数据库,并以毫秒为单位刷新和存储电脑记录。
Google为我们的思想拍摄快照,并把它们汇集成册。就像一组连续图像迅速翻动会形成动画一样,这些被记录下的数据也在讲述一个故事。
这个世界在想什么?
其中一个想法是:性。
Google的技术主管克雷格·西尔弗斯坦说:“检查记录时你可以学到很多语言中‘性’的说法。”为了使“实时搜索”适合所有人观看,Google过滤掉了和性有关的英文搜索条目,但对英文以外的其他语言,这种过滤不太成功。
尽管地域和种族千差万别,但世界各地的人们很多时候在想着同样的事情。从一个国家到另一个国家,一个地区到另一个地区,每小时、甚至每一秒都有相同的主题冒出来:名人、时事、产品和电脑下载。
Google记录小组负责数据记录的建立、储存、查询和保护,该小组三位成员之一的克里格·雷说:“从人们的搜索内容来看,世界各地的人真是惊人地相似。”
Google像个晴雨表
Google的使用(Google是世界上使用率最高的搜索引擎)使克里格·雷能身处斗室而得以纵览天下。
从2001年10月开始,他已经能够用好几种文字表达“炭疽”了。他说他还知道最近哪个国家认真对待他们的选举,因为网上相关检索的数量惊人。他指出消费文化的全球化意味着最受欢迎品牌的产地已经扩大,例如诺基亚、索尼、宝马、法拉利、宜家和微软。
从Google的数据判断,有些体育赛事几乎引发了全世界人的兴趣:环法自行车赛、温布尔登网球公开赛、世界职业棒球锦标赛的检索次数都名列去年体育类条目的前10位。
人们还可以看出,各地的搜索者对美国的电影、音乐和名人都耳熟能详。两年前,Google工程师卢卡斯·佩雷拉注意到关于“小甜甜”布兰妮·斯皮尔斯的查询率下降了,认为这预示着她的受欢迎程度降低了。这一发现催生了名为“Google时代精神”的栏目,它列出每周和每月搜索率上升和下降最快的关键词。
由于有关布兰妮的搜索量一直很高,她成了记录小组的评判标准。从她和歌手贾斯廷·廷伯莱克分手的消息造成的影响中,他们了解到新闻是怎样引起了查询量的高峰。Google能够立即感知到这类事件以及其他更具严肃意义的事件的影响。
例如,2001年2月28日上午10点45分左右,西雅图附近爆发了一场地震。不到两分钟,关于地震的搜索就从几乎是零激增至每分钟250条,而且查询者都集中在太平洋西北岸。
2001年9月11日,关于世贸中心,五角大楼和CNN的检索在恐怖袭击发生后迅速增加。接下来的几天里,预言家诺查丹马斯成为被查询次数最多的词,因为有传言说诺查丹马斯早已预言过世贸大楼的倒塌。
但最微不足道的事也可能在Google敏感的文化地震仪上反映出来。
一天早上,日志小组上班后发现“卡萝尔·布雷迪的娘家姓”登上了搜索排行的榜首。出于好奇,他们绘制了当天关于这项搜索的时间曲线图,发现搜索量集中分布于5个峰值:第一个峰值最大,其后依次是小、小、大,最后,隔了很长时间后又出现了一个极小的查询高潮。每次搜索高潮都出现在整点过后的第48分钟。这份记录在整个办公室传阅,职员们都疑惑不解。为什么人们会突然对美国20世纪70年代情景喜剧《布雷迪家庭》中的角色大感兴趣呢?可是数据只能反映情况,无法提供解释。
这是Google记录的一个缺憾:它不能抓住社会现象本身,只能抓住它们在互联网上的投影。
记录小组的成员阿米特·帕特尔说:“最让人感兴趣的是原因。你无法做出解释,除非你知道世界上正在发生其他什么事。”
那么,2001年4月22日那天到底发生了什么呢?
那天晚上,美国电视有奖竞猜节目“谁想成为百万富翁”中决定百万美元归属的问题是:“卡萝尔·布雷迪的娘家姓是什么?”节目主持人提出这个问题不过几秒钟,就有数以千计的人登录Google寻找答案(正确答案是泰勒),并随着该节目在美国各时区依次播出而形成了4次查询高峰。
卡萝尔·布雷迪数据的正确性令一些人深受启发。
谢尔盖·布林毕业于斯坦福大学计算机科学系。他参与了1998年Google的创建,现在是它的技术总裁。他说:“这就像第一次使用电子显微镜。Google的数据像一个时刻更新的晴雨表。”
从数据看潮流趋势
如果汇集起来,Google的数据可以呈现惊人的表现形式。
在克里格·雷的办公室旁边是地理展示屏,这个屏幕提供的三维立体地图显示了Google正在世界哪些地方被使用。反射到空气中的彩色小点代表搜索量,这些颜色———红色、黄色和橙色———传达了一种印象:世界上的主要城市正在“燃烧”。火焰最高的城市是纽约、东京和旧金山湾区。
地理展示屏旁边挂了两张图表,反映Google一天之内在美国的使用情况。就搜索总量而言,下午5点是惟一的高峰。但和性有关的搜索则会在晚上11点达到第二次峰值。
由于Google搜索引擎在世界范围的通行,Google公司可以跟踪到想法和现象从一个国家传播到另一个国家的过程。以番茄三姐妹为例,凭借说唱歌曲和类似“马卡雷纳”舞的碰膝舞,这支三人歌唱组合去年春天成了西班牙的热门。从夏天到秋天,Google上对“番茄三姐妹”的搜索高潮如同波浪遍及了欧洲大陆,先是出现在西班牙,然后依次是意大利、德国和法国。如果你还没听说过“番茄三姐妹”,根据Google的预测,你很快就会有所耳闻的。