用网络理论解释微博中的“富者越富”现象
近年来,我们都目睹了内容分享与社交网络的迅速发展,其中,微博作为一种革命性的信息交流方式,成为了我们生活中的重要部分。维基百科介绍,微博之所以与传统博客不同,在于它允许用户交换小块的信息,例如短句、照片、视频连接。因为微博能在短时间内传达信息,具有很强的时效性和随意性,迎合了急促的时代节奏,受到用户的青睐。全世界首个,也是最闻名世界的微博是推特(Twitter),已经在世界范围拥有5.5亿有效用户,每日新增13.5万;中国最热门的新浪微博,亦已拥有超过5亿注册用户。微博中涌现出巨大的商机,微博营销也成为许多学者的研究问题。那么,什么样的微博账户会成为众人关注的重点?怎样的微博营销策略可以吸引更多人的关注?探讨这些问题,如果从微博的网络结构角度展开研究将会很有意思。在这些网站中,我们可以观察到一个有趣的现象:有一些账户拥有的关注者远多于其他账户,而且它们拥有的关注者越多,获得新关注者的速度也越快。这就是我们常说的“富者愈富”现象。但是,这一切是怎么发生的呢?我们能不能用科学解释这个现象?
这个问题,其实远没有表面上那么简单。事实上,科学界注意到无处不在的网络,以及这些网络背后共同的规律,也是近年才发生的事情。物流运输网络如何安排可以使成本最小化?为什么世界上的两个人总能以六个人相连?大规模传染病在什么条件下最后会停止传播?随着网络问题变得越来越复杂,我们需要一门系统的科学去解释它。在此背景下,网络科学,一门横跨经济学、计算机、信息科学、行为科学、社会科学等多领域的新学科走进了我们的视野。事实上,网络不仅仅存在于互联网,更包括生物网,社会关系网,物流网,通讯网络,金融网络,产品分销网络等,它们拥有复杂网络的共同特征和规律。网络科学逐渐系统化的理论,正帮助我们更好地理解这个越来越多地由网络互相连接起来的世界。
统计学中的“正态分布”已经为人们所熟知,它可以解释我们生活中碰到的绝大部分统计问题。然而,物理学家巴拉巴西(Albert-LászlóBarabási)却在网络研究中发现了截然相反的结果,并提出了震惊科学界的无标度网络(Scale-free Network)。无标度网络服从幂指数分布,简单来说,如果把网络中的个体视为节点、个体之间存在的关系视为链接的话,那么绝大部分节点只拥有很少的链接,而极少数的节点却拥有大量的链接。这些关键的节点称作中心节点(hubs),它们的存在使得无尺度网络对意外故障有强大的承受能力,但面对协同性攻击时则显得脆弱。在现实中的许多网络,都出现了无标度网络的幂指数分布现象。
微博关注者为何“富者愈富”的问题,就蕴含了典型的无标度网络分布规律。关于此类现象,巴拉巴西认为,网站、博客、社交网站和人类的联络网都呈现无标度网络分布,服从幂指数分布。早在2007年,马里兰大学的Akshay Java 与其他三位学者就以推特为例证实了他的观点——在《我们为何使用推特:理解微博的使用与社区》中,他们声称在推特的社交网络中发现了幂指数为-2.4的无标度网络分布。简单来说,他们把推特账户看作节点,若一个账户关注另一个账户,则他们之间建立了链接,来自全世界的几百万个账户组成了一张互相连接的社交网络。在这个网络中,大部分账户只有为数不多的关注者,少数的一些节点却拥有极多的关注者,成为网络中的中心节点。
推特的社会网络中出现了指数为-2.4的幂指数分布但是,为什么无标度网络出现了,而不是正态分布呢?幂律是如何产生的,为何有的节点成为了中心节点?这背后的掌控一切的动力学是什么?巴拉巴西提出“优先情结”为这个问题提出了解释。他认为,无标度网络中中心节点的出现与网络的增长、优先情结这两点特征是密切相关的。增长指的是每过一个阶段,网络中的节点增加一个;优先情结指新的节点选择连接到某个已有节点的可能性,与该节点本身具有的链接数成正比。每个网络都从小的内核开始增长,新加入的节点优先连接到链接较多的节点,这些中心节点获得越来越多的链接,成为网络中的“爆发”点。巴拉巴西通过仿真电脑实验,证明了这两个特征将带来幂指数分布。这也就是引发“富者愈富”的原因,朋友多的人更容易交到朋友,被引用多的论文更容易被引用,都遵循这个规律。
相似地,优先情结在微博的社交网络的形成中起到了主导作用。新的账户不停地增加到微博的网络中,而这些新增加的账户更可能关注那些已经被很多人关注的账户。一个很简单的事实是,我们每个人的微博除了亲戚、朋友外,都会关注一些“微博红人”,即那些已经有很多关注者的账户,结果这些账户的关注者数目以更快的速度增长——他们已有的关注者越多,他们获得新关注者的能力就越强。
值得注意的是,微博账户的增长模型,似乎与巴拉巴西模拟的模型有所不同。在巴拉巴西模型中,节点是随机增加的,不同的节点之间没有区别,但是先加入网络中的节点具有比较优势,因为它们先开始积累链接,更容易拥有更多的链接、成为中心节点。这与行业垄断现象有所相似——先进入市场的企业具有资本积累,成为产业中的垄断者,而后进入的企业则需要有强烈的特色区分自己,才能打破这种垄断局面。在微博中,也有这样的现象。一个由社会名人创建的账户,与一个普通人创建的账户,从刚加入网络开始就具有不同的竞争力。因此,这些名人账户即使较晚进入网络,也能迅速地吸引关注者,因为名人账户本身就具有区分自己的强烈特色。但是,他们同样服从优先情结的控制——当其中一些名人账户积累了越多的关注者,他们吸引新关注者的能力也变得比其他名人更强大。
但是,问题还是没有解决。关注者多的账户更容易吸引新的关注者,这个现象看起来是理所当然的。不过,我们是否可以科学地解释这种看似理所当然的优先情结呢?出于什么动机,我们更倾向于关注那些已经有很多关注者的微博账号?要解决这个问题,我们必须考虑人们如何做出选择。我在康奈尔大学有幸选修了大卫。伊斯利(David Easley)教授的《网络》课程,找到了可能的答案。伊斯利教授是国际著名的经济学家,但他不是坚守着经济学高耸、坚固而陈旧的堡垒进行修修补补的工匠,而是走在经济学前沿的探险家。伊斯利在横跨经济系、信息学院两大学科任职,他与计算机系的同事合作,将行为经济学、博弈论加入网络分析,解释人在网络中的行为。他在《网络、群体与市场》这本专著中提出了信息层叠和网络效应两种原理。
信息层叠指的是,由于人们的行为可以传达他们所知的信息,因此,观察别人的行为并进行模仿(甚至违背自己拥有的证据),有时是一种理性行为。举一个例子,几个人轮流从不透光盒子中抽取小球,并猜测盒子中篮球多,还是红球多。假设大家都是理性的,如果你前面的两人都判断篮球多,这就传达了他们都抽到了篮球的信息,那么,即使你抽到红球,你的最佳选择却是判断篮球比较多。但是注意,信息层叠多次后很可能是在放大不实信息的准确性,这很可能带来盲从。另一方面,网络效应也叫做直接效益效应,它指的是当人们跟从其他人的行为时,他们将获得收益,而且这么做的人越多,他们的收益越大。举例说,一个手机系统的使用者越多,你就越能从使用它身上获取更大的利益,因为这样意味着这个系统会有更多共享资料,会有更多人开发相关软件。
微博网络是一个很好的例子。首先说信息层叠。当我们创建一个新的微博账户时,系统会为我们推荐一些热门账户,他们通常拥有很多的关注者,这些关注者传达了一条信息:这个账户值得关注。也许这个微博经常发布有价值的信息,也许这个账户的使用者是当前的热点人们,总之,关注它就没错了。这个时候,即使新用户并不太了解这些热门账户,他们也很可能选择关注。另一方面,当一个账户有了很多的关注者,关注它的效益也随之变大了。如今,人们使用微博的很大一部分原因是关注社会热点,因此,关注度高的微博可以使得关注者与时俱进——为关注者呈现了更多热点话题,也为小伙伴们提供了更多的共同话题。这就是为什么从总体上来说,关注度越高的微博对于其他账户具有越高的吸引力。
最近,我在国内受欢迎的新浪微博中观察到了类似现象。随着综艺节目的热播,节目中的几位主角成为了微博上的热点人物,关注者以每日几十万计的数目增长,微博动辄转发过万,就连他们发布的广告也成为网友争相转发的对象。事实上,他们的关注者以惊人的速度在增加,他们每天在热门微博、热门话题出现,这些现象都传递了一条信息:很多人认为他们的微博值得关注,那么,无论你是否真的很关心他们,点击关注看上去是一个理智的选择。另一方面,尽管有的用户可能不喜欢他们的广告时不时地在首页飘过,却享受与伙伴们一起抱怨这些广告的过程。极端地来说,热门微博说的内容并不重要,重要的是他们为人们提供了茶余饭后的共同话题,而且,关注这些话题的人越多,它们的价值就越大。
总结之,信息层叠和网络效应影响人们在网络中的行为,带来优先情结,而优先情结使得节点不断增加的网络中出现幂律,幂指数分布标志着无标度网络的出现。这一切,就是微博中富者越富现象背后控制一切的动力学。观察、解释这些现象很有趣,但发掘其背后科学原理更是一件激动人心的事情。
人类生活正被网络重新定义、重新塑造,这里面充满了市场的商机。然而,我们能不能够更好地利用网络创造价值,取决于我们能不能更好地解释网络。在这个意义上,网络科学,一门新兴的科学,蕴含着人类发展的新思想与新方法,值得我们投入更多的关注,也许我们中的一些人,会成为新时代新科学的先锋探险者。