403.「一旦将数据组织为图,就必须仔细解读其结果。网络科学有一整个学科分支都在专门研究可视化,即制造算法以便在纸张或计算机屏幕上合理安排节点和连接。然而,多数结论无法经由目测得出,而要对其进行数学分析。一些批评指出,并非所有复杂网络都具备异质度数分布(在任何情况下,这都绝非数学上的精确幂律)。的确,若网络并非异质,它们也会有趣,但公平地说,有趣的网络往往是异质的。完美的幂律并不重要:重要的是肥尾的出现,它揭示了枢纽节点的存在。将异质性解读为自组织的标记这一点已受到批评,人们指出许多网络中都存在着一定程度的规划,正如管理员对局域网的具体设计一样。但无疑地,互联网与其他许多网络一样并未经过大规模设计。因此,人们有理由认为,这些网络对随机性的偏离可被归因于自组织过程。」


书籍名称:
《网络》
基础信息:[意] 圭多·卡尔达雷利 [意] 米凯莱·卡坦扎罗 / 2018 / 译林出版社
豆瓣评分:7.6/10
豆瓣链接:https://book.douban.com/subject/30263556/
读完时间:2024-10-26 14:12:41
我的评分:2.0/5.0
我的标签:微信读书,牛津通识读本,#2024
免责声明:本页面所发布的笔记仅用于分享我在阅读过程中的摘录、总结和反思。内容大多为书中原文或书中观点的简要提炼,并不代表我个人的立场、意见或价值观。书中观点仅供参考,如需深入了解或采纳,请参考书籍的原始内容。

 


阅读笔记:

《牛津通识读本:网络(中文版)》

圭多·卡尔达雷利 米凯莱·卡坦扎罗

26个笔记

第一章 从网络的观点看世界

◆ 生态系统乃复杂的物种网络:如果我们想要理解并管理这些物种,将这种底层的网络结构纳入考虑范围则至关重要。我们对其他一些基于网络结构的系统也必须采取类似的谨慎态度。例如,像艾滋病之类的传染病的蔓延就受到某些人群内部无保护性关系模式的强烈影响。同样,流动性冲击则取决于银行间货币交换网络的相互交织。上述所有例子都是所谓涌现现象的例子。此种现象乃无法通过观察构成系统的单个元素而进行预测的集体行为。通常,呈现这些现象的系统被称为复杂系统。比如,单个的蚂蚁是相对笨拙的昆虫,但众多蚂蚁一起则能够进行如修建蚁冢或者储存大量食物这样复杂的活动。而在人类社会中,社会秩序产生于自主个体的结合,尽管他们的利益往往相互冲突,但最终仍然合力执行凭一己之力无法完成的任务。类似地,某个鲜活有机体的生命力来自其不同组分的相互作用;互联网应对错误、攻击和信息量高峰的非凡弹性是网络作为整体的性能,而非单个机器运行的结果。

地理与“网络图”

◆ 20世纪初,伦敦的地铁服务变得十分复杂,以至于人们必须不时地发布愈来愈多的地图以便为出行者提供向导。1931年,经过多次尝试,地铁公司的雇员亨利·贝克改变了绘制地铁路线图的标准。与那种将地铁路线嵌入伦敦实际地图之上的做法相反,贝克将它们置于抽象的空间中(图3)。站点由间隔合适的点表示,而线路的连接则全部变成了具有45或90度角的直线。这个地图无关车站的真实位置及其相互之间的实际距离,但它对乘客而言更加清楚且有用。乘用地铁网络的人对其地理特征不感兴趣,有车站的顺序和地铁路线的交汇信息便已足够。

◆ [插图]图3 伦敦地铁的“度量”示意图(上)与“拓扑”示意图(下)。尽管车站的实际位置和相对距离都未呈现在拓扑图中,它却是地铁服务的更佳思维导图

◆ 亨利·贝克的伦敦地铁图基本上就是一个图。他解决映射问题的方案利用了网络方法的一个基本特征:在网络中,拓扑比度量更为重要。也就是说,何物与何物相互关联比它们相隔多远更加重要。换句话说,图的实际地理情形不如其“网络图”重要。

◆ 对拓扑学的关注是网络方法的最大优势之一,当拓扑与度量相比更为适用时,网络方法就是有用的。例如,从纽约发送至伦敦某办公室的电子邮件会与来自其隔壁办公室的邮件同时抵达。即便在互联网这种嵌入地理空间的实体基础设施中,连接的模式也比物理距离更加重要。

第三章 网络世界

◆ 上世纪80和90年代,人们倾向于认为在某种方式上一切都是由基因决定的。报纸上的报道都与“同性恋基因”“肥胖基因”“暴力基因”或者“酗酒基因”有关。这种态度呼应了人们对人类复杂性的秘密隐藏在基因组中的期望。DNA——细胞核中包含基因的脱氧核糖核酸分子——又称“生命的软件”,该程序负责生命体的每一个特征正是其中代码功能的障碍导致了所有的疾病。这种图景引发了人们对基因组进行测序的风潮,而人类基因组图谱于2001年2月的发布将这个风潮推向了顶点。测序的结果令人十分惊讶,人类的基因数并不比线虫多多少,而且比某些种类的水稻基因还少。人类几乎与类人猿有着相同基因组的推断是合理的,但问题是人类基因组也与老鼠类似。软件的隐喻并不支持这一证据:DNA序列本身并不能解释我们所能观察到的物种差异,更不用说单个个体的所有特征和疾病了。事实上,生物的基因与其相应的宏观特征之间还隔着一系列漫长的步骤。此间的变异决定了不同的结果。

思维之网

◆ 直到18世纪,“灵魂”可以体现在某个器官中都是一个奇怪的设想。但是,医生已经意识到中风或者其他脑损伤可能会危及关键的认知功能——心与脑之间的关联从那时开始变得明显起来。当时,解剖学家弗朗茨·约瑟夫·加尔便敢于提出所有心理官能必然起源于大脑这种想法。他确定了大脑中的27个“器官”,每个器官分别负责颜色、声音、记忆、言语,以及友谊、仁慈、骄傲等等。这种想法听起来如此异类,以至于加尔不得不逃离维也纳,进而在激进的法国找寻避难所。

◆ 确定这些神经网络的实际结构十分困难,因为细胞数量巨大,并且探测它们困难重重。我们仅掌握了那些十分简单的生物的详细神经网络图,比如一种名为秀丽隐杆线虫的寄生线虫。这种一毫米长的透明生物能存活三周,它仅有300个神经元,却是分子生物学界的超级明星。秀丽隐杆线虫是一种模式生物,即特别适于实验的生物,因为科学家对其特征了如指掌,且它在某些方面与人体类似。这种半透明的蠕虫通常是新药和新疗法实验的第一个基准。

◆ 然而,我们可以使用另外一种策略。当人们执行一个动作,即便简单如眨眼,来自神经元的电信号风暴就会在大脑中的数个区域爆发。这些区域可以通过诸如功能性磁共振这样的技术加以确认。

关键的基础设施

◆ 2003年9月28日晚,整个意大利的灯火都熄灭了,唯一的例外是撒丁岛。恢复正常供电耗费了数小时,有些地方甚至花费了数天时间。调查发现,这场停电由发生在意大利与瑞士之间高压线路邻近处的树木闪燃引发。由此造成的供电不足导致人们对剩余线路的供电需求猛增。结果,这些线路崩溃了,并在整个电力系统中产生了某种涟漪效应。

大规模的停电揭示了电网的连通性。这些系统跨越很远的距离将电力从中心点传输至城市和工业区域。一开始的电网规划很周密,这些电网随着时间的推移而越发复杂。如今,由高压输电线路连接的发电机、变压器和变电站组成的电力网络跨越数个地区,通常是数个国家(正如2003年的例子所展现的那般)。很明显,这种网络需要仔细维护以防止危急情况。

如世界般巨大之网

◆ 万维网的想法诞生于欧洲核子研究组织。物理学家蒂姆·伯纳斯-李(计算机科学家罗伯特·卡约后来也加入进来)于1989年提出了这一想法。伯纳斯-李设计了一个允许科学家们通过自己的计算机访问粒子物理实验所得出的大量数据的系统。让这一系统得以运转的软件并未申请专利,而是被公开发行。

近在咫尺

◆ 当你与一位陌生人聊天的时候,突然发现他或她是你妻子的同学,或者你兄弟的网球搭档,抑或你朋友的邻居,等等。这种发现通常让人们惊呼(“世界真小!”),但可能它并非那般不寻常。社会系统似乎非常紧密地联系在一起:在一个足够大的陌生人群中,找到一对由十分短的关系链关联起来的人并非不可能。

捷径

◆ 在小世界网络模型中,引入无序后规则晶格便转换为网络,相应地,节点之间的距离也缩短了:小世界属性由此产生

◆ 沃茨和斯托加茨引进一个类似规则使得两个遥远村庄之间开放路径。在实际操作中,他们切掉了原始结构的某条连线,并将其与其他节点重新随机连接。顷刻间,一个村庄的居民便能与之前遥远的地区而非其邻村交换货物了。

肥尾效应

◆ 查看度数分布是检查网络是否为异质结构的最佳方法:如果度数分布呈肥尾,则该网络将有多个枢纽且为异质结构。人们从未发现某种数学上完美的幂律,因为这将意味着存在拥有无限连接数的枢纽。然而,不存在无限大的真实网络:这就是为何度数分布的肥尾总有一个度数最大值上限的原因。

富者更富

◆ 20世纪60年代初,社会学家哈丽雅特·朱克曼采访了一批获得诺贝尔奖的科学家,其目的是找到这些人工作方式中的独特之处,以及他们研究工作成功的秘诀。她在这些诺奖获得者的回答中发现了一个反复出现的主题。一位诺贝尔物理学奖获得者说:“在授予荣誉这件事上这个世界很奇怪。它往往将荣誉给予那些(已经)出名的人。”一位诺贝尔化学奖获得者补充道:“当人们在报纸上看见我的名字,他们往往会记住它,而忽略其他人名。”而一位生理学和医学奖获得者则具体谈道:“[当你在读一篇科学文献时]你常常注意到你熟悉的名字。即便排到最后,它也会让人印象深刻[……]你会记住它,而非长长的著者名单。”“最出名的人会获得更多的声誉,在程度上毫无节制的声誉。”物理学奖获得者如此总结道。

这些观察促使另一位社会学家(朱克曼后来的丈夫)罗伯特·默顿于1968年提出了一个出色的定理。默顿提出,科学处于马太效应这种社会机制的影响之下。这个名字来自《马太福音》:凡有的,还要加给他,叫他有余;没有的,连他所有的也要夺过来。(《马太福音》,25:29)

普遍的机制

◆ 优先连接特指网络中的此种机制,而同样的机制还存在于许多自然和社会现象中,这些现象未来的演化取决于它们的历史。例如,城市规模依其目前的大小随时间而改变:大城市会经历较大的扩张,小城市则变化很小。明天的股票价格通常也与今天的价格构成一定的比例关系。这种机制也被称为乘性噪声。这一过程可能会在众多网络中起作用有着各种各样的原因。在某些情况下,具备许多连接是被新节点发现的主要方式。与许多其他网站连接的网站要比那些连接更少的网站更容易被浏览网页的人发现。高引文献中的情况也是如此。这种增强的受关注程度使得它更容易获得更多连接和引用。

谁是你朋友的朋友的朋友……?

◆ 社会学家林顿·C.弗里曼引入了节点的中介中心性这一概念。取某网络中的所有节点对,数一数关联它们的最短路径数。节点的中介中心性基本上就是穿过该节点之最短路径占所有路径数量的比例。

故障和攻击

◆ 跟互联网和万维网的情况一样,大多数真实世界的网络都显示出一种双刃的鲁棒性(robustness)。即便大部分网络遭到破坏,它们仍然能够正常运转,但某些突然的小故障或者有针对性的攻击则可能让它们彻底崩溃。例如,基因突变在整个生命过程中都会自然发生(其中有些甚至能删除细胞中的某些蛋白质),或者也能人为地产生(一项名为基因剔除的基因技术就是如此,它能关闭实验室老鼠一个完整基因的功能)。但是,生物体仍能表现出对诸多突变以及大量基因剔除的极强忍耐力。多数时候,生物体还是会在整体上继续正常工作。另一方面,某些特定的突变却能完全破坏细胞的工作。大脑一直在丢失神经元:一次给任一器官带来压力的经历,比如偶尔的酗酒,就会杀死大量细胞。但宿醉过后,一切又都恢复如初。以帕金森症为例,相当比例的神经元甚至会在病人毫无察觉的情况下消失。但当这一比例超过某一阈值,受损情况便开始变得明显。

多米诺效应

◆ 物种的连环灭绝或共同灭绝事件对于生态学家而言并不陌生。例如,英国曾于20世纪中期引入黏液瘤病毒以控制兔子的种群数量,这最终导致大蓝蝶于1979年灭绝。这种病毒消灭了兔子,但兔子食用的高茎草却因此得以蔓延。后者又破坏了蚂蚁的栖息地,它们习惯在有阳光的低茎草中筑巢。蚂蚁与大蓝蝶的幼虫之间有着共生关系:它们会照看幼虫,而幼虫则报之以流食。因此,蚂蚁栖息地的破坏逐渐损害了大蓝蝶的繁衍,进而导致其灭绝。这并非真正意义上的共同灭绝,因为兔子并没有因为黏液瘤病毒而灭绝,而部分大蓝蝶也被重新引进。然而,这一事件却让我们对食物网可能受损的程度有所了解。将此事件的规模扩大,其中的连环灭绝几乎耗尽整个生态系统的物种,这便可能成为以往大灭绝事件的另一个解释。

第九章 整个世界是否就是一张网?

◆ 边的定义更为复杂。某公司可能持有另一个公司的小部分或全部资本。两座机场可通过每天一次航班或每小时一次航班相互连接。在所有这些情况中都必须建立阈值,低于该阈值则被视为弱关系而不被记录。为连接加权或设置阈值会强烈影响所得网络的形状,因此必须建立在充足的理由上。

◆ 一旦将数据组织为图,就必须仔细解读其结果。网络科学有一整个学科分支都在专门研究可视化,即制造算法以便在纸张或计算机屏幕上合理安排节点和连接。然而,多数结论无法经由目测得出,而要对其进行数学分析。一些批评指出,并非所有复杂网络都具备异质度数分布(在任何情况下,这都绝非数学上的精确幂律)。的确,若网络并非异质,它们也会有趣,但公平地说,有趣的网络往往是异质的。完美的幂律并不重要:重要的是肥尾的出现,它揭示了枢纽节点的存在。

“异质性”在这里指的是网络中节点的度数(连接数)的不均匀性。异质的网络中,一些节点拥有远多于其他节点的连接,形成了关键的“枢纽节点”。相比于“均质”网络(所有节点度数相似),异质性增加了网络的层次和复杂性,使其在分析上更加有趣。
这段话的核心在于,网络中的异质性(肥尾分布)揭示了某些节点的重要性,因为这些枢纽节点在网络的结构和功能上可能具有特别的意义。尽管网络不需要严格符合幂律分布,但肥尾现象的存在仍能表明网络中关键节点的作用,提供更深刻的分析价值。通过这种理解,我们可以更好地解读网络在各种数据组织中的功能与特性。

◆ 将异质性解读为自组织的标记这一点已受到批评,人们指出许多网络中都存在着一定程度的规划,正如管理员对局域网的具体设计一样。

◆ 但无疑地,互联网与其他许多网络一样并未经过大规模设计。因此,人们有理由认为,这些网络对随机性的偏离可被归因于自组织过程。此外,度数异质性仅是网络复杂性的其中一个标记。异质性还出现在许多其他特征中,比如中介性、集聚性和权重等,复杂性同样也会出现在其他特征中,这一点与异质性不同:例如,模块和社区结构常常偏离随机性,并对网络顶层的动力机制产生强烈影响。

◆ 另外一个批评则指出,网络科学发现的只是不同系统和动力机制之间的模糊相似性,而非真实的普适类。后者是对应于相同基本数学定律(在特定细节被忽略的情况下)的不同现象群。

◆ 当然,生物网络的具体特征与技术网络的具体特征完全不同,计算机蠕虫病毒的扩散与疾病的传染遵循着不同的规律。然而,网络理论为这些如此不同的结构和过程提供了一个共同的趋势和预测的框架。通常,如果系统足够大且相关现象的观察时间足够长,它们便会展现出十分相似的趋势。

— 来自微信读书

2024年10月26日 09:47

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注