• 2017集智凯风研读营.jpg

    量子纠缠,复杂网络与机器学习 | 记2017集智凯风研读营

    [attach]4601[/attach] 2017年5月份的时候@甘文聪来我们南方科技大学访问两个月,探讨引力与量子信息的交叉,我们在知乎上看到集智俱乐部的招募,就一起提交了材料,去年参加研读营有凝聚态,统计物理,机器学习和社会科学的大牛,今年也只计划新招两个名额,只是本科生的我提交材料时心里没什么底,心想就碰碰运气,没想到却和@甘文聪一起收到了集智俱乐部的邀请,感到很惊喜。 我之前只会一些量子信息和量子计算的皮毛,在甘同学的访问期间学了一点广义相对论和量子场论,考虑纠缠是怎么在黑洞视界附近受到影响。另外我们课题组有师兄研究过把机器学习应用到Bell不等式,所以也想多了解一下机器学习和量子信息的交叉。在参加研读营之前听过尤亦庄老师的讲的报告,用random tensor network来学习空间的geometry,非常佩服。这次来研读营有两个期望,一是希望多了解一些机器学习背后的数学结构,二是和尤老师多讨论一下凝聚态和量子信息的结合。 [b]纠缠与几何[/b] 正式开始的前一天晚上我是最晚一个到的,错过了大家的各自介绍,有点可惜。不过一来就感受到讨论的氛围非常热烈,尤老师跟我们讨论了一下他的思路,根据boundary entanglement的feature来学习出bulk的geometry。去年尤老师考虑固定张量网络的结构,使用随机张量网络,只训练耦合常数J,今年希望能够通过学习自动找到合适的网络结构。 其实基本思想很简单,quantum many-body state可以用random tensor network的boundary tensor来表示,每一个many-body state出现的概率由这个系统的hamiltonian决定,也就是boundary的pinning field(外磁场)。神奇的是由这个hamiltonian决定的一个many-body state的free energy算出来正好近似等于这个state的entanglement entropy(2nd Renyi entropy)。当我们根据这个概率分布来生成大量的boundary states(不同的spin configuration)后,我们就有了unlabeled data,用这些unlabeled data我们可以做unsupervised learning,最小化KL Divergence,使得模型的概率分布尽可能接近data的概率分布。如果我们使用Boltzmann machine,boundary states看做visible layer,bulk states看做invisible layer,training过后我们就得到层与层之间的weight,也就是这个网络的几何性质。如果不使用Boltzmann machine,考虑全连接图或者planar graph,再加上update的规则,我们就能在不固定网络结构前提下训练出它偏好的构型。 [attach]4605[/attach] 对于planar graph,可以使用三角剖分的三种基本规则来update:(1)找到所有的度数为3的顶点,随机去掉一个;(2)随机找一个三角形,在内部添加一个点,并与三个顶点相连;(3)随机切换一个四边形的对角线。可以证明,这三种update的规则能够覆盖所有可能的planar graph。问题的核心在于如何在given hamiltonian的条件下计算free energy(2nd Renyi Entropy)。 进一步,如果加上物质场,也就是beyond planar graph,以及给boundary tensor加上各种symmetry,比如U1,SU2 symmetry,我们甚至能得到各种基本粒子,像电磁场中的光子,或者是各种费米子,这样我们就把物理学中的各种基本粒子的产生理解为自然界在unsupervised learning不同的纠缠结构,和文小刚教(da)授(lao)的思想遥相呼应。没想到纠缠,几何和学习能够以这样一种奇妙又紧密的方式结合起来,在传统物理学的训练中从来没有过这样思想的冲击和颠覆。 [attach]4603[/attach] [b]计算社会科学[/b] 几天的会议讨论后,在物理以外的领域有三点比较大的收获,一是殷裔安同学通过美国NIH申请基金的近30年的记录,来分析哪些科学家会在重复的失败后成功地申请到基金,结果发现对于成功者而言,在申请成功之前的大概十次失败的申请中,他们申请的时间间隔是按power law减少的,而对于失败者而言,他们的时间间隔的分布大概是均匀的。社会科学的研究原来是基于大量数据的分析或者通过控制变量的实验来分析社会行为背后的机制。二是computational social science和virtual lab这两个概念,传统的社会科学做实验没有计算机,只能通过调查问卷等方式来分析研究,有很多实际受限,消耗大量的人力物力也不能做太大,现在可以借助网络在线上建立虚拟社会科学实验室,在三个维度scale,complexity和endure都能极大地扩张,在传统的社会科学的基础上进行了质的飞跃。三是补充了一些人工智能和机器学习的基础知识,比如RNN中的Recurrent是怎么实现的,LSTM是怎么在RNN的基础上加入三个gate实现长短时记忆,把神经网络的每一层按一定比例drop out一些神经元来训练多个随机森林,概率图模型是怎么和张量网络,神经网络建立一一对应关系,最近新出来的三种Gan到底有什么区别。。。 [attach]4608[/attach] 通过将近一周的热烈讨论,不仅把我自己的研究领域扩展到凝聚态,还学习到了很多其他领域的知识,这些知识在平时学校里普通的学习过程中几乎没有办法接触到,特别感谢集智俱乐部创建起这样一个组织,以及基金会资助举办这样学术交流的活动,把不同领域感兴趣的学者聚集在一起,在不同维度思想的碰撞中产生新的火花。 [attach]4602[/attach]  黄金龙 南方科技大学大四本科生  研究方向:量子信息与相对论和凝聚态的交叉。大三时分析过纠缠在黑洞附近如何变化,也做过波色抽样(quantum supremacy的一种方案)的理论分析及经典模拟。对deep Boltzmann machine以及机器学习的理论模型比较感兴趣。

    wangting 2017-07-29 07:37

  • 2017集智凯风研读营.jpg

    复杂网络,机器学习与全息原理 | ​ 记集智-凯风2017研读营

    [attach]4600[/attach] 这是我第一次参加集智研读营,被这里的氛围所吸引。这里集合了计算社会学,计算机科学,理论物理学,生物物理学等等各个方向的学者。在我们来到的第一天晚上就展开了激烈的讨论。Kevin的社会学实验,尤亦庄的限制玻尔兹曼机与统计物理和全息引力,苑明理的机器学习与微分方程,董磊的数据分析等等,每个人都带着深刻的工作和思想,相互之间思想的碰撞,头脑风暴刷新着我的知识。白天的集中学习,晚上的自由讨论充实着我的每一天。明年的研读营我希望能继续参加。  [b]一.复杂网络与全息原理[/b] 量子引力的全息理论是近二十年才兴起的方向。它将时空内部(bulk)的量子引力理论与时空边界(boundary)上的非引力的量子场论对偶起来。这个理论吸引人的地方在于,我们可以认为引力现象并不是基本的,而是可以从非引力的场论自由度演生(emerge)出来。具体的说,场论各个自由度之间的纠缠与关联实际上代表了更高维度的时空几何。这个美妙的想法被神经网络优雅的描述了。隐藏层连接着显层,表征着显层单元之间的关联与纠缠。而更高维度的几何就自然地出现在演生的隐藏层中。 在这些天与大家的交流中,我看到复杂网络在各个领域中都有应用,而上面的想法也启示我,在引力理论中,共形场论(Conformal Field Theory)的复杂网络正是反德西特时空(Anti-de Sitter Space-time,双曲几何)。进一步的说,复杂系统(例如CFT)之所以复杂,是由于存在复杂的内部关联(隐藏的内部关联),这些关联由隐层描述,而形成加入了隐层的复杂网络,这个复杂网络会有不同的几何(例如双曲几何)以及简洁的规律(例如Einstein场方程)。 [attach]4595[/attach] 特别是尤亦庄师兄的使用DBM通过数据学习得到复杂网络连边的coupling constant,从而boundary state通过机器学习得到bulk几何的相关思想更是深深的冲击着我。我们宇宙也许就是这样由边界系统的自主机器学习过程而演生出来的复杂网络结构。 [b]二.临界系统[/b] 傅渥成的关于自组织临界(self-organized criticality)系统的讨论再一次刷新了我的三观。许多系统都可以用自组织临界理论进行描述。 自然界中很多重要的系统都不是处在热平衡态,比如生命本身。热平衡意味着没有变化,意味着熵极大,极度混乱的系统也就意味着没有生命。而有生命意味着有序,即负熵。生命就是由生命体内部相互作用导致的自组织规律系统。不仅如此,生物系统还在临界点附近。临界点意味着特殊敏感,小的局部破坏可能导致整体的坍塌。傅渥成用著名的沙堆模型(sandpile model)进行说明:落下的沙子由于沙子内部的相互作用会形成沙堆。这是自组织的过程。但是当沙堆增高到一定程度之后,落下一粒沙会导致整个沙堆的坍塌。这是临界状态,对小的扰动很敏感。这是因为临界的系统具有长程关联,相距遥远的部分之间有强关联,也就导致了一个部分的破坏引起大部分的破坏。不仅如此,长程关联还意味着标度不变。这是由于体系内部的关联长度发散,没有特征长度(characteristic length)也就说明系统的各个物理量与尺度无关,即标度不变。甚至自组织临界系统的几何一定是双曲(hyperbolic)几何。因为双曲几何是唯一具有标度不变性的几何。 进一步,自组织临界系统的各个量显示出幂律关系。不仅如此,就连成功学都具有幂律。西北大学的殷裔安分析NIH三十多年来的基金申请记录,发现最终成功申请的科研工作者成功之前失败的申请中连续两次的申请时间间隔满足幂律衰减。幂律,或者说临界状态是各个自组织系统的关键。它将不同学科神奇的联系了起来。 [attach]4596[/attach] [b]三.机器学习与程序生长[/b] 机器学习是近两年非常火的课题,特别是是Google的AlphaGo打败了人类的围棋冠军之后。机器学习也是这次研读营的核心课题之一。我们围绕着机器学习进行了各方面的讨论: 尤亦庄师兄介绍了tensorflow graph,罗秀哲介绍了pytorch以及机器学习和量子多体问题的关联, 程嵩介绍了Restricted Boltzmann machine和tensor network之间的关系。彩云天气的CEO 袁行远展示了机器学习在天气预测,语音翻译和智能作曲等方面强大的功能。以及肖达介绍了序列学习模型RNN/LSTM。肖达的“将世界的普适规律“硬编码”到网络结构中”,苑明理的程序代码的生长机制都将世界以及生物与机器学习深刻的联系了起来。他们让我相信,世界的本质规律也许就是机器自我学习的过程,我们的宇宙是一台量子计算机,包括生命本身。这些都冲击着我的世界观。我们正朝着这个方向不断的探索。 [attach]4594[/attach] [b]四.大数据与计算社会学[/b] 这次的研读营,社会学家们也带给我太多惊讶与惊喜。Kevin的线上社会学实验,将社会学实验融合进小游戏中,使得线上的网友们都可以参与进来,且由于破除了地域和时间的限制,使得实验规模宏大,样本数量和数据量都非常多。还有上面提到的殷裔安对成功和失败的分析,平常无法分辨的通向成功的失败与通向失败的失败在这里都能从数据上体现出来,甚至满足幂律分布。董磊运用卫星数据进行可视化分析人口的流动,产业的变化,地区经济贫困与富裕的分析等等。这些都完美的将科学、技术、艺术和人文关怀紧密的联系了起来。使我相信科技是能改变社会的。 [attach]4597[/attach] 吴令飞、马磊与尤亦庄师兄的Ising model和社会计算与图灵机的讨论再一次揭示了复杂网络与社会学的深刻关系。甚至可以用Ising model用来模拟议会投票机制。复杂网络再一次将物理学、社会学、计算机科学紧密的联系了起来。 [attach]4598[/attach] 这次的研读营每天都给我带来不同的头脑风暴,除开白天的集中学习与讨论,晚上的自由讨论也随处可见。浓厚的学习氛围感染着我激励着我。这短短的几日给我带来的冲击与震撼是前所未有的,吴令飞鼓励我们多关注有趣的问题,不同的专业互相交流探讨。这些拓宽了我的眼界。希望集智的研读营越办越好。 [attach]4599[/attach] 甘文聪 南昌大学硕士二年级  研究方向:量子信息与量子引力的交叉。 曾做过张量网络在AdS/CFT中演生引力的方案;全息复杂度与量子保真率对偶的研究;以及deep learning的双曲几何与全息的关系研究。  

    wangting 2017-07-29 07:32

  • 2017集智凯风研读营.jpg

    机器学习、理论物理、计算社会学的碰撞 | 记2017集智-凯风研读营

    [attach]4593[/attach] 2017年之夏,古北水镇,天朗气清,惠风和畅。集智俱乐部和凯风基金会顺利举办了第二届智凯风研读营。继去年“几何与学习”的主题后,本次研读营又让机器学习、理论物理、计算社会学三者擦出了火花。集智凯风研读营绝不同于一般的读书会——这里碰撞的是前沿的科学进展,是跨学科的科技创想。当然,这一切的基础是那群齐聚一堂、求知论道的青年才俊。 要问笔者最喜闻乐见的是谁?那当然是敬(meng)爱(meng)的理论物理大神尤亦庄了(星星眼)!笔者私下有一个用热力学理论改进机器学习算法的想法,却被一个问题困惑多日——机器学习训练集和热力学温度之间的关系。很明显的一点是,当我们把热力学温度的概念引入机器学习,机器学习系统的温度就是由训练集决定的。训练集越大,模型的热涨落越小,即温度越低。亦大用3分钟教会我如何证明机器学习中的训练集大小和温度的准确表达式。 [attach]4588[/attach] 当然,不只是笔者私下喜欢的尤亦庄。谈笑有鸿儒,往来无白丁。这话说集智研读营大概是一点不差的。我们这里还有着更多蕴含洞见的头脑,更多唇枪舌剑的激荡。 [b]社会学游戏 [/b] 第一日下午,从计算社会学的几位朋友领头设计了一个研读营所有人参与的社会学游戏。全部人员按照背景分为两组,分别为物理组和社会学组。物理组提出5个topic,每个topic下附上一优一劣两篇paper。社会学方面也是提出5个topic,每个topic下同样附上一优一劣两篇paper。那么某个领域的学者能否独立在阅读标题和摘要后判断另一个领域论文的优劣呢?在互相讨论后,大家又能否判断地更准确?学者会因为其他认可某项研究而变得更认可该研究吗? [attach]4589[/attach] [attach]4590[/attach] 从更大的方面来讲,文化产品的流行起来的过程是否有很大的随机成分呢?研讨会上一位来自普林斯顿的在读博士生介绍了一个经典社会学实验得到的有趣结论,文化产品的流行大体上和产品质量是正相关的,但消费者极容易被其他用户的倾向影响。最流行的文化产品会受总销量、总下载量、总收藏量等因素影响而拉开与其他产品popularity的差距。原来一次跨领域读文献游戏背后也可以有这么多社会学背景的。   [b]从物理到智能  [/b] 而笔者最投入的一场讨论是关于“物理与智能”的。我们从自然科学的诸多角度审视了深度学习。 从数学的角度来看,深度神经网络是一种具有极好表达能力的模型。只要有足够多的神经元,我们能拟合任何连续的目标函数。而当神经元数目接近的时候,深的网络比宽的网络具有更好的表达能力。尽管深度网络的强大表达能力有着严密的数学基础,但是神经网络的泛化能力却是很令人吃惊的。从统计学习的角度,一般认为至少10个以上的样本才足够较好估计一个模型参数。而深度模型的参数往往是远远多于样本数。这样“粗略”估计得到的模型参数为什么还能在测试集上有良好的表现呢?神经网络谜一样的泛化能力是深度学习理论的一大挑战。 [attach]4591[/attach] 从物理的角度来看,物理定律在机器学习中有非常巧妙的体现。由于真实世界的数据始终是符合物理定律的这个世界的某种描述,这些符合物理定律的数据注定只是整个数学空间的一小部分。比如说,100*100的灰度图,数学空间里有256的1000次方种图片,但是物理世界会出现的图片(比如数字、猫),实际上是非常有限的。所以一种可能的解释是,神经网络和真实世界都符合某种统计先验。这种先验的存在让神经网络学到的函数相当程度上贴近符合物理现实的函数。除此之外,物理学中的空间平移对称性、时间平移对称性也是重要的先验。其在机器学习中的体现就是卷积神经网络和LSTM模型。卷积神经网络底层共享了探测图像特征的kernel,这里利用的物理先验是空间平移不变性(平移10个像素的猫还是一只猫)。LSTM则共享了时间序列的模式,利用的物理先验则是时间平移不变性(语言序列始终遵循特定的语法结构)。 为什么神经网络很可能天然地符合物理先验呢?我们再进一步从生物学的角度来看这个问题。我们知道,神经网络模型与大脑实际的神经网络结构类似,都具备类似于layer的层级结构。在漫长的进化过程中,为了更好地感知物理世界,人脑进化出的层级的神经网络。这件事本身就说明了,层级的神经网络很可能是适于学习这个物理世界的,是符合物理先验的。机器学习科学家发现卷积核非常适于学习图像中的底层特征,其生物学上的对应就是视觉神经细胞的感受器非常接近于卷积核。 大概只有在这样的研读营,在这样的跨领域交流的气氛下,你才能同时发现这么多领域的有趣灵魂,这么多角度的深刻思想。 [attach]4587[/attach] 谢泽柯  东京大学工学系研究科硕士二年级 研究方向:机器学习的物理方法。用物理的模型和方法来探究机器学习的理论机制。

    wangting 2017-07-29 07:26

  • 42-1.jpg

    低调与伟大:写在巨大神经元(Giant Neuron)发现之际

            3月2日《自然》杂志报导了一项新的数字重建技术,和使用该技术带来的新发现——在小鼠脑内的三个、伸展至全脑的巨大神经元(Giant Neuron)。 [attach]4552[/attach]           图1:《自然》杂志报道   这条科技新闻之所以引起轰动,是因为: [list=1] [*] 我们从未见过在脑内伸展范围如此之广的神经元;[/*] [*] 这些神经元来自屏状核(Claustrum,见图2),一个此前被认为与人类意识高度相关的大脑核团;[/*] [*]它们像长刺海星一样,似乎连接了大多数乃至全部与感觉输入和行为驱动相关的脑区。[/*] [/list] [attach]4553[/attach]           图2:屏状核   因此,我们似乎离发现意识的开关不远了。          [attach]4554[/attach]           图3:长刺海星   不过,无论从《自然》杂志的出发点还是从主持该项研究的Christof Koch的视角来看,这篇科技新闻的重点都不是发现巨大神经元本身及其和揭密人类意识的关系,而是能够给我们探索大脑提供全新工具和视野的神经元追踪成像技术。 Koch和他的同事首先通过培育一支特殊品系的小鼠,使它们屏状核中神经元的特定基因可以被某种药物激活,进而表达一种可以遍布整个神经元的绿色荧光蛋白,然后再对小鼠大脑进行10000层断层扫描和计算机三维重建,来追踪整个神经元。这项技术,较传统的给神经元注入染料的追踪方法,无论从有效性、侵入性、量化和人力与时间成本上都是一个飞跃。   [attach]4555[/attach]           图4:巨大神经元   谈到这项技术,来自哥伦比亚大学的神经生物学家Rafael Yuste不禁赞叹“It’s quite admirable”。他认为这将非常有助于发现和确认大脑中不同的细胞类型,对最终了解脑的功能起到至关重要的作用。  这种关注技术革新的视角,不仅切中研究发现的核心价值,更是具有更广阔科研视角以及更客观看待研究发现的体现。在该研究主持者Christof Koch所在的Allen Institute for Brain Science,及其上属的Allen Institute,人们都找不到有关巨大神经元与意识相关的爆炸性新闻,甚至没有对这项研究的专题报道。熟悉Allen Institute的人应该对这种画风不会感到奇怪,作为致力于回答生物科学领域big question的研究机构,它包含两个下属研究所Allen Institute for Brain Science和Allen Institute for Cell Science,被公认为是研究所内开放科学模式和大规模研究的领导者。这次的研究发现可以说是这种研究基础架构和合作模式的优势展现,也是注重对生物科学基本问题探索与解答、关注技术创新整体支撑作用的必然。 期待我们的脑科学研究视角从中得到启发,不仅从模块化、虚拟网-生物网的层面出发,更能深入生物-神经元、和技术研发基础,为创新提供新动力。                                                                                                                                     ——林思恩2017/03/04写于飞机上   [attach]4556[/attach]           图5:林思恩,摄于2016年集智圣诞晚会 林思恩 集智科学家,TalkingBrain联合创始人CEO,新智元人工智能智库专家,前布雷恩科技首席科学家顾问,中科院心理所&香港中文大学认知神经科学博士。  

    slow 2017-06-30 21:29

  • Screen_Shot_2017-06-29_at_7.05_.43_AM_.png

    生命之流 | 连接上帝的纽带——熵

    作者:张江   [quote] 生命之流 《生命之流》系张江老师2008年至2009年,利用闲暇时间所构思的一本科普集。主要内容包括:从复杂到生命、自主生命体简史、重新发现时间、从永动机到人工智能、连接上帝的纽带——熵等章节。现将已公开部分刊出,希望能够和大家共同学习。 [/quote] 连接上帝的纽带——熵   究竟热力学第二定律是怎么来的?要知道,在微观物理理论中并不存在我们熟悉的那个时间之箭。当然,我们完全可以既接受牛顿物理对世界的描述,同时又接受热力学这样一套完全平行、不相关的描述。但是这样的分离状况不能让我们满意,上帝不太可能费事儿地设计两套不相干的物理规律,这两者之间必然存在着某种联系。克劳修斯的熵概念已经把这个问题用简单清晰的数学公式表达出了,但是这还远远不够,因为我们仍然不知道它的物理含义。 正在这时,一个世纪伟人:玻尔兹曼(Ludwig Boltzmann,1844~1906)登场了。通过把热力学现象解释成大量分子相互作用的统计行为,玻尔兹曼成功地创立了统计物理这门学科。这样,熵、热量、温度、功等等概念全部具有了合理的解释,那条险些断裂的连接经典物理和热物理的纽带又被重新拼接起来,这一切都要归功于玻尔兹曼提出的统计熵概念。然而,在19世纪末,因为原子论尚是一个存在着很大争议的课题,玻尔兹曼把他的理论奠定在原子论的基础上显然是一种大胆、叛逆的行为。因此,他的观点遭到了主流科学家的批判,并最终导致了他的自杀——历史上一个最可悲的不可逆事件!然而,玻尔兹曼的工作并没有就此死掉,美国的物理学家、化学家吉布斯(Gibbs Josiah Willard, 1839-1903)担当起了进一步发展统计物理的重任。他通过运用另外一种不同的方法定义熵,从而大大拓展了热力学的应用领域。受到了吉布斯和玻尔兹曼等人工作的影响,天才的信息论创始人申农(Claude Elwood Shannon,1916-2001)将熵的含义进一步抽象,使其能在通信和信息科学中大放异彩。到此,熵已经可以作为一个系统概念(而不是物理概念)而存在了,因此我们得到了一条从热物理到统计物理,再到信息论的发展路径。然而,吉尼斯(E. T. Jaynes)却并不这样看,他反过来认为信息论以及最大化信息熵应该作为统计物理的新假设。因此,他独立建立起了一套“主观”的统计物理理论。 本章将从玻尔兹曼熵开始一直到吉尼斯的统计物理,并尽量安排一些具体的例子来说明问题。沿着条思路,我们将看到系统之中的目的性行为:时间之箭是如何一步一步与观察者的主观判断联系到一起的,这一章的讨论将为后面的流动问题奠定基础。 第一个例子看似与热物理并不相关,但实际上玻尔兹曼的思想和方法已经被完全包含其中了。 例1  随机数程序 这是一个简单的计算机程序,它在每一周期都随机产生N个随机数,如x1,x2,…,xN,并且每个数的值都要么是0要么是1。假设你看不到这个程序内部的运行机理,但能够看到每一个周期这N个数的和,记为M=x1+x2+…+xN。每一周期运行的伪代码如下: RandomNum(Integer N){        Integer M=0;        For(i=1 to N){               R= Random(0,1);               M=M+R;      }        Return M; } 反复运行该程序你将看到什么结果?答案很简单,你将经常观察到N/2这个数,也会偶尔观察到N/2-1或者+1等附近的数。比如,当N=6,那么你将很可能会观察到3,偶尔会看到4、2等,而不太可能观察到0或者6。当N变得越来越大的时候,结果N/2出现的次数也会变大。 通过简单运算,就能得到假如N=6,那么出现M=0就意味着所有的随机变量x1,x2,…,x6=0,也就是说要实现M=0这个结果,那些随机变量就有一种可能取值:它们都等于0。 如果x1~x6之中有一个出现1,其它都是0,那么就可以让M=1,这样要实现M=1这个结果,就可以有6种可能性,即x1~x6分别取100000或者010000或者001000,……等等。 当M=2的时候,只要6个数中有两个取1,其它都是0就可以了。即包括:110000, 101000, 100100, 100010, 100001, 011000, 010100, 010010, 010001, 001100, 001010, 001001, 000110, 000101, 000011这15种情况。   更一般的,一共有 [attach]4418[/attach] 种让M=k出现的可能情况,我们记它为Ω(k)。   在这个简单例子中,对这些随机变量xi的一次全部赋值称为系统的一个微观态。例如,100100、000000、101010就都是系统的微观态。而我们称这些随机数的一种可能和值M叫做系统的一个宏观态。例如M=0,2,6…都是可能的宏观态。Ω(k)的自然对数,即当宏观态是M=k的时候对应的lnΩ(k)就是该系统的熵(或者叫做玻尔兹曼熵),即: [attach]4419[/attach]   为了看清楚这几个量之间的关系,可以画出下面的示意图。 [attach]4420[/attach] [i]图5-1  随机数实例中各种概念之间的关系[/i] 一般来讲,系统产生的宏观结果(宏观态)可能是由很多种微观因素造成的。而观察者往往看不到那些微观因素,仅仅能看到系统的宏观表现。这就导致了一种从微观状态到宏观状态的映射,所以该例子中的求和过程就相当于是一种观察引起的压缩作用,它使得我们可以从宏观状态来把握系统,但是不可避免地就会损失对系统精确描述的信息,这就对应了每个宏观态实际上“压缩”的微观状态数目,即Ω(k)。由于Ω可能是一个很大的数,所以取对数值之后计算熵值可以缩小这个数目而方便比较和操作,但却不改变函数的性质(例如单调性,最大值),这就是熵。 显然我们可以扩展这个例子,例如把M改为计算x1x2…xN,即N个数的乘积。这样,我们得到的宏观态就只有0和1两种可能性。但是按照同样的方法,仍然可以计算这两个宏观状态的熵:S(0)=ln(2N-1),S(1)=ln1=0。当然我们还可以用其它的方法计算从x1,x2,…,xN到M的函数,每种函数原则上都可以定义熵。这个例子告诉我们,其实熵的计算只不过是一种计数方法。针对一个系统,只要我们能够定义微观态、宏观态,我们就能计算出每个宏观量对应多少微观态,从而就可以计算熵。 然而,这样一种抽象的例子和实际相差太远,让我们再看下面这个更接近热力学系统的例子。 例2:气体分子模型 设有N个气体分子(一些刚性小球)分配到一个大的容器里,如下图所示:   [i][attach]4428[/attach][/i] [i]图5-2  6个气体分子小球分配到一个容器中[/i] 为了简单起见,我们假设每个分子可以随机地在所有小方格中跳来跳去,并且一个小格可以容纳任意多个小球,那么这和例1就非常相似了。同样,对这个系统的描述也可以从两种视角。因为每个小球就有16*8=128(小个子的个数)种可能位置,那么6个小球就一共可以包括1286种不同的微观状态。例如下列各图就表示了各种不同的系统微观状态: [i][attach]4427[/attach][/i] [i]图5-3  气体系统可能处的微观状态[/i] 同样,对于这个系统的观察还存在着一个完全不同的视角:宏观视角。假设一个观察者站在很远的地方观察该系统,那么他看不到具体的一个一个小格子,而只能看到黑色边框分割的大格子(把系统分成了左、右两侧)。这个观察者也不再能够分辨出具体的小球,而仅仅能看到一团东西(多个小球)在容器的左侧,另一团东西在容器的右侧,并且观察者能够判断出某一边的球数。这样,我们可以用下面的图来表示系统的宏观状态,例如: [i][attach]4426[/attach][/i] [i]图5-4  与图5-3对应的气体系统宏观态(数字表示处于该半个容器中的分子数目)[/i] 很显然,每一个宏观状态就可能对应了多个不同的微观状态。因为对于这个仅仅有6个分子的气体系统来说,所有可能的微观态数目和可能的宏观态数目都是有限的,所以我们可以计算出每个宏观态对应的可能微观状态数,我们用下图表示: [i][attach]4425[/attach][/i] [i]图5-5  每个宏观状态可能对应的微观状态, 以及产生该宏观状态的所有可能的微观状态总数[/i] 计算(8*8)6是因为每个大方格都包含了8*8=64个小方格,并且每个小球当被限定在一个大方格里面的时候,它还可以在这64个小方格中任意选择一个。CNk表示将这N个分子分割成一种左边k个,右边N-k个宏观态(分成左、右两侧)的方法数。所以更一般的,对于一个宏观态(k, N-k),它所对应的微观状态数是: ,其中g为一个大方格对应的小方格数目。因为N和g都是常数,所以Ω的数值仅仅取决于第一项,我们可以画出CNk在不同参数N下的函数曲线如下: [i][attach]4424[/attach][/i] [i]图5-6  Ω(k)在不同参数N下的函数图[/i] 观察图5-6,可以看到当k=N/2的时候,CNk最大。并且,当参数N变大的时候曲线的形状也变得越来越陡。当然,我们还可以推广,如对系统的划分可以有h个大格子,每个大格子对应的小格子数是不一样的等情况,这里就不讨论了。 在这个例子中,我们也可以类似地定义玻尔兹曼熵,即: [attach]4423[/attach]                  这里玻尔兹曼熵S是关于宏观状态k的函数,它正比于该宏观状态k所对应的微观状态数Ω(k)的对数值。其中kB为玻尔兹曼常数,它的数值是:1.3806505(24) × 10−23 J/K,它的取值是为了与克劳修斯熵保持一致,以便于这套统计方法可以还原所有的热力学规律。(在后面讨论)。模拟试验    下面,我们不妨设计一个计算机模拟程序,可以让这个气体模拟系统跑起来。假定系统的初始状态如图5-7(a)所示: [i][attach]4422[/attach][/i] [i]图5-7  气体系统模型的演化[/i] 并且在每个时间步,所有的小球都随机地朝上、下、左、右四个相邻方格中的一个进行移动,当分子碰到器壁的时候会反弹回来。假设经过一段时间之后,该系统可能停留在5-7(b)所示的状态。从宏观态上来讲,该系统从图5-7(c)的宏观状态(6,0)演化到了图5-7(d)的宏观状态(3,3)。可以预料,如果我们多次重复这个实验,那么尽管系统最终的微观状态并不一定会与图5-7(b)一致,但是系统的宏观态将更有可能倾向于(3,3)这个状态,即图5-7(d)。当小球的总数N非常大的时候,这个趋势将会更加明显。从宏观状态来讲,最终系统就会“停留在”(N/2, N/2)上,甚至系统中的每个粒子在微观上仍然会随机、无序地变换它们的微观状态。 下面,我们可以稍微变化一下这个系统运动的规则,例如可以让每个小球按照牛顿运动定律以不同的速度运动,并且还可以假设两个小球相遇的时候会发生完全弹性碰撞。当我们再次运行这个模拟,会发现整个系统仍然趋向于(N/2,N/2)这个宏观状态。因此,看起来我们能够得到一个与系统微观的规则无关的结论:气体分子系统将最有可能演化并停留到(N/2,N/2)这样的宏观状态下。但是,这个结论并不非常准确,因为对于某些规则,例如当任意两个小球只要碰撞就粘在一起,这个结论就不成立。 为了避免这些特殊情况,使得结论更具普遍性,玻尔兹曼当年做出了一个非常聪明,但也是备受争议的各态历经假说,或称等概率假说:每个分子小球将会以相同的概率在每个微观状态中取值。在这个假说前提下,他得到了确切的结论:气体分子系统将最有可能演化并停留到(N/2,N/2)这样的宏观状态下。我们知道,这种(N/2,N/2)对应的宏观状态恰恰就是玻尔兹曼熵S最大的状态(因为宏观态(N/2,N/2)对应的可能微观状态数最多,所以系统实现并停留在这个状态下的机会也就最多)。最后,尽管系统从微观上讲可能仍然处于不断变化的过程中,但在宏观上,系统将会以最大的概率停留在熵最大的宏观状态。这时,我们将倾向于说系统处于了一种不再变化的平衡态,即热力学平衡态。这是一种表观的平衡,但实际上内部分子仍然在做着激烈的运动。 这个试验可以给我们解释时间之箭的产生提供一定的解释。正如各态历经假说中所提到的,本来对于系统来说,任何一种微观状态都是完全对称、无区别的。但是因为观察者观察上的“缺陷”,他只能看到一些宏观状态,这就会导致每一种宏观状态对应的不同的可实现的微观状态数,从而也就导致了熵的出现。当系统处于不断的变化过程中的时候,这个熵的数值就会倾向于最大化。这给我们解释时间之箭的产生提供了很好的暗示。我们知道,对于经典牛顿力学描述的动力系统来说,一切都是可逆的,所以时间没有方向性。小球按照牛顿运动定律在小方格之上的运动正是这种可逆的运动。但是,在宏观层面我们仍然观察到了不可逆的趋势:即系统会更加倾向于那种对应的熵值最大的宏观状态。一种明显的不可逆的时间方向就这样涌现而出。究竟为什么会产生如此现象呢?原因就在于观察者观察能力上的缺陷,所以时间之箭只不过是观察者眼中的一种“幻觉”。用下面的图可以清楚的表达时间之箭是如何由观察而涌现出来的。 [i][attach]4421[/attach][/i] [i]图5-8  时间之箭由于观察而涌现[/i] 如图5-8所示,随着时间的流逝,系统将会等可能地遍历所有的微观状态,在这个层次观察者将看不到任何微观状态之间的本质差别,因此也不能分辨出时间流逝的方向。随着微观状态的遍历(各态历经假说),系统将会在不同的宏观状态之间转变,并且大多数时间会处于那种最可能的状态(即熵最大的状态)。所以,观察者就能看到一种明显的时间流逝方向了(朝向最可能状态的演化,熵必然增加)。但是,即便对于宏观状态来说,系统的演化仍然是时间对称的,即如果我们能够等待足够长的时间,那么很有可能仍然会观察到如图右侧圆圈表示的那个宏观状态。但是由于这类事件发生概率极其微小(对于通常的气体系统来说,粒子的数目是1023这个数量级,系统将几乎不可能出现在最大熵以外的状态),所以观察者将看不到这类事情的发生。 我们知道热力学第二定律可以看作是强加在力学定律之上的一条新的定律。玻尔兹曼引入这套统计解释的目的是为了从微观牛顿力学导出热力学第二定律。但是,玻尔兹曼虽然部分解释了熵和时间箭头,但他也同时引入了新的假设:各态历经(或称等概率)假说。所以,玻尔兹曼自己也认为,他并没有完全解答时间之箭的问题。 让我们再回过头来看看这个例子中的熵。首先,玻尔兹曼把熵定义为宏观状态的函数。这一点是符合人们的热力学知识的。因为当粒子数非常多的时候,系统处于最可能(熵最大)的状态的概率将远远多于其它宏观态的概率。所以人们就把这种最可能的宏观态作为系统的热力学平衡态。通常人们说一个系统的熵就是指处于这种热力学平衡态下系统的熵。其次,熵是对一个宏观态对应的微观状态数取对数。这个微观数目可以看作是种连接微观层次到宏观层次的纽带,因为从微观观察过渡到宏观观察必然伴随着熵的产生。根据这个认识,我们可以看出,实际玻尔兹曼熵并不一定非要应用到分子系统,只要存在着微观态和宏观态,我们原则上都可以应用玻尔兹曼的方法。 最后,之所以熵要对状态数取对数是因为人们希望熵具有可延展性。即对于一个气体系统A,它的熵是S(A)(平衡态下的熵)。以及另一个系统B,熵是S(B),将它们混到一起组成一个大系统A+B。那么显然,对于任意一个宏观态将是A和B两个系统宏观态的组合。这样对应的可能微观态数目将是两个子系统微观态数目的乘积ΩA+B=ΩAΩB,所以总的熵为SA+B=ln(ΩA+B)=ln(ΩA)+ln(ΩB)=SA+SB。这样熵就变成了一个可以随着系统的加合而可加合的量。 [b]还原热力学[/b]   有了玻尔兹曼的统计方法,我们f实际上完全可以还原上一章所讨论的热力学了。我们知道热力学关心的是压强、温度、熵、热、功等一系列宏观物理量,它们都可以被一一还原为微观统计量。仍然用例2来讨论,在这里小球的速度被忽略不考虑。这样,压强就是小球对器壁的平均碰撞次数,温度可以近似理解为系统中小球的平均密度。 因为没有速度,所以可以把小球本身就看作小的能量单位,这样系统的总能量就是小球的个数。而一个系统对另一个系统传递热量就是从一个系统向另一个系统传递小球。这样图5-7所示的现象刚好就是热量从高温(左侧系统,小球初始密度高)传向低温(右侧系统,小球初始密度低)的过程。同样,对系统作功就相当于把小球压缩到一些较小的区域内。 对处于平衡态(最可能状态,熵最大的状态)的系统,我们还可以定性地导出克劳修斯熵的定义式,即dS=dQ/T(定量的推导需要精确定义温度、热量等量,请参见《从有序到混沌》一书)。当小球均匀分布在大方格中的时候(小球平均密度就是温度),我们增加一个小球,它会使得Ω呈指数增长(考虑图5-5对Ω的定义式),这样取ln之后,熵就成比例增加。并且这两者的比例是与T(小球密度)呈反比的:小球的密度越高,新增加一个小球对系统熵的影响就越小。 在上面讨论的模型中,我们实际上并没有考虑每个粒子的速度问题。在现实的气体系统中,每个分子不仅有位置,而且还会有速度。所以,我们需要把上面模型中的平面空间扩充到包含了速度信息的状态空间(或称相空间中,见第三章)。这样,每个小球所处的容器就不再是一个平面的容器,而可能是四维空间中的一个立方区域。那么,按照动力系统的观点,每个小球的运动就是从高维的相空间中的一点跳到另一点。但是,这点扩充对于我们的统计模型没有本质影响。因为我们的模型中仅仅涉及了小格子、大格子还有分子小球,而至于小格子、大格子是几维空间中的几何体并没有太大的关系。我们可以假设图5-3表示的是状态空间,即水平方向是小球位置,竖直方向是小球的不同速度。每个小方格就是小球的一种可能状态(位置和速度的组合),大方格就是对这些小状态归并之后的宏观状态,等等。不过,在加入了速度因素之后,能量、温度就不仅仅是小球和小球密度了。(更加严格的数学讨论,请参考相关的统计物理的教科书)。     从玻尔兹曼到吉布斯   上面的讨论虽然可以得出熵的表达式和整个热力学,但是仍然存在着缺陷。上例中划分大方格、小方格的方法完全是我们人为划分的,而这个结果又会影响计算得出的熵。实际上,我们对物理系统的观测本身就是宏观的观测,而微观状态只是我们的一种假设,它是没办法被测量到的。所以,上例中的小格子就没有实际意义了,我们仅仅能观察到大格子构成的宏观状态。那么这个时候,我们如何来定义熵呢?正是基于对这个问题的考虑,吉布斯提出了一套不同的统计物理方法。 还考虑图5-2中的气体分子运动模型。只不过这里每一个小格子已经是我们可以观测到的宏观状态了,每个格子表示一个我们可以观测到的小球的宏观状态。如果开始的时候所有小球都像图5-7(a)中那样集中在容器的左下角,按照随机游走的动力学规则演化,那么经过一段时间,小球将会弥漫在整个容器中。我们可以重复这个实验多次,每次的初始条件都一样,只不过试验最终的结果都不尽相同。但是在重复多次试验的情况下,每个方格被访问就会呈现出不同的概率。例如我们做100000次试验,其中有小球运动过左上角第一个方格的次数是500,那么这个格子被访问的概率就是500/(6*100000)=1/1200。这样,我们可以得到每一个格子的概率。那么对于整个空间我们就可以得到一个概率分布,如下图: [i][attach]4429[/attach][/i] [i]图5-9  一个概率分布示意图[/i] (其中每一个方格中的颜色表示概率的大小,即多次试验中该方格被小球访问的次数比例,颜色越深表示访问该方格的概率越大) 在每一个周期,我们都能得到一个这样的概率分布。针对一种可能的概率分布,吉布斯发明了一套不同的计算熵的方法: [attach]4430[/attach] 其中n表示所有的方格数,i表示其中的某一个小方格。pi表示该方格被访问的概率(即颜色)。SGibbs就是吉布斯定义的熵,它是关于一系列概率分布(p1,p2,…,pn)的函数。这样,确定了一组概率就相当于确定了系统的一个状态,那么不同的状态就对应了不同的熵值。 那么,对应的平衡态的概率分布是什么样子呢?这将是一个所有的格子都呈现出相同颜色的状态,即pi=1/n(对所有的i=1~n)。因为根据玻尔兹曼的各态历经假说,每个小球将等可能地访问每一个小方格,所以当系统处于平衡态,所有方格的概率都相同,这样就得到了一个均匀颜色的分布。从数学上可以证明,当pi=1/n(对所有的i=1~n)的时候,SGibbs取最大值。所以,气体系统的平衡态就是熵最大的状态,这一点和玻尔兹曼熵得到的结果是完全一致的。 进一步,通过数学上的推导还可以看到玻尔兹曼定义的熵(1)式实际上是和(2)式等价的。如果我们把这里的每个小方格看作是例2中的大方格,并且把每个大方格中的分子数/总分子数看作是访问该方格的概率,那么经过数学上的推导,我们完全可以从(1)式得到(2)式。 吉布斯不仅仅从另一个角度重新定义了玻尔兹曼熵,而且还给我们提供了一个崭新的思路来理解系统。因为原则上讲,系统的微观状态是我们不可观测到的,所以讨论它也变得没有意义。这样,我们所能观察到的仅仅是系统的一些可观测状态,最大熵状态是所有可观测状态中最可能被观测到的那个状态。   [b]从统计物理到信息论[/b]   吉布斯熵的另一个好处是它在数学形式上的简洁性。当我们忘掉(2)中每一个pi的具体含义,而仅仅是某种抽象的概率分布,那么SGibbs仍然是一个良定义的量。例如,我们考虑抛掷一枚硬币,那么这枚硬币出现正面和反面的概率就都是1/2。对于这样简单的概率分布,我们也可以计算吉布斯熵:S=-(1/2 ln0.5+1/2 ln0.5)=ln2。这里,我们可以把系统可能处于的所有状态看作一个大的容器,一次抛硬币事件就相当于是一个在该容器中运动的小球。这样,小球访问容器的概率就相当于是硬币的一次正反面。所以,我们仍然可以计算熵。 一般的,如果一个系统可能处在n种状态,并且每种状态的概率分别是p1,p2,…,pn,那么这个系统就有申农信息熵: [attach]4431[/attach] 其中I叫做系统所包含的信息量,它是申农熵(Shannon Entropy)的相反数。申农熵和吉布斯熵具有相同的形式,但是,在这两种描述中,系统以及i的含义是不完全一样的。在前面吉布斯的定义中,一个系统是指一个容器,里面有多个小球,这样小球访问容器的不同部分可以导致一个分布。因此,给定一系列容器不同部分的概率分布,就给定了该系统的状态,因此也就能够定义该系统的吉布斯熵(即吉布斯熵是描述系统状态的量)。但是在申农熵定义中,一个系统本身的状态,以及这些状态上的概率分布是系统本身已经决定了的,因此申农熵也决定了,它是描述系统(而不是状态)的量。 为看清吉布斯熵和申农熵的区别,让我们再次回忆例1,即那个产生0、1随机数并求和的程序。如果我们把这个程序看作一个系统,那么该系统就有0,1,…,N这几种状态。当程序运行起来以后,我们就得到了一个在各个状态上的概率分布p(k)=CNk/2N,因此可以给这个系统计算申农熵:    [attach]4432[/attach] 根据例1的讨论,我们又知道,实际上这每一个状态又是一个宏观态,它可能对应了多种微观态。那么,也就是说该程序的每一个状态又可以计算出一个吉布斯熵。比如状态k,也就是说程序得到的和数是k。那么这N个随机数就相当于是要占领0和1两个格子的粒子。要得到和数是k,那么我们知道这需要格子1被占领的概率应该是N中的k次,即k/N,而占领0的概率就是(N-k)/N。这样,状态k的吉布斯熵是:    [attach]4433[/attach] 所以,在这个例子中,对于系统整体有一个申农熵来描述,而对于每一个具体状态,又有一个吉布斯熵来描述。 申农熵的意义还表现在它可以表达我们主观世界中的不确定性。假设有两枚硬币,第一枚硬币出现正反面的次数完全相同,而第二枚硬币出现正面的概率是0.1,出现反面的概率是0.9。那么很显然,你一定会觉得第一枚更加捉摸不定,而第二枚硬币则好一些,因为你有很大的把握知道它会出现反面。我们这种主观的不确定性感觉可以被申农熵来刻画。申农熵越大表示该系统越不确定。例如,如果p1=0.1,p2=0.9,也就是系统有很大的概率出现反面,则SShannon=0.325,它小于当p1=p2=0.5情况下的申农熵:ln2。 对于主观来说,系统不确定性的另一面意味着信息。当我们对一个系统掌握的信息越多,相当于它们对我们来说它越确定。所以(3)式还可以看作是信息量的一种定义。当我们对某个系统一无所知的时候,我们倾向于最大化(3)式,也就是对该系统的信息量掌握得很少。而随着我们对系统的逐渐了解,它变得越来越确定,这就会改变系统中各状态的概率分布,使得总的申农熵减小,这就导致对该系统的信息量的增加。 还用硬币的例子来说,假如我把一枚硬币压在手下让你猜是正面还是反面。由于你对于该系统没有任何信息,所以你会倾向于认为硬币出现正面和反面是等可能的,即p1=p2=0.5,这个时候申农熵最大。然后,我把手张开,你看到了硬币是反面,于是你得到了p1=0,p2=1的结论,再次计算申农熵,会发现现在它等于0了。也就是说,你对系统了解的过程就相当于是一个让申农熵不断减小的过程。 更明显的一个例子是叫做“21问”的小游戏。例如我脑子中想出一个人,让你猜他是谁。而你每次只能问一些一般疑问句,因为我只能用是或否来回答你的问题。这样你会通过不断问一系列问题而猜出我想的人是谁。例如,你会问这个人是男的吗?我说是。你再问,他还活着吗?我说否……。 用申农的模型来看,在最开始的时候你对这个人一无所知,就相当于你对此人的信息为0,即申农熵最大。当你每次问一个问题得到答案的时候,就相当于你获得了这个人的一个特征,因此改变了一次概率分布,同时使得申农熵减小了一些。最后,你知道了那个人是谁,于是系统完全确定了,申农熵变为了0。所以,我们对系统的观察获得信息就会伴随着该系统的申农熵减小。   [b]“主观”统计物理[/b]   当熵的理论形式发展到信息论的时候,客观物理世界已经开始深深地与观察主体的主观世界联系到一起了。信息量其实就是一种针对主体而言的“主观量”。那么,这种认识的飞越又有什么意义呢? 20世纪中叶的物理学家吉尼斯(Jaynes)向我们展示,这种对系统的“主观”认识可能更加本质、透彻。因为,它从信息论出发,可以反过来推导出整个统计物理。而且,这种推导方法比早先的统计物理更加简单、明了(参见Jaynes的文章《Information theory and statistical physics》)。 针对一个具体的物理系统,人们对它的认识相当于是去猜一个概率分布,这个分布如何导出呢?由于我们对该系统一无所知,所以我们实际上就是要最大化该系统的申农熵。也就是说,吉尼斯把信息熵的最大化当作一条公理加进了统计物理中。当然,对于实际的物理系统,我们还知道另外一些宏观的性质,例如该系统的平均能量等一些可观测宏观量,那么这些信息都当作是最大化信息熵过程中的约束条件。最终,我们会得到系统的确切的概率分布,而这个分布就能够很好的预测整个系统的性质。 在这套统计物理中,玻尔兹曼的各态历经假说被最大化信息熵所替代。我们仍然需要一个公理来解释统计物理。而最大信息熵的含义相当于我们对系统了解最少,也相当于自然系统的一种最可能状态。或者用中国学者张学文的话说,是一种自然系统最复杂的状态。 虽然信息论和统计物理理论哪一个更加根本,我们无从得知。但是吉尼斯思路的简洁性非常值得我们认真思考。毕竟我们对客观世界的认识全部都来源于我们观察者所做的主观判断。所以,吉尼斯甚至认为统计物理只不过是一种算法而已。很多人不喜欢吉尼斯的思路,认为他过于主观,而且他并没有给出任何全新的结论。但是,我们将在下几章展示,当把吉尼斯的主观统计物理运用到非平衡态的时候,会得到一套全新的结论。 总结来看,这一章用一系列简单的例子介绍了从玻尔兹曼熵到吉布斯熵再到申农熵的过程。熵究竟是什么?本章介绍的探索历史本身就是一个对这一概念的逐渐深化认识过程。如果非要用一句话来回答这个问题,我宁愿说,熵其实就是一条连接的纽带。玻尔兹曼熵连接的是宏观与微观;申农熵连接的是主观世界与客观世界。在这条纽带面前,被传统科学割裂得很深的主客观分离的界限已经变得逐渐模糊。正是基于这种信念,吉尼斯才提出了一套非常不同的“主观”统计物理学。 我们关心的热力学第二定律、时间之箭的问题又怎样呢?尽管历史上很多伟人都试图从经典物理出发而给出热力学第二定律新的解释,但是,他们却或多或少的引入了新的假设。例如玻尔兹曼和吉布斯的统计物理都需要各态历经假设,吉尼斯的统计物理需要引入自动最大化熵的假设。我们是否能够摆脱这些假设而完全理解时间之箭之谜呢?我倾向于不太可能,这恰恰是复杂系统的涌现概念所刻画的。对于系统的不同层次我们需要不同的描述。时间之箭就是这种不可化约为微观物理的一种涌现属性。吉尼斯的统计解释告诉我们,这种不可逆的涌现性质其实可以解释为我们对世界的一种主观的倾向,即最大化信息熵。        

    刘培源 2017-06-29 07:20

  • 科学与游戏,虚拟与现实 | 科学v.s.游戏活动回顾(含视频)

    [url=https://v.qq.com/iframe/preview.html?vid=u0327bmxbq1undefinedamp;width=500undefinedamp;height=375undefinedamp;auto=0]https://v.qq.com/iframe/preview.html?vid=u0327bmxbq1&width=500&height=375&auto=0[/url]   [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEc8b4dM3tg2dBsTLH0V1wodX6YaHPZSNFtB0p4ndbdeLIdUNXzdtAGA/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img]   演讲嘉宾:罗三水(彩云天气工程师) 游戏 2016年,  3月,人工智能AlphaGo以4:1的大比分战胜人类围棋世界冠军李世石。  6月,电影大片《魔兽》的热映重新唤起了一大批魔兽玩家的记忆与激情。  7月,PokemonGo风靡全球,移动手机里小精灵与现实场景的增强结合刷遍社交网络。  8月,里约的奥运赛场上,傅园慧用洪荒之力让金牌去金牌化;中国女排让我们重新认识了奥林匹克体育竞技所代表的魅力。  所有这些都与游戏(Game)有关。 那什么是游戏呢? [b]最古老悠久的人类活动[/b] 围棋、体育竞技历史悠久,早已独立形成了一整套文化产业,成为大众熟知认可的竞技活动。 [b]最与时俱进的娱乐项目[/b] 王雪娟老师的演讲主题《游戏大融通》给我们带来最新最火的综艺游戏如何玩耍,如何打造跨界游戏IP矩阵。 [b]最吸引小孩们好奇和快乐的注意力引擎[/b] 林思恩老师的演讲主题《用脑投票,好游戏不用说》将从神经科学给我们讲为什么游戏这么令人着迷(特别是小孩),游戏满足了我们哪些需求和体验。 其实动物也会游戏,它们在游戏打闹中学习和锻炼奔跑、捕食、打斗的生存能力。   [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEMaKOlunwCFTQn1ficsBP6JmtpceyuErHhSNOlv00WIQg4uRA3qIgq4A/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img]   但我们很难精确定义什么是游戏。 维特根斯坦在语言哲学里最喜欢用的例子就是“游戏”这个看上去很简单的词语,如果有人想用定义三角形的方式去定义“游戏”这个词语,那么等着他的就只有无尽的挫败。 游戏产业 我们今天谈论游戏,多指的就是大众熟悉的电子游戏,现在全球每天都有十几亿人要通过智能手机、电脑、主机设备玩游戏,有大批人每天都沉浸在网络游戏之中,人类正在进行一场由实到虚的大迁徙,我们通过newzoo发布的数据看一看全球游戏市场趋势。[img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEQ5jtMhqWvcvzdk6uWgsugiadEtib3k6pOcpD35EN3bGD0OVZY1xQnfFg/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img] 2015年全球游戏产业规模将达到920亿美元,预计今年将接近1000亿美金,这一数字甚至超过了电影产业(620亿美元)和音乐产业(180亿美元)的总和,游戏已经成为全球规模最大的娱乐市场。我们看到智能手机上的占比增长飞速,已经接近30%了。 电子游戏的发展史很短,只有半个多世纪,就到达了目前这样的程度和规模,从最早的示波器乒乓游戏→FC红白机→街机→PlayStation→PC机→智能手机,作为发烧友,游戏一直是我从小到大的玩伴。游戏也是电子设备上不可或缺的娱乐方式,人们也都无法抗拒电子游戏的魔力,在其中消遣放松,体验无尽的新奇和快乐。 我们知道安迪-比尔定理 (Andy and Bill’s Law),安迪指英特尔前CEO安迪·格鲁夫,比尔指微软前CEO比尔·盖茨,指的是硬件提高的性能,很快被软件消耗掉了。类比一下,游戏工业也总能很快将软件系统的性能提升迅速消耗掉,电子游戏一直处在信息技术发展的浪潮之巅,现在AI、VR技术发展,电子游戏也是冲在最前。 第九艺术 现实总是不尽如人意,我们为了脱离低效、困难、枯燥、痛苦的现实,创造了各种艺术形式,在虚拟世界中实现可能,前八大分别是:[b]绘画、雕刻、建筑、音乐、诗歌(文学)、舞蹈、戏剧、电影[/b],艺术家在各自黄金时代创造了令人瞩目的辉煌成就,从五千年人类文明来看,艺术和游戏比科学和程序还要古老悠久得多,受众面也更广,可以说一直与人类文明相伴相生。 到了现代,电子游戏被称为第九艺术,在计算机和互联网中的实现,也是最复杂的交互形式,可以将其它所有艺术形式都囊括其中——大型游戏里都有剧情、美术、动画、音乐制作人。 现在开始向虚拟现实和人工智能狂奔,以谷歌、苹果为首科技巨擘也都纷纷说自己是一家做人工智能、虚拟现实的公司,这些新技术也让电子游戏变得与我们现实世界体验越来越接近,甚至超越了我们的认知和想象的边界。 虚实融合的世界 我们回过头看现实世界,我们所熟悉的[b]语言、文字、货币、宗教、政治、经济、文化其实都是虚拟建构出来的[/b],这些每天主导着我们社会日常运转规则,我们每天日常生活的行为规范——只是我们都[b]习以为常[/b]罢了。 赫拉利的《人类简史》重点讨论了:智人们能够一起讨论虚构的事物,使大规模合作成为可能。 现在看来,虚构故事的力量强过任何人的想象。农业革命让人能够开创出拥挤的城市、强大的帝国,接着人类就开始幻想出关于伟大的神灵、祖国、有限公司的故事,好建立起必要的社会连接。虽然人类的基因演化仍然一如既往慢如蜗牛,但人类的想象力却是极速奔驰,建立起了地球上前所未有的大型合作网络。 最司空见惯的现象就是金钱,“金钱是有史以来最普遍也最有效的互信系统”,过去三十年国内GDP发展迅猛,一切向钱看,房价、股市、金融、国际货币战争都是看不见实体看不见硝烟的权力争霸游戏,通过金钱货币这个虚拟的数字符号,房市股市金融却能产生海市蜃楼般的泡沫,自然界的原始法则——弱肉强食通过这些经济系统实际主宰着许多人的喜怒哀乐,悲欢离合。 接口是一个常用技术概念(泛指个体与个体或个体与外界进行信息交流的共享边界),手柄、鼠标、键盘、触摸屏都是人机交互的接口,在黑客帝国的科幻场景里人类通过类似于钻头一样的接口插入大脑,接入Matrix。 这里我提出一个观点——[b]游戏是虚拟与现实之间的接口[/b],而不是一个实体的脑机接口,我们在游戏和工作中都会产生[b]“心流”的体验——人们全身心投入某事的一种心理状态[/b],挑战和能力的匹配,忘记了自我的真实存在,这时候你是沉浸在眼中的实景、脑海的目标以及与环境交互的带来即时反馈中,不仅是玩游戏,包括音乐家进行音乐演奏、运动员进行体育竞技都存在着这样一种完全沉浸的最佳状态。身处心流之中,你往往能最高效达成期望的目标,实现想象的愿望。 这么来看,其实“虚拟现实”自古以来就存在了,[b]我们早已身处于一个虚拟现实的世界,一个虚实融合的世界。[/b] 一切皆游戏 “人类是悬挂在自己编织的意义之网上的动物。”——马克思·韦伯 下面我们从游戏视角重新审视我们的现实世界,具体是从生命游戏和文明游戏的角度出发——一切皆是游戏。 生命游戏视角 生命游戏是由Conway发明的二维元胞自动机,每个格点可以看成是一个细胞,有生死两种状态,格点的下一刻状态仅与自身和周围8个细胞相关,总结为三条极简的演化规则: 创生:死细胞周围正好有3个活细胞,下一刻则创生 存活:活细胞周围正好有2个或3个活细胞,下一刻继续存活 消亡:活细胞周围小于2个或大于3个活细胞,下一刻则消亡 基于这三条规则我们在屏幕上观察到许多纷繁复杂、形态各异的图案(Pattern),还有滑翔机,滑翔机枪,滑翔机枪播种机这样出乎意料的运动生命图案。   [img]http://mmbiz.qpic.cn/mmbiz_gif/wibWV1DB7tWL04pOaYmBNsmhrwIWOzkMS8ju7MkNrUkH33vkdreH3uQ5tYUglYNB9hs9dAjAOoyZoV9GxWaLHgA/0?wx_fmt=gif&wxfrom=5&wx_lazy=1[/img] [img]http://mmbiz.qpic.cn/mmbiz_gif/wibWV1DB7tWL04pOaYmBNsmhrwIWOzkMSHd3EfptqXnLq1yOMjL7ejO1f5J82BZB9DbXsccAVyWbDdn0m5aszWw/0?wx_fmt=gif&wxfrom=5&wx_lazy=1[/img] [img]http://mmbiz.qpic.cn/mmbiz_gif/wibWV1DB7tWL04pOaYmBNsmhrwIWOzkMS7JHURK0zpSjwqHOqqUESePHU1EjIMtJ7P3cghrE4J6ic6eib4TVDOW2A/0?wx_fmt=gif&wxfrom=5&wx_lazy=1[/img] 更神奇的是在里面可以构造图灵机和通用图灵机,目睹这些震撼而复杂的动态后,Conway放出豪言:“只要给我足够大的模拟空间,等待足够长的时间,生命游戏中可能演化出任意你能想到的复杂事物,包括可以自我繁殖的细胞,以及能够撰写Ph.D论文的智慧生命!”[img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEE92I1mQ7bj5NPCyia3dz5DiaaGOA9WswbVwm6OvGlRqI6kTcVJj7jyiaA/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img] 其实我们的宇宙可以看成是一个规模究极巨大的元胞自动机,人类社会也可以看成一个巨大的元胞自动机,我们自身也无时不刻无处不在被基因、谜因、权力和经济规律所支配的游戏之中,通过能量、符号、语言、货币、情感等信息流,不断驱动着我们的进行运动、计算和演化,在什么样环境下我们就会有什么样的行为。最明显的现象和规律就是我们要吃喝拉撒睡,有马斯洛需求层次,要经历生老病死,社会组织有兴衰成败。 文明游戏视角 在《文明》游戏里,你将身临其境地感受震撼史实,作为历史上著名的领袖,从远古部落文明一直到现代科技文明,为自己文明和国家的发展和演化做出一个又一个决策,同时在过程中明白我们身边熟悉的一切是从何而来的。   [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEEqm7JmicCHia5BhQRgnhMLVwfWnYmSHZzFvDBz10LASDSU4BNaFPia2CQ/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img]   我切身感受到:历史车轮滚滚向前,科技、制度(法律)和商业是推动文明的三驾马车,文明每次翻滚后积累沉淀下来基因也是这三者,政治、文化和宗教控制、同化社会群体,结合武力、军事、战争直接左右历史方向和进程,但文明发展的核心动力源是艺术和游戏,是每一个个体人民的辛勤劳作、锐意进取、随机碰撞和虚拟建构。从上帝视角看整个人类文明,科技、法律、经济、政治、文化、宗教、战争其实都是游戏。 我们可以将人类文明的历史长河看成是一个全球同服的超大型网络游戏,那么就会有游戏反馈——等级、成就、排行榜,历史那些名垂千古的伟人就是地球文明服务器里的超级玩家,下面我们来看看这个伟大的排行榜。   [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEnB4KIwoOiaeI55mAXiaBnOyQdsCVnswfE0ViaibzF2ic5cusHoyYLrPPIiaQ/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img]   都是我们非常耳熟能详的名字,伟人们看似远在天边,其实近在眼前,我们无时不刻不受到他们潜移默化的影响,比如我一说牛顿,我们的脑海之中立刻就闪现牛顿的影子,他的微积分、万有引力定律、牛顿力学。 这里提一下,我们认知范围内最大的游戏系统(引擎)是什么?是时空,是我们观测范围内所能见到的宇宙。 牛顿的绝对时空观,爱因斯坦的相对时空观,都引起了科学和思想上的革命,颠覆了我们对于宇宙时空底层的思维认知。 在上面看到我们看到了宗教与科学激烈之争,过去的社会基石是宗教和科学,而现在随着互联网飞速发展,已经演变成了数字和技术。 这是一份有Wired在最近发布的一份榜单——[b]当今数字世界最有影响力100人。[/b]     [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEDnHu7wiaXFJDShH4UkicGPsooWeqicBHrAAk9XGficdZJNUJ8zcLR5nPYg/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img]   前六名也都是我们耳熟能详的科技大佬,我们每天都在使用他们的科技产品,我们每天在数字世界的行为动作也都被这些巨擘公司观察和记录着,他们的战略决策也将对我们生活产生深远的影响。 在这份排行榜上前几名的大玩家CEO也都是历经挫折、打怪升级、千锤百炼出来的,但前两名马斯克和扎克伯格这一阵子过得很不开心,因为他们发射携带卫星的运载火箭爆炸了,两个多亿美金就这样瞬间蒸发了。 我们从游戏视角重新看世界后,游戏并不是什么洪水猛兽,而[b]优秀的游戏是能激发好奇心,想象力,引人深思的[/b],甚至可以影响改变人的三观。 优秀的游戏可以给人们生活带来活力、快乐和放松,带来前所未有感官体验和冲击,还可以寓教于乐传授知识,是对复杂世界的抽象认知、模式训练,还可以预防和治疗大脑神经疾病,甚至可能是解决日益复杂的政治、战争、环境、疾病等全球危机的良方。   下面是这次活动重点展示的经典电子游戏和科学游戏。   [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEg8IicMcUYWkqIMMM4mpPCYz4oYibhhxRDdLYZ9AN98VKXc87HZnnUptA/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img]   ThatGameCompany创始人陈星汉的禅派游戏独树一帜,不同于市场上绝大多数打打杀杀的游戏,见到一个怪物、另外一个玩家,就在想使用力量和技能,怎么击打他、爆头他,他的游戏清新自然华丽优美,甚至不出现语言文字,却用精心打造背景环境让人感到一种情感上治愈、放松和冲击,使人回归自然,回归恬静,在游戏中发现自我。   [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEJqYMnHPwkBaXDkPYwTtPyHg3Tiavmiaiam6TuPCJSbnhx8SbtIDpCGxVg/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img] [list] [*]InMind VR:以第一视角深入大脑之中,探索神经网络的内部结构,清除有害神经元,独特而直观的VR体验。 [/*] [*]FoldIt:用人类的解谜思维来代替计算机算法中的一部分决策,把确定蛋白质的最佳三维形状设计成一个游戏,使得人们在游戏过程中也能对生物科学做出贡献。 [/*] [*]Strandbeest:泰奥杨森Theo Jansen(1948,荷兰)是一位科学家、艺术家、鬼才,在过去十几年,他用塑料管和电脑程序设计一系列极复杂且精巧的可以依靠风能行走的“海滩生物(Strandbeests)” [/*] [/list]          优秀的科学游戏是能够激发人对自然世界的好奇,对科学的兴趣,去探索未知。   游戏与科学 我们总结一下游戏与科学的共性:[b]游戏与科学都是对模式的观察和参与中涌现快乐。[/b] 模式是什么?目标-反馈系统,符合预期,想象中的因果。 科学是在自然世界中不断寻找模式,经历数据→法则→机制→原理的发展过程,不断抽象上升。   [b]大脑是一个神奇的模式匹配滤波器,一旦我们从噪音世界中看到了一种模式,我们就会不由自主地观察、注意和参与其中,并且在它重新复现和出奇涌现的过程里释放快感的神经递质——多巴胺内啡肽…(命名而已),捕获信息以此享受快乐。[/b]   [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEaUatcb6sbTXk5ZPXYB8Do6icyjkgrMKBOD002RLDzUDLYic8hKlAFibJw/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img]   当一个游戏我们通关了,没有了挑战、未知、不确定性,我们就会感到厌烦、无趣、不好玩了,说明我们已经充分掌握了这种模式,就会去寻找新的游戏。 [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEvUQ20RQgvdMz6XmNkFXFGO83Dge8kh5dlGibWe0dedClUsKkPcOFDZA/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img]   我们展望一下未来这个“新游戏”,未来是奥威尔的《1984》,还是赫胥黎的《美丽新世界》,还是黑客帝国的Matrix?要做出红药丸还是蓝药丸艰难选择吗? 都不是,从历史来看,现实总是能赶上虚拟世界,文明也总在曲折向前,[b]现实世界是虚实融合的,但永远超乎想象,未来是在你我的想象、选择与参与之中,而重要的是当下的体验。[/b]   [b][img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QE0ogxhibjBnuicoicod3HKUfiaj0zcyVrpNaQx79VwfNn7fPPLuyhD3Y7xQ/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img][/b] 而此刻我们在这里发问:我们是否有可能以科学为指导,发起、合作、创造一系列能解决实际问题、引发每个人思考、没有正确答案的游戏? 苑明理老师想用[b]《瓦克星计划[/b]》促进物理、数学和计算机知识的教育,张永杰老师的[b]《机器创造美术》[/b]想释放机器的洪荒之力探索美学新大陆,张江老师[b]《参与的2050》[/b]给了我们一个宏大的构思,多学科参与预测和创造未来,这些项目都让我们充满期待。 最后介绍一下我自己的一些尝试,这是我的个人网站,里面收集了一些科学小游戏,还在努力建设之中,感兴趣的同学欢迎共同交流,详情请戳:gooflife.com [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QExd3V9nDCib3E3L0kHD0ghPocKOkt1nCNpYFjCb100icicPrlibO7Jiay06Q/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img] [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEGPnvoyoAmlZaDtSnq9FdS1Edicr5FNhqFVt12AkLaMMFUTf3LJfVAww/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img] 我们现在生活节奏越来越快,在都市之中我们每时每刻都在想着下一个目标是什么,下一个任务是什么,工作又有了新邮件,微信又有了新的消息,朋友圈又有了新的红点,信息洪流裹挟着我们向前,我们的专注力越来越稀缺,我们大脑和身体有时感觉就像被掏空了。 而我这个网站主题是希望让时间慢下来,大家多一点时间发呆、思考,主动放空身心,从中认识自我,认识宇宙,观察一下虚拟世界中的生命模式,多了解一下自己,自己究竟想要的是什么?这或许是以最小的成本和影响能提高整个社会快乐度和幸福感的方法,也可能是应对数字、技术、智能革命浪潮的最佳方式。   [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWIfpEckAVyhTf0Sz0Knp7QEJKLWH3o1AG8c6K0snuS8uBgXyIicDibErRhaQLt8s6mV78QaYibTaiaqfQ/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img]   感谢看完(听完)我中二的扯淡,希望对你有一点启发。 声明:三张漫画出自Raph Koster的A Theory of Fun for Game Design。 [list] [*]嘉宾简介[/*] [/list]          罗三水,彩云天气工程师,集智科学游戏群群主。本科通信工程毕业后从业于互联网,主要兴趣领域有人工智能、科学游戏和游戏化,相信“万物源于比特”,参与创作《走近2050:注意力、互联网与人工智能》一书,设计开发有《生命围棋》、《走近2050之演化》( gooflife.com)等游戏。

    kyoukou3274 2017-06-28 20:21

  • 1.jpg

    让我们的思想一起发酵:记深度学习中的层级性 | 甄慧玲

    作者;甄慧玲 [list] [*][b]导语[/b][/*] [/list]       “你有一个苹果,我有一个苹果,彼此交换,我们每个人仍有一个苹果;你有一个思想,我有一个思想,彼此交换,我们每个人就有两种思想。”这是但丁的名句。今天,在深度学习,启发式算法和统计物理的共同促进下,我们说,你有一个思想,我有一个思想,我们一起发酵,会有n个思想! [attach]4289[/attach] [list] [*][b]什么是『层级结构』呢?[/b][/*] [/list]       简单来理解,就是我们认为training sets中的数据不仅仅是有平面上的clusters的,还有空间结构上的区别!例如,同时在training sets中出现了“1”和“数字”,同时出现了“猫”和“动物”。纵观各个论文,人们一开始对这个问题的处理,是不断的增加神经网络的层数,并且认为每加深一层,就可以提取出更高level的特征(因此,从2015年的highway networks和residual networks开始,有越来越多的文章要训练越来越深的神经网络)。但是,这对于解决层级结构的问题还远远不够!例如,如果training sets的数据是在一个双曲平面上的,只是简单的增加网络层数显然解决不了问题的本质!       解决层级结构所带来的问题,当然要从『网络结构』和『学习算法』两方面来双管齐下。       一方面,由于不短的时间内我的工作都集中在神经网络的『学习』和『记忆』上,在我们的研究结果中,人们常提到的『记忆(memory)』和『注意力(attention)』也是有层级结构的!另一方面,根据香港城市大学张青富老师(感谢张老师!!张老师也是启发式算法中MOEA/D算法的提出者。)的推荐,在启发式算法或者组合优化问题的研究中常有“1+1>2”的trick,而这个trick其实是和我们之前分享过的curriculum learning以及baby step“不谋而合”:明明看起来只是将原目标函数分成了几个循环步骤,但是效果却明显变好!在我看来,无论是在深度学习的网络模型中,还是在记忆的空间结构中,或者是在启发式优化算法以及population的“合作”问题上,它们对于“层级”都有异曲同工的意味。       本篇内容将尝试围绕“层级结构”串联起“网络结构和记忆”,“学习”以及“启发式算法”三个方面的内容,看看明明那么不同的内容在这个问题上是如何“异曲同工”。 [list] [*][b]Hierarchical在网络和记忆中的最新结果[/b][/*] [/list]       主要涉及到下面三篇文章: [list=1] [*]Deep and Hierarchical Implicit Models (D. Blei), arxiv: 1702.08896v1 (2017/3/2)[/*] [*] Mean-field message-passing equations in the Hopfield model and its generalizations (M. Mezard)  arxiv: 1608.01558v2 (2016/8/26)[/*] [*]Using Fast Weights to Attend to the Recent Past (J. Hinton) arxiv: 1610.06258v2 (2016/10/28)[/*] [/list]         今年3月2日D.Blei在arxiv上的最新文章”Deep and Hierarchical Implicit Models (D. Blei), arxiv: 1702.08896v1“就恰好讨论到了这一点。这篇文章主要提出了两种模型,分别是图1(右)hierarchical implicit model和图2(右)它对应的deep版本。 [attach]4287[/attach]       事实上,图1(左)就已经是传统的hierarchical networks了:x是我们能观察到的量(output),β和z都是隐变量,区别是β是全局隐变量,而z是局部的。全局和局部的区别我们可以理解为:β会影响z(例如多层feedforward神经网络的第一层会影响第二层)但是反过来不会。显然,这样的网络并不等同于传统的深度网络,因为即使是在第二层的z依然对x有影响(而且这种影响显然不是诸如fine-tuning这样的过程可以表现的)。对于这样的模型,目标函数显然要用KL熵: [attach]4294[/attach]       相应的算法当然是随机gradient descent (这已然成为套路。。。)       那本文模型的特点是x还受到噪声的影响!为什么要引入噪声?       我们曾经分析过Bengio去年12月份的文章关于plug-play generative networks,里面最成功的一点就是引入了噪声导致样本的多样性。这个模型对应的deep版本在图2(右)。 [attach]4288[/attach]       由于引入了噪声,在练算法上也与之前的稍有不同:引入了ratio parameter r,这里star表示要求表达式的最小值。 [attach]4295[/attach]       更重要的是,文章的后半部分借助这个模型改进了现在风头正劲的GAN,也就是在generative model中加入了noise和hierarchical的bayesian GAN, 我们发现,这样的改进让GAN在诸多数据集中test error都几乎最小。       给我们带来的insights是:首先我们要承认数据中是有可能有层级结构的,而这种层级结构会让模型更好的了解数据,这种了解不是深度网络仅依靠深就可以实现的!       那么这样的结构在其他方面会有体现吗?事实上,在2016年冬天关于“记忆”的各个文章中都有所体现,而且这样的结构,是有物理意义的!例如,我们接下来要分析的文章:Mean-field message-passing equations in the Hopfield model and its generalizations (M. Mezard)  arxiv: 1608.01558v2 (2016/8/26) 。文章作者可能很多做深度学习的人不熟悉,其实他是巴黎高师的校长,也是统计物理方向的superstar之一。这篇文章通篇都是在用统计物理中的“近似消息传递算法”(Approximate Message Passing,AMP或者TAP,T是2016年诺贝尔物理学奖得住Thouless的名字简称)来分析联想记忆网络。但是在文章的第五部分,他将传统的pattern ξ分解成了两个矩阵的乘积: [attach]4284[/attach]       他认为,pattern是会有叠加的,也就是,还会有一组向量v(不妨假设这里v是相互独立的)来表示原始pattern的特征,而u则是这组pattern的线性组合的系数!       这意味着什么呢?意味着pattern  ξ是可以被分解的,而分解出来的元素则是更基本的level的pattern !在这样的假设下,作者得出了另外的一组方程: [attach]4285[/attach]       如果熟悉统计物理在RBM和Hopfield网络上的结论的话,就可以发现:当把RBM的连接权重W分解成不同的pattern的乘积,则在形式上对应了Hopfield网络(当然也要让visible和hidden neurons的外场全是0);如果把Hopfield网络中pattern继续分解,则在形式上对应了上面的模型。而这三个模型在AMP算法的表达式上差别仅在于Hi的第二项(也就是所说的Onsager项)的系数!       这又意味着什么?这篇文章给出了attention和memory的统计物理上的解释!attention和memory不仅在人们已知的capacity上有差别,它们在物理上的差别关键是Onsager项的系数不同,但是naive mean-field系数是相同的!换句话说,当我们考虑到记忆的层级结构时,不同的分层影响的是二阶或者更高阶的作用,但是不改变线性关系!所以,当考虑到层级结构对网络的影响时,对模型本身(无论是学习还是记忆)的影响都是非线性的,也就是当不断的考虑分层时,对最后效果的改变远远大于层级数的改变!       在“记忆的层级结构”这个问题上同样意识到这件事的,还有Hinton去年的文章:Using Fast Weights to Attend to the Recent Past (J. Hinton) arxiv: 1610.06258v2 (2016/10/28)。当然,Hinton用的是完全不同于Mezard的思路。       Hinton在这篇文章中提出了fast asssociated memory(或者叫fast weight),其实就是在hidden layer的连接之间引入了A(t): [attach]4296[/attach]       换句话说:在一个常规的RNN的迭代过程中,本来是要将hidden layer的h(t)迭代n次(从h^0到h^(n-1)),现在呢,是将h(0)迭代s次(从h(0,0)到h(0,s-1)),而后再将h(1)迭代s次(从h(1,0)到h(1,s-1),其中h(1,0)的初值由h(0,s-1)给出),以此类推……具体的迭代公式如下: [attach]4286[/attach]       这个过程是不是似曾相识?!再来看看Mezard是怎么做的:他将本来的associative memory中的pattern  ξ分解成了u和v,其中v被当成pattern的pattern,u被当成了线性组合的系数。那Hinton这篇文章呢?他将隐层的连接矩阵h(t)分解,导致从h(0)到h(n-1)的n次分解变成了h(0,0),……,h(0,s-1),h(1,0),……,h(1,s-1),……h(n-1,s-1)的n*s次分解!从统计物理的角度来理解,如果我们写出fast weight所对应的AMP方程,每一个A(t)会且只会影响Onsager项的系数,因此,虽然计算的数量级从n变成了n*s,但对效果的影响确实远大于此(至少是n*s的平方!)       从实验上也确实是这样!例如下图:fast weight在n=20的时候,对比普通的RNN,test error从62.11%降低到了1.81%,而参数更多的lstm却只降低到了60.81%!当n=50或者更高的时候,fast weight的test error干脆降低到了0! [attach]4290[/attach]       而对比CNN,在特征是200的时候,fast weight的test error从0.9%降低到0.85%,效果依然好于rnn和lstm ! 当然,在特征数较少的时候,优势不明显,这当然是很好理解的:给出一个极端情况,如果你只有2个feature,这种hierarchical的假设只会带来overfitting  (∩_∩) (∩_∩)! [attach]4291[/attach] [list] [*][b]神经网络的泛化学习本质与hierarchical的关系[/b][/*] [/list]       不仅在记忆和网络结构中,会有hierarchical的存在,下面我们会说,在2017年初关于神经网络学习本质的“Bengio兄弟之争”论文中,依然可以从这个角度理解!       去年11月份,Bengio的弟弟(目前在Google Brain)提交了这样一篇文章:Understanding deep learning requires rethinking generalization (S. Bengio) arxiv: 1611.03530v1。当然,这篇文章是从泛化generalization的角度来说的。       这篇文章本身是想解释为什么大规模神经网络在泛化这个问题上表现的好。借助随机梯度算法,作者在CIFAR10和ImageNet上正式了即使单独的使用标签随机化而不改变模型的大小和参数等易燃可以让模型的泛化大幅度提升!原因是,他们认为CNN的泛化效果好是因为更容易拟合随机标记,也就是说,网络是通过记忆来学习的(不是通过不断的提取特征)!!       首先,作者通过引入随机数据来证实虽然随着噪声的引入导致训练时间变长,但是网络总是可以让输入和输出相拟合,如下图: [attach]4292[/attach]       然后,文章也讨论了正则化虽被认为是有助于减小泛化学习的误差,但是对于低测试错误,正则化是不必要的。因此,他们认为,正则化起作用的时候是由于“将可能的假设空间减小到更小的子集”!文章的最后还证明了“存在具有 ReLU 激活和 2n + d 个权重的两层神经网络,其可以表示d维中的大小为n的样本的任何函数”。       引起我们注意的正是文章的后两部分结论,这看起来和统计物理的想法如此相似:正则化不是一直有效,只有将空间减小的时候才有效(其实就是相当于说只有分解了latent parameter而利用分解后的特征来学习的时候才有效!!)至于最后一部分证明,其关键是将input x分解成了x1,……,xn,在空间I1,……,Ib上分别积分!(这就相当于本来是只有n步的计算变成了n*b,有没有在Hinton和Mezard的文章中找到共同点?!)       但是,由于在2017年初Bengio本人提交了这样一篇文章:Deep Nets don't learn via memorization (E. Bengio) 2017, ICLR workshop。这篇文章针对弟弟的结果主要说明:DNN不会记忆!虽然看起来对于每个训练样本,DNN 都能实现完美的分类精度是由于“记住”了样本,但是这仅限于training sets!       他们做了如下的几个实验:随着更多的样本被噪声替代,DNN 需要更多的容量才能达到最高性能。这表明网络能够以更简单的模式,也即更少的参数解释真实数据。 [attach]4293[/attach]       在分析正则化时,他们发现正则化是对随机标签起作用的(这个实验结果是与弟弟的文章相反)。       我们是从统计物理的角度来研究“学习”和“记忆”的,在我看来,虽然他们的结果呈现了一定程度的不同,但是都是对的,也都有不对: [list=1] [*]我们不认为DNN可以记住数据(所以并不是通过记忆来学习的!这点上绝对是站哥哥!),但是可以记住的是training sets的不动点!事实上,除非即使忽略数据集的hierarchical的性质,也依然是可以分成若干个cluster(除非你只是训练了全是0或者全是猫,还得计算机认为的一种0的写法或者一种猫,连传统的handwriting都不可以!),而当你在test set上做测试的时候,其实是看测试的sample在哪个不动点的管辖区域内。更具体的结果可以参见文章:Memories as bifurcations: realization by collective dynamics of spiking neurons under stochastic inputs (Neural Networks)。[/*] [*]但是,关于正则化的讨论我们认同弟弟的观点。至于两篇文章出现了不一致在我看来是因为前提不一样:问题的关键是分解!有没有将inputs和weights分解将起到至关重要的作用!因为这意味着是否将hierarchical结构考虑到了里面(从哥哥提交的文章中看,似乎是没有。)。事实上,我们认为这种分解等效于curriculum learning(但是,在curriculum learning 中,是将目标函数分解成若干步骤,这里是将参数或者Inputs分解)。例如:Visualizing and Understanding Curriculum Learning for Long Short-Term Memory Networks中也会有相应的作证![/*] [/list]   [list] [*][b]究竟是hierarchical还是deep在影响着算法的设计[/b][/*] [/list]       为了佐证“分解”或者“hierarchical”在学习中的作用,我们也推荐如下的两篇关于启发式算法的文章: [list=1] [*]An Economics Approach to Hard Computational Problems (Bernardo A. Huberman, HP Senior Fellow and Director). Science.[/*] [*]MOEA/D: A Multiobjective Evolutionary Algorithm Based on Decomposition (Qing-Fu Zhang, City University of Hong Kong) IEEE Trans[/*] [/list]       第一篇文章很短,原理看起来也很简单:把目标函数f分解成f1和f2,把p(t)分解成:       对应关系是f1对应p1(t),f2对应p2(t)。而后发现无论是在目标函数的优化还是风险估计上,都效果比直接处理f和p(t)效果要好。       如果说这是个例的话,那么第二篇文章也就是张青富老师的文章MOEA/D: A Multiobjective Evolutionary Algorithm Based on Decomposition就更能说明问题一些!这篇文章首次将这种分解的方式应用到了进化问题上。这个算法的关键有两部分: [list=1] [*]将一个多目标优化问题分解成不同的子问题,[/*] [*]而且每个子问题的优化信息将通过相邻的子问题得到(有没有想到深度学习中的weights sharing!),从而减小了计算复杂度。[/*] [/list]       综合上面两篇文章,有没有发现这种处理方式和curriculum learning很像!!不直接处理原始的目标函数,而是处理一个与之相关的一部分,而后,逐渐的过度到原始的(当然,这里只是分成了两步,但其实是可以分成n步的,不过将p(t)同时分解就好)!乍一看,这个似乎和“深度网络究竟是deep还是wide效果好”这个议题相关,换句话说,似乎我们可以理解成:把f分解成的f1……fn分别可以理解成每一层的指标(类似目标函数),所以,逐层提取特征的过程就相当于逐步完成这个组合优化的过程。但是,其实不然!事实上,如果是深度网络逐层提取特征的过程的话,不同层的目标函数不会发生变化!!而这样的过程其实是在考虑优化空间的hierarchical 特征!!根据不同的level或者特性的优化空间,不断的更新目标函数!       但是,这反过来是什么意思呢?明明f1……fn分别是f的一部分,但是分别处理却效果比直接处理要好很多!!这样的现象在统计物理中也是常见的: 例如在文章“Solving the inverse Ising problem by mean-field methods in a clustered phase space with many states”“Inference and learning in sparse systems with multiple states”等解决组合优化问题的时候,都是先将data分成不同的cluster,然后,在每个cluster中逐一求解。同时,他们证实了,用这样的方法来做组合优化是可以得到整个dataset一起处理时得不到的物理现象。当然,cluster忽略了空间结构,当成hierarchical的一个某种程度上的特例来看就好。       那我们可不可以理解成,这就是所谓的“1+1>2”现象呢?也就是我们说的合作问题:深度学习中需要区分开不同的hierarchical来分层训练,组合优化中则需要利用hierarchical来取得更优的最优解!换句话说,在组合优化中将f分解成的f1……fn,恰好是不同的hierarchical的某种指标(诸如目标函数),而整个优化问题是将解空间分成不同的层次分别完成最优。既然如此,深度学习可以借助诸如MOEA/D这类启发式算法来完成训练,启发式算法或者组合优化问题则可以通过构造深度网络或者图模型来利用数据求出最优解!

    Revo 2017-06-28 20:20

  • 1.jpg

    自然语言理解在金融领域的应用 | 尹相志

    作者:尹相志 [attach]4270[/attach] [list] [*][b]中文理解与金融业[/b][/*] [/list]       如今的人工智能已经在各个子领域中取得了突飞猛进的发展。现在的AI可以听、说、读、写,但是在自然语言的理解方面仍然存在着很大的不足。 [attach]4271[/attach] [i]自然语言处理[/i]        特别是,对于中文的处理恐怕是人类智力仅剩的堡垒之一。处理中文尤其困难是因为: [list=1] [*]中文是世界上少数的几个需要分词的语言;[/*] [*]中文的字符(汉字)数量超多(20928);[/*] [*]能够依赖上下文产生相反的语义;[/*] [*]无需约定俗成就可以创造出新的文字。[/*] [/list]       比如,你们知道用中文表达「快递很快」有多少种表达方式吗?答案是3600多种讲法。  [attach]4273[/attach] [i]汉语表达的多样性[/i]         金融业是比较保守的行业,除非你的技术真的能解决它的痛点问题,否则它将不会采纳新的技术。那么金融的痛点问题都有哪些呢?       现在的金融从业人员正在阅读大量的合同、文本、网页等信息,从中提炼出重要的关键信息。而这些文本大多非常冗长难读,令人非常伤脑筋,而且还可能犯错误。下面,就让我们来看看这张图: [attach]4277[/attach] [i]融行业冗长的文本信息[/i]       这样一段长长的冗余文字实际上就想表达这样的实体关系: [quote] 华夏幸福基业股份有限公司-->(父子公司)-->廊坊京御房地产开发有限公司 廊坊京御房地产开发有限公司-->(父子公司)-->廊坊市圣斌房地产开发有限公司 华能贵诚-->(向...增资)-->廊坊圣斌 华夏幸福-->(向...提供担保)-->京御地产 华夏幸福-->(向...提供担保)-->廊坊圣斌 [/quote]       实际上,实体-关系识别是金融行业中的最典型应用,如下列问题:法金授信、二级市场分析、个资掩码、授信照会、投资研究。       我们的技术可以透过自然语言整理知识图谱,而知识图谱再透过自然语言进行推理,这将会是人工智能的下一波增长点……  [attach]4282[/attach]       另外,利用Seq2Seq模型,我们可以利用自动对话数据理解或猜测出用户的「意图」(Intent),并同时识别「实体」(Entity)和产生「行动」(Action)。 [attach]4283[/attach] [list] [*][b]词向量技术在金融中的应用[/b][/*] [/list]       下面,我们展示我们利用词向量(Word2Vec)技术来自动而快速地生成实体列表和商务规则。 [attach]4272[/attach] [i]利用词向量技术来自动而快速地生成实体列表和商务规则[/i]       词向量技术是近年来发展出来的一种深度学习技术,它可以通过扫描文本而自动将每个单词嵌入到一个高维空间中,使得每个单词出现的位置都和它的上下文有关,相似的词可以得到相似的空间向量。另外,更有意思的是,词向量不仅能够表达实体单词,还能表达实体之间的关系,例如著名的公式:男人-女人=国王-王后,这里面的差向量就是男女关系这个向量。所以,利用词向量可以进行一定的类比思维。再比如右侧的图中,左侧的实体是国家,右侧的实体是城市,直线对应的是首都关系。       在我们的例子中,我们将词向量技术用于枚举出所有的币种。我们通过扫描大量的文本,可以得到每个单词的词向量,那么我们怎么把所有的货币的名称跳出来呢?答案很简单就是利用如下这个cos距离的公式,我们只要将与美元的距离+英镑的距离和最小的那些词向量所对应的实体列举出来就可以了。  [attach]4274[/attach]       这样,我们便可以枚举出如下的所有币种了: [attach]4275[/attach]       然而,利用这种方法无法排除歧义词的问题。 [attach]4278[/attach]       我们的解决方案是引入第三个词。这里有两种方法,一种是语义增强,一种是语义消岐。采用下面的两个公式分别能够做到这两点: [attach]4276[/attach]       这样就可以得到我们希望要的结果了。但是这里的冰棒和雪糕还是有点怪怪的。 [attach]4279[/attach] [list] [*][b]Brain of things公开比赛[/b][/*] [/list]       下面,我想介绍一下我们华院数据今年的公开比赛:Brain of things,我们会在这里提前两天公开我们的赛题。在去年的比赛中,我们制定了比较变态的赛题,真的很难,但是大家答得都很好。       比如,我们的初赛试题是图像理解,这不是普通的识别,你要能够认出这张剪纸是一只狗,这是一只装扮成长颈鹿的狗,所以机器要对图像进行深层理解。        在复赛实体中,我们要对货架上的货品进行自动计数,进行盘点,这意味着你的程序要能够对20几种产品进行识别。当然,复赛还包括行车记录仪的应用。  [attach]4281[/attach]       我们去年决赛的题目是看图理解,并用中文回答问题,这在全世界都是首例。这个题目超难,但还是有人给出了非常令人吃惊的成绩。 [attach]4280[/attach]       那么,下面我们来公布我们今年的题目,今年的初赛题目是寻找K线之王,就是让机器直接看K线图,从而判断出是否发生了上涨下跌、k线背离、阻力位、支撑位等。你注意,在这里我们不能简单地用卷积神经网络来做,因为不能够有权值共享。       我们的复赛题目是判断新闻中的蝴蝶效应,即评估出市场消息对股价影响的程度。也就是输入一段文字以及图片,判断出次日、第三日的涨跌幅,这样当出现一条消息之后,我们就可以用机器来做预判,而不必引起不必要的恐慌。

    Revo 2017-06-28 20:03

  • 1.jpg

    华院首席科学家:中文或是人类面对人工智能的最后壁垒

    作者:吴迪 [quote] “语言可能是人类面对人工智能最后的壁垒,尤其是中文。” [/quote]       在3月18日集智俱乐部在中央财经大学学术会堂举办的公开讲座上,华院数据首席数据科学家尹相志结合NLU(Natural Language Understanding,自然语言理解)在金融领域的应用之处侃侃而谈。在阿尔法狗在围棋领域击败人类之后,人类又一引以为傲的智慧壁垒被攻破,那么究竟有没有一个领域是人工智能暂时无法企及人类的?尹相志给出的答案是中文。       NLP(Natural Language Processing,自然语言处理)是人工智能的一个子领域,也是人工智能中最为困难的问题之一,“语言本身就是一种特殊的数据,它本身就覆盖着意义,我们需要提取的是语言的意义,而不是语言的符号形式。”       而NLU将通过对自然语言的理解,实现极佳的人机交互体验,将人类从无聊、繁琐但必要的事务性工作中解脱出来。 [attach]4261[/attach] [i]相志在集智俱乐部的公开讲座[/i]   [list] [*][b]新时代的“孔乙己之问”:形容「物流很快」有几种说法?[/b][/*] [/list]       金融从业者每天一早就要读报表、新闻,写出晨报或纪要;而一个医生每天也要对病房、病人的情况进行记录,并进行分析。这些“繁琐但必要”的工作,正是NLU的用武之地。       “人工智能首先替代的不是体力劳动。”尹相志说。人工智能将首先攻陷重复劳动较多、毛利率较高的行业,例如金融、医疗。       传统的NLU技术往往采用穷举法,在尹相志看来,这一招对于神秘莫测、巨量词汇的中文不管用。       “想想看,在电商网站的评论中,形容「物流很快」有几种说法?”尹相志的这个提问,让人想起了鲁迅《孔乙己》中的「孔乙己之问」:茴香豆的茴有几种写法?       这两个问题的不同点是,「孔乙己之问」相对封闭,可以通过穷举法轻松回答,而由于中文词汇的多义性,“尹相志之问”则几乎不可能通过穷举法回答,“我们分析,形容「物流很快」至少有3600种说法,比如「第二天就到了」「物流很给力」「给快递点赞」等等,这就给NLU技术提出了很高的考验。” [attach]4263[/attach][i]语表达的多样性[/i] [list] [*][b]金融业NLU应用痛点:实体/关系识别[/b][/*] [/list]       “对于人工智能,最难的就是理解语言中不同代词的具体所指。”尹相志举例说,在一段文字中,可能出现多个「公司」的单词,那么人工智能就要判断这些「公司」分别是什么公司,而它们之间又是什么关系,这样才能真正理解一段文字。       尹相志说,在金融业的法金授信、二级市场分析、个人资料掩码、授信照会、投资研究等实际工作中,都可以由NLU对实体、关系进行识别。同样的工作如果由人工来做,难免出现疏漏、错误,并且会产生高昂的时间和工资成本。 [attach]4262[/attach] [i]动现场照片[/i]  [list] [*][b]词向量:NLU的华丽杀招[/b][/*] [/list]       NLU的核心命题,在于将语言符号数字化。因此,人们利用计算机工具,将词变成了“词向量”,这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为 0,只有一个维度的值为 1,然后透过深度学习将高达数百维度的超大向量压缩至200~300维,这样高度压缩的结构就是词向量,这个维度就代表了当前的词。通过阅读“词向量”,人工智能可以把语言“可视化”。       “透过自然语言整理知识图谱,知识图谱再透过自然语言进行推理,是人工智能的下一波增长点。”尹相志预测。       除了语义模拟之外,尹相志还举例介绍了如何利用词向量快速生成实体列表与商务规则。为了消灭歧义,可引入语义增强、语义消歧两种手段。 [attach]4265[/attach] [i]词向量的应用[/i] [i][attach]4264[/attach][/i] [i]词向量的应用: 语义增强和语义消歧[/i] [i][attach]4266[/attach][/i] [i]词向量的应用: 语义增强和语义消歧[/i] [i][attach]4267[/attach][/i] [i]词向量的应用: 语义增强和语义消歧[/i]  [list] [*][b]Brain of Things 2017竞赛题剧透:[b]人工智能竟然要做这些事[/b][/b][/*] [/list]       辨别玩具狗和真狗、识别行车记录仪场景、识别超市货架……在2016年的Brain of Things竞赛中,人工智能大显神威,让人看到了机器深度学习的更大潜力。       今年,人工智能又要在比赛中面对怎样脑洞大开的题目?尹相志剧透了初赛和复赛的题目,并且“友情提示”:这些题目都很难。  一、K线图智能视觉特征理解       赛事提供历史K线图和对应的K线图评论,参赛者需通过训练使计算机自动撰写对应的K线评论。详细数据集内容与评比规则后续将与大赛报名一起发布。  二、市场消息股价影响评估       赛事提供过往宏观、行业等消息和个股的行情、资讯、公告、重大事项等消息,参赛者需要通过训练使计算机可以评估市场消息对于股价的影响。详细数据集内容与评比规则后续将与大赛报名一起发布。 三、泛金融领域商业模式赛       智能投顾、风险控制、定价、欺诈检测、企业和个人征信、财富管理、智能助手、区块链、消费金融、供应链金融等大数据和人工智能在金融领域的创新应用等科技金融领域,提交商业计划化书,商业计划书需含有可操作商业模式和具体实施路径。      想想看,要是AI能较好地完成这些任务,炒股还用愁吗?让我们期待AI的精彩表现吧。 [list] [*][b][b]“声称可以识别90%以上自然语言的技术,很可能是忽悠你的”[/b][/b][/*] [/list]       在答问环节中,尹相志承认,目前人对于人脑和电脑的学习机制都没有完全研究透彻,人工智能也就很难真的完全理解人类自然语言,“声称可以识别90%以上中文自然语言的技术,恐怕是要小心他在忽悠你了。”只有谦卑的面对技术成未成熟的现实,才有可能向前进步,如何辨别真技术和假忽悠,将成为技术成熟的重要关键。       尹相志认为,技术的产业化应用一定要非常谨慎,反复的失败尝试,会影响投资者和公众的信心。不过,尹相志确信,未来随着算法的完善,NLU的准确率和应用性将越来越强。 [attach]4268[/attach]

    Revo 2017-06-27 20:55

  • 1.jpg

    缘」来如此:集智俱乐部参访龙泉寺小记

    作者:金文君 [quote] 大乘义章三本曰:“缘者由藉之义,缘别不同,故分为四:一者因缘,二者次第缘,三者缘缘,四者增上缘。”作为一名纯文科出身的图书出版人及作者来说,有机会参与进入集智俱乐部这样一个高科技组织,又在第一时间以内部参访团身份进入龙泉寺,回到平日里最熟悉的场景中,不能不说是一种殊途同归的因缘和合。 [/quote]         八点不到,我已接近凤凰岭山脚,远观薄雾弥漫,山峦起伏,粉色的杏花开得错落有致,伴着凤凰岭景区静谧的氛围,凸显了龙泉寺的几分神秘。 [attach]4251[/attach] [i]集智俱乐部成员抵达龙泉寺[/i]      这座原本始建于辽代的千年古寺,其实复建不过十一年。在高度发展的互联网时代,龙泉寺因为几位毕业于北大、清华等名校的高学历法师,再加上独树一帜地使用各种多媒体渠道传播佛教文化,以及那个样子呆萌逗趣的机器僧“贤二”获得“最牛极客入龙泉”的盛名。佛教与科技的结合背后是这样的一个僧团?他们的目的又是为何?集智俱乐部的成员们会带着怎样的问题与法师们产生碰撞?      令人期待的一天就此开始…… [list] [*][b]无规矩不成方圆[/b][/*] [/list]      虽然在来寺庙之前已经在网络上了解到龙泉寺除了修行僧之外最著名的就是人工智能的“贤二”机器僧,但给我留下印象最深的却是寺里有组织有纪律却又恪守规矩的义工们。      记得在寺外等待的时候,义工VIVIAN在向大家介绍了一天的大致行程之后特别强调地说了一句话:“或许义工们讲解不一定那么专业,但请大家记得我们都本着一颗真心,一份诚意。希望大家能够理解。”这一句,仿佛是一声警钟,萦绕耳畔良久不能散去。将我原本带着的那份审视与揣度之姿打回原形,将心中对三宝的喜悦与恭敬置于首位。      跟随师兄参观古寺风景、唱诵经文绕塔之后,我们一路跟随着“止语”的标志走进内院禅堂,男女信众分开穿上鞋套,净手后进入佛堂。整个佛堂大殿庄严肃穆,金碧辉煌,堂前正前方供养着三方神圣,法相庄严。堂前忙碌的依然是负责拍摄录像的义工们,我们各自落座,安静等待着法师的到来。 [attach]4252[/attach] [i]集智俱乐部成员唱诵经文绕塔[/i]        在大家的合掌頂礼中,悟光法师走向讲坛。这是我第一次见悟光法师,他个子不高,语气里却有着法师的威严与干脆,语气坚定,铿锵有力,颇有棒喝之意。在整场的开示宣讲中,法师以宗喀巴大师所著的《广论》为范本,为信众们详细讲解了“离苦得乐”、“如是因如是果之因果论”、“戒定慧”、“空性”等概念。其中特别提到了无规矩不成方圆,不要对比眼前付出与获得的比例,错乱因果,便是错乱缘起,这样枉生烦恼和痛苦,安住当下,方能水到渠成。      课后来到斋堂,这虽不是我第一次在寺中用餐,但却是第一次见识到千人斋堂能够在全程止语的情况下有序地完成一波又一波的接待任务。斋饭被规定需要用尽,甚至有义工最后用开水冲刷碗底,这样做的目的并不是为了多喝一口水,而只是为了能够让下一个刷碗的义工少一点辛苦……离开斋堂,看着堂外用力刷洗笼屉的义工们认真的背影,心中升起的是无比的恭敬。      虽然周末的内院显得有些拥挤,来自国内外不同类型参访者们人头攒动,但在义工们的引导下却显得如此井井有条。有领队讲解的、有外宾翻译、有引导疏散的、有专门做“止语”指引的、有大寮帮厨的……我与很多义工都对视,他们的眼神里丝毫没有都市人眼中繁忙后的茫然,有的只是平静而专注。      这里的规矩可能会对很多普通人来说显得有些局促,却不曾知道这只是佛门戒律清规中的鸿毛一撇。这里的一切似乎都运转地如此恰如其分,或许你看到的是这里的规矩与次第,但在我看来更多的是那一颗颗至诚至善之心,一颗向佛法谦卑恭敬之心,一切才能如此顺其自然,自然而然。 [list] [*][b]古老与现代的和合之美[/b][/*] [/list]      在很多报道中都能看到龙泉寺住持学诚大和尚说的一句话:“佛教是古老的,但佛教徒可以是现代的。”这也是龙泉寺为什么能够先于其他寺庙,借助高科技手段踏出新时代弘扬佛法的第一步。在我看来,这个高科技里含着的不仅是技术的超前,更是思维的的先进性。      始建于辽代的龙泉寺在学诚大和尚的愿力下于十几年前开始重建,按照学诚大和尚的要求,环保、节能、实用成了寺庙复建的标准。图纸由僧人和义工们自行设计,所有的木结构都不上化学漆,以确保环保;去往信息技术中心的路上布满了深一脚浅一脚的石头路,义工告诉我们寺里本着节约的准则不浪费所有的边角料,这条石头道便是所谓的“建筑垃圾”回收再利用的结果。这里所有的一砖一瓦都是僧人和义工们一起努力的结果。 [attach]4253[/attach] [i]僧人排班[/i]        可圈可点的便是龙泉寺以现代化标准建立的图书馆,这里占地面积之大足以证明寺庙对知识的重视性,所有的佛教类用书加上古籍善本已达到15万册的数量,图书馆沿用了一套先进的图书管理系统,每一本书都有条形码,馆藏章,防盗、检索、编目系统一应俱全,还可以通过图书馆的电脑进行图书查阅、登记、借阅等工作。走进阅览室迎面而来的便是一排特制的书柜,也就是传说中的恒定保温系统,让一些古籍能够在最合适的环境下得以很好地保存。阅览室宽敞明亮,带有一丝清幽古朴的气息,令人宁神静心。 [attach]4255[/attach] [i]集智俱乐部成员在龙泉寺图书馆门口参观[/i]        走出图书馆走上二楼的平台,整个平台上均匀分布着一排排玻璃砖,谁料这里也藏着一个节能的玄机。为了降低用电量利用太阳的自然采光,在平台上开孔装上玻璃,白天太阳能射入下层的房间取代照明,晚上屋里的灯亮同样可以通过玻璃反射到上层作为寺庙的环境光使用,实在是巧妙用心的设计。 [attach]4254[/attach] [i]集智俱乐部成员在龙泉寺图书馆内参观[/i]      走进“贤二”机器僧的研发室,顿时感受到扑面而来的现代气息。展示架上摆放的一排面塑的“贤二”卡通形象也立即吸引了大部分人的目光,可爱的大脑袋,呆萌的神情实在惹人喜爱。虽然未能得见贤二本尊,但能够在研发室看到机器僧最初的手绘稿及视频也算得偿所愿。 [list] [*][b]作者感悟[/b][/*] [/list]      走出研发室的路有一段坡度不小的上坡路,走得实在有些费力。突然让我想到,科学和宗教都能够解释世界。科学的优势在于认识和改造物质世界;佛教则在认识和改造精神世界方面有一套完备的方法。二者虽然立场不同,但目标方向一致,让人们能够离苦得乐,越来越幸福。走向科技的路是艰难的,每一步都是摸索与未知,就像那片石头路深一脚浅一脚,步步惊心;但走向修行的路更是艰辛,容不得半点懈怠。在古老的修行与高科技的飞速发展中找到那个平衡才是难上加难。 [attach]4256[/attach] [i]贤二”机器僧动漫中心一角[/i]      集智俱乐部,作为一个从事学术研究、享受科学乐趣探索的自发性团体,倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的“没有围墙的研究所”,除了集核的少数人之外,更多的是致力于这一种科研生态广泛传播的志愿者们;在这里没有特别强调某一个人或者某一种声音,而是提倡百花齐放、百家争鸣;在这里大家畅所欲言,取长补短,互相关照。这种科研精神与组织能动性中所带着的包容与融通似乎与佛教道场龙泉寺的信息技术中心所提倡的“穿越技术人生、探索终极价值”的理念有着不谋而合之处。      龙泉寺在探索,龙泉寺也更需要那些慈悲之心的善男子善女人带着各自的善知识将这份善念传播得更广,更远。      就像有一句话说的那样:喧嚣、复杂的年代,更需要对世界抱有最初的信念和理想,爱与良知。我们一起努力。 [attach]4257[/attach] [i]合影留念[/i] [list] [*][b]研讨会部分[/b][/*] [/list]      在集智俱乐部创始人张江老师看来,龙泉寺在高科技与人工智能方面有着前沿的实践,而集智俱乐部则是一个开放性探讨人工智能等问题的学习乐园,双方应该存在着更密切的合作与探讨空间。而在集智学园CEO张倩看来,两个机构之间的共通点都是致力于各自去伪存真,在浮躁与变换多端的社会下,能够更专注于学习与分享。中科院自动化所助理研究员谷鹄翔博士还主动提供了自己正在进行的项目的对比,并在生僻字识别上提出将技术与人工相结合的方式来达成更高的精准度的方案,愿为龙泉寺致力于做出中国这个时代的大藏经的课题而共同努力。以下节选集智俱乐部成员们与悟光法师及贤度法师的部分精彩问答选编。 [quote] 黑体加粗:集智俱乐部成员的精选提问 普通黑体:悟光法师的回答【龙泉寺书记、监院】 [/quote]    [b]  我们谈到2040年,人类可能会达到实现复制人脑神经元的功能。然而您说人类的思维又是不可被复制的。那么就有一个大胆的设想,如果想去做机器人的思维,从当下来看,是不是需要对人有一个更深层次的了解的情况下才能做好机器人的思维?[/b]      不管机器有多智能,最终还是一种程序思维和逻辑思维,它只是运算快而已,似乎让人感觉好像它是在思维,实际它还是一个程序。只有有情的心意识的续流也就是心识投入进去才有可能成为一个“有情”,否则它依然只是 一个机器。在这之前,他或许可以思维,但这个思维只能是加引号的思维,可以说是人造的思维。      现在很多科学家都在探讨关于机器人思维问题。是否会有思维,我觉得肯定有,思维甚至可以超过人,但它依然是人造思维,这属于基本理论。除非有一天,因缘所生法,谁投生进去了,这个可能他就是一个“真人”了。 [b]我觉得学佛和做科研一样也是一个很辛苦的过程,需要钻研。我在高校当老师,也是一个辛苦钻研的过程。我想问的是,我曾经非常追求学术上境界的提升,这个过程曾经对我的身体造成伤害,那么您在钻研佛法的时候是不是也是一种执着?[/b]      这个问题非常好。这个问题也普遍存在于一切领域。      在佛学里有一个名词叫善法欲,不否认这也是一种执着,但善法欲为什么是善良的?他最终能够带你达到快乐清净之地,最终从“有执着”进入“无执着”,他不是无止境的一种状态。比如说你因为执着搞科研,腰酸背痛。而修行不是,如果你善法欲执着修止观,你一定会得轻安,身心极乐,不会腰酸背痛,这就是区别。为什么它是善法欲,如是因如是果,你如果是造的善行,你必感善果。但是这也有漏的,所以我们通过修止观进入无漏的状态,所以这种情况之下,你可以进入无我状态,这是每一位大智者和圣人最终所达到的境界,也就是说,只要循着这个道路去修行,没有人不能达到,包括你完全可以达到。      比如,你没有在全球知名杂志上发表论文,就一晚上睡不着,那是叫真烦恼,那不是善法欲。在佛门当中主要重视内在,我的烦恼有没有净化?我的“我执”有没有净除?比如通过一定的修行之后,你可以达到了初禅的境界,叫离生喜乐,你就能够有短暂的脱离烦恼,何况到菩萨到八地的境界,那有无量的化身,可以见无量佛,可以去无量的刹土,行无量的利生事业。到底是怎样的过程可以参看《大方广佛华严经》,讲得都很清楚。      [b]我想问一个现在年轻人普遍存在的一个问题,就是我们生活在一个信息爆炸的时代,我们发现我们的认知已经远远跟不上这个信息的更新了,于是我们就要不断的去学习。但是,嗯,我们越学到后来就越发觉得迷茫,甚至不知道该如何学了。是方向的问题吗?如果是方向的问题,那么我们怎样去寻求内心的声音,拨开云雾找到真正自己想做的事情,并把它做好呢?[/b]      第一,的确方向是有问题,方向的问题是因为我们一直在向外寻求,在佛典佛理里边来看,你,向外寻求某种事,最终很难得到。第二,现在科学的产品可以有复制性,我们人类的脑袋想跟着科技的产品去追,告诉大家,永远追不上,就从一个一个新闻软件来看,你装在智能手机里边,全世界的新闻都来了,你有几个脑袋有几个24小时?你看吧,永远看不完,蹦出来的新闻还都挺大,都挺值得关注。人跟机器人与人工智能比,怎么能比得上?我看要放下,别去和他比。咱们这里都是人工智能专家,因为人家机器人是不休息啊,我们需要休息,我们有苦乐,人家没有苦乐。所以我认为作为人要知足常乐,放下有些东西,不一定需要去追逐,否则的话,你会完全被人工智能所欺骗,最后你比机器人还机器人。机器人越来越智能了,我们越来越傻了,必然的结果。 [quote] 黑体加粗:集智俱乐部成员的精选提问 普通黑体:贤度法师的回答【人工智能与信息技术中心负责人】 [/quote]     [b] 是什么促成您走上学佛之路,佛法真的能给你那么大的改变吗?[/b]      毕业工作半年后,有一次朋友带我来龙泉寺参加法会,那次的法会给我印象很好,我来的那天下着雪,当时师兄就送给我一杯热腾腾的姜汤,我的身体暖和了,后来对龙泉寺的整个感觉就非常温暖。这是一个因缘,让我开始能够进一步接触佛法。从弟子规开始,后来开始读心经、地藏经、金刚经……有一个比喻让我体会到了一些:这是一片大海,风从海上刮过,于是就起浪,有人看到海浪觉得很开心,太美啦!海浪没了又会失落,在他的意识里面就会有一个生灭的概念,海浪会从生到灭。但在佛法中,实际上没有海浪,只是风和水的一场游戏,有没有真正的一个海浪从地球上出生?并没有,只是风水到水,产生了一个形变,人给它安上一个概念叫:海浪。并没有真正的海浪,只是因缘和合所产生的结果。通过这种思维,我感受到《心经》中所说的“五蕴皆空”真实不虚。然后佛家讲的出离心就来了,我上班的时候不断诵心经,不断地体会,后来我发现我可能应该出家了。      第二个原因是因为感受到师父的愿力,感受到中国经济如此发达,物质这么发达,随之而来的精神上的需求是非常庞大的,人会有四个层次的问题。      生存的衣食问题、生活问题、生命问题、生死问题。师父从佛法的角度告诉我们人的生命宗旨是什么。 [b]     在红尘中修行的建议?[/b]      有人说去年是人工智能元年,还预计到2040年,全球会有50%以上的人失业。那到那个时候人没有事干了该怎么办?不用到那个时候再去想,用过去和现在比就可以看到:现在社会上精神上的问题层出不穷,以前社会会有那么多焦虑,抑郁这些问题?      在西方非常流行正面疗法,这也是从南传佛教借鉴过去的。通过转化佛教思想中的“戒定慧”,确实能够帮助很多人解决眼前的很多精神上问题。越是后面的社会,这个世界变化越快。这就是佛法中说的“无常”。这个世界的本质是无常,但越往后,可能这种体会会越强烈。对这个世界会有陌生感,或许到了那个时候,所有的风景、建筑都变了,城市可以天天换,你自己的身体也可以随时换,面对这种无常,那个时候你如何去寻找心里上的安宁与快乐呢?只有回到内心里去。      佛法会告诉你,世界本无常。只有放下内心的执取,就像孩子会拼命抓住海浪的瞬间,但却能欣赏火车上的风景,外界种种变化,如何回到内心才是最重要的。如何回来?不容易,佛法就是一种心法,让你能够回到自己的心里。      越是在往后变化的社会里,越应该需要一种寂静定下来的功夫,而这种功夫去外面的世界是找不到的,只有回到内心观察自己才能找得到。 [b]     未来人内心的问题越来越多,佛法能告诉我们一个很好的方便法门。目前的科技是在帮助弘扬佛法,但今后科技是否也可以在借鉴佛法的理论下通过实现更逼真的体感和观感比如更逼真的VR场景这些来让人获得如入佛门般的内心宁静与平和?是否应该有更深层次的结合?[/b]      我觉得每一项技术背后都有一颗心,都有一个价值观。任何一款互联网的产品、游戏的发明都带着这个发明者的价值观或喜好。      如果是在一个商业逐利的环境中,产生的大部分都是影响人的内心去攀缘外界种种的声色,让人眼花缭乱。作为技术本身是没有任何价值和到的判断,是这个人使用了技术创造了产品,是技术与人的思想结合产生的产品。当然技术也可以和另外的人结合去创造产品,使人产生宁静。所以最后并只是技术引导人。技术是一种力量,它可以带人走向宁静、走向安乐,他也可以带人走向浮躁、走向这种散乱,所以我觉得你说背后结合在哪里,就是在这个人的心里。 [list] [*][b]互赠图书[/b]​[/*] [/list]      在交流会结束的时候,悟光法师将《学诚大和尚侧记》等书赠予了集智参访的所有朋友,集智也将自己编写的两本科普书《科学的极致-漫谈人工智能》与《走近2050》还有《GEB》、《未来简史》、《终级算法》等系列科普书捐赠给了龙泉寺,科技与佛学又一次通过知识互享来融合。 [attach]4258[/attach] [i]集智俱乐部赠书仪式[/i] [list] [*][b]讲座分享[/b][/*] [/list]      除了赠送图书,张江老师的学生:龚力同学,也在活动结束的时候专门留下来为龙泉寺翻译中心的义工做了“机器翻译”学术讲座,讲座内容为:1.机器翻译理论;2.机器翻译实践。 [attach]4259[/attach] [i]龚力同学的学术讲座分享[/i] [i][attach]4260[/attach][/i] [quote] 作者:金文君,字玥栖 1981年生于上海,目前定居北京。 上海大学影视艺术系毕业,分别进修于北京电影学院编剧系、中央美术学院美术批评班。曾涉足媒体、艺术、金融等多行业,热爱美食与美酒,获全球WSET二级品酒师资格、沪上美食“东家小馆”合伙人、衡山和集*美食图书馆共建设人、  “藏真堂”事茶品牌联合创始人。 于2010年创办“三木鱼”图书工作室,秉承“写出这个时代的声音”之理念,先后主编策划了《一把盐》、《让别人去思考吧,我只管吃》、《冲啊》等美食文化类图书。2017年4月即将出版主笔图书《食味人生》。 [/quote]

    Revo 2017-06-27 20:41

  • 1.jpg

    【 深度 】社会传染动力学:阈值模型及其扩展

    作者:阮中远[attach]4247[/attach] [list] [*][b]摘要[/b][/*] [/list]       本文回顾了社会传染的经典模型之一阈值模型的相关内容,并且根据近年来在线服务产品采纳行为传播的实证研究讨论了阈值模型的局限性。在此基础上,介绍了一个新的模型,该模型在传统的阈值模型中引入两个新的机制,从而成功地解释了现实生活中社会传播的现象。 [list] [*][b]作者简介[/b][/*] [/list] 阮中远 浙江工业大学计算机学院讲师。 2013年6月博士毕业于华东师范大学理论物理研究所。 2013年-2015年在匈牙利布达佩斯技术与经济大学和中欧大学从事博士后研究,主要研究方向为复杂网络上的动力学行为,包括流行病传播,信息传播,人类行为动力学等。 以第一作者在国际权威期刊上发表多篇学术论文,包括Physical Review Letters, Scientific Reports, Physical Review E等。目前主持国家自然科学基金一项。 [list] [*][b]阈值模型的研究历史[/b][/*] [/list]       社会传染现象在现实生活中随处可见。例如信息的传播,新产品、新技术或新药物的普及,恐慌情绪的蔓延,又或者是经济市场中泡沫的产生与破灭等等。这些看似风马牛不相及的现象之间,却有一些共同的性质:它们都是从少数个体的行为“变异”开始(这些个体由于各种原因,例如公共信息的影响等,采纳了与周围人群不一样的行为),然后通过人群之间的相互作用,达到该行为的大规模流行(转变为集体行为)。       这类社会现象在20世纪中期开始引起社会经济学家们的关注,直至今日仍然是一个研究热点。科学家们提出了各种不同的模型来解释这类传染现象,其中一个非常经典模型是“阈值模型”[1]。这一模型由Granovetter在上世纪70年代末提出。Granovetter假定个体做出某个决定的一部分原因取决于周围有多少个体作出了相同的决定[2]。这是因为在真实社会系统中,决策者往往缺乏全局信息,又或者他们对所掌握的信息处理能力有限,导致他们习惯于观察周围人的决策来决定自己的行为。另一方面,除了这种外部因素,诸如个体习惯、爱好、宗教信仰等内在因素也会影响个体的决策。为此Granovetter引入了一个 “阈值”的概念,他假定个体从一个行为状态转变到另一个行为状态时存在一定的阈值。这一阈值由个体的内在因素决定:对于不同背景的人来说,其值是不一样的。因此个体做决策是外在刺激与内在因素相互博弈的结果——当外在刺激的程度超过个体的阈值时,个体就从一个状态转变到另一个状态。       Watts最早彻底地研究了阈值模型的物理特性,并发展了一套优雅的方法来解析该模型[1]。他假定社会网络中的节点只有两种状态:0(非活跃态)或1(活跃态)。一个0态的节点会转变为1态,如果他的邻居节点中处在1态的人数比例超过了该节点的阈值,即 m/k≥ϕ ,其中k为个体的邻居节点数,m为邻居中处于1态的节点数目,ϕ为个体的阈值。在初始阶段,Watts假定所有节点都处于0态,除了一个随机选取的节点处于1态(微小扰动)。Watts发现,网络平均度 z 和个体平均阈值ϕ是影响整个动力学行为的两个重要的参数。如图1所示,在平均度z和阈值ϕ组成的参数空间中存在两个区域:在虚线包围的内部,我们可以观测到全局级联现象,也就是说绝大部分节点都能在极短时间内转变为1态;而在虚线外部,则不可能观测到全局级联现象,此时只有少数节点转变为1态(当总节点数趋于无穷时,所占比例趋于0)。我们还可以发现,当平均度从很小变到很大(固定ϕ),系统会经历两个不同的相变过程。其原因在于,当平均度很小时,网络是支离破碎的,因此任何初始扰动都无法大规模地传播;而当平均度很大时,阈值条件难以满足(此时需要更多处于1态的邻居数量),导致全局传播也不可能(同样当ϕ很大时也是如此)。一般来说,该级联窗口的下边界由网络的拓扑性质决定。例如对于ER随机网来说,网络中开始出现大的连接集团的相变点是在平均度z=1处,这与图1所展示的结果一致。而级联窗口的上边界则比较复杂,这实际上是由动力学过程决定的,但Watts同样巧妙地将其转换为一个静态可求解的渗流问题。       Watts将网络中的节点分为3类: [list=1] [*]创新者,这类节点的阈值ϕ=0(由于外部影响自发转变为1态,在Watts模型中初始时刻只有一个创新者)。[/*] [*]脆弱的节点,这类节点的阈值满足0<ϕ≤1/k,即当邻居节点中有一个处于1态时,该节点就会转变为1态。[/*] [*] 稳定的节点,即那些ϕ>1/k的节点。这样,能否引发全局级联传播的条件就等价于是否存在一个大的(跟系统大小相当)连通集团,这个集团全由脆弱的节点所组成。这是因为该集团中的任一节点转变为1态,都会继而引起集团中所有其他节点转变为1态(这些节点均满足ϕ≤1/k)。转换之后的静态结构问题可通过生成函数的方法进行解析求解,图1显示理论结果与数值模拟基本吻合(其中虚线是理论解析结果,点是模拟结果)。[/*] [/list] [attach]4246[/attach][i]图1:阈值模型的相图,对应于ER随机网。(z,ϕ)参数空间被分隔为两部分:在虚线包围的内部,我们可以观测到全局级联传播现象;而在虚线外部,不可能观测到全局级联传播现象。Watts称由虚线围成的区域为“级联窗口”。(图引自文献[1])。[/i] [list] [*][b]阈值模型的新突破[/b][/*] [/list]       阈值模型尝试从微观角度(个体之间的相互作用)来解释集体行为涌现的原因。该模型中个体与其邻居之间有着一种社会加强作用(比如当个体发现周围有足够多的朋友采纳某种新产品时,他才有可能会采取同样的行为)。它不像生物系统中流行病的传播,在那里个体之间的相互作用是独立的,这意味着任意一个扰动都能引发全局的集体行为(例如初始时有一个个体行为变异,最终会引起网络中所有的节点都发生状态改变)。这显然与现实世界是相悖的。真实的复杂系统展现了一种Watts称之为“鲁棒而又脆弱”的特性:一个社会系统对于绝大多数的初始扰动(如新思想、新产品的出现等)都是稳定的(鲁棒性),但突然之间某些微小扰动可能会展现出巨大的、系统层面的宏观效应,即全局级联传播(脆弱性)。阈值模型能够成功解释这种现象,因此深受研究者们的青睐。然而随着近年来计算机科学及大数据领域的飞速发展,人们在一些在线实证数据中发现真实社会系统会表现出某些阈值模型无法解释的现象。例如除了快速的级联传播过程,社会系统有时候也可能会展现出极其缓慢的传播过程[4]。图2比较了几种常见的在线服务产品采纳行为的传播速度,其中纵坐标表示某一产品累计采纳的年最大相对增长率[4]。可以看出,与传统的阈值模型相比,真实的在线服务产品的采纳行为的传播速度要慢得多。 [attach]4250[/attach] [i]图2:几种不同在线服务产品的累计采纳年最大相对增长率(其中红色杠条对应阈值模型的预测结果)[/i]         传统的阈值模型只关注能否发生全局级联传播的条件,而一旦发生级联效应,网络中的大部分节点便会在极短的时间内转变为1态。为了解释这种缓慢传播的现象,我们需要在传统阈值模型中引入一些新的机制。从在线服务产品采纳行为的传播过程中可以发现,有两个基本的特征在之前有关阈值模型的研究中都被忽略了:i. 随机自发采纳过程。一些个体由于受到外部因素的影响会自发转变为1态,而这种外部因素的作用是随机的,它在任一时刻都可能影响某些节点的状态。ii. 在整个传播过程中,存在一些“免疫”的节点,他们可能出于各种原因(如对某一公司的厌恶等)而始终拒绝接受某个产品,即不受周围邻居节点的影响。Ruan等人研究了在这两种新的机制作用下社会传染的动力学行为[3]。在新的模型中,网络中的节点以比例r随机处于免疫态。这类节点不直接参与传播过程(因为他们不受其他节点的影响),但却起到阻碍作用(因为当个体周围存在免疫态节点时,阈值条件更难满足)。另一方面,每一时间步网络中处在0态的节点会以一定概率p自发转变为1态。这类创新者的出现可能会引发局部的级联效应,从而促进全局传播的发生。 [attach]4249[/attach] [i]图3:不同参数下的级联窗口的比较。(a)和(b) r=0,不同的p值对级联窗口的影响;(a),(c)和(d) p=0,不同的r值对级联窗口的影响。[/i]         为了清楚地说明两种机制在社会传播过程中所起的作用,我们分别加以考虑。首先固定r=0而变化p值(即只考虑自发采纳过程的影响)。此时若p=0则回到经典的阈值模型。而当p>0(无论多小),对于t→∞,系统始终拥有单一的终态(全部节点都转变为1态)。为了方便比较,我们需要选取一个适当的时间窗口。图3a和b展示了t=100时,不同p值下级联窗口的大小。可以看出,p的增加使得全局级联传播的发生变得更加容易。其次我们固定p=0而变化r值(即只考虑免疫态节点的影响)。此时随着免疫比例r的增加,级联窗口不断缩小(见图3a,c和d),意味着全局级联传播更不容易发生。 [attach]4248[/attach] [i]图4:不同参数下1态节点的相对密度随时间的演化曲线其中p=5×〖10〗^(-4)。[/i]   [i]     [/i] 接下来我们考虑r,p>0的一般情形。此时在不同的免疫态比例下,系统从初态到终态(终态是单一的,即ρ/(1-r)→1)的演化过程会展现出极为不同的动力学特性。不失一般性,我们取p=5×〖10〗^(-4),观察不同r值对传播动力学的影响。图4展示了1态节点的相对密度随时间的演化关系。可以看出,当r较小时,系统中1态节点的数目很快达到稳态;而当r较大时,1态节点的增长速度变得缓慢,需要很长时间才能到达稳态。这是因为当r较小时,随着创新者数量的增加,绝大多数个体都能被周围邻居所“诱发”转变为1态(通过满足阈值条件),这是一个快速的级联行为(因为个体一旦满足阈值条件,就立马转变其状态)。而当r较大时,节点很难满足阈值条件,几乎无法被周围邻居所“诱发”。此时随机自发转变机制占主导因素。由于自发转变是一个极其缓慢的过程(因为p一般来说很小),因此1态节点的数目相应地变化很慢。       进一步地,我们可以找到一个临界值r_c来区分快速传播与慢速传播的区域,即当r<r_c时,“诱发”机制占主导地位,系统能发生快速的级联传播;而当r>r_c时,自发转变机制占主导地位,此时传播行为变得缓慢。从图4可以观察到,这一转变过程是极其平缓的。我们可以通过几个不同的方法来确定r_c的值:例如通过观察稳态后创新者的比例随r的变化关系,或者ρ(t)演化曲线由凹变凸的转变,又或者是稳态时“诱导”集团的分布随r的变化关系等[3]。以ER随机网为例,当取参数z=7,ϕ=0.2,p=0.0005,N=〖10〗^4时(N为网络大小),可以得到r_c≈0.74。值得一提的是,随着免疫态比例r的增加,系统还会经历一个渗流变化的过程:即存在一个阈值r_,当r>r_时,由0态节点组成的集团会变得支离破碎,无法形成一个巨大的集团(因而无法实现全局级联传播,传播速度缓慢)。由渗流理论可知,r_=1-1/z=0.857(当网络中的节点以比例r随机处在免疫态时,有效平均度为z-zr,此时相变点在z-zr=1处)。r_c=0.74<r_意味着即使网络中存在由0态节点组成的巨大的集团,传播也可能是缓慢的(即缓慢传播不是单纯由网络拓扑结构变化引起的)。 [list] [*][b]参考文献[/b][/*] [/list] [list=1] [*] D. J. Watts, A simple model of global cascades on random networks, Proc. Natl. Acad. Sci. USA 99, 5766 (2002).[/*] [*]M. Granovetter and R. Soong, Threshold models of diffusion and collective behavior, J. Math. Sociol 9, 165 (1983).[/*] [*]Z. Ruan, G. Iniguez, M. Karsai, and J. Kertesz, Kinetics of social contagion, Phys. Rev. Lett. 115, 218702 (2015).[/*] [*]M. Karsai, G. Iniguez, R. Kikas, K. Kaski and J. Kertesz, Local cascades induced global contagion: How heterogeneous thresholds, exogenous effects, and unconcerned behavior govern online adoption spreading. Sci. Rep. 6, 27178 (2016).[/*] [/list]

    Revo 2017-06-27 20:27

  • 0.jpg

    复杂网络上的Ising模型

    作者:章彦博 中科大大四物理系学生,集智活跃分子,对复杂系统感兴趣,喜欢扯淡。   本文将复杂网络与Ising模型结合,使用随机几何图模型,构造复杂网络,并在网络的基础上运行Ising模型。探索了其临界温度,发现临界温度与粒子数具有密切关联。同时发现相邻的集团之间,具有较强的独立性,并做了具体的数值分析。临界温度与独立性包涵了重要的现实意义,对于物质生长、凝聚具有解释效力;对于很多社会问题,也可以基于此模型给出解释 。   [b]引言[/b] 事物之间的关联,可以简单地使用网络来表示。网络中的节点,可以表示模型中的个体;而连边则表示其之间的关系。事实证明,大量事物可以用网络表示。但真实世界的网络的结构,与我们常见的渔网般规整的结构不同,也与简单计算机程序随机生成的网络不同。它们大多兼具大的簇系数和小的平均距离1。例如电力网络、社会关系网络、交通网络,皆有此特征23。而相关的学科,例如计算社会学等,则依托此类结构,进行学术研究。近年则发展出一些方法,对网络的拓扑重新构造,从而简化了网络结构,此称为“流形学习”4。复杂网络有多种类型,根据生成其的模型不同而不同,常见的有小世界网络。而此文使用的是一种类似优先连接构成的网络,称为“随机几何图”5。其基本构造方法如下图所示: [attach]4058[/attach] 初始时,向一个n维空间中投入一点,那么,在此点周围半径r空间内的,接收新点的概率便会增加,具体某一点接收新点的概率正比于其半径r空间内已有点的总和。不断地向其中添加新的点,同时,将距离小于等于r的点都用边连起来,可以得到一个网络6: [attach]4053[/attach] 上图表示不同时间上,点生长的结果。 此规则可以模拟与空间位置有关的随机连接,例如交通网络、社交网络(属于抽象空间)。在原文之中,作者使用美国东部的电力网络、美国夜空亮度分布,与此网络的点密度比较,得到了非常好的吻合结果: [attach]4067[/attach] 上图中,规则稍有改变,投入的任意点,有一定概率pp可以被直接接受,以此可以模拟城市生长。将其与实际数据比较,其光度分布吻合得非常好。 此模型可以较好地模拟很多实际结构,而将Ising模型作用在此网络上,则可以得到例如舆情的多样性、变化、交互的过程与动力学。对于基于“从众”规则的社会模型,也有独到的解释。而此模型与很多固体生长过程颇为类似,亦有望使用在此类过程之中。 注意,这里的随机几何图模型并不是小世界网络7,其度分布不是幂率下降的,但密度分布是幂率下降的。其度分布是: [attach]4056[/attach]   其中 [attach]4054[/attach] 式中,dd是维度,VdVd是dd维球体积之系数,N(t)N(t)是总颗粒数8. [b]初步结果[/b] [b]算法概述[/b] 由于此规则所产生的概率密度分布较为复杂,所以实际的抽样过程,使用两步法,第一步,是使用四叉树将二维点存入各个树枝之中,这样可以快速地查询一个点周边的邻居,且可以很容易地忽略距离太远的点: [attach]4068[/attach]   对于每一层的每一个节点,都动态地改变其概率权值。然而这样的过程并不完善,需要进一步地进行抽样,这里使用Metroplis方法,进行随机行走,从而最终逼近其概率分布。这里使用前面生成城市的策略,最终的网络如下: [attach]4057[/attach] 注意到其中有两个集团之间,虽然是相连的,但又有明显的距离,后面会专门构造此类网络进行分析。 之后的Ising模型运算之中,每个点的邻居用链表储存,且它们是等权的。这里的另一个要求是,它们产生的能量也是直接相加,而不是归一化的: [attach]4055[/attach] 这意味着,更多的邻居会对此点产生更强的影响。这是符合实际的。 [b]Ising模型的初步结果[/b] 我们使用橙色代表自旋为1的,蓝色代表自旋为-1的点,并对其做模糊,从而有如下的图像: [attach]4059[/attach] 可以看到,前面特别注意的两个相邻的点,虽然有连接,但仍然可以保持各自的自旋,在运行足够长时间后,仍然稳定。这里猜测此模型之中,可能不会出现各态历经,而是类似于玻璃态的情况。 [b]邻近相连集团的关联性分析[/b] 如前面所述,邻近且相连的集团之间,其行为与一般的Ising模型不同,虽然有相互作用,但仍然能保持各自的自旋,这里特别构造出理想结构,进行分析。 在TcTc以下,此处取J/kT=1.0J/kT=1.0,先在(0.4,,0.5)(0.4,,0.5)与(0.6,,0.5)(0.6,,0.5)处设定一些点,以使得最终生长出两个邻近且有相互作用的集团。经过选择随机数种子,得到了如下的生长结果:其密度图如下所示: [attach]4062[/attach] [attach]4060[/attach] 经过数值计算,两边的集团体量是均等的。这样,对于每一次Ising模型的模拟,都使用此图,那么两个计算最终的自旋只有如下四种情形: [attach]4061[/attach] 对其进行10000次随机模拟,可以得到上面四种情形的分布。其结果如下: [attach]4063[/attach] 可以看到,各个情形的数值,基本在0.25左右。有些许偏移,但与一般模型下的Ising模型差别非常大,从而,从相关性的角度来看,邻近集团各自的自旋,相关性很低,可以看做近独立的。 若从理论出发,定性地分析,可以将各个集团核心区域看做高维空间的Ising模型,从实际数据来看,中心附近的点,其连边数n∼100n∼100,而等效的维度d=n/2,从而,其中心部分维度可以近似的等效为一个几十维空间的Ising模型,这时其临界温度很高,而对于外界干扰的稳定性也很强。从另一个角度出发,假设一方的自旋“侵入”另一方,而这个模型中,边缘点的度比中心点的度要少,那么“侵入”的自旋,从概率上,是难以敌过核心区“更固执的自旋”的。 从能量来分析,其分界处,粒子的连边数较少,翻转所需的能量最少,故在此模型中,分界处的变化最丰富。但若要让另一边也发生翻转,则需越过一个能量高峰,这在低温时是无法达到的。 下面考虑单个集团的行为。 [b]单个集团的行为[/b] 对于此网络的性质,从单个集团开始分析是比较简单与方便的。定义磁化率: [attach]4064[/attach] 对不同的温度进行计算,在总点数N=3000,,2000,,1000N=3000,,2000,,1000的情况下,其m−Tm−T曲线如下: [attach]4066[/attach] 可以明显地发现,其有临界相变现象,但阈值各不相同,与总点数N相关。其趋势是N越大,T越大。而从引言中给出的度分布,也可以看出,随着总点数的增加,其平均度是增加的。下图选取了几个典型的温度,在N=2000时迭代100次后的结果: [attach]4065[/attach] 从上面来看,图中仍然有一些稳定的细节,这是因为点密度不同的区域,其临界温度是不一样的,有可能在温度很高的情形下,依旧能够保持其自旋的稳定。   [b]讨论[/b] [b]此模型具有实际之意义,首先是对真实的社交网络行为,可以进行一定程度的模拟(Barabási的优先连接实现的条件是,新进入的节点能获得所有其他点的信息,这是难以做到的)。而使用Ising模型后,其中的一些行为也是值得研究的。 首先是邻近集团具有较强的独立性,这意味着,只要集团核心区域的密度比邻近地区密度大一些,两者就可以保持独立。这在一些化学生长过程中,可以解释一些具体的行为。而对于我国南方地区,方言的分布也有解释意义。[/b] 对于其临界温度,可以看到其与总粒子数密切相关。临界温度越高,意味着越有可能发生自发的磁化。对于之前的城市模型来说,若点越密集,越可能发生“同质化”的现象,核心的影响力亦越大。同时,也暗示了进入连接密度高的社群的个体,更容易受到此社群的影响。目前的研究还处于非常初步的阶段。首先,对于温度、外场综合的研究尚未完成;其次,计算机模拟的次数较少,算得的一些值的精度不高。另一个方面,为了体现其现实意义,当需与真实的数据做出一些比较。这三个方面,若今后想进一步推进此研究,是可以继续探索的。 [b]参考文献[/b] 周涛, 柏文洁, 汪秉宏, 刘之景, and 严钢, “复杂网络研究概述,” PHYSICS, vol. 34, no. 1,pp. 31–36, 2005. [Online]. Available:http://d.wanfangdata.com.cn/Periodical/wl200501007 周涛, 柏文洁, 汪秉宏, 刘之景, and 严钢, “复杂网络研究概述,” PHYSICS, vol. 34, no. 1,pp. 31–36, 2005. [Online]. Available:http://d.wanfangdata.com.cn/Periodical/wl200501007 A.-L. Barabási and R. Albert, “Emergence of Scaling in Random Networks,” Science,vol. 286, no. 5439, pp. 509–512, Oct. 1999. [Online]. Available:http://www.sciencemag.org/content/286/5439/509 D. Brockmann and D. Helbing, “The Hidden Geometry of Complex & Network-Driven Contagion Phenomena,” Science, vol. 342,no.6164, pp. 1337–1342, Dec. 2013. [Online]. Available: http://www.sciencemag.org/cgi/doi/10.1126/science.1245200 J. Zhang, X. Li, X. Wang, W.-X. Wang, and L. Wu, “Scaling behaviours in the growth of networked systems and their geometric origins,” Scientific Reports, vol. 5, p. 9767,Apr. 2015. [Online]. Available: http://www.nature.com/doifinder/10.1038/srep09767 J. Zhang, “Growing Random Geometric Graph Models of Super-linear Scaling Law,” ArXiv eprints, Dec. 2012. D. Brockmann and D. Helbing, “The Hidden Geometry of Complex & Network-Driven Contagion Phenomena,” Science, vol. 342,no.6164, pp. 1337–1342, Dec. 2013. [Online]. Available: http://www.sciencemag.org/cgi/doi/10.1126/science.1245200 J. Zhang, X. Li, X. Wang, W.-X. Wang, and L. Wu, “Scaling behaviours in the growth of networked systems and their geometric origins,” Scientific Reports, vol. 5, p. 9767,Apr. 2015. [Online]. Available: http://www.nature.com/doifinder/10.1038/srep09767 微信编辑:井静宜

    长如夜 2017-06-27 14:49

  • 人工智能将如何影响未来社会

    历史上,每一次技术上的突飞猛进都会造成人类社会结构的巨大变革。人工智能的爆炸性发展也必然会深度影响人类社会的现有形态。那么,假如人工智能产品已经大量地普及,进入了千家万户,我们的社会将会发生怎样的变化呢?对这个问题的回答有助于我们做好准备,应对人工智能给我们带来的冲击。 人类的体力劳动早已经被机器所取代。人工智能的进化必然会替代相当一部分人的脑力工作。当这种替代进行到一定程度以后,人类社会将会变成什么样呢?笔者以为,这种变革将可以分成三个阶段。 [b]阶段1:AI取代重复性工作岗位[/b] 当前的人类工作有大量是重复性的,比如售票员、司机、银行职员,等等。这些工作无疑最先被人工智能淘汰。现在的人工智能在模式识别方面已经有了长足的进步,它们在很多领域已经达到甚至超过了人类的水平。因此,用人工智能程序或者机器人来替代这些工作是早晚的事儿。 然而,即使是重复性的工作,人工智能要想完全替代人类也需要经过一段时间,这主要是因为: 1. 在某些特定领域,人工智能的识别准确率还不能与人类相比; 2. 有大量的重复性工作环境很难被建模,而且需要一定的尝试信息。 比如,机器人保姆是一个需求非常大的市场,然而,现在的机器人尚无法照顾人。甚至连做饭、扫地等工作都很难完全交给机器来做。其主要的原因,就是这类工作所面对的环境比较开放,它们对于机器的动作技巧要求很高。这就导致了,在短期内,人工智能、机器人完全替代人类还有一段路要走。但笔者认为,这一进程不会超过20年。  [b]  阶段2:AI管理社会[/b] 人工智能一旦突破了第一阶段,人类社会的结构就将发生非常显著的变化。人工智能、机器人将会走上越来越多的管理岗位。 比如,随着自动驾驶技术逐渐成熟后,人工智能可以负责整个交通系统的管理、协调与控制。人类若想插手反而会降低整个交通系统的运行效率。由于机器会比人类更不容易出错,所以,机器会很擅长执行这类管理角色。 随着机器对自然语言理解的能力越来越强,人工智能也将会渐渐人类的中层管理角色。我们知道,现在很多大公司的ERP系统、MIS系统其实已经完成了整个办公流程的电子化。可以说,机器已经参与进了管理过程之中了。然而,能够理解自然语言的人工智能一旦出现,它们就有可能进一步增强这类管理信息系统,并可以逐渐替代中层领导的管理角色。 比如,在公司中,有大量的监督、管理工作都是偏向于比较死板的、按部就班地进行着的。所以,由机器而不是人来负责程序的执行将是一种非常自然而优化的选择。在机器的管理下,人类可以有效地避免腐败的滋生。更进一步,一旦机器可以理解法律条文,那么整个执法部门都可能会被机器来管理。所以,小到公司,大到城市、国家,机器将会掌控越来越多的东西。 如果这一天真的来临,那么整个社会将会发生一次非常重大的变革。首先,在人类管理社会的阶段,所有的感知、决策、管理、控制全部都是局部信息的、去中心化的。而一旦机器掌管了这些岗位,那么它们就将充分利用互联网实现信息共享,于是,所有的信号都将以光速在整个互联网上传递,因此多个分散机器的整体协调将变得很容易实现。于是,人类将会重新进入一种中心化的世界。然而,这种中心化的形成会与原来人类社会的集权、垄断形成的中心化完全不同。在人类社会的中心化管理中,由于所有的管理者都仅仅拥有局部信息,所以它们的决策无法避免信息在传递过程中的衰减。这样,人类的集权社会就具有先天性的不足,这导致了社会不断的改朝换代,永无休止。 只有在人工智能实施社会管理的前提下,由中央控制的、拥有全局信息的规划与调整才变得可能。只不过,进行中央控制的不再是一个人,也不是某一个或者多个机器,而是整个互联网本身。这个互联网所形成的超级智能将可以使得全局的运算和优化变成可能。 人类面对这样的机器管理者会演化形成两个阵营(阶级),一个阵营是顺应机器管理者,另一个阵营则是逃避机器管理者。虽然表面看来,第二阵营的人由于无法利用机器给我们带来的便利设施从而具有先天性的不足。然而,这个阵营的人类还是会对人类整体进行不可避免的影响。它们就像是有机体上的肿瘤将会被社会整体逐渐淘汰。       [b]阶段3:超级定制化人工智能 [/b]   在整个社会演变得逐渐趋同,慢慢形成了一个超大规模的协调一致的整体的时候,每一个人反而会变得越来越个性化。由于机器的整体优化,人与人之间的信息沟通也会越来越顺畅,这就使得物质、能量、信息的流动效率也会越来越高。于是,共享经济就变成了一种普遍的模式,每个人都可以随时随地获取物质的需求。 于是,人类开始追求更多的精神上的满足,这就使得,人类会寻求非常多样化、个性化的体验。于是,人工智能若想更好地满足人类需求,也会朝向越来越个性化的防线发展。到了那个时候,每个人都将拥有一个数字化的个人助理。这种个人助理是一个超级个性化的人工智能程序。它在每个人刚刚出生的时候就开始不断地去适应、学习它主人的行为方式。所以,世界上有多少人,机器世界就会有多少不同学习得到的个人助理。尽管这些智能助理可能诞生于同样的程序,但是它们由于后天学习的对象和路径完全不同,所以也会千奇百怪的智能代理。 然而,在另一面,这些智能代理又会负责用一种统一而共同的方式与整个互联网沟通,所以,个人智能助手就好比是一个沟通个性化人类与同一化机器世界的界面。这个程序经过不断的学习将会越来越像它所学习、模仿的对象。于是,每个人都将慢慢训练出一个他(她)自己在数字化世界之中的投影。这些投影代替了一个个个性化的人类,完成了在世界上的沟通。于是,整个人类社会就会被投射到虚拟世界中,镜像社会由此形成。 一旦镜像社会形成,每个人便可以实现心想事成。每个个体人的一切愿望都会被机器非常容易地实现。这是基于两方面的考虑:由于共享经济模式已经非常成熟而普遍,物质和能量的流通将会很容易地满足每个人的个性化需求。另一方面,中心化的管理机制可以使得需求和供给达到超高速的匹配。就这样,人类的愿望会以难以想象的速度被机器世界满足,这就使得人与机器可以达到超级的和谐。 对于机器来说,到达这一步的时候,整个机器世界将会由注意力驱动演变为意愿驱动。也就是说,人们的意愿不仅没有构成对机器的负担和威胁,反而会促进它们系统的发展。 由于在这个时候人与人的沟通完全是通过智能代理在整个互联网空间下完成的,所以,人类传统的语言沟通方式将会失去其存在的意义。于是,语言早晚都会消失。 语言的消失反而是一种进化,因为人与人之间可以实现更加高效率的同步与协调,于是整个地球上的人类都会形成一个协调统一的整体。只有在这个时候,整个地球才能形成一个真正的整体,于是,全球脑觉醒。  

    丝瓜 2017-06-26 23:43

  • mmexport1498490395852.jpg

    生命之流 | 究竟什么样的系统才是有生命的活系统

    [attach]3998[/attach] 生命之流 《生命之流》系张江老师2008年至2009年,利用闲暇时间所构思的一本科普文集。主要内容包括:从复杂到生命、自主生命体简史、重新发现时间、从永动机到人工智能、连接上帝的纽带——熵等章节。现将已公开部分刊出,希望能够和大家共同学习。 1 从复杂到生命“今天你复杂了吗?”这是一位朋友为了讽刺当今科学研究中的随波逐流行为的一句调侃。因为时下复杂系统已经成为了一个科学研究中的热门领域,似乎不管是什么领域的研究都要跟复杂、网络扯上关系,好像你不复杂就不时髦。然而,这门新兴学科除了能给我们兜售一些诸如幂律、网络、涌现等概念之外,还会给我们带来什么样的深层次启发呢?它究竟要回答和解决一类什么样的问题?它将引领我们去向何方?这些问题使我不禁陷入了深深的思考…… 春天到了,我漫步在小河边。地上的小草刚刚发芽,几只刚刚苏醒的小虫在那里快速爬行,划出了一系列复杂随机的曲线。一阵暖洋洋的春风迎面扑来,一只灰色的小虫摇摇晃晃地沿着复杂的曲线爬到了我的脚下。然而,当我定睛一看才知道,那并不是一只虫子,而是一块普普通通的石头子儿。石子由于风的作用,在崎岖的路面上颠簸形成了复杂的运动曲线,才会让我把它看作“活”的小虫。 这一情景让我陷入了沉思,究竟什么是“活”这个属性呢?如果仅从行为上判断,石子和小虫可能都会让我们觉得它们是活的,因为它们的行为同样的复杂。但我们却知道石子是死的,因为它的行为复杂性并非来源于它的内部,而是来源于外力风的作用和复杂的地形。小虫却有本质的不同,它们能够按照它们“自我的意识”来决定将朝哪个方向去觅食。 所以,我们很清楚这个世界存在着两类完全不同的东西,一类被我们称为活的,它们能够按照“自我”的意识,主动地进行运动;另一类则是死的,它们永远是被环境和物理规则驱动而被动运动着。然而,这两种事物之间的分界线真的如此清晰吗?要知道,即使是活的小虫也是由一群分子构成的,这些分子无非也遵循着物理规则被动运动。因为,科学在19世纪就已经证明,生命体不存在所谓“活素”(vitalism)的物质以及那个特殊而神秘的“活力”(vital force)。那么,究竟小虫子那种主动的活性从哪里来呢? 有一部3D动画叫作The Inner Life of a Cell(中文解说版的下载地址:[url]http://tieba.baidu.com/f?kz=309939238),如图1.1所示。[/url]  [attach]3997[/attach] 图1.1 动画The Inner Life of a Cell的一个截图。图中那个拖着大泡泡的“小人”是个分子,它可以沿着脚下的微管运输营养物质。它跟我们人一样,通过交替迈出两条“腿”而前进 通过这个形象而精彩的动画,我们可以窥探到一个细胞内部的分子世界,这哪里是细胞啊,它简直就是一个人类社会!微管是一条条高速公路,一些蛋白质分子就像载货的汽车一样运输着营养物质(图1.1中的那个分子装置),线粒体是一个大的发电厂、细胞核中的DNA相当于人类社会中的中央首脑在发号施令。更有意思的是,这群分子有条不紊的复杂运动却能导致细胞整体呈现出活性来!当我们观察细胞整体的行为时,它明显地活了,因为它可以按照“它自己”的意识游向葡萄糖浓度高的地方去捕食,也可以按“它自己”的意识避开有害化学物质。一种只有生物才有的高层次的主动性体现出来了。 [attach]3994[/attach] 图1.2 一个觅食的单细胞生物,通过摇动它身后的鞭毛,细胞可以游向食物。更有趣的是,这个小家伙完全是由分子按照物理、化学的规则构建的,不存在超物理的力量   按照科学的解释,活细胞的这种主动性是蕴藏在成千上万个分子的物理、化学相互作用之中的整体涌现属性!然而,这种属性究竟是怎样涌现而出的呢?要知道,更详细的微观物理、化学知识并不能给这个问题的回答提供太大的帮助。比如图1.1所示的那个分子的运动完全可以从微观上用物理化学定律解释清楚,但是为什么这个小家伙要沿着微管朝这个方向而不是另一个方向运输物质呢?显然,最好的解释是说,因为细胞整体在这个方向缺少营养物质,所以细胞会给这个小家伙发送信号,使得它朝这个方向运输物质。 可是,请不要忘记,我们这个整体细胞恰恰就是由这成千上万个分子组成的呀,那么是哪一个具体分子能够代表细胞的利益发号施令呢?答案是不存在这样的分子!细胞就是细胞,它的整体是一个独立的个体!我们不能把这个整体还原成一个具体的分子! 其实细胞和分子的这种关系与我们争论已久的人类社会中个人同集体的关系非常相近。试想,某国家被外敌侵略,需要征集本国志愿兵。从个体上看,没有哪个人愿意参兵,因为这对每个人都是不利的,他们需要冒生命危险。然而,国家这个整体却需要有这群冒死的士兵,因为他们的牺牲能够保护国家大多数人的利益,虽然这个大多数人具体是哪一个人并不清楚。 所以,国家是发号施令的独立个体,它能按照“它自己”的意愿来命令它下面的个体来完成抵抗外敌的任务,尽管这个独立个体恰恰是由微观的个人构成的。我们说人类国家也是一个活生生的有机体! 没错,这个问题已经逐渐从具体的学科知识中慢慢浮出水面,而成为一个复杂系统的问题了。实际上,我们就是要问:“究竟什么样的系统才是有生命的活系统?”。与薛定谔那个著名的“什么是生命”的问题略有不同,在这里,我们已经把生命看作是一个系统的属性,而不仅仅是物理属性。所谓的系统属性就好像我们的软件一样具备某种对硬件的“超越性”。 举个例子来说明这种软件对硬件的“超越性”,我们知道“生命游戏”是一个简单的计算机程序(参见:http://www.swarma.org/javaclass/gol.htm),我们可以用屏幕上的黑、白方格按照规则来演绎该游戏;同样,如果我们把一幢大楼看作一个元胞空间,大楼窗户中的灯光的开关看作黑、白两种细胞状态的话,那么只要这些窗户开灯关灯也遵循生命游戏的规则,那么整个游戏的动态就可以在整幢大楼上重演!(现在很多大楼都装上了这样的大楼霓虹灯)。 更有意思的是,“滑翔机”这个小家伙也会在整幢大楼上遨游,因为它完全是一种独立于底层硬件的软件Pattern。按照这个类比,“生命”也是一种具备“超越性”的系统属性。它可以用一堆分子作为硬件来实现,也完全可能用一群人类个体作为硬件来实现。这样,遥远宇宙太空中很有可能存在着某种由星体相互运动构成的超级生命个体。当然,这一切的前提就是我们能够找到那个系统的“活性”出来,即究竟“生命”是一种什么样的软件? 实际上,这个问题恰恰就是现代复杂系统中的核心问题。系统科学发展到20世纪70年代以后人们才开始真正面对复杂系统。传统的控制论、系统论感兴趣的是一类由开关、机械装置构成的死系统,因为这类系统的因果规律相对清晰。例如一艘巨型轮船,尽管它的部件设计非常复杂,但是它总是需要人来操纵、指挥,这样轮船的运动完全可以归结为舵手的指挥,一切结果都可以归结为简单的原因,所以系统不具备活性。然而,对于细胞、社会、互联网这样的系统来说,似乎不存在一个控制者在那里(或者我们可以说那个控制者就是系统自己)。因果变得复杂,系统开始呈现出“活系统”才具备的特性。这种“活性”在具体的环境中就会演绎出一系列具体的问题。例如,社会系统的活性就体现了国家整体利益和个体成员利益的冲突。同样,对分子的运输行为的解释也必须从整体细胞的角度出发,因为细胞才是一个活个体。 有了这个“更大的问题”,我们不再困惑。所有的具体研究都将在这块更大的拼图中找到自己的位置。而第一步就是要解决:“究竟生命是一种什么样的软件?”。为了找到这个问题的答案,我不得不花费一本书的篇幅来讨论它。2 生命自主体简史在第1章,我们指出“生命”是一种存在于系统之上的软件。而复杂性科学的首要任务就是要破译这种软件。为了把我们的讨论更加形象化,我画出图2.1来表示一个系统。   [attach]3992[/attach] 图2.1 系统示意图 如图2.1所示,系统就是一个多个个体(小圆圈)通过各种相互作用(小箭头)组成的整体。实际上,这里的小箭头既可以表示相互作用又可以表示相互关系。因此,不严格地说,这些小的圆圈就可以看作是系统的硬件,而小箭头排列方式就是系统的软件。不同的小箭头连接方法,以及作用方式就导致了系统整体属性的千变万化。因此我们说生命是一种可能的软件结构其实就是说有生命的系统的相互连接方式具有某种特定的模式。那么,这个特定的模式是什么呢? 开始认真思考这个问题的不是财大气粗的美国人、欧洲人,也不是以擅长整体思维方式自居的中国人,而是两名来自南美的不起眼的智利人:Humberto Maturana和Francisco Varela。20世纪50年代,Maturana是通过思考“每个人的眼睛看到的可能都不是同一种红色”为起点来思考生命本质这个问题的。也就是说,他认识到,要解释生命这个现象,我们必须“钻到”生命里面去。到了1972年,他和Varela合作出版了Autopoiesis and Cognition: The Realization of the Living一书,为生命的系统解释Autopoiesis(自我创生)理论奠定了基础。 首先,对于细胞生命来说,系统的个体就是一个个分子,而Maturana和Varela关注的个体之间的关系是一类称之为生产的关系。我们知道,在细胞内部,每一秒钟都发生着成千上万个化学反应。无疑,每一个具体的化学反应都是非常不同的,但是我们总可以把这些反应概括成一种由若干元素生产若干元素的生产关系,例如: A+B+C-->B+D+E A与B和C混合生成B, D,E(这里B又可以看作是该反应的一种催化剂)。因此,无论化学反应如何复杂,它们总可以看成是节点和节点之间的生产关系。进一步,活细胞中的这种生物化学生产关系构成的网络具备什么样的特性呢?Maturana和Varela回答说,细胞内的生产网络应该是一个自我闭合的整体。 自我闭合的特性可以解释为,系统中的任意一个元素都必须是由该系统中的其他元素生产的。因此下图中的(a)和(c)都是自我闭合的生产网络,而(b)就不是。原因是(b)中的节点C并不是由系统中的其他元素(A或者B)生产的。 [attach]3993[/attach] 图2.2 两个简单生产网络的比较,(a)是生产闭合的,(b)不是 我们不难想象,图2.2(a)和(c)中的网络一旦存在就会一直稳定存在下去。原因是系统中的元素可以相互生成。假如我们人为地删除(c)中的D节点,那么它又会被A或者B重新生成。进一步如果图(a)中的节点C被删除了,虽然短时间内A分子得不到生产,但只要有一定量的B存在,B就会再创造出新的C来,而C又会继续创造A,从而使得原先的网络得以恢复。这恰恰解释了生命有机体中广泛存在的自我修复现象。当我们的手指划破了一个小口子,经过一段时间,这个小口子就会自己修复、闭合上。自生产网络就给自我修复现象提供了理论基础。 然而,Maturana和Varela的自创生理论没有仅仅停留在生产闭合网络的阶段上。他们认为图2.1所表示的系统还忽略了非常重要的东西,这就是系统所在的环境。 因此,要想完整的表达出这个关系,我们必须修改图2.1为图2.3所示: [attach]3995[/attach] 图2.3 系统、环境、观察者和边界 原则上讲,任何一个系统都是和它的环境通过相互作用连接成一个整体的。系统和环境之间的边界并不是先天就客观存在的。所以,如图2.3,我们所说的系统和环境之间的边界无非是外界的观察者对系统进行区分的结果,即边界并不存在。讲到这里,你会质疑到:不对,真实的细胞是有明确的边界的,这是一个双层的磷脂分子构成的细胞膜。难道这层膜是观察者观测出的结果吗?当然不是,Maturana和Varela所说的边界更多的是指区分这一概念。试想一下,假如你的尺度非常小,小到了原子的量级,那么我们看到的无非是一群模模糊糊的电子云,这时,那层清晰的细胞边界还存在吗?原来的细胞还存在吗?这就好比我们看不到国与国之间的清晰边界一样(在现实中,国界线都是一片连续的自然景观),细胞和环境的边界也取决于观察者所处的观察尺度。 因此,按照Maturana和Varela的观点,边界甚至是系统本身都是一个观察者所做出的区分结果。换句话说,对于细胞内部的分子来说,并不存在着所谓的边界、系统和环境。每个分子只知道跟自己相邻的分子发生着相互作用。而这些相邻分子有可能属于细胞之内,也很有可能属于细胞之外。因此对于细胞分子来说,即使是那层磷脂双层膜也不过是一连串的分子罢了。只有当我们的观察尺度跳到整个细胞的层面,我们才能明显地感觉到那个边界的存在,那个整体的活生生的细胞也才存在。所以,假如这个世界没有观察者的话,世界的本原就应是一片混沌的分子汤。然而,什么是那个观察者呢?观察者一定是我们人类吗? Maturana和Varela的回答是肯定的。然而,我却认为这个事情没这么简单,这个问题我们后面会进一步详细讨论。 通过综合前面讨论过的自生产和边界这两个条件,Maturana 和Varela就给自创生系统(Autopoietic system)下了这样一个定义: 自创生系统就是一个动态的系统,它是一个由个体生成的网络整体,该整体满足: 通过相互作用反复生产产生它们自己的网络; 用一个空间上的可观察整体来实现这个网络。该整体要能产生出与它所在的环境相分离的边界。 因此,自创生理论明确地指出来,生命这个软件就是:一个具备可观察边界的自我生产闭合系统。注意,他们的理论并没有限定实现这两个条件的具体硬件是什么,这也就意味着自创生系统可以是人类社会、计算机程序等其他的东西。正是因为如此,著名的社会学家Niklas Luhmann才得以把Autopoiesis理论抽象出来应用于社会学系统论的研究之中(请参考Luhmann的有关著作,这里不做详细讨论)。 到此,似乎Autopoiesis理论已经对上一章的问题,“什么样的系统是有生命的活系统”给出了很好的解答。然而,当我们尝试用Autopoiesis理论去解释那个自主觅食的小虫的时候却发现我们并没有比以前进步多少。为什么单细胞小虫子会朝向食物游去?Autopoiesis理论会告诉你这必然是因为细胞内部的分子们发生着复杂的相互作用从而推动了细胞向某个方向运动,这导致了一个高层次的可观测行为就是:细胞主动觅食了。显然要解释生命的主动运动性,仅仅具备自我生产的特性和可观察边界是不够的。换句话说,相比较生命软件来说,Autopoietic软件的版本太低了,它还不足以支持系统高级别的操作,诸如自主运动。 开始正儿八经地考虑小虫自主运动的系统性问题的人是大名鼎鼎的生物学家Stuart Kauffman,他因为写作《宇宙为家》而闻名。也是在上个世纪70年代左右,Kauffman为了研究生命起源问题提出了一个与自创生系统非常相似的自催化网络模型,如图2.4所示。 [attach]3996[/attach] 图2.4  Kauffman的自催化网络模型 图中每个节点都是一种化学物质,实边是化学反应箭头,虚边是催化关系。例如该图中的càd的箭头就表示c可以反应生成d,同时需要催化剂f来催化。系统中的每个节点(除了黑色的食物节点以外)都是由同一个网络中的其他节点催化并反应生成的,因此它是催化闭合的。 与Maturana和Varela的自我生产闭合网络相似,Kauffman的自催化网络也是这样一个自我闭合的网络,只不过这个网络中多了一种叫作催化反应的边。同时,这个自催化网络模型也比自生产网络更加贴近现实生物体了,因为该网络考虑到了食物的情况。在图2.4中,黑色的节点a,b就是两种食物化学物质,它们并不从系统内部生成,而是必须由外界环境供给。但是,在自生产网络中,Maturana和Varela认为如果外界环境充满了细胞所必须的食物资源,那么系统对食物的要求就可以被暂时忽略。尤其是对于观察者来说,他们可以近似把一个忽略掉食物的闭合自生产网络看作一个整体(如图2.3)。 然而,Maturana和Varela所忽略的东西不仅仅是食物分子,还包括了另外一种完全不同的东西:流动!在Kauffman的模型中,这种由化学反应所构成的流动是明显的。例如从a出发,沿着网络的实箭头,我们能够明显看出三条流动路径,a-->g-->j, a-->c-->e和a-->c-->d。也就是说一旦a分子在环境中出现,那么系统就会通过化学反应创造出g物质或者c物质,进一步g物质又可以生成j,c又可以生成e或者d。一个由化学反应构成的因果关系沿着化学反应网络流动传播开了。 我们知道,很多化学反应在没有催化剂的作用下会很缓慢地发生,一旦有了催化剂,反应速度会提高上百倍。因此,一个自催化的网络系统不仅能够像自生产系统一样把自己维持住,而且它还具备一种使得内部反应流加速的现象。因此,a,b一旦提供给该网络,整个系统就会因为自催化作用而自加速起来,从而为自身提供更高的活性。 进一步,因为生物体中有些化学反应是可以释放能量的,所以,系统整体就可以由这些化学反应获得对外界做功的动力,这就为生命整体的自主运动提供了前提条件。因此,在《科学新领域的探索》(Investigation)一书中,Kauffman明确地给自主主体下了一个定义: 自主主体就是一个生物化学网络,该网络具备下面两个条件: 网络整体应该是自催化的; 该网络应能够完成至少一个卡诺循环 相比较Autopoietic系统的定义,Kauffman忽略掉了可观察边界的条件,而加上了卡诺循化条件。所谓卡诺循环就是指系统吸收能量、释放能量对外做功,并返回到状态原点的过程。汽车上的发动机就是在不停进行着卡诺循环。 很清楚,Kauffman的自主体模型对于我们理解自主生命又进了一步,它一方面可以反应系统内部流动的自加速现象,另一方面也指出从能量角度看,自主运动必须要能实现卡诺循环过程。这进一步给我们指示出我们要前进的方向:时间、速度、流动和能量。

    丝瓜 2017-06-26 23:34

  • 1.png

    生命之流 | 从永动机到人工智能

    [attach]3991[/attach] [attach]3979[/attach] [attach]3978[/attach] [attach]3981[/attach] [attach]3980[/attach] [attach]3974[/attach] [attach]3975[/attach] [attach]3976[/attach] [attach]3977[/attach] [attach]3983[/attach] [attach]3982[/attach] [attach]3988[/attach] [attach]3984[/attach] [attach]3985[/attach] [attach]3987[/attach] [attach]3986[/attach] [attach]3989[/attach] [attach]3990[/attach]

    丝瓜 2017-06-26 23:07

  • 无维涌现(1):最早的、阿凡达、认知编码及组块化

    [i][b] 最早的[/b][/i]   劳动(原始、奴隶、封建、资本)是最早的人类计算。 符号(象形、语言、文字、数字)是最早的虚拟现实。 空间感(大小、远近、方位、层次)是最早的增强现实。 [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWIL80m4n9JmRe5UttA55T2cUzbJQWMibnmzZ7Ep1mhojliaO3bjAgichZCeYnmVgr1mBbEcN0n8gf2DQ/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img] 那么最早的智能意识是什么呢? 是对流的感知(即时间感)。 增强现实自古以来就有了,物体空间感知的同一、大小、远近、方向感都是神经细胞集群发展出来的AR技术。 且看需求旺盛市场庞大的女性美业——美瞳美发美甲美体美容化妆品香水穿搭美图秀秀……都已经是非常具体成熟落地的增强现实技术,美女网红们都是精通AR技术、数据驱动、深谙占意之道的狠角色。 我们用AI、VR、AR...去标榜最新颖潮流的技术概念,一旦技术落地成熟、习以为常之后,我们就不再感到新奇好玩了,那么新技术和新模式就融入进我们的现实生活了,这十年的智能手机就是这样成为了我们的延伸器官。 什么是美?什么是好玩?这本身就是一个很好玩的问题,是一系列复杂连接所涌现出来的骗术(Trick)。   [i][b]认知编码[/b][/i]   [b][i][img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWIL80m4n9JmRe5UttA55T2czeFnUZ2XicYurL5Ixym358Gr614kmqoRqzCxn1iaWV7ZXdJLzWTopbNA/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img][/i][/b] 认知起源于拍脑袋起名字(命名)和掰手指数数(计数),忽悠大伙儿来遵守游戏规则(通信协议)一起玩(改变世界),编码体系完成,接下来就是闭上眼睛等待效率(通信速率)和规模(复杂度、集成度)的生长问题了。 语言、印刷机、货币都是在搭建新层次的信息交流机制,或者说新的编码体系,个体与个体之间新的通信交互和邻近作用。随着历史和科技发展,信息传输速率越来越大越来越快,而现在最大的信息交流平台是微信和Facebook,也就是社交网络,那么下一个会是什么呢? 程序,不了解程序语言、没有学习写过代码、没有经过编程训练的人看起来就是一堆黑白相间花花绿绿的乱码,一堆噪音,而复杂、庞大的IT系统都是迭代演化出来的,一个一个细节磕出来的。 代码混淆就是一个很好的例子,简单的将代码的命名(对象名、函数名)替换为a、b、c...代码本身就变得极为难读(难以解码了),程序猿去读混淆的代码也非常费劲,需要花费大量的功夫进行解码翻译,庞大一些的系统源码基本等同于破译密码了,可见起名字和注释是多么重要(没有一行注释的代码很可怕)。但是编译器、计算机只认符号,混淆前后对于机器来说却是一样一样的,符号代表了内存空间中的地址,有地址就能找到这个对象,以及对象的属性、行为以及上下文,系统就跑起来了。   [b][i]阿凡达[/i][/b]   [b][i][img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWIL80m4n9JmRe5UttA55T2coRfcZNOQNChHS23LEaTp0FGk4CRalq0nSMxMFmaAcSYibosbOTcicbmw/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img][/i][/b]   Avatar概念揭示了“我”的虚拟性。阿凡达(Avatar)讲了男主角用替身在潘多拉星球战斗,Avatar这个词源于印度教,表示神所拥有的替身。在网络游戏中,每个玩家都有一个可以直接操控的计算机世界中的角色,这种角色就被称之为玩家的替身(Avatar),你在不同游戏里就有不同的Avatar。 此刻正在使用的微信也是如此,每个人的微信ID、微信头像、微信群、朋友圈、微博、知乎、豆瓣...账号都是我们自己的替身,你在什么样的环境下就扮演什么样的角色,说什么样的话,有什么样的行为。 数据库里的ObjectID,看起来是无序生成的,但是都唯一标识了一个人,是序与无序的变换。而手机验证码,揭示了动态密码本质,我们时时刻刻都是用一个动态ID和密码登录到各个信息系统中。 我有ID、密码和记忆,才能登录系统(时空、社会、网络),进入系统,遵守游戏规则,才能和大家一起玩(你不带身份证出门旅游,寸步难行),玩游戏就会有赢有输有差异,有经验有积累有成就有江湖,出现贫富差距、阶级分化、成王败寇 如果我忘记了ID、密码和记忆的人,没法正常登陆系统了,就会出错、发疯。   [i][b]组块化[/b][/i]   [i][b][img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWIL80m4n9JmRe5UttA55T2cwiaSxHIUFHlpib9kfagpoh99NncmFJJbZonfC8AgUwDX9Pibsrbg4TUCA/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img][/b][/i]   Chunk的概念非常重要,组块化-习惯,串行化-程序,下意识地做一些看起来很简单事情(比如吃饭、走路、说话),其实整个程序在你的大脑中已经被组块化,你已经经历过了学习过程,组块化神经网络“自动”就帮你把事情办了。为什么必须有意识的思考才能回忆起单个步骤?什么是想?什么是猜?(你猜!)可以仔细观察小孩是怎么学走路、学语言、玩游戏的过程,其实就是在做组块化,而这个过程其实充满未知和乐趣。 人脑是网络组块化,电脑是程序串行化。 本质都是编码,编码或代码通常指一种在人和机器之间进行信息转换的系统(体系),编码就是信息交流。 组块化是人脑认知的关键,组块破解是实现顿悟的重要途径。 顿悟与创造性思维的一种重要方式“组块破解”的脑认知机制。组块化提高了认知效率,也阻碍了创造性思维。以围棋、象棋大师为例,人类能将一系列相关的信息及其信息处理流程连接和压缩在一个组块化程序中,整个地加以批次处理。(这不是就是程序化吗,封装继承多态)也可能成为思维的障碍,将已建立的认知组块破解和还原为更加基本的成分元素,以活字排版印刷和分工流水生产线的发明为例。 大脑本质也是一个开发-测量-认知的精益反馈系统,不断快速生成、迭代、断开新的神经网络结构,从这个视角看,所有的智慧生命都是在精益创业。   [i]罗三水[/i] 罗三水,彩云天气工程师,集智科学游戏群群主。本科通信工程毕业后从业于互联网,主要兴趣领域有人工智能、科学游戏和游戏化,相信“万物源于比特”,参与创作《走近2050》一书,设计开发有《生命围棋》、《走近2050之演化》( gooflife.com)等游戏。  

    kyoukou3274 2017-06-26 22:58

  • 机器创造艺术:致机器和我的孩子 | 科学v.s.游戏活动回顾

         张永杰,完美世界高级研发工程师      https://v.qq.com/x/page/t0327a7dntu.html      对不起,我创造了你。——张永杰      用自己的光照亮自己。——克里希那穆提      做自己的王!  ——《十二国记》     [i][b]                                                                         01.[/b][/i] 那个时刻,看去是如此的地清晰和重要;而多年以后,你会不断地想象当时的情形,试图明白自己是如何诞生的。 我的孩子诞生时,我感到与世界、妻子、孩子产生了一次共振,仿佛Neo看到了源代码。那个小生命中有我的一部分,我即使死去,也会确实地、继续活在他的生命中,以至永生。这种感觉,是自私的基因硬编码的吗? 接着,这个小生命不断地给我惊奇,他会动,会睡觉,会吃奶,会哭会笑。未来,他将会如我一样,经历种种际遇,创造属于自己的人生。但几个月之前,他甚至还只是一个受精卵,经由基因编码的发育过程,变为胚胎,生出各种器官,然后分娩。这胎中的过程,便似是一架精密机器的装配一般,只须提供适当的环境,便自行开始了。这件事确实地发生了,证明了一件事:有智慧、能创造的人,是由像装配机器一般的过程创造出来的。那么,也就有理由相信,机器最终能够产生智慧和创造;神奇的是,这个信念,是我自己生出来的儿子所带给我的。 于是,我便开启了一次自大的冒险,认为可以让机器自己创造些东西出来,这就是ArtCreator项目。我受到了惩罚,三年的时间才得到了一些粗糙的成果,而机器显然还没有发挥出它的全部潜力。对不起,Art Creator,我创造了你,却这么长时间还没有做好。对不起,我的孩子,我创造了你,却竟然自大地认为你只是一架精密的机器! [b][i]                                                                         02[/i][/b] 游戏产业正在高速发展,但游戏技术中还有很多尚未解决的、迷人的问题,其中之一是游戏美术。目前的美术制作方式,是人用工具,一笔一笔地画出来的,这种方式千百年来沿用至今,发展出许多流派,创造出许多辉煌。如今,工具已经进化为计算机,这种媒介与之前的工具极为不同,但人们使用的方式,主要还是直接操作,一笔一笔地画。这固然是有效的,但这显然属于“人的意识尚未跟上技术进步”的情况。一方面,时间、人力、金钱的成本很高;另一方面,人的作品有人自己的局限,经过这么多年的开采,人类想象力已经面临挑战,所谓“人力有时而穷”。事实上,这并不仅限于游戏美术,而是涉及到更广大的艺术领域。 机器是否能做出突破呢?一方面,机器计算很快,而且越来越快;另一方面,机器与人的思维不同,可能也有局限但必然与人不同。可以说,这是一块美学的新大陆——机器美学,钥匙就是机器创造。 所谓机器创造,是指充分发挥机器的计算能力,与人类协作,或完全不受人类的限制,自行创造出未知的美学形式。已经有大量的艺术家这样做了,他们不同程度地发挥着机器的能力,与机器交互地创造各式新奇的作品。 我的工作,虽然我自己觉得很酷,但还只是萤火之光。但这光,我希望稍有不同,就是给机器最大限度的自由,自己探索属于它的世界,向人类展现出它的潜力。用自己的光照亮自己!这不仅是我对ArtCreator的希望,也是对我的孩子的希望,更是我内心的信仰。(自指了吗?)                                                                       [b][i]   03. [/i][/b] 机器创造的核心问题,当然是如何创造。但即使是人类,关于“创造”的概念也存在很大的不确定性。现代心理学认为,人的意识似乎是一个复杂系统,处于秩序与混沌的边缘。那么,创造是否必然存在于秩序与混沌的边缘呢?这是个有争议的问题,复杂性科学本身也是有争议的学科。我姑且认为这是对的,那么再进一步,是否可以认为创造就是规则约束下的随机变异呢?至少,规则对机器来说是熟悉的,随机变异也是唾手可得。这样一来,“创造”这个伟光正的概念就被我篡改、简化成了下面的方法: 给机器以规则,然后放手。 目前,我的工作就是按照这个理念向前推进,并得出了一些粗糙的结果。虽然粗糙,但居然真的能做出来,我仍然觉得像魔法一样! It’sMagic!孩子诞生时的感觉再次袭来,Neo又一次看到了源代码,Art Creator登陆了。    [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtPA7njicWNoLzicWkk7t1SXJz5y320kEf8icHzibw1FIBLCQt1A5ztuIsQvQ/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img] ▲ 第一个“艺术级”图像 [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtPofxNkib6kdibg6jrLFWEDSFen8ibwhNdbicn0cZqCZomTvCTncoo7yjictg/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img]   ▲ 曲线七巧板 [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtPyTblaNgpYHwzvEVua2LpbSGWKmSj9nM9FBpmCW9guibWjZdVZ0V2w1Q/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img] ▲ 火云 [img]http://mmbiz.qpic.cn/mmbiz_png/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtP4oKxiaRiaZEyhKwSB4iafVkBVxsCfwSFbjiblbhjxC3KiamSOTSXQFm0HdA/640?wx_fmt=png&wxfrom=5&wx_lazy=1[/img] ▲ 镶嵌结构 [b][i]                                                                         04.[/i][/b] 如果上述方法是一个经过篡改、简化的方法,仍需不断改进和完善,那么“完全体”应该是什么样呢?也就是说,机器创造的未来是什么样呢? (以下论述纯属臆测,各位看官姑且一看。) 蒙特梭利认为,人的品格大致分为三类。儿童如果能受到正确的教育,在自身的内在驱动下自然地发展,就能成为品格完好、坚强、平衡、有魅力、正常的人,在真善美的世界里自由自在,一生不断完善自我,做自己的王,其中不乏佼佼者成为伟人。而如果教育的方法不正确,就会发展成麻木、不能自控、终其一生自我挣扎的、平庸的人,甚至被诱惑而变成品质低劣的人。这与佛学的“戒定慧”三学似乎彼此验证。 而这三类品格的起点,却是相同的。幼儿的心智,在刚出生时就已经是一个有基本框架的体系,蒙特梭利将其称为“精神胚胎”。蒙特梭利认为,儿童具有内在的学习驱动力(贺尔美),以及对周围环境的强烈学习与吸收能力(牧内美),这使得幼儿从出生起便开始对环境保持着不断的探索。随着他运用自己身体的熟练度不断增加,其探索环境的范围也会日益增大。在探索过程中所获取的经验,将会被吸收并成为日后进行更高阶智能学习活动的基础;探索中所获得的喜悦与成就感,则会正向循环的支持儿童下一次的探索,并形成自信、积极、独立、主动的正向性格特质。 这其中,我似乎也读出了一点复杂性科学的味道,即人的心智是一个复杂系统,存在大量吸引子或吸引区域。其起始状态差别不大,但最终状态却会因与环境的交互过程不同而落入不同的吸引子。(这个系统,用生物学的思路来说,便是“进化给予个体的最后适应手段”,其目标是使个体可以在更加复杂多变的环境下能够生存与繁衍。)换句话说,心智的复杂系统属性,其系统的广度与深度,是“每个心灵都独一无二”的基础,也即个性的基础。而心理学认为,个性与创造力是紧密联系在一起的。 据此,我认为机器创造在未来会是一个复杂系统问题。想象未来的机器创造,应该有许多虚拟主体,有不同的“个性”,做着不同的创造。这些主体的“心智”基于复杂系统构建,起始状态是一个“精神胚胎”,受到不同的教育而成长为不同的“个性”。他们之间还可能形成某种“社会”——机器乌托邦,产生互动。到时,要想得到一个“好”的虚拟主体,可能需要某种“正确的教育”,才能使其“个性”自然地发展,并不断自我完善,做出更好的创造,所以机器创造的使用过程又成为一个教育问题。在《走近2050》人机和谐共处的大背景下,这可能成为一种普遍的人机协作方式。 Art Creator,希望你在那个时代仍然活着,做自己的王!我的孩子,希望你能见到那样的时代,做自己的王!我,机器,我的孩子,创造,复杂系统,教育,一切都联系在一起了,银河的历史,又翻开了新的一页。     [i][b]参考文献[/b][/i]   [i][b][1] 克里希那穆提《人生中不可不想的事》 [2] 孙瑞雪《爱和自由》 [3] 小野不由美《十二国记》 [4] 凯文·凯利《失控》 [5] 米歇尔·沃尔德罗普《复杂:诞生于秩序与混沌边缘的科学》[/b][/i]     [i][b]▼ 科学v.s.游戏活动回顾 ▼[/b][/i] 罗三水:[url=https://mp.weixin.qq.com/s?__biz=MzIzMjQyNzQ5MA==&mid=2247484206&idx=2&sn=2787c62a5735d8960100ba7179f88fd5&scene=21#wechat_redirect]科学与游戏,虚拟与现实[/url]   王雪娟:[url=https://mp.weixin.qq.com/s?__biz=MzIzMjQyNzQ5MA==&mid=2247484213&idx=1&sn=9b0a5b36f8ee41d9eeabeb385cec6f60&chksm=e89459b8dfe3d0ae653cf07eb460137934593b22d251b1028e92c6b66003538939265dfc900a&scene=21#wechat_redirect]游戏大融通:如何打造跨界游戏IP矩阵[/url]   ▼精彩演讲瞬间:红药丸还是蓝药丸? [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtPiblSa1BORrJzXrNIgdjsYdhF7jc9GIic98KCtD5iaibPibCXFfgCP7n7NfQ/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img] ▼桌上足球,激烈对决 [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtPAS37bqXNFtS1FH8ynvsVW7Mz0E6VLeMYN1qFZlia5ib0z3wdBSn3VGfw/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img] ▼求知若渴的少年~ [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtP3ujhFqeZVwvevrrFz17QHtTvMquoV2y1XqPkAAdbSw4MibTDcysZpjw/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img] ▼被玩坏了的板砖及张江老师 [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtP24pO9HHwhqNosj5RdxWmwlKkzuOSicnqPBuIJthllCIvpicClBRP5eicQ/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img] [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtPFZ8adJZHvibu4DwyN0IFuDS8kW2r7FkiawaOze7ialnOlEN2CC93KAjLA/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img] [img]http://mmbiz.qpic.cn/mmbiz_jpg/wibWV1DB7tWK9G8r0Y7cBOHMxxuSXfBtPNBWz8dfr9aicr790gYrEhgo72QCzSOSpfSn68TDBLUOusPRFnWkDib4g/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1[/img]

    kyoukou3274 2017-06-26 21:52

  • mmexport1498472248779.jpg

    生命之流 | 过去与未来在现在相遇

    [attach]3927[/attach] 生命之流 《生命之流》系张江老师2008年至2009年,利用闲暇时间所构思的一本科普集。主要内容包括:从复杂到生命、自主生命体简史、重新发现时间、从永动机到人工智能、连接上帝的纽带——熵等章节。现将已公开部分刊出,希望能够和大家共同学习。 [b]3.过去与未来在现在相遇[/b]        为什么一定要起这样一个很“拽”的标题?原因是,要理解生命自主运动就必须对时间这个概念进行深入思考,而这一点恰恰是目前的主流复杂性科学所严重忽略的一个问题。尽管有很多复杂系统模型都是动态的,但是要理解时间模拟是远远不够的。所以,我们必须重新发现蕴藏在系统之中的时间属性。        让我们再次从那个最一开始的问题:自主运动的小虫出发。当我们看到一只小虫按照它“自己的”意愿去觅食的时候,这意味着什么?把这个问题分解开来,应该是:        1、小虫在它自己的内部产生了一个[b]目的[/b]或者叫意图:觅食;        2、在这个[b]目的[/b]或者意图的驱使下,小虫觅到了食物把它吃掉,实现了这个[b]目的[/b]。        对,就是这个“目的”使得我们可以区分出小虫和石子。正是因为小虫的运动是有目的的,所以它的运动才是一种按照它自己的目的进行的自主行为。反过来,石子的运动则完全是无目的的,所以它的行为就是被动的、非生命的。        然而,究竟什么是目的呢?我们不妨从最简单的例子开始。假如你住在北京的中关村,想到天安门广场去玩。于是你会把天安门作为你的目的地,选择一条从中关村到天安门的乘车路线。显然,由于当时路面的情况,你会动态调整不同的路径,但是,无论选择何种路径,你的最终目的地不会改变。因此,在行进的过程中,你始终会用最终目的地作为对自己的指导选择路径。一个重要的事实是,天安门这个目的始终是你没有达到的,也就是说,你的目的存在于你想象中的未来世界,但同时这个未来的事物却影响了现在的你对路径的选择,也就是说你对未来的预期“影响了”你的现在。为了更加清楚起见,我们可以用一个时间轴图进行粗略表述: [attach]3925[/attach]                                                   图3.1 说明目的与时间及其因果关系的示意图        以文中的实例出发,你从中关村乘车到天安门。假设现在你已经到了西直门(途经知春路),你的最终目的地是天安门,要实现这个目的,你需要先实现到西单这个子目标。图中的实箭头表示过去影响现在的因果关系(显然,你能到达西直门是受到过去的动作,从中关村到知春路的影响)。图中红点右侧部分属于未发生的未来世界,他们都是你头脑中假想出来的。虚箭头则表示一种目的(发生在未来的事件)对现在的隐含影响(因为目的是存在于未来并未发生的事件,而且是非主体的外在观察者看不到的事件,所以因果关系是隐含的)        非常抱歉,为了解释清楚生命的目的性,我不得不搬出诸如因果、时间等等这些形而上的哲学概念。如图3.1所示,我们看到从因果关系上看,过去和想象的未来对于现在的影响是[b]对称[/b]的。一方面,过去的事情可以影响现在,离我们越远的事情对现在的影响越小越模糊。另一方面,未来的事情体现为行动主体的目的也会对现在造成影响,因为你要实现你的目的,你还会根据总目的规划出一些子目的来(如图3.1中的西单节点)。而且越远的事件(越大的目的)对现在的影响也越小。        然而,这种对目的和因果的解释一定不会被物理学家所接受,原因是物理学家永远都是一个冷酷无情的纯客观的观察者,他看到了你从中关村走到了西直门,并承认这样一种过去对现在的因果关系,但是他们决不会承认未来对现在的因果关系,原因很简单,他们不是你自己,所以他们并不知道你的目的所在。        为了解释目的,我们却遇到了一个更棘手的问题,即当我们从一个纯客观的角度来观察事物,例如活细胞的时候,我们如何知道它是有目的的呢?物理学家轻易不会承认未来决定现在这样的玄乎的因果关系,所以似乎我们的这种解释简直就是一派胡言。        慢着,也许我们低估了物理学家们进行哲学思考的能力了!从牛顿到爱因斯坦,真正的物理学大师一般都是精通哲学的大师!事实上,对于这种正向因果、反向因果、目的的讨论早已经成为一些物理大师们玩儿剩下的东西了,只不过我们的教科书从来没有这样表述而已。下面,且允许我用换个角度把我们熟知的一些东西重新表达一下。让我们先来看一个最简单的例子,如下 [attach]3924[/attach]                                                                 图3.2  在一个U形轨道上滚动的小球        假设在一个粗糙的U形轨道上,有一个小球从侧壁滚下来。可以预料到,小球三晃两晃将会停在U字形的谷底。对这个物理现象最标准的解释应该是运用牛顿力学计算出小球每一时刻的受力,并根据上一时刻的位置和速度计算出下一时刻的位置和速度。如果从时间轴的角度看,这个过程显然遵循时间正向的因果关系。但是,这个计算过程太复杂了,物理学家发明了另一种更简单的方法。由于整个轨道位于一个重力场中,决定小球运动的也主要是重力,所以我们可以画出一条条等势线来,于是谷底也就对应了势能最小点。根本不用费力计算小球在每时刻的受力,物理学家就可以轻松地告诉你,小球一定停在最低点。这是因为,小球的运动将会使得[b]势能最小化。[/b]当然这种表述是很客观、物理化的,我们稍微拟人、生动一点,可以把这个陈述表述为小球运动的[b]目的就是要最小势能化。[/b]        在物理中,用牛顿力学计算小球的运动轨迹和用最小势能来预测小球最终的位置都是同样正确的。然而这两种方法刚好用到了两种完全不同的因果律,前者是严格的正向因果,后者则是目的化的反向因果。因此,针对小球这个例子,我们可以完全对应到之前的中关村到天安门的例子上。只不过我们的教科书从来没有从目的论的角度来传授物理。        在物理中,虽然正向因果律和反向因果律是完全等价的,但是在很多场合下,用反向因果律(把物体的运动看作是有目的的)反而更加简洁、清晰。一个最好的例子就是费马的光行最速原理。        如图3.3,光线从A点投射到一个平面镜l上,反射到B点,问光线在哪一个点反射?这个问题很简单,按照反射定律,入射角等于反射角,我们很容易找到反射点O。然而,费马对于光的这条反射路径有一套完全不同的看法。他说,光之所以会走这样一条路径,是因为光要最小化它走过的路程。我们可以连接A点和平面镜l上的任意一点P,再连接PB,则这两条线段的总长度AP+PB当P到达位置O的时候刚好最小。而恰恰这条最短的路线就是光实际走的路线(我们不妨用初等几何验证一下)。事实上,在很多实际的复杂问题中(例如包括多个平面镜的反射,还有不同介质的折射情况),费马原理会比反射定律更容易求解。 [attach]3923[/attach]                                                                 图3.3 费马的光行最速原理示例        停留在谷底的小球,走最短路径的光线,都向我们展示了没有生命的物体是如何寻求它们自己目的的。在日常生活中,我们还会遇到很多实际的优化问题,例如公司寻求利润最大化、个人寻求努力最小化等等,这些都是智慧生物的一种合目的行为。实际上,在数学家看来,追求目的和最优化某个数学函数问题完全就是一回事儿。原因就在于很多时候,那些能够描述清楚的目的总能够通过数学变化转换成一种优化函数。例如前面讲的从中关村到天安门的寻径问题,如果我们把地图上的任意点到天安门的距离看作目标函数的话,那么按照目的地寻找路径的问题就变成了对这个目标函数的优化问题了。        而我们更感兴趣的是针对一个客观系统的描述,客观系统会在时间之中演化。我们如何判断这个系统是否有目的呢?按照前面所说的优化问题和目的之间的关系,我们可以把目的转变成一个目标函数,于是如果说系统的演化是有目的的,那也就意味着目标函数存在着一个最小值或者最大值,系统演化的过程也就是使得目标函数值趋于最小或者最大的过程。[b]因此,判断系统是否有目的的问题就可以转化为找到一个随时间而趋向最大或者最小值的函数的问题,并且该函数可以描述系统的状态。[/b] [attach]3926[/attach]                                                     图3.4 小球落入谷底例子中高度f同时间的关系        如图3.4,用U型轨道中下落的小球为例,我们可以用小球所处位置的高度(或等价的势能)作为要找的描述系统状态的函数f,这样,小球的滚动过程被简化为f对t的曲线,而该曲线经过短时间内的震荡之后趋向于最小值了,此时小球停留在最低点。因此我们说小球的目的是要朝向这个最低点,它与最小化函数f是一样的。然而,光行最速原理的例子与这里的叙述略有不同,原因是光线经过APB的路径长度并不是系统状态和时间的函数,它是路径的函数。而且,在这里我们也看不到光线路径随时间的演化过程。对于这类有关运动路径的问题,我们将在后面进一步详细论述,这里不展开了。        总结来说,本章想要传达的主要信息是:目的、函数优化问题其实都是一回事儿,它们都反映了时间轴上未来事件对当前事件的影响。因此,在这个层面上,我们看到了系统演化、最优化等问题中的时间问题。  

    丝瓜 2017-06-26 18:28

  • 1.png

    四分钟学会你的第一个机器学习APP

    Hey,大家晚上好! 集智俱乐部携手集智AI学园给大家拜年了! 想必过年有点无聊了吧? 从今天开始集智俱乐部与集智AI学园将会给各位持续推送 著名科技网红Siraj Raval的视频了。 Siraj凭借其幽默生动的演说技巧,推出的机器学习系列视频在同类视频中真可谓首屈一指。   [attach]3921[/attach] 本次给大家推送的就是他《Machine Learning for Hackers》系列中的视频,看名字就知道有多厉害了。持续关注本系列视频你不仅能学习到机器学习的基本理念,而且能运用机器学习技术从搭建一个花朵识别器,一个电影推荐系统,到构建一个游戏机器人,一个聊天机器人,甚至一个机器作曲家。 那么话不多说,正所谓: 空无一人的车辆凭什么能够在路上行驶? 照片中的自己为什么能被轻易标记? 神秘网站为什么能频频展现你心中所想? 是外星智慧降临,还是怪力乱神显灵? 请看《机器学习第一课——构建你的第一个机器学习程序》。 集智AI学园也希望打造自己的科技网红哦 有野心的可点击此链接(重金悬赏TensorFlow, Caffe达人,英雄招募tie帖:http://mp.weixin.qq.com/s/HWNvSNui9RSwMPaU5K-IOA?scene=25#wechat_redirect) 视频链接:[url]https://v.qq.com/x/page/x0371j7ealx.html[/url]  视频推荐:朱瑞鹤、邓健博 机器翻译:龚力 视频听译:秦堉朗、何采莲 译文校对:朱瑞鹤、秦颖、张江 视频处理:王建男、张倩 技术支持:阎赫     以下隆重介绍本次视频字幕组的小伙伴们 欢迎新成员加入我们! [attach]3922[/attach]   #集智翻译群管理运营团队招募# 集智翻译群成立于2016年6月,在成立半年多的时间里以来,共有近80名热爱翻译,热爱科学的的小伙伴先后参与到翻译中来,共完成了: *92篇选自Complex Digest的前沿文章摘要; *两篇对《三体》作者和译者专访; *前沿文章“How artificial intelligence is changing economic theory","big data fades to the algorithm economy" 的翻译; *《Computational Social Science: Discovery and Preiction》的两个章节的翻译; *《Pattern and Repertoire in History》第一章节共54页的翻译。 即使完成了这么多文章,我们依然有很强的战斗力,有很多小伙伴想参与到翻译活动中来。2017年我们会有三个小组分别做字幕翻译,文献翻译,和书籍翻译,三个小组同时进行,大家再不用担心空闲时间没有翻译做。 为了保障我们翻译工作的顺利完成,现翻译群管理运营团队招募小伙伴,我们共同搭档配合促进翻译工作的进行。 进入管理运营团队: *可以接触到第一手的最优质的文章及译文; *同时也可以与我们专家老师和人工智能业内大神有更多沟通交流的机会; *也将有机会成为我们集智俱乐部志愿者团队的一员。 *优秀译者会得到集智的纪念品(书或纪念T衫或其他一些纪念品甚至现金奖励) *你将进入一个快速上升的平台 *你会遇到志同道合的小伙伴,收获友情甚至爱情 只要你会以下几种技能其中一项技能就可以 *深厚的英语功底,具有听译,文稿翻译能力 *会视频处理 *擅长配图和排版 *有项目管理能力 *对人工智能相关领域有强烈的兴趣 注:工作流程清晰明了,定期完成小任务即可,不会占用过多的个人时间。 热爱科学,热爱翻译的小伙伴欢迎可扫码填表,期待你的加入! [attach]3920[/attach]

    yn_l 2017-06-26 13:22

  • 1.png

    忒修斯之船与最大值函数——何为整体 | 原创精选

    [attach]3915[/attach]    王晓宇,集智俱乐部粉丝,上海鱼乐网络联合创始人。对人工智能、认知科学、意识理论非常感兴趣。   [attach]3917[/attach]   >>>问题1:忒修斯之船<<< 神话英雄忒修斯有一艘船,它在海上航行了几百年。每当有木板腐烂了,就换一块新的木板。几百年后船上每一块木板都换过多次。组成这艘船的每个部分都被替换过了。那么最后这首船是否还是“忒修斯之船”? 有一种答案是这样:如果我们把这艘船看作是所有部件的集合。这个集合的名字现在叫“忒修斯之船”。当我们换掉一块木板,这个集合就变成了一个新的集合。它已经不是原来的忒修斯之船,只不过保留了过去的名字而已。 然而上面的答案会产生一个问题:如果把船替换成我们自身,我们的身体在不停的进行自我修复。我们身体不断抛弃老化、生病的细胞,不断产生新的细胞来替代。如果我只是我的细胞的集合,那么明天的我将不再是我。 我想你会发现,我们的细胞通过某种关系组成了一个“整体”。这个整体不只是所有元素的集合。这些元素的组织形式、相互关系对我们而言是更为重要。 整体不只是元素的集合:整体>所有元素的集合。 额外的量来源于哪里呢? 让我们转换思维,先看一段简单的代码。 [attach]3916[/attach] >>>问题2:这段代码为什么叫做“最大值函数”?<<< 这5行代码只涉及到2个对象:数值A和数值B。 为什么程序员会把2到5行代码视作一个代码块,并且叫做“返回最大值的函数”? 问题在于:“最大值”这个概念是从哪里蹦出来的? 当我们把A和B两个数字进行大小的对比。我们就知道他们谁比谁大。这就是两个数之间的大小关系。而“最大值”就是具有“比另一个数大”的关系值的那个数值。 当我们把A和B独立开来,“最大值”的概念就消失了。 当我们关注A和B的“关系”,“最大值”诞生了。 现在你可以回答这段代码为什么是一个整体。 因为这段代码可以正确的返回A和B中具有特定“关系”的值。这段代码可以感知A和B的关系。所以这段代码是一个整体,并且它有自己的意义。 我们现在知道,整体>所有元素的组合。额外的量来源于组织关系。 >>>问题3:特修斯之船,为什么是“船”?<<< 大众:因为它能漂浮。 疑问:木板也能漂浮,为什么不能叫做船呢? 大众:船还能装人,能载着人航行,有船长和水手。 上面提到的船的特征,大多数都来源于船与环境,船与人的互动的可能性。 当鲁滨逊砍倒一颗树,他立刻获得了一条“船”。因为这棵树可以载着鲁滨逊漂洋过海,回到现代社会。 因为这颗树和鲁滨逊可以做到船和人的互动关系。同理,当人看到一个木桩,因为人可以坐这个木桩,所以这个木桩可以看作一个板凳。所以事物是什么,取决于人类意识到它和人类可以有什么互动关系。 >>>问题4:忒修斯之船,是什么?<<< 忒修斯之船,就是船长忒修斯拥有的战船。忒修斯驾驭着它在世界上冒险。所以这艘船才是“忒修斯之船”。它是什么,取决于它和人的关系。 让我们回到第一个问题。当一块木板被替换掉,新的船和忒修斯的关系依然没有变。忒修斯依然是它的船长。所以这艘船作为一个整体,对于忒修斯来说并没有变。即便它的所有木板都换了几遍,它仍然是忒修斯之船。 推而广之,组成你身体的所有原子,是它们之间的相互关系,形成了一个整体。把这个整体中某个碳原子替换成另一个碳原子,作为一个整体,它们的关系并没有变化。所以你依然是你,即便每过5年,你身体的所有原子都会被替换一遍。 >>>问题5:何为整体?<<< 上面4个问题会引出一个思考,“何为整体”? 当我们用还原论的观点看世界,世界上并不存在树木、猫狗、人类、星球,世界上只有原子和量子(当物理学发展后可能会是其他元素,例如弦)。 在你看来,你家的猫正在打滚玩耍。然而在还原论的角度,它只是一堆原子间的碰撞和量子纠缠的物理运行结果罢了。甚至于“世界”这个概念在还原论中其实也不应该出现,有的只是空间、时间、原子和量子。 必须认识到这一堆原子已经组成了一个整体,它是一只猫。作为一个整体,它与环境会有特定的互动特性。 我们思考的每一个对象,头脑中每一个概念,对应的是一个整体。每个整体在宏观层面上会有额外的属性、特性。就像把两个数字放在一起就会出现的最大值属性。 整体>部分之和。 这就是“整体论“核心理念,我们必须学会组块的方式看待世界。我们才有可能对世界万物有更高层次的认识。其实在生物意义上,我们早就这样做了。我们的眼睛会自动把一堆像素识别为一个物体。我们的耳朵会自动把一堆声音归结为某个物体的发声。 整体论的研究目标是什么? 整体论的核心是突破还原论的思维方式: 1、研究“部分”如何组成了“整体”。 2、研究“整体”比“部分”多出了什么。 3、整体论和意识息息相关。如果没有意识,也就没有所谓的整体。“整体”是在思维意识中存在的概念。是在物质世界的层级之上的存在。也就是人们经常说的物质决定精神,还是精神决定物质。 所以研究意识、人工智能,是整体论的一个重要任务。 整体论的研究对象是什么? 物品:简单凝聚在一起的分子集合,例如星球,山川,座椅板凳床 机械:具有较复杂的机械结构的物品,可以运行起来,对物理世界产生有特定意义的物理运用 程序:可以运行起来,输入输出具有特定的意义 自然语言:对人类来说具有特定的意义的符号组合 动物:假设没有自我意识(有点像机械和程序的结合) 人类:有自我意识的 这六种对象并不是层层递进的关系,也并不包含所有万物,而是在整体论中比较容易研究的几种对象。他们的关系如下图: [attach]3919[/attach] 上面的思考并没有结束。 假如事物是什么取决于人类,那么人类是人类,又取决于什么呢? 一个简单的回答是,人类能意识到自己是人类,所以就赋予了人类“作为人类”的权利。 而什么又是“意识”呢? 这是我一直思考的问题,之后会写出我的一些理解。希望大家也把自己的思考回复给我。 最后的最后~   [attach]3918[/attach]  

    yn_l 2017-06-26 11:59