无标题意识,科学唯一无法企及的领域No.53115246 只看PO
2022-10-31(一)23:14:53 ID:A6Gr3rE 回应
在曾经的a岛中,推理版出现了一条串"意识,科学唯一无法企及的领域",一位a岛前辈为了驳斥这种论调,在此串中进行了如下的科普。
前辈所科普涉猎之广,内容之深刻,为搬运者带来了相当程度的精神震撼,以及带来了许多方向性的人生选择。
由于原a岛的沉没,此串已经不可考,万幸的是,笔者于过去因学习方向的原因,保存了一部分内容,秉承互联网精神,也希望怀有相同理想或志向的同志在此汲取养分,故在原文基础上稍微排版,并在此重新贴出。
无标题无名氏No.53115258
2022-10-31(一)23:15:24 ID: A6Gr3rE (PO主)
推理版成了科普版。
这个科普可能要做成一个深度科普,就在这个串内进行,但保证不能学术性的写全,因为涉及的知识太多太杂,如果要写全,每个领域都需要深厚的学术功底,讲到生理学部分可能需要读者拿过移液枪挤过loading buffer,讲到人工智能部分可能需要读者写过ARTII神经网络,实现过遗传算法。所以尽量在各个领域的描述中浅尝辄止,但也会尽量保留检索学习的线索。(随时可能弃坑)
科普分为四部分,首先神经学简史,然后认知心理学简史,然后人工智能,然后前三者学科交叉。
神经学简史部分
先从十九世纪前半页神经学研究得到的一个结论开始:神经细胞上走的电信号,是机械的反应(但多次刺激并不是每次反应都一样,之后详述)。这个结论揭示的一个间接结论就是 >单个神经细胞存储不了记忆也产生不了意识,它们必须配合才能工作。
具体存储在哪,1900年左右的时候钦定存在突触里,当时也不知道是怎么存,猜的,后来证明猜的挺好。
猜的人叫 >圣地亚哥·拉蒙-卡哈尔 (Santiago Ramón y Cajal) 得了诺奖。
然后神经学简史再从187X年开始谈。
187X年到1900年之间,神经学爆了一个重要的研究成果,就是小孩从娘胎里生出来之后,脑神经基本就不太长了,包括神经纤维和神经细胞。直到最近(1980年后)以前,甚至神经生理学界一度认为出生之后,脑子里一个神经元或者一根轴突,都不会再长,但是后来发现也不完全是,但也不完全不是,也就是说娘胎里出来的小孩,学习东西,记忆,产生意识,不是靠神经元增加或者长出新的轴突,而是靠神经纤维调权值。
这就是上边说的圣地亚哥的研究成果,但是这个成果不完全对,后来发现不光调权,调权之前还有一个切断冗余神经连接的过程,发生在出生之后。具体怎么切的,到了去年3月份才研究了个大概其,要查论文的话,查 >罗振革 的论文,然后顺着参考文献去扒。
为什么大脑不长新的,而是建立了断旧的这种耗费巨大的机制,需要等后边三学科交叉的时候才能说清楚。
现在讲了三个重要结论,1、神经细胞必须配合才能工作 2、记忆主要靠调节突触权值(实际是突触后膜上离子通道的数量和种类,可以理解成在调整突触的阶跃响应阈值) 3、记忆意识和身体控制功能形成初期大量神经和突触被大脑自己消灭了(你可以理解为把权值置为0或者把阈值置为了∞)
然后开始讲1949年赫布假说和1966年LTP。
赫布假说很简单,说的就是如果n个细胞之间互联互通,然后你用电刺激它们,让它们同时兴奋,多次之后,你下次对整个一大片神经随机电刺激,然后这些同时超射过不少次的神经就比其他神经细胞更容易同时超射。
简而言之,就是同时兴奋使细胞间连接增强。
这个理论也是一个猜的理论,但是一样猜的还可以,后来证实有这个机制,这个机制占大脑里记忆形成的大多数情况,但不是全部,还有同时刺激连接减弱的情况之类的,具体哪里是什么样的视大脑需求而定,但是必定是其中一种特性。这个神经的学习癖好的分类有几种,而这些分类在脑子里的分布,人和人基本是一样的。也就说每个人脑子里都能跟踪到的那些神经通路,而不是大脑皮层下边两层的那部分。
这里介绍一个引理,就是DNA能存的信息太少了,编码的蛋白30000种左右,非编码区占95%,就算全都算上,信息也就600000种蛋白质的水平,但是大脑神经细胞有1000亿数量级,血管分布,淋巴管分布等等,脑神经每个神经元出来的神经突触数量级大概10^3。
这就引出一个结论,DNA编码不了每根神经跟另外哪根连接。具体在DNA编码方式后来研究认为可能还是利用统计学分形的一些规则。但是分形这个东西成果出的太晚了,近战也慢,现在的生物学家不知道这个东西具体怎么建模。
简而言之就是 >DNA控制不了脑子里的神经具体怎么连,只能控制大方向,哪里用那种神经递质,那种类型的,具体连接的突触和神经细胞分布带有局部随机性。
这个结论也导致脑机接口意识上传的希望变得渺茫。
到此为止我们讲了Hebb假说之后,基本就能解释敲鱼缸同时喂食,为什么可以训练7秒记忆的金鱼游过来了。敲鱼缸,鱼耳朵硬性给鱼的震动感受和听觉中枢传入信号,然后大脑内相应神经兴奋,同时“前方有饭”的整个一个系统的神经在工作(兴奋)。
脑子里只要有连接这两部分神经的通路,训练多次之后,再敲击鱼缸,就有耳/侧线→脑内听觉/震动→“前方有饭”工作电路→运动控制中枢这样的反射。
这个基本工作原理是后边阐述意识形成原理的关键基础。
那么为什么金鱼记忆只有7秒呢,原来金鱼是短时记忆只有十几秒。原因后来发现这类动物基本没有LTP。
下一个要说的成果就是1966年LTP,研究者 泰耶·勒莫 (TerjeLømo)
LTP在兔兔脑子里发现,开了兔兔脑子刺激一条已知的神经通路,用力刺激,高频高强度,然后这条通路就一直存在较高的了突触后电位。紧张的突触后电位状态可以理解为“一触即发状态”,刷刷脑波就会使这条通路再次兴奋。
这个东西可以持续几分钟到几个月不等。(正常神经兴奋持续顶多是20毫秒左右,心肌本事大,有个钙离子通道平台期,能持续最多3秒左右,喝了咖啡还能更长导致停跳一拍)
这个机制保证哺乳动物第二天记得买手纸,而不是被困在厕所里。但是不是哺乳动物的并不是都能做到这点。
LTP是一个缩写,叫做长时程兴奋。后来研究相应的还有LTD,就是长时程抑制。
长时程抑制多用在类似于过滤钟表声音的工作里,兴奋兴奋兴奋之后,这个神经反而被抑制了,这样通路通,你就主观感受不到屋里一秒一次的滴答了。
然后简单介绍人脑的基本工作原理。前两年英国人做过一个实验,给你一个主观问题,比如扶老太问题,然后你以最快速度按按钮选选项抢答,这类问题太能体现人类作为万物之灵的自由意志了,但是同时监控你的大脑葡萄糖反应,哪里兴奋了。
后来发现你做出决定之前2秒左右你大脑基底核做出决定,然后自组织成自然语言中枢的描述和手的动作,然后动嘴开始对着研究员喋。
实验结论令人失望,人的高级意识感受不到做决定的潜意识(基底核)做了什么,并且高级意识往往认为是自己做的决定。
但也并不是所有情况都是这样的,尤其在用到逻辑的时候,虽然基底核在不停地和高级中枢(逻辑推理的时候只要用语言那块皮质)交换信息,但是高级中枢的决定权也是很重要,也要按照大脑的法,按照中枢模块之间互相制约的基本法——来做决定。
神经学基础的介绍到这里为止了。
现在重复关键结论:
神经细胞必须合作
主要记忆靠调节突触权值
意识形成阶段主要靠断神经而不是长
同时兴奋的细胞连接增强(或减弱,具体哪种不是随便分配的)
哺乳动物短时记忆靠LTP这个后来进化出来的机制
引理:DNA存储空间有限,大脑并不是DNA一根神经一根神经设计的
引理回答了小朋友们常常念叨的一个问题“大脑的神经有1000亿,怎么研究呢?”
答案就是你研究它怎么组织形成的就行了,哪里随机哪里固定,然后搞清规则,就可以用计算机模拟整个大脑,但这也导致你没法用此方法精确模仿某个人本人的大脑。
>>待续
无标题无名氏No.53115288
2022-10-31(一)23:16:35 ID: A6Gr3rE (PO主)
接上篇
先从联想记忆开始说。
联想记忆这个概念提出早在1900年之前。这个时代没有有力实验证实,因为技术太萎没法实验证明。
没法应用奥卡姆剃刀和举证义务,那当然可以满嘴跑火车了。
所以这个时代出了一些铁胆火车侠。
1900年弗洛伊德出了○妈著作《梦的解析》。
《梦的解析》可谓是火车侠里的战斗侠,在没有任何实验证明的和统计学分析的情况下,暴力进行猜测,当然被简单统计学真理给爆的体无完肤。比如你猜一个生理机制的原理猜对的几率是88%,前几次你还可能猜对,到第六次你的正确率就是0.88^6=46.44%,不到一半,如果在此基础上你再做推理,那就基本对不了了。
后来证明弗洛伊德、尼采之类的这些不讲证据的,果不其然弄的自己的理论和宗教意义,和事实偏离巨大。所以当代整个以实验为基础的心理学体系以及可以推广到整个科学界,认为这些人当年做出的成果不算科学范畴内的成果。
那么玄学是在什么时候结束的呢?
其实就在○妈著作出版后4年的1904年,虐狗狂魔巴普洛夫的实验证明了过脑子的条件反射的存在。当然这个时候膝跳反射这种不过脑子的反射已经基本研究明白了。
巴普洛夫的实验直到上一章所述赫布时代之后才获得了一个神经学上说得通的模型,来解释具体狗脑子里的东西是怎么工作的。
稍微描述一下巴普洛夫实验,就是给狗腮帮子上扎个窟窿把唾沫导出来,挂着小量瓶来记唾液分泌量。
喂食同时摇铃铛,看到食物分泌唾液。多次之后摇铃铛直接分泌唾液。和上一章说的金鱼喂食敲鱼缸的原理一样。
这个实验好在有对照组,而且分泌唾液并不是高级中枢(涉及意识的)所能控制的行为。
因为不是意识能控制的(我们也不好估算狗的意识到了什么水平,但是我们知道金鱼的大脑=嗅球,整个大脑80%负责嗅觉,功能不超过人脑额叶一小块嗅觉皮质),所以我们可以因此确定条件反射的存在。
这里注意,如果记录的不是唾液分泌而是狗开心的跳了支舞,那么批评家们就会念叨“这是高端的意识在进行更复杂的处理过程的时候的一个表现,而不是机械的条件反射”。
巴普洛夫的实验太好了,好到以至于人们看到了曙光(主要他们看到自己的妈的时候不用再心里别扭了)。
这曙光过于强大导致196X年之前,有一段时间心理学界的主流观点就是:条件反射就是构成所有动物行为的最基本单位,包括人类的思维,都能分解成一条一条的条件反射,其余的都是玄学。
这段时间称为行为学派时期。
但是只用条件反射解决不了原地悟出一个道理的情况。
1938年斯金纳做了个实验叫斯金纳箱。
基本就是一个箱子里放着一个小老鼠,有一个压杆,压一下掉出来一块吃的。
小老鼠一开始不知道这是就餐开关,碰到一次之后认为是偶然现象。碰到多次之后就学会了使用就餐开关来就餐了。
这个对巴普洛夫实验的推广,揭示了一个原理,就是脑子里有设计好的正回馈。比如吃到食物对小白鼠是好的,神经的连接视作【食物↔奖励中枢】,压杆的行为,可能当时小白鼠还在抠脚,食物、抠脚、奖励中枢,三个神经区域同时兴奋,根据Hebb规则,连接加强。
根据实验结果研究者们认为奖励中枢的作用事实上是激励动物去重复行为,所以小鼠会尝试抠脚。
抠脚无效神经抑制,尝试压杆,有效吃饭。
类似这样的过程。
得到重要结论2个:
有练好奖励中枢的刺激,比如吃喝拉撒,挊
奖励中枢连接到行为动作组的时候,激励行为动作组,使你熟练的挊动
然后十几年之后其实Hebb才提了同时兴奋的神经连接更紧密的假说。也就是刚才说的用Hebb原理解释,都是后话。斯金纳自己不好解释,因为Hebb没提出假说。Hebb自己不好解释,因为他的理论当时仅仅还是个假说(没有实验证据)。
赫布 (Hebb) 提出来上述理论的年份是1949年。
1950年图灵发明了图灵测试,发了计算性理论和智能的论文。论文都是严谨的数学证明。
这里插一个概念介绍,叫做图灵完备。
你只需一个逻辑门:非门。作用是你输入>=1V的电,它输出0V,你输入0V的电,它输出+1V。(它是单向的。)然后你把两根线搓起来接上非门,你得到了与非门。
利用这个逻辑门,用且仅用它,你可以搭出当今任何电脑。
arm芯片的计算器,GBA,80x86芯片,AMD64,显卡,一切。
这个原理导致了小朋友们可以在MC里利用红石电路建造科学计算器,这个原理早在图灵时代就被证明了。
要深入学习这是为什么,买“数理逻辑”的书,是一个二级学科,很大。
要了解这些本质是什么,买“群论”相关的书,是抽象代数范畴的三级学科,很难。
引出导论2:所有图灵完备的机器可以互相模拟对方。
导论2告诉了你为什么有人在图形计算器上boot了XP系统,为什么你可以在电脑上玩PS、GBA、街机等等模拟器,为什么你可以使用虚拟机。
因为单个神经的局部特性太简单了,现在电脑都是能模拟的(带非线性变换和内部增益参数的多输出加法器),我们就知道,如果我们知道大脑的线路是怎么接的,我们就保证能在电脑里模拟它(虽然可能效率很低消耗资源很大,但好在电脑10年内进化的效能完爆大脑10亿年内进化的效能)。
理论上可以用数学公式模拟脑子,是一个非常重要的结论。引理彻底扇了玄学家们一个大耳帖子,他们捂着脸醒悟道:原来意识是可能用数学建模的。
上一章我们知道了DNA的委屈导致了它不能一根一根的编织神经网络,而只能给生长中的脑提出一些建议。
那么当代认知心理学的实验,在设计的时候就是在探索这些“建议”
我们讲几个经典例子。
Murdock遗忘实验。(图1)
实验让被试者听30个单词(他们的母语)。然后让他们随便回忆,回忆起来一个算一个。
这个实验不涉及长时记忆,这里的长时记忆指的是那种无限长的记忆,比如“我割过○皮”。
实验结果,就是著名的记忆头尾性。
这个实验的结果不是为了证明“我发现了记忆的头尾性,表扬我”,而是为了帮助人们理解上述Hebb原理无法解释的那种清晰的意识。
清晰的意识,包括“我就是我,我比猩猩聪明,我能在脑子里自言自语”。
现已知前头几个词利用的是LTP,LTP要耗海马回的资源,耗光了就忘了,所以你不能一天背下10W单词,但是你只背下2个的话基本不会忘。
后头的不是什么低阈值的一触即发的神经通路在起作用,而是神经们就循环震荡刺激着彼此,以至于你不会在去拿啤酒的路上忘了自己在做什么(当你忘了的时候你可能用你的车钥匙去开电视)。
上述实验中每个词间隔1秒,总共30秒。前几个词你有机会在心里重复几下,来反复刺激。注意因为上一章中提到了,LTP的建立需要高频强烈刺激,LTP实验中是脑后插管刺激的兔兔。
那么不重复是不是LTP就建立不起来呢?
无标题无名氏No.53115297
2022-10-31(一)23:16:53 ID: A6Gr3rE (PO主)
我们看Peterson实验。
这个实验每次给被试者听3个辅音字母比如bkp。之所以是辅音就是让他们没法把它迅速顺利的读出来,比如sum这种就不好使。
然后给你看完之后瞬间给你一个数比如387,然后让你连续-3,你要迅速对实验员念叨:384,381..378,375..这样。
实验员不告诉你你要算到什么时候。
被试者被分为几组,分别要算3 6 9 12 15 18秒。
3秒组回忆辅音字母组合,80%人回忆对了,6秒组55%,18秒组10%。
这个实验给后来的研究指了一条路:实验结果告诉你,不及时反复刺激(反复在心里念叨),人的记忆力跟金鱼也差不多。这个结果说明哺乳动物和金鱼的差别太像LTP造成的了,所以后来展开了大量关于LTP的研究,试图解释这个实验的结果。
当然这离了解认知的原理还很远。“那么把巴普洛夫实验的研究对象换成人,摇铃铛之前告诉人‘你的饭里有屎’,然后摇铃铛,谁还会分泌唾液啊”有这样的疑问。
涉及到综合信息决策问题,也就是人类最常做的事。
这里介绍知觉整体性试验。(图2)
先给被试者看一个图,图是字符拼的字,80毫秒。第40毫秒的时候语言提示,干扰你。
比如你看到的字符画是个H,提示音给你念S。
被试者需要做的是说出自己听到了什么,图给他的就是干扰。当然这个实验的被试者都是第一次中招的,我们只记录初见杀的人的实验结果。
结论是听到和看到的东西(大字母)一致的情况下,被试反应比较快,不一致的情况下反应比较慢。而且实验结果不受小字母影响。
这个实验让我们可以猜想到,干扰和有效信息需要在脑子里打仗。为什么这么肯定呢,因为它花了时间,而不打仗的情况不需要花额外时间。顺带改变小字母不影响实验结果,也顺道证实了脑子自带视觉纹理滤噪。
我们看到,认知心理学的实验设计基本都是“记住几个”“几个人记住了”“多少秒记住多少个”“需要多少秒”,而不是问被试者“你怎么看”。因为人和其他动物不一样,其他动物人类不保证它们不会作弊,人类实验对象,人们保证他们能作弊。所以你发完论文大伙就会觉得你被你的实验对象涮了。所以实验设计的时候只好让被试者们手忙脚乱。
当然认知心理学还有一大批实验是研究孩子的。
比如给一个三岁萝莉一个棉花糖,告诉她一会不吃就给3个棉花糖,如果忍不住就摇铃开吃。然后实验员出去等15分钟回来,然后,跟踪这些孩子40年,看自控能力强的对他今后学业和社会地位有什么影响。这个实验虽然耗时40年但是被重复过几次结果都一样。
我们不知道这个实验里自控能力差的孩子是不是因为回家之后被家长数落了一通“真没出息”之后失去了信心从此走上了混日子的道路的,所以一般现在认知心理学不做这种实验(当然我们宽容一点的话,可以认为这个实验的结果基本是有效的,但是实验设计不太严谨)。
讲这三个半实验,主要是为了让读者可以对当代认知心理学怎么发展过来,怎么设计令人信服的实验,有个基础认知。这些实验是认知心理学研究成果的很小一部分。
为了防止研究对象作弊,认知心理学经常采取三个方法:
让你的apm超过2000,反应时间不到1/10秒,导致你不知所措被水淹没
研究孩子(他们甚至步骤婴儿眼球动作和眼睛对焦来让实验结果有效,而不是看婴儿反应)
研究猩猩
这种试验方法告诉了小朋友们一个道理,你如果不想跟人抬杠瞎解释,就要拿出别人没法抬杠的证据。
为什么科学界要做的这么绝呢,因为1900年之前抬杠持续了500年,最早中世纪的时候教会和你抬杠,抬不过就下油锅把你炸了,然后你被炸熟了大家就说你不是上帝的好宝宝。科学界已经受够了这种无聊的抬杠,所以认知心理学要发展一种让人尽量无法抬杠的实验设计方法。
但是老的实验设计虽然缺乏严谨性,但是有更好的启发性。新的实验里如果启发性和严谨性兼备,那么给你发诺奖。
认知心理学只是心理学范畴比较新的一个分支学科。心理学分支特别多,比如认知心理学、社会心理学、发展心理学、精神病学、神经心理学、计算心理学。
它们的研究角度可能是行为,统计,生物演化,异常,神经基础,模拟。
许多小朋友对心理学的认识还停留在尼采和弗的时代,这是不行的,也没有心理学家想往这种方向上靠。因为现在学术界基本把弗洛伊德贬的一钱不值。原理很简单,你说了半天,天花乱坠口吐莲花,后来证明你说的不对,不是白搭么。所以现在的心理学界设计实验的时候就往神经学上靠,往Hebb,集体涌现性,突触后膜电紧张性扩布,LTP,神经递质调节上靠,靠到了才有可能对。
因为万剑归宗的事实是,你的心理学理论无论如何,早晚,你得解剖出来并建模,算出来结果和直接观测神经的结果一样,才能算你猜对了。所以大家现在都下意识的避免变成弗洛伊德。
>>下一章开始讲人工智能
无标题无名氏No.53115310
2022-10-31(一)23:17:19 ID: A6Gr3rE (PO主)
这一章谈谈人工智能。
(注意这一章不太谈简史,因为就没什么历史,读者最好有一定编程基础)
人工智能从这学科一出现,就分出来两派人,一派人叫符号派,一派人叫连接派。
前者主张机器人用他们复杂的逻辑程序来思考,和人的思考方法可以完全不同,但也能做到和人类一样或者比人类能做到的更复杂的事。
后者认为在计算机里模拟生物脑,效率更高,更有助于帮助人类了解生物思考的过程。
Hebb时代过后,人工智能领域里的人就已经弄出来了人工神经网络,每个神经的计算都太简单了,他们都是多输入多输出的一个函数。输入是其它神经连接到它树突上的轴突,输出是它连接到其它神经细胞树突上的轴突。
每个轴突上有一个权值,就是它给它刺激对象的刺激强度。树突上则有一个阈值,计算所有刺激的和并进行归一化之后,计算刺激强度能不能达到它的阈值。
一个单向多层的人工神经网络,无论输入输出是什么形式,只要我有一个数据样本集。
比如我的神经网络要控制马里奥进行闯关,那么我把屏幕信号整理一下,输入给神经网络,把输出信号信号整理一下,输出给手柄。这样通过调整神经网络内的权值和阈值,我们可以看看这个神经网络能控制马里奥往前走多少。取走的最远的神经网络,对内部进行微调。重复这个过程多次,神经网络就进化到了一个能通关的水平,马里奥走的距离就是这个自然选择过程中的选择压力。
我们把这个方法叫做遗传算法。
这里给一个例子,主站的[ac1972188]。
这个例子内遗传算法不负责权值的调整,而只负责神经网络拓扑结构的调整。
你仔细看看这个网络进化出的最后一代是怎么工作的,可能能看明白。
当然神经网络不一定是单向的,也不一定是函数形式的。神经网络可以是迭代形式的,震荡形式的,或者元胞自动机(元胞自动机之后讲)。
迭代形式的神经网络的代表是著名的 霍普菲尔德神经网络 (Hopfield Neural Networks)。
这个神经网络制造了和生物脑非常相似的集体涌现性,使得利用它进行图像识别变得非常容易和方便。
震荡形的神经网络的代表是ART神经网络,这个网络的原理类似哺乳动物的脑,对连续和离散问题的分类有这非常好的应用价值,网络分为三个版本ARTI/II/III,分别对应解决不同的问题。
因为198X年,神经网络算法因为有了遗传算法帮忙,显示出无穷的威力,可以开汽车,可以直升机倒立飞,可以控制四轴飞行器抛接倒立摆。又比如Boston Dynamic的机器狗和小人都是用神经网络控制的。
这让符号派的面子挂不住。
然而遗传算法不属于符号派也不属于连结派(其实遗传算法挺复杂的,还要模拟碱基切断重组,但是本文里不赘述,因为可查的参考文献太多)。
遗传算法怎么运用于符号派呢?
有好事者对遗传算法进行了更本质的实现。它把80x86计算机指令集和内存作为一个有可运行规则的宇宙,演化过程就是这个计算机里的一些可以复制自己的程序,并且让环境显得恶劣(机器会随机杀死这些程序),并且这些程序在复制自己的时候会出错。因为空间有限,程序们开始进行格斗进化。
程序叫做Tierra。
很快程序的行为就复杂到人类无法理解了。
这些程序自己进化出的代码是80x86计算机汇编码,就是32位机器,类似什么奔腾处理器,他们的机器码。这些机器码可以翻译成汇编码,人类程序员写的程序是高级语言代码,通过编译器编译成汇编码。这些进化出来的代码更加纯粹,比如它们不像人类程序员一样常常使用循环。机器进化出的代码的循环都不是嵌套的,而更像黑客在病毒入口点附近加入的花指令,是跳来跳去的。所以人类程序员基本读不懂(本来认识汇编的程序员现在就不太好找)。
life.ou.edu/tierra/
上面是这人官网,整套东西可以下载,还有一个视频介绍。
然后讲讲元胞自动机。
元胞自动机的主题比人造灵魂更复杂,可以视为人造宇宙。
元胞自动机可以看作一些小格子,它们有一些功能。
还是举例说明。
康威生命游戏:设一个二维空间无限大,内部都是方形格子,在t+1时刻,视t时刻它相邻8个格子内存活格子的数量决定每个格子是否在t+1时刻存活。
格子周围存活的格子:
少于2个,格子死亡
等于2个,保持不变
等于3个,变成存活的
多于3个,格子死亡
这个系统因此就图灵完备了。
系统内可以创造会复制自身的生命,也可以利用系统来模拟系统自身。
元胞自动机的特点就是可以在不改变自身结构,也不由外界影响来改变自身状态的情况下,在内部完成其他宇宙的能完成的一切。
注意在当代量子力学的研究背景下,现在我们的宇宙已经被证明是一类元胞自动机了。所以宇宙可以被任何图灵机模拟。
但是宇宙的运行模式导致它很快,所以物理学家在研究的则是撕下一小片宇宙来当做计算机使用,也就是量子计算机。
还有一个重要特性就是:元胞自动机没有停机状态。
不论是ART,Hopfield还是多层感知机(MLP,就是马里奥视频里用的那个),神经网络总是有停机状态的。其中不进行迭代的多层感知机甚至不是自动机,而是函数。
必定会进入停机状态的自动机,我们可以把它理解为函数。计量它进入停机状态所花费计算代价的测度就是时间复杂度。对于一个C语言的函数,如果我们把它和它涉及的内存看做一个自动机,我们可以认为return语句就是这个函数的停机状态(假设它内部不做死循环也不引发异常)。
我们多讲讲连结派(这是我的私心导致的)
生物脑内的作为电信号处理部分的神经,我们把它抽象的抽提出来。换句话说我们给脑完美的供血供氧,让它按照它所设计的最佳状态运行,我们切断输入输出(神经的状态是阶跃的,所以我们可以彻底切断输入输出),这样我们就得到了缸中之脑。
我们没有对脑进行插管,也就是没有像黑客帝国里那样给脑输入假的输入信号,也不处理脑的输出信号(动作信号)。我们要观测脑这时候内部还工作不工作,来确定脑是函数还是自动机。
这个实验其实和LTP的实验重复了。实验结果引出重要结论:
脑是元胞自动机而不是函数。这让副现象论显得不那么别扭了——脑活动的数学模型抽提出来之后,发现原来脑在做的是建立一个宇宙,并且在自己的宇宙里按照自己宇宙的规则来演进运算。这和平时用的电脑是一样的,如果电脑不出错,电脑里的运算就不收周围环境的干扰,代价是耗能,烧电,来补负熵。
那么微扰呢?微扰不会引起非线性动力系统后面演进过程的巨大波动么?
能提出这个问题的人,也应该听说过SRB测度。t时刻微扰会彻底影响非线性动力系统t+n时刻的状态,而且不可预测,但不会影响系统的SRB测度。
通俗的讲,脑受到微扰可能会让你的行为变得不一样,比如心血来潮做了芥末年糕,但微扰不会影响你做黑暗料理的概率。
为了帮助对这部分有兴趣的小朋友,我们说说如果想自己做这些实验,这辈子要学什么。
首先你大学二年级的时候会学偏微分方程。只要你是学高数A的理科,你都会学到。如果你是985岛的岛民,你很可能要学荣格卡塔法(Runge-Katta)求微分方程的数值解。如果你部是985,可能你的老师就会偷懒不教,那你就得自学这个了。然后如果你的院系是奇怪的院系,可能你学了vb。这时候建议你学C语言。如果你做想高效的惰性运算(Delegate),你要学C++和OpenCL。现在OpenCL要支持C++了,你将可以在显卡里写随机事件发生器、神经网络和元胞自动机。
下一章会很长,可能要分三部分,第一部分仔细讲讲混沌理论和蝴蝶效应(需要微分方程基础),第二部分讲讲怎么用元胞自动机给脑建模,第三部分讲讲怎么在非希尔伯特空间——赋范混乱不堪而且不连续的拓扑空间内粗略的对SRB测度进行推广(这个空间不会碰巧是整数维度的,所以我们还要介绍豪斯多夫维数来试图对空间的粗糙程度进行计量)。
下一章的第二和第三部分部分是一些后续研究的思路,并没有人发表过相关的文献和研究结果,所以不用去试图查论文了。(第一部分有论文可以查)
无标题无名氏No.53115415
2022-10-31(一)23:20:57 ID: A6Gr3rE (PO主)
第二章:有关强人工智能的思路与方向(原文并没有分的十分细,这是po基于内容以及原po描述的语气进行分章,如果有错误的地方感谢提出)
无标题无名氏No.53115428
2022-10-31(一)23:21:27 ID: A6Gr3rE (PO主)
新的一章篇幅较大,可能会分几期。
第一部分 我们先讲一讲微分方程和通用图灵机状态转移方程之间的共同点:常数时间复杂度不可预测性。
解微分方程的技巧有很多,每一类对应着一类特殊的微分方程。但是就如同已经经过证明的“5次方程没有公式解”这个命题一样,稍微复杂的微分方程,就没法算出解析解了。(可能有的读者说“我们不是能用泰勒展开么?”,但泰勒展开和数值解法是一样要舍弃余项的,好比欧拉法本质上是泰勒展开后保留第一项,RK-N(荣格卡塔-N Runge Katta-N)保留更多项一样。)
我们不做严格证明,用停机问题这个充分条件来试图对“元胞自动机形式的神经网络如何进行建模”的研究范式进行讨论。
引理:停机问题
停机问题描述很简单,就是一段通用图灵机的程序代码(平时的电脑手机都是通用图灵机)交给一个程序,现在求一个程序,把别的程序的代码作为输入,给它阅读,让它输出2个结果,来判断输入的程序代码的最终运行结果是“成功运行结束退出(停机)”还是“陷入一个死循环(你任务管理器里看到的停止响应通常就是程序遇到了死循环而不处理你的用户输入了)”。停机问题就是讨论存不存在这种程序(微软判断不响应其实是在计时,有的程序(比如游戏载入时)看起来不响应了,你给它足够长的时间之后它会续命成功,因为只是经历了比较长时间的循环)。
停机问题被图灵证明是不存在这种高端大气的程序的。证明过程很简单。
注意,这里括号内的输入都是程序代码,而不是程序的运行结果。
假设有这么一个可以判别的程序f(P),P是你输入要检测的程序。
只需构造g,输入也是P,然后在自己程序肚子里先用f(P)看看P停机不停机,停机,他就原地旋转进入死循环,否则他就停机。
那么对于调用f(g)会发生什么呢?假设输出结果是停机,那么g也知道你会输出停机,所以它跟你背着干,所以f打错了,反之亦然。
这很像罗素悖论(理发师悖论“我给每个镇上不自己刮胡子的人刮胡子”)。
这样我们可以得到一个结论:不论是通用图灵机的程序还是微分方程,我们都可以解析的分析其中一部分方程/程序(解析就是一个你可以在常数时间复杂度内求出解的方法),而且我们仅仅可以分析这部分,大部分都解析不了(求不出通用的解析它们的方法)。
而且注意:这个解析不了是经过严格证明的,不是因为人类还过于笨才不会解析。
相似的还有哥德尔不完全性定理,不赘述。
这个结论引发了一个问题:那么不能解析是不是就不能研究了呢(或者是不是或许人脑就是不可解析的,所以也是不可观测和度量的呢)?
这就要引出本章的主题,混沌理论了——我们如何对蝴蝶效应进行观测和度量。
比如我们有一个双摆系统(图是动力学方程,推导看下面链接)。
http://scienceworld.wolfram.com/physics/DoublePendulum.html
双摆系统是一个非线性动力系统,任何初始状态的微扰动,存在一个时间,在这个时间后微扰动带来的结果不是后续行为的微差异(单摆则是固定的相位差),而是使得双摆系统后续行为变得完全不同。
那么我们如何对这个系统进行度量呢?
我们取一些描述运动的量,并且在空间中绘制出这些量变化的路径。这是一个偏微分初值问题。我们会发现,初值的微扰并不会影响后续进程中路径的分部。两个不同路径经过足够长时间的运行后所覆盖的图形是几乎一样的。当初始状态差异巨大时,图形有时会发生突变。
假设图形是3维的,我们取2个圆形,我们可以计算通过2个圆形的路径通量的比。
我们发现初始状态微扰并不会影响后续路径穿过某一区域的几率。
(如果之前没有了解这段非常难理解,所以下面附上数学漫步CHAOS帮助理解,默认是中文,里头的链是优酷的,如果不想可以选择其他语言。片子里的例子不是双摆,但原理是一样的,如果看不懂,前面还有几集,在章节里可以选择)
www.chaos-math.org/zh-hans/di-ba-zhang-tong-ji-xue
我们知道微分方程和自动机同样可以产生不可精确预测的系统(蝴蝶效应的系统),那么我们能不能来利用类似的方法研究自动机呢?
由于学术界目前常常讨论的神经网络是函数式的,函数式的神经网络总是要收敛的,所以他们类似阻尼摆方程,对上述统计方法的SRB测度产生了巨大阻碍。所以首先我们需要把学术界现在常见的函数式神经网络模型改造成元胞自动机式的。
本章下一部分开始讨论如何利用元胞自动机对神经网络进行简单的模拟。
本章第三部分讨论如何对这种神经网络模拟方式建立测度并进行计量。
最后讨论大脑可猜想的运行原理,并讨论意识产生的可能机理。