回应模式 - No.53115246


No.53115246 - 科学


无标题意识,科学唯一无法企及的领域No.53115246 返回主串

2022-10-31(一)23:14:53 ID:A6Gr3rE 回应

在曾经的a岛中,推理版出现了一条串"意识,科学唯一无法企及的领域",一位a岛前辈为了驳斥这种论调,在此串中进行了如下的科普。

前辈所科普涉猎之广,内容之深刻,为搬运者带来了相当程度的精神震撼,以及带来了许多方向性的人生选择。

由于原a岛的沉没,此串已经不可考,万幸的是,笔者于过去因学习方向的原因,保存了一部分内容,秉承互联网精神,也希望怀有相同理想或志向的同志在此汲取养分,故在原文基础上稍微排版,并在此重新贴出。

无标题无名氏No.53115547

2022-10-31(一)23:26:35 ID: A6Gr3rE (PO主)

有两个可以解释这个问题的假说,前提都是一般的刺激不足以让大脑的任何神经联系达到阈值,而传播这个有效联想来唤醒概念。

第一个是通过反复刺激来进行积累,从而利用电紧张性扩布的积累来找到Hebb联结最紧密的通路。

第二个我们假设脑波是一种受迫行为。假设脑波是大脑内某个自带设备对整个大脑的一个强迫性的广播,来节律性的改变整个大脑内所有(或者需要的)神经细胞的基础电位(这等价于为整个大脑的所有神经的阈值乘sin(wt))。按照前面的前提,大脑这么做是为了通过渐渐增加脑波的振幅来筛选出最容易达到阈值的神经联系。

我们可以找到两个证据(它们只能给我们自信而不能说服我们):

1、进行逻辑思维和进行发散思维的时候,进行后者时被试者使用的脑波振幅更大频率更低,接近于α波(βαθδ波振幅依次增加,频率依次降低,进行强逻辑思维的时候,有学者把那个高频细密的脑波叫做γ波),做梦时候脑波处于α和θ波范围内,而梦里的逻辑感人(如果假说正确,这两者就存在因果关系),而昏迷时和婴儿深睡眠时才会出现δ波,δ波出现时观测不到任何思维活动(可能大脑折返于全记混和全忘记之间)。

2、幸好不光人类有脑波。切断其他动物的丘脑,大脑的脑波就消失了,但丘脑内还能检测到脑波,这进一步暗示,对于大脑皮层,脑波很可能是受迫性的,而不是自发的(也就是说脑波不是思维活动的副产品,而是思维活动的手段)。

如何描述这种可能的联结有多少呢?每个联结都要有代表元,那么组合的幂集的组合的幂集...太多了。这些联结的可能性有没有一个精确的数学表述呢?

幸好冯·诺依曼回答过这个问题(虽然他不是为此回答的),我们看看冯·诺依曼全集(Von Neumann universe)。

这个集合定义直接放在图3、4里了。

(摘自英文维基百科条目“Von Neumann universe”)

集合同时定义了序数,而集合内的序数,就是我们的神经网络里的输入采样,我们可以把输入任意一一映射给它(我们不需要考虑顺序,随便映射就行,因为电子皮层下面是对称的)。

这样我们的神经就连接好了,它的模型不光有了元胞自动机的单元——神经元,也有了结构。

虽然一些概念可以存储与其他中枢,但这个组合结构依旧过大以至于我们的电脑硬盘放不下。

我们这里介绍一个方法来解决这个问题。如果一个空白的没有学习过东西的大脑,它的神经权值必定是不存储信息的(既然硬盘存不下,基因也存不下)。而大量的神经纤维在生物的一生中是用不上的(事实上7岁之前这些细胞和轴突都在疯狂的凋亡和猥琐),大脑之所以采取烧断的方法,是因为它做不到动态生成(试想两个神经细胞同时兴奋了,但它们没有相连,按照Hebb规则,它们原地长出了两条大胳膊拉在了一起,并且手中长出了新的细胞作为联结代表元)。所以大脑只能提前覆盖好大部分可能的组合(并且有重复,但由于大部分联结在本宇宙/本维度内不可能采到样,所以大脑省下了好多资源,但即使如此,还得有好多在出生之后根据对世界的观察来过滤舍弃掉。)

不难想象这个解决方法是什么。当两个细胞同时兴奋时,我们可以做到原地生成联结和联结代表元(先检测是否已经生成过了,利用哈希表之类的算法),因为我们用的是电脑。但是这么做可能会出现兴奋的无限循环,导致大脑的深度无限增加。这时,冯诺依曼全集的定义就显得意义突出:它可以帮我们检测并截止这类动态联结。

对于脑波的模拟,电脑就更是大显身手了,我们甚至不需要发送脑波的广播系统(树状的神经),我们只需把阈值减去,或者把静息电位加上一个动态全局常数就可以了,尤其每个细胞都可以引用静息电位而不是真正的保存一个静息电位,这使得我们模拟的系统里,静息电位也可以是全局动态甚至局部动态的,在电脑里我们有太多人脑的结构不具备的条件。

这样我们的神经网络结构就是动态的,没有学习任何东西的电子脑就是不占用空间的。

但注意我们的全部输入必须都是离散采样。也就是说,不能输入类似音波的东西,但输入可以有时序,因为我们的神经网络是自动机而不是函数。

输入音波的时候,我们要先对音波进行傅里叶变换,按照频率采样后才能输入给神经网络,如果对波形进行离散采样,就失去意义了。我们最好也对震动能量进行采样后同时输入给神经网络。(就像人耳做的一样,耳蜗的作用就是对声波进行傅里叶变换,但人类有了fft算法就几乎永远不可能像大自然一样用一个机械的驻波共振结构来解决傅里叶变换了,因为这个机械过于精密,无法维修)

下面补充一些证据,注意本部分的所有证据都是间接证据,也就是说我们的模型始终都是假说,出于人道主义和生物伦理学家那张喂不饱的嘴,这个学科的现状就是这么的二泉映月。

无标题无名氏No.53115567

2022-10-31(一)23:27:09 ID: A6Gr3rE (PO主)

太长分部分

模型里我们没有讨论三个人类认知的重要属性,创造性,动机和逻辑。

我们先来讨论创造性。

如果上面对于脑波的假说正确,在发散思维的过程中,我们的脑波区域更大幅度,更缓慢。这已经得到实验证实了,但这个实验本身没有说服力,因为实验对象是人,而且我们没法保证他们不作弊(可能他们练习过脑波控制,而且能猜出实验者的目的呢?)。

那么我们怎么筛选我们脑子里冒出的主意呢?

我们可以给错误或不需要的想法打上长时程的抑制信号(LTD),然后继续α大波累加,来唤醒联结更松散的联想。重复这个过程,我们可以得到一些好主意,并且得到线索,之后换β波逻辑推理,无效信息打上抑制,这个过程交替就行了。

这些长时程信号的兴奋/抑制控制连接到了海马回。

我们再讨论动机。

动机和能动性几乎是绑定的。根据进化论我们没有任何理由相信一个没有能动性的生物可以产生动机,这也是解释了植物为何永远进化不出神经系统。但这个解释不令人信服,所以我们提及海鞘这种谐星生物。海鞘是生物的希望,动物界的灯塔,它和脊索动物门最早的祖先是近亲。它曾经是最早的能游泳的鱼形生物,然后它游到远方,找到一块岩石,一口嘬上去,开始变形,最后变成了一块藤壶一样的滤食性木桩。它是世界上唯一一种能变成藤壶的脊索动物。观察它的神经系统发育过程,足以让我们相信动机和能动性是绑定的,动机是对能动性的适应性进化。(它属于尾索动物亚门)

动机很可能是逻辑得以进化出的前提。

动物在趋利避害的进化过程中,更多的时候不去冒险比向食物前进/逃跑更重要。包括人类的大脑在内,动物进化了丰富的抑制系统,而且有几种专门负责抑制的神经递质和突触。

在很早之前,大脑内就进化出了负责激励和抑制的代表元,它们就是感情和好恶的本质。由于它们太老,所以他们并不在第四代新皮质之内,而是塞在了大脑基底核,也就是离大脑皮层最远的核心部分。可能因为它们非常重要,所以在进化的历史长河中,它们从头到尾都得以保留。

它们有与感觉采样、联结代表元相连的结构,来对它们进行倾向性关联。比如一个事物给人的印象,包括恐惧,喜爱,等等,并不是是类似“关系”“结构”的抽象概念,而直接和基底核的不同感情中枢有着不同的连结权值,构成了人类也不得不存在的趋利避害,和价值观。如果没有这个核心保障,所有人随时可能自杀。这套核心保障是是基因硬性实现的结构性功能,比如死和性,我们如果不手动的在模拟系统中实现它们,而交给遗传算法,遗传算法也会实现它们中的大部分,只要自然选择的选择压力存在,这种自激励都会发生。

同样社会性动物趋同也是这类进化的结果(不去标新立异的摸老虎屁股,因为这么做的个体被老虎淘汰了)。

我们猜想价值观之类的无关逻辑的基本认识,是基底核与概念代表元(神经或神经簇)的联系,包括具体行为,理念,任何代表元都能与基底核相连,即使最开始的连接是间接的,但通过Hebb,A-B,B-C,A-B-C,A-C的短接方式,最终可以变成直连的。(但这个假设需要一个前提,就是保证每个概念代表元都有一个通向基底核的直接或间接通路)这种直连的短接方式,有助于动物对利害的快速响应。如果神经进行整波,筛选,可能导致动物错过逃生/摄食/繁殖机会。

如果这个假设成立,那么我们假设人类对事物的直观认识/或者不含逻辑的主观感受,实际上是一种基底核的反应,是基底核广播给全脑的状态。

现在我们理清了一条路线:

感受器→感觉皮层→(皮层下层→中枢间神经流→基底核→中枢间神经流→皮层下层)→运动皮层→效应器

括号内的部分可能重复多次。

最后大胆的谈谈对逻辑的可能形成过程的猜想(毫无依据一派胡言,因为我们脱离实证主义太久了)。

逻辑的形成几乎必须通过语言中枢和基底核相配合,否则我想不出其他的实现手段。

我们猜想逻辑是上面过程中括号内重复过程,来通过反复的强烈抑制和激励,把平时生物常用的倾向性叠加运算给模拟成二值的。

逻辑运算的常见二元运算可以转化成代表元的,二元运算实际上是语言中枢内代表元当了占位符。而它们又有确实的代表元(神经簇和这个逻辑谓词/命题一一映射),从而Hebb构造出一组代表元相互连接,比如{A,B,C}分别代表“甲”“乙”“→”(推出),他们很可能就存在于语言中枢里(也就是不存在没有名字,也没有含义,但代表联结关系的神经代表元,抽象概念直接挂在自然语言的词上。)

然而我们发现自然语言的序跟不是时序,跟时间没有关系。所以推测自然语言在大脑内像动机一样,有这结构性实现。

补充证据失语症。

分为感觉性失语,运动型失语等等。失语不是器官结构性损坏或者发声障碍,而是可以正常发声,但无法组成正常自然语言,原因几乎全部是脑受损。

感觉性失语的患者,说话时命名和找词有明显障碍。严重的彻底字聋,听不懂人说话。对实验者提出的问题常常滔滔不绝,但答非所问,发音清晰语调正确但缺乏实质词。

猜测患者保留了正常的语言组织功能的神经结构,失去了词到概念代表元的神经连接映射。

运动性失语的患者,同样找词困难,说话间断,缺乏语义连接词,以电报式表达。口语理解相对好,但对关系表述理解困难,比如“骆驼比马大”,“A向B借了5毛”。

猜测患者保留了正常的词到概念代表元的的神经连接映射,而是去了语言组织功能的神经结构。

进一步暗示了逻辑和语言中枢之间的关系。也暗示了人类的逻辑思维突出于所有其他动物的原因。语言中枢的结构性(基因硬性规定的结构)神经组织确实存在。

它的进一步实现猜测可能是一个类似浦肯野纤维的周期性同步器,相位的代表元和词相连。也可能是一个单向的顺序传导,下一级抑制上一级。反正需要实现一个偏序关系的映射。

单提,自我意识完全可以用上述模型解释。然而值得注意的是,自我意识很可能和对其他客体的认知没有任何区别,以至于进化亲缘关系微弱的动物都可能产生自我意识,比如大象和猩猩。测试自我意识的实验如下:

把一种动物分两组,隔离,一组生活区内放一面镜子,另一组不放。经过几周后,把两组动物麻麻,涂上红嘴唇。

然后两组动物都给镜子。如果提前见过镜子的动物去擦自己的红嘴唇,而没见过镜子的不去擦(它第一次照镜子,以为本来自己就是红嘴唇),那么说明动物有自我意识。

猩猩和大象等动物都有自我意识(大象只能在脑门上画个红嘴唇,会用鼻子去蹭)。

篇幅太长再分一部分,下部分讲计量和数学模型。

无标题无名氏No.53115602

2022-10-31(一)23:28:07 ID: A6Gr3rE (PO主)

接上篇,正文部分最后一章,讲讲怎么对之前篇幅中提到的脑神经系统内的状态进行计量和建模。

首先强调一遍这里的目的,我们并不是要对神经网络结构进行计量和建模,因为前文讲了网络怎么通过超限构造法这个数学上构造全集的方法来保证覆盖所有输入的组合的。

虽然你可以用遗传算法来优化这个网络的局部特性,但优化后它依旧保持了它工作的基本模式,就是利用微弱全局刺激和输入信号来构造维持比较久的当前状态(你感受到的意识),然后当前状态作为向下一个状态转移的条件,和当前输入共同作用。

这一章我们讨论,如何对神经看似杂乱的状态转移建立计量,并且针对某个已确定的“神经网络结构和记忆来”来进行预测。(也就是说我们不研究在遗传算法中正在进化着的网络,也不研究正在学习着外部环境中信息的网络,虽然它们也很重要,但研究它们的方法和这一章的内容是共通的)

下面在强调一下脑子里时序可能的表示方法。

时序,而且因为上述结构的特点,时序代表元可以和时序产生的片段进行互联而迭代,我们就可以利用一对有序的概念构造出无限长度的时序。数论上成为有序偶,有序偶大概就是{{x,y},x}这样的集合。或者别的定义方法,你随便怎么定义,然后你令它等价于(x,y)。这时候你惊奇的发现你利用元素间无偏序关系的集合构造了一对有序的二元组。当然它还可以被推广为偏序集。

之前我们讲到了混沌现象的研究方法。我们假设我们看到了“图1”中的一个轨迹。因为混沌系统对初始条件的微小差异有敏感性,我们就没法精确预测轨迹,这时,我们退而求其次,计算整个一些其他统计学属性,比如我们利用球体A把空间分成两个部分(球里和球外),我们可以统计一段时间T内,轨迹处于球A内所占的时间t,我们计算t/T。当T→∞的时候,我们得到了一个固定的测度m = t/T,它和你取的初始条件无关。当然我们可以跟踪轨迹,每当它通过球体(邻域ABC)中的一个的时候,我们记录下A、B或者C,这样我们得到一个序列。它具有随机性,可能是AABCCBCABCCBACBBCBCABCBCAABC,我们取序列长度L,计算其中"BC"出现的次数n,令L→∞,我们就得到测度e = n/L。

那么要计算这些测度,对于一个混沌动力系统的某一瞬间,我们就需要函数b = f(P,τ),函数输入P代表当前时刻状态沿着轨迹运行到了空间中的哪一点P,输入τ代表我们所规定的邻域(比如图1中的那个球体A),函数输出给我们b,它的取值是0或者1,代表在不在邻域内。

对于动力系统这太简单,我们计算欧氏距离d=√((X-Xo)²+(Y-Yo)²+(Z-Zo)²),它就是勾股定理。τ的半径是R,f于是做这件事,如果d > 0输出0,否则输出1。

由于是不可预测的系统,我们就无法得到精确的测度,但是我们通过数值计算模拟,就可以尽量长的模拟这个过程。我们的测度随着我们采样的增加逐渐趋于稳定。就和掷硬币一样,掷硬币的次数越多概率越趋近于50%。比如我们要精度精确到1%,那么当测度的波动范围不超出1%范围的时候,我们就不用继续模拟系统了。

到此,要建立测度我们就要有3个条件。

系统可以模拟并且运行(对物理系统我们有微分方程数值解法)
我们可以计算出距离(距离是范数的一个实例)
系统存在测度(不存在测度的系统有好多种,但它们通常很好理解,比如阻尼摆,它会停机,又或者俄罗斯轮盘赌,它是古典概型的)
对于神经网络我们怎么理解呢,首先它是在计算机里模拟的。我们知道计算机是二值的,那么网络的状态总数肯定是有限的。(比如你的内存有4G,那么你内存里的数据有2^8^4G种组合状态(我们忽略寄存器和程序计数器EIP))

那么我们可以建立一个空间R(多少维度,是平滑的还是有张量的,还是支离破碎的,还是和面条一样的,我们现在不知道)把网络的每种状态对应为空间中的一个点(我们把空间称为神经网络的状态空间,其实它并没有2^8^4G这么大,因为大部分状态程序是永远不会经过的)

由于网络可以运行,它的运行过程现在映射成了空间R内的一个轨迹。

现在我们讨论条件。

1、本来就做得到。3、我们相信它有测度,我们试了才能知道。

然后问题就是2。

我们知道邻域包含关系判别函数f的两个输入P和τ,其实可以看作P,Po和R。

我们计算范数||(P-Po)|| > R这个命题就好了。

我们现在需要做的就是构造一个函数d = g(P, Po),输入是状态空间内两个点(换句话说就是输入两个神经网络的瞬时状态),输出是他们在状态空间内的范数(理解为距离)d。

再换言之,我们需要一个函数g(α,β),来比较神经网络2个任意状态的相似程度,并且把相似程度描述为一个标量d。

这个函数我们有许多种方法得到(但它们效果不一定会很好)。一筹莫展的情况下,由于我们已知在很短的时间内,神经网络自然演进的两个状态距离很小。利用这个作为激励,我们可以用遗传算法训练一个小的神经网络,来作为我们要研究的神经网络的范数公式,以此帮我们求得我们要研究的神经网络两个状态间的相似程度。

当然计算相似度不必大动干戈的用一个神经网络,因为它的效果不一定比传统的机械比较好。

当一个神经网络没学习过任何东西的时候,无输入,给出全局刺激(模拟脑波),神经网络里没有任何一个神经响应。

那么这个空间就有点抽象,我们想象一个宇宙空间,每个星球是一个点,其他星球都在以光速远离你,那么你无法到达任何一个其他星球了。

当网络学习了一些东西的时候,状态之间就可以互相转化了。

这时候我们找一个时间点,把神经网络存档下来(就好像存了一个即时档),然后从这里对神经网络里神经的电压给一些微扰,然后继续模拟网络后续变化状态。

我们研究上述计量。

无标题无名氏No.53115611

2022-10-31(一)23:28:24 ID: A6Gr3rE (PO主)

通过这些计量,我们可以反推出神经网络的状态可以被数学描述成什么样的空间(或者说是点集)。如果我们侥幸可以用一个比如某个黎曼流形之类的数学模型近似的描述这个空间的性质,那么我们在脑神经学上的研究就有了巨大的突破。(我对这个不抱太大希望,估计还是豪斯多夫维数(“图3”)是无理数的分形空间,但统计学自相似八成存在)

更好的消息是我们现在有了能检测葡糖分解中间产物的核磁共振,我们就能采集到人脑的这些性质了。如果我们可以计算人脑状态间的相似度,我们就可以用混沌动力学的度量方法来研究和拟合人脑的状态空间了。(通过这些测度我们甚至有希望把人脑的状态变化拟合成向量场)

但坏消息是我们没法对人脑存即时档,而在机器上计算这些又会消耗大量的计算资源,好在我们还不至于承受不了,何况还有不着调的摩尔定律。

另一个令人激动的课题就是,我们知道一开始的那种任意两点间距离都是∞的状态空间(这种无助还可以想象成你是在无风无重力的宇宙空间内的一个尴尬的孢子,虽然星球你都看得见,但你没法飘过去,它和上述描述是等价的),通过对学习过程进行连续采样,我们有望看到学习过程中,神经网络状态空间的结构是如何变化的。

如果希望现在利用已有知识对这个空间的变化过程有个大概了解,我们发现对于两个Hebb学习的关联概念,它们的距离被拉进了。

我们更加简化的想象一个拥有超多褶皱的,弹力无限好的橡皮膜上的两点A、B被你拉近了,B、C也被你拉进了,A、C却离的还很远,但是由于橡皮膜的张力,A、C也在渐渐靠近,这就是前两张提到的集体涌现性的传递。

由于它弹力无限好,任何褶皱可以用手挊平,然后整张缩缩缩,缩成一个硬币大小的扁平小片,虽然一开始它有富士山那么大。这张褶皱橡皮膜上的空间可能是诡异的,因为神经网络学习过程中在橡皮膜上挊出了好多平滑的通道,而如果走褶子,翻山越岭的距离就常常趋近于∞,但这张橡皮膜上经常会出现“图2”中的两边之和小于第三边三角形(这就是黎曼几何研究的拿手好戏,看来他不光能助广义相对论一臂之力)

概念组也是大脑内的状态,我们可以视这个橡皮膜是动态的,我们也可以把所有橡皮膜的集合,一个内部不太光滑的三维空间(它是四维不规则物体上的三维表面,我常常把它形象的想成虫师里的虚茧内的空间,它不符合希尔伯特空间的规则,却有度量)

当然上面的二维和三维都是比喻,实际上维数比这高的多,而且不是整数。好在有了豪斯多夫维数,所以理论上对统计学分形的不规则赋范空间,我们可以推广一套可以计算统计自相似的分形的豪斯多夫维数的计算方法,然后计算神经网络内构造的状态空间的维度。

对豪斯多夫维数的数学推广我也没读过什么文献,这方面数学基础不好还需要学习。

我们感性的知道褶皱越细致的海岸线的豪斯多夫维数越高,而我们知道Hebb等等许多大脑对神经网络的调整,都是在挊平这个拓扑流形。

最后我们可以大胆的(不举证的)猜想:

每个神经网络状态空间的拓扑流形的豪斯多夫维数有一个值k,刚出生的小孩,这个值是∞,对于雨人那种超强记忆智力障碍,他的这个值一生不断的逼近0附近的一个值。而正常人的大脑在做的事就是让这个值无限逼近k(雨人的遗传病让他的K比常人的低)。决定这个k的条件是你处在什么样的宇宙,如果你生在电子世界(你是个AI,你的世界是模拟的,比如重力永远朝下),你的k就和人类不同,但有可能有一种神经网络的组织方法,可以对不同的世界都找到它们相应的k,而通过从世界中获取负熵,意识尽量逼近k,到达k后你就到达了你所在物种的“全知全能”,可惜猫的全知全能无法使它理解镜子中的自己。

我们还需要另一个计量p(f)来描述,控制变量的在某个宇宙(比如我们这个宇宙)之中,一种神经网络收敛到k之后能对这个宇宙理解到什么程度。(蚯蚓的神经网络快速的下降到0附近,导致它的空间平整到可以用一些简单数学模型描述,人脑长了1000亿×1000数量级个神经突触,配合它们的结构,保证了初始下降率比较慢,以至于逼近k的过程中不会人脑可以承受神经不够带来的精度损失)

这个量p(f)输入一个物种的智能极限,输出一个标量,来对物种间的智能进行横向比较。

不知道这个值是否就是网络状态空间的豪斯多夫维数。

我们还需要研究,为什么大脑进化出的神经权值调整规则可以让我们通过学习和与世界交互去逼近k,而不是从∞滑滑梯到0变成弱智,为什么每个动物的脑都有这个功能,它的数学本质是什么,分子生物学上怎么实现。

*这些假说包含了我的许多个人猜想,在没严谨举证之前,每个人都不应该相信它们(除非你能做实验举证)

然而最开始的提到的,“科学唯一无法企及”的意识,在有了一些基础知识、数学模型和度量方法之后变得不再遥不可及了,但在这条路上,我们依旧看到荆棘密布。

(正文结束)

无标题无名氏No.53115881

2022-10-31(一)23:37:27 ID: A6Gr3rE (PO主)

到这里为止就是过去po爬串收集到的原po进行的科普所有的正文了,原po也在原串中进行了十分多相关系统的回复,但是很可惜,当时po并没有把全串下载下来。最近整理笔记突然发现曾经有po认为的精华部分的记录,特此重新将其发出,也希望有岛民能像po一样受到其中的启发,在此再次感谢写下科普的大佬po!