回应模式 - No.53115246


No.53115246 - 科学


无标题意识,科学唯一无法企及的领域No.53115246 只看PO

2022-10-31(一)23:14:53 ID:A6Gr3rE 回应

在曾经的a岛中,推理版出现了一条串"意识,科学唯一无法企及的领域",一位a岛前辈为了驳斥这种论调,在此串中进行了如下的科普。

前辈所科普涉猎之广,内容之深刻,为搬运者带来了相当程度的精神震撼,以及带来了许多方向性的人生选择。

由于原a岛的沉没,此串已经不可考,万幸的是,笔者于过去因学习方向的原因,保存了一部分内容,秉承互联网精神,也希望怀有相同理想或志向的同志在此汲取养分,故在原文基础上稍微排版,并在此重新贴出。

无标题无名氏No.53115515

2022-10-31(一)23:25:30 ID: A6Gr3rE (PO主)

本章主题就是想办法用元胞自动机模拟一个简单的生物脑神经网络。

首先我们编程模拟单个细胞。但更首先,我们要明白怎么归约一个复杂的系统。

比如我们有一位游泳教练,他只要不知所措,就必然会被水淹没,然后必然祝你身体健康,而我们又假设由他组成的系统内,除他自身外,没有任何东西会被“被水淹没”这个状态影响,我们就可以把“不知所措→被水淹没→祝你身体健康”这个过程简化成“不知所措→祝你身体健康”。箭头是一阶逻辑的推出符号。

回到我们的系统我们首先做假设。首先我们知道,脑内除去血管和其他结缔组织主要成分胶质细胞神经细胞施万细胞。胶质细胞负责过滤养分,施万细胞负责给轴突传到加速/防漏电/支撑/保证个别情况下轴突再生,而神经细胞负责主要神经计算工作,所以我们建模的时候就可以忽略掉前这些后勤部分。当然这不是严谨的忽略,但愿它不会造成令人失望的影响(我们希望得到抽象的数学模型)。我们去除细胞内的基本生命活动,假设它们对电生理活动没什么重要影响。

重要的,我们去除对轴丘之前的电紧张性扩布(弱到没能造成动作电位的电刺激)的模拟,而把其它神经细胞传入信号假设为累加。(这样假设真的很危险也没什么道理,但是为了节省计算资源我们不得不这么做。但如果用遗传算法优化,幸好即使出现特殊情况,遗传算法也可以用多个细胞来常识替代一个用到这种功能的细胞。)

老式的神经网络模型因为可以看作函数模型,它就可以比喻为一个蚯蚓。通过激光带来的蚯蚓疼痛作为输入,蚯蚓被烧焦所花的时间长短作为选择压力,用遗传算法来优化一个老的MLP神经网控制蚯蚓活动,结果看起来就是“左边疼往右拐,右边疼往左拐”。但是如果激光有周期性,围着蚯蚓打转,蚯蚓无法预判激光,因为函数内部不能存储状态。这时候遗传算法也显得无能为力。

改造成元胞自动机,给了蚯蚓预判激光的可能性。至少通过遗传算法,它可以对周期性的激光特化出周期性的神经网络,但对随机的激光不行,就像真实世界里的蚯蚓一样。

这个简单的功能突破就是我们改造这个神经网络系统的目的,当然我们可能还要建立对LTP和超长期记忆的分子后膜钙离子通道变化进行建模模拟,加到我们神经元的模型里,但是至少最前期,我们要保证神经网络的模型至少是个元胞自动机模型而不是一个输入输出一对一的函数。(f(123)=234,函数式神经网络下次f(123)=234,但是元胞自动机神经网络下次输入可能f(123)=345)

我们开始研究单个神经。

稍微介绍神经细胞的行为。平时神经细胞都保持在静息电位下,静息电位相对细胞膜内负外正的,我们贴着细胞膜给膜外一个小的负电刺激,可以看到一个电紧张性扩布(电信号传导了一个小范围之后萎了),并且假设这个电刺激是0.7。我们给一个高的电刺激比如假设它是1.0,刚好达到了离子通道的阈值,我们发现离子通道打开钠离子内流瞬间细胞膜上局部电平衡变成内正外负,然后钾离子马上外流再把平衡恢复到之前的内负外正。电位上观测到一个高高突起的正电峰值,这个峰值我们称作超射。这个过程马上引发周围的离子通道连锁反应,这个连锁反应我们称为去极化。这个电位传播过程称为动作电位。超射去极化动作电位这三个词基本可以理解成一样的,虽然生物学上它们有些许差异,比如局部零星离子通道漏电的情况,但是我们人工神经网络建模的时候离子通道被归约了,成了简单的数学模型。

这个过程内再刺激细胞细胞不响应(离子通道拒绝响应),这段时间称作绝对不应期。

然后细胞发现漏钾钠了,钠钾泵开始工作,每次烧一个ATP运输3个Na+出去和2个K+进来,我们知道Na+和K+带的电基本一样,所以泵工作的这段时间内,因为出去的正电比较多,所以膜内比静息电位的电压还要低,导致你给1.0的刺激,细胞不响应了。你给1.2的可能它就会响应,这段时间叫做相对不应期。

我们如果挨得特别近,用两个装着电解质微玻璃管给两个0.7的电,我们可以测到电紧张性扩布相撞的时候会进行线性叠加。如果超过了1.0,则也会触发动作电位,这也是老的MLP(多层感知机)这类神经网的基本工作原理。

无论哪种情况,只要引发了动作电位,动作电位都会传递到神经细胞伸出的每一根轴突末端,突触,来把刺激传递给下一个细胞。但是突触传递多大的刺激,是突触钦定的,当然神经细胞的意见也是很重要的,因为没有动作电位刺激就是0,发生动作电位的时候,突触传递给下一个细胞的刺激基本只和它的接收者后膜上长了多少个接受神经递质的受体有关系(受体多和少,重复刺激之后受体可能变多。)

我们只考虑化学突触不考虑电突触,我们假设电突触就是中继站(虽然这不公平也不合理)。

先做一些假设:

假设就一个后膜,所有输入信号的突触都插在这一个后膜上。

假设单个细胞内的神经信号传到是瞬间的,没有相位差,整个细胞电位处处相等。

假设神经细胞间传递信号的权值由前膜决定,虽然实际多由后膜决定,但这么假设效果等价。

单个神经的模型基本可以抽象出几个值。

细胞们叫做C[i]

当前电位e
后膜阈值ζ (注:很遗憾,搬运者在此复制时未找到3.)
绝对不应期离结束还有多久t(0表示不在不应期内)
突触目的地{C[n]...C[m]}(目标都是别的细胞)
每个突触权值{W[n]...W[m]}(买个都和上面对应)
然后你还需要一段对应这个数据结构的程序(在C++里是成员函数),来计算当前状态的细胞下一时刻会转移到哪个状态。这你可以用状态转移方程/状态转移矩阵/凭感觉手挊代码来解决,不难解决,但你得保留一些参数以后交给遗传算法去优化。

同时为了保证程序运行时程序处理顺序无关性(模拟并行,比如同一时间你是先减对面护甲后打中还是先打中后减对面护甲,如果随机,会导致魔兽replay失效),我们还给每个神经制作一个小信箱,这一步他们送信,下一步才能看上一步的时候别的细胞给他们发过来的信(电信号)。这样顺序无关,细胞同步了。如果你的信号设计为信号5你就给e+5,信号8就给e+8,那么加法符合交换律,你则不需要给信件排序,否则在神经细胞处理信号前,你可能还需要给信件排序。

这是一个复杂而漫长的工程,但如果你翻开神经学家的论文向大自然抄袭,你就能获得比较好的初始数据,再交给遗传算法,遗传算法就不用再模拟30亿年的进化历史来大规模调整这些参数了了。

然后你可以给你的神经细胞增加模拟的LTP,增加模拟的权值调整(Hebb或者其他的,调整的幅度你可以通过往上面模型内添加参数来控制,并且对这些数据和模拟结果做实验)。

你甚至可以用物理引擎模拟一个世界然后制造格斗进化的环境,直到你模拟世界里的生物/小机器人进化成武术大师/贝爷。根据这些,你可以衡量你的神经网络模型的性能。

你也可以把它们应用于控制系统,比如控制一两独轮车或者一个仿生鸟,先在仿真环境中利用遗传算法优化,再实作。

但遗传算法就算进化出来了人类水平的大脑,对着一堆凌乱的结构数据和权值,人们还是摸不着头脑,但是好在,如果这可行,我们至少可以解剖它了,因为它是一段程序(如果总没有人常识人体实验或者表现出兴趣,生物伦理学家就失业)。

或者你可以按照脑神经学的书手写规则,而不是选择交给遗传算法,来获得对脑的运行机理的更直观感受和理解。

本章下一部分我们讲大脑神经连接的一些可能规则和原理,猜想它们如何处理我们观测到的信息,以及我们如何在这些看似杂乱无章的模拟神经活动中建立度量方法来统计测度建立模型假说,如何理解大脑工作方式背后的数学机理。

无标题无名氏No.53115535

2022-10-31(一)23:26:18 ID: A6Gr3rE (PO主)

接上一部分。

上面的回答中提到了层展理论。我们这一部分要做的就是在上一部分所建立的模型的宏观尺度下通过建立测度和度量方法来讨论搭建适用于神经网络宏观层面的观测手段和理论模型。

重申一遍上一部分和本部分(第四章第2、3部分)为纯讨论,而非已有成熟理论,所以不提供参考文献。这两部分的内容大多是个人观点、模型和研究手段,不能保证正确性和充足的证据。

我们首先重新观察上一部分我们建立的模型。它定义了一个神经元的活动,而没有对它的参数(包括且不限于权值和阈值)进行任何调整。它可以用于搭建一个传统的MLP,并与传统MLP完全等价,且各种MLP的训练、优化方式也可以应用于元胞自动机网络。Hopfield,ART等网络亦然。

首先请允许我为脑神经学辩解。神经学家有为神经通路染色的手段(神经通路示踪),最近发展出了一些活体示踪的手段,并且最近的也发展处了可以检测单个神经细胞而不对其产生影响的手段(神经元微探针,需要脑后插管)。但由于生物伦理学的限制这些只能应用于动物实验。

上世纪脑神经学的重要研究成果,例如左右脑功能区别(它是通过研究中度癫痫不得不切断胼胝体的患者),中央前回中央后回的运动、感觉中枢内控制身体区域分布(它们是通过开颅手术时偷偷电刺激患者大脑皮层来...),通常都是在临床医学中积累下的经验。好在最近发展了核磁追踪葡糖分解中间产物的手段,来对大脑中正在工作的神经元(因为它们分解更多葡萄糖)进行扫描。

现在我们对生物脑的工作原理进行猜想,举例定性说明神经的简单响应如何构成人脑的一些基本功能。

人类擅长于聚类和联想,并抽象出一类现象(可能是运动)/事物的共同点。比如我们看到一张哈勃太空望远镜拍摄的照片,我们注意到其中所有恒星都发出十字形的光。而在一些动画片中我们看到同样的明亮物体发出的十字形光。如果事先不知道哈勃的十字形散射是由于其镜头孔是正方形导致的,我们便也不知道这些动画的作画是对这个物理现象的模拟,但这不影响我们对二者建立联想。因此我们假设联想和聚类是一个显式的简单过程而背后不存在复杂的自动推理神经实现。

Hebb提出的假说就是为了解释联想记忆。

我们知道,当一个事物被提及,或者要求被试者想象某个事物/抽象概念的时候,其脑部核磁共振可以观察到反应。也就是说,一部分神经被激活了。

我们也知道至少,对于视觉中枢(17、18、19脑区),我们可以在皮层找到对应视网膜的像素点,它们虽然经过了旋转扭曲,但像素是一一对应的。

有一组平行神经纤维(大轴突,包括中继用的神经元),直插大脑皮层最外层。大脑皮层最外层是灰质,也就是神经元的胞体。灰质组成的皮层向下伸出了一些轴突,组成了白质,这与脊髓相反。

由于我们已知大脑皮层最外层接收到的信息是最原始的(可能经过大脑其他部分/甚至感受器的预处理,比如坐着的时候屁股的感受器只向大脑反应它接触椅子的前1秒,否则你的大脑内就会充斥着“屁股感受到椅子了!”的信息,而当你确认屁股在不在的时候,向你反应这个信息的是肌梭),感受器采样反映给大脑皮层的单位是皮层神经柱。

如果这个假设正确,我们可以解释为什么中央后回的感觉中枢内,大脑皮层面积和相对应身体部位的神经感受器数量几乎成精确正比例关系。(而运动中枢几乎与感觉中枢一一对应,却没有脏器平滑肌对应皮层区域和小JJ对应区域,小JJ由副交感神经和交感神经控制,副交感神经走第十对脑神经,不走脊柱)而脑比较悲剧的物种,有的感觉和运动中枢是混合的。

图2表示了这个临床上抠出来的可怜研究成果。

大脑皮采取神经元在外,神经纤维在内的设计。我们可以推测这种结构是为了与其下层的神经细胞相连,并覆盖尽可能多的组合。

假设西瓜和圆形的代表神经簇是不相连的(或者假设我们把这条通路切断了),那么当你看到西瓜的时候你就再也不会联想起圆形了。那么这个联想本身呢,它对应于“形状”。

在讨论为什么能抽象出形状这个概念的时候,我们先讨论对于一个冠状病毒,没有人告诉过你的情况下你也知道它是圆的(不需要经验)。

我们从图1看到了大脑皮层走到最下边,拐了。它们事实上拐到了其他中枢,但这些拐弯的中枢是平行的,而不横向互联,这是因为如果横向互联,传导过去的将不再是一个实例/概念被唤醒的精确信号,而互相影响。

有了这个结构,我们可以猜想,视觉中枢对于圆形的神经元组合方式,有一个预处理或经验记忆,使得圆形对于视觉中枢和它下面的神经簇组合,有一个实实在在的可以唤醒的代表神经簇。当你想到或者看到圆形时,它们常常兴奋。

只要它和语言中枢内的“圆形”和能建立联系,看到冠状病毒的时候就能自动涌现出圆形的概念,仿佛大脑会自动推理。

而如果要对西瓜和冠状病毒建立联系,则可以通过A-B,B-C,A-C的形式建立,多亏了Hebb原理和LTP的实现方式,这些细胞只需同时兴奋就能加强相互之间的联系(ABC并不完全代表单个神经,它们在脑内通常是一组相互耦合的神经簇,这样在那个液体的漏电环境里更稳定,但对于计算机模拟我们不一定这么做)。

这些联系本身也有相对应的神经簇,它们可能就在相应的皮层下方不深处,也可能通过背侧流/腹侧流直接连接于其他中枢内,这种直接耦合于一个概念/事物/联系本身的神经簇,没有名字,所以我们暂时称它们为代表元。

那么我们发现大脑要预设的可能概念太多了。如果基金、降水概率、龙舌兰和霍曼转移轨道有一个共同点,那么我们的大脑就需要为这个共同点提前建立一个可用的代表元,这显然的是不可能的。

而这种情况在数学这个学科内经常出现。所以我们要不听的给这些代表元起名字,以将它们的存储交给语言中枢,把代表元建立在语言中枢内,比如费马大定理,闭包,流形(即使不是为了学术交流,为大脑考虑,这种命名也是必要的)。

一个恰当的名字可以重用已有的Hebb加强过,或者加强过但你没有注意也不使用的神经通路,让你更快的记忆。这类方法常用于记忆单词。

但对于爱好速记的人而言,记忆π/扑克牌之类的奇怪任务,使得这种关联记忆法显得低效,因为这种记忆法的代表元都是有意义的,它们的数量有限,而组合和有限,这种记忆法容易混淆,因为他们要记忆的内容是无意义且可能重复的。所以他们利用的记忆法常常是把数字组合直接映射到毫不相关的东西上,因为大脑内龙舌兰和基金的联结,这个联结的代表元和神经通路是未使用过的,所以通过死记硬背强行Hebb学习映射到的神经元清晰且不和其他概念混淆,任意脑波扫一扫就可以把它过滤出来。按照这些速记爱好者的描述,这种联系设计的越离谱,回忆的时候就越不容易出错。速记的时候他们把这些离谱的基础映射编成故事,来压缩所记忆内容的长度。

那么如果这些联系过于紧密,比如当我看到圆形时,所有圆形的东西浮现眼前,大脑里所有相关概念被唤醒,那么不就无法思考了么?

无标题无名氏No.53115547

2022-10-31(一)23:26:35 ID: A6Gr3rE (PO主)

有两个可以解释这个问题的假说,前提都是一般的刺激不足以让大脑的任何神经联系达到阈值,而传播这个有效联想来唤醒概念。

第一个是通过反复刺激来进行积累,从而利用电紧张性扩布的积累来找到Hebb联结最紧密的通路。

第二个我们假设脑波是一种受迫行为。假设脑波是大脑内某个自带设备对整个大脑的一个强迫性的广播,来节律性的改变整个大脑内所有(或者需要的)神经细胞的基础电位(这等价于为整个大脑的所有神经的阈值乘sin(wt))。按照前面的前提,大脑这么做是为了通过渐渐增加脑波的振幅来筛选出最容易达到阈值的神经联系。

我们可以找到两个证据(它们只能给我们自信而不能说服我们):

1、进行逻辑思维和进行发散思维的时候,进行后者时被试者使用的脑波振幅更大频率更低,接近于α波(βαθδ波振幅依次增加,频率依次降低,进行强逻辑思维的时候,有学者把那个高频细密的脑波叫做γ波),做梦时候脑波处于α和θ波范围内,而梦里的逻辑感人(如果假说正确,这两者就存在因果关系),而昏迷时和婴儿深睡眠时才会出现δ波,δ波出现时观测不到任何思维活动(可能大脑折返于全记混和全忘记之间)。

2、幸好不光人类有脑波。切断其他动物的丘脑,大脑的脑波就消失了,但丘脑内还能检测到脑波,这进一步暗示,对于大脑皮层,脑波很可能是受迫性的,而不是自发的(也就是说脑波不是思维活动的副产品,而是思维活动的手段)。

如何描述这种可能的联结有多少呢?每个联结都要有代表元,那么组合的幂集的组合的幂集...太多了。这些联结的可能性有没有一个精确的数学表述呢?

幸好冯·诺依曼回答过这个问题(虽然他不是为此回答的),我们看看冯·诺依曼全集(Von Neumann universe)。

这个集合定义直接放在图3、4里了。

(摘自英文维基百科条目“Von Neumann universe”)

集合同时定义了序数,而集合内的序数,就是我们的神经网络里的输入采样,我们可以把输入任意一一映射给它(我们不需要考虑顺序,随便映射就行,因为电子皮层下面是对称的)。

这样我们的神经就连接好了,它的模型不光有了元胞自动机的单元——神经元,也有了结构。

虽然一些概念可以存储与其他中枢,但这个组合结构依旧过大以至于我们的电脑硬盘放不下。

我们这里介绍一个方法来解决这个问题。如果一个空白的没有学习过东西的大脑,它的神经权值必定是不存储信息的(既然硬盘存不下,基因也存不下)。而大量的神经纤维在生物的一生中是用不上的(事实上7岁之前这些细胞和轴突都在疯狂的凋亡和猥琐),大脑之所以采取烧断的方法,是因为它做不到动态生成(试想两个神经细胞同时兴奋了,但它们没有相连,按照Hebb规则,它们原地长出了两条大胳膊拉在了一起,并且手中长出了新的细胞作为联结代表元)。所以大脑只能提前覆盖好大部分可能的组合(并且有重复,但由于大部分联结在本宇宙/本维度内不可能采到样,所以大脑省下了好多资源,但即使如此,还得有好多在出生之后根据对世界的观察来过滤舍弃掉。)

不难想象这个解决方法是什么。当两个细胞同时兴奋时,我们可以做到原地生成联结和联结代表元(先检测是否已经生成过了,利用哈希表之类的算法),因为我们用的是电脑。但是这么做可能会出现兴奋的无限循环,导致大脑的深度无限增加。这时,冯诺依曼全集的定义就显得意义突出:它可以帮我们检测并截止这类动态联结。

对于脑波的模拟,电脑就更是大显身手了,我们甚至不需要发送脑波的广播系统(树状的神经),我们只需把阈值减去,或者把静息电位加上一个动态全局常数就可以了,尤其每个细胞都可以引用静息电位而不是真正的保存一个静息电位,这使得我们模拟的系统里,静息电位也可以是全局动态甚至局部动态的,在电脑里我们有太多人脑的结构不具备的条件。

这样我们的神经网络结构就是动态的,没有学习任何东西的电子脑就是不占用空间的。

但注意我们的全部输入必须都是离散采样。也就是说,不能输入类似音波的东西,但输入可以有时序,因为我们的神经网络是自动机而不是函数。

输入音波的时候,我们要先对音波进行傅里叶变换,按照频率采样后才能输入给神经网络,如果对波形进行离散采样,就失去意义了。我们最好也对震动能量进行采样后同时输入给神经网络。(就像人耳做的一样,耳蜗的作用就是对声波进行傅里叶变换,但人类有了fft算法就几乎永远不可能像大自然一样用一个机械的驻波共振结构来解决傅里叶变换了,因为这个机械过于精密,无法维修)

下面补充一些证据,注意本部分的所有证据都是间接证据,也就是说我们的模型始终都是假说,出于人道主义和生物伦理学家那张喂不饱的嘴,这个学科的现状就是这么的二泉映月。

无标题无名氏No.53115567

2022-10-31(一)23:27:09 ID: A6Gr3rE (PO主)

太长分部分

模型里我们没有讨论三个人类认知的重要属性,创造性,动机和逻辑。

我们先来讨论创造性。

如果上面对于脑波的假说正确,在发散思维的过程中,我们的脑波区域更大幅度,更缓慢。这已经得到实验证实了,但这个实验本身没有说服力,因为实验对象是人,而且我们没法保证他们不作弊(可能他们练习过脑波控制,而且能猜出实验者的目的呢?)。

那么我们怎么筛选我们脑子里冒出的主意呢?

我们可以给错误或不需要的想法打上长时程的抑制信号(LTD),然后继续α大波累加,来唤醒联结更松散的联想。重复这个过程,我们可以得到一些好主意,并且得到线索,之后换β波逻辑推理,无效信息打上抑制,这个过程交替就行了。

这些长时程信号的兴奋/抑制控制连接到了海马回。

我们再讨论动机。

动机和能动性几乎是绑定的。根据进化论我们没有任何理由相信一个没有能动性的生物可以产生动机,这也是解释了植物为何永远进化不出神经系统。但这个解释不令人信服,所以我们提及海鞘这种谐星生物。海鞘是生物的希望,动物界的灯塔,它和脊索动物门最早的祖先是近亲。它曾经是最早的能游泳的鱼形生物,然后它游到远方,找到一块岩石,一口嘬上去,开始变形,最后变成了一块藤壶一样的滤食性木桩。它是世界上唯一一种能变成藤壶的脊索动物。观察它的神经系统发育过程,足以让我们相信动机和能动性是绑定的,动机是对能动性的适应性进化。(它属于尾索动物亚门)

动机很可能是逻辑得以进化出的前提。

动物在趋利避害的进化过程中,更多的时候不去冒险比向食物前进/逃跑更重要。包括人类的大脑在内,动物进化了丰富的抑制系统,而且有几种专门负责抑制的神经递质和突触。

在很早之前,大脑内就进化出了负责激励和抑制的代表元,它们就是感情和好恶的本质。由于它们太老,所以他们并不在第四代新皮质之内,而是塞在了大脑基底核,也就是离大脑皮层最远的核心部分。可能因为它们非常重要,所以在进化的历史长河中,它们从头到尾都得以保留。

它们有与感觉采样、联结代表元相连的结构,来对它们进行倾向性关联。比如一个事物给人的印象,包括恐惧,喜爱,等等,并不是是类似“关系”“结构”的抽象概念,而直接和基底核的不同感情中枢有着不同的连结权值,构成了人类也不得不存在的趋利避害,和价值观。如果没有这个核心保障,所有人随时可能自杀。这套核心保障是是基因硬性实现的结构性功能,比如死和性,我们如果不手动的在模拟系统中实现它们,而交给遗传算法,遗传算法也会实现它们中的大部分,只要自然选择的选择压力存在,这种自激励都会发生。

同样社会性动物趋同也是这类进化的结果(不去标新立异的摸老虎屁股,因为这么做的个体被老虎淘汰了)。

我们猜想价值观之类的无关逻辑的基本认识,是基底核与概念代表元(神经或神经簇)的联系,包括具体行为,理念,任何代表元都能与基底核相连,即使最开始的连接是间接的,但通过Hebb,A-B,B-C,A-B-C,A-C的短接方式,最终可以变成直连的。(但这个假设需要一个前提,就是保证每个概念代表元都有一个通向基底核的直接或间接通路)这种直连的短接方式,有助于动物对利害的快速响应。如果神经进行整波,筛选,可能导致动物错过逃生/摄食/繁殖机会。

如果这个假设成立,那么我们假设人类对事物的直观认识/或者不含逻辑的主观感受,实际上是一种基底核的反应,是基底核广播给全脑的状态。

现在我们理清了一条路线:

感受器→感觉皮层→(皮层下层→中枢间神经流→基底核→中枢间神经流→皮层下层)→运动皮层→效应器

括号内的部分可能重复多次。

最后大胆的谈谈对逻辑的可能形成过程的猜想(毫无依据一派胡言,因为我们脱离实证主义太久了)。

逻辑的形成几乎必须通过语言中枢和基底核相配合,否则我想不出其他的实现手段。

我们猜想逻辑是上面过程中括号内重复过程,来通过反复的强烈抑制和激励,把平时生物常用的倾向性叠加运算给模拟成二值的。

逻辑运算的常见二元运算可以转化成代表元的,二元运算实际上是语言中枢内代表元当了占位符。而它们又有确实的代表元(神经簇和这个逻辑谓词/命题一一映射),从而Hebb构造出一组代表元相互连接,比如{A,B,C}分别代表“甲”“乙”“→”(推出),他们很可能就存在于语言中枢里(也就是不存在没有名字,也没有含义,但代表联结关系的神经代表元,抽象概念直接挂在自然语言的词上。)

然而我们发现自然语言的序跟不是时序,跟时间没有关系。所以推测自然语言在大脑内像动机一样,有这结构性实现。

补充证据失语症。

分为感觉性失语,运动型失语等等。失语不是器官结构性损坏或者发声障碍,而是可以正常发声,但无法组成正常自然语言,原因几乎全部是脑受损。

感觉性失语的患者,说话时命名和找词有明显障碍。严重的彻底字聋,听不懂人说话。对实验者提出的问题常常滔滔不绝,但答非所问,发音清晰语调正确但缺乏实质词。

猜测患者保留了正常的语言组织功能的神经结构,失去了词到概念代表元的神经连接映射。

运动性失语的患者,同样找词困难,说话间断,缺乏语义连接词,以电报式表达。口语理解相对好,但对关系表述理解困难,比如“骆驼比马大”,“A向B借了5毛”。

猜测患者保留了正常的词到概念代表元的的神经连接映射,而是去了语言组织功能的神经结构。

进一步暗示了逻辑和语言中枢之间的关系。也暗示了人类的逻辑思维突出于所有其他动物的原因。语言中枢的结构性(基因硬性规定的结构)神经组织确实存在。

它的进一步实现猜测可能是一个类似浦肯野纤维的周期性同步器,相位的代表元和词相连。也可能是一个单向的顺序传导,下一级抑制上一级。反正需要实现一个偏序关系的映射。

单提,自我意识完全可以用上述模型解释。然而值得注意的是,自我意识很可能和对其他客体的认知没有任何区别,以至于进化亲缘关系微弱的动物都可能产生自我意识,比如大象和猩猩。测试自我意识的实验如下:

把一种动物分两组,隔离,一组生活区内放一面镜子,另一组不放。经过几周后,把两组动物麻麻,涂上红嘴唇。

然后两组动物都给镜子。如果提前见过镜子的动物去擦自己的红嘴唇,而没见过镜子的不去擦(它第一次照镜子,以为本来自己就是红嘴唇),那么说明动物有自我意识。

猩猩和大象等动物都有自我意识(大象只能在脑门上画个红嘴唇,会用鼻子去蹭)。

篇幅太长再分一部分,下部分讲计量和数学模型。

无标题无名氏No.53115602

2022-10-31(一)23:28:07 ID: A6Gr3rE (PO主)

接上篇,正文部分最后一章,讲讲怎么对之前篇幅中提到的脑神经系统内的状态进行计量和建模。

首先强调一遍这里的目的,我们并不是要对神经网络结构进行计量和建模,因为前文讲了网络怎么通过超限构造法这个数学上构造全集的方法来保证覆盖所有输入的组合的。

虽然你可以用遗传算法来优化这个网络的局部特性,但优化后它依旧保持了它工作的基本模式,就是利用微弱全局刺激和输入信号来构造维持比较久的当前状态(你感受到的意识),然后当前状态作为向下一个状态转移的条件,和当前输入共同作用。

这一章我们讨论,如何对神经看似杂乱的状态转移建立计量,并且针对某个已确定的“神经网络结构和记忆来”来进行预测。(也就是说我们不研究在遗传算法中正在进化着的网络,也不研究正在学习着外部环境中信息的网络,虽然它们也很重要,但研究它们的方法和这一章的内容是共通的)

下面在强调一下脑子里时序可能的表示方法。

时序,而且因为上述结构的特点,时序代表元可以和时序产生的片段进行互联而迭代,我们就可以利用一对有序的概念构造出无限长度的时序。数论上成为有序偶,有序偶大概就是{{x,y},x}这样的集合。或者别的定义方法,你随便怎么定义,然后你令它等价于(x,y)。这时候你惊奇的发现你利用元素间无偏序关系的集合构造了一对有序的二元组。当然它还可以被推广为偏序集。

之前我们讲到了混沌现象的研究方法。我们假设我们看到了“图1”中的一个轨迹。因为混沌系统对初始条件的微小差异有敏感性,我们就没法精确预测轨迹,这时,我们退而求其次,计算整个一些其他统计学属性,比如我们利用球体A把空间分成两个部分(球里和球外),我们可以统计一段时间T内,轨迹处于球A内所占的时间t,我们计算t/T。当T→∞的时候,我们得到了一个固定的测度m = t/T,它和你取的初始条件无关。当然我们可以跟踪轨迹,每当它通过球体(邻域ABC)中的一个的时候,我们记录下A、B或者C,这样我们得到一个序列。它具有随机性,可能是AABCCBCABCCBACBBCBCABCBCAABC,我们取序列长度L,计算其中"BC"出现的次数n,令L→∞,我们就得到测度e = n/L。

那么要计算这些测度,对于一个混沌动力系统的某一瞬间,我们就需要函数b = f(P,τ),函数输入P代表当前时刻状态沿着轨迹运行到了空间中的哪一点P,输入τ代表我们所规定的邻域(比如图1中的那个球体A),函数输出给我们b,它的取值是0或者1,代表在不在邻域内。

对于动力系统这太简单,我们计算欧氏距离d=√((X-Xo)²+(Y-Yo)²+(Z-Zo)²),它就是勾股定理。τ的半径是R,f于是做这件事,如果d > 0输出0,否则输出1。

由于是不可预测的系统,我们就无法得到精确的测度,但是我们通过数值计算模拟,就可以尽量长的模拟这个过程。我们的测度随着我们采样的增加逐渐趋于稳定。就和掷硬币一样,掷硬币的次数越多概率越趋近于50%。比如我们要精度精确到1%,那么当测度的波动范围不超出1%范围的时候,我们就不用继续模拟系统了。

到此,要建立测度我们就要有3个条件。

系统可以模拟并且运行(对物理系统我们有微分方程数值解法)
我们可以计算出距离(距离是范数的一个实例)
系统存在测度(不存在测度的系统有好多种,但它们通常很好理解,比如阻尼摆,它会停机,又或者俄罗斯轮盘赌,它是古典概型的)
对于神经网络我们怎么理解呢,首先它是在计算机里模拟的。我们知道计算机是二值的,那么网络的状态总数肯定是有限的。(比如你的内存有4G,那么你内存里的数据有2^8^4G种组合状态(我们忽略寄存器和程序计数器EIP))

那么我们可以建立一个空间R(多少维度,是平滑的还是有张量的,还是支离破碎的,还是和面条一样的,我们现在不知道)把网络的每种状态对应为空间中的一个点(我们把空间称为神经网络的状态空间,其实它并没有2^8^4G这么大,因为大部分状态程序是永远不会经过的)

由于网络可以运行,它的运行过程现在映射成了空间R内的一个轨迹。

现在我们讨论条件。

1、本来就做得到。3、我们相信它有测度,我们试了才能知道。

然后问题就是2。

我们知道邻域包含关系判别函数f的两个输入P和τ,其实可以看作P,Po和R。

我们计算范数||(P-Po)|| > R这个命题就好了。

我们现在需要做的就是构造一个函数d = g(P, Po),输入是状态空间内两个点(换句话说就是输入两个神经网络的瞬时状态),输出是他们在状态空间内的范数(理解为距离)d。

再换言之,我们需要一个函数g(α,β),来比较神经网络2个任意状态的相似程度,并且把相似程度描述为一个标量d。

这个函数我们有许多种方法得到(但它们效果不一定会很好)。一筹莫展的情况下,由于我们已知在很短的时间内,神经网络自然演进的两个状态距离很小。利用这个作为激励,我们可以用遗传算法训练一个小的神经网络,来作为我们要研究的神经网络的范数公式,以此帮我们求得我们要研究的神经网络两个状态间的相似程度。

当然计算相似度不必大动干戈的用一个神经网络,因为它的效果不一定比传统的机械比较好。

当一个神经网络没学习过任何东西的时候,无输入,给出全局刺激(模拟脑波),神经网络里没有任何一个神经响应。

那么这个空间就有点抽象,我们想象一个宇宙空间,每个星球是一个点,其他星球都在以光速远离你,那么你无法到达任何一个其他星球了。

当网络学习了一些东西的时候,状态之间就可以互相转化了。

这时候我们找一个时间点,把神经网络存档下来(就好像存了一个即时档),然后从这里对神经网络里神经的电压给一些微扰,然后继续模拟网络后续变化状态。

我们研究上述计量。

无标题无名氏No.53115611

2022-10-31(一)23:28:24 ID: A6Gr3rE (PO主)

通过这些计量,我们可以反推出神经网络的状态可以被数学描述成什么样的空间(或者说是点集)。如果我们侥幸可以用一个比如某个黎曼流形之类的数学模型近似的描述这个空间的性质,那么我们在脑神经学上的研究就有了巨大的突破。(我对这个不抱太大希望,估计还是豪斯多夫维数(“图3”)是无理数的分形空间,但统计学自相似八成存在)

更好的消息是我们现在有了能检测葡糖分解中间产物的核磁共振,我们就能采集到人脑的这些性质了。如果我们可以计算人脑状态间的相似度,我们就可以用混沌动力学的度量方法来研究和拟合人脑的状态空间了。(通过这些测度我们甚至有希望把人脑的状态变化拟合成向量场)

但坏消息是我们没法对人脑存即时档,而在机器上计算这些又会消耗大量的计算资源,好在我们还不至于承受不了,何况还有不着调的摩尔定律。

另一个令人激动的课题就是,我们知道一开始的那种任意两点间距离都是∞的状态空间(这种无助还可以想象成你是在无风无重力的宇宙空间内的一个尴尬的孢子,虽然星球你都看得见,但你没法飘过去,它和上述描述是等价的),通过对学习过程进行连续采样,我们有望看到学习过程中,神经网络状态空间的结构是如何变化的。

如果希望现在利用已有知识对这个空间的变化过程有个大概了解,我们发现对于两个Hebb学习的关联概念,它们的距离被拉进了。

我们更加简化的想象一个拥有超多褶皱的,弹力无限好的橡皮膜上的两点A、B被你拉近了,B、C也被你拉进了,A、C却离的还很远,但是由于橡皮膜的张力,A、C也在渐渐靠近,这就是前两张提到的集体涌现性的传递。

由于它弹力无限好,任何褶皱可以用手挊平,然后整张缩缩缩,缩成一个硬币大小的扁平小片,虽然一开始它有富士山那么大。这张褶皱橡皮膜上的空间可能是诡异的,因为神经网络学习过程中在橡皮膜上挊出了好多平滑的通道,而如果走褶子,翻山越岭的距离就常常趋近于∞,但这张橡皮膜上经常会出现“图2”中的两边之和小于第三边三角形(这就是黎曼几何研究的拿手好戏,看来他不光能助广义相对论一臂之力)

概念组也是大脑内的状态,我们可以视这个橡皮膜是动态的,我们也可以把所有橡皮膜的集合,一个内部不太光滑的三维空间(它是四维不规则物体上的三维表面,我常常把它形象的想成虫师里的虚茧内的空间,它不符合希尔伯特空间的规则,却有度量)

当然上面的二维和三维都是比喻,实际上维数比这高的多,而且不是整数。好在有了豪斯多夫维数,所以理论上对统计学分形的不规则赋范空间,我们可以推广一套可以计算统计自相似的分形的豪斯多夫维数的计算方法,然后计算神经网络内构造的状态空间的维度。

对豪斯多夫维数的数学推广我也没读过什么文献,这方面数学基础不好还需要学习。

我们感性的知道褶皱越细致的海岸线的豪斯多夫维数越高,而我们知道Hebb等等许多大脑对神经网络的调整,都是在挊平这个拓扑流形。

最后我们可以大胆的(不举证的)猜想:

每个神经网络状态空间的拓扑流形的豪斯多夫维数有一个值k,刚出生的小孩,这个值是∞,对于雨人那种超强记忆智力障碍,他的这个值一生不断的逼近0附近的一个值。而正常人的大脑在做的事就是让这个值无限逼近k(雨人的遗传病让他的K比常人的低)。决定这个k的条件是你处在什么样的宇宙,如果你生在电子世界(你是个AI,你的世界是模拟的,比如重力永远朝下),你的k就和人类不同,但有可能有一种神经网络的组织方法,可以对不同的世界都找到它们相应的k,而通过从世界中获取负熵,意识尽量逼近k,到达k后你就到达了你所在物种的“全知全能”,可惜猫的全知全能无法使它理解镜子中的自己。

我们还需要另一个计量p(f)来描述,控制变量的在某个宇宙(比如我们这个宇宙)之中,一种神经网络收敛到k之后能对这个宇宙理解到什么程度。(蚯蚓的神经网络快速的下降到0附近,导致它的空间平整到可以用一些简单数学模型描述,人脑长了1000亿×1000数量级个神经突触,配合它们的结构,保证了初始下降率比较慢,以至于逼近k的过程中不会人脑可以承受神经不够带来的精度损失)

这个量p(f)输入一个物种的智能极限,输出一个标量,来对物种间的智能进行横向比较。

不知道这个值是否就是网络状态空间的豪斯多夫维数。

我们还需要研究,为什么大脑进化出的神经权值调整规则可以让我们通过学习和与世界交互去逼近k,而不是从∞滑滑梯到0变成弱智,为什么每个动物的脑都有这个功能,它的数学本质是什么,分子生物学上怎么实现。

*这些假说包含了我的许多个人猜想,在没严谨举证之前,每个人都不应该相信它们(除非你能做实验举证)

然而最开始的提到的,“科学唯一无法企及”的意识,在有了一些基础知识、数学模型和度量方法之后变得不再遥不可及了,但在这条路上,我们依旧看到荆棘密布。

(正文结束)

无标题无名氏No.53115881

2022-10-31(一)23:37:27 ID: A6Gr3rE (PO主)

到这里为止就是过去po爬串收集到的原po进行的科普所有的正文了,原po也在原串中进行了十分多相关系统的回复,但是很可惜,当时po并没有把全串下载下来。最近整理笔记突然发现曾经有po认为的精华部分的记录,特此重新将其发出,也希望有岛民能像po一样受到其中的启发,在此再次感谢写下科普的大佬po!

无标题无名氏No.53119095

2022-11-01(二)06:52:12 ID: aacNuJn

感谢补串(`・ω・)!!!

无标题无名氏No.53119434

2022-11-01(二)07:47:44 ID: oUlCX4Y

十分感谢。
这下有辅助参考理解了