无标题无名氏No.62551774 只看PO
2024-05-28(二)17:38:17 ID:WROLBFJ 回应
感觉不需要加暴论,但是暴论:ai绘图就是史
无标题无名氏No.62587713
2024-05-31(五)15:49:32 ID: BXWrYTy
>>No.62586937
人类画手学习他人绘画,越是精进越需要理解对画面某处进行某种处理的原因,并且根据自己的需求进行再加工和主观处理
但AI生成图是不需要理解对图像进行某种处理的原因的,它学习和模拟已有的画面本身
不恰当的比方,人类画手看到了发光的窗可以类比着画出另一个角度的发光的门,而AI看到发光的窗倾向于图生图生成各种同角度赤橙黄绿青蓝紫的发光的窗,但都是窗
↑叠甲以上是观看多方科普之后的个人理解
无标题无名氏No.62594217
2024-06-01(六)01:39:18 ID: 4B7Reqn
>>No.62587713
难道人类不是吗?一个没见过门,只见过窗的人,你让他去画门,他再怎么费劲画,画出来的东西都像是五颜六色的窗
ai学习的逻辑和人类是高度相似的,只是效率比人类高出几个数量级而已
由此可见,只要人类“接受,理解,运用”的学习逻辑是合理的,那么ai的学习逻辑同样是合理的
无标题无名氏No.62594506
2024-06-01(六)02:23:21 ID: 4B7Reqn
刚好学的是计算机专业,我给大家简单介绍一下ai绘画的原理
大概是十年前,第一代ai绘画算法问世,也就是对抗式生成网络(GAN),把已有图像直接喂给判断器进行深度学习,让机器自己提炼出图像的“共性”,进而从生成器产生的高度随机的大量图像中,识别出和已有图像“相似”的图像进行输出
GAN缺点很明显,一是运算量巨大,二是输出内容没法控制,三是无法被定义为创作(因为只是在寻找和已有图像相似的图像),比如那张流传很广的抽象《星空》
无标题无名氏No.62594671
2024-06-01(六)02:57:55 ID: 4B7Reqn
然后大概在三年前,出现了一个叫做CLIP的模型,这个模型做的是图像识别,也就是看图说话
CLIP也是基于大量已有图像的深度学习模型,但是CLIP的学习的目标更清晰,也就是在人类能识别的文字描述,与机器能识别的特征数据之间建立了联系
有个天才把CLIP的特征集和GAN的判断器缝到了一起,第二代ai绘画技术就诞生了
这代技术实现了一定程度上的产物可控,应用的典例就是前几年很火的简笔画自动补全,即先用CLIP识别画的是什么东西,再把这个东西对应的特征集传给GAN,最后输出和特征集的描述最相近的图片
无标题无名氏No.62594711
2024-06-01(六)03:09:23 ID: 4B7Reqn
然后技术又革新了,出来了一个叫做扩散化算法(Diffusion)的东西,它负责生成图片,取代了原先的对抗式算法GAN
第三代ai绘画模型,也就是现在广为流传的模型,就是以CLIP和扩散化算法为基础构建的,CLIP负责根据输入的文字产生对应的特征集,扩散化算法以这些特征集为基础,进行从模糊图像到清晰图像的迭代计算
无标题无名氏No.62594816
2024-06-01(六)03:37:56 ID: 4B7Reqn
然后关于ai绘画到底算不算是创作的问题,我说一些自己的看法
首先上面讲的扩散化算法的迭代,不是直接基于已有图像,而是基于大量已有图像中总结出的各种对应特征,也就是说,投入几十G的图像进行训练,得到的特征集可能只有几百M,但是从这几百M中选择想要的特征进行迭代,却可以产生无限的,和训练数据风格类似的图像
其次,人类的创作难道就不是基于特征的吗?比如画人体的时候,“标准的人体结构”就作为一个特征保存在画家的大脑里,画家必须把自己的画和这个特征进行比较,才能保证人体结构不会画错
无标题无名氏No.62594866
2024-06-01(六)03:54:12 ID: 4B7Reqn
创造的本质是不是一种机械化行为?是不是只是因为大脑算力太低,人类才会把创造当成一种玄之又玄,捉摸不透的过程?
目睹创造以极高的效率出现,从而感到一种陌生,进而说服自己相信这不属于创造,我觉得这就是大部分人在看到ai绘画的时候的心理
无标题无名氏No.62595954
2024-06-01(六)09:54:23 ID: iYjImd3
你说得对,但AI绘图至少解决了有没有的问题。举个例子,那群战犯打仗行,但提笔画画可没几个会的,没AI,还真没有这么繁多的灰风图。质量先不要求,至少给了战犯们画老婆的能力
至于好不好的问题,那涉及画师利益不便多言