Skip to main content

关于科技热词“AI 大模型”的对谈

· 10 min read
XiGou
Software Developer

这是一篇关于 AI 的非正式讨论 ,由 Ethan 发起

大模型是否有思考能力?

Q(Ethan): 先从Deepseek开始吧,自从Deepseek上线以后,我认识的许多诗人朋友都体会到了危机感。一开始,我也抱着惴惴不安的心态试了试,但最后我发现这哪里是人工智能,分明就是人工智障。

以命令Deepseek各自模仿策兰、荷尔德林、艾略特写诗为例,我们首先可以通过其策兰的《在光的裂缝中》看到这样一种逻辑,就是引用策兰诗里关键、多次重复的元素“裂隙”、“灰烬”、“眼睛”、“黑暗”、“沉默”等,以一种作文式的表达将要素们流畅链接起来,但这种流畅的抒情却很明显和策兰那种卡顿、断裂的阅读体验大相径庭;然后,当我再度要求Deepseek模仿荷尔德林写一首诗,它居然重复沿用了刚刚模仿策兰时使用过的元素,写道:“光,从时间的裂隙中洒落”,而这从未出现于荷尔德林诗中,也和前后文毫不沾边。最让人苦笑不得的是当我命令其模仿艾略特写一首中国版《荒原》,它居然只把词语作了替换,比如“荒地”改为“稻田”、“咖啡”改成“龙井”,“宝座”变成“紫荆城”、国际象棋变成中国象棋,泰晤士河变成长江,深海变成西湖。经过三轮实验,可以更加明确印证,它无法像人脑一样进行文学思考。

它的所有诗评都是基于元素的摘取以及对既有数据的模仿,所以它只能模仿“褒奖”,而无法进行批评。简单来说,就是只说好话,但是无法发现一首诗的弱点。但是对于生活中远离阅读(我们知道,很多人大学毕业后就不翻书了)的人,它这个功能的确很唬人,甚至我很多文学上的朋友得到Deepseek的褒奖后都非常开心,但是仔细对比原文,它的诗评根本就是一顿乱夸,原作者自己写的时候都没想这么多。再到后来,我发现Deepseek甚至无法辅助写作,它就是一个索引数据的工具。基于我的观察性判断,你认为我的判断是否合理?

A(Joker) :首先回答你提出的问题,现在的ai模型到底是不是一种智能的检索技术?
至少在10年以前,这种看法是主流的,中国工程院院士方滨兴就曾经发表过类似的观点, http://views.ce.cn/view/ent/201511/26/t20151126_7139508.shtml
至少说明这个观点不是完全的谬误,也不是无稽之谈。

但是在自然语言处理技术发展了多年以后,特别是 生成式 的模型提出以后我们就不能再将大语言模型看成简单的信息检索技术,因为从原理上来讲,它确实能够根据上下文去生成新的信息,而这个信息在原始的用于训练模型的数据库当中是不存在的,这样来看,他就不是简单的检索信息。

而你提到的他没有文学思考的能力,这一点我是非常赞同的,在哲学上面有一个经典的思想实验-- 汉字屋实验

一个对中文一窍不通,只说英语的人关在一间只有一个开口的封闭房间中。
房间里有一本用英文写成的手册,指示该如何处理收到的中文讯息及如何以中文相应地回复。
房外的人不断向房间内递进用中文写成的问题。
房内的人便按照手册的说明,查找合适的指示,将相应的中文字符组合成对问题的解答,并将答案递出房间。

我想用这个思维实验来解释现在的大语言模型,简直就是太贴切了,几乎不需要再做多余的语言解释,现在的大语言模型实际上就是一个汉字屋。

首先他从大规模的语料当中去学习,将学习到的东西存在神经网络的权重数据当中,而这个权重数据就相当于是如何处理中文的一种规则,外界传来中文数据的时候,他就会根据这种规则去生成一些中文的回答。

在这种情况下,你说一个汉语房间拥有文学思考的能力显然是不恰当的。

但是,我们依然没有解决最根本的问题,我们无法描述什么是一种"文学思考的能力",而人工智能模型是在对人脑的工作原理的一种探索,我们不知道人脑是如何运转的,作为对这个未知领域的探索,我们只能不断的用各种方式去尝试。我们刚开始认为它是机械的,所以去设计复杂的机器;后来又认为他跟统计学有点关系,所以设计了神经网络模型;说不定在未来的世界还有可能会出现用一群蜘蛛来模拟人脑工作过程的基于仿生学和群体智慧的科学研究。

不管用什么方式,我们都无法回答它到底有没有文学思考的能力,它到底是不是真正的人工智能?因为我们根本就不知道什么是智能。

所以我们只能用结果导向的方式来评价这个东西到底做的好不好。可能你的阅读量更大一点,能看到他作出的诗句当中的巨大的缺陷,但是我曾经试过用 AI 生成了一首诗,模仿博尔赫斯的风格,我读完了,甚至觉得真的就是博尔赫斯写的。

一柄古老的剑隐匿于暗影,
每一次挥舞都刻下新伤,
权力与命运交织成无尽的图案,
如那永远旋转的悲剧。

我在阅读这段文字的时候,也获得了和阅读博尔赫斯的书一样的体验,对我这次尝试而言,AI 模型是成功的。但是我确信他没有文学思考的能力,或者说他没有博尔赫斯那样的文学思考的能力,而是拥有一个普通的大学生的文学思考能力。对于没有文学天赋的人来讲,所谓的文学思考无非就是将自己阅读过的东西进行排列组合,我至今还没有听说过哪一个作家是生活在一个与世隔绝的环境当中,不去阅读他人的文章,不使用他人文章的内容,而凭空的去创作。

大模型是否会加剧技术集权

Q(Ethan): 近日,我又看到了一则新闻,四川省人民医院数据接入Deepseek,配合之前天津地铁接入 Deepseek 导致故障下降 50% 的新闻,出于对政绩工程、眼球经济、产业政策的不信任(因为选拔制和选举制不同,官员想要晋升就必须有政绩表现,但不管这种需求是否科学、合理),我也感到有 AI 大跃进的嫌疑。另外在美国,马斯克就是一个技术极权的典型例子,X 上诸多大V对川普的舆论铺垫在拜登任期就持续并且风靡,寡头集团甚至收买了不少中文自媒体,马斯克的封号争议也让人联想到美国一些司法裁定案例已经偏离法律的目的,而服从领导人特朗普个人的喜怒偏好。公民在技术面前越来越被动、赤裸,技术极权的年代加快来临应该是一个趋势。

A(Joker): 现在 AI 确实处于大跃进时期,已经进展到了全民大练 AI 的阶段,在 IT 公司当中,各种各样的奇葩需求都想蹭上 AI 的热点,大家似乎都在幻想,AI 就是我们的青天大老爷,AI 来了以后,我们公司内部的问题就会全部解决。

实际上真正上手去做才会发现他能做的很有限,现阶段的 AI 的能力就像一个加满了油,同时油门踩死的汽车,你想靠他到达罗马,必须要自己好好的掌握方向盘。

AI 仍然无法代替人的劳动,但是它作为一种先进的生产力革命的工具,我们绝对不能抗拒他,我们应该积极的去使用它,它对于提升我们的工作效率以及处理某些特定任务方面还是非常有帮助的

AI 必然会加剧技术集权, 或者说历史上的每一次的生产力革命。其实都加剧了技术的集权。发明了纺纱机以后,资本家拥有了纺纱机,而普通人却变成了纺纱机上的一个零件。发明了蒸汽机以后,大型的国企拥有了各种各样的机械,一些人连成为零件的资格也没有了。在软件行业 AI 带来的技术集权是非常清晰的,在上一个时代,各种软件蓬勃发展,欧洲人领导的自由软件革命让软件的源代码倾向于开放,当你想使用一个软件的时候,你可以自己下载源代码构建软件,并且部署在自己的机器上面,为自己提供 IT 服务。

现在的大模型 AI 一出来,大家就傻眼了,首先就是偷梁换柱,改变了开源的定义,一些声称开源的模型实际上只是将自己通过自己内部的软件训练优化过后的模型数据公开出来,普通人如果财力雄厚,能够买得起几百万的显卡,也可以自己部署使用这些模型,但是却无法拆开这个黑盒,不知道里面到底装了什么东西,也无法从源代码开始构建这个模型。

另一方面就是训练这些模型的巨大成本,只有科技巨头才有能力负担,普通人别谈训练,甚至连部署他的可能都没有。

个人想要对抗这样的技术集权几乎是不可能的事情, 不光对于 AI,个人在科技巨头的面前始终是渺小的,个人抵抗不了百度、Google、TikTok 的奴役,自然也抵抗不了 AI,大模型只是加剧了这一过程,让个人与科技公司之间的平衡点悄然移动。

除此之外还有更邪恶的事情,这种机器能够源源不断的生产信息,这些垃圾信息很快就会充斥整个互联网,占据互联网99%的内容,那个时候我们的注意力也必须要贡献给这样的垃圾信息,科技巨头利用这些掠夺过来的注意力去实现他们的商业目标,而在这次的“工业革命”中,我们人类不光没有机会成为机器里面的零件,连拒绝饮用机器生产出来的牛奶的自由也会渐渐的失去。

在这个日趋混乱的世界当中,我们应该珍惜自己的注意力,去看高质量的东西, 去追寻更有价值的生命体验,更应该主动的拒绝信息洪流。

而那些社会上被高科技奴役的大多数人,没有必要为他们思虑太多,总有人要做奴隶,只要不是我就可以了。