写作绅士,读作丧尸 X岛揭示板
顺猴者昌 逆猴者亡 首页版规 |用户系统 |移动客户端下载 | 丧尸路标 | | 常用图串及路标 | 请关注 公众号:【矛盾苇草】| 人,是会思考的芦苇
常用串:·豆知识·跑团板聊天室·公告汇总串·X岛路标

No.64487701 - 无标题 - 科学


回应模式
No.64487701
名 称
E-mail
标题
颜文字
正文
附加图片
•涵盖各类科学的讨论板块
•可盖棺定论各热门事件/关注后续/谣言粉碎
•干货什么的最喜欢了!
•请注意发言所包含的信息量,信息量过低的内容将移回综一
•引用请注明出处,民科、伪科学退散

无标题 无名氏 2024-11-24(日)07:04:18 ID:LhWkRsO [举报] [订阅] [只看PO] No.64487701 [回应] 管理
Thinking Claude —— 从机械推理向模拟人类的跨越:人工智能提示词工程界碑
无标题 无名氏 2024-11-24(日)07:06:30 ID:LhWkRsO (PO主) [举报] No.64487703 管理
◆概述:

近期,一款名为“Thinking Claude”的创新性提示词(Prompt)引起了人工智能界的广泛关注。该提示词由一位年仅17岁并获阿里巴巴全球数学竞赛第一名的高中生涂津豪设计,旨在显著增强AI助手Claude3.5的思维链能力,使其能够展现出更加接近人类的思考模式。这一成果不仅标志着个人开发者在人工智能领域的重大突破,也为AI技术的发展提供了新的视角。

◆Thinking Claude的背景与意义:

随着人工智能技术的飞速发展,特别是大型语言模型的崛起,人们对于AI的理解能力和交互体验提出了更高的要求。传统的思维链技术虽然能够在一定程度上提高模型的推理能力,但其结果往往显得机械化,缺乏人性化。涂津豪通过深入研究人类的思考方式,并将其融入到Claude3.5的交互过程中,实现了从机械式推理到人类化思维的跨越。

◆创新点分析:

1. 人类化思维链:涂津豪创造性地将人类的“意识流”概念引入到AI的思维链设计中,使得Claude3.5在处理任务时能够展现出更加自然流畅的思考过程。例如,模型会在解决问题的过程中自发地使用诸如“或者…”、“等等,有了”等表达,这不仅增强了用户体验的真实感,也让用户更容易理解模型的思考路径。

2. 自我迭代优化:在开发过程中,涂津豪充分利用了Claude自身的学习能力,通过与模型的持续互动,不断调整和完善提示词的内容。这种自我反馈机制大大提高了最终产品的质量,同时也为未来AI模型的自我优化提供了新的思路。

见https://github.com/richards199999/Thinking-Claude/tree/main
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-24(日)07:14:05 ID:LhWkRsO (PO主) [举报] No.64487716 管理
我不知道大家能不能意识到它的意义,我就这么说吧,这个很可能会在未来历史课本的“第四次工业革命”概述里占有一定篇幅。
无标题 无名氏 2024-11-24(日)08:23:31 ID:LdTjJO3 [举报] No.64487850 管理
有这么夸张?
无标题 无名氏 2024-11-24(日)08:53:55 ID:GkkfQOl [举报] No.64487920 管理
( ゚∀。)7我加的ai色色角色扮演discord群里有专门的分区分享prompt,感觉和这差不多啊
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-24(日)09:02:05 ID:huncPK3 [举报] No.64487953 管理
claude不太清楚,但是这个ai真的狠的离谱
给他个图片,他都能看出这个板子上缺了啥
无标题 无名氏 2024-11-24(日)09:04:07 ID:huncPK3 [举报] No.64487960 管理
我觉得真的离谱
无标题 无名氏 2024-11-24(日)09:06:05 ID:0FRwExH [举报] No.64487969 管理
虽然关注点错误但原谅我看到阿里巴巴数学竞赛有点绷不住・゚( ノヮ´ )
无标题 无名氏 2024-11-24(日)09:06:09 ID:huncPK3 [举报] No.64487970 管理
感觉搞个身体出来就能搞很多很多很多事情了
别的不说,装电脑大概是够了
无标题 无名氏 2024-11-24(日)09:10:03 ID:QAJPi3b [举报] No.64487988 管理
根据我的体感,无论是生成的结果还是结果的排版布局来说,claude生成的东西用起来确实要比gpt得劲一些,当然这只是我的体感( ゚∀。)
无标题 无名氏 2024-11-24(日)10:31:01 ID:22b93o1 [举报] No.64488397 管理
>>No.64487716
你想多了,prompt engineering的技术含量普遍太低了
无标题 无名氏 2024-11-24(日)10:41:18 ID:QBcxlys [举报] No.64488469 管理
一个prompt engineering,我对他的可行性持怀疑态度,但是起码他真的很会宣发( ゚∀。)
无标题 无名氏 2024-11-24(日)10:49:28 ID:6SxeYAj [举报] No.64488555 管理
有点好笑
收起 查看大图 向左旋转 向右旋转
无标题 无名氏 2024-11-24(日)11:18:16 ID:HbZkZqK [举报] No.64488738 管理
谢谢,午饭省下来了
无标题 无名氏 2024-11-24(日)12:19:18 ID:LhWkRsO (PO主) [举报] No.64489167 管理
o1标志着生成式AI时代转向推理式AI时代

Thinking claude呈现出的思路能作为该二者的“桥梁”之一,而且它是开源的,这就是为什么我放出了这个暴论。
无标题 无名氏 2024-11-24(日)12:22:25 ID:AoKCAi3 [举报] No.64489198 管理
>>No.64488738
请问这是什么论坛,想找点ai和大数据方面的社区看看(`・ω・)
无标题 无名氏 2024-11-24(日)12:49:20 ID:22b93o1 [举报] No.64489392 管理
充其量就是一个改善QoL的小工具,没有涉及到复杂任务的解决,没有指标证明它的有效性,没有论文,没有涉及到模型架构的改动,相比CoT来说创新点乏善可陈,研究的还是AI学术界最不关心的prompt engineering里最不关心的人机交互

身为一个17岁学生的作品来说还是能让人眼前一亮的,如果都是自己做的话,这个人行动力是很不错的,但过度吹就没必要了
无标题 无名氏 2024-11-24(日)13:45:32 ID:LhWkRsO (PO主) [举报] No.64489781 管理
>>No.64489392
你说的对

果然放暴论能迅速吸引到人答疑( ´∀`)
无标题 无名氏 2024-11-24(日)14:52:34 ID:EvNfMrb [举报] No.64490266 管理
经典llm领域任何东西都能一通乱吹
也就算个还不错的prompt吧,别的没了
o1也是,的确是提高了对数学和编程方面语料的提取效率(虽然我个人觉得编程没claude3.5好用),但有时一套“思考”下来结果却能和推理得出的结论截然不同,而且在FrontierMath里与其他模型拉不开差距甚至还不如,也不免让人怀疑有背题的嫌疑。
无标题 无名氏 2024-11-24(日)17:48:36 ID:GkkfQOl [举报] No.64491570 管理
说起来最近也总感觉这新claude 3.5 sonnet也变蠢了,玩角色扮演时即使在同一次回复里也会出现逻辑不通,前后冲突的情况。这用的还是openrouter的claude,所以应该也不是渠道商掺假什么的

UP主: