No.64487701 - X岛揭示板

No.64487701 - 无标题 - 科学

回应模式

No.64487701

名称

管理员

E-mail

标题

颜文字

正文

附加图片

水印

•涵盖各类科学的讨论板块
•可盖棺定论各热门事件/关注后续/谣言粉碎
•干货什么的最喜欢了！
•请注意发言所包含的信息量，信息量过低的内容将移回综一
•引用请注明出处，民科、伪科学退散

无标题无名氏 2024-11-24(日)07:04:18 ID:LhWkRsO [举报] [订阅] [只看PO] No.64487701 [回应]

Thinking Claude —— 从机械推理向模拟人类的跨越：人工智能提示词工程界碑

…

无标题无名氏 2024-11-24(日)07:06:30 ID:LhWkRsO (PO主) [举报] No.64487703

◆概述：

近期，一款名为“Thinking Claude”的创新性提示词（Prompt）引起了人工智能界的广泛关注。该提示词由一位年仅17岁并获阿里巴巴全球数学竞赛第一名的高中生涂津豪设计，旨在显著增强AI助手Claude3.5的思维链能力，使其能够展现出更加接近人类的思考模式。这一成果不仅标志着个人开发者在人工智能领域的重大突破，也为AI技术的发展提供了新的视角。

◆Thinking Claude的背景与意义：

随着人工智能技术的飞速发展，特别是大型语言模型的崛起，人们对于AI的理解能力和交互体验提出了更高的要求。传统的思维链技术虽然能够在一定程度上提高模型的推理能力，但其结果往往显得机械化，缺乏人性化。涂津豪通过深入研究人类的思考方式，并将其融入到Claude3.5的交互过程中，实现了从机械式推理到人类化思维的跨越。

◆创新点分析：

1. 人类化思维链：涂津豪创造性地将人类的“意识流”概念引入到AI的思维链设计中，使得Claude3.5在处理任务时能够展现出更加自然流畅的思考过程。例如，模型会在解决问题的过程中自发地使用诸如“或者…”、“等等，有了”等表达，这不仅增强了用户体验的真实感，也让用户更容易理解模型的思考路径。

2. 自我迭代优化：在开发过程中，涂津豪充分利用了Claude自身的学习能力，通过与模型的持续互动，不断调整和完善提示词的内容。这种自我反馈机制大大提高了最终产品的质量，同时也为未来AI模型的自我优化提供了新的思路。

见https://github.com/richards199999/Thinking-Claude/tree/main

…

收起查看大图向左旋转向右旋转

无标题无名氏 2024-11-24(日)07:14:05 ID:LhWkRsO (PO主) [举报] No.64487716

我不知道大家能不能意识到它的意义，我就这么说吧，这个很可能会在未来历史课本的“第四次工业革命”概述里占有一定篇幅。

…

无标题无名氏 2024-11-24(日)08:23:31 ID:LdTjJO3 [举报] No.64487850

有这么夸张？

…

无标题无名氏 2024-11-24(日)08:53:55 ID:GkkfQOl [举报] No.64487920

( ﾟ∀。)7我加的ai色色角色扮演discord群里有专门的分区分享prompt，感觉和这差不多啊

…

收起查看大图向左旋转向右旋转

无标题无名氏 2024-11-24(日)09:02:05 ID:huncPK3 [举报] No.64487953

claude不太清楚，但是这个ai真的狠的离谱
给他个图片，他都能看出这个板子上缺了啥

…

无标题无名氏 2024-11-24(日)09:04:07 ID:huncPK3 [举报] No.64487960

我觉得真的离谱

…

无标题无名氏 2024-11-24(日)09:06:05 ID:0FRwExH [举报] No.64487969

虽然关注点错误但原谅我看到阿里巴巴数学竞赛有点绷不住･ﾟ( ﾉヮ´ )

…

无标题无名氏 2024-11-24(日)09:06:09 ID:huncPK3 [举报] No.64487970

感觉搞个身体出来就能搞很多很多很多事情了
别的不说，装电脑大概是够了

…

无标题无名氏 2024-11-24(日)09:10:03 ID:QAJPi3b [举报] No.64487988

根据我的体感，无论是生成的结果还是结果的排版布局来说，claude生成的东西用起来确实要比gpt得劲一些，当然这只是我的体感( ﾟ∀。)

…

无标题无名氏 2024-11-24(日)10:31:01 ID:22b93o1 [举报] No.64488397

>>No.64487716
你想多了，prompt engineering的技术含量普遍太低了

…

无标题无名氏 2024-11-24(日)10:41:18 ID:QBcxlys [举报] No.64488469

一个prompt engineering，我对他的可行性持怀疑态度，但是起码他真的很会宣发( ﾟ∀。)

…

无标题无名氏 2024-11-24(日)10:49:28 ID:6SxeYAj [举报] No.64488555

有点好笑

…

收起查看大图向左旋转向右旋转

无标题无名氏 2024-11-24(日)11:18:16 ID:HbZkZqK [举报] No.64488738

谢谢，午饭省下来了

…

无标题无名氏 2024-11-24(日)12:19:18 ID:LhWkRsO (PO主) [举报] No.64489167

o1标志着生成式AI时代转向推理式AI时代

Thinking claude呈现出的思路能作为该二者的“桥梁”之一，而且它是开源的，这就是为什么我放出了这个暴论。

…

无标题无名氏 2024-11-24(日)12:22:25 ID:AoKCAi3 [举报] No.64489198

>>No.64488738
请问这是什么论坛，想找点ai和大数据方面的社区看看(｀･ω･)

…

无标题无名氏 2024-11-24(日)12:49:20 ID:22b93o1 [举报] No.64489392

充其量就是一个改善QoL的小工具，没有涉及到复杂任务的解决，没有指标证明它的有效性，没有论文，没有涉及到模型架构的改动，相比CoT来说创新点乏善可陈，研究的还是AI学术界最不关心的prompt engineering里最不关心的人机交互

身为一个17岁学生的作品来说还是能让人眼前一亮的，如果都是自己做的话，这个人行动力是很不错的，但过度吹就没必要了

…

无标题无名氏 2024-11-24(日)13:45:32 ID:LhWkRsO (PO主) [举报] No.64489781

>>No.64489392
你说的对

果然放暴论能迅速吸引到人答疑( ´∀`)

…

无标题无名氏 2024-11-24(日)14:52:34 ID:EvNfMrb [举报] No.64490266

经典llm领域任何东西都能一通乱吹
也就算个还不错的prompt吧，别的没了
o1也是，的确是提高了对数学和编程方面语料的提取效率（虽然我个人觉得编程没claude3.5好用），但有时一套“思考”下来结果却能和推理得出的结论截然不同，而且在FrontierMath里与其他模型拉不开差距甚至还不如，也不免让人怀疑有背题的嫌疑。

…

无标题无名氏 2024-11-24(日)17:48:36 ID:GkkfQOl [举报] No.64491570

说起来最近也总感觉这新claude 3.5 sonnet也变蠢了，玩角色扮演时即使在同一次回复里也会出现逻辑不通，前后冲突的情况。这用的还是openrouter的claude，所以应该也不是渠道商掺假什么的

X岛 - Ver 1.0 beta by 酱酱酱
联系：help@nmbxd.com
免责声明：本站无法保证用户张贴内容的可靠性，投资有风险，健康问题请遵医嘱。