图片

今年年初,中国深度求索公司发布推理型大模型DeepSeek-R1(以下简称DeepSeek)引爆热搜,引起全球广泛关注。

大家跃跃欲试

向它提问专业问题

输出工作方案

甚至聊起了个人情感问题

图片

截图自Deepseek官网聊天对话框

年轻人的“深夜树洞”

不少网友纷纷晒出自己和它的对话,并表示被感动到“泪目”,频频破防。一起来感受下:

Q

连续一周每天只睡4小时改方案,但领导还是不满意,说我没用心。我是不是很差劲?

Deepseek回答:

图片

图片

本回答由 AI 生成,仅供参考,不构成任何专业建议。

Q

毕业三年工资不高,同学晒房晒车,感觉我的人生好失败,没有方向。到底怎么才能跳出现在的困境?

Deepseek回答:

图片

图片

本回答由 AI 生成,仅供参考,不构成任何专业建议。

Q

跟前男友分手了,但睡前还是手贱忍不住搜他微博…朋友说我恋爱脑,但没人知道我每晚难过走不出来的心情,我该怎么办?

Deepseek回答:

图片

图片

本回答由 AI 生成,仅供参考,不构成任何专业建议。

DeepSeek为什么这么火?

DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,依托幻方量化顶尖的金融AI团队,将量化领域高频交易中的算法优化能力迁移至大模型研发,其自研AI-HPC架构使训练效率提升10-20倍,形成技术先发优势。

具体来说,火出圈的是DeepSeek-R1推理模型,擅长处理复杂任务且可免费商用。

图片

图源《DeepSeek从入门到精通-清华大学版》

爆火的其中一个重要契机,是有网友指出DeepSeek-R1的成功可能削弱了市场对英伟达AI芯片需求的预期,导致交易员做空英伟达股票,进而引发股价下跌。通过FP8混合精度训练、混合专家(MoE)架构等创新,训练成本仅为GPT系列的1/10-1/20,API定价压至同业1/27,或能破解行业成本困局。

此外,在用户使用过程中确实能感受到,DeepSeek-R1的自然语言、逻辑推理等能力的实现标志着AI技术在认知和应用层面达到了新高度。

AI的“治愈力”从何而来?

image.png

喂养海量案例素材

测试显示,当用户倾诉“工作压力大”时,人类常给出“放松点”等模糊回应,而AI会分步骤引导分析压力源,这与AI被“投喂”的海量心理咨询案例训练直接相关。

大模型学习的不只是知识,更是数十亿人的情感表达(如小说对白、心理咨询记录、影视台词)。

image.png

deepseek指导生成

像婴儿通过观察大人学习“何时该给拥抱”,AI在被RLHF训练(奖励函数操控)时,标注员会更倾向选择“渐进式引导”的答案,导致AI自动优化出“先认同-再分析-后建议”的三段式结构。

相较于传统大模型以自然语言和多语言交互以及连续对话的方式,实现了从“模糊搜索”到“精准推送”的升级,DeepSeek能够通过构建语义网络和模拟人类逻辑路径,实现从“信息匹配”到“知识推演”的跨越。

双轨训练机制

在海量数据的基础上,DeepSeek-Rl采用独有的双轨训练机制。一方面,它能够深入学习将复杂问题拆解为简单子问题的方法,进而逐步解决复杂问题,显著提升复杂问题的拆解能力。

另一方面,它采用了无监督强化学习技术,突破传统训练范式的局限(通常依赖大量标注数据),使DeepSeek-R1在有限标注数据的情况下,仍能维持卓越的推理性能。

图片

deepseek指导生成

这种创新的技术路径,实现了推理过程的自我反思与迭代优化。如同人类在解决问题时会不断总结经验、反思方法,DeepSeek-R1也会在推理过程中能够持续优化自身推理策略,形成类似人类的问题解决思维链。

AI的“高情商”不是真情感

但值得注意的是,AI不懂悲伤,只能模拟“悲伤时人类最需要的对话流”。RLHF(基于人类反馈的强化学习)让AI从“正确率”迭代到“让人类舒服的回答”,掌握“共情话术”,但无法区分小说剧情与现实困境。

在上述案例中,Deepseek会将“失恋”自动关联到关键词“背叛”“自我价值”……从而触发预设安慰框架,选择大量运算结果中最有可能符合人类情感需求的内容。

例如,当AI说“我理解你的痛苦”,实则是数据统计显示这句话最可能提升用户满意度。

image.png

deepseek指导生成

DeepSeek等AI开始展示出其能够站在他人立场思考问题的能力,即“他者视角”。但机器没有肉身,“自我”情感和冲动也没有根植之处。我们在使用过程中,应保持理性和辩证思维,避免过度依赖AI导致情感降级(如把AI当心理医生)。

也许真正治愈我们的不是AI的答案

而是在提问的瞬间

我们第一次对自己如此坦诚

作者:蝌蚪君

审核:刘颖 李培元

来源: 蝌蚪五线谱