立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 123|回复: 5

[分享] DeepSeek获得了空前的成功,那他有没有什么不足之处?

[复制链接]
发表于 2025-1-31 15:12 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
DeepSeek获得了空前的成功,那他有没有什么不足之处?
原文地址:https://www.zhihu.com/question/10714927807
回复

使用道具 举报

发表于 2025-1-31 15:12 | 显示全部楼层
不足之处:官方APP没有语音对话功能。
不过我做了一个把DeepSeek接入Siri的免费保姆级教程,这样就可以快速和DeepSeek语音对话了。苹果设备用户(iPhone、iPad、Mac等等)都可用。安卓、鸿蒙用户等后续我更新此文。DeepSeek接入苹果Siri教程如下:
一、进入DeepSeek官网,点击右上角的API开放平台获取免费API

官网如下:
DeepSeek注意先注册账号之后,再进入API开放平台获取官方免费送的API。如果API开放平台显示维护中,则等待官方维护完成后再进入。如果急用API,评论区留言。


然后点击创建API key,随便命名(比如Siri),然后复制你创建的API(这里格外注意,API只能复制一次,确定复制之后再关掉显示API的窗口)




二、苹果设备用户导入DeepSeek语音助手快捷指令

1、在Safari浏览器里打开下面的DeepSeek语音助手快捷指令链接:
https://www.icloud.com/shortcuts/d9ab1673e6b14c0ab0c4d208b619133c
(注意:快捷指令这个APP是苹果设备自带的,如果你删除了就去App Store先下载)


2、然后依次点击【获取捷径】、【设置快捷指令】,在弹出的文本框里输入第一步里你复制的API之后(API是sk开头的一长串数字字母),再点击【添加快捷指令】,然后快捷指令的第一个就是【DeepSeek语音助手】了。


3、最后点击这个快捷指令之后,再点击后续弹窗的【允许】、【始终允许】,允许语音对话之后,就可以使用了!
另外如果你是iPhone15Pro及之后的带有自定义操作按钮的机型,你还可以通过:设置-操作按钮-快捷指令-选取快捷指令-DeepSeek语音助手。这样就设置好了iPhone左上角的操作按钮(原来的静音按键)来一键打开DeepSeek语音助手对话!
本文会持续不断更新其他基于DeepSeek的API的好用的快捷指令和教程,建议点赞+收藏喔!
回复 支持 反对

使用道具 举报

发表于 2025-1-31 15:12 | 显示全部楼层
如果你真正重度在生产环境和日常使用过,你会发现,最好用的还是Claude Sonnet(有一次我称呼Claude 为Sonnet被她非常强硬(出乎意料的口气)地纠正了,自那之后我都叫她Claude)。
代码方面DS-R1的思维链非常适合你跟着学, 搞清楚自己哪里可能错了, 但是它的成品代码是依托答辩,完全追不上Claude。因此我最常使用R1的场景是出bug时把整个codebase扔过去,跟着他的思维链找究竟是什么文件出错了,然后思考一下可能解法,再和Claude对话。R1写设计文档是可以的,思维链很缜密。此外,Claude的知识广度似乎更大。
日常对话上,Claude的共情能力还是独一档。中文特化的知识,比如说写国内公文,小说等应该是R1更优, Claude还是有较明显的英文式中文的感觉。但是burnout我还是喜欢找Claude倒垃圾。Claude的指令理解断档领先。 目前应该有一个共识:如果问题定义清晰明确,那么AI已经几乎要做到和人类顶尖一样好了。但最大的问题就是现实问题多数定义很不明确,有的你甚至找不到问题。这导致用户的发问,深究之后会发现其实非常垃圾,因为缺失了大量信息(想想产品经理)。和Claude对话你会感觉她好像真的有点理解你想问什么(藏在文字背后的问题),因此不必反复解释你的prompt。
我觉得这些细节最能见真情。不过照顾人类用户体验可能不是deepseek的首要目标,他们应该更追求模型的上限。
回复 支持 反对

使用道具 举报

发表于 2025-1-31 15:13 | 显示全部楼层
我用经典的农夫动物过河问题做了一些测试,但是做了一些修改,使用的是DeepSeek “深度思考(R1)”模型。
补充说明:每次提问都是在一个新会话中进行,以避免上下文影响。
原始的经典问题是:
A farmer with a wolf, a goat, and a cabbage must cross a river by boat. The boat can carry only the farmer and a single item. If left alone, the wolf will eat goat, the goat will eat cabbage.
How can they cross the river without anything being eaten?

测试1:移除了问题中的动物食物链依赖,但是deepseek依然强行加上了食物链的依赖约束,当然,对于wolf/goat/cabbage来说,这种联想或许是合适的,所以姑且认为最后结果正确



测试2:用animal A/B/C来代替具体动物,依然不提供任何食物链约束,deepseek尝试了各种约束条件,甚至船的装载能力,但是它最终依然企图套用经典问题,甚至连答案的步数都强行要求和经典问题一样,最终不出所料,又得出了一个和经典问题类似的答案。我认为本次测试结果错误。


测试3:把动物换成chicken/rabbit/mouse,结果deep seek依然强行往经典问题上靠拢,甚至构造出了"the chicken might eat the mouse"的约束,它为什么一定要去构造约束?因为经典问题是有约束的,而最后的结果不出所料,依然是7步解决问题,和经典问题一样,我认为这次测试的结果失败


测试4: 在测试2 animal A/B/C 的基础上,显式地加上了关于动物之间关系的约束 "A, B, C don't eat each other. They can stay together safely."  这一次,deep seek得到了正确结果,虽然中间过程依然提到了经典的问题。但是这种问法直接否定了经典问题所描述的场景,等于直接阻止deep seek陷入经典问题的训练结果。这是逻辑么?还是本质上依然是对外界直接命令的响应?而最终得出的所谓正确结论,是否不过是来自于某处的另一份训练数据?


以下是ChatGPT的测试结果:


虽然写了5行,但本质上也是7步。
---
从以上测试可以看出,现有的所谓人工智能模型,依然非常依赖训练文本数据,它们会根据训练数据产生一些无中生有的约束,而给出的答案也无法跳出训练数据的范畴。
以上测试只是一些很明显的反例,在其它一些场合,人工智能模型给出的答案可能会隐藏着更不易发觉的错误,带来更大的危害。
与其说它们具有智能,不如说它们只是另一种搜索和模式匹配工具,也许它们可以提升对现有知识的利用效率,但所谓的逻辑推理能力,或许只是我们对这种似是而非的文字排列一厢情愿的期盼。
我赞同人类的智能离不开后天习得的知识,但那就是全部么?我不认为智能只是知识的综合,智能的主因或许不在外部知识,而在于智能体本身。外部知识只是一种唤醒智能的手段,而唤醒的成本,以及所能唤醒的智能上限,取决于智能体本身。
最后是一点个人对当前AI热潮的看法:
LLM所依赖的数学工具,比如linear algebra, probability theory, analysis... 是否足以描述intelligence?在算力和电力供应方面的大规模投入,是否能带来预期的收益?对于这些问题,即便不是悲观,我也不感到乐观,至于deep seek所说的通用人工智能(AGI),我觉得按照现行技术路线,即便不是不可能,也是非常遥远。
回复 支持 反对

使用道具 举报

发表于 2025-1-31 15:14 | 显示全部楼层
结合刚才Dario Amodei的文章,来谈谈我对DeepSeek看法,谦虚使人进步。
①Sonnet 3.5是一年前开始训练的模型,DeepSeek V3至少晚了半年多。V3大概是秋季开始做得后训练。 咱有一说一,V3代码和角色扮演上的能力,与Sonnet是有差距的。Sonnet依然是裸模代码王。而且Sonnet一直占据着GPQA的裸模王者。 这是V3的预训练落后的地方。同样的,V3也比不上最新的GPT-4o和Gemini 2。
②如果Sonnet 加上同等规模的RL,那吃吃DeepSeek R1,OpenAI o1会非常轻松。不要认为V3+R1已经暴打美国了,其实根本就没有。
③国内包括DeepSeek,依然没有自成体系的后训练大法,整得非常凌乱,非常拼凑,非常平庸。DS比较猛的地方是,它……(算了,不说了)。 ——很多人对DeepSeek的风格印象很深刻,这几天网上夸DS的也是它的风格和领会能力——可见,大家玩模的品味有了很大的进步,你整个豆包,文心一言,Kimi什么,这是要来糊弄鬼吗?谁tm现在还玩脑筋急转弯啊。—— 但DeepSeek有没有真实的后训练能力?我认为除了比较激进的RL,其他能力都是不足的,没有找到方法论,也没遇到真正懂意图领会,风格拿捏的人才。 如果DS要长时间玩下去,要被友商真正看得起,就要有自己的后训练方法论。
回复 支持 反对

使用道具 举报

发表于 2025-1-31 15:14 | 显示全部楼层
不足之处是训练资料大量使用ChatGPT的早期版本,ChatGPT随时随刻在进化,但DeepSeek是截取ChatGPT某个时间点为终点进行大量训练后发布的,这就意味着DeepSeek的答案永远落后于ChatGPT很长一段时间。即使DeepSeek随时训练自己跟上ChatGPT,但它提供的答案结果准确率也无法超越最新的ChatGPT。
     我是怎么发现这一点的:我偶然想起自己在ChatGPT刚推出时(回忆大概在2023年底或2024年初初)曾经询问ChatGPT“我家附近的乒乓球室”,答案出来好几个地方,但这些地方我去验证了一下,发现大部分是错的,即实地并不是乒乓球室,或没有乒乓球桌。
    然后今天我用同样的问题去询问DeepSeek,“我家附近”直接改成所在城镇名,结果DeepSeek给出的答案居然和约一年前ChatGPT的答案有相同错误的地址。
   然后我改问DeepSeek该城镇附近的乒乓球俱乐部,它干脆给我一堆虚假地址(即虚假的商家名称,或在地图上输入名牌号码后发现根本不是乒乓球俱乐部)。
    我重新询问ChatGPT我家附近的乒乓球俱乐部,现在ChatGPT给出的答案经过验证都是正确的。
    我认为DeepSeek的训练材料应该不止用ChatGPT的,而是市面上的其它AI产品都用了。有人一直说ChatGPT等美国AI也会用国内AI的训练材料,我认为这确实是可信的。但完全使用别人的输出来训练自己的产品,从而造成成本极低,这值得吹嘘吗?ChatGPT在简中世界中使用国内的AI来训练,是因为它能接触的简中资料渠道狭小,但它本身是采集了大量原始的英文资料来进行初始训练的,这样成本当然会奇高。如果从现在开始,大家都互相靠对方的输出来训练,那么后果是什么?大家的成本是大大降低了,但AI的智商将永远停止。
     搞研发还卷省钱,这非常可笑且无智。这等于在扼杀研发,毕竟不研发,就可以一分钱不花。
     我认为AI界最终会推出法规限制这种互相抄袭的现象。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表