deepseek也没说的那么厉害

扛麦郎 发表于 2025-2-3 10:37:14

24点游戏：12 12 11 3 
就这个一眼就知道答案的24点，deepseek思考了五分钟，打了一大版的草稿，最后得出结论：无解。 
看网上有人测试拿来做2023年高考数学题考了142分，目前看有点水分，各位大佬觉得如何

奧巴马 发表于 2025-2-3 10:57:14

问一些rust 代码问题deep都答不上来的。感觉deep的推理很弱。只要是网上没有的答案！永远答不出来！

iiii.im 发表于 2025-2-3 10:41:37

我也用了几天，还是不如gpt

yabs 发表于 2025-2-3 10:42:22

人家那么多权威评比不看，自己拿几个案例有啥用 
日常用没啥问题，反正我用免费的openai和deepseek没感觉太大区别 
付费的没用过

Google执行董事 发表于 2025-2-3 10:48:31

乐了，自己看看你家GPT o1，(12−3)×(12/11)=24

Google执行董事 发表于 2025-2-3 10:53:39

散了吧，这蠢货鉴定为纯黑子，实测R1思考一次107秒就能解出来

pykane 发表于 2025-2-3 10:59:38

这种例子意义不在在。 
之前试4o 和 V3. 
4o 连 9.9 和 9.11 谁大都能算错。 
 
所有的AI都不是完美的，他们的答案，都是有一定随机性。 
关键在于你在平时使用着，谁帮助你最大。这才是最重要的。 
如果你觉得GPT.能帮你，你就用GPT就行了。 
AI就是个工具。 
DS最大的功破案率是把GPT 价格打下来，这还不够么？ 
如果真的那么烂。GPT 没必要有啥反应。有反应也说明，打到痛点了。

蒙面人 发表于 2025-2-3 11:07:57

<div class="quote"><blockquote>pykane 发表于 2025-2-3 10:59 
这种例子意义不在在。 
之前试4o 和 V3. 
4o 连 9.9 和 9.11 谁大都能算错。 
</blockquote></div> 
gpt有反应，但不大，倒是某些人感觉像亲妈爆炸了

rqp 发表于 2025-2-3 10:59:00

327253236poko 发表于 2025-2-4 14:04:55

本帖最后由 327253236 于 2025-2-4 14:18 编辑 
 
这群台蛙跳梁小丑，不予理会才是正解。纯黑呢？1.5B的deep seek R1就能算了还算不出来？ 
 
<img id="aimg_zNn94" onclick="zoom(this, this.src, 0, 0, 0)" class="zoom" src="https://i.mij.rip/2025/02/04/b24a3aabb0b179126b4ab86fb58d2104.png" onmouseover="img_onmouseoverfunc(this)" onload="thumbImg(this)" border="0" alt="" />

页: [1]

全球主机交流论坛备用站's Archiver

deepseek也没说的那么厉害