扛麦郎 发表于 2025-2-3 10:37:14

deepseek也没说的那么厉害

24点游戏:12 12 11 3<br />
就这个一眼就知道答案的24点,deepseek思考了五分钟,打了一大版的草稿,最后得出结论:无解。<br />
看网上有人测试拿来做2023年高考数学题考了142分,目前看有点水分,各位大佬觉得如何

奧巴马 发表于 2025-2-3 10:57:14

问一些rust 代码问题deep都答不上来的。感觉deep的推理很弱。只要是网上没有的答案!永远答不出来!

iiii.im 发表于 2025-2-3 10:41:37

我也用了几天,还是不如gpt

yabs 发表于 2025-2-3 10:42:22

人家那么多权威评比不看,自己拿几个案例有啥用<br />
日常用没啥问题,反正我用免费的openai和deepseek没感觉太大区别<br />
付费的没用过

Google执行董事 发表于 2025-2-3 10:48:31

乐了,自己看看你家GPT o1,(12−3)×(12/11)=24

Google执行董事 发表于 2025-2-3 10:53:39

散了吧,这蠢货鉴定为纯黑子,实测R1思考一次107秒就能解出来

pykane 发表于 2025-2-3 10:59:38

这种例子意义不在在。<br />
之前 试4o 和 V3. <br />
4o 连 9.9 和 9.11 谁大都能算错。<br />
<br />
所有的AI都不是完美的,他们的答案,都是有一定随机性。<br />
关键在于你在平时使用着,谁帮助你最大。这才是最重要的。<br />
如果你觉得GPT.能帮你,你就用GPT就行了。<br />
AI就是个工具。<br />
DS最大的功破案率是把GPT 价格打下来,这还不够么?<br />
如果真的那么烂。GPT 没必要有啥反应。有反应也说明,打到痛点了。

蒙面人 发表于 2025-2-3 11:07:57

<div class="quote"><blockquote><font color="#999999">pykane 发表于 2025-2-3 10:59</font><br />
<font color="#999999">这种例子意义不在在。<br />
之前 试4o 和 V3. <br />
4o 连 9.9 和 9.11 谁大都能算错。<br />
</font></blockquote></div><br />
gpt有反应,但不大,倒是某些人感觉像亲妈爆炸了

rqp 发表于 2025-2-3 10:59:00

<img src="https://hostloc.com/static/image/smiley/default/titter.gif" smilieid="9" border="0" alt="" /><img src="https://hostloc.com/static/image/smiley/default/titter.gif" smilieid="9" border="0" alt="" /><img src="https://hostloc.com/static/image/smiley/default/titter.gif" smilieid="9" border="0" alt="" />

327253236poko 发表于 2025-2-4 14:04:55

<i class="pstatus"> 本帖最后由 327253236 于 2025-2-4 14:18 编辑 </i><br />
<br />
这群台蛙跳梁小丑,不予理会才是正解。纯黑呢?1.5B的deep seek R1就能算了还算不出来?<br />
<br />
<img id="aimg_zNn94" onclick="zoom(this, this.src, 0, 0, 0)" class="zoom" src="https://i.mij.rip/2025/02/04/b24a3aabb0b179126b4ab86fb58d2104.png" onmouseover="img_onmouseoverfunc(this)" onload="thumbImg(this)" border="0" alt="" />
页: [1]
查看完整版本: deepseek也没说的那么厉害