Deepseek R1 671b on a $500 AI PC!
u2b t_hh2-KG6Bw<br />有大佬懂 这671B 有水分吗? 怎么可能,内存都不够吧 <div class="quote"><blockquote><font size="2"><a href="https://hostloc.com/forum.php?mod=redirect&goto=findpost&pid=16383165&ptid=1410162" target="_blank"><font color="#999999">doruison 发表于 2025-5-18 19:53</font></a></font><br />
怎么可能,内存都不够吧</blockquote></div><br />
t_hh2-KG6Bw <br />
这么快看完了? <i class="pstatus"> 本帖最后由 dd998 于 2025-5-18 20:37 编辑 </i><br />
<br />
是Q4量化版,压根就不是满血版。<br />
<br />
看他视频里面屏幕显示的只有 0.75 token/s<br />
<br />
很慢的,一个字一个字的蹦,无实用价值啊。<br />
<br />
比之前清华大学那个在个人笔记本电脑上装的deepseek号称满血版稍微快点。<br />
<br />
但是还是没法用。 <div class="quote"><blockquote><font size="2"><a href="https://hostloc.com/forum.php?mod=redirect&goto=findpost&pid=16383193&ptid=1410162" target="_blank"><font color="#999999">dd998 发表于 2025-5-18 20:32</font></a></font><br />
是Q4量化版,压根就不是满血版。<br />
<br />
看他视频里面屏幕显示的只有 0.75 token/s</blockquote></div><br />
慢点是真满血版,无非是慢点,结果是对的<br />
int4量化,或者小参数版本,可能结果都对不上
页:
[1]