DeepSeek昨夜上新!新旧版V3对比实测，代码能力飙升，震惊海外用户

boyanx7个月前 (05-15)技术教程37

来源：智东西

作者 | 陈骏达编辑 | 漠影

智东西3月25日报道，昨日晚间，DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324，模型参数为6850亿，较早期版本的6710亿有小幅增长。不过，DeepSeek尚未放出新版模型的系统卡，我们暂时无法获取关于这款模型的更多信息。

开源地址：
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

同时，DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议，这一协议更为宽松，允许模型蒸馏、商用等行为，给了开发者更多的自主权。

新版DeepSeek-V3上线后，智东西第一时间进行了代码、数学和通用能力等多方面的测试，并关注到广大网友的测试结果。据众多已经体验上这款模型的网友分享，升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。

一位海外AI博主称，DeepSeek终于能在代码领域和Anthropic的Claude Sonnet 3.5一决高下了。而之前，Claude Sonnet 3.5在程序员圈内拥有极高的声誉，无论诸多模型在代码上的成绩如何变化，程序员依旧更青睐使用Claude系列模型。

在智东西的测试中，新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大的进步，在输入“设计一个美观的个人博客网站，带有科技感，直接开发成可用网页”的提示词之后，直接获得了如下的网页效果。

新版DeepSeek-V3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站，据其介绍，网站采用了粒子背景动画、赛博朋克UI（霓虹光效、悬浮动画和科技感配色）等设计元素，标题使用打字机动画，按钮具备光波扩散效果。

这一网站还使用了响应式设计，能自动适配手机和桌面设备。

而当旧版DeepSeek-V3获得相同的指令时，其解决方案仅有100多行代码，输出的结果在审美上也不如新版的DeepSeek-V3。

有网友称，这次的“小更新”比预期中的更大，改进显著，尤其是在数学方面。

智东西将之前实测中，曾难倒旧版DeepSeek-V3和DeepSeek-R1的一道数学题交给新版DeepSeek-V3。这次，DeepSeek-V3输出的token与原版DeepSeek-V3总量明显更长，单次输出达到了输出上限，点击继续生成后，DeepSeek-V3继续思考，但这次的答案依旧是错误的。

不过，从错误的答案中，我们也能观察到一些新的变化，如今的DeepSeek-V3在给出最终答案后，会进行一定程度的反思，并修改自己的解题过程。

而在智东西先前测试的文科类问题上，新版DeepSeek-V3的答案变得更为全面。智东西的测试问题为：“布须曼人喝不喝牛奶？”旧版DeepSeek-V3对这一问题的回答仅有三小段话，信息量不多。

新版DeepSeek-V3采用了更为结构化的回答模式，分析的内容更为全面，补充了更多的背景信息，同时生成的速度依旧比较理想。

这也印证了部分网友总结出来的特点：新版DeepSeek-V3像是V3与R1的结合体，更倾向用长输出解决问题。

新版DeepSeek-V3的发布，也让诸多网友不禁遐想：新版V3都来了，R2和V4还会远吗？

标签: 代码在线比对

返回列表

上一篇：python编程错误“大侦探”:如何精准揪出代码中的小调皮

下一篇：用Python进行机器学习(13)-图像特征提取

博阳资源网

DeepSeek昨夜上新!新旧版V3对比实测，代码能力飙升，震惊海外用户

相关文章

在 VS Code 中解决代码冲突的两种方法

深入详解Python的比较运算

别让这5个编程习惯毁了你的代码!AI检测工具帮你一键修复

python编程错误“大侦探”:如何精准揪出代码中的小调皮

在 MySQL 中使用 TINYINT 类型进行比较查询时，需要注意的事项

揭秘:打造一套完整的勒索病毒自动化采集分析系统

发表评论

滇ICP备2024046894号-21

DeepSeek昨夜上新!新旧版V3对比实测，代码能力飙升，震惊海外用户

相关文章

发表评论 取消回复

发表评论