
此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:
DeepSeek上次更新为8月21日,短短一个月,取得这一成绩来之不易,可喜可贺。
值得一提的是,新模型在Humanitys Last Exam(人类最后的考试)中,成绩提升幅度高达36.48%!
之前,有网友发现:DeepSeek V3.1输出中随机带有「极」字。网友称:
这一Bug已经导致DeepSeek V3.1无法从事编程或对输出结构敏感的相关工作。希望官方早日修复。
这次更新明确已解决「偶发异常字符等情况」,结合「Code Agent优化」,希望这次更新能完美解决DeepSeek无法从事编程或对输出结构敏感的相关工作的Bug。
至于中英文混杂,是LLM的老毛病了,比如OpenAI o3-mini等模型被曝使用中文推理。
我们也对之前在网上流传最广的会触发「极你太美」Bug的Prompt进行了测试:
IM电竞,IM电竞官网,IM电竞注册,电竞投注平台,电竞博彩,英雄联盟竞猜
现在,新模型给出了5种定时器实现方法,多处都使用了time.Second。
我们经过多次尝试,均未能复现出该Bug,说明Bug确实可能已经被修复了。
与DeepSeek-V3.1相比,新模型在工具使用与Agent任务中的表现有较大提升:
在计算机术语中,终端(Terminal)也称终端设备,是计算机网络中处于网络最外围的设备,主要用于用户信息的输入以及处理结果的输出等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Shams:火箭与22年17号秀伊森提前续约失败,双方在多方面存在分歧
“最快女护士”张水华复出刷新个人最好成绩,就职医院回应:保证医疗安全、本职服务基础上,可以有个人兴趣爱好
NASA急了,登月不用星舰?马斯克:记住我的线名中国用户举报苹果:中外双标,滥用支配地位
梦幻联动:努比亚 Z80 Ultra 将推出“徐州老味菜”同名滤镜/水印
北方大面积降温上热搜!华润置地出手,在三亚CBD重塑热带度假人居格局!
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律