
作者:秉北帝 来源:原创 发布日期:05-23

细节。 在五一节假日前一天发布重磅论文,“这很DeepSeek”。但很快大家发现,官方连夜删除了多模态仓库和论文原文,5月1日打开Github界面已经是“404”状态。 关于删除原因官方并没有特别说明,不过有猜测不是内容问题,而是信息透露太多。 这次的论文说了些啥?从行业反馈来看,论文符合DeepSeek扎实且务实的风格,同样在通过工程能力降低成本,采用了新的范式,也意味着,DeepSeek
DeepSeek的解法是给模型配上一只“手指”。通过引入“视觉原语”(Visual Primitives)框架,模型将点、边界框等空间标记提升为最小思维单元。这意味着模型在推理时,能够一边“想”一边“指”,将抽象的语言逻辑指向到具体空间坐标。 这一灵感借鉴了人类的认知。论文提及,人类走迷宫或数密集物体时,会用手指这类指示性指向来降低认知负荷、维持逻辑一致性。通过将视觉原语嵌入思考,模型可以模拟
当前文章:http://d2l5.yisohuo.com/kei4/gu68.html
发布时间:03:52:44