DeepSeek新模型“杀疯了”！用视觉压缩文字，开源即获5.7k Star，Karpathy直呼：Tokenizer必须被淘汰 -

DeepSeek新模型“杀疯了”！用视觉压缩文字，开源即获5.7k Star，Karpathy直呼：Tokenizer必须被淘汰

CSDN资讯 2025-10-22 4 次浏览技术分享 CSDN

值得注意的是，DeepSeek-OCR 能识别的语言和内容非常丰富，它除了支持普通印刷文本（包括中文、英文在内的 100 多种语言）之外，还能深入解析复杂排版的图像信息。乍一听，不少人可能觉得奇怪，但其实很直观：一页文字可能需要几千个文本 token，但压缩成图像后，只需要几百个视觉 token，就能表示同样的信息，压缩率大约 10 倍。而对于 OCR 研究者来说，这则是一个全新的 SOTA（最先进）系统——性能超越了更庞大的 MinerU 2.0 和 GOT-OCR2.0，同时运行更快、占用内存更少。

视觉 OCR 文本 Token Deepseek

新闻动态

DeepSeek新模型“杀疯了”！用视觉压缩文字，开源即获5.7k Star，Karpathy直呼：Tokenizer必须被淘汰

热门项目点击查看项目详情

文化旅游资源智能推荐系统

洪洞县14个重点村乡村旅游规划项目

AI大模型-目标追踪检测AI算法

南湖景区数字化系统-商户分销结算系统

五福驾到-寺庙型景区线上祈福网站

限时特惠点击查看活动详情

官网搭建

AI算法模型研发

网站开发

微信联系方式

QQ联系方式

微信扫码查看