×
微信联系方式
微信二维码

扫描二维码添加微信

微信号:18103268866

添加微信后可获取更多优惠信息
×
QQ联系方式
QQ二维码

扫描二维码添加QQ

QQ号:3525642302

添加QQ后可获取更多优惠信息
×
微信扫码查看

请使用微信扫描二维码查看当前页面

扫描二维码后可在微信中分享给好友

新闻动态

DeepSeek新模型“杀疯了”!用视觉压缩文字,开源即获5.7k Star,Karpathy直呼:Tokenizer必须被淘汰

CSDN资讯 2025-10-22 4 次浏览 技术分享 CSDN

值得注意的是,DeepSeek-OCR 能识别的语言和内容非常丰富,它除了支持普通印刷文本(包括中文、英文在内的 100 多种语言)之外,还能深入解析复杂排版的图像信息。乍一听,不少人可能觉得奇怪,但其实很直观:一页文字可能需要几千个文本 token,但压缩成图像后,只需要几百个视觉 token,就能表示同样的信息,压缩率大约 10 倍。而对于 OCR 研究者来说,这则是一个全新的 SOTA(最先进)系统——性能超越了更庞大的 MinerU 2.0 和 GOT-OCR2.0,同时运行更快、占用内存更少。