5天GitHub Star破万!百度Unlimited OCR引爆全球技术圈,跻身开源“现象级爆款”
这一突破不仅提升了 OCR 在长文档场景下的可用性,也为大模型长期记忆管理提供了新的技术思路。近年来,行业普遍通过扩展上下文窗口来增强长程能力,而 Unlimited OCR 则探索了另一条路径——通过更高效的注意力机制和记忆管理策略,让模型“学会保留关键上下文、适度遗忘历史信息”,以更稳定、更经济的方式完成超长任务。过去,OCR 模型面对书籍、论文、报告等长文档时,通常需要采用“逐页解析+结果拼接”的工程方案,随着输出内容不断增长,解码阶段的 KV Cache 持续膨胀,推理速度和显存成本也随之增加。










