Share EP-85 最新出的一款基於LLM的文件解析模型的輕量級：MonkeyOCR，效能好速度快

Copy link

June 10, 2025

EP-85 最新出的一款基於LLM的文件解析模型的輕量級：MonkeyOCR，效能好速度快

6 minutes

**最新出的一款基於LLM的文件解析模型的輕量級：MonkeyOCR，效能好速度快**

其3B在中文文檔解析任務上平均表現超過了Gemini 2.5 Pro和Qwen2.5-VL-72B

對於多頁文件解析，其處理速度達到每秒0.84頁，超過了MinerU的0.65頁/秒和Qwen2.5-VL-7B的0.12頁/秒

相較於MinerU，MonkeyOCR在九種中英文文件類型上平均表現提升了5.1%，公式辨識提升了15%，表格辨識提升了8.6%

MonkeyOCR採用「結構偵測-內容辨識-關係預測」三元組模式，在簡化傳統分層方法的多工具流程的同時，避免了直接使用多模態模型處理整文檔頁的低效性

支援多種類型中英文文檔，暫不支援照片文檔

github：https://github.com/Yuliang-Liu/MonkeyOCR

Become a free member and never miss an update: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw
Support this show: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw
Leave a comment and share your thoughts: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments

...more

View all episodes

By 梅森

June 10, 2025

EP-85 最新出的一款基於LLM的文件解析模型的輕量級：MonkeyOCR，效能好速度快

6 minutes

...more

Sign up to save your podcasts