Topic

#pdf-parsing

按主题聚合的新闻视图。

主题:pdf-parsing

共 1 条

  1. LiteParse可在浏览器中运行,实现PDF文本提取

    Simon Willison·

    LiteParse可在浏览器中运行,实现PDF文本提取

    西蒙·威尔森已将LiteParse——一个用于从PDF中提取结构化文本的Node.js工具——移植到浏览器中运行,使用PDF.js和Tesseract.js。它现在支持空间文本解析、OCR和边界框生成,且数据不会离开用户的设备。