Topic
#pdf-parsing
按主题聚合的新闻视图。
Topic Feed
主题:pdf-parsing
共 1 条

LiteParse可在浏览器中运行,实现PDF文本提取
西蒙·威尔森已将LiteParse——一个用于从PDF中提取结构化文本的Node.js工具——移植到浏览器中运行,使用PDF.js和Tesseract.js。它现在支持空间文本解析、OCR和边界框生成,且数据不会离开用户的设备。
Topic
按主题聚合的新闻视图。
Topic Feed
共 1 条

西蒙·威尔森已将LiteParse——一个用于从PDF中提取结构化文本的Node.js工具——移植到浏览器中运行,使用PDF.js和Tesseract.js。它现在支持空间文本解析、OCR和边界框生成,且数据不会离开用户的设备。