当前位置:首页 > 软件下载 > 应用软件

PDF Data Extractor(PDF数据提取软件)v2.02官方版

点此纠错

  • 平台:WinAll
  • 大小:62.2M
  • 语言:英文
  • 类别:应用软件
  • 授权:免费软件
  • 更新:2021-10-28
5.0
0% 0%

情介绍


PDFDataExtractorPDF数据提取软件是一款非常优秀的PDF数据提取软件。用户可以使用该软件从PDF文件中提取文本信息。在软件中,用户可以设置信息提取规则,自定义信息提取范围。









PDF Data Extractor(PDF数据提取软件)是一款非常优秀的PDF数据提取软件。用户可以使用该软件从PDF文件中提取文本信息。在软件中,用户可以设置信息提取规则,自定义信息提取。范围,并支持过滤文本等。



PDF  Data  Extractor(PDF数据提取软件)



基本介绍



PDF Data Extractor 可以从PDF 中提取某些文本信息,如果您有一个PDF 语句,需要提取帐号、姓名、地址等数据并将这些信息输出到Excel CSV,那么这是一个理想的产品文件。它使用水平、垂直文本位置匹配,对于更高级的匹配,它有一个用于条件匹配的规则系统,例如仅当帐户:文本位于同一页面上时才匹配。不同的字段也可以合并为一个,因此名字和姓氏可以作为一个字段输出到CSV 文件。许多选项可用:数据提取、OCR pdf 选项、OCR 数字校正、调整倾斜的pdf 页面选项、对希伯来语等其他语言文件的完整Uni 代码支持、从右到左的阅读顺序选项、用于处理粉碎扫描PDF 的页面文字偏移量、数字、日期和货币过滤、数据列顺序分配、在命令行上运行、标题输出、页码字段、文件名字段、批处理文件列表、32 位和64 位版本。



现在还可以根据提取的数据重命名文件或将文件复制到新位置。



特征



支持Windows XP、2003、2008、2012、2016、2019、Windows 7、Vista、8 和Windows 10



32 位和64 位版本可实现更快的处理速度



文件名和文本中支持英语、日语、中文、希伯来语等所有语言的Uni 代码



从多页pdf 中提取数据的项目符号



来自源pdf 的多个输出字段,按之前的文本、位置、第一个匹配项和最后一个匹配项向下和向上匹配选项。



项目符号条件匹配规则系统



带项目符号的输出字段,例如:总页数、匹配页码、文件名



项目符号列输出位置选项



Bullet OCR pdf 第一个选项



项目符号日期/金钱/字母/数字输出过滤



项目符号将文本复制到剪贴板选项以放置在其他软件中



用于处理扫描的pdf文件的偏移起始位置,例如被切断或倾斜的标题,因此所有位置都可以从某个稳定的文本点计算出来



项目符号修复稍微倾斜的扫描位置的垂直文本选项四舍五入到最近的5 点



用于向后镜像扫描的项目符号反向文本选项



对希伯来语等语言的从右到左单词选项支持



使用批量列表处理对pdf进行批量列表处理



可以选择在命令行上运行以实现自动化



根据提取的数据重命名或将文件复制到新位置



Bullets 支持除加密和保护之外的所有pdf 类型。



项目符号自动保存设置以供以后使用



项目符号已处理、错误和移动的文件的完整文档。



子弹安装程序



完整的HTML 和PDF 帮助



软件特点



直观的图形界面和大量工具



该应用程序的安装时间并不长,并且在实际使用其功能之前不需要完成复杂的设置。它具有真正直观的图形界面,包含大量工具和功能。



该应用程序允许您从PDF 文档中提取某些文本信息。例如,如果您有一个PDF 报表,需要提取帐号、姓名、地址等数据并将这些信息输出到Excel csv 文件中,那么它将是一个有用的程序。



从PDF 文档中提取文本



启动应用程序后,您需要做的第一件事是浏览计算机并找到您想要使用的PDF 文档。然后您必须选择页码,应用程序将在记事本中显示文本,以便您可以提取它。



它使用水平、垂直文本位置匹配,对于更高级的匹配,它具有用于条件匹配的规则系统。



更多功能和工具



您可以根据提取的数据重命名文件或将文件复制到新位置。它具有更多选项,例如数据提取、在命令行上运行、标头输出、页码字段、文件名字段、要处理的文件的批处理列表等。



总而言之,PDF Data Extractor 是一个非常好的应用程序,您可以使用它从各种PDF 文档中提取文本。



变更日志



1.修复扫描OCR问题。



2.修复了一行全部输出和批量处理的问题,现在每个文件后会自动添加一个换行符。



3. 对每个文件一行和位置处理进行一些改进。



4. 修复潜在的换行问题。