百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

如何在Java中将DOCX转换为PDF java将word转化为pdf

bigegpt 2024-10-14 08:19 7 浏览

自从Microsoft Word 2003中引入DOCX格式以来,由于其易于编辑和深入的设计选择,DOCX格式一直在全球各地的办公室中享有很高的知名度。但是9当涉及到兼容性,尤其是最终用户的查看一致性时,它的局限性开始显现出来。

它的复杂性很快就成为一种负担,兼容应用程序的不同版本会给您艰苦的设计带来意想不到的(通常是不幸的)后果。相反,无论设备,操作系统还是应用程序,PDF都具有无所不在的支持和无与伦比的一致显示保真度。但有啥用?,要进行编辑时,PDF也不实用。转换肯定冲会员。

由于这些优点和缺点,在两种格式之间进行转换仍然非常必要,而且在许多情况下通常很关键。手动将少量DOCX文件转换为PDF格式可能很简单,但工作中有很多呢?需要机械性重复呢?从程序角度看待这种转换,必须解决许多问题。

我们的主要问题是首先解析DOCX文件。这样做的主要原因是DOCX非常复杂。此格式的ECMA规范包括5000页,并定期添加新功能。另外,DOCX中的选择深度成为一把双刃剑。另一个问题是DOCX文件实际上是包含多个元数据和文档文件的压缩存档。使用“ rels”对这些文件之间的关系进行排序当然不是一件容易的事。而且,我们甚至还没有解决将所有解析后的数据转换成最终PDF的问题。

让我们假设没有开发时间或预算来从头开始研究整个过程。本教程将展示如何通过使用基于云的API来执行从DOCX到PDF的转换来解决这一难题。还将介绍如何使用此API对DOCX文件执行搜索和替换操作。

实际上,以编程方式对DOCX文件执行搜索和替换非常困难,因为它直接遇到了前面提到的解析问题。但还好的是,我们的API也可以为我们执行此任务。将所有这些放在一起,将使我们能够使用DOCX的编辑功能轻松地为报告,发票,邮件等创建富文本模板,并通过搜索和替换填充它们,然后将它们转换为PDF格式。因此,我们可以利用DOCX的优势来弥补PDF中缺少编辑选项。

在今天的演示中,我们的主要目标是在转换中保持最高的保真度。重要的设计选择(如页面布局,表格和注释)将保持不变。话虽如此,让我们开始设置过程。

我们的第一步包括安装API客户端。向我们的Maven POM文件添加一个存储库引用,如下所示:

XML格式

<repositories>
    <repository>
        <id>jitpack.io</id>
        <url>https://jitpack.io</url>
    </repository>
</repositories>


在添加以下依赖项引用之后,这将允许Jitpack动态编译我们的库:

XML格式

<dependencies>
<dependency>
    <groupId>com.github.Cloudmersive</groupId>
    <artifactId>Cloudmersive.APIClient.Java</artifactId>
    <version>v3.62</version>
</dependency>
</dependencies>


编译我们的库之后,我们现在可以将其实现到控制器中了。只需将这些导入命令添加到文件的开头即可。

// Import classes:
//import com.cloudmersive.client.invoker.ApiClient;
//import com.cloudmersive.client.invoker.ApiException;
//import com.cloudmersive.client.invoker.Configuration;
//import com.cloudmersive.client.invoker.auth.*;
//import com.cloudmersive.client.EditDocumentApi;


现在是时候调用我们的第一个函数,在本例中为convertDocumentDocxToPdf。下面是一些示例代码,演示了如何构造此代码。

piClient defaultClient = Configuration.getDefaultApiClient();
// Configure API key authorization: Apikey
ApiKeyAuth Apikey = (ApiKeyAuth) defaultClient.getAuthentication("Apikey");
Apikey.setApiKey("YOUR API KEY");
// Uncomment the following line to set a prefix for the API key, e.g. "Token" (defaults to null)
//Apikey.setApiKeyPrefix("Token");
EditDocumentApi apiInstance = new EditDocumentApi();
ReplaceStringRequest reqConfig = new ReplaceStringRequest(); // ReplaceStringRequest | Document string replacement configuration input
try {
    byte[] result = apiInstance.editDocumentDocxReplace(reqConfig);
    System.out.println(result);
} catch (ApiException e) {
    System.err.println("Exception when calling EditDocumentApi#editDocumentDocxReplace");
    e.printStackTrace();
}


尽管不是特别复杂,但必须遵循一些要求:

  • 有效的DOCX文档应用作我们的inputFile
  • 必须从API实例调用我们的函数
  • 使用API密钥,可以从Cloudmersive网站免费获得。该密钥是免费的,永久有效,将输入文件限制为4MB,并允许从任何Cloudmersive API调用1,000个API。

完成之后,就完成了DOCX to PDF的设置。如果进行测试运行,将看到我们已经可以开始实时转换文档。

现在让我们转向使用DOCX模板创建富文本PDF文档的问题。搜索和替换是动态替换字段以填充这些模板的理想工具。对于单个搜索和替换操作,可以使用editDocumentDocxReplace,它将接受ReplaceStringRequest对象。它由一个inputFile(通过字节数组或URL),要搜索的matchString,replaceString和matchCase bool组成,后者确定是否考虑字母大小写。这是一些示例代码,您可以将其用作参考:

ApiClient defaultClient = Configuration.getDefaultApiClient();
//配置API密钥授权:Apikey
ApiKeyAuth Apikey = (ApiKeyAuth) defaultClient.getAuthentication("Apikey");
Apikey.setApiKey("YOUR API KEY");
//取消注释以下行以设置API密钥的前缀,例如“ Token”(默认为null)
//Apikey.setApiKeyPrefix("Token“);
EditDocumentApi apiInstance = new EditDocumentApi();
ReplaceStringRequest reqConfig = new ReplaceStringRequest(); // ReplaceStringRequest | 文档字符串替换配置输入
try {
    byte[] result = apiInstance.editDocumentDocxReplace(reqConfig);
    System.out.println(result);
} catch (ApiException e) {
    System.err.println("Exception when calling EditDocumentApi#editDocumentDocxReplace");
    e.printStackTrace();
}

那么,如果需要一次替换大量字符串怎么办?不必重复调用前面提到的函数,我们可以改用editDocumentDocxReplaceMulti。此函数还接受一个请求对象,该对象包含一个单独的字符串替换请求数组,每个请求都有自己的matchString和replaceString。这样可以快速替换字符串,使其在与DOCX模板结合使用时特别有用。例如,可以通过单个函数实时地以诸如名称,地址和日期之类的值填充表单中的所有各个字段。

在该库中,还可以找到用于标识和填充PDF表单字段,检索和编辑元数据,文件验证以及多种流行文件格式之间的转换的功能。

相关推荐

得物可观测平台架构升级:基于GreptimeDB的全新监控体系实践

一、摘要在前端可观测分析场景中,需要实时观测并处理多地、多环境的运行情况,以保障Web应用和移动端的可用性与性能。传统方案往往依赖代理Agent→消息队列→流计算引擎→OLAP存储...

warm-flow新春版:网关直连和流程图重构

本期主要解决了网关直连和流程图重构,可以自此之后可支持各种复杂的网关混合、多网关直连使用。-新增Ruoyi-Vue-Plus优秀开源集成案例更新日志[feat]导入、导出和保存等新增json格式支持...

扣子空间体验报告

在数字化时代,智能工具的应用正不断拓展到我们工作和生活的各个角落。从任务规划到项目执行,再到任务管理,作者深入探讨了这款工具在不同场景下的表现和潜力。通过具体的应用实例,文章展示了扣子空间如何帮助用户...

spider-flow:开源的可视化方式定义爬虫方案

spider-flow简介spider-flow是一个爬虫平台,以可视化推拽方式定义爬取流程,无需代码即可实现一个爬虫服务。spider-flow特性支持css选择器、正则提取支持JSON/XML格式...

solon-flow 你好世界!

solon-flow是一个基础级的流处理引擎(可用于业务规则、决策处理、计算编排、流程审批等......)。提供有“开放式”驱动定制支持,像jdbc有mysql或pgsql等驱动,可...

新一代开源爬虫平台:SpiderFlow

SpiderFlow:新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。-精选真开源,释放新价值。概览Spider-Flow是一个开源的、面向所有用户的Web端爬虫构建平台,它使用Ja...

通过 SQL 训练机器学习模型的引擎

关注薪资待遇的同学应该知道,机器学习相关的岗位工资普遍偏高啊。同时随着各种通用机器学习框架的出现,机器学习的门槛也在逐渐降低,训练一个简单的机器学习模型变得不那么难。但是不得不承认对于一些数据相关的工...

鼠须管输入法rime for Mac

鼠须管输入法forMac是一款十分新颖的跨平台输入法软件,全名是中州韵输入法引擎,鼠须管输入法mac版不仅仅是一个输入法,而是一个输入法算法框架。Rime的基础架构十分精良,一套算法支持了拼音、...

Go语言 1.20 版本正式发布:新版详细介绍

Go1.20简介最新的Go版本1.20在Go1.19发布六个月后发布。它的大部分更改都在工具链、运行时和库的实现中。一如既往,该版本保持了Go1的兼容性承诺。我们期望几乎所...

iOS 10平台SpriteKit新特性之Tile Maps(上)

简介苹果公司在WWDC2016大会上向人们展示了一大批新的好东西。其中之一就是SpriteKitTileEditor。这款工具易于上手,而且看起来速度特别快。在本教程中,你将了解关于TileE...

程序员简历例句—范例Java、Python、C++模板

个人简介通用简介:有良好的代码风格,通过添加注释提高代码可读性,注重代码质量,研读过XXX,XXX等多个开源项目源码从而学习增强代码的健壮性与扩展性。具备良好的代码编程习惯及文档编写能力,参与多个高...

Telerik UI for iOS Q3 2015正式发布

近日,TelerikUIforiOS正式发布了Q32015。新版本新增对XCode7、Swift2.0和iOS9的支持,同时还新增了对数轴、不连续的日期时间轴等;改进TKDataPoin...

ios使用ijkplayer+nginx进行视频直播

上两节,我们讲到使用nginx和ngixn的rtmp模块搭建直播的服务器,接着我们讲解了在Android使用ijkplayer来作为我们的视频直播播放器,整个过程中,需要注意的就是ijlplayer编...

IOS技术分享|iOS快速生成开发文档(一)

前言对于开发人员而言,文档的作用不言而喻。文档不仅可以提高软件开发效率,还能便于以后的软件开发、使用和维护。本文主要讲述Objective-C快速生成开发文档工具appledoc。简介apple...

macOS下配置VS Code C++开发环境

本文介绍在苹果macOS操作系统下,配置VisualStudioCode的C/C++开发环境的过程,本环境使用Clang/LLVM编译器和调试器。一、前置条件本文默认前置条件是,您的开发设备已...