ITPub博客

首页 > 应用开发 > Java > Java 将Word转为HTML的方法

Java 将Word转为HTML的方法

原创 Java 作者:Mia张 时间:2021-10-09 13:47:13 0 删除 编辑

本文介绍如何在JAVA程序中将Word文档通过 Document.saveToFile() 方法转换为HTML文档。编辑代码前,参考如下环境配置,导入jar包。

【程序环境】

1. IntelliJ IDEA 2018( jdk 1.8.0)

2. 测试文档:Word 2013(.docx)

3. Jar包:Free Spire.Doc for Java 3.9.0

导入jar的两种方法:

方法1:下载jar包到本地,解压,将本地lib文件夹下的Spire.Doc.jar导入Java程序,步骤如下:

导入结果:


方法2 maven程序中需要配置pom.xml文件,指定maven仓库路径和spire.doc.free的依赖,配置内容如下:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>
        </repository>
    </repositories>
 
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>3.9.0</version>
    </dependency>
</dependencies>


【Java】

import com.spire.doc.*;
 
 public class WordtoHtml {
     public static void main(String[] args) {
         Document  doc = new Document();
         doc.loadFromFile("样本.docx");
         doc.saveToFile("wordtohtml.html",FileFormat.Html);
         doc.dispose();
     }
 }


【转换效果】

Word文档:


转换后的HTML文件:



:代码中的文件路径为IDEA程序项目文件夹路径,如 F:\IDEAProject\Conversion_Doc\test.docx ,文件路径可以另行自定义为其他路径。


另外可阅读更多关于Word转为其他文件格式的方法:

  • Java 将Word转为Tiff(http://blog.itpub.net/31499788/viewspace-2776921/)

  • Java 将Word转为XML以及XML转为Word的方法(http://blog.itpub.net/31499788/viewspace-2769027/)

  • Java 将Word转为PDF、PNG、SVG、RTF、XPS、TXT、XML(http://blog.itpub.net/31499788/viewspace-2665858/)


—End—



来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31499788/viewspace-2795076/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2017-10-27

  • 博文量
    127
  • 访问量
    85535