OpenOffice将doc转为pdf,再转为image(作者正式环境中的代码)

package test;
import java.awt.image.BufferedImage;
import java.awt.image.RenderedImage;
import java.io.File;
import java.io.IOException;
import java.net.ConnectException;
import java.util.ArrayList;
import java.util.List;
import javax.imageio.ImageIO;
import org.apache.commons.io.FilenameUtils;
import org.icepdf.core.pobjects.Document;
import org.icepdf.core.pobjects.Page;
import org.icepdf.core.util.GraphicsRenderingHints;
import com.artofsolving.jodconverter.DefaultDocumentFormatRegistry;
import com.artofsolving.jodconverter.DocumentConverter;
import com.artofsolving.jodconverter.DocumentFormat;
import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;
public class FileToImgUtil {
    private static OpenOfficeConnection startOpenOffice(){
        //OpenOffice的安装目录,linux环境下需要手动启动openoffice服务
        String OpenOffice_HOME = "D:\\Apache-OpenOffice-3.0\\openOffice.org\\OpenOffice.org 3\\";
        // 启动OpenOffice的服务
        String command = OpenOffice_HOME+ "program\\soffice.exe -headless -accept=\"socket,host=127.0.0.1,port=8100;urp;\"";
        try {
            Process pro = Runtime.getRuntime().exec(command);
        } catch (IOException e) {
            e.printStackTrace();
        }
        //创建连接
        OpenOfficeConnection connection = new SocketOpenOfficeConnection("127.0.0.1", 8100);
        return connection;
    }
    private static void doc2Pdf(String docPath, String pdfPath) throws ConnectException {
        File inputFile = new File(docPath);
        File outputFile = new File(pdfPath);
        OpenOfficeConnection connection = startOpenOffice();
        connection.connect();
        DocumentConverter converter = new OpenOfficeDocumentConverter(connection);
        //converter.convert(inputFile, outputFile);
        DefaultDocumentFormatRegistry formatReg = new DefaultDocumentFormatRegistry();   
        DocumentFormat txt = formatReg.getFormatByFileExtension("odt") ;
        DocumentFormat pdf = formatReg.getFormatByFileExtension("pdf") ;
        converter.convert(inputFile, txt, outputFile, pdf);
        connection.disconnect();
    }
    /**
     * 把ppt word excel等文件生成图片文件
     * @param docPath 文件路径
     * @param imgDirPath 图片保存文件夹
     * @param fileName 文件名称点的前部分
     */
    public static void doc2Imags(String docPath, String imgDirPath,String fileName){
        String pdfPath =String.format("%s%s.pdf",  FilenameUtils.getFullPath(docPath), FilenameUtils.getBaseName(docPath));
        try {
            doc2Pdf(docPath, pdfPath);
            pdf2Imgs(pdfPath, imgDirPath,fileName);
            File pdf =  new File(pdfPath);
            /*if(pdf.isFile()){
                pdf.delete();
            }*/
            System.out.println(pdfPath);
        } catch (ConnectException e) {
            e.printStackTrace();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    /**
     * 将pdf转换成图片
     *
     * @param pdfPath
     * @param imagePath
     * @return 返回转换后图片的名字
     * @throws Exception
     */
    private static List<String> pdf2Imgs(String pdfPath, String imgDirPath,String fileName) throws Exception {
        Document document = new Document();
        document.setFile(pdfPath);
        float scale = 2f;//放大倍数
        float rotation = 0f;//旋转角度
        List<String> imgNames = new ArrayList<String>();
        int pageNum = document.getNumberOfPages();
        File imgDir = new File(imgDirPath);
        if (!imgDir.exists()) {
            imgDir.mkdirs();
        }
        for (int i = 0; i < pageNum; i++) {
            BufferedImage image = (BufferedImage) document.getPageImage(i, GraphicsRenderingHints.SCREEN,
                    Page.BOUNDARY_CROPBOX, rotation, scale);
            RenderedImage rendImage = image;
            try {
                String filePath = imgDirPath + File.separator +fileName+i + ".jpg";
                File file = new File(filePath);
                ImageIO.write(rendImage, "jpg", file);
                imgNames.add(FilenameUtils.getName(filePath));
            } catch (IOException e) {
                e.printStackTrace();
                return null;
            }
            image.flush();
        }
        document.dispose();
        return imgNames;
    }
    
    public static void main(String[] args) {
        //String docPath = "d:/94_storage安装.doc";
        String docPath = "C:\\Users\\John\\Desktop\\测试文件3.xlsx";
        String pdfPath = "C:\\Users\\John\\Desktop\\";
        doc2Imags(docPath, pdfPath,"公司通讯录");
    }
}

注:需要注意jar包的问题,会各种jar的兼容性问题,下面的linux环境中测试已给出作者亲自测试的正常jar包

linux下通过直接运行class文件

java -classpath .:./jodconverter-2.2.1.jar:./icepdf-core-6.1.3.jar:./juh-2.3.0.jar:./jurt-2.3.0.jar:./ridl-2.3.0.jar:
./slf4j-api-1.7.25.jar:./commons-io-2.6.jar:./commons-net-3.3.jar:./unoil-2.3.0.jar  com/yuzi/utils/Doc2HtmlUtil_test 
/opt/doc/12344.xlsx /opt/doc/12345.pdf 123


openoffice的启动方式(linux中&表示后台启动)

1、安装OpenOffice4(该版本较稳定,亲自测试):下载路径:http://www.openoffice.org/download/index.html
2、用以下命令启动OpenOffice服务 
windows下:
         cd D:\Program Files (x86)\OpenOffice 4\program
         soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard 
linux下:
cd /opt/openoffice4/program 
 ./soffice "-accept=socket,host=localhost,port=8100;urp;StarOffice.ServiceManager" -nologo -headless -nofirststartwizard &

博客:www.sudo.ren

评论区

JFinal

2019-07-08 22:45

使用 OpenOffice 将 doc 转为 pdf 这个是头一回见,很好的分享,希望对后来的同学们有帮助

walking_

2019-07-15 10:43

想请教下 我一个服务器 多个应用 如何配置使用一个openoffice

walking_

2019-07-15 10:44

还是说我需要安装多个openoffice,分别在不同的端口运行

walking_

2019-07-15 10:59

我的windows服务器,用的 cd D:\Program Files (x86)\OpenOffice 4\program;
soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard
又开启了一个进程,暂时这么搞了,等于一个应用监听8100端口和一个应用监听默认的2002端口

walking_

2019-07-15 11:06

@walking_ 安装多个好像没搞成功,在windows上

为道日损

2019-07-16 08:52

@walking_ 只需要安装一个即可,多个应用调用一个openoffice

walking_

2019-11-07 10:23

想请教下,有没有遇到过word转成pdf之后目录以及visio图没有的问题?

为道日损

2019-11-11 09:04

@walking_ 你确定转成功了吗?目录提前新建

walking_

2019-11-11 14:46

@为道日损 转成功了 其它各类信息都正常 换了LibreOffice 6.3就好了,之前用的OpenOffice 4.1.6

为道日损

2019-11-12 10:42

@walking_ 已经好了对吧

luckySurvival

2020-07-22 20:56

你好 org.icepdf.core这个包我下载不下来 你能不能发一个给我,201661072@qq.com 谢谢啊

热门分享

扫码入社