CentOS下使用LibreOffice实现文档格式的转换方式

  • 时间:
  • 来源:斗升之水网
根据项目要求,对上传的文档进行预处理。如果用户以文档格式上传文档,则需要将其处理为docx或pdf格式,以便后续处理能够提取文档内容。 首先,我尝试了phpo office/phpword包,发现它到doc的转换并不理想。这个包比转换文档更适合基于内容生成文档 ,这不太适合我的需求。 然后我找到了自由办公室,一个开源工具 。使用后,效果非常好。和我分享。 服务器是CentOS7。您可以直接使用yum安装LibreOffice,这需要大约600MB以上的磁盘空: #您可以在安装之前将其删除,以防止yum remove libre office-* yum installlibre office在安装完成后确认版本或其他内容。虽然官方版本已经达到6.1,百胜仍然有5.3.6包 ,但是使用它没有什么错。在这里,我建议您使用您的Linux系统的包管理工具来安装它,这样可以节省很多麻烦。 如果不可用,可以使用[根@ localhost/]# soffice-versionlibre office 5.3.6.1 30(内部版本:1)。您可以使用底板帮助来查看帮助、许多参数和用例 。转换格式很简单:soffice-headled-convert-to-docx/opt/upload/source/123.doc-outdir/opt/upload/source命令上方是将/opt/upload/source/123 . doc文件转换为docx格式,并将其输出到/opt/upload/source文件夹 默认情况下:输出文件将以源文件名+新扩展名保存;用outdir中已存在的相同名称覆盖文件;成功转换将输出如下内容:convert/opt/upload/source/123 . doc->/opt/upload/source/123 . docxusingfilter:msword 2007 xmlover writing:/opt/upload/source/123 . docxlibleoffice根据文件格式自动匹配格式筛选器。对于它支持的格式,请参考官方网站。 综上所述,以上是边肖引进的CentOS下利用图书馆办公室进行文件格式转换的方法。我希望这对你有所帮助 。如果你有任何问题,请给我留言,边肖会及时回复你。 非常感谢您对脚本之家网站的支持!如果你认为这篇文章对你有帮助,请转载,请注明出处,谢谢!您可能感兴趣的文章:在Linux系统下构建centos7下的弹性搜索中间件和演示公共接口 CentOS 8 正式发布 基于Red Hat Enterprise Linux 8