最新要闻
- 片长190分钟超130万人想看!《阿凡达2:水之道》总票房突破3000万
- 最新消息:Nature最新:熊去氧胆酸可预防新冠、不怕病毒变异
- 世界热门:骁龙8 Gen2价格屠夫!moto X40系列定档12月15日
- 环球讯息:南京一地铁口被大量共享单车堵死 密密麻麻场面壮观:大家应文明骑行规范停车
- 今日最新!家长注意!羽绒服会让儿童安全座椅失效:有致命危险
- 全球实时:新能源车爆发 锂矿价格翻10倍 宁德宜春等多城提出打造“锂都”
- 资讯:降多少你会买?消息称RTX 4080要降价几千 首发用户将受伤 会有赔偿吗?
- 走后门上班?马斯克两位堂兄弟入职推特 成全职员工
- 天天热点!一张照片立即变视频主角 “AI换脸”惹上事 女子获赔5000元
- 东北零下20度 男子雪碧放车里一晚被冻炸:按键都不好使了
- 环球视点!厉害!韩国所有人将至少年轻1-2岁:网友看完方法直呼意外
- 天天微资讯!30年老司机成功预判避免车祸 当事人:本能反应 预感到它们刹不住
- 每日看点!日本最好大学东京大学2022年校花冠军出炉引网友热议 甜美可爱的学霸妹子
- 每日简讯:第一次看到水冷的RX 7900 XTX:漂亮得不像话
- 环球微头条丨新一代显卡危机 《传送门》光追性能实测:卡成1帧PPT、RTX 4090惨败
- 全球首款第二代骁龙8+2K直屏旗舰!iQOO 11今天发
手机
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
- 警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- 男子被关545天申国赔:获赔18万多 驳回精神抚慰金
- 3天内26名本土感染者,辽宁确诊人数已超安徽
- 广西柳州一男子因纠纷杀害三人后自首
- 洱海坠机4名机组人员被批准为烈士 数千干部群众悼念
家电
世界微速讯:PDF转Word完全指南:3大方法满足各种场景!
还不知道PDF怎么转Word吗,本文将提供完整的PDF转Word方案,包括离线、在线或者SDK API等各种方式,总有一款满足您的需求。
【资料图】
什么是PDF转Word?
PDF是出版和图形领域的软件厂商Adobe制定的电子文档格式标准。PDF转Word就是把PDF文档中的文字,图片,表格,注释等等文档元素相对应的转换成Word文档中相对应的文档元素。
所谓PDF转Word就是指从PDF格式文档中提取文字、图形和及其它内容并放入Word或者其他格式文档中(也可以是其他文件格式,如Excel/PPT/HTML/IMAGE等),无需重新排版,支持图文混合排版,因此你就能重复利用你的PDF文档内容,在Word中再编辑或者重整布局。
PDF文档为什么需要转成Word?
PDF是一种适合分享传播的文件格式,跨平台打开能够保持一致性,很受用户欢迎。但是PDF文档很难进行编辑修改,如果您需要对PDF进行编辑,就需要将PDF转换为WORD,转换后用WPS或者Office就可以进行编辑修改了。
如果您对PDF的文件格式感兴趣,可以看下PDF科普文章,详细了解一下。
PDF转Word的三大方法
PDF转Word一般来说有三种方式,下面我们就来一一介绍下吧,您可以根据需要选用不同的方式。
1. 传统PC端软件PDF转Word
本方法就是下载一个PDF软件到桌面,并安装。安装之后就可以离线使用了。
你可以下载Adobe Acrobat Pro试用版 ,有7天的免费试用期,Acrobat Pro一次性费用大概1800元左右
Aodbe公司是PDF标准的制定者,Acrobat Pro功能强大,除了贵没有太多毛病
适用人群和场景:
如果您对PDF处理的准确性和性能要求很高,高频对PDF进行各种处理,对数据安全要求页比较高,而且不差钱,可以购买Acrobat Pro
Acrobat Pro的PDF转Word功能比较强大,转换的效果还原度很高,基本上可以做到99.9%的还原效果
2. 在线转换或者小程序转换PDF文档
在线的PDF处理,就是在网站或者小程序上直接上传PDF文件,在线处理完毕之后,下载到本地。
目前在线的PDF处理有免费和收费两种,收费的一般开放一个小额的试用,比如1兆大小,10页等,然后引导到收费。免费的一般没有太多限制。
拿 pdf88.cn上的PDF转Word来说,这是一个完美免费的PDF转Word工具,只需要4步就能实现PDF在线转换。
第一步:打开PDF工具箱PDF转Word
第二步:上传PDF文件
通过选择文件或者将PDf文件拖拽到上述区域(支持doc或者docx格式的word文件)
可以上传1个或者多个PDF文件
第三步点击转换为Word按钮
第四步下载
看到没有,已经成功转为为docx的word格式,里面的文本、图片都可以随意编辑修改。Perfect!
在线PDF转Word的效果如何?
目前来说,只有Adobe原生的Acrobat软件对PDF的编辑、转Word是最完美、损耗最少的。
但是Acrobat只适合不差钱的大公司,一般用户都会选择免费的PDF转换器来进行转换,我们来对比下各种PDF格式下转换的效果如何(图片、表格、注释等)
我们来对比下不同PDF下的word转换效果
1. 纯文本+图片类型的
上面的示例就是纯文本+图片格式的,转换效果还是不错的,字体大小、颜色、布局、图片位置等,基本无差别的
2.带有简单表格的PDF文档
怎么样,效果还是不错的吧,完美还原了表格,100%可编辑
3.复杂表格和混合编排的PDF
看完了纯文本和表格,我们来看下更复杂点的例子
具体转换效果对比可以查看上一篇文章
适用人群和场景:
在线PDF转换Word需要在线使用,一般是对数据安全没有非常强的诉求,同时非高频的PDF处理编辑,而且对价格比较敏感,那么PDF88的各种处理工具,能够满足您大部分的PDF处理诉求。
3. 技术派:三方类库或者API实现PDF转Word
技术派的PDF处理就是用第三方类库或者OpenAPI,对pdf进行处理,一般是需要批量自动的处理PDF文件时,通过类库和API就能大量的减少时间。目前PDF的处理类库较多,我们选择几个有代表的来说下。
开源类库
pdfbox Java类库
PDFBox是一个BSD许可下的源码开放项目,为开发人员读取和创建PDF文档而准备的纯Java类库。
地址在 https://pdfbox.apache.org/ 社区比较活跃,更新速度较快
代码示例
import org.apache.pdfbox.pdmodel.PDDocument;import org.apache.pdfbox.text.PDFTextStripper;import java.io.*;public class PDFToWord { public static void main(String[] args) { try { //input file String pdfFile = "test.pdf"; //load pdf PDDocument doc = PDDocument.load(new File(pdfFile)); //get pdf number int pagenumber = doc.getNumberOfPages(); String fileName="word.doc"; File file = new File(fileName); if (!file.exists()) { file.createNewFile(); } FileOutputStream fos = new FileOutputStream(fileName); Writer writer = new OutputStreamWriter(fos, "UTF-8"); PDFTextStripper stripper = new PDFTextStripper(); stripper.setSortByPosition(true); stripper.setStartPage(1); stripper.setEndPage(pagenumber); stripper.writeText(doc, writer); writer.close(); doc.close(); System.out.println("pdf转word done!"); } catch (IOException e) { e.printStackTrace(); } }}
pdfbox 转换效果一般,对复杂的PDF格式,还原度较差,感兴趣的可以自己测试下!
itext Java类库
iText是著名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档,而且可以将XML、Html文件转化为PDF文件。
iText的安装非常方便,下载iText.jar文件后,只需要在系统的CLASSPATH中加入iText.jar的路径,在程序中就可以使用iText类库了。或者直接在mavan中引入坐标
地址 https://github.com/itext/itext7
同时itext也有收费的版本 还有一个.net的itext版本
代码
import java.io.File;import java.io.FileOutputStream;import com.itextpdf.text.pdf.PdfReader;import com.itextpdf.text.pdf.parser.PdfTextExtractor;import com.lowagie.text.Document;import com.lowagie.text.Paragraph;import com.lowagie.text.rtf.RtfWriter2;public class ReadPdfFile {public static void main(String[] args) { try { Document document = new Document(); File file = new File("file.doc"); if(!file.exists()) file.createNewFile(); RtfWriter2.getInstance(document, new FileOutputStream("file.doc")); System.out.println("file created"); document.open(); PdfReader reader = new PdfReader("test.jar"); int n = reader.getNumberOfPages(); System.out.println("total no of pages:::"+n); String s=""; for(int i=1;i<=n;i++) { s=PdfTextExtractor.getTextFromPage(reader, i); System.out.println("string:::"+s); System.out.println("===================="); document.add(new Paragraph(s)); document.newPage(); } document.close(); System.out.println("completed"); } catch (Exception de) {} }}
pdf.js JavaScript类库
准确的说pdf.js更多的用户前端的PDF展示和渲染,提供了pdf的读写api
地址 https://github.com/mozilla/pdf.js#online-demo
如果您要用来生成PDF,需要做大量的额外工作,不建议使用!
收费类库:
说完了免费的开源类库,下面说说收费的PDF类库。
开源类库效果一般,处理复杂的图标格式的PDF 有点力不从心,收费PDF是商业化软件,可以处理复杂的格式文件,但一般费用比较高,用于商业化用途较多。
aspose
Aspose 是一家致力于办公组件的提供商,数千机构都有用过aspose组件,包括微软、IBM、普华永道、安永、杜邦、希尔顿酒店、读者文摘、美洲银行、波音、西门子等。Aspose目前旗下一共有41个控件,Aspose.Total是它的总套包。
能够用来处理PDF的是Aspose.PDF工具包,支持java .net C++等,价格昂贵,一个授权1199美金起!
import com.aspose.pdf.DocSaveOptions;import com.aspose.pdf.Document;import com.aspose.pdf.SaveFormat;import com.aspose.pdf.examples.Utils;public class ConvertPDFToDOCOrDOCXFormat { public static void main(String[] args) { runExamples(); } public static void runExamples() { // The paths to resources and output directories. String testID = "com/aspose/pdf/examples/AsposePdf/Conversion/pdftodoc/"; String dataDir = Utils.getDataDir(testID); String outputDir = Utils.getOutDir(testID); System.out.println("============================"); System.out.println("Example savingToDoc start"); savingToDoc(dataDir, outputDir); System.out.println("Example savingToDoc end"); System.out.println("============================"); System.out.println("Example savingToDOCX start"); savingToDOCX(dataDir, outputDir); System.out.println("Example savingToDOCX end"); System.out.println("============================"); System.out.println("Example usingTheDocSaveOptionsClass start"); usingTheDocSaveOptionsClass(dataDir, outputDir); System.out.println("Example usingTheDocSaveOptionsClass end"); } public static void savingToDoc(String dataDir, String outputDir) { // Open the source PDF document Document pdfDocument = new Document(dataDir + "input2.pdf"); // Save the file into Microsoft document format pdfDocument.save(outputDir + "TableHeightIssue.doc", SaveFormat.Doc); } public static void savingToDOCX(String dataDir, String outputDir) { // Load source PDF file Document doc = new Document(dataDir + "input.pdf"); // Instantiate Doc SaveOptions instance DocSaveOptions saveOptions = new DocSaveOptions(); // Set output file format as DOCX saveOptions.setFormat(DocSaveOptions.DocFormat.DocX); // Save resultant DOCX file doc.save(outputDir + "savingToDOCX.docx", saveOptions); } public static void usingTheDocSaveOptionsClass(String dataDir, String outputDir) { // Open a document // Path of input PDF document String filePath = dataDir + "source.pdf"; // Instantiate the Document object Document document = new Document(filePath); // Create DocSaveOptions object DocSaveOptions saveOption = new DocSaveOptions(); // Set the recognition mode as Flow saveOption.setMode(DocSaveOptions.RecognitionMode.Flow); // Set the Horizontal proximity as 2.5 saveOption.setRelativeHorizontalProximity(2.5f); // Enable the value to recognize bullets during conversion process saveOption.setRecognizeBullets(true); // Save the resultant DOC file document.save(outputDir + "usingTheDocSaveOptionsClass.doc", saveOption); }}
pdf-tools
pdf-tools是一家瑞士的pdf解决方案服务商,提供了pdf sdk的整合方案!
PDF-tools支持30天免费试用,支持java .net c++等多种语言,大家可以下载下来自己试用下!
pdftron
PDFTron SDK是一个技术平台,为任何软件提供PDF、CAD和MS Office功能。这是构建文档功能的一种更简单、更快的方式,使您的开发人员更高效,用户更快乐。和Aspose类似
代码案例
Convert.WordOutputOptions wordOutputOptions = new Convert.WordOutputOptions();// Optionally convert only the first pagewordOutputOptions.setPages(1, 1);// Requires the Structured Output moduleConvert.toWord(filename, output_filename, wordOutputOptions);
foxit-pdf
foxit是一家专门从事PDF解决方案的供应商,为了实现成为PDF解决方案第一品牌的愿景,Foxit满足了三个不同细分市场的需求。
foxit的高性能库使用最流行的开发人员语言和环境,为所有平台的企业、移动和云应用程序添加了强大的PDF功能。
结论:
PDF的解决方案,基本上就是上述三种,当然,每一种都有非常多的服务提供商,篇幅关系,没有一一列出。
大家可以根据自己的需要,选择不同的方案来使用!
如果是企业用户,对数据安全比较敏感,不差钱,建议 用adobe官方的Acrobat Pro
如果是个人用户,或者企业中对PDF处理不频繁,在线的处理工具就足够了,比如pdf88.cn提供了主流的PDF处理服务。
如果对PDF有海量自动化处理的诉求,可以用SDK或者API来满足,小企业一般免费也差不多够了,如果追求性能,那就去购买昂贵的商业SDK,或者使用破解版的!
-
Win10无Internet访问权限怎么解决?无Internet访问权限的原因
原因:1、网络问题2、路由器限制3、Win10电脑问题一、网络问题如果这台Win10电脑是连接路由器上网的,但...
来源: -
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
1、iPhone 11采用6 1英寸LCD屏,可通过调节白平衡,来与周围环境光色温相适配;支持轻点或抬起唤醒;可...
来源: 世界微速讯:PDF转Word完全指南:3大方法满足各种场景!
Win10无Internet访问权限怎么解决?无Internet访问权限的原因
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
京东怎么分期付款?京东怎么看一共花了多少钱?
photoshopcs4序列号有哪些?pscs4的永久序列号分享
【天天报资讯】云边协同下的统一应用管理: 基于 OpenYurt 和 KubeVela 的解决方案
苹果手机显示iPhone已停用怎么办?iphone已停用是什么意思?
全球速读:行为管理(锐捷无线篇)
环球热议:app提交上架最新流程 ios
热讯:RFID读写器与西门子PLC 1200的tcp通信
C++的语法 学习笔记1
今日讯!聊聊与前端工程师天然互补的 Serverless
片长190分钟超130万人想看!《阿凡达2:水之道》总票房突破3000万
最新消息:Nature最新:熊去氧胆酸可预防新冠、不怕病毒变异
世界热门:骁龙8 Gen2价格屠夫!moto X40系列定档12月15日
环球讯息:南京一地铁口被大量共享单车堵死 密密麻麻场面壮观:大家应文明骑行规范停车
今日最新!家长注意!羽绒服会让儿童安全座椅失效:有致命危险
世界热门:CVE-2015-4852 Weblogic T3 反序列化分析
全球实时:新能源车爆发 锂矿价格翻10倍 宁德宜春等多城提出打造“锂都”
资讯:降多少你会买?消息称RTX 4080要降价几千 首发用户将受伤 会有赔偿吗?
走后门上班?马斯克两位堂兄弟入职推特 成全职员工
天天热点!一张照片立即变视频主角 “AI换脸”惹上事 女子获赔5000元
东北零下20度 男子雪碧放车里一晚被冻炸:按键都不好使了
环球视点!厉害!韩国所有人将至少年轻1-2岁:网友看完方法直呼意外
天天微资讯!30年老司机成功预判避免车祸 当事人:本能反应 预感到它们刹不住
每日看点!日本最好大学东京大学2022年校花冠军出炉引网友热议 甜美可爱的学霸妹子
视讯!OpenGL 透明度
大数据量、高并发业务怎么优化?(一)
每日简讯:第一次看到水冷的RX 7900 XTX:漂亮得不像话
环球微头条丨新一代显卡危机 《传送门》光追性能实测:卡成1帧PPT、RTX 4090惨败
全球首款第二代骁龙8+2K直屏旗舰!iQOO 11今天发
一到冬天就黑屏!但是 大众好像根本就不打算管
天天快资讯:python中的函数进阶
实时焦点:C++入门级基础知识汇总
天天微资讯!Arc显卡也能战未来 Intel新驱动实测:性能提升真打鸡血
大中华区立功 消息称马斯克将任命朱晓彤特斯拉全球CEO
当前最新:JavaWeb三大组件(Servlet、Filter、Listener)
世界报道:蓝牙协议(HFP、HSP、A2DP、AVRCP)简介
大前端html基础学习04--文本溢出
热推荐:电动车生产基地杀到欧洲?比亚迪最新回应来了
天天日报丨无2D版!《阿凡达2》预售开启:平均票价68元 首映口碑好评爆棚
【世界新要闻】备受年轻人追捧的“网红餐厅”有多坑?不服不行
环球即时:Springboot处理跨域请求
shell编程时出现:未预期的符号 `then' 附近有语法错误 或者 : 行 : `then'
世界最新:CSS Margin中5个经典布局解决方案,重难点知识,记得收藏复习
快播:实火!《阿凡达2:水之道》预售首日总票房突破千万
小米13系列发布会时间偷跑 最新售价信息曝光:3999/4999元起售
天天头条:中国石化又一次产出99.999%高纯度氢:每年2100吨
即时看!12306购票页面变了:已取消查验核酸弹窗
天天观热点:双11期间快递达42.7亿件 你的收到了吗?
【快播报】员工爆料奶茶店用过期原料 老板:事儿太多
【全球热闻】刘海屏iPhone用上灵动岛:越狱软件开发者推出“灵动刘海”
路怒可怕!出租车插队未果隧道逼停保时捷 还质问开豪车了不起:罚600扣1分
节省1000元成本 特斯拉减配辅助停车的超声波雷达:把新车主们坑惨了
暴雪《魔兽世界》停服或致大量游戏工作室倒闭:代打行业寒冬
加绒款同价:361° 纯色卫衣/运动裤69元大促(40元券)
Intel晒新显卡驱动表现:DX9游戏性能提升达80%
每日快播:一键部署应用到远程服务器,IDEA 官方 Docker 插件太顶了!
Vue视频 | 【Vue2 + Vue3 前端教程】完整版
今日关注:记录--微信小程序获取用户信息的最新方法记录
当前短讯!12 虚拟机字节码执行引擎_字节码执行机制
CompletableFuture源码解析
全球限量5000台!ThinkPad X1 Carbon 30周年纪念版即将上市
最新资讯:老马也失蹄 吞剑大师嘴插5把剑出意外被刺穿内脏:宣布收山
NASA毅力号火星车和国际空间站上的SSD:出自群联之手
网友不知情下话费暴涨2倍至99元 客服:一般会提前通知
每日快讯!Redis配置、优化及相关命令
《阿凡达》为何时隔13年推出续作?卡梅隆回应:光剧本就写了4版
全球时讯:纯电越野车真香!奇瑞也来参一脚:邀网友共创、最多奖励5万
每日视讯:一天1500元 索赔77万元代步车费用!博主曝特斯拉“精彩”上诉状
黄牛栽了!急于出手RTX 4080
两轮电动车在印度卷起来了:5年/6万公里质保、1年免费充电
Power BI 15 DAY
【高精密时钟】NTP网络校时服务器在WIN平台下调试步骤
微头条丨Chatgpt注册全流程教程
KMP算法详解-字符串匹配
焦点信息:精美的web前端源码的特效
天天短讯!女子连续服用6片感冒药致肝衰竭 专家提醒:药不能随便吃
男子被狗舔伤口发视频炫耀狗子贴心:听网友劝后打狂犬疫苗
全球播报:乐视诉清华大学获赔:内网提供电影下载 7年前就关停了
国服腾讯、网易等谁来代理?暴雪《暗黑4》发售时间曝光:容量80GB
环球动态:男子醉驾撞树想溜 爱车自动报警 并发送了定位
全球热点!JS设计模式 之 发布-订阅模式
最近沉迷Redis网络模型,无法自拔!终于知道Redis为啥这么快了
热点聚焦:行为管理(锐捷行业网关篇)
全球时讯:文盘Rust -- r2d2 实现redis连接池
前端精准测试实践
世界速递!JavaScript中 FileReader 对象详解
【世界报资讯】大数据-数据仓库-实时数仓架构分析
热头条丨JAVA8 函数式编程(1)- Lambda表达式
易基因|m6A去甲基化酶ALKBH5通过降低PHF20 mRNA甲基化抑制结直肠癌进展 | 肿瘤研究
焦点日报:火山引擎 DataTester:如何用 A/B 测试做产品增长?
WTM+InfluxDB时序数据库数据查询并放到DataTable中
中科慧政 & JNPF :全面开启智慧政务,灵活满足政务办公需求
【焦点热闻】南墙WAF-最好的免费Web应用防火墙
天天关注:高光时刻 | 方正璞华联合开发的「人力资源法律服务共享平台」在创新创业大赛中获奖
全球新消息丨95年属猪的2019年运势
【环球热闻】绳责的意思(绳责)
天天动态:水滴筹标题范文(水滴筹标题怎么写)
今头条!应用昆虫学(应用昆虫学报)