แปลง PDF เป็น Word
แปลง PDF เป็นเอกสาร Word ที่แก้ไขได้ เลย์เอาต์และตารางยังคงอยู่ — เอกสารไม่ออกจากเบราว์เซอร์
ตรวจสอบด้วยตัวคุณเอง: เปิด DevTools → แท็บ Network → ลากไฟล์มาวาง คุณจะเห็นว่าไม่มีการอัปโหลดใด ๆ เลย
สามขั้นตอน ไม่มีการอัปโหลด
ปล่อย PDF
โหลดไฟล์เข้าหน่วยความจำของเบราว์เซอร์
แปลงในเบราว์เซอร์
ข้อความ ตาราง และการจัดรูปแบบถูกดึงออกในเครื่อง
ดาวน์โหลด DOCX
เปิดใน Word หรือโปรแกรมแก้ไขใดก็ได้ PDF ต้นฉบับยังคงเดิม
เมื่อไรควรแปลง PDF เป็น Word
เหตุผลที่พบบ่อยที่สุด: คุณต้องแก้ไขเอกสารและสิ่งเดียวที่มีคือ PDF มีคนส่งสัญญา รายงาน หรือบันทึกภายในมา และจุดที่ต้องเปลี่ยนกระจายอยู่ทั่วเอกสาร แก้คำผิด ปรับวันที่ เปลี่ยนย่อหน้าเป็นเวอร์ชันที่ถูกต้อง ทำในตัวแก้ไข PDF ก็ได้ แต่ถ้าต้องเขียนใหม่หลายส่วน เปิดไฟล์ใน Word เร็วและสบายกว่า
เหตุผลทั่วไปอื่น ๆ: ดึงย่อหน้าออกมาวางในเอกสารอื่น คัดลอกบางส่วนใส่ในเนื้ออีเมล ปรับฟอร์แมตเรซูเม่ที่มาเป็น PDF ให้ตรงตำแหน่งงานอื่น นำชิ้นส่วนของบทความไปใช้ใหม่ ทุกครั้งที่ต้องเอาข้อความออกจาก PDF ไปใส่ในรูปแบบที่แก้ไขได้ การแปลงนี้คือสิ่งที่คุณต้องการ
การแปลงนี้กู้กลับได้แค่ไหน
เครื่องมือสกัดข้อความจาก PDF ของคุณและสร้างเอกสาร Word ขึ้นมาใหม่ ในทางปฏิบัติผลลัพธ์ขึ้นกับว่า PDF ของคุณคืออะไรจริง ๆ
- PDF ที่อิงข้อความแปลงได้ดี ถ้า PDF ของคุณถูกสร้างโดยส่งออกจาก Word โดย «Save as PDF» จากแอปใด ๆ หรือโดยระบบที่ผลิตโดยตรง (โปรแกรมออกใบเสร็จ ตัวสร้างรายงาน) ข้อความใน PDF เป็นข้อความจริง และเครื่องมืออ่านสะอาด Word ที่ได้มีย่อหน้าเลือกได้และแก้ไขได้
- PDF จากการสแกนกลับมาเป็นย่อหน้าเฉพาะเมื่อมีชั้น OCR การสแกนล้วนไม่มี OCR เป็นเพียงภาพของหน้ากระดาษ ไม่มีข้อความให้สกัด ถ้า PDF เป็นไฟล์ที่สแกนแต่มี OCR แล้ว (สแกนเนอร์สมัยใหม่และบริการคลาวด์หลายตัวเพิ่มชั้น OCR อัตโนมัติ) เครื่องมือจะอ่านชั้นนั้นและให้ข้อความ ถ้าเป็นการสแกนดิบไม่มี OCR Word จะออกมาว่างหรือเกือบว่าง ในกรณีนั้นให้ส่ง PDF ผ่านเครื่องมือ OCR ก่อน
- การฟื้นฟูเลย์เอาต์ดีกับร้อยแก้ว ดีน้อยกว่ากับเลย์เอาต์ซับซ้อน เครื่องมือแยกแยะเนื้อความและหัวเรื่องด้วยการวิเคราะห์ขนาดฟอนต์และจัดกลุ่มข้อความตามบรรทัด สำหรับเอกสารทั่วไป (ย่อหน้า หัวเรื่อง รายการ ตารางง่าย ๆ) ใช้งานได้ดี สำหรับเลย์เอาต์หลายคอลัมน์ เชิงอรรถพันรอบรูป กล่องข้างที่มีข้อความไหล ผลลัพธ์มีข้อความตามลำดับใกล้เคียงถูกต้อง แต่ไม่ใช่ในเลย์เอาต์เดิม
- ปัจจุบันยังไม่ดึงรูปภาพออกไปยังไฟล์ Word เครื่องมือเน้นข้อความ ถ้า PDF ของคุณมีรูป กราฟ หรือไดอะแกรมที่ต้องการใน Word ด้วย ต้องสกัดแยกต่างหาก (เปิด PDF จับภาพหน้าจอ วางใน Word) หรือใช้เส้นทางการแปลงอื่น
เรื่องการจัดรูปแบบ
เครื่องมือพยายามรักษาสิ่งที่ส่งผ่านได้น่าเชื่อถือ:
- หัวเรื่องกับเนื้อความ ถูกอนุมานจากขนาดฟอนต์ ข้อความที่ใหญ่กว่าตัวเนื้ออย่างเห็นได้ชัดถูกระบุเป็นหัวเรื่องใน Word
- การขึ้นย่อหน้า ถูกตรวจจากระยะระหว่างบรรทัด ดังนั้นย่อหน้าใน Word ตรงกับใน PDF
- ขนาดฟอนต์ ถูกรักษาคร่าว ๆ ในระดับชิ้น ข้อความ 14pt ใน PDF จะอยู่ราว 14pt ใน Word
สิ่งที่ยากกว่าและทำไม:
- ตัวหนาและตัวเอียง ต้องการให้ PDF ใช้ฟอนต์หนาหรือเอียงจริง ๆ (ไม่ใช่ฟอนต์ปกติที่เครื่องเรนเดอร์วาดให้หนาขึ้นเล็กน้อย) PDF จำนวนมากเข้ารหัสได้ถูก บางตัวไม่
- ตารางที่มีการรวมเซลล์ซับซ้อนหรือตารางซ้อน มักถูกแบนเป็นย่อหน้าเชิงเส้น ตารางง่าย ๆ ผ่านได้ดีกว่าตารางหรูหรา
- ฟอนต์ดั้งเดิม ถูกอ้างอิงเมื่อทำได้ แต่ถ้าเครื่องคุณไม่มี Word จะแทนด้วยฟอนต์ของตัวเอง เนื้อหาถูก รูปลักษณ์อาจต่าง
หมายเหตุเชิงปฏิบัติ
- ถ้า PDF มีรหัสผ่าน ปลดล็อกก่อน ส่งผ่าน unlock-pdf ก่อนแปลง PDF ที่เข้ารหัสเปิดไม่ได้เพื่อสกัดข้อความ
- สำหรับ PDF ยาว การแปลงใช้เวลา เอกสาร 200 หน้าต้องถูกแยกวิเคราะห์ทีละหน้า บรรทัดถูกจัดกลุ่มเป็นย่อหน้า และ .docx ถูกประกอบ บนแล็ปท็อปทั่วไปนับเป็นหนึ่งนาทีโดยประมาณ ครั้งแรกต้องอดทน
- วงรอบสูญเสียข้อมูล ถ้าคุณนำ Word แปลงเป็น PDF (ด้วยเครื่องมือที่อบเลย์เอาต์เป็นภาพ) แล้ว PDF นั้นกลับเป็น Word — Word ที่สองจะหยาบกว่าตัวแรกมาก ไฟล์ .docx ดั้งเดิม หากยังมีอยู่ที่ใด จะสะอาดกว่าเสมอ เครื่องมือนี้สำหรับกรณีที่ไม่มีต้นฉบับแล้ว
- ถ้าต้องการเฉพาะข้อความไม่ใช่ไฟล์ Word ดู pdf-to-txt เร็วกว่า และให้ข้อความล้วนที่วางได้ทุกที่
เกิดอะไรขึ้นกับไฟล์ของคุณ
PDF ของคุณถูกอ่านเข้าหน่วยความจำเบราว์เซอร์ ถูกแยกวิเคราะห์เพื่อข้อความและเลย์เอาต์ที่นั่น และแปลงเป็น .docx ในเครื่อง ไฟล์ Word ที่ได้ถูกเสนอให้ดาวน์โหลด ไม่มีอะไรถูกอัปโหลด ไม่มีเซิร์ฟเวอร์ใดประมวลผลเอกสารของคุณ ตรวจสอบได้: เปิด DevTools ดูแท็บ Network ระหว่างการแปลง คุณจะไม่เห็นคำขอออกที่บรรจุเนื้อหาไฟล์ของคุณ
คำถามที่พบบ่อย
PDF ของฉันถูกอัปโหลดขึ้นเซิร์ฟเวอร์หรือไม่?
ไม่ การแปลงเกิดขึ้นทั้งหมดในเบราว์เซอร์ ไฟล์ไม่ออกจากอุปกรณ์
รักษาตารางและการจัดรูปแบบหรือไม่?
ใช่ ตาราง รายการ หัวเรื่อง และการจัดรูปแบบย่อหน้าส่วนใหญ่ถูกส่งต่อไปยัง DOCX เลย์เอาต์ซับซ้อนอาจเลื่อนเล็กน้อย
PDF ที่สแกนแปลงได้ไหม (OCR)?
PDF ที่สแกนต้องใช้ OCR จึงจะเป็นข้อความที่แก้ไขได้ PDF ที่สร้างด้วยคอมพิวเตอร์ (เอ็กซ์พอร์ตจาก Word, InDesign ฯลฯ) แปลงได้สะอาด
รองรับเลย์เอาต์ซับซ้อนหรือไม่?
คอลัมน์ เชิงอรรถ และกล่องข้อความถูกประมาณค่า หากต้องการผลลัพธ์ที่เหมือนต้นฉบับ ให้เปรียบเทียบ DOCX กับต้นฉบับหลังแปลงเสมอ