PDF Word-be
online
PDF-ek konvertálása szerkeszthető Word-dokumentumokká. Az elrendezés és táblázatok megőrizve — a dokumentuma soha nem hagyja el a böngészőt.
Győződjön meg róla: nyissa meg a DevTools → Network fület → dobjon be egy fájlt. Nézze, ahogy nulla feltöltés történik.
Három lépés. Nulla feltöltés.
Húzza ide a PDF-et
Töltse be a fájlt a böngésző memóriájába.
Konvertálás a böngészőben
A szöveg, táblázatok és formázás helyben kerül kinyerésre.
DOCX letöltése
Nyissa meg Wordben vagy bármely szerkesztőben. Az eredeti PDF érintetlen marad.
Mikor érdemes PDF-et Word-be konvertálni
A leggyakoribb ok: szerkesztened kell a dokumentumot, és csak a PDF-ed van. Valaki szerződést, jelentést vagy belső feljegyzést küldött, és a változtatandó helyek szét vannak szórva — egy elgépelés javítása, dátumok frissítése, egy bekezdés cseréje a javított verzióra. Egy PDF-szerkesztőben is megy, de ha sok szöveget kell átírni, gyorsabb és kényelmesebb a fájlt Word-ben megnyitni.
Egyéb gyakori okok: bekezdések kihúzása más dokumentumba illesztéshez; egy szakasz másolása levél törzsébe; PDF-ben érkezett önéletrajz átformázása más álláshoz; cikkrészletek újrahasznosítása. Mindenhol, ahol szöveget kell kihozni a PDF-ből, és valami szerkeszthetőbe tenni, ez a megfelelő konverzió.
Mit tud és mit nem tud visszaállítani ez a konverzió
Az eszköz kihúzza a szöveget a PDF-edből, és Word-dokumentummá építi újra. Hogy ez a gyakorlatban mit jelent, erősen attól függ, mi is a PDF-ed valójában.
- A szövegalapú PDF-ek jól konvertálódnak. Ha a PDF Wordből exportálással készült, bármely alkalmazás «Mentés PDF-ként» funkciójával, vagy egy közvetlenül előállító rendszerrel (számlázó, riportgenerátor), a PDF-ben lévő szöveg valódi szöveg — és az eszköz tisztán olvassa. Az eredmény Word kijelölhető, szerkeszthető bekezdéseket tartalmaz.
- A beszkennelt PDF-ek csak akkor térnek vissza bekezdésekként, ha van OCR rétegük. Egy tiszta szkennelés OCR nélkül csak az oldalak képe — nincs kihúzandó szöveg. Ha a PDF be volt szkennelve, de már OCR-rel ellátva (sok modern szkenner és felhőalapú szolgáltatás automatikusan hozzáad OCR réteget), az eszköz beolvassa azt és szöveget produkál. Nyers szkennelés esetén OCR nélkül üres vagy majdnem üres Word lesz az eredmény. Ilyenkor először futtasd át a PDF-et OCR eszközön.
- A elrendezés-rekonstrukció jó folyószövegre, kevésbé jó összetett tördelésre. Az eszköz betűméretek elemzésével és a szöveg sorok szerinti csoportosításával felismeri a törzsszöveget és a címsorokat. Egy átlagos dokumentumhoz — bekezdések, címsorok, listák, egyszerű táblázatok — ez működik. Többhasábos elrendezésekhez, képek köré tördelt lábjegyzetekhez, oldalsávokhoz folyó szöveggel a szöveg nagyjából helyes sorrendben jön ki, de nem az eredeti tördelésben.
- A képek jelenleg nem kerülnek ki a Word fájlba. Az eszköz a szövegre összpontosít. Ha a PDF-ben fotók, diagramok vagy ábrák vannak, amikre a Wordben is szükséged van, ezeket külön kell kihúznod (megnyitod a PDF-et, képernyőképet készítesz, beilleszted a Wordbe), vagy másik konverziós utat használsz.
És a formázás
Az eszköz igyekszik megőrizni, ami megbízhatóan átjut:
- Címsorok versus törzsszöveg a betűméretből vannak kikövetkeztetve — a törzsnél jelentősen nagyobb szöveg címsorként jelölődik a Wordben.
- Bekezdéstörések a sorközből derülnek ki, így a Word bekezdései megfelelnek a PDF-ben lévőknek.
- A betűméretek nagyjából megőrződnek run-szinten — a PDF-ben 14pt szöveg a Wordben kb. 14pt körüli lesz.
Ami nehezebb, és miért:
- Félkövér és dőlt azt igényli, hogy a PDF tényleg félkövér vagy dőlt betűtípust használjon (ne egy szabályos betűtípust, amit a renderelő egy kicsit vastagabbra rajzolt). Sok PDF helyesen kódolja ezt; némelyik nem.
- Komplex cellaösszevonásokkal vagy beágyazott táblázatokkal készült táblázatok általában lineáris bekezdéseivé lapulnak. Az egyszerű táblázatok jobban átjutnak, mint a kifinomultak.
- Az eredeti betűtípusok hivatkozva vannak, ahol lehet, de ha a géped nem rendelkezik velük, a Word a sajátjaira cseréli. A tartalom helyes; a megjelenés eltérhet.
Gyakorlati megjegyzések
- Ha a PDF jelszavas, először oldd fel. Konvertálás előtt futtasd át a fájlt az unlock-pdf-en — titkosított PDF-eket nem lehet szövegkihúzásra megnyitni.
- Hosszú PDF-eknél a konverzió időt vesz igénybe. Egy 200 oldalas dokumentumot oldalanként kell elemezni, a sorokat bekezdésekbe csoportosítani, és a .docx-et összeállítani. Tipikus laptopon számolj körülbelül egy perccel. Az első futtatáskor légy türelmes.
- A kör veszteséges. Ha veszel egy Wordöt, PDF-be konvertálod (olyan eszközzel, ami a tördelést képbe sütötte) és aztán azt a PDF-et vissza Wordbe — a második Word lényegesen durvább lesz az elsőnél. Az eredeti .docx, ha még valahol megvan, mindig tisztább lesz. Ez az eszköz olyan esetekre van, ahol az eredeti már nem elérhető.
- Ha csak a szövegre van szükséged, nem Word-fájlra, lásd: pdf-to-txt. Gyorsabb, és sima szöveget ad, amit bárhova beilleszthetsz.
Mi történik a fájloddal
A PDF-edet a böngésző memóriájába olvassuk be, ott elemezzük szövegre és tördelésre, és helyileg konvertáljuk .docx-re. Az eredmény Word-fájlt letöltésre kínáljuk; semmit sem töltünk fel, semmilyen szerver nem dolgozza fel a dokumentumodat. Magad is leellenőrizheted: nyisd meg a DevToolst, figyeld a Network fület konvertálás közben — nem fogsz látni semmilyen kimenő kérést a fájlod tartalmával.
Gyakori kérdések
Feltöltődik a PDF-em egy szerverre?
Nem. A konvertálás teljes egészében a böngészőjében történik. A fájl soha nem hagyja el az eszközét.
Megőrzi a táblázatokat és formázást?
Igen. A táblázatok, listák, címsorok és a legtöbb bekezdésformázás átkerül DOCX-be. Az összetett elrendezések kissé eltolódhatnak.
Konvertálódnak a szkennelt PDF-ek (OCR)?
A szkennelt PDF-eknek OCR szükséges, hogy szerkeszthető szöveggé váljanak. A digitálisan készült PDF-ek (Wordből, InDesignból stb. exportált) tisztán konvertálódnak.
Kezeli az összetett elrendezéseket?
Az oszlopok, lábjegyzetek és szövegmezők közelítve kerülnek átadásra. A tökéletes egyezésért mindig hasonlítsa össze a DOCX-et a forrással a konvertálás után.