PDF Word 変換オンライン
PDFを編集可能なWord文書へ変換。レイアウトと表はそのまま — 文書はブラウザから出ません。
自分で確認してください:DevToolsを開く → Networkタブ → ファイルをドロップ。アップロードがゼロであることを確認できます。
3ステップ、アップロードなし。
PDFをドロップ
ファイルをブラウザのメモリに読み込みます。
ブラウザで変換
テキスト、表、書式をローカルで抽出。
DOCXをダウンロード
Wordや任意のエディタで開きます。元のPDFはそのまま保持されます。
PDFをWordに変換したくなる場面
もっとも多い理由は、文書を編集したいのに手元にあるのがPDFだけ、というケースです。誰かが契約書、報告書、社内通知を送ってきて、変えたい箇所が文書のあちこちに散らばっています——誤字を直す、日付を更新する、ある段落を修正版に差し替える。PDFのエディタでもできますが、書き直す量が多いとWordで開くほうが速くて快適です。
その他のよくある場面: 段落を抜き出して別の文書に貼る、特定のセクションをメール本文にコピーする、PDFで届いた職務経歴書を別の求人向けに再フォーマットする、論文の一部分を再利用する。文字をPDFから取り出して編集可能なものに移したい場面では、いつもこれが正しい変換です。
この変換が取り戻せるもの、戻せないもの
本ツールはあなたのPDFから本文を取り出し、それをWord文書に組み立て直します。実際に何が起こるかは、あなたのPDFが本当のところ何であるかに大きく左右されます。
- テキストベースのPDFはきれいに変換できます。あなたのPDFがWordからのエクスポート、何らかのアプリの「PDFとして保存」、あるいはそれを直接生成したシステム(請求書ツール、レポートジェネレータ)で作られているなら、PDF内の本文は本物のテキストであり、本ツールはそれを正しく読み取ります。出来上がったWordには選択可能で編集可能な段落が並びます。
- スキャンPDFは、OCR層がある場合だけ段落として戻ります。OCRなしの純粋なスキャンはページの画像でしかなく、抽出できる本文はありません。スキャン済みでもすでにOCRがかかっているなら(現代の多くのスキャナとクラウドサービスは自動でOCR層を追加します)、本ツールはそれを読んで本文を生成します。OCRなしの素のスキャンでは、Wordはほぼ空に近い形で出てきます。その場合は先に別のOCRツールでPDFを処理してください。
- レイアウトの再構築は本文向きで、複雑な組み版には弱め。本ツールはフォントサイズの分析と行単位のグループ化により、本文と見出しを区別します。普通の文書——段落、見出し、リスト、シンプルな表——では十分機能します。多段組み、画像のまわりに回り込む脚注、本文が流れるサイドバーなどでは、本文がだいたい正しい順序で出てきますが、元のレイアウトのままではありません。
- 画像は現在Wordファイルに抽出されません。本ツールは本文に集中しています。PDF内の写真、図表、ダイアグラムをWord側でも必要とする場合は、別途取り出す必要があります(PDFを開き、画像のスクリーンショットを撮ってWordに貼り付ける)、または別の変換手段を使ってください。
書式についてはどうなるか
確実に持ち越せるものは、なるべく保とうとします。
- 見出しと本文はフォントサイズから推測されます——本文より明確に大きい文字はWordで見出しとして印付けされます。
- 段落区切りは行間隔から検出されるので、Wordの段落はPDFの段落に対応します。
- フォントサイズはラン単位でおおまかに保たれ、PDFで14ptだった本文はWordでもおよそ14ptになります。
難しいもの、その理由:
- 太字と斜体は、PDFが実際に太字または斜体のフォントを使っている必要があります(レンダラが普通のフォントを少し太く描いたものではダメです)。多くのPDFはこれを正しくエンコードしていますが、そうでないものもあります。
- セルが複雑に結合された表や入れ子の表は、たいてい線形の段落にフラット化されます。シンプルな表のほうが手の込んだ表より通りがよいです。
- もとのフォントは可能な限り参照されますが、お使いのコンピュータにそれがない場合、Wordは別のフォントで代替します。中身は正しいですが、見た目は変わることがあります。
実用上のメモ
- PDFにパスワードがかかっている場合は先に解錠してください。変換の前に unlock-pdf を通してください——暗号化されたPDFは本文抽出のために開けません。
- 長いPDFは変換に時間がかかります。200ページの文書はページごとに本文を解析し、行を段落にまとめ、.docxを組み立てる必要があります。一般的なノートで一分ほど見ておいてください。初回は気長に。
- 往復は劣化を伴います。WordをPDFに変換し(レイアウトを画像として焼き付けるツールで)、そのPDFをWordに戻すと、二度目のWordは最初のものよりかなり荒くなります。元の.docxがどこかに残っているなら、それは常により清潔です。本ツールは、原本がもう手元にない場合のためのものです。
- 本文だけ必要でWordファイルは要らない場合は、pdf-to-txt を見てください。より速く、どこにでも貼れる素のテキストが手に入ります。
ファイルの扱い
あなたのPDFはブラウザのメモリに読み込まれ、その場で本文とレイアウトの解析が行われ、ローカルで.docxに変換されます。できあがったWordファイルはダウンロードとして提示されます。アップロードはなく、文書を処理するサーバもありません。確認できます——DevToolsを開き、変換中にネットワークタブを見てください。ファイルの内容を運ぶ外向きの通信は出ません。
よくある質問
PDFはサーバーにアップロードされますか?
いいえ。変換はすべてブラウザ内で行われます。ファイルは端末から離れません。
表や書式は保持されますか?
はい。表、箇条書き、見出し、段落書式の大部分はDOCXに引き継がれます。複雑なレイアウトはわずかにずれる場合があります。
スキャンしたPDFは変換できますか(OCR)?
スキャンPDFは編集可能なテキストにするためOCRが必要です。デジタル生成されたPDF(Word、InDesignなどからの出力)はきれいに変換されます。
複雑なレイアウトに対応しますか?
段組み、脚注、テキストボックスは近似処理されます。完全一致が必要な場合は、変換後に必ずDOCXと元ファイルを比較してください。