Redaksi teks di PDF
di browser Anda.
Ketik kata yang ingin disensor — setiap kemunculan di setiap halaman ditutup. Tanpa unggah, tanpa kebocoran. (Redaksi visual, bukan tingkat forensik — lihat FAQ.)
Verifikasi sendiri: buka DevTools → tab Network → jatuhkan sebuah file. Saksikan tidak ada upload sama sekali.
Tiga langkah. File Anda tidak pernah keluar dari tab ini.
Letakkan PDF Anda
Pilih file yang ingin diredaksi. File dimuat ke memori browser, bukan ke server.
Ketik pola-pola
Nama, email, nomor telepon — satu per baris atau dipisah koma. Kami menemukan setiap kecocokan.
Unduh salinan yang diredaksi
Setiap kecocokan ditutup dengan kotak hitam pekat di setiap halaman. File asli tetap utuh.
Menutupi teks yang tidak ingin Anda bagikan
Alasan untuk meredaksi (redact) PDF biasanya adalah menyembunyikan bagian dokumen sambil tetap menjaga sisanya dapat dibaca. Sebuah kontrak dengan alamat rumah pihak lawan dikirim ke peninjau ketiga yang seharusnya tidak melihat alamat itu. Rujukan medis dibagikan dengan asuransi tempat pengenal pasien harus ditutupi. Laporan keuangan dilampirkan ke berkas dewan tetapi nomor rekening pada level unit harus tertutup. Proposal proyek ditunjukkan ke kandidat vendor dengan baris anggaran dihitamkan agar mereka mengusulkan tanpa terjangkar pada angka. Tugasnya kecil dan dapat diprediksi: ketik kata atau frasa yang ingin disembunyikan, dan alat menggambar persegi panjang hitam buram di atas setiap kemunculan pada setiap halaman.
Baca ini dengan cermat sebelum meredaksi sesuatu yang sensitif: ini adalah redaksi visual, bukan forensik. Persegi panjang hitam menutupi teks di layar dan dalam cetakan, tetapi teks di bawah tetap di berkas. Siapapun dengan alat PDF dapat mengekstrak melalui salin-tempel, pencarian, atau pemeriksaan content-stream. Ini cocok ketika pembaca biasa tidak boleh melihat teks — mengirim draf, menyembunyikan nomor rekening non-publik dari kolega, menyamarkan nomor telepon Anda di tangkapan layar. Ini tidak cocok untuk publikasi di bawah undang-undang keterbukaan informasi, pengajuan pengadilan, atau apapun di mana lawan akan melihat dengan cermat.
Cara kerja pencocokan
Anda memasukkan satu atau lebih pola. Setiap pola dicari sebagai pencocokan whole-substring tidak peka huruf besar/kecil terhadap fragmen teks dalam PDF. Saat fragmen mengandung pola Anda, sebuah persegi panjang hitam digambar di atas seluruh bounding-rect fragmen.
Konsekuensi praktis:
- Pencocokan substring, bukan kata utuh. Pola
artmenutupi «art», «artist», «smart», «martin». Buat pola cukup spesifik — nama lengkap, nomor rekening lengkap, alamat e-mail lengkap. - Tidak peka huruf besar/kecil. Pola
Annamenutupi «Anna», «anna», «ANNA». - Tidak ada regex, tidak ada wildcard. Apa yang Anda ketik adalah urutan literal yang dicocokkan.
- Cakupan per fragmen. PDF menyimpan teks dalam fragmen; bounding rect yang digambar menutupi seluruh fragmen. Jika pola Anda mengenai satu kata dalam fragmen yang berisi lebih banyak teks, teks di sekitarnya juga akan ditutupi. Biasanya itu yang Anda inginkan; kadang-kadang Anda akan melihat lebih banyak yang ditutupi dari yang diharapkan.
- Pola yang melintasi batas fragmen terlewatkan. «Budi Santoso» adalah satu fragmen di sebagian PDF dan dua di lainnya. Jika terpisah, pola tidak akan cocok pada string yang disambungkan. Tambahkan bagian sebagai pola terpisah:
Budi Santoso,Santoso,Budi.
Persegi panjang hitam memiliki padding 1 titik di sekitar bounding box yang terdeteksi — untuk penempatan glif sub-piksel, agar tidak ada garis dari teks asli yang mengintip di tepi.
Apa yang tersembunyi vs. apa yang masih di berkas
Bagian ini lebih penting dari yang lain. Persegi panjang hitam adalah instruksi gambar dalam content-stream halaman. Teks asli juga ada di content-stream, di bawahnya. Pembaca PDF menampilkannya berurutan: pertama teks, lalu persegi panjang di atas, jadi persegi panjang menang secara visual. Tetapi teksnya sendiri tidak dihapus.
Apa artinya secara konkret:
- Salin-tempel mengambil teks asli. Memilih area yang diredaksi di Adobe Reader dan menyalin memberi kata-kata yang Anda coba sembunyikan. Persegi panjang hitam tidak dapat dipilih; teks di bawahnya bisa.
- Mesin pencari menemukan teks. Jika PDF yang diredaksi diunggah ke situs, pencarian nama yang diredaksi akan memunculkan dokumen.
- Menyimpan ulang di alat PDF lain bisa mempertahankan kedua lapisan. Beberapa alat membangun ulang content-stream dan bisa menjatuhkan redaksi; yang lain menyimpannya.
- Alat forensik mengekstrak yang asli dengan mudah. Setiap parser PDF dapat mendaftar semua content-stream teks. Persegi panjang hanya gambar terpisah.
Untuk situasi di mana teks di bawah benar-benar harus hilang — publikasi di bawah hukum transparansi, bukti di pengadilan, apapun yang menuju lawan — Anda perlu alur kerja berbeda: ekspor ulang dokumen sumber dengan teks sensitif terhapus, atau konversi halaman ke gambar dan OCR ulang (yang secara permanen menghilangkan lapisan teks).
Apa yang selamat dan apa yang tidak
- Konten halaman yang terlihat tetap sama. Semua yang tidak cocok tetap persis seperti semula — font sama, tata letak sama, gambar sama.
- Markah, anotasi, tautan, kolom formulir — semuanya selamat. Persegi panjang adalah tambahan yang digambar; tidak ada yang lain dibangun ulang.
- Teks asli dipertahankan di bawahnya. Lihat bagian di atas. Ini batasan utama.
- Tanda tangan digital menjadi tidak sah. Modifikasi apapun pada dokumen, termasuk menambahkan persegi panjang, memutus pengikatan tanda tangan.
- PDF terenkripsi harus dibuka kuncinya dulu. Lewatkan melalui unlock-pdf dengan kata sandi sebelum meredaksi.
Kalau ada yang janggal
- «At least one redaction pattern required». Daftar pola kosong. Ketik setidaknya satu kata atau frasa.
- Pola cocok tetapi menutupi lebih banyak teks dari yang diharapkan. PDF menyimpan baris itu sebagai satu fragmen, dan persegi panjang per fragmen. Biasanya dapat diterima; kalau bermasalah, sumber harus diekspor ulang dengan teks dihapus dengan benar.
- Pola tidak cocok dengan yang saya harapkan. Tiga penyebab biasa: (1) teks ada dalam gambar yang dipindai, bukan lapisan teks — alat tidak melihat teks gambar; OCR dulu via pdf-to-txt atau alat khusus. (2) Pola melintasi fragmen — bagi menjadi yang lebih pendek. (3) PDF menggunakan karakter non-Latin dengan pengkodean rusak; menyalin dari penampil untuk melihat apa yang sebenarnya ada di sana adalah diagnosis tercepat.
- Saya meredaksi tetapi kolega mengekstrak teks via salin-tempel. Bekerja seperti yang didokumentasikan — hanya redaksi visual. Untuk penghapusan nyata ekspor ulang dari sumber.
Catatan praktis
- Gunakan untuk penyembunyian visual, bukan untuk skenario lawan. Menyembunyikan nama dalam draf yang dikirim ke teman yang tidak akan mengekstrak: oke. Menyembunyikan nama dalam pengajuan pengadilan di mana pihak lawan akan menjalankan alat forensik: tidak oke.
- Pola spesifik daripada generik. Redaksi
+62-21-555-0123, bukan0123. Redaksi[email protected], bukanjane. Pola spesifik kurang menutupi berlebih dan menyembunyikan dengan baik apa yang Anda inginkan. - Verifikasi dengan menyalin. Setelah meredaksi, buka hasilnya di penampil, pilih area yang diredaksi, salin. Jika teks asli keluar, Anda telah mengonfirmasi batasannya — lanjutkan hanya jika penyembunyian visual cukup.
- Untuk penghapusan permanen, gunakan sumber. Jika dokumen berasal dari Word, edit Word dan ekspor ulang. Dari basis data, kueri ulang tanpa kolom sensitif. Alat redaksi PDF untuk kasus tanpa sumber.
- Berkas asli tetap utuh. Yang Anda unduh adalah PDF redaksi baru; sumber di disk tidak berubah.
Apa yang terjadi pada berkas Anda
Redaksi berjalan di peramban Anda. Pola yang diketik dan isi berkas tidak pernah meninggalkan tab ini. Buka DevTools dan amati tab Network selama operasi — tidak ada permintaan keluar yang membawa isi berkas atau pola. PDF tetap di disk; versi yang diredaksi adalah unduhan baru di sebelahnya.
Pertanyaan umum
Apakah setiap kemunculan akan diredaksi?
Ya — kami memindai setiap halaman dan menutup setiap kecocokan dari setiap pola yang Anda ketik. Tidak ada mode \"hanya kemunculan pertama\"; redaksi bersifat global secara desain.
Apakah ini redaksi tingkat forensik?
Bukan. MVP kami menimpa setiap kecocokan dengan kotak pekat — secara visual sudah diredaksi, tetapi teks aslinya masih ada di aliran PDF. Untuk redaksi forensik (teks benar-benar dihapus dari berkas), gunakan alat desktop seperti Adobe Acrobat Pro. Kami terbuka soal trade-off ini agar Anda bisa memilih.
Lalu mengapa redaksi visual?
Untuk sebagian besar kasus — berbagi contoh kontrak, menutup nomor telepon di tangkapan layar, menghilangkan nama di portofolio — redaksi visual sudah cukup dan jauh lebih cepat dari membuka Acrobat. Jangan dipakai untuk dokumen yang lawannya akan mengekstrak teks.
Bisakah saya meredaksi area tertentu, bukan teks?
Redaksi pilih-area (menyeret kotak di halaman) ada di roadmap. Versi saat ini adalah ketik-untuk-mencari, cocok untuk email, nama, nomor telepon, dan pola berbasis string apa pun.
Ke mana file saya pergi?
Tidak ke mana-mana. Redaksi terjadi sepenuhnya di tab ini. Bisa diverifikasi di DevTools → Network: tidak ada yang diunggah.