Herhangi bir PDF'den metin çıkarın,
tarayıcınızda.
Herhangi bir PDF'den temiz bir metin katmanı alın — paragraflar korunur, çok sayfa, UTF-8. Çıkarma tarayıcınızda çalışır, böylece dosya cihazınızdan asla ayrılmaz.
Üç adım. PDF'iniz bu sekmeden asla ayrılmaz.
PDF'inizi bırakın
Metin çıkarmak istediğiniz dosyayı seçin. Sunucuya değil, tarayıcının belleğine yüklenir.
Metin katmanını okuyoruz
pdf.js her sayfayı dolaşır, öğeleri Y-koordinatına göre sıralar ve paragraf sonlarını ait oldukları yerde yeniden oluşturur.
.txt kopyalayın veya indirin
Temiz UTF-8 düz metin alın. Panoya kopyalayın veya .txt olarak kaydedin — siz karar verin.
Sıkça sorulanlar
Çıkarma nasıl çalışır?
PDF'inizin gömülü metin katmanını sayfa sayfa okumak için Mozilla'nın pdf.js'sini kullanıyoruz. Öğeler Y-koordinatına göre gruplanır, böylece paragraf sonları korunur — sunucu yok, yükleme yok.
Taranmış PDF'lerde çalışır mı?
Hayır. Taramalar metnin görüntüleridir, metin değil — çıkarmak için OCR gerekir, bu araç OCR çalıştırmaz. PDF'iniz taranmış kâğıttan oluşturulduysa önce bir OCR aracına ihtiyacınız var.
Dosyam herhangi bir yere yükleniyor mu?
Asla. Çıkarma tamamen tarayıcınızda WebAssembly üzerinden çalışır — DevTools → Ağ sekmesinden doğrulanabilir. Dosya cihazınızda kalır.
Parolayla korunan PDF'ler ne olacak?
PDF'i önce PDF Kilidini Aç aracımızla açın, sonra metni çıkarın. Şifrelenmiş içerik akışları parola olmadan ayrıştırılamaz.
Dosya boyutu sınırı nedir?
100 MB'a kadar. Daha büyük dosyalar tarayıcı belleğini tüketebilir — önce PDF Böl aracıyla bölmeyi deneyin.