Tüm konular

+
Home > Kaynak > PDF > bilgi optik karakter tanıma (OCR)

Optik karakter tanıma (OCR) bilgisine

OCR nedir?

Optik karakter tanıma OCR için genellikle kısaltılmış, mekanik veya elektronik taranan görüntülerin el yazısı, daktilo ya da matbu metin içine makine ile kodlanmış metin çevrilmiştir.

OCR neden kullanılır?

OCR belge, taranan kağıt belgelerden, PDF dosyaları veya düzenleme ve arama veri a digital fotoğraf makinesi tarafından yakalanan görüntüleri gibi farklı türlerine dönüştürmek için yaygın olarak kullanılır. Profesyonel, bazı ortamlarda (örneğin, kütüphaneler, ofisler) binlerce kitap ve belgeler düzenli olarak yedekleme ve arşiv için taranır. Bir tarayıcı sadece orijinal kağıt belgeleri, PDF formatında taranmış belgeleri yansıma tabanlı sonuçlanan fotoğraflarını alır. İşleme ve bu tür büyük birimleri taranan belgelerin saklanması önemli belirli ifade veya adı bir dosya içinde arama kuramama bozukluğu konudur. Ayrıca herhangi bir metin vurgulanan, kopyalanmış veya değiştirilmiş, belgeyi bir büyük resim dosyası olarak karşı bireysel metin karakterleri içerdiğinden.

OCR Sample

OCR kullanmadan önce tüm alanı sayfasında işaretli ve vurgulanmış olduğundan ve hiçbir metin arama ve düzenlenmiş.

OCR, sayfadaki metnin işlemi ile seçme aracı seçilebilir sonra arama ve karakter, sözcük ve paragraflar kolayca düzenleyin.

Wondershare PDF OCR araçları size nasıl yardım edebilirim?

Wondershare PDF OCR araçları hızlı ve doğru bir şekilde taranan PDF metni tanımak ve tanınmış sonuçları düzenlenebilir biçimlerde korumak yardımcı olabilir.

Wondershare PDF Editor Pro for Mac: ile üstün OCR Doğruluk ve biçimini koruma, arama, düzeltmek ve Mac üzerinde doğrudan taranan veya görüntü tabanlı PDF'deki metni kopyalayın sağlar Ayrıca biçimlenmiş metni taranan PDF ihracat dayalı Word, Excel, PowerPoint, EPUB, HTML ve metin biçimleri sağlar.

Wondershare PDF Converter Pro: Üstün OCR doğruluk oranıyla taranan PDF metni tanımak ve birden çok taranan PDF Word, Excel, PowerPoint, EPUB, HTML ve metin belgeleri yazi-tabanli Windows'ta dönüştürebilirsiniz.


Wondershare PDF Converter Pro for Mac: Üstün OCR doğruluk oranıyla taranan PDF metni tanımak ve birden çok taranan PDF Word, Excel, PowerPoint, EPUB, HTML ve metin belgeleri metin tabanlı Mac dönüştürebilirsiniz

OCR tanıma kalitesini artırmak nasıl?

OCR tanıma kalitesi büyük ölçüde tarama işlemi sırasında kullanılan ayarlara bağlıdır görüntü kalitesini büyük ölçüde bağlıdır. Amacıyla daha iyi OCR tanıma kalitesi taranmış belgeleriniz için almak için işte belge tarama için bazı ipuçları:

Yazı tipini çok küçüktür
En iyi tanıma sonuçları elde etmek için daha yüksek çözünürlükte çok küçük yazı tipleriyle Yazdırılan belgeleri tarayın.
İstediğiniz çözünürlük ScanSourceSettings nesne Çözünürlük özelliği içinde belirtebilirsiniz.


Kaynak resim Önerilen çözünürlük
Reader tipik metinler için 300 dpi (boyutu fontlarda basılmış 10 pt veya daha büyük)
Reader metinler için 400-600 dpi baskı içinde daha küçük yazı tipleri (9pt veya daha küçük)

Parlaklığı ayarlama
Siyah beyaz modda tarama yaparken parlaklık ayarını ayarlamanız gerekebilir. Arzu ettiğiniz parlaklık ScanSourceSettings nesne parlaklık özelliği içinde belirtebilirsiniz. Orta değeri yaklaşık % 50, çoğu durumda yeterli olacaktır.
Ortaya çıkan görüntü çok fazla "yırtık" veya "sıkışmış" birlikte harf içeriyorsa, aşağıdaki tabloda kullanmada sorun giderme.

Görüntü bu gibi görünüyor Öneriler
Good Quality Bu görüntü tanıma için uygundur
Very Light
karakterler "yırtık" ya da çok hafif
  • Parlaklık görüntünün koyu yapmak için indirin.
  • Gri tonlarında tarama. Parlaklık otomatik olarak ayarlanmış.
  • Very Dark
    karakterler çok bozuk bir arada sıkışmış veya doldurulabilen
  • Görüntü daha parlak yapmak için parlaklığı artırmak
  • Gri tonlarında tarama. Parlaklık otomatik olarak ayarlanmış.
  • Baskı kalitesi
    Kalitesiz bulanık ve düzensiz harfler "gürültü ile" (yani rastgele siyah noktalar veya speckles), belgeleri veya satırları çarpık ve ötelenen tablo kenarlıkları belirli tarama ayarları yapılması gerekebilir. Örneğin, bu Faks ve gazete:

    Print Quality

    Düşük kaliteli belgeleri en iyi gri tonlamalı olarak taranır. Gri tonlarında tararken, programın en iyi parlaklık değeri otomatik olarak seçer.
    Gri Tonlama modunda zaman orta ve düşük kaliteli belgeleri kabul ederek daha iyi tanıma sonuçları elde etmek için taranan metin harflerle hakkında daha fazla bilgi korur.


    İlgili makaleler

    Ürün ile ilgili sorular? Konuşmak doğrudan destek ekibimize >>

    Sayfanın Üstü