Astuces OCR: Les meilleurs résultats dans la reconnaissance optique de caractères sur le PC

FONTE ZOOM:
Textes de documents imprimés peuvent être idéalement utilisés, sauf si elles sont lues par OCR dans l'ordinateur. En reconnaissance optique de caractères, cachent cependant quelques obstacles, de sorte que lorsque la reconnaissance pauvres un post-traitement compliqué est nécessaire. Les astuces suivantes réduire le taux d'erreur en reconnaissance OCR et plus rapide du texte à un résultat fiable. La plupart des modèles OCR sont lus avec un PC en utilisant des scanners à plat

OCR: Quel est-il exactement?

La reconnaissance optique de caractères est un procédé dans lequel le texte est lu à partir d'un modèle pour un traitement ultérieur dans un ordinateur. Le processus de numérisation se compose essentiellement de deux étapes: d'abord, une image de texte est numérisé. Puis "lit" une page OCR et convertit les caractères reconnus dans un texte et un format de texte qui peuvent être traitées sur un PC avec l'un des programmes populaires de traitement de texte.

Le logiciel moderne OCR convertit non seulement passivement les caractères reconnus dans le texte, mais est également capable limitée à la reconnaissance intelligente de caractères. Il caractères mal reconnus par l'analyse de contexte pour être corrigées, par exemple, un «8oot" mal reconnu pour corriger une «bateau». Cela vous donne OCR activités avec les systèmes informatiques courants, le meilleur résultat, voici des conseils pratiques pour l'application OCR succès.

Les écrous et boulons de l'OCR: La manipulation des médias droit

Translucide marque réprimer: numériser des originaux qui sont imprimés sur les deux côtés avec du papier fin est souvent problématique, parce que le retour peut sembler plus ou moins forte. Une bonne aide dans de tels cas est un morceau de carton noir convient Sur scanner à plat entre la cible et le couvercle du scanner.

Le tableau noir crée un comportement de réflexion plus uniforme, vous donnant un modèle utile pour l'édition graphique, ou de reconnaissance optique de caractères. Tableau noir est dans les magasins de papeterie disponible, un parfaitement adapté à la pièce de la vitre d'exposition, vous devriez investir dans des accessoires personnels pour votre scanner.

sont des programmes d'édition d'images aujourd'hui très efficaces et offrent de nombreuses fonctionnalités, y compris la rotation d'image ou de textes: align de médias. Cependant, vous devriez vous abstenir de ces options si vous prévoyez de la capture de texte une «image». Alignez OCR templates exactement horizontale, depuis modèles obliques ou tard par le logiciel rotation de 180 degrés modèles dégradent le taux de reconnaissance OCR de manière significative.

Modèles lisses ondulées: après un stockage prolongé de nombreux documents papier jamais après stockage une ondulation plus ou moins forte qualitativement réduit considérablement toute saisie de texte. Il est fortement recommandé pour lisser le papier chaque fois que possible. Cela peut faire un bon service sur le couvercle du scanner comme une assistance dépannage spontanée quelques livres lourds.

Astuces OCR pour capture et de post-traitement des données numérisée

Utilisez OneNote: Toute personne qui utilise du paquet Microsoft Office "de OneNote» version 2007, peut être enregistré dans les cas simples, le «détour» par l'intermédiaire d'un programme d'OCR et de traiter le scanner directement et de mettre le texte reconnu. Si le scanner est branché et connecté au système, ouvrir le site de registre "Coller" et utiliser le symbole "d'expression du scanner».

Ensuite, sélectionnez l'appareil et régler la résolution. Afin de saisir seulement le texte sur une partie particulière du modèle, utilisez le «Insertion personnalisée". Après avoir effectué l'analyse de l'image dans votre page OneNote actuelle est inséré. Pour effectuer le processus OCR, cliquez avec le bouton droit de la souris sur l'image numérisée et d'utiliser le menu contextuel "Copier le texte de l'image". Le résultat peut ensuite coller [Ctrl] [V] dans OneNote ou d'autres applications de texte et de stocker dans un format cible souhaité.

Rechercher et remplacer: OCR Quand il est comme dans la vie réelle: Vous ne avez jamais 100%. Soyez conscient du processus OCR que 99,9% reconnaissance correcte est un taux de 1 pour mille d'erreur. En termes pratiques, cela signifie que vous avez une erreur avec des paroles allemandes dans environ 150 mots chacun.

Si vous utilisez un correcteur orthographique, vous obtenez les erreurs dans le texte tout à fait sûr sur la piste. Découvrez erreur, vous pouvez aplanir certaines erreurs de séquence éventuellement similaires rapidement. Ce est facile avec la commande "Rechercher et remplacer", vous offrir tous les programmes de traitement de texte graves.

Au bureau / Parole 2012, par exemple, vous trouverez la commande "Remplacer" par défaut dans le menu "Démarrer" en haut à droite. Entrez la chaîne mal détectée et la correcte et confirmer l'exécution commande Remplacer. Cela permet par exemple, si dans le texte reconnu une variété d'espaces doubles arriver que vous remplacez par un seul espace.

Attention dans les tableaux: Le problème, ce est les listes de processus OCR de numéros, tels que des tables. Tandis que les textes basés sur des structures sémantiques et syntaxiques et ont de nombreux licenciements qui aident erreur facile à détecter et corriger, ce est difficile, voire impossible dans les nombres.

Cela peut donner fluage de graves erreurs qui peuvent conséquences fatales pour l'OCR, par exemple, dans une liste numérisée de numéros de téléphone ou Euro. En tant que contre-mesure, il est recommandé d'optimiser le résultat du scan par différents paramètres et de comparer les résultats avec soin.

Essai gratuit

Puissant logiciel OCR pour le PC est presque exclusivement offert sous la forme d'un logiciel commercial. Il est connu en particulier le logiciel de bureau OCR "Fine Reader" ABBYY pour les systèmes d'exploitation Windows, comme les anciennes versions de FineReader sont souvent inclus dans la livraison des scanners à plat ou collection. L'offre d'un logiciel OCR libre pour les systèmes PC est mince. Si vous voulez capturer seulement quelques pages, peut gérer les offres gratuites suivantes:

1. FreeOCR: Sur ce site, l'outil OCR en ligne sera offert. Aucune inscription ne est nécessaire, prend en charge plus de 30 langues. Vous chargez simplement votre document dans l'un des formats les plus populaires tels que JPG, GIF, TIFF, BMP et PDF et obtenez alors le texte capturé. Toutefois, il ne devrait pas être un fichier d'image de plus de 2 Mo ou plus large ou supérieure à 5000 pixels. Un maximum de 10 images sont traitées par heure.

2. cognitive OpenOCR: Un logiciel OCR libre pour l'installation locale est OpenOCR cognitive. En plus de Windows, un port Linux est disponible. Supports sont plus de 20 langues. Les résultats peuvent être sauvegardés dans des formats RTF, HTML ou ASCII. Lors de l'exportation vers Word de traitement de texte ou un tableur Excel structure du document et les polices sont bien en partie conservé. Plus d'informations et le téléchargement sont accessibles ici.

3. FreeOCR: Ce programme OCR a le même nom, mais sinon les mêmes outils en ligne rien en commun. Il ne fonctionne que sur Windows et utilise l'interface TWAIN pour la communication avec le scanner. En outre, les fichiers PDF et d'images TIFF peuvent être utilisés comme une source de reconnaissance de caractères.

La dernière version inclut le support pour 11 langues, plus peut être ajouté. Ce est une exportation directe au format Microsoft Word possible. Pour plus d'informations sur l'installation et l'exploitation peuvent être trouvés ici.

D'autres applications offrent la conseils article experto.de suivante

  • Outils PDF gratuit pour Windows: Les astuces des professionnels des documents
  • Recevez coloré: Conseils pratiques pour l'impression avec des imprimantes laser couleur
  • Collection d'outils Freeware - analyser et corriger LCD / TFT erreur de pixel
  • Les outils alternatifs Foxit PDF gratuit, nitro, de Sumatra et XChange
  • Conseils pratiques pour l'utilisation de surfsticks USB
VOIR AUSSI:
  1.  
  2.  
  3.  
Sans commentaires

Laisser un commentaire

Code De Sécurité