σαρωτές OCR είναι είτε εισαγωγής κειμένου ή συλλογής δεδομένων σαρωτές . Σαρωτές εισαγωγής κειμένου διαβάσετε ολόκληρο το έγγραφο , ή τουλάχιστον μεγάλα τμήματά του . Η εισαγωγή των δεδομένων μπορεί να είναι το χέρι που τρέφονται ή ο σαρωτής μπορεί να έχει αυτόματη τροφοδοσία δεδομένων , την ανάγνωση , τη διαλογή και στοίβαγμα δυνατότητες . Όταν χρησιμοποιείτε ένα σαρωτή εισαγωγής κειμένου , επεξεργασία λαμβάνει χώρα είτε κατά τη διάρκεια ή μετά τη σάρωση . Συλλογής δεδομένων σαρωτές σύλληψη και τη μορφή των δεδομένων κατά τη διαδικασία σάρωσης , και κανένας άνθρωπος δεν την επεξεργασία των δεδομένων λαμβάνει χώρα . Εξαιτίας αυτού , Data Capture σαρωτές θα πρέπει να είναι πιο ακριβείς .
Η Τύποι
τύποι Scanner μπορεί να είναι σταθερή ή φορητή . Σταθερός scanners , όπως καρότσα , τροφοδοσία φύλλων και τύμπανο σαρωτές χρησιμοποιούν κυρίως εισαγωγής κειμένου για να διαβάσετε , να επεξεργάζονται και να αποθηκεύουν τα δεδομένα εικόνων στον υπολογιστή σας , όπου μπορείτε , στη συνέχεια, να επεξεργαστείτε ή να μορφοποιήσετε το κείμενο συλλαμβάνονται . Χειρός σαρωτές , όπως ψηφιακές πένες ή σαρωτές bar code , χρησιμοποιήστε είτε εισαγωγής κειμένου ή συλλογής δεδομένων για να διαβάσετε και επεξεργασία πληροφοριών δεδομένων και στη συνέχεια να τις αποθηκεύει για μελλοντική επεξεργασία ή "κλειδώσει " τα δεδομένα για αποτροπή επεξεργασίας της .
Η
Η Μέθοδοι
Η
Εν συντομία , ένας σαρωτής OCR παίρνει μια εικόνα του εγγράφου και, στη συνέχεια, το λογισμικό του σαρωτή OCR εξετάζει το OCR γραμματοσειρά η εικόνα περιέχει , και στη συνέχεια διαβάζει και το μετατρέπει σε κείμενο χρησιμοποιώντας είτε Matching Matrix ή τη μέθοδο Εξαγωγή Χαρακτηριστικών . Matching Matrix είναι μια μορφή της εύρεσης προτύπου , όπου ο σαρωτής κοιτάζει ένα χαρακτήρα και να ταιριάζει με ένα στη βιβλιοθήκη του χαρακτήρες ή πρότυπα χαρακτήρα . Εξαγωγή Χαρακτηριστικών δεν βασίζονται σε μια προκαθορισμένη βιβλιοθήκη , αλλά σε γενικά χαρακτηριστικά, όπως ανοικτούς χώρους , κλειστά σχήματα , και τεμνόμενες γραμμές όταν αποκρυπτογράφηση χαρακτήρες . Εξαγωγή Χαρακτηριστικών πηγαίνει επίσης από το όνομα Intelligent Character Recognition , ή ICR .
Εικόνων Οφέλη
Η
Το πιο σημαντικό όφελος από τη χρήση ενός σαρωτή OCR είναι η εξάλειψη των ανθρώπινων λαθών εισαγωγής δεδομένων . Σαρωτές OCR διαβάσει δεδομένα σε ταχύτητες που μπορεί να φτάσει πάνω από 200 χαρακτήρες ανά δευτερόλεπτο . Το ποσοστό ακρίβειας ενός σαρωτή OCR είναι 99,9975 τοις εκατό, ή ένας αντιλαμβάνεται εσφαλμένα χαρακτήρα σε 40.000 , σε σύγκριση με ένα ανθρώπινο ρυθμό αντιλαμβάνεται εσφαλμένα από ένα στα 300 χαρακτήρων. Αυτόματος έλεγχος ψηφίο επικύρωσης μπορεί να φέρει το ποσοστό ακρίβειας OCR σε λιγότερες από μία στις 3.000.000 .
Εικόνων Εκτιμήσεις
Η
Poor πρωτότυπα ποιότητας θα οδηγήσει σε λιγότερο ακριβή έγγραφα OCR . Χειρόγραφα έγγραφα, τα έγγραφα που περιέχουν στυλ κειμένου , παλαιότερα έγγραφα , φωτοτυπίες και τα περισσότερα έγγραφα φαξ δεν λειτουργούν καλά με σαρωτές OCR . Συστάσεις για τα αποδεκτά έγγραφα περιλαμβάνουν τυπωμένο κείμενο σε ένα μέγεθος γραμματοσειράς μικρότερο από 72 πόντους , laser και το μελάνι του εκτυπωτή jet κειμένου , έγγραφα φαξ με 200 κουκκίδες ανά ίντσα ( dpi ) ή μεγαλύτερη ανάλυση και εμπορικά έντυπο υλικό , όπως βιβλία , φυλλάδια και περιοδικά .
Η
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα