Όλα τα βήματα που εμπλέκονται στην OCR - κατάτμηση, εξαγωγή χαρακτηριστικών και ταξινόμηση - μπορεί να υλοποιηθεί με τη χρήση του MATLAB . Τμηματοποίηση , η οποία περιλαμβάνει τον έλεγχο της σύνδεσης των σχημάτων , καθώς και την επισήμανση και την απομόνωση τους , είναι το πιο σημαντικό στάδιο διότι δεν επιτρέπει στο πρόγραμμα OCR για να εξαγάγετε στοιχεία από κάθε ατομικό χαρακτήρα . Κατάτμηση των χειρόγραφο κείμενο είναι ιδιαίτερα δύσκολη λόγω χειρόγραφες χαρακτήρες τείνουν να συνδέονται μεταξύ τους . Εξαγωγή χαρακτηριστικών εξάγει τα πιο χρήσιμα χαρακτηριστικά , όσον αφορά την αναγνώριση , από κάθε χαρακτήρα και ταξινόμηση εκχωρεί αυτά τα χαρακτηριστικά στις κατηγορίες χαρακτήρων .
Εικόνων Capture Image
Η
Σύμφωνα με ένα έγγραφο που παρουσιάστηκε σε ένα σεμινάριο δίνεται από LASIN Εργαστήριο Synergetics στο Πανεπιστήμιο της Λιουμπλιάνα , OCR μπορεί να υλοποιηθεί σε MATLAB με τη χρήση του Neural Network Toolbox και Επεξεργασία Εικόνας Toolbox add- ons . Το πρώτο στάδιο περιλαμβάνει την ανάγνωση της εικόνας στο χώρο εργασίας MATLAB ως αρχείο bitmap . Αυτό είναι ένα είδος αρχείο γραφικών στο οποίο κάθε στοιχείο εικόνας , ή εικονοστοιχείο αντιστοιχεί σε μία ή περισσότερες δυαδικό ψηφίο, ή λίγο , στη μνήμη. Ο ακόλουθος κώδικας χρησιμοποιείται για το έργο αυτό
I = imread ( « training.bmp ') ? . Imshow (Ι )
Η
εικόνων Μετατροπή εικόνας
το επόμενο στάδιο είναι να μετατρέψει την έγχρωμη εικόνα , η οποία αποθηκεύεται ως χωριστές κόκκινο, πράσινο και μπλε επικαλύψεις, σε μια ασπρόμαυρη εικόνα , η οποία αποτελείται από διακριτά αποχρώσεις του γκρι. . Ο παρακάτω κώδικας MATLAB μετατρέπει την εικόνα RGB σε μια ασπρόμαυρη φωτογραφία του ξενοδοχείου
Igray = rgb2gray ( Ι) ? Imshow ( Igray )
εικόνων αλώνισμα
Η
συνέχεια , μια τεχνική γνωστή ως « αλώνισμα » χρησιμοποιείται για να μετατρέψει την ασπρόμαυρη εικόνα σε μία δυαδική εικόνα . Το κύτταρο των κωδικών MATLAB απαιτείται για να μετατρέψει την εικόνα κλίμακας του γκρι σε μια δυαδική εικόνα μοιάζει κάπως έτσι :
ΙΣΒ = im2bw ( Igray , graythresh ( Igray ) ) ? Imshow ( IBW )
Η
Edge Detection
Η
Αφού δημιουργηθεί η δυαδική εικόνα , μεμονωμένων χαρακτήρων κόβονται σε subimages . Αυτά παρέχουν τα ανεπεξέργαστα δεδομένα για τη συνήθη λειτουργία εξόρυξης . Οι subimages πρέπει να περικοπεί δραστικά στα σύνορα του κάθε χαρακτήρα , εάν πρόκειται να είναι κανονικού μεγέθους , έτσι η ανίχνευση την άκρη του κάθε χαρακτήρα είναι σημαντική . Η άκρη μιας εικόνας μπορεί να ανιχνευθεί χρησιμοποιώντας τον παρακάτω κώδικα MATLAB
iEDGE = ακμή ( uint8 ( IBW ) ) ? . Imshow ( iEDGE )
εικόνων Αντικείμενα
Η .
Όλα τα αντικείμενα σε μια εικόνα - και οι ιδιότητες του κάθε αντικειμένου - μπορεί να καθοριστεί χρησιμοποιώντας τον ακόλουθο κώδικα MATLAB
[ Ilabel num ] = bwlabel ( Ifill ) ? disp ( αριθμός ) ? Iprops = regionprops ( Ilabel ) ? Ibox = [ Iprops.BoundingBox ] ? Ibox = αναμορφώσει ( Ibox , [ 4 50 ] ) ? imshow (Ι )
Η
εικόνων
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα