Το κείμενο να λειτουργήσει ομιλία δίνεται σε προγράμματα αναγνώρισης ομιλίας κυρίως ως εργαλείο διόρθωση κειμένων , που επιτρέπει στο χρήστη να ακούσουμε τι ο υπολογιστής έχει ερμηνεύσει . Κάθε πρόγραμμα περιλαμβάνει μια βάση δεδομένων με τουλάχιστον 150.000 λέξεις , που του επιτρέπουν να αναλύει τις λέξεις και συγκεκαλυμμένη τους σε κείμενο ή ομιλία . Νέες λέξεις μπορούν να προστεθούν στη βάση δεδομένων ανά πάσα στιγμή . Λογισμικού
εικόνων Εκπαίδευση
Αναγνώριση φωνής συνήθως απαιτεί μια αρχική περίοδο κατάρτισης , κατά την οποία ο χρήστης μιλά σε έναν υπολογιστή που χτίστηκε μικρόφωνο ή ακουστικά . Αυτό επιτρέπει στο πρόγραμμα να εξοικειωθεί με τα πρότυπα φωνή του χρήστη , εξασφαλίζοντας πιο ακριβή μετάφραση .
Η Χαρακτηριστικά
Η
φωνής σε κείμενο φωνητική αφορά την ερμηνεία της ανθρώπινης φωνής , όπως μία κυματομορφή , μια μαθηματική αναπαράσταση του ήχου. Σύμφωνα με την ιστοσελίδα LumenVox Ομιλία του κινητήρα , τα προγράμματα λογισμικού αναγνώρισης ομιλίας αναλύει τα χαρακτηριστικά των ήχων που προέρχονται από την κυματομορφή και να τις συγκρίνουν με τις δικές τους ακουστικών μοντέλων .
Η
εικόνων
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα