Πολλά τηλεφωνικά κέντρα χρησιμοποιούν σύνθεσης φωνής servers σε καλούντες διαδρομή από το κύριο μενού σε ένα ανθρώπινο χειριστή ο οποίος εργάζεται σε ένα συγκεκριμένο τμήμα . Αυτοί οι διακομιστές είναι συνήθως σε θέση να παράγουν την ομιλία , καθώς και την κατανόηση του. Σύνθεσης ομιλίας servers που χρησιμοποιούνται επίσης σε εφαρμογές Web για να γίνουν πιο προσιτά και διαδραστικό.
Εικόνων μηχανή σύνθεσης ομιλίας
Η
Μια μηχανή σύνθεσης ομιλίας δέχεται είσοδο σε μορφή κειμένου προγραμματισμένες εκ των προτέρων ή εντολές σε πραγματικό χρόνο και εξόδους αναγνωρίσιμη ομιλία . Μηχανές σύνθεσης φωνής που επεξεργάζονται προ κειμένου εκτελούν συχνά ένα ενιαίο έργο , όπως η ενημέρωση των επισκεπτών ότι μια συγκεκριμένη περιοχή είναι εκτός ορίων . Μηχανές σύνθεσης ομιλίας που δέχονται εντολές σε πραγματικό χρόνο χρησιμοποιούνται για να παρέχουν τα άτομα με ειδικές ανάγκες με ένα μέσο για να επικοινωνούν , και χρησιμοποιούνται επίσης σε συστήματα τηλεπικοινωνιών. Η φωνή που ακούς από αυτά τα συστήματα είναι ένας συνδυασμός των δειγμάτων και των αλγορίθμων ανθρώπινη φωνή που δημιουργούν την ψευδαίσθηση της ομαλής ομιλίας .
Η Αναγνώριση φωνής
Η
αναγνώριση φωνής συστήματα λειτουργούν προς την αντίθετη κατεύθυνση . Θα ερμηνεύσει την ομιλία ενός ανθρώπου και να το μετατρέψει σε κείμενο . Συστήματα αναγνώρισης φωνής χρησιμοποιούν τη μέθοδο της ερμηνείας ομιλία ενός ανθρώπου που βασίζεται σε πιθανότητες . Για παράδειγμα, σε ένα απλό σύστημα αναγνώρισης φωνής , όπου τα μόνα αποδεκτά είσοδοι είναι "ναι" ή "όχι ", ο υπολογιστής είναι σε θέση να υπολογίσουμε την πιθανότητα ότι ένας χρήστης λέγοντας ένα ή το άλλο. Αυτό είναι δυνατό, επειδή το σύστημα αναγνώρισης φωνής μπορεί να συγκρίνει τις φωνητικές τους ήχους της κάθε εισόδου σε μια βάση δεδομένων των δειγμάτων . Η αρχή είναι η ίδια για συστήματα με πολλές εισόδους , αν και η πιθανότητα σφάλματος είναι υψηλότερο . Εικόνων
Text- to-Speech
Η
Text - to-speech είναι μια τεχνολογία που μετατρέπει τον άνθρωπο αναγνωρίσιμο κείμενο στο φωνητικό του ισοδύναμο , τότε το μετατρέπει σε ήχο με τα ηχεία . Ένα μεγάλο μέρος αυτής της διαδικασίας είναι που ασχολούνται με την ερμηνεία του κειμένου και το σπάσιμό της σε κομμάτια . Κάθε κομμάτι μπορεί να αποτελείται από πολλές λέξεις , και αντιπροσωπεύει μεμονωμένες φράσεις . Με αυτόν τον τρόπο , ο κινητήρας κειμένου σε ομιλία μπορεί να καταστήσει την ομιλία που ακούγεται φυσικό για την ανθρώπινη ακροατές. Εξελιγμένα text-to -speech κινητήρες διαρρήξει τις μονάδες αυτές σε μεμονωμένες συλλαβές , πλήρης, με πίσσα και πληροφορίες διάρκειας .
Η
εικόνων
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα