Ενότητες αναγνώρισης φωνής: Διαδικασία εργασίας και εφαρμογές

Δοκιμάστε Το Όργανο Μας Για Την Εξάλειψη Των Προβλημάτων





Η πρόοδος στην τεχνολογία έχει αναπτύξει μια έξυπνη τεχνική διεπαφής ανθρώπου-μηχανής που διευκολύνει τη λειτουργία υπολογιστών ή μηχανών ή ρομπότ χρησιμοποιώντας τις φωνητικές εντολές ενός ανθρώπου χωρίς τη χρήση συστημάτων εισόδου, όπως πληκτρολόγια ή ποντίκι. Αυτή η διεπαφή ανθρώπου-μηχανής (HMI) μπορεί να επιτευχθεί χρησιμοποιώντας αναγνώριση φωνής ενότητες. Σε αυτό το άρθρο, θα συζητήσουμε τις ενότητες αναγνώρισης φωνής μαζί με τη διαδικασία και τις εφαρμογές τους.

Φωνητική ενότητα

Φωνητική ενότητα



Ενότητα αναγνώρισης φωνής

Η αναγνώριση φωνής είναι μια τεχνική που διευκολύνει ένα φυσικό και βολικό διεπαφή ανθρώπου-μηχανής χρησιμοποιώντας τη μονάδα αναγνώρισης φωνής. Εξάγει και αναλύει χαρακτηριστικά φωνής του ανθρώπου που παραδίδεται σε μια μηχανή ή υπολογιστή μέσω του μικροφώνου. Η τεχνική αναγνώρισης φωνής ταξινομείται σε πολλούς τύπους βάσει διαφορετικών κριτηρίων όπως το εύρος των χρηστών, ένας αριθμός λέξεων που χρησιμοποιούνται για αναγνώριση, η φυσικότητα της ομιλίας. Εάν το επίπεδο αναγνώρισης φωνής είναι περισσότερο από 95%, τότε χρησιμοποιείται μόνο η αναγνώριση φωνής.


Αρχή εργασίας της μονάδας αναγνώρισης φωνής

Το HM2007 είναι ένα μονό τσιπ CMOS ενότητα αναγνώρισης φωνής. Πρόκειται για ένα ολοκληρωμένο κύκλωμα αναλογικού μπροστινού μέρους μεγάλης κλίμακας με ανάλυση φωνής, αναγνώριση ομιλίας και διαδικασίες ελέγχου συστήματος αναγνώρισης φωνής. Το HM2007 μπορεί να λειτουργήσει σε δύο τρόπους: χειροκίνητη λειτουργία και λειτουργία ελέγχου CPU.



ΗΜ2007

Διάγραμμα καρφιτσών HM2007

Στον χειροκίνητο τρόπο λειτουργίας, η μονάδα αναγνώρισης φωνής HM2007 χρησιμοποιείται για τη δημιουργία ενός απλού συστήματος αναγνώρισης συνδέοντας στοιχεία όπως ένα πληκτρολόγιο, SRAM μνήμης 8Kbyte και άλλα στοιχεία. Εάν η τροφοδοσία είναι ενεργοποιημένη, τότε το HM2007 ξεκινά μια διαδικασία προετοιμασίας και, εάν ο πείρος WAIT είναι L, τότε ο HM2007 ελέγχει την εξωτερική μνήμη: 8Kbyte SRAM - είτε είναι τέλειο είτε όχι. Ωστόσο, εάν το WAIT είναι H, τότε η διαδικασία ελέγχου μνήμης θα παραλειφθεί από το HM2007. Μετά από αυτήν τη διαδικασία προετοιμασίας, το HM2007 μεταβαίνει σε λειτουργία αναγνώρισης. Στη λειτουργία αναγνώρισης, εάν ο ακροδέκτης WAIT είναι H, τότε το HM2007 είναι έτοιμο να δεχτεί τη φωνή και ξεκινά τη διαδικασία αναγνώρισης. Εάν ο ακροδέκτης WAIT είναι L, τότε το HM2007 δεν δέχεται τη φωνή που πρέπει να αναγνωριστεί. Στη συνέχεια, η εκπαίδευση νέων προτύπων με την εκκαθάριση εκπαιδευμένων προτύπων είναι οι δύο λειτουργίες που εκτελούνται χρησιμοποιώντας τα πλήκτρα λειτουργίας: TRN και CLR. Όλα τα μοτίβα στο HM2007 μπορούν να διαγραφούν εισάγοντας το πλήκτρο αριθμού 99 και πατώντας CLR.

Στον τρόπο λειτουργίας CPU, πολλές λειτουργίες όπως RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, RESET λειτουργίες της μονάδας αναγνώρισης φωνής HM2007 παρέχονται σε αυτήν τη λειτουργία. Παρόμοια με έναν χειροκίνητο τρόπο λειτουργίας, σε αυτήν τη λειτουργία ενεργοποιούνται επίσης, η αναγνώριση, η εκπαίδευση, το αποτέλεσμα, η μεταφόρτωση, η λήψη και η επαναφορά λειτουργιών πραγματοποιούνται με βάση διαφορετικά κριτήρια.

Εφαρμογές της Ενότητας Αναγνώρισης Φωνής

Ρομποτικό όχημα ελεγχόμενο με φωνή

Κιτ Έργου Ρομποτικού Οχήματος με Φωνή

Κιτ Έργου Ρομποτικού Οχήματος με Φωνή

Ένα ρομποτικό όχημα ελεγχόμενο με φωνή με σύστημα αναγνώρισης ομιλίας μεγάλων αποστάσεων έχει σχεδιαστεί για έλεγχο μέσω διεπαφής ανθρώπου-μηχανής και φωνητικών εντολών για τις απομακρυσμένες λειτουργίες του ρομποτικού οχήματος. Ενα 8051 μικροελεγκτής χρησιμοποιείται μαζί με μια μονάδα αναγνώρισης φωνής ή μια ενότητα αναγνώρισης ομιλίας για την επίτευξη της επιθυμητής λειτουργίας. Η κατεύθυνση της κίνησης του ρομποτικού οχήματος μπορεί να ελεγχθεί χρησιμοποιώντας φωνητικές εντολές ή κουμπιά. Οι φωνητικές εντολές αποστέλλονται από το RF από το άκρο μετάδοσης προς το άκρο λήψης. Έτσι, το ρομποτικό όχημα κινείται προς τα εμπρός, προς τα πίσω, αριστερά ή δεξιά, με βάση τις εντολές που λαμβάνει ο δέκτης.


Διάγραμμα μπλοκ πομπού ελεγχόμενου με φωνή ρομποτικού οχήματος

Διάγραμμα μπλοκ πομπού ελεγχόμενου με φωνή ρομποτικού οχήματος

Αυτή η κίνηση του ρομποτικό όχημα σε μια συγκεκριμένη κατεύθυνση μπορεί να ελεγχθεί χρησιμοποιώντας δύο κινητήρες που συνδέονται με τον μικροελεγκτή της σειράς 8051. Πομπός RF μετατρέπει τις εντολές με διακόπτη ή φωνητικές εντολές που μετατρέπονται σε κωδικοποιημένα ψηφιακά δεδομένα προς όφελος του αποδεκτού εύρους (έως 200 μέτρα) από το ρομποτικό όχημα. Τα κωδικοποιημένα δεδομένα που λαμβάνονται στο κύκλωμα δέκτη αποκωδικοποιούνται ώστε να αποστέλλονται σε άλλο μικροελεγκτή για οδήγηση κινητήρων DC με χρήση IC οδηγού κινητήρα για έλεγχο της κατεύθυνσης και της κίνησης των κινητήρων χρησιμοποιώντας τα αποκωδικοποιημένα δεδομένα των φωνητικών εντολών.

Διάγραμμα μπλοκ δέκτη ρομποτικού οχήματος ελεγχόμενης με φωνή

Διάγραμμα μπλοκ δέκτη ρομποτικού οχήματος ελεγχόμενης με φωνή

Αυτό το ρομποτικό όχημα με φωνητικό έλεγχο με έργα αναγνώρισης ομιλίας σε μεγάλες αποστάσεις μπορεί να ενσωματωθεί με ένα Τεχνολογία DTMF που διευκολύνει τον έλεγχο του ρομποτικού οχήματος χρησιμοποιώντας κινητό τηλέφωνο. Αυτή η τεχνολογία DTMF παρέχει μια επικοινωνία πολύ μεγάλης εμβέλειας σε σύγκριση με την τεχνολογία RF - έτσι τα ρομποτικά οχήματα μπορούν να ελεγχθούν εξ αποστάσεως από πολύ μεγάλη απόσταση.

Κύκλωμα φωνής εγγραφής και αναπαραγωγής

9 Απριλίου IC

9 Απριλίου IC

9 Απριλίου IC

Το APR 9301 IC αποτελείται από 28 ακίδες και μη πτητική μνήμη flash. Διευκολύνει την εγγραφή 100Κ κύκλων και αποθήκευση μνήμης για περίπου 100 χρόνια. Απαιτούνται μόνο χαμηλής τάσης 5V και 25mA ρεύματος για την κανονική λειτουργία του ολοκληρωμένου κυκλώματος APR 9301.

Λειτουργία του κυκλώματος εγγραφής φωνής και αναπαραγωγής

Το APR 9301 IC εκτελεί εγγραφή και αναπαραγωγή φωνής λειτουργίες. Η εγγραφή μπορεί να πραγματοποιηθεί με τη λήψη φωνητικών σημάτων χρησιμοποιώντας καλής ποιότητας (οποιουδήποτε είδους) μικρόφωνο συμπυκνωτή συνδεδεμένο στις 17 και 18 ακίδες ενός ολοκληρωμένου κυκλώματος. Εάν κλείσουμε το διακόπτη S1, τότε μπορεί να ξεκινήσει η λειτουργία εγγραφής για εύκολη εγγραφή φωνητικού μηνύματος για 20-30 δευτερόλεπτα. Ως ένδειξη της εγγραφής LED που είναι συνδεδεμένο στον ακροδέκτη 25 του APR 9301 IC θα αναβοσβήνει όσο γειωθεί ο πείρος L 27.

Κύκλωμα φωνής εγγραφής και αναπαραγωγής

Κύκλωμα φωνής εγγραφής και αναπαραγωγής

Μετά την ολοκλήρωση 20 κύκλων με την τελευταία μνήμη, η διαδικασία εγγραφής τερματίζεται αυτόματα αλλάζοντας την τιμή μιας αντίστασης R1 που συνδέεται με τους πείρους 6 και 7 του APR 9301 IC. Μέγιστος χρόνος εγγραφής 20 δευτερολέπτων, 24 δευτερολέπτων και 30 δευτερολέπτων μπορεί να επιτευχθεί αλλάζοντας τις τιμές της αντίστασης R1 ως 52K, 67K και 89K, αντίστοιχα.

Η ενότητα εισαγωγής απενεργοποιείται αυτόματα κατά τη λειτουργία αναπαραγωγής. Εάν ο διακόπτης S2 είναι κλειστός, τότε θα εμφανιστεί ένα μήνυμα από το ηχείο από την αρχή των ηχογραφημένων μηνυμάτων. Εάν ολοκληρωθούν οι λειτουργίες εγγραφής ή αναπαραγωγής, τότε το APR 9301 IC θα τεθεί σε κατάσταση αναμονής.

Αυτό το κύκλωμα μπορεί να συσσωρευτεί σε ένα κοινό PCB. Κολλήστε προσεκτικά τη βάση IC APR 9301 έτσι ώστε να μην υπάρχει βραχυκύκλωμα μεταξύ των ακίδων του ολοκληρωμένου κυκλώματος. Ελέγξτε το κύκλωμα αφού το συναρμολογήσετε στο PCB και, στη συνέχεια, συνδέστε το IC στη βάση IC. Πριν δώσετε τροφοδοσία στο κύκλωμα, ελέγξτε προσεκτικά τις συνδέσεις των πείρων. Η τροφοδοσία ρεύματος με βάση τον ρυθμιστή 5 volt χρησιμοποιείται για παροχή ρεύματος στο κύκλωμα. Χρησιμοποιείται ηχείο καλής ποιότητας 2 ιντσών-8-ωμ για καθαρό ήχο. Η εγγραφή μπορεί να γίνει πατώντας το διακόπτη S1. Τα ηχητικά σήματα (Ομιλία ή Μουσική) παραλαμβάνονται από το μικρόφωνο και μεταφέρονται στο IC όπου τα φωνητικά σήματα αποθηκεύονται στα κελιά μνήμης. Εάν κλείσουμε το διακόπτη S2, τότε αρχίζει η αναπαραγωγή και μπορούμε να ακούσουμε το ηχογραφημένο μήνυμα μέσω του ηχείου.

Η μονάδα αναγνώρισης φωνής μπορεί να χρησιμοποιηθεί σε πολλές εφαρμογές, όπως για τον έλεγχο των συστημάτων αεροσκαφών χρησιμοποιώντας φωνητικές εντολές των πιλότων, για τον έλεγχο μηχανοκίνητου τροχού με χρήση πολυεπεξεργαστή ενεργοποιημένου με φωνή κ.ο.κ. Εάν ενδιαφέρεστε να μάθετε για το ηλεκτρικά και ηλεκτρονικά έργα με βάση τη μονάδα φωνητικής αναγνώρισης, τότε μπορείτε να επικοινωνήσετε μαζί μας δημοσιεύοντας τα σχόλιά σας στην παρακάτω ενότητα σχολίων.

Φωτογραφικές μονάδες: