Πώς μπορεί ένας υπολογιστής να μεταφράσει τις σκέψεις σε λέξεις; Μια ομάδα επιστημόνων από το Πανεπιστήμιο της Καλιφόρνια ανακάλυψε ένα νέο, σημαντικό και ελπιδοφόρο κομμάτι του παζλ και το αποτέλεσμα είναι ένα εκπληκτικά πειστικό μοτίβο συνθετικής ομιλίας.
Δημιούργησαν μια συσκευή που μετατρέπει τα εγκεφαλικά κύματα σε λέξεις, εστιάζοντας σε σωματικές κινήσεις που σχετίζονται με την ομιλία και όχι με τον ήχο των λέξεων που προσπαθεί το άτομο να επικοινωνήσει. Αυτή η συσκευή μπορεί να εμφυτευθεί στον εγκέφαλο και να κάνει αυτόματα τη μετατροπή.
Advertisment
Μελετώντας τις κινήσεις της γλώσσας, του λάρυγγα και άλλων μηχανισμών ομιλίας, κατάφεραν να αναπαράγουν ήχους ομιλίας με έναν πολύ πιο αξιόπιστο και αποτελεσματικό τρόπο σε σύγκριση με τις φορές που προσπαθούσαν να συνδυάζουν τα εγκεφαλικά κύματα με προβλεπόμενους ήχους ομιλίας. Χρησιμοποιώντας αυτές τις πληροφορίες, η ομάδα δημιούργησε ένα πρόγραμμα υπολογιστή που προσομοιώνει τις κινήσεις φωνητικής οδού εστιάζοντας στα κέντρα ομιλίας του εγκεφάλου. Τα ευρήματα της ομάδας δημοσιεύτηκαν πρόσφατα στο επιστημονικό περιοδικό Nature.
Το άρθρο συμπέρανε ότι αυτή η νέα μέθοδος θα μπορούσε να αποτελέσει τη βάση μιας πραγματικά επαναστατικής τεχνολογίας για άτομα που αντιμετωπίζουν σοβαρές διαταραχές ομιλίας, σωματικά τραύματα ή άλλες παθήσεις που περιορίζουν την ικανότητά τους να επικοινωνούν.
Η ομιλία μπορεί να μας φαίνεται μια απλή υπόθεση, αλλά δεν είναι: αποτελεί μία από τις πιο περίπλοκες λειτουργίες που εκτελεί ο άνθρωπος, αφού απαιτείται ακρίβεια και συγχρονισμός διαφόρων μυών. Μέχρι τώρα, λοιπόν, ασθενείς με νευρολογικές νόσους, όπως Πάρκινσον, πλάγια αμυοτροφική σκλήρυνση δυσκολεύονται να επικοινωνήσουν με τους άλλους, όπως η διάσημη περίπτωση του Stephen Hawking.
Advertisment
Οι επιστήμονες στην προσπάθειά τους να εφεύρουν μια πρωτοποριακή συσκευή, κατέγραψαν μέσω ηλεκτροδίων τη δραστηριότητα του εγκεφαλικού φλοιού πέντε εθελοντών, όσο εκείνοι μιλούσαν. Χρησιμοποιώντας αυτή την καταγραφή, σχεδίασαν ένα σύστημα, το οποίο σε πρώτο στάδιο μπορούσε να αποκωδικοποιεί τα νευρωνικά σήματα, τα υπεύθυνα για τις επιμέρους κινήσεις της φωνητικής οδού. Σε δεύτερο στάδιο, δημιούργησαν έναν αλγόριθμό που έχει τη δυνατότητα να συνθέτει ομιλία από αυτές τις αποκωδικοποιημένες κινήσεις.
Οι ακροατές της έρευνες καταλάβαιναν την παραγόμενη ομιλία, αν και ήταν σαφώς κατώτερη της φυσικής. Εντούτοις, μέχρι σήμερα αποτελεί την πιο επιτυχημένη προσπάθεια από την πλευρά της επιστήμης και στο μέλλον οι ίδιοι ερευνητές έχουν στόχο την περαιτέρω βελτίωση της επαναστατικής αυτής συσκευής.
[toggle title="Πηγές"]
https://www.nature.com/articles/s41586-019-1119-1
[/toggle]