Όταν πέθανε το 1827 σε ηλικία 56 ετών, ο Λούντβιχ βαν Μπετόβεν άφησε ημιτελή τη 10η συμφωνία του. Έχουν διασωθεί μόνο μερικές χειρόγραφες σημειώσεις που περιγράφουν εν συντομία τα σχέδιά του για το έργο, ενώ οι περισσότερες αποτελούν απλώς ατελείς ιδέες ή αποσπάσματα θεμάτων ή μελωδιών. Τώρα, μια διεπιστημονική ομάδα επιστημόνων πληροφορικής της νεοφυούς εταιρείας Playform AI, με έδρα το Πανεπιστήμιο Rutgers, εκπαίδευσε ένα σύστημα τεχνητής νοημοσύνης να μιμείται το ύφος του μεγάλου συνθέτη και τη χρησιμοποίησε για να γράψει μια πλήρη συμφωνία με βάση αυτά τα αρχικά σχέδια.
Το sciencefocus του BBC μίλησε με τον επικεφαλής ερευνητή του έργου, τον καθηγητή Ahmed Elgammal, για να μάθουμε περισσότερα. Σύμφωνα με τον ίδιο, λοιπόν, ο Μπετόβεν άφησε σχέδια σε διάφορες μορφές, κυρίως μουσικά προσχέδια, αλλά και κάποιες γραπτές σημειώσεις με κάποιες ιδέες. Προηγουμένως, το 1988, ο Άγγλος μουσικολόγος Barry Cooper χρησιμοποίησε την πλειονότητα αυτών των σχεδίων, περίπου 250 μουσικά μέτρα, που προορίζονταν για ένα πρώτο μέρος, στην προσπάθειά του να ολοκληρώσει τη συμφωνία.
Advertisment
Όμως, αυτό που έμεινε πίσω είναι πραγματικά πολύ λίγο. Ουσιαστικά, πρόκειαι για τρία μέτρα μουσικής εδώ και τέσσερα μέτρα μουσικής εκεί και μερικά πρόχειρα σκίτσα, τα οποία ακούγονται σαν τα σημεία εκκίνησης των κύριων θεμάτων των κινήσεων που σκόπευε ο ίδιος να γράψει. Όταν μελετάμε και ακούμε τον Μπετόβεν και άλλους κλασικούς συνθέτες, αυτό συμβαίνει συνήθως. Συνήθως. δηλαδή, εργάζονται με ένα κύριο θέμα και το αναπτύσσουν σε μια ακολουθία δύο λεπτών και στη συνέχεια έρχεται ένα άλλο θέμα. Αυτός είναι ο παραδοσιακός τρόπος σύνθεσης, και αυτό ακριβώς έπρεπε να μάθει και η τεχνητή νοημοσύνη – πώς ο Μπετόβεν και άλλοι κλασικοί συνθέτες ξεκινούν με ένα θέμα και το αναπτύσσουν.
Πώς οι ερευνητές εκπαιδεύουν την Τεχνητή Νοημοσύνη να αναπτύσσει μελωδίες με βάση μόνο αυτό το μοτίβο
Ο τρόπος με τον οποίο η τεχνητή νοημοσύνη παράγει μουσική γενικά μοιάζει πολύ με τον τρόπο με τον οποίο το ηλεκτρονικό μας ταχυδρομείο, για παράδειγμα, προσπαθεί να προβλέψει την επόμενη λέξη στο mail που γράφουμε. Έτσι, όταν γράφουμε ένα μήνυμα, βλέπουμε ότι το σύστημα μας προτείνει τι θα θέλαμε να γράψουμε στη συνέχεια.
Πρόκειται για την ίδια ιδέα – η τεχνητή νοημοσύνη πρέπει να μάθει από πολλά μουσικά δεδομένα. Ρωτά ποια θα ήταν η επόμενη νότα με βάση αυτό που μόλις γράψαμε. Κι αν μπορούμε να προβλέψουμε την επόμενη νότα, τότε μπορούμε και την επόμενη και την επόμενη και ούτω καθεξής. Αυτή είναι η βασική ιδέα.
Όμως αυτό που σύντομα συνειδητοποιούμε είναι ότι αν συνεχίσουμε να γράφουμε μόνο με βάση τις προτάσεις της τεχνητής νοημοσύνης, θα αρχίσει να μη βγάζει πολύ νόημα. Αυτό συμβαίνει και με τη μουσική. Αν απλά του δώσουμε ένα σημείο εκκίνησης και το αφήσουμε να προβλέψει, μπορεί να το κάνει για μερικές νότες. Αλλά μετά από αυτό αρχίζει να είναι ανιαρό και ανούσιο και δεν είναι πλέον πιστή στο κύριο θέμα.
Advertisment
Αυτή ήταν λοιπόν η κύρια πρόκληση. «Πώς μπορούμε να επιτρέψουμε στην τεχνητή νοημοσύνη να παραμείνει στο κύριο θέμα και να το αναπτύξει; Εδώ λοιπόν έρχεται ο ρόλος του ανθρώπινου εμπειρογνώμονα που συνεργάζεται με την ΤΝ. Έτσι, το σύστημα τεχνητής νοημοσύνης χρειάστηκε να «συνεργαστεί» με ειδικούς για να υποδείξουν και να επισημάνουν στο σύστημα του ποιο ήταν το μοτίβο και πού ήταν η ανάπτυξη του θέματος σε πολλά μουσικά κομμάτια. Οπότε, βασικά, η τεχνητή νοημοσύνη μάθαινε ως μαθητής. Αυτό έκανε μεγάλη διαφορά, διότι μετά η ΤΝ μπορούσε πραγματικά να παραμείνει στο θέμα», εξηγεί ο Elgammal.
Πώς όμως κατάφεραν να κάνουν την τεχνητή νοημοσύνη να πάρει τη μελωδία και στη συνέχεια να πει «Πώς θα συνέχιζε ο Μπετόβεν αυτή τη μελωδία;». Ο τρόπος με τον οποίο δημιουργούμε τη μουσική είναι πολύ παρόμοιος με τον τρόπο με τον οποίο χρησιμοποιούμε την ΤΝ για να μεταφράσουμε γλώσσες. Όπως όταν χρησιμοποιείτε το Google Translate ή μια άλλη τεχνητή νοημοσύνη για να μεταφράσει μια πρόταση από μια γλώσσα σε μια άλλη. Αυτού του είδους τα μοντέλα που χρησιμοποιούνται στη μετάφραση μαθαίνουν πολλές προτάσεις υποβάθρου. Ποια είναι λοιπόν η πρόταση στα γερμανικά; Ποια είναι η πρόταση στα αγγλικά; Κι από αυτό, προσπαθούν να μάθουν πώς να τις μεταφράζουν.
Έτσι, βασικά, φανταστείτε ότι έχετε αυτά τα μοντέλα (για την εναρμόνιση). Βάζετε τη μελωδία στη μία πλευρά και στην άλλη πλευρά βάζετε πώς θα την δημιουργούσε ο Μπετόβεν, ώστε η τεχνητή νοημοσύνη να μάθει πώς να μεταφράζει μια γραμμή μελωδίας σε εναρμονισμένη μουσική. Το θέμα με τη μουσική είναι ότι είναι πολύ δομημένη και ακολουθεί πολλούς κανόνες. Αλλά αυτό είναι πολύ δύσκολο για εμάς να το συλλάβουμε και να το καταγράψουμε. Για να το καταλάβετε αυτό πρέπει να έχετε διδακτορικό στη μουσικολογία με ειδίκευση στον Μπετόβεν. Αλλά η μηχανή είναι σε θέση να το συλλάβει στατιστικά και μαθηματικά με έναν πολύ έμμεσο τρόπο και να το χρησιμοποιήσει για να μας δώσει αυτή την εναρμόνιση.
Είναι δυνατόν να βάλουμε μια τεχνητή νοημοσύνη να κάνει ένα εντελώς πρωτότυπο έργο;
Ναι, απαντά η ερευνητική ομάδα: «Δεν έχουμε καμία αμφιβολία γι’ αυτό, το κάναμε αυτό στην εικαστική τέχνη πριν από μερικά χρόνια, όπου αναπτύξαμε έναν σχεδόν αυτόνομο καλλιτέχνη τεχνητής νοημοσύνης που είχε εξετάσει, ας πούμε, τα τελευταία 500 χρόνια δυτικής τέχνης. Ο στόχος ήταν βασικά να δημιουργήσει νέα έργα τέχνης που δεν ακολουθούσαν κανένα υπάρχον στυλ.
Αν η τεχνητή νοημοσύνη δημιουργούσε ένα έργο τέχνης ιμπρεσιονιστή ή του Πικάσο ή ένα έργο τέχνης σε στυλ Αναγέννησης, θα μπορούσε να το συνειδητοποιήσει και έτσι θα έπρεπε να μάθει πώς να δημιουργεί κάτι νέο. Η πρόκληση με αυτό το έργο ήταν στην πραγματικότητα οι περιορισμοί – το γεγονός ότι η τεχνητή νοημοσύνη δεν παρήγαγε μουσική από μόνη της, αλλά παρήγαγε μουσική που βασίζεται στην ιδιοφυΐα του Μπετόβεν και επίσης ακολουθούσε τα σχέδια. Αυτό το καθιστά ακόμη πιο δύσκολο. Ο υψηλός πήχης, βέβαια, των προσδοκιών οφειλόταν δηλαδή στη μεγαλογυΐα του Μπετόβεν. Αλλά όταν πρόκειται να δημιουργηθεί μουσική αυτόνομα, νομίζουμε ότι αυτό είναι πιο εύκολο έργο».
Πηγή:
www.sciencefocus.com/news/ai-beethovens-symphony