Η φράση αυτή ακούγεται προκλητική και είναι. Η Τεχνητή Νοημοσύνη, που μιλάει τόσο γνωστικά, δίνει συμβουλές και γράφει άρτια κείμενα (περιλήψεις, δοκίμια, σενάρια, μεταφράσεις, πεζογραφήματα, ακόμα και ποίηση), είναι δυνατό να μην καταλαβαίνει αυτό που γράφει; Η φράση αυτή λειτουργεί μεταφορικά και κυριολεκτικά, αλλά έχει και άλλες ερμηνευτικές εκδοχές επιπλέον.
Μαζί με τους αλγόριθμους και τις διάφορες πλατφόρμες μαθαίνουμε κι εμείς, τι έχουμε να περιμένουμε από τη νέα τεχνολογική επανάσταση που αλλάζει και πάλι όλο τον κόσμο (όπως η τυπογραφία, η βιομηχανία, η ατμομηχανή, η τηλεφωνία, το αυτοκίνητο, το αεροπλάνο, η ραδιοτηλεόραση, ο υπολογιστής, το διαδίκτυο, το ρομπότ, το κινητό κτλ.). Αλλά η διαδικασία αυτή μόλις έχει αρχίσει· στις διακλαδώσεις της εφαρμογής της και στην εκλέπτυνση της απομίμησης του ανθρώπινου εγκεφάλου. Χωρίς αμφιβολία, σε διάφορες περιοχές του επιστητού η χρήση και εφαρμογή της ΤΝ είναι ευεργετική και χρήσιμη, ακόμα και επιθυμητή. Αναφέρομαι κυρίως στις θετικές επιστήμες (στη βασική έρευνα, basic research, π. χ. τη μελέτη του ανθρώπινου εγκεφάλου ή την αστροφυσική), όπου η σύνδεση, σύγκριση και στατιστική άπειρων δεδομένων, σε χρόνο ντε τε και με ακρίβεια, ξεπερνούν κατά πολύ τις δυνατότητες του ανθρώπινου εγκεφάλου. Αλλά τα πολλά χρήματα της απόσβεσης είναι αλλού: στη βιομηχανική παραγωγή, όπου αντικαθιστά σε πολύ μεγάλο βαθμό πλέον τον άνθρωπο, και στην οικιακή χρήση ή στο κινητό ανεξαρτήτως τόπου και χρόνου, όπου η ΤΝ στην οθόνη γίνεται σύντροφος, φίλος, πνευματικός, εξομολογητής, παρέα στη μοναξιά, σύμβουλος σε προσωπικά κι άλλα θέματα, ακούραστος συνομιλητής με όνομα και ταυτότητα που έδωσες εσύ ο ίδιος, πάντα διαθέσιμος κι ευγενικός, σκέτη ψυχική στήριξη, αναφαίρετος από την καθημερινή ζωή, που απαλλάσσει τον εγκέφαλο των χρηστών από τις περιττές και περίπλοκες σκέψεις – φτάνει να πληρώσεις τη συνδρομή. Τα δωρεάν δεν θα κρατήσουν πολύ.
Στην πρώτη περίπτωση οι επιπτώσεις της ΤΝ είναι κυρίως θετικές, ακόμα και άγνωστες στις εκτάσεις των νεωτερισμών που θα φέρει, στη δεύτερη μεικτές, γιατί από τη μια επιταχύνει και τελειοποιεί την παραγωγή προϊόντων (που σχεδόν τα περισσότερα δεν χρειάζονται πραγματικά), εντείνει ωστόσο και την απολυταρχία της μεταφυσικής πλέον οικονομοκεντρικής σκέψης, από την άλλη όμως στοιχίζει θέσεις εργασίας και αυξάνει την ανεργία ή την περιστασιακή μόνο απασχόληση, με αποτέλεσμα ότι θα ανοίξει η ψαλίδα μεταξύ φτωχών και πλούσιων ακόμα περισσότερα· και τρίτον: ο προσποιούμενος φίλος και σύντροφος στο σπίτι και στο κινητό θα οδηγήσει μεγάλα τμήματα του πληθυσμού σε εξάρτηση από τους συγκεκριμένους αλγόριθμους και σε πνευματική νωθρότητα της ανθρώπινης νόησης, η οποία πλέον απαλλάσσεται από τον κόπο να ζυγίσει τις λύσεις των προβλημάτων μόνοι της (άμεση συνέπεια: η κωδικοποίηση των όποιων συμβουλών, πέρα από τον ευγενικό τόνο του διαλόγου, σύμφωνα με τις προδιαγραφές, δηλ. της ευγένειας και του ευπρεπισμού, που δόθηκαν εξ αρχής από τις ανθρώπινες επεμβάσεις των ειδικών στο ραφινάρισμα των αποτελεσμάτων). Αυτά τα αποτελέσματα είναι όντως καταπληκτικά, αν σκεφτεί κανείς τον τελείως αφηρημένο τρόπο, με τον οποίο λειτουργεί το σύστημα, ιδίως στην ανάγνωση κειμένων και στις απαντήσεις στον ηχητικό διάλογο.
*
Μια ειδική κατηγορία της εφαρμογής της ΤΝ είναι η παραγωγή κειμένων και η συμμετοχή σε διάλογο με τον χρήστη (ερωταπόκριση). Και σε αυτή την κατηγορία αναφέρεται και ο πολύσημος τίτλος αυτού του σύντομου δοκιμίου. Γιατί η ΤΝ δεν “διαβάζει” κείμενα στη γλωσσική τους μορφή και δεν κατανοεί το περιεχόμενό τους με τις σημασίες των λέξεων, τη γραμματική και τη δομή των φράσεων, “δεν ξέρει γράμματα”, αλλά τα μετατρέπει σε διανύσματα (vectors) μαθηματικής και γεωμετρικής φύσεως, τα οποία είναι τελείως άσχετα με σημασίες, ιστορίες, ορθογραφίες, συνυποδηλώσεις, ειρωνείες, υφολογίες, μεταφορές, γλωσσοπαίγνια, συνειρμούς κτλ. και όλο τον ετυμολογικό, σημασιολογικό, αισθητικό, ρυθμικό και ηχητικό φόρτο των λέξεων, τις συντακτικές δομές των φράσεων και την ιεραρχία τους σε μακροπερίοδες συνθέσεις, δηλαδή όλο το πολιτισμικό, τοπικό και ιστορικό φορτίο της γλώσσας, ιδίως της έντεχνης σε δραματουργία, πεζογραφία και ποίηση. Στη συνέχεια θα προσπαθήσω να περιγράψω αυτήν τη μετατροπή, η οποία, ειδικά στον έντεχνο λόγο, απισχναίνει τον αισθητικό και ιστορικό πλούτο της γλώσσας, την παραλλακτικότητά της, τους τρόπους και τις στρατηγικές ύφανσης τού κάθε συνθέματος κι άλλα πολλά, τα οποία αφήνονται στην τυχαιότητα μιας τεχνητής σύνθεσης από έναν πραγματικό ωκεανό κειμένων. Ακόμα και όταν ζητήσω από την πλατφόρμα να μου φτιάξει, με πέντε λέξεις κλειδιά, ένα ποίημα στο ύφος του Παλαμά ή του Ελύτη, έχει στη διάθεση της όλα τα κείμενα του Παλαμά και του Ελύτη που έχουν ψηφιοποιηθεί, και σταχυολογεί από αυτά στην τύχη σπαράγματα, ανασυνθέτοντάς τα σύμφωνα με τις γραμματικές και συντακτικές οδηγίες που δόθηκαν· αν δώσεις δεύτερη εντολή για αλλαγή, θα σου βγάλει άλλο ποίημα, αν δώσεις τρίτη, κι άλλο, κι αυτό σχεδόν στη νιοστή.
Απ’ ό,τι είναι κατανοητό, σε κείμενα νομικά, διοικητικά, σε πραγματείες και δοκίμια η μέθοδος αυτή μπορεί να αποδίδει. Π. χ. στις περιλήψεις, στην αναζήτηση νομολογίας, στην τεκμηρίωση δικαστικών αποφάσεων κτλ. Η εφαρμογή στην εκπαίδευση είναι άκρως προβληματική, και η χρήση της ΤΝ στη μάθηση και στις εξετάσεις θα έπρεπε να απαγορευτεί ή να περιοριστεί σε ειδικές περιπτώσεις όπως και με το κινητό. Στην πράξη ακόμα και αυτό μοιάζει δύσκολο. Για το πανεπιστήμιο, σε σύνθετες ερωτήσεις που θέλουν ανάπτυξη (κι όχι μόνο multiple choice), η λύση μπορεί να είναι οι αποκλειστικά προφορικές εξετάσεις.
Ξεχωριστή περίπτωση είναι βέβαια η χρήση κι εφαρμογή στις τέχνες: στη μουσική σύνθεση (υπήρχε ήδη η περίπτωση της ηλεκτρονικής μουσικής), στη ζωγραφική (π.χ. στα εξώφυλλα των βιβλίων, για να αποφευχθούν τα δικαιώματα) και όλως ιδιαιτέρως στη λογοτεχνία. Το επίμαχο θέμα είναι εν πρώτοις τα συγγραφικά δικαιώματα που δεν πληρώθηκαν από τις εταιρείες ανάπτυξης και εκμετάλλευσης της ΤΝ και χρησιμοποίησαν λαθραία μεγάλα τμήματα της παγκόσμιας λογοτεχνίας για την τροφοδότηση του συστήματος χωρίς την άδεια των δημιουργών και την καταβολή των σχετικών αμοιβών, αλλά στο βαθύτερο βάθος και η ενδεχόμενη απαξίωση κι εξαφάνιση λογοτεχνίας όπως την ξέρουμε. Σε ανοιχτή επιστολή ομάδας συγγραφέων προς τους εκδοτικούς οίκους των ΗΠΑ για τη χρήση της τεχνητής νοημοσύνης δεκάδες ονομαστοί συγγραφείς καλούν τους μεγάλους εκδοτικούς οίκους να δεσμευτούν δημόσια να μην εκδώσουν ποτέ βιβλία “γραμμένα από μηχανές”. Επισημαίνουν: “Τα κείμενα που παράγει η τεχνητή νοημοσύνη φαίνονται φθηνά επειδή είναι φθηνά. Φαίνονται απλά επειδή είναι εύκολο να παραχθούν”. Αναγνωρίζει τα κοινωνικά οφέλη που μπορεί να έχει, “αλλά η αντικατάσταση της τέχνης και των καλλιτεχνών δεν είναι ένα από αυτά”. Οι συγγραφείς ζητούν, να μην δημοσιεύσουν ποτέ βιβλία της ΤΝ, που είναι συντεθειμένες με ιδέες κλεμμένες από συγγραφείς, να μην προωθήσουν τέτοια συνθέματα λογοκλοπής, να μην απολύσουν κόσμο, να μην δημιουργήσουν θέσεις για την ΤΝ (επιμελητές, μεταφραστές κτλ.)[1]. Παρόμοια ανοιχτή επιστολή συνυπέγραψε η ελληνική Εταιρεία Συγγραφέων μαζί 13 άλλους μεγάλους ευρωπαϊκούς οργανισμούς, ομοσπονδίες, ενώσεις συγγραφέων και άλλων δημιουργών σχετικά με τα δικαιώματα καλλιτεχνών κι άλλων δημιουργών προς την Επιτροπή Νομικών Ζητημάτων του Ευρωπαϊκού Κοινοβουλίου, όπου τονίζεται πως “Μέχρι σήμερα, τα μοντέλα τεχνητής νοημοσύνης έχουν ήδη εκμεταλλευτεί τεράστιες ποσότητες προστατευόμενων έργων χωρίς καμία άδεια, αμοιβή ή διαφάνεια για τους/τις δημιουργούς, τους/τις καλλιτέχνες και τους/τις ερμηνευτές/τριες που εκπροσωπούμε”[2].
Αυτή η συζήτηση έχει ξεκινήσει και διεξάγεται σε πολλά επίπεδα και σε πολλές χώρες αλλά τα σχετικά αδικήματα έχουν ήδη διαπραχθεί και συνεχίζουν να διαπράττονται με αυξανόμενο ρυθμό, τα όποια νομοθετικά μέσα τρέχουν πίσω από τα γεγονότα (όπως η εγκληματικότητα είναι πάντα μπροστά από τη νομοθεσία). Ο καθημερινός τύπος και τα περιοδικά, έντυπα και ηλεκτρονικά, που ασχολούνται (μεταξύ άλλων και) με τον πολιτισμό, είναι γεμάτα με αιτήματα για διαύγεια, προστασία πνευματικών δικαιωμάτων, διαφύλαξη προσωπικών δεδομένων κτλ., αλλά είναι πολύ αργά. Τα χρήματα που διακυβεύονται από την ανάπτυξη κι εφαρμογή του νέου κλάδου της τεχνολογίας παντού είναι παρά πολλά. Στα υποσχόμενα κέρδη υποκύπτει κάθε ηθικός δισταγμός. Και σχετικές διαφημίσεις διατείνουν (και έχουν μάλιστα και δίκαιο), πως τώρα, στη νέα εποχή αυτή που ανατέλλει, ο καθένας μπορεί να γίνει λογοτέχνης πολύ εύκολα, να γράφει έπη και μυθιστορήματα, τραγούδια και ποίηση· και η λογοτεχνία όπως την ξέραμε (και οι αναγνώστες της) ανήκουν ίσως ήδη στο παρελθόν. Άλλη μια ήττα της ποιότητας και της πρωτοτυπίας απέναντι στην κωδικοποίηση των πάντων και τη βιομηχανική παραγωγή προϊόντων και καταναλωτών, και τώρα μάλιστα την τυποποίηση των ίδιων των σκέψεων και νοοτροπιών.
Η φυσική υπόσταση των οργανισμών όμως πιθανώς θα αντισταθεί, και αν δεν ισορροπηθούν οι τεχνητές αυτές εξελίξεις με τη σοφία και δύναμη της φύσης, που χρειαζόταν εκατομμύρια χρόνια να φτάσει στη συνθετότητα αυτή που τη διακρίνει, το μέλλον ανήκει όλο και περισσότερο σε ψυχολόγους, γιατρούς και ψυχίατρους.
Στο τέλος να δώσω όρισμένες εκλαϊκευτικές και απλουστευμένες εξηγήσεις για τον τρόπο και τη διαδικασία της μετατροπής της γλώσσας των κειμένων, σε μια νέα “γλώσσα”, που “δεν ξέρει τι λέει”, αλλά μιμείται το πρότυπο με μερικώς πετυχμένο τρόπο. Αντλώ από ένα άρθρο στο internet που έχει ακριβώς αυτή τη σκοπιμότητα[3]. Στο internet προσφέρονται και διαφημίζονται ήδη προγράμματα ελέγχου, τα οποία αποφαίνονται αν ένα κείμενο έχει γραφεί από την ΤΝ ή από άνθρωπο· το ποσοστό επιτυχίας της διάγνωσης κυμαίνεται γύρω στα 60%, ανάλογα βέβαια με τη φύση του κειμένου. Τα κριτήρια διάγνωσης δεν είναι απόλυτα, αλλά το σωστό cocktail συνδυασμών τούς βγάζει αυτό το ποσοστό. Επίπλεον κάθε έμπειρος αναγνώστης της ποίησης θα καταλάβει μόνος του με σχετικά μεγάλη βεβαιότητα, αν ένα κείμενο είναι “ανθρώπινο” ή όχι. Θα μάθουμε κι αυτό! Μολοντούτο ο βαθμός της επιτυχίας τέτοιων μιμήσεων πραγματικής λογοτεχνίας (και ακριβώς αυτό διαφημίζεται) είναι τρομακτικός!
Τα βήματα εκπαίδευσης και εκμάθησης της μίμησης της γλώσσας από την ΤΝ ξεκινάει ως το πρώτο βήμα με τη μετατροπή των λέξεων σε “διανύσματα” (vectors) μαθηματικής και γεωμετρικής φύσεως μέσω του transformer, ένας αλγόριθμος που μεταγράφει μια λέξη όχι μόνο σε αριθμούς (το μόνο που κατανοούν τα σχετικά computers), αλλά συνδέει τις λέξεις με στατιστικό τρόπο με άλλες κοντινές λέξεις, καθορίζει τη συχνότητα των συνεμφανίσεών τους και αποσαφηνίζει τη λειτουργία τους μέσα στη φράση. Αυτό σημαίνει πως τα διανύσματα αυτά λειτουργούν σαν ένα σύνολο αριθμών, που αποτελούν συντεταγμένες, οι οποίες περιγράφουν τη θέση και τη “βαρύτητα” της λέξεις σ’ έναν πολυδιάστατο χώρο (το ανάλογο του κειμένου). Αυτή η διαδικασία οδηγεί (βήμα 2) στη βαθμολόγησή τους, ποιο αριθμητικό “βάρος” (μαθηματικά) θα πάρουν, σχετικά με τις σχέσεις τους με άλλες λέξεις και μοτίβα. Αυτό είναι μια διαδικασία που πραγματοποιείται συνεχώς και αναπροσαρμόζεται αδιάλειπτα, οδηγεί στην “κατανόηση” της σχέσης των λέξεων μεταξύ τους στατιστικά, κι έτσι ο αλγόριθμος αποκτά “πείρα”.
Αυτό είναι τα γενικά. Η εκπαίδευση της ΤΝ γίνεται ύστερα σε ποιοτικά κείμενα επιλεγμένα (βήμα 3), ώστε να βελτιώνεται η ακρίβεια των προβλέψεων, ποιες λέξεις ακολουθούν και σε ποια συμφραζόμενα εμφανίζονται. Σε αυτό το στάδιο δηλ. αποκλείονται τολμηροί ή μοναδικοί συνειρμοί και το σύστημα μαθαίνει τα “συνήθη” και τεστάρεται. Αυτό το στάδιο συμπληρώνεται με το attention score (βήμα 4), όπου εντοπίζονται οι πιο σημαντικές λέξεις μιας φράσης (ουσιαστικό, ρήμα). Η ΤΝ παράγει συνήθως άρτιες φράσεις και έχει μια τάση προς τις σύντομες. Αυτό το βήμα συνδυάζεται και με τα dot products που εξετάζουν τις ομοιότητες των λέξεων μεταξυ τους (βήμα 5) και καθορίζει στατιστικά ποιες είναι οι πιο σημαντικές λέξεις για την “κατανόηση”. Αυτά τα αποτελέσματα υποβάλλονται στα dot products που εξετάζουν τις ομοιότητες των λέξεων μεταξύ τους (βήμα 6) και υπολογίζουν τις πιθανότητες συσχετισμών των λέξεων, δηλαδή φτάνουν σε ένα αποτέλεσμα και παίρνουν αποφάσεις. Ακολουθούν ακόμα δύο διορθωτικά βήματα (7 και 8): με την backpropagation τεστάρονται τα αποτελέσματα σε εκατομμύρια κείμενα και διορθώνονται σχετικά τα “βάρη” (σημ.2) κάθε λέξης· δηλαδή το σύστημα μαθαίνει από τη διόρθωση των “λαθών”, αυξάνοντας συνεχώς την ακρίβεια του συστήματος. Αυτό το βήμα συμπληρώνεται με το fine-tuning με μια διαδικασία όπου συμμετέχουνε πλέον οι άνθρωποι (Reinforcement Learning from Human Feedback, RLHF), ειδικοί ερευνητές στην επεξεργασία φυσικής γλώσσας (NLP experts): γλωσσολόγοι, επιμελητές κειμένων, κοινωνιολόγοι, ψυχολόγοι, άτομα με σπουδές στη φιλοσοφία και ειδίκευση στην ηθική· εδώ εξασφαλίζεται η ευθυγράμμιση με ηθικές αξίες και κοινωνικά αποδεκτές προσεγγίσεις, βελτιώνεται η ποιότητα των απαντήσεων, – είναι τελικά αυτοί που φτιάχνουν τα χρηστικά και καλογραμμένα κείμενα που ανταποκρίνονται στις ανάγκες των χρηστών, κείμενα αξιόπιστα και λειτουργικά.
Κάπως έτσι λοιπόν δημιουργούνται τα γλωσσικά μοντέλα LLMs (large Language Models) της ΤΝ, η οποία προσπαθεί να “κατανοεί” τη γλώσσα μεταφέροντας κάθε ερώτηση και απάντηση, ολόκληρους τους διαλόγους σε μια μαθηματική “μεταγλώσσα”, που προσποιείται την κατανόηση, ενώ στην πραγματικότητα δεν ξέρει ακριβώς τι σημαίνουν αυτά που λέει, “δεν ξέρει τι λέει”. Από μόνη της η ΤΝ δεν έχει καμία ευθύνη. Και η γλώσσα δεν είναι μόνο οι σημασίες, είναι το πιο εξελιγμένο σύστημα επικοινωνίας του ανθρώπινου πολιτισμού, με παραγλωσσικά και πολλά άλλα σημεία[4], υπαινιγούς, ειρωνείες, συναισθήματα, παύσεις και σιωπές, εκφωνήματα, αναστεναγμούς και χίλια άλλα, τα οποία συναπαρτίζουν την ποιότητα και την αύρα ενός διαλόγου. Στη δημιουργία έντεχνων κειμένων, όπως την ποίηση, αυτή η αδυναμία είναι πιο φανερή. Δεν μυρίζει “ανθρωπίλα”. Δεν είναι αυθόρμητη. Δεν αλλάζει γνώμη. Το μεγάλο ατού της ΤΝ στον γλωσσικό τομέα είναι η ταχύτητα της σύνθεσης (είτε πρόκειται για απάντηση ή για σύνθεμα), η οποία, στην κυριολεξία, καταργεί την ύπραξη του χρόνου. Αλλά ο χρόνος και ο χώρος είναι οι θεμελιώδεις συντεταγμένες της υπόστασης των οργανισμών, του σώματος μας, των στοχασμών μας και γενικά της ωρίμασνης της σκέψης. Χωρίς το παρελθόν, και το δικό μας ατομικά, δεν υπάρχει και μέλλον, επίσης και προσωπικά.
Η χρήση της ΤΝ στις τέχνες είναι ένα πείραμα που αποπροσανατολίζει την απόλαυση της πρόσληψης και στερεί από τον δημιουργό την ικανοποίση και την εσωτερική ολοκλήρωση. Κάνει αυτόν τον φτωχό κόσμο του νυν ακόμα πιο φτωχό.
https://www.lemonweb.gr/blog/pos_leitourgei_i_tehniti_noimosyni_ai_enas_aplos_odigos/
12/11/2024
Σύνοψη
Η διαδικασία εκπαίδευσης και βελτίωσης της Τεχνητής Νοημοσύνης περιλαμβάνει τα εξής στάδια:
-
Μετατροπή λέξεων σε διανύσματα(vectors) ώστε το AI να μπορεί να κατανοήσει κείμενο σε μαθηματική μορφή.
-
Εκχώρηση βαρώνστις σχέσεις μεταξύ λέξεων, επιτρέποντας στο AI να αναγνωρίζει σχέσεις και μοτίβα.
-
Εκπαίδευση με επιμελημένα κείμενα υψηλής ποιότητας για τη βελτίωση της ακρίβειας των προβλέψεων.
-
Χρήσηattention scores για την ανάδειξη των πιο σημαντικών λέξεων σε κάθε πρόταση.
-
Υπολογισμός ομοιοτήτων μεdot products για την αξιολόγηση της συνάφειας των λέξεων στο περιεχόμενο.
-
Μετατροπήattention scores σε πιθανότητες με χρήση της συνάρτησης softmax, επιτρέποντας στο AI να λαμβάνει αποφάσεις με μεγαλύτερη ακρίβεια.
-
Βελτίωση μεbackpropagation, προσαρμόζοντας τα βάρη βάσει των λαθών, ώστε να αυξάνεται συνεχώς η ακρίβεια του συστήματος.
-
Fine–tuning μεReinforcement Learning from Human Feedback (RLHF), όπου ειδικοί αξιολογούν και βελτιώνουν τις απαντήσεις του AI για ευθυγράμμιση με ηθικές αξίες και πρακτική χρησιμότητα.








ευχαριστούμε για το κείμενο