Η Τεχνητή Νοημοσύνη μεγαλώνει και σε εγχώρια επιστημονικά φυτώρια, τονίζει ο Βασίλης Κατσούρος, Διευθυντής στο Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ) του Ερευνητικού Κέντρου Αθηνά. Τα μεγάλα γλωσσικά μοντέλα για την ελληνική γλώσσα πάνω στα οποία δουλεύουν ελληνικά ερευνητικά κέντρα, η συμμετοχή τους σε διεθνή ερευνητικά προγράμματα, οι προκλήσεις, οι ευκαιρίες και οι εκτιμήσεις για την επόμενη δεκαετία.
Είναι η εξέλιξη των μεγάλων γλωσσικών μοντέλων η βασική αιτία της εκρηκτικής ανόδου της Τεχνητής Νοημοσύνης (ΤΝ) παγκοσμίως;
Η εκρηκτική άνοδος της ΤΝ σε παγκόσμιο επίπεδο οφείλεται σε πολλούς παράγοντες, όπως η αύξηση της διαθέσιμης υπολογιστικής ισχύος, η ευρεία διαθεσιμότητα δεδομένων και η ανάπτυξη νέων μοντέλων και τεχνικών βαθιάς μάθησης.
Η εξέλιξη των μεγάλων γλωσσικών μοντέλων αναμφισβήτητα έχει παίξει καθοριστικό ρόλο στο να φέρει την ΤΝ στο επίκεντρο του ενδιαφέροντος. Ξεκίνησε με την κυκλοφορία αρχικά του ChatGPT της OpenAI στα τέλη του Νοεμβρίου 2022, ακολούθησε το LLaMA της Meta στα τέλη του Φεβρουαρίου 2023 που κυκλοφόρησε ως ανοιχτό μοντέλο, όπως και το αντίστοιχο της Mistral τον Σεπτέμβριο 2023, και συνεχίζεται με διαρκώς επιταχυνόμενο ρυθμό μέχρι σήμερα είτε πρόκειται για κλειστά μοντέλα, όπως το Gemini της Google, το Claude της Anthropic, είτε πρόκειται για ανοικτά μοντέλα όπως το DeepSeek ή το Qwen της Alibaba.
Πρέπει να αναγνωρίσουμε ότι τα ανοιχτά μοντέλα έχουν παίξει έναν ιδιαίτερα σημαντικό ρόλο στην ταχεία εξέλιξη των LLM, καθώς επιτρέπουν την περαιτέρω ανάπτυξη της έρευνας και την προσαρμογή των μοντέλων σε εξειδικευμένους τομείς αλλά και σε διαφορετικές γλώσσες και πολιτισμικά περιβάλλοντα.
Σε ποια φάση εξέλιξης των LLΜ βρισκόμαστε; Έχουν βρεθεί σε «πλατό» ή η εξέλιξή τους συνεχίζεται ραγδαία; Παρά την εξέλιξη, υπάρχουν ακόμα σημαντικές αδυναμίες.
Δεν έχουμε φτάσει ακόμα σε ένα «πλατό», ωστόσο η ταχύτητα της εξέλιξης κυμαίνεται. Τα LLM συνεχίζουν να εξελίσσονται ταχύτατα σε διάφορες διαστάσεις, όπως η κατανόηση πολυτροπικών δεδομένων, δηλαδή δεδομένων που συνδυάζουν κείμενα, εικόνες και ήχους, γίνονται πολύγλωσσα, αποκτούν τη δυνατότητα συλλογισμού και αναστοχασμού της απόκρισής τους, συνδυάζονται με άλλα εργαλεία ως μέρος της συλλογιστικής τους -για παράδειγμα εκτελώντας κώδικα- αποκτούν νέα γνώση με πρόσβαση στο διαδίκτυο ή άλλες πηγές, και γίνονται όλο και πιο υπολογιστικά αποδοτικά και οικονομικότερα.
Παράλληλα, διαρκώς αναπτύσσονται νέες τεχνικές όπως η αυτοεκπαίδευση για να αντιμετωπιστούν αδυναμίες των LLM, όπως οι παραπλανητικές ή λανθασμένες απαντήσεις.
Εσείς δουλεύετε με τα LLM στα ελληνικά. Είναι αντίστοιχο το επίπεδο λειτουργίας των μοντέλων στα ελληνικά ή υπολείπονται έναντι της λειτουργίας σε πιο δημοφιλείς γλώσσες; Ποιες από τις γλωσσικές ιδιαιτερότητες της ελληνικής παίζουν ιδιαίτερο ρόλο στην ΤΝ;
Στο Ινστιτούτο Επεξεργασίας του Λόγου ξεκινήσαμε το καλοκαίρι του 2023 να αναπτύσσουμε ανοιχτά μεγάλα γλωσσικά μοντέλα για την ελληνική γλώσσα. Τον Μάρτιο του 2024 κυκλοφορήσαμε το πρώτο μοντέλο μας, το «Μελτέμι», και τον Φεβρουάριο του 2025 το δεύτερο, το «Κρικρί». Τα δύο αυτά μοντέλα διαθέτουν 7 και 8 δισεκατομμύρια παραμέτρους αντίστοιχα και, ενώ σε σύγκριση με μοντέλα παρόμοιου μεγέθους για άλλες γλώσσες, τα μοντέλα μας επιδεικνύουν πολύ καλές επιδόσεις, εξακολουθούν να υπολείπονται των πολύ μεγάλων μοντέλων, αυτών δηλαδή που διαθέτουν εκατοντάδες δισεκατομμύρια παραμέτρους, που είναι διαθέσιμα για δημοφιλείς γλώσσες όπως τα αγγλικά.
Η ανάπτυξη μοντέλων, όμως, θα συνεχιστεί και διαρκώς θα επιδιώκουμε να αναπτύσσουμε μεγαλύτερου μεγέθους LLM που να μπορούν να μοντελοποιούν καλύτερα τις ιδιαιτερότητες της ελληνικής γλώσσας, όπως παλαιότερες μορφές της γλώσσας, αλλά και η ύπαρξη ιδιωμάτων και διαλέκτων. Για τον σκοπό αυτό χρειαζόμαστε μεγαλύτερη ποσότητα ποιοτικού περιεχομένου για την εκπαίδευσή τους, περιεχόμενο από παλαιότερες μορφές της ελληνικής ώστε να υποστηρίζεται καλύτερα η ιστορική εξέλιξη της ελληνικής γλώσσας, αλλά και εξειδικευμένα μοντέλα για διαφορετικά είδη κειμένου που περιλαμβάνουν ορολογία, όπως τα ιατρικά, τα νομικά και άλλα.
Έχουμε ξεκινήσει να επενδύουμε ως χώρα στην ΤΝ; Γίνεται σχετική έρευνα; Υπάρχει ιδιωτική ή δημόσια χρηματοδότηση για κάτι τέτοιο;
Η Ελλάδα έχει ξεκινήσει να επενδύει στον τομέα της ΤΝ σε πολλαπλά επίπεδα. Τα ερευνητικά κέντρα της χώρας μας είναι ιδιαίτερα εξωστρεφή και συμμετέχουν σε πολλά ερευνητικά προγράμματα του «Ορίζοντα Ευρώπη» που σχετίζονται με την ΤN και τις εφαρμογές της.
Η ίδρυση της μονάδας «Αρχιμήδης» στο Ερευνητικό Κέντρο Αθηνά το 2022 είναι ένα σημαντικό βήμα για τη συνεχιζόμενη έρευνα και εκπαίδευση στον τομέα της ΤΝ, καθώς νέοι ερευνητές χρηματοδοτούνται για να κάνουν τη διδακτορική τους έρευνα υπό την επίβλεψη ερευνητών και καθηγητών από ελληνικά ερευνητικά κέντρα και πανεπιστήμια σε συνεργασία με Έλληνες επιστήμονες της διασποράς.
Στον τομέα των υποδομών, η χρηματοδότηση της υπερυπολογιστικής υποδομής «Δαίδαλος» περιμένουμε ότι θα λειτουργήσει ως καταλύτης. Την υποδομή αυτή θα αξιοποιήσει ο Φάρος, το ελληνικό εργοστάσιο ΤΝ, το οποίο χρηματοδοτείται από ελληνικούς και ευρωπαϊκούς πόρους, για να διαθέσει εκτός από υπολογιστικούς πόρους, μοντέλα ΤΝ, καθώς και μεγάλα δεδομένα σε ερευνητικά κέντρα, αλλά και σε δημόσιους φορείς, καθώς και στον ιδιωτικό τομέα.
Ο Φάρος θα εστιάσει στους τομείς, της υγείας, της βιώσιμης ανάπτυξης και της ελληνικής γλώσσας και του πολιτισμού. Επιπλέον, οι ευρωπαϊκοί κόμβοι ψηφιακής καινοτομίας που λειτουργούν εδώ και 2 έτη υποστηρίζουν συνέργειες μικρομεσαίων επιχειρήσεων με ερευνητικούς και ακαδημαϊκούς φορείς, ώστε να δοκιμαστούν καινοτόμες λύσεις ΤΝ σε πραγματικά προβλήματα του παραγωγικού τομέα και της δημόσιας διοίκησης.
Επιπλέον, η Ελλάδα είναι από τα ιδρυτικά μέλη της Ευρωπαϊκής Κοινοπραξίας Ψηφιακών Υποδομών με την ονομασία Συμμαχία για τις Γλωσσικές Τεχνολογίες (Alliance for Language Technologies) που έχει ως στόχο τον συντονισμό των ευρωπαϊκών και των επενδύσεων των κρατών μελών για την ανάπτυξη πολύγλωσσων LLM για τις ευρωπαϊκές γλώσσες και την ενίσχυση των ευρωπαϊκών επιχειρήσεων για την ανάπτυξη καινοτομικών λύσεων.
Στους πρώτους μήνες του 2025 ξεκινούν τέσσερα χρηματοδοτούμενα ευρωπαϊκά έργα στο πλαίσιο της Συμμαχίας για τις Γλωσσικές Τεχνολογίες, συνολικής επένδυσης 100 εκατ. ευρώ περίπου, στα οποία η Ελλάδα συμμετέχει. Είναι πολύ σημαντική η συμμετοχή της χώρας μας σε αυτά τα έργα, καθώς θα λειτουργήσει συμπληρωματικά με τις προσπάθειες που γίνονται στον Φάρο, ώστε η ελληνική γλώσσα να περιλαμβάνεται σε πολυγλωσσικά μοντέλα ΤΝ που δημιουργούνται σε ευρωπαϊκό επίπεδο.
Πώς φαντάζεστε την ΤΝ και τα LLM σε δέκα χρόνια από τώρα; Ποιες είναι οι πιο ριζοσπαστικές αλλαγές που περιμένετε και πώς θα μπορούσαν να αξιοποιηθούν εντός συνόρων;
Σε δέκα χρόνια, τα LLM θα είναι πολυτροπικά, συνδυάζοντας εικόνα, ήχο και κείμενο, θα έχουν ενσωματωθεί στους υπολογιστές, στις κινητές συσκευές, σε ρομποτικά συστήματα αλλά και σε καθημερινές συσκευές και αντικείμενα, δημιουργώντας ένα πανταχού παρόν οικοσύστημα ΤΝ. Θα έχουν δυνατότητα συνεχούς ενημέρωσης και αυτοβελτίωσης, και θα προσφέρουν πιο διαφανείς και επεξηγήσιμες υπηρεσίες, οι οποίες θα είναι ευθυγραμμισμένες με αυστηρούς ηθικούς κανόνες και πρότυπα ασφάλειας, ενισχύοντας την εμπιστοσύνη των χρηστών.
Παράλληλα, η τεχνολογία Gen AI ενέχει σημαντικούς κινδύνους, με κυριότερο τα deepfakes που θα γίνουν σχεδόν μη ανιχνεύσιμα, οδηγώντας σε σοβαρά προβλήματα παραπληροφόρησης, χειραγώγησης και ψηφιακής εξαπάτησης. Απαιτούνται ισχυροί μηχανισμοί πρόληψης και αντιμετώπισης, καθώς και ενημέρωση των πολιτών.
Η Ελλάδα μπορεί να αξιοποιήσει αυτές τις εξελίξεις σε τομείς όπως η έξυπνη γεωργία, η εξατομικευμένη ιατρική και εκπαίδευση και η διαχείριση κρίσεων, αυξάνοντας παράλληλα την ψηφιακή ανθεκτικότητά της.