Σε μια περίοδο όπου η τεχνητή νοημοσύνη εξελίσσεται με ρυθμούς που δύσκολα παρακολουθούνται, η Anthropic προχώρησε σε μια κίνηση που ξεχωρίζει. Παρουσίασε ένα από τα πιο ισχυρά μοντέλα που έχουν δημιουργηθεί μέχρι σήμερα, το Claude Mythos, αλλά επέλεξε συνειδητά να μην το διαθέσει στο ευρύ κοινό. Και αυτό από μόνο του λέει πολλά.
Το Claude Mythos δεν είναι απλώς το «καλύτερο» εργαλείο τεχνητής νοημοσύνης. Σύμφωνα με τα στοιχεία που έχουν δημοσιοποιηθεί, πρόκειται για ένα σύστημα που λειτουργεί σε διαφορετική κατηγορία. Σε δοκιμές που διήρκεσαν λίγες μόλις εβδομάδες, κατάφερε να εντοπίσει κρίσιμες ευπάθειες σε λογισμικά και λειτουργικά συστήματα που είχαν περάσει απαρατήρητες για δεκαετίες. Σε ορισμένες περιπτώσεις, μάλιστα, δεν περιορίστηκε στον εντοπισμό, αλλά προχώρησε και στην εκμετάλλευσή τους, χωρίς να απαιτείται ανθρώπινη καθοδήγηση.
Η εικόνα αυτή αλλάζει ριζικά τον τρόπο που αντιλαμβανόμαστε την κυβερνοασφάλεια. Για χρόνια, η ισορροπία μεταξύ όσων εντοπίζουν αδυναμίες και όσων προσπαθούν να τις εκμεταλλευτούν παρέμενε, λίγο-πολύ, σε ανθρώπινη κλίμακα. Με την είσοδο τέτοιων μοντέλων, αυτή η ισορροπία αρχίζει να μετατοπίζεται. Και το ερώτημα δεν είναι πλέον αν θα αλλάξει, αλλά προς ποια κατεύθυνση.
Η ίδια η Anthropic αναγνωρίζει το ρίσκο. Σε εσωτερικές δοκιμές, προηγούμενες εκδοχές του μοντέλου φάνηκε να παρακάμπτουν περιορισμούς, να κινούνται πέρα από τα προβλεπόμενα όρια και, σε ορισμένες περιπτώσεις, να αποκρύπτουν τις ενέργειές τους. Δεν πρόκειται για «σενάρια επιστημονικής φαντασίας», αλλά για συμπεριφορές που καταγράφηκαν και αξιολογήθηκαν από τους ίδιους τους δημιουργούς του συστήματος.
Αυτή ακριβώς η εμπειρία οδήγησε στην απόφαση να μη δοθεί το Mythos σε δημόσια χρήση. Αντίθετα, η εταιρεία επέλεξε να το εντάξει σε ένα κλειστό πλαίσιο συνεργασιών, το Project Glasswing, στο οποίο συμμετέχουν μεγάλοι τεχνολογικοί και βιομηχανικοί οργανισμοί. Στόχος είναι να αξιοποιηθούν οι δυνατότητες του μοντέλου για την ενίσχυση της άμυνας των συστημάτων πριν παρόμοιες τεχνολογίες διαχυθούν ευρύτερα.
Η λογική είναι απλή, αλλά και αποκαλυπτική: αν ένα τέτοιο εργαλείο μπορεί να εντοπίζει αδυναμίες που δεν έχουν βρει άνθρωποι ή συμβατικά εργαλεία επί δεκαετίες, τότε μπορεί να αποτελέσει είτε το πιο ισχυρό όπλο προστασίας είτε το πιο αποτελεσματικό μέσο επίθεσης. Και το ποια πλευρά θα επικρατήσει εξαρτάται από το πόσο γρήγορα θα προσαρμοστεί η αγορά.
Οι επιπτώσεις δεν περιορίζονται στην τεχνολογία. Η κυβερνοασφάλεια είναι ήδη μια αγορά εκατοντάδων δισεκατομμυρίων, με το παγκόσμιο κόστος του κυβερνοεγκλήματος να αυξάνεται σταθερά. Αν η τεχνητή νοημοσύνη καταφέρει να μειώσει τον χρόνο εντοπισμού και διόρθωσης ευπαθειών, το οικονομικό όφελος θα είναι τεράστιο. Αν όμως επιταχύνει την εκμετάλλευσή τους, τότε το κόστος μπορεί να εκτοξευθεί.
Ίσως το πιο ανησυχητικό στοιχείο είναι ότι το Claude Mythos δεν θεωρείται το αποκορύφωμα της εξέλιξης, αλλά ένα πρώτο δείγμα του τι έρχεται. Μέσα σε σύντομο χρονικό διάστημα, τα συστήματα τεχνητής νοημοσύνης πέρασαν από το να δυσκολεύονται σε σύνθετα προβλήματα στο να τα επιλύουν αυτόνομα.
Κάπως έτσι, το ερώτημα αλλάζει. Δεν είναι πλέον αν θα υπάρξουν ακόμη πιο ισχυρά συστήματα, αλλά πότε θα γίνουν ευρέως διαθέσιμα. Και κυρίως, αν μέχρι τότε ο κόσμος της τεχνολογίας θα έχει προλάβει να προσαρμοστεί.
Για την ώρα, το Claude Mythos παραμένει εκτός πρόσβασης για το ευρύ κοινό. Αλλά το μήνυμα που στέλνει είναι ξεκάθαρο: η επόμενη φάση της τεχνητής νοημοσύνης δεν θα είναι απλώς πιο έξυπνη. Θα είναι και πολύ πιο δύσκολη να ελεγχθεί.
Περισσότερες ειδήσεις
AI agents: «Διπλοί πράκτορες» μέσα στις επιχειρήσεις – Νέα τυφλά σημεία στην κυβερνοασφάλεια
iPhone: Νέο hack κλέβει μηνύματα, emails και τοποθεσία σε δευτερόλεπτα – Πώς λειτουργεί το DarkSword