Η Microsoft ανακοίνωσε πως έκανε ένα ακόμη βήμα πιο κοντά στη δημιουργία «ιατρικής υπερνοημοσύνης», καθώς ένα νέο εργαλείο Τεχνητής Νοημοσύνης (AI) κατάφερε να ξεπεράσει έμπειρους γιατρούς στη διάγνωση δύσκολων ιατρικών περιπτώσεων.
Η τεχνολογική κούρσα προς την υπερνοημοσύνη — δηλαδή την ανάπτυξη ΑΙ συστημάτων που υπερβαίνουν τις ανθρώπινες πνευματικές ικανότητες σε κάθε τομέα — συνεχίζεται με γοργούς ρυθμούς. Οι κορυφαίοι παίκτες του χώρου υπόσχονται να μεταμορφώσουν τη λειτουργία των παγκόσμιων συστημάτων υγείας.
Στο τελευταίο της πείραμα, η Microsoft δοκίμασε το νέο της διαγνωστικό σύστημα τεχνητής νοημοσύνης απέναντι σε 21 έμπειρους γιατρούς από το Ηνωμένο Βασίλειο και τις ΗΠΑ, αξιοποιώντας 304 πραγματικές ιατρικές περιπτώσεις που είχαν δημοσιευτεί στο New England Journal of Medicine, ένα από τα εγκυρότερα ιατρικά περιοδικά παγκοσμίως.
Το AI μοντέλο κατάφερε να διαγνώσει σωστά έως και το 85,5% των περιστατικών — σχεδόν τετραπλάσιο ποσοστό επιτυχίας από εκείνο των γιατρών, οι οποίοι είχαν μεταξύ 5 και 20 ετών επαγγελματικής εμπειρίας.
Σύμφωνα με την ανάλυση, το AI σύστημα όχι μόνο έδινε ακριβέστερες διαγνώσεις, αλλά και παρήγγειλε λιγότερες εξετάσεις και απεικονιστικούς ελέγχους, μειώνοντας σημαντικά το κόστος και τον χρόνο διάγνωσης.
Η Microsoft επισημαίνει πως τα αποτελέσματα δείχνουν ότι η Τεχνητή Νοημοσύνη μπορεί να αντιμετωπίσει πολύπλοκα ιατρικά σενάρια τα οποία συχνά δυσκολεύουν ακόμη και εξειδικευμένους γιατρούς, καθώς οι τελευταίοι δεν είναι ειδικοί σε όλα τα πεδία της ιατρικής.
«Η AI μπορεί να συνδυάσει εύρος και βάθος ιατρικής γνώσης, επιδεικνύοντας διαγνωστική λογική που σε πολλές περιπτώσεις υπερβαίνει εκείνη κάθε μεμονωμένου γιατρού», ανέφεραν στελέχη της Microsoft σε επίσημη ανακοίνωση.
Η Microsoft δεν βλέπει την AI ως υποκατάστατο των γιατρών, τουλάχιστον προς το παρόν. Αντιθέτως, θεωρεί πως αυτά τα εργαλεία θα μπορούν να αυτοματοποιούν επαναλαμβανόμενα καθήκοντα, να εξατομικεύουν θεραπείες και να επιταχύνουν την ιατρική διάγνωση.
Το AI διαγνωστικό μοντέλο μιμείται τη διαδικασία σκέψης ενός γιατρού: συλλέγει τα δεδομένα του ασθενούς, παραγγέλνει τις κατάλληλες εξετάσεις και στη συνέχεια καταλήγει σε διάγνωση.
Ένας «gatekeeper agent» έχει πρόσβαση στα στοιχεία του ασθενούς και τα επικοινωνεί σε έναν «diagnostic orchestrator», ο οποίος υποβάλλει ερωτήσεις και ζητά εξετάσεις, λαμβάνοντας απαντήσεις που βασίζονται σε πραγματικά δεδομένα.
Η Microsoft δοκίμασε το σύστημα με κορυφαία AI μοντέλα όπως: GPT, Llama, Claude, Gemini, Grok και DeepSeek.
Το μοντέλο o3 της OpenAI, το οποίο είναι ενσωματωμένο στο ChatGPT, κατάφερε να διαγνώσει σωστά το 85,5% των περιστατικών, έναντι μόλις 20% κατά μέσο όρο από τους 21 γιατρούς.
Τα ευρήματα δημοσιεύθηκαν ως προδημοσίευση, κάτι που σημαίνει ότι δεν έχουν ακόμα περάσει από επιστημονική αξιολόγηση (peer review).
Η Microsoft αναγνώρισε επίσης ορισμένους σημαντικούς περιορισμούς:
Η εταιρεία ζητά περισσότερα στοιχεία από τον πραγματικό κόσμο για την αξιολόγηση της ΤΝ στην κλινική πράξη, τονίζοντας πως θα προβεί σε αυστηρούς ελέγχους και επικυρώσεις πριν προχωρήσει σε ευρύτερη εφαρμογή.