Νέα πίεση στον παγκόσμιο ανταγωνισμό της τεχνητής νοημοσύνης ασκεί η DeepSeek, καθώς η κινεζική startup παρουσίασε την preview έκδοση του πολυαναμενόμενου V4 large language model, διευρύνοντας τη σειρά των open-source μοντέλων της και επιχειρώντας να αποδείξει ότι η Κίνα μπορεί να παραμείνει ανταγωνιστική όχι μόνο σε επίπεδο επιδόσεων, αλλά και κόστους.
Η νέα κυκλοφορία έρχεται περισσότερο από έναν χρόνο μετά το R1 reasoning model, το οποίο είχε προκαλέσει αναταράξεις στις διεθνείς αγορές τεχνολογίας, καθώς συνδύαζε υψηλές επιδόσεις με αισθητά χαμηλότερο κόστος ανάπτυξης και χρήσης σε σχέση με τα μοντέλα των αμερικανικών κολοσσών.
Όπως και σε προηγούμενες κυκλοφορίες της DeepSeek, το νέο μοντέλο διατίθεται ως open-source, επιτρέποντας στους developers να κατεβάζουν τον κώδικα, να τον τρέχουν τοπικά και, στις περισσότερες περιπτώσεις, να τον τροποποιούν.
Το V4 είναι διαθέσιμο σε δύο εκδόσεις, pro και flash, ανάλογα με το μέγεθος και τις ανάγκες χρήσης. Σύμφωνα με την εταιρεία, το μοντέλο εμφανίζει ισχυρές επιδόσεις έναντι εγχώριων ανταγωνιστών, ιδίως σε agent-based tasks, επεξεργασία γνώσης και inference.
Ο Neil Shah, αντιπρόεδρος έρευνας της Counterpoint Research, χαρακτήρισε το preview του V4 ως «σοβαρή επίδειξη ισχύος», επισημαίνοντας ότι προσφέρει χαμηλότερο κόστος inference σε σχέση με προηγούμενα μοντέλα. Το inference αφορά το υπολογιστικό και οικονομικό κόστος που απαιτείται για να χρησιμοποιηθεί ένα ήδη εκπαιδευμένο μοντέλο και να παράγει απαντήσεις.
Η DeepSeek ανέφερε επίσης ότι το V4 έχει βελτιστοποιηθεί για χρήση με δημοφιλή agent tools, όπως το Claude Code της Anthropic και το OpenClaw.
Η DeepSeek ιδρύθηκε το 2023 και έγινε ευρύτερα γνωστή στα τέλη του 2024 με το V3, ένα δωρεάν open-source μοντέλο που, σύμφωνα με την ίδια, εκπαιδεύτηκε με λιγότερο ισχυρά chips και με κόστος πολύ χαμηλότερο από εκείνο μοντέλων εταιρειών όπως η OpenAI και η Google.
Λίγες εβδομάδες αργότερα, τον Ιανουάριο του 2025, παρουσίασε το R1, ένα reasoning model που κατάφερε να φτάσει ή και να ξεπεράσει σε ορισμένα benchmarks κορυφαία LLMs της διεθνούς αγοράς. Η εταιρεία είχε τότε υποστηρίξει ότι το μοντέλο αναπτύχθηκε σε δύο μήνες και με κόστος κάτω από 6 εκατ. δολάρια, χρησιμοποιώντας χαμηλότερης δυναμικότητας chips της Nvidia.
Η αποκάλυψη αυτή είχε εντείνει τα ερωτήματα για το πραγματικό μέγεθος του αμερικανικού προβαδίσματος στην AI, αλλά και για το αν οι τεράστιες επενδύσεις των Big Tech σε υποδομές τεχνητής νοημοσύνης είναι μονόδρομος ή υπερβολή.
Ωστόσο, αναλυτές εκτιμούν ότι το V4 δύσκολα θα έχει το ίδιο σοκ στις αγορές με το R1, καθώς οι επενδυτές έχουν πλέον προεξοφλήσει ότι τα κινεζικά μοντέλα AI είναι ανταγωνιστικά και φθηνότερα στη χρήση.
Το ενδιαφέρον στη νέα κυκλοφορία είναι ότι η DeepSeek δεν τοποθετείται πλέον μόνο απέναντι στους αμερικανικούς παίκτες, αλλά και απέναντι σε άλλα κινεζικά open-source μοντέλα. Σύμφωνα με τον Ivan Su, senior equity analyst της Morningstar, αυτή η νέα σύγκριση δείχνει πόσο έχει ενταθεί ο εγχώριος ανταγωνισμός στην Κίνα.
Μετά την επιτυχία του R1, η DeepSeek βρέθηκε αντιμέτωπη με ισχυρότερη πίεση από εταιρείες όπως η Alibaba και η ByteDance, οι οποίες παρουσίασαν επίσης νέα μοντέλα μέσα στο 2026.
Στο χρηματιστήριο του Χονγκ Κονγκ, μετοχές κινεζικών εταιρειών AI κινήθηκαν πτωτικά μετά την ανακοίνωση της DeepSeek, με τις MiniMax και Knowledge Atlas Technology, γνωστή και ως Zhipu, να υποχωρούν περίπου 8%, ενώ η Manycore Tech κατέγραψε πτώση 9%.
Ένα από τα μεγάλα ερωτήματα γύρω από το V4 αφορά τα chips που χρησιμοποιήθηκαν για την εκπαίδευση και την υποστήριξή του.
Η Huawei επιβεβαίωσε ότι το τελευταίο AI computing cluster της, το οποίο βασίζεται στους επεξεργαστές Ascend, μπορεί να υποστηρίξει το νέο μοντέλο της DeepSeek. Παραμένει, ωστόσο, ασαφές σε ποιον βαθμό χρησιμοποιήθηκαν chips της Huawei στην εκπαίδευση του V4, σε σύγκριση με εκείνα της Nvidia.
Το ζήτημα έχει ιδιαίτερη σημασία, καθώς οι κινεζικές εταιρείες έχουν περιορισμένη πρόσβαση στα πιο προηγμένα chips της Nvidia, λόγω των αμερικανικών περιορισμών στις εξαγωγές. Την ίδια ώρα, το Πεκίνο ενισχύει συστηματικά την προσπάθεια ανάπτυξης εγχώριας βιομηχανίας ημιαγωγών και πιέζει τις κινεζικές τεχνολογικές εταιρείες να στραφούν σε τοπικές εναλλακτικές.
Σύμφωνα με την Wei Sun, principal AI analyst της Counterpoint, η δυνατότητα του V4 να τρέχει εγγενώς σε κινεζικά chips μπορεί να έχει σημαντικές συνέπειες, ενισχύοντας την τεχνολογική αυτονομία της Κίνας και μειώνοντας περαιτέρω την εξάρτηση από τη Nvidia.
Μετά την ανακοίνωση της DeepSeek, οι μετοχές κινεζικών κατασκευαστών chips κινήθηκαν ανοδικά στο Χονγκ Κονγκ, με τη SMIC να ενισχύεται κατά 9% και τη Hua Hong Semiconductor να σημειώνει άνοδο 15%.
Περισσότερες ειδήσεις
«Ντέρμπι κορυφής» ανάμεσα σε Alibaba και DeepSeek με φόντο την κυριαρχία σε ΑΙ
Συναγερμός στην Ουάσινγκτον – Υποψίες ότι η Κίνα εκπαίδευσε νέο AI με απαγορευμένα chips της Nvidia
Το φιλόδοξο πλάνο της OpenAI: Από chatbot σε «κέντρο ελέγχου» της ψηφιακής ζωής