Τι είναι και πώς λειτουργεί το κινεζικό DeepSeek, που “γκρέμισε” τις μετοχές τεχνολογίας στις ΗΠΑ

Από

28/01/2025

742

Οι επενδυτές εγκαταλείπουν τις αμερικανικές μετοχές τεχνητής νοημοσύνης εν μέσω έκπληξης για μια νέα, φθηνότερη, αλλά ταυτόχρονα αποτελεσματική εναλλακτική κινεζική τεχνολογία. Τι είναι όμως και πώς λειτουργεί η εφαρμογή DeepSeek;

Τι είναι το DeepSeek;

Η DeepSeek είναι μια κινεζική εταιρεία τεχνητής νοημοσύνης (AI) με έδρα το Hangzhou που προέκυψε πριν από μερικά χρόνια από μια πανεπιστημιακή startup. Ο δηλωμένος στόχος του είναι να δημιουργήσει μια τεχνητή γενική νοημοσύνη – έναν όρο για μια νοημοσύνη σε ανθρώπινο επίπεδο που καμία εταιρεία τεχνολογίας δεν έχει επιτύχει ακόμη. Δεν έχει φτάσει ακόμη εκεί, αλλά αυτός μπορεί να είναι ένας λόγος για τον οποίο οι επιστήμονες υπολογιστών στο DeepSeek έχουν υιοθετήσει μια διαφορετική προσέγγιση για την κατασκευή του μοντέλου AI τους, με αποτέλεσμα να φαίνεται πολλές φορές φθηνότερο στη λειτουργία του από τους ανταγωνιστές του στις ΗΠΑ.

Ένας άλλος λόγος για τον οποίο φαίνεται ότι ακολούθησε την προσέγγιση χαμηλού κόστους θα μπορούσε να είναι το γεγονός ότι οι Κινέζοι επιστήμονες υπολογιστών έπρεπε από καιρό να ξεπεράσουν τα όρια στον αριθμό των τσιπ υπολογιστών που είναι διαθέσιμα σε αυτούς, ως αποτέλεσμα των περιορισμών της κυβέρνησης των ΗΠΑ.

Γιατί δεν το είχαμε ξανακούσει;

Η εταιρεία εντυπωσιάζει εδώ και καιρό αθόρυβα τον κόσμο της τεχνητής νοημοσύνης με τις τεχνικές της καινοτομίες, συμπεριλαμβανομένης της αναλογίας κόστους προς απόδοση αρκετές φορές χαμηλότερη από αυτή των μοντέλων που κατασκευάζονται από τη Meta (Llama) και την OpenAI (Chat GPT). Δεν έχει κάνει τόσο θόρυβο για τις δυνατότητες των καινοτομιών της όσο οι εταιρείες της Silicon Valley. Οι τελευταίες έχουν κυκλοφορήσει ανακοινώσεις προϊόντων εδώ και μήνες, καθώς επείγονται όλο και περισσότερο να δημιουργήσουν επιτέλους αποδόσεις από τις επενδύσεις πολλών δισεκατομμυρίων δολαρίων. Θα πρέπει να αναμένουμε ωστόσο να δούμε περισσότερα από το χαρούμενο λογότυπο της μπλε φάλαινας του DeepSeek, καθώς όλο και περισσότεροι άνθρωποι σε όλο τον κόσμο το κατεβάζουν για να πειραματιστούν.

Τι είναι το μοντέλο R1 για το οποίο μιλά όλος ο κόσμος;

Είναι το μοντέλο DeepSeek AI για το οποίο οι άνθρωποι ενθουσιάζονται περισσότερο προς το παρόν, καθώς ισχυρίζεται ότι έχει απόδοση ανάλογη με το μοντέλο o1 της OpenAI, το οποίο κυκλοφόρησε στους χρήστες του Chat GPT τον Δεκέμβριο. Τη Δευτέρα ήταν η πιο δημοφιλής δωρεάν εφαρμογή που κατεβάστηκε στο κατάστημα εφαρμογών της Apple στο Ηνωμένο Βασίλειο και σε άλλα μέρη του κόσμου.

Υπάρχουν όμως πολλά μοντέλα τεχνητής νοημοσύνης από OpenAI, Google, Meta και άλλες εταιρείες. Πού βρίσκεται το μεγάλο ζήτημα;

Αυτό το μοντέλο χρησιμοποιεί ένα διαφορετικό είδος εσωτερικής αρχιτεκτονικής που απαιτεί λιγότερη χρήση μνήμης, μειώνοντας έτσι σημαντικά το υπολογιστικό κόστος κάθε αναζήτησης ή αλληλεπίδρασης με το σύστημα τύπου chatbot. Έχει επαινεθεί από ερευνητές για την ικανότητά του να αντιμετωπίζει σύνθετες συλλογιστικές εργασίες, ιδιαίτερα στα μαθηματικά και την κωδικοποίηση και φαίνεται να παράγει αποτελέσματα συγκρίσιμα με τους ανταγωνιστές, με ένα κλάσμα της υπολογιστικής ισχύος που χρειάζονται εκείνοι. Η DeepSeek ανέφερε ότι χρειάστηκαν δύο μήνες και λιγότερα από 6 εκατομμύρια δολάρια για την ανάπτυξη του μοντέλου, αν και ορισμένοι παρατηρητές προειδοποιούν ότι πιθανόν το ποσό έχει σκόπιμα υποτιμηθεί. Ωστόσο, είναι έτσι κι αλλιώς πολύ μικρότερο από τα δισεκατομμύρια που ξοδεύουν οι εταιρείες τεχνολογίας της Silicon Valley για την ανάπτυξη AI και είναι λιγότερο δαπανηρό στη λειτουργία του.

Ποιος το κατέχει;

Ένας πρόσωπο-κλειδί είναι ο Liang Wenfeng, ο οποίος κάποτε διαχειριζόταν ένα κινεζικό hedge fund που τώρα χρηματοδοτεί το DeepSeek. Σε μια σπάνια συνέντευξη, έχει δηλώσει: “Για πολλά χρόνια, οι κινεζικές εταιρείες έχουν συνηθίσει άλλες να κομίζουν τεχνολογική καινοτομία, ενώ εστιάσαμε στη δημιουργία εσόδων από εφαρμογές – αυτό ωστόσο δεν είναι αναπόφευκτο. Σε αυτό το κύμα, η αφετηρία μας δεν είναι να εκμεταλλευτούμε την ευκαιρία για γρήγορο κέρδος, αλλά μάλλον να φτάσουμε στα τεχνολογικά μας απώτατα όρια και να οδηγήσουμε την ανάπτυξη ολόκληρου του οικοσυστήματος… Πιστεύουμε ότι καθώς η οικονομία αναπτύσσεται, η Κίνα πρέπει σταδιακά να γίνει συνεισφέρων παράγοντας”.

Γιατί υποχώρησαν οι αμερικανικές μετοχές τεχνολογίας;

Εκατοντάδες δισεκατομμύρια δολάρια εξαφανίστηκαν από την κεφαλαιοποίηση μεγάλων τεχνολογικών μετοχών μετά τη διάδοση των ειδήσεων για την απόδοση του chatbot DeepSeek το σαββατοκύριακο. Το χρονοδιάγραμμα ήταν σημαντικό, καθώς τις τελευταίες ημέρες οι εταιρείες τεχνολογίας των ΗΠΑ είχαν δεσμεύσει εκατοντάδες δισεκατομμύρια δολάρια επιπλέον για επενδύσεις στην τεχνητή νοημοσύνη – μεγάλο μέρος των οποίων θα διατεθεί για την κατασκευή της υπολογιστικής υποδομής και των πηγών ενέργειας που απαιτούνται, όπως πιστεύεται ευρέως, για την επίτευξη του στόχου της τεχνητής γενική νοημοσύνη. Η απόδοση του DeepSeek φαίνεται να αμφισβητεί, τουλάχιστον σε πρώτο πλάνο, αυτή την αφήγηση.

Ποια είναι η ανησυχία για την Nvidia;

Η Nvidia είναι μια από τις εταιρείες που έχει κερδίσει τα περισσότερα από την έκρηξη της τεχνητής νοημοσύνης. Από κατασκευαστής καρτών γραφικών για βιντεοπαιχνίδια έγινε ο κυρίαρχος κατασκευαστής τσιπ στην αδηφάγα πεινασμένη βιομηχανία τεχνητής νοημοσύνης. Συγκρίθηκε με έναν μετριοπαθή έμπορο αξινών και κουβάδων στην Καλιφόρνια του 19ου αιώνα, ο οποίος έτυχε να βρισκόταν επιτόπου όταν συνέβη ο πυρετός του χρυσού και έτσι έγινε ένας τεράστιος προμηθευτής της πλουσιότερης βιομηχανίας του κόσμου. Οι εταιρείες τεχνολογίας που κοιτάζουν λοξά το DeepSeek πιθανότατα αναρωτιούνται αν πρέπει τώρα να αγοράσουν τόσο πολλά από τα εργαλεία της Nvidia. Η χρηματιστηριακή της αξία μειώθηκε κατά 600 δισ. δολάρια τη Δευτέρα.

Τι δεν κάνει το DeepSeek;

Δεν έχει φτάσει στην τεχνητή γενική νοημοσύνη, το όριο στο οποίο η τεχνητή νοημοσύνη αρχίζει να πλησιάζει και που επιδιώκουν το OpenAI και άλλοι κολοσσοί στη Silicon Valley. Ο Sam Altman, διευθύνων σύμβουλος της OpenAI, προειδοποίησε ότι η σημαντική ανακάλυψη είναι απίθανο να είναι επικείμενη. Ωστόσο κάνει ό,τι μπορούν να κάνουν και οι άλλοι, με ένα κλάσμα του κόστους.

Είναι η ανάδυση του DeepSeek καλό νέο;

Μια πιθανότητα είναι οι προηγμένες δυνατότητες τεχνητής νοημοσύνης να μπορούν τώρα πια να επιτευχθούν χωρίς την τεράστια ποσότητα υπολογιστικής ισχύος, μικροτσίπ, ενέργειας και νερού ψύξης που θεωρούνταν αναγκαία. Όπως συμβαίνει με όλες τις τεχνολογικές ανακαλύψεις, ο χρόνος θα είναι ο κριτής του τι απ’ όλα θα γίνει πραγματικότητα.