Πισω από την επιτυχια του DeepSeek κρύβεται η Huawei

Η κινεζική εταιρεία τεχνητής νοημοσύνης DeepSeek έχει αναδειχθεί ως σημαντικός παίκτης στον τομέα, παρουσιάζοντας ένα μοντέλο που ανταγωνίζεται επάξια τα αμερικανικά αντίστοιχα, με σημαντικά χαμηλότερο κόστος.
Ένας από τους βασικούς παράγοντες της επιτυχίας αυτής είναι η χρήση των επεξεργαστών Ascend 910C της Huawei.
Το μοντέλο DeepSeek R1 εκπαιδεύτηκε χρησιμοποιώντας τις GPU H100 της Nvidia, αλλά για τη διαδικασία της “inference”—δηλαδή την παραγωγή απαντήσεων από το εκπαιδευμένο μοντέλο—βασίζεται στους επεξεργαστές Ascend 910C της Huawei.
Αυτή η στρατηγική μειώνει το κόστος και περιορίζει την εξάρτηση από την αμερικανική τεχνολογία. Η επιλογή των επεξεργαστών της Huawei για τη φάση της inference επιτρέπει στη DeepSeek να διατηρεί υψηλή απόδοση, ενώ παράλληλα εξοικονομεί πόρους.
Αν και οι επεξεργαστές Ascend 910C δεν διαθέτουν την απαιτούμενη ισχύ για την εκπαίδευση μεγάλων μοντέλων, είναι ιδανικοί για την εφαρμογή των ήδη εκπαιδευμένων μοντέλων.
Η επιτυχία της DeepSeek υπογραμμίζει την αυξανόμενη ικανότητα της Κίνας στον τομέα της τεχνητής νοημοσύνης. Η στρατηγική της εταιρείας, σε συνδυασμό με τις τεχνολογικές εξελίξεις της Huawei, ενδέχεται να αναδιαμορφώσει τον κλάδο, προωθώντας την καινοτομία και την αποδοτικότητα.