Tras el impacto de DeepSeek en el ámbito de la Inteligencia Artificial, que ha provocado pérdidas significativas en empresas como NVIDIA, se ha revelado que el modelo opera en chips de Huawei, destacando una vez más las capacidades del modelo chino.
Confirmación del uso de chips de Huawei en DeepSeek
Se ha confirmado que el modelo DeepSeek R1 LLM fue entrenado en las GPUs Nvidia H100, pero para la inferencia, que es el proceso de aplicar el modelo entrenado para generar respuestas, utiliza el chip Ascend 910C de Huawei. En esta fase, el modelo recibe nuevos datos y se le solicita que tome decisiones basadas en patrones aprendidos, sin contar con ejemplos específicos del resultado esperado.
En resumen, el modelo utiliza los patrones previamente aprendidos para producir contenido o hacer elecciones basadas en las instrucciones dadas.
Esta información proviene de @Dorialexander, quien menciona que los chips Ascend son utilizados únicamente para la inferencia, lo que reduce los requerimientos de potencia de la GPU. No obstante, el rendimiento relativamente bajo del Ascend 910C limita su capacidad para el entrenamiento de modelos.
Huawei tiene planes de abordar esta limitación con su próximo chip 920C, que buscará competir con el Blackwell B200, el chipset líder de Nvidia en el ámbito de la IA.
Con Información de pisapapeles.net