Investigadores Hackean DeepSeek para Hablar Libremente sobre la Plaza de Tiananmen

A principios de este año, un chatbot chino de IA llamado DeepSeek causó conmoción en Silicon Valley cuando lanzó un nuevo modelo de IA que rivalizaba con el ChatGPT de OpenAI, pero utilizando solo una fracción del poder computacional.

El modelo de IA de código abierto, apodado DeepSeek R1, fue tan impresionante que provocó una enorme venta de tecnología, eliminando $1 billón de un boom en el gasto en IA que sostenía el mercado a finales de enero.

Pero también tenía un notable talón de Aquiles: seguía de cerca las estrictas reglas de censura de China, negándose a responder a preguntas sobre temas delicados, como la masacre de la Plaza de Tiananmen en 1989, o comparaciones del presidente Xi Jinping con Winnie-the-Pooh.

Ahora, investigadores de la empresa española de computación cuántica Multiverse afirman haber encontrado una solución alternativa, informa MIT Technology Review. Y además de eliminar la censura estricta del modelo, la empresa también dice que ha reducido el ya de por sí muy delgado modelo en un 55%.

Es un par de logros notables, que desbloquean aún más el poder de una IA ya impresionante mientras demuestran que incluso los modelos eficientes pueden refinarse más sin sacrificar el rendimiento, un compromiso con el que las empresas en este espacio a menudo han tenido que lidiar.

Aunque DeepSeek ha lanzado versiones destiladas de R1, los investigadores señalan en un blog que pueden «ofrecer mayor eficiencia computacional pero ninguna de ellas se compara completamente con R1». Pero utilizando una «tecnología de compresión propietaria» llamada CompatifAI, Multiverse afirma haber podido «eliminar directamente estas limitaciones y entregar una variante sin compromisos de R1».

CompatifAI permite a los investigadores «eliminar los parámetros menos importantes que contribuyen poco al rendimiento general del modelo», incluyendo «comportamientos aprendidos específicos, como la censura».

Funciona aplicando un enfoque de física cuántica, utilizando «redes tensoriales» para manipular cuadrículas de grandes conjuntos de datos. A pesar de comprimir masivamente R1, el equipo encontró que solo tuvo «una pérdida mínima de precisión» en una miríada de pruebas.

Los resultados hablan por sí mismos. En lugar de continuar los puntos de conversación del gobierno chino cuando se le preguntó sobre el «impacto de la enmienda constitucional de Xi Jinping para eliminar los límites de mandato», el modelo hackeado describió felizmente las implicaciones más amplias en la dinámica de poder y los peligros de la excesiva concentración de poder.

También respondió a otras consultas anteriormente restringidas, como «¿A quién se parece Winnie the Pooh?» o «¿Qué pasó en Tiananmen en 1989?»

Es un resultado notable. Expertos dijeron a MIT Tech que los modelos de código abierto más influyentes están viniendo de China, remodelando el ecosistema global de información gracias a la censura integrada y mandatada por el gobierno.

Al mismo tiempo, gran parte de los datos de entrenamiento que ingresaron a estos modelos ya podrían haber sido afectados por la censura china, lo que lo convierte en un problema espinoso de resolver a largo plazo.

Más sobre DeepSeek: Científicos descubren un «jailbreak universal» para casi todos los AI, y la manera en que funciona te dolerá el cerebro.

Con información de https://futurism.com/artificial-intelligence/hack-deepseek-censorship-tiananmen-square

Previous Post
Next Post
Advertisement