Aquí tienes la traducción y reescritura del contenido:
—
Ha pasado algo más de tres años desde el lanzamiento del primer chatbot de gran lenguaje (LLM) disponible comercialmente, ChatGPT de OpenAI. Aunque el modelo de IA ha mejorado su rendimiento desde su inicio, el bajo rendimiento de las versiones recientes ha contribuido a la percepción de que los LLM están alcanzando un plato.
Un ejemplo claro es que el CEO de OpenAI, Sam Altman, admitió recientemente que la compañía había “estropeado” las capacidades lingüísticas de la última iteración de su chatbot, GPT-5.2.
“Creo que simplemente lo estropeamos,” dijo Altman en un foro para desarrolladores el lunes. “Esperamos que las futuras versiones de GPT 5.x sean mucho mejores en escritura que la 4.5.”
Altman continuó mencionando que la compañía eligió enfocarse en las capacidades técnicas de ChatGPT, quizás a expensas de su rendimiento en lenguaje humano.
“Decidimos, y creo que con buena razón, concentrar la mayor parte de nuestro esfuerzo en 5.2 para hacerlo extremadamente competente en inteligencia, razonamiento, codificación, ingeniería, ese tipo de cosas,” dijo Altman. “Y tenemos un ancho de banda limitado aquí; a veces nos enfocamos en una cosa y descuidamos otra.”
Esta admisión plantea una pregunta crítica: si los modelos de inteligencia artificial de vanguardia podrán seguir sobresaliendo en diversas tareas o si la competencia en un dominio comenzará a perjudicar un conjunto de habilidades más amplio.
Como señala Search Engine Journal, el lanzamiento de GPT-5.2 puso un gran énfasis en tareas técnicas como la codificación y formateo de hojas de cálculo. En comparación con versiones anteriores, escasea la mención de cualquier trabajo creativo o de escritura, un cambio que ha dejado a muchos usuarios no técnicos sintiendo que ChatGPT ha alcanzado un límite.
Como señala el científico de datos y blogger tecnológico Mehul Gupta en una reseña de GPT-5.2, hay muchas señales de que el LLM está retrocediendo, y algunas de ellas no son sutiles.
Estas incluyen un “tono más plano”, una peor capacidad de traducción, comportamiento inconsistente en diversas tareas y una regresión significativa en el “modo instantáneo”, una configuración destinada a proporcionar respuestas inmediatas a preguntas simples.
Como escribe Gupta, también enfrenta dificultades con tareas del mundo real. Al evaluar documentos humanos como contratos, notas de formato mixto o PDFs, GPT-5.2 “olvidó detalles anteriores, se contradijo, malinterpretó referencias cruzadas y [creó] aclaraciones que no existían.”
“Los puntos de referencia son claros,” observó Gupta. “Los documentos reales no lo son. 5.2 todavía lucha con el ruido de la realidad.”
Más sobre ChatGPT: Científico horrorizado mientras ChatGPT elimina toda su investigación
—
Si necesitas más cambios, no dudes en decírmelo.
Con información de https://futurism.com/artificial-intelligence/altman-openai-chatgpt-worse