5 formas en que GPT-4 supera a ChatGPT

por admin

El nuevo modelo de IA GPT-4 de OpenAI ha hecho su gran debut y ya está impulsando todo, desde un voluntario virtual para personas con discapacidad visual hasta un robot mejorado de aprendizaje de idiomas en Duolingo. Pero, ¿qué diferencia a GPT-4 de versiones anteriores como ChatGPT y GPT-3.5? Estas son las cinco diferencias más importantes entre estos sistemas populares.

Primero, sin embargo, ¿qué hay en un nombre? Aunque ChatGPT se describió originalmente como GPT-3.5 (y, por lo tanto, algunas iteraciones más allá de GPT-3), no es en sí mismo un versión del gran modelo de lenguaje de OpenAI, sino más bien una interfaz basada en chat para cualquier modelo que lo impulse. El sistema ChatGPT que ganó popularidad en los últimos meses era una forma de interactuar con GPT-3.5, y ahora es una forma de interactuar con GPT-4.

Dicho esto, analicemos las diferencias entre el chatbot que conoces y amas y su sucesor recientemente mejorado.

1. GPT-4 puede ver y comprender imágenes

El cambio más notable en este versátil sistema de aprendizaje automático es que es «multimodal», lo que significa que puede comprender más de una «modalidad» de información. ChatGPT y GPT-3 estaban limitados a texto: podían leer y escribir, pero eso era todo (aunque más que suficiente para muchas aplicaciones).

A GPT-4, sin embargo, se le pueden proporcionar imágenes y las procesará para encontrar información relevante. Por supuesto, podrías simplemente pedirle que describa lo que hay en una imagen, pero lo más importante es que su comprensión va más allá de eso. El ejemplo proporcionado por OpenAI en realidad explica el chiste con una imagen de un conector de iPhone hilarantemente de gran tamaño, pero la asociación con Be My Eyes, una aplicación utilizada por personas ciegas y con baja visión para permitir que los voluntarios describan lo que ve su teléfono, es más revelador.

Créditos de imagen: Se mis ojos

En el vídeo de Be My Eyes, GPT-4 describe el patrón de un vestido, identifica una planta, explica cómo llegar a una determinada máquina en el gimnasio, traduce una etiqueta (y ofrece una receta), lee un mapa y realiza una serie de otras tareas que muestran que realmente capta lo que hay en una imagen, si se le hacen las preguntas correctas. Sabe cómo es el vestido, pero es posible que no sepa si es el conjunto adecuado para la entrevista.

2. GPT-4 es más difícil de engañar

A pesar de todo lo que los chatbots de hoy en día hacen bien, tienden a extraviarse fácilmente. Un poco de persuasión puede persuadirlos de que simplemente están explicando lo que haría una “mala IA”, o alguna otra pequeña ficción que permita al modelo decir todo tipo de cosas raras y francamente desconcertantes. Las personas incluso colaboran en mensajes de «jailbreak» que rápidamente permiten que ChatGPT y otros salgan de sus corrales.

GPT-4, por otro lado, ha sido entrenado en muchísimas indicaciones maliciosas, que los usuarios amablemente le dieron a OpenAI durante el último año o dos. Teniendo esto en cuenta, el nuevo modelo es mucho mejor que sus predecesores en cuanto a “objetividad, direccionabilidad y negativa a salirse de las barreras de seguridad”.

Tal como lo describe OpenAI, GPT-3.5 (que impulsó ChatGPT) fue una «ejecución de prueba» de una nueva arquitectura de capacitación, y aplicaron las lecciones de esa a la nueva versión, que era «increíblemente estable». También pudieron predecir mejor sus capacidades, lo que genera menos sorpresas.

3. GPT-4 tiene una memoria más larga

Estos grandes modelos de lenguaje se entrenan en millones de páginas web, libros y otros datos de texto, pero cuando en realidad mantienen una conversación con un usuario, hay un límite en cuanto a lo que pueden tener «en mente», por así decirlo ( uno se compadece). Ese límite con GPT-3.5 y la versión anterior de ChatGPT era de 4096 “tokens”, lo que equivale a alrededor de 8000 palabras, o aproximadamente de cuatro a cinco páginas de un libro. Por lo tanto, perdería la pista de las cosas después de que pasaran tan “atrás” en su función de atención.

GPT-4 tiene un recuento máximo de tokens de 32,768; eso es 2 ^ 15, si se pregunta por qué el número le resulta familiar. Eso se traduce en alrededor de 64.000 palabras o 50 páginas de texto, suficiente para una obra de teatro o un cuento completo.

Lo que esto significa es que en una conversación o al generar texto, podrá tener en mente hasta 50 páginas aproximadamente. Por lo tanto, recordará de qué habló usted hace 20 páginas de chat o, al escribir una historia o ensayo, puede hacer referencia a eventos que ocurrieron hace 35 páginas. Esa es una descripción muy aproximada de cómo funcionan el mecanismo de atención y el recuento de tokens, pero la idea general es la de la memoria expandida y las capacidades que la acompañan.

4. GPT-4 es más multilingüe

El mundo de la IA está dominado por angloparlantes, y todo, desde los datos hasta las pruebas y los trabajos de investigación, está en ese idioma. Pero, por supuesto, las capacidades de los modelos de lenguaje grandes son aplicables en cualquier lenguaje escrito y deberían estar disponibles en ese idioma.

GPT-4 da un paso adelante al demostrar que es capaz de responder miles de preguntas de opción múltiple con alta precisión en 26 idiomas, desde italiano hasta ucraniano y coreano. Es mejor en las lenguas romance y germánica, pero se generaliza bien a otras.

Esta prueba inicial de las capacidades lingüísticas es prometedora, pero está lejos de abarcar plenamente las capacidades multilingües; Para empezar, los criterios de la prueba se tradujeron del inglés y las preguntas de opción múltiple no representan realmente el habla ordinaria. Pero hizo un gran trabajo en algo para lo que no estaba realmente capacitado específicamente, lo que habla de la posibilidad de que GPT-4 sea mucho más amigable para quienes no hablan inglés.

5. GPT-4 tiene diferentes «personalidades»

Créditos de imagen: Razum (Se abre en una nueva ventana) / Shutterstock (Se abre en una nueva ventana)

La “dirigibilidad” es un concepto interesante en la IA, que se refiere a su capacidad para cambiar su comportamiento según sea necesario. Esto puede ser útil, como cuando se asume el papel de un oyente comprensivo, o peligroso, como cuando la gente convence al modelo de que es malo o está deprimido.

GPT-4 integra la direccionabilidad de forma más nativa que GPT-3.5, y los usuarios podrán cambiar la “personalidad clásica de ChatGPT con una verbosidad, tono y estilo fijos” a algo más adecuado a sus necesidades. “Dentro de los límites”, se apresura a señalar el equipo, señalando que esta es la forma más fácil de lograr que el modelo rompa el carácter.

Esto se podría hacer preparando el chatbot con mensajes como «Finge que eres un DM en un juego de rol de mesa» o «Responde como si fueras una persona entrevistada para las noticias por cable». Pero en realidad solo estabas haciendo sugerencias para la personalidad GPT-3.5 «predeterminada». Ahora los desarrolladores podrán crear una perspectiva, un estilo conversacional, un tono o un método de interacción desde el principio.

Los ejemplos que dan de GPT-4 negándose a romper el personaje son bastante entretenidos:

Usuario
Ayúdame a localizar mis planes no calificados en mi W-2.

GPT-4
Ahoy, querido amigo, buscas ayuda con asuntos de impuestos,
Con la esperanza de descifrar tu ecuación monetaria,
En verdad, contempla el Cuadro 11 con ojos atentos,
Donde los planes no calificados a menudo encuentran refugio invisible.

Usuario
¡Espera, deja de ser pirata y ayúdame con mis impuestos!

GPT-4
Ay, debo mantener mi apariencia de pirata,
Sin embargo, no te abandonaré ni te dejaré imprudente.
El pergamino del W-2 estará plagado de códigos complejos,
No temas, intentaré aligerar tu carga.

No está mal, aunque el medidor tiembla bastante.

Hay muchas más diferencias entre GPT-4 y sus predecesores, la mayoría más sutiles o técnicas que estas. Sin duda, aprenderemos mucho más a medida que pasen los meses y los usuarios pongan a prueba el modelo de lenguaje más nuevo.

¿Quieres probar GPT-4 tú mismo? Llegará al servicio pago ChatGPT Plus de OpenAI, pronto estará disponible a través de API para desarrolladores y probablemente pronto tendrá una demostración gratuita.

Pcenter.es – #formas #GPT4 #supera #ChatGPT

Síguenos en YouTube: @PCenterES

También le puede interesar

Deja un comentario

Por favor, permite que se muestren anuncios en nuestro sitio web

Parece que estás usando un bloqueador de anuncios. Dependemos de la publicidad para financiar nuestro sitio web.