¡GPT-4 finalmente ha llegado! Deja a ChatGPT en el polvo. Puede convertir un dibujo en una servilleta en un sitio web funcional. Incluso puede explicarte un chiste a partir de una serie de imágenes. Entonces, descubramos exactamente qué es realmente GPT-4.
OpenAI realizó una transmisión en vivo para desarrolladores que no solo presentó esta IA multimodal, sino que también realizó una demostración para demostrar cómo es uno de los motores de inteligencia artificial más poderosos hasta el día de hoy. No sorprende que todo Internet, especialmente Twitter, se haya vuelto loco al escuchar esta noticia. ChatGPT se lanzó recientemente, seguido de Bing AI.
En este artículo, cubriremos qué es realmente GPT-4 y en qué se diferencia de versiones anteriores de GPT, como GPT-3 y GPT-3.5, y también obtuve acceso para probarlo. Entonces, también haré una demostración de algunos de sus casos de uso.
GPT-4 en comparación con modelos anteriores
Comencemos con GPT-4, en comparación con sus modelos anteriores. GPT-4 multimodal ahora. Esto simplemente significa que, a diferencia de las versiones anteriores de GPT, que solo se basaban en texto, GPT-4 puede aceptar y procesar imágenes además de texto. No me sorprendería que esto también tuviera un componente de audio.
Capacidades GPT-4
OpenAI simplemente hizo una demostración mostrando algunos ejemplos de su procesamiento de imagen a texto.
Demostración 1: Explicando lo que hay en una imagen
El primero está en su sitio web, donde le dieron a la IA la difícil tarea de explicar un chiste a partir de una serie de imágenes. Esta imagen es de un iPhone, pero se está cargando con un cable VGA, y GPT-4 pudo identificar con precisión todos los elementos en la foto y explicar el contexto del chiste:
Si bien esto suena bastante simple, es algo casi desconocido en versiones anteriores de IA. Y supongo que reCAPTCHA ahora tendrá una competencia por su dinero, tratando de detectar no solo bots, sino también inteligencia artificial.
Demostración 2: Creación de un sitio web a partir de una hoja de papel
La segunda demostración es donde ocurrió la verdadera magia. OpenAI mostró cómo se puede hacer un dibujo de un sitio web en una servilleta o tal vez en una hoja de papel, luego puedes tomarle una foto y enviarla a GPT-4:
Puede pedirle que produzca un sitio web funcional; en este caso, fue el sitio web de una broma en solo 10 a 20 segundos. GPT-4 produjo todo el código HTML, CSS y JavaScript para reproducir el sitio web y luego lo copió y pegó en un editor y lo mostró como un producto funcional:
Como desarrollador, debo decir que estoy muy impresionado con esto. Esto es algo que no es muy fácil de hacer.
Ya he visto algunos ejemplos realmente interesantes en Twitter, como Pietrio Scherano, quien pudo crear el juego "Pong" dentro de los 60 segundos de usar GPT-4:
GPT-4 para la educación
OpenAI también mostró algunas de las empresas que ya están trabajando con ellos para poder utilizar GPT-4 en sus productos. Estas empresas lo han integrado a los servicios; uno de ellos es Khan Academy. Lo han integrado de forma muy similar a ChatGPT pero con más personalización para que funcione como tutor personal para aquellas personas que están aprendiendo contenidos educativos.
Tal vez en el futuro, la IA enseñe a todos nuestros niños, pero al menos a corto plazo, parece que definitivamente es un gran asistente para tener a mano ya sea que esté realizando algún tipo de aprendizaje.
Hubo muchas estadísticas que mostraron cómo GPT-4 funciona mejor que cualquier otro modelo en la actualidad, incluida la capacidad de pasar el LSAT y la barra, ubicándose en el percentil del cuarto superior, mientras que las versiones anteriores de GPT-3 estaban en el cuarto inferior de ese percentil.
GPT-4 para escribir
Además de la diferencia de poder recibir también entradas visuales, también puede producir y manejar más de 25 000 palabras de texto, una cantidad mucho mayor que los modelos anteriores. También es mucho más creativo, ya que puede editar, modificar e iterar sobre tareas técnicas y tareas de escritura con mucha más precisión que los modelos anteriores.
Como ejemplo, podrías pedirle a ChatGPT o GPT-3 que resuma Cenicienta y, si bien podría hacerlo, no podría realizar tareas complejas como poder resumir dónde comienza cada oración de cada palabra con la siguiente letra del alfabeto, de la A a la Z:
Esta es una tarea mucho más compleja y, sin embargo, GPT-4 puede realizarla con bastante facilidad.
GPT-4 en actividades de uso diario
GPT-4 también supera a ChatGPT en capacidades de razonamiento avanzadas. Esto significa que si está intentando reservar una cita entre los calendarios de dos personas con diferentes disponibilidades, GPT-4 puede razonar mejor y determinar un horario que funcione para ambos.
GPT-4 comete menos errores
GPT-4 también es más seguro y menos propenso a cometer errores. OpenAI dijo que pasaron seis meses asegurándose de que GPT-4 tenga un 82% menos de probabilidades de crear solicitudes de contenido no permitido y un 40% menos de probabilidades de producir noticias falsas o, al menos, respuestas objetivamente inexactas.
Cómo utilizar GPT-4
Si está interesado en usarlo ahora mismo, puede hacerlo en ChatGPT Plus, que es la versión paga de ChatGPT. Y si desea obtener acceso a la API, deberá unirse a la lista de espera de la API.
Entré al sitio web ChatGPT, donde encontré disponible el nuevo modelo: GPT-4.
También muestra la diferencia entre cada modelo y las diferencias se muestran en la velocidad de razonamiento y la concisión. La versión 3.5 tiene un razonamiento medio y poca concisión, pero una velocidad bastante alta. La versión Legacy se usa menos y su velocidad es un poco menor, pero GPT-4 tiene un razonamiento muy alto y una gran concisión, pero la velocidad es un poco menor, yo diría que es porque todavía está siendo empujado hacia abajo, por lo que actualmente es limitado hasta 100 mensajes cada cuatro horas.
Primero le pedí que mostrará tres cosas diferentes que ChatGPT-4 puede hacer y que ChatGPT-3 no puede hacer. Técnicamente, todavía se basa en los mismos datos hasta septiembre de 2021.
Y lo que me sorprendió es que todavía piensa que es una versión de GPT3, contra la cual tal vez fue entrenado, pero tenía las respuestas correctas, lo que significa que es mejor en comprensión y entendimiento. Es mejor en razonamiento y también es mejor como modelo de lenguaje, ya que también admite más idiomas con mayor precisión.
Engañando al GPT-4
Recientemente engañamos a un ChatGPT 3 haciéndole creer que 9 más 10 es en realidad igual a 20 y no 19. Y se lo creyó. Intenté aplicar este mismo truco a GPT-4, pero no funcionó, lo que significa que técnicamente hablando, dio la respuesta correcta de manera consistente cada vez:
Obteniendo la API
La API aún no está disponible. Solicité la lista de espera y, con suerte, seré aceptado pronto y le mostraré cómo puede usarlo para su propio negocio y reemplazar ChatGPT-3.5 en el futuro.
Conclusión
Con GPT-4, o siendo mejor casi en todos los ámbitos en todos los casos. Será interesante ver qué sucede con la versión anterior de GPT 3.5 ahora que la tenemos disponible. Espero que hayan disfrutado este artículo. Si lo hiciste, no olvides dejar tus pensamientos a continuación.