ChatGPT-4o vs 4

Capacidades multimodales

  • ChatGPT-4: Se centra en las interacciones basadas en texto, destacando en la comprensión y generación de texto a través de varios contextos e idiomas.
  • ChatGPT-4o: Amplía las capacidades para incluir audio e imágenes, lo que le permite comprender y responder a entradas de audio, generar salidas de imagen y combinarlas con texto para una experiencia de interacción más rica.
  • Tiempos de respuesta

  • ChatGPT-4: Proporciona una rápida generación de texto pero no maneja entradas de audio o imagen.
  • ChatGPT-4o: Responde a entradas de texto, imagen y audio en tan solo 232 milisegundos, con un tiempo medio de respuesta de 320 milisegundos, lo que hace que las interacciones sean más fluidas y realistas.
  • Rendimiento y rentabilidad

  • ChatGPT-4: Alto rendimiento en la generación y comprensión de textos, pero puede consumir muchos recursos.
  • ChatGPT-4o: Iguala el rendimiento de GPT-4 Turbo en texto a la vez que es más rápido y un 50% más barato en la API. Sobresale en idiomas distintos del inglés y ofrece una visión y comprensión de audio superiores.