OpenAI presentó GPT-4o

Tal como lo habíamos informado, OpenAI, la empresa detrás de ChatGPT presentó hace apenas unas horas, GPT-4o su nuevo modelo, bajo la insignia de que «puede razonar a través de audio, visión y texto en tiempo real…», algo que seguramente será probado y testeado por usuarios, desarrolladores y, por supuesto, la competencia…

Según la empresa, este versión de su inteligencia artificial es un paso adelante y natural hacia la interacción ser humano-computadora, ya que la misma acepta diversidad de entradas y combinación, es decir texto, audio, imágenes y con ello, el resultado refleja también esa diversidad, es decir puede responderte textualmente, con audio, video o imágenes, según considere.

En lo referente al audio, puede contestar en apenas 232 milisegundos, lo que lo deja casi como una conversación entre humanos, si consideramos que nosotros somos capaces de decir 4 palabras por segundo y responder instantáneamente a ellas… salvo que la conversación sea entre un adulto mayor y su hijo adolescente… la respuesta puede llevar toda una vida…

En las generaciones anteriores de ChatGPT, Voice Mode canalizaba tres modelos separados, uno que transcribía el audio a texto, otro que tomaba ese texto y generaba un nuevo texto; y el tercer modelo, era el encargado de convertir ese nuevo texto en audio, proceso que rondaba entre los 2.8 y 5.4 segundos… Una vida y media se te podía ir en una conversación con IA…

Ahora un solo modelo es el encargado de procesar el hilo de extremo a extremo, ya sea texto, audio o video y de generar las salidas respectivas.

#	Name	Price	Market Cap	Change	Price Graph (24h)

OpenAI presentó GPT-4o

LIBERTONIA: La clara visión de Santaolalla

Abrió “Huellas de Dinosaurios”

Inaugurado el monumento al Soldado de Malvinas más grande del país

“Vamos a una situación de lectores pobres y libros carísimos”

Comparte esto: