Давайте посмотрим на живую демонстрацию того, что может сделать gpt4 omni благодаря своим мультимодальным возможностям и продвинутому пониманию языка.
Представляем GPT-4o, нашу новую модель, способную понимать текст, аудио и видео в реальном времени. Оначрезвычайно универсальна, с ней интересно играть, и это шаг к гораздо более естественной форме взаимодействия человека и компьютера (и даже человека и компьютера).
Поприветствуйте GPT-4o, нашу новую флагманскую модель, способную воспринимать звук, изображение и текст в режиме реального времени: http://openai.com/index/hello-gpt-4o/. Ввод текста и изображений уже сегодня доступен в API и ChatGPT, а голос и видео - в ближайшие недели.
Ученик делится экраном своего iPad с новым ChatGPT + GPT-4o, а ИИ разговаривает с ним и помогает ему учиться в режиме реального времени. Представьте себе, что это доступно каждому студенту в мире. Будущее очень, очень светлое.