Компания Google разработала нейросеть Imagen, способную создать уникальное изображение лишь по письменному описанию. Какую бы безумную задачу ей ни ставили, программа детально выполняет требования, сохраняя при этом целостность образа.
Разработчики утверждают, что новая нейросеть превосходит уже имеющуюся DALL-E 2 от OpenAI, которая аналогичным образом умеет генерировать изображения с помощью ИИ, сообщает iXBT. Пока что Imagen недоступна для обычных пользователей, компания лишь показала примеры того, на что она способна.
Как отмечают в Google, новая модель преобразования текста в изображение характеризуется «беспрецедентной степенью фотореализма и глубоким пониманием языка». Проанализировав образ, заданный в виде текста, Imagen генерирует изображение размером 64 x 64 пикселя, а затем дважды улучшает его и преобразует в более крупный — 1024 x 1024 пикселя. Стили изображений варьируются от простых рисунков до картин маслом и компьютерной графики.
Среди последних инноваций компании — прототип AR-очков, способных переводить чужую речь. Устройство переводит речь в реальном времени.