0 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p><strong>Что за нейросеть?</strong>Её <a>разработала</a>команда исследовательского проекта Google Brain, которая занимается изучением искусственного интеллекта на основе глубокого обучения. Нейросеть Imagen умеет распознавать текст и генерировать изображения маленького размера, а потом с помощью метода диффузии доводить их до большего размера.</p>
1
<p><strong>Что за нейросеть?</strong>Её <a>разработала</a>команда исследовательского проекта Google Brain, которая занимается изучением искусственного интеллекта на основе глубокого обучения. Нейросеть Imagen умеет распознавать текст и генерировать изображения маленького размера, а потом с помощью метода диффузии доводить их до большего размера.</p>
2
<p>Нейросеть улучшает изображения до тех пор, пока не решит, что не может сделать его ещё более приближённым к заданному описанию. Однако это не похоже на обычное масштабирование, потому что Imagen дополняет картинку новыми деталями.</p>
2
<p>Нейросеть улучшает изображения до тех пор, пока не решит, что не может сделать его ещё более приближённым к заданному описанию. Однако это не похоже на обычное масштабирование, потому что Imagen дополняет картинку новыми деталями.</p>
3
Котики, собачки и еноты от Imagen. Источник:<a>Google Research</a><p><strong>Как нейросеть работает?</strong>Команда разработчиков Imagen описывает процесс создания картинок так:</p>
3
Котики, собачки и еноты от Imagen. Источник:<a>Google Research</a><p><strong>Как нейросеть работает?</strong>Команда разработчиков Imagen описывает процесс создания картинок так:</p>
4
<ul><li>сначала нейросеть получает описание - например, "собака на велосипеде";</li>
4
<ul><li>сначала нейросеть получает описание - например, "собака на велосипеде";</li>
5
<li>затем она создаёт первую версию изображения, где ширина глаза пса будет 3 пикселя;</li>
5
<li>затем она создаёт первую версию изображения, где ширина глаза пса будет 3 пикселя;</li>
6
<li>после этого запускается диффузия, в процессе которой нейросеть расширяет ширину глаза на первом шагу до 12 пикселей, а на втором - до 48.</li>
6
<li>после этого запускается диффузия, в процессе которой нейросеть расширяет ширину глаза на первом шагу до 12 пикселей, а на втором - до 48.</li>
7
</ul><p>Imagen работает как художник, который начинает со схематичного наброска, постепенно дополняющегося деталями.</p>
7
</ul><p>Imagen работает как художник, который начинает со схематичного наброска, постепенно дополняющегося деталями.</p>
8
<p><strong>Чем Imagen лучше других нейросетей?</strong>Разработчики сравнили Imagen с аналогичной нейросетью DALL-E 2 от OpenAI. По итогам тестирования они выяснили, что Imagen выдаёт более точные и достоверные работы. Но были запросы, по которым обе нейросети не смогли создать соответствующие изображения. Например, обрабатывая запрос "лошадь верхом на астронавте", нейросети постоянно ставили астронавта на лошадь, а не наоборот.</p>
8
<p><strong>Чем Imagen лучше других нейросетей?</strong>Разработчики сравнили Imagen с аналогичной нейросетью DALL-E 2 от OpenAI. По итогам тестирования они выяснили, что Imagen выдаёт более точные и достоверные работы. Но были запросы, по которым обе нейросети не смогли создать соответствующие изображения. Например, обрабатывая запрос "лошадь верхом на астронавте", нейросети постоянно ставили астронавта на лошадь, а не наоборот.</p>
9
Сравнение Imagen с другими нейросетями по показателям "Выравнивание" и "Достоверность". Источник:<a>Google Research</a><p><strong>Как протестировать нейросеть?</strong>Пока никак, потому что Imagen работает в режиме закрытой бета-версии. Команда Google боится, что пользователи будут использовать нейросеть для генерации неприемлемых изображений и усугублять принятые обществом предрассудки и стереотипы.</p>
9
Сравнение Imagen с другими нейросетями по показателям "Выравнивание" и "Достоверность". Источник:<a>Google Research</a><p><strong>Как протестировать нейросеть?</strong>Пока никак, потому что Imagen работает в режиме закрытой бета-версии. Команда Google боится, что пользователи будут использовать нейросеть для генерации неприемлемых изображений и усугублять принятые обществом предрассудки и стереотипы.</p>
10
<p>Подробнее прочитать об Imagen и посмотреть сгенерированные картинки можно на <a>сайте Google Research</a>.</p>
10
<p>Подробнее прочитать об Imagen и посмотреть сгенерированные картинки можно на <a>сайте Google Research</a>.</p>
11
11