Индикатор загрузки
Загрузка...

Написать промт и получить шедевр: как общаться с визуальными нейросетями

Время на прочтение: 6 мин.

Вы восхищаетесь творениями ИИ, созданными по ТЗ профессионалов, а в ответ на ваши задания нейросеть выдает нечто несуразное? На самом деле написать промт для той же DALL-E или Midjourney не так сложно, как может показаться на первый взгляд. Темой нашего сегодняшнего разговора станет разработка ТЗ для нейросетей, которые генерируют картинки. Итак, как создать промт, по которому ИИ сотворит настоящий шедевр? Будем разбираться!

Процесс генерации картинок нейросетями

Прежде чем перейти непосредственно к поиску ответа на поставленный выше вопрос, следует разобраться в механизме работы нейросетей, ориентированных на визуализацию.

Прежде всего, следует помнить о том, что подобные решения – это роботы, а значит, для качественной и правильной обработки запросов им необходима конкретика. Указание «Нарисуй красивое лицо» будет воспринято ими некорректно, поэтому следует добавить в промт больше деталей, конкретных черт, таких как «Зеленые глаза», «Полные губы» и пр. 

Для получения качественного результата нужно дать ИИ детальные и предельно четкие инструкции, описать текстуру, цвет, форму, художественный стиль и узоры. Это позволит нейросети создать предельно точное и качественное изображение.

Как создать промт для визуального ИИ

Что ж, пришло время перейти к рассмотрению главного нашего вопроса. Ниже приведем парочку советов, следование которым поможет написать такой промт, который поймет нейросеть, заточенная на визуализацию.

Тип картинки

Создавая промт, следует предельно точно охарактеризовать тип изображения, которое необходимо сгенерировать. Обязательно указать, что это – эскиз, рисунок или 3D-рендеринг, и как он должен выглядеть в конечном счете – как фото или как рукотворная иллюстрация.

Оптимально начинать слова такими словами:

  • Фотография…
  • Эскиз…
  • Иллюстрация…
  • 3D визуализация…

И т.д.

Тема

Необходимо описать предмет, который надо создать. Не важно, о чем идет речь – о человеке или о животном, об неживом объекте или об эмоции – описывая его, следует быть предельно точным, иначе нейросеть не поймет, что она должна найти в своей базе. 

Пример:

  • Фотография Премьер-министра.
  • Рисунок совы.
  • 3D-рендеринг кровати.

Ниже — результат работы ИИ Midjourney AI по запросу «Иллюстрация совы».

Максимум деталей

Следует включить в описание дополнительные сведения об элементах картинки – цвет, форму, текстуру и размер. Если, к примеру, нужно нарисовать медведя, нельзя писать просто – «Медведь», надо указать, какой он – черный или бурый, гризли, полярный и пр., а также описать, где животное находится – в лесу или на берегу водоема и пр.

Пример:

  • Иллюстрация совы красного цвета с голубыми глазами.
  • Фото президента в черном костюме.
  • 3D-рендеринг прямоугольного зеленого стула.

На фото ниже – результат работы Midjourney по запросу «Иллюстрация красной совы с ярко-голубыми глазами».

Четкое описание формы и стиля

Крайне важно указать в промте детальные сведения относительно формы картинки и ее стиля. Особенно актуально это в случаях, когда арбитражнику необходимо получить конкретный визуальный эффект. Поэтому в ТЗ приветствуются такие слова, как «минимальный», «абстрактный», «сюрреалистичный» и пр. – они помогают передать требуемый художественный стиль и повышают шансы того, что результат оправдает ожидания.

Пример:

  • Фото президента в костюме черного цвета в минималистичном стиле.
  • 3D-рендеринг зеленого прямоугольного стула в кубическом стиле.

Приветствуется использование фамилии конкретного художника, например, «Как Сальвадор Дали» и пр. 

Ниже – результат работы Midjourney по запросу «Иллюстрация красной совы с ярко-голубыми глазами в стиле абстрактного экспрессионизма»:

Определение композиции

Чтобы композиция готового рисунка была такой, как и предполагалось, в промте стоит использовать соответствующие ключи, отображающие стиль, разрешение, соотношение сторон и пр.

Пример:

  • Иллюстрация совы красного цвета с голубыми глазами, выполненной в стилистике абстрактного экспрессионизма. Освещение объемное.
  • Фото президента в черном костюме, выполненное в минималистичном стиле, сделанное с высоты.
  • 3D-рендеринг зеленого квадратного стула в кубическом стиле с соотношением сторон 4096 x 2160.

На скрине ниже – результат выдачи Midjourney по запросу «Иллюстрация красной совы с ярко-голубыми глазами в стиле абстрактного экспрессионизма с объемным освещением».

Примеры, приведенные выше, наглядно показывают изменение результатов выдачи по мере усложнения задания. 

Как правильно писать промты: полезные советы

Предлагаем вашему вниманию парочку советов, которые помогут написать ТЗ, способное побудить ИИ на создание настоящего шедевра.

  1. Использовать ключи, которые будут понятны нейросети. От сленга в данном случае лучше отказаться.
  2. Краткость – сестра таланта. Идеальное ТЗ должно быть лаконичным. Оптимальный размер промта – 3-7 слов, но перегружать ИИ слишком пространным описанием не стоит.
  3. Прилагательные помогут четко изложить мысли, поэтому их необходимо использовать для описания предмета и стиля его исполнения. 
  4. Не стоит увлекаться противоречивой терминологией с двойственным значением. Это касается слов «абстрактный» и «реалистичный» в одном промте. ИИ попросту не поймет, что от него требуется.
  5. Целесообразно использовать специальные инструменты для составления промтов, такие как ChatGPT. Это удобные в работе генераторы, которые отлично себя зарекомендовали по той простой причине, что робот робота всегда поймет.
  6. Прежде чем использовать нейросеть, необходимо внимательно изучить ее особенности, в частности, ключи, которые инструмент способен распознать. DALL-E, Midjourney, Bing Image Creator – все они работают по-разному, поэтому и результат выдачи по одному и тому же ТЗ будет разным. 

А теперь сравним результаты, выданные визуальным ИИ

Визуальную нейросеть следует подбирать в зависимости от особенностей проекта. Для большей наглядности предлагаем посмотреть, как работает Midjourney, Bing Image Creator и DALL-E. Итак, начнем!

Midjourney

Он известен как нейросеть, генерирующая невероятно реалистичные изображения. В Discord пользователи делятся подсказками, которые помогают в создании качественных картинок. Почему бы не воспользоваться помощью опытных специалистов?

Первые 25 изображений Midjourney создаст бесплатно, за остальное придется платить. Подписка на месяц стоит 10 долларов.

Как писать промты для Midjourney

  • Все важные указания нужно давать вначале.
  • ИИ любит ссылки на конкретных исполнителей, поэтому целесообразно включить их в ТЗ.
  • Эффективны такие слова и словосочетания, как «модная фотография», «фото, получившее Пулитцеровскую премию», «золотой час», «боке» и т.д.

На скрине ниже картинка, созданная нейросетью по запросу «Дадаистский коллаж постапокалиптического мира в неоновых тонах и объемном освещении».

DALL-E

У этой нейросети лучше всего выходят фантастические пейзажи в стиле сюрреализма. Кроме того, она интересно интерпретирует абстрактные идеи и творческие концепции. Порой ее изображения столь необычны, что кажутся потусторонними. Фокусировка на фотореалистичных картинках у этого ИИ минимальна, его простой и понятный интерфейс высоко ценится новичками, ведь он способствует хорошей, а главное – оперативной обучаемости. 

Первые 50 картинок выдаются бесплатно, затем, после начала использования, пользователю ежемесячно выдают еще по 15 кредитов. Остальное придется оплачивать. Стоимость использования – 15 долларов за 115 промтов.

Как написать промт для DALL-E

  • Указать конкретный художественный стиль – цифровое искусство, киберпанк, вейп-арт и пр.
  • Подготовить описательный промт, добавив в него побольше прилагательных, таких как «светлый», «грустный», «темный», «счастливый».
  • Если не указать цвет фона, он останется белым. Чтобы изменить это, необходимо включить в ТЗ описание типа «в ночном лесу» или «в Париже».

Вот результат выдачи DALL-E по запросу «Дадаистский коллаж постапокалиптического мира в неоновых тонах и объемном освещении»:

Результат совсем не такой, как у Midjourney, не правда ли?

Bing Image Creator

«Конек» этой нейросети – яркость красок и детализация. У нее пока плохо получаются черты лица, наблюдаются определенные проблемы с последовательностью стиля и мелкими деталями, но в целом ИИ заслуживает внимания. А если учесть тот факт, что за использование инструмента не придется платить, можно смело утверждать, что у него большое будущее. И не беда, если выдача по первым промтам будет некачественной – когда рука набьется, все обязательно получится.

Как написать хорошее ТЗ для Bing Image Creator

Практика показывает, что наилучший результат выдается по промтам, составленным по схеме «прилагательное + существительное + глагол + стиль». Благодаря включению в описание указания вида с камеры и художественного стиля качество картинки значительно улучшится. 

Вот, что выдала нейросеть по запросу «Дадаистский коллаж постапокалиптического мира в неоновых тонах и объемном освещении».

Вместо заключения

Составлять промты для визуальных нейросетей необходимо в зависимости от того, с каким инструментом планируется работать и какой результат необходимо получить. Однако практика показывает, что лучше всего использовать сочетание конкретных существительных и прилагательных. А вообще в идеале переложить задачу по составлению промтов на специальные инструменты, работающие на базе ИИ – ChatGPT и тому подобные.

Поделиться с друзьями!

TraffNews

Traffnews фокусирует внимание на самом сочном и полезном контенте. Мы предлагаем интересные публикации о трафике, арбитраже и заработке в интернете. Статьи, инструкции, гайды, статистика, мнения, кейсы - все это вы найдете в нашей ленте. Мы, словно LEGO, публикуем разные блоки контента, которые формируют один крупный поток качественной информации для арбитражников и маркетологов. Только авторские материалы. Только честные и объективные оценки. Только рабочие кейсы и инструменты. Все это бесплатно, доступно и просто.

0 комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *