Генерация изображений в онлайн-редакторе DashaMail: советы и рекомендации

В предыдущей статье мы рассказали, как работать с функционалом, теперь разберем самое важное — запросы (промты), по которым генерируются изображения и как их правильно составлять.

Что такое промт и из чего он состоит

Промт (prompt) — это описание, которое Midjourney использует для генерации изображения. В промте обязательно должен быть текст, также он может содержать параметры изображения.

Ссылка на изображение добавляется, если требуется, чтобы генерируемая картинка была в каком-то конкретном стиле. URL-адрес всегда прописывается в начале промта.

Текст описывает изображение, которое вы хотите получить.

Параметры позволяют менять способ создания изображения. Они позволяют изменять пропорции, модели, стили и многое другое. Параметры добавляются в конце промта после двух дефисов --.

Хорошо продуманное описание поможет создать уникальные и захватывающие изображения.

На что нужно обратить внимание

На текущий момент бот понимает только текст на английском языке. Не бойтесь при необходимости использовать онлайн-переводчик, в текстовом описании изображения (промте) не требуется идеальное построение фраз.

Нынешняя версия Midjourney довольно хорошо распознает текст запроса, поэтому составлять промты стало значительно проще. Например, по запросу «create a high-resolution image of a legendary gold chest, half buried in the ground, in a dark forest. Bright light is radiating from the chest, the chest is bright gold, and glowing», (который выглядит привычнее для ChatGPT или DALL-E) нейросеть выдает очень приличный результат:

Обратите внимание на тот факт, что Midjourney создает картинки, опираясь на изображения объектов, которые имеются в сети. Например, фото котиков в свободном доступе много, поэтому картинки с ними получаются очень хорошо и генерируются без проблем. В отличие от этого, оазис для цветов часто скрыт на снимках с букетами. Поэтому при запросе нарисовать флористическую пену, бот рисует различные объекты с цветами, но не тот, который нужен.

Составление текстового промта

Выбор основного объекта

В первую очередь нужно описать центральную тему или объект, вокруг которого строится остальная часть промта. Правда, если вписывать в запрос исключительно один объект, то результаты вряд ли порадуют разнообразием.

Пример по запросу «puppy»

Детали запроса

Для генерации картинки достаточно пары слов, и изображения с такими промтами получаются отличными:

Пример: картинки по запросу distopian futuristic 2d monochrome

Но если вы введете фразу без дополнительных условий, то все, что не было точно описано, ai «додумает».

Большое количество деталей может сломать генерацию, когда бот не понимает, что именно нужно нарисовать. Поэтому, если требуется большое количество предметов на фото (например, десять подарков разного цвета), не описывайте отдельно каждый, а объедините их в одну категорию.

Учитывайте, что Midjourney плохо понимает отрицания (нет, без, но, исключая). Лучше описать то, что вы хотите видеть на изображении, а не то, чего нужно избегать. Например, если попросить нарисовать сцену праздника без фейерверка, то с большой вероятностью на итоговом изображении как раз появится фейерверк.

По запросу «holiday without fireworks» отрицание не сработало ни в одном из вариантов.

Стили

Midjourney обучена на обширном списке художественных стилей, работ конкретных художников, разнообразных направлений и временных эпох. При указании стилистики в запросе, будь то выбор материалов (акварель, живопись маслом), художественные направления, конкретные художники — результаты получаются впечатляющими.

watercolor of a duck wearing victorian style clothing

Shrek by Picasso

Ссылки на изображения

Есть несколько вариантов, как использовать URL в промте:

1. Использование стиля изображения

Если нужно использовать какое-либо изображение в качестве примера, то сначала укажите ссылку на него и только после этого добавьте текстовое описание.

Пример: https://ссылка_на_изображение текст описания

Исходное изображение

Результат по запросу https://ссылка_на_изображение colorful collage, Coliseum

2. Объединение нескольких изображений

Чтобы объединить несколько изображений, вставьте ссылки на них, разделенные пробелом или запятой:

https://ссылка_на_изображение1, https://ссылка_на_изображение2

или

https://ссылка_на_изображение1 https://ссылка_на_изображение2

Например, при объединении этих двух изображений:

Получился такой котик на диване:

Параметры

Применяйте параметры в запросе, чтобы влиять на генерируемое изображение. Допускается использование несколько параметров одновременно. Важно правильно прописывать их, используя два дефиса и пробел перед числами, в противном случае параметры не сработают. Также не забывайте, что их нужно добавлять только в конец промта.

Пример — промт «three-quarter close-up pose, young woman with curly brown hair and wearing a blue strapless dress, focus on the eyes» без параметров:

Этот же промт, но уже с параметрами, отвечающими за стиль, соотношение сторон изображения и качество рендеринга:

Самые часто используемые параметры:

Пропорции. По умолчанию изображение генерируется в пропорции 1:1. Параметр в конце запроса --ar отвечает за соотношение сторон, оно может быть любым. Например, добавьте в конце промта --ar 2:3, чтобы получить вертикальную картинку или --ar 3:2, чтобы получить горизонтальную. Рекомендуем использовать только параметры 1:1, 16:9 и 9:16, 3:2 и 2:3, 2:1 и 1:2, 3:4 и 4:3.

Также можно использовать кнопки пропорций при создании запроса:

Хаос. Параметр --chaos увеличивает процент абстракции в генерируемом изображении. Больший показатель поможет дать интересные и неожиданные результаты, но они могут значительно отличаться от вашего запроса. Диапазон — от 0 до 100.

Запрет. Параметр --no указывает, что не должно присутствовать на изображении. Например, --no text отвечает за отсутствие текста в сгенерированном изображений. Следует помнить, что нейросеть не очень дружит с отрицаниями, поэтому это условие может не всегда срабатывать.

Режим Niji. Параметр --niji позволяет генерировать изображения в аниме-стиле.

Картинка по запросу «cat» без параметров и картинка с параметром --niji

Seed. Параметр на данный момент не поддерживается. Если эта переменная есть в промте, она будет удалена при передаче запроса.

Замощение. Параметр --tile позволяет создать изображения, которые можно использовать в качестве повторяющихся элементов для бесшовных узоров. Особенно он будет удобен для создания фона письма с повторяющимися элементами.

Картинка без параметров и картинка с параметром --tile

Перечисленного выше достаточно для создания эффектных изображений.

Например, в запросе «Imagine a futuristic fashion shoot on Mars: beautiful woman, light gray simple and easy outfit, anamorphic lens, ultra-realistic, hyper-detailed portrait photography taken by Thierry Mugler. The image must be captured in ultra-high resolution. Use the enabled photorealism mode to create an ultra-realistic image 8k, --ar 2:3» подробно расписаны только условия и указаны пропорции, однако изображение получилось достаточно точным:

ОБРАТИТЕ ВНИМАНИЕ! Функция генерации изображений работает только на платных тарифных планах.