Перейти к основному содержимому
Перейти к основному содержимому

Генерация изображений

Beta feature. Learn more.

Генерация изображений позволяет агенту создавать новые изображения на основе текстового промпта или редактировать изображения, загруженные пользователем. Агент выбирает между генерацией и редактированием в зависимости от запроса и доступного контекста.

Включите генерацию изображений

Генерация изображений настраивается через модальное окно Add Tools в Конструкторе агентов (а не в разделе Capabilities). Нажмите Add Tools в нижней части панели Конструктора агентов, затем добавьте один из инструментов для работы с моделями изображений — например, OpenAI Image Tools, DALL-E-3 или Stable Diffusion. Агент сам выберет подходящий инструмент в зависимости от запроса, либо вы можете ограничить выбор в инструкциях.

Модальное окно Agent Tools с интеграциями для моделей изображений, включая OpenAI Image Tools, DALL-E-3 и Stable Diffusion, а также другие сторонние инструменты

Генерация

Когда пользователь запрашивает изображение, агент вызывает инструмент генерации с промптом и возвращает полученное изображение непосредственно в ответе. Агент сохраняет ссылку на изображение в своём контексте, чтобы затем описать его или повторно использовать в рамках того же диалога.

Редактирование

Если пользователь загружает изображение и просит внести изменения — изменить цвет, добавить объект или расширить композицию, — агент использует вариант инструмента для редактирования. Результат заменяет соответствующую область или расширяет исходное изображение в соответствии с запросом.

Примечания

  • Сгенерированные изображения не отправляются автоматически в отдельную систему анализа изображений. Если вам нужно, чтобы агент интерпретировал изображение, используйте vision с изображением, загруженным пользователем.
  • Действуют политики провайдера в отношении контента. Промпты, нарушающие политику провайдера, приводят к ошибке, а не к созданию изображения.