Генерация изображений
Генерация изображений позволяет агенту создавать новые изображения на основе текстового промпта или редактировать изображения, загруженные пользователем. Агент выбирает между генерацией и редактированием в зависимости от запроса и доступного контекста.
Включите генерацию изображений
Генерация изображений настраивается через модальное окно Add Tools в Конструкторе агентов (а не в разделе Capabilities). Нажмите Add Tools в нижней части панели Конструктора агентов, затем добавьте один из инструментов для работы с моделями изображений — например, OpenAI Image Tools, DALL-E-3 или Stable Diffusion. Агент сам выберет подходящий инструмент в зависимости от запроса, либо вы можете ограничить выбор в инструкциях.

Генерация
Когда пользователь запрашивает изображение, агент вызывает инструмент генерации с промптом и возвращает полученное изображение непосредственно в ответе. Агент сохраняет ссылку на изображение в своём контексте, чтобы затем описать его или повторно использовать в рамках того же диалога.
Редактирование
Если пользователь загружает изображение и просит внести изменения — изменить цвет, добавить объект или расширить композицию, — агент использует вариант инструмента для редактирования. Результат заменяет соответствующую область или расширяет исходное изображение в соответствии с запросом.
Примечания
- Сгенерированные изображения не отправляются автоматически в отдельную систему анализа изображений. Если вам нужно, чтобы агент интерпретировал изображение, используйте vision с изображением, загруженным пользователем.
- Действуют политики провайдера в отношении контента. Промпты, нарушающие политику провайдера, приводят к ошибке, а не к созданию изображения.