Automatic1111
AUTOMATIC1111 Stable Diffusion Web UI — свободное программное обеспечение с открытым исходным кодом на основе генеративного искусственного интеллекта, предназначенное для генерации изображений по текстовому описанию[2]. Программа использует модель Stable Diffusion в качестве основы и поддерживает большое количество расширений и функций для кастомизации результата[3]. Также обозначается как SD WebUI, A1111 или Automatic1111[4].
Общие сведения
| AUTOMATIC1111 Stable Diffusion Web UI | |
|---|---|
| Автор | AUTOMATIC1111 |
| Разработчики | AUTOMATIC1111 и сообщество |
| Написана на | Python |
| Первый выпуск | 22 августа 2022 |
| Последняя версия | |
| Репозиторий | github.com/AUTOMATIC1111… |
| Лицензия | AGPL-3.0 |
История
SD WebUI был выложен на GitHub 22 августа 2022 года записью от AUTOMATIC1111[5], через месяц после первого выпуска Stable Diffusion[6]. На тот момент Stable Diffusion можно было запускать только через командную строку[3]. SD WebUI быстро стал популярным и был описан как «самый популярный инструмент для локального запуска диффузионных моделей»[2][7]. SD WebUI является одним из самых популярных графических интерфейсов для Stable Diffusion наряду с ComfyUI[8]. В феврале 2024 года издательство Gijutsu Hyoronsha (Япония) выпустило книгу о работе с Stable Diffusion в связке с SD WebUI на японском языке[9][10]. По состоянию на июль 2024 года проект имеет 136 000 звёзд на GitHub[11].
Возможности
SD WebUI использует Gradio в качестве фреймворка пользовательского интерфейса[12][13][14]. Все параметры, доступные в Stable Diffusion, представлены через интерфейс SD WebUI. Кроме того, SD WebUI добавляет собственные параметры, отсутствующие в оригинальном Stable Diffusion, в том числе поддержку Low-rank adaptation, ControlNet и пользовательских вариационных автоэнкодеров[12][13][15]. Поддерживается взвешивание текстовых промптов, генерация изображений по примеру (image-to-image), инпейтинг, outpainting и увеличение изображений[16]. Реализовано более 20 сэмплеров, включая DDIM, Euler, Euler a, DPM++ 2M Karras, UniPC и другие[16][17]. SD WebUI также ценится за многочисленные оптимизации по сравнению с базовой реализацией Stable Diffusion[3].
Stable Diffusion WebUI Forge
Stable Diffusion WebUI Forge (Forge) — заметный форк SD WebUI, разработанный Lvmin Zhang, который также создал ControlNet и Fooocus[18][19]. Изначальной целью Forge было повышение производительности и расширение возможностей SD WebUI с последующим внесением улучшений в основной проект[18][19]. Одна из оптимизаций Forge позволяет пользователям с малым объёмом VRAM ускорять генерацию изображений на некоторых версиях Stable Diffusion[18]. Например, для карт с 8 ГБ и 6 ГБ видеопамяти ускорение достигает 30–45 % и 60–75 % соответственно[18][19]. Forge также включает вспомогательные функции, не реализованные в стандартной SD WebUI, например поддержку большего числа сэмплеров[20]. Часть оптимизаций Forge была заимствована из ComfyUI, другая часть разработана собственной командой проекта[19]. В августе 2024 года в Forge добавлена поддержка диффузионной модели Flux от Black Forest Labs, пока отсутствующей в SD WebUI[21].