Fooocus
Fooocus — свободная программа генеративного искусственного интеллекта с открытым исходным кодом, предназначенная для генерации изображений по текстовому запросу[2]. В качестве основной модели для генерации изображений используется Stable Diffusion XL, а также набор стандартных настроек и пресетов, упрощающих сам процесс[2].
Общие сведения
| Fooocus | |
|---|---|
| Тип | Q133730744? |
| Автор | Lvmin Zhang |
| Написана на | Python |
| Первый выпуск | 9 августа 2023 |
| Последняя версия |
|
| Репозиторий | github.com/lllyasviel/Fo… |
| Лицензия | GPLv3 |
| Сайт | github.com/lllyas… (англ.) |
История
Fooocus был создан Lvmin Zhang — докторантом Стэнфордского университета, ранее обучавшимся в Китайском университете Гонконга и Сучжоуском университете[3]. Zhang также является основным автором ControlNet,[3][4] который используется во многих других интерфейсах Stable Diffusion, таких как AUTOMATIC1111 и ComfyUI. По состоянию на 9 июля 2024 года проект имел 38 100 звёзд на GitHub[5].
Возможности
Ключевая особенность Fooocus — простота установки и отсутствие необходимости вручную настраивать параметры модели для получения желаемых результатов[2][3][6]. Согласно описанию проекта, используется GPT-2 для автоматического обогащения подсказок пользователя деталями[7]. В числе стандартных расширений по умолчанию доступен LCM (низкоранговая адаптация), что обеспечивает более быструю генерацию изображений[8]. Fooocus изначально ориентирован на фотореалистичный стиль, однако пользователю доступен выбор из ряда предопределённых стилей[2] Хотя Fooocus рассчитан на получение хороших результатов из коробки, предусмотрена вкладка расширенных настроек для ручной кастомизации.[9]. Пользовательский интерфейс построен на базе Gradio[10].