Fooocus

Fooocus — свободная программа генеративного искусственного интеллекта с открытым исходным кодом, предназначенная для генерации изображений по текстовому запросу[2]. В качестве основной модели для генерации изображений используется Stable Diffusion XL, а также набор стандартных настроек и пресетов, упрощающих сам процесс[2].

Общие сведения
Fooocus
Тип Q133730744?
Автор Lvmin Zhang
Написана на Python
Первый выпуск 9 августа 2023
Последняя версия
Репозиторий github.com/lllyasviel/Fo…
Лицензия GPLv3
Сайт github.com/lllyas… (англ.)

История

Fooocus был создан Lvmin Zhang — докторантом Стэнфордского университета, ранее обучавшимся в Китайском университете Гонконга и Сучжоуском университете[3]. Zhang также является основным автором ControlNet,[3][4] который используется во многих других интерфейсах Stable Diffusion, таких как AUTOMATIC1111 и ComfyUI. По состоянию на 9 июля 2024 года проект имел 38 100 звёзд на GitHub[5].

Возможности

Ключевая особенность Fooocus — простота установки и отсутствие необходимости вручную настраивать параметры модели для получения желаемых результатов[2][3][6]. Согласно описанию проекта, используется GPT-2 для автоматического обогащения подсказок пользователя деталями[7]. В числе стандартных расширений по умолчанию доступен LCM (низкоранговая адаптация), что обеспечивает более быструю генерацию изображений[8]. Fooocus изначально ориентирован на фотореалистичный стиль, однако пользователю доступен выбор из ряда предопределённых стилей[2] Хотя Fooocus рассчитан на получение хороших результатов из коробки, предусмотрена вкладка расширенных настроек для ручной кастомизации.[9]. Пользовательский интерфейс построен на базе Gradio[10].

Примечания