EleutherAI

EleutherAI — некоммерческая независимая исследовательская группа в области искусственного интеллекта, созданная с акцентом на открытость и коллективное участие. Группа, которую зачастую называют свободной альтернативой OpenAI, была основана в июле 2020 года на платформе Discord Коннором Лихи, Сидом Блэком и Лео Гао[1] для организации репликации GPT-3. В начале 2023 года коллектив был официально зарегистрирован как некоммерческий исследовательский институт EleutherAI Institute[2].

Общие сведения
EleutherAI
URL eleuther.ai
Коммерческий нет
Тип сайта исследовательский кооператив
Регистрация необязательная
Язык (-и) английский
Язык программирования Python
Владелец EleutherAI Institute
Начало работы 2020
Текущий статус активен
Страна

История

EleutherAI возникла как Discord-сервер 7 июля 2020 года под предварительным названием «LibreAI». Через несколько недель проект получил современное имя «EleutherAI» в отсылке к греческому слову eleutheria («свобода»)[3][4]. Основатели коллектива — Коннор Лихи, Лео Гао и Сид Блэк. В соавторстве они написали код проекта Eleuther, создав открытую платформу для исследований и разработки моделей машинного обучения, аналогичных GPT-3[5].

30 декабря 2020 года EleutherAI выпустила датасет The Pile — около 800 ГБ тщательно подобранных текстов для обучения больших языковых моделей[6]. Хотя в опубликованной работе были упомянуты модели GPT-Neo, их релиз состоялся только 21 марта 2021 года[7]. По словам самих авторов, они не ожидали, что публике будут так интересны «наши маленькие модели»[8]. В июне 2021 года EleutherAI представила модель GPT-J-6B (шесть миллиардов параметров), которая вновь стала крупнейшей открытой альтернативой GPT-3[9]. Языковые модели EleutherAI распространяются под лицензией Apache 2.0 и считаются одним из катализаторов запуска новой волны стартапов в области ИИ[2].

Изначально коллектив отвергал предложения о финансировании, предпочитая использовать вычислительные ресурсы по программе Google TPU Research Cloud[10]. Позднее, в начале 2021 года, EleutherAI приняла поддержку компаний CoreWeave и SpellML в виде доступа к крупным кластерам GPU для масштабных исследований. 10 февраля 2022 года был выпущен GPT-NeoX-20B — модель, масштабированная благодаря предоставленным ресурсам[11].

В 2022 году многие участники EleutherAI задействованы в исследовательском воркшопе BigScience: занимались мультизадачной дообучкой[12][13], обучением модели BLOOM[14] и разработкой средств для оценки моделей[14]. Инженеры EleutherAI, Stability AI и NVIDIA вместе с биологами из Колумбийского университета и Гарварда работали над проектом OpenFold — открытой реализацией AlphaFold2[15][16].

В начале 2023 года EleutherAI преобразовалась в некоммерческий исследовательский институт под управлением Стеллы Бидерман, Кёртиса Хюбнера и Шиваншу Пурохита[2]. Тогда же коллектив заявил о переходе от масштабирования языковых моделей к работам по интерпретируемости, выравниванию и научным исследованиям[17]. Сохраняя приверженность открытости, организация сосредоточилась на новых направлениях[18].

В июле 2024 года расследование студии Proof news показало, что датасет The Pile содержит субтитры более 170 000 видеороликов YouTube с 48 000+ каналов. Это вызвало критику и обвинения в отсутствии согласия со стороны авторов[19][20]. По состоянию на 2025 год исполнительным директором была Стелла Бидерман, главой отдела политики и этики — Авия Сковрон, главой направления интерпретируемости — Нора Белроуз, а глава по HPC — Квентин Энтони[21].

Исследования

Согласно сайту организации, EleutherAI — это «децентрализованный коллектив добровольцев-исследователей, инженеров и разработчиков, сосредоточенный на открытых исследованиях выравнивания ИИ, масштабировании и открытом искусственном интеллекте»[22]. Организация не занимается коммерциализацией своих разработок, но публикует научные статьи, ведёт блог и делает модели доступными для скачивания и использования бесплатно.

The Pile

The Pile — датасет (886 ГБ), предназначенный для обучения больших языковых моделей. Изначально создан для тренировки серии GPT-Neo, со временем стал использоваться и для других моделей — включая Megatron-Turing NLG от Microsoft[23][24], Open Pre-trained Transformers (Meta AI)[25], LLaMA[26], Galactica[27], BioMedLM 2.7B (Стэнфордский университет)[28], Chinese-Transformer-XL (Пекинская академия искусственного интеллекта)[29] и YaLM 100B (Яндекс)[30]. В отличие от других открытых датасетов, The Pile представляет собой тщательно скомпонованную коллекцию, созданную с учётом задач языкового моделирования, и подробно документирован командой EleutherAI.

Серии моделей GPT

Наибольшую известность организации принесли открытые языковые модели, вдохновлённые работами OpenAI над GPT-3[31]. Серии «GPT-Neo» включают языковые модели с 125 миллионами, 1,3 миллиарда, 2,7 миллиарда, 6 миллиардов и 20 миллиардов параметров:

  • GPT-Neo (125M, 1,3B, 2,7B):[32] релиз состоялся в марте 2021 года; на тот момент это была крупнейшая открытая GPT-3-подобная модель.
  • GPT-J (6B):[33] также вышла в марте 2021 года и на момент релиза была самой крупной моделью данного типа[34].
  • GPT-NeoX (20B):[35] релиз — февраль 2022 года (на тот момент — крупнейшая открытая языковая модель).
  • Pythia (13B):[36] в отличие от более ранних, специально предназначена для научных исследований свойств и процессов обучения LLM: предоставляет 154 контрольные точки тренировок и полный доступ к данным/[36].

VQGAN-CLIP

undefined
undefined

После релиза DALL-E компанией OpenAI в январе 2021 года EleutherAI начала собственные проекты по синтезу изображений по текстовому описанию. Когда OpenAI не опубликовала свои модели, Кэтрин Кроусон и цифровой художник Райан Мёрдок разработали технику, объединяющую CLIP и VQGAN для генерации изображений по тексту[39][40][41][42]. Технологией мгновенно заинтересовалось сообщество: Crowson открыто публиковала notebooks для запуска моделей без сложной настройки[43][44][45]. По утверждению CEO Stability AI Эмада Мостаки, именно успех VQGAN-CLIP дал толчок основанию Stability AI.

Общественная оценка

Признание

Работы EleutherAI по демократизации GPT-3 получили премию Netexplo Global Innovation от ЮНЕСКО (2021)[46], были отмечены премией InfoWorld Best of Open Source Software в 2021[47] и 2022 годах[48], а также были номинированы на AI Innovation Award от VentureBeat (2021)[49].

Когнитивист и критик индустрии глубокого обучения Гэри Маркус неоднократно[50] хвалил прозрачность и открытость EleutherAI.

Максимилиан Гантц из Mozilla Foundation подчеркнул значимость проектов EleutherAI для независимого аудита ИИ: «Если модели и датасеты открытые — это даст гораздо больше возможностей для критического анализа и устранения вреда от генеративного ИИ, который иначе редко доступен»[51].

Критика

Журналист Кайл Виггерс выражал сомнения в полной независимости EleutherAI, указывая на участие коммерческих структур вроде Stability AI и Hugging Face (получающих венчурные инвестиции), и их потенциальное влияние на исследования коллектива[52].

Примечания

  1. About (брит. англ.). EleutherAI. Дата обращения: 23 мая 2024.
  2. 1 2 3 Wiggers, Kyle Stability AI, Hugging Face и Canva поддерживают новый некоммерческий ИИ-исследовательский институт (англ.). TechCrunch (2 марта 2023). Дата обращения: 8 августа 2023. Архивировано 29 августа 2023 года.
  3. Leahy, Connor; Hallahan, Eric; Gao, Leo; Biderman, Stella What A Long, Strange Trip It's Been: EleutherAI One Year Retrospective (англ.). EleutherAI Blog (7 июля 2021). Дата обращения: 14 апреля 2023. Архивировано 29 августа 2023 года.
  4. Smith, Craig EleutherAI: When OpenAI Isn't Open Enough. IEEE Spectrum. IEEE (21 марта 2022). Дата обращения: 8 августа 2023. Архивировано 29 августа 2023 года.
  5. Stability AI, Hugging Face и Canva поддерживают новый некоммерческий ИИ-исследовательский институт (2 марта 2023).
  6. Gao, Leo; Biderman, Stella; Black, Sid (2020-12-31). The Pile: An 800GB Dataset of Diverse Text for Language Modeling. arXiv 2101.00027. arXiv:2101.00027.
  7. GPT-3's free alternative GPT-Neo is something to be excited about (англ.). VentureBeat (15 мая 2021). Дата обращения: 14 апреля 2023. Архивировано 9 марта 2023 года.
  8. What A Long, Strange Trip It's Been: EleutherAI One Year Retrospective (7 июля 2021). Архивировано 29 августа 2023 года. Дата обращения: 1 марта 2023.
  9. GPT-J-6B: An Introduction to the Largest Open Source GPT Model. www.forefront.ai. Дата обращения: 1 марта 2023. Архивировано 9 марта 2023 года.
  10. EleutherAI: When OpenAI Isn't Open Enough. IEEE Spectrum. Дата обращения: 1 марта 2023. Архивировано 21 марта 2023 года.
  11. Black, Sid; Biderman, Stella & Hallahan, Eric (2022-04-14), GPT-NeoX-20B: An Open-Source Autoregressive Language Model, arΧiv:2204.06745 [cs.CL]. 
  12. Sanh, Victor; Webson, Albert; Raffel, Colin; Bach, Stephen H.; Sutawika, Lintang; Alyafeai, Zaid; Chaffin, Antoine; Stiegler, Arnaud; et al. (2021), Multitask Prompted Training Enables Zero-Shot Task Generalization, arΧiv:2110.08207 [cs.LG]. 
  13. Muennighoff, Niklas; Wang, Thomas; Sutawika, Lintang; Roberts, Adam; Biderman, Stella; Teven Le Scao; M Saiful Bari; Shen, Sheng; et al. (2022), Crosslingual Generalization through Multitask Finetuning, arΧiv:2211.01786 [cs.CL]. 
  14. 1 2 Workshop, BigScience; Teven Le Scao; Fan, Angela; Akiki, Christopher; Pavlick, Ellie; Ilić, Suzana; Hesslow, Daniel; Castagné, Roman; et al. (2022), BLOOM: A 176B-Parameter Open-Access Multilingual Language Model, arΧiv:2211.05100 [cs.CL]. 
  15. Meet OpenFold: Reimplementing AlphaFold2 to Illuminate Its Learning Mechanisms and Generalization (21 августа 2023).
  16. Democratizing AI for Biology with OpenFold.
  17. The View from 30,000 Feet: Preface to the Second EleutherAI Retrospective (2 марта 2023).
  18. AI Research Lab Launches Open Source Research Nonprofit. The NonProfit Times.
  19. Gilbertson, Annie; Reisner, Alex (2024-07-16). “Apple, Nvidia, Anthropic Used Thousands of Swiped YouTube Videos to Train AI”. WIRED. Дата обращения 2024-07-18.
  20. Gilbertson, Annie Apple, Nvidia, Anthropic Used Thousands of Swiped YouTube Videos to Train AI. Proof (16 июля 2024). Дата обращения: 18 июля 2024.
  21. Staff. Дата обращения: 18 июля 2024.
  22. EleutherAI Website. EleutherAI. Дата обращения: 1 июля 2021. Архивировано 2 июля 2021 года.
  23. Microsoft and Nvidia team up to train one of the world's largest language models (11 октября 2021). Дата обращения: 8 марта 2023. Архивировано 27 марта 2023 года.
  24. AI: Megatron the Transformer, and its related language models (24 сентября 2021). Дата обращения: 8 марта 2023. Архивировано 4 марта 2023 года.
  25. Zhang, Susan; Roller, Stephen; Goyal, Naman; Artetxe, Mikel; Chen, Moya; Chen, Shuohui; Dewan, Christopher; Diab, Mona; et al. (2022-06-21), OPT: Open Pre-trained Transformer Language Models, arΧiv:2205.01068 [cs.CL]. 
  26. Touvron, Hugo; Lavril, Thibaut; Izacard, Gautier; Grave, Edouard & Lample, Guillaume (2023-02-27), LLaMA: Open and Efficient Foundation Language Models, arΧiv:2302.13971 [cs.CL]. 
  27. Taylor, Ross; Kardas, Marcin; Cucurull, Guillem; Scialom, Thomas; Hartshorn, Anthony; Saravia, Elvis; Poulton, Andrew; Kerkez, Viktor; et al. (2022-11-16), Galactica: A Large Language Model for Science, arΧiv:2211.09085 [cs.CL]. 
  28. Model Card for BioMedLM 2.7B. huggingface.co. Дата обращения: 5 июня 2023. Архивировано 5 июня 2023 года.
  29. Yuan, Sha; Zhao, Hanyu; Du, Zhengxiao; Ding, Ming; Liu, Xiao; Cen, Yukuo; Zou, Xu; Yang, Zhilin; Tang, Jie (2021). “WuDaoCorpora: A super large-scale Chinese corpora for pre-training language models”. AI Open. 2: 65—68. DOI:10.1016/j.aiopen.2021.06.001.
  30. Yandex (2022). Yandex publishes YaLM 100B, the largest GPT-like neural network in open source. Пресс-релиз.
  31. GPT-3's free alternative GPT-Neo is something to be excited about (15 мая 2021). Дата обращения: 10 марта 2023. Архивировано 9 марта 2023 года.
  32. Andonian, Alex; Biderman, Stella; Black, Sid; Gali, Preetham; Gao, Leo; Hallahan, Eric; Levy-Kramer, Josh; Leahy, Connor; et al. (2023-03-10), GPT-NeoX: Large Scale Autoregressive Language Modeling in PyTorch, DOI 10.5281/zenodo.5879544. 
  33. EleutherAI/gpt-j-6B · Hugging Face. huggingface.co. Дата обращения: 10 марта 2023. Архивировано 12 марта 2023 года.
  34. GPT-J-6B: An Introduction to the Largest Open Source GPT Model. www.forefront.ai. Дата обращения: 1 марта 2023. Архивировано 9 марта 2023 года.
  35. Black, Sidney; Biderman, Stella; Hallahan, Eric; et al. (2022-05-01). GPT-NeoX-20B: An Open-Source Autoregressive Language Model. Proceedings of BigScience Episode #5 -- Workshop on Challenges & Perspectives in Creating Large Language Models. pp. 95—136. arXiv:2204.06745. DOI:10.18653/v1/2022.bigscience-1.9. Дата обращения 2022-12-19 – via Association for Computational Linguistics - Anthology.
  36. 1 2 Biderman, Stella; Schoelkopf, Hailey; Anthony, Quentin; Bradley, Herbie; O'Brien, Kyle; Hallahan, Eric; Mohammad Aflah Khan; Purohit, Shivanshu; et al. (2023), Pythia: A Suite for Analyzing Large Language Models Across Training and Scaling, arΧiv:2304.01373 [cs.CL]. 
  37. CLIP-Guided Diffusion (брит. англ.). EleutherAI. Дата обращения: 20 августа 2023. Архивировано 29 августа 2023 года.
  38. CLIP Guided Diffusion HQ 256x256.ipynb - Colaboratory (англ.). Google Colab. Дата обращения: 20 августа 2023. Архивировано 29 августа 2023 года.
  39. MIRANDA, LJ The Illustrated VQGAN. ljvmiranda921.github.io (8 августа 2021). Дата обращения: 8 марта 2023. Архивировано 20 марта 2023 года.
  40. Inside The World of Uncanny AI Twitter Art. Nylon (24 марта 2022). Дата обращения: 8 марта 2023. Архивировано 29 августа 2023 года.
  41. This AI Turns Movie Text Descriptions Into Abstract Posters. Yahoo Life (20 сентября 2021). Дата обращения: 8 марта 2023. Архивировано 27 декабря 2022 года.
  42. Quach, Katyanna A man spent a year in jail on a murder charge involving disputed AI evidence. Now the case has been dropped. www.theregister.com. Дата обращения: 8 марта 2023. Архивировано 8 марта 2023 года.
  43. We asked an AI tool to 'paint' images of Australia. Critics say they're good enough to sell (14 июля 2021). Архивировано 7 марта 2023 года. Дата обращения: 8 марта 2023.
  44. Nataraj, Poornima Online tools to create mind-blowing AI art. Analytics India Magazine (28 февраля 2022). Дата обращения: 8 марта 2023. Архивировано 8 февраля 2023 года.
  45. Meet the Woman Making Viral Portraits of Mental Health on TikTok. Vice.com (30 ноября 2021). Дата обращения: 8 марта 2023. Архивировано 11 мая 2023 года.
  46. UNESCO Netexplo Forum 2021. Дата обращения: 8 марта 2023. Архивировано 16 октября 2022 года.
  47. Yegulalp, James R. Borck, Martin Heller, Andrew C. Oliver, Ian Pointer, Matthew Tyson and Serdar The best open source software of 2021. InfoWorld (18 октября 2021). Дата обращения: 8 марта 2023. Архивировано 8 марта 2023 года.
  48. Yegulalp, James R. Borck, Martin Heller, Andrew C. Oliver, Ian Pointer, Isaac Sacolick, Matthew Tyson and Serdar The best open source software of 2022. InfoWorld (17 октября 2022). Дата обращения: 8 марта 2023. Архивировано 8 марта 2023 года.
  49. VentureBeat presents AI Innovation Awards nominees at Transform 2021 (16 июля 2021). Дата обращения: 8 марта 2023. Архивировано 8 марта 2023 года.
  50. What's next for AI: Gary Marcus talks about the journey toward robust artificial intelligence. ZDNET. Дата обращения: 8 марта 2023. Архивировано 1 марта 2023 года.
  51. Chowdhury, Meghmala Will Powerful AI Disrupt Industries Once Thought to be Safe in 2023? (англ.). Analytics Insight (29 декабря 2022). Дата обращения: 6 апреля 2023. Архивировано 1 января 2023 года.
  52. Wiggers, Kyle Stability AI, Hugging Face и Canva поддерживают новый некоммерческий ИИ-исследовательский институт (2 марта 2023). Дата обращения: 8 марта 2023. Архивировано 7 марта 2023 года.