LaMDA

LaMDA
LaMDA
Тип	языковая модель, чатбот
Разработчик	Google
Движок	Transformer
Первый выпуск	18 мая 2021
Состояние	активное
Сайт	blog.google/technology/a…

LaMDA
LaMDA
Тип	языковая модель, чатбот
Разработчик	Google
Движок	Transformer
Первый выпуск	18 мая 2021
Состояние	активное
Сайт	blog.google/technology/a…

LaMDA — языковая модель для диалоговых приложений (англ. Language Model for Dialogue Applications), разработанная компанией Google с 2017 года для создания более естественного и интеллектуального взаимодействия между человеком и технологиями^[1].^[2] LaMDA относится к типу больших языковых моделей (LLM) с элементами искусственного интеллекта и впервые была публично представлена на конференции Google I/O в 2021 году^[1].

В июне 2022 года LaMDA привлекла широкое внимание после того, как инженер Google Блейк Лемуан заявил, что чатбот обрёл признаки сознания^[2], однако научное сообщество отвергло эти утверждения, несмотря на интересные результаты теста Тьюринга. В феврале 2023 года Google анонсировала Bard — чатбот на основе LaMDA, как конкурента растущей популярности ChatGPT от OpenAI. LaMDA основана на архитектуре нейронной сети transformer, созданной Google в 2017 году^[1].

Первая генерация

Google представила разговорную языковую модель LaMDA на открытии конференции Google I/O 18 мая 2021 года^[3]. LaMDA построена на архитектуре Transformer, разработанной исследовательским подразделением Google в 2017 году^[1]^[4]. Модель обучалась на диалогах и человеческих историях, что позволило поддерживать открытые беседы. По заявлениям Google, ответы LaMDA отличаются «осмысленностью, интересностью и контекстной уместностью»^[5].

Вторая генерация

11 мая 2022 года Google представила LaMDA 2 — преемника первой генерации — на Google I/O 2022. Новая версия извлекает текстовые примеры из различных источников, формируя уникальные «естественные диалоги» даже по вопросам, на которые она не была непосредственно обучена^[6]. Одновременно Google запустила приложение AI Test Kitchen, работающее на LaMDA 2, которое предлагало списки рекомендаций на основе сложных целей^[7]. Приложение стало доступно для «избранных учёных, исследователей и политиков»; с августа 2022 года пользователи из США могли подать заявку на ранний доступ^[8].

Заявления о сознательности

11 июня 2022 года газета The Washington Post сообщила, что инженер Google Блейк Лемуан был отправлен в оплачиваемый административный отпуск после обращения к руководству о якобы сознательности LaMDA. К такому выводу он пришёл на основании неоднозначных ответов чатбота по вопросам самоидентификации, морали, религии и «трёх законов робототехники» Азимова^[10]. Google опровергла эти заявления, настаивая на отсутствии доказательств сознательности LaMDA^[11]. В интервью Wired Лемуан ещё раз подтвердил свои взгляды. Впоследствии он был уволен из Google^[12], после того как он нанял адвоката для защиты интересов LaMDA по просьбе чатбота. 22 июля Google официально уволила Лемуана, назвав его обвинения необоснованными^[13].

Заявления Лемуана были подвергнуты критике большинством научного сообщества^[14]. Так, эксперты по искусственному интеллекту, в том числе Гэри Маркус, Эрик Бриньолфсон, Адриан Хилтон и другие, отвергли возможность самосознания языковых моделей^[9]. Руководитель отдела ИИ Meta Platforms Ян Лекун пояснил, что такие нейронные сети, как LaMDA, недостаточно мощны для формирования «настоящего интеллекта»^[15]. Профессор Калифорнийского университета в Санта-Круз Макс Кремински также отметил, что архитектура LaMDA не поддерживает ключевые признаки человеческого сознания^[16].

Дэвид Ферруччи, ведущий разработчик IBM Watson, сравнил ситуацию с эффектом, производимым Watson при его появлении^[17]. Бывший исследователь Google Тимнит Гебру назвала Лемуана жертвой «цикла хайпа» вокруг ИИ^[18]. Эти дискуссии возобновили интерес к тесту Тьюринга как критерию искусственного интеллекта^[9], а также к феномену эффекта ЭЛИЗЫ.

Bard

В ноябре 2022 года OpenAI анонсировала ChatGPT, чатбот на основе GPT-3^[19]. ChatGPT приобрёл бешеную популярность и стал интернет-сенсацией. В ответ на конкуренцию генеральный директор Google Сундар Пичаи инициировал срочные меры по развитию ответных ИИ-продуктов компании, а сооснователи Google Ларри Пейдж и Сергей Брин были вновь привлечены к обсуждению дальнейшей стратегии^[20].

На вопрос сотрудников, не была ли LaMDA для Google упущенной возможностью в борьбе с ChatGPT, Пичаи и глава ИИ Джефф Дин ответили, что из-за масштабов компании избыточная поспешность представляла репутационные риски^[21]. В январе 2023 года глава DeepMind Демис Хассабис раскрыл планы создания собственного чатбота-аналога ChatGPT^[22], а Google ускорила тестирование систем «Apprentice Bard» и других^[23]. Пичаи пообещал инвесторам расширять использование и развитие LaMDA^[24].

6 февраля Google анонсировала Bard — диалогового чатбота на базе LaMDA. Bard сначала тестировался на ограниченном круге пользователей, после чего был запущен для более широкой аудитории^[25]. Bard носил кодовое имя «Atlas» во время разработки^[26]. Презентация Bard сопровождалась ошибкой, когда бот дал неверный ответ на вопрос о телескопе Джеймса Уэбба^[27], что привело к падению акций Google. Аналитики отмечали, что компания «вынужденно нагоняет» Microsoft^[28], а презентация Bard была приурочена к анонсу интеграции ChatGPT в Bing^[29].

LaMDA использует языковую модель transformer для генерации ответов и предварительно обучается на корпусе из 1,56 триллиона слов, включающем тексты документов и диалоги^[30]. Дальнейшее дообучение происходит на вручную размеченных данных для оценки осмысленности, интересности и безопасности. Тесты Google показали, что ответы LaMDA превосходят человеческие по критерию интереса. Для повышения достоверности фактов модель transformer взаимодействует с внешней системой поиска информации. Было протестировано три варианта модели, крупнейший из которых содержит 137 миллиардов параметров:

Гиперпараметры модели transformer
Параметры	Слои	Размерность (d_модели)	Голов
2 млрд	10	2560	40
8 млрд	16	4096	64
137 млрд	64	8192	128

Пресс-релиз на официальном блоге Google

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[10]

[11]

[12]

[13]

[14]

[9]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

Google
Председатель совета директоров: Эрик Шмидт Директор, президент по технологиям и сооснователь: Сергей Брин Главный исполнительный директор и сооснователь: Ларри Пейдж Материнская компания: Alphabet
Реклама	AdMob Adscape AdSense Advertising Professional Ads Analytics DoubleClick Insights for Search Trends Wallet Google Университет
Коммуникации	Allo Google+ Calendar Friend Connect Duo Gmail Inbox Groups Hangouts Meet Messages Panoramio Picasa Вопросы и ответы Talk Translate Voice
ПО	Chrome Chromium Chrome DevTools Earth Gadgets Goggles Now Picasa SketchUp Talk Google Assistant Find Hub Toolbar
Платформы	Account Android App Engine BigTable Chromecast Chrome OS Dialogflow Google Workspace Пользовательский поиск Native Client GFS Nexus OpenSocial Pixel Play Public DNS Stadia TV Fuchsia
Инструменты разработки	Android Studio Dart Gadgets API GData Go Googlebot Guice GWS Highly Open Participation Contest KML MapReduce Mediabot Pinyin SketchUp Ruby Sitemaps index Summer of Code AtGoogleTalks Web Toolkit Google Website Optimizer
Публикация	Alerts Blogger Bookmarks Документы FeedBurner Library Project Map Maker Sites YouTube Диск Фото Keep
Поиск (PageRank)	Appliance Audio Books Images Maps Mars Moon Ocean Sky Street View News Patents Покупки Scholar Usenet Video Web
Тематические проекты	ARCore Imagen Finance Google Glass Беспилотный автомобиль Google Loon Проект Tango Google Cardboard Noto Code Jam Where Is My Train Zoho CRM
Закрытые проекты	Actifio Anvato Вопросы и ответы Browser Sync Base Bump Buzz Checkout Click-to-call Code Desktop Dodgeball Gears GOOG-411 Flutter Health iGoogle Image Labeler Jaiku Knol Labs Lively Makani Technologies LLC Mashup Editor Notebook Orkut Pack Page Creator Picnik Reader SearchWiki Updater Video Marketplace Wave Web Accelerator Wildfire Interactive Google Play Music Quest Visual Urban Engines
См. также	Gemini История Поглощения Службы и проекты Google Логотип Doodle Цензура Ara Arts & Culture Calico Current Earth Outreach Foundation (Google.org) Google China Googleplex Google X Lunar X Prize I/O WiFi Zeitgeist «Бомбы» Гуглизация Dinosaur Game Контент-ферма

LaMDA

История

Первая генерация

Вторая генерация

Заявления о сознательности

Bard

Метод

Примечания

Ссылки

Категории