PaLM

PaLM
PaLM
Тип	Большая языковая модель
Разработчик	Google AI
Языки интерфейса	английский
Сайт	ai.google

PaLM
PaLM
Тип	Большая языковая модель
Разработчик	Google AI
Языки интерфейса	английский
Сайт	ai.google

PaLM (Pathways Language Model) — большая языковая модель на базе трансформеров, разработанная Google AI и включающая 540 миллиардов параметров^[1]. Для исследований масштабирования также были созданы сокращённые версии PaLM с 8 и 62 миллиардами параметров.

Модель PaLM способна выполнять широкий спектр задач, включая логическое и арифметическое рассуждение, объяснение шуток, генерацию программного кода и машинный перевод^[2].^[3]^[4]^[5] При применении к PaLM техники цепочек рассуждений (chain-of-thought prompting), модель демонстрирует высокие результаты на задачах с несколькими шагами рассуждения — таких, как решение текстовых задач или вопросы, требующие логического вывода^[1].^[2]

Впервые PaLM была анонсирована в апреле 2022 года и оставалась закрытой до марта 2023 года, когда Google запустила публичный API для PaLM и других технологий^[6]. До публичного запуска API был доступен только ограниченному числу разработчиков по списку ожидания^[7].

Google совместно с DeepMind разработали медицинскую версию PaLM 540B с дообучением на медицинских данных — Med-PaLM, превзошедшую предыдущие модели по качеству ответов на медицинские вопросы^[8].^[9] Med-PaLM стала первой программой, успешно прошедшей экзамен на получение медицинской лицензии в США, а также способной корректно отвечать как на вопросы с множественным выбором, так и на открытые вопросы, обосновывать свои ответы и их самооценивать^[10].

Google также разработала PaLM-E — мультимодальную языковую модель для задач робототехники, использующую визуальные преобразования^[11].^[12] PaLM-E может выполнять робототехнические задачи без необходимости дообучения или дополнительной настройки^[13].

В мае 2023 года на ежегодной конференции Google I/O была представлена версия PaLM 2^[14]. Сообщается, что PaLM 2 — это модель с 340 миллиардами параметров, обученная на 3,6 триллиона токенов^[15].

PaLM была предварительно обучена на массиве из 780 миллиардов токенов, охватывающем широкий спектр задач обработки естественного языка и пользовательских сценариев. Этот датасет включал отфильтрованные веб-страницы, книги, статьи из Википедии, новостные публикации, исходные коды из открытых репозиториев на GitHub и диалоги из социальных сетей^[1].^[2] В основе лежит тот же датасет, что использовался для обучения модели LaMDA от компании Google^[2]

Обучение PaLM 540B было выполнено на двух TPU v4-подкластерах, каждый из которых включал 3072 чипа TPU v4 на 768 узлах — это самая крупная на момент публикации конфигурация TPU, использовавшая гибрид параллелизма по данным и модели.^[2]^[16]. Используя суммарно 6144 чипа и достигая аппаратной эффективности FLOP 57,8 %, обучение установило рекорд эффективности среди моделей такого масштаба^[3].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

Google
Председатель совета директоров: Эрик Шмидт Директор, президент по технологиям и сооснователь: Сергей Брин Главный исполнительный директор и сооснователь: Ларри Пейдж Материнская компания: Alphabet
Реклама	AdMob Adscape AdSense Advertising Professional Ads Analytics DoubleClick Insights for Search Trends Wallet Google Университет
Коммуникации	Allo Google+ Calendar Friend Connect Duo Gmail Inbox Groups Hangouts Meet Messages Panoramio Picasa Вопросы и ответы Talk Translate Voice
ПО	Chrome Chromium Chrome DevTools Earth Gadgets Goggles Now Picasa SketchUp Talk Google Assistant Find Hub Toolbar
Платформы	Account Android App Engine BigTable Chromecast Chrome OS Dialogflow Google Workspace Пользовательский поиск Native Client GFS Nexus OpenSocial Pixel Play Public DNS Stadia TV Fuchsia
Инструменты разработки	Android Studio Dart Gadgets API GData Go Googlebot Guice GWS Highly Open Participation Contest KML MapReduce Mediabot Pinyin SketchUp Ruby Sitemaps index Summer of Code AtGoogleTalks Web Toolkit Google Website Optimizer
Публикация	Alerts Blogger Bookmarks Документы FeedBurner Library Project Map Maker Sites YouTube Диск Фото Keep
Поиск (PageRank)	Appliance Audio Books Images Maps Mars Moon Ocean Sky Street View News Patents Покупки Scholar Usenet Video Web
Тематические проекты	ARCore Imagen Finance Google Glass Беспилотный автомобиль Google Loon Проект Tango Google Cardboard Noto Code Jam Where Is My Train Zoho CRM
Закрытые проекты	Actifio Anvato Вопросы и ответы Browser Sync Base Bump Buzz Checkout Click-to-call Code Desktop Dodgeball Gears GOOG-411 Flutter Health iGoogle Image Labeler Jaiku Knol Labs Lively Makani Technologies LLC Mashup Editor Notebook Orkut Pack Page Creator Picnik Reader SearchWiki Updater Video Marketplace Wave Web Accelerator Wildfire Interactive Google Play Music Quest Visual Urban Engines
См. также	Gemini История Поглощения Службы и проекты Google Логотип Doodle Цензура Ara Arts & Culture Calico Current Earth Outreach Foundation (Google.org) Google China Googleplex Google X Lunar X Prize I/O WiFi Zeitgeist «Бомбы» Гуглизация Dinosaur Game Контент-ферма

Обработка естественного языка
Общие определения	Языковая модель Корпус текстов Речевой корпус Стоп-слова Мешок слов AI-полнота N-грамма Биграммный шифр Триграмма
Анализ текста	Сегментация текста Частеречная разметка Поверхностно-синтаксический анализ Обработка сложных слов Извлечение коллокаций Стемминг Лемматизация Распознавание именованных сущностей Разрешение кореферентности Анализ тональности текста Извлечение концептов Синтаксический анализ Разрешение лексической многозначности Извлечение терминологии Извлечение информации Идентификация языка Определение регистра
Реферирование	Извлечение предложений Генерация реферата Упрощение текста
Машинный перевод	Автоматизированный Гибридный Интерлингвальный На основе правил На основе примеров На основе словаря На основе трансформации Нейронный Статистический Синхронный
Идентификация и сбор данных	Распознавание речи Синтез речи Оптическое распознавание символов Генерация текста
Тематическая модель	Размещение патинко Латентное размещение Дирихле Латентно-семантический анализ
Рецензирование	Автоматизированная оценка сочинений Конкордансер Предиктивный ввод текста Система проверки грамматики Система проверки правописания Угадывание синтаксиса
Интерфейс на естественном языке	Виртуальный ассистент Виртуальный собеседник Вопросно-ответная система Голосовой интерфейс Интерактивная литература

PaLM

Функциональные особенности

Обучение

Примечания

Категории