OpenSubtitles
OpenSubtitles — стартап, основанный в 2005 году его владельцем, известным под псевдонимом Brano, и специализирующийся на агрегировании субтитров для аудиовизуальных произведений.
В 2022 году OpenSubtitles входил в число 5000 самых посещаемых сайтов в интернете[1].
Общие сведения
| OpenSubtitles | |
|---|---|
| OpenSubtitles | |
| URL | opensubtitles.org |
| Коммерческий | нет |
| Тип сайта | агрегатор субтитров |
| Регистрация | необязательная |
| Язык (-и) | английский |
| Посещаемость | 7,3 млн визитов в месяц (сентябрь 2025) |
| Язык программирования | PHP |
| Расположение сервера | Словакия |
| Владелец | OpenSubtitles Group Limited |
| Автор | Brano |
| Начало работы | 2005 |
| Текущий статус | активен |
| Слоган | делай как можно проще |
История
OpenSubtitles был создан в 2005 году словацким разработчиком по имени Brano[2]. Название было выбрано, чтобы подчеркнуть открытый характер контента, так как страницы сайта были доступны в формате XML для обработки данных[2].
В 2018 году Федеральный суд Австралии вынес постановление о блокировке 181 сайта, связанных с онлайн-пиратством, включая OpenSubtitles. Иск был подан такими компаниями, как Village Roadshow, Disney, Twentieth Century Fox, Paramount Pictures, Columbia Pictures, Universal Pictures и Warner Bros.[3]. В конце 2019 года сайт столкнулся с новыми юридическими проблемами, которые привели к блокировке доступа для пользователей из Дании. В ответ на обращение датской антипиратской группы RettighedsAlliancen, добившейся судебного запрета, администрация OpenSubtitles добровольно заблокировала доступ для датских IP-адресов[4]. Одной из причин стала связь ресурса с пиратским сервисом Popcorn Time, для которого OpenSubtitles долгое время являлся поставщиком субтитров[5]. Хотя блокировка была локализована для Дании, она затронула и пользователей в других скандинавских странах из-за общих интернет-провайдеров, таких как Telia и Telenor[6].
В августе 2021 года OpenSubtitles подвергся хакерской атаке. Злоумышленник, воспользовавшись слабым паролем администратора и уязвимостью, позволившей осуществить SQL-инъекцию, получил персональные данные почти 7 млн пользователей[7]. Утечка включала имена, IP-адреса, адреса электронной почты и пароли, хешированные с помощью устаревшего алгоритма MD5[8]. Хакер потребовал выкуп в биткойнах. Несмотря на то, что администрация заплатила выкуп за неразглашение данных и помощь в устранении уязвимости, база была слита в сеть 18 января 2022 года[9][10]. После инцидента компания ввела новые политики безопасности, включая обязательный сброс паролей для всех пользователей[7].
Функциональность
По состоянию на 2025 год, OpenSubtitles предоставляет доступ к своей базе данных через современный REST API, который пришёл на смену устаревшей системе на базе XML-RPC[11]. Взаимодействие с API происходит с использованием формата JSON[12], а формат XML больше не поддерживается[13]. Поиск субтитров возможен по различным параметрам, включая идентификаторы IMDb и TMDB, названию произведения или хешу видеофайла[12].
Для интеграции со сторонними приложениями используется двухуровневая система аутентификации: статический ключ приложения (Api-Key) и временный JWT-токен пользователя[14]. API позволяет выполнять поиск, скачивание и загрузку субтитров[11]. Количество скачиваний ограничено и зависит от статуса пользователя: анонимные пользователи могут скачивать до 5 файлов в сутки, зарегистрированные — от 20, а VIP-пользователи — до 1000[14]. С 1 января 2024 года доступ к старому API (XML-RPC) был сохранён только для VIP-пользователей в рамках стратегии перехода на новый REST API на домене OpenSubtitles.com[15][16].
Взаимодействие с OpenSubtitles для контента, полученного через BitTorrent-клиенты, происходит преимущественно опосредованно, через плагины для медиацентров и специализированные программы[17].
- Медиацентры: Jellyfin[18] (через официальный плагин) и Stremio[19] (через аддон «OpenSubtitles v3») автоматически находят и загружают субтитры для файлов в медиатеке и, по состоянию на май 2026 года, поддерживают работу с новым API OpenSubtitles.com[20].
- Специализированные программы: Приложения, такие как Bazarr или SubDownloader, интегрируются с менеджерами загрузок (например, Sonarr и Radarr) для автоматического поиска субтитров к скачанному контенту. При этом Bazarr полностью поддерживает новый API OpenSubtitles.com[21].
- Медиаплееры: Многие плееры, включая VLC и Media Player Classic, имеют встроенную функцию поиска субтитров на OpenSubtitles[22].
Скачивание (выгрузка) субтитров возможно как вручную через официальный сайт, так и автоматически через API[15]. Файлы по умолчанию предоставляются в формате SRT с кодировкой UTF-8[14].
Загрузка новых субтитров централизована через старую версию сайта (opensubtitles.org) или с помощью официального приложения «OpenSubtitles Uploader»[23]. Кроме того, сервис AI.OpenSubtitles.com позволяет генерировать и переводить субтитры с помощью искусственного интеллекта[24].
Система пользовательских уровней поощряет вклад в развитие платформы: зарегистрированные пользователи получают более высокие лимиты на скачивание в зависимости от количества загруженных ими субтитров. VIP-статус, приобретаемый за плату, предоставляет максимальные лимиты, отключает рекламу и даёт расширенный доступ к API[15].
Аудитория и посещаемость
По состоянию на сентябрь 2025 года ежемесячная посещаемость основных доменов проекта распределялась следующим образом: сайт opensubtitles.org зафиксировал 7,3 миллиона визитов, в то время как данные по opensubtitles.com разнятся — 6,26 миллиона визитов по оценке Semrush[25] и 4,5 миллиона по данным Similarweb. Основная аудитория сайта opensubtitles.org состоит из мужчин (70,22 %), а самая многочисленная возрастная группа — от 25 до 34 лет.
База данных сайта постоянно растёт. К 2018 году она насчитывала 3,7 миллиона файлов субтитров и охватывала 69 % идентификаторов IMDb, для которых имелись субтитры как минимум на двух языках[26].
Использование данных для обучения ИИ
Обширная база данных OpenSubtitles, содержащая диалоги из десятков тысяч фильмов и сериалов, стала ценным ресурсом для обучения крупных языковых моделей (LLM)[27]. Эта практика получила широкую огласку в 2024—2025 годах после расследования, показавшего, что данные с сайта использовались технологическими компаниями без разрешения правообладателей[28].
Данные OpenSubtitles были включены в состав крупного обучающего набора данных «The Pile», выпущенного в 2020 году[29]. Среди компаний, использовавших этот датасет для тренировки своих ИИ-моделей, упоминались Apple, Meta, Nvidia, Salesforce, Bloomberg и Anthropic[27]. Использование разговорной речи из субтитров позволяет моделям лучше имитировать естественное человеческое общение[27]. Помимо коммерческого применения, датасет OpenSubtitles давно используется в академической среде для исследований в области машинного перевода и обработки естественного языка[30]. В 2024 году был выпущен корпус данных OpenSubtitles2024 для машинного перевода, включающий 70 языков и 2022 языковые пары в тестовом наборе[31].
Использование данных OpenSubtitles для обучения коммерческих ИИ вызвало юридические и этические споры. Поскольку субтитры считаются производными работами, их использование без разрешения и компенсации правообладателям аудиовизуальных произведений рассматривается как нарушение авторских прав[27]. Кроме того, такая практика противоречит условиям использования самого сайта OpenSubtitles.org, которые прямо запрещают коммерческое использование контента[32]. Легальность распространения пользовательских субтитров также ставится под сомнение, так как суды в некоторых юрисдикциях, например в Австралии и Нидерландах, признавали их самостоятельными объектами авторского права[28]. В 2025—2026 годах не было публичных свидетельств заключения официальных соглашений о лицензировании данных для ИИ, и использование базы оставалось неавторизованным[33].
На фоне несанкционированного использования своей базы данных, в 2023 году команда OpenSubtitles запустила собственный коммерческий сервис AI.OpenSubtitles.com. Эта платформа предлагает платные услуги по автоматической генерации и переводу субтитров с помощью различных ИИ-моделей, что является отдельным направлением развития проекта.