OpenSubtitles
OpenSubtitles — стартап, основанный в 2005 году его владельцем, известным под псевдонимом Brano[1], и специализирующийся на агрегировании субтитров для аудиовизуальных произведений.
В 2022 году OpenSubtitles входил в число 5000 самых посещаемых сайтов в интернете[2].
Что важно знать
| OpenSubtitles | |
|---|---|
| OpenSubtitles | |
| URL | opensubtitles.org |
| Коммерческий | нет |
| Тип сайта | агрегатор субтитров |
| Регистрация | необязательная |
| Язык (-и) | английский |
| Посещаемость | 7,3 млн визитов в месяц (сентябрь 2025) |
| Язык программирования | PHP |
| Расположение сервера | Словакия |
| Владелец | OpenSubtitles Group Limited |
| Автор | Brano |
| Начало работы | 2005 |
| Текущий статус | активен |
| Слоган | делай как можно проще |
История
OpenSubtitles был создан в 2005 году словацким разработчиком по имени Brano[3]. Название было выбрано, чтобы подчеркнуть открытый характер контента, так как страницы сайта были доступны в формате XML для обработки данных[3].
В 2018 году Федеральный суд Австралии вынес постановление о блокировке 181 сайта, связанных с онлайн-пиратством, включая OpenSubtitles. Иск был подан такими компаниями, как Village Roadshow, Disney, Twentieth Century Fox, Paramount Pictures, Columbia Pictures, Universal Pictures и Warner Bros.[4]. В конце 2019 года сайт столкнулся с новыми юридическими проблемами, которые привели к блокировке доступа для пользователей из Дании. В ответ на обращение датской антипиратской группы RettighedsAlliancen, добившейся судебного запрета, администрация OpenSubtitles добровольно заблокировала доступ для датских IP-адресов[5]. Одной из причин стала связь ресурса с пиратским сервисом Popcorn Time, для которого OpenSubtitles долгое время являлся поставщиком субтитров[6]. Хотя блокировка была локализована для Дании, она затронула и пользователей в других скандинавских странах из-за общих интернет-провайдеров, таких как Telia и Telenor[7].
В августе 2021 года OpenSubtitles подвергся хакерской атаке. Злоумышленник, воспользовавшись слабым паролем администратора и уязвимостью, позволившей осуществить SQL-инъекцию, получил персональные данные почти 7 млн пользователей[8]. Утечка включала имена, IP-адреса, адреса электронной почты и пароли, хешированные с помощью устаревшего алгоритма MD5[9]. Хакер потребовал выкуп в биткойнах. Несмотря на то, что администрация заплатила выкуп за неразглашение данных и помощь в устранении уязвимости, база была слита в сеть 18 января 2022 года[10][11]. После инцидента компания ввела новые политики безопасности, включая обязательный сброс паролей для всех пользователей[8].
Функциональность
По состоянию на 2025 год, OpenSubtitles предоставляет доступ к своей базе данных через современный REST API, который пришёл на смену устаревшей системе на базе XML-RPC[12]. Взаимодействие с API происходит с использованием формата JSON[13], а формат XML больше не поддерживается[14]. Поиск субтитров возможен по различным параметрам, включая идентификаторы IMDb и TMDB, названию произведения или хешу видеофайла[13].
Для интеграции со сторонними приложениями используется двухуровневая система аутентификации: статический ключ приложения (Api-Key) и временный JWT-токен пользователя[15]. API позволяет выполнять поиск, скачивание и загрузку субтитров[12]. Количество скачиваний ограничено и зависит от статуса пользователя: анонимные пользователи могут скачивать до 5 файлов в сутки, зарегистрированные — от 20, а VIP-пользователи — до 1000[15]. С начала 2024 года доступ к API для бесплатных пользователей был ограничен, что сделало регистрацию или VIP-статус обязательными для стабильной работы автоматизированных инструментов[16].
Взаимодействие с OpenSubtitles для контента, полученного через BitTorrent-клиенты, происходит преимущественно опосредованно, через плагины для медиацентров и специализированные программы[17].
- Медиацентры: Jellyfin[18] и Stremio[19] имеют официальные плагины и аддоны, которые автоматически находят и загружают субтитры для файлов в медиатеке.
- Специализированные программы: Приложения, такие как Bazarr или SubDownloader, интегрируются с менеджерами загрузок (например, Sonarr и Radarr) для автоматического поиска субтитров к скачанному контенту.
- Медиаплееры: Многие плееры, включая VLC и Media Player Classic, имеют встроенную функцию поиска субтитров на OpenSubtitles[20].
Скачивание (выгрузка) субтитров возможно как вручную через официальный сайт[21], так и автоматически через API[16]. Файлы по умолчанию предоставляются в формате SRT с кодировкой UTF-8[15].
Загрузка новых субтитров централизована через старую версию сайта (opensubtitles.org)[22] или с помощью официального приложения «OpenSubtitles Uploader»[23]. Кроме того, сервис AI.OpenSubtitles.com позволяет генерировать и переводить субтитры с помощью искусственного интеллекта[24].
Система пользовательских уровней поощряет вклад в развитие платформы: зарегистрированные пользователи получают более высокие лимиты на скачивание в зависимости от количества загруженных ими субтитров. VIP-статус, приобретаемый за плату, предоставляет максимальные лимиты, отключает рекламу и даёт расширенный доступ к API[16].
Аудитория и посещаемость
По состоянию на сентябрь 2025 года ежемесячная посещаемость основных доменов проекта распределялась следующим образом: сайт opensubtitles.org зафиксировал 7,3 миллиона визитов[25], в то время как данные по opensubtitles.com разнятся — 6,26 миллиона визитов по оценке Semrush[26] и 4,5 миллиона по данным Similarweb[27]. Основная аудитория сайта opensubtitles.org состоит из мужчин (70,22 %), а самая многочисленная возрастная группа — от 25 до 34 лет[28].
База данных сайта постоянно растёт. К 2018 году она насчитывала 3,7 миллиона файлов субтитров и охватывала 69 % идентификаторов IMDb, для которых имелись субтитры как минимум на двух языках[29].
Использование данных для обучения ИИ
Обширная база данных OpenSubtitles, содержащая диалоги из десятков тысяч фильмов и сериалов, стала ценным ресурсом для обучения крупных языковых моделей (LLM)[30]. Эта практика получила широкую огласку в 2024—2025 годах после расследования, показавшего, что данные с сайта использовались технологическими компаниями без разрешения правообладателей[31].
Данные OpenSubtitles были включены в состав крупного обучающего набора данных «The Pile», выпущенного в 2020 году[32]. Среди компаний, использовавших этот датасет для тренировки своих ИИ-моделей, упоминались Apple, Meta, Nvidia, Salesforce, Bloomberg и Anthropic[30]. Использование разговорной речи из субтитров позволяет моделям лучше имитировать естественное человеческое общение[30]. Помимо коммерческого применения, датасет OpenSubtitles давно используется в академической среде для исследований в области машинного перевода и обработки естественного языка[33].
Использование данных OpenSubtitles для обучения коммерческих ИИ вызвало юридические и этические споры. Поскольку субтитры считаются производными работами, их использование без разрешения и компенсации правообладателям аудиовизуальных произведений рассматривается как нарушение авторских прав[30]. Кроме того, такая практика противоречит условиям использования самого сайта OpenSubtitles.org, которые прямо запрещают коммерческое использование контента[34]. Легальность распространения пользовательских субтитров также ставится под сомнение, так как суды в некоторых юрисдикциях, например в Австралии и Нидерландах, признавали их самостоятельными объектами авторского права[31].
На фоне несанкционированного использования своей базы данных, в 2023 году команда OpenSubtitles запустила собственный коммерческий сервис AI.OpenSubtitles.com. Эта платформа предлагает платные услуги по автоматической генерации и переводу субтитров с помощью различных ИИ-моделей, что является отдельным направлением развития проекта.


