Репозиторий информации
Репозиторий информации (англ. information repository, репозиторий) в информационных технологиях — это «централизованное место, в котором агрегированные данные хранятся и поддерживаются в организованном виде, обычно на компьютерных носителях данных»[1]. Это «может быть как просто агрегированное размещение данных в одном доступном месте хранения, так и означать наличие средств для избирательного извлечения данных»[1].
Универсальная цифровая библиотека
В 2012 году концепция универсальной цифровой библиотеки была охарактеризована как «находящаяся в пределах досягаемости» в одной из директив Европейского союза по авторскому праву[2], в которой рассказывалось о попытках компании Google осуществить «массовое оцифровывание» так называемых «осиротевших произведений» (то есть устаревших авторских работ, находящихся под авторским правом, но без конкретного правообладателя).
Бюро по авторским правам США и законодательство Европейского союза об авторском праве работают над этим вопросом. Google достигла соглашений во Франции, предусматривающих возможность выбора издателем, какие произведения могут быть оцифрованы или продаваться. В то же время Google пыталась добиться в США разрешения по принципу «свободного оцифровывания и продажи любых произведений, если правообладатель явно не отказался», однако пока этого достичь не удалось[3].
Попытки разработки так называемого репозитория информации предпринимались в течение десятилетий:
- В 1989 году корпорация IBM пыталась объединить мейнфреймы и ПК с помощью OfficeVision, чтобы создать «репозиторий информации»[4].
- В 2003 году компания Microsoft представила OneNote как расширение к Microsoft Office 2003, позиционируя его как инструмент для создания «персонального репозитория информации»[5].
- В 1996 году основанная в 1898 году библиотека получила дополнительное финансирование для расширения своих задач и превращения в важный «локальный ресурс-центр и региональный репозиторий информации»[6]. The New York Times описывает её как вторую по величине в регионе Нью-Йорка (уступая только публичной библиотеке Нью-Йорка на Пятой авеню). Среди сервисов фигурирует «компьютерный информационный центр, обслуживающий внешние запросы».
Федеративный репозиторий информации
Федеративный репозиторий информации — это способ внедрения вторичного уровня хранения данных, который может включать в себя множество сетевых технологий хранения, функционирующих под управлением различных операционных систем. В таких репозиториях данные, которые более не требуется держать на основном хранилище, защищаются, классифицируются на основе захваченных метаданных, обрабатываются, дублируются и автоматически очищаются на основе заданных сервисных политик и требований[7].
Федеративные репозитории информации были разработаны для решения проблем, связанных с разрастанием данных, и устранения необходимости разворачивать отдельные решения для хранения данных при наличии разнородных технологий и операционных систем. Они обеспечивают централизованное управление всеми ресурсами хранения. Репозитории автономны, поддерживают разнородные ресурсы хранения, позволяют управлять ресурсами: добавлять, обслуживать, утилизировать и удалять носители, отслеживать офлайн-носители и работать независимо.
Поскольку одна из главных целей внедрения федеративного репозитория информации — снижение нагрузки на ИТ-персонал по сравнению с традиционными системами хранения, такие репозитории построены с расчётом на автоматизацию. Автоматизация осуществляется через политики, позволяющие обрабатывать данные в зависимости от времени, событий, возраста и содержания данных. Политики позволяют:
- управлять свободным местом в файловых системах,
- устранять нерелевантные данные (mp3-файлы, игры и прочее),
- управлять ресурсами вторичного хранения.
Обработка данных происходит в зависимости от типа носителя, пула хранения и используемой технологии хранения.
Поскольку федеративные репозитории информации предназначены для сокращения трудозатрат ИТ-специалистов, они разрабатываются так, чтобы быть простыми во внедрении и иметь гибкие возможности конфигурации, практически неограниченную масштабируемость, избыточность и устойчивое автоматическое восстановление.
Федеративные репозитории информации поддерживают развитые клиентские средства поиска и восстановления данных, которые с учётом разрешений предоставляют пользователям возможность осуществлять поиск по репозиторию, просматривать его содержимое (включая данные на офлайн-носителях) и восстанавливать отдельные или множественные файлы как на свой сетевой компьютер, так и на другие машины сети.