Репозиторий информации

Репозиторий информации (англ. information repository, репозиторий) в информационных технологиях — это «централизованное место, в котором агрегированные данные хранятся и поддерживаются в организованном виде, обычно на компьютерных носителях данных»^[1]. Это «может быть как просто агрегированное размещение данных в одном доступном месте хранения, так и означать наличие средств для избирательного извлечения данных»^[1].

В 2012 году концепция универсальной цифровой библиотеки была охарактеризована как «находящаяся в пределах досягаемости» в одной из директив Европейского союза по авторскому праву^[2], в которой рассказывалось о попытках компании Google осуществить «массовое оцифровывание» так называемых «осиротевших произведений» (то есть устаревших авторских работ, находящихся под авторским правом, но без конкретного правообладателя).

Бюро по авторским правам США и законодательство Европейского союза об авторском праве работают над этим вопросом. Google достигла соглашений во Франции, предусматривающих возможность выбора издателем, какие произведения могут быть оцифрованы или продаваться. В то же время Google пыталась добиться в США разрешения по принципу «свободного оцифровывания и продажи любых произведений, если правообладатель явно не отказался», однако пока этого достичь не удалось^[3].

Репозиторий информации

Попытки разработки так называемого репозитория информации предпринимались в течение десятилетий:

В 1989 году корпорация IBM пыталась объединить мейнфреймы и ПК с помощью OfficeVision, чтобы создать «репозиторий информации»^[4].
В 2003 году компания Microsoft представила OneNote как расширение к Microsoft Office 2003, позиционируя его как инструмент для создания «персонального репозитория информации»^[5].
В 1996 году основанная в 1898 году библиотека получила дополнительное финансирование для расширения своих задач и превращения в важный «локальный ресурс-центр и региональный репозиторий информации»^[6]. The New York Times описывает её как вторую по величине в регионе Нью-Йорка (уступая только публичной библиотеке Нью-Йорка на Пятой авеню). Среди сервисов фигурирует «компьютерный информационный центр, обслуживающий внешние запросы».

Федеративный репозиторий информации — это способ внедрения вторичного уровня хранения данных, который может включать в себя множество сетевых технологий хранения, функционирующих под управлением различных операционных систем. В таких репозиториях данные, которые более не требуется держать на основном хранилище, защищаются, классифицируются на основе захваченных метаданных, обрабатываются, дублируются и автоматически очищаются на основе заданных сервисных политик и требований^[7].

Федеративные репозитории информации были разработаны для решения проблем, связанных с разрастанием данных, и устранения необходимости разворачивать отдельные решения для хранения данных при наличии разнородных технологий и операционных систем. Они обеспечивают централизованное управление всеми ресурсами хранения. Репозитории автономны, поддерживают разнородные ресурсы хранения, позволяют управлять ресурсами: добавлять, обслуживать, утилизировать и удалять носители, отслеживать офлайн-носители и работать независимо.

Автоматизация управления данными

Поскольку одна из главных целей внедрения федеративного репозитория информации — снижение нагрузки на ИТ-персонал по сравнению с традиционными системами хранения, такие репозитории построены с расчётом на автоматизацию. Автоматизация осуществляется через политики, позволяющие обрабатывать данные в зависимости от времени, событий, возраста и содержания данных. Политики позволяют:

управлять свободным местом в файловых системах,
устранять нерелевантные данные (mp3-файлы, игры и прочее),
управлять ресурсами вторичного хранения.

Обработка данных происходит в зависимости от типа носителя, пула хранения и используемой технологии хранения.

Поскольку федеративные репозитории информации предназначены для сокращения трудозатрат ИТ-специалистов, они разрабатываются так, чтобы быть простыми во внедрении и иметь гибкие возможности конфигурации, практически неограниченную масштабируемость, избыточность и устойчивое автоматическое восстановление.

Восстановление данных

Федеративные репозитории информации поддерживают развитые клиентские средства поиска и восстановления данных, которые с учётом разрешений предоставляют пользователям возможность осуществлять поиск по репозиторию, просматривать его содержимое (включая данные на офлайн-носителях) и восстанавливать отдельные или множественные файлы как на свой сетевой компьютер, так и на другие машины сети.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

Репозиторий информации

Универсальная цифровая библиотека