Репозиторий информации


Репозиторий информации (англ. information repository, репозиторий) в информационных технологиях — это «централизованное место, в котором агрегированные данные хранятся и поддерживаются в организованном виде, обычно на компьютерных носителях данных»[1]. Это «может быть как просто агрегированное размещение данных в одном доступном месте хранения, так и означать наличие средств для избирательного извлечения данных»[1].

Универсальная цифровая библиотека

В 2012 году концепция универсальной цифровой библиотеки была охарактеризована как «находящаяся в пределах досягаемости» в одной из директив Европейского союза по авторскому праву[2], в которой рассказывалось о попытках компании Google осуществить «массовое оцифровывание» так называемых «осиротевших произведений» (то есть устаревших авторских работ, находящихся под авторским правом, но без конкретного правообладателя).

Бюро по авторским правам США и законодательство Европейского союза об авторском праве работают над этим вопросом. Google достигла соглашений во Франции, предусматривающих возможность выбора издателем, какие произведения могут быть оцифрованы или продаваться. В то же время Google пыталась добиться в США разрешения по принципу «свободного оцифровывания и продажи любых произведений, если правообладатель явно не отказался», однако пока этого достичь не удалось[3].

Репозиторий информации

Попытки разработки так называемого репозитория информации предпринимались в течение десятилетий:

  • В 1989 году корпорация IBM пыталась объединить мейнфреймы и ПК с помощью OfficeVision, чтобы создать «репозиторий информации»[4].
  • В 2003 году компания Microsoft представила OneNote как расширение к Microsoft Office 2003, позиционируя его как инструмент для создания «персонального репозитория информации»[5].
  • В 1996 году основанная в 1898 году библиотека получила дополнительное финансирование для расширения своих задач и превращения в важный «локальный ресурс-центр и региональный репозиторий информации»[6]. The New York Times описывает её как вторую по величине в регионе Нью-Йорка (уступая только публичной библиотеке Нью-Йорка на Пятой авеню). Среди сервисов фигурирует «компьютерный информационный центр, обслуживающий внешние запросы».

Федеративный репозиторий информации

Федеративный репозиторий информации — это способ внедрения вторичного уровня хранения данных, который может включать в себя множество сетевых технологий хранения, функционирующих под управлением различных операционных систем. В таких репозиториях данные, которые более не требуется держать на основном хранилище, защищаются, классифицируются на основе захваченных метаданных, обрабатываются, дублируются и автоматически очищаются на основе заданных сервисных политик и требований[7].

Федеративные репозитории информации были разработаны для решения проблем, связанных с разрастанием данных, и устранения необходимости разворачивать отдельные решения для хранения данных при наличии разнородных технологий и операционных систем. Они обеспечивают централизованное управление всеми ресурсами хранения. Репозитории автономны, поддерживают разнородные ресурсы хранения, позволяют управлять ресурсами: добавлять, обслуживать, утилизировать и удалять носители, отслеживать офлайн-носители и работать независимо.

Автоматизация управления данными

Поскольку одна из главных целей внедрения федеративного репозитория информации — снижение нагрузки на ИТ-персонал по сравнению с традиционными системами хранения, такие репозитории построены с расчётом на автоматизацию. Автоматизация осуществляется через политики, позволяющие обрабатывать данные в зависимости от времени, событий, возраста и содержания данных. Политики позволяют:

  • управлять свободным местом в файловых системах,
  • устранять нерелевантные данные (mp3-файлы, игры и прочее),
  • управлять ресурсами вторичного хранения.

Обработка данных происходит в зависимости от типа носителя, пула хранения и используемой технологии хранения.

Поскольку федеративные репозитории информации предназначены для сокращения трудозатрат ИТ-специалистов, они разрабатываются так, чтобы быть простыми во внедрении и иметь гибкие возможности конфигурации, практически неограниченную масштабируемость, избыточность и устойчивое автоматическое восстановление.

Восстановление данных

Федеративные репозитории информации поддерживают развитые клиентские средства поиска и восстановления данных, которые с учётом разрешений предоставляют пользователям возможность осуществлять поиск по репозиторию, просматривать его содержимое (включая данные на офлайн-носителях) и восстанавливать отдельные или множественные файлы как на свой сетевой компьютер, так и на другие машины сети.

Примечания