Babelfy

Babelfy — программный алгоритм для разрешения лексической неоднозначности текста, написанного на любом языке.

В частности, Babelfy решает задачи многоязычного разрешения неоднозначности значений слов (то есть определения правильного смысла имён существительных, глаголов, прилагательных и наречий) и связывания сущностей (то есть идентификации упоминаний энциклопедических объектов, таких как люди, компании, географические названия и прочее)[1].

Общие сведения
Babelfy
Тип Разрешение лексической неоднозначности, Связывание сущностей
Последняя версия Babelfy 1.0 (июнь 2014)
Лицензия Attribution-NonCommercial-ShareAlike 3.0 Unported
Сайт babelfy.org

Обзор

Работа Babelfy основана на многоязычной семантической сети BabelNet и включает три этапа:

  • Каждой вершине семантической сети BabelNet, будь то понятие (concept) или именованная сущность, сопоставляется семантическая подпись — набор связанных вершин. Этот шаг выполняется предварительно и лишь однажды, независимо от обрабатываемого текста.
  • Для заданного входного текста извлекаются все потенциально линкуемые фрагменты, и для каждого из них определяется список возможных значений в соответствии с семантической сетью.
  • Строится основанная на графах семантическая интерпретация всего текста: кандидатные значения извлечённых фрагментов соединяются с использованием вычисленных ранее семантических подписей. Далее выделяется плотный подграф этой структуры, после чего выбирается наиболее подходящее значение для каждого фрагмента.

В результате текст на любом из 271 языка, поддерживаемого BabelNet, аннотируется семантическими метками, которые могут частично перекрываться.

Примечания

Ссылки