Релевантность
Релева́нтность (от англ. relevant — существенный, уместный[1]) в информационной науке и информационном поиске означает степень соответствия найденного документа или набора документов информационным нуждам пользователя (Релевантность, Relevance).
Профессор Тефко Сарацевич отмечает тесную связь данной концепции с базовыми понятиями когнитивной теории релевантности, разработанной Дэном Спербером и Дейдрой Уилсон, и таким разделом математики, как релевантная логика.
Большой практический интерес к алгоритмам автоматической оценки релевантности связан с их использованием при ранжировании в поисковых системах.
Релевантность — это обозначение субъективной степени соответствия чего-либо в моменте[2] времени[3][4].
Определение подразумевает:
- Обозначение степени — исходит от субъективности конкретного наблюдателя или группы наблюдателей.
- Подразумеваемое понятие[5] «чего-либо» — отсылка на любой вид информации или объекта, субъекта или процесса в онлайн-офлайн пространстве.
- Степень релевантности — это значимость в моменте времени, как правило, максимальный уровень адекватности[6], соответствия[7], необходимости[8], применимости[9] с точки зрения наблюдателя.
Концепция релевантности[10][11] — это субъективная значимость соответствия чего-либо в мере восприятия наблюдателя на данный момент времени.
Концепция включает в себя соотношение между А (или количеством А) и Б (или количеством Б) а также свойством — С (или свойствами — С).
Части (А) и (Б) могут быть материальными и нематериальными или комбинациями того и другого.
Примерами материальных составляющих являются — документы, механизмы, процессы и т. д.
Примерами нематериальных составляющих являются — понятия, информация и т. д.
Комбинациями того и другого — задача, ситуация, обязанности и т. д.
Свойства С такие как утилитарность, адекватность, полезность устанавливают контекст или основу соответствия между А и Б.
Соотношение между А и Б считается релевантным по свойствам С, где свойства С субъективны и могут быть очевидными и неочевидными, сформулированными и подразумеваемыми, рациональными или нерациональными в моменте времени.
История
Первое упоминание термина релевантность было в 1733 году[12][13].
Первое применение термина в контексте анализа значимости соответствия чего-либо было дано в 1854 году работой Джеймс Фредерик Феррьер[14].
В 60-х годах ХХ столетия термин стал «модным» словом, применяемым в дискуссиях на социально значимые вопросы для электората[15].
Первые теории анализа степеней соответствия берут своё начало из эпистемологии — раздела философии, который изучает такие вопросы:
Концепция релевантности, раскрываемая в эпистемологии, послужила фундаментом в развитии ряда научных областей, например: когнитология, логика, информационные науки.
В информационной науке концепция релевантности формально была представлена в 1958 году работой Brian Campbell Vickery тематического анализа для поиска информации[16] и послужила в качестве ориентира последующих исследований концепции в области информационного поиска.
В настоящее время каждый пользователь интернета по мере собственного восприятия обозначает степень релевантности информационного контента в соответствии с собственными интересами. Концепция релевантности в сети затрагивает каждого интернет-пользователя, а степень значимости информации наиболее широко анализируема в период развития информационных технологий.
Исследования
Кластер информационных наук включает в себя множество разных областей, таких как:
Практики (Information scientist) исследуют аспекты релевантности в рамках взаимодействия пользователей и организаций с информационными системами для определения параметров, используемых в методах обозначения мер соответствия информации.
В информационной науке релевантность подразумевает соотношение и меру соответствия[17]. Как правило, понятие означает меру информации, передаваемой документом относительно запроса пользователя.
Критерии релевантности используются для количественной оценки отдельных явлений. Например, когда пользователь оценивает полезность, важность, уместность документа или представление документа к требуемой информации запросу, задаче, ситуации и т. д.
Информационные технологии изменили то, как большинство пользователей получают, организовывают, сохраняют, накапливают, анализируют информацию. В любом взаимодействии с ИТ понятие релевантность играет основополагающую роль, но в то же время не имеет однозначного определения, поскольку субъективная мера соответствия не имеет окончательного измерения[18].
Любые поисковые алгоритмы, как и все существующие информационные системы, с разным уровнем успеха пытаются приблизиться к понятию абсолютной релевантности.
Ключевое отличие области информационного поиска (ИП) от теории информации или библиотековедения, это причастность спецификаций, предназначенных для поиска. В области (ИП) концепция релевантности считается основополагающей, на основе которой конструируется индексация и информационно-поисковые системы[19] (ИПС).
Концепция[20] релевантность в (ИПС), представляет собой соотношение между компонентами из групп (А) и (Б), по соответствию (Е) в определённый момент времени, где (А) и (Б) подразумевают виды, а (Е) значимость релевантности.
Компонентом (А) может быть, i) документ который будет получен пользователем поисковой системой (ИПС) или ii) представление документа, в виде ключевых слов, фраз или предложений, либо iii) информация, передаваемая чтением полученного документа.
Компонентом (Б) может быть, i) задача перед пользователем, которая требует информацию для решения или ii) необходимая информация, в понимании пользователя представляющая саму задачу, либо iii) запрос, в виде слов, фраз или предложений для извлечения информации.
(Е) полагает меру соответствия, то есть оценку одного или нескольких людей и время вынесенного решения.
«Интеллектуальная индексация информации — это сама специфика поиска, прикладные поисковые методики, механизмы, формулы и системы для операций поиска[21] — Calvin Mooers».
Системы информационного поиска сконструированы для извлечения релевантной информации по запросу пользователя. В критерии поиска, как правило, используются два основных показателя recall — полнота и precision — точность. В совокупности они обозначают значимость соответствия данного запроса, что и является понятием релевантности[22].
Критерий (пертинентность) эффективности информационно-поисковых систем измеряет вероятность соответствия между релевантностью, извлекаемой системой (формальная релевантность), и субъективной релевантностью данного пользователя (содержательная релевантность)[23].
Существует несколько подходов к оценке релевантности. Содержательная релевантность — соответствие ответов информационному запросу, определяемое неформальным путём. Формальная релевантность — соответствие, определяемое путём сравнения образа поискового запроса с поисковым образом ответа по определённому алгоритму.
Одним из распространённых методов для оценки релевантности является TF-IDF-метод. Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть, чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного ответа по отношению к термину — то есть ответ будет выдаваться раньше в результатах поиска по данному термину. Автор метода — Джерард Солтон (англ. Gerard Salton), в дальнейшем доработан Карен Спарк Джонс.
Согласно теории релевантности, восприятие информации соответствует чему-либо (имеет релевантность) тогда и только тогда, когда её переработка даёт какие-либо положительные когнитивные эффекты[24][25].
Когнитивистика исследует эффекты и свойства человеческого познания и интеллекта. В развитии познания поиск релевантности является основным из процессов человеческого мышления[26].
В 1986 году Дэн Спербер и Дейдра Уилсон, авторы теории релевантности, в работе «Принципы релевантности»[27] обозначили центральное значение релевантности в любых суждениях и коммуникациях. Также авторы отмечали, что процессы интуитивного мышления, связанные с соотношением физических предметов, выходят за рамки исследования теории релевантности.
В 1990 году исследования Gorayska-Lindsay показали, что теория релевантности также решает вопросы в соотношениях физических предметов. Ключевая идея в их решении в том, что релевантность имеет целенаправленность[28]. Где (А) релевантный элемент для (Б), если (Б) является целью, и (А) необходим в достижении (Б).
«Луна сделана из сыра. Таким образом, в настоящее время в Эквадоре либо идёт дождь, либо нет».
В соответствии с правилами классической логики вывод построен правильно, но с точки зрения релевантной логики причастное предположение никак не связано с выводом[29].
Релевантность в области логики исследуется в дедуктивных[30] умозаключениях, отвергая предшествующего, не имеющего отношения к следствию.
Методы релевантной логики основаны на принципе исключения нерелевантных предположений в исследовании и выстраивании логических выводов[31].
Наиболее[32] цитируемые работы анализа и критики релевантной логики: «Entailment, Vol. 1, 2: The Logic of Relevance and Necessity»[33]
Множество систем логической релевантности затрагивают такие области как:
- Семантика и философия («Relevance Logic: A Philosophical Interpretation. 1st Edition»[34], Edwin David Mares, «Ternary Relations and Relevant Semantics»[35], Bob Meyer (logician)),
- Информационный поиск («Logical Models in Information Retrieval»[36] Mounia Lalmas, «Information Retrieval, Imaging and Probabilistic Logic»[37] Fabrizio Sebastiani),
- Искусственный интеллект («The Relevance of Relevance»[38] Devika Subramanian, Russell Greiner, & Judea Pearl).
Теория релевантности исследуется во множестве разных наук и с 2010 стала одной из основных[39] в областях прагматики, лингвистики, искусственного интеллекта, когнитивной психологии и т. д.
Примеры
Используя информационные технологии сети, пользователь в мере своего восприятия обозначает степень релевантности контента. С другой стороны, релевантность контента пользователя обозначает статус личности в онлайн-офлайн пространстве.
В процессе поиска, анализа или мониторинга информации (Поисковая система, Экспертная система, Content curation и т. д.) в соответствии со своими интересами, пользователи обозначают степень релевантности контента. Используя возможности систем в виде подписок, «Нравитсяов», просмотров публикаций, пользователи обозначают релевантность авторов контента (Reputation system, Social network analysis software и т. д.).
С другой стороны, пользователь, публикуя контент (Социальные медиа), в процессе мгновенной обратной связи в виде релевантных комментариев (Система мгновенного обмена сообщениями, Микроблогинг, Эмотикон и т. д.), приобретает значимость навыков или умений. Используя технологии (Social web, Social media marketing, Блог и т. д.), в рамках признания приобретённых навыков, продвижения или маркетинга своего контента, формирует свой статус релевантности (Индивидуальный бренд) в онлайн-офлайн пространстве.
В юриспруденции, в частности в сфере западного законодательства, «релевантность» согласно правилу Fed Rule[40] 401 Федерального Законодательства Доказательств США имеет следующее определение: «прилагающее доказательство имеет тенденцию делать какой-либо существующий факт дела представленным следствием более вероятным или менее вероятным, нежели это было бы без доказательства».
Правило Fed Rule 402[41] допускает прилагающее доказательство, только если оно имеет релевантность. С другой стороны понятие вероятность в определении релевантности имеет неоднозначное значение[42].
В значении существует и принцип логического исчисления математической вероятности, и принцип правдоподобия[43].
Существование в законодательстве однозначного правила релевантности доказательств и отсутствие однозначного понятия вероятности ярко обозначают важность концепции релевантности в области юриспруденции.
Экономист Джон Мейнард Кейнс, теории которого являются основополагающими в современной макроэкономике, считал важным определять понятие релевантности в рамках задач с вычислением экономического риска. Кейнс предлагал измерять релевантность по принципу того, какие изменения вносит информация в анализ вероятности будущего события.
Экономист Людвиг фон Мизес, известеный по своим работам в области праксиологии и анализе индивидуального выбора и действия, применял термин релевантность в рамках экономических действий. В частности он считал, что «действие требует понимания релевантности прошлых действий для принятия следующих[44]». И предполагал, что релевантность определяется, прежде всего, по степени полезности[45], где полезность информации оценивается на основе субъективного суждения[46].
С точки зрения бухгалтерии релевантна та информация, которая в рамках анализа финансового учёта, прежде всего, необходима и влияет на решения пользователя[47].
В сфере экономики понятие релевантность, как правило, обозначает информацию, связанную с принятием наиболее эффективного решения.
Концепция релевантности имеет широкое применение в разных областях, таких как:
а также в различнных секторах услуг:
- реклама[48],
- консалтинг[49] и т. д.
См. также
Примечания
Литература
- Relevance Theory: Applications and Implications / Carston R., Uchida S.. — John Benjamins Publishing, 1998. — 312 с. — (Pragmatics & Beyond; new ser. 37). — ISBN 90-272-5049-9.
- Jodłowiec M. The Challenges of Explicit and Implicit Communication: A Relevance-Theoretic Approach. — Peter Lang, 2015. — 192 с. — (Text - Meaning - Context: Cracow Studies in English Language, Literature and Culture. Volume 11). — ISBN 978-3-631-65867-3.
- Tefko Saracevic. Relevance: A Review of and a Framework for the Thinking on the Notion of Information Science (англ.) // Journal of American Society for Information Science. — 1975. — November, December (no. 26 (6)). — P. 321—343.
- Tefko Saracevic. Relevance: A Review of the Literature and a Framework for Thinking on the Notion in Information Science. Part II (англ.) // Advances in Librarianship. — 2006. — No. 30. — P. 3—71.
- Tefko Saracevic. Relevance: A Review of the Literature and a Framework for Thinking on the Notion in Information Science. Part II: Nature and Manifestations of Relevance (англ.) // Journal of American Society for Information Science and Technology. — 2007. — November (no. 58 (13)). — P. 1915—1933. — doi:10.1002/asi.20682.
- Tefko Saracevic. Relevance: A Review of the Literature and a Framework for Thinking on the Notion in Information Science. Part III: Behavior and Effects of Relevance (англ.) // Journal of American Society for Information Science and Technology. — 2007. — November (no. 58 (13)). — P. 2126—2144. — doi:10.1002/asi.20681.
- Tefko Saracevic. Research on relevance in information science: A historical perspective (англ.) // ASIS&T. — 2012. — P. 49—60.
- Diane H. Sonnenwald. Theory Development in the Information Sciences. — University of Texas Press, 2016. — 303 с. — ISBN 9781477308264.
- Sperber D., Wilson D. Relevance: Communication and Cognition. — 2nd Edition. — Wiley, 1996. — 338 с. — ISBN 978-0631198789.
- Sperber D., Wilson D. Meaning and Relevance. — Cambridge University Press, 2012. — 382 с. — ISBN 978-0521766777.
- Pilkington A. CurrentPoetic Effects: A relevance theory perspective. — John Benjamins Publishing, 2000. — 228 с. — (Pragmatics & Beyond; new ser. 75). — ISBN 90-272-5091-X.
- Tendahl M. A Hybrid Theory of Metaphor. Relevance Theory and Cognitive Linguistics. — Palgrave Macmillan, 2009. — 282 с. — ISBN 978-0-230-22793-4.
- Current Issues in Relevance Theory / Rouchota V., Jucker A. H.. — John Benjamins Publishing, 1998. — 378 с. — (Pragmatics & Beyond; new ser. 58). — ISBN 90-272-5072-3.
- Ludwig von Mises, Human Action: The Scholar’s Edition 1998, Mises.org
- Saracevic, Tefko, Introduction to information science, R. R. Bowker Co; 1st edition (1970), ISBN 978-0835203135.
- Barbara Gorayska, Cognition and Technology: Co-Existence, Convergence and Co-Evolution. 2010 Benjamins Publishing Co.
- Alan R Anderson and Nuel D Belknap, Entailment, Vol. 1, 2: The Logic of Relevance and Necessity, Princeton University Press, Jan, 1976.
- Edwin David Mares, Relevance Logic: A Philosophical Interpretation 1st Edition. Cambridge University Press.
- Hjørland, Birger (2000). Relevance Research: The Missing Perspectives: «Non-relevance» and «Epistemological Relevance». Journal of the American Society for Information Science, 51(2), 209—211.
- Hjørland, Birger (2001). Towards a theory of aboutness, subject, topicality, theme, domain, field, content. . . and relevance. Journal of the American Society for Information Science and Technology. 52(9),774-778.
- Hjørland, Birger (2002), Epistemology and the Socio-Cognitive Perspective in Information Science. Journal of the American Society for Information Science and Technology, 53(4), 257—270.
- Hjørland, B. (2010). The foundation of the concept of relevance. Journal of the American Society for Information Science and Technology, 61(2), 217—237.
- Hjørland, Birger & Sejer Christensen, F. (2002). Work tasks and socio-cognitive relevance. A specific Example. Journal of the American Society for Information Science and Technology, 53(11), 960—965.
- Millstone, E. & Crouch, D. (1986). The social relevance of science and technology education. An annotated bibliographic guide. UNESCO. (ED.86/WS.24) Link.
- Gorayska B. & R. O. Lindsay (1993). The Roots of Relevance. Journal of Pragmatics 19, 301—323. Los Alamitos: IEEE Computer Society Press.
- Lindsay, R. & Gorayska, B. (2002) Relevance, Goals and Cognitive Technology. International Journal of Cognitive Technology, 1, (2), 187—232
- Sperber, D. & D. Wilson (1986/1995) Relevance: Communication and Cognition. 2nd edition. Oxford: Blackwell.
- Sperber, D. & D. Wilson (1987). Précis of Relevance: Communication and Cognition. Behavioral and Brain Science, 10, 697—754.
- Sperber, D. & D. Wilson (2004). Relevance Theory. In Horn, L.R. & Ward, G. (eds.) 2004 The Handbook of Pragmatics. Oxford: Blackwell, 607—632. http://www.dan.sperber.fr/?p=93
- Saracevic, Tefko, PhD, Rutgers University, School of Communication and Information, Tefko Saracevic — Google Scholar Citations.
- Diane H. Sonnenwald ResearchGate.net, [1], [2].
- Stefano Mizzaro Publications by Stefano Mizzaro.
- Barbara Gorayska, Goodreads.com.
- Mounia Lamlas, MSc PhD, University of Glasgow.
- Edwin David Mares PhD, ResearchGate.net.
- Fabrizio Sebastiani, Fabrizio Sebastiani: Publications.
- Robert K. Meyer, Philpapers.org.
- Russell Greiner, ACM Digital Library.org.
- Методы информационного поиска и ранжирования документов в компьютерных сетях (рус.)
- Исследование и разработка моделей и методов поиска информационных образовательных ресурсов в электронной библиотеке (рус.)
- Обобщенная релевантная логика и модели рассуждений (рус.)
- Повышение релевантности периодического тематического поиска информации в Web (рус.)
- Причинно-следственные связи на разных уровнях языка (рус.)
- Методы автоматического поиска релевантной информации в тексте на естественном языке (рус.)