Пересечение ковариаций

Пересече́ние ковариа́ций — это алгоритм объединения двух или более оценок состояния в фильтре Калмана при неизвестной корреляции между ними[1][2][3][4].

Формулировка

Известны информационные элементы a и b, которые требуется объединить в элемент информации c. Известно, что у a и b есть математические ожидания и ковариации , и , , однако их перекрёстная корреляция неизвестна. Алгоритм пересечения ковариаций рассчитывает математическое ожидание и ковариацию для c следующим образом:

Здесь ω вычисляется так, чтобы минимизировать выбранную норму, например, след или логарифм определителя. Для более высоких размерностей требуется решение задачи оптимизации, однако для низких размерностей существуют аналитические решения[5].

Применение

Метод пересечения ковариаций может использоваться вместо обычных уравнений обновления фильтра Калмана, чтобы гарантировать консервативность результирующей оценки вне зависимости от корреляции между двумя оценками. При этом ковариация строго не увеличивается согласно выбранной мере. Использование фиксированной меры необходимо для строгости, чтобы последовательность обновлений не приводила к росту фильтрованной ковариации[6].

Алгоритм нашёл широкое применение в робототехнике и распределённых сенсорных сетях для слияния данных. Он используется для объединения оценок состояния, полученных от разных узлов сети, степень корреляции между которыми неизвестна[7]. В частности, метод и его вариации применяются в задачах кооперативной локализации для групп автономных транспортных средств или роботов[8].

С развитием глубокого обучения пересечение ковариаций стали использовать для повышения точности и стабильности прогнозов. Метод применяется для слияния результатов, полученных от различных архитектур нейронных сетей, таких как LSTM и GRU, что позволяет создать более надёжную итоговую оценку[9].

В 2024 году был представлен подход, расширяющий один из вариантов метода — обратное пересечение ковариаций (ICI) — на отслеживание движущихся 3D-объектов с использованием кватернионов. Этот распределённый алгоритм позволяет каждому узлу сети обновлять оценку состояния объекта в трёхмерном пространстве, опираясь только на локальную информацию и данные от соседних узлов, что делает его устойчивым к изменениям в топологии сети[10].

Преимущества

Согласно обзорам[11][12], пересечение ковариаций обладает следующими преимуществами:

  1. Полностью избегается необходимость идентификации и расчёта перекрёстных ковариаций.
  2. Получается согласованная объединённая оценка, что обеспечивает недивергентность фильтра.
  3. Точность объединённой оценки превосходит каждую из локальных по отдельности.
  4. Метод даёт общий верхний предел дисперсий ошибки оценки, обладающий устойчивостью к неизвестным корреляциям.

Эти преимущества показаны, в том числе, на примере задачи SLAM, где количество ориентиров/маяков превышало миллион[13].

Недостатки и альтернативные методы

Консерватизм классического CI

Основным недостатком классического алгоритма пересечения ковариаций (CI) является его консерватизм[14]. Метод гарантирует получение согласованной (консистентной) оценки, при которой вычисленная ковариация ошибки является верхней границей для истинной ковариации[14][15]. Это позволяет избежать недооценки погрешности и расхождения фильтра.

Однако эта надёжность достигается ценой потенциальной потери точности. На практике консерватизм часто приводит к тому, что результирующая ковариация ошибки оказывается значительно завышенной, то есть итоговая оценка становится излишне «осторожной» и менее точной, чем могла бы быть[16]. Такое завышение неопределённости может также снижать скорость сходимости фильтра[14].

Именно этот компромисс между гарантированной согласованностью и потерей точности стал основной мотивацией для разработки альтернативных, менее консервативных методов слияния данных, таких как обратное и разделённое пересечение ковариаций[17].

Разделённое пересечение ковариаций (SCI)

Метод разделённого пересечения ковариаций (англ. Split Covariance Intersection, SCI) был предложен в 2013 году[18]. Он был разработан для случаев, когда ошибки объединяемых оценок содержат как независимые, так и коррелированные компоненты, поскольку в таких условиях классический CI не является оптимальным[19]. Наряду с классическим CI, метод SCI считается особенно действенным подходом к слиянию данных[20].

В 2023 году было доказано, что SCI является оптимальным правилом объединения для двух оценок при условии, что в их ошибках присутствует некоррелированный компонент[21][22]. Дальнейшее развитие метод получил в 2025 году с выходом исследования, расширяющего SCI для учёта также и коррелированных компонент ошибок. Было показано, что этот новый подход обеспечивает оптимальные границы консервативного слияния, обобщая свойство оптимальности стандартного CI на более широкий класс схем объединения[19].

Обратное пересечение ковариаций (ICI)

Метод обратного пересечения ковариаций (англ. Inverse Covariance Intersection, ICI) был представлен в 2016 году как менее консервативная альтернатива классическому CI[23]. Его основная цель — получение более точных оценок путём решения проблемы излишней «осторожности» стандартного алгоритма.

В отличие от CI, который объединяет оценки, ICI находит и исключает (вычитает) максимально возможную общую информацию, содержащуюся в объединяемых оценках. Такой подход позволяет избежать двойного учёта одних и тех же данных, что является одной из причин консерватизма CI, и получить менее «размытый» результат. Исследования показали, что для ICI могут быть ослаблены условия, необходимые для обеспечения согласованности оценки, а сам метод способен обрабатывать и другие источники корреляций, например, общий шум процесса.

Ключевым исследованием, подробно рассматривающим свойства алгоритма, стала работа Б. Ноака, Й. Сейса и У. Д. Ханебека, представленная в 2017 году. В дальнейшем метод получил развитие: в 2024 году был предложен подход, расширяющий ICI на отслеживание движущихся 3D-объектов с использованием кватернионов. Этот распределённый алгоритм позволяет каждому узлу сети обновлять оценку, опираясь только на локальную информацию и данные от соседей, что делает его устойчивым к изменениям в топологии сети.

Обобщённое обратное пересечение ковариаций (GICI)

Метод обобщённого обратного пересечения ковариаций (англ. Generalized Inverse Covariance Intersection, GICI) был предложен в 2019 году как развитие метода обратного пересечения ковариаций (ICI) для применения в нелинейных системах[24]. Цель GICI — вычислить и исключить (вычесть) общую информацию, содержащуюся в объединяемых оценках, чтобы избежать двойного учёта данных и получить менее консервативный (более точный) результат по сравнению с классическим CI[24].

В 2022 году метод был расширен для слияния данных от множества источников (оценок)[25][26]. Для этого исследователи объединили два ранее существовавших подхода: GICI для двух узлов и ICI для нескольких датчиков. Моделирование показало, что такой подход обеспечивает более точные результаты по сравнению с «наивным» слиянием, при котором общая информация между узлами игнорируется[25].

Другие разработки

Помимо основных альтернатив, исследования развивались и в других направлениях, направленных на повышение точности, снижение вычислительной сложности и адаптацию метода к специфическим задачам.

  • Обобщение для частично коррелированных данных. В 2018 году был предложен модифицированный алгоритм CI для случаев, когда известны границы коэффициента корреляции между ошибками оценок. Этот подход позволяет получить более точный результат по сравнению с классическим CI, который предполагает полное незнание корреляций[27].
  • Быстрые алгоритмы (FCI). Поскольку стандартный CI требует решения задачи оптимизации, что может быть вычислительно затратно, были разработаны «быстрые» версии алгоритма (англ. Fast Covariance Intersection, FCI), которые находят решение без итераций. Исследования в этом направлении велись с середины 2000-х годов, примером является работа Д. Франкена и А. Хюппера 2006 года, в которой был представлен улучшенный быстрый алгоритм для распределённого слияния данных[28].
  • Специализированные фильтры. Для решения конкретных проблем были созданы специализированные фильтры на основе CI:
    • SCIKCF (англ. Sequential Consensus-based CI Kalman Correlation Filter) — разработан в 2019 году для распределённых систем с прерывистыми наблюдениями или потерями данных. Он позволяет сенсорам достигать консенсусных оценок последовательно, снижая вычислительную нагрузку[29].
    • EVCI (англ. Eigenvalue-based Covariance Intersection) — энергоэффективный алгоритм, представленный в 2019 году для беспроводных сенсорных сетей. Он использует разложение ковариационной матрицы по собственным значениям для оценки полезности данных, позволяя передавать только ту информацию, которая улучшает точность, тем самым экономя энергию[30].
  • Теоретико-игровой подход. В 2016 году был предложен подход, который формулирует задачу слияния данных как теоретико-игровую и вычисляет оптимальную оценку в минимаксном смысле. Этот метод позиционируется как менее консервативная альтернатива CI.
  • Фреймворк CLUE. В 2023 году был представлен обобщённый фреймворк под названием «Консервативный линейный несмещённый оценщик» (англ. Conservative Linear Unbiased Estimator, CLUE), который объединяет в себе различные методы слияния данных, включая CI, и рассматривает их как частные случаи более общей парадигмы.

Мотивация

Широко распространено мнение, что неизвестные корреляции встречаются во множестве задач мультисенсорного слияния данных. Пренебрежение эффектами неизвестных корреляций может привести к резкому снижению эффективности и даже к расходимости оценки. Поэтому проблема остаётся предметом научного интереса на протяжении десятилетий. Однако из-за сложности и неизвестного характера корреляций не просто создать удовлетворительную схему для слияния данных с неизвестной взаимосвязью. Игнорирование корреляций (так называемое «наивное слияние»)[31], может привести к расходимости фильтра. Для компенсации такого рода расходимости часто применяют эвристики — например, искусственно увеличивают шум системы. Однако такой подход требует значительного опыта и снижает теоретическую строгость фильтра Калмана[32].

Примечания

Категории