Спектральное разложение матрицы

Cпектральное разложение матрицы или разложение матрицы на основе собственных векторов — представление квадратной матрицы $A$ в виде произведения трёх матриц $A=V\Lambda V^{-1}$ , где $V$ — матрица, столбцы которой являются собственными векторами матрицы $A$ , $\Lambda$ — диагональная матрица с соответствующими собственными значениями на главной диагонали, $V^{-1}$ — матрица, обратная матрице $V$ .

В таком виде могут быть представлены только матрицы, обладающие полным набором собственных векторов, то есть набором из n линейно независимых собственных векторов, где n — порядок матрицы $A$ .

Спектральное разложение может использоваться для нахождения собственных значений и собственных векторов матрицы, решения систем линейных уравнений, обращения матрицы, нахождения определителя матрицы и вычисления аналитических функций от матриц.

Теория собственных векторов и собственных значений матрицы

Ненулевой вектор $\mathbf {v}$ размерности N является собственным вектором квадратной $N\times N$ матрицы $\mathbf {A}$ , если он удовлетворяет линейному уравнению

\mathbf {A} \mathbf {v} =\lambda \mathbf {v}

,

где $\lambda$ — скаляр, называемый собственным значением матрицы и соответствующий собственному вектору $\mathbf {v}$ . То есть, собственные вектора — вектора, которые линейное преобразование $\mathbf {A}$ всего лишь удлиняет или укорачивает, а собственное значение — это коэффициент изменения длины. Уравнение выше называется уравнением на собственные значения или задачей на собственные значения.

Уравнение выше может рассматриваться как однородная система линейных уравнений

(\mathbf {A} -\lambda \mathbf {E} )\,\mathbf {v} =0

,

в которой $\lambda$ — это некоторый скалярный параметр, а $\mathbf {v}$ — нетривиальное решение однородной системы линейных уравнений. Нетривиальные решения однородной системы линейных уравнений существуют только при равенстве нулю определителя матрицы системы, то есть

p\left(\lambda \right)=\det \left(\mathbf {A} -\lambda \mathbf {E} \right)=0.

Многочлен $p(\lambda )$ называется характеристическим многочленом матрицы, а уравнение выше называется характеристическим уравнением. Характеристическое уравнение является полиномиальным уравнением N-ого порядка от переменной $\lambda$ . Данное уравнение имеет $N_{\lambda }$ различных корней, где $1\leqslant N_{\lambda }\leqslant N$ . Множество решений, то есть, собственных значений, называется спектром матрицы $\mathbf {A}$ ^[1]^[2]^[3].

Разложим характеристический многочлен $p(\lambda )$ на множители:

p\left(\lambda \right)=\left(\lambda -\lambda _{1}\right)^{n_{1}}\left(\lambda -\lambda _{2}\right)^{n_{2}}\cdots \left(\lambda -\lambda _{N_{\lambda }}\right)^{n_{N_{\lambda }}}=0.

Натуральное число n_i называется алгебраической кратностью собственного значения $\lambda _{i}$ . Если поле скаляров алгебраически замкнуто, сумма алгебраических кратностей равна N:

\sum \limits _{i=1}^{N_{\lambda }}{n_{i}}=N.

Для каждого собственного значения $\lambda _{i}$ решается отдельное уравнение на собственные векторы:

\left(\mathbf {A} -\lambda _{i}\mathbf {E} \right)\mathbf {v} =0.

Имеется $1\leqslant m_{i}\leqslant n_{i}$ линейно независимых решений для каждого такого уравнения. Линейные комбинации m_i решений являются собственными векторами, связанными с собственным значением $\lambda _{i}$ . Целое число m_i называется геометрической кратностью значения $\lambda _{i}$ . Алгебраическая кратность $n_{i}$ и геометрическая кратность $m_{i}$ могут не совпадать, но всегда $m_{i}\leqslant n_{i}$ . Общее число линейно независимых собственных векторов $N_{\mathbf {v} }$ может быть вычислено путём суммирования геометрических кратностей

\sum \limits _{i=1}^{N_{\lambda }}{m_{i}}=N_{\mathbf {v} }.

Собственные векторы могут быть проиндексированы собственными значениями с помощью двойного индекса, тогда $\mathbf {v} _{ij}$ будет означать j-й собственный вектор для i-го собственного значения. В более простой индексации используется единственный индекс $\mathbf {v} _{k}$ , где $k=1,2,\dots ,N_{\mathbf {v} }$ .

Разложение матрицы с помощью собственных векторов

Пусть $\mathbf {A}$ будет квадратной $n\times n$ матрицей, имеющей n линейно независимых собственных векторов q_i ( $i=1,\dots ,n$ ). Тогда $\mathbf {A}$ можно разложить

\mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}

,

где $\mathbf {Q}$ является квадратной $n\times n$ матрицей, i-ым столбцом которой является собственный вектор $q_{i}$ матрицы $\mathbf {A}$ , а $\Lambda$ является диагональной матрицей, диагональными элементами которой являются соответствующие собственные значения, $\Lambda _{ii}=\lambda _{i}$ . Заметим, что только диагонализируемые матрицы могут быть разложены таким образом. Например, матрица сдвига $\left[{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}\right]$ не может быть диагонализирована.

Обычно собственные вектора q_i нормируют, но это не обязательно, в качестве столбцов матрицы $\mathbf {Q}$ может быть использован и ненормированный набор из n собственных векторов v_i.

Разложение может быть получено из фундаментального свойства собственных векторов:

{\begin{aligned}\mathbf {A} \mathbf {v} &=\lambda \mathbf {v} \\\mathbf {A} \mathbf {Q} &=\mathbf {Q} \mathbf {\Lambda } \\\mathbf {A} &=\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}.\end{aligned}}

Пример[править | править код]

Приведём к диагональному виду матрицу $\mathbf {A}$ размера $2\times 2$

\mathbf {A} ={\begin{bmatrix}1&0\\1&3\\\end{bmatrix}}

над полем вещественных чисел. Представим искомое разложение в виде

{\begin{bmatrix}1&0\\1&3\end{bmatrix}}={\begin{bmatrix}a&b\\c&d\end{bmatrix}}{\begin{bmatrix}x&0\\0&y\end{bmatrix}}{\begin{bmatrix}a&b\\c&d\end{bmatrix}}^{-1},

для некоторых вещественных матриц $\left[{\begin{smallmatrix}x&0\\0&y\end{smallmatrix}}\right]$ и $\mathbf {B} =\left[{\begin{smallmatrix}a&b\\c&d\end{smallmatrix}}\right].$

Умножив обе стороны равенства справа на $\mathbf {B}$ , получим:

{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a&b\\c&d\end{bmatrix}}={\begin{bmatrix}a&b\\c&d\end{bmatrix}}{\begin{bmatrix}x&0\\0&y\end{bmatrix}}.

Равенство выше может быть разложено на две системы уравнений:

{\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}={\begin{bmatrix}ax\\cx\end{bmatrix}}\\{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}={\begin{bmatrix}by\\dy\end{bmatrix}}\end{cases}}.

Выносим x и y:

{\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}=x{\begin{bmatrix}a\\c\end{bmatrix}}\\{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}=y{\begin{bmatrix}b\\d\end{bmatrix}}\end{cases}}

Обозначая

{\overrightarrow {a}}={\begin{bmatrix}a\\c\end{bmatrix}},\quad {\overrightarrow {b}}={\begin{bmatrix}b\\d\end{bmatrix}},

получаем два векторных уравнения:

{\begin{cases}A{\overrightarrow {a}}=x{\overrightarrow {a}}\\A{\overrightarrow {b}}=y{\overrightarrow {b}}\end{cases}}

Последняя система может быть представлена одним векторным равенством, включающим решения для двух собственных значений:

\mathbf {A} \mathbf {u} =\lambda \mathbf {u}

,

где $\lambda$ представляет одно из двух собственных значений x и y матрицы $\mathbf {A}$ , а $\mathbf {u}$ представляет один из двух векторов ${\overrightarrow {a}}$ и ${\overrightarrow {b}}$ .

Перенося $\lambda \mathbf {u}$ в левую часть и вынеся $\mathbf {u}$ , получим

(\mathbf {A} -\lambda \mathbf {E} )\mathbf {u} =\mathbf {0}

Поскольку матрица $\mathbf {B}$ невырожденна, важно, чтобы вектор $\mathbf {u}$ не был нулевым. Поэтому,

\det(\mathbf {A} -\lambda \mathbf {E} )=0

.

Решениями уравнения

(1-\lambda )(3-\lambda )=0

являются $\lambda =1$ и $\lambda =3$ , а получающаяся диагональная матрица из разложения матрицы $\mathbf {A}$ равна $\left[{\begin{smallmatrix}1&0\\0&3\end{smallmatrix}}\right]$ .

Если подставить решения обратно в систему уравнений выше, получим

{\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}=1{\begin{bmatrix}a\\c\end{bmatrix}}\\{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}=3{\begin{bmatrix}b\\d\end{bmatrix}}\end{cases}}

Решив уравнения, мы получим

a=-2c\quad {\text{и}}\quad b=0,\qquad c,d\in \mathbb {R} .

Тогда матрица $\mathbf {B}$ , требуемая для разложения матрицы $\mathbf {A}$ равна

\mathbf {B} ={\begin{bmatrix}-2c&0\\c&d\end{bmatrix}},\qquad c,d\in \mathbb {R} ,

То есть:

{\begin{bmatrix}1&0\\1&3\end{bmatrix}}={\begin{bmatrix}-2c&0\\c&d\end{bmatrix}}{\begin{bmatrix}1&0\\0&3\end{bmatrix}}{\begin{bmatrix}-2c&0\\c&d\end{bmatrix}}^{-1},\qquad c,d\in \mathbb {R}

Обращение матрицы через разложение по собственным векторам[править | править код]

Пусть матрица $\mathbf {A}$ имеет спектральное разложение и никакое из собственных значений матрицы не равно нулю. В этом случае матрица $\mathbf {A}$ является невырожденной, а её обратная матрица находится по формуле

\mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}

Если матрица $\mathbf {A}$ является симметричной матрицей, тогда матрица $\mathbf {Q}$ гарантированно будет ортогональной, то есть $\mathbf {Q} ^{-1}=\mathbf {Q} ^{\mathrm {T} }$ . А поскольку матрица $\Lambda$ является диагональной, то её обратную легко вычислить:

\left[\Lambda ^{-1}\right]_{ii}={\frac {1}{\lambda _{i}}}

Практическое значение^[4][править | править код]

Если разложение с помощью собственных векторов используется для матрицы, полученной при измерениях с реальными данными, то обратная матрица может быть хуже обусловлена, если все собственные значения используются в неизменной форме. Дело в том, что когда собственные значения становятся относительно малыми, вклад их обратных в обратную матрицу велик. Эти близкие к нулю значения или «шум» системы измерения будет иметь чрезмерное влияние и может помешать решению с помощью обращения.

Было предложено два варианта смягчения последствий: отбрасывание малых или нулевых собственных значений и копирование наименьшего надёжного значения в более маленькие.

Первый вариант смягчения подобен разрежению исходной матрицы, в которой удаляются элементы, которые посчитали незначимыми. Однако, если процесс решения окажется близок к уровню шума, откидывание может удалить компоненты, которые влияют на желаемое решение.

Второй вариант смягчения копирует собственное значение, так что меньшие значения имеют меньшее влияние на результат обращения, но по-прежнему вносят вклад, так что могут быть найдены решения, даже близкие к уровню шума.

Надёжное собственное значение может быть найдено в предположении, что собственные значения крайне близки и низкое значение является хорошим представлением шума измерения (который предполагается низким для большинства систем).

Если собственные значения выстроены по величине, надёжное собственное значение может быть найдено путём минимизации лапласиана отсортированных собственных значений^[5]:

\min \left|\nabla ^{2}\lambda _{\mathrm {s} }\right|

,

где собственные значения помечены буквой s для обозначения сортировки (от английского sorted). Место минимума является наименьшим надёжным собственным значением. В системах измерения квадратный корень из этого надёжного собственного значения является средним шумом относительно других компонент системы.

Функциональное исчисление

Пусть квадратная матрица $\mathbf {A}$ имеет разложение $\mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}$ . Тогда возведение матрицы в натуральную степень считается по простой формуле:

\mathbf {A} ^{n}=\left(\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}\right)^{n}=\underbrace {\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}\cdot \ldots \cdot \mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}} _{n}=\mathbf {Q} \mathbf {\Lambda } ^{n}\mathbf {Q} ^{-1},

здесь в промежуточном выражении сокращаются произведения $\mathbf {Q} ^{-1}\mathbf {Q}$ . Операция возведения в натуральную степень позволяет определить над матрицами различные функции, которые выражаются в виде степенных рядов.

Разложение матрицы по собственным значениям позволяет быстрее вычислить степенной ряд от матрицы. Пусть f (x) задается степенным рядом

f(x)=a_{0}+a_{1}x+a_{2}x^{2}+\cdots

В соответствии с формулой для степени от матрицы выше, степенной ряд для матрицы можно посчитать по формуле

f\left(\mathbf {A} \right)=\mathbf {Q} f\left(\mathbf {\Lambda } \right)\mathbf {Q} ^{-1}

,

где $f\left(\mathbf {\Lambda } \right)$ — функция от диагональной матрицы $\Lambda$ , которая может быть очень легко вычислена:

\left[f\left(\mathbf {\Lambda } \right)\right]_{ii}=f\left(\lambda _{i}\right)

При этом недиагональные элементы матрицы $f(\Lambda )$ равны нулю. То есть, $f(\Lambda )$ также является диагональной матрицей. В результате, вычисление функции от матрицы сводится к простому вычислению функции от каждого из собственных значений.

Похожая техника работает и в более общем виде в голоморфном функциональном исчислении, с помощью формулы

\mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}

можно вычислять от матриц степенные ряды, которые содержат отрицательные степени. Здесь снова используется, что $\left[f\left(\mathbf {\Lambda } \right)\right]_{ii}=f\left(\lambda _{i}\right)$ .

Примеры[править | править код]

Квадратный корень из матрицы:

{\sqrt {\mathbf {A} }}=\mathbf {Q} {\sqrt {\mathbf {\Lambda } }}\mathbf {Q} ^{-1}.

Возводим в квадрат и убеждаемся в корректности:

\mathbf {Q} {\sqrt {\mathbf {\Lambda } }}\mathbf {Q} ^{-1}\mathbf {Q} {\sqrt {\mathbf {\Lambda } }}\mathbf {Q} ^{-1}=\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}=\mathbf {A} .

Аналогичным образом определяется экспонента матрицы $\exp {\mathbf {A} }$ :

\exp {\mathbf {A} }=\mathbf {Q} \exp {\mathbf {\Lambda } }\mathbf {Q} ^{-1}.

Разложение специальных матриц

Нормальные матрицы[править | править код]

Комплексная квадратная матрица $\mathbf {A}$ нормальна (что означает, что $\mathbf {A} ^{\ast }\mathbf {A} =\mathbf {AA} ^{\ast }$ , где $\mathbf {A} ^{\ast }$ является эрмитово-сопряжённой) тогда и только тогда, когда она может быть разложена

\mathbf {A} =\mathbf {U} \mathbf {\Lambda } \mathbf {U} ^{*}

где $\mathbf {U}$ является унитарной (что означает, что $\mathbf {U} ^{\ast }=\mathbf {U} ^{-1}$ ) и $\mathbf {\Lambda } =diag(\lambda _{1},\dots ,\lambda _{n})$ является диагональной матрицей^[6]. Столбцы $\mathbf {u} _{1},\dots ,\mathbf {u} _{n}$ матрицы $\mathbf {U}$ образуют ортонормальный базис и являются собственными векторами матрицы $\mathbf {A}$ с соответствующими собственными значениями $\lambda _{1},\dots ,\lambda _{n}$ .

Если класс матриц $\mathbf {A}$ ограничен эрмитовыми матрицами ( $\mathbf {A} =\mathbf {A} ^{\ast }$ ), то $\Lambda$ имеет только вещественные значения. Если класс матриц $\mathbf {A}$ ограничен унитарными матрицами, то все значения $\Lambda$ лежат на комплексной единичной окружности, то есть, $|\lambda _{i}|=1$ .

Вещественные симметричные матрицы[править | править код]

Для любой вещественной $n\times n$ симметричной матрицы собственные значения вещественны и собственные вектора можно выбрать вещественными и ортонормальными. Таким образом, вещественная симметричная матрица $\mathbf {A}$ может быть разложена в

\mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{\mathsf {T}}

где $\mathbf {Q}$ — ортогональная матрица, столбцами которой служат собственные вектора матрицы $\mathbf {A}$ , а $\Lambda$ — диагональная матрица, у которой значения на диагонали равны собственным значениям матрицы $\mathbf {A}$ ^[7].

Полезные факты

Полезные факты о собственных значениях[править | править код]

Произведение собственных значений равно определителю матрицы $\mathbf {A}$
$\det \left(\mathbf {A} \right)=\prod \limits _{i=1}^{N_{\lambda }}{\lambda _{i}^{n_{i}}}$
Заметим, что каждое собственное значение возведено в степень n_i, алгебраическую кратность.
Сумма собственных значений равна следу матрицы $\mathbf {A}$
$\operatorname {tr} \left(\mathbf {A} \right)=\sum \limits _{i=1}^{N_{\lambda }}{{n_{i}}\lambda _{i}}$
Заметим, что каждое собственное значение умножается на n_i, алгебраическую кратность.
Если собственные значения матрицы $\mathbf {A}$ есть $\lambda _{i}$ и $\mathbf {A}$ обратима, собственные значения матрицы $\mathbf {A} ^{-1}$ просто равны $\lambda _{i}^{-1}$ .
Если собственные значения матрицы $\mathbf {A}$ есть $\lambda _{i}$ , то собственные значения матрицы $f(\mathbf {A} )$ просто равны $f(\lambda _{i})$ для любой голоморфной функции f.

Полезные факты о собственных векторах[править | править код]

Если матрица $\mathbf {A}$ эрмитова и имеет полный ранг, базис собственных векторов можно выбрать взаимно ортогональным. Собственные значения вещественны.
Собственные вектора матрицы $\mathbf {A} ^{-1}$ те же самые, что и собственные вектора матрицы $\mathbf {A}$ .
Собственные вектора определены с точностью до постоянного множителя. То есть, если $\mathbf {Av} =\lambda \mathbf {v}$ , то $c\mathbf {v}$ является также собственным вектором для любого скаляра c ≠ 0. В частности, $-\mathbf {v}$ и $e^{i\theta }\mathbf {v}$ (для любого $\theta$ ) также являются собственными векторами.
В случае вырожденных собственных значений (собственное значение появляются более одного раза), собственные вектора имеют дополнительную степень свободы вращения, то есть любая линейная (ортонормальная) комбинация собственных векторов с одним и тем же собственным значением является сама собственным вектором.

Полезные факты о разложении с помощью собственных векторов[править | править код]

Матрица $\mathbf {A}$ может быть разложена с помощью собственных векторов тогда и только тогда, когда число линейно независимых собственных векторов $N_{\mathbf {v} }$ равно размерности собственного вектора: $N_{\mathbf {v} }=N\,$
Если $p(\lambda )$ не имеет кратных корней, то есть, если $N_{\lambda }=N,$ , то $\mathbf {A}$ может быть разложена.
Из утверждения «матрица $\mathbf {A}$ может быть разложена» не следует, что $\mathbf {A}$ имеет обратную.
Из утверждения «матрица $\mathbf {A}$ имеет обратную » не следует, что $\mathbf {A}$ может быть разложено с помощью собственных векторов. Контрпримером является матрица $\left[{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}\right]$ , которая является обратимой дефектной матрицей.

Полезные факты об обратной матрице[править | править код]

Матрица $\mathbf {A}$ обратима тогда и только тогда, когда
$\lambda _{i}\neq 0\quad \forall \,i$
Если $\lambda _{i}\neq 0$ и $N_{\mathbf {v} }=N$ , обратная матрица задаётся равенством
$\mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}$

Численные вычисления

Численное вычисление собственных значений[править | править код]

Предположим, что требуется вычислить собственные значения заданной матрицы. Если размеры матрицы малы, собственные значения могут быть вычислены символьно с помощью характеристического многочлена. Однако это часто невозможно для больших матриц, и в этом случае используются численные методы.

На практике собственные значения больших матриц не вычисляются с помощью характеристического многочлена. Вычисление многочлена становится само по себе трудоёмким и затратным по времени, а точные (символьные) корни многочлена высокой степени трудно вычислить и выразить — из теоремы Абеля о неразрешимости уравнений в радикалах следует, что корни многочленов высокой степени (5 и выше) не могут быть в общем случае представлены как выражения от корней n-ой степени. По этой причине общие алгоритмы поиска собственных векторов и собственных значений работают итеративно.

Существуют итеративные численные алгоритмы аппроксимации корней многочленов, такие как метод Ньютона, но, как правило, непрактично строить характеристический многочлен, а затем применять эти методы. Одной из причин является то, что малые ошибки округления в коэффициентах характеристического многочлена могут привести к большим ошибкам в собственных значениях и собственных векторах — корни являются крайне плохо обусловленной функцией от коэффициентов^[8].

Простым и точным итеративным методом является степенной метод — выбирается случайный вектор $\mathbf {v}$ и вычисляется последовательность единичных векторов

{\frac {\mathbf {A} \mathbf {v} }{\left\|\mathbf {A} \mathbf {v} \right\|}},{\frac {\mathbf {A} ^{2}\mathbf {v} }{\left\|\mathbf {A} ^{2}\mathbf {v} \right\|}},{\frac {\mathbf {A} ^{3}\mathbf {v} }{\left\|\mathbf {A} ^{3}\mathbf {v} \right\|}},\ldots

Эта последовательность почти всегда сходится к собственному вектору, соответствующему собственному значению наибольшей величины, при условии что у вектора $\mathbf {v}$ соответствующая этому собственному вектору компонента в базисе из собственных векторов ненулевая (а также при условии, что имеется только одно собственное значение наибольшей величины). Этот простой алгоритм полезен в некоторых практических приложениях. Например, Google использует его для вычисления ссылочного ранжирования документов в их поисковике^[9]. Также степенной метод является отправной точкой для многих других сложных алгоритмов. Например, если хранить не только последний вектор последовательности, а смотреть в линейной оболочке всех векторов последовательности, можно получить лучшую (сходящуюся быстрее) аппроксимацию собственного вектора, и эта идея является основой итерации Арнольди^[8]. Также важный QR-алгоритм также основан на слегка изменённом степенном методе^[8].

Численное вычисление собственных векторов[править | править код]

Если собственные значения вычислены, собственные вектора можно вычислить путём решения уравнения

\left(\mathbf {A} -\lambda _{i}\mathbf {E} \right)\mathbf {v} _{i,j}=0

с помощью исключения Гаусса или любого другого метода решения матричного уравнения.

Однако, в практических методах нахождения собственных значений матриц большого размера собственные вектора обычно вычисляются другими способами как побочный продукт вычисления собственного значения. В степенном методе, например, собственный вектор, в общем-то, вычисляется перед вычислением собственного значения (который обычно вычисляется согласно отношению Рэлея для собственного вектора)^[8]. В QR-алгоритме для эрмитовой матрицы (или любой нормальной матрицы), ортонормальные собственные вектора получаются как произведение матриц $\mathbf {Q}$ из шагов алгоритма^[8]. (Для матриц более общего вида QR-алгоритм сначала осуществляет разложение Шура, из которого собственные вектора могут быть получены обратной подстановкой^[10]) Для эрмитовых матриц алгоритм поиск собственных значений «разделяй и властвуй» более эффективен чем QR-алгоритм, если нужны как собственные вектора, так и собственные значения^[8].

Дополнительные темы

Обобщённые собственные пространства[править | править код]

Напомним, что геометрическую кратность собственного значения можно описать как размерность связанного собственного пространства, ядра матрицы $\lambda \mathbf {E} -\mathbf {A}$ . Алгебраическая кратность может также рассматриваться как размерность — это размерность связанного обобщённого собственного пространства (в 1-м смысле), которое является ядром матрицы $(\lambda \mathbf {E} -\mathbf {A} )^{k}$ для любого достаточно большого k. То есть, это пространство обобщённых собственных векторов (в первом смысле), где обобщённый собственный вектор — это любой вектор, который рано или поздно станет 0, если применить $\lambda \mathbf {E} -\mathbf {A}$ достаточное число раз. Любой собственный вектор является обобщённым собственным вектором, а потому любое собственное пространство содержится в связанном обобщённом собственном пространстве. Это даёт простое доказательство, что геометрическая кратность никогда не превосходит алгебраическую кратность.

Такое использование не следует путать с обобщённой задачей собственных значений, описанной ниже.

Сопряжённый собственный вектор[править | править код]

Сопряжённый собственный вектор — это вектор, который после линейного преобразования переходит в (с точностью до умножения на скаляр) в свой сопряжённый. Скаляр тогда называется сопряжённым собственным значением линейного преобразования. Сопряжённые собственные вектора и значения представляют, по сути дела, ту же самую информацию, что и обычные собственные вектора и собственные значения, но возникают в случае использования других систем координат. Соответствующим равенством будет

\mathbf {A} \mathbf {v} =\lambda \mathbf {v} ^{*}.

Например, в теории когерентного электромагнитного рассеяния линейное преобразование $\mathbf {A}$ представляет действие, осуществляемое рассеивающим объектом, а собственные вектора представляют поляризационные состояния электромагнитной волны. В оптике координатная система определяется с волновой точки зрения, известной как выравнивание прямого рассеивания (англ. Forward Scattering Alignment, FSA), и порождает уравнения обычных собственных значений, в то время как в радарах координатная система определяется со стороны радара, она известна как выравнивание обратного рассеивания (англ. Back Scattering Alignment, BSA) и порождает уравнения для сопряжённых собственных векторов.

Обобщённая задача нахождения собственных значений[править | править код]

Обобщённая задача нахождения собственных значений (во втором смысле) — это задача нахождения вектора $\mathbf {v}$ , удовлетворяющего равенству

\mathbf {A} \mathbf {v} =\lambda \mathbf {B} \mathbf {v}

где $\mathbf {A}$ и $\mathbf {B}$ являются матрицами. Если $\mathbf {v}$ удовлетворяет этому равенству для некоторого $\lambda$ , то мы называем $\mathbf {v}$ обобщённым собственным вектором матриц $\mathbf {A}$ и $\mathbf {B}$ (во втором смысле), а $\lambda$ называется обобщённым собственным значением матриц $\mathbf {A}$ и $\mathbf {B}$ (во втором смысле), соответствующим обобщённому собственному вектору $\mathbf {v}$ . Возможные значения $\lambda$ должны удовлетворять следующему равенству

\det(\mathbf {A} -\lambda \mathbf {B} )=0.

Если можно найти $n$ линейно независимых векторов $\{\mathbf {v} _{1},\dots ,\mathbf {v} _{n}$ , таких что для любого $i\in \{1,\dots ,n\}$ , $\mathbf {Av} _{i}=\lambda _{i}\mathbf {Bv} _{i}$ , мы определяем матрицы $\mathbf {P}$ и $\mathbf {D}$ следующим образом

P={\begin{pmatrix}|&&|\\\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\\|&&|\end{pmatrix}}\equiv {\begin{pmatrix}(\mathbf {v} _{1})_{1}&\cdots &(\mathbf {v} _{n})_{1}\\\vdots &&\vdots \\(\mathbf {v} _{1})_{n}&\cdots &(\mathbf {v} _{n})_{n}\end{pmatrix}}

(D)_{ij}={\begin{cases}\lambda _{i},&{\text{если }}i=j\\0,&{\text{иначе}}\end{cases}}

Тогда выполняется следующее равенство

\mathbf {A} =\mathbf {B} \mathbf {P} \mathbf {D} \mathbf {P} ^{-1}

Доказательство

\mathbf {A} \mathbf {P} =\mathbf {A} {\begin{pmatrix}|&&|\\\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\\|&&|\end{pmatrix}}={\begin{pmatrix}|&&|\\A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\\|&&|\end{pmatrix}}={\begin{pmatrix}|&&|\\\lambda _{1}B\mathbf {v} _{1}&\cdots &\lambda _{n}B\mathbf {v} _{n}\\|&&|\end{pmatrix}}={\begin{pmatrix}|&&|\\B\mathbf {v} _{1}&\cdots &B\mathbf {v} _{n}\\|&&|\end{pmatrix}}\mathbf {D} =\mathbf {B} \mathbf {P} \mathbf {D}

А поскольку $\mathbf {P}$ обратима, умножим на эту обратную и получим требуемый результат.

Множество матриц вида $\mathbf {A} -\lambda \mathbf {B}$ , где $\lambda$ — комплексное число, называется пучком. Термин пучок матриц может относиться также к паре матриц $\mathbf {A} ,\mathbf {B}$ ^[11].

Если матрица $\mathbf {B}$ обратима, то исходную задачу можно переписать в виде

\mathbf {B} ^{-1}\mathbf {A} \mathbf {v} =\lambda \mathbf {v}

что является стандартной задачей собственных значений. В большинстве ситуаций, однако, нежелательно осуществлять это обращение, а решать обобщённую задачу собственных значений. Это особенно важно, если матрицы $\mathbf {A}$ и $\mathbf {B}$ эрмитовы, поскольку в этом случае $\mathbf {B} ^{-1}\mathbf {A}$ в общем случае обычно не эрмитова и важные свойства решения больше не проявляются.

Если обе матрицы $\mathbf {A}$ и $\mathbf {B}$ симметричны и эрмитовы и $\mathbf {B}$ является кроме того положительно определённой, собственные значения $\lambda _{i}$ вещественны и собственные вектора $\mathbf {v} _{1}$ и $\mathbf {v} _{2}$ с различными собственные значения $\mathbf {B}$ -ортогональны ( $\mathbf {v} _{1}^{\ast }\mathbf {Bv} _{2}=0$ )^[12]. В этом случае собственные вектора можно выбрать так, что матрица $\mathbf {P}$ , определённая выше, удовлетворяет условиям

\mathbf {P} ^{*}\mathbf {B} \mathbf {P} =\mathbf {E}

or

\mathbf {P} \mathbf {P} ^{*}\mathbf {B} =\mathbf {E}

,

и существует базис обобщённых собственных векторов (он не является дефектной матрицей)^[11]. Этот случай иногда называется эрмитово определённым пучком^[11].

См. также

Примечания

↑ Golub, Van Loan, 1996, с. 310.
↑ Kreyszig, 1972, с. 273.
↑ Nering, 1970, с. 270.
↑ Hayde, Twede, 2002, с. 355.
↑ Hayde, Twede, 2002, p. 299.
↑ Horn, Johnson, 1985, с. 133 Theorem 2.5.3.
↑ Horn, Johnson, 1985, с. 136 Theorem 2.5.3 Corollary 2.5.11.
↑ ¹ ² ³ ⁴ ⁵ ⁶ Trefethen, Bau, 1997.
↑ Ipsen, Wills, 2005.
↑ Quarteroni, Sacco, Saleri, 2000, с. 15.
↑ ¹ ² ³ Bai, Demmel, 2000.
↑ Parlett, 1998, с. 345.

Литература

Hayde A. F., Twede D. R. Observations on relationship between eigenvalues, instrument noise and detection performance // Imaging Spectrometry VIII. / Sylvia S. Shen. — 2002. — Т. 4816. — doi:10.1117/12.453777. — Bibcode: 2002SPIE.4816..355H.
Twede D. R., Hayden A. F. Refinement and generalization of the extension method of covariance matrix inversion by regularization // Imaging Spectrometry IX.. — 2004. — Т. 5159. — doi:10.1117/12.506993. — Bibcode: 2004SPIE.5159..299T.
Lloyd N. Trefethen, David Bau. Numerical Linear Algebra. — «SIAM, 1997. — ISBN 978-0-89871-361-9.
Alfio Quarteroni, Riccardo Sacco, Fausto Saleri. section 5.8.2 // Numerical Mathematics. — «Springer, 2000. — ISBN 978-0-387-98959-4.
Beresford N. Parlett. The symmetric eigenvalue problem. — Reprint.. — Philadelphia: «Society for Industrial and Applied Mathematics, 1998. — ISBN 978-0-89871-402-9. — doi:10.1137/1.9781611971163.
- Перевод Б. Парлетт. Симметричная проблема собственных значений. — Москва: «Мир», 1983.
Ilse Ipsen, Rebecca M. Wills. Analysis and Computation of Google's PageRank // 7th IMACS International Symposium on Iterative Methods in Scientific Computing, Fields Institute, Toronto, Canada, 5–8 May 2005. — 2005.
Generalized Hermitian Eigenvalue Problems // Templates for the Solution of Algebraic Eigenvalue Problems: A Practical Guide / Z. Bai, J. Demmel, J. Dongarra, A. Ruhe, H. Van Der Vorst. — Philadelphia: SIAM, 2000. — ISBN 978-0-89871-471-5.
Joel N. Franklin. Matrix Theory. — Dover Publications. — ISBN 978-0-486-41179-8.
Gene H. Golub, Charles F. Van Loan. Matrix Computations. — 3rd. — Baltimore: Johns Hopkins University Press, 1996. — ISBN 978-0-8018-5414-9.
- Перевод Дж. Голуб, Ч. Ван Лоун. Матричные вычисления. — Москва: «Мир», 1999. — ISBN 5-03-002406-9.
Roger A. Horn, Charles R. Johnson. Matrix Analysis. — Cambridge University Press, 1985. — ISBN 978-0-521-38632-6.
- Перевод Хорн Р., Джонсон Ч. Матричный анализ. — «Мир», 1989. — [[Служебная:Источники книг/{{{isbn}}}|ISBN {{{isbn}}}]].

Roger A. Horn, Charles R. Johnson. Topics in Matrix Analysis. — Cambridge University Press, 1991. — ISBN 978-0-521-46713-1.
Erwin Kreyszig. Advanced Engineering Mathematics. — 3rd. — New York: Wiley, 1972. — ISBN 978-0-471-50728-4.
Evar D. Nering. Linear Algebra and Matrix Theory. — 2nd. — New York: Wiley, 1970.
Strang G. Introduction to Linear Algebra. — 3rd. — Wellesley-Cambridge Press, 1998. — ISBN 978-0-9614088-5-5.

Ссылки

Interactive program & tutorial of Spectral Decomposition.

[_4cfb9bc1a3a3c638-1] Golub, Van Loan, 1996, с. 310.

[_bd6e0cae18e3821e-2] Kreyszig, 1972, с. 273.

[_b927ff69cc537ea0-3] Nering, 1970, с. 270.

[_5be7c01717ffa7b2-4] Hayde, Twede, 2002, с. 355.

[_5beb38171802a97f-5] Hayde, Twede, 2002, p. 299.

[_efc08cdb5a20fcbb-6] Horn, Johnson, 1985, с. 133 Theorem 2.5.3.

[_e2b722bcfa6a4e30-7] Horn, Johnson, 1985, с. 136 Theorem 2.5.3 Corollary 2.5.11.

[_98e7730e5b10b91e-8] ¹ ² ³ ⁴ ⁵ ⁶ Trefethen, Bau, 1997.

[_d927d288031e436c-9] Ipsen, Wills, 2005.

[_efc081c7795000f2-10] Quarteroni, Sacco, Saleri, 2000, с. 15.

[_a47cf19f06e31b95-11] ¹ ² ³ Bai, Demmel, 2000.

[_24d9af920aadd4cc-12] Parlett, 1998, с. 345.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]