научная статья по теме О ДИФФЕРЕНЦИРОВАНИИ МАТРИЧНЫХ ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ Математика

Текст научной статьи на тему «О ДИФФЕРЕНЦИРОВАНИИ МАТРИЧНЫХ ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2015, том 55, № 9, с. 1460-1473

УДК 519.61

О ДИФФЕРЕНЦИРОВАНИИ МАТРИЧНЫХ ОРТОГОНАЛЬНЫХ

ПРЕОБРАЗОВАНИЙ^ © 2015 г. М. В. Куликова*, Ю. В. Цыганова**

(* Технический университет г. Лиссабон Universidade Técnica de Lisboa, Instituto Superior Тёстсо, CEMAT; ** 432970 Ульяновск, ул. Л. Толстого, 42, Ульяновский гос. ун-т) e-mail: Kulikova.Maria@yahoo.ru; tsyganovajv@mail.ru Поступила в редакцию 16.01.2012 г. Переработанный вариант 16.08.2013 г.

Построены новые вычислительные алгоритмы дифференцирования матричных ортогональных преобразований, не требующие знания производных матрицы ортогонального преобразования. Рассмотрен пример применения этих алгоритмов для устойчивого к ошибкам машинного округления способа вычисления решения матричного разностного уравнения чувствительности Риккати. Библ. 23. Табл. 2.

Ключевые слова: матричное дифференцирование, ортогональные преобразования матриц, дифференцирование матричных ортогональных преобразований, матричное разностное уравнение Риккати, матричное разностное уравнение чувствительности Риккати.

Б01: 10.7868/80044466915090112

ВВЕДЕНИЕ

В работе рассматриваются вычислительные алгоритмы дифференцирования матричных ортогональных преобразований. Ортогональные преобразования в силу своих улучшенных вычислительных свойств широко используются при решении различных задач вычислительной линейной алгебры (см. [1]—[5]). В теории калмановской фильтрации (см. [6], [8]) ортогональные преобразования применяются для эффективного вычисления решения матричного разностного уравнения Риккати. Под эффективностью мы подразумеваем устойчивость по отношению к ошибкам машинного округления. Многочисленные исследования данной проблемы содержатся в [5]—[11] и др.

В свою очередь, потребность в дифференцировании матричных соотношений для вычисления значений производных элементов матриц возникает в задачах вычислительной математики, математической физики, теории управления и др. Например, в задачах параметрической идентификации стохастических моделей систем с фильтрацией подобные вопросы требуется решать при построении устойчивых к ошибкам машинного округления алгоритмов вычисления решения так называемого уравнения чувствительности Риккати (см. [12], [13]).

В связи с этим, целью данной работы является построение новых вычислительных методов для нахождения в заданной точке 0 значений производных дгу/д0 элементов верхней треугольной матрицы Я(0), полученной в результате ортогонального преобразования Т(0)А(0) = Я(0), где А(0) — прямоугольная матрица, зависящая от скалярного параметра 0, Т(0) — матрица ортогонального преобразования.

Результаты работы могут найти применение прежде всего в теории адаптивной калмановской фильтрации, параметрической идентификации моделей систем, а также в задачах вычислительной математики, оптимизации, управления и др.

Разд. 1 содержит постановку задачи. В разд. 2 излагаются вычислительные процедуры дифференцирования матричных ортогональных преобразований, позволяющие найти в заданной точ-

Работа выполнена при финансовой поддержке первого автора португальским фондом науки и технологии (Fundagao para a Ciencia e a Tecnologia) при софинансировании европейского фонда FEDER (грант No. SFRH/BPD/64397/2009).

ке значения производных элементов верхней треугольной матрицы, полученной в результате ортогонального преобразования. В разд. 3 рассматривается приложение разработанных методов к задаче вычисления решения матричного разностного уравнения чувствительности Риккати. В разд. 4 приведены два примера, иллюстрирующих работу построенных алгоритмов. В заключение обобщаются результаты работы.

1. ПОСТАНОВКА ЗАДАЧИ

Идея вычислительных методов для дифференцирования матричных ортогональных преобразований впервые была изложена в [14]. В дальнейшем данная идея подучила свое развитие при разработке класса квадратно-корневых методов параметрической идентификации в работах [11]—[20].

Рассмотрим прямоугольную матрицу А(0), элементы которой зависят от скалярного параметра 0 е К1. Предположим, что область определения Э(0) параметра 0 такова, что для любого 0 е Э(0) существует ортогональное разложение 7(0)И(0) = R(0), где ^0) — матрица ортогонального преобразования к верхнему треугольному виду прямоугольной матрицы A(0), R(0) — верхняя треугольная матрица. Далее предположим, что элементы матрицы A являются дифференцируемыми функциями по скалярному параметру 0 и матрица производных Aв = {дa¡j/д0} известна. Требуется вычислить значения элементов матрицы Re в заданной точке.

Вопросы существования гладких функций, являющихся элементами матриц T и R, подробно исследованы в [21].

В настоящей статье используется следующее

Предложение 1 (см. [21, Ргоро8Шоп 2.3]). Если элементы матрицы A полного столбцового ранга имеют k производных, тогда существует QR-разложение матрицы A такое, что элементы матриц Q и R также имеют k производных.

Замечание 1. В условиях решаемой задачи имеем T = Qт. Из предложения 1 следует, что условием существования производных элементов матрицы R является полнота ранга матрицы А.

Замечание 2. Матричное ортогональное преобразование

1Л = R (1)

может быть выполнено с помощью одного из известных вычислительных методов ортогонализации, например, метода отражений Хаусхолдера или метода вращений Гивенса (см., [4] — [8] и многие другие).

Целью данной работы является разработка вычислительных методов для нахождения в заданной точке элементов матрицы производных Re по известной матрице А и полученной в результате ортогональных преобразований матрице R. Рассматриваются четыре случая.

Случай 1. Ортогональное преобразование квадратной невырожденной матрицы А размера п х п к верхней треугольной матрице R.

Случай 2. Ортогональное преобразование расширенной прямоугольной матрицы полного ранга А размера п х (п + m) к верхней треугольной матрице R = ^ ^2], где R1 — верхняя треугольная подматрица размера п х п, R2 — размера п х m.

Случай 3. Ортогональное преобразование прямоугольной матрицы полного ранга А размера

(п + m) х п к верхней треугольной матрице R = [Я] |0]т, где R1 — верхняя треугольная подматрица размера п х п.

Случай 4. Ортогональное преобразование расширенной прямоугольной матрицы A ранга не меньше п и размера (п + m) х (п + к) к расширенной матрице

Я =

я1 я

0 Я

} П

} т

п + к

где R1 — верхняя треугольная подматрица размера п х п, R2 и R3 — подматрицы размеров п х k и m х k.

Будем использовать следующие обозначения: Ь — строго нижняя треугольная матрица, D — диагональная матрица, и — строго верхняя треугольная матрица. Тогда любая квадратная матрица A представима в виде A = Ь + D + и. Через Ae обозначим матрицу производных по скалярному

параметру 0. Через Аобозначим матричный блок, расположенный на пересечении строк матрицы A с п-й по m-ю и столбцов с ^го по 1-й.

2

2. ВЫЧИСЛИТЕЛЬНЫЕ АЛГОРИТМЫ ДИФФЕРЕНЦИРОВАНИЯ МАТРИЧНЫХ ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ

Приведем возможные способы решения данной задачи. Сначала рассмотрим уравнение

Я тЯ = АтА. (2)

Дифференцируя (2) по скалярному параметру 0, получаем

Ят Яв + (Ят Яв )т = АТ0А + (АТА0 )т. (3)

Матрица Я является верхней треугольной. Следовательно, матрица Яе также верхняя треугольная и может быть найдена как решение системы линейных алгебраических уравнений (3). Однако, если матрица А плохо обусловленная, то стандартные алгоритмы решения линейной системы, как правило, приводят к неточным результатам.

Рассмотрим второй способ. Дифференцируя по скалярному параметру 0 соотношение (1), получаем

Я0 = ТА, + ТеА. (4)

Для нахождения матрицы Я, требуется знание матрицы Те, которая может быть получена либо аналитически (что неудобно при решении практических задач большой размерности), либо с помощью существенной модификации используемого метода ортогонализации (здесь получается зависимость от выбранного метода ортогонализации). Следует отметить, что левая часть соотношения (4) является верхней треугольной матрицей, а оба слагаемых правой части — полные матрицы. Следовательно, при вычислении (4) обязательно присутствует вычитание, которое также может привести к существенной потере точности при вычислениях.

Третий способ, впервые предложенный в [14] для случая квадратной невырожденной матрицы А, заключается в следующем. Обратимся снова к (4). В силу ортогональности матрицы Т верно соотношение ТТт = I. Дифференцируя последнее равенство по 0, получаем

Т0 Тт + ТТ0 = 0. (5)

Следовательно, ТеТт = —(ТеТ т)т. Рассмотрим матрицу F = ТеТт. Она является кососимметри-

ческой, так как Fт = — F, и поэтому представима в виде F = Ь — Ь .

Лемма 1 (см. [14, с. 1296]). Пусть Т — матрица ортогонального преобразования к верхнему треугольному виду квадратной невырожденной матрицы А, т.е. ТА = Я, где Я — верхняя треугольная матрица. Допустим, что элементы матрицы А являются дифференцируемыми функциями по скалярному параметру 0. Тогда справедливы следующие соотношения:

(1) ТеТт = Г - Ь ,

(И) ТАеЯ-1 = Ь + D + и. Следствие 1. Верхняя треугольная матрица Яе из (4) может быть найдена по формуле

Я0 = (Г + Б + и) Я, (6)

где матрицы Ь , D и и, получены из (1) и (И) леммы 1.

Доказательство. Домножая обе части соотношения (4) на Я-1 и принимая во внимание равенство А = Т тЯ, получаем

Я0 Я 1 = ТА0Я- + Т0 Тт. (7)

Тогда с учетом соотношений (1) и (И) леммы 1, с учетом (6) и (7) получаем Я0Я 1 = V - Ь + Ь + Б + и ^ Я0 = (V + Б + и)Я.

тетт та0я-1

Следствие 1 доказано.

Обобщим результат леммы 1 и рассмотрим случай 2 расширенной прямоугольной матрицы А размера п х (п + т).

Лемма 2. Пусть A — прямоугольная матрица размера п х (п + m), гankA = п и элементы матрицы A являются дифференцируемыми функциями по скалярному параметру 0. Представим ортогональное преобразование ТА = R в виде

Т [А] А2] } п = [Я] Я2] } п,

(8)

где Т — (п х п)-матрица ортогонального преобразования к верхнему треугольному виду прямоугольной матрицы А и R1 — верхняя треугольная матрица размера п х п. Пусть

Т [(А!)0 (А2)0] } п = [X N } п,

(9)

где X, N — соответствующие матричные блоки размеров п х п и п х т. Тогд

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком