научная статья по теме ТЕОРЕМА ДАЙНСА И НЕКОТОРЫЕ ДРУГИЕ СВОЙСТВА КВАДРАТИЧНЫХ ОТОБРАЖЕНИЙ Математика

Текст научной статьи на тему «ТЕОРЕМА ДАЙНСА И НЕКОТОРЫЕ ДРУГИЕ СВОЙСТВА КВАДРАТИЧНЫХ ОТОБРАЖЕНИЙ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2015, том 55, № 10, с. 1661-1669

УДК 519.626

ТЕОРЕМА ДАЙНСА И НЕКОТОРЫЕ ДРУГИЕ СВОЙСТВА КВАДРАТИЧНЫХ ОТОБРАЖЕНИЙ

© 2015 г. Д. Ю. Карамзин

(119333 Москва, ул. Вавилова, 40) e-mail: dmitry_karamzin@mail.ru Поступила в редакцию 13.01.2015 г.

Изучаются вещественные однородные квадратичные отображения из Rn в R2. Известно, что образ у таких отображений всегда выпуклый. Ниже приводится доказательство выпуклости образа, основанное на квадратичном экстремальном принципе. Отмечается, что если квадратичное отображение Q сюръективно, и n > 2 + dimkerQ, то у него существует регулярный нуль. Также приводится некоторый критерий линейной зависимости квадратичных форм. Библ. 28.

Ключевые слова: квадратичные формы и отображения, выпуклость образа, регулярные нули.

DOI: 10.7868/S0044466915100130

1. ВВЕДЕНИЕ

В 1941 году американским математиком Л. Дайнсом был получен широко известный сейчас результат о выпуклости образа двух вещественных квадратичных форм. Им также было отмечено, что при отсутствии нетривиальных нулей этот образ есть либо вся плоскость, либо замкнутый острый конус (см. [1]).

В настоящей работе этот результат несколько уточняется, так как ниже указывается на некоторую более глубокую связь, которая существует между структурой нулей и структурой образа квадратичного отображения на плоскость (теорема 1). (Здесь и всюду ниже под термином "квадратичное отображение" будем понимать однородное вещественное квадратичное отображение.) В работе также приводится еще одно доказательство выпуклости образа. Это доказательство основано на квадратичном экстремальном принципе, предложенном в [2]. Кроме того, приводится некоторый общий результат о линейной зависимости k квадратичных форм (теорема 2).

Выпуклость образа вещественных квадратичных форм имеет важное значение для оптимизации, и в частности для решения задач нелинейного и квадратичного программирования, где свойства выпуклости позволяют применять эффективные, глобально сходящиеся вычислительные процедуры (см., например, [3]—[7], и понятие ¿-леммы, или ¿-процедуры, которая часто применяется для решения квадратичных задач). Помимо приложений в численных методах, выпуклость образа квадратичных форм, как и свойства такого образа в целом, безусловно представляет и чисто математический интерес. Отметим обзорную работу [8], где собрано множество фактов и задач по квадратичным отображениям, и в частности, освещается проблема развития теоремы Дайнса на более высокую, чем 2, размерность.

По квадратичным задачам оптимизации, включая и теоретические, и численные аспекты исследования, на сегодняшний день в мире существует очень большое количество работ. Эта область является актуальной благодаря различным инженерным приложениям. Помимо уже упомянутых выше отметим работы [9]—[24].

2. ТЕОРЕМА ДАЙНСА

Введем необходимые обозначения и определения. Рассмотрим конечномерное пространство X = [n и квадратичное отображение Q : X—- [2. Таким образом, Q = (Q1, Q2), где Q1, Q2 — квадратичные формы на X (также будем обозначать и соответствующие симметричные матрицы, задающие сами квадратичные формы). Действие квадратичного отображения Q на элементе х при-

1661

1662

КАРАМЗИН

нято обозначать через Q[x, x] или Q[x]2. Образ множества Mпри отображении Q обозначим через Q(M). Множество нулей отображения Q обозначим через

K:= {x е X: Q[x, x] = 0}.

Множество K является, очевидно, замкнутым конусом. Вектор x е K называется регулярным нулем квадратичного отображения Q, если векторы Q1x и Q2x линейно независимы. Вектор x е K назовем нетривиальным нулем, если подпространство imQx содержит отличные от нуля элементы. Соответственно скажем, что нуль тривиальный, если Qx = 0. Множество всех тривиальных нулей отображения Q, очевидно, образует некоторое подпространство в X, которое называется ядром отображения Q и обозначается через kerQ. (Ясно, что kerQ = kerQ1 n kerQ2, где kerQi — это ядра соответствующих линейных операторов, порожденных матрицами Q.)

Теорема 1. Образ Q(X) является выпуклым конусом. Более того, справедливы следующие свойства:

а) если существует хотя бы один регулярный нуль, то Q(X) = [2;

б) если все нули нерегулярны, но существует хотя бы один нетривиальный нуль, то образ вложен в полуплоскость; при этом, если существует базис в X, состоящий из нулей, то образ вложен даже в прямую (и, значит, формы линейно зависимы);

в) если все нули тривиальны, то образ либо вся плоскость, либо замкнутый острый конус.

Условие а) очевидно. Выпуклость образа вместе с условием в) представляют собой утверждение теоремы Дайнса (см. [1]). Условие б) является новым. Его доказательству и посвящена основная часть этой работы. Но вначале установим выпуклость множества Q(X).

Лемма 1. Множество Q(X) есть выпуклый конус.

Доказательство. Тот факт, что множество Q(X) является конусом, очевиден. Отметим, что этот конус не обязательно замкнут (пример: Q1[x]2 = xj, Q2[x]2 = x1x2). Поскольку Q(X) — это полуалгебраическое множество, то, согласно теоремам вещественной алгебраической геометрии (полуалгебраическая триангуляция, см. в [25]), образ Q(X) есть конечное объединение связных конусов с началом в нуле.

Возьмем произвольный конус C из этого объединения и рассмотрим луч l с началом в нуле, который лежит на его границе. Не ограничивая общности, будем считать, что этот луч совпадает с осью 0y1, чего всегда можно добиться поворотом плоскости. Докажем тогда, что образ Q(X) целиком лежит по одну сторону от прямой y2 = 0, т.е. либо Q(X) с Г+, либо Q(X) с Г-, где Г+ = {y : y2 > 0}, Г- = {y : y2 < 0}.

Рассмотрим два случая. Пусть lс C. Возьмем y* е l, y* Ф 0. Для определенности будем считать, что C n O с Г+, где O — некоторая окрестность точки y*. Рассмотрим точку x*: Q[x*]2 = y*. Тогда квадратичная форма 9(x) = Q2[x, x] неотрицательна в окрестности точки x*. Поскольку 9(x*) = 0, то, в силу экстремальных свойств имеем 9'(x*) = 0, 9"(x*) > 0. Но 9"(x*) = 2Q2. Таким образом, конус С целиком принадлежит верхней полуплоскости: C с Г+.

Рассмотрим второй случай, когда l n C = {0}. В этом случае форма Q1, очевидно, неположительна на нулях формы Q2. Снова применяя экстремальный принцип, но, правда, уже не классический, а квадратичный, предложенный в [2], и к задаче условного экстремума

—Q1[x, x] —min, Q2[x, x] = 0,

решением которой является точка x = 0, найдем не равные одновременно нулю числа < 0 и такие, что

X1Q1[x, x] + X2Q2[x, x] > 0 Vx е X. (1)

Поэтому образ лежит в некоторой полуплоскости. Однако луч l принадлежит границе образа. Поэтому, если образ не вложен ни в одну из полуплоскостей Г+, Г—, то — l n Q(X) = {0}, и, значит, форма Q1 неотрицательна на нулях формы Q2. Применяя квадратичный экстремальный принцип к задаче

Q1[x, x] —» min, Q2[x, x] = 0,

решением которой является точка х = 0, найдем не равные одновременно нулю числа Xi > 0 и X2 такие, что

Xi Qi [х, х] + X2 Q2 [^ ] > 0 Vx е X. (2)

Представляются два случая. Если формы Q1, Q2 линейно зависимы, то образ есть либо прямая, либо луч, и, значит, образ выпуклый. Пусть формы линейно независимы. Складывая тогда (1) и (2) с нужными коэффициентами, учитывая, что X1 и Xi разных знаков, несложно вывести, что форма Q2 нестрого знакоопределена.

Итак, для каждого луча l, принадлежащего границе образа, мы показали, что Q(X) вложено в одну из полуплоскостей, на которые разбивает плоскость прямая, содержащая луч l. Теперь очевидно, что, взяв конечное пересечение таких полуплоскостей, получим образ Q(X). Таким образом, Q(X) — выпуклый конус. Лемма доказана.

Мы показали, что выпуклость образа квадратичного отображения в [2 есть несложное следствие квадратичного экстремального принципа, предложенного в [2]. Этот экстремальный принцип основывается на индексном подходе. (Подробнее об этом подходе см. в обзорной статье [22].) Верно и обратное: из выпуклости образа квадратичного отображения в [2 вытекают необходимые условия экстремума, полученные в [2], правда, только для случая одного ограничения при к = 1.

Следующая лемма завершает доказательство теоремы Дайнса в классической ее формулировке.

Лемма 2. Если конус Q(X) не замкнут или есть полуплоскость, то K\kerQ Ф 0.

Доказательство. Достаточно рассмотреть случай, когда ядро ker Q тривиально. Действительно, общий случай легко свести к этому частному, рассмотрев сужение отображения Q на подпространство ker Q1, образ которого совпадает с Q(X).

Предположим противное, т.е. что K = {0}. Отсюда сразу вытекает замкнутость Q(X). Теперь, чтобы прийти к противоречию, необходимо показать, что множество Q(X) не есть полуплоскость. Сделаем это.

Пусть Q(X) вложено в полуплоскость. Тогда, с точностью до линейных невырожденных преобразований, можно считать, что

Q2 [х, х] = xi + х2 + ... + х,2,

где s < n. Если s = n, то Q(X), очевидно, строго вложено в верхнюю полуплоскость Г+. Пусть s < n. Однако, если форма Q1 на подпространстве х1 = х2 = ... = х3 = 0 меняет знак, то n —s > 1, и поэтому в этом подпространстве найдется нетривиальный нуль отображения Q. Но мы предположили, что K = {0}. Это противоречие доказывает лемму.

Лемма 3. Пустъ K\ker Q Ф 0, и Q(X) = [2. Тогда Q обладает регулярным нулем.

Доказательству леммы предпошлем два вспомогательных утверждения. Пусть х е K. Обозначим через Л(х) множество таких единичных векторов X е [2, что X е imQx1, и Q^, х] > 0 Vх е е ker Qх.

Предложение 1. Предположим, что все нули отображения Q нерегулярны. Пусть e е K. Тогда, если существует вектор X е Л(е) такой, что XQ^, х] = 0 Vх е kerQe, то Q(X) Ф [2.

Доказательство. Очевидно, что достаточно рассмотреть лишь случай rank Qe = 1. Представляются две возможности.

Пусть найдется другой нуль f е K такой, что f £ ker Qe. В этом случае, как несложно видеть, im Qe = im Qf, а в силу условий предложения Q^, х] е im Qe Vх е ker Qe. Тогда, поскольку

Q[aX + pf2 = a2Q [ х, х ] + 2apQ[ х, f] + р2 Q f f] с im Qf = imQe,

для любого х е ker Qe, то, учитывая, что codimker Qe = 1, очевидно, получаем, что Q(X) с im Qe с [2.

Рассмотрим другой случай, когда K с ker Qe. Применяя поворот в X,

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком