научная статья по теме НЕОБХОДИМЫЕ УСЛОВИЯ МИНИМУМА В АНОРМАЛЬНЫХ ЗАДАЧАХ С ГЕОМЕТРИЧЕСКИМИ ОГРАНИЧЕНИЯМИ Математика

Текст научной статьи на тему «НЕОБХОДИМЫЕ УСЛОВИЯ МИНИМУМА В АНОРМАЛЬНЫХ ЗАДАЧАХ С ГЕОМЕТРИЧЕСКИМИ ОГРАНИЧЕНИЯМИ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2007, том 47, < 3, с. 364-375

УДК 519.626.2

НЕОБХОДИМЫЕ УСЛОВИЯ МИНИМУМА В АНОРМАЛЬНЫХ ЗАДАЧАХ С ГЕОМЕТРИЧЕСКИМИ ОГРАНИЧЕНИЯМИ1-*

© 2007 г. А. В. Арутюнов*, Д. Ю. Карамзин**

(* 119198 Москва, ул. Миклухо-Маклая, 6, РУДН; ** 119991 Москва, ул. Вавилова, 40, ВЦ РАН) e-mail: arutun@orc.ru; dmitry_karamzin@mail.ru Поступила в редакцию 06.10.2006 г.

Рассматривается анормальная задача минимизации с конечномерным образом и геометрическими ограничениями, которые, в частности, включают в себя ограничения типа неравенств. Для этой задачи получены необходимые условия второго порядка, усиливающие ранее известные результаты. Библ. 7.

Ключевые слова: анормальные задачи, необходимые условия второго порядка, геометрические ограничения, индекс квадратичной формы.

Пусть X - линейное пространство, У = есть к-мерное арифметическое пространство. Заданы замкнутое выпуклое множество С с У, отображение Р : X —► У и функция/: X —► И?1. Рассмотрим экстремальную задачу

/х) — шп, Р(х) е С. (Р)

Целью настоящей работы является вывод для этой задачи необходимых условий локального минимума второго порядка при естественных предположениях гладкости Р и / в случае, когда рассматриваемая точка экстремума анормальна в определяемом ниже смысле.

Поясним сказанное на примере частного случая задачи (Р), а именно задачи с ограничениями типа равенств

/х) — шп, Р(х) = 0, (1)

т.е. при С = 0, и когда пространство X конечномерно, а / и Р дважды непрерывно дифференцируемы. Пусть х0 является локальным минимумом в задаче (1). Могут представиться две возможности. Пусть вначале точка х0 нормальна. Последнее означает, что т Р '(х0) = У, где т Р '(х0) - образ оператора Р '(х0). В этом случае необходимые условия первого и второго порядков хорошо известны (см. [1]). Они заключаются в существовании такого множителя Лагранжа X, что вторая

д2 X

производная функции Лагранжа —- (х0, X) неотрицательно определена на ядре кегР'(х0) опера-

д х 2

тора Р'(х0), которое является касательным подпространством ко множеству {х : Р(х) = 0} в точке х0.

Откажемся теперь от предположения нормальности, допустив тем самым, что точка х0 может быть анормальной, т.е. что тР'(х0) Ф У. Тогда приведенные выше необходимые условия второго порядка, как известно (см. [2]), вообще говоря, могут не выполняться. Тем не менее в [2] получены необходимые условия второго порядка, которые остаются содержательными и без априорных предположений нормальности точки х0. Они заключаются в том, что для любого вектора

д2 X

И е кегР'(х0) существует такой (зависящий от И) множитель Лагранжа X е Лк(х0), что —- (х0, Х)[И,

дх2

И] > 0. Здесь Лк(х0) - множество тех нормированных множителей Лагранжа X, для каждого из ко-

1) Работа выполнена при финансовой поддержке РФФИ (коды проектов 05-01-00193, 06-01-00530, 06-01-81004), Фон-

да содействия отечественной науке и грантов Президента РФ (проекты МК-5591.2006.1, НШ-5344.2006.1).

торых найдется такое линейное подпространство П с X, что

д2 X

Пс kerF' (х0), codim П< к, —2" (х0Д)[х, х ]> 0 Vx еП,

д х

где codim обозначает коразмерность линейного подпространства. Эти необходимые условия естественным образом обобщают классические результаты на анормальный случай. При этом непустота множества Лк(х0) уже сама является важным необходимым условием минимума.

Приведенные результаты из [2] были затем обобщены в [3] на более общую задачу (P), в которой множество C предполагается всего лишь замкнутым. После этого в [4] для задачи (1) при дополнительном предположении, что точка х0 анормальна, необходимые условия из [2] были усилены. А именно, в [4] доказано, что если точка х0 анормальна, то в приведенной выше формулировке необходимых условий множество Лк(х0) можно заменить на, вообще говоря, меньшее множество Лк _ х(х0). В настоящей работе этот результат обобщается на более общую, чем (1), задачу (P).

Перейдем к точным формулировкам. Вначале определим на пространстве X так называемую конечную топологию. Для этого обозначим через М множество всех линейных конечномерных подпространств M с X. Открытыми в конечной топологии являются те и только те множества, для которых пересечение с любым подпространством M е М открыто в единственной отделимой векторной топологии пространства M. Локальный минимум относительно конечной топологии является слабейшим среди обычно рассматриваемых типов минимума (подробности см. в [2]). В дальнейшем под локальным минимумом будем подразумевать локальный минимум относительно конечной топологии.

Пусть х0 е X, причем y0 = F^0) е C. Предположим, что х0 является локальным минимумом задачи (P). Будем также предполагать, что отображения F, f дважды непрерывно дифференцируемы в окрестности точки х0 относительно конечной топологии. Это означает, что для произвольного M е М, содержащего точку х0, сужения f и F на M дважды непрерывно дифференцируемы в некоторой (зависящей от M) окрестности точки х0.

Рассмотрим функцию Лагранжа X : X х [к + 1 —► R1:

Х(хД) = Xof (х) + <y*, F(х)}, X = (А,о, У*), ^о е [\ у* е Y.

(Здесь и ниже пространство, сопряженное с арифметическим пространством, отождествляется с ним самим.)

Обозначим через Л(х0) множество векторов X = (X0, y*), которые отвечают принципу Лагранжа в точке х0:

д X

(хо,Х) = 0, Xo > 0, у* е Nc(yo), IX = 1, (2)

где Nc(у) - нормальный конус к выпуклому множеству C в точке у е C. В силу принципа Лагранжа (см. [5], [3]), множество Л(х0) не пусто. Элементы X этого множества называются множителями Лагранжа.

Линейное подпространство I с Y называется инвариантным относительно множества C, если I + C с C (см. [3, определение 2.1]). Заметим, что если I1, I2 - два инвариантных подпространства, то I = I1 + I2 - также инвариантное подпространство относительно C, так как

I + C = (I1+12) + C = I1 + (I2 + C) с I1 + C с C.

Поэтому в силу конечномерности пространства Y существует максимальное по включению среди всех инвариантных подпространств I, которое обозначим через 3.

Положим 5 = dim 3х, где 1 обозначает ортогональное дополнение. Отметим (это будет использовано ниже), что по построению у* е 3х V(X0, у*) е Л(х0).

Для целого неотрицательного числа r обозначим через Лг(х0) множество векторов X е Л(х0), для каждого из которых существует линейное подпространство П = n(X) с F '(х0)_1(3) такое, что

д2Х

codimП< r, —j(х0, X)[х, х]> 0 Vx е П. дх2

Будем говорить, что точка х0 анормальна, если тР'(х0) + 3 Ф У. Рассмотрим множества

Тс(Уо) = {ё е У : (у + её, С) = о(е),е> 0 }, ТС(у,, й) = |^ е У : Шй+ ей + 1е2с) = о(е2),е> 01,

которые называются, соответственно, касательным конусом и внутренним касательным множеством второго порядка к С в точке у0, где dist - расстояние от точки до множества. Отметим, что оба эти множества замкнуты и выпуклы.

Рассмотрим конус критических направлений в точке х0:

Ж(х,) = \ х е X : ( д-(х,), х) < 0, ^(х,)х е Тс(Р(х,)) к

хо )■ *} < 0, §—( ;

Теорема 1. Пусть точка х0 является локальным минимумом в задаче (Р) и анормальна. Тогда Л5 - 1(х0) Ф 0 и для любых векторов И е Ж(х0), е Т2с(р(х0), д—(х0)И^ имеет место неравенство

тах 1 ^(х0,Х)[И, И] - <у*, 0. (3)

ХеЛ-1( х0)[д х

Доказательство. Не ограничивая общности, будем считать, что х0 = 0, Р(х0) = 0,/(х0) = 0. Положим Ж = Ж(0), Л = Л(0). Доказательство теоремы разобьем на четыре этапа. При этом будем использовать три вспомогательных утверждения (леммы 1, 2, 3), которые приведены в Приложении в конце статьи.

Этап I. Докажем утверждение теоремы при следующих дополнительных предположениях (от которых будем последовательно избавляться на последующих этапах):

а) пространство X конечномерно и X =

б) 3 = {0} (и поэтому 5 = к);

в) множество С является конечнопорожденным конусом, т.е. существуют такие векторы ai е У, 1 = 1, 2, ..., 11, что С = {у е У : За, > 0|у = ^ 1 ад };

г) w = 0.

Заметим, что предположение г) корректно, так как в силу предположения в) имеет место 0 е ТС (0, ё) Уё е Тс(0).

Рассмотрим два случая.

Случай 1. Пусть вначале

/ (0) е хт (Р (0) *). (4)

Возьмем произвольную точку у е С. Положим 2(у) = ТС(у) п (-ТС(у)). Заметим, что 2(0) = 3 = {0}, но 2(у) Ф {0} при у Ф 0, так как у е 2(у). При этом если у е ^С, то 2(у) = У, а если у е дС, то 2(у) -это линейная оболочка наименьшей грани, содержащей у. Обозначим через Р1(у) оператор ортогонального проектирования У на подпространство (2(у))х.

Как известно, конечно-порожденный конус имеет конечное число граней. Поэтому когда у пробегает все значения из конуса С, то 2(у) принимает лишь конечное множество значений (подпространств). Среди этих значений выберем только те подпространства, для которых /(0) е е т(Рх(у)Р'(0)*). Эти подпространства обозначим через 21, ..., 2т. Оператор ортогонального

проектирования на 2i обозначим через Р^. Отметим, что т > 1, так как, в силу (4), в качестве 21 можно взять 2(0).

Положим Ь, = кег(Г' (0)), N = кег(Г' (0))*, i = 1 2, ..., т. По определению, для каждого i = 1, 2, ..., т существует вектор е У такой, что/'(0) + (Р^Г (0))*^ = 0.

Определим билинейные отображения Qi и квадратичные формы 0 по формулам

Q1 [ х, £] = Р 0)[ х, £], Qo,г[ х, £] = /"(0)[ х, £] + С * Q1 [ х, £], х,^е X.

Для каждого номера i = 1, 2, ..., т по подпространствам Ь, А, квадратичному отображению Qi и квадратичной форме Qi 0 в соответствии с приведенными ниже в приложении формулами (30) и

(31) определим множества М\ , М'2.

По лемме 1, для всех достаточно малых 5 > 0 функция ф/х) := Q0, [х, х] не принимает значение

(-5) на множествах М\ и М2 при всех i = 1, 2, ..., т. Зафиксируем такое 5 > 0 и положим/5(х) =

=/(х) + 15|х |2.

Вначале докажем, что для любого к е Ж существуют (зависящие от 5 и, естественно, от к) линейное подпространство П(5) и вектор Х такие, что

П(5)с кег Г (0), со^ш П(5)< к - 1, ХеЛ, (5)

д 2 СР

^(0, Х)& £] + X05£|2 > 0 У^ е П(5), (6)

д х

дх2

(0,Х)[к, к] + Х05|к\2 > 0. (7)

В силу принципа Лагранжа, Л Ф 0 . Положим

Н = Н (5) = { к е Ж : 3/ = /(к )|</' (0), /> - /5( 0 )[И, к ]< 0, Г' (0) / - Г" (0 )[И, к ]е С }.

Очевидно, что если к е Н, то

Х0/ 5( 0)[ к, к ] + (у*, Г" (0)[ к, к]>>

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком