научная статья по теме СТАБИЛИЗАЦИЯ ДИФФЕРЕНЦИАЛЬНЫХ ПОВТОРЯЮЩИХСЯ ПРОЦЕССОВ Автоматика. Вычислительная техника

Текст научной статьи на тему «СТАБИЛИЗАЦИЯ ДИФФЕРЕНЦИАЛЬНЫХ ПОВТОРЯЮЩИХСЯ ПРОЦЕССОВ»

Автоматика и телемеханика, № 5, 2015

( 2015 г. М.А. ЕМЕЛЬЯНОВ (mikhailemelianovarzamas@gmail.com), П.В. ПАКШИН, д-р физ.-мат. наук (pakshinpv@gmail.com) (Арзамасский политехнический институт (филиал) Нижегородского государственного технического университета им. Р.Е. Алексеева), И. ГАЛКОВСКИЙ, д-р инженерных наук (k.galkowski@issi.uz.zgora.pl) (Институт управления и компьютерных наук Зеленогурского университета,

Польша),

Э. РОДЖЕРС, д-р философии (etar@ecs.soton.ac.uk) (Школа электроники и компьютерных наук университета Саутгемптона,

Великобритания)

СТАБИЛИЗАЦИЯ ДИФФЕРЕНЦИАЛЬНЫХ ПОВТОРЯЮЩИХСЯ ПРОЦЕССОВ1

Дифференциальные повторяющиеся процессы представляют собой одну из разновидностей 2Б систем и применяются для описания физических процессов, многократно воспроизводящих одинаковые действия, и процессов управления с итеративным обучением. Эти модели хорошо зарекомендовали себя в рамках линейной динамики, где имеются результаты, подтвержденные экспериментально. В то же время нелинейная теория таких процессов практически отсутствует. В статье представлены новые результаты по устойчивости, стабилизации и компенсации возмущений с использованием Нто-нормы для нелинейных дифференциальных повторяющихся процессов. Эти результаты затем применяются для построения алгоритмов управления с итеративным обучением при наличии неопределенных параметров и при наличии случайных отказов, которые моделируются однородной марковской цепью с конечным числом состояний. Конечные соотношения представлены в виде системы линейных матричных неравенств.

1. Введение

Многие производственные системы выполняют последовательность циклов, называемых повторениями, каждый из которых протекает в течение определенного ограниченного отрезка времени, называемого длительностью повторения [1]. После окончания каждого цикла система возвращается в начальное состояние и начинает выполнять новый цикл. Выходная переменная в таких системах называется профилем повторения. Характерным примером, который описан в [1] со ссылками на оригинальные авторские работы, является конвейер для резки угля, где профилем повторения (прохода) является верхняя часть угольного пласта выше нулевой линии, и целью является извлечение максимального количества угля за проход. Режущая машина опирается на предыдущий профиль прохода, чтобы произвести следующий проход, при этом не исключено, что могут возникнуть колебания профиля, амплитуда которых будет возрастать от повторения к повторению.

1 Работа выполнена в рамках государственного задания № 2.1748.2014/K Минобрнау-ки России и при частичной финансовой поддержке Российского фонда фундаментальных исследований (проект № 13-08-01092_а).

При появлении подобных колебаний процесс должен быть остановлен, чтобы скорректировать профиль вручную для их подавления с целью восстановления нормального процесса резания и предотвращения возможных механических повреждений режущей машины. Альтернативой является использование управляющих воздействий, направленных на гашение указанных колебаний, но задача стабилизации в данном случае не может быть решена стандартными методами теории управления, поскольку здесь не учитывается двумерный характер системы, а именно то, что динамика системы зависит от двух переменных: времени на текущем цикле и номера цикла. Для исследования устойчивости таких систем в рамках линейных моделей была разработана строгая теория [1], основанная на изучении свойств некоторого линейного оператора в соответствующем банаховом пространстве.

Системы подобного типа относятся к так называемым 2Б системам, которые начали появляться в задачах управления и теории цепей начиная с 70-х гг. прошлого века. Наиболее распространеными здесь являются модель Роессера [2], модель Форназини-Маркезини [3] и модель в форме повторяющегося процесса [1]. Модель Роессера берет начало из задач обработки изображений, в ней выделяют динамику двух составляющих вектора состояния, обычно называемых горизонтальной и вертикальной компонентами; модель Форназини-Маркезини, в оригинале названная динамической системой с двумя индексами, использует единственный вектор состояния; повторяющийся процесс отличается от модели Роессера конечной продолжительностью одной из составляющих.

Значительный всплеск интереса к 2Б системам возник после появления работы [4], где с целью повышения точности выполнения операций роботами были предложены метод и алгоритмы управления с итеративным обучением. К настоящему времени, как показывают обзорные статьи [5, 6], задаче управления с итеративным обучением посвящено огромное количество работ, и интерес к ней не ослабевает. Управление с итеративным обучением применимо в системах, многократно повторяющих однородные операции, например, портальный робот, перемещающий грузы из одной точки в другую по заданной траектории. Суть такого управления заключается в том, что информация с предыдущего выполнения операции используется на следующем выполнении с целью повышения точности. В этом случае, с одной стороны, имеется динамический процесс выполнения отдельной операции, с другой стороны -динамический процесс перехода от одного повторения операции к другому.

В [7] высокая эффективность результатов применения управления с итеративным обучением была подтверждена экспериментально. Другим интересным примером является система автономного патрулирования территории [8], состоящая из беспилотного летательного аппарата и автономных наземных датчиков. Эта система используется для обнаружения нарушителей, захвата требуемой цели и быстрой передачи информации о ее местонахождении оператору. Здесь профилем повторения является замкнутая траектория патрулирования. В течение цикла патрулирования летательный аппарат должен проходить над каждым из автономных наземных датчиков, и одной из основных задач управления в данном случае является уменьшение возможных отклонений от заданной траектории, величина которых может возрастать от

повторения к повторению. При появлении подобных отклонений необходимо скорректировать траекторию с целью восстановления нормального процесса патрулирования. Для решения данной задачи в [8] предлагается использовать управление с итеративным обучением, когда управление на текущем цикле полета по траектории корректируется на основе информации, полученной на предыдущем цикле полета.

Существенная часть публикаций по управлению 2Б системами, включая случай систем с неопределенными параметрами, посвящена исследованию линейных стационарных систем. Отметим, что, хотя в линейной теории и получены необходимые и достаточные условия устойчивости, доведение их до вычислимых соотношений является весьма непростой задачей. Один из подходов здесь связан с нахождением полиномиальной положительно определенной матрицы, удовлетворяющей неравенству типа Ляпунова в комплексных переменных. В [9] предлагается решение этой задачи на основе линейных матричных неравенств, но, как отмечают авторы этой работы, вычислительная сложность получается при этом весьма высокой. Эта сложность еще более возрастает при попытке решения задачи стабилизации на основе необходимых и достаточных условий. Обычно здесь используются достаточные условия устойчивости в форме уравнения Ляпунова с ограничениями на структуру решения, называемого обычно 2Б уравнением Ляпунова [1].

Работы, посвященные исследованию нелинейных систем, стали появляться лишь в последние несколько лет. В [10] изучается устойчивость нелинейных систем Форназини-Маркезини, [11, 12] посвящены исследованию различных видов устойчивости нелинейных дискретных систем Роессера, в [13, 14] соответственно исследуется устойчивость дискретных и дифференциальных повторяющихся процессов. В то же время целый ряд инженерных задач диктует необходимость развития нелинейной теории. Примерами могут служить недавняя работа [15], где управление с итеративным обучением применяется к конвейерной системе высокоточного лазерного напыления металла и [16], где для повышения качественных характеристик ветрового электрогенератора, снижения экстремальных нагрузок на его рабочие лопасти и сохранения максимальной производительности предлагаются интеллектуальные системы в сочетании с управлением с итеративным обучением.

Настоящая статья развивает результаты авторов, полученные в [17]. Представлены новые результаты по стабилизации нелинейных дифференциальных повторяющихся процессов с использованием нестандартного применения метода векторных функций Ляпунова. Далее на их основе решается задача компенсации возмущений с использованием Нте-нормы. Затем результаты распространяются на модели, учитывающие возможные случайные отказы, перерывы в поступлении информации и другие факторы, которые можно рассматривать как случайные переключения. Такие переключения параметрического или структурного характера обычно описываются однородной марковской цепью с конечным числом состояний. Подобные модели в литературе получили название систем с марковскими скачками или систем случайной структуры [18,19]. Для дискретных повторяющихся процессов подобная задача решалась в [20]. На основе разработанной теории решается задача синтеза

управления с итеративным обучением для линейной системы с информационными нарушениями и неопределенностями в информационном канале.

2. Описание системы и постановка задачи

Рассмотрим нелинейный повторяющийся процесс с периодом повторения Т, который описывается на отрезке 0 ^ £ ^ Т следующей моделью в пространстве состояний:

(2 1) х к+1(£) = Л(хк+1(£),Ук (¿),ик+1(£)^к (£)),

где к — номер повторения (итерации), хк(£) € К""х — вектор состояния на текущей итерации, ук(£) € МПу — вектор профиля повторения, ии(£) € МПи — входной вектор, Wk(£) € — вектор возмущений; /1 и /2 — нелинейные функции, такие что /1(0, 0, 0, 0) = 0, /2(0, 0, 0, 0) = 0. Граничные условия, т.е. последовательность векторов начального состояния и начальный профиль повторения, считаются известными и имеют вид:

(22) хк+1(0) = 4+1, к ^

(.) Уо(£) = / (£), 0 < t < Т,

где элементы вектора 4+1 € К""х — известные постоянные; элементы вектора /(£) € МПу — известные функции 0 ^ £ ^

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком