научная статья по теме МЕТОД ПРИСОЕДИНЕННЫХ ЧАСТИЧНЫХ ФИЛЬТРОВ В НЕЛИНЕЙНЫХ ЗАДАЧАХ БАЙЕСОВСКОГО ОЦЕНИВАНИЯ С ПАРАМЕТРОМ, ИМЕЮЩИМ ВЫСОКУЮ АПРИОРНУЮ НЕОПРЕДЕЛЕННОСТЬ Кибернетика

Текст научной статьи на тему «МЕТОД ПРИСОЕДИНЕННЫХ ЧАСТИЧНЫХ ФИЛЬТРОВ В НЕЛИНЕЙНЫХ ЗАДАЧАХ БАЙЕСОВСКОГО ОЦЕНИВАНИЯ С ПАРАМЕТРОМ, ИМЕЮЩИМ ВЫСОКУЮ АПРИОРНУЮ НЕОПРЕДЕЛЕННОСТЬ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2015, № 3, с. 21-39

УПРАВЛЕНИЕ В СТОХАСТИЧЕСКИХ СИСТЕМАХ С РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ

УДК 519.245_51.74

МЕТОД ПРИСОЕДИНЕННЫХ ЧАСТИЧНЫХ ФИЛЬТРОВ В НЕЛИНЕЙНЫХ ЗАДАЧАХ БАЙЕСОВСКОГО ОЦЕНИВАНИЯ С ПАРАМЕТРОМ, ИМЕЮЩИМ ВЫСОКУЮ АПРИОРНУЮ

НЕОПРЕДЕЛЕННОСТЬ © 2015 г. Д. Г. Арсеньев, Н. А. Берковский

Санкт-Петербург, Санкт-Петербургский государственный политехнический ун-т Поступила в редакцию 04.07.14 г., после доработки 08.12.14 г.

Предложена модификация распространенной схемы решения нелинейных байесовских задач оптимального оценивания, в которых вектор состояния содержит параметр, не меняющийся в процессе оценивания. Для решения таких задач часто применяется прием, при котором изменяющаяся часть вектора состояния моделируется при помощи последовательных методов Монте-Карло (частичных фильтров), а параметр моделируется как условное распределение, связанное с конкретной траекторией (реализацией подвижной компоненты). Различные модификации этой схемы отличаются в основном способами моделирования параметра. В ряде работ последних лет, посвященных задаче одновременного позиционирования и картографирования, векторный параметр, представляющий собой координаты неизвестных точечных ориентиров (реперов), моделируется при помощи обобщенного фильтра Кал-мана, полигауссовских аппроксимаций и более специфических методов. Рассматривается модификация, в которой параметр, как и подвижная часть вектора состояния, моделируется при помощи частичных фильтров. Выведены основные рекуррентные соотношения между весами частичных фильтров, предложенный вычислительный алгоритм проиллюстрирован применением к задаче одновременной локализации и картографирования по информации только о пеленгах.

DOI: 10.7868/S0002338815030038

Введение. Работа посвящена решению нелинейных байесовских задач оптимального оценивания [1], в которых вектор состояния состоит из двух частей — подвижной, изменяющейся в процессе оценивания, и параметра, сохраняющего постоянное значение, которое, однако, известно лишь с точностью до вероятностного распределения. Важным примером таких задач служат различные варианты задачи одновременной локализации и картографирования, в дальнейшем — SLAM (Simultaneous localization and mapping) [2—5]. В задачах SLAM в качестве изменяющейся части вектора состояния фигурируют обобщенные координаты автономного подвижного объекта, а в качестве параметра — координаты некоторых неподвижных точечных характеристик среды (реперов), которые требуется нанести на карту.

В последнее время распространенным для SLAM подходом является моделирование реализаций вектора состояния в два этапа: вначале независимо генерируются подвижные части вектора состояния, а затем при фиксированных значениях этих частей моделируются значения параметра по соответствующим условным распределениям (Rao — Blackwellised Particle Filter, в русской литературе в частных случаях называется методом частичного аналитического интегрирования) [6, 7]. В рамках этого подхода различные модификации различаются, по существу, способами моделирования условных распределений параметра. Например, в "классической" задаче SLAM, где мобильный робот, оснащенный дальномером, движется, наносит на карту точечные характеристики среды и одновременно определяет свое положение, параметр моделируется при помощи обобщенного фильтра Калмана (ОФК). Отметим, что при использовании дальномера априорные координаты реперов находятся с достаточно высокой точностью. В результате при линеаризации, используемой в ОФК, не возникает большой ошибки, и алгоритмы Fast SLAM 1.0 и 2.0 [6], основанные на соединении последовательных методов Монте-Карло [8] (ПМК, Sequential Monte Carlo method) с ОФК, эффективны.

Однако в задачах, где робот для определения позиций реперов может пользоваться только камерой, измеряя пеленги (bearing-only SLAM), эти алгоритмы дают неточные результаты, так как

априорная неопределенность в координатах реперов слишком велика для корректного применения ОФК [9]. По той же причине ОФК не дает точных оценок и в задаче слежения, рассмотренной в [10]. Для преодоления этой трудности в работах, посвященных решению bearing-only SLAM, при моделировании параметра, состоящего из координат реперов, используются поли-гауссовская аппроксимация (Gaussian Sum Filter) [2, 11] и более специфические методы, например, представление области неопределенности для реперов в виде трапеций, рекуррентно изменяющих свои размеры [5].

В настоящей статье рассматривается вычислительная схема, в которой для моделирования параметра применяются ПМК (другое название ПМК — фильтры частиц или частичные фильтры, Particle Filter). В предлагаемой модификации с каждой независимой реализацией подвижной части вектора состояния связывается частичный фильтр, моделирующий вторую часть. Таким образом, мы имеем один главный частичный фильтр и банк "присоединенных" частичных фильтров в количестве, равном числу "частиц" главного фильтра. Ввиду этого обстоятельства далее в статье предлагаемый алгоритм именуется "методом присоединенных частичных фильтров" (МПЧФ). Сферой применения МПЧФ являются байесовские задачи с вектором состояния, включающим случайный параметр, априорная неопределенность в значении которого велика (настолько, что применение ОФК не эффективно).

В разд. 1 собраны необходимые сведения, касающиеся ПМК, которые использовались при разработке МПЧФ, в разд. 2 приведено описание МПЧФ вместе с ключевыми рекуррентными соотношениями для весов частичных фильтров и предположениями, которым должно удовлетворять совместное распределение вектора состояния и измерений для корректной работы МПЧФ. В разд. 3 содержится описание плоской задачи bearing-only SLAM и показано, что МПЧФ применим к этой задаче, в разд. 4 — результаты численного эксперимента. Наконец, в Приложении помещены доказательства некоторых важных утверждений, использованных при выводе основных соотношений МПЧФ.

1. Последовательные методы Монте-Карло. Рассмотрим вектор состояния S, е , i = 0,1,..., представляющий собой дискретный марковский процесс с априорным распределением f (s0) и переходной плотностью f (s,|si_1). В статье мы следуем распространенному в современной литературе по ПМК обычаю обозначать плотности, входящие в модель, одной и той же буквой, поскольку из списка аргументов почти всегда ясно, о какой плотности идет речь. Пусть наблюдения (измерения) M,, i е К, зависят только от текущего состояния Si и описываются условными плотностями f (m, | si). Здесь и далее ^n — пространство «-мерных векторов с вещественными координатами, а К — множество натуральных чисел. Обозначим S0:i = {S0,S1,..., S,} и M1:i = {M1, M2,..., Mn}, i eH. Будем считать, что имеется возможность моделировать случайные векторы S0 с плотностью f (s0) и S, с плотностью f (s,|si_1) при фиксированных значениях si-1, i е К. Способы моделирования подробно рассмотрены в [12], кроме того, моделирование многих используемых плотностей реализовано в популярных математических программах Matlab, Mathcad и др. Следует обратить внимание на то, что векторы состояния нумеруются, начиная с нуля, а измерения — с единицы.

Ставится цель оценить рекурсивно во времени апостериорное распределение с плотностью f (s 0:i |m1:i), маргинальные плотности f (s, |m1:i) и математические ожидания вида

I (g,) = E [gi (S0:i )|m1:i ] = Jg{ (s 0:i )f (s 0^1,) ds ^ , i еК, (U)

где gt : (+1) ^ — некоторая функция. Интеграл без обозначения множества интегрирования здесь и везде ниже в статье обозначает несобственный интеграл по всему множеству изменения переменной интегрирования. Чаще всего g (s0:i) = s0:i, gt (s;-) = s, (вычисляются условные средние) или

gi(si) = s,siT - E[SMi]E[Si|m1:i]T

(вычисляются условная ковариационная матрица вектора состояния на i-м шаге). Условимся, что f (m1|m1:0) = f (m1); f ^m^) = f (s0).

Известно [10], что апостериорное распределение при - е К удовлетворяет рекурсии

/ (• 0>и) = / (. »,-|т„-,)(т (У (8-|'-),

/ (т-1т1:---1)

которая часто пишется в виде

/КМ-) К /(8„г-М--!)/(т-|8-)/(S-.IS-._i), - е N. С1-2)

Замечание. Здесь и далее в равенствах с условной плотностью знак псевдопропорциональности х обозначает пропорциональность с точностью до нормирующей функции, не зависящей от того аргумента условной плотности в левой части равенства, который находится слева от вертикальной черты. Например, в равенстве

/ (х|у) = / (*У) - / (х, У),

| / (х, У )(1х

аналогично / (у | х) ж / (х, у), однако из этого отнюдь не следует, что / (у|х) ж / (х|у), поскольку

/ (у| х) = / (/.

/ (х)

Таким образом, нормирующая функция зависит от переменной у, находящейся слева от вертикальной черты в записи плотности / (у| х). Этот знак часто применяется в англоязычной литературе по ПМК. Использование знака х позволяет записывать некоторые соотношения для ПМК в более короткой и удобной форме. Кроме того, он употребляется еще в одном случае, оговоренном ниже.

В дальнейшем до конца разд. 1 будем считать, что вектор т1:- фиксирован. Последовательно применяя (1.2) к/(80:-_1|т1:-_1), /(80:-_2|т1:-_2), приходим к формуле

/ (8 0 )П / (8 *|8 к-1

П / (т к 18 к ) = / (8 0:-- )р (81:-, т^), - £ К , (1.3)

/ (80:/|т1:,)<* где функция

I

/ (8 „:-) = / (8 о )П / (8 к 18 к-1), (1.4)

к = 1

является априорной плотностью вектора 80:- и

I

р (81:-, т1:-) = П / (т к 18 к) (1-5)

к = 1

В (1.3) знак псевдопропорциональности скрывает множитель, не зависящий от 80:-. Заметим, что реализации наборов случайных векторов 80:- могут генерироваться последовательно. Именно при наличии какой-либо конкретной реализации 8 0:- можно дополнить ее до реализации 80:-+1, моделируя 8-+1 с плотностью / (8-+1| 8,). Этот факт лежит в основе схемы простейшего варианта последовательных методов Монте-Карло, применяемого в байесовском оценивании. В связи с (1.3)— (1.5) можно записать (1.1) в виде

. \g- 0:-)рС8^т1-)/(0:-0:-- . 1 (81} = Г7-ТТТ^-' ' (1'6)

] Р (81:,, т1-)/ (8 0:-) 0:-

Предположим, что оба интеграла в (1.6) абсолютно сходятся, и рассмотрим случайную величину

N

N 8' (в0:'(- )) (( Л> Ш1:/) ^ {81) =--

NР (-), т1

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком