Примечание | Излагается оригинальный подход к проблеме адаптации в нелинейных динамических системах. Адаптивность как свойство приспособления рассматривается применительно к задачам обработки информации в нелинейных динамических системах |
Загрузить архив: | |
Файл: ref-29349.zip (5431kb [zip], Скачиваний: 459) скачать |
АДАПТАЦИЯ В НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМАХ
СанктПетербург — 2006
ББК
Тюкин Иван Юрьевич,
Терехов Валерий Александрович
Адаптация в нелинейных динамических системах
ISBN
Излагается оригинальный подход к проблеме адаптации в нелинейных динамических системах. Адаптивность как свойство приспособления рассматривается применительно к задачам обработки информации в нелинейных динамических системах, математическая модель которых известна не полностью. В первую очередь теория и методы адаптации ориентированы на задачи управления в открытых динамических системах. Но приводимые в книге методы и алгоритмы адаптации успешно могут быть распространены и на решение задач обработки эмпирической информации в разных областях науки и техники.
Книга базируется на использовании аппарата функционального анализа, нелинейной динамики, теории аппроксимации и синергетики. Приведенные примеры решенных на основе введенной теории, методов и алгоритмов адаптации задач иллюстрируют междисциплинарный характер проблемы адаптации в динамических системах различной природы и назначения. Поэтому книга рассчитана на довольно широкий круг читателей – специалистов по кибернетике, прикладной математике, биофизиков и других отраслей науки и техники.
Книга может быть использована как учебное пособие для студентов старших курсов технических университетов и аспирантов, обучающихся по специальностям в области управления и информатики.
Оглавление
Основные обозначения и сокращения 6 Введение 8 Проблемы адаптации в управляемых нелинейных детерминированных системах 13 Логические основы проблемы адаптивного управления . . . . . . . . . 13 Поисковый принцип адаптации и экстремальные системы . . . 13 Беспоисковый принцип адаптации . . . . . . . . . . . . . . . . . 15 Математические постановки задачи адаптивного управления . . . . . 22 Методы синтеза адаптивных систем управления нелинейными динамическими объектами . . . . . . . . . . 27 Системы с линейной и выпуклой параметризацией . . . . . . . 28 Системы с невыпуклой параметризацией . . . . . . . . . . . . . 32 Метод аналитического конструирования агрегированных регуляторов и принцип инвариантного погружения задачах адаптивного управления . . . . . . . . . . . . . . . . . 34 Проблемы адаптивного управления нелинейными объектами . . . . . . 39 Новый подход к решению проблемы адаптации в нелинейных системах . . . . . . . . . . . . . . . . . . . . . 47 Функциональный анализ динамических систем 52 Операторное описание динамических систем . . . . . . . . . . . . . . . 54 Свойства операторов устойчивых систем . . . . . . . . . . . . . . . . . 62 Постановка задачи функционального анализа и регулирования неравновесных, открытых и неустойчивых систем . . . . . . . . . . . . 69 Анализ и синтез систем с локально ограниченными операторами . . . 76 Анализ реализуемости соединений систем локально ограниченными операторами . . . . . . . . . . . . . 76 Задача функционального синтеза адаптивного регулятора. Принцип разделения.. . . . . . . . . . . . . . . . . . . . . . . . 85 Анализ асимптотического поведения систем локально ограниченными операторами . . . . . . . . . . . . . . . . . 90 Анализ асимптотического поведения неустойчивых систем . . . . . . . 93 Теорема о малом контурном усилении для неравномерной сходимости . . . . . . . . . . . . . . . . . . . 99 Характеризация притягивающего множества по Милнору . . . 103 Системы с сепарабельной динамикой . . . . . . . . . . . . . . . 106 Задачи адаптивного управления для классов нелинейных объектов 112 Постановка задачи адаптивного управления в условиях функциональной неопределенности и нелинейной параметризации . . 113 Синтез прямого адаптивного управления нелинейными динамическими объектами . . . . . . . . . . . . . . . . . 127 Метод виртуального алгоритма адаптации. Достаточные условия реализуемости . . . . . . . . . . . . . . . 128 Задача вложения. Достаточные условия разрешимости . . . . . 135 Задача прямого адаптивного управления классом объектов с моделями в нижнетреугольной форме . . . . . . . . 140 Задача адаптивного регулирования к инвариантным множествам . . . 154 Объекты с параметрической неопределенностью нелинейной параметризацией . . . . . . . . . . . . . . . . . . 155 Объекты с сигнальными возмущениями линейной параметризацией . . . . . . . . . . . . . . . . . . . . 156 Задача адаптивного управления взаимосвязанными нелинейными системами . . . . . . . . . . . . . . . 160 Системы с немоделируемой динамикой . . . . . . . . . . . . . . 160 Функциональная нормализация немоделируемых возмущений . . . . . . . . . . . . . . . . . . . . 163 Децентрализованное адаптивное управление . . . . . . . . . . . 165 Задача параметрической идентификации объектов нелинейно параметризованными моделями одного класса . . . . . . . 172 Задача недоминирующего управления объектами нелинейной параметризацией общего вида . . . . . . . . . . . . . . . 178 Искусственные нейронные сети в задаче адаптивного управления 190 Задача адаптивного управления объектами неопределенной физической моделью возмущений . . . . . . . . . . . 191 Задача комонотонной нейросетевой аппроксимации функций . . . . . . . . . . . . . . . . . . . . . . . . . . 196 Задача синтеза алгоритмов настройки параметров . . . . . . . . . . . . 199 Формальная постановка задачи . . . . . . . . . . . . . . . . . . 201 Аппроксимация функций помощью логистических уравнений . . . . . . . . . . . . . . . 202 Синтез алгоритмов оценки параметров систем логистических уравнений . . . . . . . . . . . . . . . . . 203 Решения прикладных задач адаптивного управления и идентификации нелинейных динамических систем 220 Задача управления динамикой автомобиля в режиме разгона торможения в условиях неопределенности качества дорожного покрытия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 Система прямого адаптивного управления . . . . . . . . . . . . 222 Результаты моделирования . . . . . . . . . . . . . . . . . . . . . 226 Задача идентификации моделей электрической активности клеток нервной системы по измерениям мембранного потенциала . . . . . . . . . . . . . . . . . 231 Формальная постановка задачи . . . . . . . . . . . . . . . . . . 232 Анализ модели . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 Синтез алгоритма идентификации . . . . . . . . . . . . . . . . . 237 Задача адаптивного сравнения шаблонов системах обработки визуальной информации . . . . . . . . . . . . . . 241 Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 241 Условия синхронизации осцилляторовдетекторов совпадений . . . . . . . . . . . . . . . 246 Синтез подсистемы адаптивной фильтрации оптических возмущений . . . . . . . . . . . . . . . 248 Результаты экспериментальной апробации системы . . . . . . . 257 Послесловие 263 Приложение 1. Дополнение к методам нелинейного адаптивного управления 265 Адаптивный обход интегратора . . . . . . . . . . . . . . . . . . . . . . 265 Адаптивный обход интегратора с функциями настройки . . . . . . . . 271 Минимаксный алгоритм адаптивного управления для систем с нелинейной параметризацией. . . . . . . . . . . . . . . . 279 Приложение 2 283 Доказательство Теоремы 2.1 . . . . . . . . . . . . . . . . . . . . . . . . 283 Доказательство Теоремы 2.3 . . . . . . . . . . . . . . . . . . . . . . . . 286 Доказательство Теоремы 2.4 . . . . . . . . . . . . . . . . . . . . . . . . 286 Доказательство Теоремы 2.5 . . . . . . . . . . . . . . . . . . . . . . . . 287 Доказательство Теоремы 2.6 . . . . . . . . . . . . . . . . . . . . . . . . 289 Доказательство Теоремы 2.7 . . . . . . . . . . . . . . . . . . . . . . . . 290 Доказательство Леммы 2.2. . . . . . . . . . . . . . . . . . . . . . . . . 293 Доказательство Леммы 2.3. . . . . . . . . . . . . . . . . . . . . . . . . 294 Доказательство Следствия 2.2 . . . . . . . . . . . . . . . . . . . . . . . 294 Доказательство Следствия 2.3 . . . . . . . . . . . . . . . . . . . . . . . 295 Приложение 3 298 Доказательство Теоремы 3.1 . . . . . . . . . . . . . . . . . . . . . . . . 298 Доказательство Следствия 3.1 . . . . . . . . . . . . . . . . . . . . . . . 301 Доказательство Теоремы 3.2 . . . . . . . . . . . . . . . . . . . . . . . . 301 Доказательство Теоремы 3.3 . . . . . . . . . . . . . . . . . . . . . . . . 302 Доказательство Леммы 3.1 . . . . . . . . . . . . . . . . . . . . . . . . . 303 Доказательство Теоремы 3.4 . . . . . . . . . . . . . . . . . . . . . . . . 308 Доказательство Следствия 3.2 . . . . . . . . . . . . . . . . . . . . . . . 311 Доказательство Теоремы 3.5 . . . . . . . . . . . . . . . . . . . . . . . . 312 Доказательство Теоремы 3.6 . . . . . . . . . . . . . . . . . . . . . . . . 317 Доказательство Теоремы 3.7 . . . . . . . . . . . . . . . . . . . . . . . . 317 Доказательство Теоремы 3.8 . . . . . . . . . . . . . . . . . . . . . . . . 320 Доказательство Теоремы 3.9 . . . . . . . . . . . . . . . . . . . . . . . . 323 Доказательство Теоремы 3.10 . . . . . . . . . . . . . . . . . . . . . . . 324 Доказательство Теоремы 3.11 . . . . . . . . . . . . . . . . . . . . . . . . 327 Доказательство Следствия 3.3. . . . . . . . . . . . . . . . . . . . . . . 333 Приложение 4 336 Доказательство Теоремы 4.1 . . . . . . . . . . . . . . . . . . . . . . . . 336 Доказательство Теоремы 4.2 . . . . . . . . . . . . . . . . . . . . . . . . 336 Доказательство Леммы 4.1 . . . . . . . . . . . . . . . . . . . . . . . . . 339 Доказательство Теоремы 4.3 . . . . . . . . . . . . . . . . . . . . . . . . 340 Список источников 343 Предметный указатель 375В книге применяются следующие термины и их определения. В соответствии с общепринятыми конвенциями, символом R будем обозначать поле вещественных чисел, а R+ = {x ∈ Rx ≥ 0}; символом N – множество нату|
ральных чисел; символом Rn –линейное пространство L(R) над полем вещественных чисел с размерностью dim{L(R)} = n; эвклидову норму элемента x ∈ Rn обозначим как x; Ck – пространство функций, дифференцируемых по меньшей мере k раз.
Символ K обозначает класс всех монотонно возрастающих функций κ : R+ R+
→
таких, что κ(0) = 0, символом K∞ обозначим подкласс функций κ ∈ K, дополнительно удовлетворяющих следующему условию: lims→∞ κ(s)= ∞. Функции κ : RR,
→
ограничение которых на R+ принадлежит классу K∞, будем обозначать символом K∞,e. Наконец, будем говорить, что β : R+ × R+ → R+ из KL, если и только если для всех s ∈ R+ ⇒ β(·,s) ∈ K, а β(s,·) монотонно убывает до нуля.
n
Символом L[t0,T], где T > t0, p ≥ 1, обозначим пространство всех функций
p
f : RRn таких, что
→
1/p
T
f p,[t0,T ] = f (τ)pdτ< ∞. t0
Символ f p,[t0,T ] обозначает Ln[t0,T] – норму векторфункции f (t). Символом
p
Ln [t0,T] обозначим пространство всех функций f : RRn таких, что
∞→
f ∞,[t0,T ] = ess sup{f (t),t ∈ [t0,T]
} < ∞,
n
где f ∞,[t0,T ] обозначает L∞[t0,T] – норму функции f (t).
n
Пусть χ : RR>0 – некоторая функция, символом Lχ,p[t0,T] будем обозначать
→
пространство всех функций f : RRn таких, что
→
1/p
T
χ(τ)f (τ)pdτ< ∞.
t0
Для некоторого множества A в Rn и нормы · (например, стандартной эвклидовой нормы в Rn) символом ·A будем обозначать следующую индуцированную норму:
= inf
xA q∈A{x − q}.
> Δ,
xAΔ = xA −Δ, xA0, xA ≤Δ.
Аналогично нормам ·∞,[t0,t], символом ·A∞,[t0,t] обозначим:
= sup x(τ)A .x(τ)A∞,[t0,t] τ ∈[t0,t]
Пусть задана некоторая функция f : Rn Rm. Будем говорить, что функция
→
f (x) : Rn → Rm локально ограничена, если для любого x< δ существует константа D(δ) > 0 такая, что справедлива оценка: f (x)≤D(δ).
Рассмотрим квадратную матрицу Γ размерностью n×n. Тогда записью Γ > 0 будем обозначать положительно определенную симметрическую матрицу, а символом Γ−1 обозначим матрицу, обратную к Γ. Символами λmin(Γ), λmax(Γ) обозначим минимальные и максимальные собственные числа матрицы Γ соответственно. Символом I будем обозначать единичную матрицу соответствующей размерности. Записью
xΓ обозначим квадратическую форму xT Γx, x ∈Rn; а |·|– модуль скалярной величины. Решение системы дифференциальных уравнений x= f (x,t,θ,u), x(t0)= x0, u : R+ → Rm , θ ∈ Rd для t ≥ t0 обозначим как x(t,x0,t0,θ,u) или x(t), если значения x0,θ и функция u(t) явно определяются контекстом. Пусть u : Rn ×Rd ×R+ Rm функция состояния x, параметров ˆ
θ и времени
→
t. Пусть, в дополнение, x и ˆ
θ являются функциями времени t. Тогда, если аргументы функции u могут быть явно определены из контекста, будем использовать
ˆ
сокращенную запись u(t) вместо исходной u(x(t),θ(t),t).
Для удобства и компактности записи при вычислении частных производных функционалов по векторному полю будем использовать следующее расширенное определение производной Ли по векторному полю. Пусть вектор состояния x ∈ Rn может быть записан в виде разбиения x = x1 ⊕x2, где x1 ∈Rq , x1 = (x11,...,x1q )T , x2 ∈ Rp, x2 =(x21,...,x2p)T , q + p = n, и операция ⊕ обозначает прямую сумму двух векторов. Введем в рассмотрение функцию f : Rn Rn такую, что f (x)=
→
f1(x) ⊕f2(x), где f1 : Rn Rq , f1(·)=(f11(·),...,f1q (·))T , f2 : Rn Rp, f2(·)=
→→
(f21(·),...,f2p(·))T . Тогда символом Lfi(x)ψ(x,t), i ∈ {1,2} обозначим производную Ли функции ψ(x,t) по векторному полю fi(x,θ):
dim xi
∂ψ(x,t)
Lfi(x)ψ(x,t) = fij (x,θ). ∂xij
j
Иные термины и обозначения определяются в соответствующем контексте книги.
С момента публикации первых работ по адаптивным системам в первой половине 20го века до настоящего дня приспосабливающиеся системы или системы с адаптацией эволюционировали от сравнительно простых экстремальных систем управления линейными объектами до адаптивных регуляторов линейных объектов, порядок математической модели которых существенно превосходит порядок математической модели объекта. В подавляющем большинстве практических приложений теория адаптивных систем управления и идентификации, как совокупность общесистемных положений и методов, используется для решения стандартных задач регулирования хорошо изученных и исследованных, зачастую устойчивых по Ляпунову объектов. Потенциальная роль этих теорий уже на этапе их возникновения, представлялась, как это следует из анализа работ ученых в конце 50х – начала 60х годов прошлого века, значительно шире и глубже. Однако эти предвидения не были поняты или на это не было обращено внимание большинства ученых, активно занятых задачами адаптивного управления того времени.
В естественных науках, таких, как физика, химия или биология, понимание механизмов и самих принципов адаптации, “приспособления” на сегодняшний день является одной из наиболее актуальных проблем [301]. Именно в этих областях знаний применение методов адаптации и управления наиболее перспективно для анализа явлений, не поддающихся анализу на языке “родной” науки. Хорошим примером может служить применение кибернетических методов в физике [85]. Не менее актуальным остается адаптивный подход к проектированию систем управления функционально сложными техническими объектами и технологическими процессами в условиях неконтролируемых изменений собственных свойств и свойств внешней среды. В то же время применение “классических” методов оказывается в значительной мере затруднительным или малоэффективным [67, 68, 69]. Причиной тому является то, что условия применимости классических методов в рамках существующей теории требуют точного знания уравнений математической модели объекта, линейности по неизвестным параметрам, устойчивости по Ляпунову целевых движений и, более того, известности функции Ляпунова (зачастую со знакоопределенной производной по времени) для целевых движений [292, 254, 219, 232, 157, 187, 38]. Каждое из этих требований в отдельности ограничивает роль существующей теории адаптивных систем в приложении к актуальным проблемам естественных наук; в совокупности они представляют собой ”стандартный” подход, который оказывается ограниченным даже для решения типовых задач управления техническими объектами.
Основное внимание авторов сосредоточено на теории и методах адаптивного управления нелинейными динамическими объектами:
–с потенциально неустойчивой по Ляпунову и неравновесной целевой динамикой;
Необходимыми компонентами такой теории адаптивного управления, как это следует из логики ее развития, являются: 1) аппарат анализа свойств нелинейных систем, который не требует точного знания математических моделей исследуемых объектов и не зависит от того, устойчив ли объект по Ляпунову; 2) принципы и методы адаптации к неконтролируемым, неизмеряемым возмущениям и неопределенностям среды и модели объекта, использующие лишь их общесистемные, фундаментальные свойства; 3) поиск, анализ и синтез структур реализации алгоритмов нелинейного управления, адаптации и идентификации.
В рамках развиваемой в книге теории адаптации обсуждаются следующие проблемные задачи1.
1) Разработка математического аппарата, позволяющего анализировать реализуемость, полноту и ограниченность состояния объектов и их соединений на основе моделей в виде отображений “входвыход” и “входсостояние” в предположении, что эти отображения известны лишь с точностью до мажорирующих. Результатом использования этого аппарата анализа являются формулировки желаемых принципов макроорганизации и целевых ограничений, реализация которых не требует a priori устойчивости по Ляпунову целевых движений, знания целевых множеств в явном виде, а также полной определенности математической модели управляемого объекта.
2) Разработка метода реализации полученных принципов и целевых ограничений для классов моделей нелинейных динамических объектов в виде частично известных систем нелинейных дифференциальных уравнений. Результатом применения
1Часть результатов в разд. 2 – 5, вошедших в книгу, получена И. Ю. Тюкиным во время его работы в RIKEN в лаборатории Perceptual Dynamics, Computational Neuroscience Group (Japan).
этого метода при решении задач синтеза систем адаптивного управления нелинейными динамическими объектами является комплекс методов решений типовых задач адаптивного управления. Для возможности использования в процессе управления адекватных, нелинейных физических моделей, методы должны допускать нелинейную параметризацию моделей неопределенности в широком и практически значимом классе функций.
3) Формализованная мотивация синтеза типовых структур адаптивных систем управления на основе искусственных нейронных сетей, включая решение задачи выбора подходящей архитектуры сети и разработку методов настройки параметров полученного класса регуляторов.
Вследствие ограничения круга решаемых задач, объектами исследования являются нелинейные динамические системы и их соединения, потенциально представимые в виде локально ограниченных отображений, систем дифференциальных уравнений и системами аппроксимирующих нелинейных функций с настраиваемым базисом.
Предметом обсуждаемых в книге проблем адаптации служат свойства реализуемости, полноты, ограниченности состояния адаптивных систем управления, условия достижения целевых множеств и их окрестностей, законы адаптивного управления, процедуры оценки неизвестных параметров нелинейных отображений, качество переходных процессов при условии неполноты информации об объекте и в условиях параметрических, сигнальных и функциональных возмущений.
Изложение современного состояния теории адаптивного управления, ее методов и алгоритмов ограничено аналитическим обзором, необходимо включенным в книгу для мотивации и аргументации новых положений и идей, которые составляют ее основное содержание. Для знакомства с традиционными подходами к решению проблемы адаптации в управляемых динамических системах можно рекомендовать достаточно большое число обстоятельных книг и публикаций в периодической печати. Наименования таких работ приводятся в библиографическом списке. Тем не менее, относительно новые методы адаптивного управления нелинейными объектами, появившиеся в последние десятилетия прошлого века, главным образом, в англоязычных изданиях, авторы сочли целесообразным включить в книгу в виде отдельного приложения.
Содержание книги составлено следующим образом.
В первом разделе анализируются известные подходы к решению задач адаптивного управления нелинейными динамическими объектами и формулируются основные проблемы, возникающие в стандартных постановках [82, 84, 254, 219] и производится постановка задачи работы. К числу проблем существующих методов в работе относятся: неоднозначность самого понятия адаптивной системы, качества управления, ограниченность классов целей управления2 и моделей неопределенности, требования точной информации о модели объекта (т. е. знание дифференциальных уравнений) и отсутствие типовых средств реализации в общем случае нелинейных законов управления.
Во втором разделе вводится описание нелинейных систем с использованием лишь качественной информации и свойствах “входсостояние” и “входвыход”, вводится математический аппарат анализа соединений динамических систем с локально ограниченными по состоянию и неограниченными по свободной переменной (времени) операторами. Поставлена и решена задача функционального синтеза адаптивных систем, обосновано использование известного принцип разделения, предоставляющего возможность независимого решения задач функционального синтеза обратной связи, алгоритма адаптации и наблюдателя. При этом желаемые фактические взаимодействия между этими подсистемами формулируются в виде принадлежности соответствующих выходов к заданным функциональным пространствам.
В третьем разделе книги на основе результатов предыдущего раздела приводится новая постановка задачи адаптивного управления нелинейными объектами в условиях неопределенности математической модели объекта, возможной неустойчивости по Ляпунову целевой динамики, нелинейной параметризации и частичной неопределенности целевых функционалов. Общая задача адаптивного управления ставится как задача регулирования влияния неопределенности в заданное функциональное пространство, что позволяет избежать использования аппарата функций Ляпунова и, как следствие, потенциальных ограничений этого метода при решении задач синтеза. В рамках общей постановки задачи приводятся частные постановки задач адаптивного регулирования к инвариантным множествам, управления соединением взаимосвязанных систем и идентификации. Для решения совокупности этих задачи в работе вводится и обосновывается метод т.н. виртуального алгоритма адаптации, и приводятся условия применимости этого метода для классов моделей объектов в рамках поставленных задач.
В четвертом разделе поставлена задача построения адаптивных регуляторов с применением нейронных сетей в качестве настраиваемых моделей неопределенности. Вводится и обосновывается архитектура таких сетей, а также приводятся оценки скоростей сходимости аппроксимационного ряда в выбранном базисе функций. Для настройки функционального и в общем случае нелинейно параметризованного базиса
2К числу наиболее существенных ограничений стоит отнести ограничения на устойчивость по Ляпунову целевых движений в системе и необходимость точной спецификации целевого множества. Последнее требование в условиях неопределенности модели приводит либо к необходимости предварительной идентификации объекта, что противоречит самой сути большинства методов прямого адаптивного управления, либо к искусственному, силовому введению в систему движений, не свойственных самому объекту
вводится метод, основанный на представлении базисных функций линейной комбинацией решений нелинейных дифференциальных уравнений с линейными параметрами. Приводятся условия сходимости параметров базиса в окрестность оптимальных значений для заданной аппроксимируемой функции.
В пятом разделе приводятся решения ряда прикладных задач управления, идентификации и обработки экспериментальной инфорации в биофизике, решения которых в рамках стандартных постановок либо не известны, либо затруднительны в силу ограничений самой задачи. В частности, рассмотрены и решены задачи оптимального экстренного торможения в условиях неопределенности свойств дорожного покрытия, задача идентификации динамики класса клеток (биологических нейронов) головного мозга животных, задача синтез адаптивной системы обработки визуальной информации, включая проблемы распознавания линейно несепарабельных и перекрывающихся объектов.
В приложении 1 в качестве справочного материала кратко изложены основы метода адаптивного обхода интегратора, необходимые для понимания примера расчета адаптивного закона управления с применением этого метода в разд. 3, параграф 3.2., а также сведения о минимаксном подходе к адаптивному управлению в нелинейных системах. Включение этого материала в определенной мере восполняет пробел в дефиците сведений в отечественной научной литературе о зарубежных работах по адаптивному управлению нелинейными объектами, а также полезен для сравнительного анализа возможностей этих методов с другими, в том числе и разрабатываемыми авторами книги.
В приложениях 2–4 приводятся доказательства лемм и теорем, содержащихся в книге.
В разделе рассматривается класс задач управления нелинейными динамическими объектами в условиях неопределенности в контексте существующих математических постановок проблемы адаптации. Приводится ретроспективный анализ развития теории адаптивных систем управления. На основе устанавливаемых недостатков общепринятых подходов к решению проблемы адаптивного управления делается вывод о необходимости поиска новых решений, адекватных уровню сложности самой исходной задачи.
Проблема адаптивного управления как систематическое исследование поведения и построения динамических систем, способных приспосабливаться к изменениям условий функционирования, имеет более, чем полувековую историю. Исторически процессам формализации частных проблем адаптации предшествовал период создания общесистемных взглядов как на саму проблему, так и на способы ее решения. Поэтому представляется естественным хотя бы кратко остановиться на анализе хронологически первых логических постановках проблемы адаптивного управления.
Первые идеи и конкретные способы адаптации проявились в конце 30х годов прошлого столетия в задаче автоматической оптимизации производительности промышленных установок и в задаче увеличения мощности двигателей внутреннего сгорания. Основное содержание задачи автоматической оптимизации состояло в поиске и удержании системы на экстремуме ее статической характеристики.
Автоматический поиск экстремума статической характеристики объекта как способ автоматического регулирования по максимуму или минимуму показателя качества технологического процесса был предложен в СССР Ю. С. Хлебцевичем в 1940 г. [87] и несколько позже В. В. Казакевичем в 1943 г. [21]. Проблемы теории экстремальных регуляторов привлекли к себе внимание многих ученых в СССР и за рубежом в 50е годы [12, 315, 19, 22, 104, 80, 251, 264, 274] прошлого столетия. Первое систематическое изложение прикладной теории экстремального регулирования как принципа автоматической оптимизации систем содержится в опубликованной в США в 1951 г. под редакцией Ч. С. Дрейпера и И. Т. Ли книге “Принципы автоматической оптимизации”, где были представлены результаты исследований коллектива специалистов лаборатории авиационной автоматики MIT. Обширный список работ по адаптивным системам, опубликованных к 1958 году, содержится в обзорной статье [104]. Большинство ранних работ по экстремальным системам рассматривают модели объектов в виде статических отображений, позже некоторые авторы расширяют класс допустимых систем до моделей Винера и Гаммерштейна [339]. Анализ устойчивости экстремальных систем управления детерминированными нелинейными динамическими объектами в замкнутом контуре оставался открытой проблемой более сорока лет. Теоретически обоснованные схемы применения экстремальных регуляторов для динамических нелинейных систем широкого класса впервые приводятся лишь в 2000 г. в работе [222], где в качестве основного аппарата анализа используются методы усреднения. В качестве возбуждающего сигнала, аналога пробных воздействий, используется гармонический сигнал малой амплитуды. В русскоязычной литературе современным примером использования пробных воздействий в структуре адаптивного регулятора является т.н. “самоорганизующийся оптимальный регулятор с экстраполяцией” (СОРЭ) [31], обеспечивающий как параметрическую, так и структурную адаптивность системы. В нем пробным воздействием служит циклическое задание элементов ковариационной матрицы фильтра КалманаБьюси.
Потенциальные приложения экстремальных адаптивных регуляторов приводятся в обзоре [304] и монографии [107]. Эти приложения включают процессы управления двигателями внутреннего сгорания, паровыми котлами, водяными турбинами, ветряными мельницами, ячейками солнечных батарей. К потенциальным приложениям следует отнести и системы управления антиблокировкой колес в режиме торможения, предложенные в работе [92], системы управления биореактором [172] и процессом “мягкого” затвора электромеханических клапанов [275].
Однако несмотря на интенсивные исследования методов синтеза экстремальных систем с непосредственной автоматической оптимизацией режимов работы на действующем объекте, экстремальные регуляторы не получили скольнибудь широкого распространения. Можно привести несколько тому причин. Вопервых, это недопустимость пробных движений на действующий промышленный объект, нарушающих нормальный режим его работы и требующий дополнительных затрат энергии на реализацию пробных поисковых воздействий. Вовторых, поиск экстремума с помощью пробных сигналов требуют значительного времени, за которое статическая характеристика объекта может изменяется настолько, что оптимизация становится неэффективной. Втретьих, реальная инерционность объекта, запаздывание и возмущения, действующие на объект, приводят к дополнительным ошибкам регулирования (“рысканью”) при воздействии пробных сигналов на входе объекта. Отметим, что все (или подавляющее большинство) работы по экстремальным системам управления базировались на использовании линейных моделей объектов с унимодальной статической характеристикой и введении пробных поисковых сигналов на входе объекта. В связи с этим укажем на работу1, в которой разработан метод синтеза экстремального регулятора и где для оценки функции градиента статической экстремальной характеристики объекта пробные воздействия не используются, а рекуррентные алгоритмы вычисления функций градиентов заменены на численные оценки производных, что снимает ряд эксплуатационных проблем в практических задачах. Класс моделей объектов ограничен нестационарными многомерными, приводимыми к автономным одноканальным моделям. Поэтому в целом, как принцип адаптации, автоматическая оптимизация на основе поисковых и беспоисковых механизмов отыскания экстремума статической характеристики регулируемого динамического объекта в условиях неконтролируемых изменений характеристик динамических объектов и возмущений получил ограниченное применение.
Альтернативой идее поиска экстремального значения функционала качества системы управления с использованием метода “проб” и “ошибок”, стала “беспоисковая” оптимизация. Применительно к адаптивным системам этот подход к реализации механизма адаптации к неконтролируемым факторам основывался на аналитических вычислениях тем или иным способом условий экстремума функционала качества, без использования пробных воздействий на объект. Поэтому в от “аналитические” или “беспоисковые” самонастраивающиеся системы [29, 2, 23].
По [118] адаптация, самоорганизация, саморегулирование означает постепенное изменение усредненных свойств в стохастической среде функционирования динамической системы. В [36] способы достижения требуемых динамических свойств самонастраивающихся систем классифицируются по степени сложности этих систем за счет:
а) высокого контурного коэффициента усиления;
б) изменения параметра по программе согласно заранее заданным условиям работы системы;
в) изменения параметров в зависимости от требуемого критерия качества системы;
1Французова Г. А. Синтез систем экстремального регулирования для нелинейных нестационарных объектов на основе принципа локализации // Дисс. на соискание ученой степени доктора техн. наук. Новосибирский гос. техн. университет, 2004.
г) изменения структуры системы в зависимости от требуемого показателя ее качества.
Несмотря на то, что приведенные способы хронологически относятся еще к началу 60х годов прошлого столетия, их логические принципы сохраняются в той или иной мере и в современных схемах адаптивных систем управления.
Способ а) – самый простой. При отсутствии информации об уровне аддитивных возмущений или о величине невязки между математической моделью процесса и уравнениями, стоящими за реальными физическими процессами в объекте (эту невязку обычно называют немоделируемой или паразитной динамикой) способ применяется наиболее часто. В теории управления нелинейными объектами регуляторы, позволяющие изменять коэффициент вплоть до бесконечно больших величин в зависимости от величины отклонения от положения равновесия называют “регуляторами с бесконечной границей роста коэффициента” (infinite gain margin controllers). Примером являются, т. н. LgV – регуляторы для аффинных по управлению систем
x=f (x)+g(x)u, x ∈ Rn , f :Rn Rn , g :Rn Rn ,
→→
где V (x) – функция Ляпунова для автономной системы, а LgV – производная Ли функции V (x) по векторному полю g(x). Возможны и иные примеры систем адаптивного управления с помощью высоких коэффициентов усиления, более изощренные по форме, но все те же по содержанию, единственная цель которых состоит в демпфировании неизвестной нелинейности или возмущений с помощью больших коэффициентов усиления в отрицательной обратной связи или специальных функций
– мажорант.
Пример адаптивной системы, построенной на способе б), который является, безусловно, более интересным, чем простое увеличение контурного усиления, приведен в работах [144, 252], где параметры адаптивного регулятора (точнее, текущий индекс используемого контроллера) изменяются согласно программе, реализуемой на основе схемы с гистерезисом. Критерием переключения является значение функционала качества, ассоциированного с конкретным контроллером. Выбор следующего контроллера из конечного множества возможных происходит последовательным перебором и циклическим образом. Подобная идея построения адаптивного регулятора со свойствами, изменяющимся согласно некоторой программе в зависимости от условий работы системы, была впоследствии развита в работе [256], где переключение происходит не циклическим образом, а целенаправлено – в зависимости от значения критерия качества, что является, посути, способом в).
К направлению с применением способа в) скорее всего следует отнести и все то огромное множество работ в современной параметрической постановке, где параметры регулятора основного контура настраиваются согласно алгоритмам градиентного типа. Способ г) в классификации Ли, выделенный отдельно, можно считать, повидимому, подклассом систем в) с той лишь оговоркой, что для реализации таких систем потребуется рассматривать параметризованные линейные комбинации управляющих функций из заданного класса вместо единственной функции.
При отсутствии содержательной информации о динамических свойствах регулируемого объекта целесообразно применять способ г). В [10] анализируются самонастраивающиеся системы со многими настраиваемыми параметрами и для этого используется цифровая вычислительная машина. Автор упомянутой работы критически оценивает применение термина “самонастраивающиеся системы” к системам, не являющимися таковыми (а это – системы комбинированного регулирования, системы с допустимо высоким коэффициентом усиления в контуре, автоколебательные системы) и разделяет точку зрения Дж. Траксела [93, 73], что “ ... т. н. самонастраивающееся регулирование является только методом рассмотрения систем”, который имеет определенную ценность при логическом подходе к проектированию нелинейных систем автоматического регулирования, но не является новым фундаментальным вкладом в теорию систем управления. Принцип самонастройки или адаптации состоит, по существу, из трех положений:
а) определение оптимальных условий работы и адекватного им критерия качества;
б) сравнение существующих характеристик с оптимальными;
в) изменение настройки системы с целью привести существующие характеристики к оптимальным.
Задачи б) и в) решаются автоматически; задача а) решается разработчиком на начальной стадии проектирования. В работах [118, 36, 117, 73, 313, 81] адаптация постулируется как способность системы изменять свою структуру и подстраиваться в соответствии с изменяющейся обстановкой. Под категорию адаптивного управления подпадают, по мнению Ю. Ту [313], те системы управления, где уравнения, характеризующие динамику процесса, статистические свойства сигналов или возмущений, например, распределения вероятностей для случайных переменных, заранее неизвестны или известны частично. Однако, в работе [158] высказывается мнение, что “... систематическое изложение задач адаптивного управления ведет к метазадаче, которая не является задачей адаптивного управления”. В цикле работ Р. Беллмана и его последователей [118, 117, 119, 86, 24] вводится итеративная стратегия адаптивного управления, базирующаяся на байесовском оценивании значений вероятности случайных параметров (коэффициентов уравнений динамики, статистических характеристик случайных сигналов или возмущений) и синтезе оптимального управления стохастическими процессами на основе теории динамического управления, т. е., по существу, предлагается концепция идентификационного подхода к решению проблемы адаптации в управляемых динамических системах.
Так, например, в [24] процесс адаптации наделяется следующими чертами: а) идентификации в форме определения апостериорной статистики; б) собственно стохастического управления. В частности, если некоторый параметр уравнений системы a priori задается какимлибо законом распределения, то задача б) превращается в задачу стохастической по Байесу оптимизации. В [119] вводятся понятия “более общих процессов адаптации”, где указывается на большой смысл попытки формулирования того, что следует подразумевать под “общим видом процессов управления с адаптацией” . Для этого постулируются как выполнимые следующие предположения.
1) Динамические процессы рассматриваются как многошаговые процессы изменения состояния, т. е. процессы в дискретные моменты времени k =1,2,..., отображающие последовательную эволюцию состояния динамической системы. В частности, эта эволюция задается дифференциальными уравнениями состояния; в общем случае, последовательностью функций
N
{fN } = h(xk)},{k=0
где h(xk):Rn Rm – заданная функция состояния xk. Эта функция явля
→
ется функцией начального состояния x0 и числа шагов (измерений) N при условии, что определено преобразование F(x):Rn Rn, обладающее свой
→
ством: xk =F(xk−1), xk−1 – есть состояние на одну единицу времени позднее. В достаточно общем случае принимается xk =F(xk−1,uk,ξk), где u – вектор управления, изменяющий состояние в соответствии с заданной целью; ξ – случайная переменная с фиксированной, но неизвестной функцией распределения и Pˆ(ξ)– априорная оценка для этой функции распределения. В таком случае
ˆ
пара (x,P(ξ))есть состояние управляемого объекта.
2) Состояние системы наблюдаемо на каждом шаге.
3) На каждом шаге вычисляется априорная оценка как истинная функция распределения и математические ожидания переменных состояния получаются на этой основе.
4) Существует систематическая процедура для модификации априорной функции распределения по мере того, как развертывается этот процесс. Эта процедура может быть процедурой с адаптацией, если в результате выбора uk новая функция распределения зависит от старой функции распределения, от реализации ξk, от начального состояния x0, нового состояния xk и управления uk.
ˆ
5) Пусть M{JN } = J¯(x,P) – математическое ожидание функции критерия ”суммарного” типа JN = N
k=0 q(xk,uk+1,ξk+1). Тогда J¯N (x,Pˆ) вычисляется в соответствии с принципом оптимальности Беллмана в виде функционального уравнения и из него на каждом шаге k =1,2,..., следует вычислять оптимальное управление u∗= minuk J¯(x,Pˆ). Но, как об этом пишут сами авторы [119]: “не
k
очень трудно записать эти соотношения, но большие трудности представляет получение аналитических или численных результатов из этих уравнений”.
Из приведенной формулировки процессов управления с адаптацией следуют логические принципы адаптации по Беллману.
1) Адаптивное управление рассматривается как управление по состоянию в условиях случайной среды функционирования с неизвестной функцией распределения.
2) В основу “механизма” адаптации полагается теория итераций и, как следствие, приоритет отдается численным методам оптимизации с последовательным использованием измерительных данных.
3) Рандомизация целевой функции и использование методов теории статистических решений, в частности, байесового и связанных с ним других, более экономичных, но и менее содержательных статистических подходов к оцениванию.
4) Текущая оптимизация на основе результатов текущего оценивания с использованием рандомизированных сепарабельных целевых функций интегрального или суммарного типов.
Следует обратить внимание на то, что хотя общая формулировка процессов адаптации по Беллману обращается к параметризованным моделям системы в широком смысле этого слова, она не ограничивается гипотезой квазистационарности параметров. Вариабельность параметров ограничивается лишь законами распределения параметрических возмущений. Отличительная особенность такой формулировки заключается и в том, что для адаптации используются лишь измерения текущего состояния.
Принципу действия систем управления с приспособлением Дж. Траксел дал в [93, 73] “... достаточно вольное определение .... как системы с автоматическим измерением сигналов или динамических характеристик объекта с последующей автоматической перестройкой устройства управления ...” с последующей критикой такого определения как нестрогого. И далее: ”Попытки дать строгое определение, которое позволяло бы точно разделить системы на два класса – приспосабливающиеся и неприспосабливающиеся (т. е. на адаптивные и неадаптивные – авт.), наталкиваются, повидимому, на непреодолимые препятствия. Например, обычную одноконтурную систему можно считать приспосабливающейся, если основное внимание обращать на усиление в цепи обратной связи, уменьшающее влияние любых вариаций параметров объекта”. На примере простейшей схемы резисторного делителя напряжения Дж. Траксел показывает, что эта – вовсе не схема с обратной связью! – может быть рассмотрена согласно ее математическому определению как схема с компенсирующей параметрические изменения отрицательной обратной связью. Поэтому он делает вывод, что даже всем привычная “.... обратная связь может быть определена только как точка зрения, которую выбирает исследователь или конструктор”. С такой позиции “... приспосабливающейся системой является всякая физическая система, которая может быть спроектирована с точки зрения принципа приспособления”. Сам Дж. Траксел, допуская, как это следует из его рассуждений, множество точек зрения на понимание механизма адаптации, вводит три различные формы реализации принципа приспособления:
В своей фундаментальной работе Дж. Траксел делает глубокой и важный по своему значению вывод о принадлежности приспосабливающихся систем к классу существенно нелинейных замкнутых систем управления, реализация которых невозможна при использовании обычных линейных методов теории управления.
Адаптивный подход по Дж. Тракселу позволяет (и в этом его назначение) создавать системы с нулевой чувствительностью при условии, что элементы адаптации действуют мгновенно и без помех. Но хорошо известно, что именно это условие как раз и не выполняется во всех рассматриваемых до настоящего времени адаптивных системах.
Далее отметим еще одно важное условие, которое обсуждается в работе Дж. Траксела: идеальное выполнение указанных условий требует задания математического класса входных сигналов с тем, чтобы ”... вводимые в систему нелинейные элементы, зависящие от характеристик объекта, обеспечивали требуемое качество системы в целом”. И это требование для реализации адаптивных свойств замкнутой системы в подавляющем большинстве работ по адаптивному управлению даже не упоминается в числе обсуждаемых задач.
И, наконец, обратим внимание на вывод, сделанный в работе Траксела: “... перспективной чертой принципа приспосабливания является возможность введения простого механизма обучения в ту часть системы, которая осуществляет приспосабливание. Когда обучение комбинируется с приспосабливанием, система управления получает гибкость и способность решать более значительные задачи, присущие человекуоператору”. И опять именно это интуитивное понимание необходимости простых механизмов приспосабливания, открывающих путь к практической реализации адаптивных регуляторов в задачах управления, не получило должного развития в подавляющем большинстве приложений. Этим, в том числе, можно объяснить совершенно неудовлетворительный для настоящего времени практический результат применения теории адаптивных систем.
В обзорном докладе Дж. Траксела на 2м международном конгрессе ИФАК [73] сформулирована концепция логической теории самонастраивающихся систем, базирующейся на трех теориях:
– теории моделирования управляемых систем и объектов;
– теории оптимизации детерминированных и стохастических динамических систем (А. А. Фельдбаум; Р. Беллман (динамическое программирование); Л. С. Понтрягин (принцип максимума), R. Кulikowski (оптимизация нелинейных случайных процессов управления), А. Брайсон, Хо ЮШи (градиентные методы оптимизации));
– теории устойчивости нелинейных систем.
Концепция логической теории по Тракселу приводит к механизмам адаптивного управления, сущность которых состоит из трех частей – оптимизации, идентификации с использованием оценок чувствительности (передаточных функций, оценочных функций или иных характеристик системы) к изменениям параметров объекта или внешней среды и анализа условий устойчивости нелинейных систем.
В целом идеи, сформированные в работах исследователей с середины 50х до конца 60х годов 20го столетия, исходили из парадигмы идентификационного подхода к реализации адаптивных свойств динамических систем управления.
В эти же годы формировался подход к самообучению систем управления [73, 313, 81, 86, 89], который предполагал изменение закона регулирования или стратегии управления при непредвиденных изменениях условий функционирования системы. Если в “обычных” приспосабливающихся системах изменяются структура алгоритма или его параметры с последующей оптимизацией динамических характеристик системы, то в самообучающихся системах на основе теории статистических решений изменяется тип стратегии управления.
В рассматриваемых подходах общим являлось использование априорной информации об объекте, сведений о статистических характеристиках измеряемых сигналов в системе управления и ее использование в процессах обучения.
Этому вопросу посвящен ряд основополагающих работ [315, 19, 80, 36, 37, 93, 158, 343, 226, 81, 91, 32, 50, 53, 82, 303]. Приведем те из них, которые не привязаны к использованию конкретных механизмов адаптации и характеризуются известной общностью.
В небольшой по объему статье Л. Заде [343] делает попытку формального определения адаптивности, квалифицируя это как сложную проблему, неопределенность которой порождается смешением собственно адаптивного поведения и механизма его достижения. Соединение этих альтернативных составляющих в единственном осмысленном определении, как и в работе Дж. Траксела, представляется автору иллюзорной целью изза невозможности строгого математического описания всех возможных механизмов адаптации. Позже об этом же писал в своей монографии [50] Дж. Саридис, где он привел более двух десятков различных по смыслу определений и существующих постановок задачи адаптивного управления и адаптивных систем.
По Л. Заде формальное определение понятия адаптивности с точки зрения ее внешнего проявления, без указания элементов ее реализации, вытекает из следующих рассуждений.
Рассматривается система S, имеющая своим входом функцию времени g(t):R
→
Rm из класса Gν {g(t)}. Семейство входов Gν представляет собой своего рода источник, возможно, но не необходимо, снабженный вероятностной мерой, определенной на этом семействе, так, чтобы Gν можно было рассматривать как случайный процесс. Обобщая, можно считать, что и само семейство Gν является членом семейства {Gν }, индексированного своей переменной ν ∈ R.
Пусть качество работы системы S задано функцией Q :RR, зависимой от ν,
→
что отражается значениями Q(ν). Вводится критерий допустимости качества в виде: Q(ν)∈ Ω, где Ω – некоторый класс функций. Информация о системе в рамках введенных обозначений может быть рассмотрена как отношение принадлежности ν ∈ N , где N есть определенное множество значений переменной ν. Тогда понятие адаптивности как свойства динамической системы через ее внешнее проявление можно дать следующим определением.
Определение 1.2.1. Система S называется адаптивной по отношению к семейству {Gν } и Ω, если Q(ν) ∈ Ω для любого источника семейства {Gν }, ν ∈ N . Другими словами, система S адаптивна по отношению к множеству N и классу Ω, если она отображает множество N в класс Ω, а именно: Q(ν):N Ω.
→
Определение адаптивности по Л. Заде эквивалентно понятию допустимого поведения динамической системы S для семейства входных функций Gν или, как более общее, для семейств {Gν }. Неопределенность ограничена возможными семействами G(ν), а допустимое поведение – соответствующим значением Q(ν).
Формулирование задачи адаптивного управления содержится и в работе [226], где, без потери общности, выделяются следующие компоненты типовой задачи управления с оптимизацией характеристик управляемой системы.
Исходные данные для ее решения включают:
1) физические и математические соотношения между измеряемыми сигналами x(t), z(t)и u(t), т. е. принимается во внимание физическая сущность объекта;
2) статистические характеристики возмущений внешней среды f (t), υ(t). Допускается полуопределенное задание характеристик, с точностью до параметров, например, функций распределения этих возмущений.
Рисунок 1.1. Задача адаптивного управления
Требуется в соответствии с целью управления определить функцию u(t) в зависимости от измеряемой функции выхода z(t) при неполной информации об объекте. Методы решения подобной задачи приводятся в многочисленных работах по адаптивным системам управления. Из постановки задачи следует ее решение при условии идентифицируемости (в определенном смысле) объекта управления в системе с обратной связью по выходу z(t) в режиме нормальной эксплуатации. Решению задачи адаптивного управления в приведенной постановке посвящены работы, среди которых из числа приведенных в списке литературы можно выделить работы по применению байесовского оценивания в сочетании с методом динамического программирования [118, 117, 158, 313, 119, 86], спектральных методов идентификации [93, 2, 25, 33], методов оценивания динамических характеристик объектов и его состояния (аналитические методы синтеза с применением настраиваемых моделей, фильтров Винера и Калмана, корреляционных функций, функций чувствительности, универсальных алгоритмов оптимизации по критерию обобщенной работы) [37, 93, 2, 23, 25, 32], теории инвариантности [20, 45].
Достаточно общее и строгое определение термина “адаптация” в случаях параметрической неопределенности объекта или возмущений для детерминированных с обобщением на стохастические системы с управляемыми марковскими процессами ситуаций введено в работах [91, 50, 53, 82, 84]. В рамках этих определений разработана математическая теория адаптивного управления [82, 84]. Ее особенностью является рассмотрение процесса управления на полубесконечном интервале времени при цели управления, не зависящей от характера переходных процессов, что приводит к итеративным процессам адаптации со слабо контролируемой динамикой процессов в системе.
Приведем в упрощенной форме постановку задачи адаптивного управления по цитируемым работам. Предполагается задание системы дифференциальных уравнений достаточно общего вида для модели объекта, включающих вектор неизвестных
x= f (x,u,θ,t); y = h(x,u,θ,t),
где u ∈ Rm, и f : Rn × Rm × Ωθ × R+ Rk – глад
→ Rn , h : Rm × Rm × Ωθ × R+ →
кие функции своих аргументов. Без существенной потери общности в практических приложениях параметр θ возможно определить как функцию времени: θ : R+ Ωθ,
→
θ(t) ∈ Θ. При этом вводятся стандартные предположения на функции в правых частях исходной системы, гарантирующие существование хотя бы одного решения. Для конкретных задач эти функции могут быть подчинены дополнительным требованиям.
Задание множества Θ как множества функций или векторов из некоторого класса определяет класс адаптивности, на который распространяется постановка задачи адаптивного управления.
Для цели управления Q[x(τ),u(τ),0 ≤ τ ≤ t] ≤ Δ при t ≥ t∗, Δ ≥ 0 – пороговое значение целевого функционала Q[], определенного на множестве состояний объекта
·
x ∈ Rn, сигналов управления u ∈ Rm, ставится задача нахождения неупреждающего алгоритма адаптивного управления в виде двухуровневой структуры:
u(t) = Ut[y(τ),u(τ),β(τ),0 ≤ τ ≤ t];
β(t) = Bt[y(τ),u(τ),β(τ),0 ≤ τ ≤ t],
где β ∈ Rp – конечномерный вектор настраиваемых параметров, обеспечивающий выполнение целевого условия для системы управления и принадлежность всех траекторий x(t),u(t),β(t) к заданным множествам. Синтезируемая адаптивная система должна обеспечивать для любого θ ∈ Ωθ (Θ) и любых начальных значений x(0), β(0) достижение цели управления.
В обзорном докладе [8] на 1й Всесоюзной конференции ”Теория адаптивных систем и ее применения” (1820 мая 1983 г., Ленинград) анализируются достижения теории адаптивного управления в классе аналитических (по В. В. Солодовникову) или беспоисковых (по А. А. Красовскому) самонастраивающихся систем (БСНС), к числу которых отнесены системы с самонастройкой по частотным, временным характеристикам и с применением эталонных моделей поведения объекта в системе. Последнее означает задание модели либо в явном виде, когда она включается в систему как физическое устройство или программа, или в неявном, когда она заменяется экстраполятором, вычисляющим значения обобщенной ошибки адаптивного управления по заданному набору коэффициентов уравнения эталонной модели и измеряемым (оцениваемым) сигналам в основном контуре. Общепринятой стала классификация всего многообразия конкретных типов БСНС на два различающихся по принципу работы класса: на системы без предварительной идентификации объектов, получивших название систем с “прямым адаптивным управлением” (англ. термин direct adadtive control или model reference adaptive systems изза использования в этом классе эталонных моделей), и систем с текущей идентификацией динамических характеристик объекта и возмущений внешней среды, получивших название “идентификационные адаптивные системы”. В англоязычной литературе системы этого класса называются системами “непрямого адаптивного управления” (indirect adaptive control). В обзоре
[8] дается оптимистическая оценка возможностям практического применения БСНС, которым и до настоящего времени уделяется внимание в научной печати как основному принципу построения адаптивных систем.
Однако в последнее время появляется критические оценки развитых подходов к построению систем адаптивного управления [84, 31]. В основе критического отношения лежит очевидный факт несоответствия теоретических результатов их практической значимости. Достаточно сказать, что в составе программнотехнических комплексов лишь очень немногих ведущих фирм мира заявляются адаптивные контроллеры, а случаи уверенного использования адаптивных регуляторов в промышленной практике встречаются еще реже.
Особо следует остановиться на теории адаптивных систем, разработанной в середине 60х годов прошлого столетия Я. З. Цыпкиным. Им был выдвинут подход к решению задач адаптации, в основу которого положены вероятностные итеративные методы оптимизации целевых функционалов [88, 89], используемые для решения внешне различных технических задач. “Алгоритмический” подход к синтезу алгоритмов управления в реальном времени, в темпе протекания процессов в объекте положил начало бурному потоку работ по теории адаптивных систем, использующей вероятностные итеративные алгоритмы (см., например, обширный обзор публикаций, приведенных в [50]). Стоит отметить при этом, что итерационный процесс адаптации постулировался как необходимый еще в работах Р. Беллмана [118, 343, 119] (см. с. 45).
Немалые надежды, возлагавшиеся на новый механизм адаптации в виде вероятностных итеративных методов, нашли свое отражение и в формировании самого определения адаптивности. Если адаптивность по Дж. Тракселу, Р. Беллману и Л. Заде приводила к идентификационному механизму адаптации с использованием теории статистических решений, то “алгоритмический” подход по Я. З. Цыпкину в принципиальном плане расширяет применение этой теории (“адаптивный байесовский подход” [89]) до возможной реализации класса самообучающихся систем классификации и распознавания и в конечном итоге, класса самообучающихся систем управления. На 2м Ленинградском симпозиуме по теории адаптивных систем (30 января 2 февраля 1974 г.) Я. З. Цыпкиным была выдвинута концепция адаптивного управления в динамической системе как процесса асимптотического приближения
а) неопределенности ситуации (уравнений объекта, ограничений, недоступных для измерения возмущений среды);
б) неопределенности цели управления, достигаемой путем
в) рандомизированной стратегии управления.
Такая весьма общая концепция, очевидно, включает постановки задач адаптивного управления, сформулированные в более ранних работах Беллмана, Заде и Траксела, как частный случай. Иллюзия принципиальной разрешимости этой проблемы базировалась на тех возможностях, которые приписывались вероятностным итеративным алгоритмам адаптации. Несмотря на то, что конструктивного развития такая концепция не получила, содержательная составляющая этого подхода в полной мере до сих пор не оценена.
Обстоятельный обзор методов синтеза адаптивных систем управления нелинейными объектами по выходу содержится в статье [13], хотя уже в ранних работах Р. Беллмана, К. Фу и других авторов постановка задачи адаптивного управления и предлагаемый подход к ее решению также не ограничивалась линеаризованными моделями объектов. В классе самонастраивающихся систем математически строгая постановка задачи адаптивного управления [91], которая была приведена выше, распространяется и на класс нелинейных объектов.
Как вытекает из приведенного обзора логических и формальных постановок задач адаптивного управления, проблема адаптации исторически возникла в контексте задач оптимизации поведения систем. С другой стороны, к настоящему времени сложилась упоминавшееся выше общепринятое разделение адаптивных систем на системы прямого адаптивного управления и системы идентификационного типа. Подобное деление, однако, не в полной мере позволяет определить специфику методов синтеза самих алгоритмов адаптации в зависимости от математического аппарата решения исходной оптимизационной задачи.
Поэтому с появлением формальной параметрической постановки В. А. Якубовича [91], развитой впоследствии в работах [82, 84], в дополнение к общепринятой классификации было бы естественно различать методы решения задачи адаптивного управления в зависимости от типа параметризации математических моделей в самой постановке задачи – задачи с выпуклой и линейной параметризацией и задачи с невыпуклой, нелинейной параметризацией. Кроме того, как отмечается Я. З. Цыпкиным в предисловии к монографии [90], логично разделять методы синтеза адаптивных систем и по способу выбора целевого критерия – эвристическое задание цели управления в виде достаточно произвольного функционала и согласованный выбор целевого критерия и закона управления с динамикой самого объекта. Принимая во внимание высказанные соображения, приведем краткую классификацию методов синтеза адаптивных систем в соответствии с предложенными критериями.
Следуя работе [13], рассмотрим основные методы синтеза адаптивных систем управления нелинейными объектами в сформулированной выше постановке В. А. Якубовича.
Согласно [91] в процессе синтеза сначала находятся уравнения (алгоритмы) регулятора объекта для принятой модели с использованием какоголибо метода теории управления, а затем алгоритм настройки его параметров. Это – общепринятый в настоящее время подход к синтезу адаптивных систем. Решение первой задачи базируется на применении методов теории управления нелинейными динамическими объектами, описываемыми в классом дифференциальных уравнений общего вида. Типовым частным случаем является аффинная по управлению нелинейная модель:
x=f (x,θ,t)+g(x,θ,t)u; y =h(x,θ,t),
где u,y – скалярные функции управления и выхода объекта соответственно.
Конструктивные результаты в теории адаптивных систем управления в постановке В.А. Якубовича, полученные для аффинных по управлению нелинейных моделей объекта, приведем ниже.
1. Метод скоростного градиента. Метод скоростного градиента впервые был предложен А. Л. Фрадковым в работе [83] и развит впоследствии в [82, 84]. Основная идея метода состоит в рассмотрении процесса адаптации как задачи минимизации мгновенного значения скорости изменения целевого функционала Q(x,t) : Rn × R+ R (с учетом знака). Управление u ищется в классе функций вида
→
u = u(x,θ,t), где ˆ
ˆθ – вектор параметров обратной связи. Изменение параметров задается пропорционально градиенту скорости изменения Q(x,t):
θ =−Γ ∂ˆˆ
ˆ∂ dQ(x(t),t) =−Γ ∂∂ ˆ∂Qx(x,θ,θ,t), Γ> 0,
θ dt θ
ˆ∂Q(x,t)
ˆ
∂Qx(x,θ,θ,t)= g(x,θ,t)u(x,θ,t).
∂x
При условии выбора целевого функционала Q(x, t) в виде дифференцируемой, ограниченной снизу и неограниченной сверху (по состоянию) функции, отрицательность его производной по времени d/dtQ(x, t) на полубесконечном интервале [t, ∞), t > t0 будет означать устойчивость по Ляпунову всей системы. Следует отметить, что на практике устойчивость по Ляпунову достигается лишь в расширенном пространстве состояний Rn ×Ωθ. Стремление же целевого функционала к минимально возможному значению происходит в асимптотике при t →∞. Критическими условиями работоспособности метода являются:
– условие выпуклости скорости изменения целевого функционала по настраиваемым параметрам ˆ
θ:
ˆˆˆ
θˆ
(ˆ −θ) ∂ ∂Qx(x, θ, θ, t) ≥∂Qx(x, θ, θ, t) −∂Qx(x, θ, θ, t);
∂ˆ
θ
θ(∂Qx(x, θ, θ, t)) от неизвестных a priori параметров θ;
ˆ
раметров ˆ
θ функции управления u(x, θ, t), которые удовлетворяют условию асимптотической устойчивости по Ляпунову для исходной системы.
форм нелинейных объектов и метода обхода интегратора, является совмещение задачи синтеза нелинейного закона управления и синтеза алгоритма адаптации этого закона “адаптивный обход интегратора”. В настоящее время получили развитие различные подходы к реализации “адаптивного обхода интегратора”.
В обоих методах возникает проблема компенсации возмущающего влияния ошибок: в первом методе – ошибки оценивания состояния; во втором – ошибки наблюдения. Для этого в первом случае в синтезируемый по методу ОИ закон вводятся дополнительные компенсирующие поправки, содержащие частные производные, возводимые на каждом шаге в квадрат. Поэтому возникает проблема чувствительности к коэффициентам при таких поправках. Во втором случае для компенсации необходимо введение дополнительных демпфирующих обратных связей.
Перечисленные методы синтеза нелинейного адаптивного управления гарантируют достижение главного качества – устойчивости адаптивной системы в расширенном пространстве состояния, включая векторы настраиваемых параметров и оценок вектора состояния. Подобное расширение и отсутствие доказательств факта асимптотической устойчивости в расширенном пространстве состояния (за исключением, пожалуй, линейных систем некоторого класса и нелинейных систем при условии постоянного возбуждения [250, 268]), побуждает к неизбежной критике качества переходных процессов в таких системах, т. к. стремление к нулю целевого функционала вытекает вовсе не из теоремы Ляпунова об асимптотической устойчивости, а из леммы Барбалата, которая, в свою очередь, не дает явных оценок ни скорости сходимости, ни максимальных отклонений от целевой траектории.
Помимо нетривиальности решения задачи синтеза на основе канонических форм нелинейных моделей объекта, остается нерешенной проблема чувствительности синтезируемых адаптивных алгоритмов к неизбежному отличию исходных нелинейных уравнений объекта от используемых на практике упрощенных моделей. Ведь именно по этой причине алгоритмы адаптивного управления, синтезированные для линейных моделей, зачастую неработоспособны на реальных объектах. Кроме того, сами по себе условия существования непараметрического преобразования в канонические формы нельзя называть слабыми и легко проверяемыми.
Наиболее полно аналитические методы решения задачи адаптивного управления в постановке В. А. Якубовича, интегрирующие состояние теории адаптивного управления, вплоть до настоящего времени, изложены в книге [38]. По оценке ее авторов, наиболее совершенная стратегия адаптивного управления состоит в одновременном изучении объекта в режиме нормальной эксплуатации и управлении им. Такой закон управления можно в общем случае записать в виде векторных уравнений:
ˆ
u = U(y, θ,t);
,
ˆˆ
θ = Θ(y,θ,t)
где ˆ– оценка вектора неопределенных факторов модели объекта управления.
θ ∈ Ωθ
В зависимости от возможного физического смысла, который имеет, можно выделить три типа неопределенности математической модели управляемого объекта:
1) функциональная неопределенность, означающая, что θ является неизвестной функцией в классе Θ(x,u,t);
2) сигнальная неопределенность, когда θ = θ(t) –неизвестная функция времени;
3) параметрическая неопределенность, когда θ – вектор неизвестных квазистационарных параметров заданной математической модели объекта.
С начала 70х годов и по настоящее время решение задачи адаптивного управления шло по пути аналитического синтеза алгоритмов в классе приведенных выше векторных уравнений с неопределенностью типа 3), чаще без учета внешних возмущений на объект и при условии, что динамика реального объекта адекватна принятому динамическому порядку используемой модели, т.е. отсутствует немоделируемая динамика. В значительно меньшей степени рассматривались ситуации, когда такие идеальные условия работы реального объекта не выполнялись. Результатом этих исследований в рамках тех же методов синтеза адаптивных алгоритмов, которые были получены для идеальных условий работы, явились, так называемые, робастные алгоритмы адаптации. Практически неизбежное присутствие немоделируемой динамики, а также нарушение условий согласования и относительная степень ρ ≥ 2 объекта (линейного, нелинейного) порождают немалые математические проблемы синтеза адаптивных законов управления. Можно с уверенностью сказать, что именно перечисленные факторы, нарушающие расчетные, идеальные условия применимости столь же идеальных адаптивных алгоритмов, являются одной из причин неудачных попыток применить эти алгоритмы на практике.
С другой стороны, выполнение условия согласования дает возможность реализации компенсационного механизма подавления возмущенных движений в системе. В обычных, неадаптивных системах, примером такого рода компенсации служат инвариантные системы, где организуются дополнительные каналы передачи возмущенного движения с такими динамическими характеристиками, что в требуемой точке системы суммарное действие возмущений и компенсирующих воздействий равно нулю или допустимо малому значению. Напомним, однако, что такое решение будет реальным при одинаковых порядках динамики модели и реального объекта. В адаптивных системах компенсационный механизм реализуется в пространстве параметров принятой модели объекта и настраиваемых параметров адаптивного регулятора. Очевидно, что в силу неизбежных отличий нелинейных уравнений реального объекта от его заданной параметризованной модели, условия компенсации вряд ли могут быть выполнены.
В [38] справедливо отмечается, что нарушение условий согласования не означает, что возмущенные движения в системе, порождаемые неопределенностью динамики объекта 1) 3), не могут быть компенсируемыми. В обоснование этой мысли положены довольно сложные аналитические методы синтеза алгоритмов, для чего используются специальные параметризованные модели объекта и метод адаптивного обхода интегратора. Этот метод, однако, столкнулся с принципиальной трудностью по обеспечению устойчивости траекторий движения в системе в условиях ненулевых возмущений и при относительной степени объекта более, чем единица. Для преодоления возникающих проблем были разработаны еще более сложные и изощренные алгоритмы адаптации для компенсации влияния неопределенных факторов (в частности, группа алгоритмов адаптации с расширенной ошибкой (R. Monopoli (1974),
A. Morse (1980))), применение которых даже для целей компьютерного моделирования становится проблемой и врядли приближает разработчика к практическому их использованию в реальных условиях даже для управления одномерными объектами.
Так, использование алгоритма с расширенной ошибкой в системе асимптотического слежения за эталонной моделью выхода линейного объекта третьего порядка с одним интегрирующим звеном и тремя коэффициентами, которые априорно полагаются неизвестными, приводит к структуре адаптивного регулятора, динамический порядок которого равен 29 [38]. При этом предполагается, что внешние возмущения отсутствуют. Очевидна неадекватность решения проблемы адаптации на основе линейно параметризованных моделей объекта и воздействий внешней среды реальным задачам управления.
Задачи адаптивного управления системами нелинейной параметризацией неопределеностей порождают обособленную область проблем в существующей теории адаптивных систем. Перечисленные выше сложности теории, неизбежно возникающие уже для линейно параметризованных моделей, усугубляются нарушением принципа суперпозиции по параметрам векторного поля в правой части дифференциального уравнения модели. Поэтому “параметрическая” нелинейность математических моделей физических явлений зачастую приносится в жертву удобству работы с линейно параметризованными моделями. Все методы адаптивного управления, рассмотренные ранее, за исключением метода скоростного градиента [83] в постановочной части так или иначе предполагают линейную параметризацию модели обобщенного настраиваемого объекта. Известный метод скоростного градиента, в общем случае сформулированный для нелинейно параметризованных систем, требует выполнения условия выпуклости по параметрам производной по времени целевого функционала, что не всегда выполняется даже для моделей с выпуклыми по параметрам правыми частями. Нарушение условия выпуклости сводит “на нет” эффективность метода для синтеза адаптивных регуляторов нелинейных динамических объектов.
Несмотря на потенциальные сложности в отношении моделей с нелинейной параметризацией для адаптивного управления в рамках существующей общепринятой логики синтеза адаптивных систем, физика самого исследуемого явления зачастую диктует необходимость их применения и, следовательно, актуальность.
На сегодняшний день предложен ряд подходов к синтезу адаптивного регулятора, в той или иной степени работоспособных для различных классов нелинейных объектов. Большинство из них базируется на идее демпфирования нелинейно параметризованной функции в правой части модели объекта линейно параметризованными функциями регулятора. В качестве примера отметим работы [231, 230, 148, 123]. В русскоязычной литературе и несколько ранее эта идея впервые была высказана и исследована В. В. Путовым [48]. Хотя в явном виде такая трактовка полученного научного результата им самим и не приводится, она становится очевидной, если рассматривать нелинейно параметризованные функции в правой части как функциональную неопределенность, удовлетворяющую условиям мажорирования.
Отдельно следует отметить работу [206], где дается локальное решение задачи адаптивного управления системами с нелинейной параметризацией. Локальность решения в данном случае означает, что для любого значения параметра θ ∈ Ωθ существует такая окрестность Vθ(θ) ⊂Ωθ точки θ и алгоритм адаптации, синтезированный для линеаризованной по параметру модели, который гарантирует достижение цели управления для любого ˆ
θ(0) ∈V(θ).
Следующая группа методов базируется на синтезе минимаксного адаптивного управления для класса параметризованных моделей объекта по ошибке [233, 212, 96]:
ˆ
ec = −kec + f(x,θ) −f(x,θ) + ua(t),
где k∈R+, k>δ= const, δ∈R+, f : Rn ×Ωθ → R, f ∈C0 , f ограничена и удовлетворяет условию Липшица по θ, функция ua : R+ R – т. н. регуляризационный
→
член. Краткое обоснование этого метода приводится в приложении 1.
ˆ
Идея такого управления состоит в синтезе алгоритма адаптации θ= ecω∗, который удовлетворяет критерию:
ˆ
ω∗ = arg min max sign(eε)J(ω,θ,θ),
ωθ∈Ωθ
где
1,y≥1
c
eε = ec −εSe , S(y) = y, −1 <1
ε
−1,y≤−1
и
ˆˆˆ
J(ω,θ,θ) = f(x,θ) −f(x,θ) + (θ −θ)T ω.
При этом управление ua(t) выбирается таким образом, чтобы обеспечить выполнение неравенства:
c ˆ
eεSe ua(t) + eεJ(ω∗,θ,θ) ≤0.
ε
Следует отметить, что алгоритмы этого типа остаются демпфирующими в силу последнего неравенства, т. к. основным их отличием от метода мажорирующих функций является лишь то обстоятельство, что демпфирующая добавка ua(t) выбирается “оптимальным” образом согласно минимаксной оптимизации. При этом для успешного разрешения такой оптимизационной задачи требуется заранее знать область возможного изменения параметров θ модели, что само по себе не является значимым ограничением. Однако следует понимать, что увеличение области допустимого изменения параметров в этом случае автоматически влечет к тому, что верхняя граница модуля ua(t)увеличивается и, следовательно, демпфирующий член играет все
||
большую и большую роль в обеспечении устойчивости по Ляпунову расширенной системы.
По своему содержанию, таким образом, алгоритмы [233, 212, 96] остаются демпфирующими и врядли существенно разрешают принципиальную проблему параметрического адаптивного управления в невыпуклом случае.
1.3.3. Метод аналитического конструирования агрегированных регуляторов и принцип инвариантного погружения в задачах адаптивного управления
Метод аналитического конструирования агрегированных регуляторов(метод АКАР) был разработан проф. А. А. Колесниковым в 80 – 90е годы прошлого столетия и в последующем развивался им в контексте синергетической теории управления [26, 27]. Базовые положения этого метода позже легли в основу метода адаптивного управления на многообразиях [62, 76, 311].
Ключевая идея теории А. А. Колесникова состоит в том, что управление осуществляется в пространстве состояний объекта с использованием т. н. макропеременных ψi : Rn → R, ψi ∈ C1 , i =1,...,r, r ≤ n, равенство нулю которых задает желаемые инвариантные многообразия. Сам термин “инвариантные многообразия” вводится через определение фазового потока x(t,x0,t0), как отображения начального состояния x0 ∈Rn,t0,t ∈R+ в состояние x(t) в момент времени t. Для удобства обозначений фазовый поток системы x= f (x,θ,u,t) в дальнейшем будем обозначать символом xf (t,x0,t0).
Определение 1.3.1. Множества S ⊂Rn называются инвариантными по отношению к потоку xf (t,x0,t0), если
xf (t,x0,t0) ∈S
для любых x0 ∈S для всех t > t0.
Следуя определениям А. А. Колесникова, желаемые инвариантные многообразия
– это состояния исходной динамической системы, которые удовлетворяют технической цели управления и одновременно являются наиболее естественными состояниями самого объекта. Привлекательной особенностью метода АКАР является отсутствие необходимости задавать знакоопределеные целевые функционалы и включение информации о естественных (или желаемых) динамических состояниях объекта непосредственно в целевую функцию.
В качестве критерия достижения цели управления предлагается использовать свойство аттрактивности целевых многообразий. Термин аттрактивность в [26] понимается в рамках стандартного определения аттрактивности множества [173].
Определение 1.3.2. Множество Aназывается притягивающим (аттрак
тивным), если
1) оно замкнутое, инвариантное и
2) для некоторой окрестности Vмножества Aи для всех x0 ∈Vвыполняются следующие предельные соотношения:
(1.1)
x(t,x0) ∈V ∀t ≥0; lim x(t,x0)A = 0. (1.2)
t→∞
В англоязычной литературе близким к методу АКАР можно считать метод инвариантного погружения [106] или метод immersion and invariance (следуя авторам этой статьи, для краткости будем называть его методом I&I). Этот метод построен на использовании таких категорий, как погружение и инвариантность и, в принципе, не требует априорного задания класса функций Ляпунова для процедуры синтеза. Метод не требует в явном виде ни выполнения условий непосредственной компенсации, ни линейной параметризации объекта.
Несмотря на идейную близость метода I&I к методу АКАР, они существенно различаются по формальному содержанию. Эта разница состоит в том, что задача синтеза регулятора в методе АКАР трансформируется в две задачи. Вопервых, в задачу отыскания ”подходящего инвариантного многообразия”
x =π(ξ),ξ ∈ Rp,π:Rp Rn ,
→
допускающего задание в неявном виде:
{x ∈ Rn,φ(x)=0x =π(ξ)}|
и инвариантного вдоль решений уравнений замкнутой системы. Вовторых, управление должно быть выбрано таким образом, чтобы многообразие φ(x) = 0 было аттрактивным. Следует отметить, что обе эти задачи в работе [106] не решаются, в отличие от теории А. А. Колесникова. Более того, аттрактивность и инвариантность целевого многообразия вводятся в качестве предположений. Доказывается, однако, что эти предположения могут быть достаточными для решения задачи асимптотической стабилизации заданного положения равновесия. Этот результат сформулирован в приводимой ниже теореме [106]
Теорема 1.1. Рассматривается класс аффинных по управлению нелинейных систем:
x=f (x)+g(x)u, (1.3)
где x ∈ Rn , u ∈ Rm; x∗ ∈ Rn – стабилизируемое положение равновесия системы с регулятором. Предполагается существование дифференцируемых требуемое число раз функций
Rm
α:Rp Rp,φ:Rn Rn−p,π:Rp → Rn,ψ:Rn × Rn−p Rm ,c:Rp
→→ →→
и выполнение следующих условий: 1) Существование целевой системы
ξ=α(ξ),
глобально асимптотически устойчивой в точках ξ∗ =π(x∗). 2) Условие погружения: для всех ξ выполняется равенство
∂π(ξ)
f (π(ξ))+g(π(ξ))c(π(ξ))= α(ξ).
∂ξ
3) Для ξ ∈ Rp существует неявное многообразие x = π(ξ), эквивалентное φ(x)=0 для x ∈Rn .
4) Аттрактивность многообразия и ограниченность решений. Все траектории системы
∂φ(x)
z= (f (x)+g(x)ψ(x, z)),
∂x x=f (x)+g(x)ψ(x, z)
ограничены и z → 0при t →∞. Тогда x∗ – глобально асимптотически устойчивое положение равновесие системы (1.3).
В работе [106] вводится понятие ”адаптивная стабилизируемость” при условии инвариантного погружения. Для формулировки этого понятия используется гипотеза:
Предположение 1.1. Существует параметризованная функция Ψ(x, θ): Rn ×Ωθ → Rm, такая, что для неизвестного θ ∈Ωθ система
x=f ∗(x)=f (x)+g(x)Ψ(x, θ)
имеет глобально асимтотически устойчивое положение равновесия x =x∗.
Приведенная гипотеза в содержательном смысле эквивалентна условию достижимости в методе скоростного градиента [82, 84, 13, 38] за исключением того, что функционал, фигурирующий в условии достижимости в методе скоростного градиента, здесь a priori не задается.
Определение 1.3.3. Система (1.3) в предположении 1.1 называется адаптивно стабилизируемой при условии инвариантного погружения, если расширенная система
x=f (x, θ)+g(x)Ψ(x, β1(x)+ˆ
θ),
(1.4)
ˆ
ˆ
θ =β2(x, θ)
стабилизируема при условии инвариантного погружения вдоль решений целевой системы
ξ=α(ξ).
Необходимо отметить, что отличием от стандартных подходов является лишь тот факт, что в качестве настраиваемого параметра используется вектор ˆ
θ +β1(x).
Решение задачи адаптивного управления по [106] с использованием теоремы осуществимо при выполнении ряда ограничительных условий, которые для удобства выпишем вместе.
Приведенные результаты и краткий анализ работ [26, 27, 106] позволяют сделать следующие выводы.
1) Оба направления являются первой попыткой формулировки задачи адаптивного управления на многообразиях в нелинейных динамических системах и, в частности, в классе моделей с параметрической неопределенностью.
2) Отмечая близость предлагаемого в [106] метода к методу аналитического конструирования агрегированных регуляторов в синергетической теории управления [27], следует сделать вывод, что в отличие от метода АКАР, где конечным результатом синтеза является оптимальный закон управления нелинейным многомерным объектом, результатом метода I&I является лишь доказательство существования стабилизирующего закона управления для принятого класса нелинейного объекта и определение параметрического алгоритма адаптации. С другой стороны, если теория А. А. Колесникова включает концептуальное, по меньшей мере, решение задачи выбора целевых многообразий (аттракторов) и метод синтеза оптимальных законов управления, переводящих исходную систему на целевые многообразия, то в методе I&I решение этих задач отсутствует. Следует также отметить, что в известном смысле оба метода дополняют друг друга. Метод АКАР дает решение задачи конструирования нелинейных оптимальных регуляторов, а метод I&I обосновывает достаточность этого решения при одинаковых для обоих методов ограничений для асимптотической адаптивной стабилизации положения равновесия на целевом многообразии.
3) Попытка авторов работы [106] уйти от параметрического управления и от идеологии “непосредственной компенсации” как рабочего принципа современной теории адаптивного управления оказывается не столь успешной, как это заявляется в работе. Все сформулированные результаты опираются именно на условие компенсации или в общем случае – на условие достижимости. Поэтому о решении задачи непараметрического управления или о ее постановке в рамках метода говорить пока преждевременно.
4) Несмотря на то, что в [106] утверждается возможность применения адаптивных алгоритмов для нелинейно параметризованных регуляторов, посуществу, используется линейно параметризованная модель, что входит в противоречие с выводами ее авторов. Тем не менее, несомненная ценность работы состоит, на наш взгляд, в формировании нового подхода в англоязычной литературе к синтезу адаптивных систем как специального класса нелинейных динамических систем, не опирающемуся на использование класса параметризованных моделей объектов, и принимающего концепцию адаптацию динамической системы по состоянию.
1.4. Проблемы адаптивного управления нелинейными объектами
Приведенный анализ постановок задач и методов адаптивного управления динамическими объектами, начиная с работ Беллмана [117, 119] и заканчивая современными результатами [219, 191, 38, 27, 106], позволяет сформулировать ряд актуальных и до сих пор нерешенных проблем современной теории адаптивного управления.
Первый круг проблем – это проблемы определения самого свойства адаптивности в управляемых системах. Тезис о том, что любая система, которая может быть спроектирована с точки зрения принципа приспособления является адаптивной (Дж. Траксел) недостаточно формализован и вместе с тем неоднозначен, чтобы быть полноценным определением. С другой стороны, известные постановки задачи Л. Заде [343], В. А. Якубовича [91, 82], определившие направление исследований на несколько десятилетий вперед, не выходят за рамки трактовки адаптивности как особого поведения выхода системы в при неопределенности математической модели в заданном класса. Такое определение адаптивности приводит к естественным противоречиям, отмеченным, в частности, в предисловии к тематическому выпуску журнала System & Control Letters по адаптивным системым за 2003 год [281]. В [281] подчеркивается, что адаптивность, с одной стороны, и уменьшение неопределенности со временем, с другой стороны, никак не отражается в самой задаче адаптивного управления.
Формализация задачи адаптивного управления привела к выхолащиванию самого понятия адаптивности. Трактовка адаптивности лишь как приспособление, но не как приспособление наилучшим (в смысле какоголибо критерия) образом разрушает границы между обычной задачей управления по выходу и задачей адаптивного управления. Иллюстрацией этого утверждения является постановка задачи регулирования по выходу, приведенная в работе [127]. Модель объекта задается системой
x= f (x,ω,u);
ω = S(ω);
, (1.5)
y = k(x,ω),
e = h(x,ω),
где y ∈ Rp – вектор измерений, e ∈ Rq – вектор регулируемых величин, u ∈ Rm – функция управления, ω(t,ω0,t0) – сигнал возмущений, заданный решениями системы дифференциальных уравнений
ω = S(ω), ω(t0) = ω0.
Функции f ,h,k,S предполагаются Ckгладкими. Целью управления является обеспечение предельного соотношения
lim e(t) = 0 (1.6)
t→∞
для любых x(t0) ∈ Rn и ω(t0) ∈ Ωω ⊂ RT . Формально задача (1.5),(1.6) ставится как решение проблемы регулирования в условиях неизмеряемых вомущений с известной моделью. Хотя явным образом в работе [127] термин “адаптация” и не используется, сама постановка задачи укладывается в рамки задачи В. А. Якубовича, где адаптивность предполагается в классе решений подсистемы, моделирующей влияние возмущений. Таким образом, формализация адаптивности в терминах поведения выхода системы приводит к тому, что задача адаптивного управления поглощается целиком задачей управления по выходу. Интуитивно понятно, однако, что приспособление в адаптивных системах следует понимать не только в терминах свойств выхода системы, но и в терминах повышения ее эффективности со временем (что согласуется с критическими замечаниями в [281]). Следовательно, очевидна необходимость коррекции самого понятия адаптивная система с привлечением критериев оценки эффективности/оптимальности системы во времени.
Второй класс проблем – это проблема целей адаптивного управления. Стандартная постановка задачи адаптивного управления допускает целевые множества, определенные в виде неравенств
Q[x(τ),u(τ),0 ≤ τ ≤ t] ≤ Δ, ∀ t > t∗.
Зачастую целевые функционалы Q(·) задают в виде знакоопределенных функций состояния. Более того, в большинстве случаев [254, 191, 84, 38], несмотря на относительную широту класса целевых функционалов в постановке задачи, сами алгоритмы адаптивного управления требуют, чтобы целевой функционал обладал следующими свойствами:
1) Q(x,t):Rn × R+
→ R+, Q ∈ C1;
2) limx→∞ Q(x,t)=∞, ∀ t ∈ R+;
3) Q(0,t)=0(для задачи регулирования в начало координат).
Дополнение этих свойств условием достижимости (для алгоритма скоростного градиента [83, 84] и симметричным условием в [254] для градиентных алгоритмов) автоматически влечет требование о знании функции Ляпунова для системы с идеальным регулятором основного контура. Знание функции Ляпунова для невозмущенной (в отсутствие параметрических возмущений) системы является, таким образом, необходимым условием построения адаптивного регулятора для стандартных методов синтеза. В этой связи следует отметить работу [269], где предлагается схема адаптивного управления, не требующая знания функции Ляпунова с отрицательно определенной производной по времени (в условии достижимости). Допускается знание лишь того, что эта функция существует и обладает рядом свойств качественного характера. Требование известности функции Ляпунова с отрицательно определенной производной по времени заменяется на требование знания функции Ляпунова, обеспечивающей устойчивость невозмущенной системы. Однако несмотря на очевидные достоинства, эта схема имеет и ряд недостатков. Это, прежде всего, мультипликативный рост размерности регулятора в зависимости от размерности вектора неопределенности и требование глобальной асимптотической устойчивости (единственного) целевого множества в системе с регулятором основного контура при отсутствии параметрических возмущений.
Требования существования функции Ляпунова для системы с идеальным регулятором основного контура существенно сужает a priori и класс допустимых целевых движений в адаптивной системе. Так, в частности, неустойчивые и неравновесные режимы не могут выступать в роли целевой динамики для стандартных методов адаптивного управления. С другой стороны, например, физические процессы в лазерах (мультистабильность, нерегулярность решений) [314, 135, 136, 137], химических реакторах (уравнение реакциидиффузии), метаболических сетях, биологических организмах, социальных системах [110, 155, 273, 180, 149, 244, 141, 111, 40, 41] являются примерами систем, в которых такие режимы – естественное динамическое состояние. Отметим и процессы, изоморфные знаменитому “феномену бабочки”, открытому Э.Н. Лоренцом еще в 1963 году [234]. Cущность этого феномена состоит в том, что малейшие возмущения могут оказывать существенное влияние на решение системы. Этот факт сформулирован в известном тезисе Лоренца о влиянии воздушного потока от крыльев бабочки на ураганы, возникающие на удалении в тысячи миль от нее. К классу задач, допускающих неустойчивые по Ляпунову режимы нормального функционирования, следует отнести и проблему управления бифуркациями [215], где целевыми движениями могут быть неустойчивые и хаотические колебания [173], задачи промежуточной (от англ. – intermittent) и перемежающейся, странствующей (от англ. – itinerancy) синхронизации [204] в системах параллельной аналоговой обработки информации [329, 203, 201, 202].
Все эти процессы не удовлетворяют условиям глобальной устойчивости по Ляпунову и, следовательно, не допускают адаптивного управления стандартными методами без привлечения дополнительных средств регуляризации. Часто таким регуляризирующим средством является введение эталонной модели и дополнительной обратной связи, выполняющей роль стабилизирующего управления по ошибке. Таким образом, осуществление адаптации ставится в прямую зависимость от знания эталонных движений и учета их в функции адаптивного управления. С другой стороны, введение дополнительного стабилизирующего управления по ошибке не всегда возможно и целесообразно (рост размерности системы и как следствие потенциальное понижение качества переходных процессов). Поэтому возникает необходимость в распространении методов адаптивного управления на системы с неустойчивыми по Ляпунову целевыми режимами.
Третья группа проблем современной теории адаптивного управления – это проблемы качества адаптивных систем. Большинство алгоритмов адаптивного управления [82, 84, 38, 291, 292, 254, 219] гарантируют лишь устойчивость по Ляпунову адаптивной системы в расширенном пространстве состояний X⊂Rn ⊕Rd ⊕Rr , включающем настраиваемые параметры ˆ
θ ∈Rd и состояние наблюдателя ξ ∈Rr . При этом зачастую игнорируется тот факт, что свойство устойчивости по Ляпунову гарантирует лишь малость отклонений от положения равновесия при условии малых возмущений. С другой стороны, адаптивные постановки задачи управления в условиях неопределенности оправданы лишь при относительно больших по норме параметрических возмущениях (см. например, работу [162], где иллюстрируется этот тезис на примере методов обхода интегратора). Таким образом, факт устойчивости по Ляпунову адаптивной системы не является показателем качества переходных процессов. Более того, в тех случаях, где устойчивость по Ляпунову является единственной характеристикой системы в дополнение к достижению цели управления на полубесконечном интервале времени, есть все основания усомниться в адекватности (или успешности) применения самого метода функций Ляпунова для синтеза адаптивного управления.
В качестве практически обоснованной меры качества адаптивной системы управления поэтому традиционно считается свойство асимптотической устойчивости по Ляпунову [292], что выражается в робастности к малым возмущениям и приемлемом качестве переходных процессов2. В адаптивных системах асимптотическая
2См. также [72], где в дополнение к устойчивости вводится и анализируется важное в практическом отношении понятие времени адаптации
устойчивость по Ляпунову и, как следствие, желаемые робастность и качество достигаются за счет выполнения т. н. условия постоянного возбуждения [227, 250](от англ. persistently exciting) или предельной невырожденности. Формально для линейного регрессора
f(x, θ) = φ(x)T θ, φ : Rn Rd (1.7)
→
это условие может быть сформулировано следующим образом:
Определение 1.4.1. Функция φ(x(t)) называется предельно невырожденной, если существуют такие числа T, δ > 0, что для любого t > 0 справедлива следующая оценка:
t+T φ(x(τ))φ(x(τ))T dτ ≥ δId. t
Для того, чтобы регрессор (1.7) удовлетворял свойству предельной невырожденности согласно определению 1.4.1, в общем случае требуется внешнее возбуждение вектора состояния системы, что не всегда возможно на практике. Отсутствие же свойства предельной невырожденности регрессора зачастую влечет невыполнение условий асимптотической устойчивости и, как следствие, к чувствительности к малым возмущениям и отсутствию асимптотической сходимости оценок вектора θ. Следовательно, требуются иные критерии для оценки качества адаптивных систем.
Большинство работ по прямому адаптивному управлению в отсутствие ограничительного требования предельной невырожденности регрессора используют в качестве косвенных показателей качества оценки верхних границ L2 и Lнорм сигналов x(t),
∞
e(t) или ˆ
θ(t) (см., например [191, 219]).
Анализ более совершенных критериев качества, таких, как интегральноквадратичный критерий, приводится в работах [163, 162]. В этих работах, однако, рассматривается либо слишком узкий класс нелинейных систем [163], либо приводится лишь сравнение между системами робастного и адаптивного управления [162] без предложения новых подходов к синтезу самих алгоритмов адаптации в контексте качества их динамического поведения. С другой стороны, известны эвристики, улучшающие качество переходных процессов в адаптивных системах. В частности, это методы адаптивного управления с множественными моделями, предложенные в работах [255, 256]. Кроме того, к числу методов, гарантирующих улучшенные показатели качества адаптивных систем следует отнести и метод обхода интегратора с функциями настройки (от англ. tuning functions) [217, 220]. В работе [218] утверждается, что нелинейный регулятор основного контура, вытекающий из метода адаптивного обхода интегратора уже для линейных моделей самого объекта управления, превосходит по качеству переходных процессов системы со стандартными адаптивными регуляторами для линейных систем. Однако формальные критерии качества (за исключением все тех же оценок верхних границ норм L2 и L∞ ошибок регулирования) в виде функционалов, вычисляемых в явном виде и a priori как функции областей допустимых начальных условий и параметрической неопределенности, в этих работах не вводятся.
Четвертый круг проблем адаптации порождается одной из главных проблем современной теории управления – проблемой получения адекватных с физической точки зрения и математически корректных моделей динамических объектов для синтеза заведомо грубых систем управления. Управление по выходу (адаптивное в том числе) использует математические модели физических объектов в классах дифференциальных уравнений. Это представляется естественным и очевидным. Первый шаг в сторону приближения линеаризованных моделей нелинейных по своей природе реальных объектов и систем состоит в использовании в задачах синтеза законов управления исходно нелинейных моделей в виде нелинейных дифференциальных уравнений. Однако и для таких нелинейных моделей в большинстве случаев информация о поведении системы традиционно формируется в виде измеряемых входов/выходов, т. е. используется первичная измерительная информация. В то же время известно, что фундаментальные свойства нелинейных систем определяются объективно существующими инвариантами (параметрами порядка в синергетике), образуемыми переменными состояния или совокупностью измеряемых переменных. В методе АКАР в качестве таких инвариантов выступают макропеременные, которые могут рассматриваться как целевые модели состояния динамической системы.
Проблема адекватной модели и информации о состоянии динамической системы – это и ограниченность классов моделей нелинейных динамических систем, формализуемых в терминах дифференциальных уравненийи и для которых получены теоретически (не говоря уже о практически) обоснованные методы и алгоритмы адаптивного управления. Прежде всего, это модели с линейной параметризацией неопределенности:
mT
f (x,θ)= φi(x)θi, φi :Rn Rn , θ =(θ1,θ2,...,θm).
→
i=1
К очевидным достоинствам таких моделей следует отнести широкий спектр алгоритмов и методов адаптивного управления, разработанных в предположении о линейности функции f (x,θ) по параметру [292, 291, 82, 254, 191, 38]. В частности, линейность модели по неизвестному параметру и как следствие – выполнение принципа суперпозиции – приводят к возможности распространения известных алгоритмов адаптивного управления по выходу для линейных систем [214] на классы нелинейных динамических систем [221, 241, 240, 260].
С другой стороны, значительное число физических процессов описываются нелинейными динамическими моделями с нелинейной параметризацией. Это, например, модели процессов в химических и биореакторах [123, 305], модели трения в механических [101, 102, 128, 267] и биомедицинских [290] системах, модели магнитного потока в индукционных моторах и магнитных подвесах [140, 261] электромеханические клапаны [276], модели управляемых процессов в двигателях внутреннего сгорания, силовых установках кораблей [109] и в перспективных силовых установках гидроводородного принципа действия [150].
Проблема адаптивного управления, где неопределенность математической модели задается нелинейной функцией параметров и состояния содержит и такой класс практически важных задач как адаптивное регулирование классом динамических систем. Эта задача по содержательному смыслу наиболее близка к проблеме одновременной стабилизации в классической теории управления [337, 122, 300, 169] и задаче адаптивного управления с множественными моделями [255, 253]. Принципиальная разница, однако, состоит в том, что вместо построения закона управления на основе анализа свойств локальных адаптивных регуляторов с линейной параметризацией, нелинейная постановка задачи позволяет проводить синтез системы управления и анализ ее свойств одновременно и в рамках единой теории.
Подавляющее большинство методов адаптивного управления объектами с нелинейно параметризованными моделями требуют либо введения демпфирующих управлений (компенсаторов нелинейности) [233, 96, 212], либо используют линейно параметризованные мажорирующие управления (доминирование нелинейности) [148, 231, 230, 123]. При этом в обоих случаях задача построения управляющей функции с нелинейной параметризацией не решается, но заменяется (за счет использования нелинейного демпфирования и мажорирования) на задачу отыскания управления с линейной параметризацией. Таким образом, в теоретическом плане подобные решения остаются в рамках прежней постановки задачи адаптивного управления с линейно параметризованной неопределенностью в замкнутом контуре. Платой за такую подмену является неизбежное понижение качества системы при естественном повышении энергетических затрат на управление (“чрезмерная” компенсация влияния нелинейности).
Необходимость в адаптивном управлении системами с нелинейно параметризованными моделями без привлечения механизмов мажорирования и линеаризации появляется в широком спектре задач обратной (инверсной) биоинженерии, физики и биологии. К таким задачам, прежде всего, следует отнести проблему синтеза систем технического зрения. Адаптация на уровне отдельного элемента здесь продиктована пространственной неоднородностью обрабатываемого изображения и дополнительно мотивируется результатами физиологических исследований [124, 335]. При этом математические модели классических и неклассических настраиваемых рецепторных полей искусственных нейронов в системах обработки визуальной информации как правило нелинейно параметризованы [143]. Использование мажорирующих функций в алгоритмах адаптации в таких системах автоматически влечет большие энергетические потери вследствие чрезмерной компенсации неопределенности при условии высокой плотности размещения элементов.
В задачах управления проблема недоминирующей адаптации особенно остра в приложениях, где систематическое перерегулирование по управлению приводит к быстрому износу исполнительных устройств, нежелательным вибрациям и перерасходу энергозатрат на реалзацию управляемого движения. Типичный пример такой задачи – это управление разгоном/торможением механических систем на колесах в условиях неизвестных и изменяющихся по ходу движения системы свойств дорожного полотна (коэффициента трения). Физически обоснованные математические модели трения в таких системах как правило нелинейны по параметрам [128, 267].
Такие теоретические открытия в физике и биологии, как перемежающаяся синхронизация [168, 203, 204, 202] и самонастройка клеток внутреннего уха в особое состояние на границе устойчивости3 [108, 199, 154] дополнительно подчеркивают необходимость изучения механизмов адаптации без привлечения демпфирования. Примером, иллюстрирующим практическую ценность самонастройки к критическим состояниям и экспериментально подтверждающим возможность технической реализации таких систем в режимах перемежающейся синхронизации, является работа [328]. Наконец, параметрическое управление самоорганизующимися критическими режимами – явлением, наблюдаемом в землетрясениях [325], нервной активности мозга человека [116], математическая модель которых в свою очередь описывается системой фазовых осцилляторов с нелинейным возбуждением [294].
Известные в литературе алгоритмы адаптации, не использующие вспомогательного демпфирования неопределенности, зачастую являются локальными [206] и представляют в этом смысле лишь теоретический интерес, как возможность распространения применимости адаптивного управления для модели с линейной параметризацией на классы моделей с нелинейной по параметрам неопределенностью при условии малых параметрических возмущений. Известные нелокальные результаты для систем с нелинейной параметризацией регулятора и модели [283] и методологически близкие к ним работы [188, 242, 243] для систем с нелинейной параметризацией модели, но с линейно параметризованным регулятором, как отмечают сами авторы [242, 243]: “являются лишь математическим доказательством возможности синтеза адаптивного регулятора и не имеют никакой практической ценности”. Кроме того, условия применимости алгоритмов адаптации в работах [283, 188, 242, 243] содержат
3Математические модели, наиболее точно описывающие это состояние, соответствуют бифуркациям Хопфа, где управляющим параметром служит концентрация ионов K+ и Ca2+, изменяющая мембранный потенциал клетки. Изменения мембранного потенциала, в свою очередь, инициируют нервные импульсы, исходящие от клеткидетектора звуковых колебаний.
ограничительное требование экспоненциальной устойчивости системы с регулятором основного контура (все параметры известны, адаптации нет), что существенно сужает область применимости (пусть и в исключительно теоретическом плане) результата. Из сказанного очевидна актуальность проблемы синтеза адаптивного управления для классов моделей с нелинейной параметризацией без привлечения доминирования и демпфирования в управлении и без использования гипотезы о малом диапазоне параметрических возмущений.
Пятый круг проблем – это проблемы реализации адаптивных регуляторов нелинейными динамическими системами. Суть этих проблем состоит в том, что условием разрешимости задач адаптивного управления нелинейными объектами является, вообще говоря, возможность реализации точно таких же возмущений самим регулятором. Этот тезис известен в литературе как принцип внутренней модели. В задаче адаптивного управления нелинейными объектами этот тезис выдвигался многими авторами. Так, например, в [308] показано, что уже для локального управления по выходу в нелинейных системах такая модель действительно необходима. Для линейных систем подобные результаты были получены в середине 70х годов прошлого столетия в работе [160]. Еще раньше этот же принцип, но с позиций общей теории систем, был обоснован в работе [138]. Таким образом, в силу того, что каждый физический объект с нелинейной динамикой по своему уникален, решение задачи адаптивного управления тоже оказывается уникальным и в этом смысле ограниченным классом доступных физических моделей исследуемых процессов. Другими словами, задача адаптивного регулятора в общем случае не поддается формальной типизации. Ситуация осложняется еще и тем, что сами модели возмущений не всегда известны даже с точностью до класса нелинейностей.
Таким образом, встает задача о выборе самой структуры адаптивного закона управления, в одной стороны удовлетворяющего принципу внутренней модели, а с другой – допускающей достижение целей управления.
1.5. Новый подход к решению проблемы адаптации в нелинейных системах
Анализ эволюции теории адаптивного управления – логических и математических основ адаптивного управления позволяет сформулировать (табл. 1) ключевые характеристики общепринятой или стандартной постановки задач и соответствующих условий их решения, в значительной степени ограничивающих возможность их использования для решения реальных и вместе с тем актуальных задач управления, и сравнительные характеристики нового подхода к решению проблемы адаптации в управляемых системах физическими объектами и процессами в условиях неопреде
Характеристика | Новая постановка | Стандартные постановки |
Адаптация | Асимптотическая компенсация влияния неопределенности с точностью до заданного функционального пространства | Сигнальнопараметрическая |
Цели управления | Достижение желаемых | Стабилизация по Ляпунову |
динамических состояний, в т. ч. неравновесных и неустойчивых | расширенной системы, отслеживание эталонных | |
по Ляпунову движений | (известных) траекторий | |
Целевые функции | Макропеременные, знание | В классе функций Ляпунова |
функций Ляпунова не требуется | ||
Качество | Мера качества процессов задается постановкой задачи в зависимости от физических свойств объекта. | Устойчивость по Ляпунову и ограниченность траекторий |
Модели объектов | Дифференциальные уравнения, | Дифференциальные уравнения |
отображения “входвыход” | (известные) | |
Классы | а) параметрическая; | a) параметрическая; |
моделируемых | б) сигнальная; | б) сигнальная; |
неопределенностей | в) функциональная; | в) функциональная; |
относительно уравнений | относительно уравнений | |
динамики макропеременных | модели объекта | |
Классы моделей | Допускаются нелинейно | Линейные по параметру |
неопределенности | параметризованные и невыпуклые | модели неопределенности |
модели неопределенности | ||
Адекватность | Сильная. Используются исходно | Слабая, модели упрощенные, |
моделей | нелинейные модели | “удобные” для используемых |
адекватные физической | методов синтеза | |
сущности самих объектов | ||
Реализация | Алгоритмы адаптации – | Каждой задаче соответствует |
алгоритмов | для классов нелинейностей; | уникальное решение |
управления | реализация законов управления – | |
на типовых элементах |
Для решения задач адаптивного управления в новой постановке в системах с неравновесной и неустойчивой целевой динамикой для широкого класса нелинейных динамических систем с использованием информации лишь качественного характера 4 прежде всего требуется:
1) описание исследуемых объектов на языке, не требующем точное знание диф
4К информации качественного характера в книге относятся макропеременные [26], возможность описания объекта дифференциальными уравнениями, оценки отображений “вход–выход” в заданных функциональных пространствах и т. д.
ференциальных уравнений самого объекта;
2) математический аппарат анализа соединений таких объектов (систем объектов) при условии возможной неустойчивости по Ляпунову положений равновесия, движений или целевых множеств в пространстве состояний объекта.
Искомый математический аппарат должен позволять формулировать принципы желаемой макроорганизации адаптивных систем управления в виде ограничений в функциональных пространствах на свойства отображений “входвыход”, “входсостояние” и макропеременные для управляемого объекта, регулятора и их соединений, выполнение которых:
1) гарантирует реализуемость, полноту и ограниченность состояний объекта и регулятора;
2) сохраняет все “типичные”, желаемые, полезные нелинейные эффекты управляемого объекта, включая мультии метастабильность, неустойчивость по Ляпунову, неравновесность;
3) устраняет нежелательное эффекты в самом объекте, нежелательное влияние среды, и влияние неопределенности информации об объекте для достижения целей управления.
Исходной информацией на данном этапе являются модели объекта с точностью до оценок отображений “входвыход” и “входсостояние” по нормам в заданных функциональных пространствах, а также принадлежность внешних сигналов (возмущений) к конкретным функциональным пространствам.
Полученные принципы и ограничения выступают в качестве основных требований к адаптивному регулятору в задаче синтеза конкретных законов адаптивного управления. Формулировка требований к адаптивному регулятору на языке ограничений в функциональных пространствах потенциально позволит снять проблему устойчивости по Ляпунову целевых движений. Задача синтеза адаптивного регулятора сводится в свою очередь к решению проблемы обеспечения выполнения конкретных функциональных ограничений в нелинейных системах при условии возможной нелинейной параметризации неопределенностей. Исходной информацией для решения задачи синтеза являются макропеременные, классы моделей неопределенности, а также модели объекта с точностью до дифференциальных уравнений целевой динамики и макропеременных.
Для эффективной и потенциально автоматизируемой практической реализации разработанных алгоритмов адаптивного управления нелинейными динамическими объектами требуется решение проблемы реализации полученных нелинейных законов в технических устройствах типовой и однородной архитектуры. В качестве подобных устройств в работе выбираются нейронные сети прямого распространения, математическими моделями которых служат суперпозиции нелинейных непрерывных функций заданного класса с настраиваемыми параметрами. Исходной информацией для решения задачи реализации являются классы нелинейностей модели объекта с точностью до дифференциальных уравнений целевой динамики и макропеременных, а также условия применимости разработанных алгоритмов управления.
Диаграмма, иллюстрирующая содержание задачи синтеза адаптивных систем в терминах требуемой информации об объекте, классов моделей (уровни описания объекта), необходимых методов анализа и синтеза, их взаимодействие и иерархия (с указанием конкретного раздела в рамках работы) представлена на рис. 1.2.
Рисунок 1.2. Содержание теории и методов адаптивного управления нелинейными динамическими объектами с применением нейронных сетей
Нетрудно видеть, что синтез адаптивных систем осуществляется согласно принципу последовательного раскрытия неопределенности [6] и в соответствии с новой содержательной постановкой проблемы адаптации в управляемых системах разбивается на разрешение трех групп проблем, соответственно излагаемых в разделах 2, 3 и 4.
1. Проблемы анализа и синтеза систем и их соединений с использованием минимально необходимой информации о самом объекте или системе. К такой минимально доступной информации об объекте в работе относятся свойства реальных управляемых объектов или процессов в виде исходно нелинейных уравнений “входвыход”, “входсостояние” объекта [344, 196] и макропеременные или параметры порядка таких объектов (процессов) [26, 27, 51]. В число рассматриваемых моделей реальных объектов включаются системы с неустойчивой по Ляпунову целевой динамикой. Кроме того, допускаются объекты с недоопределенными математическими моделями, в том числе, с немоделируемой динамикой. Результатом решения этой группы проблем являются методы анализа свойств соединений систем и принципы построения систем управления объектами в условиях неопределенности (разд. 2).
2. Функциональный анализ динамических систем
В разделе вводится формальное описание динамических систем в терминах отображений в функциональных пространствах или оператора в широком смысле этого слова. Подобное описание, задающее систему в терминах “входвыход”, оказывается наиболее полным для анализа общих свойств управляемых нелинейных систем. Свойства систем, как отображений в функциональных пространствах, в дальнейшем оказываются существенно важной информацией в задачах синтеза систем управления в общем случае и, в частности, синтеза систем управления с адаптацией.
Так, в частности, показано, что наиболее распространенные определения устойчивости (устойчивость инвариантных множеств по Ляпунову [223], устойчивость решений системы по Ляпунову, устойчивость от входа к состоянию, от входа к выходу и от выхода к состоянию, и наконец, устойчивость систем, заданных оператором [344]) эквивалентны свойству непрерывности некоторого функционального отображения, заданного над специфически определенными функциями входа, областью определения, и выхода, областью значений (теоремы 2.1, 2.3).
Реальные технические и физические системы, однако, не всегда могут быть описаны непрерывными отображениями. Для технических систем сам факт непрерывности отображения в точке в широком смысле слова означает возможность бесконечно близкого приближения к цели. На практике же требуются лишь достаточно близкие приближения. При этом колебания самого отображения в соответствующих окрестностях решений могут быть достаточно малой величины, хотя и не равными нулю. В теории динамических систем это соответствует, например, существованию устойчивого предельного цикла в окрестности положения равновесия. Кроме того, в системах с непрерывным оператором при условии, что множество входов не ограничивается лишь управлением и определяется дополнительно взаимодействием со средой (т. е. в открытых системах), свойство непрерывности оператора как отображения может нарушаться по части переменных.
Непрерывные отображения и отображения с ограниченным колебанием, вообще говоря, являются различными математическими объектами и методы анализа систем с непрерывным оператором не могут быть автоматически распространены на новые объекты. Поэтому для описания (асимптотического) поведения таких систем с неравновесной и потенциально неустойчивой динамикой использованы локально ограниченные операторы и определены условия, гарантирующие реализуемость, полноту и ограниченость состояний для последовательных, параллельных и замкнутых соединений таких систем (теоремы 2.4, 2.5), устанавливаются оценки предельных множеств соединений (следствие 2.1) с учетом лишь качественной информации о системе в целом.
Эти результаты использованы в задаче синтеза управления:
1) с возможностью сохранения существенно нелинейных эффектов самого объ
екта как по входу e1 ∈E1, так и по входу δ(δ [t0,T] в области D0(r(e1))
t)∈L(свойство устойчивости ”входвыход” для сигналов δ(t)большой амплитуды из Lδ[t0,T]);
2) при выполнении требований к ограниченности состояния x(t)=x1(t)⊕x2(t) и выхода y(t)=y1(t)⊕y2(t)всей системы1;
3) без требований непрерывности передаточных отображений, что эквивалентно возможности создания неустойчивых целевых движений (см. теоремы 2.3, 2.1);
На основе анализа свойств соединений систем с локально ограниченными операторами поставлена задача функционального синтеза адаптивного регулятора. Дается решение этой задачи, сформулированное в виде принципа разделения (теорема 2.6).
Отдельно рассмотрены вопросы функционального анализа класса систем для которых локальная ограниченность соответствующих операторов не является равномерной по времени. Примерами таких систем являются системы с перемежающейся, итинерантной и поисковой динамикой. Для характеристики асимптотического поведения таких систем используется понятие слабого притягивающего множества по Милнору. Разрабатывается метод анализа таких систем и формулируются условия возникновения областей захвата в пространстве состояний (теорема 2.7, или теорема о неравномерном малом контурном усилении). Анализируются асимптотические свойства таких систем (следствие 2.2) и приводятся упрощенные критерии для систем, представимых соединением устойчивой подсистемы с сепарабельной динамикой2 и неустойчивой поисковой (следствие 2.3). Кроме того, полученные в следствиях 2.2, 2.3 результаты автоматически приводят к обобщенной теореме о малом контурном усилении для каскадов интегрально устойчивых от входа к состоянию систем с двунаправленными связями (в отличие от известных результатов в этой области для систем с однонаправленными связями [97]).
1Ограниченность x1(t), y1(t) вытекает непосредственно из неравенства (2.60). Условия ограниченности x2(t), y2(t) определяются из оценок (П2.22), (П2.23) в Приложении 1.
2Частным случаем являются экспоненциально устойчивые системы.
2.1. Операторное описание динамических систем
По аналогии с [17, 47] введем в рассмотрение физический объект O, взаимодействующий со средой. Будем считать, что над объектом O возможно провести эксперимент (потенциально многократный) с целью воздействия на объект или для описания объекта в заданных условиях. Кроме того, положим, что выполняются следующие стандартные гипотезы:
1) процесс наблюдения явным образом не влияет на объект O;
2) процессы в объекте O описываются вещественными функциями, определенными на непустом подмножестве T ⊂R;
3) воздействия u, e наблюдателя и среды, и реакция x объекта O, и измерения y этой реакции могут быть описаны вещественными функциями, определенными на
T.
Функции u : T → Rm будем называть воздействиями наблюдателя или управлением, функции e : T → Rs назовем воздействиями среды или возмущением, функции назовем реакциями объекта или состоянием, а функции y : T → Rh
x : T → Rn
назовем наблюдениями или просто выходом объекта O.
Множества допустимых функций u(t), e(t), x(t) и y(t), t ∈ T обозначим символами U, E, X и Y соответственно. Дополнительно положим, что множество T определения функций u(t), e(t), x(t) и y(t) является интервалом на R. Будем называть интервал T интервалом существования объекта. Максимально возможный допустимый интервал T∗(O,u,e) определения функций x(t) назовем временем существования объекта O. Очевидно, что время существования объекта O в общем случае зависит от воздействий u ∈U и e ∈E. Однако, если эта зависимость явно определяется из контекста, то вместо записи T∗(O,u,e) будем использовать символ T∗. П р и м е р 2.1.1. Примером объекта с конечным временем существования является, например, решение дифференциального уравнения, моделирующего физические эффекты взрывного характера:
x= x 2 + u, x(t0) = 0.
При u(t) = const,u ≤ 0 (т. е. при отсутствии воздействия наблюдателя, или при “охлаждении” вещества) время существования объекта совпадает с [t0,∞) ⊂R. При u > 0 (т. е. при нагревании) решение x(t) достигает бесконечно больших значений за конечное время T∗, и интервал существования объекта T∗ =[t0,T∗).
В математической теории абстрактных систем понятие “система” вводится как бинарное отношение S, определенное на множестве {U×E}×{X×Y}и заданное графом P⊆{U×E}×{X×Y}. Другими словами, система задается совокупностью пар ({u,e}x,y}) ∈{U×E}×{X ×Y}. При этом допускается, что состояния x(t)
,{и измерения y(t) определены не для всех u ∈ U, e ∈ E. Формальное определение абстрактной системы как некоторого отношения на множестве входов u(t), e(t), состояний x(t) и выходов y(t) является одним из наиболее общих в теории систем. Из него, однако, не ясна спецификация причинноследственных связей между входом и состоянием и входом, состоянием и выходом. В динамических системах, имеющих отношение к техническим и физическим объектам, отношения причинности играют существенное значение. Прежде всего нас будет интересовать свойство реакции x(t), y(t) объекта по отношению к предъявленным входам u(t), e(t). При этом функциональность3 графа P ⊆{U×E}×{X ×Y} отношения S не обязательна. Более того, в силу необходимости анализировать открытые системы, требование функциональности графа P являлось бы существенным ограничением на применимость результатов анализа свойств систем в силу необходимости поверок единственности реакций x(t), вообще говоря, не полностью известных, на неизвестные воздействия e(t). Поэтому, чтобы, вопервых, иметь возможность задавать причинноследственные связи (направленные взаимодействия) между элементами, составляющими систему, т. е. функциями u(t), e(t), x(t) и y(t), а, вовторых, избежать избыточного и ограничительного требования единственности реакций, введем понятие системы S как совокупности отображений.
Определение 2.1.1. Системой S, заданной на множестве входов U, воздействий среды E, состояний X и выходов Y, будем называть совокупность отображений
: (2.1)ST {u(t),e(t)}⊆U×E →{x(t)}⊆X;
: (2.2)HT {u(t),e(t),x(t)}⊆U×E×X →{y(t)}⊆Y;
[t0,T] .
T =
⊆T∗Отображение ST в (2.1) формально определяет взаимодействие “вход – состояние”, а отображение HT в (2.2) формализует взаимодействие “вход, состояние – выход”.
Для возможности сравнения реакций x(t) и y(t) при различных воздействиях u(t), e(t) необходимо ввести какуюлибо меру близости (метрику) в множествах функций U, E4, X и Y. Кроме того, в подавляющем большинстве технических и
3Граф P бинарного отношения S функционален, если для любого {u, e}∈U×E найдется один и
только один элемент {.
x, y}∈X×Y
4Введение метрики в множестве E, вообще говоря, не обязательно для всех результатов этого раздела.
физических задач множества функций U и X наделены структурой линейного пространства. Другими словами, в множестве входов и реакций введены и однозначно определены операции сложения “+”, образующие абелеву группу и внешнего умножения на скаляр “ ” (в нашем случае на число из R) со свойством дистрибутивности
·
по сложению. Поэтому в качестве множеств U, E, X, Y будем рассматривать, прежде всего, метрические пространства. Более того, в ряде случаев будет необходимо сравнивать суммы элементов из U, E X, Y и их умножения на скаляр. Поэтому с самого начала будет считать, что U, E X, Y – нормированные пространства над
T. Из обширного множества возможных нормированных пространств для задания
U, X, Y будем использовать прежде всего функциональные пространства Ln[t0,T],
p
p ∈ R≥1, R≥1 = x ∈ R, n ∈ N. Подобный выбор обусловлен тем, что
{|x ≥ 1}∪∞многие физически значимые свойства функций u(t), x(t) и y(t) (например, энергия, мощность, максимальная амплитуда) могут быть установлены непосредственно из значений функциональных норм ·p,[t0,T ]. Кроме того, ряд стандартных показателей качества и целевых критериев также могут быть сформулированы на языке
n
функциональных норм в L1 [t0,T], Ln[t0,T] и Ln [t0,T].
2
∞
Rn Rm
П р и м е р 2.1.2. Пусть состояние x : R и управление u : R опреде
→→
лены на интервале [t0,T] и, кроме того, непрерывны. Тогда записи слева и справа эквивалентны:
1) T x(τ)2 + u(τ)2dτ x(t)2,[t0,T ]2 + u(t)2,[t0,T ]2;
t0
⇔ 2) T x(τ)dτ ⇔x(t)1,[t0,T ];
t0
3) maxt∈[t0,T ] x(t)+ T u(τ)2dτ ⇔x(t)∞,[t0,T ] + u(t)2,[t0,T ]2 .
t0
В отличие от множеств X, Y и U, множество E удобно задать линейным нормированным пространством Le. Это продиктовано тем обстоятельством, что воздействия среды не всегда естественно могут быть представлены как функции времени. Так, например, иногда имеет смысл включить в множество E и неизвестные параметры объекта O, начальные и граничные условия. Другими словами, те параметры, представление которых функциями времени не всегда возможно или естественно в условиях задачи. Примером такого пространства Le является прямая сумма Le = Rdp[t0,T],
⊕Lгде норма ·Le на Le индуцируется нормами в Rd и Lp[t0,T] соответственно:
e, z = ξ ⊕ν, ξ ∈Rd , ν ∈Lp[t0,T]= ξ+ ν(t)p,[t0,T ].
zLe
∀z ∈L⇒
Принимая во внимание приведенные рассуждения, будем считать, что множества U, X, Y являются линейными функциональными пространствами Lu, Lx, Ly над интервалом T =[t0,T] существования объекта O. Кроме того, в каждом из этих пространств определена хотя бы одна Lp[t0,T] норма, p ∈R≥1. Множество E зададим некоторым линейным нормированным пространством Le с нормой ·Le . Cистема S в этом случае может быть рассмотрена не просто как пара отображений ST
и HT ,
а как совокупность операторов действующих на пространствах Lu, Lx, Ly .
Определение 2.1.2. Рассмотрим систему (2.1), (2.2), где множества X, пространства функций Lx[t0,T]⊆Lqn[t0,T], Lu[t0,T]m[t0,T]и Ly[t0,T]⊆
Uи Y– ⊆Lp Lh[t0,T], q, p, k ∈R≥1 соответственно. Будем говорить, что система (2.1), (2.2)
k | |||
---|---|---|---|
задает оператор “входсостояние” ST ( | u,e) | ||
ST (u,e): Lu[t0,T]×E →Lx[t0,T | ], (2.3) | ||
и оператор (2.2) з | адает оператор “входвыход”(2.2) HT | u,e)( | |
HT (u,e): Lu[t0,T]×E →Ly [t0,T | ], (2.4) | ||
на интервале T = | [t0,T | ], если и только если выполняется соотношение |
u(u[t0,T]⇒ x(x[t0,T], ∀t)∈Lt)∈Le ∈E;
u(u[t0,T]⇒y(y [t0,T], ∀.t)∈Lt)∈Le ∈EДля анализа свойств систем, заданных операторами “входсостояние” ST (u,e) и “входвыход” HT (u,e) в смысле определения 2.1.2, необходимо иметь информацию о свойствах преобразования u(t), e в x(t) и y(t) по действием операторов ST (u,e), u,e). С одной стороны, эта информация должна позволять оценивать и срав
HT (
нивать в какомлибо смысле свойства реакций в зависимости от свойств входов. С другой стороны, такая информация должна быть достаточно общей и принципиально проверяемой на практике.
В качестве такой информации естественно выбрать функциональные нормы в Lu
y . Как это иллюстрируется примером 2.1.2, функциональные нормы (по крайи Lx, Lней мере Lp[t0,T]нормы для p =1,2,∞) имеют вполне определенный физический смысл, могут выступать как критерии качества систем и, кроме того, их значения могут быть вычислены непосредственно в результате эксперимента. В дополнение, они позволяют сравнивать элементы соответствующих пространств, включая суммы и умножения на число. Следовательно, уместно ввести дополнительную характеристику системы (2.1), (2.2), учитывающую качественную связь функциональных норм Luy под действием операторов (2.3) и (2.4). С этой целью по анало
и Lx, Lгии с коэффициентом усиления в линейных системах, введем понятие нелинейного
коэффициента передаточного отображения из Lu в Lx (Luy ).
в L
Определение 2.1.3. Будем говорить, что для системы (2.1), (2.2) на интервале T =[t0,T]определены коэффициенты γS,Lx , γH,Ly передаточного отображения ”входсостояние” (из Lux) и “входвыход” (из Lu в Ly), если и только
в Lесли 1) система (2.1), (2.2) задает оператор ST (u,e): Lu[t0,T]×E → Lx[t0,T]и существует функция γS,Lx R+, такая, что выполняется неравен
:Le ×R+ ×R
→
ство:
x(t)Lx,[t0,T ] ≤ γS,Lx (e,u(t)Lu,[t0,T ],T), (2.5)
где функция γS,Lx (e,u(t)Lu,[t0,T ],T)– не убывающая по u(t)Lu,[t0,T ], и локально
ограничена по всем аргументам;
2) система (2.1), (2.2) задает оператор HT (u,e): Lu[[t0,T]иt0,T]×E → Ly существует функция γH,Ly R+, такая, что выполняется нера
:Le ×R+ ×R
→
венство:
y(t)Ly ,[t0,T ] ≤ γH,Ly (e,u(t)Lu,[t0,T ],T), (2.6)
где функция γH,Ly (e,u(t)Lu,[t0,T ],T)– не убывающая по u(t)Lu,[t0,T ], и локально ограничена по всем аргументам.
Коэффициенты γS,Lx , γH,Ly передаточного отображения “входсостояние” (из Lu x) и “входвыход” (из Lu в Ly ), как следует из определения 2.1.3, являются
в Lфункциями своих аргументов и в этом смысле однозначно определяют поведение системы в терминах отношений норм соответствующих линейных пространств. С другой стороны, они могут быть определены не единственным образом и поэтому сами по себе не могут однозначно задавать систему (2.1), (2.2). Кроме того, одна и та же система S может иметь несколько различных коэффициентов передаточных отображений “входсостояние” и “входвыход” в зависимости от того, каким образом определены нормы ·Lx в (2.5), (2.6). Это свойство иллюстрируется , ·Ly и ·Lu
примером 2.1.3.
П р и м е р 2.1.3. Рассмотрим дифференциальное уравнение первого порядка
x=−x+u, x(t0)∈E ⊂ R (2.7) y =x, T =[t0,T],
где u ∈ C0[t0,T]и u ∈L1 t0,T]∩L1
2,[t0,T]. Система (2.7), очевидно, задает оператор
∞[ ∞[t0,T]∩L12,[t0,T]. При этом для
“входсостояние” ST :L12,[t0,T]∞[t0,T]∩L1×E → L1
системы (2.7) определены сразу четыре коэффициента передаточных отображений
L1 ∞, L12, L12, L1 .2 → L12 →L1 ∞ → L1 ∞ → L1
∞
В реальных технических и физических системах практически важным для анализа случаем является существование коэффициентов передаточных отображений для
n
пространств Lx ∞[t0,T], Ly ⊆Lh [t0,T] и, соответственно, норм = ∞,[t0,T ],
⊆L
∞·Lx ·= ·∞,[t0,T ]. Такие коэффициенты будем обозначать символами γS,∞ и γH,∞.·Ly
Существование коэффициентов γS,∞ и γH,∞ означает, что существует не пустой интервал времени T, на котором состояние и выходы системы (2.1), (2.2) являются ограниченными функциями времени, что в свою очередь является необходимым условием физической и технической реализуемости такой системы.
Определение 2.1.4. Система S называется
1) реализуемой, если для каждого u ∈Lu и e ∈E существует число T(u,e) > t0 такое, что
x(t)∞,[t0,T ] < ∞; (2.8)
y(t)∞,[t0,T ] < ∞; (2.9)
2) реализуемой с передаточным отображением по норме ·Lu , если для каж
дого e ∈ E существует такое число T(e) > t0, что в системе S на интервале
T = [t0,T] определены коэффициенты γS,∞ и γH,∞ соответствующих передаточ
ных отображений. А именно, выполняются неравенства
x(t)∞,[t0,T ] ≤γS,∞(e,u(t)Lu,[t0,T ],T); (2.10)
y(t)∞,[t0,T ] ≤γH,∞(e,u(t)Lu,[t0,T ],T). (2.11)
Интервал T =[t0,T] будем называть интервалом реализуемости системы
при заданных u ∈Lu, e ∈E.
Свойство реализуемости, например, всегда выполнено для систем, заданными обыкновенными дифференциальными уравнениями с непрерывными правыми частями при условии, что функции u(t) ∈C0. Это вытекает непосредственно из теоремы о существовании решения дифференциального уравнения. Отметим, что определение 2.1.4 предполагает и существование норм u(t)Lu,[t0,T ] для входов, реализуемых по норме ·Lu,[t0,T ] систем. В дополнение, свойство реализуемости системы на интервале T позволяет сформулировать важное в практическом отношении понятие полноты системы.
Определение 2.1.5. Систему S будем называть 1) полной, если она реализуема на (полу) бесконечном интервале времени T; существуют такие коэффициенты γS,∞ и γH,∞ передаточных отображений, что
неравенства (2.10), (2.11) выполнены для всех T ≥t0.
Свойство полноты системы, посути, означает, что интервал существования системы как объекта исследования совпадает с интервалом [t0,∞]. Для систем, заданных дифференциальными уравнениями свойство полноты эквивалентно гарантии существования решения x(t)на сколь угодно большом интервале времени при всех e ∈E и u(u.
t)∈L
Сам факт полноты некоторой системы (2.1), (2.2) в смысле определения 2.1.5 в большинстве случаев не нуждается в доказательстве. Зачастую это свойство выполнено по умолчанию, например, для самих управляемых физических или технических объектов, за исключением, пожалуй, экзотических случаев, подобных примеру 2.1.1. Однако в задачах синтеза и анализа систем полнота соединения элементарных блоков (наблюдатель, алгоритм адаптации, регулятор) при допущении, что сам объект может быть неустойчивым, с конечным временем существования и неустойчивой целевой динамикой, оказывается важным вопросом исследования таких соединений.
Необходимость введения понятий реализуемости и полноты системы в работе продиктована еще и тем, что существенная часть вопросов в теории управления касается прежде всего асимптотических свойств, при t →∞, поведения (состояний, выходов, входов и т.п.) исследуемой системы. Это означает, что нас интересуют отображения S[t0,∞](u,e): Lu[t0,∞][t0,∞]. Однако известны объекты из класса
×E →L∞
систем, заданных линейными дифференциальными уравнениями с постоянными коэффициентами (см. пример 2.1.4), для которых такие отображения определены не для всех e ∈ E. Следовательно, анализ (и синтез) таких систем в терминах норм ·∞,[t0,∞] оказывается невозможным. С другой стороны, эти системы обладают свойством реализуемости и полноты, что позволяет анализировать их поведение в терминах функциональных норм ·∞,[t0,T ]. Это, в свою очередь, дает возможность отыскать классы Uc ⊂Lu функций u(t) (задача анализа), гарантирующие существование оператора S[t0,T ](u,e): Uc[t0,T]∞[t0,T]при T →∞уже для всех e ∈E
×E →L
и таким образом обеспечить существование решения задачи синтеза.
П р и м е р 2.1.4. Рассмотрим объект, заданный системой дифференциальных уравнений
x1 =−λx1,
(2.12)
x2 =λx2 +u, λ ∈R>0, x1(t0),x2(t0)∈R,
где u(u ⊆ L1 [t0,∞]∩C0[t0,∞]. Естественно отнести значения x1(t0),x2(t0)t) ∈ L∞
к множеству E ⊆ R2 воздействий среды. Система (2.12) является реализуемой и Рисунок 2.1. Область определения оператора S[t0,∞](u,e): Lu ×R2 ∞[t0,∞] для системы (2.12) при u(t)=0, t ∈[t0,∞] →L2
полной в смысле определений 2.1.4, 2.1.5. Однако оператор S[t0,∞](u,e): L
u ×E →
L2 [t0,∞] существует не для всех пар (x1(t0),x2(t0)) = (e1,e2) ∈ E. В частности,
∞
при u(t) = 0 оператор S[t0,∞] определен лишь на устойчивом многообразии Cs =
x1,x2) ∈ R2x2 =0} [173] пространства решений системы (2.12). Иллюстрация к
{(
|
этому примеру приведена на рис. 2.1.
Пример 2.1.4 иллюстрирует качественную разницу между анализом систем в про
странствах Lx[t0,T]и Lx[t0,∞]с нормами ·Lx [t0,T][t0,∞]соответственно.
и ·Lx Так, например, в пространствах Lx[t0,∞] даже для “хороших” реализуемых систем, обладающих свойством полноты, отображение S[t0,∞](u,e) может оказаться сингулярным в некоторых точках (областях) u0 u[t0,∞], e0 ∈ E. В частности, для
∈ L
объектов, заданных системой стационарных дифференциальных уравнений с гладкой правой частью и начальными условиями из E, область существования оператора S[t0,∞](0,e) ограничена множеством E ∩Cs, где Cs – устойчивое многообразие пространства решений системы при u(t)=0для всех t ∈[t0,∞].
Это, в свою очередь, служит иллюстрацией того, что такая характеристика асимптотического поведения системы, как устойчивость по Ляпунову, может быть связана с отсутствием/наличием сингулярности у задающего систему оператора. Факт возможного наличия такой сингулярности определяет специфику постановок задач и набор допустимых методов анализа и синтеза для этих систем.
Поэтому для анализа и последующего синтеза адаптивных систем на основе лишь качественной информации о свойствах операторов “входвыход” и “входсостояние” необходимо прежде всего сформулировать отличительные характеристики устойчивых и допустимых неустойчивых систем.
2.2. Свойства операторов устойчивых систем
Традиционно понятия устойчивости систем формулируются с привлечением понятия фазового потока динамических систем [223], где сам фазовый поток определяется как отображение
x(t,x0,t0), x : R ×Rn Rn , (2.13)
×R
→
удовлетворяющее условию
x(t0,x0,t0) = x0.
Физический смысл аргументов отображения x(t,x0,t0) – это текущий момент времени t, вектор начальных условий x0 ∈Rn и начальный момент времени t0. В силу того, что в задаче анализа устойчивости начальные условия предполагаются заданными a priori, можно рассматривать пару (x0,t0) как элемент подпространства E0 ⊆Rn
⊕R пространства E воздействий среды. Следовательно, фазовый поток (2.13) уместно
рассматривать как отображение, которое переводит пару (x0,t0) ∈E0 ⊂E в элемент
n
из пространства функций L∞[t0,T] аргумента t. Таким образом, с фазовым потоком
(2.13) можно соотнести эквивалентную систему:
n
: x ⊆L∞[t0,T],ST E →L(2.14)
y ⊆Ln
:[t0,T],
HT E→L∞определенную на интервале T =[t0,T], с входом из E и выходом из Lx.
Положим, что существует положительно инвариантное множество (в смысле определения 1.3.1) Ω∗ ⊂Rn по отношению к фазовому потоку x(t,x0,t0). Приведем наиболее общее определение устойчивости по Ляпунову инвариантного множества Ω∗ относительно фазового потока x(t,x0,t0).
Прежде всего введем в рассмотрение меру близости решений x(t,x0,t0) к множеству Ω∗. Стандартной мерой в задачах исследования устойчивости является функциональная норма, индуцированная мерой близости xΩ∗ = dist(Ω∗,x) в пространстве Rn точки x ∈Rn и множества Ω∗ ⊂Rn:
x(t,x0,t0)Ω∗,[t0,∞] = sup dist(Ω∗,x(t,x0,t0)). (2.15)
t≥t0
зовому потоку x(t,x0,t0) системы (2.14) называется
1) устойчивым по Ляпунову, если система (2.14) является полной в достаточно большой окрестности множества Ω∗, и для любой εокрестности V(Ω∗,ε) множества Ω∗ существует такое δ(ε,t0) > 0, что для всех x0 ∈ V(Ω∗,δ(ε,t0)) выполнено следующее соотношение:
x(t,x0,t0) ∈V(Ω∗,ε) ∀t ≥t0,
или
x0Ω∗ < δ(ε,t0) ⇒x(t,x0,t0)Ω∗,[t0,∞] < ε; (2.16)
2) асимптотически устойчивым по Ляпунову, если оно устойчиво по Ляпунову и
lim dist(x(t,x0,t0),Ω∗) = 0.
t→∞
Определение 2.2.1 является обобщением понятий устойчивости положения равновесия [207], устойчивости по части переменных, [49, 9, 333], и устойчивости по функции [38]. В некотором роде инверсным свойству устойчивости по Ляпунову является устойчивость множества по Лагранжу.
Определение 2.2.2. Инвариантное множество Ω∗ является устойчивым по Лагранжу, если для любого ограниченного ε > 0 найдется такое δ(ε,t0) > 0, что для всех x0 ∈ V(Ω∗,ε) множество V(Ω∗,δ(ε,t0)) является положительно
инвариантным по отношению к потоку xf (t,x0,t0). Другими словами,
x0Ω∗ < ε ⇒x(t,x0,t0)Ω∗ < δ(ε,t0). (2.17)
Как вытекает из определений 2.2.1, 2.2.2 свойство устойчивости инвариантных множеств характеризует локальное поведение динамических систем, т. е. в окрестности заданного инвариантного множества Ω∗ ⊂Rn. В случае, если объектом исследования является конкретный элемент x(t) ∈Ix из пространства состояний
m(ST ) ⊆L
Lx системы (2.14), называемый решением системы, а не отклонение всех решений от инвариантного множества Ω∗, используется понятие устойчивости решения.
Определение 2.2.3. Решение x(t,x0,t0) называется
1) устойчивым по Ляпунову в области X ⊂Rn, если для любого положительного числа ε > 0 существует такое δ(ε,t0,y0,x0), что
x0 −y0< δ(ε,t0,y0,x0) ⇒x(t,x0,t0) −y(t,y0,t0)∞,[t0,∞] < ε, x0,y0 ∈X; (2.18)
2) асимптотически устойчивым по Ляпунову, если оно устойчиво по Ляпунову и при этом выполняется следующее предельное соотношение
lim (x(t,x0,t0) − y(t,y0,t0)) = 0.
t→∞
Практически важным применением понятия устойчивости решения системы (2.14) в теории регулирования нелинейных систем является, например, свойство конвергентности систем [11]. Развитие теории конвергентных систем [11], приведенное в работах [271, 272], позволило снять стандартное ограничение локальности для класса нелинейных систем в задаче управления по выходу. Существенным является то, что именно переход от анализа малых отклонений от инвариантных множеств и использования теоремы о центральном многообразии [192] к анализу поведения решений на полубесконечных интервалах и, соответственно, применению теоремы об инвариантном многообразии [272], позволил построить теорию нелокального регулирования по выходу.
Несмотря на очевидные различия в определениях устойчивости 2.2.1–2.2.3, эти определения формулируют общие свойства систем с позиции их операторных характеристик. Такими операторными характеристиками устойчивости в определениях 2.2.1–2.2.3 являются свойства передаточного отображения ST и функции γS,Lx (e,T), представимой в виде
γS,Lx (e,T) = γS,Lx (x0 ⊕ t0,T) = γS,L∞ (x0Ω∗ ,t0), (2.19)
Эти свойства сформулированы в следующей теореме.
Теорема 2.1. Для того, чтобы система (2.14) была устойчивой в смысле определения 2.2.1, необходимо и достаточно выполнения следующих альтернатив:
1.1) чтобы отображение S∗
T (x0,t0)= ST (x0 ⊕ t0), T =[t0,∞] из Rn × R в про
n
странство Lx ∞[t0,∞] c метрикой (2.15) было непрерывно по x0 в окрестности
⊆ LV(Ω∗,ε) для всех t0 ∈ R;
1.2) коэффициент γS,Lx (e,T) отображения ST , представимым в виде (2.19),
где функция γS,L∞ (0,t0) = 0, ∀ t0 ∈ R локально ограничена по t0, непрерывна и не
убывает по x0Ω∗ в окрестности нуля.
Для устойчивости в смысле определения 2.2.2 необходимо и достаточно выполнения альтернатив:
2.1) чтобы отображение S∗
T (x0,t0)= ST (x0 ⊕ t0), T =[t0,∞] из Rn × R в про
n
странство Lx ∞[t0,∞] c метрикой (2.15) было локально ограничено по x0 в
⊆ Lокрестности V(Ω∗,ε) для всех t0 ∈ R;
2.2) коэффициент γS,Lx (e,T)отображения ST , представимым в виде (2.19), где функция γS,L∞ (0,t0)=0, ∀t0 ∈R, локально ограничена по t0, x0Ω∗ (в окрестности нуля).
Устойчивость в смысле определения 2.2.3 эквивалентна
3) непрерывности по x0 ∈Rn отображения S∗ x0,t0)=ST (x0 ⊕t0), T =[t0,∞],
T (
n
[t0,∞]из Rn ×R в пространство Lx ⊆L[t0,∞]cо стандартной метрикой в
T =
∞
Ln [t0,T].
∞
Как следует из теоремы 2.1, понятия устойчивости по Ляпунову инвариантного множества и решения эквивалентны свойству непрерывности соответствующих отображений метрических пространств в функциональные метрические пространства. В каждом случае, однако, непрерывность определяется относительно специфических норм функционального пространства Lx. Свойство устойчивости по Лагранжу, в свою очередь, оказывается эквивалентно локальной ограниченности отображения
x0,t0). Существенным оказывается и то, что для устойчивых систем (2.14) суще
ST∗ (ствуют коэффициенты γS,Lx (e,T)передаточных отображений, не зависящие в явном виде от T. Понятия устойчивости по Ляпунову инвариантных множеств и решений систем характеризуют свойства системы без учета специфики влияния внешних возмущений и входов на решение. Эти ключевые понятия теории систем формулируются для всех допустимых воздействий e ∈E, которые не меняют, например, определение системы в виде записи (2.14). Влияние моделируемых возмущений ограничено, однако, лишь элементами из линейного пространства E0. При этом свойство устойчивости в определениях 2.2.1, 2.2.2, 2.2.3 должно выполняться для всех e ∈E. Таким образом, стандартные определения устойчивости по Ляпунову инвариантного множества или решения характеризуют лишь влияние начальных условий на состояние x(xt) ∈ L
системы (2.14), оставляя за пределами рассмотрения специфику реакции объекта на
классы входов u(u. Эта специфика, тем не менее, имеет существенное значение
t)∈Lв задачах анализа и синтеза соединений систем и при исследовании асимптотического поведения объектов при наличии возмущений.
Для оценки асимптотического поведения систем с входом и выходом в работах [344, 302, 296, 216] вводятся понятия устойчивости “входвыход”, “входсостояние”, “входвыходсостояние”. При этом обычно считается, что состояние x(t)∈Ln [t0,T],
∞
a u(u[t0,T]. Множество E воздействий среды, аналогично предыдущему слу
t) ∈ Lчаю, задается прямой суммой E =Rn ⊕R. Тогда, согласно определению 2.1.2, будем
: Ln
x ⊆L∞[t0,T],
ST u ×E→L(2.20) y ⊆Ln
[t0,T].
: L
HT u ×E →L∞
Кроме того, положим, что система (2.20) реализуема и полна. Следуя [344, 207], дадим определение устойчивости “входвыход”.
Определение 2.2.4. Система (2.20) называется устойчивой от входа к выходу, если существует функция α ∈ K и число β > 0 такие, что для всех
u[t0,∞]y [t0,T] и e ∈E справедлива оценка u(t)∈L∩L
y(t)Ly ,[t0,T ] ≤α(u(t)Ly ,[t0,T ])+β. (2.21)
Система называется устойчивой от входа к выходу с конечным коэффициентом передачи, если существует такое число γ > 0, что выполняется неравенство
y(t)Ly ,[t0,T ] ≤γu(t)Ly ,[t0,T ] +β. (2.22)
Устойчивость “входвыход” (так называемая Lустойчивость [207], если рассматриваются линейные пространства Lp), естественным образом вводит такую практически важную характеристику систем, как коэффициент передачи. Это понятие, в свою очередь, оказывается ключевым для операторного анализа соединений нелинейных систем с обратными связями.
П р и м е р 2.2.1. Рассмотрим соединение двух систем S1, S2 с операторами “вход
выход” H1,T :
и H2,T 1,T : y1(t)=H1,T (u1(t)),
H
2,T : y2(t)=H2,T (u2(t)),
H
изображенное на рис. 2.2. Как показано в работе [344], если произведение γ1γ2 (или
композиция α1 α2) коэффициентов передачи γ1 и γ2 двух систем строго меньше
единицы, то замкнутое соединение таких систем оказывается устойчивым от входа к выходу. Точная формулировка этого результата дается теоремой 2.2 о малом контурном усилении [207, 344].
Теорема 2.2. Пусть заданы две полные и устойчивые от входа к выходу
системы S1, S2:
y1(t)Ly ,[t0,T ] ≤γ1u1(t)Ly ,[t0,T ] +β1,
Рисунок 2.2. Соединение систем с обратной связью
y2(t)Ly ,[t0,T ] ≤γ2u2(t)Ly ,[t0,T ] +β2.
Тогда замкнутое соединение систем S1 и S2 устойчиво от входа υ1 (υ2) к выходу
y1 (y2) с конечным коэффициентом передачи при условии, что
γ1γ2 < 1. (2.23)
Известны обобщения этого фундаментального результата с привлечением понятия практической устойчивости от входа к выходу [196]:
Определение 2.2.5. Система (2.20) называется практически устойчивой от входа к выходу, если существуют функция α ∈K, β ∈KLи число D > 0 такие, что для всех u(t)∈Lu[y[t0,T] и e ∈E справедлива оценка
t0,∞]∩Lx0,t)+α(u(t)Ly ,[t0,T ])+D. (2.24)y(t)≤β(
Теоремы о малом контурном усилении являются одним из наиболее эффективных критериев устойчивости в операторном анализе систем, и, как следствие, понятие устойчивости “входвыход” оказывается существенным в задаче анализа свойств соединений устойчивых систем. Устойчивость “входвыход”, однако, никак не характеризует поведение состояния x(t). С целью компенсации этого недостатка в работах [302, 216, 296] вводятся понятия устойчивости “входсостояние”, “выходсостояние” и “входвыход состояние” .
Определение 2.2.6. Система (2.1), (2.2) называется:
1) глобально устойчивой от входа к состоянию относительно инвариантного множества Ω∗ ⊂ Rn, если она полна и, кроме того, существуют функции γ ∈ K, β ∈ KL такие, что для любых x0 ∈ Rn и t ≥ t0 фазовый поток системы удовлетворяет оценке
x(t,x0,t0)≤β(x0Ω∗ ,t)+γ(u(τ)∞,[t0,t]); (2.25)
Ω∗
инвариантного множества Ω∗ ⊂Rn, если она полна и, кроме того, существуют
функции γ ∈K, β ∈KL такие, что для любых x0 ∈Rn и t ≥t0 фазовый поток
системы удовлетворяет оценке
t
x(t,x0,t0)Ω∗ ≤β(x0Ω∗ ,t)+ γ(u(τ))dτ; (2.26)
t0
3) глобально устойчива от входа к выходу и состоянию относительно инва
риантного множества Ω∗ ⊂Rn, если она полна и существуют функции γu
∈K, γy ∈K, β ∈KLтакие, что для всех x0 ∈Rn , t ≥t0 выполнено неравенство
x(t,x0,t0)Ω∗ ≤β(x0Ω∗ ,t)+γu(u(τ)∞,[0,t])+γy (y(τ)∞,[t0,t]); (2.27)
4) глобально устойчива от выхода к состоянию, если существуют функции
γy ∈K, β ∈KLтакие, что для всех x ∈Rn , t ≥t0
x(t,x0,t0)Ω∗ ≤β(x0Ω∗ ,t)+γy (y(τ)∞,[t0,t]). (2.28)
В работе [302] показано, что свойство устойчивости от входа к состоянию эквивалентно существованию специальной функции Ляпунова для исходной системы. Кроме того, в этой же работе доказывается, что устойчивость “входсостояние” влечет глобальную асимптотическую устойчивость инвариантного множества Ω∗ при u(t)=0. Устойчивость от выхода к состоянию является необходимым и достаточным условием обнаруживаемости состояния по выходу [296].
Аналогично случаю автономных систем (2.14), понятия устойчивости в определениях 2.2.4, 2.2.6 для систем с входом и выходом (2.20) в некотором роде эквивалентны и одинаковым образом характеризуют реакцию объекта на различные воздействия из множества Lu ×E. Cправедливо следующее утверждение.
Теорема 2.3. Для того, чтобы система (2.20) была:
1) устойчивой от входа к выходу в смысле определения 2.2.4 необходимо существование локально ограниченного по e, непрерывного по uLy ,[t0,T ] и ограниченного по T коэффициента γH,Ly (e,u(t)Ly ,[t0,T ],T) передаточного отображения “входвыход”;
2) устойчивой от входа к состоянию необходимо существование коэффициента γS,Lx (e,u(t)Lu,[t0,T ],T)передаточного отображения “входсостояние”, представимого в виде
γS,Lx (e,u(t)Lu,[t0,T ],T)=γS,L∞ (x0Ω∗ ,t0,u(t)Lu,[t0,T ],T),
где функция γS,L∞ (·) непрерывна по x0Ω∗ , u(t)Lu,[t0,T ], локально ограничена по t0, ограничена по T и γS,L∞ (0,t0,0,T) = 0 для всех t0 ∈R+, T ≥t0;
Операторные характеристики интегральной устойчивости “входсостояние” могут быть рассмотрены как частный случай устойчивости “входсостояние” с той лишь разницей, что u ∈Lγ , где Lγ пространство всех функций u : T γ(u(τ))dτ < ∞.
t0 При этом определение нормы (или в общем случае метрики) в Lγ требует отдельного рассмотрения в зависимости от свойств функции γ(·). Характеристики устойчивости от входа к выходу и состоянию и от выхода ко входу могут быть переформулированы в терминах устойчивости “входсостояние” в силу монотонности функции γy (·) и существования γH,L∞ (e,u(t)Lu,[t0,T ],T):
γy(y(t)∞,[t0,T ]) ≤γy (γH,L∞ (e,u(t)Lu,[t0,T ],T)).
Операторные характеристики, приведенные в теоремах 2.1, 2.3, позволяют выделить необходимые и достаточные свойства операторов устойчивых систем. Анализ этих свойств, в свою очередь, позволяет обосновать круг первостепенных проблем анализа асимптотического поведения неустойчивых систем и формально поставить задачу управления системами, заданных операторными соотношениями “входвыход”
(2.4) и “входсостояние” (2.3).
2.3. Постановка задачи функционального анализа и регулирования неравновесных, открытых и неустойчивых систем
Как вытекает из анализа свойств устойчивых систем, в наиболее широко используемых определениях 2.2.1–2.2.6, эквивалентные операторные характеристики устойчивости по Ляпунову (теорема 2.1) – это непрерывность отображения ST∗ (x0,t0) по x0 или непрерывность нелинейных коэффициентов γS,L∞ передаточных отображений. Устойчивость по Ляпунову зачастую является критерием работоспособности систем и подавляющее большинство методов синтеза систем управления направлены, прежде всего, на обеспечение этого качества. В этом смысле, очевидно, свойство непрерывности оператора, как эквивалент устойчивости по Ляпунову, является синонимом работоспособности.
Свойство непрерывности оператора позволяет эффективно применять методы математического анализа для исследования асимптотических свойств соединений устойчивых систем. Так, в частности, именно непрерывность оказывается необходимым условием применения теоремы 2.2 о малом контурном усилении в вопросах анализа замкнутых нелинейных систем. Свойство равномерной непрерывности также оказывается ключевым в вопросах анализа аттрактивности инвариантных множеств соединений устойчивых от входа к состоянию систем [296]. Кроме того, это свойство автоматически гарантирует сохранение устойчивости последовательного соединения устойчивых от входа к состоянию (выходу) систем.
Известна и связь непрерывности коэффициентов передаточных отображений для устойчивых систем от входа к выходу (L2устойчивых) со свойством строгой пассивности по выходу нелинейных систем. А именно, как показано в [207], строгая пассивность по выходу влечет L2устойчивость от входа к выходу. Следовательно, согласно теореме 2.1, существование оператора системы с непрерывным коэффициентом γS,Lx передаточного отображения из L2 в L2 является необходимым условием строгой пассивности по выходу.
Несмотря на перечисленные достоинства такой характеристики работоспособных систем, как непрерывность оператора, практическая проверка этого свойства и, как следствие, возможность использования методов анализа и синтеза таких систем не всегда возможна и эффективно реализуема.
Прежде всего, для сложных физических систем сам факт проверки непрерывности оператора от входа к состоянию подразумевает предварительно решение задачи идентификации состояния объекта. С другой стороны, если такая идентификация все же успешно проведена, то проверка непрерывности оператора оказывается осложнена неизбежным наличием шумов в измерительных данных. Более того, сам факт возможности эффективного исследования непрерывности отображения зависит прежде всего от знания модели физических объектов с точностью до всех значимых состояний. Другими словами, даже устойчивые объекты могут оказаться неустойчивыми в нашем понимании уже при условии, что вектор состояния объекта и модели не полностью адекватны.
Для математических объектов, например, для моделей в пространстве состояний, заданных обыкновенными дифференциальными уравнениями
x=f (x,θ,t,u), f ∈C0 , θ ∈Rd , u ∈Rm , x ∈Rn ,
(2.29)
y =h(x), h : Rn Rh
→
проверка непрерывности оператора зачастую сводится к поиску функции Ляпунова
V(x,t): Rn | ×R | → | R+: | |||
---|---|---|---|---|---|---|
α1(x)≤V(x,t)≤α2(x), α1,α2 ∈K∞, | (2.30) | |||||
удовлетворяющей неравенству | ||||||
∂V(x,t) ∂x f (x,θ,t,u)+ | ∂V(x,t) ∂t | ≤0. | (2.31) |
Задача отыскания такой функции V(x,t)для произвольного векторного поля f (x,θ,t,u) не тривиальна и, вообще говоря, решение существенным образом зависит от точного знания модели (2.29).
Проблема отыскания функции V(x,t) становится еще более сложной, если в дополнение к устойчивости требуется определить аттрактивность инвариантного множества. В этом случае дополнительно требуется, чтобы левая часть неравенства
(2.31) была отрицательно определена. Несмотря на то, что для автономных систем эта проблема может быть решена без требования отрицательной определенности полной производной функции V(x,t) и выполнения неравенств (2.30) [223, 4], отыскание подходящей функции V(x,t) в общем случае для открытых систем остается проблемой.
В качестве альтернативы условию отрицательности полной производной по времени функций Ляпунова V(x,t) как критерия равномерной аттрактивности, известны т. н. “предельные критерии” [103]. В частности, в [103] показано, что необходимым условием равномерной аттрактивности нулевого положения равновесия в системе
(2.29) является выполнение интегрального неравенства
∀δ > 0 ∃a > 0, b ∈R : x> δ, t ≥t0 ≥0⇒
t (2.32)
f (x(τ),θ,τ,u(τ))dτ ≥a(t−t0) + b.
t0
Достаточные же условия равномерной аттрактивности в [103] неизбежно требуют отыскания подходящей функции Ляпунова V(x,t).
Еще одной возможной заменой явного использования функций Ляпунова в задаче исследования асимптотических свойств системы (2.29) является свойство равномерной δпредельной невырожденности сигналов (от англ. uniform δpersistency of excitation), введенное в работе [257].
Определение 2.3.1. Пусть решение x(t) системы (2.29) представимо в виде x(t)= x1(t) ⊕x2(t). Функция φ : t → φ(t,x(t)) называется равномерно δпредельно невырожденной по отношению к x1(t) в области D, если для всех x(t) ∈ D существуют положительные константы δ > 0, T > 0 и µ > 0 такие, что для всех t ∈R выполнено условие
t+T
φ(τ,z(τ))dτ ≥µ. (2.33)x(t) −z(t)≤δ ⇒ t Однако проверка равномерной предельной невырожденности функции φ(t,x(t)) состояния системы (2.29), как следует непосредственно из (2.33), подразумевает, вообще говоря, знание свойств конкретных решений x(t) : x1(t) ∈D системы (2.29). Решения x(t,x0,t0) системы (2.29) в свою очередь непрерывно зависят от неизвестного параметра θ [43] и существенным образом определяются функциями времени в правой части. Следовательно, проверка условий (2.32), (2.33) влечет в общем случае решение задачи идентификации.
Таким образом, свойство непрерывности оператора, задающего систему (или, что эквивалентно, существование функции Ляпунова для системы (2.29)) оказывается трудно проверяемым свойством на практике. Особенно, если речь идет о моделях вида (2.3), (2.4), (2.5), (2.6). Более того, даже если объектом исследования являются уравнения (2.29), анализ непрерывности оператора упирается либо в необходимость отыскания подходящей функции V(x,t), либо в дополнительное исследование свойств некоторых функций состояний вдоль решений системы (2.29). В обоих случаях решение этих нетривиальных задач оказывается чувствительным к конкретному виду векторного поля f (x,θ,t,u). Поэтому методы анализа и синтеза систем, основанные на использовании подобной информации, не могут быть эффективно использованы в условиях существенной неопределенности, в том числе и в задачах адаптивного управления. В дополнение следует иметь в виду, что в силу неизбежного присутствия немоделируемой динамики, свойство непрерывности отношений “входвыход” и “входсостояние” в реальной системе, даже в случае успешного решения перечисленных задач, может не выполняться.
Приведенные рассуждения показывают, что несмотря на удобство математического анализа систем с непрерывными операторами и коэффициентами передаточных отображений, проверка этого свойства на практике затруднительна, либо не всегда возможна в силу отсутствия необходимой и исчерпывающей информации о моделях “входвыход” и “входсостояние” реальных систем. Более того, сама природа физического объекта может не допускать описание его в терминах непрерывных отображений. Так, например, операторы неустойчивых систем (как показано в примере 2.1.4) оказываются сингулярными даже если система при этом остается реализуемой и полной. Известны примеры открытых систем, систем с немоделируемыми возмущениями, активно взаимодействующих со средой, характеристики которых меняются качественным образом со временем и под действием среды. Происходящие при этом изменения в поведении систем получили название катастроф [3].
П р и м е р 2.3.1. Простейшим примером систем, допускающих такие изменения, является система
[1,1] ⊆R;ST : R ×E→ R, E⊆−
(2.34)
HT : R ×E→ R;
ST (u,e) =
x ∈R}
max
3+ex{
.
1
3
u=
x
Как это иллюстрируется рисунком, оператор “входсостояние” системы (2.34) непрерывен при e ≥0. Однако свойство непрерывности оператора ST (u,e) “входсостояние” нарушается при e < 0.
Рисунок 2.3. Диаграмма возникновения катастрофы или потеря непрерывности по u отображения ST (u,e) “входвыход” в системе (2.34) при e < 0.
Следовательно, возникает вопрос об адекватности использования классических определений устойчивости и их обобщенного математического эквивалента – непрерывности отображений “входвыход” и “входсостояние” – в задачах анализа систем в условиях неконтролируемых сигнальных и параметрических возмущений и при отсутствии полной информации о самом объекте исследования.
Естественной заменой условию непрерывности отображений как критерию работоспособности системы является свойство локальной ограниченности оператора, задающего систему. Свойство локальной ограниченности оператора является в некотором роде минимально допустимой целью управления и соответствует понятию устойчивости по Лагранжу (см. теорему 2.1)5. В качестве минимально доступной информации для анализа систем с локально ограниченными операторами логично использовать и информацию о процессах в системе лишь качественного характера. Такой информацией может быть, например, существование локально ограниченных по отдельным аргументам или по их совокупности коэффициентов соответствующего передаточного отображения.
Проблема, однако, заключается в том, что исследование систем с локально ограниченными операторами и их соединениями затруднено отсутствием эффективных методов анализа и синтеза таких систем. Исключением является, пожалуй, класс полупассивных систем [278]. Для полупассивных систем, заданных моделями вида (2.29), где dim{u} = dim{y} разработаны методы анализа и синтеза соединений [279] при условии, что cвязи между системами удовлетворяют условию линейности, симметричности, инвариантности и так называемому условию диффузии. В общем
5Отметим также, что несмотря на катастрофу в системе (2.34) при e < 0, отображение ST (u,e) остается локально ограниченным.
ется открытым. Это дополнительно подчеркивает актуальность задачи исследования
свойств систем с локально ограниченными операторами и их соединений.
Для возможности формального анализа соединений систем прежде всего необ
ходимо определить основные классы взаимодействий, которые принято называть по
следовательным, параллельным и замкнутым соединением. С этой целью введем
в рассмотрение две системы S12:
и S
1,T : n1 [t0,T];
u1 x1 ⊆L
SL×E1 →L∞ (2.35)
1,T : u1 y1 ⊆Lm1 [t0,T];
HL×E1 →L∞
2,T : u2 x2 ⊆Ln2 [t0,T];
SL×E2 →L∞ (2.36) 2,T : m2 [t0,T].
u2 y2 ⊆L
HL×E2 →L∞ Определение 2.3.2. Пусть заданы системы S1, S2 ⊆L. Последо
y1 u2
и Lвательным соединением систем S12 будем называть систему S:
и S
: x ⊆Ln1+n2 [t0,T];
ST Lu ×E →L∞ (2.37)
: y ⊆Lm2 [t0,T],HT Lu ×E →L∞
где
= 2; x = x1 x2 ; y = y2 ;
EE1 ⊕ELL⊕LLLST (u,e1 ⊕e2) = S1,T (u,e1) ⊕S2,T (H1,T (u,e1),e2), (2.38) HT (u,e1 ⊕e2) = H
2,T (H1,T (u,e1),e2).
Определение 2.3.3. Пусть заданы системы S1, S2 u = u1 =0.
u2
и L
L∩LПараллельным соединением систем S12 будем называть систему S:
и S
: x ⊆Ln1+n2 [t0,T],
ST Lu ×E →L∞ (2.39)
: y ⊆Lm1+m2 [t0,T],HT Lu ×E →L∞
где
= 2, x = x1 x2 , y = y1 y2 ;
EE1 ⊕ELL⊕LLL⊕LST (u,e1 ⊕e2) = S2,T (u,e2),1,T (u,e1) ⊕S(2.40) HT (u,e1 ⊕e2) = H2,T (u,e2).1,T (u,e1) ⊕HОпределение 2.3.4. Пусть заданы системы S1, S2 и Ly1 u2 , Ly2 u1 .⊆L⊆LЗамкнутым соединением систем S12 будем называть систему S:
и S
: x ⊆Ln1+n2 [t0,T],
ST Lu ×E →L∞ (2.41)
: y ⊆Lm1+m2 [t0,T],HT Lu ×E →L∞
= 2, x = x1 x2 , y = y1 y2 , u = u1 u2
EE1 ⊕ELL⊕LLL⊕LLL⊕Ly1 = 1,T (u1 + y2,e1);
H
y2 = 2,T (u2 + y1,e2);
H(2.42)
ST (u1 ⊕u2,e1 ⊕e2) = S2,T (u2 + y1,e2);1,T (u1 + y2,e1) ⊕S
HT (u1 ⊕u2,e1 ⊕e2) = H2,T (u2 + y1,e2).1,T (u1 + y2,e1) ⊕H
В задаче анализа свойств соединений систем прежде всего актуальны вопросы реализуемости и полноты всего соединения. Эти вопросы наиболее остро стоят в задаче анализа замкнутых соединений систем. Отличительной особенностью замкнутого соединения (2.42) является неявный характер задания оператора такой системы и, как следствие, трудности анализа свойств операторов ST , HT . Дополнительной сложностью в задаче анализа операторных свойств соединений становится и необходимость замены гипотезы о непрерывности операторов ST , HT на более практичную гипотезу их локальной ограниченности. Следствием этого является то, что такой мощный инструмент анализа, как теорема о малом контурном усилении (теорема 2.2), оказывается не пригодной для анализа контуров (замкнутых соединений) из систем с локально ограниченными операторами.
Таким образом, анализ систем с позиции задач управления не исчерпывается анализом реализуемости и полноты. Более того, свойства полноты служат лишь необходимым условием разрешимости более важной цели – управления системой. Отсюда следует актуальность задачи анализа асимптотических свойств полных систем или, другими словами, анализ ограниченности по нормам в соответствующих функциональных пространствах Lx, Ly состояний и выходов для классов воздействий из множества E. Как только свойство ограниченности установлено, возникает задача оценки предельных множеств по состоянию, выходу и входу в управляемых системах.
Следовательно, актуальны следующие задачи анализа систем с локально ограниченными операторами.
З а д а ч а 2.1. Анализ реализуемости и полноты соединений. Пусть система S:
n
: x ⊆L∞[t0,T],ST Lu ×E →L(2.43) y ⊆Ln
:[t0,T]
HT Lu ×E →L∞
является (последовательным, параллельным, замкнутым) соединением систем S1 и S2. Требуется:
1) найти условия, при которых соединение S реализуемо;
2) найти условия, при которых соединение S полно.
З а д а ч а 2.2. Анализ локальной ограниченности оператора соединений. Пусть задана полная система S (2.43). Требуется:
1) сформулировать условия (свойства систем S1 и S2), гарантирующие локальную ограниченность операторов “входсостояние” и “входвыход” системы S для всех
u ∈Lu; 2) найти коэффициенты γS,Lx (·,·,·), γH,Lx (·,·,·) передаточных отображений “вход
состояние” и “входвыход”:
x(t)Lx,[t0,T ] ≤γS,Lx (e,u(t)Lu,[t0,T ],T),
y(t)Ly ,[t0,T ] ≤γH,Ly (e,u(t)Lu,[t0,T ],T).
З а д а ч а 2.3. Анализ асимптотического поведения систем. Пусть задана полная система S (2.43) с локально ограниченными операторами “входсостояние” и “входвыход”. Найти предельные (при t →∞) оценки областей принадлежности состояния x(t) и выхода y(t). Кроме того, определить оценки
lim x(t)Lx,[T,∞], lim (2.44)
T →∞ y(t)Ly ,[T,∞]
T →∞ как функции от e ∈E, u ∈Lu.
Решению этих и смежных задач посвящены следующие параграфы раздела.
2.4. Анализ и синтез систем с локально ограниченными операторами
2.4.1. Анализ реализуемости соединений систем с локально ограниченными операторами
Рассмотрим задачу анализа реализуемости и полноты соединений систем. Вопросы реализуемости и полноты соединений актуальны прежде всего в задачах синтеза систем. Наиболее простыми и часто встречающимися операциями в задаче синтеза систем являются, очевидно, параллельное или последовательное соединение элементов. Но в общем случае уже последовательное соединение двух произвольных абстрактных систем может представлять известные сложности для анализа соединений в терминах функциональных норм входов, выходов и состояния системы.
П р и м е р 2.4.1. Рассмотрим последовательное соединение систем
2
S1 : z= z(1 + u1(t)); (2.45)
−
x1 = x2,
S2 : (2.46) x2 = −ω2
0 x1 + z(t),
где ω0 > 0 – параметр системы (2.46). В системе (2.46) возникает эффект резонанса
1
при воздействиях z(t) = rsin(ω0t) ∈L[t0,T], r ∈R. А именно, решения x1(t) могут
∞
rt
иметь вид x1(t)= 2ω0 cos(ω0t), что соответствует неограниченному росту нормы
− x(t)∞,[t0,T ] при T → ∞ и сколь угодно малых значениях r (т. е. при сколь угодно
малых значениях нормы z(t)∞,[t0,T ]).
В примере 2.4.1 условия резонанса, очевидно, не будут выполнены ни при каких u1(t) ∈ L1 . Однако в общем случае требуется возможность осуществления та
∞,[t0,T ]
кого рода проверок для произвольных нелинейных систем (2.1), (2.2), что не представляется возможным и, более того, необходимым. Более приемлемым способом анализа соединений являются, повидимому, консервативные оценки поведения систем на основе понятий коэффициентов передаточных отображений и реализуемости. Такие консервативные оценки последовательных и параллельных соединений приводятся в следующей теореме.
Теорема 2.4. Пусть заданы системы (2.35) и (2.36). Тогда
1) параллельное соединение (2.39), (2.40) реализуемых (полных) систем реализуемо (полно).
Если при этом системы S1, S2 реализуемы (полны) с передаточными отображениями по нормам ·Lu1 на интервалах [t0,T1], [t0,T2] соответствен
и ·Lu2
но, и кроме того, для системы S1 определен коэффициент γH,Ly1 передаточного
отображения
y1(t)Lu2 ,[t0,T1] ≤γH,Ly1 ⊆Lu2 (e1,u1(t)Lu1 ,T1),
то
2) последовательное соединение (2.37), (2.38) систем S12 также реализу
и Sемо (полно) с передаточным отображением по норме ·Lu1 .
x(t)∞,[t0,T ] γS1,∞(e1,u1(t)Lu1 ,[t0,T ],T) + γS2,∞(e2,γH,Ly1 (e1,u1(t)Lu1 ,T),T);
≤
(2.47)
y(t)∞,[t0,T ] γH2,∞(e2,γH,Ly1 (e1,u1(t)Lu1 ,T),T).
≤
Причем в случае реализуемых систем время T = T∗(S) существования системы S удовлетворяет оценке
T∗(S) ≤min{T∗(S1),T∗(S2)}. (2.48)
Свойства реализуемости и полноты параллельных и последовательных соединений в условиях теоремы 2.4 наряду с оценками (2.47) в дальнейшем будут использованы при анализе замкнутых контуров. Однако, прежде чем перейти к формулировке основного результата параграфа – теореме о реализуемости и полноте замкнутых соединений – введем дополнительное понятие, имеющее важное значение для анализа динамических систем.
Определение 2.4.1. Рассмотрим систему S, (2.1), (2.2), заданную опе
раторами ST и HT , (2.3), (2.4) на T =[t0,T]. Пусть в дополнение определено отображение
ψ : x[t0,T] ψ[t0,T], (2.49)
L×Eψ →Lгде Lψ[t0,T] – линейное нормированное пространство с нормой ·Lψ ,[t0,T ], а Eψ – линейное пространство.
Будем говорить, что ψ(x(t),eψ) ∈Lψ[t0,T] мажорирует состояние x(t) и выход y(t) по норме ·Lψ , если и только если существуют функции µS,∞ : E×R+ R+→
R+ такие, что
и µH,∞ : E×R+ →
x(t)∞,[t0,T ] ≤µS,∞(e,ψ(x(t),eψ )Lψ ,[t0,T ]); (2.50)
y(t)∞,[t0,T ] ≤µH,∞(e,ψ(x(t),eψ )Lψ ,[t0,T ]). (2.51)
Без потери общности будем полагать, что функции µS,∞(·,p) и µH,∞(·,p) не убывают по аргументу p.
Понятия мажорирования и мажорирующих функций в частности широко известны в анализе и эффективно применяются в задачах синтеза систем управления6. Практический смысл использования мажорирующих функций состоит прежде всего в том, чтобы по изменениям (или посредством изменения) известных a priori функций судить об изменении целого ряда переменных. При этом сами мажорируемые переменные в общем случае могут быть не доступны для непосредственного измерения.
В рамках стандартных постановок задач анализа систем, где пространства состояния X ⊆Rn, свойство мажорирования состояния сводится к оценкам вида
(2.52)
x≤µ(ψ(x)).
6См., например, [48], где вводится метод мажорирующих функций для решения задач адаптивного и робастного управления. В работах [230, 231] мажорирование используется для адаптивной компенсации нелинейно параметризованных возмущений.
α1(x)≤V(x,t)≤α2(x), α1,α2 ∈K∞
являются, по существу, условиями мажорирования.
Несмотря на очевидное сходство между (2.30), (2.52) и (2.50), (2.51), характеристика функционального мажорирования7 в определении 2.4.1 обладает рядом преимуществ по сравнению со стандартными определениями в задачах анализа динамических систем.
Вопервых, мажорирование в определении 2.4.1 означает возможность оценки поведения системы S в пространстве Lx[t0,T] с помощью функций из Lψ[t0,T]. Наличие такой связи дает, в свою очередь, дополнительную степень свободы при решении задач синтеза. И в этом смысле, вовторых, функция ψ(x,eψ) является “информационной” переменной анализа – в отличие от “действительной” в (2.52). Другими словами, для того, чтобы управлять состоянием x(t)∈Lx[t0,T], например, перемещением или максимальным отклонением от заданного множества (элемент пространства
x[t0,T] ⊆Ln [t0,T]) совсем не обязательно строить систему управления перемеще
L∞
нием и компенсировать отклонения большими по амплитуде управлениями. Вполне
m
достаточным может оказаться управление энергией ψ(x(t),eψ ) ⊆L2 [t0,T] системы с помощью малых по амплитуде управляющих сигналов.
Втретьих, такое функциональное мажорирование хорошо согласуется с известным принципом управления по агрегированным макропеременным [51, 27, 26, 30, 52, 42]. Основное отличие мажорирования в определении 2.4.1 от понятия макропеременной в заключается лишь в том, что макропеременная является функцией состояния x(t), в то время как мажорирующее отображение ψ(x(t),eψ ) в определении 2.4.1 есть элемент нормированного функционального пространства Lψ[t0,T]. В обоих случаях оказывается возможным трактовать отображения ψ(x(t),eψ) как параметры порядка исследуемой системы.
П р и м е р 2.4.2. Рассмотрим уравнения массы на пружине с нелинейным демпфированием:
x1 =x2,
(2.53)
x2 =k0x1 +f(x2,t)+u(t), k0 < 0,
где функция f : R ×R+ → R, f ∈ C1 моделирует влияние нелинейного демпфера.
Введем в рассмотрение функцию ψ(x(t),λ)= λx1(t)+x2(t), λ ∈ R>0 и рассмотрим
7Под термином функциональное мажорирование имеется в виду мажорирование в функциональных пространствах.
x1 =−λx1 +ψ(t).
Функция ψ(x(t),λ) ∈ L1 [t0,T] мажорирует состояние системы (2.53) по норме ·
∞
∞,[t0,T ]. Это следует, например, из того, что x1(t) является решением уравнения
t x1(t)=e−λt x1(t0)+e−λt e λτ ψ(τ)dτ ⇒; t0
1
x1(t)x1(t0)+ λψ(t)∞,[t0,t].
||≤||
Тогда, используя неравенство
x2(t)ψ(t)+λx1(t),
||≤||||
получим, что
1
x(t)∞,[t0,t] ≤ 1+ ψ(t)∞,[t0,t] +(1+λ)x1(t0). (2.54)λ ||
В дополнение к оценке (2.54), можно показать, что функция ψ(x(t),λ) ∈ L1 [t0,T]
∞
мажорирует состояние системы (2.53) по нормам L1[t0,T], p ≥ 1. Действительно,
p
применяя неравенства треугольника Гельдера [28] и используя
1 1
e−λt t λτ 1
e |q dτ,
t0 |≤ λq
получим
1
q
1 11
x1(t)∞,[t0,t] ≤x1(t0)+ ψ(t)p,[t0,t], + =1.
||λq pq Следовательно, максимальное отклонение x1(t)в системе (2.53) мажорируется также
и нормами ψ(t)p,[t0,t]. Это, в свою очередь, означает, что управление максимальным
отклонением x1(t) от начала координат на интервале времени [t0,t] может быть ре
ализовано в пространстве Lψ посредством регулирования норм ψ(t)p,[t0,t], p ≥ 1.
При этом точное знание нелинейного демпфирования f(x2,t) не требуется.
Таким образом, использование понятия мажорирующего отображения позволяет более гибко применять результаты операторного анализа систем. С другой стороны, оно ни в коей мере не ограничивает применимость последующих формулировок в силу того, что мажорирующее отображение для системы (2.1), (2.2), заданной операторами ST и HT , (2.3), (2.4), всегда существует, например, вида ψ :ψ(x(t),eψ)=x(t), если система реализуема с передаточными отображениями по норме ·Lu .
В силу определения 2.4.1, для заданного мажорирующего отображения ψ(x(t),eψ) в виде (2.49) можно определить оператор
u,e,eψ):Lu[t0,T]ψ[t0,T]PT (×E×Eψ →L(2.55) u,e,eψ)=ψ(ST (u,e),eψ ).
PT (
Таким образом, в последующем будем рассматривать системы, заданные операторами ST , HT и PT . Кроме того, ограничимся рассмотрением систем, для которых выполнено следующее условие.
Предположение 2.1. Для любого e ∈ E найдется функция u∗(e,t) и
подпространство Lδ [t0,T]⊆Lu[t0,T] такие, что для операторов
u∗(e,t)+δ(t),e,eψ )
PT (u∗(e,t)+δ(t))
ST (
определены коэффициенты γP,Lψ , γH∗,Ly передаточных отображений Lδ [t0,T]
→
ψ[t0,T], Lδ [t0,T]y[t0,T]:
L→L
ψ(t)Lψ ,[t0,T ] ≤γP,Lψ (e,eψ ,δ(t)Lδ ,[t0,T ],T) (2.56)
y(t)Ly,[t0,T ] ≤γH∗,Ly (e,δ(t)Lδ ,[t0,T ],T). (2.57)
Предположение 2.1 означает, что для любого возмущающего воздействия e среды E в пространстве входов Lu[t0,T] можно выделить элемент u∗(e,t) и непустое подпространство Lδ [t0,T] ⊆Lu[t0,T] такие, что управления u(t)= u∗(e,t)+δ(t) “регулируют” выход y(t) и функцию ψ(t) по нормам y(t)Ly ,[t0,T ], ψ(t)Lψ ,[t0,T ] в силу неравенств (2.56), (2.57). Оценка (2.56), в свою очередь, согласно условиям мажорирования (2.50), (2.51) позволяет управлять нормами x(t)∞,[t0,T ], y(t)∞,[t0,T ] состояния и выходов системы S. Другими словами, предположение 2.1 постулирует саму возможность функционального управления состоянием x(t) и выходом y(t) посредством управляющих сигналов δ(t) из подпространства Lδ[t0,T] пространства u[t0,T] входов при условии сохранения реализуемости системы S8.
L
Рассмотрим замкнутое соединение системы S1, удовлетворяющей предположению 2.1, и некоторой системы S2. Cтруктурная схема такого соединения изображена на рис. 2.4. Как было отмечено ранее, операторы замкнутого соединения систем (2.42) в общем случае задаются неявным образом в зависимости от операторов систем
1, S2. При этом, согласно условиям задачи 2.1, непрерывность отображений H1,T ,S8В частном и наиболее практичном случае, когда нормы ·Ly ,[t0,T ] совпадают, и ·∞,[t0,T ]
неравенство (2.57) автоматически выполняется (см. (П2.19) в Приложении 1).
Рисунок 2.4. Замкнутое соединение систем S12
и S
2,T может нарушаться как следствие возможных резонансов или неустойчивости
H
систем S1, S2. Более того, сами отображения H1,T , H2,T могут быть не полностью известны. Поэтому возникает вопрос о возможности анализа реализуемости, полноты и ограниченности состояния и выходов соединения с использованием информации лишь качественного характера, а именно, таких свойств операторов H1,T , H2,T , как локальная ограниченность коэффициентов функций γH1,Ly1 , γH2,Ly2 = γH2,Lδ передаточных отображений.
Ответ на этот вопрос дается теоремой 2.5, устанавливающей достаточные условия реализуемости и полноты замкнутых соединений, схема которых приведена на рис.
2.4.
Т е о р е м а 2.5. Теорема о существовании малого контурного усиления. Пусть
система S1 заданная операторами S1,T 1,T , (2.35) на T =[t0,T] удовлетворяет
и Hусловиям:
1) для системы S1 существуют мажорирующее отображение ψ(x1(t),eψ ) и
функция u∗(e1,t) ∈Lu[t0,T], удовлетворяющие предположению 2.1.
Рассмотрим систему S2, (2.35), заданную операторами
2,T : y1 [t0,T][t0,T];
x2
SL×E2 →L
2,T : y1 [t0,T] δ[t0,T].HL×E2 →L
Положим, что
2) система S2 реализуема (полна) с заданными передаточными отображениями по норме ·Ly1 ,[t0,T ];
3) коэффициент γH2,Lδ передаточного отображения Ly1 [t0,T] →Lδ [t0,T] суще
ствует и глобально ограничен по норме Ly1 ,[t0,T ], т. е. существует непрерывная ·
H2,Lδ (e2,T) : E2 ×R+ R+ такая, что неравенство
→
H2,Lδ (e2,T), (2.58)
γH2,Lδ (e2,y1(t)Ly1 ,[t0,T ],T) ≤γ∗
выполнено для всех y1(t) ∈Ly1 [t0,T].
Тогда замкнутое соединение (2.42) систем S1, S2 реализуемо (полно) для всех
u(t):
u(t) = u∗(e1,t) + δ(t), δ(t) ∈Lδ [t0,T]. (2.59)
При этом, если функции γP,Lψ (·), γ∗) ограничены по T:
H2,Lδ (·
sup γP,Lψ (e1,eψ,d,T) = ΔP (e1,eψ,d), T ≥t0
sup γ∗
H2,Lδ (e2,T) = ΔC (e2), T ≥t0
то x1(t), y1(t) ограничены, и как следствие, справедливы следующие оценки:
x1(t)∞,[t0,T ] ≤µS1,∞(e1,ΔP (e1,eψ ,ΔC (e2) + δ(t)Lδ ,[t0,T ]));
(2.60)
y1(t)∞,[t0,T ] ≤µH1,∞(e1,ΔP (e1,eψ ,ΔC (e2) + δ(t)Lδ ,[t0,T ])).
Теорема 2.5, или теорема о существовании малого контурного усиления , устанавливает, что для реализуемости (полноты) замкнутых соединений реализуемых (полных) систем S12 с локально ограниченными операторами достаточно, чтобы
и Sкоэффициент γH2,Lδ передаточного отображения из L[t0,T] в Lδ[t0,T] был ограни
y1
ченной по y1(t)Ly1 ,[t0,T ] функцией для всех y1(t) ∈Ly1 [t0,T].
Таким образом, в отличие от теоремы о малом контурном усилении (теорема 2.2), теорема 2.5 не требует точного знания коэффициентов передачи γ1 и γ2 операторов “входвыход” H12 для того, чтобы сделать вывод о реализуемости, полноте и
и Hограниченности состояний и выходов в замкнутом контуре. Вместо этого требуется лишь существование ограниченного по y1(t)Ly1 ,[t0,T ] коэффициента передаточного отображения (2.58). При этом коэффициенты передачи из Ly1 [t0,T] δ [t0,T] и
в L δ[t0,T] в Lδ [t0,T], вычисляемые в виде
1,T (u∗(e,t) + δ(t),e1)Ly1 ,[t0,T ]γLy1 ,Lδ = sup Hδ(t)Lδ [t0,T ] ,
δ(t)∈Lδ [t0,T ] 2,T (y1(t),e2)Lδ ,[t0,T ]
, (2.61)
γLδ ,Ly1 = sup Hy1(t)Ly1 [t0,T ]
y1(t)∈Ly1 [t0,T ] 1,T (u∗(e1,t) + δ(t),e1),e2)Lδ ,[t0,T ]
2,T (H γLδ ,Lδ = sup Hδ(t)Lδ ,[t0,T ]
δ(t)∈Lδ [t0,T ]
могут быть не определены (т. е. иметь разрывы второго рода, см. рис. 2.5, в.), не ограничены (рис. 2.5, а.) и/или не удовлетворять условию малости контурного усиления γLδ ,Lδ = γLy1 ,Lδ γLδ ,Ly1 < 1 для всех y1(t) ∈Ly1 [t0,T]δ [t0,T] (рис. 2.5,
· , δ(t) ∈L
в.)
Рисунок 2.5. Иллюстрация к существованию малого контурного усиления
Физический смысл положений теоремы 2.5 иллюстрируется рисунком 2.5. На рис. 2.5, а. изображены графики функции γH∗
1 ,Ly1 (e1,δ(t)Lδ ,[t0,T ],T) в зависимости от аргумента δ(t)Lδ ,[t0,T ] при различных значениях аргумента e1, соответствующие кривым синего, красного и зеленого цветов. На рис. 2.5, б. приведен график функции γH2,Lδ (e2,y1(t)Ly1 ,[t0,T ],T) в зависимости от аргумента y1(t)Ly1 ,[t0,T ]. На рис. 2.5, в. приведена оценка верхней границы γ∗ коэффициента контурного усиления в
Lδ ,Lδ
точке δ(t) ∈Lδ[t0,T]:
γ∗ 1 ,Ly1 (e1,δ(t)Lδ ,[t0,T ],T),T)
Lδ ,Lδ (δ(t)Lδ ,[t0,T ],T) = γH2,Lδ (e2,γH∗δ(t)Lδ ,[t0,T ] .
В силу того, что выполняется условие (2.58), функция γ∗ δ(t)Lδ ,[t0,T ],T) мажо
Lδ ,Lδ (
рируется монотонно убывающей функцией (в пределе до нуля) при росте значений функциональных норм δ(t)Lδ,[t0,T ] сигнала δ(t) для фиксированного T и для каждого e1 ∈E1 (графики γ∗ δ(t)Lδ ,[t0,T ],T) для различных значений возмущений
Lδ ,Lδ (
среды e1 выделены цветом на рис. 2.5, в.). Очевидно, что для каждого e1
∈ E
найдется r(e1) ∈R+, такое, что
γLδ ,Lδ (r(e1)) = sup γ∗ δ(t)Lδ ,[t0,T ],T) < 1. (2.62)
Lδ ,Lδ (
δ(t)Lδ,[t0,T ]>r(e1)
(это соответствует заштрихованной области на диаграмме 2.5, в.). Следовательно, для любого e11 найдется такое число r(e1) ≥0, что коэффициент контурного
∈E
усиления γLδ ,Lδ в (2.61) будет меньше единицы для всех δ(t) ∈Lδ [t0,T] при условии, что δ(t) достаточно велики по норме: δ(t)Lδ ,[t0,T ] > r(e1). Если при этом функция
H2,Lδ (e2,T) в (2.58) окажется глобально ограниченной по T, то тогда для замкнутого соединения систем S1 и S2 контурное усиление по δ(t) будет строго меньше единицы для всех T > t0 и δ(t)Lδ ,[t0,T ] > r(e1).
γ∗
y2(t)Lδ ,[t0,T ] ≤γLδ ,Lδ (r(e1))δe(t)Lδ ,[t0,T ]
Lδ ,Lδ (r(e1))y2(t)Lδ ,[t0,T ] + γLδ ,Lδ (r(e1))δ(t)Lδ ,[t0,T ] ⇒
≤γ(2.63)
γLδ ,Lδ (r(e1)) y2(t)Lδ ,[t0,T ] ≤1 −γLδ ,Lδ (r(e1)) δ(t)Lδ ,[t0,T ].
Неравенство (2.63), в свою очередь, можно назвать свойством устойчивости “входвыход” для сигналов “большой амплитуды” (т. е. при δ(t)Lδ,[t0,T ] > r(e1), см. также определение 2.2.4) замкнутой системы Sпо отношению ко входу δ(t) и выходу y2(t).
Свойство устойчивости “входвыход” для сигналов большой амплитуды является антитезой известного понятия устойчивости “входвыход” в малом ([207], определение 5.2, стр. 201):
y2(t)Lδ ,[t0,T ] ≤αr(δ(t)Lδ ,[t0,T ]) + β,
где αr ∈Kопределено лишь для δ(t)Lδ ,[t0,T ] ≤r. Принципиальное отличие этих понятий с точки зрения анализа заключается в том, что устойчивость в малом гарантирует, что все сингулярности и резонансы существуют за пределами ограниченной области Dδ [t0,T]: δ(t)Lδ,[t0,T ] ≤r в пространстве Lδ [t0,T]. В то 0(r) ⊆L
время, как свойство устойчивости “входвыход” для сигналов большой амплитуды (2.63) означает, что особенности в поведении системы могут возникать лишь при ограниченных амплитудах воздействий (возмущений) δ(t). При этом для любого состояния e1 среды E1 область существования таких особенностей будет всегда ограничена внутренностью сферы D0(r(e1)). За пределами этой сферы поведение системы практически устойчиво [196] и коэффициенты передаточных отображений “входвыход” непрерывны по норме Lδ [t0,T ] в пространстве входов и выходов
·
δ[t0,T].
Результаты системного анализа общих свойств последовательных, параллельных и замкнутых соединений систем, приведенные в теоремах 2.4, 2.5, имеют существенное значение для формальной постановки и последующего решения задачи синтеза систем управления. Применение этих результатов к задаче синтеза адаптивных систем рассматривается к следующем параграфе.
2.4.2. Задача функционального синтеза адаптивного регулятора. Принцип разделения.
Для того, чтобы перейти от анализа соединений абстрактных систем к задачам синтеза адаптивных систем управления прежде всего конкретизируем понятия объекта управления, регулятора, цели управления и качества адаптивного управления.
p,T : Lu[t0,T]xp [t0,T];S×Ep →L
p,T : Lu[t0,T]yp [t0,T]; (2.64)
H×Ep →Lp,T : Lxp [t0,T]ψp [t0,T].P×Ep ×Eψ →L
В качестве допустимых управляющих входов выберем функции u∗(t)∈U∗ u[t0,T],
⊆L
где U∗ – множество допустимых управлений. Без потери общности будем полагать, что функция u∗(t) может зависеть от состояния xp(t) и воздействий ep среды Ep:
u∗(t)=u∗(ep,xp(t),t).
Отметим, что в силу того, что Lu[t0,T]обладает структурой линейного пространства, любой элемент u(t)∈Lu[t0,T] может быть представлен суммой вида
u(t)=u∗(ep,xp(t),t)+δ(t), δ [t0,T]u[t0,T] (2.65)δ(t)∈L⊆Lдля некоторого u(t)∈U∗ и подпространства Lδ [t0,T] пространства Lu[t0,T]9. Таким образом, можно сказать, что управление u∗(t) преобразует исходную систему (2.64) с множеством входов из Lu[t0,T] в новую, “управляемую” систему S∗с множеством
p
входов из Lδ [t0,T] ⊆ Lu[t0,T]. “Измененные” операторы системы (2.64) формально могут быть получены заменой u(t) в (2.64) на u∗(ep,xp(t),t)+δ(t), δ(t)∈Lδ [t0,T]
⊆
u[t0,T] и определены в виде
p,T (δ,e)=Sp,T (u∗ +δ,ep);
S∗
p,T (δ,e)=Hp,T (u∗ +δ,ep); (2.66)
H∗
p,T (δ,e,eψ )=Pp,T (u∗ +δ,ep,eψ ).
P∗В зависимости от конкретной задачи вход δ(t) в уравнениях (2.66) управляемой системы S∗может играть роль возмущения, ошибки по управлению, эталонной тра
p
ектории, программы и т. п.
Минимально допустимой целью управления будем считать ограниченность состояния xp(t) и выхода yp(t) объекта Sp. Ограниченность состояния и выхода в случае реализуемых (полных) систем лишь на конечном ограниченном интервале времени [t0,T], безусловно, не является конечной целью синтеза. Однако это требование в силу того, что точные количественные характеристики операторов управляемого объекта не используются на данном этапе синтеза, оказывается адекватным уровню доступной информации о самом объекте.
Регулятором будем называть систему Sc:
c,T : Lyp [t0,T]c [t0,T];
xc
S×E→L(2.67)
c,T : Lyp [t0,T]cyc [t0,T]u[t0,T],
H×E→L⊆L
9При этом Lδ [t0,T] в общем случае совпадает с Lu[t0,T].
yc [t0,T] u[t0,T] функций u∗(ep,xp(t),t) ∈U∗.yc(t) ∈L⊆L
В силу того, что управление u∗(ep,x(t),t) ∈ U∗, обеспечивающее достижение цели, в общем случае зависит от состояния xp(t) и воздействий среды ep ∈ Ep, то естественным образом возникают задачи восстановления значимой для управления информации о состоянии xp(t) и о воздействиях среды ep. В соответствии с этим введем в рассмотрение систему наблюдения So:
o,T : yp [t0,T] o [t0,T],
xo
SL×E→L(2.68)
o,T : yp [t0,T] oyo [t0,T],
HL×E→L
систему адаптации Sa:
a,T : yp [t0,T] yo [t0,T] ×Ea [t0,T],
xa
SL⊕L→L(2.69)
a,T : yp [t0,T] yo [t0,T] ×Eaya [t0,T];
HL⊕L→L
и функции
uo : Eyo [t0,T] u[t0,T],
p ×L×R+ →L
ua : Lya [yo [t0,T] u[t0,T],
t0,T] ×L×R+ →L
где yo(t) – это оценка информации о состоянии xp(t) при воздействиях среды ep по измерениям yp(t), а ya(t) – оценка информации о воздействии среды ep по измерениям yp(t) с использованием оценок yo(t). При этом функция uo(ep,yo(t),t) является оценкой управления u∗(ep,xp(t),t) по измерениям yp(t) при условии, что ep известно. Функция ua(ya(t),yo(t),t), в свою очередь, является оценкой функции uo(ep,yo(t),t) по измерениям yp(t), yo(t). Таким образом, опосредованно через функцию uo(ep,yo(t),t) и отображения (2.68), (2.69), функция ua(ya(t),yo(t),t) является оценкой функции u∗(ep,xp(t),t) по измерениям yp(t). В этой связи будем полагать, что функция ua(ya(t),yo(t),t) является выходом yc(t) регулятора Sc.
Качество систем управления в стандартных постановках определяется, как правило, в терминах свойств желаемого поведения объекта. В нашем же случае, при условии, что желаемое поведение обусловлено лишь ограниченностью состояния и выходов, логично рассматривать не качество системы в целом, а качество собственно управления. В силу того, что объект Sp под действием управления u∗(ep,xp(t),t) представляет собой систему (2.66), для которой пространство входов ограничено линейным нормированным пространством Lδ [t0,T], то в роли критерия качества управления естественно выбрать отклонение функций uo(ep,yo(t),t), ua(ya(t),yo(t),t) по норме в Lδ[t0,T] от неизвестного u∗(ep,xp(t),t):
x[t0,T]= u∗(ep,xp(t),t) −uo(ep,yo(t),t)Lδ ,[t0,T ]; (2.70)
J
e[t0,T]=uo(ep,yo(t),t)−ua(ya(t),yo(t),t)Lδ ,[t0,T ]. (2.71)
J
Таким образом, задача синтеза функционального адаптивного регулятора в широком смысле этого слова, как задача управления в условиях неопределенности информации о воздействиях (eoa среды и в отсутствие точной
p,eo,ea) ∈ Ep ×E×E
информации о состоянии x(x[t0,T] объекта Sp, может быть сформулирована
t) ∈ Lследующим образом:
З а д а ч а 2.4. Задача функционального синтеза адаптивного регулятора. Для
класса реализуемых (полных) объектов Sp (2.64) найти функции u∗(ep,xp(t),t) и
определить классы систем So, Sa (2.68), (2.69) такие, что для всех ep:p ∈E1) замыкание системы S∗(2.66) с регулятором So, Sa реализуемо (полно);
p 2) состояние xp(t)и выход yp(t)объекта Sp и регулятора ограничены; 3) оценки верхних границ Jx, Je в (2.70), (2.71) и норм xp(t)Lxp ,[t0,T ], yp(t)Lyp ,[t0,T ] могут быть получены как функции аргументов ep, eo, ea. Последнее требование обусловлено необходимостью сравнения свойств систем управления в зависимости от условий функционирования и состояния среды Ep, Eo,
a.
E
Достаточные условия разрешимости этой задачи в виде ограничений на системы
o, Sa вытекают из следующей теоремы. S
Теорема 2.6. Рассмотрим систему (2.64), заданную операторами Sp,T , Hp,T и Pp,T . Пусть
1) существует управление (2.65) такое, что управляемая система (2.66) удовлетворяет предположению 2.1;
2) существуют реализуемые (полные) системы So (2.68) и Sa (2.69), заданные операторами So,T , Ho,T a,T , Ha,T соответственно;
и S3) нормы Jx[t0,T] e[t0,T], определенные выражениями (2.70), (2.71) ограни
и Jчены
x ≤ΔJx , Je ≤ΔJe . (2.72)J
Тогда замкнутое соединение системы Sp c регулятором Sc:
c,T (yp,eo ⊕ea)=Sa,T (yp,Ho,T (yp,eo)o(yp,eo),S,ea)⊕S(2.73)
c,T (yp,e0 ⊕ea)=ua(Ha(yp,Ho(yp,eo),ea),Ho(yp,eo),t)
H
ничена по T:
sup γP,Lψ (ep,eψ,d,T) = ΔP (ep,eψ ,d), (2.74) T ≥t0
то xp(t) ограничено:
xp(t)∞,[t0,T ] ≤µSp,∞(ep,ΔP (ep,eψ,ΔJx + ΔJe + δ(t)Lδ ,[t0,T ])).. (2.75)
Теорема 2.6 формулирует достаточные условия разрешимости части 1) задачи 2.4. Проблема 2) в задаче 2.4 автоматически разрешается при наличии дополнительной информации о свойствах “входвыход” и “входсостояние” для систем Soa. В част
и Sности, если они обладают свойством “ограниченный вход – ограниченный выход”, то
проблема 2) также автоматически разрешается, так как согласно теореме 2.6 условие
(2.74) влечет ограниченность xp(t)). Решение подзадачи 3), очевидно, требует знания оценок передаточных отображений для систем So, Sa, что, как правило, всегда доступно на этапе синтеза системы управления.
В дополнение к условиям разрешимости задачи синтеза на принципиальном уровне, как то: обеспечение полноты и ограниченности состояний, теорема 2.6 формулирует принцип разделения в задаче синтеза управления в условиях неопределенности. В частности, этим принципом обосновывается то, что решение задачи управления в условиях неопределенности может быть сведено к решению совокупности независимых задач:
1) задачи синтеза управления u∗(ep,xp(t),t), при наличии достоверной информации о состоянии xp и среде ep, трансформирующего объект Sp в систему (2.66), удовлетворяющую предположению 2.1;
2) задачи синтеза системы наблюдения (наблюдателя) So состояния xp(t) по выходу yp(t), гарантирующей ограниченность нормы Jx[t0,T] для всех u∗ при
∈ U∗
условии, что воздействия среды ep измеряются;
3) задачи синтеза системы адаптации Sa к неконтролируемым возмущениям среды ep, гарантирующей ограниченность нормы Je[t0,T] для всех yoyo .
∈L
Ключевым фактором, в отличие от стандартных подходов, здесь является то, что условия реализуемости, полноты и ограниченности решений замкнутой системы не зависят от того, каким образом получены частные решения задач 1)–3). Так, например, для решения задачи 1) совершенно не важно, каким образом решаются задачи 2), 3). Требуется лишь отыскать u∗ ∈ U, удовлетворяющее предположению 2.1. С другой стороны, решение задач 2), 3), по сути, требует выполнения ограничения (2.72). При этом в силу того, что эти задачи решаются сразу для классов u∗
∈U и
yo ∈Lyo , общее решение задачи управления не зависит от того, какие конкретные элементы u∗ и yo были выбраны на этапах 1) и 2).
2.5. Анализ асимптотического поведения систем с локально ограниченными операторами
Предыдущие параграфы раздела были посвящены проблеме функционального анализа и отчасти синтеза систем с локально ограниченными передаточными отображениями. Результаты, сформулированные в теоремах 2.4, 2.5 и 2.6, устанавливают условия при которых последовательное, замкнутое и параллельное соединения систем с локально ограниченными операторами также являются системами с локально ограниченными операторами относительно новых входов, выходов и состояний. Это соответствует решению задач 2.1 и 2.2.
Решение задачи 2.3 в отличие от задач 2.1 и 2.2 предполагает не просто установление факта ограниченности состояния и выходов, но и подразумевает спецификацию областей, в которых это состояние находится. Поэтому естественно полагать, что для ее решения потребуется дополнительная информация о системе. Вопрос лишь в том, какая это информация. Так, в частности, оценки (2.44) могут быть получены непосредственно из (2.75) или (2.60) при условии, что известны оценки сверху на предел
lim sup δ(t)Lδ ,[T,∞], T →∞
и, кроме того, оценки отображений “входвыход” и “входсостояние” µS,∞(·), µH,∞(·), µSp,∞(·), области изменений параметров среды ep и оценки сверху норм Jx[t0,∞], [t0,∞]. Подобная информация, как правило, всегда доступна либо из эксперимента
Je
и предметной области происхождения системы, либо возникает на этапе синтеза, как характеристика регулятора. Более точные оценки принадлежности состояния и выходов системы с локально ограниченным оператором можно сформулировать с привлечением фундаментальных понятий инвариантных (см. определение 1.3.1) и предельных [120, 173] множеств.
О п р е д е л е н и е 2.5.1. Точка p называется ωпредельной точкой точки x0 потока (отображения) x(t,x0,t0), если существует последовательность момен
тов времени t1,t2,...,ti,... такая, что
lim x(ti,x0,t0) = p.
i→∞
Множество всех ωпредельных точек p для x0 называется ωпредельным множе
ством точки x0
Существует обширная литература по анализу свойств предельных множеств систем. Фундаментальные свойства предельных множеств для систем, заданных дифx= f (x), (2.76)
где функция f (·) локально Липшицева, сформулированы в следующей лемме (см. [120], стр. 198, а также [207], стр. 127, лемма 4.1).
Лемма 2.1. Если решения системы (2.76) ограничены для всех x0 ∈Dпо t ≥0, то множество Ω(D) = ω(x0) замкнуто, инвариантно и, кроме того,
x0∈D
lim dist(x(t,x0,t0),Ω(D)) = 0.
t→∞
Лемма 2.1 и теорема 2.6 позволяют сформулировать важное следствие.
Следствие 2.1. Рассмотрим системы Spc, удовлетворяющие услови
и Sям теоремы 2.6. Пусть, кроме того, системы Sa, So имеют локально ограниченные передаточные отображения “входсостояние” и δ(t) ≡ 0. Предположим, в дополнение, что в области (2.75) замкнутая система может быть описана дифференциальным уравнением вида (2.76)10. Тогда решения замкнутой системы асимптотически стремятся к максимальному инвариантному множеству, содержащемуся в
xmax µSp,∞(ep,d);p≤ ep∈Ep,d≤M (2.77) M = max ΔP (ep,eψ,d).
+ΔJe
ep∈Ep,eψ ∈Eψ ,d≤ΔJx
Наиболее принципиальное требование к информации о системе, предъявляемое следствием 2.1 состоит в возможности описания объекта, регулятора и среды системой автономных дифференциальных уравнений. Если такое допущение справедливо для системы, то тогда ключевым уточняющим фактором становится знание инвариантных множеств системы. Как правило, инвариантные множества самого объекта (положения равновесия или замкнутые орбиты) могут быть оценены a priori. Поэтому, если оценки асимптотического поведения управляемой системы важны, то существенной задачей на этапе синтеза адаптивной системы становится задача отыскания такого регулятора, чтобы инвариантные множества замкнутой системы совпадали с целевыми.
Выполнение этого естественного требования, однако, не всегда возможно для систем, допускающих неопределенности в модели, пусть и представимыми в виде
10Вектор x в данном случае – это обобщенный вектор состояния, включая состояние регулятора и среды.
Рисунок 2.6. Область притяжения траекторий
(2.76). Частные результаты для асимптотически устойчивых положений равновесия получены в работах [269, 106]. Однако для широкого класса систем и множеств более сложной структуры, в частности, неустойчивых, применение этих результатов малоэффективно. Это, в свою очередь, мотивирует необходимость разработки схем адаптивного управления, не привносящих новых инвариантных множеств, кроме желаемых, в пространство состояний замкнутой системы.
В заключение отметим наиболее важные отличия оценок (2.77), полученных в результате комбинированного использования методов функционального анализа систем и свойств предельных множеств от стандартных методов оценки асимптотических решений в теории адаптивных систем. Эти различия иллюстрируются рисунком
2.6. Прежде всего, условия реализуемости, полноты и ограниченности сформулированы с учетом мажорирующих отображений ψ(x, eψ). Для простоты будем полагать, что ψ : Rn R – скалярная функция состояния и не зависит от eψ . Множество
→
Ωψ = x ∈ Rnψ(x)=0} поэтому задает поверхность в Rn. В стандартных мето
{|
дах адаптивного управления требуется явное задание целевого множества в виде нулей положительно определенной и неограниченно возрастающей по xфункции V : Rn R+ (см. рис. 2.6, а). Это условие зачастую ограничивает применимость тео
→
рии, вопервых, множествами, для которых такое задание возможно (как правило, это сегменты гладких поверхностей или точки в Rn). Вовторых, в такой постановке необходимо a priori знание целевого множества. Дальнейшие изменения целевых множеств без изменения алгоритмов управления не допускается. В случае использования функционального подхода эти ограничения автоматически снимаются. Действительно, ограниченность состояния замкнутой системы вытекает из теорем 2.5,
2.6 (сфера Ωx = x ∈Rnx : x(t)≤Δ}на рис. 2.6, б). С другой стороны, состо{|
яние x(t) принадлежит области Ωψ = x ∈Rnx : ψ(x)≤M }. Таким образом,
{|||
траектория x(t, x0, t0, θ, u(t)) будет принадлежать множеству Ωx ∩Ωψ для всех t ≥t0 (затененная область на рис. 2.6, б). При этом в случае, если расширенная система удовлетворяет уравнениям вида (2.76), то решения стремятся к максимальному инвариантному множеству в Ωx ∩Ωψ . Знание этого множества a priori не требуется. В
1
случае, когда известно, что ψ(x) ∈Cи ψ → 0 при t →∞, то решения, очевидно, стремятся к максимальному инвариантному множеству в Ωψ .
Отметим также и отличие излагаемого подхода от геометрических методов в адаптивном управлении [106]. Прежде всего методы, использующие описание движения системы в локальных координатах целевых многообразий, применимы лишь в окрестности этих многообразий в Rn. При этом функции ψ(·) не должны зависеть от t, что совсем не обязательно в нашем случае, и кроме того, должны выполняться дополнительные метрические ограничения на свойства самой целевой поверхности [38]. В этом смысле результаты в [106] локальные (см. также теорему 1.1, приведенную в разд. 1). Результаты теорем 2.5, 2.6, напротив, не ограничены этими требованиями и, следовательно, применимы для систем, находящихся изначально вдали от положений равновесия или от целевых множеств.
2.6. Анализ асимптотического поведения неустойчивых систем
Большинство методов анализа асимптотических свойств динамических систем основано на таких фундаментальных понятиях, как устойчивость по Ляпунову в комбинации со стандартным понятием притягивающего множества (см. определение 1.3.2). Свойство (1.2) в определении 1.3.2 отражает собственно факт аттрактивности, притягивания или сходимости, в то время как свойство (1.1) требует, чтобы сходимость была равномерной по x0 в окрестности A. Требование равномерности в таком смысле, очевидно, является необходимым для непрерывности в Ln [t0, ∞] и,
∞
следовательно, устойчивости по Ляпунову.
Несмотря на то, что стандартные понятия притягивающих множеств и устойчивости по Ляпунову являются эффективным тандемом в обширном множестве приложений, все же некоторые задачи не могут быть решены на их основе. Условие (1.1), в частности, может нарушаться в системах с перемежающейся, итинерантной или метаустойчивой динамикой. В общем случае оно не выполняется в системах, где фазовый поток глобально не обладает свойством сжатия. Такие системы, однако, естественным образом возникают в задачах глобальной оптимизации [175]. Например, в [297] отыскание глобального минимума некоторой дифференцируемой функции Q : Rn → R+ на ограниченном множестве Ωx ⊂Rn предлагается решать разбиением процедуры поиска на локальносжимающую, градиентную подсистему Sa
∂Q(x)
:x=−µx +µtT(t), µx, µt ∈ R+
Sa
∂x (2.78) :T(t)=h{t, x(t)}, h :R+ × Ln [t0, t]Ln t0, t]
Sw
∞→ ∞[Поисковая функция T(t) в (2.78) плотной в области Ωx (то есть посещающей любую малую окрестность каждой точки в Ωx). Несмотря на то, что работа [297] не содержит формальных доказательств работоспособности алгоритмов (2.78), приведенные в ней вычислительные решения некоторых типовых оптимизационных задач демонстрируют существенные преимущества схем вида (2.78) по сравнению со стандартными, полученными из условий устойчивости по Ляпунову или равномерной по начальным условиям сходимости. Ослабление требования устойчивости по Ляпунову оказывается также преимущественным в задачах адаптации и идентификации для систем с параметризацией общего вида [323], навигации [309] и принятия решений в интеллектуальных системах [327, 330]. Системы с притягивающими, но тем не менее неустойчивыми по Ляпунову инвариантными множествами актуальны в задачах моделирования поведения биологических и физических систем [105]. Объекты подобного рода возникают также в задачах синхронизации нелинейных систем [121, 265] 11. В случае, если исходная система устойчива, необходимость отыскания подходящей функции Ляпунова может быть существенным препятствием для анализа, особенно в тех ситуациях, когда информация о системе не полностью доступна. В этих случаях достижение целевых множеств безотносительно к устойчивости собственно процесса достижения цели можно рассматривать в качестве допустимого решения задачи регулирования. Известные результаты в этом направлении опубликованы в работах [188, 283]. Несмотря на то, что свойство (1.1) может не выполняться или намеренно игнорируется при анализе, сходимость траекторий x(t, x0) к множеству A, свойство (1.2), должно, тем не менее, обеспечиваться. Это мотивирует, в свою очередь, исследование вопроса сходимости без требования ее равномерности в окрестности A по x0. Подходящим понятием, которое адекватно этому требованию, является свойство слабой аттрактивности или аттрактивности по Милнору [245]:
Определение 2.6.1. Множество A называется слабо аттрактивным, слабо притягивающим или притягивающим по Милнору, если оно
1) замкнутое, инвариантное и
11Здесь уместно также отметить работу [280], где показано существенное различие между устойчивой и “почти устойчивой” синхронизацией в терминах необходимых коэффициентов усиления между парой осцилляторов Лоренца.
2) для некоторого множества V (не обязательно окрестности множества A) со строго положительной мерой и всех x0 ∈V выполняется соотношение (1.2).
Стандартные методы, в частности, принцип инвариантности ЛаСалля [224] или теоремы о центральном многообразии [132], могут быть использованы для анализа локальной неравномерной сходимости. Успешность применения этих методов, однако, зависит от точности информации о дифференциальных уравнениях исследуемой системы. В тех случаях, когда такая информация недоступна, и система представима в виде соединений отображений “входвыход”, оправдано применение теорем о малом контурном усилении [344, 196] или теоремы 2.5. Эти результаты, однако, предполагают непрерывность либо локальную ограниченность отображений каждого компонента соединения, что может не выполняться для неравномерносходящихся процессов.
Предлагается компромиссное решение проблемы анализа асимптотической сходимости к неустойчивым множествам, использующее как свойства отображений “входвыход”, так и фундаментальные понятия предельных множеств и инвариантности (центральные понятия в [224, 132]). Рассматривается класс систем, которые могут быть представлены в виде замкнутого соединения равномернопритягивающей, устойчивой подсистемы Sa с поисковой, в общем случае неустойчивой, частью Sw. Типичным примером систем такого класса являются нелинейные каскады вида
a :x=f (x, z),
S(2.79)
w :z=q(z, x),
S
где нулевое решение xподсистемы асимтотически устойчиво по Ляпунову в отсутствие входа z, а состояние zподсистемы есть функция интеграла tt 0 x(τ )dτ . Сложность анализа асимптотических свойств соединений вида (2.79) заключается в том, что даже в случае если обе подсистемы в соединении (2.79) оказываются устойчивыми и xподсистема не зависит от состояния z, соединение вцелом может оказаться неустойчивым [97]. Однако неустойчивость по Ляпунову, как уже неоднократно было отмечено в разделе, не всегда означает неограниченность решений и невозможность достижения цели системой. Это обстоятельство дополнительно стимулирует необходимость анализа асимптотических свойств неустойчивых по Ляпунову систем.
Результаты настоящего параграфа позволяют показать, что для неустойчивых соединений вида (2.79), при выполнении некоторых дополнительных ограничений на свойства входвыход систем Saw, всегда существует непустое множество
и SV в пространстве состояния системы, такое что траектории, проходящие через V остаются ограничны и асимптотически приближаются к некоторому инвариантному множеству (слабому притягивающему множеству по Милнору).
Формально соединение систем Saw зададим следующим образом:
и S
a : (uSa,x0) →x(t), (2.80)
w : (uSw,z0) →z(t),
где uaa ⊆L∞[t0,∞], uww [t0,∞] – входы систем Saw соответственно,
и S
∈U∈U⊆L∞
nm
x0 ∈Rn , z0 ∈Rm начальные условия, а x(t) ∈X ⊆L[t0,∞][t0,∞]
∞, z(t) ∈Z ⊆L∞состояния. Положим, что система Sa устойчива от входа к состоянию относительно компактного множества A.
Предположение 2.2. Состояние x(t) системы Sa удовлетворяет условию:
a : x(t)A ≤β(x(t0)A ,t−t0) + cua(t)∞,[t0,t], ∀t0 ∈R+, t ≥t0, (2.81)S
где функция β(·,·) ∈KL, и c > 0 – положительная константа.
Сжимающие свойства невозмущенной динамики системы Sa моделируются в (2.81) функцией β(·,·). Отношение “входвыход” описывается в терминах непрерывного отображения, удовлетворяющего условию Липшица. При этом само отображение “входвыход” не обязательно сжимающее.
Для систем Sa, представимых системой обыкновенных дифференциальных уравнений x= fx(x,ua), fx(·1 , (2.82),·) ∈C
предположение 2.2 эквивалентно комбинации следующих свойств12:
∈ U→
κ(0) = 0 такая, что для всех
inf x(t)A ≤κ(ua(t)∞,[t0,∞)).
t∈[t0,∞)
Класс систем Sw, неустойчивых, поисковых подсистем соединения (2.80) специфицируем следующим образом.
Предположение 2.3. Система Sw полна:
uw z(t) ∈Z, ∀t ≥t0, t0 ∈R+w(t) ∈U⇒
12Подробное доказательство приведенных эквивалентных характеристик устойчивости “входсостояние” приводится в работе [302].
Рисунок 2.7. a. Структурная схема рассматриваемых соединений систем systems Sa и Sw. Система Sa – “сжимающая” система, имеет инвариантное притягивающее множество A, удовлетворяющее определению 1.3.2. Система Sw может не содержать притягивающих множеств, она соответствует “поисковой” динамике. Примером поведения систем такой конфигурации является динамика фазового потока в окрестности седловой точки в трехмерном пространстве, что иллюстрируется диаграммой b.
и для нее определены функции выхода h : Rm R и “ограничивающие” функции
→
γ0 ∞,e такие, что справедливо следующее интегральное неравен
∈K∞,e, γ ∈Kство:
t t
w : γ1(uw(τ ))dτ ≤h(z(t0)) −h(z(t)) ≤ γ0(uw(τ ))dτ, ∀t ≥t0,t0 ∈R+. (2.83)
S
t0 t0
Неравенство(2.83) влечет монотонность функции h(z(t)) по t. Для удобства по
следующих формулировок положим, что определены функции γ0,1 | : | R+ | R+ и |
→ | |||
γ0,2 : R+ R+ такие, что | |||
→ | |||
γ0(a · b) ≤γ0,1(a) · γ0,2(b), | (2.84) |
для всех ограниченных a, b ∈R+. Отметим, что эти функции всегда найдутся, например, для локально Липшицевых функций γ0(·).
Рассмотрим замкнутое соединение систем (2.81), (2.83) с уравнениями связи ua(t) = h(z(t)) и uw(t) = x(t):
A
x(t)β(x(t0), t −t0) + ch(z(t))∞,[t0,t], t A ≤A t
(2.85)
γ1(x(τ )A)dτ ≤h(z(t0)) −h(z(t)) ≤ γ0(x(τ )A)dτ.
t0 t0
Диаграмма, иллюстрирующая общую структуру соединения (2.85) приведена на рис.
2.7.
Уравнения (2.85) характеризуют качественным образом взаимодействие между сжимающей Sa и поисковой Sw динамикой, свойственное целому спектру задач оптимизации (2.78) и теории систем, (2.79). Подобное описание также характерно для систем, находящихся в состоянии транскритичной бифуркации или бифуркации типа “седлоузел”.
П р и м е р 2.6.1. Рассмотрим систему:
x1 = −x1 + x2;
(2.86)
x2 = ε+ γx 2
1,γ > 0,
где параметр ε изменяется от отрицательных до положительных значений. При ε = 0 устойчивое и неустойчивое положения равновесия в системе “сталкиваются”, приводя к каскадам вида (2.85). В отличие от другого возможного сценария:
x1 = −x1 + x2;
x2 = ε+ γx 2
2,γ > 0,
где динамика второго уравнения не зависит от первого, анализ асимптотического поведения системы (2.86) не редуцируется до анализа отдельных уравнений независимо друг от друга. В этом смысле рассматриваемый класс систем (2.85) соответствует, возможно, наихудшему для анализа случаю и поэтому дополнительно интересен.
Именно, представляет интерес ответ на следующий вопрос: существует ли такое множество (слабая область захвата в терминологии [173] и [245]), что все траектории замкнутой системы, проходящие через это множество остаются ограниченными? Естественно ожидать, что существование такого множества будет зависеть от свойств функций γ0(·), γ1(·) и β(·,·), c в (2.85). Если такое множество существует, то следующий вопрос состоит в определении условий возникновения слабого притягивающего множества.
Для ответа на поставленные вопросы прежде всего формулируются условия существования точки x0 ⊕ z0 такой, что ее ωпредельное множество ω(x0 ⊕ z0) ограничено в следующем смысле:
h(ωz(x0 ⊕ z0))< ∞. (2.87)
ωx(x0 ⊕ z0)A < ∞,
||
Можно показать, что множество Ω всех таких точек имеет ненулевой объем в Rn × Rm. Для установления условий возникновения притягивающих множеств используется понятие статической характеристики “входсостояние”13 системы. Показывается, что если такая характеристика определена для для системы Sa, то возникновение и расположение притягивающего по Милнору множества определяется ее нулями. Диаграмма, иллюстрирующая основные шаги анализа и последовательность условий, влекущих возникновение притягивающих множеств соединения
(2.85) приведена на рис. 2.8.
13Точное определение дается в параграфе 2.6.2.
Рисунок 2.8. Возникновение слабого притягивающего по Милнору множества Ω∞. Панель a – целевое инвариантное множество, панель b – возникновение слабой области захвата (теорема 2.7), панель c – трансформация слабой области захвата в область притяжения слабого притягивающего в множества Ω∞ (леммы 2.2, 2.3, следствие 2.3)
2.6.1. Теорема о малом контурном усилении для неравномерной сходимости
Перед тем, как сформулировать основные результаты этого параграфа, введем в рассмотрение три последовательности:
= {σi}∞Ξ = {ξi}∞
i=0, i=0, T = {τi}∞i=0.
SПервая последовательность, S (см. рис. 2.9), разбивает интервал [0,h(z0)], h(z0) > 0 в объединение сжимающихся интервалов Hi:
[0,h(z0)] = ∪∞Hi, Hi =[σi+1h(z0),σih(z0)]. (2.88)
i=0
Формально это свойство последовательности S зададим в виде предположения 2.4.
Предположение 2.4. Последовательность S строго монотонна, убывает и, кроме того,
lim σn = 0, σ0 = 1. (2.89)
n=0 :{σn}∞n→∞ Последовательности Ξ и T будут использованы для определения достаточной степени
ξi ∈Ξ сжатия фазового потока системы (2.81) в терминах свойств функции β(·,·) и
времени Ti > τi ∈T. Эти характеристики сформулированы в предположениях 2.5 и
Предположение 2.5. Для заданных последовательностей Ξ, T и функции β(·,·) ∈KLв (2.81) выполняются следующие неравенства:
β(·,Ti) ≤ξiβ(·,0), ∀Ti ≥τi. (2.90)
Предположение 2.5 устанавливает, что для заданного (пока произвольного) коэффициента ξi и момента времени t0 необходимо как минимум τi условных единиц времени для того, чтобы состояние x достигло области:
x(t0)A ,0).
xA ≤ξiβ(
Для того, чтобы специфицировать желаемую величину ξi, в дополнение к (2.90), необходимо ввести меры влияния начальных условий x0 и входов h(z0) на состояние x(t) системы (2.81) в процессе ее движения в пространстве состояний. С этой целью введем две системы функций, Φ и Υ:
Φ : φj (s)= φj−1 ρφ,j (ξi−j · β(s,0)), j = 1,...,i (2.91) φ0(s)= β(s,0);
υj (s) ρυ,j (s), j = 1,...,i
Υ : = φj−1 (2.92) υ0(s)= β(s,0),
где функции ρφ,j , ρυ,j ∈K удовлетворяют неравенству
φj−1(a+ b) ≤φj−1 ρυ,j (b). (2.93) ρφ,j (a) + φj−1
Отметим, что в случае β(·,0) ∈K∞ функции ρφ,j (·), ρυ,j (·), удовлетворяющие неравенству (2.93) всегда существуют [196]. Свойства последовательности Ξ, обеспечивающие желаемую степень влияния начальных условий x0 и входа h(z0) на норму состояния x(t), сформулированы в предположении 2.6.
Предположение 2.6. Последовательности
n
σ−1 φn(x0A),σ−1
n n
·
υi(ch(z0)σn−i) , n = 0,...,∞
| |·
i=0
ограничены сверху, т. е. существуют функции B1(x0), B2(h(z0),c) такие, что
||σ−1 φn(x0A) ≤B1(x0A); (2.94)
n
·
n
σ−1
n
υi(ch(z0)σn−i) ≤B2(h(z0),c) (2.95)
| |||·
i=0
для всех n = 0,1,...,∞.
Следует отметить, что для широкого класса функций β(s,0), в частности сепарабельных и Липшицевых по s, предположения 2.4–2.6 всегда выполняются. Этот случай рассматривается подробно в параграфе 2.6.3 как следствие теоремы 2.7.
Для того, чтобы показать возникновение “слабых” областей захвата по Милнору в пространстве состояния, рассмотрим следующее семейство объемов, индуцированных последовательностью S и соответствующим разбиением (2.88) интервала [0,h(z0)]:
Ωi = h(z(t)) ∈Hi}. (2.96){x ∈X,z ∈Z|Для каждых x0 ∈Z из Ω0 одинаково возможны два альтернативных вари∈X, z0
анта. В одном случае траектория x(t,x0) ⊕z(t,z0) остается в некотором множестве Ω ⊂Ω0 для всех t > t, t ≥t0. Следовательно, при t →∞ состояние стремится к множеству
Ωa = xA ≤ch(z0), z : h(z) ∈[0,h(z0)]}. (2.97){x ∈X, z ∈Z|· Во втором случае траектория x(t,x0) ⊕z(t,z0) последовательно пересекает объемы Ωj , и tj – моменты времени когда траектория x(t,x0) ⊕z(t,z0) “протыкает” гиперповерхности h(z(t)) = h(z0)σj . Очевидно, что в этом случае состояние замкнутой системы останется в Ω0 только если последовательность {ti}∞
i=0 расходится. Условия, устанавливающие такую возможность в зависимости от свойств характеристических последовательностей S, Ξ, T и также от свойств функций γ0(·) в (2.85), сформулированы в теореме 2.7. Диаграмма, схематически иллюстрирующая основные идеи доказательства представлена на рис. 2.9.
2.4–2.6. В дополнение положим, что выполнены следующие условия: | |||||||
---|---|---|---|---|---|---|---|
1) существует положительное число Δ0 > 0 такое, что | |||||||
1 τi | (σi −σi+1) γ0,1(σi) | ≥Δ0 | ∀i = 0,1,...,∞; | (2.98) | |||
2) множество Ωγ | всех точек x0, z0, удовлетворяющих неравенству | ||||||
γ0,2(B1(x0A) + B2(|h(z0)|,c) + c|h(z0)|) ≤h(z0)Δ0 | (2.99) | ||||||
не пусто; | |||||||
3) частичные суммы элементов последовательности T расходятся: | |||||||
∞ τi | = | ∞. | (2.100) |
i=0
Тогда для всех x0, z0 ∈Ωγ состояние x(t,z0) ⊕z(t,z0) системы (2.85) асимптотически стремится к множеству (2.97)
Ωa = xA ≤ch(z0), z : h(z) ∈[0,h(z0)]}.{x ∈X, z ∈Z|·
Стандартные схемы | Предлагаемое решение |
1) Область притяжения – окрестность инвариантного множества | 1) Область притяжения – множество положительной меры (не обязательно, являющееся окрестностью) |
2) Влечет устойчивость по Ляпунову инвариантного множества | 2) Позволяет анализировать сходимость в неустойчивых по Ляпунову системах |
Дано: расходящаяся последовательность моментов времени ti | Дано: последовательность множеств Ωi, расстояние Δi от которых к Aстремится к нулю при i →∞ |
Доказывается: сходимость норм x(ti)⊕z(ti)=Δi к нулю при i →∞ | Доказывается: расходимость последовательности {ti}, где ti : x(ti)⊕z(ti)∈Ωi |
Рисунок 2.9. Основные отличия стандартных концепций сходимость (слева) и концепции слабой, неравномерной сходимости (справа). В случае равномерной сходимости траектории, начинающиеся в окрестности множества Aвсегда остаются в некоторой окрестности A (сплошные и пунктирные голубые линии). В случае неравномерной сходимости только лишь часть начальных условий окрестности множества Aсоответствует траекториям, остающимся в некоторой окрестности множества A. Траектории, начинающиеся из других начальных условий могут покидать окрестность множества A. Необходимым условием для того, чтобы траектории все же оставались в окрестности множества A является, очевидно, расходимость последовательности
ti}. В рамках рассматриваемой постановки задачи расходимость последовательности {ti}влечет и ограниченность нормы x(t)A .{
Основное отличие теоремы 2.7 от стандартных теорем о малом контурном усилении [344, 196] состоит в том, что последние учитывают лишь отношения “входвыход” и “входсостояние” (отображения γ0(·) и константа c в случае системы (2.85)). Это является следствием того, что каждый элемент соединения предполагается устойчивым от входа к состоянию, и их внутренней динамикой поэтому можно пренебречь. Для системы (2.85) это предположение не выполняется, так как подсистема Sw в общем случае неустойчива по Ляпунову. Следовательно, для того, чтобы установить ограниченность x(t, x0) и h(z(t, z0)), необходимо учитывать “степень устойчивости” самой системы Sa. Иначе говоря, система Sa должна обладать достаточно большой степенью сжатия по x0, в то время как коэффициент передачи “входвыход” системы
должен быть достаточно малым. Степень сжатия по x0 в Sa, в соответствии с
Sw (2.81), определяется функцией β(·, ·). Свойства этой функции в явном виде учиты ваются в предположениях 2.6 и (2.100). Область допустимых начальных условий и, собственно, условие малого контурного усиления (свойства “входвыход” систем Sw и Sa) определяются условиями (2.98), (2.99) соответственно. Отметим и то отличие, что область Ωγ в общем случае не является окрестностью Ωa. Поэтому сходимость состояния к Ωa, обусловленная теоремой 2.7, вообще говоря, не является равномер ной по x0, z0 в окрестности Ωa.
В дополнение отметим и то обстоятельство, что теорема останется справедливой, если вместо соединения (2.85) рассматривать соединения вида
x(t)A ≤β(x(t0)A , t − t0) + ch(z(t))∞,[t0,t] + ε(t)∞,[t0,t],
t t (2.101)
γ1(x(τ )A)dτ ≤h(z(t0)) − h(z(t)) ≤ γ0(x(τ )A)dτ,
t0 t0
где ε(t) имеет смысл асимптотически затухающего возмущения. При этом
i
ε(t)≤ Mh(z0) · σi,t ≥ τi − τ0.
|| · j=0
Условие (2.99) при этом трансформируется в неравенство
γ0,2(B1(x0A) + B2(h(z0), c + M ) + (c + M )h(z0)) ≤ h(z0)Δ0. (2.102)
||||Последнее замечание позволяет использовать результаты теоремы 2.7 для систем, состояние которых недоступно для измерения, но может быть восстановлено с точностью до асимптотически затухающих ошибок.
2.6.2. Характеризация притягивающего множества по Милнору
Теоремы о малом коэффициенте усиления позволяют эффективно установить условия ограниченности состояния и полноту замкнутого соединения. Оценки же областей сходимости, вытекающие из них, зачастую слишком консервативны (см., например, (2.97)). Это объясняется тем, что условия подобных теорем используют лишь оценки отображений “входвыход” и “входсостояние” в качестве доступной информации о системе. В случае, когда необходимы более точные оценки областей сходимости, естественно ожидать, что потребуется дополнительная информация о свойствах систем Saw. Вопрос лишь в том, насколько подробной должна быть
и Sтакая информация, достаточно ли ограничиться качественной информацией о классе систем или необходимы какиелибо количественные характеристики? Оказывается, что в нашем случае знание факта существования статической характеристики “входсостояние” (см. определение 2.6.2) оказывается достаточным для того, чтобы существенно улучшить оценки (2.97) области сходимости.
Определение 2.6.2. Будем говорить, что для системы Sa, (2.81), определена статическая характеристика “входсостояние” χ : R → R+ по норме
xA,
если для любой константы ¯
ua выполняется предельное соотношение:
ua lim x(t)A ∈χ(¯a : lim ua(t) =¯ua). (2.103)
∀ua(t) ∈Ut→∞ ⇒ t→∞ Ключевым свойством системы Sa в определении 2.6.2 является то, что существование предела limt→∞ ua(t) влечет существование предела x(t)A при t →∞. Следует отметить, что граф отображения χ не обязательно должен быть функциональным. Поэтому определение 2.6.2 в принципе допускает значительную долю неопределенности при описании системы Sa. Существенным для последующего анализа будет лишь сам факт наличия такой характеристики для системы Sa. Не каждая система, однако, обладает характеристикой χ(·), удовлетворяющей определению 2.6.2. Известны примеры простых систем, состояние которых не имеет предела даже по норме при постоянных и асимптотически приближающихся к константам входах, как это требуется в (2.103). В механике, физике и биологии такие системы представляют собой классы нелинейных осцилляторов, возбуждаемых постоянными входами. Для работы с такими системами удобно использовать более слабое свойство усредненной статической характеристики или статической характеристики в среднем.
Определение 2.6.3. Будем говорить, что для системы (2.81) определена статическая характеристика в среднем χT : R → R+ по норме xA, если для
любого постоянного ¯
ua и некоторого T > 0 выполняется предельное соотношение:
t+T
ua lim x(τ )A dτ ∈χT (¯
a : lim ua(t) =¯ua). (2.104)
∀ua(t) ∈Ut→∞ ⇒ t→∞ t
Оценки асимптотических свойств состояния системы (2.85) в зависимости от свойств статических характеристик системы Sa могут быть получены из лемм 2.2 и 2.3.
Лемма 2.2. Пусть задана система (2.85) и функция h(z(t, z0)) ограничена для некоторого x0, z0. Кроме того, положим, что для системы (2.81) определена статическая характеристика χ(·) : RR+. Тогда справедливы следующие
→
предельные соотношения:
lim x(t, x0)A = 0, lim h(z(t, z0)) ∈χ−1(0). (2.105)
t→∞ t→∞ Как вытекает из леммы 2.2, в случае, если статическая характеристика системы Sa определена, асимптотическое поведение соединения (2.85) характеризуется нулями отображения χ(·). Подобный вывод можно сформулировать и для систем со статической характеристикой в среднем
Лемма 2.3. Пусть задана система (2.85). Функция h(z(t, z0)) ограничена для некоторого x0, z0, h(z(t, z0)) ∈[0, h(z0)], и для системы (2.81) определена статическая характеристика χT (·) : RR+ в среднем. Кроме того, пусть существует
→
положительная константа γ¯такая, что функция γ1(·) в (2.83) удовлетворяет ограничению:
γ1(s) ≥γ¯·s, ∀s ∈[0,s¯],s¯∈R+ : s > c h(z0). (2.106)
¯
·
В дополнение положим, что χT (·) не имеет нулей в правой полуплоскости. Тогда
lim x(t, x0)A = 0, lim h(z(t, z0)) = 0. (2.107)
t→∞ t→∞
Немедленным следствием лемм 2.2 и 2.3 является тот факт, что выполнение условий теоремы 2.7 в случае, если система (2.81) обладает статической характеристикой
) или χT (·) автоматически гарантирует сходимость состояний замкнутой системы
χ(·
в область
Ωa = = 0, z : h(z) ∈[0, h(z0)]}. (2.108){x ∈X, z ∈Z|xA
При некоторой дополнительной информации качественного характера о свойствах систем Saw оказывается возможным сформулировать более сильное утверждение
и Sоб области сходимости состояний замкнутой системы. Этот результат приведен в
виде следствия 2.2 из теоремы 2.7.
Следствие 2.2. Рассмотрим систему (2.85), удовлетворяющую условиям теоремы 2.7. Пусть, в дополнение,
C1) поток x(t, x0)⊕z(t, z0) генерируется системой автономных дифференциальных уравнений с локально Липшицевой правой частью;
C2) подсистема Sw практически интегрально устойчива от входа к состоянию:
t
z(τ )∞,[t0,t] ≤Cz + γ1(us(τ ))dτ (2.109)
0
и функция h()в (2.83) непрерывна: h(0;··)∈CC3) для системы Sa определена статическая характеристика χ().
·
Тогда для всех x0, z0 ∈Ωγ состояние замкнутой системы асимптотически стре
мится (при t →∞) к множеству
Ωa ==0,h(z)∈χ−1(0)}. (2.110){x ∈X, z ∈Z| xA
Как вытекает из следствия 2.2, нули статической характеристики системы Sa фактически “управляют” расположением областей, в которые асимптотически сходятся траектории замкнутой системы (2.85). Это свойство иллюстрируется рисунком 2.10. Отметим также и то, что в случае замены условия C3 в следствии 2.2 на альтернативное:
C3’) для системы Sa определена статическая характеристика в среднем χT (),
·
отображение χT () не имеет нулей в правой полуплоскости и функция γ1() удо
··
влетворяет условию (2.106), можно показать, что состояние замкнутой системы асимптотически сходится в об ласть
Ωa ==0,h(z)=0}. (2.111){x ∈X, z ∈Z| xA
Доказательство этого факта аналогично доказательству следствия 2.2 и поэтому не приводится.
2.6.3. Системы с сепарабельной динамикой
Условия ограниченности состояния и полноты замкнутого соединения для классов систем, оценки областей захвата по Милнору (множества Ωγ ) и, при доступной дополнительной качественной информации, оценки области, в которые состояние сходится асимптотически все эти результаты были получены для достаточно общего класса функций β(·, ·)∈KLв (2.81) и γ0(), γ1()в (2.83). Основным затруднением
··
практического характера для применения этих результатов является необходимость проверки в конкретных приложениях выполнение условий теоремы 2.7 в силу общности функций β(, ·) и γ0(), γ1(). Условия теоремы 2.7, однако, могут быть суще
···
ственно упрощены, если известна дополнительная информация о классе функций Рисунок 2.10. Управление расположением притягивающих множеств с помощью статических характеристик подсистем замкнутого соединения
). Этой информацией, в частности, может быть свойство сепарабельности β(·,·) и γ0(·функции β(·,·) или, что эквивалентно, возможность следующей ее факторизации:
β(xA | ,t) ≤βx(xA) · | βt(t), | (2.112) | ||
---|---|---|---|---|---|
где βx(·) ∈K и βt(·) ∈C0 | строго убывает14 по t и, к | роме того, | |||
lim | βt(t) = 0. | (2.113) | |||
t→∞ |
Факторизация (2.112), как показано в работе [171], реализуема для широкого класса равномерно асимптотически устойчивых систем Sa при соответствующем преобразовании координат. Немедленным следствием такой факторизации (2.112) является тот факт, что элементы последовательности Ξ в предположении 2.5, не зависят от норм
x(ti)A. Следовательно, проверка предположений 2.5, 2.6 упрощается. Наиболее ин
тересный как с практической, так и с теоретической точек зрения случай возникает, когда функция βx(·) в (2.112) удовлетворяет условию Липшица. Для этого класса систем условия теоремы 2.7 редуцируются до единственного и легко проверяемого неравенства. Рассмотрим подробнее этот случай.
Без потери общности положим, что состояние x(t) системы Sa удовлетворяет оценкам x(t0)A · βt(t−t0) + c·h(z(t,z0))∞,[t0,t], (2.114)
x(t)A ≤где значение βt(0) больше или равно единице. В силу того, что функция βt(t) строго убывает, отображение βt : [0,∞] →[0,βt(0)] инъективно. Более того, βt(t) непрерывно, тогда оно сюрьективно и, следовательно, биективно. Другими словами, существует обратное (непрерывное) отображение β−1 : [0,βt(0)] →R+ такое, что:
t
βt−1 βt(t) = t, ∀ t > 0. (2.115)
14В случае, если функция βt(·) не строго монотонна, она всегда может быть мажорирована строго монотонной функцией.
Условия возникновения областей захвата в пространстве состояний замкнутой системы (2.85) для системы Sa, удовлетворяющей выражению (2.114) приведены в форме следствия 2.3.
Следствие 2.3. Рассмотрим замкнутое соединение (2.85), где система Sa удовлетворяет (2.114), функция γ0(·) в (2.83) Липшицева:
γ0(s)≤Dγ,0 ·s(2.116)
||||
и область
β−1 d −1 κ −1 h(z0)
κ
Ωγ : Dγ,0 ≤ t κβt(0) κβt(0) x0A + βt(0) · c ·|h(z0)1 + ·|1−d + c|h(z0)|
(2.117)
не пуста для некоторых d < 1, κ > 1. Тогда для всех начальных условий x0
z0 ∈ Ωγ состояние x(t, x0) ⊕z(t, z0) системы (2.85) асимптотически при t → ∞
сходится к множеству Ωa, заданному выражением (2.97). Если, в дополнение, справедливы условия C1)–C3) следствия 2.2, то притягивающее множество (в смысле Милнора) содержится в области (2.108).
Практически важным объектом применения этого следствия являются экспоненциально устойчивые системы Sa:
x(t0)A Dβ exp(−λt) + c ·h(z(t, z0))∞,[t0,t], λ > 0,Dβ ≥1. (2.118)x(t)A ≤
В этом случае область (2.117) начальных условий (область захвата по Милнору), гарантирующих сходимость к Ωa, определяется из неравенства
h(z0)
Dγ,0 ≤ max ln .
κDβ κ κ
κ>1, d∈(0,1) −λ d −1 κ −1 Dβ x0A + Dβ · c ·|h(z0)1 + 1−d + ch(z0)
|||
Следует отметить и тот факт, что следствие 2.3 совместно со следствием 2.2 может служить аналогом теоремы о малом контурном усилении для соединений и каскадов интегрально устойчивых от входа к состоянию систем. В отличие от известных результатов [97], где рассматриваются системы вида
x= f (x, z);
z= q(z),
предлагаемые критерии сходимости допускают двунаправленные соединения
x= f (x, z); z= q(x, z),
что существенно расширяет сферу применимости результатов.
В заключение отметим связь приведенных результатов со стандартной теоремой о малом контурном усилении. Эта связь дается следующим следствием, вытекающем непосредственно из (2.117).
Следствие 2.4. Рассмотрим соединение (2.85), где система Sa удовлетво
ряет неравенству (2.114). Тогда множество Ωγ начальных условий, соответствующее ограниченным траекториям системы (2.85), имеет ненулевую меру, если выполнено условие
(2.119)
Dγ,0 · c ·G < 1,
где
d k κ
βt(0) 1 + + 1G = βt−1 κβt(0) k −11 −d
·
для некоторых d ∈(0, 1), κ ∈(1, ∞). В частности, Ωγ содержит область
1 1 β−1 d −1 k −1 −c κ
x(t0)A ≤ βt(0) 1 + + 1h(z(t0))
βt(0) Dγ,0 t κβt(0) k 1 −d
· В случае, если динамика подсистемы Sa экспоненциально устойчива, т. е. удовлетворяет условию (2.118), член G в условие (2.119) определяется в виде
1 κDβ k κ
= Dβ 1 + + 1. (2.120)G λ · ln dk −11 −d
Для Dβ =1 минимальное значение G в (2.120) может быть оценено следующим образом:
1 k κ 15.6886 16
= min 2 + <, (2.121)
G∗ λ ·d∈(0,1), κ∈(1,∞) ln κ k −11 −d ≈ λλ
d
что приводит к еще более простой формулировке условия (2.120):
c 1
. (2.122)
Dγ,0 ·λ ≤ 16
В свете приведенных замечаний следствие 2.4 дает явное и легко проверяемое условие существования области захвата в пространстве состояния класса неустойчивых по Ляпунову систем. Более того, оно позволяет специфицировать явным образом точки x(t0), z(t0), принадлежащие к возникшей области захвата. Наконец, условия существования этой области, неравенство (2.119), оказывается похожим на стандартные ограничения (2.23) теорем о малом контурном усилении. Несмотря на внешнее сходство выражений (2.23) и (2.122), результаты параграфа содержательно отличаются от классических уже лишь тем, что коэффициент передачи “входвыход” подсистемы Sw в формулировках следствий 2.3, 2.4 может быть бесконечным или вообще не определенным.
Для иллюстрации сходств и отличий стандартных теорем о малом контурном усилении и предложенных критериев рассмотрим следующий пример.
П р и м е р 2.6.2. Рассмотрим системы
x1 = −λ1x1 + c1x2,
; (2.123) x2 = −λ2x2 + c2x1
||
x1 = −λ1x1 + c1x2, . (2.124) x2 = c2x1
||
Система (2.123) может быть интерпретирована как соединение двух устойчивых “входсостояние” и “входвыход” систем, x1 и x2, с коэффициентами передачи “входвыход” c1/λ1 и c2/λ2 по норме L1 [t0, ∞] соответственно. Следовательно, для уста
∞
новления ограниченности состояния всего соединения (2.123) можно использовать теорему о малом контурном усилении. Условия допустимой малости коэффициентов передачи в этом случае приводят к ограничениям вида:
c1 c2
< 1.
λ1 · λ2
Стандартные теоремы о малом контурном усилении, однако, не могут быть применены для систем вида (2.124) в силу того, что коэффициент передачи “входвыход” второй подсистемы, x2, оказывается бесконечным. Тем не менее, в этом случае следствие 2.4 позволяет сформулировать условия возникновения слабого притягивающего множества в системе (2.124) и оценить его область притяжения. Как вытекает из следствия 2.4, выполнение неравенства
c1 c2 1
<
λ1 · λ1 16
влечет существование области захвата ненулевой меры. Оценка этой области дается в свою очередь неравенством
κ −1 k − 1
λ ln
k
1
κ
x1(t0)
2 +
x2(t0),x2(t0) < 0.
|
|≤ −
|
|
d
1 − d
c2
Приведенные результаты, включая оценки областей захвата соединения (2.85), служат основой для синтеза адаптивных наблюдателей и процедур идентификации по выходу для систем, не представимых в канонической форме адаптивного наблюдателя [114], и используются в задаче недоминирующего управления нелинейно параметризованными системами общего вида и в приложениях адаптивного распознавания изображений с альтернативными интерпретациями (см. разд. 3).
3. Задачи адаптивного управления для классов нелинейных объектов
В разделе рассмотрен круг проблем, посвященный синтезу адаптивных регуляторов для нелинейных динамических систем. На основе результатов разд. 2, в частности, теорем о существовании малого контурного усиления и с использованием принципа разделения, в разделе дается новая постановка задачи синтеза адаптивного управления. Ее отличия от известных постановок (см. разд. 1) заключаются в использовании в качестве базовых информационных единиц мажорирующих состояние отображений или макропеременных, а не первичной информации в виде измерительных данных по выходу или переменных вектора состояния; введение целевой динамики поведения динамической управляемой системы, а не целевых функционалов; допустимость нелинейной, в т. ч. невыпуклой, параметризации модели.
Общая задача адаптивного управления ставится как задача управляемой самоорганизации в расширенном фазовом пространстве открытой системы “объект – внешняя среда – регулятор” без явного использования аппарата метода функций Ляпунова и, как следствие, потенциальных ограничений этого метода при решении задач синтеза. В рамках общей постановки формулируются и решаются частные задачи адаптации в управляемых динамических системах.
1) Задача адаптивного управления движением изображающей точки расширенного фазового пространства системы к инвариантным множествам. Практическая ценность этой задачи состоит в том, что в ней не требуется точного задания самих финишных целевых множеств управляемой системы. Дополнительной и необходимой информацией здесь является знание того, что целевое множество содержит инвариантное подмножество. Решение этой задачи выполнено для систем с нелинейной и линейной параметризацией и сигнальными возмущениями.
2) Задача адаптивного управления взаимосвязанными нелинейными системами, в том числе, исследовано влияние немоделируемой динамики на свойства адаптивных систем, приведено решение задачи синтеза систем с перекрестными связями в каналах управления и адаптации.
3) Задача параметрической идентификации в замкнутом контуре нелинейных систем с нелинейной параметризацией. В ней исследованы условия асимптотической сходимости оценок к действительным значениям параметров и что особенно важно в приложениях, условия экспоненциальной устойчивости процедуры оценки параметров. Кроме того, получены оценки скорости сходимости процедуры идентификации в зависимости от свойств нелинейно параметризованного регрессора.
4) Задача недоминирующего управления и идентификации в системах с нелинейной параметризацией общего вида. Решение этой задачи формулируется как для систем с известной целевой динамикой, так и для систем, где целевые движения не полностью специфицированы, и доступны лишь оценки скорости сходимости невозмущенных движений к целевым множествам.
Для решения поставленных задач в разделе вводится новый метод синтеза адаптивных регуляторов – т. н. метод виртуального алгоритма адаптации. Суть метода состоит в том, что на первом этапе синтеза выбор алгоритмов адаптации проводится, исходя из предположений о доступности полной информации об объекте. По этой причине такие алгоритмы названы виртуальными. Единственным критерием успешности выбора алгоритма на данном этапе является достижение цели адаптивного управления. В работе выбор виртуальных алгоритмов адаптации обусловлен функциональным принципом разделения, введенном в разд. 2. На втором этапе синтеза решается задача реализуемости этих алгоритмов в интегродифференциальной форме. Посредством определенных структурных ограничений специфицируются классы систем, для которых решение задачи реализации всегда существует и может быть получено аналитически. На третьем этапе решается задача вложения исходной системы в системы более высоких размерностей. Эти системы, с одной стороны, должны удовлетворять критериям разрешимости задачи реализуемости алгоритмов адаптации, а с другой стороны, должны обеспечивать достижение исходных целей управления. Для решения этой задачи также использован функциональный принцип разделения.
Для задач 1)3) приводятся частные виртуальные алгоритмы адаптации и теоремы вложения, гарантирующие разрешимость задачи синтеза в соответствии с предложенным методом. Решение задачи 4) приводится как методом виртуального алгоритма адаптации, так и с использованием теоремы о малом контурном усилении для неравномерной сходимости (теорема 2.7) в зависимости от доступной информации о целевой динамике системы.
3.1. Постановка задачи адаптивного управления в условиях функциональной неопределенности и нелинейной параметризации
Будем рассматривать классы объектов управления, допускающие описание системами уравнений вида:
x1 =f1(x,t)+g1(x,t)u,
(3.1)
x2 =f2(x,θ,t)+g2(x,t)u,
x1 =(x11,...,x1q)T ∈ Rq;
x2 =(x21,...,x2p)T ∈ Rp;
x =(x11,...,x1q,x21,...,x2p)T ∈ Rn .
В уравнении (3.1) θ ∈ Ωθ ∈ Rd обозначает вектор неизвестных воздействий среды1, при этом множество Ωθ полагается замкнутым и ограниченным подмножеством Rd . Отметим, что знание границ области Ωθ по умолчанию не требуется, если это не оговорено заранее или не вытекает автоматически из формулировок результатов. Согласно общепринятым конвенциям, символами u ∈ R и x обозначаются управляющий вход системы (3.1) и вектор состояния. Функции
f1 :Rn × R+ Rp, g1 :Rn × R+ Rp
→ Rq, f2 :Rn × Rd × R+ →→ Rq , g2 :Rn × R+ →
в модели (3.1) предполагаются локально ограничеными по x и глобально ограниченными по t. При этом их зависимость от времени ограничивается стандартными условиями локального существования решений системы (3.1).
Будем полагать, что функции f1(x,t) и g1(x,t) известны и доступны для измерения, в то время как функции f2(x,θ,t) и g2(x,t) могут быть, вообще говоря, неизвестны и недоступны для измерения. В соответствии с этим вектора x1 и x2 будем называть как независимое от неопределенности и соответственно зависимое от неопределенности разбиения состояния x. Для удобства записи в некоторых случаях будем использовать представление системы (3.1) в виде:
x=f (x,θ,t)+g(x,t)u, (3.2)
где
g(x,t)=(g11(x,t),...,g1q (x,t),g21(x,t),...,g2p(x))T ,
f (x,θ,t)=(f11(x,t),...,f1q(x,t),f21(x,θ,t),...,f2p(x,θ,t))T .
При этом все введенные выше ограничения на классы рассматриваемых функций в
(3.1) индуцируются и на функции f (x,θ,t).
В соответствии с аргументацией предыдущего раздела (см. параграфы 2.4 и 2.5), а также в силу результатов, изложенных в [26, 27, 51], поведение сложных динамических систем уместно рассматривать в терминах мажорирующих состояние отображений (определение 2.4.1) или макропеременных в терминологии [26]. Это позволяет существенно редуцировать объем информации, необходимой для анализа
1В общем случае это могут быть функции времени.
систем, что особенно актуально в условиях неопределенности модели самого объекта. В этом смысле полезно учитывать возможность такого рассмотрения непосредственно в постановке задачи синтеза адаптивного управления. С этой целью введем
1
в рассмотрение функцию ψ :Rn ×R+ → R, ψ ∈Cсо следующим свойством
1
Предположение 3.1. Для функции ψ(x,t)∈Cсправедлива оценка:
x(t)∞,[t0,T ] ≤γ˜x0,θ,ψ(x(t),t)∞,[t0,T ] , (3.3)
где γ˜x0,θ,ψ(x(t),t)∞,[t0,T ] – локально ограниченная и неотрицательная функ
ция своих аргументов.
Согласно определению 2.4.1, функция ψ(x,t)мажорирует состояние системы (3.1) и поэтому близость к множеству
Ω0 =x(t)∈Rn ψ(x(t),t)=0} (3.4)
{|
может служить естественной оценкой качества поведения системы. Поэтому в системах управления объектами с неопределенностью математических моделей множество Ω0 удобно выбрать в качестве “минимального” целевого множества в том смысле, что попадание в его окрестность влечет, по меньшей мере, ограниченность вектора состояния объекта.
В стандартных постановках задач адаптивного управления (см., например, [82]) целевые критерии обычно удовлетворяют метрическим ограничениям в пространстве состояния объекта Rn:
ν1(x −ξ(t))≤ψ(x,t)≤ν2(x −ξ(t)), ν1,ν2 ∈K∞, (3.5)
где функция ξ :R+ Rn 0 является, например, эталонной траекторией. Функ
→ , ξ ∈C
ция ψ(x,t) в этом случае выступает в качестве естественной функции Ляпунова регулятора основного контура (см. условие достижимости в [82, 84]). В дополнение к тому, что подобные постановки ограничивают динамику управляемой системы устойчивыми по Ляпунову движениями2, отыскание функции Ляпунова в общем случае является нетривиальной задачей. Кроме того, если Ω0 задает целевое множество, то задача отыскания функции ψ(x,t), удовлетворяющей обоим ограничениям (3.4), (3.5) в условиях когда информация о желаемой траектории ξ(t)известна лишь частично представляется особенно затруднительной.
В отличие от общепринятых постановок, класс допустимых целевых множеств, удовлетворяющих предположению 3.1, оказывается существенно шире в силу отсутствия изначальной привязки к методу функций Ляпунова и, как следствие, необходимости одновременного разрешения (3.4) и (3.5). Причина этого состоит в том, что
2В разд. 2, параграф 2.6, приводится краткий обзор примеров, когда такое требование либо невыполнимо, либо нежелательно в силу специфических свойств управляемых систем.
вместо стандартных эвклидовых норм · в пространстве состояния Rn и явного задания цели уравнением (3.5), в предположении 3.1 используются функциональные нормы x(t)p,[t0,T ], T ≥t0 в функциональных пространствах Lp[t0,T], T ≥t0, p ∈R≥1 ∪∞. Замена стандартных метрических ограничений (3.5) в Rn на операторные отношения позволяют, с одной стороны, использовать измерения функции ψ(x,t) в качестве меры близости состояния x(t) к целевому множеству Ω0, не вводя при этом ограничения вида (3.5) на функцию ψ(x,t). С другой стороны, ограниченность x(t), как минимально допустимый критерий качества, вытекает из ограниченности L1[t0,T]норм функции ψ(x(t),t).
p
В зависимости от задачи и свойств исходного объекта управления, предположение 3.1 может быть интерпретировано как свойство наблюдаемости неограниченного роста [196] состояния системы (3.1) по “выходу” ψ(x,t). Кроме того, оно может быть рассмотрено как свойство ограниченный вход – ограниченное состояния системы (3.1) на ограничении ψ(x(t,x0,t0,θ,u(x(t),t)),t)=υ(t), где сигнал υ(t) выступает в качестве нового “входа”3. Если же ограниченность решений в явном виде не требуется – в силу свойств самой задачи по причине, например, естественной ограниченности состояния физического объекта для класса допустимых управлений, то предположение 3.1 можно вообще исключить из последующего рассмотрения.
Введем ограничения на класс допустимых решений задачи управления, а именно: специфицируем класс U∗ функций u, потенциально гарантирующий, по меньшей мере, ограниченность x(t,x0,t0,θ,u) для всех θ ∈Ωθ и x0 ∈Rn. Согласно условию (3.3), ограниченность x(t,x0,t0,θ,u)достигается, если выбор функции u гарантирует, что ψ(x(t),t) ∈ L1 [t0,∞]. Поэтому для того, чтобы определить искомый класс U∗,
∞
рассмотрим изменение ψ(x,t) вдоль решений системы (3.2):
ψ=Lf (x,θ,t)ψ(x,t)+Lg(x,t)ψ(x,t)u+ ∂ψ(x,t) . (3.6)
∂t Классом допустимых управлений U∗ будем считать класс функций u:
;
u ∈U∗ ⇔
∂ψ(x,t)ˆ
Lf (x,θ,t)ψ(x,t)+Lg(x,t)ψ(x,t)u+=f(x,θ,t)−f(x,θ,t)−(ψ,ω,t)+ε(t),
∂t
(3.7)
где f :Rn ×Rd ×R+ → R, :R ×Rw ×R+ R, ε : R+ R – некоторые локально →→
ˆ
ограниченные по x, ψ, ω, θ, θ и глобально ограниченные по t функции. Для широкого класса моделей (3.1), в частности, для которых существует Lg(x,t)ψ(x,t)−1 при любых допустимых x, условие (3.7) обеспечивается выбором:
∂ψ(x,t)
ˆ
u(x,θ,ω,t)=(Lg(x,t)ψ(x,t))−1 −Lf (x,θ,t)ψ(x,t)−(ψ,ω,t)− (3.8)
ˆ
∂t
3См. пример 2.4.2 в разд. 2.
с учетом обозначения Lf (x,θ)ψ(x,t)= f(x,θ,t). Тогда, принимая во внимание (3.8), уравнение (3.6) может быть записано в виде:
ˆ
ψ=f(x,θ,t)−f(x,θ,t)−(ψ,ω,t). (3.9)
Таким образом, закон (3.8) переводит исходную модель (3.1) в хорошо известную в литературе форму моделей по ошибке 4[254]. Отметим, что в уравнениях (3.7), (3.8) и (3.9) вектор ˆ
θ имеет смысл оценок неизвестного вектора θ.
Неполнота математических моделей физических объектов и погрешности измерений неизбежно приводят к наличию немоделируемой динамики в системе управления. Эти эффекты учитываются слагаемым ε(t) в уравнении (3.7). В общем случае класс функций ε(t) может быть достаточно произвольным5. Таким образом, расширенная запись уравнения (3.6) имеет вид:
ˆ
ψ=f(x,θ,t)−f(x,θ,t)−(ψ,ω,t)+ε(t). (3.10)
Отметим, что включение слагаемого ε(t)в правую части (3.10) позволяет учитывать эффекты наблюдателей на динамику системы, что автоматически расширяет область применимости результатов на классы задач управления по выходу.
Специфицируем, наконец, свойства функции (ψ,ω,t) в (3.8), (3.10). Существующие постановки задач адаптивного управления и идентификации [292, 254, 219, 84, 82] предполагают глобальную асимптотическую устойчивость по Ляпунову целевых движений. В нашем случае это эквивалентно глобальной устойчивости системы
ˆ
(3.10) при θ ≡θ. Это свойство, как демонстрируется в разделе 2, не всегда адекватно отражает целевое и естественное поведение сложных систем. С другой стороны, подавляющее большинство реальных процессов (включая, безусловно, и асимптотически устойчивые с аддитивным входом) обладает свойством диссипации энергии: конечная энергия на входе системы производит конечные отклонения по состоянию. В качестве энергии сигналов принято использовать их Lp[t0,T]нормы. Причем зачастую индекс p = 2, что обусловлено, вопервых, удобством работы с такими пространствами (определено понятие внутреннего произведения); вовторых, физическим смыслом таких энергий, например, суммарная мощность на интервале времени; в третьих, следующим фактом: ε(t) ∈ L2[t0,T]t0,T] ⇒ ε(t) ∈ Lp[t0,T], p ≥ 2.
∩L∞[
ˆ
В данном случае входом является сумма f(x(t),θ,t)−f(x(t),θ(t),t)+ε(t). Поэтому стандартное требование устойчивости целевых движений естественно заменить следующим предположением.
4Модели по ошибке (3.9) оказываются удобны для работы с системами с нелинейно параметризованными моделями в задачах адаптивного управления [233, 318] и идентификации [130].
5По умолчанию, и если отдельно не оговорено иное, формулировки результатов в данной работе
0
приведены для случая, когда ε(t) ∈L1[t0, ∞] .
2
∩C
ψ=−(ψ, ω, t)+ζ(t), (3.11)
ˆ
где ζ : R+ R, а функция (ψ, ω, t) идентична правой части (3.10) при θ = θ,
→
ε(t)=0. Тогда для любого ω ∈ Ωω для системы (3.11) определено отображение
“входсостояние” L1[t0, ∞]∞[t0, ∞] по входу ζ(t). Другими словами,
2
→ L1
2[t0, ∞]⇒ ψ(t, ψ0, t0, ω)∈ L1 [t0, ∞], ψ0 ∈ R
ζ(t)∈ L1
∞
и существует функция γ∞,2 такая, что
ψ(t)∞,[t0,T ] ≤ γ∞,2(ψ0, ω, ζ(t)2,[t0,T ]), ∀ ζ(t)∈ L1[t0, T]. (3.12)
2
Таким образом, целевая динамика, удовлетворяющая предположению 3.2, в отличие от общепринятых подходов может иметь неустойчивые по Ляпунову положения равновесия, орбиты и, в частности, быть хаотической (в смысле, например, определений хаотической динамики, приведенных в [173]).
П р и м е р 3.1.1. Примером систем, которые с одной стороны потенциально способны генерировать хаотические колебания, а с другой удовлетворяют предположению 3.2, являются известные уравнения Лоренца [234]:
x=σ(y − x)+ζ(t);
y=ρx − y − xz; (3.13)
z=−βz +xy, σ, ρ, β > 0.
В системе (3.13) переменная x выполняет роль функции ψ(x, t), а функция (ψ, ω, t)= −σψ+σy(t, ω, t0, ζ(t)). Вектор ω в этом случае является вектором начальных условий: ω =(x0, y0, z0)T . Можно показать, что система (3.13) задает передаточное отображе
ние L1
2[0, ∞]от входа ε(t)к вектору состояния (x, y, z)T . Для этого рассмотрим → L3
∞
функцию:
V0(x, y, z)= 1(x 2 +y 2 +(z − σ − ρ)2).
2
Ее производная по времени может быть записана в виде:
σ +ρ2
2
V0 =−σx 2 − y − β z − +β (σ +ρ)2 +xε(t).
24
Учитывая, что
σ +ρ2 1(z − σ − ρ)2 (σ +ρ)2 ,z −
2 ≥ 2− 4
ββ
V0 −y 2 (z −σ −ρ)2 +(σ + ρ)2 + xε(t);≤ −σx 2 − 22 β
2
+ (z −σ −ρ)2≤ −κ(x 2
(σ + ρ)2
+ xε(t);
) +
+ y
2
β
κ = min
σ, , 1
.
2
Следовательно,
V0 ≤−2κV0 + ββ ε(t) 2 κε2(t)
+ . (3.14)
(σ + ρ)2 + xε(t) ≤−κV0 +(σ + ρ)2 −κx −
2 22κ 4 Пусть ε(t) ∈L1
2[0, ∞]. Тогда рассмотрим функцию V0(x,y,z)
∞ κε2(τ)
V (x, y, z, t) = ς(ξ)dξ + dτ,
4
0 t
где ς : RR определена следующим образом:
→
ς(ξ) =
β
1, ξ > 2κ (σ + ρ)2
β
0,ξ ≤ 2κ (σ + ρ)2 .
В соответствии с (3.14), производная по времени функции V (x, y, z, t) удовлетворяет оценке:
κε2(t) κε2(t)β
V≤ς(V0)
(σ + ρ)2
−κV0 +
+ ς(V0)
≤0.
−
2
4
4
Следовательно, x(t), y(t), z(t) ограничены и система (3.13) задает всюду определенное
передаточное отображение L1
2[0, ∞
]
3L→∞
. Это в свою очередь эквивалентно тому,
что
ψ= −σψ + σy(t, ω, t0, ζ(t))
задает всюду определенное передаточное отображение L1
2[0, ∞
]
1L→∞
по отношению
ко входу ε(t) и состоянию ψ(x, t) = x.
Другой, пример, удовлетворяющий предположению 3.2 – это уравнение Хиндмарша и Роуза [180]. Это уравнение моделирует ионный ток через клеточную мембрану в клетках аксонов и широко используются в областях искусственного интеллекта и нейронных сетей, например, для обработки визуальной информации [287].
Если устойчивость целевой динамики ψ= −(ψ, ω, t) следует автоматически из специфики конкретной прикладной задачи, то и в этом случае предположение
3.2 обладает определенным преимуществом перед стандартными требованиями. Это преимущество заключается в том, то предположение 3.2 не требует a priori знания конкретной функции Ляпунова для невозмущенной системы. Подобное свойство, кроме того, что оно является более “дружелюбным” для исследователя, позволяет в принципе синтезировать процедуры адаптации для систем с индуцируемой мультистабильностью 6[156, 336, 135, 239].
В задачах управления нелинейными объектами существенное значение играет возможность управления с помощью малых сигналов или слабых обратных связей. В теории адаптивных систем в стандартных постановках определение малого управления оказывается затруднительным в силу произвола выбора как механизмов достижения цели, так и регуляторов основного контура, которые никак не специфицируются в постановках задачи [82, 84, 254, 219]. Действительно, ответ на вопрос: является ли управление u(t) малым, зависит прежде всего от того, каким образом определен класс наиболее предпочтительных управляющих функций, реализуемый регулятором основного контура, и лишь затем возможностью решения задачи адаптации в этом классе обратных связей. В рамках задач адаптивного управления и, более широко, механизмов адаптации, термин малое управление означает прежде всего т. н. недоминирующее адаптивное управление, т. е. такие законы адаптации в существующей системе, которые не требуют введения дополнительных компенсирующих обратных связей. Включение уравнений целевой динамики (3.11) в задачу синтеза адаптивного регулятора позволяет формально определить это понятие в контексте общей постановки задачи синтеза адаптивных законов управления в открытых динамических системах. Несмотря на кажущуюся очевидность, такая постановка проблемы адаптивного управления существенно отличается от известных и общепринятых.
Принимая во внимание, что единственная детерминированная компонента управления (3.8) в модели (3.10) – это функция (ψ,ω,t), то вполне естественно полагать, что класс C функций (ψ,ω,t), для которого цель управления достигается за счет изменений в ˆ
θ, определяет и класс допустимых недоминирующих управлений.
Определение 3.1.1. Адаптивное управление будем называть недоминирующим в классе C, если найдется такая функция ˆ
θ(x,t):Rn ×R+ Rd, что
→ цель управления достигается для всех x0 ∈Rn , θ ∈Ω.θ, ∈C
Определение недоминирующего адаптивного управления на основе свойств клас
6В системах с индуцируемой мультистабильностью, т. е. в системах с множеством аттракторов и в которых траектории спонтанно переходят от одного аттрактора к другому в зависимости от внешних воздействий, синтез алгоритмов адаптации, основанный на знании конкретной функции Ляпунова, требует наличие дополнительной информации о текущем динамическом состоянии системы (т. е. свойства аттракторов и их расположение в пространстве состояния) самой системы. Это влечет необходимость идентификации текущего динамического состояния системы непосредственно перед решением задачи адаптивного управления.
са допустимых функций ∈C позволяет применять это понятие, учитывая специфику конкретной постановки задачи. Так, например, недоминирующее управление в классе C = { : RR),(σ)σ ≤ 0,σ ∈ R} означает, что цель
→ ||(·| ∈ K
управления достигается при сколь угодно малых по амплитуде отрицательных обратных связях по ψ в системе (3.10). В случае же, если для достижения цели, например, при наличии немоделируемой динамики требуется привлекать дополнительные компенсирующие воздействия υ(t), то недоминирующее управление в классе = : R ×R+ R(ψ,t)= 0(ψ) + υ(t)}, 0 : RR означает,
C{→|→ R, υ : R+ →
что неопределенность модели (3.10) компенсируется изменением ˆ
θ(x,t) с точностью до компенсации помехи за счет дополнительного сигнала υ(t) с заранее заданными свойствами.
Таким образом, мы ввели основные ограничения на допустимые классы систем
(3.2) и классы допустимых управляющих функций. Рассмотрим теперь класс допустимых функций f(x,θ,t) в (3.10). В подавляющем большинстве случаев, по крайней мере на уровне постановки задачи, принято предполагать наиболее широкий класс допустимых моделей параметризованных неопределенностей. С одной стороны, задание параметризации общего вида для функции f(x,θ,t) в принципе возможно, но методически оно врядли конструктивно изза известных сложностей работы с нелинейностями общего вида. Стандартные постановки решения в литературе ограничиваются линейно или выпукло параметризованными моделями. Эти модели, однако, не всегда адекватны физической сущности задачи и, как следствие, могут приводить к неадекватным результатам управления. Поэтому возникает необходимость найти класс нелинейностей, что описывают разумно широкий диапазон практически значимых физических эффектов, а с другой стороны дает основания надеяться на возможность отыскания решения задачи адаптивного управления. Подходящим классом нелинейностей является следующий класс функций.
Предположение 3.3. Для заданной функции f(x,θ,t) в (3.10) суще
1
ствует такая функция α(x,t) : Rn ×R+ положительное число
→ Rd , α(x,t) ∈CD > 0, что справедливы неравенства
(f(x,θ,t) −f(x,θ,t))(α(x,t)T (ˆ
ˆθ −θ)) ≥0; (3.15)
|ˆ
f(x,θ,t) −f(x,θ,t)≤D|α(x,t)T (ˆ. (3.16)
θ −θ)
||
Первое неравенство, (3.15), предположения 3.15 выполняется, например, для любой гладкой нелинейной функции f(x,θ,t), монотонной по линейному функционалу φ(x)T θ относительно вектора параметров θ:
∂fm(x,λ,t)
f(x,θ,t) = fm(x,φ(x)T θ,t); sign = const.
∂λ
Рисунок 3.1. Иллюстрация к предположению 3.3 для нелинейно параметризованных функций f(x,θ,t)=fm(φ(x)T θ,t), fm :R×R+ R. Жирной линией в каждом блоке
→
показаны функции MDφ(x)T θ, D =maxx,t Dθ(x,t)соответственно.
||
Следовательно, функция α(x,t), удовлетворяющая неравенству (3.15), имеет вид:
α(x,t)=Mφ(x)κ(x,t),
1
где κ :Rn ×R+ .
→ R+, κ(x,t)∈C
Второе неравенство, (3.16), выполнено, если функция f(x,φ(x)T θ,t) растет не быстрее, чем линейная функция по переменной φ(x)T θ для всех x ∈ Rn. Это требование выполнено, например, для функций f(x,φ(x)T θ,t), удовлетворяющих (глобально) условию Липшица по аргументу φ(x)T θ:
f(x,φ(x)T θ,t)−f(x,φ(x)T θ,t)≤Dθ(x,t)φ(x)T (θ −θ).
||||В частности, неравенства (3.15), (3.16) выполняются для функций вида f(x,φ(x)T θ,t), где α(x,t)=MDθ(x,t)φ(x). Эти свойства иллюстрируются рис. 3.1.
Физический смысл ограничений в предположении 3.3 состоит в том, что они позволяют оценивать нелинейно параметризованные и в общем случае неизвестные
ˆ
разности f(x,θ,t)−f(x,θ,t) посредством линейно параметризованных функционаT (ˆ
лов Dα(x,t)θ −θ)с известными α(x,t). Таким образом, неравенства (3.15), (3.16) естественным образом расширяют (и в т. ч. включают) линейно параметризованные модели до нелинейных по параметрам. При этом класс моделей физических процессов, удовлетворяющих предположению 3.3 по меньшей мере для ограниченных
ˆ
θ,θ ∈Ωθ оказывается достаточно широк. Эти модели включают в себя эффекты трения “залипания” [101], трение между шиной и дорожным покрытием [128], процессы в демпферах автомобильных подвесок [210], гладкие нелинейности типа “ограничение” и “зона нечувствительности”. Кроме того, этот класс нелинейностей включает модели биореакторов [123]. В дополнение функции f(x,θ,t), удовлетворяющие предположению 3.3, служат нелинейным базисом множества аппроксимационных схем. Кроме того, они включают гауссовские нелинейности, используемые в моделях процессов нервной деятельности [143]. Примеры типовых нелинейностей в моделях пречисленных физических процессах и соответствующие функции α(x,t) приведены в табл. 3.1.
Физический смысл | Математическая модель | Области | α(x,t) |
неопределенности f(x,θ,t) | допустимых | ||
параметров | |||
Трение “залипания” [101] | θ0e−x2 2θ1 = e−x2 2θ1+ln(θ0) x = (x1,x2) | Δθ > θ0,θ1 > 0 x ∈R2 | (−x2 2,1)T |
Трение между шиной и дорожным | Fnsign(x1 −rx2) σ0 L G x3 1−x3 σ0 L x3 1−x3 +G G = θ µC + (µS −µC )e− |rx2x3||1−x3|vs | Δθ > θ > 0 x1,x2 ≥0 | x3 1−x3 |
полотном [128] | x = (x1,x2,x3) r,Fn,σ0,µS ,µC > 0 параметры | x3 ∈(0,1) | |
µS > µC | |||
Сила давления | Ko(θ+1)Ap(x1−x2) Lθ+Ko P0 x2 3 | Δθ > θ > 0 | Ap(x1 −x2) |
гидравлической | x3 > 0 | ||
эмульсии в демпферах | x = (x1,x2,x3) | ||
подвески [210] | Ko,Ap,Po,L > 0 параметры | ||
Нелинейности в | x1x2 θ0+θ1x1 , x1x2 θ0+θ1x2 | Δθ > θ0,θ1 > 0 | x1x2(1,x1)T |
модели Монода роста | x = (x1,x2) | x1,x2 > 0 | x1x2(1,x2)T |
микроорганизмов [123] | |||
Фокальные возмущения в системах обработки визуальной информации [143] | n i,j=1 e− |i−ic|+|j−jc|θ ri,j (t) ri,j : R+ →R+, i,j,n ∈N ic,jc ∈N, 1 ≤ic,jc ≤n | Δθ > θ > 0 ri,j (t)≤Δr | 1 |
В некоторых приложениях требуется не просто обеспечить достижение целевого множества, но и одновременно определить значения неизвестных θ. С этой целью имеет смысл формализовать дополнительные естественные ограничения на класс нелинейностей, в принципе позволяющие получение таких оценок. Для этого отметим, что параметрическая ошибка ˆ
θ −θ может быть обнаружена по выходу ψ(x,t), в соответствии с (3.10), только лишь, если ˆˆ
θ −θ =0влечет f(x,θ,t)−f(x,θ,t)=0. Поэтому в тех случаях, когда требуется сходимость оценок ˆ
θ к θ, полезно иметь
оценки разности f(x,θ,t)−f(x,θ,t)снизу. Такая возможность определяется пред
|ˆ|положением 3.47: 7Несмотря на то, что предположение 3.4 требует выполнения неравенства (3.17) для всех x ∈Rn ,
Предположение 3.4. Для заданной функции f(x,θ,t) в (3.10) и функции α(x,t), удовлетворяющих предположению 3.3, существует такое положительное число D1 > 0, что выполнено неравенство
ˆ
|f(x,θ,t) −f(x,θ,t)≥D1α(x,t)T (ˆ. (3.17)
θ −θ)
|||
Отметим также и то, что в задачах оценки параметров эффективность собственно алгоритмов оценивания часто зависит от того, насколько “хороша” сама нелинейность f(x,θ,t) и насколько предсказуем отклик системы (3.11) на ее малые и локальные измерения. Естественной мерой предсказуемости функций являются свойства локальной ограниченности и Ckгладкости. Полагаем, что качество функций f(x,θ,t) и (ψ,ω,t) характеризуется с помощью следующего набора свойств:
Д1. Функция f(x,θ,t) локально ограничена по x, θ равномерно по t.
Д2. Функция f(x,θ,t) ∈C1, и производная ∂f(x,θ,t)/∂t локально ограничена по x, θ равномерно по t.
Д3. Для заданных ограниченных Ux ⊂ Rn , Uθ ⊂ Rd существует такое число
ˆ
DUx,Uθ > 0 что для всех x ∈ Ux и θ,θ ∈ Uθ выполняется предположение 3.4,
причем D1 = DUx,Uθ .
Д4. Функции (ψ,ω,t) локально ограничены по ψ, ω равномерно по t.
Таким образом, предположения 3.1 – 3.4 и допущения 1–4 задают основные ограничения, достаточные для формальной постановки обобщенной и частных задач адаптивного управления. Под обобщенной задачей будем понимать совокупность требований самого общего характера, таких как ограниченность состояний замкнутой системы, принадлежность ошибок к определенным функциональным пространствам, выполнение предельных целевых соотношений. Частные задачи, в свою очередь, получаются из обобщенной спецификацией желаемых свойств замкнутой системы, например, восстановление полной информации о неизвестных θ, робастность к немоделируемой динамике, децентрализованное управление, возможность получения решений для более широкого класса нелинейностей. В соответствии с этим сформулируем следующие задачи.
θ ∈Rd и t ∈R+, в ряде случаев оказывается достаточным локальное выполнение этого условия, т. е. в окрестности некоторого ограниченного множества.
З а д а ч а 3.1. Для системы (3.1), (3.7), удовлетворяющей предположениям 3.1–3.3 и, возможно 3.4, требуется найти закон адаптивного управления вида
ˆˆ
θ =θ(x,t), (3.18)
обеспечивающий 1) полноту замкнутой системы;
ˆ
2) ограниченность по норме в L2[t0,∞]сигнала f(x(t),θ,t)− f(x,θ(t),t):
ˆ
f(x(t),θ,t)− f(x,θ(t),t)∈ L1[t0,∞],
2
(3.19)
ˆ
f(x(t),θ,t)− f(x,θ(t),t)2,[t0,∞] < ∞
для любых x0 ∈ Rn и θ ∈ Ωθ;
3) асимптотическую компенсацию влияния неопределенности модели на целевую динамику
ˆ
limf(x(t),θ,t)− f(x,θ(t),t)=0. (3.20)
t→∞
Решение задачи 3.1, вопервых, автоматически влечет реализуемость системы управления, в том смысле, что на любом конечном интервале времени решения замкнутой системы как минимум ограничены; вовторых, свойство (3.19) в силу предположений 3.1, 3.2 гарантирует по меньшей мере ограниченность решений без требования устойчивости целевой динамики по Ляпунову и, более того, позволяет оценить близость к целевому множеству (3.4); втретьих, выполнение предельного соотношения (3.20) гарантирует точную компенсацию влияния моделируемых возмущений во времени, что решает проблему адаптации, выдвинутую в [281].
Факт доказательства разрешимости задачи 3.1 и возможные конструктивные решения неизбежно мотивируют вопрос об асимптотическом поведении замкнутой системы. В частности, очевидна актуальность ответа на вопрос: как из всего множества возможных решений выбирать те, которые гарантируют регулирование состояния системы к заданному инвариантному множеству. Формально это составляет задачу 3.2
З а д а ч а 3.2. Пусть задана система (3.1) и Ω0 – ее нетривиальное инвариантное множество при θ =0(не совпадает с пространством Rn). Найти закон управления
ˆˆˆ
u =u(x,θ,t), θ =θ(x,t), (3.21)
гарантирующий, что состояние x(t) системы (3.1) c управлением (3.21) асимптотически приближается к множеству Ω0 для любых θ ∈ Ωθ.
Задачи 3.1 и 3.2 в своей постановке в явном виде не предполагают ни возможности декомпозиции системы (3.1) на совокупность взаимодействующих подсистем ни, наоборот, возможность объединения автономно управляемых систем в единое целое. С другой стороны, принципиальная возможность разделения задачи адаптивного регулирования сложной системой на совокупность подзадач меньшей размерности позволила бы существенно упростить процедуры синтеза и анализа. Таким образом, имеет смысл задача 3.3
З а д а ч а 3.3. Рассмотрим соединение пары (не обязательно идентичных) систем S1 и S2 вида (3.1), (3.7) с алгоритмами адаптивного управления (3.18), гарантирующими решение задачи 3.1 для каждой из подсистем:
1. найти условия, при которых 1.1) соединение систем (3.18) полно; 1.2) состояние расширенной системы ограничено для любых θ1 ∈ Ωθ1 , θ2 ∈ Ωθ2 ; 1.3) для каждой из подсистем выполняется предельное соотношение (3.20).
Рассмотрим соединение пары систем S1 и D2, где D2 произвольная (полная) система.
2. Найти условия, при которых 2.1) соединение систем полно; 2.2) состояние расширенной системы ограничено для любых θ ∈ Ωθ.
3. Найти условия разрешимости задач 1 и 2 для совокупности произвольного конечного числа подсистем в соединении.
Отметим, что задача 3.3 включает как частный случай класс проблем управления по выходу и задачи децентрализованного адаптивного управления.
Рассмотрим, наконец, задачи оценки неизвестных параметров нелинейных моделей динамических систем.
З а д а ч а 3.4. Для системы (3.1), (3.7), удовлетворяющей предположениям 3.1–3.3
и 3.4, найти закон адаптивного управления вида (3.18), обеспечивающий:
1) полноту замкнутой системы;
2) выполнение предельного соотношения
ˆ
lim θ(t) = θ (3.22)
t→∞
для любых x0 ∈ Rn и θ ∈ Ωθ. Кроме того, желательной является возможность оценить скорость сходимости оценок ˆ
θ к θ.
Принципиальное отличие задачи 3.4 от предыдущих заключается в том, что в ней не требуется достижения целевых множеств и вообще говоря, ограниченности решений. Это означает, что частичные решения задачи 3.4 могут быть интерпретированы как алгоритмы адаптивного управления бифуркациями в том случае, когда
ˆ
выполнение равенства θ = θ влечет качественные изменения динамики системы. Другими словами, когда целевая динамика (3.11) качественным образом отличается от возмущенной динамики. Отметим, что факт допустимой нелинейной параметризации моделей автоматически отличает эту постановку от известных постановок задач адаптивного управления бифуркациями (см., например, работы [249, 248]).
Хотя решения задачи 3.4 и применимы для систем с нелинейной параметризацией, область приложений этих результатов определяется прежде всего ограничениями, заложенными в предположениях 3.3, 3.4 относительно класса допустимых нелинейных функций. Следовательно, интересен вопрос о возможности получения асимптотических оценок параметров θ для более широкого класса моделей систем. Ценой за подобное расширение может быть невозможность выполнения предельного соотношения (3.22) для всех x0 ∈ Rn и θ ∈ Ωθ. Ответ на этот вопрос выносится в отдельную задачу 3.5.
З а д а ч а 3.5. Для заданной системы (3.1) определить управление u, алгоритм
(3.18) и области Ωx, Ω
θ ⊂ Ωθ начальных условий таких, что состояние системы
(3.1) ограничено и предельное соотношение (3.22) выполняется для всех x0 ∈ Ωx,
θ.
θ ∈ Ω
Решения задач 3.1 – 3.5 приводится в последующих параграфах раздела.
3.2. Синтез прямого адаптивного управления нелинейными динамическими объектами
Рассмотрим конструктивные условия разрешимости задачи 3.1. С этой целью введем метод виртуального алгоритма адаптации, позволяющий аналитически выводить требуемые законы адаптивного управления при условии, что доступна информация о динамике изменений вектора x1, не зависящего от неопределенностей разбиения вектора состояния. Достаточные условия применимости этого метода для класса нелинейных систем (3.1) приводятся в параграфе 3.2.1, теорема 3.1. В дальнейшем полезно определить типовые классы систем, удовлетворяющие специфическим структурным ограничениям, для которых эти условия всегда выполняются. В параграфе 3.2.2 приводится метод, позволяюший сводить системы вида (3.1) к таким типовым системам за счет вложения (или, эквивалентно, расширения системы) системы (3.1) в системы более высокой размерности, для которых условия теоремы 3.1 выполняются a priori. В параграфе 3.2.3 показывается, как результаты параграфов
3.2.1 и 3.2.2 могут быть применены для каскадов из систем вида (3.1). В частности, приводятся условия разрешимости задачи 3.1 и собственно алгоритмы управления для систем в нижнетреугольной форме.
3.2.1. Метод виртуального алгоритма адаптации. Достаточные условия реализуемости
Подавляющее большинство известных методов адаптивного управления и идентификации предполагают, что структура (в смысле класса функций и их аргументов) желаемых управлений и алгоритмов настройки параметров имеет вид:
ˆ
u = u(x,θ,t);
(3.23)
ˆ
θ = Alg(ψ,x,t),
где u : Rn × Rd × R+ – некоторая функция состояния, оценок ˆ
θ и времени, а Alg : R × Rn × R+ Rd – закон (алгоритм) изменения оценок ˆ
θ в зависимости от
→
значений мажорирующей состояние переменной, возможно, части вектора состояния x и времени.
ˆ
Наиболее распространенной стратегией отыскания пары u(x,θ,t), Alg, также известная как принцип непосредственной компенсации (англ. – certaintyequivalence principle), является двухэтапный синтез. На первом этапе ставится задача отыскания обратной связи вида u(x,θ,t), θ ∈ Ωθ, обеспечивающей достижение целей управления при условии, что значения θ известны. На втором этапе вектор θ формально заменяют оценкой ˆ
θ в функции u(x,θ,t) и находят классы функций Alg(·), гарантирующие достижение целей управления с учетом ограничений задачи (например, что сигналы x, θ не доступны для измерения в явном виде).
В рамках такой стратегии задача синтеза адаптивного регулятора разбивается на две фактически независимые задачи в силу того, что синтез обратной связи u(x,θ,t), как правило, не ставится в зависимость от последующего решения задачи синтеза алгоритма Alg(ψ,x,t)8. Это позволяет, с одной стороны, в полной мере использовать преимущества современных методов синтеза законов управления нелинейными системами [192, 207, 259] в задаче синтеза обратной связи u(x,θ,t). С
8Единственное требование, что соединяет эти две задачи, так это стандартное требование асимптотической устойчивости по Ляпунову замкнутой системы с обратной связью u(x,θ,t) при ˆ
θ = θ. Последующие процедуры синтеза алгоритмов адаптации строятся исходя из того, что это условие выполнено. При этом как правило требуется знание конкретной функции Ляпунова. В случаях линейных моделей объекта такая функция обычно выбирается в классе квадратичных форм.
другой стороны, когда подходящие классы функций u(x,θ,t) уже определены, эта стратегия позволяет применять широкий спектр известных в литературе стандартных процедур адаптации и идентификации [232, 157, 82, 254, 38] при условии, что закон управления u(x,θ,t) обеспечивает по меньшей мере асимптотическую устойчивость системы по Ляпунову.
Тем не менее, именно эти основные достоинства принципа непосредственной компенсации (в широком смысле слова – универсальность и сведение проблемы к двум относительно независимым задачам) являются его ахиллесовой пятой. Суть проблемы состоит в том, что этот принцип действительно не учитывает – в равной мере ни с пользой для дела, ни во вред – саму возможность взаимодействия между процессами собственно управления и процедурами адаптации и оценки параметров. Однако, как показано в работах [318, 306, 263, 106], введение взаимодействия между управлением и адаптацией в виде дополнительного слагаемого
ˆθP (x,t):Rn × R+ → Rd | (3.24) |
к оценкам ˆθ в функции u(x, ˆθ,t): | |
u(x, ˆθ +ˆθP (x,t),t) | (3.25) |
приводит к появлению новых свойств управляемой системы и улучшению качества переходных процессов. К сожалению, введение фактора возможного взаимного влияния и взаимодействия закона управления в основном контуре и алгоритма адаптации кардинальным образом усложняет синтез, нарушая простоту двухэтапного синтеза и, естественно, независимость задач синтеза регулятора основного контура и алгоритмов адаптации. Следует отметить, что даже в случаях линейных моделей объекта и регулятора и простых алгоритмах адаптации с использованием квадратичных функционалов, итоговая адаптивная систем становится эквивалентной многосвязной нелинейной системе с порядком более, чем третий. Гарантировать желаемое качество траекторий в такой системе становится трудно разрешимой задачей.
Подход к разрешению этих проблем, позволяющий сделать процесс синтеза взаимодействия ˆ
θP (x,t) целенаправленным и систематическим, содержится в работах [77, 319]. Предложенный в них метод позволяет, вопервых, сохранить двухэтапную процедуру синтеза адаптивного регулятора при сохранении формальной независимости задач синтеза регулятора основного контура и процедуры адаптации. С другой стороны, метод позволят систематически и целенаправленно вводить желаемые взаимосвязи типа (3.24) в структуру адаптивного регулятора (3.25).
Принципиальное отличие этого метода от известных состоит в том, что вместо того, чтобы рассматривать задачу синтеза в рамках заданных ограничений, и лишь затем искать возможные пути ее решения, предлагается решать задачу без учета ограничений и лишь затем, из пространства всех решений выбирать только те, которые удовлетворяют исходной постановке, т. е. с ограничениями.
В конкретном случае это эквивалентно тому, что для заданной и, вообще говоря,
ˆ
произвольной функции управления u(x,θ,t) ищется некоторый алгоритм адаптации, гарантирующий, что замкнутая система обладает желаемыми свойствами (например, обеспечивается решение задачи 3.1). При этом на данном этапе допускается исполь
зование всей возможной, в т. ч. недоступной для измерения информации ψ, x,θ:
ˆlg(ψ,
θ = A∗ψ,x,x,θ,t). (3.26)
По этой причине алгоритмы типа (3.26) называются в работе виртуальными, т. е. физически не реализуемыми в форме (3.26).
После того, как искомый класс алгоритмов адаптации (3.26), гарантирующий выполнение требований (3.19) установлен, решается задача реализации этих законов уже с учетом ограничений на недоступность сигналов
ψ, x,θ для непосредственного измерения. При этом естественно допустить возможность использования информации о векторных полях f1(x,θ,t), g1(x,t) модели (3.1), а также знание некоторых свойств функций f2(x,θ,t) качественного характера.
Для решения задачи физической реализации законов (3.26) в форме, не тре
бующей непосредственного измерения сигналов ψ, x,θ предлагается использовать интегродифференциальный [159] эквивалент векторного уравнения (3.26) в виде т. н. алгоритма в конечной форме [77]:
ˆθP (x,t) +ˆ
θ = Γ(ˆθI (t)), Γ ∈ Rd×d , Γ > 0
(3.27)
ˆ
θI = Alg(ψ,x,t).
Таким образом, предложенный подход к решению задачи синтеза адаптивного регулятора, с одной стороны, сохраняет такие достоинства принципа непосредственной компенсации, как возможность синтеза обратной связи u(x,θ,t) независимо от собственно процедуры адаптации. С другой стороны, этот подход автоматически и обоснованно приводит к искомым взаимосвязям ˆ
θP (x,t), гарантирующим в силу построения желаемые свойства (3.19) замкнутой системы даже в случае, если функции f(x,θ,t) в модели (3.10) зависят от вектора θ нелинейным образом.
Выбор класса виртуальных алгоритмов адаптации (3.26) должен быть подчинен возможности решения задач 3.1 – 3.5. Поэтому такие алгоритмы должны быть, как минимум, работоспособны в случае нелинейной параметризации моделей без привлечения аппарата мажорирующих функций [48, 233, 231, 230]. Вовторых, они потенциально должны обеспечивать возможность выполнения свойства (3.22) (задачи 3.4, 3.5). Втретьих, для решения задачи 3.2 естественно требовать, чтобы введение управляющих связей не привносило в систему никаких иных инвариантных множеств за исключением, пожалуй, инвариантности вдоль многообразия целевой динамики (если такое существует). Поэтому класс виртуальных алгоритмов адаптации, обеспечивающих решения задач 3.1–3.5 зададим в виде:
ˆ
ˆˆ
θ = Γ( ψ+ (ψ,ω,t))α(x,t) + Q(x,θ,t)(θ −θ), Γ ∈Rd×d , Γ > 0, (3.28)
ˆ
где Q(x,θ,t) : Rn ×Rd ×R+0. Подобный выбор обусловлен тем, что
→ Rd×d , Q(·) ∈C
фазовый поток, генерируемый такими системами, потенциально инвариантен вдоль уравнений целевой динамики, при условии, что Q= 0. При этом работоспособность алгоритмов вида (3.28) в системах с нелинейно параметризованными неопределенностями в функциях f(x,θ,t) – достижение целей управления и свойства (3.22), по меньшей мере для систем с асимптотически устойчивой по Ляпунову целевой динамикой (3.11), доказана в работах [46, 318].
В качестве кандидата на реализацию алгоритмов (3.28) в интегродифференциальной или конечной форме (3.27) выберем следующую систему уравнений:
ˆθP (x,t) +ˆ
θ(x,t) = Γ(ˆθI (t)); Γ ∈Rd×d , Γ > 0 ˆ
θP (x,t) = ψ(x,t)α(x,t) −Ψ(x,t), (3.29) ˆ
ˆˆ
θI = (ψ(x,t),ω,t)α(x,t) + R(x,θ,u(x,θ,t),t),
где функции Ψ(x,t) : Rn ×R+1 в системе (3.29) удовлетворяют
→ Rd, Ψ(x,t) ∈ C
предположению 3.59
Предположение 3.5. Существует такая функция Ψ(x,t), что для всех x ∈Rn выполняется следующее равенство:
∂Ψ(x,t) ∂α(x,t)
∂x2 −ψ(x,t) ∂x2 = B(x,t), (3.30)
где функция B(x,t) : Rn ×R+ Rd×p либо тождественно равна нулю, либо в
→
случае f2(x,θ,t) дифференцируема по θ, удовлетворяет неравенству:
B(x,t)F(x,θ,θ,t) ≤0 ∀θ,θ ∈Ωθ, x ∈Rn;
1 ∂f2(x,s(λ),t)
F(x,θ,θ,t) = dλ; s(λ) = θλ+ θ(1 −λ).
∂s
0
ˆˆ
Функция R(x,θ,u(x,θ,t),t) : Rn ×Rd Rd в системе (3.29) задается в
×R×R+
→
виде:
ˆ
R(x,u(x,θ,t),t) = ∂Ψ(x,t)/∂t−ψ(x,t)(∂α(x,t)/∂t) −(ψ(x,t)Lf1 α(x,t) ˆ
−Lf1 Ψ(x,t)) −(ψ(x,t)Lα(x,t) −Lg1 Ψ(x,t))u(x,θ,t), (3.31)
g1
ˆˆ
+ B(x,t)(f2(x,θ,t) + g2(x,t)u(x,θ,t)).
9Похожее требование “интегрируемости” вводится также в [27] как условие работоспособности алгоритмов идентификации неизвестных параметров.
ˆˆ
Функции Ψ(x,t) и R(x,θ,u(x,θ,t),t) в системе (3.29) играют роль регулятоˆ
ров формы производной θ(x,t). Другими словами, они обеспечивают соответствие ˆ
производной по времени θ(x,t) уравнению (3.28). Роль функции Ψ(x,t) в (3.29) состоит в том, чтобы компенсировать влияние зависимого от неопределенности члена ψ(x,t)Lf2(x,θ,t)α(x,t). При этом условие (3.30) является условием возможности такой
ˆˆ
компенсации10. Функция R(x,θ,u(x,θ,t),t), в свою очередь, компенсирует влияние независимых от неопределенности векторных полей f1(x,t), g1(x,t) и g2(x,t) на же
ˆ
лаемую форму производной по времени θ(x,t). Свойства системы (3.1) с регулятором основного контура (3.7) (в частности, (3.8)) и алгоритмом адаптации (3.29), (3.31), приводятся в теореме 3.1.
Теорема 3.1. Рассмотрим замкнутую систему (3.1), (3.10), (3.29), (3.31) и положим, что выполнены предположения 3.3, 3.4 и 3.5. Тогда справедливы следующие утверждения:
ˆ
1) Пусть для заданных начальных условий x(t0), θI (t0) и значений вектора θ интервал [t0,T∗] является (максимальным) интервалом времени, на котором определены решения замкнутой системы (3.1), (3.10), (3.29), (3.31). Тогда
ˆ
f(x(t),θ,t) − f(x(t),θ(t),t)) ∈ L1[t0,T∗];
2
ˆ
f(x(t),θ,t) − f(x(t),θ(t),t))2,[t0,T ∗] ≤ Df (θ,t0,Γ,ε(t)2,[t0,T ∗]); 0.5 D (3.32)
2 θ − ˆ
Df (θ,t0,Γ,ε(t)2,[t0,T ∗]) = D θ(t0) 2 + D1 ε(t)2,[t0,T ∗];
Γ−1
θ(t) 2 θ(t0) − θ 2 D 2
θ − ˆ
+2D2 ε(t)2,[t0,T ∗].
Γ−1
Γ−1 ≤ ˆ1
В дополнение, если выполнены предположения 3.1 и 3.2, то
n
2) ψ(x(t),t) ∈ L1
∞[t0,∞], x(t) ∈ L∞[t0,∞] и
ψ(x(t),t)∞,[t0,∞] ≤ γ∞,2 ψ(x0,t0),ω,Df (θ,t0,Γ,ε(t)2,[t0,∞]) + ε(t)2,[t0,∞] ; (3.33)
3) кроме того, если выполняются свойства Д1, Д4 и для системы (3.11) опре
делено передаточное отображение L1[t0,∞][t0,∞], p > 1 по входу ζ(t) и
2p
→ L1
выходу ψ, то
ε(t) ∈ L1[t0,∞] ∩ L1 [t0,∞] lim ψ(x(t),t) = 0. (3.34)
2
∞⇒ t→∞
Если, в дополнение, выполняется свойство Д2 и функции α(x,t), ∂ψ(x,t)/∂t локально ограничены по x равномерно по t, то
10В Приложении 2, в доказательстве теоремы 3.1, показано, что предположение 3.5 действительно достаточно для существования функции ˆ
θ(x,t) состояния и времени, удовлетворяющей записи (3.28).
4) справедливо следующее предельное соотношение
ˆ
lim f(x(t),θ,t) −f(x(t),θ(t),t) = 0. (3.35)
t→∞
Теорема 3.1, посути, формулирует достаточные условия разрешимости задачи 3.1 в классе алгоритмов адаптации (3.29). При этом дополнительным условием разрешимости (в дополнение к сформулированным ранее предположениям) является новое предположение 3.5. Поэтому перед тем как развить результаты теоремы 3.1, раскроем физический смысл этого предположения.
Предположение 3.5 фактически связывает возможность синтеза алгоритма адаптации в классе (3.28), со свойствами функций α(x,t) и макропеременной ψ(x,t). Эти функции в свою очередь зависят от свойств нелинейности f(x,θ,t) опосредованно через неравенства (3.15), (3.17) при выборе функции α(x,t) и, что еще более важно, от способа задания множества: {x ∈ Rnψ(x,t) =0} ⊆ Ω0, посредством кон
|
кретной функции ψ(x,t). Эти специфические свойства функций f(x,θ,t) и ψ(x,t) оказываются связанными условиями разрешимости уравнений в частных производных вида (3.30) относительно функции Ψ(x,t). В достаточно общем случае, когда B(x,t) = col(B1(x,t),..., Bd(x,t)) и α(x,t) ∈ C2 , α(x,t) = col(α1(x,t),...,αd(x,t)), необходимые и достаточные условия существования искомой функции Ψ(x,t) вытекают из известной леммы Пуанкаре:
∂ ∂αi(x,t) ∂ ∂αi(x,t) T
∂x2 ψ(x,t) ∂x2 + Bi(x,t)= ψ(x,t) ∂x2 + Bi(x,t). (3.36)
∂x2
Следует отметить, что это равенство, будучи формальным условием существования требуемой функции Ψ(x,t) в (3.30), одновременно учитывает и структурные свойства системы (3.1), (3.10). Действительно, положим B(x,t)=0 и рассмотрим частные
производные ∂αi(x,t)/∂x2, ∂ψ(x,t)/∂x2 | по вектору x2 = (x21,...,x2p)T . Пусть | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
∂ψ(x,t) ∂x2 ∂αi(x,t) ∂x2 | = = | 0 0 | 0 0 | ··· ··· | 0 0 | ∗ 0 ∗ 0 | ··· ··· | 0 0 | ; , | (3.37) |
где символ ∗ в (3.37) обозначает некоторые функции состояния x и времени t. Тогда условие (3.37) гарантирует справедливость равенства (3.36) и, следовательно, предположения 3.5. Таким образом, выполнение предположения 3.5 зависит от того, насколько большая часть разбиения x2 состояния x является аргументом функций ψ(x,t) и α(x,t). Так, например, если ∂α(x1 ⊕x2,t)/∂x2 =0, то предположение 3.5 выполняется для произвольных ψ(x,t) ∈ C1. Если ψ(x,t), α(x,t) зависят от единственного компонента вектора x2, например x2k, k ∈ {0,...,p}, то условие (3.37)
также всегда выполняется. Причем функция Ψ(x,t) в этом случае может быть вычислена либо аналитически взятием неопределенного интеграла
α(x,t)
Ψ(x,t) = ψ(x,t) dx2k, (3.38)
∂x2k
либо численно
x2k(t) α(x,t)
Ψ(x,t) = ψ(x,t) dx2k. (3.39)
x2k(t0) ∂x2k
Во всех остальных случаях существование искомой функции Ψ(x,t) определяется условием (3.36).
Необходимость выполнения предположения 3.5, на первый взгляд, может казаться существенным ограничением, которое ограничивает применимость как результатов теоремы 3.1, так и всего подхода в целом узким классом задач, для которых выполняется условие (3.36). Несмотря на то, что подобная критика действительно справедлива в части непосредственного применения теоремы 3.1, отметим, что, вопервых, условие (3.36) выполняется по умолчанию для достаточно широкого круга практически важных постановок задач адаптации и оценки параметров в системах с нелинейной параметризацией11 для произвольных α(x,t),ψ(x,t) ∈C1. Рассмотрим, например, работу [130], где класс допустимых систем ограничен уравнениями вида (3.40):
x= −(x,u)x+ f(θ,u,x), (x,t) > min > 0, x ∈R. (3.40)
Размерность вектора состояния в системе (3.40) равна единице и совпадает с размерностью x2: dim{x} = dim{x2} =1. Следовательно, в соответствии с (3.38) и при условии, что ψ(x,t), α(x,t) ∈C1, функция Ψ(x,t), удовлетворяющая равенству
(3.30) всегда существует (в частности при B(x,t)=0). Вовторых, для широкого класса систем, не удовлетворяющих предположению 3.5 оказывается возможным такое расширение уравнений системы12, что предположение 3.5 выполняется в новом пространстве [322, 319, 317]. При этом расширение производится таким образом, чтобы достижение цели управления в расширенном пространстве состояний влекло выполнение исходных целей управления. Условия такой возможности и формальные ограничения на классы допустимых систем (3.1), для которых подобная процедура может быть реализована, приводятся в параграфе 3.2.2.
В заключение кратко прокомментируем результаты, установленные теоремой 3.1. Теорема 3.1, устанавливая условия разрешимости задачи 3.1, формулирует свойства,
11См., например, постановку задачи в [130] для оценки параметров нелинейных систем в случае нелинейной параметризации. Эта постановка на сегодняшний день является одной из наиболее общих постановок, известных в литературе.
12Этот процесс эквивалентен вложению состояния в пространства более высокой размерности с доопределением уравнений динамики системы по новым переменным.
имеющие важное значение как для задач собственно управления – свойства 2), 3), так и идентификации – 1), 4). Эти свойства, как иллюстрируется уравнениями (3.32)–(3.35), дают условия ограниченности решений x(t,x0,t0,θ,u(t)), асимптотического “обнуления” целевого функционала (условие (3.34)) и точной асимптотической компенсации влияния моделируемых неопределенностей f(x,θ,t) даже при наличии
неизмеряемых возмущений ε(t) ∈ L1
2
[t0,∞]
1L∩∞
[t0,∞]
. Эти свойства естественным
образом вытекают из того, что выполнено требование (f(x(t),θ,t)−f(x(t),
ˆ
θ(t),t))) ∈
L1[t0,∞] (требование (3.19) в задаче 3.1), выполнение которого в свою очередь обеспечивается свойствами (3.15), (3.16), (3.17) функций f(x,θ,t) в предположениях 3.3,
3.4. Среди этих свойств оценка (3.17) в предположении 3.4 имеет особое значение в случае ненулевых возмущений (в общем случае неограниченных по равномерной норме) из L1[t0,∞]. В случае если возмущения ε(t) равны нулю можно показать, что
2
свойства 1)–4) выполняются без требования выполнения условий предположения 3.4.
Следствие 3.1. Рассмотрим систему (3.1), (3.10),(3.29), (3.31), и положим, что ε(t) = 0 и выполнены предположения 3.3,3.5. Тогда
ˆ2
5) норма θ − θ(t)не возрастает со временем и свойства 1)–4)13 теоремы
Γ−1
3.1 справедливы с учетом того, что ε(t) = 0 в соответствующих оценках.
ˆ
В дополнение к тому, что разность f(x,θ,t) − f(x,θ,t)может теперь не удо
||
влетворять требованию ограниченности снизу (3.17), следствие 3.1 гарантирует, что
θ(t)2
θ − ˆΓ−1 не возрастает со временем при ε(t) = 0. Практическое значение этого следствия состоит в том, что в последующих параграфах раздела оно позволит доказать выполнение предельного соотношения (3.22) при более слабых ограничениях, чем требования предположения 3.4. Кроме того, оно позволит сформулировать условия экспоненциальной устойчивости невозмущенной системы (при ε(t)=0), что в свою очередь гарантирует робастность замкнутой системы по отношению к (малым)
1возмущениям из L∞
[t0,∞] в правой части (3.10).
Однако перед тем, как перейти к рассмотрению этих новых свойств алгоритмов
(3.29) рассмотрим вначале более важную задачу, связанную с обеспечением выполнения предположения 3.5 для систем вида (3.1).
3.2.2. Задача вложения. Достаточные условия разрешимости
В общем случае, когда dim{x2} > 1, проблема отыскания функции Ψ(x,t), удовлетворяющей условию (3.30) предположения 3.5 может быть решена с помощью
13В этом случае, однако, оценки нормы ψ(x(t),t)∞,[t0,∞] будут отличаться от оценок (3.33) теоремы 3.1. Новые границы даются формулой (П3.14) в Приложении 2
специальной процедуры вложения, предложенной в [319]. Основная идея, лежащая в основе этой процедуры, состоит во введении вспомогательной системы
ξ = fξ(x,ξ,t), ξ ∈ Rz ,
(3.41)
hξ = hξ (ξ,t), Rz × R+ Rh ,
→
такой, что f(x(t),θ,t) − f(x1(t) ⊕ hξ(t) ⊕ x2(t),θ,t) ∈ L1[t0,∞], (3.42)
2
причем dim{hξ } + dim {x2} = p. Таким образом, уравнения модели по ошибке (3.10) принимают следующий вид:
ˆ
ψ= f(x1 ⊕ hξ ⊕ x
2,θ,t) − f(x1 ⊕ hξ ⊕ x2,θ,t) − (ψ,ω,t) + εξ(t), (3.43)
где εξ (t) ∈ L1[t0,∞] и dim{x= p − h < p. В принципе, размерность вектора x
22}
таким образом может быть уменьшена до единицы или нуля. Как только это свойство выполнится, автоматически выполнится и условие (3.37), что в свою очередь, согласно (3.36), гарантирует выполнение предположения 3.5.
Сформулируем формальные ограничения на желаемые свойства системы (3.41) в виде предположения
Предположение 3.6. Система (3.41) 1) полна, т. е.
x ∈ Ln
∞[t0,T] ∞[t0,T]; (3.44)
⇒ ξ ∈ Lz 2) для любых θ ∈ Ωθ и x(t0) вдоль решений системы (3.41) существует функция
Δξ : Rd × Rn R+ такая, что справедлива следующая оценка:
→
f(x,θ,t) − f(x1 ⊕ x2⊕ hξ ,θ,t)2,[t0,T ∗] ≤ Δξ (θ,x0), (3.45)
где T∗ – максимальное время существования решения x(t).
Очевидно, что расширение уравнений системы (3.1) уравнениями системы (3.41) трансформируют уравнения (3.10) в (3.43), где
εξ(t)2,[t0,T ] ≤ Δξ (θ,x0).
Для расширенной системы (3.1), (3.41) введем алгоритм адаптации:
ˆθP (x,t) +ˆ
θ(x,t) = Γ(ˆθI (t)); Γ ∈ Rd×d , Γ > 0; ˆ
θP (x,t) = ψ(x,t)α(x1 ⊕ x2⊕ hξ,t) − Ψ(x1 ⊕ x2⊕ hξ ,t) (3.46) ˆ
ˆˆ
θI = (ψ(x,t),ω,t)α(x1 ⊕ x2⊕ hξ ,t) + R(x,θ,u(x,θ,t),t),
где функция Ψ(x1 ⊕ x2⊕ hξ ,t) удовлетворяет предположению 3.7.
Предположение 3.7. Существует функция Ψ(x1 ⊕ x2⊕ hξ,t) ∈ C1, такая, что справедливо равенство
∂Ψ(x1 ⊕ x2⊕ hξ ,t) 2 ⊕ hξ ,t)
= ψ(x,t) ∂α(x1 ⊕ x. (3.47)
∂x∂x
22
ˆˆ
Функция R(x,θ,u(x,θ,t),t) : Rn × Rd Rd в системе (3.46) имеет вид:
× R × R+
→
ˆ
R(x,u(x,θ,t),t) = ∂Ψ(x1 ⊕ x2⊕ hξ ,t)/∂t− ψ(x,t)(∂α(x1 ⊕ x2⊕ hξ ,t)/∂t)+
∂Ψ(x1 ⊕ x2 ⊕ hξ ,t) − ψ(x,t) ∂α(x1 ⊕ x
2 ⊕ hξ,t) ∂hξ(ξ,t) fξ (x,ξ,t)−
∂hξ ∂hξ · ∂ξ (3.48) (ψ(x,t)Lf1 α(x1 ⊕ x
2 ⊕ hξ ,t) − Lf1 Ψ(x1 ⊕ x2⊕ hξ ,t))− (ψ(x,t)Lg1 α(x1 ⊕ xˆ
2 ⊕ hξ,t) − Lg1 Ψ(x1 ⊕ x2⊕ hξ,t))u(x,θ,t).
Свойства замкнутой расширенной системы (3.1), (3.41), (3.46), (3.48) сформулированы в теореме 3.2
Теорема 3.2. Рассмотрим расширенную систему (3.1), (3.41), (3.46), (3.48), где система (3.41) удовлетворяет предположению 3.6. Тогда для расширенной замкнутой системы справедливы утверждения теоремы 3.1 при условии, что предположение 3.5 в формулировке теоремы 3.1 заменено на предположение 3.7.
При этом выполнение предположения 3.2 для систем (3.1), (3.11) влечет полноту и ограниченность решений замкнутой расширенной системы.
Теорема 3.2 устанавливает условия (предположение 3.6), при которых ограничения предположения 3.5 могут быть заменены более слабыми требованиями предположения 3.7. Нетрудно убедиться в том, что при условии существования системы (3.41), удовлетворяющей предположению 3.6 и условию dim{hξ } = p, предположение 3.7 всегда выполняется. Следовательно, можно сделать следующий вывод о том, что классы систем, для которых существует такое вложение одновременно являются и классами разрешимости задачи 3.1. В этом смысле теорема 3.2 сводит решение задачи 3.1 к решению задачи отыскания подходящего вложения исходной системы (3.1) в систему более высокого порядка (3.1), (3.41), dim{hξ} = p, для которой выполняются условия предположения 3.6.
Рассмотрим теперь классы систем, для которых подобное вложение оказывается возможным. Будем рассматривать функции f2(x,θ,t), удовлетворяющие следующему предположению f2(x,θ,t):
Предположение 3.8. Для функций f2(x,θ,t) в системе (3.1) существуют и известны такие функции δf (x,t) : Rn × R+ → Rp, что для любого θ ∈ Ωθ неравенству:
f2,i(x,θ,t)≤θf,i · δf,i(x,t)+θb,i,i =1,...,p, (3.49)
||
причем функции δf,i(x,t)≥0для всех i =1,...,p.
В силу предположения 3.8 для любого θ ∈Ωθ существуют функции Δf :Rp ×R+
→
Rp+1 , Δf (x,t)=δf (x,t)⊕1и вектор η ∈Rp такие, что
f2(x,θ,t)≤ηT Δf (x,t). (3.50)
Класс систем, удовлетворяющий предположению 3.8 и, следовательно, неравенствам (3.49), (3.50) содержит в себе такой широкий класс моделей, как системы с локально ограниченными по θ функциями f2(x,θ,t). В этом смысле предположение
3.8 не является ограничением в силу того, что векторные поля в правой части (3.1) по умолчанию предполагаются локально ограниченными. Существенным для нас является лишь то, что функции δf (x,t) в (3.49) и соответственно функции Δf (x,t) в
(3.50) известны.
Важным частным случаем систем, удовлетворяющих предположению 3.8 являются системы, где нелинейно параметризованные модели неопределенности глобально ограничены по x, θ и t, что соответствует подавляющему большинству практически значимых ситуаций. В этом случае, очевидно Δf (x,t)=1, а η = η ∈ R1 является скаляром.
Предположение 3.8, посути, специфицирует информацию о функциях f2(x,θ,t), требуемую для применения вводимого подхода к построению вспомогательных систем (3.41). Это предположение, однако, не вводит никаких ограничений на функции ψ(x,t), частные производные которых тем не менее участвуют в определении функций f(x,θ,t). Для того, чтобы учесть это влияние, отдельно введем ограничения на класс допустимых функций f(x,θ,t). Эти ограничения сформулированы в предположении 3.9
Предположение 3.9. Для функций f(x,θ,t) в моделях (3.9), (3.10) и
(3.43) определены и существуют непрерывно дифференцируемые функции h :
Rp ×Rn ×R+ → Rp, hξ : Rp → Rp такие, что для всех θ ∈ Ωθ справедливо
неравенство
h(ξ,x,t)−h(f(x1 ⊕hξ(ξ),θ,t)−f(x1 ⊕x2,θ,t). (3.51)
x2,x,t)≥
||
Предположение 3.9 выполняется, например, для функций f(x,θ,t), удовлетворяющих условию Липшица.
Введем в рассмотрение следующую систему уравнений
ξ = (H(ξ,x,t)T H(ξ,x,t) + β)(x2 − ξ) + g2(x,t)u+ υ, β > 0, (3.52)
где
1 ∂h(s(λ,ξ,x),x,t)
H(ξ,x,t) = dλ, s(λ,ξ,x) = λx2 + (1 − λ)ξ,
∂s
0
а вектор υ определяется как
υ = −ˆηT Δf (x,t) · sign(ξ − x2);
(3.53)
ˆ
η = Γη Δf (x,t) · sign(ξ − x2)T (ξ − x2), Γη > 0.
Свойства системы (3.52), (3.53) устанавливаются следующей теоремой.
Теорема 3.3. Рассмотрим последовательное соединение систем (3.1) и (3.52), (3.53). Положим, что для системы (3.1) выполняется предположение 3.8, а функция h(·) в (3.52) удовлетворяет предположению 3.9. Тогда
1) система (3.52), (3.53) полна и, кроме того,
2) для любых x(t0) ∈ Rn и θ ∈ Ωθ справедлива оценка
f(x1 ⊕ hξ,θ,t) − f(x1 ⊕ x2,θ,t)2,[t0,T ∗] ≤ 1 ξ(t0) − x2(t0) 22 1
,
η(t0) − η
+ ˆ
Γ−1
η
√2
(3.54)
где T∗ – максимальное время существования решения x(t).
Теорема 3.3 позволяет сводить задачу отыскания функций Ψ, удовлетворяющих предположениям 3.5 или 3.7 в задаче 3.1 синтеза адаптивного регулятора к проверке условий предположений 3.8, 3.9. Подобная замена позволяет сделать вывод о том, что для класса локально ограниченных по θ функций f2(x,θ,t) и Липшицевых по x2 функций f(x,θ,t) всегда найдется расширение (3.41), трансформирующее исходные уравнения (3.1), (3.10) в (3.1), (3.41), (3.43). Причем для расширенной системы решение задачи синтеза адаптивного регулятора всегда гарантируется в силу теоремы 3.2 так как выполнение предположения 3.6 гарантируется теоремой 3.3. Таким образом, теоремы 3.2, 3.3 устанавливают факт принципиальной разрешимости задачи (3.1). Конкретные уравнения алгоритмов адаптации даются выражениями (3.52), (3.53), (3.46), (3.48).
Как и любые результаты общего характера, теорема 3.3 имеет и очевидные недостатки. К наиболее существенным недостаткам следует отнести тот факт, что правые части системы (3.52), вообще говоря, разрывные. Для случая, когда правые части разбиения xвектора x2 оказываются линейно параметризованными аналогичный
2
результат, обеспечивающий выполнение предположения 3.6, можно привести в классе систем с непрерывными правыми частями (см. параграф 3.3). В общем случае синтез расширений (3.41), обеспечивающие выполнение предположения 3.6 в классе систем с непрерывными правыми частями оказывается нетривиальной задачей. Тем не менее, такие задачи неизбежно возникают при управлении каскадами нелинейных систем. Для решения задач синтеза в системах такого типа обычно используются итеративные процедуры, требующие вычисления производных правых частей всей системы на каждом шаге синтеза [217, 26].
С целью распространения предлагаемого метода на каскады нелинейных систем, а также для определения самой возможности итеративного синтеза методом виртуального алгоритма адаптации отдельно рассмотрим случай, когда математическая модель системы (3.1) имеет нижнетреугольную форму. Эти результаты приводятся в следующем параграфе.
3.2.3. Задача прямого адаптивного управления классом объектов с моделями в нижнетреугольной форме
Рассмотрим класс объектов, математическая модель которых имеет следующий вид:
xi =fi(x1,...,xi,θi)+xi+1,
xn =fn(x1,...,xn,θn)+u+ε(t), (3.55)
ε(t)∈ L2, θi ∈ Ωθ, i =1,...n− 1,
Будем считать, что функции fi(·) в модели (3.55) удовлетворяют предположениям 3.3, 3.4 с соответствующими функциями αi(x). Термином “гладкая функция” в этом параграфе будем называть функции, дифференцируемые сколь угодно большое число раз. Для удобства будем считать, что функции αi(x) гладкие. В заключение допустим, что выполнено следующее предположение.
¯
Предположение 3.10. Существуют гладкие функции Di(·):Ri × Ri
→ R такие, что для любого θi ∈ Ωθ справедлива оценка:
2
¯
(fi(x1,...,xi,θi)− fi(x1,...,xi,θi))2 Di 2(xi,xi)xi − xi ,
≤
где xi =(x1,...,xi)T , xi=(x1,...,xi)
Целью управления будем считать выполнение предельного соотношения:
lim ψ(x1(t))=0. (3.56)
t→∞
Для достижения поставленной цели рассмотрим вначале задачу построения расширения (3.41) для системы (3.55). Условия существования такого расширения сформулированы в лемме 3.1.
xi =fi(x1,...,xi,θi)+βi(x,t), (3.57)
i =1,...,n и гладкая функция u(x,z,θ0):Rn ×Rm ×Rd R.
→
Предположим, что θ0 ∈Ω0, Ω0 – ограничены и существуют гладкие функции ¯¯
F(x,x,z), Di(x,x), i =1,...,n такие, что:
2
1) (u(x,z,θ0)−u(x,z,θ0))≤x −x2 F¯2(x,x,z)∀θ0 ∈Ω0,x,x ∈Rn;
2 xD2
2) (fi(x1,...,xi,θi)−fi(x1,...,xi,θi))xi −˜i2 ¯i (xi,xi)∀θi ∈Ωθ,xi,xi ∈Rn;
≤˜˜
xi =(x1,...,xi,0,...,0)T ,
˜
xi =(x1,...,xi,0,...,0)T .
Пусть существуют и известны функции αi(x), удовлетворяющие предположениям 3.3, 3.4 для функций fi(x1,...,xi,θi)соответственно. Тогда существуют такие ξ(t):RRn , ν(t):RRm, гладкие функции fξ(), fν (), и система:
→→ ··
ξ =fξ (x,ξ,z,ν), ξ0 ∈Rn ,
(3.58)
ν=fν (x,ξ,z,ν), ν0 ∈Rm ,
что
1) u(x,z,θ0)−u(qi,z,θ0)∈L2[t0,∞], i =1,...,n
qi =(ξ1,...,ξi,xi+1,...,xn)T ;
2) fi(x1,...,xi,θi)−fi(ξ1,...,ξi−1,xi,θi)∈L2[t0,∞], i =2,...,n; 3) x ∈L[t0,T]⇒ ξ,ν ∈L∞[t0,T].
∞
Лемма 3.1 позволяет сформулировать следующий результат
Теорема 3.4. Пусть заданы система (3.55) и целевой функционал ψ(x1)=
0. Причем ψ(x1) ∈ L[t0,T][t0,T]. Кроме того, пусть существуют ∞⇒ x1 ∈ L∞функции αi(x1,...,xi), удовлетворяющие предположениям 3.3, 3.4 для функции fi(x1,...,xi,θi)в (3.55) соответственно. В дополнение положим, что fi(x1,...,xi,θi) удовлетворяют предположению 3.10, а функции αi(x1,...,xi), fi(x1,...,xi,θi),
i =1,...,n, ψ1(x1)гладкие. Тогда существуют такие система:
ξ=fξ(x,ξ,ν), ν=fν (x,ξ,ν),
(3.59)
ξ0 ∈Rn
, ν0 ∈Rm ,
ˆˆ
гладкие функции ψi(xi,t), i =1,...,n, θP (x,ξ), управление u(x,θ,ξ,ν), и алгоритм адаптации
ˆˆθP (x,ξ)+ˆ
θ(x,ξ,θI )=γ(ˆθI ), γ > 0,
(3.60)
ˆ
ˆ
θI =fθˆ(x,θ,ξ,ν),
что
1) ψi(xi,t),ψ ∈ L2[t0,∞][t0,∞], ψ,ψi ∈ L2[t0,∞], i =1,...,n;
∩ L∞2) ˆˆ
θ ∈ L∞[t0,∞]и u(x,θ,ξ,ν)− u(x,θn,ξ,ν)∈ L2[t0,∞];
3) x,ξ,ν ∈ L[t0,∞];
∞
4)если ε(t)∈ L[t0,∞], то ψ,ψi ∈ L[t0,∞], и, более того, выполняются предель
∞∞
ные соотношения:
limψ(x1(t))=0, limψi(xi(t),t)=0, i =1,...,n. t→∞ t→∞
Теорема 3.4, аналогично теоремам 3.2, 3.3, устанавливает условия (предположение 3.10), при которых необходимость решения уравнений в частных производных
(3.30) заменяется более простой задачей синтеза расширения (3.41), (3.52), (3.53) или (3.59), удовлетворяющей предположению 3.6. Отметим, что подобное расширение системы или вложение состояния управляемого объекта в пространства более высокой размерности (с соответствующим доопределением решений по новым переменным) может быть интерпретировано как построение функционального наблюдателя So (параграф 2.4.2), обеспечивающего ограниченность ошибки восстановления, значимой для управления информации по норме (2.70). Таким образом, полнота и ограниченность решений замкнутой системы вытекают непосредственно из теоремы
2.6.
Следует отметить и то, что доказательство теоремы 3.4 конструктивно. Другими словами, в дополнение к установлению самого факта существования закона адаптивного управления для системы (3.55), оно определяет собственно уравнения такого регулятора (П3.42) в явном виде. Для того, чтобы проиллюстрировать шаги итеративного синтеза, использованного в доказательстве теоремы 3.4, а также преимущества рассматриваемого метода по сравнению с существующими в отношении качества управления, приведем два примера.
В первом примере для объекта второго порядка с линейной параметризацией приводятся синтез законов управления в соответствии с теоремами 3.2, 3.3 и 3.4. Эти законы сравниваются со стандартными решениями метода адаптивного обхода интегратора [217, 205]. Во втором примере приводится синтез регулятора для системы с нелинейно параметризованными моделями неопределенностей.
2
x1 = x1θ0 + x2; x2 = x1θ1 + x2θ2 + u, (3.61)
где параметры θ0, θ1 и θ2 предполагаются неизвестными a priori. Цель управления состоит в достижении следующего множества: x1 −1=0 в R2. Синтез регулятора для системы (3.61) проведем в соответствии с шагами доказательства теоремы 3.4.
ˆ
1) Синтез промежуточного управления. Вычислим функцию управления u1(x1,θ0) такую, что для редуцированной системы
2
x1 = x1θ0 + u1(x1,θˆ0) + ε1(t), ε1(t) ∈L2; θˆ0 = θˆ0,P (x1) + θˆ0,I (t)
выполняется следующее предельное соотношение: ψ(x1(t)) = x1(t) −10 при t
→→
ˆˆ
∞. Кроме того функция u1(x1,θ0(x1,θ0,I )) должна обеспечивать выполнение условия ψ,ψ∈L2[t0, ∞].
2) Вложение. Расширим систему (или вложим) с помощью вспомогательной подсистемы
ξ= fξ (x, ξ, ν); ν= fν (x, ξ, ν) (3.62)
таким образом, чтобы выполнялось условие
ˆˆ
u(x1,θ0(x1,θ0,I )) −u(ξ,θˆ0(ξ,θˆ0,I )) ∈L2[t0, T],x1 −ξ ∈L2[t0, T ]. (3.63)
Эти L2[t0, T]нормы должны быть ограничены сверху функциями начальных условий и, возможно, параметров.
3) Синтез закона управления. Введем новый целевой функционал ψ2(x2, t) = x2 −
u1(ξ,θˆ0(ξ,θˆ0,I )) и вычислим закон управления u(x1, x2, ξ, t) такой, что ψ2 ∈L2[t0, ∞], ψ2 ∈L2 ∩L∞[t0, ∞]. Последние условия влекут выполнение равенств
22
x1 = x1θ0 + x2 = x1θ0 + u1(x1,θˆ0(x1,θˆ0,I )) + µ(t),
где
ˆˆ
µ(t) = x2 −u1(x1,θ0(x1,θ0,I )) = (x2 −u1(ξ,θˆ0(ξ,θˆ0,I )))+ ˆˆ
(u1(ξ,θˆ0(ξ,θˆ0,I )) −u1(x1,θ0(x1,θ0,I ))) ∈L2[t0, ∞].
ˆˆ
Следовательно, в силу выбора функции u1(x1,θ0(x1,θ0,I )), управление u(x1, x2, ξ, t) будет гарантировать выполнение предельного соотношения ψ(x1(t)) → 0 при t →∞, а также свойства ψ,ψ∈L2[t0, ∞].
ˆˆˆ
−
2
1) −θˆ0x1, где C1 > 0 – параметр синтеза (коэффициент отрицательной обратной связи), а θˆ0 удовлетворяет дифференциальному уравнению (виртуальный алгоритм адаптации):
2
θˆ0 = γ0(C1(x1 −1) + x1)x1, γ0 > 0. (3.64)
Как следует из леммы 9.1, управление u1(x1,θˆ0) с алгоритмом (3.64) обеспечивают выполнение следующих свойств ψ,ψ∈L2[t0, ∞], ψ(x1(t)) → 0 при t →∞. В соответствии с теоремой 3.1, реализация алгоритмов (3.64) в конечной форме имеет вид:
3
θˆ0(x1,θˆ0,I (t)) = γ0(1/3x1 + θˆ0,I (t)); θˆ0,I = C1(x1 −1)x2. Подставляя эти функции в
1
ˆ
u1(x1,θ0), получим искомое выражение для u1(·):
52 ˆ
ˆ
u1(x1,θˆ0(x1,θ0,I )) = −C1(x1 −1) −γ0(1/3x1 + xθ0,I (t));
1
(3.65)
2
θˆ0,I = ψ(x1)α1(x1) = C1(x1 −1)x1.
Таким образом, первый этап синтеза завершен.
Синтезируем теперь систему (3.62), обеспечивающую выполнение условия (3.63) для функции (3.65). С этой целью рассмотрим разность:
ˆˆ
u(x1,θ0(x1,θ0,I )) −u(ξ,θˆ0(ξ,θˆ0,I )) = −(x1 −ξ)(C1 + γ0((x1 + ξ)θˆ0,I +
(3.66)
43 2
1/3(x1 + xξ + x1ξ2 + x1ξ3 + ξ4)))
1
143 2
и введем обозначение F(x1, ξ,θˆI,0) = (C1 +γ0((x1 +ξ)θˆ0,I + 3 (x1 +x1ξ+x1ξ2 +x1ξ3 +ξ4))). Лемма 3.1 гарантирует существование системы (3.62), такой, что выполняется условие (3.63). В частности, эта система может быть определена следующим уравнением
ξ=(x1 −ξ)(F2(x1, ξ,θˆ0,I ) + 1) + x 2θˆξ + x2, (3.67)
1
ˆ2
где θˆξ удовлетворяет дифференциальному уравнению θξ =(x1 −ξ + x1 −ξ)x. Реа
1
лизация этого алгоритма в конечной форме14 следует из теоремы 3.1, и может быть записана в виде:
3
θˆξ =1/3x1 + θˆξ,I ;
22
θˆξ,I =(x1 −ξ)x1 −x1((x1 −ξ)(F 2(x1, ξ,θˆ0,I ) + 1) + x 2θˆξ + x2). (3.68)
1
14Введение алгоритма (3.68) не является здесь необходимым шагом, так как исходная система линейно параметризована и поэтому условие (3.63) может быть обеспечено обычным градиентным алгоритмом. Тем не менее, в примере будем придерживаться последовательности шагов доказательства теоремы 3.4 с целью иллюстрации подхода, применимого как в случае линейно параметризованных систем, так и для систем с нелинейной параметризацией.
52
ξ=(x1 − ξ)(F2(x1, ξ,θˆ0,I )+1)+ 1 x1 +θˆξ,I (t)x1 +x2;
3
2 52
θˆξ,I =(x1 − ξ)x 2 1 − x1((x1 − ξ)(F 2(x1, ξ,θˆ0,I )+1)+ 1 x1 +θˆξ,I (t)x1 +x2).(3.69)
3
Таким образом, второй этап синтеза завершен.
Для завершения итеративной процедуры синтеза рассмотрим новое целевое многообразие x2−u1(ξ,θˆ0(ξ,θˆ0,I ))=0и целевую функцию ψ2(x2, t)=x2−u1(ξ,θˆ0(ξ,θˆ0,I ))= x2 +C1(ξ − 1)+γ0(1 ξ5 +θˆ0,I ξ2). Запишем производную по времени функции ψ2(·):
3
ψ2 = x2 − ∂u1(ξ,θˆ0(ξ,θˆ0,I ))ξ− ∂u1(ξ,θˆ0(ξ,θˆ0,I ))ˆ θ0,I =x1θ1 +x2θ2 +u ∂ξ ∂θˆ0,I
5
2
+γ0C1ξ2(x1 − 1)x1 +(C1 +γ0( ξ4 +2ξθˆ0,I ))((x1 − ξ)(F 2(x1, ξ,θˆ0,I )+1)+
3 1 5
2
γ0( x1 +θˆξ,I (t)x1)+x2).
3
Тогда управление
ˆ2
u = −ξθˆ1 − x2θ2 − γ0C1ξ2(x1 − 1)x1 − C2(x2 +C1(ξ − 1)+γ0(1 ξ5 +θˆ0,I ξ2)) (3.70)
3 5 52 −(C1 +γ0( ξ4 +2ξθˆ0,I ))((x1 − ξ)(F 2(x1, ξ,θˆ0,I )+1)+γ0(1 x1 +θˆξ,I (t)x1)+x2),
33
где C2 > 0 – параметр, обеспечивает выполнение равенства: ψ2 = −C2ψ2(x2, t)+ ˆˆx1θ1 +x2θ2 − x1θ1 − x2θ2. Учитывая свойство (3.63), запишем производную ψ2 в виде
ˆ
ψ2 = −C2ψ2(x2, t)+ξθ1 +x2θ2 − ξθˆ1 − x2θ2 +ε(t), где ε(t) = (x1 − ξ)θ1 ∈ L2. Как
вытекает из леммы 9.1, алгоритм адаптации
θˆ1 =γ0(C2ψ2(x2, t)+ ψ2)α1(ξ); (3.71)
θˆ2 =γ0(C2ψ2(x2, t)+ ψ2)α2(x2), α1(ξ)=ξ, α2(x2)=x2
обеспечивает выполнение свойств ψ2 ∈ L2 ∩ L∞ и ψ2 ∈ L2. Реализации алгоритма
(3.71) следуют из теоремы 3.1:
θˆ1(x2, ξ,θˆ0,I , t)= γ0((x2 +C1(ξ − 1)+γ0(1 ξ5 +θˆ0,I ξ2))ξ +θˆ1,I (t)); (3.72)
3 θˆ1,I = C2(x2 +C1(ξ − 1)+γ0(1 ξ5 +θˆ0,I ξ2))(ξ − ξ);
3 C2 2 θˆ2(x2, ξ,θˆ0,I , t)= γ0( x2 +θˆ2,I (t));
2 ˆ1
ˆ
θ2,I = C2(x2 +C1(ξ − 1)+γ0( ξ5 +θˆ0,I ξ2))x2 + ∂Ψ2 ξ+ ∂Ψ2 θ0,I ,
3 ∂ξ ∂θˆ0,I
∂α2(x2) x2
где Ψ2(x2, ξ,θˆ0,I ) = ψ2(x2, t) ∂x2 dx2 = 2 + (C1(ξ − 1) + γ0( 1 ξ5 + θˆ0,I ξ2))x2.
23
Для оценки качества полученного управления сравним результаты моделирования замкнутой системы с известным методом адаптивного обхода интегратора [217, 205]. Адаптивный регулятор для системы (3.61) в соответствии с методом [205] имеет вид:
24 ˆ
u1 = −C2(x2 + C1(x1 − 1) + θˆ3x1) − γ0x1(x1 − 1) − x2(C1 + 2x1θ3)
23 ˆˆ
−(C1x1 + 2θˆ3x1)θˆ− x1θ1 − x2θ2;
22
θˆ= γ0(x2 + C1(x1 − 1) + θˆ3x1)x1(C1 + 2θˆ3x1);
2
θˆ1 = γ0(x2 + C1(x1 − 1) + θˆ3x1)x1;
2
θˆ2 = γ0(x2 + C1(x1 − 1) + θˆ3x1)x2; (3.73)
2
θˆ3 = γ0(x1 − 1)x1,
где C1 > 0, C2 > 0, γ0 > 0 – параметры. Как и прежде, параметры C1, C2 являются
коэффициентами отрицательных обратных связей по состоянию, а γ0 – коэффициент скорости адаптации.
Адаптивное управление с функциями настройки [217] дается уравнениями
u1 = −C2(x2 + C1(x1 − 1) + x 2θˆ) − (x1 − 1) −
1
2 ˆˆ
θx 2
(C1 + 2x1θˆ)(x2 +ˆ1) − x1τ − x1θ1 − x2θ2;
22 ˆ2
θˆ= τ; τ = γ0((x1 − 1)x1 + (x2 + C1(x1 − 1) + xθ)x1(C1 + 2x1θˆ));
1
θˆ1 = γ0(x2 + C1(x1 − 1) + x 2θˆ)x1; (3.74)
1
θˆ2 = γ0(x2 + C1(x1 − 1) + x 2θˆ)x2.
1
Результаты моделирования замкнутой системы с этими тремя различными законами управления приведены на рис. 3.2. Начальные условия и параметры были выбраны
следующим образом: θ0 = θ1 =1, θ2 =0.5, C2 = C1 = γ =1, x1(0) = 2,x2(0) = 0.2, ˆˆˆ
θˆ3(0) = θ0(0) = 3, θ1(0) = θ2(0) = −2, ξ2(0) = 0,ξ1(0) = x1(0). Начальные усло
вия для переменных θˆ1,I (0), θˆ2,I (0) и θˆ3,I (0) in (3.72) соответствовали значениям ˆˆ
θ1(0) = θˆ2(0) = −2,θ3(0) = 3. В качестве дополнительного фактора качества введем переменную
3
Δθˆ(t) = θi − θˆi(t)2 ,
i=1
которая служит мерой отклонения оценок параметров системы от их действительного значения.
Рисунок 3.2. Графики траекторий системы (3.61) с управлениями (3.70), (3.72) (жирные сплошные линии), (3.73) (точки), (3.74) (пунктирные линии); a – траектории x1 как функции времени, b – x2 как функции времени, c – нормы параметрической ошибки Δθˆкак функции времени, d – управление u как функция времени.
Как вытекает из результатов моделирования, качество переходных процессов в системе (3.61) с алгоритмом (3.70), (3.72) оказывается лучше, чем при использовании стандартных методов (3.73) и (3.74). Причем особенно заметно преимущество управления (3.70), (3.72) в темпе скорости уменьшения параметрической ошибки. Для количественного сравнения качества управления приведем значения суммарной
2
энергии I = T u1(τ )dτ, T = 500, затраченной на управление во всех трех случаях.
0
Для системы с управлением (3.70), (3.72) I = 627.10, для систем с управлением
(3.73) I = 13329.28, регулятор (3.74) обеспечивает наихудшее качество управления
I = 263872.58. Похожая качественная картина наблюдается и при других значениях параметров
C1, C2 и γ0. В частности, при C1 = C2 = c, где значение c варьировалось в интервале
[1, 5], а параметр γ0 выбирался случайным образом из [0.1, 2].
Для других начальных условий x1(0), x2(0), однако, ни один из представленных алгоритмов не продемонстрировал абсолютное превосходство в качестве процессов. В среднем, однако, в рассмотренном диапазоне изменений начальных условий качество системы с предложенными алгоритмами (3.70), (3.72), выраженное в терминах L2норм ошибки x1(t) − 1 и управления u(t), превосходит наилучшие результаты для систем с алгоритмами адаптивного обхода интегратора (3.73), (3.74). Результаты сравнения частично иллюстрируются рис. 3.3. Моделирование также показало, что для предложенных алгоритмов (3.70),(3.72) параметрическая неопределенность, выраженная числом Δθ(T ), не возрастает относительно начального состояния Δθ(0) = 4.609. В то же время алгоритмы, построенные на основе адаптивного обхода интегратора, часто приводят к существенному увеличению параметрической неопределенности Δθ(T ).
Иллюстрацией возможностей метода в случаях, когда модель объекта имеет нелинейно параметризованные неопределенности, служит следующий пример.
П р и м е р 3.2.2. Рассмотрим систему массы на пружине с неизвестным трением прилипания (или, в общем случае, демпфированием), а также с неопределенностями динамики исполнительных механизмов. Схематически эта система иллюстрируется рис. 3.4. Уравнения динамики системы следуют непосредственно из законов Ньютона:
x1 = x2;
2
x2 = −kx1 + k(x3 − x1) − tanh(Sf x2)(C1 + θ1,2e−θ1,1x2 );
x3 = θ2x3 + u. (3.75)
Коэффициенты k в (3.75) обозначают коэффициент упругой деформации пружины,
2
слагаемое tanh(Sf x2)(C1 + θ1,2e−θ1,1x2 ), Sf = 50 моделирует эффекты сил трения между контактными поверхностями и массой. При этом коэффициент C1 – это коэффициент кулоновского трения, а параметры θ1,1, θ1,2 характеризуют штрибековские силы. Параметр θ2 обозначает постоянную времени исполнительного механизма. Для простоты положим, что k = C1 = 1.
Уравнения (3.75) встречаются в широком классе механических систем, включающих системы электромеханических клапанов, аппаратах искусственных мышц, моделях тканей и органов живых организмов (хотя и с другими функциями нелинейного демпфирования), а также в тактильных интерфейсах [186].
γ0 =2
C1 =2
C2 =2
γ0 =2
C1 =1
C2 =1
γ0 =1
C1 =2
C2 =2
γ0 =1
C1 =1
C2 =1
Рисунок 3.3. Диаграммы сравнения качества систем с алгоритмами адаптации на основе адаптивного обхода интегратора (3.73), (3.74) с системами на основе алгоритмов (3.70),(3.72) для начальных условий x1(0)∈ [, 2], x2(0)∈ [, 2] и следу
−2−2
ющих значений неизвестных параметров θ0 =1,θ1 =1,θ2 =1. Каждая строчка содержит результаты моделирования систем с предустановленными параметрами C1, C2, γ0 адаптивного регулятора. Левый столбец содержит данные сравнения L2норм управления u(t), средний столбец соответствует L2нормам ошибки x1(t)− 1, правый
ˆ
столбец содержит значения Δθ =θ−θ(T ). Время моделирования T =30с. Зеленый цвет в правом столбце соответствует управлению (3.73), синий цвет – управлению, (3.74), красный цвет – управлению (3.70),(3.72). Белые области ни рисунках в левом и среднем столбцах соответствуют начальным условиям, при которых какойлибо из алгоритмов адаптивного управления на основе метода обхода интегратора (3.73),
(3.74) превосходит по качеству предложенный в примере закон в терминах L2норм сигналов u(t)и x1(t)− 1соответственно. Закрашенные (серые) области соответствуют начальным условиям, при которых качество системы с предложенным алгоритмом (3.70),(3.72) оказывается лучше чем для обоих систем с управлением (3.73) и (3.74).
Рисунок 3.4. Система массы на пружине
Усредненные коэффициенты кулоновского трения и жесткости пружины определяются в основном физическими свойствами материалов и могут быть оценены a priori. Оценки штрибековских сил, однако, существенно более чувствительны к изменению условий среды (положение на поверхности, температура и т. д.) в силу принципиальной пространственной неоднородности контактных поверхностей. Поэтому для точного позиционирования, особенно на малых скоростях, требуется введение адаптации в тракт управления. В силу специфики задачи и нелинейностей применение методов мажорирования неизбежно влечет перерегулирование и колебания в окрестности рабочей точки. Следовательно, для обеспечения лучших переходных характеристик требуется недоминирующее управление в точности компенсирующее эффекты трения залипания.
Положим, что целью управления является перевод состояния системы в положение x1 = 1. Система (3.75) имеет нижнетреугольную форму, и поэтому для решения этой задачи можно использовать результаты теоремы 3.4 при условии, что выполняются предположения 3.3, 3.4, 3.10. В силу того, что скорость x2, в принципе, ограничена и, кроме того, имеет место равенство
2
2+log θ1,2
2
tanh(Sf x2)θ1,2e−θ1,1x2 = tanh(Sf x2)e−θ1,1x,
можем заключить, что предположения 3.3, 3.4 выполняются, причем
3
α1(x) = (−x2,x2,0,0)T .
Предположение 3.10 также выполняется в силу того, что рассматриваемые нелинейности локально Липшицевы по x.
Приведем синтез адаптивного регулятора для системы (3.75), следуя шагам конструктивного доказательства теоремы 3.4. Рассмотрим вначале первые два уравнения, где x3 играет роль виртуального управления u1:
x1 = x2
2
x2 = −2x1 −tanh(Sf x2)(1 + θ1,2e−θ1,1x2 ) + u1. (3.76)
Целью управления является достижение многообразия ψ(x1) = x1 −1 = 0. В первом уравнении нет никаких неопределенностей, поэтому сразу выберем новое целевое многообразие ψ1(x1,x2) = x1 −1 + x2 = 0 и управление
ˆ ˆ2
u1(x,θ1)= −ψ1(x1,x2) + 2x1 −x2 + tanh(Sf x2)(1 + e−θ1,1x2+log θˆ1,2 ), (3.77)
которое обеспечивает выполнение следующего равенства:
2 2
ψ1 = −ψ1(x1,x2) + tanh(Sf x2)(e−θˆ1,1x2+log θˆ1,2 −e−θ1,1x2+log θ1,2 ). (3.78)
Алгоритмы адаптации θˆ1,1, θˆ1,2 имеют вид:
3
θˆ1,1(x1,x2,t)= −γ(−ψ1(x1,x2)x 2 −Ψ1,1(x1,x2) + θˆ1,1,I ) + θˆ1,1(0), γ > 0, ∂Ψ1,1(x1,x2)
3
θˆ1,1,I = −ψ1(x1,x2)x2 + x2,
∂x1
3 4
Ψ1,1(x1,x2)= −(x1 −1)x 3 x2; (3.79)
2 −4
θˆ1,2(x1,x2,t)= −γ(ψ1(x1,x2)x2 −Ψ1,2(x1,x2) + θˆ1,2,I ) + θˆ1,2(0), γ > 0, ∂Ψ1,2(x1,x2)θˆ1,2,I = ψ1(x1,x2)x2 + x2,
∂x1
2
Ψ1,2(x1,x2)=(x1 −1)x2 + x2 . (3.80)
2
2
Функции Ψ1,1 = ψ1(x1,x2)3x2dx2 и Ψ1,2 = ψ1(x1,x2)dx2 выбираются согласно предположению 3.5 теоремы 3.1 таким образом, чтобы производные функций θˆ1,1, θˆ1,2 имели вид:
3
θˆ1,1 = γ(ψ1 + ψ1(x1,x2))x2;
θˆ1,2 = −γ(ψ1 + ψ1(x1,x2))x2. (3.81)
Свойства замкнутой системы (3.76), (3.77), (3.81) (предельное соотношение ψ1(x1,x2) → 0 при t →∞) вытекают из леммы 9.1. Отметим, что алгоритмы (3.79), (3.80) не требуют введения расширений (3.58). Это вытекает из того, что производная x1 не зависит от θ в явном виде и поэтому оказывается возможным компенсировать слагаемое
∂Ψ1,1(x1,x2) x1, ∂Ψ1,2(x1,x2)
x1 в θˆ1,1,I , θˆ1,2,I непосредственным образом.
∂x1 ∂x1
Этим завершается первый шаг синтеза. Рассмотрим теперь исходные уравнения
(3.75) и выберем ψ2(x1,x2,x3,t) = u1(x1,x2,t) − x3 15. В отличие от предыдущего случая, производная ψ2 зависит не только от f3(x,θ2) = x2θ2 + u, но и от f2(x,θ1). Сумма двух монотонных функций, как известно, не является монотонной в общем случае по совокупности параметров θ1⊕θ2. Следовательно, для того, чтобы удовлетворить предположениям 3.3, 3.4 необходимо заменить переменную x2 в ψ2 на новую переменную ξ. Другими словами, мы должны вложить исходную систему в систему более высокого порядка, обеспечив при этом, что u1(x1,x2,t) −u1(x1,ξ,t) ∈ L2 (см. доказательства лемм 3.1, 9.1). Отметим, что в соответствии с требованиями леммы 9.1 такое расширение должно обеспечивать выполнение условия f3(x,θ2) − f3(x1 ⊕ ξ⊕ x3,θ2) ∈ L2. В нашем примере, однако, функция f3 не зависит от x2. Поэтому достаточно обеспечить выполнение условия u1(x1,x2,t) −u1(x1,ξ,t) ∈ L2 для того, чтобы гарантировать достижение цели управления: limt→∞ ψ(x1(t)) = 0.
Рассмотрим разность u1(x1,x2,t) − u1(x1,ξ,t):
62
2 42
x2 +θˆ1,2,I (t)
u1(x1,x2,t) − u1(x1,ξ,t) = −2(x2 − ξ) + tanh(Sf x2)e− x2 +θˆ1,1,I (t)x2−
−
ξ2 +ˆθ1,2,I (t)
42 .
tanh(Sf ξ)e− ξ6 +θˆ1,1,I (t)ξ2−
Применяя теорему о среднем для разности экспонент, получим оценку:
|u1(x1,x2,t) − u1(x1,ξ,t)| | ≤ |x2 < |
---|