1. 状态空间建模
状态空间方程是现代控制理论的基础,用一阶微分方程组描述系统的内部动态。对于一个线性时不变(LTI)系统,其状态空间模型为:
$$\begin{aligned} \dot{x}(t) &= A x(t) + B u(t) \quad &\text{(状态方程)} \\ y(t) &= C x(t) + D u(t) \quad &\text{(输出方程)} \end{aligned} $$
其中:
- $x(t) \in \mathbb{R}^n$:状态向量(系统内部变量)
- $u(t) \in \mathbb{R}^m$:输入向量
- $y(t) \in \mathbb{R}^p$:输出向量
- $A, B, C, D$ 为适当维度的常数矩阵。
1.1 状态空间方程的解
1.1.1 零输入响应
先考虑 $ u(t) = 0 $ 的情况:
$$\dot{x}(t) = A x(t), \quad x(t_0) = x_0 $$
这个方程的解可用矩阵指数表示:
$$x_{\text{zi}}(t) = e^{A(t-t_0)} x_0 $$
其中矩阵指数 $ e^{At} $ 定义为:
$$e^{At} = I + At + \frac{A^2 t^2}{2!} + \dots $$
满足:
$$\frac{d}{dt} e^{At} = A e^{At} = e^{At} A. $$
1.1.2 非齐次方程的解(全响应)
现在考虑非齐次方程:
$$\dot{x}(t) - A x(t) = B u(t), \quad x(t_0) = x_0 $$
对状态方程两边左乘积分因子 e^{-A(t-t_0)}:
$$e^{-A(t-t_0)} \dot{x}(t) - e^{-A(t-t_0)} A x(t) = e^{-A(t-t_0)} B u(t) $$
注意到左边是 d/dt [e^{-A(t-t_0)} x(t)],因此:
$$\frac{d}{dt}\left[ e^{-A(t-t_0)} x(t) \right] = e^{-A(t-t_0)} B u(t) $$
两边从 t_0 到 t 积分,并利用 x(t_0)=x_0,可直接得到:
$$x(t) = e^{A(t-t_0)} x_0 + \int_{t_0}^{t} e^{A(t-\tau)} B u(\tau) d\tau $$
这是状态全响应。
1.1.3 输出响应
将 $ x(t) $ 代入输出方程:
$$x(t) = e^{A(t-t_0)} x(t_0) + \int_{t_0}^{t} e^{A(t-\tau)} B u(\tau) d\tau $$
$$y(t) = C e^{A(t-t_0)} x(t_0) + C \int_{t_0}^{t} e^{A(t-\tau)} B u(\tau) d\tau + D u(t) $$
核心是状态转移矩阵 $ \Phi(t) = e^{At} $,它决定了系统的自由运动。
1.2 与传递函数的转换
$$\boxed{G(s) = C (sI - A)^{-1} B + D} $$
1.2.1 从状态方程推导传递函数
-
对状态方程和输出方程两边同时进行拉普拉斯变换(设初始状态 $x(0) = 0$):
$$\begin{aligned} sX(s) &= A X(s) + B U(s) \\ Y(s) &= C X(s) + D U(s) \end{aligned} $$
-
由状态方程变换式整理出 $X(s)$:
$$sX(s) - A X(s) = B U(s) \\ (sI - A) X(s) = B U(s) $$
其中 $I$ 是 $n \times n$ 单位矩阵。假设 $(sI - A)$ 可逆,则:
$$X(s) = (sI - A)^{-1} B U(s) $$
-
将 $X(s)$ 代入输出变换式:
$$\begin{aligned} Y(s) &= C (sI - A)^{-1} B U(s) + D U(s) \\ &= \left[ C (sI - A)^{-1} B + D \right] U(s) \end{aligned} $$
由此得出传递函数。
1.2.2 状态方程与传递函数的关系
在上述推导中,我们做了一些假设:
- 系统必须是线性时不变(LTI)的:这是推导的基础。
- 系统初始状态为零:传递函数只反映系统的输入-输出特性,不包含初始状态的信息。状态空间模型则能描述初始状态的影响。
- $(sI - A)$ 必须可逆(除了在极点的孤立点):这要求 $s$ 不是 $A$ 的特征值。实际上,$A$ 的特征值就是 $(sI - A)^{-1}$ 的极点。
状态方程和传递函数并不是完全等价的关系:
- 从状态空间到传递函数:推导是唯一的。给定一个状态空间模型,总能通过公式 $G(s)=C(sI-A)^{-1}B+D$ 计算出一个唯一的传递函数矩阵。
- 从传递函数到状态空间:是不唯一的。同一个传递函数 $G(s)$ 可以有无数个状态空间实现(如能控标准型、能观标准型、对角标准型等)。它们内部结构不同,但输入输出特性一致。这称为状态空间实现理论。
状态空间方程包含了更多的信息:
-
$(sI - A)^{-1}$ 可以展开为:
$$(sI - A)^{-1} = \frac{\text{adj}(sI - A)}{det(sI - A)} $$
其中 $\text{adj}(\cdot)$ 表示伴随矩阵。
-
因此,传递函数:
$$G(s) = \frac{C \cdot \text{adj}(sI - A) \cdot B}{det(sI - A)} + D $$
- 分母多项式 = $det(sI - A)$(当 $D=0$ 时)。
- 分子多项式 = $C \cdot \text{adj}(sI - A) \cdot B$ 的元素。
-
在由状态空间计算 $G(s)$ 时,分子分母可能包含公因子。
-
如果发生相消,则传递函数的阶次(分母次数)将小于状态空间的维数 $n$。
-
这对应于系统具有不可控或不可观的模式(对应于被消去的极点)。
只有当状态空间模型是既能控又能观时,传递函数的极点才与 $A$ 的特征值完全一致,且传递函数的阶次等于状态维数 $n$。
1.3 小结
- 传递函数是在复数域对系统的描述,状态空间是在时间域的描述。
- 传递函数仅适用于线性时不变系统,且只能表示零初始条件下的输入输出关系。
- 状态空间实现不是唯一的(不同状态变量选取导致不同的$A,B,C,D$),但对应的传递函数是唯一的。
- 传递函数只能反映系统可控且可观那部分的动态,存在零极点对消时,状态空间模型包含“隐藏”模态(即不可控或不可观的模态)。
2. 离散化
在实际工程应用中,数字计算机控制系统已成为主流。计算机以离散时间方式工作,因此需要:
- 数字控制器实现:连续控制器需要在计算机上实现
- 采样数据系统分析:现代控制系统多为采样数据系统
- 混合系统设计:连续被控对象 + 离散控制器
- 数值仿真:计算机仿真需要离散时间模型
考虑连续时间LTI系统:
$$\begin{aligned} \dot{x}(t) &= A x(t) + B u(t) \\ y(t) &= C x(t) + D u(t) \end{aligned} $$
其中 $ x(t) \in \mathbb{R}^n $, $ u(t) \in \mathbb{R}^m $, $ y(t) \in \mathbb{R}^p $。
采样假设:
- 采样周期:$ T_s $(固定)
- 采样时刻:$ t_k = kT_s $,$ k = 0, 1, 2, \dots $
- 离散信号:$ x[k] = x(kT_s) $, $ u[k] = u(kT_s) $, $ y[k] = y(kT_s) $
2.1 零阶保持器(ZOH)离散化
2.1.1 ZOH定义与特性
零阶保持器:在采样间隔 $ [kT_s, (k+1)T_s) $ 内,保持控制信号恒定:
$$u(t) = u[k], \quad \text{对于 } t \in [kT_s, (k+1)T_s) $$
ZOH的频率特性:
- 传递函数:$ H_{\text{zoh}}(s) = \frac{1 - e^{-T_s s}}{s} $
- 幅频特性:$ |H_{\text{zoh}}(j\omega)| = T_s \cdot \left| \frac{\sin(\omega T_s/2)}{\omega T_s/2} \right| $
- 相频特性:$ \angle H_{\text{zoh}}(j\omega) = -\frac{\omega T_s}{2} $
ZOH会引入相位滞后,影响系统稳定性。
2.1.2 ZOH离散化的精确推导
从 $ t = kT_s $ 到 $ t = (k+1)T_s $,状态方程为:
$$\dot{x}(t) = A x(t) + B u(t) $$
在区间 $ [kT_s, (k+1)T_s) $ 内,$ u(t) = u[k] $ 常数。
状态方程的解为:
$$x(t) = e^{A(t - kT_s)} x[k] + \int_{kT_s}^{t} e^{A(t-\tau)} B u[k] d\tau $$
令 $ t = (k+1)T_s $,并做变量代换 $ \eta = (k+1)T_s - \tau $:
$$x[k+1] = e^{A T_s} x[k] + \left( \int_{0}^{T_s} e^{A \eta} d\eta \right) B u[k] $$
因此得到:
$$\boxed{ \begin{aligned} A_d &= e^{A T_s} \\ B_d &= \left( \int_{0}^{T_s} e^{A \eta} d\eta \right) B \end{aligned}} $$
输出方程在采样时刻保持:
$$\boxed{ \begin{aligned} C_d &= C \\ D_d &= D \end{aligned}} $$
2.1.3 $ B_d $ 的计算公式
当 $ A $ 可逆时:
$$\int_{0}^{T_s} e^{A \eta} d\eta = A^{-1} (e^{A T_s} - I) $$
所以:
$$B_d = A^{-1} (e^{A T_s} - I) B $$
当 $ A $ 不可逆时(如包含积分器),需要使用级数展开:
$$\int_{0}^{T_s} e^{A \eta} d\eta = T_s \sum_{k=0}^{\infty} \frac{(A T_s)^k}{(k+1)!} = T_s \left( I + \frac{A T_s}{2!} + \frac{A^2 T_s^2}{3!} + \cdots \right) $$
2.1.4 矩阵指数的计算方法
计算 $ e^{A T_s} $ 是离散化的核心:
-
泰勒级数法:
$$e^{A T_s} = I + A T_s + \frac{(A T_s)^2}{2!} + \frac{(A T_s)^3}{3!} + \cdots $$
截断到足够项数,适合计算机计算。
-
特征值分解法:
若 $ A = V \Lambda V^{-1} $,则:$$e^{A T_s} = V e^{\Lambda T_s} V^{-1} $$
其中 $ e^{\Lambda T_s} = \text{diag}(e^{\lambda_1 T_s}, e^{\lambda_2 T_s}, \dots) $。
-
拉普拉斯变换法:
$$e^{A T_s} = \mathcal{L}^{-1}\{ (sI - A)^{-1} \}_{t=T_s} $$
-
凯莱-哈密顿法:
对于 $ n $ 维系统,$ e^{A T_s} $ 可表示为 $ I, A, A^2, \dots, A^{n-1} $ 的线性组合。
2.1.5 ZOH离散化的性质
-
保持能控性:如果连续系统 $ (A, B) $ 能控,且采样周期 $ T_s $ 不满足病态采样条件,则离散系统 $ (A_d, B_d) $ 也能控。
- 病态采样:当连续系统有共轭极点 $ \lambda_{1,2} = \sigma \pm j\omega $,且 $ \omega T_s = k\pi $($ k $ 为整数)时,可能导致能控性丢失。
-
保持能观性:类似地,在非病态采样下,能观性得以保持。
-
稳定性保持:
- 连续系统稳定($ A $ 的所有特征值实部 < 0)⇔ 离散系统稳定($ A_d $ 的所有特征值模 < 1)
- 特征值映射:$ z = e^{s T_s} $,将左半s平面映射到单位圆内
-
频率混叠:采样频率 $ f_s = 1/T_s $ 必须满足香农采样定理:$ f_s > 2f_{\text{max}} $,其中 $ f_{\text{max}} $ 是系统最高有效频率。
2.2 一阶保持器(FOH)离散化
2.2.1 FOH定义
一阶保持器:在采样间隔内,控制信号线性变化:
$$u(t) = u[k] + \frac{u[k+1] - u[k]}{T_s} (t - kT_s), \quad t \in [kT_s, (k+1)T_s) $$
2.2.2 FOH离散化公式
推导过程更复杂,结果为:
$$\begin{aligned} A_d^{\text{foh}} &= e^{A T_s} \\ B_d^{\text{foh}} &= \left( \int_{0}^{T_s} e^{A \eta} d\eta \right) B_0 + \left( \int_{0}^{T_s} e^{A \eta} \frac{\eta}{T_s} d\eta \right) B_1 \end{aligned} $$
其中 $ B_0 $ 和 $ B_1 $ 与连续系统的 $ B $ 矩阵相关。
FOH比ZOH能更好地逼近连续信号,但实现更复杂,实际应用较少。
2.3 近似离散化方法
当采样周期 $ T_s $ 较小时,可以使用近似方法。
2.3.1 前向欧拉法(显式欧拉)
原理:用前向差分近似导数:
$$\dot{x}(t) \approx \frac{x[k+1] - x[k]}{T_s} $$
代入连续方程:
$$\frac{x[k+1] - x[k]}{T_s} = A x[k] + B u[k] $$
整理得:
$$\boxed{ \begin{aligned} A_d^{\text{fe}} &= I + A T_s \\ B_d^{\text{fe}} &= T_s B \end{aligned}} $$
性质:
- 计算简单
- 稳定性:如果连续系统稳定,需要 $ T_s $ 足够小才能保证离散系统稳定
- 精度:一阶精度,局部截断误差 $ O(T_s^2) $
2.3.2 后向欧拉法(隐式欧拉)
原理:用后向差分近似导数:
$$\dot{x}(t) \approx \frac{x[k+1] - x[k]}{T_s} $$
但在右端项使用 $ k+1 $ 时刻的值:
$$\frac{x[k+1] - x[k]}{T_s} = A x[k+1] + B u[k+1] $$
整理得:
$$\boxed{ \begin{aligned} A_d^{\text{be}} &= (I - A T_s)^{-1} \\ B_d^{\text{be}} &= (I - A T_s)^{-1} T_s B \end{aligned}} $$
性质:
- 需要矩阵求逆
- 无条件的稳定保持:如果连续系统稳定,则离散系统一定稳定
- 精度:一阶精度,但数值稳定性好
2.3.3 双线性变换(Tustin方法/梯形法则)
原理:用梯形积分近似:
$$x[k+1] = x[k] + \frac{T_s}{2} \left( \dot{x}[k+1] + \dot{x}[k] \right) $$
代入状态方程:
$$x[k+1] = x[k] + \frac{T_s}{2} \left( A x[k+1] + B u[k+1] + A x[k] + B u[k] \right) $$
整理得:
$$\boxed{ \begin{aligned} A_d^{\text{tustin}} &= \left( I - \frac{T_s}{2} A \right)^{-1} \left( I + \frac{T_s}{2} A \right) \\ B_d^{\text{tustin}} &= \left( I - \frac{T_s}{2} A \right)^{-1} T_s B \\ C_d^{\text{tustin}} &= C \left( I - \frac{T_s}{2} A \right)^{-1} \\ D_d^{\text{tustin}} &= D + \frac{T_s}{2} C \left( I - \frac{T_s}{2} A \right)^{-1} B \end{aligned}} $$
性质:
- 需要矩阵求逆
- 保持稳定性:将左半s平面映射到单位圆内
- 精度:二阶精度,局部截断误差 $ O(T_s^3) $
- 频率畸变:存在频率翘曲(Frequency Warping)
2.3.4 频率翘曲与预翘曲
频率翘曲:双线性变换将连续频率 $ \omega_c $ 映射为离散频率 $ \omega_d $:
$$\omega_d = \frac{2}{T_s} \tan\left( \frac{\omega_c T_s}{2} \right) $$
当 $ \omega_c T_s $ 较小时,$ \omega_d \approx \omega_c $,但当 $ \omega_c $ 接近奈奎斯特频率 $ \pi/T_s $ 时,畸变严重。
预翘曲:在设计滤波器时,先对关键频率进行预补偿:
$$\omega_c' = \frac{2}{T_s} \tan\left( \frac{\omega_c T_s}{2} \right) $$
用 $ \omega_c' $ 设计连续系统,再进行双线性变换。
2.3.5 各种方法的比较
| 方法 | 精度 | 计算复杂度 | 稳定性保持 | 应用场景 |
|---|---|---|---|---|
| 精确ZOH | 精确 | 高(需矩阵指数) | 完全保持 | 精确分析、快速采样 |
| 前向欧拉 | 一阶 | 低 | 条件保持(小$T_s$) | 快速仿真、简单系统 |
| 后向欧拉 | 一阶 | 中(需矩阵求逆) | 无条件保持 | 刚性系统仿真 |
| 双线性变换 | 二阶 | 中(需矩阵求逆) | 无条件保持 | 滤波器设计、控制系统 |
当然还有其它近似离散化方法,例如龙格-库塔(RK45),这里暂不展开说明。
2.4 离散化与连续系统特性的关系
2.4.1 特征值映射
连续系统特征值 $ s_i $ 与离散系统特征值 $ z_i $ 的关系:
$$z_i = e^{s_i T_s} $$
具体映射:
- $ s = 0 $(积分器) → $ z = 1 $
- $ s = -\infty $(高频模态) → $ z = 0 $
- $ s = \sigma \pm j\omega $ → $ z = e^{\sigma T_s} \angle (\pm \omega T_s) $
2.4.2 稳定性映射
- 连续稳定区域:Re(s) < 0(左半平面)
- 离散稳定区域:|z| < 1(单位圆内)
- 映射关系:$ z = e^{sT_s} $ 将左半s平面映射到单位圆内
2.4.3 能控能观性保持
定理:如果连续系统 $ (A, B, C) $ 能控且能观,且采样周期 $ T_s $ 不满足以下病态条件,则离散化系统 $ (A_d, B_d, C_d) $ 也能控且能观:
$$T_s \neq \frac{k\pi}{\text{Im}(\lambda_i - \lambda_j)}, \quad k = \pm 1, \pm 2, \dots $$
其中 $ \lambda_i, \lambda_j $ 是 $ A $ 的任意两个特征值。
2.4.4 传递函数关系
连续传递函数 $ G(s) $ 与ZOH离散化后传递函数 $ G_d(z) $ 的关系:
$$G_d(z) = (1 - z^{-1}) \mathcal{Z} \left\{ \mathcal{L}^{-1} \left[ \frac{G(s)}{s} \right]_{t=kT_s} \right\} $$
其中 $ \mathcal{Z} $ 表示Z变换,$ \mathcal{L}^{-1} $ 表示拉普拉斯反变换。
2.5 多速率采样与异步采样
2.5.1 多速率采样系统
在实际系统中,不同变量可能以不同速率采样:
- 状态多速率:不同状态变量以不同周期采样
- 输入多速率:不同控制输入以不同周期更新
- 输出多速率:不同输出以不同周期测量
2.5.2 提升技术(Lifting)
将多速率系统转换为等效的单速率系统:
- 找到所有采样周期的最小公倍数 $ T = \text{LCM}(T_1, T_2, \dots) $
- 构造提升状态向量,包含所有采样时刻的状态
- 得到提升后的系统模型
2.5.3 异步采样处理
当采样与更新不同步时:
- 时变系统模型:系统矩阵随时间周期性变化
- 周期时变系统理论:使用Floquet理论分析
- 近似方法:用平均采样周期近似
2.6 实际应用考虑
2.6.1 采样周期的选择
经验准则:
- 闭环带宽准则:$ T_s \approx \frac{1}{10} \cdot \frac{2\pi}{\omega_b} $,其中 $ \omega_b $ 是闭环带宽
- 上升时间准则:$ T_s \approx \frac{t_r}{10} $,其中 $ t_r $ 是阶跃响应的上升时间
- 主导极点准则:$ T_s \approx \frac{1}{10} \cdot \frac{2\pi}{\omega_d} $,其中 $ \omega_d $ 是主导复极点的虚部
- 香农采样定理:$ f_s > 2f_{\text{max}} $,通常取 $ f_s = (4 \sim 10) f_{\text{max}} $
2.6.2 量化效应
数字控制中的量化误差:
- A/D转换器量化:测量量化误差
- D/A转换器量化:控制量化误差
- 计算量化:数值计算中的舍入误差
- 极限环振荡:量化可能引起小幅振荡
2.6.3 计算延迟
实际数字控制器存在的计算延迟:
- 零阶保持延迟:控制量在整个采样周期保持
- 计算时间延迟:算法执行时间
- 通信延迟:网络控制系统中的传输延迟
延迟补偿方法:
- 预测控制
- 史密斯预估器
- 状态观测器结合预测
2.6.4 抗混叠滤波器
为防止频率混叠,在采样前加入抗混叠滤波器(低通滤波器):
- 截止频率:略高于系统有效带宽
- 类型:通常为巴特沃斯或贝塞尔滤波器
- 阶数:足够高以确保充分衰减
2.7 小结
离散化是连接连续时间理论与数字实现的桥梁:
- 精确离散化(ZOH)提供了理论上的精确映射,但需要计算矩阵指数
- 近似方法(欧拉、双线性变换)计算简单,适用于快速采样或初步设计
- 采样周期选择是关键设计参数,影响性能、稳定性和实现成本
- 实际因素(量化、延迟、多速率)需要在设计中考虑
- 保持连续系统特性(稳定性、能控性、能观性)是离散化的重要目标
正确的离散化方法选择和参数设计对于数字控制系统的成功实现至关重要。在实际工程中,通常需要在精度、计算复杂度和实现便利性之间进行权衡。
3. 能控性与能观性
3.1 能控性(Controllability)
可控性描述的是输入能否在有限时间内将系统状态从任意初始点驱动到任意目标点。
- 定义:对于系统 $ \dot{x} = Ax + Bu $,如果在有限时间 $ [t_0, t_f] $ 内,存在一个控制输入 $ u(t) $,能使系统从任意初始状态 $ x(t_0) $ 转移到任意终端状态 $ x(t_f) $,则称该系统在 $ t_0 $ 时刻是完全可控的。
- 判据(连续线性时不变系统):
- 秩判据(最常用):可控性矩阵
$$\mathcal{C} = [B, AB, A^2B, ..., A^{n-1}B] $$
满秩,即 $ \text{rank}(\mathcal{C}) = n $(系统阶数)。 - PBH判据:对 $ A $ 的每个特征值 $ \lambda_i $,矩阵 $ [\lambda_i I - A, B] $ 行满秩。
- 格拉姆矩阵判据:可控性格拉姆矩阵在有限时间区间内正定。
- 秩判据(最常用):可控性矩阵
- 意义:若系统不可控,则存在不受输入影响的模态,无法通过反馈任意配置极点。此时需分析其可控子空间。
3.1.1 能控性分解
如果系统不完全能控,$ \text{rank}(\mathcal{C}) = r < n $,则存在相似变换 $ \bar{x} = T^{-1}x $,将系统变换为:
$$\begin{aligned} \begin{bmatrix} \dot{\bar{x}}_c \\ \dot{\bar{x}}_{\bar{c}} \end{bmatrix} &= \begin{bmatrix} A_c & A_{12} \\ 0 & A_{\bar{c}} \end{bmatrix} \begin{bmatrix} \bar{x}_c \\ \bar{x}_{\bar{c}} \end{bmatrix} + \begin{bmatrix} B_c \\ 0 \end{bmatrix} u \\ y &= \begin{bmatrix} C_c & C_{\bar{c}} \end{bmatrix} \begin{bmatrix} \bar{x}_c \\ \bar{x}_{\bar{c}} \end{bmatrix} + D u \end{aligned} $$
其中:
- $ (\bar{x}_c, A_c, B_c) $ 维数为 $ r $,是完全能控子系统
- $ (\bar{x}_{\bar{c}}, A_{\bar{c}}) $ 维数为 $ n-r $,是不能控子系统
- $ A_{\bar{c}} $ 的特征值称为不能控模态
3.1.2 能控性的物理意义
- 状态反馈极点配置:系统完全能控是可以通过状态反馈任意配置系统极点的充要条件。
- 最优控制:LQR(线性二次调节器)问题要求系统能控(或至少能稳)。
- 系统设计:不能控的部分无法通过反馈改变,需要在建模时特别注意。
3.2 能观性(Observability)
可观测性描述的是输出信息能否在有限时间内唯一地确定系统的内部初始状态。
- 定义:对于系统 $ \dot{x} = Ax + Bu, \quad y = Cx + Du $,如果根据在有限时间区间 $[t_0, t_f]$ 内测量到的输出 $ y(t) $ 和输入 $ u(t) $,能够唯一地确定系统在初始时刻 $ t_0 $ 的状态 $ x(t_0) $,则称该系统在 $ t_0 $ 时刻是完全可观测的。
- 判据(连续线性时不变系统):
- 秩判据(最常用):可观测性矩阵
$$\mathcal{O} = \begin{bmatrix} C \\ CA \\ CA^2 \\ \vdots \\ CA^{n-1} \end{bmatrix} $$
满秩,即 $ \text{rank}(\mathcal{O}) = n $。 - PBH判据:对 $ A $ 的每个特征值 $ \lambda_i $,矩阵 $ \begin{bmatrix} C \\ \lambda_i I - A \end{bmatrix} $ 列满秩。
- 格拉姆矩阵判据:可观测性格拉姆矩阵
$$W_o(t_f) = \int_{0}^{t_f} e^{A^T \tau} C^T C e^{A \tau} \, d\tau $$
对任意 $ t_f > 0 $,$ W_o(t_f) $ 正定(即满秩,$\text{rank}(W_o) = n$)。
- 秩判据(最常用):可观测性矩阵
3.2.1 能观性分解
如果系统不完全能观,$ \text{rank}(\mathcal{O}) = q < n $,则存在相似变换 $ \bar{x} = T^{-1}x $,将系统变换为:
$$\begin{aligned} \begin{bmatrix} \dot{\bar{x}}_o \\ \dot{\bar{x}}_{\bar{o}} \end{bmatrix} &= \begin{bmatrix} A_o & 0 \\ A_{21} & A_{\bar{o}} \end{bmatrix} \begin{bmatrix} \bar{x}_o \\ \bar{x}_{\bar{o}} \end{bmatrix} + \begin{bmatrix} B_o \\ B_{\bar{o}} \end{bmatrix} u \\ y &= \begin{bmatrix} C_o & 0 \end{bmatrix} \begin{bmatrix} \bar{x}_o \\ \bar{x}_{\bar{o}} \end{bmatrix} + D u \end{aligned} $$
其中:
- $ (\bar{x}_o, A_o, C_o) $ 维数为 $ q $,是完全能观子系统
- $ (\bar{x}_{\bar{o}}, A_{\bar{o}}) $ 维数为 $ n-q $,是不能观子系统
- $ A_{\bar{o}} $ 的特征值称为不能观模态
3.2.2 能观性的物理意义
- 状态估计:系统完全能观是设计状态观测器(如龙伯格观测器)的必要条件。
- 故障检测:能观性决定了系统内部状态是否可以通过输出监测。
- 系统辨识:不能观的部分无法通过输入输出数据识别。
3.3 能控性与能观性的关系
3.3.1 对偶原理
能控性和能观性是对偶的概念:
- 系统 $ (A, B, C) $ 的能控性等价于其对偶系统 $ (A^T, C^T, B^T) $ 的能观性。
- 系统 $ (A, B, C) $ 的能观性等价于其对偶系统 $ (A^T, C^T, B^T) $ 的能控性。
这一原理使得能控性和能观性的分析可以相互转化,简化了理论推导。
3.3.2 卡尔曼分解(标准结构分解)
同时考虑能控性和能观性,可以将系统分解为四个部分:
设变换后系统为:
$$\begin{aligned} \begin{bmatrix} \dot{x}_1 \\ \dot{x}_2 \\ \dot{x}_3 \\ \dot{x}_4 \end{bmatrix} &= \begin{bmatrix} A_{11} & A_{12} & A_{13} & A_{14} \\ 0 & A_{22} & 0 & A_{24} \\ 0 & 0 & A_{33} & A_{34} \\ 0 & 0 & 0 & A_{44} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \\ x_4 \end{bmatrix} + \begin{bmatrix} B_1 \\ B_2 \\ 0 \\ 0 \end{bmatrix} u \\ y &= \begin{bmatrix} C_1 & 0 & C_3 & 0 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \\ x_4 \end{bmatrix} + D u \end{aligned} $$
四个子系统:
- $ \Sigma_1 (x_1) $:能控且能观
- $ \Sigma_2 (x_2) $:能控但不能观
- $ \Sigma_3 (x_3) $:不能控但能观
- $ \Sigma_4 (x_4) $:不能控且不能观
3.3.3 传递函数与能控能观性的关系
重要结论:
- 系统的传递函数 $ G(s) = C(sI - A)^{-1}B + D $ 只反映能控且能观部分 $ \Sigma_1 $ 的动态特性。
- 不能控或不能观的模态在传递函数中会被消去(零极点对消)。
- 最小实现的维数 = 能控且能观部分的维数。
例子:考虑系统:
$$A = \begin{bmatrix} -1 & 0 \\ 0 & -2 \end{bmatrix}, \quad B = \begin{bmatrix} 1 \\ 0 \end{bmatrix}, \quad C = \begin{bmatrix} 1 & 0 \end{bmatrix} $$
- 模态 $ \lambda = -1 $:能控且能观
- 模态 $ \lambda = -2 $:不能控(因为 $ B $ 第二行为0)
- 传递函数:$ G(s) = \frac{1}{s+1} $,不包含 $ \lambda = -2 $ 的模态
3.3.4 能控能观性格拉姆矩阵
对于稳定系统($ A $ 渐近稳定),定义:
- 能控性格拉姆矩阵:$ P = \int_0^\infty e^{At}BB^Te^{A^Tt}dt $,满足李雅普诺夫方程:
$$AP + PA^T + BB^T = 0 $$
- 能观性格拉姆矩阵:$ Q = \int_0^\infty e^{A^Tt}C^TCe^{At}dt $,满足李雅普诺夫方程:
$$A^TQ + QA + C^TC = 0 $$
平衡实现:通过相似变换使 $ P = Q = \Sigma = \text{diag}(\sigma_1, \dots, \sigma_n) $,其中 $ \sigma_1 \ge \sigma_2 \ge \dots \ge \sigma_n > 0 $ 称为汉克尔奇异值,反映了每个模态对输入输出行为的贡献。
3.4 能控能观性在实际系统中的应用
3.4.1 状态反馈控制
对于系统 $ \dot{x} = Ax + Bu $,采用状态反馈 $ u = -Kx + r $,则闭环系统为:
$$\dot{x} = (A - BK)x + Br $$
- 如果系统完全能控,则可以通过选择 $ K $ 任意配置闭环极点。
- 如果系统不完全能控,只能配置能控部分的极点,不能控部分的极点保持不变。
3.4.2 状态观测器设计
对于系统 $ \dot{x} = Ax + Bu $,$ y = Cx $,设计观测器:
$$\dot{\hat{x}} = A\hat{x} + Bu + L(y - C\hat{x}) $$
估计误差 $ e = x - \hat{x} $ 满足:
$$\dot{e} = (A - LC)e $$
- 如果系统完全能观,则可以通过选择 $ L $ 任意配置观测器极点。
- 如果系统不完全能观,只能配置能观部分的极点,不能观部分的误差动态不可改变。
3.4.3 分离原理
对于输出反馈控制 $ u = -K\hat{x} + r $,其中 $ \hat{x} $ 是观测器估计的状态,闭环系统的特征值由两部分组成:
- 状态反馈部分的特征值:$ \lambda_i(A - BK) $
- 观测器部分的特征值:$ \lambda_i(A - LC) $
两部分可以独立设计,这就是分离原理。
3.4.4 最小能量控制
对于能控系统,从 $ x(0) = 0 $ 到 $ x(T) = x_f $ 的最小能量控制为:
$$u^*(t) = B^T e^{A^T(T-t)} W_c(T)^{-1} x_f $$
其中 $ W_c(T) $ 是能控性格拉姆矩阵。所需最小能量为:
$$E_{\min} = x_f^T W_c(T)^{-1} x_f $$
3.4.5 模型降阶
基于能控能观性格拉姆矩阵的平衡实现,可以:
- 计算汉克尔奇异值 $ \sigma_i $
- 忽略 $ \sigma_i $ 很小的模态(对应既难控又难观的模态)
- 得到降阶模型,保留主要的输入输出特性
3.5 小结
能控性和能观性是现代控制理论的两个核心概念:
- 能控性关注输入对状态的影响能力,是状态反馈控制的基础。
- 能观性关注输出反映状态信息的能力,是状态估计的基础。
- 两者共同决定了系统的最小实现和内部结构。
- 在实际系统分析和设计中,必须同时考虑能控性和能观性:
- 设计控制器前检查能控性
- 设计观测器前检查能观性
- 理解系统的零极点对消现象
- 进行模型降阶时考虑汉克尔奇异值
这些概念不仅在线性系统理论中重要,也是非线性系统、时变系统、分布参数系统等更一般系统理论的基础。
4. 系统的稳定性
稳定性是控制系统最重要的特性之一,描述了系统在受到扰动后能否恢复或保持在期望状态的能力。
4.1 稳定性概念与分类
4.1.1 基本概念与平衡点
平衡点定义:对于系统 $ \dot{x} = f(x, t) $,若存在状态 $ x_e $ 使得 $ f(x_e, t) = 0 $ 对所有 $ t \geq t_0 $ 成立,则 $ x_e $ 称为系统的平衡点。线性系统 $ \dot{x} = Ax $ 的原点 $ x=0 $ 总是平衡点;若 $ A $ 非奇异,则原点是唯一平衡点;若 $ A $ 奇异,则存在无穷多个平衡点。
4.1.2 李雅普诺夫稳定性分类
-
稳定(李雅普诺夫稳定):从平衡点附近出发的轨迹始终保持在平衡点附近。形式化定义:对于任意 $ \epsilon > 0 $,存在 $ \delta(\epsilon, t_0) > 0 $,使得 $ \|x(t_0)\| < \delta $ 意味着 $ \|x(t)\| < \epsilon $ 对所有 $ t \geq t_0 $ 成立。
-
渐近稳定:系统稳定,且轨迹随时间趋向于平衡点,即 $ \lim_{t \to \infty} x(t) = 0 $。
-
指数稳定:以指数速率收敛到平衡点。存在常数 $ \alpha > 0 $, $ \beta > 0 $, $ \delta > 0 $,使得 $ \|x(t_0)\| < \delta $ 意味着 $ \|x(t)\| \leq \alpha \|x(t_0)\| e^{-\beta(t-t_0)} $ 对所有 $ t \geq t_0 $ 成立。
-
全局渐近稳定:在整个状态空间 $ \mathbb{R}^n $ 上都是渐近稳定的。
-
一致稳定:稳定性与初始时间 $ t_0 $ 无关,即 $ \delta $ 只依赖于 $ \epsilon $ 而不依赖于 $ t_0 $。
-
不稳定:存在某个 $ \epsilon > 0 $,无论 $ \delta $ 多小,总存在初始状态满足 $ \|x(t_0)\| < \delta $,但在某个时刻 $ t \geq t_0 $ 有 $ \|x(t)\| \geq \epsilon $。
4.1.3 BIBO稳定性与内部稳定性
BIBO稳定性:有界输入产生有界输出的能力。对于线性时不变系统,连续系统要求脉冲响应 $ g(t) $ 绝对可积($ \int_0^\infty |g(t)| dt < \infty $),离散系统要求脉冲响应 $ g[k] $ 绝对可和($ \sum_{k=0}^\infty |g[k]| < \infty $)。
内部稳定性:状态本身有界且收敛,比BIBO稳定性更强。对于最小实现系统,两者等价。
$ L_p $ 稳定性:更一般的输入输出稳定性概念。系统 $ y = G(u) $ 是 $ L_p $ 稳定的,如果存在常数 $ \gamma, \beta $ 使得 $ \|y\|_p \leq \gamma \|u\|_p + \beta $。特别地,$ L_2 $ 稳定性对应有限能量增益,$ L_\infty $ 稳定性对应BIBO稳定。
4.2 线性系统稳定性判据
4.2.1 特征值判据(最直接)
连续系统 $ \dot{x} = Ax $:
- 渐近稳定:$ A $ 的所有特征值实部 $ \text{Re}(\lambda_i) < 0 $(左半开复平面)
- 临界稳定(稳定但不渐近稳定):所有特征值实部 $ \leq 0 $,且零实部特征值对应的若尔当块为1×1(代数重数 = 几何重数)
- 不稳定:存在实部 > 0 的特征值,或零实部特征值对应若尔当块 > 1×1
离散系统 $ x[k+1] = A_d x[k] $:
- 渐近稳定:所有特征值模 $ |\lambda_i| < 1 $(单位圆内)
- 临界稳定:所有特征值模 $ \leq 1 $,且单位圆上特征值对应若尔当块为1×1
- 不稳定:存在模 > 1 的特征值,或单位圆上特征值对应若尔当块 > 1×1
特征值与系统响应的关系:
特征值 $ \lambda = \sigma \pm j\omega $ 对应的模态中,实部 $ \sigma $ 决定收敛/发散速度,虚部 $ \omega $ 决定振荡频率。时域响应类型包括:过阻尼(两个负实特征值)、欠阻尼(共轭复特征值,负实部)、临界阻尼(重实特征值,负实部)、无阻尼振荡(纯虚特征值)、不稳定振荡(正实部的共轭复特征值)。
4.2.2 传递函数极点判据(频域法)
连续系统 $ G(s) $:渐近稳定 ⇔ 所有极点实部 < 0。与BIBO稳定性关系:极点左半面 ⇔ 脉冲响应绝对可积 ⇔ BIBO稳定。
离散系统 $ G(z) $:渐近稳定 ⇔ 所有极点模 < 1。与BIBO稳定性关系:极点单位圆内 ⇔ 脉冲响应绝对可和 ⇔ BIBO稳定。
与特征值判据关系:对于最小实现系统,特征值 = 极点。
4.2.3 奈奎斯特判据(几何频域法)
适用于线性系统(含延迟系统):开环传递函数 $ L(s) $ 的奈奎斯特曲线逆时针包围 (-1, j0) 点的圈数 = 开环右半平面极点数。
工程应用:
- 提供稳定裕度:增益裕度(相位穿越频率处幅值到0dB的距离)、相位裕度(增益穿越频率处相位到-180°的距离)
- 处理非有理系统(含 $ e^{-s\tau} $)
- 适合实验测量与分析
小增益定理:考虑两个稳定系统 $ H_1 $ 和 $ H_2 $ 的反馈连接,如果 $ \|H_1\| \cdot \|H_2\| < 1 $(其中 $ \|\cdot\| $ 表示系统增益,如 $ H_\infty $ 范数),则闭环系统稳定。
4.2.4 根轨迹法
开环增益 $ K $ 从0变化到∞时,闭环极点在复平面上的轨迹。稳定性分析:根轨迹在右半平面时对应闭环系统不稳定;根轨迹与虚轴的交点对应临界稳定。
4.3 李雅普诺夫直接法(最通用)
4.3.1 基本思想与李雅普诺夫函数
核心思想:构造"能量"函数 $ V(x) > 0 $($ x \neq 0 $),通过其变化趋势 $ \dot{V}(x) $ 判断稳定性。李雅普诺夫函数 $ V(x) $ 是标量函数,满足正定性($ V(0) = 0 $ 且 $ V(x) > 0 $ 对所有 $ x \neq 0 $)和径向无界性(全局分析时需要:$ \|x\| \to \infty \Rightarrow V(x) \to \infty $)。
4.3.2 稳定性定理
- 稳定:存在正定函数 $ V(x) $ 使 $ \dot{V}(x) \leq 0 $(半负定)
- 渐近稳定:存在正定函数 $ V(x) $ 使 $ \dot{V}(x) < 0 $(负定)对所有 $ x \neq 0 $
- 全局渐近稳定:渐近稳定 + $ V(x) $ 径向无界
- 不稳定:存在函数 $ V(x) $ 使 $ \dot{V}(x) $ 正定,且 $ V(x) $ 在原点的任意邻域内可取正值
拉萨尔不变性原理(扩展):对于自治系统 $ \dot{x} = f(x) $,如果存在连续可微函数 $ V(x) $ 使得在某个区域 $ \Omega $ 内 $ \dot{V}(x) \leq 0 $,令 $ E = \{x \in \Omega \mid \dot{V}(x) = 0\} $,$ M $ 是 $ E $ 内的最大不变集,则所有从 $ \Omega $ 内出发的轨迹当 $ t \to \infty $ 时都趋向于 $ M $。用于分析极限环、稳态工作点等。
4.3.3 线性系统的李雅普诺夫方法
对于 $ \dot{x} = Ax $,选择二次型函数 $ V(x) = x^T P x $,$ P = P^T > 0 $。导数:$ \dot{V}(x) = x^T (A^T P + P A) x $。
判据:系统渐近稳定 ⇔ 对任意 $ Q = Q^T > 0 $,李雅普诺夫方程 $ A^T P + P A = -Q $ 有唯一正定解 $ P > 0 $。
离散系统:对于 $ x[k+1] = A_d x[k] $,李雅普诺夫函数 $ V(x) = x^T P x $($ P > 0 $),差分 $ \Delta V(x[k]) = x[k]^T (A_d^T P A_d - P) x[k] $。稳定性条件:存在 $ P > 0 $ 使得 $ A_d^T P A_d - P = -Q < 0 $。
4.3.4 李雅普诺夫函数的构造方法
- 线性系统:二次型 $ V(x) = x^T P x $,通过求解李雅普诺夫方程得到 $ P $
- 非线性系统:
- 能量函数法:对机械系统,使用动能+势能
- 变量梯度法:假设 $ \nabla V $ 的形式,反推 $ V $
- 克拉索夫斯基法:对特定形式的系统
- 构造性方法:基于系统结构特性
4.4 输入输出稳定性
4.4.1 BIBO稳定性与 $ L_p $ 稳定性
如4.1.3节所述,BIBO稳定性关注有界输入产生有界输出的能力。$ L_p $ 稳定性提供更一般的框架,特别是 $ L_2 $ 稳定性(有限能量增益)和 $ L_\infty $ 稳定性(有界输入有界输出)在鲁棒控制中尤为重要。
4.4.2 输入到状态稳定性(ISS)
非线性系统 $ \dot{x} = f(x, u) $ 的ISS性质:存在 $ \beta \in \mathcal{KL} $ 和 $ \gamma \in \mathcal{K}_\infty $ 使得 $ \|x(t)\| \leq \beta(\|x(0)\|, t) + \gamma(\sup_{\tau \in [0,t]} \|u(\tau)\|) $。即状态由初始状态和输入共同决定,且当输入有界时,状态有界。
ISS李雅普诺夫函数:存在函数 $ V(x) $ 和 $ \alpha_1, \alpha_2, \alpha_3, \sigma \in \mathcal{K}_\infty $ 使得 $ \alpha_1(\|x\|) \leq V(x) \leq \alpha_2(\|x\|) $ 且 $ \frac{\partial V}{\partial x} f(x, u) \leq -\alpha_3(\|x\|) + \sigma(\|u\|) $。
4.5 频域稳定性判据与伯德图分析
4.5.1 奈奎斯特判据与稳定裕度
如4.2.3节所述,奈奎斯特判据提供几何频域稳定性判断。稳定裕度是重要的工程指标:
- 相位裕度:通常取30°60°(45°为典型值),对应阻尼比0.40.8,超调量1.5%~25%
- 增益裕度:通常要求 > 6 dB
4.5.2 伯德图稳定性分析
从伯德图判断稳定性:
- 低频段:反映系统类型和稳态误差
- 中频段:决定动态响应(穿越频率、相位裕度)
- 高频段:反映抗高频噪声能力
4.6 鲁棒稳定性
4.6.1 模型不确定性类型
- 参数不确定性:参数在某个区间内变化
- 未建模动态:高频动态、非线性等未包含在模型中
- 结构不确定性:模型结构不精确
4.6.2 鲁棒稳定性分析方法
- 区间系统稳定性:系统参数在区间内变化,判断所有可能参数组合下的稳定性
- $ H_\infty $ 鲁棒稳定性:考虑加性不确定性 $ G(s) = G_0(s) + \Delta(s) $,$ \|\Delta(j\omega)\| < |W(j\omega)| \ \forall \omega $。鲁棒稳定的条件是 $ \|W(s) T(s)\|_\infty < 1 $,其中 $ T(s) = G_0(s)(1 + G_0(s)K(s))^{-1} $ 是补灵敏度函数
- μ分析:处理结构不确定性 $ \Delta = \text{diag}(\Delta_1, \dots, \Delta_k) $。鲁棒稳定的条件是 $ \mu_\Delta(M(j\omega)) < 1 \ \forall \omega $,其中 $ M $ 是互联矩阵,$ \mu $ 是结构奇异值
- 鲁棒李雅普诺夫方法:对于不确定系统 $ \dot{x} = A(\delta)x $,寻找公共李雅普诺夫函数 $ V(x) = x^T P x $ 使得 $ A^T(\delta) P + P A(\delta) < 0 \ \forall \delta \in \Delta $,通常转化为线性矩阵不等式(LMI)问题
4.7 非线性系统稳定性
4.7.1 局部线性化方法
对于非线性系统 $ \dot{x} = f(x) $,在平衡点 $ x_e $ 处线性化:$ A = \left. \frac{\partial f}{\partial x} \right|_{x=x_e} $
定理:
- 如果 $ A $ 的所有特征值实部 < 0,则原非线性系统局部渐近稳定
- 如果 $ A $ 有至少一个特征值实部 > 0,则原系统不稳定
- 如果 $ A $ 有特征值实部 = 0,其他特征值实部 < 0,则线性化方法无法判定(需用其他方法)
4.7.2 不变集定理与极限环分析
如4.3.2节所述,拉萨尔不变性原理用于分析极限环、稳态工作点等。极限环是非线性系统中的孤立周期解,产生原因包括非线性特性(饱和、死区、滞环等)、量化效应(数字控制系统)、参数变化等。分析方法包括描述函数法(频域)、相平面法(二阶系统)、庞加莱映射等。
4.8 时变系统稳定性
4.8.1 时变线性系统
考虑 $ \dot{x} = A(t)x $,特征值方法不再适用。
稳定性判据:
- 慢变系统:如果 $ A(t) $ 变化足够慢,且每个冻结时刻的系统都稳定,则原系统可能稳定
- 周期系统:$ A(t+T) = A(t) $,使用弗洛凯理论分析
- 李雅普诺夫方法:寻找时变李雅普诺夫函数 $ V(x, t) $
4.8.2 一致渐近稳定性
对于时变系统,渐近稳定性可能依赖于初始时间 $ t_0 $。一致渐近稳定性要求收敛速率与 $ t_0 $ 无关。
定理:如果存在函数 $ V(x, t) $ 和 $ \alpha_1, \alpha_2, \alpha_3 \in \mathcal{K}_\infty $ 使得 $ \alpha_1(\|x\|) \leq V(x, t) \leq \alpha_2(\|x\|) $ 且 $ \dot{V}(x, t) \leq -\alpha_3(\|x\|) $,则系统全局一致渐近稳定。
4.9 离散时间系统稳定性
4.9.1 离散时间稳定性判据补充
除特征值判据($ |\lambda_i(A_d)| < 1 $)外,还有:
- 舒尔-科恩判据:特征多项式的系数满足特定条件
- 朱利判据:通过朱利表判断所有根在单位圆内
- 李雅普诺夫判据:存在 $ P > 0 $ 满足 $ A_d^T P A_d - P < 0 $
4.9.2 采样对稳定性的影响
连续系统稳定 ⇏ 离散化后稳定,原因包括:
- 采样频率过低:不满足香农采样定理
- 病态采样:连续系统有复极点 $ \sigma \pm j\omega $,且 $ \omega T_s = k\pi $
- 保持器相位滞后:特别是ZOH引入的近似 $ T_s/2 $ 延迟
4.9.3 提升技术
对于多速率系统,通过提升技术得到单速率系统:提升状态 $ \bar{x}[k] = [x^T[k], x^T[k+1], \dots, x^T[k+N-1]]^T $,得到提升系统 $ \bar{x}[k+1] = \bar{A} \bar{x}[k] + \bar{B} \bar{u}[k] $,分析提升系统的稳定性。
4.10 特殊稳定性问题
4.10.1 时滞系统稳定性
含时滞系统:$ \dot{x}(t) = A_0 x(t) + A_1 x(t-\tau) + B u(t) $
分析方法:
- 频域法:特征方程含 $ e^{-\tau s} $
- 李雅普诺夫-克拉索夫斯基泛函:$ V(x_t) = x^T(t) P x(t) + \int_{t-\tau}^t x^T(\theta) Q x(\theta) d\theta $
- LMI方法:转化为线性矩阵不等式
4.10.2 切换系统稳定性
系统在多个子系统间切换:$ \dot{x} = A_{\sigma(t)} x $,$ \sigma(t) \in \{1, 2, \dots, m\} $
判据:
- 存在公共李雅普诺夫函数 $ V(x) = x^T P x $ 使 $ A_i^T P + P A_i < 0 $ 对所有 $ i $
- 平均驻留时间条件(各子系统稳定且切换足够慢)
4.11 实际应用中的稳定性问题
4.11.1 稳定性与性能折衷
-
稳定性裕度 vs 响应速度:
- 高增益:响应快但稳定裕度小,易振荡
- 低增益:稳定裕度大但响应慢,跟踪差
-
鲁棒性 vs 性能:
- 鲁棒控制器:保守,对模型误差不敏感,但性能可能较差
- 高性能控制器:对模型精确性要求高,鲁棒性差
- 现代方法:$ H_\infty $ 控制、$ \mu $ 分析、LQR/LQG
经验准则:
- 相位裕度:30°~60°(通常取45°)
- 增益裕度:> 6 dB
- 阻尼比:0.40.8(对应超调量1.5%25%)
4.11.2 参数变化与自适应控制
当系统参数变化时:
- 固定控制器:可能导致不稳定,如果参数变化超出设计范围
- 增益调度:根据工作点调整控制器参数
- 自适应控制:在线估计参数并调整控制器
4.11.3 实际工程应用流程
1 | 建模 → 线性化 → 特征值分析 → 频域验证 → 非线性验证 → 实现 |
示例:飞机姿态控制系统:
- 建立非线性模型:$ \dot{\theta} = \omega $, $ \dot{\omega} = f(\theta, \omega, \delta) $
- 工作点线性化:得到 $ A, B, C, D $
- 特征值分析:检查 $ \text{Re}(\lambda_i) < 0 $?
- 奈奎斯特分析:评估相位裕度 > 45°?
- 李雅普诺夫验证:构造 $ V = \theta^2 + \omega^2 $ 检查 $ \dot{V} < 0 $
- 数字实现:ZOH离散化,检查离散稳定性
4.12 各种判据的比较与选择
4.12.1 方法比较
| 方法 | 适用系统 | 主要优点 | 主要缺点 | 与BIBO稳定性关系 |
|---|---|---|---|---|
| 特征值/极点 | LTI系统 | 直接简单,物理明确 | 仅限LTI,大规模难 | 左半面极点⇔绝对可积 |
| 奈奎斯特 | 线性系统 | 处理延迟,提供裕度 | 需频率响应,复杂 | 保证闭环BIBO稳定 |
| 根轨迹 | LTI系统 | 可视化参数影响 | 仅限单参数,高阶复杂 | 显示闭环极点变化 |
| 李雅普诺夫 | 所有系统 | 最通用,理论严格 | 构造困难,可能保守 | 存在V函数⇒状态收敛 |
| $ H_\infty $/μ分析 | 不确定系统 | 处理鲁棒性 | 计算复杂,保守 | 保证鲁棒BIBO稳定 |
4.12.2 选择指南
-
初步分析(LTI系统):
- 优先使用特征值/极点判据
- 快速判断稳定性
-
频域设计与鲁棒性:
- 使用奈奎斯特判据评估稳定裕度
- 使用根轨迹法设计控制器参数
- 使用$ H_\infty $/μ分析处理不确定性
-
非线性/时变系统:
- 必须使用李雅普诺夫方法
- 设计控制器(反步法、滑模控制)
- 分析吸引域
-
严格证明与高级设计:
- 李雅普诺夫方法
- LMI(线性矩阵不等式)框架
- 鲁棒控制设计
4.13 小结
稳定性分析是控制系统的核心:
-
概念层次:
- BIBO稳定性(输入输出观点)
- 内部稳定性(状态空间观点)
- 李雅普诺夫稳定性(能量观点)
- ISS稳定性(输入到状态观点)
-
方法演进:
1
2
3
4
5
6
7
8
9绝对可积/可和(基础定义)
↓
极点/特征值判据(LTI系统核心)
↓
奈奎斯特/根轨迹(工程频域方法)
↓
李雅普诺夫方法(通用理论框架)
↓
LMI/鲁棒方法(现代高级工具) -
工程实践原则:
- 线性系统先用特征值/极点法快速判断
- 重要系统用多种方法交叉验证
- 非线性系统必须用李雅普诺夫方法
- 设计阶段将稳定性要求转化为约束
-
现代发展:
- 从稳定性判断 → 稳定性保证设计
- 从单一模型 → 不确定系统鲁棒稳定
- 从连续分析 → 数字实现考虑(量化、延迟、采样)
- 从集中式分析 → 网络化系统分布式稳定性
稳定性不仅是系统能否工作的判据,更是控制器设计的基础。理解各种方法的联系与区别,能够根据具体问题选择合适的方法,设计出既稳定又性能优良的控制系统。
5. 系统实现与规范型
5.1 系统实现的基本概念
5.1.1 什么是系统实现?
定义:给定一个传递函数矩阵 $ G(s) $(或脉冲响应序列),找到一个状态空间模型 $ (A, B, C, D) $,使得:
$$G(s) = C(sI - A)^{-1}B + D $$
这个过程称为实现问题。
5.1.2 实现的性质
- 维数(阶数):实现的维数 $ n $ 称为实现的维数或实现的阶数。
- 最小实现:所有实现中维数最小的称为最小实现。
- 最小实现与可控可观性:
- 一个实现是最小实现 当且仅当 它既是可控的又是可观的。
- 最小实现的维数等于传递函数 $ G(s) $ 的麦克米兰阶数(极点总数,计重数)。
- 非最小实现:如果实现不可控或不可观,则存在零极点对消,实现的维数大于麦克米兰阶数。
5.1.3 实现的不唯一性
同一个传递函数可以有无穷多个状态空间实现。不同的实现之间通过相似变换相关联:
$$\begin{aligned} \bar{A} &= T^{-1} A T \\ \bar{B} &= T^{-1} B \\ \bar{C} &= C T \\ \bar{D} &= D \end{aligned} $$
其中 $ T $ 是任意可逆矩阵。相似变换保持:
- 传递函数不变
- 特征值不变
- 可控性和可观性不变
5.2 单输入单输出(SISO)系统的规范型
5.2.1 可控标准型(控制器标准型)
考虑传递函数:
$$G(s) = \frac{b_{n-1}s^{n-1} + b_{n-2}s^{n-2} + \cdots + b_1s + b_0}{s^n + a_{n-1}s^{n-1} + \cdots + a_1s + a_0} $$
可控标准型为:
$$A_c = \begin{bmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ -a_0 & -a_1 & -a_2 & \cdots & -a_{n-1} \end{bmatrix}, \quad B_c = \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 0 \\ 1 \end{bmatrix} $$
$$C_c = \begin{bmatrix} b_0 & b_1 & \cdots & b_{n-1} \end{bmatrix}, \quad D_c = 0 $$
特点:
- 可控性矩阵为单位下三角阵,显然满秩 → 保证可控
- 最后一行为分母系数(负值)
- $ C $ 矩阵包含分子系数
5.2.2 可观标准型(观测器标准型)
可观标准型是可控标准型的对偶形式:
$$A_o = \begin{bmatrix} 0 & 0 & \cdots & 0 & -a_0 \\ 1 & 0 & \cdots & 0 & -a_1 \\ 0 & 1 & \cdots & 0 & -a_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & \cdots & 1 & -a_{n-1} \end{bmatrix}, \quad B_o = \begin{bmatrix} b_0 \\ b_1 \\ b_2 \\ \vdots \\ b_{n-1} \end{bmatrix} $$
$$C_o = \begin{bmatrix} 0 & 0 & \cdots & 0 & 1 \end{bmatrix}, \quad D_o = 0 $$
特点:
- 可观性矩阵为单位下三角阵,显然满秩 → 保证可观
- 最后一列为分母系数(负值)
- $ B $ 矩阵包含分子系数
5.2.3 对角标准型(模态标准型)
当传递函数具有互异极点 $ p_1, p_2, \dots, p_n $ 时:
$$G(s) = \frac{k_1}{s-p_1} + \frac{k_2}{s-p_2} + \cdots + \frac{k_n}{s-p_n} $$
对角标准型为:
$$A_d = \begin{bmatrix} p_1 & 0 & \cdots & 0 \\ 0 & p_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & p_n \end{bmatrix}, \quad B_d = \begin{bmatrix} 1 \\ 1 \\ \vdots \\ 1 \end{bmatrix} $$
$$C_d = \begin{bmatrix} k_1 & k_2 & \cdots & k_n \end{bmatrix}, \quad D_d = 0 $$
特点:
- $ A $ 矩阵为对角阵,对角线元素为系统极点
- 每个状态变量对应一个模态(自然模式)
- 可控可观性检查:如果某个 $ k_i = 0 $,则该模态不可观;如果 $ B $ 的某行为0,则该模态不可控
5.2.4 约当标准型
当系统有重极点时,使用约当标准型。设 $ p $ 为 $ r $ 重极点:
$$A_j = \begin{bmatrix} p & 1 & 0 & \cdots & 0 \\ 0 & p & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & p \end{bmatrix} \quad (\text{约当块}, r \times r) $$
整个系统由多个约当块组成。
5.3 多输入多输出(MIMO)系统的规范型
5.3.1 可控性分解
对于不完全可控的系统,可以通过相似变换将其分解为可控和不可控两部分:
$$\bar{A} = T^{-1}AT = \begin{bmatrix} A_{c} & A_{12} \\ 0 & A_{\bar{c}} \end{bmatrix}, \quad \bar{B} = T^{-1}B = \begin{bmatrix} B_{c} \\ 0 \end{bmatrix} $$
$$\bar{C} = CT = \begin{bmatrix} C_c & C_{\bar{c}} \end{bmatrix} $$
其中:
- $ (A_c, B_c) $ 可控
- $ A_{\bar{c}} $ 的特征值为不可控模态
5.3.2 可观性分解
类似地,对于不完全可观的系统:
$$\bar{A} = \begin{bmatrix} A_o & 0 \\ A_{21} & A_{\bar{o}} \end{bmatrix}, \quad \bar{B} = \begin{bmatrix} B_o \\ B_{\bar{o}} \end{bmatrix} $$
$$\bar{C} = \begin{bmatrix} C_o & 0 \end{bmatrix} $$
其中:
- $ (A_o, C_o) $ 可观
- $ A_{\bar{o}} $ 的特征值为不可观模态
5.3.3 卡尔曼分解(标准结构分解)
同时考虑可控性和可观性,可将系统分解为四个部分:
$$\bar{A} = \begin{bmatrix} A_{co} & A_{12} & A_{13} & A_{14} \\ 0 & A_{c\bar{o}} & A_{23} & A_{24} \\ 0 & 0 & A_{\bar{c}o} & A_{34} \\ 0 & 0 & 0 & A_{\bar{c}\bar{o}} \end{bmatrix}, \quad \bar{B} = \begin{bmatrix} B_{co} \\ B_{c\bar{o}} \\ 0 \\ 0 \end{bmatrix} $$
$$\bar{C} = \begin{bmatrix} C_{co} & 0 & C_{\bar{c}o} & 0 \end{bmatrix} $$
四个子系统:
- $ \Sigma_{co} $:可控且可观
- $ \Sigma_{c\bar{o}} $:可控但不可观
- $ \Sigma_{\bar{c}o} $:不可控但可观
- $ \Sigma_{\bar{c}\bar{o}} $:不可控且不可观
重要结论:系统的传递函数只反映可控且可观部分 $ \Sigma_{co} $ 的动态特性。
5.4 最小实现算法
5.4.1 汉克尔矩阵法(脉冲响应实现)
对脉冲响应序列 $ h_0, h_1, h_2, \dots $,构造汉克尔矩阵:
$$H_{r,s} = \begin{bmatrix} h_1 & h_2 & \cdots & h_s \\ h_2 & h_3 & \cdots & h_{s+1} \\ \vdots & \vdots & & \vdots \\ h_r & h_{r+1} & \cdots & h_{r+s-1} \end{bmatrix} $$
取足够大的 $ r, s $ 使得 $ \text{rank}(H_{r,s}) = n $,然后通过奇异值分解等方法得到最小实现。
5.4.2 传递函数到状态空间的转换方法
- 部分分式展开法:适合单极点情况,直接得到对角标准型
- 可控/可观标准型法:直接按公式构造
- 平衡实现法:通过平衡变换,使可控性和可观性格拉姆矩阵相等且为对角阵
5.5 规范型的应用
5.5.1 控制器设计
- 可控标准型:便于极点配置,因为特征多项式系数直接出现在 $ A $ 矩阵的最后一行
- 对角标准型:便于模态分析,每个状态对应一个自然模式
5.5.2 观测器设计
- 可观标准型:便于观测器设计,因为输出方程简单
- 龙伯格观测器通常基于可观标准型设计
5.5.3 模型降阶
对于高阶系统,可以:
- 找到最小实现,去除不可控/不可观部分
- 对可控可观部分进行平衡截断,保留主要模态
- 得到降阶模型,保持主要输入输出特性
5.5.4 系统辨识
从实验数据得到系统模型时,规范型提供了参数化的模型结构,减少了待估参数的数量。
5.6 小结
- 系统实现将传递函数转换为状态空间模型,实现不唯一
- 最小实现对应可控且可观的实现,维数最小
- 规范型提供标准的结构形式,便于分析和设计
- 常见规范型:可控标准型、可观标准型、对角标准型、约当标准型
- 卡尔曼分解揭示了系统内部结构,解释了为什么传递函数只反映系统的一部分特性
- 规范型在控制器设计、观测器设计、模型降阶等方面有重要应用
规范型是现代控制理论中的重要工具,它们不仅提供了分析和设计系统的标准方法,还深刻揭示了系统的内在结构特性。
说些什么吧!