Double Integrator Plant Control

by allenlu2007

 

Double integrator plant 在很多 mechanics 和 electronics 應用中可以看到。例如 low friction 2nd order mechanics plant (not damped system); 或是 phase lock loop or uncompensated opamp in electronics.

Double integrator 在 open loop 中是 unstable (two poles in origin) in feedback control system.  因些需要適當的 controller 才能達成預期的 control (last time, least energy, minimum error, etc.)

為什麼不討論 Single Integrator Control?

Single integrator 從 mechanics 角度來看可以視為 highly damped plant; or one pole device in electronics.

First, one pole device in feedback control system 基本上是 stable.  Secondly, single integrator control system 基本上 follow control (force).  一旦 force 停止或移除,state 也會停止 exponentially stop.  因此 single integrator 的行 為是很容易預測和控制。

One pole control system 也是常見於 control system, 特別是用於 mechanics 不可以有 overshoot 的控制。例如工具機 (milling machine) 或日常生活中的 damper or buffer (門或汽車)。

One pole control system (overdamped) 和一般人的直覺比較符合。或是說一般人的大腦比較簡單,習慣或可預測慢慢 damped 的東西或環境 (如汽車的 buffer,電梯開關門)。如果是 bouncing back and force 的東西或環境,大腦可能比較不會預測,需要 training 過後才容易控制 (如籃球)。

One pole control system 雖為容易被大腦接受,最大的問題就是反應慢。想想一些 damped 的門或自動門。或是一些機器人看起來反應很慢。這時就需要改成 double integrator control.   

Double integrator 的控制雖然比較困難(容易有 stability 問題),最大的好處就是反應快。

Double Integrator Plant

We consider the double integrator plant, which is one of the most fundamental systems in control applications, representing single-degree-of-freedom translational and rotational motion. Applications of the double integrator include low-friction, free rigid-body motion, such as single-axis spacecraft rotation [1] and rotary crane motion [2]. Control of the double integrator has been of interest since the early days of control theory when it was used extensively to illustrate minimum-time and minimum-fuel controllers.

以下我們會考慮幾種不同的 controller 並比較 performance 的差異。

 

Problem Statement

NewImage

Given initial conditions of x(t=0) and x'(t=0)  (初始位置和初始速度)  

Controller 的目標是從任何 initial condition steer to origin and park at origin at a finite time. 

 

意即 x(t=tf)=0 and x'(t=ft)=0 


Phase space representation 

NewImage

因此 double integrator 可以用以下的 equation 表示,  x = [x1, x2]’

NewImage

這可以說是 open loop state equation, 假設所有 states (x1 and x2, 位置和速度) 都 fully observable.

在很多現實的情況下,可能只有位置是 observable (例如在 PLL 的 phase detector).  因些我們會加上 output equation.

NewImageand

NewImage

如果是所有 states 都 observables,  C=[1, 0; 0, 1], output y = x.  這和之前假設相同。如果只有位置 observable, C = [1, 0].

所以原來的問題就變成 x(t=tf) = [0, 0] for both position and velocity.

 

Linear Controller Controllability

求解之前,先要確定存在 solution.  先不考慮時間,從 xo 是否能 steering 到 x1, 也稱為 reachability.

換個 notation, let A = M and B = N

NewImage

NewImage

M = A (nxn) and N = B (nxm)

先定義 controllability matrix G:

NewImage

是否只要 reachable 就是 controllable?  直觀上好像是。Wrong!   如果是 exponentially explode 有時也是 reachable, 但終將 fail.  在 control theory 中另外一個非常重要的因素是 stable!

Controllable 的第一步是 G matrix 必須是 reachable (full rank).   第二步是 M matrix 必須是 stable.  

Controllable =  Reachable + Stable

Theorem 2.3 說明了 rank(G) = n 保証了 reachability.   所謂 stability 就是當 α=0 (無外力), 系統在有 small perturbation 時不會 explode (Lyapunov stability) 或是 exponential decay down (exponential stability).  對於 linear dynamic system, 我們用 exponential stability.   

Exponential stability =>  M 的 eigenvalue 的 real part 必須小於 0.

綜合以上所述  controllable = reachable ( rankG=n ) + stable ( Re eig(M) < 0)

NewImage

Reachable (fixed given M and N)

Stable (can be altered by control method)

Reachable ( rankG=n ) 似乎是 plant (given M and N) 天生的特性。同時包含 M and N 的 information.

Stable ( Re eig(M) < 0 ) 似乎只有 M 的 information.  我們可以改變 plant 的 stability 嗎? 答案是肯定的。這正是control theory 的主要工作。如何讓一個 unstable plant 藉由 control method (state/output feedback, or state/output feedforward, etc.) 變成 stable.  但在 linear control system 應該無法讓 unreachable 的 plant 變成 full controllable.

我們用例子來說明:

Example 1 (reachable double integrator model)

NewImage

NewImage

以上的例子說明 Example 1 是:   reachable but NOT stable, 因此也非 controllable.  在沒有外力的狀況下,運動的物體無法停止。

 

如何 save 這個狀況?  如果我們可以把外力一分為二: 一部份變成 state dependent; 另一部份變成 state independent.

NewImage

為什麼 K 用負號? 因為 state dependent 部份最終會用 state (negative) feedback 來達成。外力變成內力。r 這時可以稱為新的外力。或是也稱為 reference.  因為在 steady state 時,  dx/dt = 0.   x 會 track r (if same dimension). 

NewImage

至於 K 是否 always 存在,在此先不討論。原來的 stability ( Re eig(A) < 0) 這時就變成 ( Re eig(A-BK) < 0) 條件因為 controller 的介入而改變。從另外角度想,新的外力 r=0 時,還有內力 ( state negative feedback ) 把 plant 拉回 stable 如下。

 

NewImage

藉由 state negative feedback,  我們把原來的 plant 變成 controllable.

除了 state feedback, 另一方式是 output feedback, 也可以改變 stability 特性。

 

另一個 double integrator example 但非 controllable.   G 的 Rank=1 < 2.  即使經由 state feedback 也無法讓 M 變為 stable.  這個 plant 原來是 unreachable 並且 unstable.  即使用 state feedback, 仍然是 unreachable 並且 unstable.

 

Example 2 (unreachable double integrator model)

NewImage

 

Various Controller 

這裡考慮幾種不同 controller:  linear or nonlinear;  state feedback or output feedback. 參考本文

先定義兩個 nonlinear function for controller: one is saturation function, 另一個是 sign function (bang-bang controller or minimum time controller)

NewImage          NewImage

NewImageNewImage 

基本上所有的 controller 都會被 applied saturation function,  以符合實際的狀況。 

我們分為幾類 controller 來比較。First Linear Time Invariant Controller.

 

Linear Time-Invariant Controllers 

PD controller (proportional-derivative) is given by 

NewImage  (this means it is state feedback!)

如預期,即使包含 saturation function, state negative feedback system 仍然是 globally asymptotically stable for all positive k1 and k2.

也如預期,PD controller 反應慢,有 infinite theoretical settling time (behavior).  Choose k1=1; k2=1.25

 (一般常用的好像是 PI controller 而非 PD controller??  是 output feedback 關係, u = -k1q1 only?  或是比較像是 LQG with OF.  見最後應用部份) ==> 因為是 double integrator system.  如果是 one integrator, 則是 PI controller.

 

另一種 LTI controller 是 linear quadratic gaussian (LQG controller).  By separation principle, LQG 包含 LQE (estimator) and LQR (controller).   基本上 estimator (or filter) 的部份就是 Kalman filter (第一個 LTI filter with output feedback). 再加上 LQR (第二個 LTI filter with estimated state feedback). 

NewImage

最後一句話的意思是 LQG 即使用 full state feedback 仍然和一般的 LQR (with full state feedback) controller 不同。why?  so the separation principle 仍適用?  注意 LQG 可以有 output feedback (OF, only position with noise) or full state feedback (FSF, both position and velocity with noise).

注意雖然 LQG 是 2nd order controller 反應比 PD 快。但仍然有 infinite theoretical settling time.

 

Minimum Time Controller (Bang-Bang controller)

可以參考前文 bang-bang controller.  是 optimal time controller with bounded input.

Bang-bang controller 的 phase plane 是拋物線 (parabola 如下圖); 也可以 follow state feedback law.

NewImage

先比較 PD, LQG (FSF and OF), 和 bang-bang controller 的 phase portraits 如下圖。

NewImage 

stability 最好的是 PD;  反應最快 (finite time) 是 bang-bang controller. 

 

Minimum Energy Controller

NewImage

NewImage 

Saturation Controller

NewImage

另外還有多種 controller: trap door controller; discontinuous sliding mode controller; continuous sliding mode controller; homogeneous controller; direct adaptive controller; universal stabilizing controller.   其實這些我從沒有用過或聽過。

 NewImage

NewImage

 

比較不同 controllers 的反應時間。Minimum time controller 如預期最好。

NewImage 

比較不同 controllers 的 stability. (saturation controller 最優)

NewImage

比較不同 controllers for disturbance rejection. (minimum time 最優)

NewImage

  

應用面來看 double integrator controller

Double integrator controller 的含義是 plant 包含 two integrators (e.g. frictionless mechanics).

配合的 controller 有以上的選擇。另一類問題用包含 double integrator 的 controller 來 track reference (constant, or time varying such as ramp or sinusoidal signal).  主要的原因就是利用 double integrator (i) 反應快 (ii) asymptotical error 趨近 0 的特性。請參考前文1,  2, and 3.

 

A. PLL 是 sampled-data (discrete) system.   PLL 一般包含 PFD, VCO (one integrator), 

with linear phase detector (linear)

PLL with bang-bang phase detector (nonlinear)

PLL with linear phase detector 的 digital controller 基本上是 Kalman filter (見前文). 

因此是 output (phase only for normal PFD) feedback  or state feedback (separate phase and frequency detector) 的 LQG controller (用 estimated 的 phase and frequency 來做 LQR control)?  To be derived.

 

Sampled double integrator controller 

Double integrator 的 controller 有兩種型式:continuous (如上述) 和 sampled-data (or discrete-time) controller.

Sampled-data 常用於 digital controller or discrete time system (e.g. PLL).   Sampled-data 的 controller 之後再討論。

 NewImage

 

2. minimal fuel (energy) controller (?)

4. PD (with bound or no bound) (no bound is ok because the controller type is given without infinite).  Therefore PD is not minimal time controller.

5. Saturation controller (combined PD and bang-bang?)

 

Duality

overshoot and frequency peaking are dual problem for 2nd order system?

 

Advertisements