Linear algebra and linear system - Controllability
이번장에서는 controllable에 대한 판별과 controllable하다면 그 입력은 무엇인가 에 대해 배우게 됩니다.
Definition of Controllability
지금까지 선형시스템은 다음과 같이 주어졌습니다.
$\dot x = A(t)x+B(t)u$
$y=C(t)x+D(t)u$
하지만 controllability를 공부함에 있어서 출력 y 없이 생각해 보겠습니다.
controllability는 $R^n$ 공간에서 임의의 초기값 $x(t_0)$ 가 임의의 $x(t_1) 까지 가겠느냐에 대한 질문 입니다.
controllable하다는 것은 어떤 initial point, 어떤 final point, 어떤 시간 을 정하던 적절한 continuous한 입력이 존재한다를 의미합니다.
Controllability
출력을 생각하지 않으므로 시스템에서는 A,B행렬이 중요합니다.
system이 controllability하다는 것은 pair A,B가 controllaility합니다.
$\dbinom{\dot x_1}{\dot x_2} = \begin{pmatrix}
0 & 1
0 & 1
\end{pmatrix} \dbinom{ x_1}{ x_2} + \begin{pmatrix}
1 & -1
0 & 0
\end{pmatrix} \dbinom{ u_1}{ u_2}$
예를 들어
$\dot x_1 = x_2 + u_1 - u_2$
$\dot x_2 = x_2$
$x_2$는 $x_2(t)=e^{(t-t_0)}x_2(t_0)$와 같이 움직이고 입력에 영향을 받지 않으므로 initial point와 final point를 마음대로 고를 수 없으므로 controllable하지 않습니다.
$\dot x_1 = 2u$
$\dot x_2 = -u$
만약 다음과 같을 경우 얼핏보면 입력을 잘 넣어서 controllable할거같지만 그렇지 않습니다.
위식을 정리하면
$\dot x_1 = -2\dot x_2$가 나오고 양변을 적분하면
$x_1(t_1)-x_1(t_0)=-2x_2(t_1)+2x_2(t_0)$ 가 됩니다.
초기값을 마음대로 정하면 $t_1$ 일때의 값이 정해집니다.
$\dot x_1 = x_2$
$\dot x_2 = u$
와 같은 식은 controllable 합니다.
입력으로 $\dot x_2$를 마음대로 할 수 있고 그러면 $\dot x_1$을 마음대로 할 수 있습니다. 뒤에서 controllable판별 방법을 공부하면 더 명확히 알 수 있습니다.
Controllability Gramian and Terminologies
$\dot x = A(t)x+B(t)u$
초기값과 임의의 target값이 주어졌을 때 입력을 구하는것은 막연하게 느껴집니다.
$x(t) = \Phi(t,t_0)x(t_0)+\int_{t_0}^{t}\Phi(t,\tau)B(\tau)u(\tau)d\tau$
이므로 $t$ 대신 $t_1$을 넣고 이항하면
$x(t_1) - \Phi(t_1,t_0)x(t_0)=\int_{t_0}^{t_1}\Phi(t_1,\tau)B(\tau)u(\tau)d\tau$
그리고 $x(t_1),x(t_0)$ 가 임의로 주어지므로 좌변이 전부 주어집니다.
controllability는 여기서 $u(\tau)$가 존재하냐의 질문입니다.
p개의 element를 갖는 연속함수를 R^n 공간의 상수벡터로 보내는 mapping 다음과 같이 정의하면
$L(u) =\int_{t_0}^{t_1}\Phi(t_1,t)B(t)u(t)dt$
$ L: C^p[ t_0,t_1] \rightarrow R^n$
이 mapping의 range space가 $R^n$ 공간이면 controllable 합니다.
막연했던 u를 찾는게 이제는 mapping L의 range space를 생각하는 문제가 되었습니다.
THM $ L: C^p[ t_0,t_1] \rightarrow R^n$
$L(u) =\int_{t_0}^{t_1}F(t)u(t)dt$
$F(t) \in R^{nxp}$
$\int_{t_0}^{t_1}F(t)F^{T}(t)dt=W(t_1,t_0), F(t)F^{T}(t) \in R^{nxn}$
$R(L)=R(W)$ : R(w)가 이점인 이유는 상수 행렬이 나오고 rank를 바로 따지면 되기 때문에 L(u)를 구하는 것보다 명확합니다.
pf) $R(W) \subset R(L)$
$x \in R(w)$ 즉 $x = W(t_0,t_1)\eta$라는 $\eta$가 존재한다.
$x = \int_{t_0}^{t_1}F(t)u(t)dt$ 를 만족하는 u가 존재해야한다.
$u(t) = F^{T}(t)\eta$로 제시한다.
$x = \int_{t_0}^{t_1}F(t) F^{T}(t)\eta dt = W(t_1,t_0)\eta$를 만족한다.
pf) $R(W) \supset R(L)$
$x\in R(L)$
$x \notin R(w)$ 의 모순을 보임으로 증명합니다.
$x = w + z, w \in R(W), z\in R(W)^{\perp}, z \ne 0$
$z\in R(W)^{\perp}=N(W^T)$ 따라서
$\int_{t_0}^{t_1}F(t)F^{T}(t)dtz=W^T(t_1,t_0)z = 0$, W는 symatric
앞에 $z^T$를 곱하면
$\lVert F^T(t)z \rVert ^2 = 0$
$ \therefore F^T(t)z = 0, \forall t\in [ t_0,t_1]$
$z^T x \ z^Tw + z^Tz$
$z^Tx \ne 0$ 인데
$z^T\int_{t_0}^{t_1}F(t)u(t)dt \ne 0$ 이므로 모순입니다.
다음과 같이 $R(W) = R(L) $ 를 증명했습니다.
$R(L) = R(G_c(t_0,t_1))$
$G_c(t_0,t_1)) \triangleq \int_{t_0}^{t_1}\Phi(t_1,\tau)B^T(\tau)\Phi^T(t_1,\tau)d\tau$
이 행렬을 controllability Gramian이라고 부릅니다.
L이라는 mapping의 range space를 구하는 대신 controllability Gramian의 range space를 구합니다.
controllable할 조건은 이 행렬의 range space가 $R^n$ 공간이여야 합니다.
Therom
“controllable to zero” : $x(t_0) \rightarrow 0(t_1)$
“reachable” : $0(t_0) \rightarrow x(t_1)$
controllability라는 말은 위의 두 의미를 만족한다는 것입니다.
만약 시스템이 선형시스템이라면 반대 또한 만족합니다.
Property of Controllability Gramian
controllability Gramian 행렬이 nonsingular하다면 controllable하다는 것을 의미했고 이와 동치는 $\Phi(t_1,\tau)B(\tau)$ 또는 $B^T(\tau)\Phi^T(t_1,\tau)$ 의 culumn 들이 독립임을 의미합니다.
$\Phi(t_1,\tau)$ 는 n by n 정방행렬
$B(\tau)$ 는 n by p 이때 p는 입력의 개수입니다.
$\Phi(t_1,\tau)B^T(\tau)\Phi^T(t_1,\tau)d\tau$ 는 항상 singular합니다.
controllable하다면 적분하면 nonsingular가 됩니다.
$V =\int_{t_0}^{t_1}G^T(t)G(t)dt nonsingular \Leftrightarrow {g_1(t),g_2(t),\cdots g_n(t) } indep on [ t_0,t_1]$
$g(t) \in R^{pxn}$
pf)
${g_1(t),g_2(t),\cdots g_n(t) }$ 이 독립이 라고한다면
$\beta_1 g_1(t) + \beta_2 g_2(t) \cdots + \beta_n g_n(t) =0 \forall t\in [ t_0,t_1]$
위 식을 정리하면
$G(t)\beta = 0, \forall t\in[ t_0,t_1], \beta \ne 0$
따라서 $V\beta = 0$ 가 됩니다.
0이 아닌 vector $\beta$ 를 곱해서 0이 됐으므로 V는 nonsingular일 수가 없습니다.
다음 질문들을 할 수 있습니다.
${g_1(t),g_2(t),\cdots g_n(t) } indep on [ t_0,t_1]$
$\bar{t_0}< t_0 < \hat{t_0}< \hat{t_1}< t_1 < \bar{t_1}$ 일때
Q1 : ${g_1(t),g_2(t),\cdots g_n(t) } dep on [ \bar t_0,\bar t_1]$ ?
A1 : No (일반적으로)
Q2 : ${g_1(t),g_2(t),\cdots g_n(t) } dep on [ \hat t_0,\hat t_1]$ ?
A2 : Yes
Q1 : ${g_1(t),g_2(t),\cdots g_n(t) } indep on [ \bar t_0,\bar t_1]$ ?
A1 : Yes
Q2 : ${g_1(t),g_2(t),\cdots g_n(t) } indep on [ \hat t_0,\hat t_1]$ ?
A2 : No
이 성질을 이용하면 controllability gramian이 $t_0,t_1$ 구간에서 nonsingular한다고 했을 때 더 넓은 구간에서도 nonsingular한다고 할 수 있습니다.
Controllability of Linear Systems
미분된 형태로 controllability를 생각해 볼 순 없을까 해서 나온 Theorem입니다.
Theorem
$M_0(t)=B(t)$
$M_j(t)=-A(t)M_{j-1}(t)+\frac{d}{dt}M_{j-1}(t)$
$rank[ M_0(t) \cdots M_{n-1}(t)] = n at \tau\in[ t_0,t_1]$
pf) full row rank를 가지지만 controllability가 성립하지 않는다고 전개합니다.
$(A(t),B(t))$ not controllable
$\exists \alpha \ne 0$ : 0이 아닌 row vector
$\alpha \Phi(t_1,t)B(t) = 0, \forall t\in [ t_0,t_1]$
$\frac{d^k}{dt^k}\alpha \Phi(t_1,t)B(t)=0$
한번 미분하면
$-\alpha\Phi(t_1,t)A(t)B(t)+\alpha \Phi(t_1,t)\dot B(t)=\alpha\Phi(t_1,t)M_1(t)=0$
한번 더 미분하면
$-\alpha\Phi(t_1,t)A(t)M_1(t) + \alpha \Phi(t_1,t)\dot B(t) \dot M_1 = \alpha\Phi(t_1,t)M_2(t)=0$
$\vdots$
$\alpha \alpha\Phi(t_1,t)M_{n-1}(t) = 0$
M앞에 0이 아닌 row vector들을 곱하면 0이 됩니다.
똑같이 $[ M_0(t) \cdots M_{n-1}(t)]$ 앞에 곱하면 0이 되고 구간에서 다 rank가 n이 될 수 없습니다.
LTI system에서 controllability
$\ddot x = Ax + Bu$
$G_c(t_0,t_1)=\int_{t_0}^{t_1}e^{A(t_1-t)}BB^Te^{A^T(t_1-t)}dt$
$M_0=B$
$M_j(t)=-A(t)M_{j-1}(t)$
$[B, -AB, + A^2B,-A^3B,\cdots,(-1)A^{n-1}B]$ 이 행렬의 row들이 모두 독립이면 LTI system은 controllable합니다.
’ - ‘ 부호가 싫다면 I만 존재하는 대각행렬을 통해서 없애줄 수 있습니다.
$P=[B, AB, A^2B,A^3B,\cdots,A^{n-1}B]$ 이 행렬을 controllability mtx라고 부릅니다.
Theorem
LTI system은 controllable하다면 어떤 구간에서도 controllable합니다.
앞에서 full row rank를 가지면 controllable하다는 것을 확인했고 이제 controllable하다면 ful row rank를 가진다는 것을 보겠습니다.
THM : $R(G_c(T_0,t_1))=R(PP^T)=R(P)$
pf_1)
$R(G_c(T_0,t_1))^{\perp}=R(PP^T)^{\perp}=R(P)^{\perp}$
위 식을 보인다는 말은 아래와 같습니다.
$N(G_c(t_0,t_1))=N(PP^T)=N(P^T)$
$x \in N(G_c(t_0,t_1))$
$G_c(t_0,t_1)x = 0$ 를 풀어서 쓰고 앞에 $x^T$를 곱하면
$x^T\int_{t_0}^{t_1}e^{A(t_1-t)}BB^Te^{A^T(t_1-t)}xdt=0$
$\Rightarrow B^Te^{A^T(t_1-t)}x=0, \forall t\in [ t_0,t_1]$
한번 미분하면 (-기호를 없애면)
$ B^TA^Te^{A^T(t_1-t)}x=0$
한번더 미분하면
$ B^T(A^T)^2e^{A^T(t_1-t)}x=0$
모든 t에대해서 성립하므로 $t$자리에 $t_1$을 넣으면
$B^Tx=0$
$B^TA^Tx=0$
$B^T(A^T)^2x=0$ 와 같이 되므로
$\begin{bmatrix}
B^T
B^TA^T
B^T(A^T)^2
\vdots
\end{bmatrix} x =0$
이므로 이 말은 0이 아닌 x를 골랐으므로 행렬안에 있는 column들이 선형 종속이라는 의미고 즉 P의 row들은 선형 종속이라는 의미입니다. 즉 행렬은 full column rank를 가지지 않습니다.
즉 $P^Tx=0$이므로 $x\in N(PP^T)$와 $x\in N(P^T)$ 임을 증명한 것 입니다.
pf_2)
$x\in N(PP^T)=N(P^T)$
$P^Tx=0 \Rightarrow B^Tx=0,B^TA^Tx=0,\cdots \Rightarrow x^TA^iB=0, \forall i=1,2,\cdots, n-1$
$e^{A(t_1-t)}=\sum_{i=0}^{n-1} f_i(t)A^i$
$e^{A(t_1-t)}B=\sum_{i=0}^{n-1} f_i(t)A^iB$
여기서 앞에 $x^T$를 곱하면 0이 되고 마찬가지로
$x^TG_c=\int_{t_0}^{t_1}e^{A(t_1-t)}BB^Te^{A^T(t_1-t)}dt=0$
이 말은 $G_c$가 singular하다는 의미입니다.
결국 $N(G_c(t_0,t_1))=N(PP^T)$ 임을 증명했습니다.
$P=[B, AB, A^2B,A^3B,\cdots,A^{n-1}B]$
$\dot x = Ax + Bu$ : controllable
$\bar x = Tx$ 새로운 state를 잡으면
$\dot{\bar x} = TAT^{-1}\bar x + TBu$ 에서의 새로운 pair는 과연 controllable할까요?
시스템의 고유한 성질이기 때문에 물리적으로 생각하면 당연히 controllable해야 합니다.
A와 B에 각각을 대입하면 다음을 얻습니다.
$\bar P = TP$
controllability를 만족하는 u가 있다는 것을 배웠고 그렇다면 u를 구하는것은?
$x(t_1)-\Phi(t_1,t_0)x(t_0)=\int_{t_0}^{t_1}\Phi(t_1,\tau)B(\tau)u(\tau)d\tau$
Q : $x(t_0),x(t_1)$이 주어졌을때 $u$를 구할 수 있느냐? A : 양변에 $\Phi(t_0,t_1)$을 곱하면
$\Phi(t_0,t_1)x(t_1)-x(t_0)=\int_{t_0}^{t_1}\Phi(t_0,\tau)B(\tau)u(\tau)d\tau$
좌변은 다 알고 있는 항이므로 $\bar x$라고 하겠습니다. 그리고 u는 다음과 같이 제시하겠습니다.
$u(\tau)=B^T(\tau)\Phi^T(t_0,\tau)G_c^{-1}(t_0,t_1)\bar x$
다음 u를 실제로 대입하면
$G_c^{-1}(t_0,t_1)\bar x$는 상수이므로 적분기호 밖으로 나올 수 있습니다. 그러면 controllability gramian ($G_c$)가 되고 inverse와 곱해지면서 I가 됩니다. 이는 곧 좌변이므로 성립함을 알 수 있습니다.
다음과 같이 하나의 입력을 구했습니다. mapping의 nullspace가 0이라는 것을 보이지 않았기 때문에 입력은 유일하지 않을 수 있고 한 입력만 보인것입니다.