본문 바로가기
Mathematics/선형대수

(선형대수학) 2.5 Representations of Linear Transformations

by 피그티 2018. 7. 21.

Linear transformation의 집합 역시 vector space이므로 (선형대수학) 1.4 Coordinate Representation에서와 같이 basis를 이용하여 행렬로 표현할 수 있다. 그러나 단순하게 일렬로 된 행렬보다는 vector에 작용하는 연산자로써의 기능이 드러나도록 representation을 만들 수 있다. 이 페이지에서는 linear transformation의 행렬 표현에 대하여 살펴보자.

 

 

Matrix Representation of Linear Transformation

 

\(n\)-dimensional vector space \(V\)의 ordered basis를 \(\mathcal{B}=\{\mathbf{a}_1,\mathbf{a}_2,\cdots,\mathbf{a}_n\}\)이라고 하고 \(m\)-dimensional vector space \(W\)의 ordered basis를 \(\mathcal{C}=\{\mathbf{b}_1,\mathbf{b}_2,\cdots,\mathbf{b}_m\}\)이라고 하자. Linear transformation의 집합 \(L(V,W)\)의 dimension은 \(nm\)이 되고 이 때 basis를

$$ E_{ij}\mathbf{a}_k = \delta_{jk}\mathbf{b}_i $$

와 같이 선택할 수 있다.((선형대수학) 2.2 The Set of Linear Transformations 참고) 임의의 Linear transformation \(T\)를 basis의 linear combination으로 표현하면 다음과 같다.

$$ T=\sum _{i=1} ^m \sum_{j=1}^n t_{ij}E_{ij} $$

이제 \(T\)를 \(V\)의 vector \(\mathbf{v}=\sum_{k=1}^nv_k\mathbf{a}_k\)에 작용하면,

$$ T\mathbf{v}=\sum_{i=1}^m\sum_{j=1}^nt_{ij}E_{ij}\mathbf{v}=\sum_{i=1}^m\sum_{j=1}^nt_{ij}E_{ij}\left(\sum_{k=1}^nv_k\mathbf{a}_j\right)=\sum_{i=1}^m\sum_{j=1}^n\sum_{k=1}^nt_{ij}v_k\delta_{jk}\mathbf{b}_i=\sum_{i=1}^m\sum_{j=1}^nt_{ij}v_j\mathbf{b}_i $$

가 된다. 마지막 식은 \(T\mathbf{v}\)가 basis \(\mathcal{C}\)에서 representation이 

$$ [T\mathbf{v}]_\mathcal{C}=\begin{bmatrix} \sum_{j=1}^nt_{1j}v_j \\ \sum_{j=1}^nt_{2j}v_j \\ \vdots \\ \sum_{j=1}^nt_{mj}v_j \end{bmatrix} $$

가 됨을 보여준다. 그리고 이 식은 다음과 같이 행렬의 곱셈으로 분리될 수 있다.

$$ \begin{bmatrix} \sum_{j=1}^nt_{1j}v_j \\ \sum_{j=1}^nt_{2j}v_j \\ \vdots \\ \sum_{j=1}^nt_{mj}v_j \end{bmatrix} = \begin{bmatrix} t_{11} & t_{12} & \cdots & t_{1n} \\ t_{21} & t_{22} & \cdots & t_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ t_{m1} & t_{m2} & \cdots & t_{mn} \end{bmatrix} \begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix} $$

이 때 마지막 행렬이 바로 \(\mathbf{v}\)의 basis \(\mathcal{B}\)에서의 representation이다. 그러므로 \(T\)의 representation을 두 번째 \(m\times n\)행렬로 만들어줌으로써 linear transformation의 작용을 행렬의 곱셈처럼 표현할 수 있다. Linear transformation의 representation은 \(V\)의 basis와 \(W\)의 basis가 다르면 다른 값을 가지므로 여러 basis를 사용하게 될 때는 \([T]_\mathcal{C} ^\mathcal{B}\)와 같이 basis를 표현해 주는 것이 혼동을 줄일 수 있다.

 

THEOREM            Matrix Representation of Linear Transformation 

 

\(n\)-dimensional vector space \(V\)의 ordered basis를

$$ \mathcal{B}=\{\mathbf{a}_1,\mathbf{a}_2,\cdots,\mathbf{a}_n\} $$

\(m\)-dimensional vector space \(W\)의 ordered basis를

$$ \mathcal{C}=\{\mathbf{b}_1,\mathbf{b}_2,\cdots,\mathbf{b}_m\} $$

이라고 하자. \(V\)로부터 \(W\)로의 linear transformation \(T:V\to W\)가

$$ T \mathbf{a}_j=\sum_{i=1}^mw_i\mathbf{b}_i $$

라고 하면, \(T\)의 matrix representation은

$$ \begin{array}{} ~~~~~~~~~~~\scriptstyle{(j\mathrm{th~column})} \\ [T]=\begin{bmatrix} & w_1 & \\ & w_2 & \\ \cdots & \vdots & \cdots \\ & w_m & \end{bmatrix} \end{array}$$

가 되고 \(T\mathbf{v}=\mathbf{w}\)는

$$ [T][v]=[w] $$

로 표현된다.

 

 

Examples

 

1. \(\mathbb{R}^2\)에서 \(\mathbb{R}^3\)로의 linear transformation 

$$ T(x,y)=(2x+y,3y,3x+2y) $$

는 standard basis를 택했을 경우 representation은

$$ [T]=\begin{bmatrix} 2 & 1 \\ 0 & 3 \\ 3 & 2 \end{bmatrix} $$

가 된다. \(\mathbb{R}^3\)의 basis를 \(\{(1,0,0),(1,1,0),(1,1,1)\}\)로 한다면

$$ T(1,0)=(2,0,3)=2(1,0,0)-3(1,1,0)+3(1,1,1) $$

$$ T(0,1)=(1,3,2)=-2(1,0,0)+1(1,1,0)+2(1,1,1) $$

이므로 \(T\)의 representation은

$$ [T]=\begin{bmatrix} 2 & -2 \\ -3 & 1 \\ 3 & 2 \end{bmatrix} $$

가 된다.

 

 

2. Basis Change

 

(선형대수학) 1.4 Coordinate Representation에서 본 바와 같이 basis를 바꾸면 vector의 representation이 바뀌는 것과 마찬가지로 linear transformation의 representation도 바뀐다. basis에 따른 representation 간의 변화는 기존의 식으로부터 쉽게 구할 수 있다. basis에 따른 vector의 representation 간의 변환식이

$$ R[v]_\mathcal{B}=[v]_\mathcal{D} $$

$$ P[w]_\mathcal{C}=[w]_\mathcal{F} $$

라고 한다면 \(T\mathbf{v}=\mathbf{w}\)의 \(\mathcal{B}\), \(\mathcal{C}\) matrix repersentation

$$ [T]_\mathcal{C} ^\mathcal{B} [v]_\mathcal{B} = [w]_\mathcal{C} $$

로부터

$$ P[T]_\mathcal{C} ^\mathcal{B}R^{-1}R [v]_\mathcal{B} = P[w]_\mathcal{C} $$

이고 이를 \(\mathcal{D}\), \(\mathcal{F}\) matrix repersentation

$$ [T]_\mathcal{F} ^\mathcal{D} [v]_\mathcal{D} = [w]_\mathcal{F} $$

와 비교하면

$$ [T]_\mathcal{D} ^\mathcal{F} = P[T]_\mathcal{B} ^\mathcal{C}R^{-1} $$

이어야 함을 알 수 있다.

 

Linear operator의 경우에는 정의역과 공역에 같은 basis를 사용하므로

$$ [T]_\mathcal{D} = R[T]_\mathcal{B}R^{-1} $$

과 같은 basis 변환 식을 얻는다. \([T]_\mathcal{B}\)와 \([T]_\mathcal{D}\)는 \(R\)이 곱해져 있기 때문에 행렬 성분들이 서로 다르므로 같은 행렬은 아니나 똑같이 \(T\)라는 linear operator를 표현하고 있다. 이를 확장하여 \(n\times n\) 행렬 \(A\)와 \(B\)가 invertible한 행렬 \(R\)에 의해서

 

\(A=RBR^{-1}\) 또는 \(B=R^{-1}AR\)

 

의 관계를 가지고 있다면 두 행렬은 같은 linear operator를 (다른 basis에서) 표현하고 있다고 볼 수 있다.

 

THEOREM            Matrix Similarity

 

\(n\times n\) 행렬 \(A\), \(B\)가 어떤 invertible \(n\times n\) 행렬 \(P\)에 대하여

$$ B=P^{-1}AP $$

이면, vector space \(V\)의 linear operator \(T\)의 matrix representation이 \(A=[T]_\mathcal{B}\), \(B=[T]_\mathcal{C}\)인 basis \(\mathcal{B}\)와 \(\mathcal{C}\)가 존재한다. 이 때 행렬 \(A\), \(B\)를 similar하다고 한다.

 

 

3. Dual Space

 

Vector space \(V\)의 basis \(\mathcal{B}=\{\mathbf{a}_1,\mathbf{a}_2,\cdots,\mathbf{a}_n\}\)에 대하여 linear functional \(f:V\to \mathbb{R}\)을 생각해보자. 보통 \(\mathbb{R}\)의 basis는 숫자 1로 하므로

$$ f(\mathbf{a}_i)=c_i $$

라고 한다면 \(f\)의 representation은

$$ [f]=\begin{bmatrix} c_1 & c_2 & \cdots & c_n \end{bmatrix} $$

가 된다. 그런데 이것은 dual basis \(\mathcal{B}^*=\{f_1,f_2,\cdots,f_n\}\)이라고 할 경우

$$ f=\sum_{i=1}^n c_if_i $$

라는 점으로부터, (선형대수학) 1.4 Coordinate Representation에서 사용한 방식의 representation을 가로로 쓴 것(더 정확히는 행렬을 transpose한 것)과 동일하다. 그래서 linear functional은 vector와 동일하게 취급하는 경우가 많은데 이러한 경우 원래 vector와 구별하기 위해서 covector라고 부른다. vector와 covector가 구분되는 경우는 basis change에 따라 representation이 다르게 변형되는때이다. vector가 basis change로

$$ \begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix} ~\longrightarrow~ R\begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix} $$

처럼 변형된다면 covector의 (dual basis) representation은

$$ \begin{bmatrix} c_1 & c_2 & \cdots & c_n \end{bmatrix} ~\longrightarrow~ \begin{bmatrix} c_1 & c_2 & \cdots & c_n \end{bmatrix}R$$

로 변형된다. covector를 vector처럼 취급하여 representation을 세로로 쓴다면

$$ (\begin{bmatrix} c_1 & c_2 & \cdots & c_n \end{bmatrix})^T= \begin{bmatrix} c_1 \\ c_2 \\ \vdots \\ c_n \end{bmatrix} ~\longrightarrow~ (\begin{bmatrix} c_1 & c_2 & \cdots & c_n \end{bmatrix}R)^T=R^T\begin{bmatrix} c_1 \\ c_2 \\ \vdots \\ c_n \end{bmatrix} $$

처럼 변형된다. 전자기학을 처음 공부할 때 \(\vec{\nabla}\)를 vector처럼 취급하나 change of basis에서 vector와는 다른 방식으로 변형되는 것에서 혼란을 겪게 되는데 변형 방식이 다른 것의 근본적 원인은 covector와 covector 작용 방식에 있다. \(\vec{\nabla}\)의 변환에 대한 것은 <(다양체,텐서) ------>에서 다룬다.