* 2022.09.13 수업의 복습입니다.*
원래 2부까지만 할 예정이었던 선형대수학 1 복습이었지만, 내가 adjoint operator 까지의 범위를 이해한 수준과 Spectral theorem 이후 범위를 이해한 수준이 상당히 달라서 (Read: 뒷부분이 탄탄하지 못해서) 아예 새로운 글을 통해 복습하기로 하였다.
이후 어떤 명제를 진술할 때, 그 명제가 참인 체를 뒷부분에 괄호를 통해 첨부할 예정이다.
6) 특수한 Operator와 대각화 가능성
$T \in \mathcal{L}(V)$라 하자. 우리는 특수한 linear operator에 붙이는 여러 명칭을 살펴보았다:
a. $T^{*}T = TT^{*}$이면 $T$는 normal이다. ($\mathbb{F} = \mathbb{C}, \mathbb{F} = \mathbb{R}$)
b. $T^{*} = T$이면 $T$는 Hermitian / self-adjoint이다. ($\mathbb{F} = \mathbb{C}, \mathbb{F} = \mathbb{R}$)
c. $T^{*} = T^{-1}$이면 $T$는 unitary이다 ($\mathbb{F} = \mathbb{C}$) / $T$는 orthogonal이다. ($\mathbb{F} = \mathbb{R}$)
#주석. $(V,\mathbb{F})$가 유한차원 내적공간이라 하자. 이제 내적이라 함은 $\bullet: V \times V \to \mathbb{F}$임에 유의하라. 따라서 $\mathbb{F} = \mathbb{C}$이면 내적성질 iii)은 $x\bullet y = \overline{y \bullet x}$인 반면, $\mathbb{F} = \mathbb{C}$이면 내적성질 iii)은 $x \bullet y = y \bullet x$와 동치이다. (모든 내적의 결과물이 실수이기 때문이다.)
예컨대 $V =\mathbb{C}, \mathbb{F} = \mathbb{R}$일 때 $\bullet: V \times V \to \mathbb{R}, x\bullet y = x_{1}y_{1} + x_{2}y_{2}$는 실수 위에 정의된 내적공간인 반면, $V =\mathbb{C}, \mathbb{F} = \mathbb{C}$일 때 $\bullet: V \times V \to \mathbb{C}, x\bullet y = x_{1}y_{1} + x_{2}y_{2}$는 더 이상 복소수 위에 정의된 내적공간이 아니게 된다.
한편 $\mathbb{F} = \mathbb{R}$이더라도, $\Psi_{V}: V \to V^{*}, \Psi_{V}(x) = x^{*}$는 여전히 정의할 수 있다. 그렇다면 c에서 체가 다른 경우를 왜 따로 불러야 하는가? 이는 이후 살펴볼 스펙트럴 정리에서 잘 드러날 것이다.
우리는 앞서 ONB로 대각화 가능한 모든 선형변환은 normal임을 살펴보았다. ($\mathbb{F} = \mathbb{C}, \mathbb{R}$)
그렇다면 그 역이 성립하는지가 문제된다. 우선 normal operator에 대한 다음의 사실들을 정립하자:
명제. $T\in \mathcal{L}(V)$라 하자. 이제 $TT^{*} = T^{*}T$라면, 다음이 성립한다: ($\mathbb{F} = \mathbb{C} \space or \space \mathbb{F} = \mathbb{R}$)
(a) $||T(x)|| = ||T^{*}(x)||$
(b) $\lambda \in \mathbb{F}$에 대해 $T -\lambda I$ 역시 normal이다.
(c) $v \in V$가 $T$의 고유벡터이고 고윳값 $\lambda$에 대응한다 하자. 이제 $v$는 $T^{*}$의 고유벡터이며 동시에 고윳값 $\overline{\lambda}$에 대응한다.
(d) $x_{1}, x_{2} \in V$는 각각 $\lambda_{1}, \lambda_{2}$에 대응하는 $T$의 고유벡터라 하자. 이제 $x_{1} \bullet x_{2} = 0$이다.
(c)의 증명.
$v$가 $T$의 고유벡터라 하고 고윳값을 $\lambda$라 하자. 이제 $(T-\lambda)v \bullet (T-\lambda)v = 0$이라는 사실을 안다.
그런데 한편으로 $(T-\lambda I)^{*} = T^{*} - \overline{\lambda} I$라는 사실을 아므로,
$$v \bullet (T^{*} - \overline{\lambda} I)(T - \lambda I) v \\ = v \bullet (T - \lambda I)(T^{*} - \overline{\lambda}I) v \\ = (T^{*} - \overline{\lambda}I)v \bullet (T^{*} - \overline{\lambda}I)v = 0$$
이다. $\square$
(d)의 증명.
$\lambda_{1} (x_{1} \bullet x_{2}) = T(x_{1}) \bullet x_{2} = x_{1} \bullet T^{*}x_{2} = \lambda_{2} (x_{1} \bullet x_{2}) \square$.
또한 다음의 정리가 중요하게 사용된다:
Schur's Theorem.
$T \in \mathcal{L}(V)$라 하고, $T$의 특성다항식이 $\mathbb{F}$ 위에서 일차식으로 분해된다 하자. 이제 ONB $\beta$가 존재하여, $[T]_{\beta}$가 상방삼각행렬이 되도록 할 수 있다.
증명.
$V$의 차원에 대한 귀납법을 사용한다.
$dim V = 1$이면 $V = \{av_{1} | a\in \mathbb{F}\}$이므로 $\beta = \{v_{1}\}$은 ONB이고, $Tv_{1} = cv_{1}$이면 $[T]_{\beta} = [c]$이고 이는 상방삼각행렬이다.
$dim V = 1,...,n-1$에 대해 정리가 성립한다 하자. 이제 $dim V = n$이라 하자.
$T$의 특성다항식이 $\mathbb{F}$ 위에서 분해된다. 한편 $\beta$가 $V$의 ONB라 하면
$det(T - \lambda I) = det( [T - \lambda I]_{\beta})$이고,
$det(T^{*} - \overline{\lambda} I) = det([T - \lambda I]^{*}_{\beta}) = \overline{det([T - \lambda I]_{\beta})}$이므로 둘의 특성다항식은 complex conjugate 관계에 있고, 따라서 $T^{*}$의 특성다항식 역시 $\mathbb{F}$ 위에서 일차식으로 분해된다. 따라서 $T^{*}$는 고유벡터가 하나 이상 있다. 한 고유벡터를 골라 $v_{1}$이라 표기하자.
이제 $\{v_{1}\}^{\perp}$는 $V$의 $n-1$차원 부분공간이다. 이것이 $T$- invariant하다면, $V = \{v_{1}\}^{\perp} \oplus \{av_{1} | a\in \mathbb{F} \}$이고, 각각의 ONB를 $\beta, \beta'$이라 하면 $[T]_{\beta \cup \beta'}$은 상방삼각행렬일 것이다. 이는 마지막 행과 열을 제외한 $(n-1)\times (n-1)$ 행렬이 상방삼각이고, $T$-invariance에 의해 $n$행 $i$열 (i < n)의 성분이 0일 것이기 때문이다.
$v \in \{v_{1}\}^{\perp}$라 하자. 이제 $Tv \bullet v_{1} = v \bullet T^{*}v_{1} = v \bullet \overline{\lambda}v_{1} = \lambda (v \bullet v_{1}) = 0$이므로 이것이 $T$-invariance를 보이고, 따라서 증명이 완료된다. $\square$
정리. (Spectral theorem 1)
$T \in \mathcal{L}(V), \mathbb{F} = \mathbb{C}$라 하자. 이제 $T$가 normal하면 ONB $\beta$가 존재하여 $[T]_{\beta}$가 대각행렬이 되게 할 수 있다.
증명.
Schur's theorem에 의해 ONB $\beta$를 잡아, $[T]_{\beta}$가 상방삼각행렬이 되도록 하자.
일단 $v_{1}$은 고유벡터임을 안다. 이제 $v_{1},...,v_{k-1}$이 고유벡터일 때 $v_{k}$ 또한 고유벡터임을 보일 것이다.
$Tv_{k} = A_{1k}v_{1} + ... + A_{kk}v_{k}$라는 사실을 안다. 한편 $k \neq j$에 대해
$$ A_{kj} = Tv_{k} \bullet v_{j} \\ = v_{k} \bullet T^{*}v_{j} = \lambda_{j} v_{k} \bullet v_{j} \\ = 0$$
이다. 첫 등식은 기저가 ONB인 경우 행렬표현의 정의에 의해 성립한다. 셋째 등식은 $T$가 normal하면 $T$의 고유벡터와 $T^{*}$의 고유벡터가 같다는 사실로부터 성립한다. 마지막 등식은 ONB의 정의에 의해 성립한다.
따라서 $[T]_{\beta}$는 대각행렬이고 정리가 증명된다. $\square$
Alt 증명.
$V$의 차원에 대해 귀납법을 사용한다.
$dim V = 1$인 경우 특성다항식이 일차식으로 분해되므로 ($\mathbb{F} = \mathbb{C}$) 성립한다.
$dim V = 1,...,n-1$일 때 성립한다 가정하고, $dim V = n$인 경우를 보이자.
특성다항식이 일차식으로 분해되므로 고유벡터가 하나 이상 있고, 이 벡터에 상응하는 고윳값을 $\lambda_{1}$이라 하자.
이제 $dim E(\lambda_{1}) < n$이므로 이 고유공간에 대한 ONB $\beta'$을 잡아, $T$를 고유공간에 제한한 operator를 $\beta'$으로 표현하면 대각행렬이 나오도록 하자.
이제 Schur's theorem과 유사하게 $E(\lambda_{1})^{\perp}$가 $T$-invariant함을 보이자.
$y \in E(\lambda_{1})^{\perp}$라 하자. 이제 $v\in E(\lambda_{1})$라 하면,
$$ Ty \bullet v = y \bullet T^{*}v = y \bullet \overline{\lambda_{1}}v = \lambda_{1} (y \bullet v) = 0$$
이다. 여기서 둘째 등식은 normal operator의 경우 $T,T^{*}$의 고유벡터들이 같다는 사실을 이용하였다. $\square$
정리. (Spectral theorem 2)
$T \in \mathcal{L}(V), \mathbb{F} = \mathbb{C} \space or \space \mathbb{R}$이라 하자. 이제 $T$가 self-adjoint하면 ONB $\beta$가 존재하여 $[T]_{\beta}$가 대각행렬이 되게 할 수 있다.
증명.
$\mathbb{F} = \mathbb{C}$이므로 $T$의 특성다항식은 $\mathbb{F}$서 일차식으로 분해되고, 따라서 ONB $\beta$가 존재하여 $[T]_{\beta}$가 상방삼각행렬이 되도록 할 수 있다.
한편
$$ [T^{*}]_{\beta} = [T]^{*}_{\beta} = [T]_{\beta}$$ 역시 상방삼각행렬이므로 이는 $[T]_{\beta}$가 대각행렬임을 의미한다.
#주석. 여기서는 $\mathbb{F} = \mathbb{R}$이어도 증명이 성립한다는 사실에 주목하라. 만약 spectral theorem 1을 사용하고자 했다면 $\mathbb{F] = \mathbb{R}$을 증명하지 못했을 것인데, 이는 특성다항식이 split한다는 보장이 없기 때문이다.
ONB $\beta = \{v_{1}, ... , v_{n} \}$를 통해 $[T]_{\beta}$가 대각화되었다 하자. 이제 $T \in \mathcal{L}(V)$를 다음과 같이 나타낼 수 있다:
$$ T = \Sigma_{i=1}^{n} \lambda_{i} v_{i} v_{i}^{*}$$
"음? 스칼라곱은 왼쪽에서만 정의했는데?"라고 생각할 사람들을 위해서, 여기서 $v_{i}$는 사실 벡터가 아니라 선형변환이다!
$v_{i} : \mathbb{F} \to V, v_{i}(1) = v_{i}$
abusive notation이라고 항의할 수 있겠다. 사실 나도 그렇다고 생각한다. 하지만 교수님께서 이렇게 가르치셔서 일단은 이렇게 써보았다. 맥락에 따라 잘 분간할 수 있어야지. 여튼 벡터는 일종의 선형변환이라고 볼 수 있다는 관점이 흥미롭긴 했다.
이러한 사실들을 바탕으로 선형변환의 정부호성을 조사할 수 있다:
정의. $T \in \mathcal{L}(V)$는 self-adjoint 변환이라 하자. 또한 $\mathbb{F} \in \{\mathbb{R}, \mathbb{C}\}$이라 하자.
이제 다음과 같이 정의하자:
$0 \neq x \in V, Tx \bullet x > 0 \Leftrightarrow T$ is positive definite (양의 정부호)
$0 \neq x \in V, Tx \bullet x \geq 0 \Leftrightarrow T$ is positive semi-definite (양의 준정부호)
negative definite, negative semi-definite 역시 유사하게 정의한다.
$T$가 self-adjoint하므로, $\mathbb{F}$가 실수, 복소수 중 무엇이더라도 spectral theorem 2에 의해 ONB $\beta$에 의해 $T$가 대각화가 가능함을 안다. 또한 앞서 살펴본 표기 $T = \Sigma_{i=1}^{n} \lambda_{i} v_{i} v_{i}^{*}$을 고려해 보면, 다음의 사실을 쉽게 증명할 수 있다:
$T$ positive definite <=> $\lambda_{i} > 0$
$T$ positive semi-definite <=> $\lambda_{i} \geq 0$
한편 unitary, self-adjoint operator들의 고윳값들은 특수한 성질을 가진다:
1) $T \in \mathcal{L}(V), \mathbb{F} = \mathbb{C}$가 unitary operator이라 하자. 이제 $T$는 ONB에 의해 대각화 가능하며 (spectral theorem 1), 특히 모든 고윳값들은 크기 1의 복소수이다.
특히 $T$는 내적을 보존한다: $Tx \bullet Ty = x \bullet y$
이러한 $T$를 rigid motion이라 부른다.
2) $T \in \mathcal{L}(V)$가 self-adjoint operator이라 하자. 이제 $T$는 ONB에 의해 대각화 가능하며 (spectral theorem 2), 특히 모든 고윳값들은 실수이다.
이는 Normal operator의 경우 $T, T^{*}$가 같은 고유벡터들을 가지며 대응되는 고윳값은 complex conjugate 관계를 가짐에서 기인한다.
7) 6), but for matrices
정의.
$A \in \mathcal{M}_{n \times n}$이 행렬이라 하자. 행렬에 대해서 다음과 같이 정의한다:
i) $A$ is normal $\Leftrightarrow L_{A} \in \mathcal{L}(\mathbb{F}^{n})$ is normal
ii) $A$ is self-adjoint $\Leftrightarrow L_{A} \in \mathcal{L}(\mathbb{F}^{n})$ is self-adjoint
iii) $A$ is unitary (complex) / orthogonal (real) $\Leftrightarrow L_{A} \in \mathcal{L}(\mathbb{F}^{n})$ is unitary / orthogonal
명제 1.
$$ L_{A^{*}} = (L_{A})^{*}$$
증명.
$\mathbb{F}^{n}$의 표준기저 $\beta = \{e_{1}, ... , e_{n}\}$을 잡음으로써 우리는 다음의 사실을 알 수 있다:
$$ [L_{A^{*}}]_{\beta} = A^{*} = [L_{A}]_{\beta}^{*} = [(L_{A})^{*}]_{\beta}$$
이제 선형변환의 집합에서 동차원 행렬의 집합으로 보내는 선형변환이 전단사이므로 증명이 완료된다. $\square$
명제 2.
$\mathbb{F} = \mathbb{C}$이고, $A \in \mathcal{M}_{n\times n}$가 unitary 행렬이라 하자. 이제 $A$의 열들은 $\mathbb{C}^{n}$의 ONB를 이룬다.
증명.
$\beta$를 $\mathbb{C}^{n}$의 표준기저라 하자. 이제 다음이 성립한다:
$$I_{n} = [I_{\mathbb{C}^{n}}]_{\beta} = [L_{AA^{*}}]_{\beta} = [L_{A}]_{\beta} [L_{A^{*}}]_{\beta} = AA^{*}$$
$A^{*}A$에 대해서도 유사한 증명이 가능하다.
명제 3.
$\mathbb{F} = \mathbb{C}$이고 $A \in \mathcal{M}_{n\times n}$가 normal 행렬이라 하자. 이제 unitary 행렬 $U$가 존재하여, $U^{-1}AU$가 대각행렬이 된다.
증명.
$L_{A} \in \mathcal{L}(\mathbb{C}^{n})$이 ONB에 의해 대각화 가능하므로, 이 기저를 $\beta'$이라 하자.
이제 대각행렬 $D$가 존재하여 $D = [L_{A}]_{\beta'} = [I_{\mathbb{C}^{n}}]_{\beta}^{\beta'} [L_{A}]_{\beta} [I_{\mathbb{C}^{n}}]_{\beta'}^{\beta}$이고, $[I_{\mathbb{C}^{n}}]_{\beta'}^{\beta}$의 열들은 $\mathbb{C}^{n}$의 정규직교기저를 이루므로 이 행렬은 unitary 행렬 $U$로 표현할 수 있다.
따라서 $D = U^{-1}AU$가 성립한다. $\square$
명제 4.
$\mathbb{F} =\mathbb{R}$이고 $A \in \mathcal{M}_{n \times n}$가 대칭행렬이라 하자. 이제 orthogonal 행렬 $U$가 존재하여, $U^{-1}AU$가 대각행렬이 된다.
증명.
이 경우 $A = A^{*}$이므로 $\mathbb{R}^{n}$의 표준기저 $\beta$에 대해 $[L_{A}^{*}]_{\beta} = [L_{A^{*}}]_{\beta} = [L_{A}]_{\beta}$이고, 따라서 $L_{A}$가 self-adjoint operator가 되고, 따라서 ONB에 의해 대각화 가능하다. 이후 명제 3의 증명에서 했던 내용을 그대로 반복하면 증명이 완료된다. 다만 $\mathbb{F} = \mathbb{R}$이므로 좌표변환 행렬이 orthogonal 하다는 차이점을 얻는다. $\square$
#주석. unitary operator들은 normal하므로 diagonalizable하다. 허나 orthogonal operator들은 normal하기는 하지만 특성다항식이 split한다는 보장이 없으므로 diagonalizable하다는 보장 역시 없다.
예컨대 다음의 행렬을 살펴보라:
$$ A = \begin{bmatrix} cos(\theta) \space sin(\theta) \\ -sin(\theta) \space cos(\theta) \end{bmatrix}$$
$A^{*}A = AA^{*} = I$이므로 이 행렬(과 이에 연관된 선형변환 $L_{A}$)는 orthogonal이다. 허나 이 행렬은 실수에서 대각화가능하지 않다 (특성다항식이 실수에서 분해되지도 않는다).
이로써 모든 복습이 마무리되었다. 다음 글부터는 SVD를 들어가도록 하겠다.
'수학 (2022-2) > 선형대수학 2' 카테고리의 다른 글
선형대수학 - 쌍선형 형식의 대각화, 이차형식, Sylvester 정리 (0) | 2022.10.02 |
---|---|
선형대수학 - 쌍선형 형식과 행렬표현 (1) | 2022.09.25 |
선형대수학 - 스펙트럴 정리, 특이값 분해와 Pseudoinverse (1) | 2022.09.20 |
선형대수학 1 복습 (Part 2) (0) | 2022.09.06 |
선형대수학 1 복습 (Part 1) (0) | 2022.09.05 |