지난 시간에는 멱급수의 형태로 정의된 함수들을 살펴보았었다. 특히, 멱급수의 형태로 정의된 함수들은 수렴반경에서 실해석적이며 (점 근방에서 함수가 자신의 테일러 전개로 수렴) 수렴반경 내부의 임의의 구간에서 균등수렴한다는 사실이 중요했다.

 

이제 이번 시간에는 급수를 활용하기는 하지만 다른 방식으로 정의된 급수를 살펴볼 것이다. 이 급수는 다항식을 베이스로 한 멱급수와 달리 삼각함수를 베이스로 한 푸리에 급수이다. 마찬가지로 푸리에 급수가 언제 자기 자신으로 수렴하는지가 문제된다. 그러나 이 문제를 본격적으로 다루려면 르벡 적분을 알아야 하므로 현 시점에서는 비교적 약한 정리들만을 증명할 수 있음에 유념하라.

 

 

글의 순서는 다음과 같다:

 

<목차>

1. 함수공간에서의 정규직교집합

 1-1. 구체적 예시: 삼각함수, 지수함수

 

2. 삼각 다항식, 삼각급수, 푸리에 급수

 2-1. 삼각 다항식

 2-2. 삼각 급수

 2-3. 푸리에 급수

 

3. 푸리에 급수의 탐구

 3-1. 푸리에 급수 계수들의 상한: Bessel's Inequality

 3-2. 립시츠 연속은 점별수렴을 보장

 3-3. 푸리에 급수는 원함수에 "수렴": Parseval's Theorem

 

 

 

1. 함수공간에서의 정규직교집합

 함수공간의 적절한 부분집합을 잡으면 벡터공간이 만들어진다. 예컨대 $\mathcal{C}([a,b])$는 폐구간 $[a,b]$서 연속인 함수들의 집합이라 하자. 연속함수는 스칼라곱과 덧셈에 대해서도 연속함수이고 이것이 교환법칙, 결합법칙 등 연산의 좋은 성질들을 만족하므로, 이 집합은 벡터공간이다.

 더욱이, 리만적분 가능한 함수들만이 들어 있는 벡터공간에서는 내적이 정의된다. 예컨대 앞서 살펴본 $\mathcal{C}([a,b])$의 경우 다음과 같이 내적이 정의된다:

$$ f(t) \bullet g(t) = \int_{a}^{b} f(t) \overline{g(t)} dt$$

 

 이제 이런 적절히 선택한 내적공간에서 정규직교기저를 찾을 수 있다면 여러모로 좋다는 사실을 알 수 있다 (예컨대 정사영을 할 수 있을 것이다.) 그러나 우리는 현재 일반적인 함수공간에서 기저를 찾기란 사실상 이론상 가능하다는 사실만 안다. 따라서 우리는 차선책으로, 1) 정규직교집합을 찾은 다음에 2) 그 정규직교집합으로 '사실상 내적공간의 모든 함수들을 잘 설명할 수 있다'는 사실을 보이는 순서를 취할 것이다.

 

 현 시점부터는 내적공간을, 복소수 값을 가지는 실함수 중 리만적분 가능한 함수들 $V = \mathcal{R}([a,b])$로 잡도록 한다.

 

정의. (정규직교집합)

$V$에 속하는 함수들의 집합 $\{\phi_{n}\}_{n\in \mathbb{N}}$이 다음을 만족한다 하자:

$$ n \neq m \Rightarrow \int_{a}^{b} \phi_{n}(t) \overline{\phi_{m}(t)} dt = 0$$

이제 이 집합은 [a,b]서 정의된 함수들의 직교집합 (orthogonal system of functions)이다.

 

또한 $V$에 속하는 함수들의 집합이 추가로 다음을 만족한다 하자:

$$ \int_{a}^{b} |\phi_{n}(t)|^{2} dt = 1$$

이제 이 집합은 [a,b]서 정의된 함수들의 정규직교집합 (orthonormal system of functions)이다.

 

 

 1-1. 구체적 예시: 삼각함수, 지수함수

eg. $[a,b] = [0,2\pi]$라 하자. 이 구간 위에서 리만적분 가능한 다음 함수들을 살펴보자:

$\{ \frac{1}{\sqrt{2\pi}}, \frac{cos(x)}{\sqrt{2\pi}}, \frac{sin(x)}{\sqrt{2\pi}}, \frac{cos(2x)}{\sqrt{2\pi}}... \}$

이 함수들은 통상적인 함수 내적공간에서 정규직교집합을 이룬다. 

 

eg. $[a,b] = [0,2\pi]$라 하자. 마찬가지로

$\{\frac{1}{\sqrt{2\pi}} e^{inx} | n \in \mathbb{Z}\}$는 통상적인 함수 내적공간에서 정규직교집합을 이룬다.

 

 

 

2. 삼각 다항식, 삼각급수, 푸리에 급수

 2-1. 삼각 다항식

 우리는 앞서 $\{\frac{1}{\sqrt{2\pi}}e^{inx} | n \in \mathbb{Z} \}$가 함수들의 정규직교집합을 이룸을 살펴보았다. 이하에서는 이 집합을 기반으로 하여 내용을 전개하도록 한다.

 

정의. (삼각다항식)

$a_{n}, b_{n} \in \mathbb{C}$라 하자. 이제 다음의 유한합을 (n차) 삼각다항식이라 한다:

$$ f(x) = a_{0} + \Sigma_{n=1}^{N} a_{n} cos(nx) + b_{n} sin(nx) ...(*)$$

오일러 등식 $e^{ix} = cos(x) + i*sin(x)$에 의해 (*)꼴의 삼각 다항식은 다음과 같이도 표현할 수 있음을 안다:

$$ \Sigma_{-N}^{N} c_{n} e^{inx}, c_{n} \in \mathbb{C} ...(**)$$

이러한 꼴의 식 역시 (n차) 삼각다항식이라 부른다.

 

사실 합의 개념에서는 상당히 생소한, $-N$에서 $N$까지 합한다는 개념이 갑자기 등장하지만, 유한합의 경우 합의 순서가 전혀 상관이 없으므로 그저 $\{-N,-N+1,...,N-1,N\}$에서 $\{1,...,2N+1\}$로 가는 임의의 전단사로 새로 index를 매긴 후 이것을 유한합하였다 보면 될 것이다.

 

만약 어떤 삼각다항식 $f(x) = \Sigma_{-N}^{N} c_{n} e^{inx}$이 주어져 있으면, 다음이 성립한다:

$$\int_{-\pi}^{\pi} (\frac{1}{\sqrt{2\pi}}f(x))(\frac{1}{\sqrt{2\pi}}e^{-imx}) dx = \begin{cases} c_{m} \space\space (|m| \leq N) \\ 0 \space\space (o.w) \end{cases}$$

 

여기서 $\{\frac{1}{\sqrt{2\pi}} e^{imx} | -N \leq m \leq N \}$는 정규직교집합임에 주목하라. 우리가 하고 있는 곱한 후 적분하는 과정은 일종의 (추상적인 벡터공간에서) 정사영이고, 이 정사영의 과정으로 얻어지는 정보로 원래 함수를 복원할 수 있는지를 알고 싶다. 이제 삼각다항식으로 표현되는 함수들의 경우, 정사영을 통해 함수 전체를 복원할 수 있다는 결과를 얻는다는 점이 중요하다.

 

 2-2. 삼각 급수

정의. (삼각급수)

다음의 식을 삼각 급수라 부른다:

$$f(x) = \Sigma_{-\infty}^{\infty} c_{n} e^{inx}, c_{n} \in \mathbb{C}$$

 

여기서는 일단 $\Sigma_{\infty}^{\infty}$가 무엇을 의미하는지 알야아 한다. 어떤 $x$에서 $f(x)$가 존재한다는 것은, $lim_{N\to\infty} \Sigma_{-N}^{N} c_{n}e^{inx}$가 존재한다는 것을 의미한다. 

 

따라서 $f$는 일종의 무한차 삼각다항식이라고 볼 수 있다. 엄밀히 말해서는 $f$가 존재하는 $x$에 대해서만 저 식을 삼각급수라 불러야 하나, 이 책에서는 이를 별도로 언급하고 넘어가지 않고 있다. 따라서 앞으로는 $c_{n}$과 관련된 조작을 할 때 $f$가 수렴하는 범위에서 그런 조작을 한다고 이해하면 될 것 같다.

 

이 때 우리가 $\int_{-\pi}^{\pi} f(x) e^{-inx} dx$를 통해 계수를 복원하고 싶다. 허나 우리는 균등수렴에 관한 정리가 이 상태에서는 없으므로 이 조작을 할 수 없다는 점에 유의하라.

 

 2-3. 푸리에 급수

 $f$가 $[-\pi, \pi]$서 리만적분 가능한 함수라고 하자. 이제 다음의 복소수는 모든 정수 $n$에 대해 존재한다:

$$c_{n} = \int_{-\pi}^{\pi} f(x)e^{-inx} dx$$

이제 이렇게 정의된 계수로 만든 삼각급수 $\Sigma_{-\infty}^{\infty} c_{n} e^{inx}$를 $f$의 푸리에 급수라 하고, 표기법상으로 $$f ~ \Sigma_{-\infty}^{\infty} c_{n} e^{inx}$$라 표기한다 (이 표기는 삼각급수가 $f$로부터 유도될 뿐이고, 실제 $f$로 수렴하는지는 모르기 때문에 사용한다).

 

이제 핵심적인 문제는 다음과 같다:

$f$를 바탕으로 어떤 삼각급수를 만들었다 하자. $f$가 어떤 성질을 가지면 그 삼각급수가 원함수로 수렴할까?  

 

3. 푸리에 급수의 탐구

 3-1. 푸리에 급수 계수들의 상한: Bessel's Inequality

푸리에 급수가 원래 함수에 수렴하는지에 대해서는 보장이 가능하지 않다. 그러나, 푸리에 급수의 부분합은 어떤 의미에서는 "같은 차수 이하의 삼각 다항식 중에서는" 가장 좋은 근사라고 할 수 있는데, 이것이 다음의 정리를 통해 나타난다:

 

정리 8.11

우리가 고려하는 함수공간의 원소들은 $[a,b]$서 리만적분 가능하다 하고, $\{\phi_{n}\}$이 함수들의 정규직교 집합이라 하자. 이제 $c_{m} = \int_{a}^{b} f(x) \overline{\phi_{m}}(x)dx$의 작업을 통해 $f$의 푸리에 급수를 유도할 수 있다. 이제 푸리에 급수의 $m$차 부분합을 $s_{m} = \Sigma_{n=1}^{m} c_{n} \phi_{n}$이라 하자.

 

이제 $t_{m} = \Sigma_{n=1}^{m} \gamma_{n} \phi_{n}$이라 할 때, 다음이 성립한다:

$$ \int_{a}^{b} |f(x) - s_{m}(x)|^{2} dx \leq \int_{a}^{b} |f(x) - t_{m}(x)|^{2}dx$$

 

 

#주석. 여기서 $\phi_{m}$들의 함수들이 통상적으로 사용하는 지수함수 $e^{imx}$이라면, 푸리에 급수의 부분합이 같은 차수 이하의 삼각다항식들 중 최고의 근사라는 의미를 정리가 내포함을 안다.

또한, 정리가 말하는 "최고의 근사"라는 것은 적분에 의해 정의되는 노름임에 유의하라. 예컨대 함수공간에서의 sup norm과는 다른 형태이다.

 

증명.

다음의 사실에 주목하자:

$$\int_{a}^{b} f(t) \overline{t}_{m}(t) dt \\ = \Sigma_{n=1}^{m} \overline{\gamma}_{m} \int_{a}^{b} f(t) \overline{\phi}_{n}(t) dt \\ = \Sigma_{n=1}^{m} c_{n} \overline{\gamma}_{n}$$

 

따라서, 다음이 성립한다:

$$ \int_{a}^{b} (f(x) - t_{m}(x))(\overline{f}(x) - \overline{t}_{m}(x)) dx \\ = \int_{a}^{b} |f(x)|^{2} dx - \int_{a}^{b} f(x) \overline{t}_{m}(x) dx - \int_{a}^{b} \overline{f}(x) t_{m}(x) + \int_{a}^{b} |t_{m}(x)|^{2} dx \\ = \int_{a}^{b} |f(x)|^{2} dx - \Sigma_{n=1}^{m} c_{n} \overline{\gamma}_{n} - \Sigma_{n=1}^{m} \overline{c}_{n} \gamma_{n} + \Sigma_{n=1}^{m} |\gamma_{n}|^{2} \\ = \int_{a}^{b} |f(x)|^{2}dx - \Sigma_{n=1}^{m} |c_{n}|^{2} + \Sigma_{n=1}^{m} |c_{n} - \gamma_{n}|^{2}$$

 

이제 이 수량이 최소가 되기 위한 필요충분조건이 $c_{n} = \gamma_{n}$이라는 것을 알 수 있다.

 

이 식으로부터 다음의 사실을 알 수 있다:

$$ \int_{a}^{b} |f(x) - s_{m}(x)|^{2} dx = \int_{a}^{b} |f(x)|^{2} dx - \Sigma_{n=1}^{m} |c_{n}|^{2} \geq 0 \\ \Rightarrow \int_{a}^{b} |f(x)|^{2} dx \geq \Sigma_{n=1}^{m} |c_{n}|^{2}$$

 

여기서 $m \to \infty$에도 여전히 부등식이 성립한다:

 

따름정리. (Bessel's Inequality)

$$ \Sigma_{n=1}^{\infty} |c_{n}|^{2} \leq \int_{a}^{b} |f(x)|^{2}$$

 

특히 만약 $\phi_{n}$이 $e^{inx}$의 꼴이고, 삼각다항식이 $s_{N}(x) = \Sigma_{n=1}^{N} c_{n} e^{inx}$로 주어지면, 부등식은 $ \frac{1}{2\pi} \int_{-\pi}^{\pi} |s_{N}(x)|^{2}dx = \Sigma_{-\infty}^{\infty} |c_{n}|^{2} \leq \frac{1}{2\pi} \int_{-\pi}^{\pi} |f(x)|^{2}dx$로 주어진다.

 

 3-2. 립시츠 연속은 점별수렴을 보장

푸리에 급수가 원함수에 점별수렴하도록 보장하는 약한 조건들이 있다면 참 좋을 것이다. 일단은 립시츠 연속이라는 매우 강력한 조건을 이용하여 점별수렴을 보장하도록 한다.

 

정리 8.14 (립시츠 연속은 점별수렴을 보장)

$f$는 $[-\pi, \pi]$서 리만적분 가능한 함수이고 $2\pi$의 주기를 가진 함수라 하자. 또한, 어떤 점 $x\in [-\pi, \pi]$에서 다음이 성립한다 하자:

$$ \exists \delta > 0 , M > 0 \space\space s.t. |x-y|< \delta \Rightarrow |f(x)-f(y)| < M|x-y|$$

 

이제 함수 $f$와 점 $x$로부터 유도한 푸리에 급수의 $n$차 부분합을 $s_{n}(f;x) = \Sigma_{-n}^{n} c_{k}e^{ikx}$이라 하면, 다음이 성립한다:

$$lim_{n \to \infty} s_{n}(f;x) = f(x)$$

 

 

증명.

$f$는 $2\pi$ 주기 함수이고 $[\pi, \pi]$서 리만적분 가능하다. 따라서 푸리에 급수의 계수를 정의할 수 있는데, 우리는 정규직교 함수들의 집합으로 지수함수를 택하기로 한다.

이 경우

$$c_{n} = \frac{1}{2\pi} \int_{-\pi}^{\pi} f(t) e^{-int} dt$$

이고, 따라서

 

$$ c_{n} e^{inx} = \frac{1}{2\pi} \int_{-\pi}^{\pi} f(t) e^{in(t-x)}dt \\ = \frac{1]{2\pi} \int_{-\pi}^{\pi} f(x-t)e^{int} dt$$

이다. 여기서 둘째 등식은 변수 치환을 한 후, 주기성에 의해 적분구간을 옮길 수 있음을 이용한 것이다.

 

표기법상의 편의를 위해 다음과 같이 디리클레 커널을 정의한다:

$$D_{N}(x) = \Sigma_{n=-N}^{N} e^{inx}$$

이 경우

$$s_{N}(f;x) = \Sigma_{n=-N}^{N} c_{n}e^{inx} \\ = \frac{1}{2\pi} \int_{-\pi}^{\pi} f(x-t) \Sigma_{n=-N}^{N} e^{int}dt \\ = \frac{1}{2\pi} \int_{-\pi}^{\pi} f(x-t) D_{N}(t)dt$$

또한, $\int_{-\pi}^{\pi} D_{N}(t)dt = 1$이므로 $\int_{-\pi}^{\pi} f(x)D_{N}(t) dt = f(x)$임에 주목하라.

 

이제 마지막으로, 디리클레 커널을 계산해 보면,

$$ D_{N}(x) = \begin{cases} \frac{sin((N+\frac{1}{2})x)}{sin(\frac{1}{2}x)} \space\space x \neq 0 \\ 2N \space\space x = 0 \end{cases}$$

이 성립한다.

 

구간에서의 리만적분의 경우 한 점을 변화시킨다고 적분값이 달라지지는 않는다. 따라서 다음의 함수를 정의한다:

 

$$ g(t) = \begin{cases} \frac{f(x-t)-f(x)}{sin(\frac{1}{2}x)} \space\space x \neq 0 \\ 0 \space\space x = 0 \end{cases}$$

이제 다음이 성립한다:

 

$$ s_{N}(f;x) - f(x) =  \int_{-\pi}^{\pi} g(t) sin((N+\frac{1}{2})t) dt \\ = \int_{-\pi}^{\pi} [g(t) sin(\frac{1}{2}t)] cos(Nt) dt + \int_{-\pi}^{\pi} [g(t) cos(\frac{1}{2}t)] sin(Nt) dt $$

 

 

그런데 $f$가 립시츠 연속이므로 $g$는 유계이고, 더욱이 $g * sin(\frac{1}{2}t), g * cos(\frac{1}{2}t)$는 리만적분 가능한 함수와 유계함수의 곱이므로 리만적분 가능하다. 따라서 저 값들은 결국 새로운 정규직교 집합을 $\{ \frac{1}{\sqrt{2\pi}}, \frac{sin(t)}{\sqrt{\pi}}, \frac{cos(t)}{\sqrt{\pi}}, ... \}$으로 세웠을 때의 푸리에 계수들이고, Bessel's inequality에 의해 $n\to\infty$에서의 극한값은 모두 0이다. 이로써 증명이 마무리된다.  $\square$  

 

따름정리.

$f(x) = 0$이 어떤 열린 구간 $J$서 성립한다 하자. 이제 $x\in J \Rightarrow lim_{N\to\infty} s_{N}(f;x) = 0$이다.

 

증명.

$J$서 $f$는 상수함수이므로 립시츠 연속이다. 따라서 푸리에 급수의 부분합이 원함수로 점별수렴한다. 그런데 원함수가 0이므로, 푸리에 급수도 0으로 점별수렴한다. $\square$

 

 3-3. 푸리에 급수는 원함수에 "수렴": Parseval's Theorem

$f,g$가 $2\pi$의 주기를 가지고 $[-\pi, \pi]$서 리만적분 가능하다 하자. 이제 특히 연속함수에 대해서는 앞서 배운 Stone-Weierstrass 정리를 활용할 수 있다:

 

정리 8.15 (연속함수는 삼각다항식으로 근사가능)

$f$는 $2\pi$의 주기를 가지고 $[-\pi. \pi]$서 연속이라 하자.

이제 임의의 $\epsilon>0$에 대해 어떤 삼각다항식 ($f$의 푸리에 급수라는 보장은 없다) $P$가 존재하여,

$$||f - P|| < \epsilon$$이 성립한다.

 

 

증명.

$g: \mathbb{R} \to \mathbb{C}, g(x) = e^{ix}$라고 정의하면, $[0,2\pi)$서 정의된 삼각다항식 $f(x) = \Sigma_{-N}^{N} c_{n} e^{inx}$을 복소평면 위의 단위원 $T$에서 정의된 함수로 생각할 수 있다. 이제 다음이 성립한다:

 

i) $T$에서 정의된 삼각다항식의 집합 $\mathcal{A}$는 self-adjoint algebra이다:

$\overline{f}(x) = \Sigma_{-N}^{N} \overline{c_{n}} e^{-inx} = \Sigma_{-N}^{N} \overline{c_{-n}} e^{inx}$

 

ii) $\mathcal{A}$는 SP와 VNP를 만족한다.

VNP: $f(x) = c_{0}, c_{0} \neq 0$은 VNP를 만족시키기에 충분하다.

SP: $x_{1} \neq x_{2}$라 하자. $f(x) = e^{ix}$를 $T$상에서 바라본 함수 $g(z) = z$는 이미 SP를 만족시키기에 충분하다. ($x_{1}, x_{2}$는 $T$ 상의 다른 점이기 때문)

 

iii) $f$는 $[-\pi, \pi]$서 연속이므로 $\mathcal{b}(T, \mathbb{C})$의 원소이다.

 

정리 7.33에 의해서, $\overline{\mathcal{A}}^{U} = \mathcal{b}(T,\mathbb{C})$이고, 따라서 $f$ 역시 $\overline{\mathcal{A}}^{U}$의 원소이고 이것이 정리를 증명한다. $\square$

 

 

이제 연속성이 성립되지 않는다면 어떤 말을 할 수 있는지가 문제된다. 그런데 Parseval's Theorem은 푸리에 급수의 부분합이 "적분상으로는" 원함수에 수렴한다는 이야기를 한다. 이를 위해서는 6단원 연습문제 12번 (임의의 적분가능함수에 대해, "적분상으로"는 원하는 만큼 가까운 연속함수가 있다)를 활용한다:

 

정리 8.16 (Parseval's theorem)

$f,g$는 주기 $2\pi$를 가진 리만적분 가능함수라 하자. 또한, $f(x) \sim \Sigma_{-\infty}^{\infty} c_{n} e^{inx},  g(x) \sim \Sigma_{-\infty}^{\infty} \gamma_{n}e^{inx}$의 꼴로 푸리에 급수가 주어진다 하자.

 

이제 다음의 사실들이 성립한다:

 

a) $$ lim_{N \to \infty} \frac{1}{2\pi} \int_{-\pi}^{\pi} |f(x) - s_{N}(f;x)| ^{2} dx  = 0$$

b) $$\frac{1}{2\pi} \int_{-\pi}^{\pi} f(x)\overline{g(x)} dx = \Sigma_{-\infty}^{\infty} c_{n} \overline{\gamma}_{n}$$

c) $$\frac{1}{2\pi} \int_{-\pi}^{\pi} |f(x)|^{2} dx = \Sigma_{-\infty}^{\infty} |c_{n}|^{2}$$

 

 

증명.

a)

첫째, 구간 $[a,b]$서 리만적분 가능한 함수들에 대해 다음의 노름을 정의할 수 있음을 상기하라:

$$ ||f-g||_{2} := (\int_{a}^{b} |f-g|^{2} dx)^{\frac{1}{2}}$$

특히, 삼각부등식은 통상적인 코시-슈바르츠 부등식의 증명과정과 유사하게 증명된다.

 

둘째, 임의의 적분가능 함수는 그 구간에서 연속함수로 "적분 노름상" 잘 근사될 수 있다는 점을 상기하라.

 

셋째, 정리 8.15에 의해 임의의 연속함수는 어떤 삼각다항식에 의해 "점별로" 잘 근사될 수 있다는 점을 상기하라.

 

넷째, 정리 8.11에 의해 푸리에 급수의 부분합은 차수가 같거나 낮은 삼각다항식 중에서는 "적분상" 최선의 근사가 됨을 기억하라.

 

마지막으로, Bessel's inequality에 의해 푸리에 급수의 계수들의 합이 적분에 의해 주어지는 상한에 의해 유계임을 상기하라.

 

$\epsilon > 0$을 잡는다. 이제 $||f-h||_{2} < \frac{\epsilon}{3}$가 되는 연속함수 $h$를 잡을 수 있다.

둘째로, 정리 8.15에 의해 $h$에 점별로 충분히 가까워서, $||h-P||_{2} < \frac{\epsilon}{3}$가 성립하는 삼각다항식 $P$를 잡을 수 있다.

이제 $P$가 $M$차 삼각다항식이라 하자. 그렇다면, $N \geq M$인 모든 $N$에 대해, $||h- s_{N}(h)|| \leq ||h - P||_{2} < \frac{\epsilon}{3}$가 성립할 것이다.

 

또한, Bessel's inequality에 의해 $||s_{N}(f) - s_{N}(h)||_{2}  =||s_{N}(f-h)||_{2} \leq ||f-h||_{2}$가 성립한다.

 

따라서, 삼각부등식에 의해 $N \geq M$인 모든 자연수 $N$에 대해,

$$ ||f-s_{N}(f)||_{2} \leq ||f - h||_{2} + ||h - s_{N}(h)||_{2} + ||s_{N}(h) - s_{N}(f)||_{2} < \frac{\epsilon}{3} * 3 = \epsilon$$이 성립하고 이것이 정리를 증명한다.

 

 

b) $$|\frac{1}{2\pi} \int_{-\pi}^{\pi} f(x) \overline{g(x)} dx - \frac{1}{2\pi} \int_{-\pi}^{\pi} s_{N}(f;x) \overline{g(x)} dx|  \\ \leq \frac{1}{2\pi} (\int_{-\pi}^{\pi} |f(x) - s_{N}(f;x)|^{2} dx)^{\frac{1}{2}} (\int_{-\pi}^{\pi} |g(x)|^{2}dx)^{\frac{1}{2}}$$

이다. 따라서, $$\int_{-\pi}^{\pi} f(x)\overline{g(x)} dx = lim_{N\to\infty} \Sigma_{-N}^{N} c_{n} \int_{-\pi}^{\pi} \overline{g(x)} \phi_{n}(x) dx \\ = lim_{N\to\infty} \Sigma_{-N}^{N} c_{n} \overline{\gamma_{n}}$$이다.

여기서 수열의 수렴성은, Schwarz inequality를 쓴 후 Bessel's inequality를 사용하면 (리만 적분 가능성에 의해) 유도된다.

 

 

c) b)에 $g = f$를 대입하면 바로 증명된다. $\square$

 

 

 

이로써 중간범위가 끝났다. 다음 시간에는 감마 함수를 나갈 듯한데, 일단 다음주가 중간이므로 중간고사를 보고 복습을 올리도록 하겠다.

오늘은 Friedberg 6.8 Bilinear and Quardatic forms를 마저 다루도록 하겠다.

목차는 다음과 같다:

 

1. 쌍선형 형식의 대각화

 1-1. 대칭 쌍선형 형식

 1-2. 쌍선형 형식은 언제 대각화 가능한가?

 

2. (실수체 위의) 이차형식

 2-1. 이차형식의 정의

 2-2. 이차형식의 대각화와 함의

 

3. Sylvester 정리

 

 

1. 쌍선형 형식의 대각화

1-1. 대칭 쌍선형 형식

우리는 앞서 벡터공간 $(V,\mathbb{F})$에 대해 정의된 쌍선형 형식 $H: V \times V \to \mathbb{F}$가 있을 때, $V$의 기저 $\beta = \{v_{1},...,v_{n}\}$가 주어지면 $H$를 행렬로 유일하게 표현할 수 있음을 배웠다.

이제 $H$를 표현한 행렬들이 각종 좋은 성질들을 만족할 때, 이것이 $H$와 어떤 관련이 있는지를 살펴보고자 한다.

우선 다음의 정의를 내린다:

 

정의. (대칭 쌍선형 형식)

$H: V \times V \to \mathbb{F}$가 모든 $x,y\in V$에 대해 $H(x,y) = H(y,x)$를 만족하면, $H$는 대칭 쌍선형 형식이다.

 

 

이제 대칭 쌍선형 형식의 행렬표현이 대칭행렬인지를 살펴본다.

 

 

정리. (대칭 쌍선형 형식의 행렬표현)

$H:V\times V\to\mathbb{F}$가 대칭 쌍선형 형식이라 하자. 이제 $\beta$가 $V$의 임의의 기저이면, $\psi_{\beta}(V)$는 대칭행렬이다.

역으로, 임의의 기저 $\beta$에 대해 $\psi_{\beta}(V)$가 대칭행렬이면, $H:V\times V\to \mathbb{F}$가 대칭 쌍선형 형식이다.

 

증명.

$(\Rightarrow)$ $H$가 대칭 쌍선형 형식이라 하자. 또한 $A = \psi_{\beta}(H), \beta = \{v_{1},v_{2},...,v_{n}\}$라 두자.

이제 $A_{ij} = H(v_{i}, v_{j}) = H(v_{j},v_{i}) = A_{ji}$이다.

 

$(\Leftarrow) J: V\times V \to \mathbb{F}, J(x,y) := H(y,x)$로 정의한 쌍선형 형식을 고려하자.

이제 어떤 기저 $\beta = \{v_{1},...,v_{n}\}$을 잡고 $A = \psi_{\beta}(H), B = \psi_{\beta}(J)$라 두면,

$B_{ij} = J(v_{i}, v_{j}) = H(v_{j},v_{i}) = A_{ji}=  A_{ij}$이므로 $A = B$이다.

그런데 선형변환 $\psi_{\beta}: \mathcal{B}(V) \to \mathcal{M}_{n\times n}(\mathbb{F})$는 전단사이므로, $J = H$이다.

 

 

따라서 대칭 쌍선형 형식은 곧 대칭행렬로 표현되며 대칭행렬은 대칭 쌍선형 형식의 표현이라는 사실을 알 수 있다.

 

 1-2. 쌍선형 형식은 언제 대각화 가능한가?

선형변환을 마치 일차함수 $y = cx$의 합으로 나타낼 수 있으면 계산도 편리하고 표현도 깔끔해졌다는 사실을 상기하라.

이제 우리는 마찬가지로 쌍선형 형식 $H(x,y)$를 마치 일차함수 $y = cH(v_{i}, v_{i})$의 합으로 나타내고자 한다.

 

정의. (쌍선형 형식의 대각화 가능성)

$H: V \times V \to \mathbb{F}$가 유한차원 벡터공간에서 정의된 쌍선형 형식이라 하자. 또한 $\beta = \{v_{1} , ... , v_{n}\}$인 어떤 $V$의 기저가 존재하여, $\psi_{\beta}(H)$가 대각행렬이 된다 하자. 그렇다면 $H$는 대각화 가능하다고 한다.

 

명제.

모든 대각화 가능한 쌍선형 형식은 대칭 쌍선형 형식이다.

 

증명.

앞선 정리에 의해, 한 기저로 표현했을 때 대칭이면 모든 기저로 표현했을 때 대칭이라는 사실에 주목하라.

$H: V \times V \to\mathbb{F}$가 대칭 쌍선형 형식이라면, $V$의 기저 $\beta$가 존재하여 $\psi_{\beta}(H)$가 대각행렬이 된다. 그런데 대각행렬은 명백히 대칭행렬이다.

 

 

이제 역이 성립하는지가 문제된다. 예컨대 $\mathbb{F} = \mathbb{R}$이고 $V$가 내적공간이라면 명백히 스펙트럴 정리에 의해 역이 성립할 것이다. 그러나 이것보다 훨씬 일반적인 체의 경우에도, $\mathbb{F}$에서 $1+1 = 0$이 성립하면 안된다는 제한조건만 부과하면 역이 성립한다.

 

 

이를 위해 다음의 보조정리를 증명한다:

 

보조정리.

$H: V \times V \to \mathbb{F}$가 대칭 쌍선형 형식이고 $\mathbb{F}$는 $1+1 \neq 0$이라 하자.

이제 $H$가 항등적으로 0이 아니라면, $\exists x \in V, H(x,x) \neq 0$이다.

 

증명.

$H \not\equiv 0$이므로,  $\exists x,y\in V, H(x,y) \neq 0$이다.

이제 $H(x+y,x+y) = H(x,x)+H(y,y)+2H(x,y)$이므로, 최소한 $H(x,x), H(y,y), H(x+y,x+y)$ 중 하나 이상은 0이 아니다.

(여기서 2를 곱하는 것이 문제되지 않는 이유 역시 $1+1 \neq 0$ 때문임에 주목하라)

 

 

본 정리. (대칭 쌍선형 형식은 대각화 가능하다)

유한차원 벡터공간 $V$에 대해 $H: V \times V \to \mathbb{F}$가 대칭 쌍선형 형식이고 $\mathbb{F}$는 $1+1 \neq 0$가 성립한다 하자.

이제 $H$는 대각화 가능하다.

 

본 정리의 증명.

$V$의 차원에 대해 귀납법을 사용한다.

Case 1. $dim(V) = 1$인 경우

$H$가 대칭 쌍선형 형식이고 $\beta = \{v\}$가 $V$의 임의의 기저라 하면, $\psi_{\beta}(H)$는 $1\times 1$ 행렬로 대각행렬이다.

 

Case 2. $dim(V) = n-1 \Rightarrow dim(V) = n$

$dim(V) = n$이라 하고 $H$는 $V$서 정의된 대칭 쌍선형 형식이라 하자.

만약 $H \equiv 0$이라면 어떤 기저를 골라도 표현이 영행렬이므로 대각행렬일 것이다.

따라서 $H\not\equiv 0$이라 하자.

보조정리에 의해 $\exists x \in V, H(x,x)\neq 0$이다.

 

이제 다음의 선형변환을 정의한다:

$$L_{x} : V \to \mathbb{F}, L_{x}(y) = H(x,y)$$

$L_{x}(x) \neq 0$이므로 $L_{x}$의 위수는 1이고, 따라서 $N(L_{x})$는 $V$의 $n-1$차원 부분공간이다.

이제 $H$를 $N(L_{x})$에 제한한 함수 $\tilde{H}$는 여전히 대칭 쌍선형 형식이고 차원이 $n-1$이므로, 귀납법 가정에 의해 기저 $\beta' = \{v_{1},...,v_{n-1}\}$가 존재하여 $H(v_{i}, v_{j}) = H(v_{i},v_{i}) \delta_{ij}$가 성립한다. ($\delta_{ij}$는 크로네커 델타이다.)

 

또한, $L_{x}(v_{i}) = 0$이므로, $x \not\in span\{v_{1},...,v_{n-1}\}$이고, 따라서 $\beta = \beta' \cup \{x\}$는 $V$의 기저이다.

 

이제 마지막으로, $L_{x}$의 정의에 의해 $H(x, v_{i}) = H(v_{i},x) = 0$임에 주목하면, $\psi_{\beta}(H)$가 대각행렬임을 알 수 있다. $\square$

 

 

앞서 말했듯, $V$가 실내적공간이면 스펙트럴 정리에 의해 다음이 성립한다:

정리. (실내적공간 위의 대칭 쌍선형 형식은 정규직교기저로 대각화 가능)

$V$가 유한차원 실내적공간이고 $H$는 $V$서 정의된 대칭 쌍선형 형식이라 하자. 이제 정규직교기저 $\gamma$가 존재하여 $\psi_{\gamma}(H)$가 대각행렬이다. 즉, $H$는 정규직교기저로 대각화 가능하다.

 

증명.

$V$의 아무 정규직교기저 $\beta$를 택하면, $\psi_{\beta}(H)$는 실대칭행렬이다. 이제 스펙트럴 정리의 행렬 버전에 의해, 어떤 orthogonal 행렬 $Q$가 존재하여 $Q^{-1}\psi_{\beta}(H)Q= D$, $D$는 대각행렬이 된다.

 

그런데 $Q$가 orthogonal하므로 $Q^{T} = Q^{-1}$이고, 따라서 어떤 orthogonal 행렬 $Q$가 존재하여 $Q^{T}\psi_{\beta}(H)Q = D$가 된다.

이제 $w_{j} = \Sigma_{i=1}^{n} Q_{ij}v_{i}$로 정의하면 $Q$가 orthogonal하므로 $\gamma = \{w_{1},...,w_{n}\}$는 정규직교 기저이고, $\psi_{\gamma}(H) = Q^{T}\psi_{\beta}(H)Q = D$가 된다. $\square$

 

이는 이후 이차형식에서 요긴하게 쓰일 정리이다.

 

 

2. (실수체 위의) 이차형식

 2-1. 이차형식의 정의

쌍선형 형식의 활용으로 이차형식이 존재한다.

 

정의. (이차형식)

어떤 함수 $(V,\mathbb{F})$가 벡터공간이라 하자. $K: V \to \mathbb{F}$가 이차형식이라는 것은, 대칭 쌍선형 형식 $H:V\times V \to \mathbb{F}$가 존재하여 $K(x) = H(x,x)$가 성립하는 것을 의미한다.

 

체가 $1+1 \neq 0$을 만족한다면, $H(x,y) = \frac{1}{2} K(x+y) - K(x) - K(y)$를 통해 대칭 쌍선형 형식을 복원할 수 있다.

 

우리는 특히 $\mathbb{R}$을 체로 가지는 경우 정의되는 이차형식에 관심이 있는데, 이는 대응되는 대칭 쌍선형 형식을 대각화할 수 있기 때문이다.

 

 2-2. 이차형식의 대각화와 함의

예컨대 $V = \mathbb{R}^{n}$이라 하고, $H(x,y) = x^{T}Ay$의 꼴로 주어진 대칭 쌍선형 형식이 있다면, $Q^{T}AQ = D$가 되는 orthogonal 행렬 $Q$가 존재한다. 따라서 $H(x,y) = (Qx)^{T}D(Qy)$이고, $K(x) = (Qx)^{T}D(Qx)$가 되어 사실상 $K$는 $x$를 어떤 다른 좌표계로 나타낸 이후, 계수를 좌표들로 하는 완전제곱식의 합이 된다.

 

이는 예컨대 헤시안의 정부호성을 통해 함수의 이계필요/충분조건을 검증할 때 활용된다.

 

(보충 예정)

 

 

3. Sylvester 정리

두 $n\times n$ 행렬 $A,B$가 합동관계를 만족한다는 것은, 가역행렬 $Q$가 존재하여 $Q^{T}AQ = B$가 성립함을 의미한다. 또한 이는 결국 $A,B$가 동일한 쌍선형 형식의 다른 표현에 불과함을 의미하였다.

이제 우리는 임의의 두 행렬 $A,B$가 합동관계인지 판별하고 싶다고 하자. 이는 매우 어려운 작업이므로, 우선 (대각화될 수 있다는 사실을 아는) 실대칭행렬 $A,B$의 합동관계를 판별하고 싶다고 하자.

 

그렇다면 우선 실벡터공간 $V$에서 정의된 대칭 쌍선형 형식 $H: V\times V \to \mathbb{F}$를 다른 기저에 대해서 행렬표현을 할 때, 변하지 않는 양이 있는지를 아는 것이 좋을 것이다. 이러한 양을 불변량이라 하는데, 예컨대 두 행렬이 서로 다른 불변량을 가지고 있다면 명백히 둘은 같은 대칭 쌍선형 형식으로부터 유도되지 않았을 것이다.

 

가장 간단한 불변량은 위수이다. 이제 Sylvester 정리는, 대칭 쌍선형 형식을 대각화 했을 때 i) 주대각성분 중 양수의 개수, ii) 주대각성분 중 음수의 개수, iii) 주대각성분 중 0의 개수가 모두 불변량임을 주장한다:

 

 

 

정리. (Sylvester 정리)

$V$가 유한차원 실벡터공간이고, $H:V\times V \to \mathbb{F}$가 대칭 쌍선형 형식이라 하자.

이제 $\beta, \gamma$가 모두 $V$의 기저이고 $A = \psi_{\beta}(H), B = \psi_{\gamma}(H)$가 대각행렬이면, 다음이 성립한다:

 

i) $A$의 주대각성분 중 양수의 개수와 $B$의 주대각성분 중 양수의 개수가 같다. 두 행렬의 index가 같다.

ii) $A$의 주대각성분 중 음수의 개수와 $B$의 주대각성분 중 음수의 개수가 같다. 따라서 두 행렬의 signature이 같다.

 

 

증명.

$dim(V) = n$이라 하고, 이 경우 $A,B$의 위수가 같음을 아므로 $rank(H) = r$이라 하자.

$\beta, \gamma$의 순서를 적절히 조정한 $\beta', \gamma'$을 잡아 다음이 성립하도록 하자:

 

$\beta' = \{v_{1},...,v_{p}, v_{p+1},...,v_{r}, v_{r+1},...,v_{n}\}, \gamma' = \{w_{1},...,w_{q}, w_{q+1}, ..., w_{r}, w_{r+1},...,w_{n}\}$이며,

$$H(v_{i},v_{i}) > 0 \space\space (1\leq i \leq p) \\ H(v_{i},v_{i}) < 0 \space\space (p+1 \leq i \leq r) \\ H(v_{i},v_{i}) = 0 \space\space (r+1 \leq i \leq n)$$이고

$$H(w_{i},w_{i}) > 0 \space\space (1 \leq i \leq q) \\ H(v_{i}, v_{i}) < 0 \space\space (q+1 \leq i \leq r) \\ H(v_{i},v_{i}) = 0 \space\space (r+1 \leq i \leq n)$$이다.

 

 

이제 두 행렬은 위수가 같으므로, i)은 ii)를 함의한다. 귀류법을 사용하기 위해 $p \neq q$라 하자. 일반성을 잃지 않고 $q > p$라 하자.

 

우리는 어떤 $x \in V$를 구성하여, $H(x,x) > 0 $이면서 $H(x,x) \leq 0$을 만족하도록 만들고 싶다.

이를 위해 다음의 선형변환을 구성하자:

 

$$L : V \to \mathbb{R}^{p-q+r} \\ L(x) = (H(v_{1},x), H(v_{2},x),...,H(v_{p},x), H(w_{q+1},x), ... , H(w_{r},x))$$

 

다음의 사실들에 주목하라:

i) $L$이 선형변환임은 $H$의 선형성으로부터 도출된다.

ii) 위수정리에 의해 $rank(L) \leq p-q+r \Rightarrow nullity(L) \geq n-(p-q+r) > n-r$이다.

iii) $span\{v_{r+1},...,v_{n}\} \leq N(L)$

 

따라서, $span\{v_{r+1},...,v_{n}\}$에 들어있지 않으면서 $N(L)$에는 들어있는 벡터 $x$가 존재한다.

이제 $x = \Sigma_{i=1}^{p} a_{i}v_{i} + \Sigma_{i=p+1}^{r} a_{i}v_{i} + \Sigma_{i=r+1}^{n} a_{i}v_{i}$라 하자. 

$x \in N(L)$이므로 $a_{1},...,a_{p} = 0$이다. 그런데 $x \not\in span\{v_{r+1},...,v_{n}\}$이므로 $a_{p+1},...,a_{r}$ 중 하나 이상은 0이 아니다.

 

그러므로 $H(x,x) = \Sigma_{i=1}^{n} a_{i}^{2} H(v_{i},v_{i}) < 0$이다.

 

이제 다른 한편으로는 $x = \Sigma_{j=1}^{n} b_{j}w_{j}$이다. 그런데 $b_{p+1},...,b_{r} = 0$이다. 따라서

$H(x,x) =\Sigma_{j=1}^{n} b_{j}^{2} H(w_{j},w_{j}) \geq 0$이다. 이는 모순이므로 증명이 끝났다. $\square$

 

 

이를 행렬에 적용하면, 대칭행렬 $A$와 어떤 대각행렬 $D$가 합동관계라면, $A$랑 합동인 다른 모든 대각행렬은 $D$와 index와 signature이 같다. ($A$로부터 대칭 쌍선형 형식을 정의할 수 있기 때문)

 

또한, $J_{pr} = \begin{pmatrix} I_{p} \space\space O \space\space O \\ O \space\space -I_{r-p} \space\space O \\ O \space\space O \space\space O \end{pmatrix}$라는 행렬들이 일종의 대칭행렬의 prototype가 되어, 모든 대칭행렬은 알맞은 $p,r$에 대해 유일한 $J_{pr}$과 합동관계에 있게 된다.

 

 

 

다음 글부터는 수치선대 쪽으로 나가서, 선형 연립방정식의 해가 계수에 크게 의존하는 조건들을 살펴보도록 하겠다.

*사실 원래 진도대로라면 Stone-Weierstrass 정리를 먼저 다룬 후 (유계 닫힌 구간에서는, 다항식들로 임의의 연속함수를 "잘 근사"할 수 있다), 이러한 근사가 가능하게 되는 함수집합의 조건이 Separating points와 Non-vanishing at every point이라는 사실을 살펴보아야 한다. 그러나 8장의 진도와 크게 관련이 없으며 필자가 그 부분을 복습하기에 시간이 오래 걸릴 것으로 예상하는 바, 일단은 8장 진도를 먼저 복습하기로 하였다.

 

 

이전 미적분학 시간이나 해석개론 1 시간에서, 우리는 $k$번 미분 가능한 함수는 근방에서 $k$차 다항식으로 근사할 수 있으며, 무한 번 미분가능한 함수는 주어진 점 근방의 함수를 테일러 급수로 표현할 수 있음을 보았다.

 

따라서 우리는 다음과 같은 "테일러 급수"의 (사실은 real-anlaytic) 함수들에 관심이 있다:

 

$$ f(x) = \Sigma_{n=0}^{\infty} c_{n} x^{n}, c_{n} \in \mathbb{R}$$

 

여기서 당장 문제되는 것들이 눈에 보인다. 이러한 문제의식을 파고 들어감으로써, 언제 이런 급수 형태의 함수들을 잘 다룰 수 있는지를 알게 될 것이다.

 

i) $f$는 무한급수의 형태로 표현된다. 허나 일반적으로 무한급수는 존재한다는 보장이 없다.

ii) 예컨대 $f$가 어떤 점 근방에서 정의된다고 하자. 그런데 우리는 $f$가 미분가능한지 알고 싶다고 하자. 유한 차 다항식은 항상 무한히 미분 가능하지만, $f$는 유한 차 다항식이 아니다.

iii) $f$가 무한히 미분 가능하다 하자. 그렇다면 $f$는 일종의 "테일러 급수"이므로, $f$의 테일러 전개를 하면 계수들이 그대로 얻어질 것으로 기대할 수 있다. 그러나 무한히 미분 가능한 함수라고 해서 테일러 전개가 원래 함수에 수렴한다는 보장은 없다. (이러한 성질이 성립하는 함수는 real-analytic function이라 한다.) 언제 이러한 성질이 성립하는가?

 

 

수렴반경과 관련한 다음의 결과를 상기하라:

 

보조정리.

멱급수 $\Sigma_{n=0}^{\infty} c_{n}x^{n}$를 고려하자. 이제 $R = \frac{1}{limsup_{n\to\infty} \sqrt[n]{|c_{n}|}}$이라 하자. (단, limsup = 0이면 $R = \infty$로 약속한다.)

이제 $|x| < R$이면, $\Sigma_{n=0}^{\infty} c_{n}x^{n}$은 절대수렴한다. 또한, $|x|>R$이면, $\Sigma_{n=0}^{\infty} c_{n}x^{n}$은 발산한다. 이러한 $R$을 멱급수 $\Sigma_{n=0}^{\infty}c_{n}x^{n}$의 수렴반경이라 부른다.

 

 

증명.

$limsup = 0$인 경우는 독자에게 맡긴다.

$limsup \neq 0$인 경우를 살펴본다. $|x|<R$이라 하자. 이제 우리는 $\Sigma_{n=0}^{\infty} |c_{n}||x^{n}|$의 수렴성을 판별하고 싶다. 이를 위해 n-th root test를 활용한다.

$$ \sqrt[n]{|c_{n}||x^{n}|} = \sqrt[n]{|c_{n}|} |x| = R*\sqrt[n]{|c_{n}|} (\frac{|x|}{R}) \\ limsup_{n\to\infty} (R*\sqrt[n]{|c_{n}|})(\frac{|x|}{R}) = \frac{|x|}{R} < 1$$이므로, n-th root test에 의해 이 급수는 절대수렴한다는 사실을 안다.

한편 $|x|>R$이면,

$$\exists \delta >0, n_{k} \space s.t. \space \sqrt[n]{|c_{n_{k}}|}|x| > 1+\delta \\ \Rightarrow |c_{n_{k}}||x|^{n_{k}} > (1+\delta)^{n_{k}} \\ \Rightarrow lim_{n\to\infty}|c_{n}||x^{n}| \neq 0$$이므로 급수가 수렴하지 않는다. $\square$

 

 

이제 멱급수꼴 함수에 대한 다음의 정리를 주장할 수 있다:

 

정리 8.1

$f(x) = \Sigma_{n=0}^{\infty} c_{n} x^{n}$이 수렴반경 $R$을 가지고 있다 하자. 이제 다음의 사실들이 성립한다:

i) $\epsilon >0$에 대해 $f$는 $[-R+\epsilon, R-\epsilon]$에서 균등수렴한다. (만약 $R  = \infty$라면, 임의의 상수 $M>0$에 대해 $[-M,M]$서 균등수렴한다.)

ii) $f$는 $(-R,R)$서 미분가능하다.

iii) $x\in (-R,R) \Rightarrow f'(x) = \Sigma_{n=1}^{\infty} nc_{n}x^{n-1}$

 

i)의 증명.

$\epsilon > 0$이 주어졌다 하자. 우리는 Weierstrass의 M-test를 이용하여 (Thm 7.10) 균등수렴성을 보일 것이다. $g_{n}(x) = c_{n}x^{n}$이라 하면, $y=x^{n}$은 증가함수이므로 $|g_{n}(x)| = |c_{n}||x^{n}| \leq |c_{n}|(R-\epsilon)^{n}$이다. 또한, $\Sigma_{n=0}^{\infty} |c_{n}|(R-\epsilon)^{n}$은 $R-\epsilon \in (-R,R)$이므로 보조정리에 의해 유한하다. 따라서, Weierstrass M-test에 의해 $f$는 $[-R+\epsilon, R-\epsilon]$에서 균등수렴한다. 

 

iii)의 증명.

iii)을 보이면 ii)는 (미분계수가 존재한다는 의미이므로) 자동으로 따라온다.

$x\in (-R,R)$을 고정하자. $N_{\delta}(x) \subset [-R+\epsilon , R-\epsilon]$을 만족하도록 어떤 근방과 $\epsilon>0$을 잡는다. 이제 다음의 사실들에 주목하라:

a. 부분합 $g_{n}(x) = \Sigma_{k=1}^{n} kc_{k}x^{k-1}$은 $g(x) = \Sigma_{k=1}^{\infty} kc_{k}x^{k-1}$에 $[-R+\epsilon, R-\epsilon]$에서 균등수렴한다. 

b. $f_{n}(x) = \Sigma_{k=0}^{n} c_{k}x^{k}$라 하면, $(f_{n})'(x) = g_{n}(x) \space\space (x\in [-R+\epsilon, R-\epsilon])$이다.

 

따라서 정리 7.17에 의해, $f$는 $x$서 미분가능하고, $f'(x) = g(x)$이다. 이제 이 과정을 $(-R,R)$의 모든 점에서 반복할 수 있으므로 증명이 완료된다. $\square$.

 

 

따름정리. 정리 8.1의 조건들이 성립하면, $f$는 $(-R,R)$에서 무한히 미분가능하며, 또한 미분계수들은

$$ f^{(k)} (x) =\Sigma_{n=k}^{\infty} n(n-1)...(n-k+1)c_{n}x^{n-k}$$

로 주어진다.

특히, $f^{(k)}(0) = k! c_{k}$이다.

 

증명.

귀납법을 이용하여, 위의 정리와 함께 $f^{(k}}(x)$의 수렴반경 역시 $R$이라는 사실을 증명할 것이다.

 

Case 1. $k=1$

정리 8.1에 의해 $f$는 $(-R,R)$에서 미분가능하며, 미분계수는

$$ f'(x) = \Sigma_{n=1}^{\infty} nc_{n}x^{n-1}$$로 주어진다.

또한 $lim_{n\to\infty} \sqrt[n]{n} = 1$을 이용하면 $f'$의 수렴반경 역시 $R$임을 안다.

 

Case 2. $k=m \Rightarrow k=m+1$

$b_{m} = n(n-1)...(n-m+1)c_{n}$이라 하자.

이제 귀납법 가정에 의해 $f^{(m)}(x) = \Sigma_{n=m}^{\infty} b_{m}x^{n-m}$이다.

또한 이 경우 수렴반경이 $R$이므로, $f^{(m)}(x)$는 $(-R,R)$에서 미분가능하며,

$f^{(m+1)}(x) = \Sigma_{n=m+1}^{\infty} (n-m)b_{m}x^{n-m}$이다.

그런데 $b_{m}(n-m) = n(n-1)...(n-m)c_{n}$이므로, 계수들이 보조정리에서 주장하는 바와 동일하게 나타난다.

또한 $lim_{n\to\infty} \sqrt[n]{n-m} = 1$이므로 $f^{(m+1)}$의 수렴반경 역시 $R$이다.

따라서 귀납 단계가 성립하며 증명이 완료된다. $\square$

 

 

수렴반경은 내부에서는 절대수렴, 외부에서는 발산을 보장한다. 그러나 정확히 $x=R, x=-R$인 경우에 급수가 어떻게 행동하는지에 대해서는 말이 없다. 다음의 정리는 끝점을 넣었을 때 $f$가 수렴하는 경우 $f$가 연속이라는 사실을 보인다 (일반성을 잃지 않고 $R=1$인 경우를 고려한다:)

 

정리 8.2

$f(x) = \Sigma_{n=0}^{\infty} c_{n}x^{n}, \space (-1<x<1)$이라 하고 $\Sigma_{n=0}^{\infty} c_{n}$이 수렴한다 하자.

이제 다음이 성립한다:

$$ lim_{x\to 1} f(x) = \Sigma_{n=0}^{\infty} c_{n}$$

 

증명.

$s_{n} = \Sigma_{k=0}^{n} c_{k}$라 하자. 우리는 $s_{n} \to s$라는 사실을 아므로, $\epsilon > 0$이 주어질 때 $\exists N, n\geq N \Rightarrow |s_{n} - s| < \frac{\epsilon}{2}$가 성립한다.

 

이제 $s_{-1} = 0$이라 정의하면, 주어진 $x \in (-1,1)$에 대해

$$f(x) = \Sigma_{n=0}^{\infty} (s_{n} - s_{n-1})x^{n} \\ = lim_{n\to\infty} s_{n}x^{n} + \Sigma_{k=0}^{n-1} s_{k}x^{k}(1-x) \\ = lim_{n\to\infty} \Sigma_{k=0}^{n-1} s_{k}x^{k} (1-x) \\ = (1-x) \Sigma_{n=0}^{\infty} s_{n}x^{n}$$

가 성립한다.

 

이제 다음의 식을 보자:

$$ |f(x) - s| = |(1-x) \Sigma_{n=0}^{\infty} (s_{n} - s) x^{n}| \leq |(1-x)\Sigma_{n=0}^{N} (s_{n} -s)x^{n}| + |(1-x)\Sigma_{n=N+1}^{\infty} (s_{n}-s) x^{n}| \leq |1-x|2M(N+1) + \frac{\epsilon}{2}$$

여기서 $N,\epsilon$은 위에서 주어진 수들이다. 또한, 전개에서 $(1-x)\Sigma_{n=0}^{\infty} x^{n} = 1$이라는 사실을 이용하였다.

이제 $\delta = \frac{\epsilon}{4M(N+1)}$이라 하면, $1-\delta < x < 1 \Rightarrow |f(x)-s|< \epsilon$이 성립하므로 증명이 끝난다. $\square$

 

 

정리 8.2의 따름정리로써 이전에 증명한 아벨의 정리를 증명할 수 있다:

 

따름정리. (아벨)

$\Sigma_{n} a_{n} = A, \Sigma_{n} b_{n} = B, \Sigma_{n} c_{n} = C, c_{n} = \Sigma_{k=0}^{n} a_{k}b_{n-k}$라 하자.

이제 $C = AB$가 성립한다.

 

증명.

$f(x) = \Sigma_{n} a_{n} x^{n}, g(x) = \Sigma_{n} b_{n} x^{n}, h(x) = \Sigma_{n} c_{n}$이라 하자.

우선, $f(1), g(1), h(1)$이 존재하므로 세 멱급수 모두 수렴반경이 최소 1이고, 따라서 $0 \leq x < 1$에서 세 멱급수 모두 절대수렴한다는 사실을 안다.

따라서, $0 \leq x < 1$에서 $f(x)g(x) = \Sigma_{n} a_{n}x^{n} \Sigma_{m} b_{m}x^{m}$을 재배열하여도 수렴에 영향이 없으며, $f(x)g(x) = h(x)$라는 사실을 알 수 있다. 

마지막으로, 정리 8.2에 의해

$ lim_{x\to 1-} f(x) = A, lim_{x\to 1-} g(x) = B, lim_{x \to 1-} h(x) = C$라는 사실을 안다.

따라서

$AB = lim_{x\to 1-} f(x) lim_{x\to 1-}g(x) = lim_{x \to 1-} f(x)g(x) = lim_{x\to 1-} h(x) = C$이다. $\square$

 

 

우리가 살펴보는 함수 $f(x) = \Sigma_{n=0}^{\infty} c_{n}x^{n}$은 어떤 수렴반경 $(-R,R)$에서 멱급수의 형태로 나타낸 함수였고, 우리는 이 함수가 real-analytic이라는 주장을 하였다. 그러나 우리가 여태껏 보인 것은 무한번 미분가능하다는 사실뿐이지, 어떤 점에서 실제로 테일러 전개를 했을 때 원함수에 수렴한다는 주장은 아니었다. 이제 그 주장을 실제로 하고 싶으나, 그 전에 무한급수를 교환할 수 있는 조건을 다루는 Foubini 정리를 증명하여야 한다.

 

정리 8.3 (Foubini)

이중수열 $\{a_{ij}\}$가 주어져 있다고 하자. 이제 $\Sigma_{j} |a_{ij}| = b_{i}$로 수렴하고, 또 $\Sigma_{i} b_{i}$가 수렴한다 하자.

이제 다음이 성립한다:

$$ \Sigma_{i}\Sigma_{j} a_{ij} = \Sigma_{j}\Sigma_{i} a_{ij}$$

 

증명.

우선, $\Sigma_{i} |\Sigma_{j} a_{ij}| \leq \Sigma_{i} b_{i} < \infty$이므로 좌변이 절대수렴한다는 사실은 알 수 있다.

이제 우변이 좌변과 같은 값으로 수렴한다는 사실을 보이기 위해서는 다음의 함수를 정의한다:

 

$E = \{0 \} \cup \{\frac{1}{n}| n \in \mathbb{N}\}$이라 하자. $E$는 가산집합임이 분명하다.

우리가 만약 $\Sigma_{i}\Sigma_{j} a_{ij} = lim_{n\to\infty} \Sigma_{i}\Sigma_{j=1}^{n} a_{ij}$라는 것을 보일 수 있다면, 각 $j$에 대해 $\Sigma_{i} a_{ij}$가 존재할 것이므로 호환이 가능할 것이고, 따라서 결과가 성립할 것이다. 이것을 염두에 두고 다음의 함수들을 정의한다:

 

$$f_{i}: E \to \mathbb{R}, f_{i}(\frac{1}{n}) = \Sigma_{j=1}^{n} a_{ij}, f_{i}(0) = \Sigma_{j} a_{ij} \\ g(\frac{1}{n}) = \Sigma_{i} f_{i}(\frac{1}{n}), g(0) = \Sigma_{i} f_{i}(0)$$

 

이제 다음의 사실들을 살펴보자:

i) 주어진 임의의 $i \in \mathbb{N}$에 대해, $lim_{n\to\infty} f_{i}(\frac{1}{n}) = f_{i}(0)$이므로, $f_{i}$는 $x=0$에서 연속이다.

ii) $|f_{i}(x)| \leq \Sigma_{j=1}^{\infty} |a_{ij}| = b_{i} < \infty, \Sigma_{i} b_{i} < \infty$이므로 Weierstrass M-test에 의해 집합 $E$에서 $f_{i} \to_{u} g$이다.

iii) 따라서, $g$ 역시 $x=0$에서 연속이고, $lim_{n\to\infty} \Sigma_{i} \Sigma_{j=1}^{n} a_{ij} = lim_{n\to\infty} g(\frac{1}{n}) = g(0) = \Sigma_{i}\Sigma_{i} a_{ij}$이 성립한다. 따라서 증명이 완료된다. $\square$

 

이제 모든 멱급수 형태의 함수는 수렴반경 내에서 real-analytic하다는 사실을 보일 것이다:

 

정리 8.4 (멱급수는 실해석적)

$f(x) = \Sigma_{n} c_{n}x^{n}$이라 하고, 수렴반경이 $R$로 주어져 있다 하자. 이제 $a \in (-R,R)$에 대해, $|x-a| < R - |a|$에서는 다음의 등식이 성립한다:

$$ f(x) = \Sigma_{n} \frac{f^{(n)}(a)}{n!} (x-a)^{n}$$

즉, $f$는 자신의 테일러 전개로 표현되고, 따라서 $f$는 실해석적이다.

 

증명.

$f(x)  = \Sigma_{n} c_{n} x^{n}$의 형태로 주어져 있다는 사실을 어떻게든 이용해야 한다. 이를 위해서 다음의 분해를 고려한다:

 

$$ f(x) = \Sigma_{n} c_{n} ((x-a)+a)^{n} = \Sigma_{n} c_{n} \Sigma_{m=0}^{n} \begin{pmatrix} n \\ m \end{pmatrix} a^{n-m}(x-a)^{m}$$

이제 이항계수를 $\begin{pmatrix} n \\ m \end{\pmatrix} = 0 \space if \space m > n$으로 확장하여 정의하면,

$$f(x) = \Sigma_{n} \Sigma_{m} c_{n} \begin{pmatrix} n \\ m \end{pmatrix} a^{n-m}(x-a)^{m}$$이다.

이제 Foubini 정리를 이용하여 합의 순서를 바꿀 수 있는지를 알고 싶다. 이를 위해서는 항들의 절댓값의 합이 수렴한다는 것을 보이면 족하다:

 

$$\Sigma_{n} \Sigma_{m} |c_{n} \begin{pmatrix} n \\ m \end{pmatrix} a^{n-m}(x-a)^{m}| \\ = \begin{pmatrix} n \\ m \end{pmatrix} |a|^{n-m}|x-a|^{m} \\ = \Sigma_{n} |c_{n}| (|x-a|+|a|)^{n}$$

그런데 계수가 $|c_{n}|$인 멱급수와 $c_{n}$인 멱급수의 수렴반경은 동일하므로, $|x-a|< R- |a|$인 $x$에 대해서 이 멱급수가 수렴한다는 사실을 알 수 있고, 푸비니 정리를 적용할 수 있다.

 

이제

$$ f(x) = \Sigma_{m} (\Sigma_{n} c_{n} \begin{pmatrix} n \\ m \end{pmatrix} a^{n-m})(x-a)^{m} \\ = \Sigma_{m} (\Sigma_{n \geq m} c_{n} \begin{pmatrix} n \\ m \end{pmatrix} a^{n-m})(x-a)^{m}$$

인데, 괄호 안의 형태는 정확히 $\frac{f^{(m)}(a)}{m!}$이다. 따라서

$$ f(x) = \Sigma_{m} \frac{f^{(m)}(a)}{m!} (x-a)^{m}$$이므로, 증명이 끝난다. $\square$

 

 

 

마지막으로 두 멱급수로 정의된 함수가 같아지는 조건을 알아보고자 한다. 두 멱급수가 같다는 사실이 유지되면서, 수렴하는 수열이 존재하면 두 멱급수는 아예 같다는 것이 골자이다. 

정리 8.5 (멱급수의 일치 조건)

$f(x) = \Sigma_{n} a_{n} x^{n}, g(x) = \Sigma_{n} b_{n}x^{n}$ 모두 $S = (-R,R)$에서 잘 정의된다 하자 (따라서 수렴반경이 최소한 $R$이다.) 이제 $E := \{x \in S | f(x) = g(x) \}$로 정의하자. $E$에 집적점이 존재하면 $E = S$이다.

 

증명.

$h(x) = \Sigma_{n} (a_{n}- b_{n}) x^{n}$이라 정의하자.

$A := E'$는 $E$의 집적점들의 집합이라 하자. 이 집합은 항상 $S$에서 닫혀 있으므로, $B = S - A$는 열린 집합이다.

이제 $A$가 열린 집합이라고 하자. 그러면 $(-R,R) = A \sqcup B$이고 $A,B$ 모두 열린 집합인데 $S$는 연결집합이므로 $A,B$중 하나는 공집합이고, $A$는 가정에 의해 공집합이 아니므로 $B$가 공집합이다. 그런데 $f$는 $S$에서 연속이므로, $E$는 닫힌 집합이어서 $A \subset E$이고, 따라서 $E = S$이다.

 

이제 $A$가 열린집합임을 보이자.

$h$는 $(-R,R)$에서 잘 정의된다는 사실에 주목하라. 이제 $x_{0} \in A$라 하자. 정리 8.4에 의해 $h$를 $x = x_{0}$ 를 중심으로 테일러 전개할 수 있으며, 최소한 $|x-x_{0}| < R - |x_{0}|$에서 수렴한다. 계수들을 편의상 $d_{n}$이라 하면,

$$ h(x) = \Sigma_{n} d_{n} (x -x_{0})^{n}, \space\space |x-x_{0}| < R - |x_{0}|$$가 성립한다.

 

이제 우리는 모든 $d_{n} = 0$이라는 것을 보이고자 한다. 그렇지 않다고 가정하면 $d_{k} \neq 0$인 가장 작은 음이 아닌 정수 $k$가 존재한다. 따라서 $h(x) = (x-x_{0})^{k} \Sigma_{n} d_{n+k} (x-x_{0})^{n}$이다.

이제 $p(x) = \Sigma_{n} d_{n+k} (x-x_{0})^{n}$ 또한 멱급수이므로, $|x-x_{0}| < R - |x_{0}|$서 연속이다. 그런데 $g(x_{0}) \neq 0$이므로 어떤 $\delta> 0$에 대해서 $x \in N_{\delta}(x_{0}) \Rightarrow p(x) \neq 0$이다.

따라서 $0< |x-x_{0}| < \delta \Rightarrow h(x) = (x-x_{0})^{k} p(x) \neq 0$인데 이는 $x_{0} \ in A$에 모순된다. $\square$

 

 

다음 복습은 두 가지 가능성이 있는데, i) 우리가 흔히 쓰는 지로삼 함수를 멱급수로부터 정의하는 작업을 하거나, ii) FTC와 푸리에 급수를 배울 것이다.

오늘 미방을 하면서 느꼈던 것이, 내가 지로삼 적분을 (당연히 문과를 나왔으니) 잘 못하는데 이것이 나중에 발목을 잡을 것 같았다. 따라서 이번 글은 여태껏 상미방에 대해 배운 바를 간단히 정리하고, Boyce 책의 연습문제들을 풀어보는 식으로 구성하고자 한다.

 

 

현재 상미분방정식 수업의 진도는 다음과 같다:

 

1. 미분방정식의 분류체계를 배웠다.

상미방 / 편미방: 구하고자 하는 함수에 독립변수가 둘 이상 있고 방정식에 편미분이 등장하면 편미방, 아니면 상미방이다. 

차수: 몇계 도함수까지 방정식에 등장하는지를 의미한다.

선형성: 미분방정식 $\mathcal{F}(t, y , y', ... , y^{n-1}, y^{n}) = 0$이 주어질 때, 이 방정식이 $y, y',...,y^{n}$에 선형인지를 의미한다.

(선형임을 전제할 때) 동차성: $a_{n}y^{n} + a_{n-1}y^{n-1} + ... + a_{1}y' + a_{0}y = g(t)$로 주어질 때, $g(t)= 0 $인지를 의미한다.

 

 

 

2. 특수한 미분방정식들의 해를 구하는 방법을 구했다.

2-1. 일차 상미분방정식의 경우: 일차 상미방은 $y' = f(t,y)$의 꼴로 표현될 수 있다.

분리형: $f(t,y) = g(t)p(y)$의 곱으로 표현되는 경우 해석적인 해를 구할 수 있다. 그러나 해가 양함수로 표현되지 않을 수 있다.

선형: $y'+p(t)y = g(t)$로 주어진 경우, 양변에 integrating factor을 곱하여 $(\mu y)' = \mu g$의 꼴로 나타낼 수 있다.

이런 경우 해석적인 해를 구할 수 있고, 양함수로 표현된다.

완전: 일차 상미방이 $M(t,y)y' + N(t,y) = 0$의 꼴로 표현되었다 하자. 또한, 함수 $\psi(t,y)$가 존재하며, $\psi_{y}(t,y) = M(t,y), \psi_{t}(t,y) = N(t,y)$라 하자. 이 경우 어떤 상수 $c$에 대해 $\psi(t,y) = c$를 만족하는 함수 $y = y(t)$가 존재하면, $\psi_{t} + \psi_{y} \frac{dy}{dt} = 0$이 성립하여 미분방정식의 해가 된다. 따라서 이런 경우 해석적으로 해를 구할 수 있고, 해는 일반적으로 음함수로 표현된다.

만약 영역이 단순 연결 영역이어서 모든 경로를 점으로 연속적으로 축소시킬 수 있다면, 미분방정식이 완전일 필요충분조건은 $M_{t} = N_{y}$인 것이다.

마지막으로 상미방이 완전이 아니더라도 어떤 함수를 곱해 완전 상미방이 될 수 있다. 통상적으로 곱하는 함수는 $t,y$ 모두에 의존하지 않는데, 두 변수 모두에 의존하는 경우 상미방을 풀기 위해 편미방을 풀어야 하기 때문이다.

(일반적인) 동차: 이 동차성은 앞에서 살펴본 선형 동차/비동차 미방이랑 다르다. 일차 상미방이 동차라는 것은, $y' = f(t,y)$로 표현될 때 $f(t,y)$가 이변수함수로서 $t,y$에 대해 1차 동차라는 것을 의미한다. 즉, $\lambda \in \mathbb{R}$일 때, $f(\lambda t, \lambda y) = f(t,y)$인 것이다. 이 경우 $f(t,y) = f(\frac{y}{t})$로 표현될 수 있고, 새로운 변수 $z := \frac{y}{t}$로 정의하면 일차 선형 미분방정식을 얻게 되므로 양함수 꼴의 해석적인 해를 구할 수 있다.

 

 

 

2-2. 이차 상미분방정식의 경우: 이차 상미방은 $y'' = f(t,y,y')$의 꼴로 표현될 수 있다.

선형 동차 + 상수계수: $y'' + ay' + by = 0$ 꼴의 상미분방정식이다. 이 경우 $y = e^{\lambda t}$의 해가 존재할 것이라고 가정한 후 $\lambda$의 구체적인 값을 찾는다. 중근이 아닌 경우 이는 선형독립인 두 함수를 준다. 선형 동차 이차 상미방의 해공간은 (계수가 상수가 아니더라도) 차원 2의 벡터공간이므로, 이 두 함수는 모든 해를  생성한다. 중근이 $\lambda = -\frac{a}{2}$로 주어지는 경우, 다른 해는 $y(t) = te^{-\frac{a}{2}}$로 주어진다.

선형 동차: 이 경우 일반적인 풀이를 알 수 없다.

선형 비동차: $y'' + p(t)y' + q(t)y = g(t)$ 꼴의 상미방이다. 이 경우 대응하는 선형 동차 방정식의 해집합 $y^{h}$를 먼저 알아낸 다음, 비동차 미방을 만족하는 특수해 $y^{p}$가 주어지면, $y = y^{p} + y^{h}$로 표현된다.

그렇다면 $y^{h}$를 어떻게 구하느냐가 문제된다. 두 가지 방법이 있다.

 

1) UDC (Undetermined coefficients: 미정계수법)

이 경우 $y'' + p(t)y'+q(t)y = g(t)$에서 $g(t)$의 형태에 따라 매개변수를 넣은 함수 형태를 찍는다. 정말 고급진 방법이다.

통상적으로 이 방법을 사용할 수 있는 경우는 많지 않다. 예컨대 $g(t) = sin(t)$이면, $y(t) = A sin(t) + B cos(t)$일 것이라고 믿고 대입을 한 후 $A,B$에 대해서 푸는 방식이다.

그런데 어떤 경우에는 $g$가 이미 대응하는 동차 상미방 $y'' + p(t)y'+q(t) = 0$의 해가 되어버리는 경우가 있다. 이러한 경우에는 공명이 일어난다고 하는데, 이 경우 찍고자 하는 형태에 $t$나 $t^{2}$을 곱한 후 다시 대입을 하면 된다. 예컨대 $y(t) = At* sin(t) + Bt* cos(t)$인 식이다.

 

2) VOP (Variation of Parameters: 매개변수변환법)

VOP의 경우 조금 더 고급진 방법이나, 시간이 많이 걸린다는 단점이 존재한다. VOP의 기본 아이디어는, $y_{1}, y_{2}$가 대응되는 선형동차 상미방 $y''+p(t)y'+q(t) = 0$를 생성하는 집합일 때, (외부로부터 가해지는 힘으로 볼 수 있는) $g(t)$의 존재는 $y = c_{1} y_{1} + c_{2} y_{2}$에서 상수 $c_{1}, c_{2}$는 바꾸지만, 해의 형태 자체는 바꾸지 않을 것이라는 믿음이다.

따라서 해를 $y = u_{1}(t) y_{1} + u_{2}(t) y_{2}$로 표현한 다음 적합한 $u_{1}, u_{2}$를 찾아내는 것이 목표이다.

그런데 여기서 $u_{1}, u_{2}$에 아무런 제약을 두지 않는다면 결국 이차 상미방 둘을 풀어야 하는 상황이 발생하므로, 이를 막기 위해 $u_{1}' y_{1} + u_{2}' y_{2} = 0$이라는 추가적인 제약을 둔다.

이제 이것을 대입하면 $u_{1}, u_{2}$는 다음의 식들을 만족해야 한다는 사실을 알 수 있다:

 

$$ u_{1}' y_{1}' + u_{2}' y_{2} ' = g(t) \\ u_{1}' y_{1} + u_{2}' y_{2} = 0$$

 

이는 다음의 선형 연립방정식 체계로 나타낼 수 있다:

 

$$ Au = \begin{pmatrix} g(t) \\ 0 \end{pmatrix} \\ A = \begin{pmatrix} y_{1}' \space\space y_{2}' \\ y_{1} \space\space y_{2} \end{pmatrix}, u = \begin{pmatrix} u_{1}' \\ u_{2}' \end{pmatrix} $$

$y_{1}, y_{2}$는 선형독립이면서 이차 선형 상미방의 해이므로, Wronskian이 전역적으로 0이 아니다. 따라서 우리는 이 연립방정식 체계가 모든 $t$에서 유일한 해를 가질 것임을 안다.

 

이제 $u_{1}', u_{2}'$을 다시 적분하면 특수해를 얻는다.

 

 

3. 해의 개념, 해의 존재성과 유일성, 해 공간의 구조를 배웠다.

초기값 문제: 다음의 연립방정식 $$y' = \mathcal{F}(y,t) \\ y(t_{0}) = y_{0}$$을 초기값 문제 (IVP)라 부른다. 특히, 고차 미분방정식은 연립 일차 미분방정식으로 환원할 수 있으므로, $y$가 스칼라함수가 아니라 벡터함수이면 일반적인 초기값 문제는 위와 같이 일차 연립 미분방정식과 관련된 초기값의 연립방정식으로 나타낼 수 있다.

 

예컨대 $y'' = 3y' - sin(t)*y + cos(t)$를 연립 일차 미분방정식으로 나타낸다면, 다음과 같이 할 수 있다:

 

$ y_{1} = y \\ y_{2} = y_{1}'$로 정의한다.

이제 다음과 같은 연립 일차 미분방정식을 생각한다:

 

$$ y_{1}' = y_{2} \\ y_{2}' = 3y_{2} - sin(t)*y_{1} + cos(t)$$

 

이를 다시 나타내면

$$ \begin{pmatrix} y_{1} \\ y_{2} \end{pmatrix} ' = \begin{pmatrix} \mathcal{F}_{1} (y_{1}, y_{2}, t) \\ \mathcal{F}_{2} (y_{1}, y_{2}, t) \end{pmatrix} = \mathcal{F}(y_{1}, y_{2}, t)$$

로 표현할 수 있다.

 

고전해: 점 $t_{0}$가 주어져 있다 하자. 미분방정식 $y^{n} = \mathcal{F}(y^{n-1},...,y', y,t)$와 관련된 초기값 문제 $$y' = \mathcal{F}(y,t), t > t_{0} \\ y(t_{0}) = y_{0}$$의 고전해는 다음을 만족하는 함수 $y = y(t)$이다:

 

i) $t > t_{0} \Rightarrow y' = \mathcal{F}(y,t)$ (점별로 미분방정식을 만족)

ii) $lim_{t \to t_{0}+} y(t) = y_{0}$

 

(왜 이렇게 극한으로 표현했을까? 이는 해의 존재성과 유일성이 열린 집합에서만 논의될 수 있기 때문이다.)

 

 

해의 존재성과 유일성: 초기값 문제 $$y' = \mathcal{F}(y,t), t > t_{0} \\ y(t_{0}) = y_{0}$$가 주어져 있다 하자. 이제 i) 이 문제에 대해 해가 항상 존재하는지, ii) 이 문제에 대해 해가 유일한지를 알고 싶다. 다음의 정리는 해의 존재성과 유일성을 보증하는 조건들을 다룬다:

 

정리. (Cauchy-Lipschitz) 초기값 문제 $$y' = \mathcal{F}(y,t), t > t_{0} \\ y(t_{0}) = y_{0}$$가 주어져 있다 하자.

이제 $\mathcal{F}$가 $(t_{0}, y_{0})$의 근방에서 $y,t$에 대해 연속이고 $y$에 대해 립시츠 연속이라 하자. 그렇다면 어떤 근방 $(t_{0} - \delta, t_{0} + \delta) \times (y_{0} - \epsilon, y_{0} + \epsilon)$이 존재하여, 이 근방에서 초기값 문제에 대해 해가 유일하게 존재하며, 이 해는 관측된 초기값에 대해 연속이다. 즉, 어떤 상수 $C = C(t_{0} , \delta)$가 존재하여, 초기값이 $x_{0}$일 때 해가 $x$이고 $\tilde{x}_{0}$일 때 해가 $\tilde{x}$이라면,

$$|t- t_{0}| \leq \delta \Rightarrow |x(t) - \tilde{x}(t)| \leq C|\tilde{x}_{0} - x_{0}|$$

가 성립한다.

 

 

 

 

이제 연습문제를 풀어보도록 하겠다.

 

 

-- 수정중 --

* 2022.09.25 수업의 복습입니다.*

 

100만년 만에 쓰는 복습글인 것 같다.  지난번에는 연습문제를 풀겠다고 공언했지만 음...계획이 바뀌었다.

최근에 좀 나태해진 것 같은데, 다시 꾸준히 글을 올리는 루틴을 되찾아가도록 해야겠다.

 

 

오늘은 Friedberg의 6.8 Bilinear and Quadratic Forms의 내용을 다루도록 하겠다.

이번 글부터는 일목요연한 정리를 위해 목차를 만들기로 했는데, 목차는 다음과 같다:

 

 

<목차>

1. 쌍선형 형식의 소개

  1-1. 쌍선형 형식의 정의는 무엇인가?

  1-2. 쌍선형 형식의 예시로는 무엇이 있는가?

 

2. 쌍선형 형식들의 집합에 대한 분석

  2-1. 쌍선형 형식은 벡터공간을 이루는가?

  2-2. 쌍선형 형식과 행렬공간은 어떤 관계를 가지는가?

 

3. 쌍선형 형식의 표현들과 합동 (congruence)관계

  3-1. 하나의 쌍선형 형식을 서로 다른 기저로 표현한 행렬의 관계는 무엇인가?

  3-2. 합동관계를 만족하는 서로 다른 행렬은 같은 쌍선형 형식의 다른 기저표현인가?

 

 

1. 쌍선형 형식의 소개

1-1. 쌍선형 형식의 정의는 무엇인가?

정의. (쌍선형 형식)

벡터공간 $(V,\mathbb{F})$가 주어져 있다고 하자. 이제 $H: V \times V \to \mathbb{F}$가 다음을 만족한다 하자:

$x_{1},x_{2},y_{1}, y_{2} \in V, c \in \mathbb{F}$일 때, 

$$i) H(cx_{1}+x_{2}, y_{1}) = c H(x_{1}, y)+ H(x_{2}, y_{1}) \\ ii) H(x_{1}, cy_{1}+y_{2}) = cH(x_{1}, y_{1})+H(x_{1}, y_{2})$$이다.

 

이제 $H$를 (V에서 정의된) 쌍선형 형식이라 한다.

 

 

쌍선형 형식은 내적공간에서 정의될 필요가 없음에 주목하라. 또한, 복소공간에서 정의된 내적의 경우 둘째 항에 대해 내적이 선형이 아니라 켤레선형이므로 쌍선형 형식이 아님에도 주목하라.

 

1-2. 쌍선형 형식의 예시로는 무엇이 있는가?

예1.

$ V = \mathbb{R}^{2}, \mathbb{F} = \mathbb{R}$이라 하자.

이제 $x = (x_{1}, x_{2}), y = (y_{1}, y_{2})$라 할 때, $H : V \times V \to \mathbb{R}, H(x,y) = 4x_{1}y_{1} + 2x_{1}y_{2} - 3x_{2}y_{1} + x_{2}y_{2}$라 하자.

 

$H$가 쌍선형 형식인가? 

직접 정의를 따져가면서 증명하는 방법도 있고, 다음의 사실을 이용할 수 있다:

 

$$A = \begin{bmatrix} 4 \space\space 2 \\ -3 \space\space 1 \end{bmatrix}$$라 하자. 

이제 $H(x,y) = x^{T}Ay$라는 사실을 행렬 곱셈의 정의로부터 쉽게 알 수 있다.

따라서 $x,y,z\in \mathbb{R}^{2}, a \in \mathbb{R}$이라 하면 다음이 성립한다:

 

$$ H(ax+z,y) = (ax+z)^{T}Ay = (ax+z)^{T}(Ay) = a(x^{T}Ay) + z^{T}Ay = aH(x,y)+H(z,y)$$

이 사실은 행렬곱셈과 덧셈이 분배하며, 전치연산자가 선형이기 때문에 성립한다.

 

마찬가지로 $H$가 둘째 항에 대해서 선형이라는 사실을 보일 수 있다.

 

 

2. 쌍선형 형식들의 집합에 대한 분석

2-1. 쌍선형 형식은 벡터공간을 이루는가?

이제 벡터공간 $(V, \mathbb{F})$가 주어질 때, 이 공간에서 정의된 모든 쌍선형 형식들의 집합을 정의할 수 있다. 이 집합을 $$ \mathcal{B}(V)$$로 표시하자.

 

이제 $V$서 정의된 모든 쌍선형 형식들의 집합 $\mathcal{B}(V)$를 선형대수학의 용어로 분석하고자 한다. 따라서 이 집합이 벡터공간이냐고 묻는 것은 매우 자연스러운 질문이다. 조금 뜬금없는 질문이라고 생각할 법한 사람도 있겠다. 그러나 우리가 선형대수학을 다루는 이상 이러한 질문을 던지지 않으면 솔직히 할 수 있는 것이 제한적이다.

 

우리가 정의하는 덧셈과 스칼라곱은 함수의 경우와 동일하다:

 

$ B_{1}, B_{2} \in \mathcal{B}(V), c\in\mathbb{R}$이라 하자. 이제 $B_{1}+B_{2}, cB_{1}$는 다음과 같이 정의한다:

 

$$ B_{1}+B_{2}: V \times V \to \mathbb{F}, (B_{1}+B_{2})(x,y) = B_{1}(x,y)+B_{2}(x,y) \\ (cB_{1}): V \times V \to \mathbb{F}, (cB_{1})(x,y) = c(B_{1}(x,y)) $$

 

 

이제 집합 $\mathcal{B}(V)$와 이렇게 정의한 연산이 함께 벡터공간을 이루는지가 문제된다.

벡터공간의 정의를 상기하면 다음과 같다:

 

$(V,\mathbb{F})$가 벡터공간이라는 것은 다음이 모두 성립함을 의미한다:

 

i) 이항연산 $+$가 존재하여 $(V,+)$가 가환군이다. (덧셈에 대해 닫혀있음, 교환법칙, 결합법칙 성립, 항등원, 역원 존재)

ii) 스칼라곱 연산 $\bullet: \mathbb{F}\times V \to V$가 존재한다.

iii) $(ab)\bullet v = a(b\bullet v)$가 성립한다. (스칼라곱과 체의 곱셈이 결합법칙 만족)

iv) 체의 항등원을 $1$이라 표기할 때 $1\bullet v = v$이다. (항등원은 스칼라곱에서도 항등원)

v) $(a+b)\bullet v = a\bullet v + b \bullet v$이다. (스칼라곱과 체의 덧셈이 분배법칙 만족)

 

여기서 모든 성질을 보이는 것은 매우 귀찮은 일이므로, 특별히 연산에 대해 닫혀있다는 성질을 증명하고, 나머지는 시간이 나면 보충하도록 하겠다. 

 

주장. $(\mathcal{B}(V),+,\bullet)$은 연산에 대해 닫혀있다.

증명.

Part 1. $\mathcal{B}(V)$는 덧셈에 대해 닫혀있다.

$B_{1}, B_{2} \in \mathcal{B}(V)$라 하자. 

이제 $B_{1} + B_{2}\in \mathcal{B}(V)$임을 보이고자 한다.

임의의 $y \in V$를 고정하고, $x_{1}, x_{2} \in V, a \in \mathbb{F}$라 하자.

이제

$$(B_{1}+B_{2})(ax_{1}+x_{2},y) = B_{1}(ax_{1}+x_{2},y) + B_{2}(ax_{1}+x_{2},y) \\ = aB_{1}(x_{1},y)+B_{1}(x_{2},y)+aB_{2}(x_{1},y)+B_{2}(x_{2},y) \\ = B_{1}(x_{1},y)+B_{2}(x_{1},y) + aB_{1}(x_{2},y)+aB_{2}(x_{2},y) \\ a(B_{1}+B_{2})(x_{1},y)+(B_{1}+B_{2})(x_{2},y)$$

이다.

둘째 항에 대한 선형성도 유사하게 보일 수 있다.

 

 

Part 2. $\mathcal{B}(V)$는 스칼라곱에 대해 닫혀있다.

$B \in \mathcal{B}(V), c \in \mathbb{F}$라 하자. 이제 $(cB)$가 쌍선형형식임을 보여야 한다.

$y \in V$를 고정하고, $x_{1}, x_{2} \in V, a\in \mathbb{F}$라 하자.

이제

$$ (cB)(ax_{1}+x_{2},y) = c(B(ax_{1}+x_{2},y) \\ = c(aB(x_{1},y)+B(x_{2},y)) \\ = c(aB(x_{1},y)) + c(B(x_{2},y)) \\ = a(cB)(x_{1},y) + (cB)(x_{2},y)$$

이다.

둘째 항에 대한 선형성도 유사하게 보일 수 있다.

 

 

나머지 성질들도 증명이 그리 어렵지는 않다. 앞으로는 $\mathcal{B}(V)$가 벡터공간이라는 사실을 적극적으로 활용할 것이다.

 

2-2. 쌍선형 형식과 행렬공간은 어떤 관계를 가지는가?

$(V,\mathbb{F})$가 이제는 $n$차원 유한차원 벡터공간이라고 가정하자.

우리는 앞서 살펴본 예시로부터 다음의 명제를 증명할 방법을 쉽게 착안할 수 있다:

 

명제. $A \in \mathcal{M}_{n\times n}(\mathbb{F})$라 하자.

이제 다음의 함수는 $\mathbb{F}^{n}$에서 정의된 쌍선형 형식이다:

 

$$ H: \mathbb{F}^{n} \times \mathbb{F}^{n} \to \mathbb{F}, H(x,y) = x^{T}Ay$$

 

증명.

둘째 항을 $y$로 고정하고 첫 항에 $x$를 입력으로 받는 함수 $R_{y}: \mathbb{F}^{n} \to \mathbb{F}, R_{y}(x) = H(x,y)$를 생각해 보자.

$c \in \mathbb{F}, x_{1},x_{2} \in \mathbb{F}^{n}$이면 $R_{y}(cx_{1}+x_{2}) = (cx_{1}+x_{2})^{T}Ay = c(x_{1}^{T}Ay)+(x_{2}^{T}Ay) = cR_{y}(x_{1}) + R_{y}(x_{2})$여서, $R_{y}$는 선형변환임을 알 수 있다. 특히 여기서 $y$에 대한 제한이 없었으므로, $H$는 첫 항에 대해 선형임을 알 수 있다.

 

둘째 항의 선형성을 증명하기 위해서는 첫 항을 $x$로 고정하고 둘째 항 $y$를 입력으로 받는 함수 $L_{x}: \mathbb{F}^{n} \to \mathbb{F}, L_{x}(y) = H(x,y)$를 생각하고 이것이 선형임을 보이면 충분한데, 행렬 곱셈의 성질에 의해 위와 같이 쉽게 보일 수 있다. $\square$

 

따라서 하나의 행렬 $A \in \mathcal{M}_{n\times n}$$(\mathbb{F}^{n}, \mathbb{F})$서 하나의 쌍선형 형식을 정의한다.

 

 

이제 역이 성립하는지가 큰 관심사이다. 선형변환의 경우를 생각해 보면, 하나의 행렬이 행렬 곱셈을 통해 하나의 선형변환을 정의했고, 역으로 선형변환의 경우 기저가 주어지면 하나의 행렬로 표현되었다는 사실을 상기하자.

쌍선형 형식의 경우에도 유사한 말을 할 수 있다. $H \in \mathcal{B}(V)$라 하고, $\beta = \{v_{1}, ... , v_{n} \}$이 $V$의 순서가 있는 기저라 하자.

 

정의.

쌍선형 형식 $H \in \mathcal{B}(V)$와 기저 $\beta$가 주어져 있을 때, 성분들이 다음과 같이 주어지는 행렬을 정의하자:

$$ A \in \mathcal{M}_{n\times n}, A_{ij} = H(v_{i}, v_{j})$$

이제 $A$는 기저 $\beta$에 대한 $H$의 행렬표현이라 하고, $A = \psi_{\beta}(H)$로 표시한다.

 

 

따라서 유한차원 벡터공간 $(V,\mathbb{F})$서 정의된 쌍선형 형식과 순서가 있는 기저가 주어지면, 쌍선형 형식을 행렬로 표현할 수 있음을 안다.

그러나 이 표현이 유일한지는 아직 알지 못하는데, 표현의 유일성은 다음의 정리에서 나타난다:

 

정리 6.32

$(V,\mathbb{F})$가 $n$차원 벡터공간이라 하고 순서가 있는 기저 $\beta$가 주어졌다 하자. 이제 다음과 같이 정의되는 함수 

$$ \psi_{\beta}: \mathcal{B}(V) \to \mathcal{M}_{n\times n}$$

는 동형사상이다.

 

증명.

세 부분으로 나누어서 증명을 진행한다.

Part 1. $\psi_{\beta}$가 선형사상임을 보인다.

$B_{1}, B_{2} \in \mathcal{B}(V), c\in \mathbb{F}$라 하자.

이제 $\psi_{\beta}(cB_{1}+B_{2})$는 하나의 행렬로, 그 $ij$성분은 다음과 같이 정의된다:

 

$$ \psi_{\beta}(cB_{1}+B_{2})_{ij} = (cB_{1}+B_{2})(v_{i}, v_{j}) \\ = c(B_{1})(v_{i},v_{j}) + B_{2}(v_{i}, v_{j}) \\ = c \psi_{\beta}(B_{1})_{ij} + \psi_{\beta}(B_{2})_{ij} \\ = (c \psi_{\beta}(B_{1})_{ij} + \psi_{\beta}(B_{2})_{ij}$$

모든 성분에 대해서 이 논의가 성립하므로, $\psi_{\beta}(cB_{1}+B_{2}) = c \psi_{\beta}(B_{1})+\psi_{\beta}(B_{2})$이다.

 

 

Part 2. $\psi_{\beta}$가 단사임을 보인다.

어떤 $B \in \mathcal{B}(V)$에 대해, $\psi_{\beta}(B) = 0$이라 가정하자.

영행렬의 정의에 의해 $1 \leq i,j \leq n \Rightarrow B(v_{i}, v_{j}) = 0$이다.

이제 $x,y \in V \Rightarrow B(x,y) = 0$임을 보이면 족할 것이다.

$\beta$는 기저이므로, $x = \Sigma_{i=1}^{n} a_{i}v_{i}, y = \Sigma_{j=1}^{n} b_{j}v_{j}$인 체의 원소들 $a_{1},..., a_{n}, b_{1},...,b_{n}$이 유일하게 존재한다.

 

따라서

$$B(x,y) = B(\Sigma_{i=1}^{n} a_{i}v_{i}, \Sigma_{j=1}^{n} b_{j}v_{j}) = \\ \Sigma_{i=1}^{n} \Sigma_{j=1}^{n} a_{i}b_{j} B(v_{i},v_{j}) = 0$$이다.

 

이제 $\mathcal{B}(V)$의 영벡터만이 영공간에 포함되어 있으므로 사상이 단사임을 보였다.

 

 

Part 3. $\psi_{\beta}$가 전사임을 보인다.

$A \in \mathcal{M}_{n \times n}$이라 가정하자. 이제 어떤 $B \in \mathcal{B}(V)$가 존재하여 $\psi_{\beta}(B) = A$가 될 수 있는지가 문제된다.

 

그런데 이는 다음과 같이 답을 낼 수 있다. 다음과 같은 함수를 정의한다:

$$B: V\times V \to \mathbb{F}, B(x,y) = [x]_{\beta}^{T}A[y]_{\beta}$$

여기서 $[x]_{\beta}$는, $x = \Sigma_{i=1}^{n} a_{i}v_{i}$이면 $[x]_{\beta} = \Sigma_{i=1}^{n} a_{i}e_{i}$로 주어지는 좌표지정 변환의 함숫값이다.

좌표 지정 변환은 선형이고 행렬곱 역시 선형이므로 $B$는 쌍선형 형식이다.

 

또한, $B(v_{i},v_{j}) = [v_{i}]_{\beta}^{T} A [v_{j}]_{\beta} = e_{i}^{T}Ae_{j} = A_{ij}$이므로, $\psi_{\beta}(B) = A$이다. 따라서 사상이 전사임을 보였다. $\square$

 

이로써, $n$차원 벡터공간에서는 기저가 주어지면 쌍선형 형식과 $n\times n$ 행렬의 집합이 같음을 보였다.

또한, 특히 $\mathbb{F}^{n}$에서 정의되는 모든 쌍선형 형식은 (표준기저를 잡음으로써) $H(x,y) = x^{T}Ay$의 형식으로 주어짐을 알 수 있다.

 

 

3. 쌍선형 형식의 표현들과 합동 (congruence)관계

3-1. 하나의 쌍선형 형식을 서로 다른 기저로 표현한 행렬의 관계는 무엇인가?

우리는 2-2에서 $(V,\mathbb{F})$의 순서가 있는 기저가 주어지면 쌍선형 형식과 행렬집합이 $\psi_{\beta}$로 연결됨을 살펴보았다. 그런데 다음의 질문이 떠오를 수 있다:

 

 

$H \in \mathcal{B}(V)$이고 $\beta,\gamma$는 $V$의 서로 다른 순서가 있는 기저일 때, $\psi_{\beta}(H)$ $\psi_{\gamma}(H)$의 관계는 무엇일까?

 

 

선형변환의 경우, $T: V \to V$가 선형변환이고 $\beta, \gamma$가 서로 다른 기저일 때, 가역행렬 $Q$가 존재하여 다음이 성립했었다:

$$[T]_{\beta} = Q^{-1}[T]_{\gamma}Q$$

특히, $Q = [I_{V}]_{\beta}^{\gamma}$로, 좌표계 변환 행렬이었음을 상기하라.

 

따라서 쌍선형 형식의 행렬표현에 있어서도 좌표계 변환 행렬이 중요하게 작용할 것임을 직감할 수 있다.

이는 다음의 정리를 통해 표현된다:

 

정리 6.33

$(V,\mathbb{F})$는 $n$차원 벡터공간이고, $\beta = \{v_{1}, ... , v_{n} \}, \gamma = \{w_{1}, ... , w_{n} \}$은 서로 다른 순서가 있는 기저이고, $Q$는 다음과 같이 정의된 행렬이라 하자:

 

$$ w_{j} = \Sigma_{i=1}^{n} = Q_{ij}v_{i}$$

즉, $Q$는 $\gamma$서 $\beta$로 좌표계를 변환하는 행렬이라 하자.

 

이제 임의의 쌍선형 형식 $H \in \mathcal{B}(V)$에 대해, $\psi_{\gamma}(H) = Q^{T}\psi_{\beta}(H)Q$이다.

 

 

증명.

$A = \psi_{\beta}(H), B = \psi_{\gamma}(H)$라 하자.

 

$$B_{ij} = H(w_{i},w_{j}) = H(\Sigma_{k=1}^{n}Q_{ki}v_{k}, w_{j}) \\ = \Sigma_{k=1}^{n} Q_{ki} H(v_{k}, w_{j}) \\ = \Sigma_{k=1}^{n} Q_{ki} \Sigma_{r=1}^{n} Q_{rj} H(v_{k}, v_{r}) \\ = \Sigma_{k=1}^{n}\Sigma_{r=1}^{n} (Q^{T})_{ik} A_{kr} Q_{rj} \\ = (Q^{T}AQ)_{ij}$$

 

이제 $Q$는 좌표계 변환 행렬이므로 가역이라는 사실을 안다. 따라서, 한 쌍선형 형식을 다른 기저로 표현한 행렬 $A,B$ 사이에는, 가역행렬 $Q$가 존재하여 $B = Q^{T}AQ$가 성립한다. $\square$

 

 

이러한 관계를 합동관계라 정의한다:

 

정의. (합동관계)

행렬 $A,B\in \mathcal{M}_{n\times n}(\mathbb{F})$에 대해, 가역행렬 $Q$가 존재하여

$$B = Q^{T}AQ$$가 존재하면, $A,B$는 합동관계에 있다(congruent)고 한다.

 

 

합동관계는 유사관계처럼 동치관계를 정의한다.

 

3-2. 합동관계를 만족하는 서로 다른 행렬은 같은 쌍선형 형식의 다른 기저표현인가?

이제 역이 성립하는지가 문제된다. 정리 6.33의 다음 따름정리를 보면 이해가 더 잘 될 것이다:

 

따름정리.

두 행렬 $A,B \in \mathcal{M}_{n\times n}(\mathbb{F})$가 서로 합동관계에 있고, $n$차원 벡터공간 $(V,\mathbb{F})$와 어떤 순서가 있는 기저 $\beta$, 그리고 쌍선형 형식 $H \in \mathcal{B}(V)$이 존재하여 $\psi_{\beta}(H) = A$라 하자.

이제  어떤 순서가 있는 기저 $\gamma$가 존재하여 다음이 성립한다:

 

i) $\psi_{\gamma}(H) = B$

ii) $B = Q^{T}\psi_{\beta}(H) Q$, $Q$는 가역일 때, $Q$는 좌표계를 $\gamma$에서 $\beta$로 변환하는 좌표계 변환 행렬이다.

 

증명.

$A,B$가 합동 관계에 있으므로 어떤 가역행렬 $Q$가 존재하여 $B = Q^{T}\psi_{\beta}(H)Q$가 성립한다.

이제 다음과 같이 새로운 기저 $\gamma$를 정의한다:

 

$w_{j} = \Sigma_{i=1}^{n} Q_{ij}v_{i}$

 

$Q$는 가역행렬이므로 $\gamma$는 실제로 기저이고, 따라서 $Q$는 정의상 좌표계를 $\gamma$에서 $\beta$로 바꾸는 변환행렬이다. 이제 정리 6.33와 $B$의 구성에 의해

 

$$ B = Q^{T}\psi_{\beta}(H)Q = \psi_{\gamma}(H)$$이다. $\square$

 

 

6.6 스펙트럴 분해와 정사영

우리는 이전에 선형대수학 1을 복습하면서 스펙트럴 정리를 배웠었다. $V$가 내적공간이고 $T \in \mathcal{L}(V)$이라 하자. 이제 모든 $x,y \in V$에 대해 $Tx\bullet y = x \bullet T^{*}y$가 되는 유일한 adjoint operator $T^{*}$를 정의할 수 있었음을 상기하라.

 

$\mathbb{F} = \mathbb{C}$이면, $TT^{*} = T^{*}T$인 모든 선형변환 $T$는 어떤 정규직교기저 $\beta$로 대각화 가능했고, $\mathbb{F} = \mathbb{R}$이면 $T = T^{*}$인 모든 선형변환 $T$는 어떤 정규직교기저 $\beta$로 대각화 가능했다. (체에 따라 조건이 다른 이유는 특성다항식이 체에서 일차식으로 분해되어야 하기 때문이었음을 상기하라.)

 

 

이제 오늘은 "정규직교기저로 대각화 된다"는 말을, 정사영의 개념을 통해 설명하고자 한다. 특히, (예컨대 $\mathbb{F} = \mathbb{C}$일 때) 임의의 normal operator는 정사영의 합으로 분해된다는 중요한 결과를 얻을 것이다. 이하에서는 $V$가 내적공간이라 가정하고, $\mathbb{F} = \mathbb{C}$이거나 $= \mathbb{R}$이라 가정하자.

 

 

우선 사영의 개념을 정의해야 한다.

정의. (사영)

$T \in \mathcal{L}(V)$라 하고, $V = W_{1} \oplus W_{2}$라 하자. 이제 $x = x_{1} + x_{2}, x_{1} \in W_{1}, x_{2} \in W_{2}$일 때, $T(x) = x_{1}$으로 주어지는 선형변환 $T$는 the projection on $W_{1}$ along $W_{2}$라 한다. 

 

 

정리. (사영의 조건)

$T \in \mathcal{L}(V)$가 사영이면, $T^{2} = T$인 것이다. 역으로, $T^{2} = T$이면, $T$는 사영이다.

증명.

$(\Rightarrow)$ $V = W_{1} \oplus W_{2}$라 하고, $T$는 $W_{2}$를 따르는 $W_{1}$에 대한 사영이라 하자. 또한 $x = x_{1} + x_{2}, x_{1} \in W_{1}, x_{2} \in W_{2}$라 하자. 

이제 $T^{2}(x) = T(T(x)) = T(x_{1}) = x_{1}$이다.

 

$(\Leftarrow)$ $T^{2} = T$인 어떤 선형변환 $T \in \mathcal{L}(V)$가 주어졌다 하자. 이제 $V = R(T) \oplus N(T)$임을 보이면 족하다.

우선 $V = R(T) + N(T)$임을 보이고자 한다. 

$x = T(x) + (x - T(x))$ 임은 자명하다.

이제 $T(x) = T^{2}(x) + T(x-T(x)) = T(x) + T(x-T(x))$이므로 $x - T(x) \in N(T)$이고, $V = R(T) + N(T)$임을 안다.

이제 $x \in R(T) \cap N(T)$라 하자. 이제 다음의 사실들이 모두 성립한다: 

$$\exists y \in V, x = T(y) \\ \Rightarrow 0 = T(x) = T^{2}(y) = T(y) = x$$

 

따라서 $R(T) \cap N(T) = \{0\}$이므로 $V = R(T) \oplus N(T)$이다.

 

 

위의 논의에 의해 일반적인 사영은 range와 nullity 모두에 의해 주어짐에 주목하라.

한편, range와 nullity가 직교 관계를 가지는 특별한 사영이 존재하는데 이를 정사영이라 한다:

 

 

정의. (정사영)

$T \in \mathcal{L}(V)$가 사영이라 하자. 이제 $R(T) = N(T)^{\perp}, N(T) = R(T)^{\perp}$이면 $T$는 정사영이다.

 

유한차원 벡터공간에서는 두 조건 중 하나가 다른 하나를 내포하나, 무한차원에서는 그렇지 않으므로 두 조건을 모두 서술하였다.

 

 

유한차원 벡터공간의 경우 정사영은 $R(T)$에 의해서 완전히 정의된다는 사실에 주목하라. 

 

다음의 정리는 사영이 정사영일 조건을 서술한다:

 

정리 6.24 (정사영의 조건)

내적공간 $V$에 대해 $T \in \mathcal{L}(V)$가 사영이라 하자. 이제 $T$가 정사영일 필요충분조건은 $T^{*}$이 존재하고 $T = T^{*}$인 것이다.

 

$(\Rightarrow)$ $T$가 정사영이라 하자. 이제 $V = R(T) \oplus N(T)$이고 $R(T)^{\perp} = N(T), N(T)^{\perp} = R(T)$가 성립한다. 임의의 $x,y\in V$를 고르자. $x = x_{1} + x_{2}, y = y_{1} + y_{2}, x_{1}, y_{1} \in R(T), x_{2}, y_{2} \in N(T)$라 하자.

 

이제 $Tx\bullet y = x_{1} \bullet y = x_{1} \bullet y_{1} = x \bullet y_{1} = x \bullet Ty$

가 성립하므로 $T^{*}$가 존재하며 $T^{*} = T$라는 사실을 알 수 있다.

 

 

$(\Leftarrow)$ 사영 $T$에 대해 $T^{*}$가 존재하고 $T^{*} = T$라 하자. 이제 정사영임을 보이고자 한다.

임의의 $x \in R(T), y \in N(T)$라 하자. 이제 $\exists z \in V, x = Tz$이고, $x \bullet y = z \bullet T^{*}y = z \bullet Ty = z \bullet 0 = 0$이라는 사실을 아므로, $R(T) \subset N(T)^{\perp}$이다. 마찬가지로 $N(T) \subset R(T)^{\perp}$이다. 따라서 $R(T) \subset R(T)^{\perp \perp}$인데, $R(T)^{\perp\perp} \subset R(T)$이므로 $R(T) = N(T)^{\perp}, N(T) = R(T)^{\perp}$가 성립한다. $\square$

 

 

이제 우리는 정사영의 용어를 통해 스펙트럴 정리를 서술하고 증명할 수 있게 되었다:

 

 

정리 6.25 (스펙트럴 정리 - 정사영 버전)

$V$는 유한차원 내적공간이라 하고, $T \in \mathcal{L}(V)$라 하자. $\mathbb{F} = \mathbb{C}$이면 $T$가 normal이고, $\mathbb{F} = \mathbb{C}$이면 $T$가 self-adjoint라 하자.

이제 ONB $\beta$에 의해 $T$가 대각화된다는 사실을 안다. $\lambda_{1}, ... , \lambda_{k}$가 $T$의 서로 다른 고윳값들이고, $W_{i} \space (1 \leq i \leq k)$는 $\lambda_{i}$에 대응되는 고유공간이라 하자. 마지막으로, $T_{k}$는 고유공간 $W_{k}$에 대한 정사영이라 하자.

 

이제 다음의 사실들이 모두 성립한다:

 

1) $V = W_{1} \oplus W_{2} \oplus ... \oplus W_{k}$

2) $W_{i}^{\perp} = \oplus_{j \neq i} W_{j}$

3) $T_{i}T_{j} = \delta_{ij}T_{i}, \space 1 \leq i,j \leq k$

4) $I = T_{1} + T_{2} + ... + T_{k}$

5) $T = \lambda_{1} T_{1} + \lambda_{2} T_{2} + ... + \lambda_{k} T_{k}$

 

 

증명.

1) $T$는 ONB $\beta$에 의해 대각화 가능하다는 사실을 안다. 따라서, 고유벡터들로만 이루어져 있는 기저가 존재한다. 이제 예컨대 $\beta = \{v_{1}, ... , v_{m_{1}}, v_{m_{1}+1}, ... , v_{m_{2}}, ... , v_{m_{k}}\}$라 하자. 또한 $v_{1} , ... , v_{m_{1}}$은 $\lambda_{1}$에 대응하는 고유벡터들이고, $v_{m_{i}+1},... , v_{m_{i+1}}$은 $\lambda_{i+1}$에 대응하는 고유벡터들이라 하자.

이제 기저의 정의에  의해 $W_{i} = span \{v_{m_{i-1}+1}, ... , v_{m_{i}}\}$이고, 따라서 $V = W_{1} + W_{2} + ... + W_{k}$이다. 한편 서로 다른 고유공간에 들어간 벡터들은 수직이므로, $V = W_{1} \oplus W_{2} \oplus ... \oplus W_{k}$이라는 사실이 도출된다. (뒷부분은 정리 5.11을 사용하여도 된다.)

 

2) 서로 다른 고유공간에 있는 벡터들끼리는 수직이고 내적은 첫 항에 대한 선형성과 둘째항에 대한 켤레선형성을 만족하므로, $\oplus_{j\neq i} W_{j} \leq W_{i}^{\perp}$임을 안다. 그런데 $V$가 유한차원 내적공간이고, $dim (\oplus_{j \neq i} W_{j}) = \Sigma_{j \neq i} dim(W_{j}) = dim(V) - dim(W_{i}) = dim(W_{i}^{\perp})$이고 따라서 두 공간은 같다.

 

3) $x = x_{1} + ... + x_{k}, \space x_{i} \in W_{i}$인 $x_{i}$가 유일하게 존재함을 안다.

한편 $T_{i}T_{j}(x) = T_{i}(x_{i}) = \begin{cases} 0 \space (i \neq j) \\ x_{i} \space (i = j) \end{cases} = \delta_{ij}T_{i}(x)$임을 안다. 모든 $x \in V$에 대해 이것이 성립하므로 두 선형변환은 같다.

 

4) $x = x_{1} + ... + x_{k}$로 나타냈다 하자.

이제 $\Sigma_{i=1}^{k} T_{i}(x) = \Sigma_{i=1}^{k} x_{i} = I(x)$이다.

모든 $x\in V$에 대해 이것이 성립하므로 두 선형변환은 같다.

 

5) $x = x_{1} + ... + x_{k}$로 나타냈다 하자.

이제 $\Sigma_{i=1}^{k} \lambda_{i}T_{i}(x) = \Sigma_{i=1}^{k} \lambda_{i}x_{i} = T(x)$이다.

모든 $x \in V$에 대해 이것이 성립하므로 두 선형변환은 같다. $\square$

 

 

이제 $T \in \mathcal{L}(V)$가 normal ($\mathbb{F} = \mathbb{C}$) / self-adjoint ($\mathbb{F} =\mathbb{R}$)이라 하고, $W_{i}$가 서로 다른 고유치 $\lambda_{i}$들에 대응하는 고유공간이라 하자. $\beta$는 이 공간들의 기저의 합집합이라 하면,

 

$[T]_{\beta} = \begin{bmatrix} \lambda_{1} I_{m_{1}} \space\space O \space\space ... \space\space O \\ O \space\space \lambda_{2} I_{m_{2}} \space\space ... \space\space O \\ \vdots \space\space \vdots \space\space \vdots \\ O \space\space O \space\space ... \space\space \lambda_{k}I_{m_{k}} \end{bmatrix}$

 

이다.

 

 

스펙트럴 정리에 의해 많은 따름정리들이 성립한다. 넓게 봐서는 이후 다룰 SVD, polar decomposition, pseudoinverse 모두 스펙트럴 정리의 따름정리이다. "그다지 제약적이지 않은 조건을 만족하는 많은 linear operator들을, 잘 행동하는 orthogonal projection들의 합으로 나타낼 수 있다"는 정리의 위력이라 할 수 있겠다.

 

따름정리 1.

유한차원 내적공간 $V$에 대해 $T \in \mathcal{L}(V), \mathbb{F} = \mathbb{C}$라 하자. 이제 $T \space normal \Leftrightarrow \exists g: poly., \space g(T) = T^{*}$이다.

증명.

$(\Leftarrow) T^{*} = g(T) = \Sigma_{i=0}^{m} a_{i}T^{i}$이다. 그런데 선형변환의 합성 시 스칼라곱은 순서와 무관하므로 $TT^{*} = \Sigma_{i=0}^{m} T(a_{i}T^{i}) = \Sigma_{i=0}^{m} a_{i} T^{i+1} = \Sigma_{i=0}^{m} (a_{i}T^{i})T = T^{*}T$이다.

 

$(\Rightarrow)$ $T$는 복소내적공간에서 normal하므로 ONB로 대각화 가능하다. $T$의 고유치들을 $\lambda_{1}, ... , \lambda_{k}$라 하자. 이제 스펙트럴 정리에 의해 정사영 $T_{1}, ... , T_{k}$가 존재하여 $T = \Sigma_{i=1}^{k} \lambda_{i} T_{i}$가 성립한다.

이제 Lagrange interpolation formula를 이용하여 $g(\lambda_{i}) = \overline{\lambda_{i}}$가 성립하는 다항식 $g$를 생각하자. $T_{i}T_{j} = \delta_{ij} T_{i}$를 이용하면, 임의의 다항식 $g$에 대해 $g(\Sigma_{i=1}^{k} \lambda_{i} T_{i}) = \Sigma_{i=1}^{k} g(\lambda_{i}) T_{i}$임을 안다.

그런데 위에서 구한 $g$를 생각하면,

 

$g(T) = \Sigma_{i=1}^{k} \overline{\lambda_{i}} T_{i} = \Sigma_{i=1}^{k} \overline{\lambda_{i}} T^{*}_{i} = (\Sigma_{i=1}^{k} \lambda_{i}T_{i})^{*} = T^{*}$이다. $\square$

 

 

따름정리 2.

$\mathbb{F} = \mathbb{C}$라 하고 $V$는 유한차원 내적공간이라 하자.

이제 $T \in \mathcal{L}(V)$라 할 때, 다음이 성립한다:

 

$T \space unitary \Leftrightarrow T \space normal, |\lambda_{i}|=1$

 

증명.

$(\Rightarrow)$ $T$가 유니터리하면 $T$가 normal하다. 따라서 $T$는 ONB로 대각화 가능하고, 스펙트럴 정리에 의해 정사영 $T_{1}, ... , T_{k}$가 존재하여,

$T = \lambda_{1}T_{1} + ... + \lambda_{k}T_{k}$이다.

 

이제 $T^{*} = \Sigma_{i=1}^{k} \overline{\lambda_{i}}T_{i}$이다. $T$가 유니터리이므로,

$I = TT^{*} = \Sigma_{i=1}^{k} |\lambda_{i}|^{2} T_{i} = \Sigma_{i=1}^{k} T_{i}$이다.

 

$x_{i} \in W_{i}$를 각각 대입하면 $|\lambda_{i}| = 1$임을 알 수 있다.

 

$(\Leftarrow)$ 이미 증명하였다.

 

 

따름정리 3.

$\mathbb{F} = \mathbb{C}$라 하고 $V$는 유한차원 내적공간이라 하자.

이제 $T \in \mathcal{L}(V)$가 normal하다 하자. $T$의 서로 다른 고윳값들을 $\lambda_{1},...,\lambda_{k}$라 할 때 다음이 성립한다:

$T \space self-adjoint \Leftrightarrow \lambda_{i} \in \mathbb{R}$

 

증명.

$(\Leftarrow)$ $T$가 normal하므로 스펙트럴 정리에 의해 정사영 $T_{1}, ..., T_{k}$가 존재하여 $T = \lambda_{1}T_{1} + ... + \lambda_{k}T_{k}$이다. 이제 $T$의 모든 고유치들이 실수라 하자. $T^{*} = \overline{\lambda_{1}}T_{1} + ... + \overline{\lambda_{k}}T_{k} = T$이다.

 

$(\Rightarrow)$ 이미 증명하였다.

 

따름정리 4.

$T$가 스펙트럴 정리를 적용할 요건들을 만족한다 하고, $T = \lambda_{1}T_{1} + ... + \lambda_{k}T_{k}$라 하자.

이제 각 $T_{i}$에 대해, 어떤 다항식 $g$가 존재하여 $T_{i} = g(T)$이다.

 

증명.

Lagrange interpolation formula를 쓰면 된다.

 

 

 

6.7 특이값 분해와 Pseudoinverse

1) 특이값 분해 (Singular Value Decomposition)

$V,W$는 유한차원 내적공간이고 $T \in \mathcal{L}(V,W)$라 하자. (아무런 제한이 없다!) 우리는 이전에 $T^{*}$를 $\mathcal{L}(V)$에 대해서만 정의했지만, 다음의 식을 만족하도록 $\mathcal{L}(V,W)$에 있는 $T^{*}$ 또한 (최소한 유한차원에서는) 유일하게 정의할 수 있다:

 

$$ v \in V, w \in W \Rightarrow (Tv \bullet w)_{V} = (v \bullet T^{*}w)_{W}$$

(아랫첨자는 각각의 벡터공간에서 정의된 내적을 사용한다는 의미이다.)

 

이제 이러한 사실을 염두에 두면, adjoint가 만족했던 많은 성질들 (eg. $(TU)^{*} = U^{*}T^{*}$)가 이 새로운 맥락에서도 성립함을 알 수 있다.

 

이제 $T^{*}T \in \mathcal{L}(V)$라는 새로운 linear operator을 고려하자. 다음의 사실들이 성립한다:

1) $(T^{*}T)^{*} = T^{*}T$이므로 이 새로운 linear operator은 self-adjoint하다.

2) $rank(T^{*}T) = rank(T)$이다.

3) $v \in V$에 대해 $(T^{*}Tv, v)_{V} = (Tv, Tv)_{W} \geq 0$이므로 $T^{*}T$는 positive semi-definite하다.

 

1)에 의해 체가 무엇인지에 상관없이 어떤 ONB $\beta = \{v_{1}, ... , v_{n}$로 대각화 가능하며, 6.6절의 따름정리 3에 의해 모든 고윳값들이 실수이다. 이제 $rank(T^{*}T) = rank(T) = r \leq n$이라 하고, $v_{i}$에 대응하는 고윳값들이 $\lambda_{1} \geq \lambda_{2} \geq ... \geq \lambda_{n} \geq 0$이라 하자 (모든 고윳값이 0보다 작지 않은 것은 3)에 의한 것이다). 특히 $r < n$이면, $\lambda_{r+1} = \lambda_{r+2} = ... = \lambda_{n} = 0$일 것이다. 

 

이제 $W$의 선형독립인 집합 $\{w_{1}, ... , w_{r} \}$을 다음과 같이 정의하자:

$$w_{i} := \frac{1}{\sqrt{\lambda_{i}} T(v_{i}),  \space 1 \leq i \leq r$$

 

이 집합이 정규직교집합이라는 것을 보이고자 한다.

a. 정규성의 증명.

$$(w_{i} \bullet w_{i})_{W} = \frac{1}{\lambda_{i}} (Tv_{i}, Tv_{i})_{W} \\ = \frac{1}{\lambda_{i}} (T^{*}Tv_{i}, v_{i})_{V} \\ = \frac{1}{\lambda_{i}} (\lambda_{i}v_{i}, v_{i}) = 1$$

 

b. 직교성의 증명.

$1 \leq i \neq j \leq r$이라 하자. 이제 $$(w_{i} \bullet w_{j})_{W} = \frac{1}{\sqrt{\lambda_{i}\lambda_{j}}}(Tv_{i}, Tv_{j})_{W} \\ = \frac{1}{\sqrt{\lambda_{i}\lambda_{j}}}(T^{*}Tv_{i}, v_{j})_{V} \\ = 0$$

 

 

이제 이 선형독립인 집합으로부터 그람-슈미트 과정에 의해 정규직교기저를 구성할 수 있다. 이 기저를 $\gamma = \{ w_{1}, w_{2}, ... , w_{m}\}$이라 하자.

 

이제 $$([T]_{\beta}^{\gamma})_{ij} = \begin{cases} \sigma_{i} = \sqrt{\lambda_{i}} \space (1 \leq i = j \leq r) \\ 0 \space (o.w.) \end{cases}$$

이다.

 

이러한 정보를 바탕으로 다음의 정리를 증명하자.

 

정리 6.26 (SVD)

$V,W$가 유한차원 내적공간이고 $T \in \mathcal{L}(V,W)$이고 $rank(T) = r$이라 하자. 이제 $V,W$의 정규직교기저 $\beta = \{v_{1},...,v_{n}\}, \gamma = \{w_{1},...,w_{m}\}$와 스칼라 $\sigma_{1} \geq \sigma_{2} \geq ... \geq \sigma_{r} > 0가 존재하여

$$T(v_{i}) = \begin{cases} \sigma_{i}w_{i} \space (1 \leq i \leq r) \\ 0 \space (i > r) \end{cases} ...(*)$$

가 성립한다.

 

역으로 $(*)$가 성립하는 정규직교기저들과 스칼라들이 주어졌다 하자. 이제 $v_{1}, ... , v_{n}$들은 $T^{*}T$의 고유벡터들이며, $v_{i}$에 대응하는 고유치는 $\sigma_{i}^{2} \space (1 \leq i \leq r), 0 \space (i > r)$이다. 따라서 위의 방법에 의해 도출되는 스칼라들은 유일하다.

 

증명.

첫 부분은 위의 논의에 의해서 모두 증명하였다.

따라서 유일성을 증명하는 것으로 족하다.

 

(*)를 만족하는 정규직교기저 $\beta = \{v_{1}, ... , v_{n}\}, \gamma = \{w_{1}, ... , w_{m}\}$이 주어졌다 하자. 

이제 $1 \leq i \leq r$을 고정하면, 모든 $j$에 대해 $(T^{*}Tv_{i}, v_{j})_{V} = (Tv_{i}, Tv_{j})_{W} = \sigma_{i}\sigma_{j} \delta_{ij} = (\sigma_{i}^{2}v_{i}, v_{j})_{V}$이므로 모든 $v \in V$에 대해서도 $(T^{*}Tv_{i}, v)_{V} = (\sigma_{i}^{2}v_{i}, v)_{V}$이다. 따라서 $T^{*}Tv_{i} = \sigma_{i}^{2}v_{i}$이다.

또한 $i > r$을 고정하면 모든 $j$에 대해 $(T^{*}Tv_{i}, v_{j})_{V} = (Tv_{i}, Tv_{j})_{W} = 0$이므로 마찬가지로 $T^{*}Tv_{i} = 0$이다. 따라서 증명이 완료된다. $\square$

 

이제 특이값의 존재성과 유일성이 정립되었으므로 이를 정의할 수 있게 되었다.

 

정의. (특이값)

정리 6.26에서 나오는 값 $\sigma_{1} \geq \sigma_{2} \geq ...\geq \sigma_{r} > 0$을 $T$의 특이값이라 부른다. 만약 $rank(T) < min(m,n)$이면, $\sigma_{r+1} = ... = \sigma_{min(m,n)} = 0$ 또한 $T$의 특이값이라 부른다.

 

이제 선형변환이 아닌 행렬에 대해서 특이값들을 구하고자 한다. 행렬의 경우 특히 행렬을 특수한 행렬들의 곱으로 분해할 수 있고 이 분해를 특이값 분해라 부른다.

 

$A \in \mathcal{M}_{m\times n}$이라 하자. 이제 이 행렬에 대응되는 선형변환 $L_{A}: \mathbb{F}^{n} \to \mathbb{F}^{m}$이 존재한다는 사실을 안다. 또한 $rank(A) = r$이라 하자.

 

이제 $L_{A}$은, 정리 6.26에 의해 $\mathbb{F}^{n}, \mathbb{F}^{m}$의 정규직교기저 $\beta, \gamma$와 특이값 $\sigma_{1} \geq \sigma_{2} \geq ... \geq \sigma_{r} > \sigma_{r+1} = ... = \sigma_{min(m,n)} =0$이 존재하여, 

 

$$([L_{A}]_{\beta}^{\gamma})_{ij} = \begin{cases} \sigma_{i} \space (1 \leq i = j \leq r) \\ 0 \space (o.w.) \end{cases}$$가 성립한다.

 

따라서, $\mathbb{F}^{n}, \mathbb{F}^{m}$의 표준기저들을 각각 $st_{n}, st_{m}$이라 표시하면,

 

$$ [L_{A}]_{st_{n}}^{st_{m}} = [I_{m}]_{\gamma}^{st_{m}} [L_{A}]_{\beta}^{\gamma} [I_{n}]_{st_{n}}^{\beta} $$이다.

 

이제 $[I_{m}]_{\gamma}^{st_{m}}$의 열벡터들은 $\gamma$의 벡터들로 정규직교기저를 이루므로, 이 행렬은 유니터리하다는 사실을 안다.

 

마찬가지로 $[I_{n}]_{st_{n}}^{\beta}$의 역행렬의 열벡터들은 $\beta$의 벡터들로 정규직교기저를 이루므로, 

이 행렬도 유니터리하다는 사실을 안다.

 

따라서 행렬 $A$에 대해, 유니터리 행렬 $U,V$와 $(\Sigma)_{ij} = \begin{cases} \sigma_{i} \space (1 \leq i = j \leq r) \\ 0 \space (o.w.) \end{cases}$를 만족하는 행렬 $\Sigma$가 존재하여,

$$ A = U\Sigma V^{*}$$가 성립한다.

 

이렇게 행렬을 분해한 결과를 특이값 분해라 한다. 특히, $\Sigma$의 주대각성분들은 $L_{A}$의 특이값들이고, 따라서 $AA^{*}$ 또는 $A^{*}A$의 고윳값들의 (양의) 제곱근임에 주목하라.

 

 

eg. Find the singular value decomposition for the matrix $A = \begin{bmatrix} 1 \space\space 1 \space\space -1 \\ 1 \space\space 1 \space\space -1 \end{bmatrix}$.

 

 

2) Polar Decomposition

우리의 목적은 복소수를 (양의 x축으로부터의 각)*(음이 아닌 실수)꼴로 나타냈듯, 정사각행렬 $A \in \mathcal{M}_{n\times n}$를 (유니터리 행렬)*(양의 준정부호 행렬)로 나타내는 것이다.

이것은 특이값 분해에 의해서 쉽게 이루어진다.

 

정리 6.28

$A \in \mathcal{M}_{n\times n}$이라 하자. 이제 유니터리 행렬 $W$와 양의 준정부호 행렬 $P$가 존재하여 $$A = WP$$가 성립한다.

또한, $A$가 가역이면 이 분해는 유일하다.

 

증명.

(존재성)

특이값 분해에 의해 

$$ A = U\Sigma V^{*}$$가 주어졌다 하자.

이제 $$ A = (UV^{*})(V\Sigma V^{*})$$이고, 유니터리 행렬의 곱은 유니터리이므로 첫 괄호로 묶은 행렬은 유니터리이며,

$$ (V \Sigma V^{*} x \bullet x) = (\Sigma V^{*}x \bullet V^{*}x) \geq 0$$이므로 둘째 괄호로 묶은 행렬은 양의 준정부호이다. 여기서 $\Sigma$는 대각행렬이며 모든 고유치가 음이 아니므로 양의 준정부호이다. 

 

(가역일 시 유일성)

$A$가 가역이라 하자. 이제 귀류법을 사용하여 $A = WP = ZQ$라 하고, $W,Z$는 유니터리, $P,Q$는 양의 준정부호라 하자.

 

그렇다면 $P,Q$는 가역행렬이여야 하므로 양의 정부호이며, $Z^{-1}W = QP^{-1}$은 유니터리 행렬이다.

그런데 $P,Q$는 양의 정부호 행렬이므로 $P,Q$는 self-adjoint하고, 따라서

$$ PQ^{-1} = (W^{-1}Z) = (Z^{-1}W)^{*} = (QP^{-1})^{*} = P^{-1}Q$$

이고, 따라서

$$ P^{2} = Q^{2}$$이다.

이제 $P,Q$가 양의 정부호이므로 $P = Q$여야 한다.

 

# 위의 주장에 대한 증명.

$P,Q$는 self-adjoint하므로 항상 ONB에 대해 대각화 가능하다. 대각화한 정규직교기저들을 각각 $\beta = \{v_{1}, ... , v_{n} \}, \gamma = \{w_{1}, ... , w_{n} \}$이라 하자.

또한 $P,Q$는 양의 정부호이므로 모든 고윳값이 0보다 크다.

이제 $P$의 고윳값을 $\lambda_{1} > \lambda_{2} > ... > \lambda_{s} > 0$, $Q$의 고윳값을 $\mu_{1} > \mu_{2} > ... > \mu_{t} > 0$이라 하자.

 

이제 다음을 보일 것이다:

a) $\lambda_{1} = \mu_{1}$

b) $Pv = \lambda_{1} v \Leftrightarrow Qv = \mu_{1} v$

c) s = t, $P=Q$

 

a)의 증명.

일반성을 잃지 않고 $\lambda_{1} > \mu_{1}$이라 하자.

이제 일반성을 잃지 않고 $Pv_{1} = \lambda_{1}v_{1}$를 만족한다 하자.

이제 $\gamma$는 $\mathbb{F}^{n}$의 기저이므로, $v_{1} = \Sigma_{i=1}^{n} a_{i} w_{i}$인 $a_{i} \in \mathbb{F}$가 존재하고, 특히 두 벡터의 노름이 동일해야 하므로 $\Sigma_{i=1}^{n} |a_{i}|^{2} = 1$이 성립한다.

 

그런데 $P^{2}v_{1} = \lambda_{1}^{2} v_{1} = \Sigma_{i=1}^{n} a_{i}\mu_{\psi(i)}^{2} w_{i}$이다. 여기서 $\psi(i)$는, $w_{i}$에 대응하는 고유치를 돌려주도록 설정된 함수이다. 노름을 재면 한편으로는 $\lambda_{1}^{2}$이고 다른 한편으로는 $\mu_{1}^{2}$보다 클 수 없으므로, 이는 모순이다.

 

b)의 증명.

이제 $Pv = \lambda_{1}v$라고 하자. 일반성을 잃지 않고 $||v|| = 1$이라 하자.

이제 $v = w + z, Qw = \mu_{1}w, z \in W_{1}^{\perp}$라고 하자.

두 부분공간은 수직이므로 $1 = ||w||^{2}+||z||^{2}$이다.

또한 $||Q^{2}v||^{2} = ||P^{2}v||^{2} = \lambda_{1}^{4} = \mu_{1}^{4} ||w||^{2} + ||Q^{2}z||^{2} \leq \mu_{1}^{4} ||w||^{2} + \mu_{2}^{4} ||z||^{2} \leq \mu_{1}^{4}$이다. 그런데 등호가 항상 성립해야 하므로 가능한 유일한 경우는 $||w|| = 1, ||z|| = 0$인 경우이다. 반대의 경우도 마찬가지로 증명할 수 있다.

 

c)의 증명.

이제 $P,Q$ 모두 가장 큰 고윳값 $\lambda_{1}$에 대응하는 고유공간이 같으므로 이 고유공간을 $E_{\lambda_{1}}$이라 표기하자. 이제 $L_{P}, L_{Q}$를 $E_{\lambda_{1}}^{\perp}$에 제한한 선형변환에 대해서 동일한 논의를 반복하면 두 행렬의 고윳값들이 모두 같고, 대응하는 고유공간이 모두 같아진다는 결론을 얻는다. 이는 어떤 유니터리 행렬 $W$가 존재하여, $P = W^{-1}DW = Q$임을 의미한다. 따라서 증명이 완료되었다.

$\square$

 

 

3) Pseudoinverse

$T \in \mathcal{L}(V,W)$라 하자. 일반적으로 $dim(V) = dim(W)$이고 $T$가 전단사이면 역변환 $T^{-1}$을 정의할 수 있었음을 상기하라. 그러나 이것이 성립하지 않는 경우에도 "역변환과 가장 가까운 변환" $T^{\dagger} \in \mathcal{L}(W,V)$를 정의할 수 있으면 좋을 것이다.

 

다음과 같이 pseudoinverse를 정의하자:

 

정의. (Pseudoinverse)

$V,W$가 유한차원 내적공간이고 $T: V \to W$가 선형변환이라 하자.

 

$L: N(T)^{\perp} \to R(T)$는 $x \in N(T)^{\perp} \Rightarrow L(x)= T(x)$로 주어진다고 하자.

이제 $N(L) = \{0\}$이므로, dimension theorem에 의해 $L$은 전단사라는 사실을 알고, 다음과 같이 Moore-Penrose Pseudoinverse를 정의할 수 있다:

 

$$ T^{\dagger}(x) = \begin{cases} L^{-1}(x) \space (x \in R(T)) \\ 0 \space (x \in R(T)^{\dagger}) \end{cases}$$

 

이제 특이값 분해를 이용하여 pseudoinverse를 명시적으로 구해 보자.

 

$T: V \to W$이고 $V,W$가 내적공간이어서 정리 6.26의 조건이 성립한다 하자. 또한 $rank(T) = r \leq min(m,n)$이라 하자. 이제 각각 $V,W$의 정규직교기저인 $\beta = \{v_{1}, ... , v_{n}\}, \gamma = \{w_{1}, ... , w_{m} \}$와 특이값 $\sigma_{1} \geq \sigma_{2} \geq ... \geq \sigma_{r} > 0$가 존재하여

$$T(v_{i}) = \begin{cases} \sigma_{i}w_{i} \space (1 \leq i \leq r) \\ 0 \space (i > r) \end{cases}$$

가 성립한다. 여기서 특히 $span\{v_{1}, ... , v_{r} \} = N(T)^{\perp},  span\{v_{r+1},...,v_{n}\} =N(T), span\{w_{1},...,w_{r}\} = R(T)$임에 주목하라.

 

 

따라서 $T$의 pseudoinverse는 다음과 같이 주어진다:

 

$$ T^{\dagger}(w_{i}) = \begin{cases} \frac{1}{\sigma_{i}} v_{i}} \space (1 \leq i \leq r) \\ 0 \space (i > r) \end{cases}$$

 

 

선형변환의 pseudoinverse를 보았으므로 이제 행렬의 pseudoinverse를 다루고자 한다.

$A \in \mathcal{M}_{m\times n}$이라 하자. 이제 관련된 선형변환 $L_{A}: \mathbb{F}^{n} \to \mathbb{F}^{m}$이 존재한다.

 

이제 $A^{\dagger} = [L_{A}^{\dagger}]_{st}^{st}$로 정의한다.

즉, $$ (L_{A})^{\dagger} = L_{A^{\dagger}}$$가 성립하도록 $A$의 pseudoinverse를 정의한다.

 

행렬의 경우 특이값 분해가 가능했으므로, 특이값 분해를 바탕으로 pseudoinverse를 분석해 보자.

 

$A = U\Sigma V^{*}$의 특이값 분해가 이루어졌다 하자.

특히 $U,V$는 유니터리 행렬이고 $\Sigma_{ij} = \begin{cases} \sigma_{i} \space (i=j \leq r) \\ 0 \space (o.w.) \end{cases}$라 하자.

 

 

이제 다음의 정리를 얻는다:

 

정리 6.29 $A \in \mathcal{M}_{m\times n}, rank(A) = r$이고 특이값들 $\sigma_{1} \geq \sigma_{2} \geq ... \geq \sigma_{r}$을 가지며 특이값 분해 $A = U\Sigma V^{*}$가 주어졌다 하자. 또한 $\Sigma^{\dagger}$은 다음과 같이 정의된다 하자:

 

$$ \Sigma_{ij}^{\dagger} = \begin{cases} \frac{1}{\sigma_{i}} \space (i=j \leq r) \\ 0 \space (o.w.) \end{cases}$$

 

이제 $A^{\dagger} = V \Sigma^{\dagger} U^{*}$은 $A^{\dagger}$의 특이값 분해이다.

 

증명.

$L_{V\Sigma^{\dagger}U^{*}} = L_{U\Sigma V^{*}}^{\dagger}$임을 보이면, $U, V$가 유니터리이고 $\Sigma^{\dagger}$는 정리 6.27의 형태를 띠므로 증명을 완료하는 데 충분하다.

 

 

$V$의 열벡터들이 이루는 기저를 $\beta = \{v_{1}, ... , v_{n} \}$, $U$의 열벡터들이 이루는 기저를 $\gamma = \{w_{1}, ... , w_{m}\}$이라 하자.

 

 

이제 $L_{A}(v_{i}) = \begin{cases} \sigma_{i}u_{i} \space (1 \leq i \leq r) \\ 0 \space (i > r) \end{cases}$이고, $R(T) = span\{w_{1}, ... , w_{r}\}, N(T)^{\perp} = span\{v_{1},...,v_{r}\}$이다.

 

또한 $L_{A^{\dagger}}(w_{i}) = V \Sigma^{\dagger} U^{*} (Ue_{i}) = V\Sigma^{\dagger}e_{i} = \begin{cases} \frac{1}{\sigma_{i}} v_{i} \space (1 \leq i \leq r) \\ 0 \space (i > r) \end{cases}$이므로, $L_{A^{\dagger}} = (L_{A})^{\dagger}$임을 보였다. $\square$

 

 

 

마지막으로 선형연립방정식 체계와 pseudoinverse의 관계를 살펴보자. 만약 $A \in \mathcal{M}_{n \times n}(\mathbb{F})$이 가역이면, 선형연립방정식 체계 $Ax = b$는 유일한 근 $x = A^{-1}b$를 가진다. 그러나 $A$가 가역이 아닐 때에 이 방법을 쓸 수 없다는 단점이 존재한다. 우리는 다음의 조건들을 만족하는 어떤 알고리즘을 원한다 하자:

 

(i) $Ax = b$에 해가 존재한다면, $||x||$가 가장 작은 해를 돌려준다.

(ii) $Ax = b$에 해가 존재하지 않는다면, $||Ax-b||$가 가장 작은 $x$를 돌려준다.

 

 

이제 다음의 정리는 pseudoinverse가 이 알고리즘과 밀접한 관련이 있음을 시사한다:

 

정리 6.30 

연립방정식 체계 $Ax = b, A \in \mathcal{M}_{m\times n}, b \in \mathbb{F}^{m}$이라 하자. $z = A^{\dagger}b$라 하면, $z$는 다음의 성질들을 가진다:

 

(i) $Ax = b$에 해가 존재한다면, $z$는 해이며 $||z||$는 해 중에서 가장 작다. 

(ii) $Ax = b$에 해가 존재하지 않는다면, $z$는 $||Az-b|| \leq ||Ax-b||$를 만족한다. 즉 $Az$는 $b$에 가장 가까운 $R(L_{A})$의 원소이다.

 

 

증명.

우선 다음의 사실을 확인하자:

$T: V \to W$가 내적공간 사이의 선형변환이고, $T^{\dagger}: W \to V$가 그 pseudoinverse라 하자.

이제 $T^{\dagger}T$는 $N(T)^{\perp}$에의 정사영이고, $TT^{\dagger}$은 $R(T)$에의 정사영이다.

증명은 $T^{\dagger}$의 정의로부터 바로 유도된다.

 

 

이제 행렬 $A$로 유도되는 선형변환 $L_{A}$를 고려한다. $b \in R(L_{A})$라 하자. 이 경우 $L_{AA^{\dagger}} = L_{A}L_{A^{\dagger}} = L_{A}(L_{A})^{\dagger}$은 $R(L_{A})$에의 정사영이므로 $AA^{\dagger}(b) = b$이다.

특히, $Aw = b = AA^{\dagger}b$가 성립하면, $w - z \in N(T)$이므로, $||w||^{2} = ||w-z||^{2} + ||z||^{2} \leq ||z||$이다.

 

이제 $b \notin R(L_{A})$라 하자.

이 경우 $b = w_{1} + w_{2}, w_{1} \in R(L_{A}), w_{2} \in R(L_{A})^{\perp}$이다.

따라서 $AA^{\dagger}b = w_{1} = Az$이고, 만약 $x \in \mathbb{F}^{n}$이면,

 

$$ ||Ax - b||^{2} = ||A(x-z)||^{2} + ||Az - b||^{2} \leq ||Az-b||^{2}$$이다. $\square$

 

 

 

다음 글에서는 연습문제를 몇 개 풀도록 하겠다.

* 2022.09.13, 2022.09.15 수업의 복습입니다.*

 

#주석.

함수열의 연속과 관련한 단어들이 둘이다 보니 (uniformly continuous / equicontinuous) 이제는 번역을 어떻게 해야 할지 모르겠다. 앞으로는 그냥 영어 표현을 있는 대로 쓰겠다.

 

해개연 1 범위에서 배운 다음의 사실을 상기하자:

실수/복소수로 만들어진 수열 $(x_n)_{n\geq 1}$이 유계라 하자. 즉 어떤 실수 $R >0$이 존재하여 $\forall n\in\mathbb{N}, |x_{n}| < R$가 성립한다 하자.

우리는 이 수열에는 항상 수렴하는 부분수열이 있다는 사실을 배웠다. 

 

이제 함수열과 관련하여 유사한 질문들을 던지고자 한다. 특히, 함수열이 "유계"일 때, 균등수렴(uniformly converge)하는 부분수열이 존재하는지가 큰 관심의 대상이 될 것이다. 점별수렴이 아니라 균등수렴을 다루는 이유는, 함수공간 자체를 하나의 거리공간으로 볼 때 수렴의 자연스러운 개념이 균등수렴이기 때문이다.

 

 

이제 "유계"에 대해 더 곰곰히 생각할 필요가 있다. 어떤 복소수열 $(x_{n})_{n\geq 1}$이 유계라는 것은 어떤 수 $M \in \mathbb{R}$이 존재하여 $n \in \mathbb{N} \Rightarrow |x_{n}| < M$이 성립하는 것이었다. 유계인 함수는 그 자체에 노름을 줄 수 있었음을 상기하면, 어떤 함수열 $(f_{n})_{n \geq 1}$이 유계라는 것 역시, 어떤 수 $M \in \mathbb{R}$이 존재하여 $n \in \mathbb{N} \Rightarrow ||f_{n}|| < M$이 성립하는 것이라 할 수 있다. 즉, $$sup_{n \in \mathbb{N}} sup_{x \in E} |f_{n}(x)| \leq M$$이 성립하는 수 $M$이 존재하는 것이다. 이 성질을 만족하는 함수열 $f_{n}$은 균등유계 (uniformly bounded)인 함수열이라 부른다.

 

 

이에 반해, $sup_{x \in E}$ 조건을 제외하고, 각 $x\in E$에 대해서 복소수열 $(f_{n}(x))_{n \geq 1}$이 수렴하면, 이 함수열은 점별유계 (pointwise bounded)인 함수열이라 부른다. 점별유계는 어찌보면 생각해내기 더 쉬운 개념이지만, 함수공간 자체를 분석하는 데에는 균등유계 개념이 더 유용하다고 할 수 있겠다.

 

 

이제 본 질문으로 돌아가서, 함수열 $f_{n}: (X,d) \supset E \to \mathbb{C}$이 균등유계/ 점별유계라 하자. $f_{n}$의 부분수열 $f_{n_{k}}$가 존재하여 $f_{n_{k}}$가 $E$서 정의된 어떤 함수로 점별수렴할 수 있는가?

 

우선 살펴볼 것은, $E$가 한 점에 불과할 때에는 $(f_{n})_{n \geq 1}$이 수열과 다름이 없어져서, 이미 해석개론 1 범위에서 살펴본 Heine-Borel 정리에 의해 수렴하는 부분수열이 존재할 것이다.

 

비슷한 논리로, $E$의 원소의 유한할 때에도 이러한 부분수열을 항상 잡을 수 있을 것이다. 그렇다면 $E$의 원소가 "너무 많아지는" 시점은 언제인가? 다음의 정리는 "가산일 때는 괜찮다"라는 부분적인 답을 준다:

 

 

정리 7.23

$E$는 가산집합 (countably infinite)이고, 함수열 $f_{n}: (X,d) \supset E \to \mathbb{C}$가 점별유계라 하자.

이제 $f_{n}$의 부분수열 $f_{n_{k}}$가 존재하여, 어떤 함수 $f: E \to \mathbb{C}$로 점별수렴한다.

 

 

증명.

$E$가 가산이므로, 수열 $(x_{i})_{i \geq 1}$로 $E$의 원소들을 모두 나열할 수 있다. 따라서 앞으로는 일반성을 잃지 않고 $E = \{x_{1}, x_{2}, ... \}$이라 하자.

 

$x_{1}$을 고정하자. 이제 $(f_{n}(x_{1}))_{n \geq 1}$은 유계인 복소수열이므로, Heine-Borel 정리에 의해 수렴하는 부분수열을 가진다. 이 부분수열을 $(g^{1}_{k})_{k \geq 1}$이라 하자.

 

이제 $x_{2}$를 고정하자. 이제 $(f_{n}(x_{2}))_{n \geq 1}$은 유계인 복소수열이므로, $(g^{1}_{k}(x_{2}))_{k \geq 1}$ 역시 유계인 복소수열이고, 따라서 수렴하는 부분수열을 가진다. 이 부분수열을 $(g^{2}_{k})_{k \geq 1}$이라 하자.

 

 

마찬가지로 부분수열들 $g^{1}_{k}, g^{2}_{k}, ... , g^{i}_{k}$가 위의 과정을 거쳐서 만들어졌다 하자. 이제 $(g^{i}_{k}(x_{i+1}))_{k \geq 1}$은 유계인 복소수열이므로 수렴하는 부분수열 $g^{i+1}_{k}$를 가진다. 이럴 수 있는 것은 Heine-Borel 정리 덕분이다.

 

특히, 부분수열의 모든 항들은 원래 수열에서의 아래첨자가 오름차순으로 오도록 정렬한다 하자. 예컨대 $\{g^{1}_{k}\}_{k \geq 1} = \{f_{1}, f_{3}, f_{5}, ... \}$이라 하면, $g^{1}_{k} = f_{2k-1}$이 되도록 하는 식이다. 이는 단순히 부분수열을 원래 함수열로 치환할 때 아래첨자가 오름차순으로 오도록 하기 위함이다. 

 

 

이제 모든 부분수열의 항들 $g^{i}_{k}$를 하나의 2차원 배열로 나열해보자:

 

$x_{1}$서 수렴 $g^{1}_{1}$ $g^{1}_{2}$ $g^{1}_{3}$ ...
$x_{1}, x_{2}$서 수렴 $g^{2}_{1}$ $g^{2}_{2}$ $g^{2}_{3}$ ...
$x_{1}, x_{2}, x_{3}$서 수렴 $g^{3}_{1}$ $g^{3}_{2}$ $g^{3}_{3}$ ...
$x_{1}, x_{2}, x_{3}, x_{4}$서 수렴  $g^{4}_{1}$ $g^{4}_{2}$ $g^{4}_{3}$ ...
.... ... ... ... ...

 

이제 다음과 같이 대각선 성분들만을 택한다 하자:

$h_{k} := g^{k}_{k}$

 

이 $h_{k}$는 $(f_{n})_{n\geq 1}$의 부분수열임은 명백하다. 이제 이것이 점별수렴함을 보일 것이다.

$x_{i} \in E$를 고정하자.

우리는 $(g^{i}_{k}(x_{i}))_{k \geq 1}$이 수렴함을 알기 때문에 다음의 사실도 안다:

 

$$ \forall \epsilon > 0, \exists N \in \mathbb{N} \space s.t. \space n,m \geq N \Rightarrow |g^{i}_{N}(x_{i}) - g^{i}_{M}(x_{i})| < \epsilon$$

 

이제 $\epsilon >0$을 고정하자. 위에서 구해진 $N$을 생각해보자.

 

$$n,m \geq N \Rightarrow |h_{n}(x_{i}) - h_{m}(x_{i})| = |g_{n}^{n}(x_{i}) - g_{m}^{m}(x_{i})|  \\ \leq |g_{n}^{n}(x_{i}) - g_{n}^{m}(x_{i})| + |g_{n}^{m}(x_{i}) - g_{m}^{m}(x_{i})| \\ \leq \frac{\epsilon}{2} + \frac{\epsilon}{2} = \epsilon$$

임을 안다.

 

여기서 마지막 부등식이 성립하는 이유를 설명하고자 한다.

 

앞서 $n,m \geq N$이라 했으므로 $g_{n}^{m}, g_{n}^{n}, g_{m}^{m}$ 모두 $(g^{N}_{k})_{k \geq 1}$의 어떤 항일 것이다. 특히, 아랫첨자가 무조건 오름차순으로 오도록 정렬하기로 하였으므로, $g^{n}_{n} = g^{N}_{k}$인 $k$가 존재하며, 더군다나 $k \geq n \geq N$이다. 마찬가지 논리로 $g^{n}_{m} = g^{N}_{k}$인 $k$가 존재하며 더군다나 $k \geq m \geq N$이다. 이제 $(g^{N}_{k})_{k\geq 1}$가 코시라는 점으로부터 원하는 부등식이 유도된다.

 

 

 

이제 함수열의 수렴하는 부분수열과 관련하여 다음의 큰 질문 두 가지를 던져볼 수 있다:

 

 

질문 1. 균등유계인 함수열이 존재할 때, 점별수렴하는 부분수열이 있는가?

반례. $f_{n}: [0,2\pi] \to \mathbb{R}, f_{n}(x) = sin(nx)$라 하자. 이 함수열은 균등유계이면서 ($sup_{x\in [0,2\pi]) sup_{n\in\mathbb{N}} |f_{n}(x)| \leq 1$) 옹골집합에서 정의된 연속함수열이다.

 

그러나 이 함수열에서 점별수렴하는 부분수열이 없음을 보이고자 한다. 이를 위해서 11단원에서 배우는 정리를 하나 이용하고자 한다.

 

귀류법을 사용하여 증명을 한다. 점별수렴하는 부분수열 $f_{n_{k}}$가 존재한다 가정하자. 이제 이 부분수열은 코시일 것이므로,

 

$$ \lim_{k \to \infty} sin(n_{k}x) - sin(n_{k+1}x) = 0$$

이고

 

따라서 $$ \int_{0}^{2\pi}\lim_{k \to \infty}((sin(n_{k}x) - sin(n_{k+1}x))^{2}) dx \\ = \lim_{k \to \infty} \int_{0}^{2\pi} (sin(n_{k}x) - sin(n_{k+1}x))^{2} dx = 0$$일 것이다. 여기서 극한을 적분기호 안으로 넣는 데에 11장의 정리가 사용되었다.

그런데 $n,m\in\mathbb{N}, n\neq m \Rightarrow \int_{0}^{2\pi} (sin(nx) - sin(mx))^{2} dx =2\pi$임을 알기 때문에 이것은 모순이다.

 

 

질문 2. 균등유계인 함수열이 존재하며 이 함수열이 점별수렴할 때, 균등수렴하는 부분수열이 있는가?

반례. $f_{n}: [0,1] \to \mathbb{R}, f_{n}(x) = \frac{x^{2}}{x^{2} +(1-nx)^{2}}$이라 하자.

$f_{n}$은 균등유계이며 (모든 $n,x$에 대해 $|f_{n}(x)| \leq 1$이다) $x=0$이면 $f_{n}(0) = 0$이고, $0 < x \leq 1$을 고정하면 $\lim_{n \to \infty} f_{n}(x) = 0$이므로 $f \equiv 0$으로 점별수렴한다.

또한 $f_{n}$은 옹골집합에서 정의된 연속함수열이다.

 

그러나 $f_{n}$에는 균등수렴하는 부분수열이 존재할 수 없다. 모든 자연수 $n \in \mathbb{N}$에 대해, $f_{n}(\frac{1}{n}) = 1$임에 주목하라. 따라서 정리 7.9?에 의해 이 함수열의 임의의 부분수열은 0으로 균등수렴할 수 없다.

 

 

 

사실 이러한 (직관적으로는 성립할 법한) 정리들이 무너지는 이유는 $E$의 원소들이 "너무 많기" 때문이다. 즉, 함수열 $f_{n}$이 균등유계다 하더라도 결국 위의 예시들에서 살펴보았듯 비가산 개의 함수값들을 비가산 개의 점에서 택할 수 있으므로, 가산개의 항을 가지는 수열에서 점별수렴/균등수렴하는 부분수열을 택할 수 없는 것이다.

 

연속은 한 점의 근방에서 함수가 취할 수 있는 값들에 제한을 가했다. 균등연속은 한 가지 함수가 전역적으로 변할 수 있는 범위를 제한했다. 위의 반례들에서는 함수열이 모두 균등연속이지만, 이것으로는 불충분함을 알 수 있다. 따라서 다음의 개념을 정의한다:

 

 

정의 7.22 (Equicontinuity)

$\mathcal{F}$은 $E \subset (X,d) \to \mathbb{C}$인 함수들의 집합이라 하자.

이제 $\mathcal{F}$가 equicontinuous하다는 것은 다음을 의미한다:

 

$$ \forall \epsilon > 0, \exists \delta > 0 s.t. \forall x \in E \space and \space f \in \mathcal{F}, d(x,y) < \delta \Rightarrow  |f(x) - f(y)| < \epsilon$$

 

 

 

정리 7.24

$f_{n} : E \to\mathbb{C}$가 다음을 만족한다 하자:

1) $E$는 옹골집합이다.

2) $f_{n}$은 각각 유계이고 연속이다.

3) $f_{n} \rightarrow_{u} f$인 $f$가 존재한다.

 

이제 $\mathcal{F} := \{f_{n} | n \in \mathbb{N} \}$은 equicontinuous하다.

 

증명.

$\epsilon > 0$을 잡는다.

$f_{n} \rightarrow_{u} f$이므로 $\exists N\in\mathbb{N} \space s.t. \space n \geq N \Rightarrow ||f_{n} - f|| < \ frac{epsilon}{3}$이다.

또한, 정리 7.12에 의해 $f$는 연속이고, $E$는 옹골집합이므로 $f$는 균등연속이다.

따라서 $\exists \delta >0, \space s.t. \space \forall x \in E, d(x,y)<\delta \Rightarrow  |f(x) - f(y)| < \frac{epsilon}{3}$.

 

이제 $d(x,y)<\delta, n \geq N$이라 하자. $|f_{n}(x) - f_{n}(y)| < |f_{n}(x) - f(x)| + |f(x) - f(y)| + |f(y) - f_{n}(y)| < \epsilon$이다.

 

이제 $n < N$인 경우는, 각 $f_{n}$이 균등연속이므로, $\exists \delta_{n} > 0 \space s.t. \space \forall x\in E, d(x,y)<\delta_{n} \Rightarrow |f_{n}(x) - f_{n}(y)| < \epsilon$이다.

 

따라서 $\delta^{*} := min\{ \delta_{1}, ... , \delta_{N-1}, \delta\}$이라 두면,

 

$$ \forall x \in E, \forall n \in \mathbb{N}, d(x,y)< \delta \Rightarrow |f_{n}(x) - f_{n}(y)| < \epsilon$$

이 성립하므로 $\mathcal{F}$이 equicontinuous하다. $\square$

 

 

정리 7.25

$f_{n} : E \to \mathbb{C}$가 다음을 만족한다 하자:

1) $E$는 옹골집합이다.

2) $f_{n}$은 점별유계이다.

3) $\mathcal{F} = \{f_{n} | n \in \mathbb{N} \}$은 equicontinuous하다.

 

이제 $f_{n}$은 균등수렴하는 부분수열이 존재한다.

 

 

증명.

$E$는 옹골집합이므로, 연습문제 2.25에 의해 조밀하면서 가산인 부분집합 $E'$이 존재한다. ($\delta_{n} = \frac{1}{n}$인 근방들로 $E$를 덮고 거기서 여전히 $E$를 덮는 유한 개를 택할 수 있다; 이 과정을 모든 자연수 $n$에 대해 반복하면 된다.)

 

이제 정리 7.23에 의해, $E'$서 점별수렴하는 부분수열 $f_{n_{k}}$가 존재한다. 편의상 $g_{k} := f_{n_{k}}$라 하자.

 

$\epsilon > 0$을 잡는다. equicontinuity에 의해 $\exists \delta > 0 \space s.t. \space n \in \mathbb{N}, x \in E \Rightarrow |f_{n}(x) - f_{n}(y)| < \epsilon$이다. 이 조건에 부합하는 $\delta >0$을 잡는다.

 

이제 $E'$에서 유한 개의 원소들 $\{v_{1}, ... , v_{s}\}$를 택해, $x \in E \Rightarrow \exists 1 \leq i \leq s, d(x,v_{i}) < \delta$가 되도록 잡는다. (이는 $E$의 옹골성과 $E'$의 조밀성에 의해 가능하다)

 

이제 $g_{k}$는 유한 개의 원소들에서 점별수렴하므로, $\exists N \in \mathbb{N}, n,m \geq N \Rightarrow sup_{x \in \{v_{1}, ... , v_{s}\} |g_{n}(x) - g_{m}(x)| < \epsilon$이다.

 

이제 $g_{k}$가 균등수렴함을 보일 것이다. 이를 위해 $g_{k}$가 균등코시임을 보이면 족하다.

 

위에서 잡은 $\epsilon > 0$을 고려한다. 아무 $x\in E$를 잡는다. 특히 $d(x, v_{i}) < \delta$가 된다고 하자 (이것이 항상 존재함은 위에서 보였다.)

이제

$$n,m \geq N \Rightarrow |g_{n}(x) - g_{m}(x)| \\ \leq |g_{n}(x) - g_{n}(v_{i})|+|g_{n}(v_{i}) - g_{m}(v_{i})| + |g_{m}(v_{i}) - g_{m}(x)| \\ \leq 3\epsilon$$

가 성립한다.

첫 항과 셋째 항은 함수열의 equicontinuity에 의해 통제된다. 둘째 항은 유한집합 $\{v_{1}, ... , v_{s}\}$에서 $g_{k}$가 균등코시이기 때문에 통제된다.

 

따라서 우리는 $\epsilon$에 대응되는 $N$을 잡아서 부분함수열 $g_{k}$이 균등코시가 됨을 보였으므로 $g_{k}$가 균등수렴함을 보였다. $\square$

 

 

 

다음 글에서는 Stone-Weierstrass theorem과 그 일반화를 살펴볼 것이다. 이것의 motivation은 결국, "모든 연속 실함수를 우리가 잘 아는 함수들로 근사할 수 없을까?"에 대한 질문의 대답이다. 특히, Stone-Weierstrass Theorem은 구간서 정의된 연속 실함수는 다항함수열로 근사할 수 있음을 알려줄 것이다.

* 2022.09.13 수업의 복습입니다.*

 

원래 2부까지만 할 예정이었던 선형대수학 1 복습이었지만, 내가 adjoint operator 까지의 범위를 이해한 수준과 Spectral theorem 이후 범위를 이해한 수준이 상당히 달라서 (Read: 뒷부분이 탄탄하지 못해서) 아예 새로운 글을 통해 복습하기로 하였다.

 

이후 어떤 명제를 진술할 때, 그 명제가 참인 체를 뒷부분에 괄호를 통해 첨부할 예정이다.

 

6) 특수한 Operator와 대각화 가능성

$T \in \mathcal{L}(V)$라 하자. 우리는 특수한 linear operator에 붙이는 여러 명칭을 살펴보았다:

 

 

a. $T^{*}T = TT^{*}$이면 $T$는 normal이다. ($\mathbb{F} = \mathbb{C}, \mathbb{F} = \mathbb{R}$)

b. $T^{*} = T$이면 $T$는 Hermitian / self-adjoint이다. ($\mathbb{F} = \mathbb{C}, \mathbb{F} = \mathbb{R}$)

c. $T^{*} = T^{-1}$이면 $T$는 unitary이다 ($\mathbb{F} = \mathbb{C}$) / $T$는 orthogonal이다. ($\mathbb{F} = \mathbb{R}$)

 

 

#주석. $(V,\mathbb{F})$가 유한차원 내적공간이라 하자. 이제 내적이라 함은 $\bullet: V \times V \to \mathbb{F}$임에 유의하라. 따라서 $\mathbb{F} = \mathbb{C}$이면 내적성질 iii)은 $x\bullet y = \overline{y \bullet x}$인 반면, $\mathbb{F} = \mathbb{C}$이면 내적성질 iii)은 $x \bullet y = y \bullet x$와 동치이다. (모든 내적의 결과물이 실수이기 때문이다.) 

 

예컨대 $V =\mathbb{C}, \mathbb{F} = \mathbb{R}$일 때 $\bullet: V \times V \to \mathbb{R}, x\bullet y = x_{1}y_{1} + x_{2}y_{2}$는 실수 위에 정의된 내적공간인 반면, $V =\mathbb{C}, \mathbb{F} = \mathbb{C}$일 때 $\bullet: V \times V \to \mathbb{C}, x\bullet y = x_{1}y_{1} + x_{2}y_{2}$는 더 이상 복소수 위에 정의된 내적공간이 아니게 된다.

 

한편 $\mathbb{F} = \mathbb{R}$이더라도, $\Psi_{V}: V \to V^{*}, \Psi_{V}(x) = x^{*}$는 여전히 정의할 수 있다. 그렇다면 c에서 체가 다른 경우를 왜 따로 불러야 하는가? 이는 이후 살펴볼 스펙트럴 정리에서 잘 드러날 것이다.

 

 

우리는 앞서 ONB로 대각화 가능한 모든 선형변환은 normal임을 살펴보았다. ($\mathbb{F} = \mathbb{C}, \mathbb{R}$)

그렇다면 그 역이 성립하는지가 문제된다. 우선 normal operator에 대한 다음의 사실들을 정립하자:

 

 

명제. $T\in \mathcal{L}(V)$라 하자. 이제 $TT^{*} = T^{*}T$라면, 다음이 성립한다: ($\mathbb{F} = \mathbb{C} \space or \space \mathbb{F} = \mathbb{R}$)

 

(a) $||T(x)|| = ||T^{*}(x)||$

(b) $\lambda \in \mathbb{F}$에 대해 $T -\lambda I$ 역시 normal이다.

(c) $v \in V$가 $T$의 고유벡터이고 고윳값 $\lambda$에 대응한다 하자. 이제 $v$는 $T^{*}$의 고유벡터이며 동시에 고윳값 $\overline{\lambda}$에 대응한다.

(d) $x_{1}, x_{2} \in V$는 각각 $\lambda_{1}, \lambda_{2}$에 대응하는 $T$의 고유벡터라 하자. 이제 $x_{1} \bullet x_{2} = 0$이다.

 

 

(c)의 증명.

$v$가 $T$의 고유벡터라 하고 고윳값을 $\lambda$라 하자. 이제 $(T-\lambda)v \bullet (T-\lambda)v = 0$이라는 사실을 안다.

그런데 한편으로 $(T-\lambda I)^{*} = T^{*} - \overline{\lambda} I$라는 사실을 아므로,

 

$$v \bullet (T^{*} - \overline{\lambda} I)(T - \lambda I) v \\ = v \bullet (T - \lambda I)(T^{*} - \overline{\lambda}I) v \\ = (T^{*} - \overline{\lambda}I)v \bullet (T^{*} - \overline{\lambda}I)v = 0$$

이다. $\square$

 

(d)의 증명.

$\lambda_{1} (x_{1} \bullet x_{2}) = T(x_{1}) \bullet x_{2} = x_{1} \bullet T^{*}x_{2} = \lambda_{2} (x_{1} \bullet x_{2}) \square$.

 

 

또한 다음의 정리가 중요하게 사용된다:

Schur's Theorem.

$T \in \mathcal{L}(V)$라 하고, $T$의 특성다항식이 $\mathbb{F}$ 위에서 일차식으로 분해된다 하자. 이제 ONB $\beta$가 존재하여, $[T]_{\beta}$가 상방삼각행렬이 되도록 할 수 있다.

 

증명.

$V$의 차원에 대한 귀납법을 사용한다.

$dim V = 1$이면 $V = \{av_{1} | a\in \mathbb{F}\}$이므로 $\beta = \{v_{1}\}$은 ONB이고, $Tv_{1} = cv_{1}$이면 $[T]_{\beta} = [c]$이고 이는 상방삼각행렬이다.

 

$dim V = 1,...,n-1$에 대해 정리가 성립한다 하자. 이제 $dim V = n$이라 하자.

$T$의 특성다항식이 $\mathbb{F}$ 위에서 분해된다. 한편 $\beta$가 $V$의 ONB라 하면

$det(T - \lambda I) = det( [T - \lambda I]_{\beta})$이고,

$det(T^{*} - \overline{\lambda} I) = det([T - \lambda I]^{*}_{\beta}) = \overline{det([T - \lambda I]_{\beta})}$이므로 둘의 특성다항식은 complex conjugate 관계에 있고, 따라서 $T^{*}$의 특성다항식 역시 $\mathbb{F}$ 위에서 일차식으로 분해된다. 따라서 $T^{*}$는 고유벡터가 하나 이상 있다. 한 고유벡터를 골라 $v_{1}$이라 표기하자.

 

이제 $\{v_{1}\}^{\perp}$는 $V$의 $n-1$차원 부분공간이다. 이것이 $T$- invariant하다면, $V = \{v_{1}\}^{\perp} \oplus \{av_{1} | a\in \mathbb{F} \}$이고, 각각의 ONB를 $\beta, \beta'$이라 하면 $[T]_{\beta \cup \beta'}$은 상방삼각행렬일 것이다. 이는 마지막 행과 열을 제외한 $(n-1)\times (n-1)$ 행렬이 상방삼각이고, $T$-invariance에 의해 $n$행 $i$열 (i < n)의 성분이 0일 것이기 때문이다.

 

 

$v \in \{v_{1}\}^{\perp}$라 하자. 이제 $Tv \bullet v_{1} = v \bullet T^{*}v_{1} = v \bullet \overline{\lambda}v_{1} = \lambda (v \bullet v_{1}) = 0$이므로 이것이 $T$-invariance를 보이고, 따라서 증명이 완료된다. $\square$

 

 

정리. (Spectral theorem 1)

$T \in \mathcal{L}(V), \mathbb{F} = \mathbb{C}$라 하자. 이제 $T$가 normal하면 ONB $\beta$가 존재하여 $[T]_{\beta}$가 대각행렬이 되게 할 수 있다.

 

증명.

Schur's theorem에 의해 ONB $\beta$를 잡아, $[T]_{\beta}$가 상방삼각행렬이 되도록 하자.

일단 $v_{1}$은 고유벡터임을 안다. 이제 $v_{1},...,v_{k-1}$이 고유벡터일 때 $v_{k}$ 또한 고유벡터임을 보일 것이다.

$Tv_{k} = A_{1k}v_{1} + ... + A_{kk}v_{k}$라는 사실을 안다. 한편 $k \neq j$에 대해

$$ A_{kj} = Tv_{k} \bullet v_{j} \\ = v_{k} \bullet T^{*}v_{j} = \lambda_{j} v_{k} \bullet v_{j} \\ = 0$$

이다. 첫 등식은 기저가 ONB인 경우 행렬표현의 정의에 의해 성립한다. 셋째 등식은 $T$가 normal하면 $T$의 고유벡터와 $T^{*}$의 고유벡터가 같다는 사실로부터 성립한다. 마지막 등식은 ONB의 정의에 의해 성립한다.

 

따라서 $[T]_{\beta}$는 대각행렬이고 정리가 증명된다. $\square$

 

Alt 증명.

$V$의 차원에 대해 귀납법을 사용한다.

$dim V = 1$인 경우 특성다항식이 일차식으로 분해되므로 ($\mathbb{F} = \mathbb{C}$) 성립한다.

$dim V = 1,...,n-1$일 때 성립한다 가정하고, $dim V = n$인 경우를 보이자.

특성다항식이 일차식으로 분해되므로 고유벡터가 하나 이상 있고, 이 벡터에 상응하는 고윳값을 $\lambda_{1}$이라 하자.

이제 $dim E(\lambda_{1}) < n$이므로 이 고유공간에 대한 ONB $\beta'$을 잡아, $T$를 고유공간에 제한한 operator를 $\beta'$으로 표현하면 대각행렬이 나오도록 하자.

이제 Schur's theorem과 유사하게 $E(\lambda_{1})^{\perp}$가 $T$-invariant함을 보이자.

$y \in E(\lambda_{1})^{\perp}$라 하자. 이제 $v\in E(\lambda_{1})$라 하면,

$$ Ty \bullet v = y \bullet T^{*}v = y \bullet \overline{\lambda_{1}}v = \lambda_{1} (y \bullet v) = 0$$

이다. 여기서 둘째 등식은 normal operator의 경우 $T,T^{*}$의 고유벡터들이 같다는 사실을 이용하였다. $\square$

 

 

 

정리. (Spectral theorem 2)

$T \in \mathcal{L}(V), \mathbb{F} = \mathbb{C} \space or \space \mathbb{R}$이라 하자. 이제 $T$가 self-adjoint하면 ONB $\beta$가 존재하여 $[T]_{\beta}$가 대각행렬이 되게 할 수 있다.

 

 

증명.

$\mathbb{F} = \mathbb{C}$이므로 $T$의 특성다항식은 $\mathbb{F}$서 일차식으로 분해되고, 따라서 ONB $\beta$가 존재하여 $[T]_{\beta}$가 상방삼각행렬이 되도록 할 수 있다.

한편

$$ [T^{*}]_{\beta} = [T]^{*}_{\beta} = [T]_{\beta}$$ 역시 상방삼각행렬이므로 이는 $[T]_{\beta}$가 대각행렬임을 의미한다.

 

 

#주석. 여기서는 $\mathbb{F} = \mathbb{R}$이어도 증명이 성립한다는 사실에 주목하라. 만약 spectral theorem 1을 사용하고자 했다면 $\mathbb{F] = \mathbb{R}$을 증명하지 못했을 것인데, 이는 특성다항식이 split한다는 보장이 없기 때문이다.

 

 

ONB $\beta = \{v_{1}, ... , v_{n} \}$를 통해 $[T]_{\beta}$가 대각화되었다 하자. 이제 $T \in \mathcal{L}(V)$를 다음과 같이 나타낼 수 있다:

 

$$ T = \Sigma_{i=1}^{n} \lambda_{i} v_{i} v_{i}^{*}$$

 

"음? 스칼라곱은 왼쪽에서만 정의했는데?"라고 생각할 사람들을 위해서, 여기서 $v_{i}$는 사실 벡터가 아니라 선형변환이다!

 

$v_{i} : \mathbb{F} \to V, v_{i}(1) = v_{i}$

 

abusive notation이라고 항의할 수 있겠다. 사실 나도 그렇다고 생각한다. 하지만 교수님께서 이렇게 가르치셔서 일단은 이렇게 써보았다. 맥락에 따라 잘 분간할 수 있어야지. 여튼 벡터는 일종의 선형변환이라고 볼 수 있다는 관점이 흥미롭긴 했다.

 

 

이러한 사실들을 바탕으로 선형변환의 정부호성을 조사할 수 있다:

 

 

정의. $T \in \mathcal{L}(V)$는 self-adjoint 변환이라 하자. 또한 $\mathbb{F} \in \{\mathbb{R}, \mathbb{C}\}$이라 하자.

이제 다음과 같이 정의하자:

$0 \neq x \in V, Tx \bullet x > 0 \Leftrightarrow T$ is positive definite (양의 정부호)

$0 \neq x \in V, Tx \bullet x \geq 0 \Leftrightarrow T$ is positive semi-definite (양의 준정부호)

negative definite, negative semi-definite 역시 유사하게 정의한다.

 

 

$T$가 self-adjoint하므로, $\mathbb{F}$가 실수, 복소수 중 무엇이더라도 spectral theorem 2에 의해 ONB $\beta$에 의해 $T$가 대각화가 가능함을 안다. 또한 앞서 살펴본 표기 $T = \Sigma_{i=1}^{n} \lambda_{i} v_{i} v_{i}^{*}$을 고려해 보면, 다음의 사실을 쉽게 증명할 수 있다:

 

$T$ positive definite <=> $\lambda_{i} > 0$

$T$ positive semi-definite <=> $\lambda_{i} \geq 0$

 

 

한편 unitary, self-adjoint operator들의 고윳값들은 특수한 성질을 가진다:

 

1) $T \in \mathcal{L}(V), \mathbb{F} = \mathbb{C}$가 unitary operator이라 하자. 이제 $T$는 ONB에 의해 대각화 가능하며 (spectral theorem 1), 특히 모든 고윳값들은 크기 1의 복소수이다.

특히 $T$는 내적을 보존한다: $Tx \bullet Ty = x \bullet y$

이러한 $T$를 rigid motion이라 부른다.

 

2) $T \in \mathcal{L}(V)$가 self-adjoint operator이라 하자. 이제 $T$는 ONB에 의해 대각화 가능하며 (spectral theorem 2), 특히 모든 고윳값들은 실수이다.

이는 Normal operator의 경우 $T, T^{*}$가 같은 고유벡터들을 가지며 대응되는 고윳값은 complex conjugate 관계를 가짐에서 기인한다.

 

 

7) 6), but for matrices

정의.

$A \in \mathcal{M}_{n \times n}$이 행렬이라 하자. 행렬에 대해서 다음과 같이 정의한다:

i) $A$ is normal $\Leftrightarrow L_{A} \in \mathcal{L}(\mathbb{F}^{n})$ is normal

ii) $A$ is self-adjoint $\Leftrightarrow L_{A} \in \mathcal{L}(\mathbb{F}^{n})$ is self-adjoint

iii) $A$ is unitary (complex) / orthogonal (real) $\Leftrightarrow L_{A} \in \mathcal{L}(\mathbb{F}^{n})$ is unitary / orthogonal

 

 

명제 1.

$$ L_{A^{*}} = (L_{A})^{*}$$

증명.

$\mathbb{F}^{n}$의 표준기저 $\beta = \{e_{1}, ... , e_{n}\}$을 잡음으로써 우리는 다음의 사실을 알 수 있다:

$$ [L_{A^{*}}]_{\beta} = A^{*} = [L_{A}]_{\beta}^{*} = [(L_{A})^{*}]_{\beta}$$

이제 선형변환의 집합에서 동차원 행렬의 집합으로 보내는 선형변환이 전단사이므로 증명이 완료된다. $\square$

 

명제 2.

$\mathbb{F} = \mathbb{C}$이고, $A \in \mathcal{M}_{n\times n}$가 unitary 행렬이라 하자. 이제 $A$의 열들은 $\mathbb{C}^{n}$의 ONB를 이룬다.

증명.

$\beta$를 $\mathbb{C}^{n}$의 표준기저라 하자. 이제 다음이 성립한다:

$$I_{n} = [I_{\mathbb{C}^{n}}]_{\beta} = [L_{AA^{*}}]_{\beta} = [L_{A}]_{\beta} [L_{A^{*}}]_{\beta} = AA^{*}$$

$A^{*}A$에 대해서도 유사한 증명이 가능하다.

 

 

명제 3.

$\mathbb{F} = \mathbb{C}$이고 $A \in \mathcal{M}_{n\times n}$가 normal 행렬이라 하자. 이제 unitary 행렬 $U$가 존재하여, $U^{-1}AU$가 대각행렬이 된다.

증명.

$L_{A} \in \mathcal{L}(\mathbb{C}^{n})$이 ONB에 의해 대각화 가능하므로, 이 기저를 $\beta'$이라 하자.

이제 대각행렬 $D$가 존재하여 $D = [L_{A}]_{\beta'} = [I_{\mathbb{C}^{n}}]_{\beta}^{\beta'} [L_{A}]_{\beta} [I_{\mathbb{C}^{n}}]_{\beta'}^{\beta}$이고, $[I_{\mathbb{C}^{n}}]_{\beta'}^{\beta}$의 열들은 $\mathbb{C}^{n}$의 정규직교기저를 이루므로 이 행렬은 unitary 행렬 $U$로 표현할 수 있다.

따라서 $D = U^{-1}AU$가 성립한다. $\square$

 

 

명제 4.

$\mathbb{F} =\mathbb{R}$이고 $A \in \mathcal{M}_{n \times n}$가 대칭행렬이라 하자. 이제 orthogonal 행렬 $U$가 존재하여, $U^{-1}AU$가 대각행렬이 된다.

증명.

이 경우 $A = A^{*}$이므로 $\mathbb{R}^{n}$의 표준기저 $\beta$에 대해 $[L_{A}^{*}]_{\beta} = [L_{A^{*}}]_{\beta} = [L_{A}]_{\beta}$이고, 따라서 $L_{A}$가 self-adjoint operator가 되고, 따라서 ONB에 의해 대각화 가능하다. 이후 명제 3의 증명에서 했던 내용을 그대로 반복하면 증명이 완료된다. 다만 $\mathbb{F} = \mathbb{R}$이므로 좌표변환 행렬이 orthogonal 하다는 차이점을 얻는다. $\square$

 

 

#주석. unitary operator들은 normal하므로 diagonalizable하다. 허나 orthogonal operator들은 normal하기는 하지만 특성다항식이 split한다는 보장이 없으므로 diagonalizable하다는 보장 역시 없다.

 

예컨대 다음의 행렬을 살펴보라:

 

$$ A = \begin{bmatrix} cos(\theta) \space sin(\theta) \\ -sin(\theta) \space cos(\theta) \end{bmatrix}$$

 

$A^{*}A = AA^{*} = I$이므로 이 행렬(과 이에 연관된 선형변환 $L_{A}$)는 orthogonal이다. 허나 이 행렬은 실수에서 대각화가능하지 않다 (특성다항식이 실수에서 분해되지도 않는다).

 

 

이로써 모든 복습이 마무리되었다. 다음 글부터는 SVD를 들어가도록 하겠다.

+ Recent posts

cs