전 연재글에서는 $f:\mathbb{R}^{n} \rightarrow \mathbb{R}$에 대한 제약이 없고 f가 $C^{3}$급 함수일 때 f가 어떤 점 x에서 극소점/ 극대점을 가지기 위한 필요조건과 충분조건을 살펴보았다. (애석하게도 필요충분조건 하나로 정리되지는 않는다는 것 역시 살펴보았다.)

 

이제는 $f: \mathbb{R}^{n} \rightarrow \mathbb{R}$를 최소화 하되, $g_{1}(x) = 0 , g_{2}(x) = 0 , ... , g_{K}(x) = 0$을 만족하는 $x \in \mathbb{R}^{n}$에 대해서만 고려하는 경우를 살펴보자. 이 경우 새로운 벡터함수 g를 정의하여

$$ g = (g_{1}, ... , g_{K})^{T} $$

로 표현할 수 있다. $g: \mathbb{R}^{n} \rightarrow \mathbb{R}^{K}$인 다변수 벡터함수이다. 단, $1 \leq K < n$라 하고, 각 스칼라 함수는 $C^{1}$급 이상이라 하자.


이제 최적화 문제를 다르게 표현하면

 

$$ \min{f(x)} \\ s.t. g(x) = 0, x \in \mathbb{R}^{n} \\ ...(1.3) $$

 

로 표현할 수 있다.

 

제약을 만족하는 x의 집합을 S라 정의하면

$$ S = \{x \in \mathbb{R}^{n} | g(x) = 0\} ...(1.4) $$

 

일반적으로 이 문제는 선택할 수 있는 x가 너무 많기 때문에, 극소점을 먼저 살펴보는 방식으로 진행된다.

그 전에 우리가 $\mathbb{R}^{n}$에서 알고 있는 극소점의 정의를 S에 대해서 확장시킬 필요가 존재한다.

 

정의.

S에서 정의된 함수 f가 점 $x_{0} \in S$에서 극소점을 가진다는 것은,

$$\exists \epsilon > 0 s.t. y \in S, ||x_{0}-y|| < \epsilon \Rightarrow f(y) \geq f(x_{0}) $$

을 의미한다.

 

 

즉 일반적으로 생각하는 $\mathbb{R}^{n}$의 열린 근방이 존재하여, 그 근방 안에 있으면서 S에 있으면 항상 $f(x_{0})$보다 작지 않은 함숫값을 가진다는 의미이다.

 

 

이제 다음 정리는 함수 f가 제약 g = 0에 직면할 때, f가 점 $x_{0}$에서 극소점을 가지기 위한 필요조건을 명시한다:

 

정리 1.3 

함수 f가 제약 g=0에 직면한 최소화 문제 (1.3)에 대하여, f가 $x_{0}$에서 극소점을 가지기 위한 필요조건은, $\lambda \in \mathbb{R}, \lambda \in \mathbb{R}^{K}$가 존재하여 다음을 만족한다는 것이다:

 

$(i) (\lambda_{0},  \lambda) \neq 0$

$(ii)$ 만약 $F(x,\lambda) = \lambda_{0} f(x) + \lambda^{T}g(x)$라 하면 $\nabla F(x_{0}, \lambda) = 0$

 

 

이 정리의 증명을 위해서는 다음의 음함수 정리를 알아둘 필요가 있다:

 

보조정리. (음함수 정리)

실수 $x_{1}, ... x_{n}, y_{1}, ..., y_{m}$에 대하여 $x = (x_{1},...,x_{n}) \in \mathbb{R}^{n}, y = (y_{1},...,y_{m}) \in \mathbb{R}^{m}$이라 하자.

또한 $C^{p}$급 함수 (p는 1보다 크거나 같은 양의 정수) $F: \mathbb{R}^{n+m} \rightarrow \mathbb{R}^{m}$가 정의되어 있고, 집합 S를

$S = \{(x_{1},...,x_{n},y_{1},...,y_{m})\in \mathbb{R}^{n+m} | F(x,y) = 0 \}$로 정의하자.

 

x를 $x^{0} = (x_{1}^{0}, x_{2}^{0}, ..., x_{n}^{0})$로 고정하였다 할 때, $G(y) = F(x^{0},y)$라 정의하자.

이제 어떤 점 $y^{0} =(y_{1}^{0}, y_{2}^{0}, ..., y_{m}^{0})$에 대하여 $F(x^{0}, y^{0}) =0$이고

G의 야코비안 행렬

$$ M_{ij} = \begin{bmatrix} \frac{\partial G_i}{\partial y_{j}} (y^{0}) \end{bmatrix} $$ 

 

이 가역이면, 다음이 성립한다:

 

$$ \exists \epsilon > 0 s.t. \phi_i : N(\epsilon, x^{0}) \rightarrow \mathbb{R}, \\ (i)   \phi_i \in C^{p} \\ (ii)   \phi_i(x^{0}) = y_{i}^{0}, i=1,...,m \\ (iii)   F((x), \phi(x)) = 0  $$

 

이 때 $\phi (x) = (\phi_{1} (x), ... , \phi_{n} (x))$인 벡터함수이고 $N(\epsilon, x^{0})$은 점 $x^{0}$으로부터 거리가 $\epsilon$보다 작은 $\mathbb{R}^{n}$의 집합이다.

 

 

 

 

보조정리만 10 줄 넘게 달한다! 이 정리를 처음 보면 두려움에 몸을 벌벌 떨 가능성이 크다 (필자는 그랬다. 진성 수학 변태들은 두려움이 아니라 환희에 몸을 벌벌 떨지 모르겠다. 하여튼 어느 쪽이더라도 몸은 벌벌 떨 것이라고 생각한다.)

 

 

이 일반적인 형태의 정리의 증명은 필자도 아직 모른다. 다만 직관은 어느 정도 설명해 줄 수 있으리라 생각하여, 이를 전달하고자 한다.

 

 

#주석 (음함수 정리의 직관) - 이 부분은 위키피디아의 관련 문서, https://web.stanford.edu/class/msande310/310trialtext.pdf, https://sites.math.washington.edu/~morrow/334_15/IFT.pdf를 참고하여 작성하였다.

 

최대한의 단순화를 위하여, 원의 방정식 

$$ x^{2} + y^{2} = 1 $$

을 고려하여 보자.

 

이 집합은 x에 대한 함수를 정의하지 않는데, 예컨대 $x = \frac{1}{2}$이 주어지더라도 $y = \frac{\sqrt{3}}{2}, y = - \frac{\sqrt{3}}{2}$ 모두 해가 되기 때문에 주어진 x에 대해 y가 유일하게 결정되어야 한다는 함수의 정의에 어긋나는 것이다.

 

그러나 우리는 원의 윗부분과 아랫부분은 함수로 나타낼 수 있음을 아는데, 원의 윗부분은 함수 $ y = \sqrt{1-x^{2}}, y \geq 0 $으로 나타내고 원의 아랫부분은 함수 $ y = - \sqrt{1-x^{2}}, y \leq 0$으로 나타내는 것이다.

 

이제 $ y \neq 0$이 되는 어떤 점 $(x_{0}, y_{0})$을 잡는 경우, 예컨대 $ y > 0$이면 $x_{0}$의 주변에서 함수 $ y = \sqrt{1-x^{2}}$은 실제로 국소적으로 원과 일치할 것이고, $y < 0$이면 그 $x_{0}$의 주변에서 함수 $ y = - \sqrt{1-x^{2}} $ 은 국소적으로 원과 일치할 것이다. 이 경우에는 함수가 식으로 주어지며 구하기 어렵지 않지만, 이 정리의 핵심은 이러한 함수를 식으로 직접 구할 수 없더라도 어떤 조건 하에서는 그런 함수가 존재는 한다는 사실을 안다는 것이다.

 

그렇다면 그 조건이란 어떤 것인가? 원의 방정식은 어떤 이변수함수 F(x,y)에 대하여 F(x,y)=0인 점의 집합임을 상기하자. 어떤 점 $x_{0}$의 근방에서 원을 따라하는 함수가 정의되려면, 그 점 근처에서 y가 변할 때 F가 변해야 한다. 만약 그렇지 않다면, 예컨대 x=-1, y=0이나 x=1, y=0을 살펴보면 그 점에서 실제 원이 그러하듯 '안으로 꺾여' 버려서 정의가 안 되어 버릴 수 있고, 정의는 된다 하더라도 그 함수는 그 점에서 미분가능하지 않아 버릴 것이다. 이는 y가 변할 때 F가 변하지 않아버리면, F의 등위면이 국소적으로 수직선이 되어버려, 어떤 x 근방에서 등위면에 일치하는 함수를 정의하려 해도 그 점에서 수직선이 되는 함수는 미분가능할 수 없기 때문이다.

 

 

음함수 정리는 이를 여러 변수로 일반화한 것에 불과하다. 등위면이 수직선이 되지 않는다는 조건은, 앞서 살펴본 경우에는 F의 y에 대한 편미분계수가 0이 아닌 것이었고, 이를 다변수함수로 일반화한 것이 야코비안 행렬의 행렬식이 0이 아니라는 것이다. 특히 우리는 y가 변할 때 등위면이 수직선이 되는 경우에 함수를 정의할 수 없게 되므로 (x는 어차피 우리가 정하는 것이다),  야코비안 행렬은 x를 고정한 F에 대해서 $y_{1}, ..., y_{m}$의 편미분계수들을 성분으로 가지는 것이다.

또한 원의 예시에서 우리의 목적은 y를 x의 함수로 국소적으로 나타내는 것이었다면, 일반적인 조건에서의 목적은 $y_{1},...,y_{m}$을 $x_{1},...,x_{n}$의 함수로 나타내는 것이라는 점을 주의하자.

 

 

 

 

이제 음함수 정리를 이용하여 등호 제약 최소화 문제의 극소점 필요조건 정리를 증명하고자 한다.

(정리 1.3의) 증명.

$\nabla F(x_{0}, \lambda) = 0$은 다음을 의미한다:

$\lambda_{0} \nabla f(x_{0}) + \Sigma_{i=1}^{K} \lambda_{i} g_i(x_{0}) = 0$

또한 $(\lambda, \lambda_{i}) \neq 0$이므로 이는 벡터들의 집합 $S= \{\nabla f(x_{0}), \nabla g_1(x_{0}) , ... , \nabla g_K(x_{0})\}$가 선형종속임을 의미한다.

 

따라서 우리는 귀류법을 사용하여, S의 벡터들이 선형독립이면 g=0에 직면한 f가 $x_{0}$에서 극소점을 가질 수 없음을 보일 것이다.

 

S의 벡터들이 선형독립이라 가정하자.

 

다음의 함수 $F: \mathbb{R}^{n+1} \rightarrow \mathbb{R}^{K+1}$를 정의하자:

 

$$ F_{i} (x,u) = g_{i} (x), i=1,...,K, F_{K+1} (x,u) = f(x) - f(x_{0}) - u $$

 

이제 우리는 집합 $ D = \{(x,u)| F(x,u) = 0\} $에서 u<0인 해가 존재한다는 것을 보이면 그만이다.

만약 S의 벡터들이 선형독립이라면, 행렬

$$ M = \begin{bmatrix} \frac{\partial f}{\partial x_{1}} & ... & \frac{\partial g_{K}}{\partial x_{1}} \\ \vdots & \ddots & \vdots \\ \frac{\partial f}{\partial x_{n}} & ... & \frac{\partial g_{K}}{\partial x_{n}} \end{bmatrix} $$의 위수가 K+1이고, 따라서 K+1 x K+1 부분행렬을 골라 그 행렬이 가역이도록 만들 수 있다. 고른 행 중 하나의 행은 모두 $\frac{\partial ...}{\partial x_{i}}$의 꼴을 가질 것이다. 이제 변수들의 재명명하여 그렇게 고른 행들이 $\frac{\partial ...}{\partial x_{i}}, i=1,...,K+1$이 되도록 하였다 하자.

그렇다면 이제 우리가 함수로 나타내고자 하는 변수들이 $x_{i}, i=1,...,K+1$이고 고정시킬 변수들이 $x_{K+2},...,x_{n}, u$라 할 때, 새로 정의한 함수 G의 $x_{1},...,x_{K+1}$의 야코비안이 앞서 구한 부분행렬과 일치하게 되어 가역이 되고, 음함수 정리를 사용할 수 있다.

 

따라서 함수들 $\phi_{i}, i=1,...,K+1$가 $(x^{0}_{K+2}, ..., x^{0}_{n}, 0) 의 근방에 정의되어

$$ \phi_{i}(x^{0}_{K+2}, ..., x^{0}_{n}, 0) = x^{0}_{i}, i=1,...,K+1; \\ F(\phi(x_{K+2}, ..., x_{n}, u), x_{K+2}, ..., x_{n}, u) = 0; \\ \phi_{i} \in C^{1} $$

가 성립하게 된다.

 

 

그런데 함수가 u = 0을 가지는 $\mathbb{R}^{n-K}$ 어떤 점의 근방에 정의되므로 u<0인 해가 존재해야 하며, 이는 제약 g=0을 만족하면서 $f(x) < f(x_{0})$을 만족하는 해가 $x_{0}$와의 임의의 가까운 근방에 존재한다는 의미로, g=0에 직면한 f가 $x_{0}$에서 극소점을 가진다는 가정에 모순이다.

 

이상에 의하여 S는 선형종속이어야 함을 보였고, 이것이 정리 1.3에서 주장하는 바임은 선형종속의 정의에 의해 쉽게 확인할 수 있다. $\square$

 

 

이번 연재는 여기서 끊고, 다음 연재글에서는 예시를 통해 라그랑주 승수법의 실제 활용을 살펴볼 예정이고 가능하다면 최소점에 대한 필요/충분 조건들을 다룰 것이다.

유클리드 본인은 원과 직선의 교점이 존재한다는 정리를 별도로 증명하지 않고 사용하였다. 그러나 놀랍게도 원과 직선의 교점은 이전의 공리군으로 얻을 수 없는 사실이고 별도로 가정해야 하는 성질의 것이다.

 

엄밀한 증명은 아니지만, 다음의 사실을 고려하여 보자.

원 O가 있고 반경이 선분 OR로 주어질 때, 원의 내부는 OQ < OR인 점 Q의 집합이고, 원 외부는 OQ > OR인 점 Q의 집합이다. 직관적으로 데카르트 좌표평면 $\mathbb{R}^2$에서 원의 내부점을 통과하는 직선이 존재하면 원과 교점이 존재한다는 사실을 증명하고 싶다고 할 때, 한 직선 위에 원의 내부점과 외부점이 모두 있으면 원 위의 점이 있다는 사실을 이용하면 증명이 가능할 것이다. 그런데 이 사실은 실수의 완비성에 의존하는 것으로 일반적인 수 체계에서는 성립하지 않는 것이다. 3장에서는 수 체계로부터 기하체계를 도출할 수 있음을 볼텐데, 이처럼 완비성이 성립하지 않는 수 체계로부터 만든 기하계에서는 원과 직선의 교점이 없을 수도 있는 것이다.

 

#주석.

바로 전 게시글인 평행선 공리군에서 마치 원과 직선의 교점이 존재한다는 걸 증명한 것처럼 보이는 내용이 나온다. 그러나 거기서 실제로 증명한 것은 '원과 직선의 교점이 존재한다면, 그리고 그 직선이 원의 내부를 통과한다면, 다른 교점 또한 존재한다'는 명제이다.

 

 

 

연속성 공리군은 다음과 같다:

 

공리 5.1 (측정 공리 / Archimedes 공리)

선분 AB와 선분 CD가 임의의 두 선분이면, CD를 반직선 AB상에 A에서부터 연속적으로 작도하여 갈 때 유한 n번만에 B를 넘게 되는 자연수 n이 존재한다.

 

#주석

위의 표현은 책에 있는 표현 그대로이다. 조금 더 엄밀하게 표현하자면, 자연수 n이 주어질 때 다음처럼 점 $D_{1}, D_{2}, ... D_{n}$를 잡는다 하자:

 

(i) $D_{1}, D_{2}, ..., D_{n}$은 반직선 AB 위에 있고, $i=1,...,n-1$에 대하여 $D_{i+1}, D_{i+2}, ..., D_{n}$은 반직선 $AD_{i}$ 위에 있다.

(ii) $AB \equiv AD_{1} \equiv D_{1}D_{2} \equiv ... \equiv D_{n-1}D_{n}$

 

이렇게 점들을 잡는 것은 n이 주어질 때 유일하다는 사실을 선분 작도의 유일성으로부터 안다.

 

이제 측정 공리가 말하고자 하는 바는, 충분히 큰 자연수 n에 대하여 위에서처럼 점들을 잡을 때, 선분 $AD_{n} > AB$가 된다는 것이다.

 

 

공리 5.2 (선의 완비성 공리)

순서와 합동의 관계를 가진 한 직선상의 점들의 집합에 새로운 점들을 더 추가하여 이 직선의 원래 원소들 사이 성립하던 공리군 (1)~(3)과 공리 5.1, 이들로부터 유도되는 직선의 순서와 합동에 관한 기본 성질들이 유지되도록 확장하는 것이 불가능하다.

 

'순서와 합동에 관한 성질들이 유지된다'는 조건은, 예컨대 직선 l 를 확장한 새로운 직선 l'이 있고, 점 A,B,C가 직선 l의 옛 점이고 ABC가 성립할 때, 새로운 직선 l'에서도 ABC가 성립해야 한다는 것도 의미한다.

 

 

특이한 점으로, 아르키메데스 공리 (공리 5.1)이 만족되지 않는 공리계에서는 완비성 공리 (공리 5.2)를 요구할 수 없다. 즉, 아르키메데스 공리를 만족하지 않지만 공리군 (1)~(3)과 이로부터 유도되는 정리들은 만족하는 어떤 공리계가 있을 때 순서 및 합동에 관한 정리들을 만족하면서 이 공리계를 항상 확장할 수 있다고 한다.

(필자가 이를 증명한 적은 없어서...책에는 그렇다고 나와 있다.)

 

 

선의 완비성 공리와 다른 공리들로부터 기하계의 완비성을 증명할 수 있다.

 

정리 2.8.1 (완비성 정리) 공리군 (1)~(5)를 만족하는 공리계의 원소 (점, 선, 평면)은 더 이상 새로운 점, 선, 평면을 추가하여 확장하는 것이 불가능한 기하계를 이룬다.

 

증명. 귀류법을 이용하여 증명을 한다. 확장 이전의 기하계를 $P$라 하고, 어떤 집합 $Q, P\cap Q = \emptyset $에 대하여 $P'=P \cup Q$가 성립하여 P'를 확장 이후의 기하계라 하자.

두 단계로 증명을 진행할 것이다:

Step 1. 어떤 확장 이전의 평면이 존재하여, 확장 이후 그 평면 위에 새로운 점이 존재하게 된다.

Step 2. 이것은 선의 완비성 공리에 모순됨을 보일 것이다.

 

Step 1.

점, 선, 평면 어떠한 것을 확장해도 확장 이전에 없던 점이 존재해야 한다. 이 점을 N이라 하자. 이제 $N\in Q$를 확인할 수 있다.

공리 1.8에 의하여 한 평면 위에 있지는 않은 네 점 A,B,C,D가 확장 이전의 기하계 P에 존재해야 한다.

이제 평면 ABN과 평면 ACD가 같다면 Step 1이 마무리 된다. 같지 않다면 두 평면은 점 A를 공유하므로 공리 1.7에 의하여 다른 점 E를 공유해야 한다.

E가 직선 AB 상에 있다면 점 직선 AB가 평면 ACD에 포함되므로 모순이다. 따라서 E는 직선 AB 상에 있지 않다. 

만약 E가 새 점이라면 평면 ACD 위에 새 점 E가 존재하게 되고, 만약 E가 옛 점이라면 평면 ABE 위에 새 점 N이 존재하기 된다.

 

Step 2.

이제 옛 평면 P에 대하여 확장 이후 P에 속하는 새 점 N이 존재한다고 가정하자.

한 직선 위에 있지 않고 P에 있는 확장 이전 세 점 A,B,C를 잡고 삼각형 ABC를 고려하자.

선분 AB 사이에 있는 옛 점 E를 잡는다 (이렇게 잡는 것은 앞서 증명한 순서 공리군의 정리 덕분에 가능하다).

이제 직선 EN은 선분 AB와 만나므로, Pasch 공리에 의하여 직선 EN은 꼭지점 C를 지나거나 선분 AC, BC 중 하나랑 지나게 된다.

 

Case 1. 직선 EN이 꼭지점 C를 지남

새 점 N은 옛 직선 CE 위에 존재한다. 

 

Case 2. 직선 EN이 선분 AC를 지남 -> 교점을 F라 하자.

Case 2-1. F가 옛 점

-> 새 점 N은 옛 직선 EF 위에 존재한다.

Case 2-2. F가 새 점

-> 새 점 F는 옛 직선 AC 위에 존재한다.

 

모든 경우에, 선의 완비성 공리 5.2가 성립하지 않으므로, 모순이 도출되고 증명이 끝난다. $\square$

 

 

이 증명의 핵심이 되는 공리는 결합공리 1.7 (두 평면이 한 점을 공유하면 다른 한 점을 공유한다)이다. 이것 없이는 Step 1이 성립하지 않아 증명 전체가 깨진다. 따라서 공리 1.7이 없는 공리계에서는 완비성을 요구할 수 없다고 한다.

 

#주석.

이것 역시 책에서는 그렇다고 하나, 필자가 증명하지는 못하겠고 또 다른 공리들은 요구할 필요가 없는지에 대하여 의구심이 든다.

 

 

선의 완비성 공리가 아르키메데스 공리와 과연 독립적인가 하는 의구심이 들 수 있다. 이후 3장에서는 연산이 잘 정의되는 어떠한 수 체계를 이용하여, 아르키메데스 공리까지는 성립하지만 완비성은 성립하지 않는 기하계를 만들어낼 것이고, 따라서 우리가 흔히 사용하는 Cartesian 기하 ($\mathbb{R}^3)를 얻기 위해서는 완비성 공리까지 요구해야 함을 살펴볼 것이다.

 

 

 

2.8.1 부록 - Dedekind Cuts

정의. (최소 상계 성질)

순서가 정의된 어떤 집합 P가 있을 때, P가 최소 상계 성질을 가진다는 것은 다음과 같다:

$S\subset P , S \neq \emptyset $가 위로 유계일 때 (즉 S의 모든 원소보다 큰 P의 원소가 존재할 때), S의 최소 상계가 존재한다.

 

최소 상계라는 것은 최댓값보다 약한 개념으로, 다음과 같이 정의할 수 있다:

 

정의. (최소 상계)

$x \in S$가 x의 최소 상계라는 것은 다음을 의미한다:

(i) $y \in S \Rightarrow x \geq y$ (x는 S의 상계이다)

(ii) $z < x \Rightarrow \exists y \in S, z < y$ (x보다 작은 어떠한 원소도 S의 상계가 아니다)

 

유리수의 집합은 최소 상계 성질을 가지지 않는다.

예컨대 다음의 집합

$S := {q\in \mathbb{Q} | q^2 < 2}$ 는 위로 유계이며 $1\in S$이므로 공집합이 아니다.

그러나 S는 최소 상계가 없다는 사실을 증명할 수 있다. (증명은 생략; Rudin의 "Principles of Mathematical Analysis"에 자세히 나와있음)

 

최소 상계 성질의 존재성은 이후 실수 위에서 미적분을 할 수 있는 실수의 중요한 성질이기 때문에, 명시적으로 최소 상계 성질이 있는 집합의 구성은 해석학자들에게 중요한 문제였다. Richard Dedekind는 이를 'cut'이라는 개념을 이용하여 유리수로부터 직접 구성해냈다.

 

 

1단계: 하나의 cut이란 $\mathbb{Q}$의 부분집합 $\alpha \subset \mathbb{Q}$ 중 다음의 성질을 만족하는 임의의 집합이다:

(i) $\alpha \neq \emptyset, \alpha \neq \mathbb{Q}$

(ii) $a\in \alpha, b\in \mathbb{Q}, b<a \Rightarrow b\in \alpha$.

(iii) $a\in \alpha \Rightarrow \exists a < c, c \in \alpha $.

 

실수의 존재성을 이미 "알고" 있는 우리에게는 이것들의 동기가 명확하다: 하나의 cut은 어떤 실수보다 작은 모든 유리수의 집합인 것이다. 그러나 실수의 존재를 증명하기 전까지는 '어떤 실수'가 뭔지 모르기 때문에 이런 복잡해 보이는 집합을 만들어내야 한다.

 

 

2단계: $\mathbb{P}$를 모든 cut의 집합이라 하고, 그 원소들 사이의 순서를 다음과 같이 정의한다:

$\alpha \subset \beta, \alpha \neq \beta  \Leftrightarrow \alpha < \beta$.

이제 순서 "<"는 (i) 삼분법을 만족하고 (ii) 이행적이라는 것을 보일 수 있다.

 

 

3단계: $\mathbb{P}$가 최소상계 성질이 있다는 것을 보인다.

 

 

4단계: $\mathbb{P}$는 사칙연산이 잘 정의되며, 그 연산은 대수체의 성질을 만족하면서 2단계에서 정의한 순서관계와도 '잘 합치되므로' $\mathbb{P}$는 최소상계 성질을 가진 하나의 순서 대수체이다.

 

 

#주석

아직 대수체가 뭔지, 순서 대수체가 뭔지 정의한 적이 없으므로, 봐도 모르는 것이 당연하다. 3장에서 이를 다룰 예정이다.

 

 

5단계: $r\in \mathbb{Q}$에 대하여 $r* = \{p\in \mathbb{Q} | p < r \}$을 정의하면 $r* \in \mathbb{P}$이고

$\mathbb{Q}* = \{r*|r\in \mathbb{Q}\} \subset \mathbb{P}$

는 유리수의 4칙연산을 보존하므로, $\mathbb{Q}*$는 $\mathbb{Q}$와 동형이며 $\mathbb{P}$의 부분집합이다.

 

 

6단계: 최소상계 성질이 있는 임의의 두 순서대수체는 항상 동형이라는 사실로부터 $\mathbb{P}$를 실수들의 집합이라 하고 $\mathbb{R}$로 표기한다.

 

 

선의 완비성 공리는 다음의 Dedekind 공리와도 동치이다:

 

공리 5-2'. 직선에는 최소 상계 성질이 있다.

 

명제. 공리 5-2와 공리 5-2'은 동치이다.

증명. (추후 보충 예정)

 

 

따라서 선의 완비성 공리를 만족하는 기하의 직선은 실수선과 동일하다고 할 수 있고, 공리계 전체는 데카르트 기하와 같다고 할 수 있다.

 

 

이제 원과 직선의 교점 존재성을 다음과 같이 증명하자:

 

정리 2.8.2 한 평면상의 원은 그 원에 있지 않는 점들을 내부와 외부로 분리한다. 특히, 선분의 한 끝점이 원 내부에 있고 또 다른 끝점은 외부에 있다면 그 선분은 원과 한 점에서 만난다.

 

증명전략.

직선은 곧 실수선이므로, 어떤 cut을 만들어내어 그 최소 상계가 원과의 교점이 되도록 하면 참 편리할 것이다.

 

증명. 

원의 중심을 O, 반경을 OR이라 하자. 원의 내부는 OX < OR인 점 X의 집합으로 $S_{1}$이라 표기, 원의 외부는 OY > OR인 모든 Y의 집합으로 $S_{2}$라 표기하자.

 

선분의 삼분법에 의하여 $S_{1} \cap S_{2} = \emptyset$이고, 원주상에 있지 않은 모든 점은 $S_{1}, S_{2}$ 중 정확히 하나에 속한다. A가 한 내부점이고 B가 한 외부점이라 하면 OA < OR < OB이다. 

 

이제 직선 AB의 한 부분집합 $L_{1}$을 다음과 같이 정의한다:

$L_{1}$은 점 A에서 점 B의 반대편에 있는 직선 AB의 반직선과, 직선 AB 위에 있으면서 원 O의 내부에 있는 점들의 합집합이다.

 

앞서 살펴본 명제에 의해 우리의 공리계는 직선이 곧 실수선인 Cartesian 기하계임을 아므로, 이 집합은 하나의 Dedekind cut을 이루며, 완비성 공리에 의해 여기에 $L_{1}$에 최소 상계점 M이 존재한다.

 

이제 $X \in L_{1}, Y \notin L_{1}$에 대해 M은 X와 Y 사이에 있게 되므로 $OR \equiv OM$임을 쉽게 보일 수 있다. $\square$ 

 

 

다음 게시글에는 3장. 유클리드 공리의 일관성과 독립성 단원을 시작하면서, 수의 연산 체계와 기하계가 동일한 공리계라는 아이디어에서 착안하여, 대수체로부터 기하계를 만드는 작업을 시작할 것이다.

2장 연습문제는 추후에 별도로 보충할 예정이다.

이 글에서는 입력이 다변수이고 출력은 일변수인 함수 $f: D \subset \mathbb{R} ^ n \rightarrow \mathbb{R}$에 제약이 없을 때 최적화를 고려한다.

 

#주석. 출력이 다변수인 함수는 고려하지 않는 것인가?

-> 일반적으로 $\mathbb{R}^n$은 $\mathbb{R}$에 비해 자연스럽게 떠오르는 순서구조가 훨씬 제약되어 있다. 예컨대 두 실수는 통상적인 대소관계로 비교를 할 수 있으나, 예컨대 $u,v \in \mathbb{R}^n$일 때 $u > v \Leftrightarrow u_i > v_i$로 정의하면 비교할 수 없는 두 벡터가 생긴다. 또한 $\mathbb{R}^n$에서 항상 순서를 비교할 수 있도록 관계를 정의하면 거의 모두가 $\mathbb{R}$의 순서구조와 동형임을 알 수 있다. 우리의 목적은 최적화이므로, 순서가 자연스럽게 정의되는 $\mathbb{R}$에서 값을 가지는 함수들 위에 노는 것이다.

 

 

함수 f 가 어떤 점에서 극점을 가질 필요/충분조건들을 살펴보기 위하여 다변수함수의 테일러 전개를 사용한다:

보조정리. (다변수 함수의 2차 테일러 전개)

$f:D \subset \mathbb{R}^n \rightarrow \mathbb{R}$가 $C^3$급 함수라고 가정하자. 이제

$f(x_{0} + \epsilon y) = f(x_{0}) + \epsilon y^T f'(x_{0}) + \frac{1}{2} \epsilon^2 y^T f''(x_{0}) y + O(\epsilon^3)$

가 성립한다.

(단, $f'(x_{0}) = \nabla f(x_{0})$는 기울기 벡터이고, $f''(x_{0}) = \nabla^2 f(x_{0})$는 헤시안 행렬로, 다음과 같다:)

$\begin{bmatrix} \frac{\partial^{2} f}{\partial x_{1}^2} \cdots \frac{\partial^{2} f}{\partial x_{1}x_{n}} \\ \vdots \ddots \vdots \\ \frac{\partial^{2} f}{\partial x_{n}x_{1}} \cdots \frac{\partial^{2} f}{\partial x_{n}^2} \end{bmatrix}$

 

증명.

일변수 테일러 전개와 연쇄법칙으로부터 이를 쉽게 확인할 수 있다.

함수 $g: \mathbb{R} \rightarrow \mathbb{R}$을 다음과 같이 정의한다:

$g(t) := f(x_{0}+ ty)$

 

이제 f가 $C^3$급이고 함수 $h: \mathbb{R} \rightarrow \mathbb{R}, h(t) = x_{0} + ty$는 무한 번 미분가능하므로 g 또한 $C^3$급임을 알 수 있다.

 

이제 g에 대해 2차 테일러 전개를 하면

 

$g(\epsilon) = g(0) + \epsilon g'(0) + \frac{\epsilon^2}{2} g''(0) + O(\epsilon ^ 3)$

 

그런데 연쇄법칙에 의하여

$g'(t) = \Sigma_{i=1}^{n} \frac{\partial f}{\partial x_{i}} (x_{0} + ty) y_{i}$

$g''(t) = \Sigma_{i=1}^{n} \Sigma_{j=1}^{n} \frac{\partial^2 f}{\partial x_{i} \partial x_{j}} (x_{0} + ty) y_{i}y_{j} $

 

이제 $g'(0) = y^T f'(x_{0}) , g''(0) = y^T f''(x_{0}) y$ 임을 확인하는 것은 대입 후 단순 행렬-벡터 연산을 통해 쉽게 확인할 수 있다. $\square$

 

 

f가 $C^3$급이므로 영의 정리에 의하여 헤시안 행렬 H는 대칭행렬이다. 

이제 대칭행렬에 대해서 다음의 분류를 한다:

 

정의 1.2 대칭행렬 H와 임의의 벡터 $y\neq 0, y \in \mathbb{R}^n$에 대하여 $y^{T} H y > 0$이 성립하는 대칭행렬 H를 양의 정부호라 하고 $H>0$으로 표기한다. 또한 벡터 $y \in \mathbb{R}^n$에 대하여 $y^{T} H y \geq 0$가 성립하는 대칭행렬 H를 양의 준정부호라 하고 $H \geq 0$라 표기한다.

 

같은 방식으로 음의 정부호, 음의 준정부호를 정의할 수 있다.

 

 

이제 이전에 일변수 실함수에 대해서 성립했던 정리 1.1, 1.2가 이러한 해석 하에서 다변수 실함수에서도 성립함을 쉽게 확인할 수 있다.

 

 

정리 1.1'. 점 $x_{0}$가 f의 극소점이 되기 위한 필요조건은

$(i) f'(x_{0}) = 0$

$(ii) f''(x_{0}) \geq 0$

이다.

 

증명. 

테일러 전개

$f(x_{0} + \epsilon y) = f(x_{0}) + \epsilon y^T f'(x_{0}) + \frac{1}{2} \epsilon^2 y^{T} f''(x_{0}) y + O(\epsilon^3)$

를 다시 생각해 보면,

만약 $f'(x_{0}) \neq 0$ 이라면, $ y = - f'(x_{0}) $로 잡으면 $y^T f'(x_{0}) = - (f'(x_{0}))^T f'(x_{0}) < 0$가 성립하고, 또한 $\frac{f(x_{0} + \epsilon y) - f(x_{0})}{\epsilon} = y^{T} f'(x_{0}) + \frac{1}{2} \epsilon y^{T} f''(x_{0}) y + \frac{O(\epsilon^3)}{\epsilon}$

이다. 우변에서 $\epsilon \rightarrow 0+$에 따라 뒤의 두 항은 0으로 수렴하는 반면 첫 항은 음수이므로 좌변도 $\epsilon \rightarrow 0$에 따라 음수여야 하고, 이는 f가 $x_{0}$ 서 극소점을 가진다는 가정에 모순된다.

 

이제 (i)이 성립한다 하자. 만약 (ii)가 성립하지 않는다면, $\exists y \in \mathbb{R}^n, s.t. y^T f''(x_{0}) y < 0$

그러한 y를 택하고 테일러 전개를 하면

$\frac{f(x_{0} + \epsilon y) - f(x_{0})}{\epsilon^2} = \frac{1}{2}y^{T} f''(x_{0}) y + \frac{O(\epsilon^3)}{\epsilon^{2}}$

에 따라 우변의 두번째 항은 0으로 수렴하는 반면 첫 항은 음수이므로, 좌변 역시 $\epsilon \rightarrow 0$에 따라 음수여야 하고, 이는 f가 $x_{0}$서 극소점을 가진다는 가정에 모순된다. $\square$

 

이제 일변수 함수때와 표기 방식만 다르고 동일한 논리를 통해

 

정리 1.2 ' 점 $x_{0}$가 f에서 극소점을 가지기 위한 충분조건은

$(i) f'(x_{0}) = 0$

$(ii) f''(x_{0}) > 0$

이다.

 

역시 증명해낼 수 있다.

 

 

이제 예시 하나를 통해 마무리를 짓고자 한다.

 

예시 1.1 

$f(x) = f(x_{1}, x_{2}) = 3x_{1}^{2} + 2x_{1}x_{2} + 3x_{2}^{2} - 6x_{1} + 14x_{2} + 22$라 하자. f가 극소점을 가지는 x를 구하도록 하자.

 

일계도함수들과 이계도함수들을 구하면

$\frac{\partial f}{\partial x_{1}} = 6x_{1} + 2x_{2} - 6, \frac{\partial f}{\partial x_{2}} = 2x_1 + 6x_{2} + 14$

$\frac{\partial^2 f}{\partial x_{1}^{2}} = 6, \frac{\partial^2 f}{\partial x_{1} \partial x_{2}} = 2, \frac{\partial^2 f}{\partial x_{2}^2} = 6$

 

이제

$f'(x_{0}) = \begin{bmatrix} 6x_{1} +2x_{2} - 6 \\ 2x_{1} +6x_{2} + 14 \\ \end{bmatrix}$

$f''(x_{0}) = \begin{bmatrix} 6 & 2 \\ 2 & 6 \end{bmatrix}$

 

 

다음의 보조정리를 이용한다 (증명은 추후 보충 예정):

보조정리. A는 $n \times n$ 실행렬로, 대각화가 가능하며 모든 고윳값이 양이라 하자. 그러면 A는 양의 정부호 행렬이다.

 

$f''(x_{0})$의 고윳값이 4, 8로 모두 양수이다. 이제 $x_{0}= (2,-3)$에서 $f'(x_{0}) = 0$이고 $f''(x_{0}) >0$이므로, 정리 1.2'에 의하여 f는 (2,-3)서 극솟값을 가진다는 사실을 알 수 있다. 또한 $f'(x_{0}) = 0$이 되도록 하는 $x_{0}$은 앞서 살펴본 (2,-3)이 유일함을 알 수 있으므로 f는 (2,-3)서 최솟값을 가진다는 사실까지 알 수 있다.

 

두 직선이 평행하기 위한 필요충분조건은 두 직선의 교점이 없다는 것이고, 우리 직관상으로 직선과 점이 있을 때 점을 지나면서 직선에 평행한 직선은 하나뿐이어야 한다. 그러나 이 성질은 가능한 모든 기하체계에서 자동적으로 성립하는 것은 아니고, 평행선에 관한 공리로써 서술되어야 한다.

 

우선 우리가 직관으로 알고 있는 성질들을 정의하는 작업부터 시작한다.

 

정의 2.7.1 한 평면상에서 만나지 않는 두 직선 l, l'을 서로 평행하다고 하고 기호로는 l || l'로 나타낸다.

 

평행선 공리가 성립하지 않을 수도 있다면, 예컨대 공리군 (I)~(III)만을 가정할 시 직선 l과 l 위에 있지 않은 점 A에 대해서, A를 지나는 평행선이 하나보다 많이 있을 수도 있고 없을 수도 있다고 생각할 수 있다. 허나 다음 명제에 의해 공리군 (I)~(III)을 가정한 모든 기하계에서 평행선이 최소 하나 있다는 사실은 알 수 있다.

 

명제. 평면 $\alpha$ 상에 있는 직선 l과 l 위에 있지 않은 점 A가 주어질 때 A를 지나고 l과 평행한 직선이 하나 이상 존재한다.

 

증명. 직선 l 위에 있는 점 B를 택한다. 이제 점 A와 점 B를 연결하는 직선 m은 직선 l과 점 A 모두를 지난다.

이제 직선 m에 의해 나누어지는 반평면 중 하나를 택하고, 다음을 만족하도록 반직선 n을 잡는다:

 

$\angle(m,l) \equiv \angle(m,n)$

 

이제 반직선 n을 연장하여 만든 직선 n'에 대해 n' || l 임을 보이고자 한다. 결론을 부정하여 직선 n'과 직선 l이 한 점 C에서 만난다고 가정하자. 그렇다면 점 A,B,C가 모두 한 점 위에 있지는 않으므로 삼각형 ABC가 정의될 수 있다.

 

그런데 $\angle(m,n)$은 삼각형 ABC의 외각이고, $\angle(m,l)$은 그 보각이 아닌 한 내각이므로 삼각형의 외각정리 (2.6.14)에 의해 $\angle(m,l) > \angle(m,n)$이며 이는 모순이다. $\square$

 

 

이제 평행선 공리를 공식적으로 서술한다.

 

공리 4. (평행선 공리) 한 평면상에 직선 l과 직선 l상에 있지 않은 점 P가 있으면 P를 지나고 l과는 만나지 않는 직선은 하나보다 많지 않다.

 

 

따라서 (공리군 1~3을 모두 가정하면) 주어진 점을 지나고 주어진 직선에 평행인 직선은 단 하나 존재한다.

 

평행선 공리와 동치인 명제는 다음과 같이 서술할 수 있다:

 

명제. "한 평면의 두 직선 l과 m이 같은 평면상의 다른 직선 n을 만나지 않으면 그 자신들도 만나지 않는다." 는 공리4와 동치이다.

증명.

( $\Rightarrow$ ) 공리 4가 성립하지 않아, 어떤 직선 n이 존재하고 점 A가 존재, A를 지나면서 n과 평행한 직선이 최소 둘 있다고 하자. 이제 그 중 둘을 골라 l과 m이라 하면 전건의 부정이 성립한다.

 

( $\Leftarrow$ ) 한 평면의 두 직선 l과 m이 다른 직선 n을 만나지 않으나, l과 m은 교점 A가 있다 하자. 그렇다면 점 A를 지나면서 n과 평행한 직선이 l과 m 적어도 둘 있으므로 평행선 공리가 성립하지 않는다. $\square$

 

 

평행선 공리의 도입으로 기하가 굉장히 단순해진다. 당장 합동 공리군까지만 가정할 때는 외각 정리를 보이기 위해서 보각을 이용한 복잡한 과정을 거쳐야 했는데, 삼각형 내각의 합이 일정하다는 사실을 쓸 수 없었기 때문이고, 이 사실 자체가 평행선 공리에 의존하기 때문이다.

 

 

정의. (동위각, 엇각)

직선 l,m,n이 모두 다른 직선들이라 하고,

직선 n과 직선 l,m 모두 교점이 존재한다고 가정하자. 이 교점들을 A,B라 명명한다.

또한 A에 의해 나누어지는 직선 l의 두 반직선을 l', l''이라 하고

B에 의해 나누어지는 직선 m의 두 반직선을 m',m''이라 명명한다.

 

다음을 만족하는 두 각 $\angle P, \angle Q$는 서로 동위각 이다:

(i) $\angle P$는 A를 꼭지점으로 가지고 A에 의해 나누어지는 직선 n의 한 반직선과 l의 한 반직선으로 이루어진 각이다.

(ii) $\angle Q$는 B를 꼭지점으로 가지고 B에 의해 나누어지는 직선 n의 한 반직선과 m의 한 반직선으로 이루어진 각이다.

(iii) 선분 AB는 $\angle P$와 $\angle Q$의 변에 공통적으로 포함된다.

(iv) $\angle P$가 변으로 가지는 l의 반직선과 $\angle Q$가 변으로 가지는 m의 반직선은 직선 n에 대하여 같은 반평면 위에 있다.

 

또 다음을 만족하는 두 각 $\angle P, \angle Q$는 서로 엇각이다:

(i) $\angle P$는 A를 꼭지점으로 가지고 A에 의해 나누어지는 직선 n의 한 반직선과 l의 한 반직선으로 이루어진 각이다.

(ii) $\angle Q$는 B를 꼭지점으로 가지고 B에 의해 나누어지는 직선 n의 한 반직선과 m의 한 반직선으로 이루어진 각이다.

(iii) 선분 AB는 $\angle P$와 $\angle Q$의 변에 공통적으로 포함된다.

(iv) $\angle P$가 변으로 가지는 l의 반직선과 $\angle Q$가 변으로 가지는 m의 반직선은 직선 n에 대하여 반대편 반평면 위에 있다.

 

 

#사족.

정의가 굉장히 복잡해 보이지만, 통상적으로 생각하는 동위각과 엇각을 그려놓고 따라가면 금방 이렇게 정의한 동기가 이해될 것이다.

 

 

정리 2.7.1 

(i) 두 평행선들이 제 3의 직선을 만나서 만드는 엇각과 동위각은 합동이다.

(ii) 역으로, 엇각이나 동위각이 합동이면 두 직선은 평행하다.

 

증명. 

증명에 앞서 직선 l, m, n에 대해서

l || m,

l $\times$ n = A,

m $\times$ n = B라 하자.

(만난다는 사실은 어떻게 보장하는가? -> 예컨대 m과 n의 교점이 없다면 A를 지나면서 m과 평행한 직선이 l과 n 둘 존재하게 되어 공리 4에 모순된다.)

 

A에 의해 정의되는 l의 반직선 중 하나를 임의로 골라 l'이라 하고, 직선 n에 의해 나누어지는 반평면 중 l'을 포함하는 반평면 위 m의 반직선을 m'이라 하자.

 

또한 A에 의해 나누어지는 n의 반직선 중 B를 포함하지 않는 반직선을 n'이라 하고, B에 의해 나누어지는 반직선 중 A를 포함하는 반직선을 n''이라 하자.

 

이제 $\angle(n',l')$, $\angle(n'',m')$은 정의에 의해 동위각이다.

 

(ii) 의 증명

이는 삼각형의 외각정리 2.6.14로부터 도출된다.

 

(i) 의 증명

결론을 부정하여 모순을 이끌어낼 것이다.

각의 삼분법에 의하여 $\angle (n',l') > \angle(n'',m')$ 또는 $\angle (n',l') < \angle(n'',m') $ 중 정확히 하나가 성립한다.

일반성을 잃지 않고 전자라 하자.

이제 반직선 n'을 가지고 점 A에서 방사하며, $\angle (n',l'') \equiv \angle(n'',m')$ 을 만족하도록 반직선 l''을 잡되, l''은 직선 n에 의해 나누어지는 두 반평면 중 반직선 m'을 가지는 반평면 위에 있도록 할 수 있다.

이제 반직선 l''을 연장한 직선은 다음을 만족한다:

 

(a) 점 A를 지난다.

(b) (ii)에 의해 직선 m과 평행하다.

 

그러나 이는 평행선 공리와 모순이다. $\square$

 

 

평행선 공리로부터 삼각형의 내각들의 합은 "180도"라는 말을 하고 싶다. 그러나 우리는 도라는 개념을 정의한 적이 없으므로 두개의 직각을 더한 크기라는 표현을 사용한다. 그런데 우리가 처음 각을 정의할 때 "180도" 이상의 각은 각의 내부와 외부가 없어 정의하지 않았다는 점을 상기하자. 이제 각의 정의를 확장할 필요성이 생긴다.

 

정의. 반직선 l'과 반직선 l''이 한 점 A와 A를 지나는 직선 l의 서로 다른 두 반직선이라 하자.

이제 $\angle(l',l'')$은 2직각의 크기를 가진다고 정의한다.

 

이 정의는 정리 2.6.7 (각의 연산)와 2.6.12 (각의 크기 비교)에서 유도되는 각의 삼분법을 준수하며, 실제로 직각인 두 각을 '더할' 때 $\angle(l',l'')$ 꼴의 각을 얻을 것으로 예상할 수 있다. (실제로 증명한 적은 없음; 만약 반례가 있다면 지적 부탁)

 

 

정리 2.7.2 삼각형의 내각들의 합은 2 직각이다.

증명. 

$\triangle ABC$를 고려하자.

공리 2.2에 의하여 BCD가 성립하도록 하는 점 D를 B에서 C로 뻗어가는 반직선 위에 잡을 수 있다.

이제 점 C를 지나고 직선 AB에 평행한 유일한 직선 l을 잡고, C에 의해 정의되는 l의 두 반직선 중 점 A를 포함하는 반평면의 반직선을 l'이라 하고 그 위의 점 E를 잡는다.

 

이제 $\angle ABC$와 $\angle ECD$는 동위각 관계이므로 정리 2.7.1에 의해 합동이다.

또한 $\angle BAC$와 $\angle ACE$는 엇각 관계이므로 정리 2.7.1에 의해 합동이다.

 

C에서 B로 뻗어가는 반직선을 n, C에서 D로 뻗어가는 반직선을 n'이라 하자.

이제 정리 2.6.7에 의해 각의 덧셈을 잘 정의할 수 있는데, 삼각형의 세 내각의 크기의 합은 $\angle(n,n')$의 크기와 같고 이는 두 직각의 크기의 합과 같다는 사실을 알 수 있다. $\square$

 

#사족.

이 정리는 삼각형의 내각들의 합의 크기를 주는 것뿐만 아니라, 그 크기가 실제로 상수임을 알려준다는 데에서 큰 의의가 있다.

 

 

 

한편 평행선 공리와 합동 공리군으로부터 과 원과 관련된 성질들이 잘 성립한다는 사실을 유도할 수 있다.

 

정의 2.7.2 한 평면 a상의 임의의 점 O와 R에 대하여 $OR \equiv OQ$가 되는 a상의 모든 Q점들의 집합을 점 O를 중심으로 하는 원이라 한다. O를 원의 중심, OR을 원의 반경이라 한다.

 

정의. 중심이 O이고 반경이 OR인 원에 대해 점 A,B가 원 위에 있는 서로 다른 두 점이라 하자.

이제 선분 AB를 원의 이라 한다.

 

명제. 일직선상에 있지 않은 세 점을 지나는 원은 항상 작도 가능하다.

증명. 

점 A,B,C가 일직선상에 있지 않은 세 점이라 하자. 이 세 점을 지나는 원이 존재함을 보일 것이다.

$\triangle ABC$를 고려하자. 

합동 공리군에 의해 선분 AB의 수직이등분선 l과 선분 BC의 수직이등분선 m을 고려할 수 있다.

l과 m이 교점이 있음을 주장하고자 한다. 결론을 부정하여 교점이 없다고 가정하자.

그렇다면 정리 2.7.1에 의해 직선 AB와 m의 교점이 존재하며, 그 교점에서 방사하는 직선 AB의 반직선 하나와 m의 반직선 하나를 택하여 각을 만들면 그 각은 직각이 된다.

즉, 직선 m은 직선 AB와도 수직이고 직선 BC와도 수직이다. 따라서 정리 2.7.1에 의해 직선 AB와 직선 BC는 평행한데 선분 AB와 선분 BC의 교점이 이미 존재하므로 이는 모순이다.

이제 l과 m의 교점을 O라 하고 선분 OA를 원의 반경이라 할 때, 선분 합동의 전이성에 의하여

$OA \equiv OB \equiv OC$가 성립하여 A,B,C 모두 이 원 위에 있다. $\square$

 

 

 

문제 2.7.1을 증명하기 이전에, 여태껏 우리가 각에 대해 증명해온 명제들은 모두 각이 2직각보다 작은 경우였다.

특히 각의 내부와 외부는 각이 2직각보다 작은 경우에 잘 성립하는 것들이고, 각이 2직각보다 큰 경우는 성립하지 않는다.

그러나 각의 크기와 관련된 명제들이나 덧셈 뺄셈과 관련된 명제는 각의 정의를 연장하여도 잘 성립한다:

 

정의. 각 $\angle(h,k)$가 2직각보다 작은 각이라 하자. 또한 h'는 반직선 h의 반대편 반직선, k'은 반직선 k의 반대편 반직선이라 하자. 이제 $\angle(h,k)$의 켤레각은 $\bar{\angle (h,k)}$로 표시하며, 반직선 h,k와 $\angle (h,k)$의 외부에 있는 점의 순서쌍으로 정의된다. 그 크기는 $\angle (h,k') + \angle (h',k) + \angle (h',k')$로 정의된다. 만약 어떤 각 P가 다른 각 Q의 켤레각이면 P의 켤레각은 Q로 정의한다.

 

문제 2.7.1 다음을 증명하라.

(1) 동일 직선상에 있지 않은 임의의 세 점을 지나는 원은 단 하나 있다.

증명.

중심이 같으면서 반경이 다른 원은 선분 OA와 합동이어야 함이 명백하므로, 중심이 O'으로 다른 원이 존재한다고 가정하자.

이제 $O'A \equiv O'B$가 성립하면 O'은 선분 AB의 수직이등분선 위의 점이어야 함을 보일 것이다.

O'이 직선 AB 위에 있다면 AO'B가 성립해야 하고 $O'A \equiv O'B$이므로 O'은 선분 AB의 이등분점이므로 정리가 성립한다.

O'이 직선 AB 위에 있지 않다면 삼각형 AO'B는 이등변삼각형이고 정리 2.6.1에 의하여 $\angle O'AB \equiv \angle O'BA$가 성립한다. 또한 정리 2.7.2에 의하여 $\angle O'AB, \angle O'BA$는 모두 직각보다 작다.

점 A에서 시작하고 O'가 있는 반평면쪽으로 뻗어나가면서 반직선 AB와 직각을 이루는 반직선을 n, 점 B에서 시작하고 O'가 있는 반평면쪽으로 뻗어나가면서 반직선 BA와 직각을 이루는 반직선을 m이라 하자.

이제 n을 연장한 직선에 의해 나누어지는 두 반평면 중, 반직선 AO'은 B를 포함하는 반평면에 포함되어 있고, m을 연장한 직선에 의해 나누어지는 두 반평면 중, 반직선 BO'은 A를 포함하는 반평면에 포함되어 있다.

따라서 점 O'은 위의 두 조건을 모두 만족하며, O'을 지나며 직선 AB에 수직인 직선을 그으면 그 직선은 반직선 n,m 모두와 평행하다.

그런데 직선 AB 위의 점 중 위의 두 조건을 만족하는 부분은 선분 AB뿐이므로, O'를 지나며 직선 AB와 수직인 직선과 직선 AB의 교점은 선분 AB 위에 있다. 이 점을 D라 하자.

이제 $\angle ADO' \equiv \angle BDO'$이며 두 각 모두 직각이므로 삼각형의 확장된 ASA 합동조건에 의해

$\triangle ADO' \equiv \triangle BDO'$이고, 따라서 $AD \equiv BD$이고 O'은 선분 AB의 이등분선 위에 있다.

 

마찬가지의 논리로 O'은 선분 AB, 선분 BC, 선분 CA의 이등분선 모두 위에 있어야 하는데 이를 만족하는 점은 O로 유일함을 결합공리와 위의 명제에 의해 알 수 있다. $\square$

 

 

(2) 같은 현을 가지는 원의 원주각은 서로 합동이다.

 

우선 다음의 보조정리가 필요하다.

보조정리. C가 원 O 위의 점이면서 현 AB를 연장한 에 대해서 O와 같은 반평면 위에 있다 하면, $\angle ACB$는 직각보다 작다.

 

증명.

공리 3.1에 의하여, 점 O에서 시작하며 점 B의 반대편으로 방사하는 반직선 위 점 B'을 잡아 $OC \equiv OB'$이 되도록 할 수 있다. (이러한 점 B'은 유일하다). 이제 B'은 원 O 위에 있음은 정의에 의해서 명백하다.

원 O가 직선 AB에 대해서 C와 같은 반평면에 있으므로, 점 O는 $\angle ABC$의 내부에 있고 따라서 반직선 BO는 선분 AC와 교점이 존재한다. 이 교점을 D라 하자.

이제 B'은 직선 AC에 대하여 B와 반대편 반평면에 있음을 주장할 것이다. 모순을 도출하기 위해 명제의 결론을 부정하여 DB'B라고 가정하자. (B',D는 모두 B에서 시작하고 O로 가는 반직선 위의 점들이므로, DBB'은 가능하지 않은 순서관계이다.)

이제 $OA \equiv OB' \equiv OC$가 성립하므로, 이등변삼각형에 관한 정리 2.6.1과 각의 연산에 관한 정리 2.6.7에 의해 $\angle OCB \equiv \angle CBO, \angle OBA \equiv \angle OAB$, 외각정리에 의해 $\angle CBO > \angle CDB, \angle ABO > \angle ADB$이다. 그런데 $\angle ADB + \angle CDB$의 크기가 2 직각이므로 둘 중 하나는 최소한 1직각의 크기이다. 일반성을 잃지 않고 $\angle ADB$가 1직각보다 작지 않다고 가정하자.

그런데 그렇다면 $\angle ABO + \angle BAO > \angle ADB + \angle ADB$이므로 삼각형의 내각의 합이 2직각이라는 정리 2.7.2에 모순된다.

 

명제의 증명.

원 O 위의 현 AB가 있고 현 AB 위에 있지 않은 점 C가 있으며 C가 직선 AB에 대하여 O와 같은 반평면에 있다 할 때 $\angle ACB$를 원주각이라 부른다. 또한, 이 때 $\angle AOB$를 중심각이라 부른다.

이 명제는 점 C와 점 C'이 서로 다른 점이고 현 AB에 대해 원주각 $\angle ACB, \angle AC'B$를 정의할 때, $\angle ACB \equiv \angle AC'B$라는 것을 주장한다.

우리는 중심각이 항상 원주각의 2배임을 보임으로써 이 명제를 보일 것이다. $\angle AOB$는 $\angle ACB, \angle AC'B$ 모두의 중심각이므로 이를 보이기만 하면 명제의 증명이 끝날 것이다.

 

점 O가 삼각형 ABC의 내부에 있는 경우와 외부에 있는 경우로 나누어 생각한다.

 

Case 1. 내부에 있는 경우

점 C에서 방사하며 점 O를 지나는 반직선을 그린다. 선분 AB는 $\angle C$의 내부에 있으므로 반직선 CO와 선분 AB는 교점을 가진다. 이 점을 D라 하자.

정리 2.7.2를 증명하면서 삼각형의 외각은 보각이 아닌 다른 두 내각 각각보다 클 뿐만 아니라, 삼각형 외각의 크기는 보각이 다른 두 내각의 크기의 합이라는 사실까지 증명하였다는 점을 상기하자.

$\triangle AOC, \triangle BOC$는 모두 이등변삼각형이므로 $\angle ACO \equiv \angle CAO, \angle BCO \equiv \angle CBO$이고, 정리 2.7.2에 의해 $\angle AOD \equiv \angle ACO + \angle CAO, \angle BOD \equiv \angle BCO + \angle CBO$이다. 따라서

$\angle AOB \equiv \angle AOD + \angle BOD \equiv 2*(\angle ACO + \angle BCO) \equiv 2*(\angle ACB)$이고 이는 우리가 증명하고자 하던 바이다.

 

 

Case 2. 삼각형의 변 위에 있는 경우

현 AB 위에 점 O가 있다고 하자.

$\triangle AOC \equiv \triangle BOC$이므로, 이등변삼각형의 성질에 의해 $\angle ACO \equiv \angle CAO, \angle BCO \equiv \angle CBO$이다. 그런데 삼각형의 내각의 합은 2직각이므로 $\angle ACB$의 크기가 직각임을 쉽게 확인할 수 있다. 특히 이 경우 원주각이 반직선 OA, 반직선 OB로 정의되는 각의 크기인 2직각이므로 명제가 성립한다.

 

이제 선분 BC 위에 점 O가 있다 하자. (AC의 경우는 마찬가지 논리)

$\angle ACO \equiv \angle CAO$이고 $\angle AOB$는 $\angle AOC$의 외각이므로

$\angle AOB \equiv \angle ACO + \angle CAO \equiv 2*(\angle ACO)$이고 이는 우리가 보이고자 했던 바이다.

 

 

Case 3. 삼각형의 외부에 있는 경우

점 C와 점 O는 직선 AB에 대해 같은 반평면 위에 있으므로, 점 O와 점 A가 직선 BC에 대해 반대편 반평면에 있거나 점 O와 점 B가 직선 AC에 대해 반대편 반평면에 있어야 한다. (#주석. 둘 다 성립하는 경우를 배제하는 것은 아니다. 둘 다 성립하지는 않음을 보이기 위해서는 별도의 증명이 필요하다.)

일반성을 잃지 않고 점 O가 점 A와 반대편 반평면에 있다 하자.

이제 선분 OA는 직선 BC와 교점이 있는데, 점 O에서 방사하고 A의 반대편으로 가는 반직선에 대해 선분 OA와 선분 OD가 합동이 되도록 점 D를 잡으면 선분 BC는 각 BDC의 내부에 있으므로 반직선 DO와 선분 BC의 교점이 있고, 따라서 선분 OA와 선분 BC의 교점이 존재한다. 이 점을 E라 명명한다.

한편 점 C에서 점 O로 뻗어가는 반직선을 잡고, O에서 C의 반대편으로 진행하며 $CO \equiv OF$가 되도록 하는 점 F를 잡는다. F는 원 O 위에 있으며, 반직선 CO는 $\angle ACB$의 외부에 있으므로 선분 OF와 선분 AB와 교점의 존재할 수는 없다.

 

이제 $\triangle OAC$는 $OC \equiv OA$인 이등변삼각형이고 $\triangle BOC$는 $OB \equiv OC$인 이등변삼각형이다.

한편 외각의 성질에 의해 $\angle AOB = \angle AOF - \angle BOF$이다.

그런데 $\angle AOF = 2*\angle OCA, \angle BOF = 2*\angle BCO$이다.

따라서 $\angle AOB = 2* (\angle OCA - \angle OCB) = 2 * (\angle ACB)$이고 이는 우리가 보이고자 하던 바이다. $\square$

 

 

(3)

(i) 원에 내접하는 사각형의 맞각의 합은 2직각이다.

(ii) 역으로 사각형의 한 쌍의 맞각의 합이 2직각이면 원에 내접한다.

(i)의 증명.

(2)에 의하여 다음의 보조정리가 성립한다:

 

보조정리. 

$\triangle ABC$가 원 O에 내접하고, 직선 l은 선분 AO에 수직이면서 점 A를 지나는 직선이라 하자.

이제 직선 l에 있으면서 직선 AC에 의해 나누어지는 반평면 중 B가 없는 반평면에 있는 부분을 l'이라 하고 l' 위의 한 점을 D라 하면,

$\angle CAD \equiv \angle ABC$.

 

이제 $\square ABCD$가 원 O에 내접하며, $\angle BAD, \angle BCD$가 서로 맞각이라 하자.

선분 OD에 수직이며 점 D를 지나는 직선 l을 긋고, 직선 BD가 정의하는 두 반평면 중 점 A와 같은 쪽에 있는 반직선을 l',  점 C와 같은 쪽에 있는 반직선을 l''이라 하고 l' 위의 한 점 D', l'' 위의 한 점 D''을 잡는다.

이제 보조정리에 의해 $\angle BAD \equiv \angle BDD'', \angle BCD \equiv \angle ADD'$가 성립한다.

그런데 $\angle BDD', BDD''$은 보각 관계이므로 $\angle BAD + \angle BCD$은 2직각이다. $\square$

 

 

(ii)의 증명.

귀류법을 사용하기 위하여 명제의 결론을 부정하자. $\square ABCD$는 맞각의 합이 2직각이나, 어떤 원에도 내접하지 않는다 가정하자.

이제 세 점 A,B,C가 한 직선 위에 있지는 않으므로 이를 지나는 원은 유일하게 존재함을 (1)에 의해 안다. 그 원의 중심을 O라 하자. 가정에 의해서 D는 원 O 위에 있지 않다.

이제 점 O를 지나고 직선 CD에 수직인 직선 l을 고려하자. 직선 CD와 직선 l은 교점 E가 존재해야 하며, 정리 2.6.15에 의해 OE < OC가 성립한다. 이제 점 E에서 시작하며 점 C의 반대편으로 뻗어가는 반직선 위에서 $ CE \equiv EF$가 성립하도록 점 F를 잡는다. 이제 $\triangle OCE \equiv \triangle OFE$가 성립하므로 F는 원 O 위의 점이다.

이제 경우를 나눈다.

 

Case 1. CFD가 성립

$\angle AFC$는 $\triangle AFD$의 외각이며, $\angle ADF$는 $\angle AFC$의 보각이 아니므로 외각정리 2.6.14에 의해 $\angle AFC > \angle ADF$가 성립한다. 그런데 이러면 $\square ABCF$는 원 O에 내접하는데 $\angle ABC + \angle AFC > \angle ABC + \angle ADC = 2*R$ (R은 직각의 크기)이므로 (i)에 모순된다.

 

Case 2. CDF가 성립

이제 $\angle ADC$가 $\triangle AFD$의 외각이고, $\angle AFD$는 $\angle ADC$의 보각이 아니므로 외각정리 2.6.14에 의해 $\angle ADC > \angle AFC$가 성립한다. 그런데 이러면 $\angle ABC + \angle AFC < \angle ABC + \angle ADC = 2*R$이므로 (i)에 모순된다.

 

이상의 논의에 의해 $D\neq F$는 모순을 야기하고, 귀류법을이용한 증명이 완료되었다. $\square$

 

 

이제 평행선 공리를 모두 다루었으므로, 다음 시간에는 연속성 공리를 다룰 것이다.

이 공리는 완비성과 아르키메데스 공리로 이루어져 있는데, 연속성 공리는 특히 기하보다는 대수의 영역에서 더 직관적으로 이해되기가 쉽다는 특성이 있다. 

 

 

이번 연재에서는 John Gregory와 Cantian Lin 저 <Constrained Optimization in the Calculus of Variations and Optimal Control Theory>를 정리해 나가면서, 제약된 최적화 관련 내용을 복습하고 학습해나갈 것이다.

필자는 경제수학 수준과 대학 미적분학 수준의 제약 최적화 내용만 알기 때문에, 새로운 내용을 배울 것이라 기대하면서 연재를 시작한다. 또한 필자의 배경지식이 빈약하므로 연습문제 풀이 등에서 오류가 많을 예정인데, 댓글 등으로 적극적인 지적이 있기를 기대한다...

 

 

 

1.1 비제약 최적화

일반적으로 최적화 문제는 정의역이 n차원 실수공간의 부분집합이고 값이 실수인 어떤 함수의 극대/극솟값을 구하는 형태로 나타난다. 여기서 여러 아종이 파생되는데, 예컨대 정의역이 볼록집합인 경우, 정의역이 특정한 조건을 만족하도록 제약되는 경우 등이 있겠다. 이러한 상황에서 문제를 푸는 수치, 해석적 방법을 살펴보는 것이 이 책의 목적이다.

 

허나 이러한 문제를 풀기 전에, n차원 실수공간 전체에서 정의역을 가지고 실수값을 가지는 함수의 극솟값과 극댓값을 구하는 문제를 먼저 살펴본다.

 

정의 1.1

 

함수

$f: D \subset \mathbb{R} ^{n} \rightarrow \mathbb{R} $

가 $f \in C^{3}(D)$ 를 만족한다 하자. 즉, f는 연속인 삼계도함수를 가진다.

 

또한 $x_{0}$가 D의 내부점이고, 다음이 성립한다 하자:

$\exists \delta >0, s.t. x\in N(\delta ,x_{0}) := \{x : ||x-x_{0}|| < \delta \} \Rightarrow f(x_{0}) \leq f(x) $

 

이제 $x_{0} \in D$를 함수 f의 극소점이라 한다. 특히, $x \in N(\delta , x_{0}) , x\neq x_{0} \Rightarrow f(x_{0}) < f(x)$가 성립하면 $x_{0} \in D$를 f의 단조 극소점이라 한다.

 

또한, $x\in D$가 함수 g:= -f 의 극소점이라면 x는 g의 극대점이라 하고, 단조 극대점 또한 동일한 방식으로 정의한다.

 

 

우선은 n=1인 경우, 즉 f가 실함수인 경우를 살펴보자.

$C^3$급 실함수의 어떤 점이 극소점/ 극대점이 되기 위한 필요조건과 충분조건을 살펴보기 위하여 다음의 정리를 이용한다:

 

 

보조정리 (테일러 정리).

열린 구간에서 정의된 함수

$f:\left(a,b\right)\rightarrow \mathbb{R}$

가 n번 미분가능하다 하고, x는 열린구간 (a,b)에 속한다 하자.

이제 $x+\epsilon$가 (a,b)에 속하도록 하는 모든 $\epsilon >0$에 대해서, 다음이 성립한다:

$\exists \xi \in \left(x,x+\epsilon \right),\ f\left(x+\epsilon \right)=\Sigma _{i=0}^{n-1}\ \frac{f^i\left(x\right)}{i!}\epsilon ^i+\frac{f^n\left(\xi \right)}{n!}\epsilon ^n$

이 정리에 대한 증명은 생략한다. 

 

 

그리스 문자가 매우 많아서 처음 보는 사람은 두려움에 떨 가능성이 크다 (필자도 그랬다). 조금 풀어서 설명을 하자면, 이 정리는 다음을 말한다:

 

(i) x에서 $\epsilon$ (엡실론) 만큼 옆으로 간 함숫값은, $\epsilon$의 n차 다항식으로 주어질 수 있다. (예컨대 엡실론을 입력으로 받아들이는 지수함수나 사인함수로도 주어질 수 있는데, 다항식으로 주어지며, 다른 차수가 아니라 f가 미분가능한 횟수의 차수를 차수로 가지는 다항식이다)

 

(ii) 이 다항식의 계수들은, n-1차 까지는 x에서 i계 미분계수 / i!으로 주어지고, n차에서는 x와 $x+\epsilon$ 사이 어떤 $\xi$ (크사이) 에 대하여 크사이에서 n계 미분계수 / n!으로 주어진다.

 

(iii) 이 이야기를 종합하면,

 

$f(x+\epsilon)-\Sigma _{i=0}^{n-1} \frac{f^i(x)}{i!}\epsilon^i =\frac{f^n(\xi)}{n!}\epsilon^{n}$

즉, $f(x+\epsilon)$와 계수가 잘 주어진 n-1차 다항식의 차는 $e^n$에 의존하는 항이 된다는 의미이고,

다른 말로 $\epsilon$이 0으로 접근하면 $f(x+\epsilon)$와 다항식의 오차는 $e^n$의 속도로 0에 수렴한다는 의미이다.

또 다른 말로 이야기하면, f(x) 근처의 값은 n-1차 다항식으로 잘 근사된다는 의미이다. 이러한 성질은 f의 n번 미분가능함에 의존한다.

 

 

이 문제에서는 f가 세 번 미분가능하므로, 테일러 정리에 의해 f(x+e)를 다음과 같이 표현할 수 있다:

$f\left(x+\epsilon \right)=f\left(x\right)+\epsilon f'\left(x\right)+\frac{1}{2}\epsilon ^2f''\left(x\right)+\frac{1}{6}\epsilon ^{3\ }f'''\left(\xi \right),\ \ \xi \in \left(x,x+\epsilon \right)$

 

그런데 f는 그냥 세 번 미분 가능한 것이 아니라 삼계도함수가 연속이다. 따라서 삼계미분계수의 절댓값은 주어진 $\epsilon$에서 유계일 것이고 그 상한은 $\epsilon$이 작아질수록 같이 작아질 것이다. 

$\left|{f\left(x+\epsilon \right)-\left\{f\left(x\right)+\epsilon f'\left(x\right)+\frac{1}{2}\epsilon ^2f''\left(x\right)\right\}}\right|\le \frac{1}{6}k_{\epsilon }\epsilon ^{3\ }$

 

 

$\epsilon$를 작게 하면 할수록 $k_{\epsilon}$는 작아질 것이므로, 충분히 작은 $\epsilon$에 대해서 $k_\epsilon < K$인 K가 존재할 것이다.

이를 표기하는 방법으로

${f\left(x+\epsilon \right)-\left\{f\left(x\right)+\epsilon f'\left(x\right)+\frac{1}{2}\epsilon ^2f''\left(x\right)\right\}=O\left(\epsilon ^3\right)}$

이라고 표기한다.

 

 

 

이 테일러 근사로부터 다음의 결과들이 바로 얻어진다:

 

정리 1.1

f가 $x_{0}$에서 극소점을 가지기 위한 필요조건은

$\left(i\right)\ f'\left(x_{0}\right)=0$
$\left(ii\right)\ f''\left(x_{0}\right)\ge 0$
 

증명.

실수의 삼분법에 의하여 $f'(x_{0}) > 0 , f'(x_{0}) < 0 , f'(x_{0}) = 0$ 셋 중 하나만이 성립한다.

이제 만약 $f'(x_{0}) > 0$이라 가정하자. 테일러 전개에 의하여

$\frac{f(x_{0}+\epsilon) - f(x_{0})}{\epsilon} = f'(x_{0}) + \frac{1}{2} \epsilon f''(x_{0}) + \frac{O(\epsilon ^3)}{\epsilon}$

마지막 두 항은 $\epsilon \rightarrow 0$에 따라 0으로 수렴하는 반면, $f'(x_{0})$은 상수이므로, 충분히 작은 모든 $\epsilon>0$에 대하여 우변이 0보다 커야 하고 따라서 좌변도 0보다 커야 한다.

 

그러나 이는 $f(x_{0}+\epsilon) > f(x_{0})$을 의미하므로 f가 $x_{0}$에서 극소점을 가지지 않는다.

 

마찬가지의 논리로 $f'(x_{0}) < 0$이라 가정하면, 테일러 전개와 위와 유사한 논의에 의해 절댓값이 충분히 작은 $\epsilon < 0$에 대하여 $f(x_{0}+\epsilon) > f(x_{0})$를 의미하고, 따라서 f가 $x_{0}$ 에서 극소점을 가지지 않는다.

 

이제 (i)은 성립하지만 (ii)가 성립하지 않는다 하자; 즉 $f''(x_{0}) <0$이라 가정하자.

 

테일러 전개를 다시 하면

$\frac{f(x_{0}+\epsilon) - f(x_{0})}{\epsilon}$

$= \frac{1}{2} \epsilon f''(x_{0}) + \frac{O(\epsilon^3)}{\epsilon}$

 

따라서

 

$\frac{f(x_{0}+\epsilon) - f(x_{0})}{\epsilon^2}$

 

$=\frac{1}{2} f''(x_{0}) + \frac{O(\epsilon^3)}{\epsilon^2}$

 

 

이제 두번째 항은 $\epsilon \rightarrow 0$에 따라 0으로 수렴하는 반면 $f''(x_{0})$는 음수이므로, 충분히 작은 모든 $\epsilon >0$에 대하여 우변이 음수이고 좌변도 음수이다.

그런데 이는 충분히 작은 모든 $\epsilon >0$에 대해

$f(x_{0} +\epsilon ) - f(x_{0}) < 0$임을 의미하므로, f는 $x_{0}$서 극솟값을 가질 수 없다. $\square$

 

 

정리 1.2 

f가 $x_{0}$에서 단조 극소점을 가지기 위한 충분조건은

$\left(i\right)\ f'\left(x_{0}\right)=0$
$\left(ii\right)\ f''\left(x_{0}\right) > 0$

 

증명.

 

다시 테일러 전개를 사용하면 (i)에 의해

$\frac{f(x_{0}+\epsilon) - f(x_{0})}{\epsilon^2}$

$=\frac{1}{2} f''(x_{0}) + \frac{O(\epsilon^3)}{\epsilon^2}$

 

 

이제 두번째 항은 $\epsilon \rightarrow 0$에 따라 0으로 수렴하는 반면 $f''(x_{0})$는 양수이므로, 충분히 작은 모든 $|{\epsilon}| >0$에 대하여 우변이 양수이고 좌변도 양수이다.

따라서 그러한 모든 $\epsilon$에 대해서 어떤 양수 K가 존재하여,

$f(x_{0} +\epsilon) - f(x_{0}) > K*\epsilon^2 > 0$

따라서

$\exists \delta >0, x_0 - \delta < x < x_0 + \delta \Rightarrow f(x) \geq f(x_{0}), x\neq x_0 \Rightarrow f(x) > f(x_{0})$. $\square$

 

 

마지막으로 예제로 마무리짓고자 한다.

 

문제 1.1 

$f(x) = 2x^{2} - 12x + 25$라 하자.

a. $x_0 = 3$이 정리 1.2의 충분조건들을 만족함을 보이시오.

b. $x_0 = 3$에서 f가 전역적 최솟값을 가짐을 보이시오.

 

풀이.

f는 다항함수이므로 전역적으로 무한번 미분 가능함을 상기하자. 따라서 정리 1.2를 적용할 때 미분 가능성에 따른 제약이 없다.

a. $f(x_0) = 7, f'(x_0) = 0, f''(x_0) = 4$이며 이는 정리 1.2의 충분조건들을 만족함을 확인할 수 있다.

 

b. f를 $x_0 =3$에서 테일러 전개를 하면 모든 $\epsilon>0$에 대하여

$f(x_0 + \epsilon) = f(x_0) + \epsilon f'(x_0) + \frac{1}{2} \epsilon^2 f''(x_0) + O(\epsilon^3)$

 

그런데 f의 2차 테일러 근사다항식

$7 + 2\epsilon^2$은 $f(3 + \epsilon)$과 같음을 (직접 대입으로) 확인할 수 있다.

 

따라서 $f(3+\epsilon) = f(3)+2\epsilon^2 \geq f(3) $임을 확인할 수 있고, f는 x=3에서 전역적 최솟값을 가진다.

 

 

다음 글에서는 다변수 함수의 비제약 최적화를 다룰 예정이다.

* 이 시리즈는 <유클리드 기하 개론>이라는 책을 정리하는 연재글로, 네이버 블로그에서 연재하다가 수식 입력이 불편해서 티스토리로 넘어온 연재입니다. 추후 블로그에 있던 글들을 옮길 예정이나, 일단은 이어 연재할 생각입니다.

블로그 주소는 https://blog.naver.com/inducedsubgraph 입니다.

 

 

오늘은 어제에 이어 합동 공리군으로부터 도출되는 정리들을 살펴본다.

 

Part 1.

삼각형의 SAS 합동이 성립한다.

삼각형의 ASA 합동이 성립한다.

두 변이 같은 이등변삼각형의 밑각은 같다.

직각은 존재한다.

각의 덧셈/뺄셈은 잘 정의된다.

Part 2.

삼각형의 SSS 합동이 성립한다.

각의 합동은 전이적이다.

각의 크기 비교는 내부/외부 비교를 통해서 잘 정의된다.

모든 직각은 합동이다.

Part 3.

삼각형의 한 외각은 자신의 보각이 아닌 다른 어떤 내각보다도 크다.

삼각형의 큰 변의 맞각은 작은 변의 맞각보다 크고, 큰 각의 맞변은 작은 각의 맞변보다 크다.

두 각이 같은 삼각형은 이등변삼각형이다.

모든 선분은 이등분될 수 있다.

 

 

우리가 살펴보는 모든 정리들은 평행선 공리가 성립하지 않는 비유클리드 기하학에서도 성립함에 유의하라.

삼각형의 외각정리로부터 시작한다. 

 

정리 2.6.14 (외각의 정리) 삼각형의 한 외각은 자신의 보각이 아닌 내각보다 크다.

증명.

$ \triangle ABC $에 대해, 점 C에서 시작하며 A로 뻗어가는 반직선의 반대편에 있는 점 A'를 잡는다.

우선 $\angle BCA' > \angle BAC$ 임을 보이고자 한다. 

귀류법을 사용하기 위하여 명제의 결론을 부정하고, $\angle BAC \geq \angle BCA'$ 라고 가정하자. 여기서 모순이 발생한다면 각의 크기 비교의 삼분법에 의하여 원하는 사실인 $\angle BCA' > \angle BAC$을 보일 수 있다.

만약 $\angle BCA' < \angle BAC$이라면, 정의 2.6.3에 의하여 각 BCA' 밖에 있으면서 C에서 방사하는 반직선 l이 존재할 것이고, 이 반직선은 각 BCA의 내부에 있어 선분 AB와 점 D에서 만날 것이다.

이제 삼각형 ACD의 외각 $\angle DCA$ 는 각 A와 크기가 같은데, 이로 인해 모순이 발생함을 보일 것이다.

선분 DC를 연장하여 직선 DC를 만든다. 이제 C에서 출발하여 D의 반대편에 있는 반직선 위의 점 D'을 잡되, 

선분 BD와 선분 CD'가 합동이 되도록 한다.

이제 맞꼭지각은 합동이므로 $\angle BCD' \equiv \angle DBC \equiv \angle A'CD$가 성립한다.

또한 선분 AC는 삼각형 ACD와 삼각형 ACD' 모두의 공통선분이고, 선분 AD와 선분 CD'은 합동이다.

따라서 SAS 합동에 의하여 삼각형 ACD와 삼각형 CAD'은 합동이고, 특히 

 

$\angle CAD' \equiv \angle ACD$

 

그런데 이 각은 각 CAD의 보각이므로, D'은 직선 AD위에 있어야 하고 이는 모순이다 (점 A,C,D는 한 직선 위에 있지 않은 세 점).

 

만약 $\angle BCA' \equiv \angle BAC$라면, D 대신 B를 집어넣으면 위의 논의가 그대로 성립한다.

 

이제 $\angle BCA' > \angle ABC$도 같은 논리를 통해 증명될 수 있다. (선분 AC를 연장하지 않고 선분 BC를 연장하면 점들끼리 명칭을 붙일 때의 대칭성에 의하여 위의 논리가 그대로 성립한다.)

$\square$

 

 

정리 2.6.15 한 삼각형의 큰 변의 맞각은 작은 변의 맞각보다 크고, 또 큰 각의 맞변은 작은 각의 맞변보다 크다.

증명전략.

다음 사실들을 이용한다:

i) 정리 2.6.14.

ii) 선분 AB가 선분 CD보다 '작다'는 것은, 선분 CD 위에 있는 점 E가 존재, 선분 CE와 선분 AB가 합동이 되도록 할 수 있다.

 

증명

(i) 큰 변의 맞각이 작은 변의 맞각보다 크다는 것을 증명하고자 한다.

$\triangle ABC$에 대하여 $AB > BC$ 라고 가정하자.

이제 $\angle C > \angle A$임을 보이고자 한다.

선분의 크기 비교의 정의에 의하여, 점 B에서 방사하고 점 C를 지나는 반직선 위에 점 D를 잡아, 선분 BD와 선분 AB가 합동이 되도록 한다. 이때 점 D는 선분 BC의 밖에 있다.

이제 $\angle ACB$는 $\triangle ACD$의 외각이고 $\angle D$는  $\angle ACB$의 보각이 아니므로 정리 2.6.14에 의하여

$\angle ACB > \angle D$

또한 $\triangle ABD$가 이등변삼각형이므로 $\angle BAD \equiv \angle BDA$

그런데 반직선 AD와 선분 BC의 교점이 없으므로 ($\because$ 반직선 AD와 직선 BC의 교점이 D이고 이는 선분 BC의 밖) 반직선 AD는 $\angle BAC$의 밖에 있고, 정의 2.6.3에 의해

$\angle BAC < \angle BAD$

 

따라서 정리하면

$\angle BAC < \angle BAD \equiv \angle BDA < \angle ACB $.

 

(ii) 이제 역으로 $\angle C > \angle A$ 가 성립하면 $ AB > BC $도 성립함을 보이고자 한다.

귀류법을 사용하기 위해 명제의 결론을 부정하자. 그렇다면 $ AB \equiv BC $ 이거나 $ AB < BC $이고 만약 둘이 합동이라면 이등변삼각형의 성질에 의해 $\angle C \equiv \angle A$이고 삼분법에 의해 이는 전제와 모순된다. 만약 $ AB < BC$이라면 (i) 에 의해 $ \angle C < \angle A$이고 마찬가지로 삼분법에 의해 이는 전제와 모순된다.

$\square$

 

이로써 정리 2.6.1 (이등변삼각형의 두 내각은 합동)의 역이 성립한다:

 

정리 2.6.16 두 각이 합동인 삼각형은 이등변삼각형이다.

(증명은 2.6.15로부터 바로 도출됨.)

 

 

정리 2.6.14와 SAS 합동정리로부터 다음의 확장된 SAS 합동정리가 얻어진다:

 

 

정리 2.6.17 두 삼각형 $\triangle ABC, \triangle A'B'C'$에 대하여 $AB\equiv A'B', \angle A \equiv \angle A', \angle C \equiv \angle C'$이면 $\triangle ABC \equiv \triangle A'B'C'$이다.

증명전략. 이미 삼각형의 ASA 합동정리는 보였으므로, 각 B와 각 B'이 합동임을 보이면 그만이다. 이를 위해 정리 2.6.14를 사용하자.

증명. 귀류법을 사용하여 각 B와 각 B'이 합동이 아니라 하자. 각의 삼분법에 의하여 $\angle B > \angle B'$이거나 $\angle B' > \angle B$인데, 일반성을 잃지 않고 전자가 성립한다 가정하자. 이제 점 B에서 방사하며 점 C가 있는 반평면쪽으로 방사하는 반직선 l을 잡아, 반직선 l과 반직선 BA에 의해 만들어지는 각이 각 B'과 합동이 되도록 할 수 있다.

또한 반직선 l은 선분 AC와 교점을 가지는데 이 교점을 C"이라 하자.

$\triangle ABC" \equiv \triangle A'B'C'$이다 (ASA 합동)

따라서 $\angle AC"B \equiv \angle A'C'B' \equiv \angle ACB$인데, 이는 삼각형의 외각 정리 (2.6.14)에 모순된다. $\square$

 

 

정리 2.6.18 모든 선분은 2등분될 수 있다.

증명. 공리 1.3에 의하여 직선 AB 위에 있지 않은 한 점 C가 있다.

이제 다음이 성립하도록 점 D를 잡는다:

(i) $\angle CAB \equiv \angle ABD $

(ii) $AC \equiv BD$

(iii) 점 C와 점 D는 직선 AB에 의해 나누어지는 두 반평면의 반대편에 있다.

 

C와 D는 반대편 반평면에 있으므로 선분 CD와 직선 AB는 교점을 가진다. 이 점을 E라 하자.

이제 점 E가 선분 AB 위에 있음을 보이고자 한다:

 

귀류법을 사용한다. 명제의 결론을 부정하면, AEB가 아니므로 ABE이거나 BAE인데, 일반성을 잃지 않고 전자라 가정하자.

이제 $  \angle CAE \equiv \angle AED > \angle AED > \angle CAE $가 성립하는데 이는 삼분법에 의해 모순이다.

 

따라서 AEB가 성립한다.

이제 $\triangle ACE \equiv \triangle BDE$임을 보이는 것은 정리 2.6.17 의해 성립한다.

 

 

여기까지는 선분, 각의 합동 공리로부터 삼각형의 합동에 대해 살펴보았다. 이제 합동을 임의의 도형으로 확장한다.

 

 

정의 2.6.6 $A_1 , A_2 , ..., A_n $과 $ B_1, B_2 ,..., B_n$은 각각 평면 $\pi, \pi'$에 배열된 점으로써 임의의 서로 대응되는 선분들이 합동이라 하면, 이 배열된 점들은 서로 합동이라 한다.

또한 합동으로 배열된 이 점들의 각각의 점들 $A_i ,B_i $를 서로 대응되는 점이라 한다.

 

 

정의 2.6.7 유한 개의 점들의 집합을 도형이라 하고, 한 도형의 점들이 한 평면에 있을때 평면도형이라 한다.

두 도형의 대응되는 점들이 쌍으로 순서가 주어지고 대응되는 모든 선분들과 각들이 서로 합동일 때 이 두 도형이 합동이라 한다.

 

 

 

평면과 공간에 대한 일반적인 합동정리들은 다음과 같다(증명은 생략):

 

정리 2.6.20 평면 $\pi $ 상의 도형 (A,B,C,...,L)과 평면 $\pi'$ 상의 도형 (A',B',...,L')은 합동인 평면 도형들이라 하자. P가 $\pi$ 상의 한 점이라면 $\pi'$ 상에서도 (A,B,C,...,L,P)와 (A',...,L',P')가 합동이 되도록 한 점 P'를 찾을 수 있다. 특히 도형이 일직선상에 있지 않은 적어도 세 개의 점이 있다면 P'의 선택은 유일하다.

 

정리 2.6.21 (A,B,C,...,L)과 (A',B',...,L')은 합동인 도형들이고 P가 한 점이라면 한 점 P'을 찾아서 (A,B,...,L,P)와 (A',B',...,L',P')가 합동이 되도록 할 수 있다. 특히 도형이 한 평면에 있지 않은 네 점을 가지고 있다면 P'의 선택은 유일하다.

 

사실 증명하라 하면 잘 못할 것 같다. 삼각형으로 도형을 쪼개는 작업이 들어갈 것 같다는 느낌만 든다. 그냥 그렇구나...합동에 관한 일반적 상식이 평행선 공리 없이도 성립하는구나... 하고 넘어갔다.

 

 

다음 포스팅에서는 드디어 유명한 평행선 공리로 들어간다. 이 공리는 매우 강력해서, 갑자기 전통적인 유클리드 기하학으로 분위기가 확 전환될 것으로 예상한다. 평행선 공리를 이용하여 삼각형 내각 합의 크기, '원'의 존재성, 유일성 등을 증명할 것이다.

+ Recent posts

cs