지난 연재글에서 언급한 대로, 이번 글은 모서리 조건이 실제 변분법 문제에서 사용되는 사례를 살펴볼 것이고, 이어서 Transversality condition (필자가 이에 대해 적절한 번역어를 찾지 못했다. 횡단성 조건이라고 하는 곳이 있었는데 이것이 과연 널리 쓰이는 표현인지 의구심이 들었다.)을 소개하고 유도할 것이다. Transversality condition을 이용한 사례는 다음 연재글로 넘길 예정이다.
이 글의 순서는 다음과 같다:
(a) 모서리 조건을 활용하여 변분법 문제를 풀어본다.
(b) Transversality condition을 소개하고 유도한다.
(a) 모서리 조건을 활용하여 변분법 문제를 풀어본다.
지난 글에서 유도한 모서리 조건을 요약하자면 다음과 같다:
함수 $y_{0}$가 fixed end-point problem의 해라고 가정하자. 이제 $x$에 대한 두 함수
$$f_{y'}(x,y_{0}, y_{0}'), f(x,y_{0},y_{0}') - y_{0}' f_{y'}(x,y_{0},y_{0}')$$는 모든 점에서 좌극한과 우극한이 일치한다.
(예1) 우리가 풀어볼 문제는
$$ \min I(y) = \int_{0}^{1} (y'^{2} -1)^{2} dx \\ s.t. \space y(0)=0, y(1)=\frac{1}{2} $$
이다.
우리가 고려하는 $y(x)$는 조각적 $C^{1}$급의 함수들로 $y(0) = 0, y(1) = 1$인 함수들이다.
그렇다면 이제 이 문제의 해는 적분 형태의 오일러-라그랑주 등식을 만족해야 한다; 어떤 실수 $c \in \mathbb{R}$가 존재하여
$$ f_{y'} (x, y(x), y'(x)) = \int_{a}^{x} f_{y} (x, y(x), y'(x)) dx + c$$
가 성립한다.
그런데 $f(x,y,y') = (y'^{2}-1)^{2}$이므로, $f_{y} = 0, f_{y'} = 2(y'^{2}-1)y'$임을 안다.
따라서 어떤 실수 $c \in \mathbb{R}$가 존재하여,
$$ 4y'(y'^{2} -1) = c$$
가 모든 $x$에 대해 성립한다.
이 문제는 $y' = \pm 1$가 모서리가 아닌 모든 $x \in [a,b]$서 성립한다면 $I(y) = 0$이 달성되며,
실제로 어떤 해 $$y_{0} (x) = \begin{cases} x \space 0 \leq x \leq \frac{3}{4} \\ -(x-1)+\frac{1}{2} \space \frac{3}{4} \leq x \leq 1 \end{cases}$$가 존재한다. (이 해가 조각적 $C^{1}$급임을 보이는 것은 쉽다. 어떻게 이 해를 생각해내냐는 질문에 대해서는, $y' = \pm 1$이면 최솟값이 달성되니까 $y' = 1$로 하고, $y(1) = \frac{1}{2}$를 일치시키기 위해서 한번 꺾는다고 생각하면 될 것 같다.)
따라서 $c = 0$이 성립해야 한다.
이러면 모서리가 아닌 점에서 $y' = 0, y' = \pm 1$가 모두 성립할 수 있다.
그런데 두번째 모서리 조건에 의해
$$ f - y' f_{y'} = ((y')^{2} -1)^{2} - 4(y')^{2}((y')^{2}-1) $$
가 모든 점에서 좌극한, 우극한이 일치해야 한다.
만약 어떤 모서리점 $d \in (a,b)$가 존재하여 $y'(d-) = 1, y'(d+) = 0$이라고 하면 $ f - y'f_{y'}$가 $d$서 불연속이 될 것이고, $y'(d-) = -1, y'(d+) = 0$인 경우도 마찬가지일 것이다.
따라서, 해가 되는 모든 함수 $y_{0}$는 $y_{0}' \equiv 0$이거나, $y_{0}' = \pm 1$ 사이에서만 불연속이 일어날 수 있다 (이 경우 $f - y'f_{y'}$의 양 극한이 모두 0이 되므로 문제가 없다).
그런데 $y_{0}' \equiv 0$은 끝 조건을 만족하지 않으므로 불가능하고, 가능한 해들은 모두 $y_{0} ' = \pm 1$ 사이에서 불연속이 일어나는 해들이다.
이러한 해들이 무한히 많음은 쉽게 알 수 있다. 다른 해의 예로는
$$y_{0}(x) = \begin{cases} -x \space 0 \leq x \leq \frac{1}{4} \\ (x-1)+\frac{1}{2} \space \frac{1}{4} \leq x \leq 1 \end{cases}$$
가 있다.
(예2) 우리가 풀어볼 문제는
$$\min J(y) = \int_{0}^{b} ((y')^{2} - y^{2}) dx \\ \space s.t. y(0) = y(b) = 0$$
이다.
여기서 $b > \pi$라 가정한다.
#주석.
이러한 형태의 범함수 $J$는 이차형식이라고 불리는데, 사실 이전에 다루었어야 하는 내용인데 필자가 제대로 이해를 하지 못해서 넘어갔었다. 이 기회를 빌어 여기서 간단히 다루고자 한다.
정의. (쌍선형 형식)
벡터공간 $V$에 대해서 $B: V \times V \rightarrow \mathbb{R}$가 각 입력항에 대해서 선형이면 이를 쌍선형 형식이라 한다.
정의. (이차형식)
어떤 범함수 $F: V \rightarrow \mathbb{R}$에 대해서 쌍선형 형식 $B$가 존재하여 $F(v) = B(v,v)$가 성립하면 $F$를 이차형식이라 한다.
명제.
J는 이차형식이다.
증명.
(조각적) $C^{1}$급의 함수들은 벡터공간을 이룬다는 것은 선형대수학의 쉬운 결과이다.
이제 $K(y,z) = \int_{a}^{b} (y'z' - yz) dx$라 하면 $K$가 쌍선형 형식임은 쉽게 알 수 있고, $K(y,y) = \int_{a}^{b} ((y')^{2} - y^{2}) dx = J(y)$라는 사실도 쉽게 도출된다.
이제 $z$를 $y$의 변화분이라 할 때, 다음의 결과는 일변수함수의 경우와 유사한 형태를 띤다:
명제.
$\lim_{\epsilon \rightarrow 0} \frac{J(y+\epsilon z) - J(y)}{\epsilon} = 2K(y,z)$
증명.
이차형식의 정의에 의해 $J(y+\epsilon z) = K(y + \epsilon z, y + \epsilon z) = K(y,y) + 2\epsilon K(y,z) + \epsilon^{2} K(z,z)$이고, 이 식을 바탕으로
$$\lim_{\epsilon \rightarrow 0} \frac{J(y+\epsilon z) - J(y)}{\epsilon} \\ = \lim_{\epsilon \rightarrow 0} 2K(y,z) + \epsilon K(z,z) \\ = 2K(y,z)$$
임을 안다.
이차형식의 문제들은 범함수 최적화에서 자주 등장하며, 특히 이계조건과 관련이 깊다고 한다. (이 부분은 추후 이해도가 높아지면 보충할 예정이다.)
#주석 끝.
이 문제의 최솟값이 만약 0보다 작다면, 즉 $\exists y_{0}, J(y_{0}) < 0$, $J(2y_{0}) = 4J(y_{0}) < J(y_{0})$이므로 최솟값이 없을 것이다. 역으로 최솟값이 0보다 크다면 $\frac{1}{2}$를 곱하여 더 작게 만들 수 있다.
따라서 만약 최솟값이 존재한다면 그 값은 0이어야 한다.
이제 다음의 함수
$$\bar{y}_{0} (x) = \begin{cases} \sin x \space 0 \leq x \leq \pi \\ 0 \space \pi < x \leq b \end{cases}$$가 과연 임계 조건을 만족하냐가 문제된다.
- 이 함수가 오일러-라그랑주 등식을 만족하는가?
=> $f_{y} = -2y, f_{y'} = 2y'$이다. 모서리점 $\pi$를 제외하고 모든 점에서 $y$가 $C^{2}$급이므로 오일러-라그랑주 등식을 이용하면
$ \frac{d}{dx} f_{y'} = -2y'' \\ f_{y} = -2y$이다.
그런데
$$\bar{y}_{0} (x) = \begin{cases} \sin x \space 0 \leq x \leq \pi \\ 0 \space \pi < x \leq b \end{cases}$$
가 미분방정식
$$ 2y'' = -2y$$
를 모서리점을 제외하고 모두 만족함을 확인할 수 있다.
- 이 함수가 모서리 조건을 만족하는가?
=> $f_{y'} = 2y'$는 모든 점 $x \in (0, b)$서 좌극한과 우극한이 일치하므로 $x = \pi$서도 좌극한과 우극한이 일치한다.
그런데 $\bar{y}_{0}'(\pi -) = -1, \bar{y}_{0} '(\pi +) = 0$이므로 우리가 생각한 함수 $\bar{y}_{0}$는 임계점 조건들을 만족하지 못한다.
- 그럼 $\int_{0}^{b} ((y')^{2}-y^{2}) dx = 0$인 다른 해는 없는가?
$y(0) = 0, y(b) = 0$과 오일러-라그랑주 등식을 조각적으로 만족하는 해는 위에서 살펴본 $\bar{y}_{0}$뿐임을 쉽게 확인할 수 있다. 따라서 이 문제 자체가 해를 가지지 않는다는 사실을 추론할 수 있다.
(b) Transversality condition을 소개하고 유도한다.
일반적으로 Transversality condition은 경계조건 $y(a) = A, y(b) = B$가 완전하게 주어지지 않은 경우에 사용한다.
특히 다음의 두 가지가 자주 등장한다:
(i) 끝점의 $x$좌표 $a,b$는 주어져 있지만 $A,B$는 주어지지 않은 경우.
(ii) 끝점이 주어지지 않고, 대신에 $y(x)$가 어떤 곡선 $y = \psi (x), y = \phi (x)$와 교점을 가져야 한다고 주어지는 경우.
우선 (i)의 경우를 살펴본다. 편의를 위하여 $a, y(a) = A, b$는 주어져 있지만 $y(b) = B$가 주어져 있지 않다고 하자. 이제 우리가 풀고자 하는 문제는
$$\min I(y) = \int_{a}^{b} f(x,y,y')dx \\ s.t. \space y(a) = A, b \space given$$
사실 이 경우 기본적인 아이디어는 변분법의 아이디어와 같다. 다만 우리가 고려하는 변화분들의 함수가
$$\mathcal{Z}_{a} := \{y \in \mathcal{Y} | y(a) = 0 \}$$ 로 $\mathcal{Z}$와 비교할 때 $y(b) = 0$의 조건이 사라진 것을 확인할 수 있다.
이제 $y_{0} (x)$가 문제의 해라면, 임의의 $z \in \mathcal{Z}_{a}$에 대해서 $F(\epsilon) := I(y+ \epsilon)$는 일변수 함수이고 미분가능하므로, $F'(0) = 0$을 만족해야 한다.
이전에 했던 적분 형태의 오일러-라그랑주 등식 유도를 상기하면
$$ 0 = \int_{a}^{b} (f_{y}z + f_{y'} z') dx \\ = \int_{a}^{b} [- \int_{a}^{x} f_{y} ds + f_{y'}]z' dx + [z(x) \int_{a}^{x} f_{y} ds]_{a}^{b}$$
이제 $z(b) = 0$인 어떤 $z \in \mathcal{Z}_{a}$를 택하면 적분형태의 오일러-라그랑주 등식을 유도할 수 있다.
따라서 이러한 경우에도 상수 $c$ 가 존재하여 $\int_{a}^{x} f_{y} ds + c= f_{y'}$가 성립한다.
이제 이 등식을 다시 넣으면
$$ \int_{a}^{b} cz' dx + z(b) \int_{a}^{b} f_{y}ds \\ = z(b) [\int_{a}^{b} f_{y}ds + c] \\ = 0$$
이 성립해야 한다.
그런데 $c + \int_{a}^{b} f_{y} ds = f_{y'}(b, y(b), y'(b))$이고 $z(b)$가 임의의 수일 수 있으므로
$f_{y'}(b, y_{0}(b), y_{0}' (b)) = 0 ...(1)$을 도출한다. (1)은 Transversality condition이다.
이제 (ii)의 경우를 살펴본다.
(ii)의 경우 풀어야 하는 문제는, 어떤 곡선 $\phi \in C^{1} (-\infty, \infty)$에 대해서
$$ \min I(y) = \int_{a}^{b} f(x, y, y')dx \\ s.t \space y(a) = A, y(b) = \phi (b)$$
이다.
이 경우 $b$가 상수로 주어지는 것이 아니라, $y$의 끝점이 (뭔지는 모르지만) 곡선 $\phi$ 위에 있어야 함을 의미한다.
이제 우리가 움직이는 방향은 명백히 곡선 $\phi$ 위여야 할 것이다.
이제 $y_{0} : [a,b] \rightarrow \mathbb{R}$이 위의 문제의 해라고 가정하자. 이 경우 $b$는 어떤 수로 주어짐에 유의하라.
또한 $x > b$에 대해 $y_{0}(x) := y_{0} (b) + y_{0}'(b-) (x - b)$라 정의하자.
마지막으로 $y_{0}'(b) \neq \phi ' (b)$라 가정하자.
이제 이전과 유사하게 변화분들의 집합은 $\mathcal{Z}_{a}' := \{ y \space PWS \space in \space [a, \infty) | y(a) = 0 \}$로 정의한다. 마지막으로 일변수함수를 정의하기에 앞서 다음의 비선형 방정식 체계을 만족하도록 $\Delta (\epsilon)$을 정의한다:
$$ (i) \space \Delta (0) = 0 \\ (ii) \space \phi (b + \Delta (\epsilon)) = y_{0} (b + \Delta (\epsilon)) + \epsilon z (b + \Delta(\epsilon)) $$
이제 음함수 정리에 의해서 $\Delta (\epsilon)$이라는 함수가 $\epsilon = 0$의 근방에서 존재한다는 사실을 안다. 또한 $\Delta (\epsilon)$은 $\epsilon = 0$의 근방서 미분가능해야 할 것이다.
이제 $\phi ' (b) \Delta (0) = y_{0} ' (b) \Delta'(0) + z(b)$이므로
$$ \Delta ' (0) = \frac{z(b)}{\phi '(b) - y_{0} ' (b)}$$
이다.
이제 우리는 일변수함수를 정의할 준비가 되어 있다:
0 근방의 모든 $\epsilon$에 대해서 $y_{0} + \epsilon z$가 경계점 조건을 만족하는 함수이고, 이 경우 범함수의 값은
$$ \int_{a}^{b+\Delta (\epsilon)} f(x, y_{0} + \epsilon z, y_{0} ' + \epsilon z') dx$$
이다.
이제 일변수 함수 $F(\epsilon) := \int_{a}^{b+\Delta (\epsilon)} f(x, y_{0} + \epsilon z, y_{0} ' + \epsilon z') dx$로 정의하면 $F'(0) = 0$이 성립해야 한다. 그런데
$$ F'(0) = \Delta '(0) f(b,y_{0}(b), y_{0}'(b)) + \int_{a}^{b} (f_{y}z + f_{y'}z')dx \\ = \frac{z(b)}{\phi '(b) - y_{0}'(b)} f(b,y_{0}(b), y_{0}'(b)) + \int_{a}^{b} [ - \int_{a}^{x} f_{y} ds + f_{y'}] z' dx + z(b) \int_{a}^{b} f_{y}ds$$
이다.
이제 $z(a)=z(b)=0$인 $z$를 선택하면 적분 형태의 오일러-라그랑주 등식이 성립함을 안다. 이를 다시 대입하면
$$ 0 = \frac{z(b)}{\phi'(b)-y_{0}'(b)} f(b,y_{0}(b), y_{0}'(b)) + z(b) [c + \int_{a}^{b} f_{y} dx] \\ = \frac{z(b)}{\phi'(b) - y_{0}'(b)} f(b,y_{0}(b), y_{0}'(b)) + z(b) f_{y'}(b, y_{0}(b), y_{0}'(b))$$이다. 이제 $z(b)$는 임의의 값을 취할 수 있으므로
$$ f(b,y_{0}(b), y_{0}'(b)) + (\phi'(b) - y_{0}'(b)) f_{y'}(b, y_{0}(b), y_{0}'(b)) = 0 ...(2)$$
가 성립한다. (2)는 Transversality condition이다.
이상으로 우리는 Boundary condition의 연습문제와 Transversality condition의 소개, 유도를 마쳤다.
다음 연재글에서는 Transversality condition을 이용한 문제를 해결하고, strong minimum / weak minimum의 개념을 소개하고자 한다. 이를 위해서 함수 공간에서의 거리 개념이 중요하게 사용될 것이다.
'수학 (2022-2) > 최적화' 카테고리의 다른 글
최적화 - 2.4 추가적인 필요조건 (Part 2) (0) | 2022.08.13 |
---|---|
최적화 - 2.4 추가적인 필요조건 (Part 1) (0) | 2022.08.11 |
최적화 - 2.3 임계점 조건 (Part 1 - 모서리 조건) (0) | 2022.08.07 |
최적화 - 2.2 오일러-라그랑주 등식 (0) | 2022.08.04 |
최적화 - 2.1 변분법 소개 및 예제 (0) | 2022.08.02 |