for textmining

Convex Functions

|

이번 글에서는 Convex Function(볼록함수)와 관련된 개념들을 살펴보도록 하겠습니다. 이 글은 미국 카네기멜런대학 강의를 기본으로 하되 저희 연구실의 김해동 석사과정이 만든 자료를 정리했음을 먼저 밝힙니다. 영문 위키피디아 또한 참고하였습니다. 그럼 시작하겠습니다.

convex function

convex function이란 임의의 두 점 $x$, $y$와 $[0,1]$ 사이의 값 $t$에 대해 다음이 항상 성립하는 함수 $f$를 가리킵니다.

이를 그림으로 도시하면 다음과 같습니다.

convex function 유형

strict convex란 임의의 두 점 $x$, $y$와 $[0,1]$ 사이의 값 $t$에 대해 다음이 항상 성립하는 함수 $f$를 가리킵니다. 다시 말해 $f$는 convex function이면서, 선형함수(linear function)보다 큰 곡률을 가집니다. (등호는 $f$가 선형함수일 때 성립하므로)

strong convexconvex function 가운데 0이 아닌 양수 $m$에 대해 다음이 항상 성립하는 함수 $f$를 가리킵니다. 다시 말해 $f$는 적어도 quadratic function만큼 convex하다는 걸 뜻합니다.

따라서 다음과 같은 포함관계가 성립합니다.

  • strong convexstrict convexconvex

concave function(오목함수)convex function에 음수를 취한 함수를 가리킵니다. 따라서 우리는 convex function에 집중해서 분석합니다.

convex function의 예시

convex function의 대표적 예시는 다음과 같습니다.

convexity를 보존하는 연산

convex function에 대해 다음 연산은 convexity를 보존합니다.

convex function의 특성

convex function은 다음 세 가지 중요한 특성이 있습니다. 다음과 같습니다.

이 가운데 second-order characterization을 활용해 소프트맥스 함수가 convex function임을 증명해 보겠습니다. 다음과 같습니다.

Comments