Caracterización de Funciones Cóncavas y Convexas Alejandro Lugon 20 de agosto de 2010 1. Definiciones y preliminares 1.1. Concavidad Una función: f : S −→ R con dominio S ⊂ Rn convexo, es: Cóncava si para todos x, y ∈ S y λ ∈ [0, 1] se tiene: f ((1 − λ)x + λy) ≥ (1 − λ)f (x) + λf (y) Estrictamente Cóncava si para todos x, y ∈ S, x 6= y y λ ∈]0, 1[ se tiene: f ((1 − λ)x + λy) > (1 − λ)f (x) + λf (y) Convexa si para todos x, y ∈ S y λ ∈ [0, 1] se tiene: f ((1 − λ)x + λy) ≤ (1 − λ)f (x) + λf (y) Estrictamente Convexa si para todos x, y ∈ S, x 6= y y λ ∈]0, 1[ se tiene: f ((1 − λ)x + λy) < (1 − λ)f (x) + λf (y) Todas estas definiciones son relativas al conjunto S, es decir lo apropiado serı́a decir “cóncava/convexa en S”. Toda función estrictamente cóncava es cóncava y toda función estrictamente convexa es convexa. Podemos tener funciones que no sean ni cóncavas ni convexas y funciones que sean cóncavas y convexas, estas ultimas son las funciones afı́n-lineales: f (x) = a · x + b. 1 CVX CCV AFIN STCCV 1.2. STCVX Hessiana Si el dominio S es abierto y la función f es de clase C 2 podemos definir la matriz Hessiana de segundas derivadas: ∂2f ∂x1 ∂xn ∂2f ∂x2 ∂xn ··· ··· .. . .. . ∂2f ∂xn ∂x2 ··· ∂2f ∂xn ∂xn ∂2f ∂x1 ∂x1 ∂2f ∂x1 ∂x2 ∂2f Hf (x) = D f (x) = (x) = ∂xi ∂xj ∂2f ∂x2 ∂x1 ∂2f ∂x2 ∂x2 2 2 .. . ∂2f ∂xn ∂x1 .. . 2 f f la cual es simétrica ( ∂x∂i ∂x = ∂x∂j ∂x ) j i A partir del Hessiano determinamos los menores principales de la siguiente manera. Consideremos un subconjunto no vacı́o cualquiera I ⊂ {1, 2, ..., n} del conjunto de ı́ndices, si consideramos solamente las filas y columnas de Hf (x) con ı́ndices en I y calculamos el determinante, tenemos un menor principal: 2 ∂ f ∆I (x) = ∂xi ∂xj i,j∈I El número de elementos en I es el orden del menor principal. Por lo tanto tenemos tantos menores principales como subconjuntos no vacı́os de {1, 2, ..., n}, es decir 2n − 1. Si consideramos subconjuntos de ı́ndices de la forma I = {1, 2, ..., k} para k = 1, 2, . . . , n tenemos los menores principales dominantes: Dk(x) = 2 ∂ f Dk (x) = ∂xi ∂xj i,j≤k = ∂2f ∂x1 ∂x1 ∂2f ∂x1 ∂x2 ∂2f ∂x2 ∂x1 ∂2f ∂x2 ∂x2 .. . ∂2f ∂xk ∂x1 ··· ∂2f ∂xk ∂x2 ··· .. . .. . ∂2f ∂x1 ∂xk ··· ∂2f ∂xk ∂xk ∂2f ∂x2 ∂xk .. . Por lo tanto tenemos solamente n menores principales dominantes. 1.3. Valores propios Dada una matriz cuadrada A un valor propio (real) de A es un λ ∈ R tal que existe v ∈ Rn , v 6= 0 que cumple: Av = λv 2 Una matriz de orden n × n tiene a lo más n valores propios (reales). Si la matriz es simétrica, como la Hessiana, tiene exactamente n valores propios (reales). 1.4. Matrices Definidas Una matriz simétrica A es: Definida negativa si para todo x 6= 0 se tiene: xT Ax < 0. Semidefinida negativa si para todo x se tiene: xT Ax ≤ 0. Definida positiva si para todo x 6= 0 se tiene: xT Ax > 0. Semidefinida positiva si para todo x se tiene: xT Ax ≥ 0. Con estas definiciones toda matriz definida negativa es semidefinida negativa y toda matriz definida positiva es semidefinida positiva. Podemos tener matrices indefinidas (que no son semidefinidas positivas ni negativas) y la única matriz que es semidefinida positiva y negativa a la vez es la matriz nula. 2. Caracterización para n general Proposición 1 Dada una función f : S −→ R de clase C 2 con dominio S ⊂ Rn convexo y abierto. Sea Hf su Hessiana. Son equivalentes: 1. f es cóncava en S. 2. Hf es semidefinida negativa en todo punto de S 3. Hf tiene todos sus valores propios no positivos (≤ 0) en todo punto de S 4. Todos los menores principales de Hf en todo punto de S cumplen (−1)#(I) ∆I ≥ 0 Proposición 2 Dada una función f : S −→ R de clase C 2 con dominio S ⊂ Rn convexo y abierto. Sea Hf su Hessiana. Son equivalentes: 1. f es convexa en S. 2. Hf es semidefinida positiva en todo punto de S 3. Hf tiene todos sus valores propios no negativos (≥ 0) en todo punto de S 4. Todos los menores principales de Hf en todo punto de S cumplen ∆I ≥ 0 Proposición 3 Dada una función f : S −→ R de clase C 2 con dominio S ⊂ Rn convexo y abierto. Sea Hf su Hessiana. Son equivalentes: 3 1. Hf es definida negativa en todo punto de S 2. Hf tiene todos sus valores propios negativos (< 0) en todo punto de S 3. Todos los menores principales dominantes de Hf en todo punto de S cumplen (−1)k Dk > 0 Cualquiera de estas propiedades implica (pero no es equivalente a) que f es estrictamente cóncava en S. Proposición 4 Dada una función f : S −→ R de clase C 2 con dominio S ⊂ Rn convexo y abierto. Sea Hf su Hessiana. Son equivalentes: 1. Hf es definida positiva en todo punto de S 2. Hf tiene todos sus valores propios positivos (> 0) en todo punto de S 3. Todos los menores principales dominantes de Hf en todo punto de S cumplen Dk > 0 Cualquiera de estas propiedades implica (pero no es equivalente a) que f es estrictamente convexa en S. De manera esquemática: ⇔ Hsdn f ccv ⇑ f st − ccv ⇐ ⇔ (−1)#(I) ∆I ≥ 0 ⇑ ⇑ Hdn (−1) Dk > 0 k ⇔ ⇔ λi ≤ 0 ⇑ ⇔ λi < 0 y f cvx ⇔ ⇑ f st − cvx ⇐ Hsdp ⇔ ⇑ Hdp ∆I ≥ 0 ⇑ ⇔ Dk > 0 4 ⇔ λi ≥ 0 ⇑ ⇔ λi > 0