Máster en Estadı́stica Aplicada Departamento de Estadı́stica e Investigación Operativa Universidad de Granada Trabajo fin de máster Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo José Antonio Anguita Izquierdo Granada, septiembre de 2015 Agradezco muy especialmente al Dr. Francisco de Asís Torres Ruiz, tutor de este trabajo, por su guía, tiempo y dedicación. También a mi familia por su paciencia Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Contenido Introducción ...............................................................................................................................................2 Capítulo 1. Estudio general del proceso de difusión lognormal con factores exógenos ...........................5 1.1. Definición de proceso de difusión ..............................................................................................5 1.2. Proceso de difusión lognormal no homogéneo .........................................................................7 1.3. El proceso a partir de la ecuación diferencial estocástica .........................................................8 1.4. El proceso a partir de las ecuaciones de Kolmogorov............................................................. 10 1.5. Características del proceso ..................................................................................................... 12 Capítulo 2. Curvas de crecimiento ......................................................................................................... 15 Capítulo 3. Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo .... 24 3.1. Proceso de difusión tipo Gompertz.............................................................................................. 25 3.2. Proceso de difusión tipo von Bertalanffy ..................................................................................... 27 3.3. Proceso de difusión tipo Richards ................................................................................................ 30 3.4. Proceso de difusión tipo logístico ................................................................................................ 32 Capítulo 4. Simulación de los procesos ................................................................................................... 35 Capítulo 5. Inferencia en los procesos .................................................................................................... 40 5.1. Planteamiento general ................................................................................................................. 40 5.2. Inferencia en el proceso lognormal no homogéneo .................................................................... 41 5.2.1. Inferencia en el proceso tipo Gompertz ............................................................................... 43 5.2.2. Inferencia en el proceso tipo logístico .................................................................................. 45 5.2.3. Inferencia en el proceso tipo Bertalanffy .............................................................................. 46 5.2.4. Inferencia en el proceso tipo Richards .................................................................................. 49 5.3. Aspectos sobre procedimientos SA y VNS ................................................................................... 51 5.3.1 Acotación del espacio paramétrico ........................................................................................ 52 5.4. Estimación de los parámetros para el caso Bertalanffy ............................................................... 57 ANEXO A. Código R. Simulación de las trayectorias ................................................................................ 60 ANEXO B. Código R. Estimación de parámetros...................................................................................... 63 Bibliografía .............................................................................................................................................. 76 José Antonio Anguita Izquierdo Página 1 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Introducción La modelización y estudio de fenómenos asociados a sistemas dinámicos, en particular de crecimiento, ha sido objeto de análisis desde hace muchísimo tiempo en diversos campos de aplicación, habiendo experimentado un gran auge en las últimas décadas. El motivo principal para ello radica en la necesidad de comprender los mecanismos de evolución de los sistemas con el fin de dar una explicación a su comportamiento, permitiendo predecir el mismo sin perder de vista la posible inclusión de influencias ajenas a las variables en estudio que permitan alterar dicho comportamiento y, con ello, tener la posibilidad de controlar externamente la evolución del fenómeno en consideración. Tradicionalmente los modelos empleados para estos fines han sido determinísticos, es decir, no toman en cuenta las fluctuaciones o perturbaciones que pudieran existir en el sistema considerado, y surgieron a partir de la modelización mediante ecuaciones diferenciales ordinarias cuyas soluciones son curvas que describen distintos tipos de esquemas de crecimiento. Entre estos modelos podemos citar el exponencial, asociado al modelo malthusiano, así como el logístico y el gompertziano, relacionados con crecimientos de tipo sigmoidal. Aunque estos modelos son los más extensamente empleados (de hecho fueron los primeros que surgieron en este ámbito), posteriormente han ido apareciendo otros muchos, entre los que podemos citar el modelo de Von Bertalanffy, el de Richards, monomolecular, Blumberg, Weibull, doble sigmoidal…, cada uno de los cuales presenta alguna particularidad que les hace más propicio para estudiar determinados esquemas de crecimiento. En este trabajo, trabajaremos cuatro de estos modelos: Gompertz, logístico, Bertalanffy y Richards, todos relacionados con un crecimiento de tipo sigmoidal y con un único punto de inflexión. Las perturbaciones antes mencionadas, pueden provenir de múltiples factores, que no siempre son cuantificables o incluso pueden ser desconocidos. Como indica Li et al. (2011), "los ruidos son muy abundantes en la naturaleza y la sociedad humana; por ejemplo, las fluctuaciones ambientales, la falta de precisión de las mediciones. En cualquier caso, uno tiene que lidiar con los efectos de la aleatoriedad en el modelo”. Por esta razón, en las últimas décadas, el objetivo de la formulación del modelo se ha centrado en modificar la ecuación diferencial ordinaria asociada al modelo determinista, introduciendo un elemento aleatorio, llamado ruido blanco, para obtener modelos estocásticos, en concreto, procesos de difusión, como solución de las ecuaciones diferenciales estocásticas asociadas. El uso de estos modelos estocásticos no sólo proporciona una explicación más realista de las variables en estudio, sino que también permite estudiar otras características importantes, por ejemplo, la inferencia, los tiempos de primer paso y sus problemas relacionados. En concreto, en este trabajo, nos hemos centrado en el proceso de difusión lognormal asociado al modelo de Malthus, que ha sido usado frecuentemente como modelo probabilístico en numerosos campos científicos donde la variable bajo consideración muestra una tendencia exponencial. La distribución lognormal y los procesos de difusión, se han utilizado en particular en la modelización de fenómenos de crecimiento en la Ecología (ver Capocelli y Ricciardi [2], Ricciardi [25]) entre otros), en José Antonio Anguita Izquierdo Página 2 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Geología, Biología, Medicina, etc. Una revisión de un gran número de aplicaciones puede verse, por ejemplo, en Crow y Shimizu [5]. Los procesos de difusión de tipo lognormal, por otra parte, como modelos dinámicos estocásticos, han sido también utilizados en la modelización en Economía y Finanzas para modelar variables dinámicas (Cox y Ross [4], Merton [22], Markus y Shaked [21]). La versión no homogénea del proceso permite introducir factores exógenos al sistema con el fin de dar una explicación del comportamiento de la variable estudiada por la difusión (variable endógena) en términos de dichas variables externas. Normalmente, la vía de introducir variables externas en el modelo es a través de una función h dependiente del tiempo que sea continua en el intervalo donde el proceso sea observado. Este proceso ha sido ampliamente estudiado desde el punto de vista de la inferencia estadística, en particular la basada en muestreo discreto, así como de los tiempos de primer paso y sus problemas asociados, siendo aplicado en diversos campos (ver Gutiérrez et al. [8], [9], [10], [11], [12], [14], [15]). En el presente trabajo, vamos a considerar el proceso de difusión lognormal no homogéneo (también conocido como proceso de difusión lognormal con factores exógenos) como una manera de generar modelos de difusión estocásticos que nos permitan modelizar el comportamiento de curvas de crecimiento, centrándonos en las mencionadas anteriormente. Para ello, se han establecido las condiciones generales y posteriormente se han aplicado a cada caso concreto. El proceso lognormal no homogéneo se define como un proceso de difusión {𝑋(𝑡); 𝑡0 ≤ 𝑡 ≤ 𝑇} que toma valores en ℝ+ , con momentos infinitesimales 𝐴1 (𝑥, 𝑡) = ℎ(𝑡)𝑥 y 𝐴2 (𝑥) = 𝜎 2 𝑥 2 , donde ℎ(𝑡) es una función continua en [𝑡0 , 𝑇], 𝜎 > 0, y con distribución inicial degenerada o lognormal. Notemos que este proceso no homogéneo generaliza la versión homogénea, en la cual ℎ(𝑡) = 𝑚 ∈ ℝ. Como mencionamos anteriormente, una de las principales razones para incluir la función ℎ(𝑡) en la media infinitesimal del proceso, es que nos permite representar influencias externas (factores exógenos) dependientes del tiempo, sobre el comportamiento de la variable en estudio (variable endógena). Estas influencias pueden expresarse en términos de un conjunto de variables externas cuyo comportamiento es conocido y contribuyen a la descripción y al control de la evolución del proceso. Por ejemplo, es habitual considerar dicha función como una combinación lineal de funciones continuas 𝑞 llamadas factores, ℎ(𝑡) = 𝛽0 + ∑𝑗=1 𝐹𝑗 (𝑡), con 𝛽𝑗 ∈ ℝ, y 𝐹𝑗 funciones continuas en [𝑡0 , 𝑇], 𝑗 = 1, … , 𝑞. Este caso ha sido ampliamente estudiado en relación con algunos aspectos sobre la inferencia y los tiempos de primer paso (ver Torres-Ruiz, F. [32]; Gutiérrez et al. [8], [9], [11], etc...) y se han utilizado para modelar variables dependientes del tiempo en varios campos. Por ejemplo, Gutiérrez et al. ([14]) construyeron un proceso de difusión lognormal no homogéneo para ajustar el producto interior bruto de España al considerar como variables exógenas, el gasto del consumidor y la formación de capital fijo bruto doméstico. Sin embargo, otras veces, las variables externas no están disponibles o hay situaciones en las que sus expresiones funcionales no se conocen. En tal caso Gutiérrez et al. [17] sugieren aproximar los José Antonio Anguita Izquierdo Página 3 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑘) 𝑘) 𝑘) factores exógenos por medio de funciones polinómicas, es decir, ℎ(𝑡) = ∑𝑘𝑗=0 𝛽𝑗 𝑃𝑗 (𝑡), donde 𝑃𝑗 𝑘) 𝑘) son polinomios de grado k, (𝑃0 = 1) y 𝛽𝑗 ∈ ℝ, 𝑗 = 1, … , 𝑘 Por otro lado, teniendo en cuenta determinadas funciones concretas de ℎ(𝑡), se pueden definir otros procesos de difusión, como casos particulares del proceso lognormal no homogéneo, asociados a expresiones alternativas de las curvas de crecimiento que aquí trataremos. En este sentido, podemos citar un proceso de tipo Gompertz (introducido en [16] aplicado al estudio del crecimiento de conejos), una generalización del proceso von Bertalanffy (introducido en [28], con una aplicación para el crecimiento de especies de peces y usado en [26] para el estudio de calibrado de frutas), un proceso tipo logístico (introducido en [29], con una aplicación para el crecimiento de un cultivo de microorganismos) y una de tipo Richards (ver [30]). En el capítulo 1 se realiza una breve introducción de los procesos de difusión en general, para posteriormente pasar a centrarnos en nuestro proceso lognormal no homogéneo. Dicho proceso se presenta desde dos puntos de vista; a partir de las ecuaciones de Fokker-Planck y Kolmogorov, a partir de ecuaciones diferenciales estocásticas, y se realiza un estudio general y descriptivo de sus principales características. En el siguiente capítulo, se estudian las curvas de crecimiento con las que vamos a trabajar en este documento, dando nuevas reparametrizaciones de sus expresiones originales para hacer depender su cota superior de un valor inicial (lo cual puede ser de utilidad para estudiar el comportamiento de individuos particulares de la población en estudio), así como sus principales características y gráficas. Se verá que todas estas curvas obedecen una determinada ecuación diferencial ordinaria común, lo que permitirá, en el capítulo 3, utilizar nuestro proceso de difusión lognormal para modelizar dichas curvas pues su función media se adapta a cada uno de sus comportamientos. A continuación, en el capítulo 4, se simulan los procesos apoyándonos en el hecho de que dichos procesos resultantes son transformaciones del proceso de Wiener y dándose sus respectivos gráficos. En el Anexo A se presenta el código en R para simular las trayectorias y realizar dichos gráficos. Por último, se trata el problema de la estimación máxima verosimilitud de los parámetros. Hacemos notar que, en general, los sistemas que aparecen son bastante complejos y a la hora de resolverlos surgen problemas con algunos procedimientos numéricos, por lo que se sugieren el uso de procedimientos de optimización estocásticos tales como Simulated Annealing o Variable Neighborhood Search. Para la aplicación eficiente de estos procedimientos, se presentan algunas estrategias con el fin de acotar los espacios paramétricos asociados. Para concluir este capítulo, se lleva a cabo la estimación para el caso Bertalanffy, en la misma línea que se ha hecho para la curva Richards en 2015 (véase [30]). Todo ello programado en R, como se puede observar en el Anexo B. José Antonio Anguita Izquierdo Página 4 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Capítulo 1. Estudio general del proceso de difusión lognormal con factores exógenos 1.1. Definición de proceso de difusión Llamamos proceso de difusión a un proceso de Markov {𝑋(𝑡): 𝑡0 ≤ 𝑡 ≤ 𝑇} en tiempo continuo y con espacio de estados continuo, que cumple: - Tiene trayectorias continuas casi seguro - ∀𝜀 > 0, ∀𝑥, veri�ica: a) 1 limℎ→0 ∫|𝑦−𝑥|>𝜀 𝐹(𝑑𝑦, 𝑡 + ℎ|𝑥, 𝑡) = 0, es decir, grandes cambios en un corto espacio de tiempo ℎ son poco probables. Además esta condición implica la convergencia en probabilidad. b) Existen los momentos truncados de los incrementos condicionados 1 𝐴1 (𝑥, 𝑡) = lim � (𝑦 − 𝑥)𝐹(𝑑𝑦, 𝑡 + ℎ|𝑥, 𝑡) ℎ→0 ℎ |𝑦−𝑥|≤𝜀 1 (𝑦 − 𝑥)2 𝐹(𝑑𝑦, 𝑡 + ℎ|𝑥, 𝑡) 𝐴2 (𝑥, 𝑡) = lim � ℎ→0 ℎ |𝑦−𝑥|≤𝜀 Usamos estos momentos truncados, pues tenemos asegurado que siempre existen, frente a los momentos infinitesimales media y varianza que no siempre existen. Además los momentos truncados de orden superior a dos, en general, son nulos, pues se prueba que para r > 2 1 lim � ℎ→0 ℎ |𝑦−𝑥|≤𝜀 |𝑦 − 𝑥|𝑟 𝐹(𝑑𝑦, 𝑡 + ℎ|𝑥, 𝑡) = 0 Ahora bien, para comprobar que un proceso es de difusión, en la práctica, se usa el siguiente resultado que proporciona unas condiciones suficientes para ello: TEO 1.1: Un proceso de Markov en tiempo continuo, con espacio de estados continuo y con trayectorias continuas casi seguro y verificando: 1 1. ∃𝛿 > 0 𝑡𝑎𝑙 𝑞𝑢𝑒 ∀𝑥, limℎ→0 ∫ |𝑦 − 𝑥|2+𝛿 𝐹(𝑑𝑦, 𝑡 + ℎ|𝑥, 𝑡) = 0 ℎ 2. Existen los momentos infinitesimales 1 Media infinitesimal o drift: 𝐴1 (𝑥, 𝑡) = limℎ→0 ∫ (𝑦 − 𝑥)𝐹(𝑑𝑦, 𝑡 + ℎ|𝑥, 𝑡) ℎ 1 Varianza infinitesimal: 𝐴2 (𝑥, 𝑡) = limℎ→0 ∫ (𝑦 − 𝑥)2 𝐹(𝑑𝑦, 𝑡 + ℎ|𝑥, 𝑡) ℎ Entonces es proceso de difusión Al usar estos momentos infinitesimales, de existir, no tenemos asegurado que los de orden superior a dos sean nulos. Lo que si tenemos, con la condición anterior, es que los dos primeros momentos coinciden con los dos primeros momentos truncados, por lo que podemos usar estos dos primeros momentos en el sentido de ser la media y la varianza por unidad de tiempo, del incremento condicionado. José Antonio Anguita Izquierdo Página 5 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Por otro lado, para que la función de distribución de un proceso de difusión verifique la ecuación atrasada de Kolmogorov 𝜕𝐹(𝑥, 𝑡|𝑦, 𝑠) 𝜕𝐹(𝑥, 𝑡|𝑦, 𝑠) 𝐴2 (𝑦, 𝑠) 𝜕 2 𝐹(𝑥, 𝑡|𝑦, 𝑠) + 𝐴1 (𝑦, 𝑠) + =0 𝜕𝑠 2 𝜕𝑦 2 𝜕𝑦 1 𝑠𝑖 𝑥 ≥ 𝑦 con la condición lim𝑠↑𝑡 𝐹(𝑥, 𝑡|𝑦, 𝑠) = � , 0 𝑠𝑖 𝑥 < 𝑦 se tiene que cumplir que dicha distribución de transición sea dos veces derivable respecto de y, con derivadas continuas y acotadas. Además, si existen las densidades de transición, 𝑓(𝑥, 𝑡|𝑦, 𝑠), también verificarán dicha ecuación con condición inicial lim𝑠↑𝑡 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 𝛿(𝑥 − 𝑦), siendo 𝛿 la función delta de Dirac. Para que verifique la ecuación adelantada de Kolmogorov o ecuación de Fokker-Planck 𝜕[𝐴1 (𝑥, 𝑡)𝑓(𝑥, 𝑡|𝑦, 𝑠)] 1 𝜕 2 [𝐴2 (𝑥, 𝑡)𝑓(𝑥, 𝑡|𝑦, 𝑠)] 𝜕𝑓(𝑥, 𝑡|𝑦, 𝑠) =− + , 𝑡0 < 𝑠 < 𝑡 < 𝑇 𝜕𝑡 𝜕𝑥 𝜕𝑥 2 2 con la condición lim𝑠↑𝑡 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 𝛿(𝑥 − 𝑦), tienen que existir y ser continuas las derivadas 𝜕𝑓(𝑥, 𝑡|𝑦, 𝑠) 𝜕[𝐴1 (𝑥, 𝑡)𝑓(𝑥, 𝑡|𝑦, 𝑠)] 𝜕 2 [𝐴2 (𝑥, 𝑡)𝑓(𝑥, 𝑡|𝑦, 𝑠)] , 𝑦 𝜕𝑡 𝜕𝑥 2 𝜕𝑥 Todo ello suponiendo que existen las densidades de transición. Para asegurarnos esto, enunciamos el siguiente teorema que impone las siguientes condiciones a los momentos infinitesimales: TEO 1.2: Supongamos que los momentos infinitesimales 𝐴1 y 𝐴2 verifican, para todo valor x del espacio de estados y ∀𝑡 ∈ [𝑡0 , 𝑇], las siguientes condiciones: 1. ∃𝜎0 , 𝑘 constantes positivas, tales que � |𝐴1 (𝑥, 𝑡)| ≤ 𝑘√1 + 𝑥 2 0 < 𝜎0 ≤ �𝐴2 (𝑥, 𝑡) ≤ 𝑘√1 + 𝑥 2 2. (Condición de Hölder) ∃𝛾, 𝑘 constantes positivas, tales que � Entonces se verifica: |𝐴1 (𝑥, 𝑡) − 𝐴1 (𝑦, 𝑡)| ≤ 𝑘|𝑥 − 𝑦|𝛿 |�𝐴2 (𝑥, 𝑡) − �𝐴2 (𝑦, 𝑡)| ≤ 𝑘|𝑥 − 𝑦|𝛿 1. La ecuación atrasada tiene una única solución sujeta a la anterior condición frontera. Además, para 𝑡 > 𝑠, 𝐹(𝑥, 𝑡; 𝑦, 𝑠) es derivable respecto de x, por lo que admite densidad, que también verificará la ecuación atrasada con condición frontera del tipo delta de Dirac. 2. Existe un proceso de Markov {𝑋(𝑡): 𝑡0 ≤ 𝑡 ≤ 𝑇} con trayectorias continuas, que verifica las condiciones de proceso de difusión y que tiene por función de distribución de transición 𝐹(𝑥, 𝑡; 𝑦, 𝑠). 3. Si, además, las condiciones del enunciado son cumplidas por 𝜕𝐴1 (𝑥, 𝑡) 𝜕𝐴2 (𝑥, 𝑡) 𝜕 2 𝐴2 (𝑥, 𝑡) , 𝑦 𝜕𝑥 𝜕𝑥 𝜕𝑥 2 entonces la función de densidad de transición también es la única solución de la ecuación adelantada. 4. Por último, se tiene que si 𝛾=1, 𝑓(𝑥, 𝑡|𝑦, 𝑠) es la densidad de transición de la única solución de la ecuación integral estocástica 𝑡 𝑡 𝑋(𝑡) = 𝑋(𝑡0 ) + � 𝐴1 (𝑋(𝑠), 𝑠)𝑑𝑠 + � �𝐴2 (𝑋(𝑠), 𝑠)𝑑𝑊(𝑠) José Antonio Anguita Izquierdo 𝑡0 𝑡0 Página 6 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 1.2. Proceso de difusión lognormal no homogéneo El proceso lognormal no homogéneo se define como un proceso de difusión {𝑋(𝑡); 𝑡0 ≤ 𝑡 ≤ 𝑇} que toma valores en ℝ+ , con momentos infinitesimales 𝐴1 (𝑥, 𝑡) = ℎ(𝑡)𝑥 y 𝐴2 (𝑥) = 𝜎 2 𝑥 2 donde ℎ(𝑡) es una función continua en [𝑡0 , 𝑇], 𝜎 > 0, y con distribución inicial degenerada o lognormal Veamos a continuación, si el proceso definido por esos momentos verifica las condiciones del Teorema 1.2: En primer lugar, comprobemos si ∃𝜎0 , 𝑘 constantes positivas, tales que � |𝐴1 (𝑥, 𝑡)| ≤ 𝑘√1 + 𝑥 2 0 < 𝜎0 ≤ �𝐴2 (𝑥, 𝑡) ≤ 𝑘√1 + 𝑥 2 Por un lado se tiene que, |ℎ(𝑡)𝑥| ≤ |ℎ(𝑡)|𝑥 ≤ |ℎ(𝑡)|√1 + 𝑥 2 , luego si 𝑡 ∈ [𝑡0 , 𝑇] y como h continua, tenemos que alcanza su máximo (M) en [𝑡0 , 𝑇]. Por tanto |ℎ(𝑡)|√1 + 𝑥 2 ≤ |𝑀| ∙ √1 + 𝑥 2 con 𝑡 ∈ [𝑡0 , 𝑇]. Por otro lado, se obtiene que 0 < 𝜎0 ≤ 𝜎𝑥 ≤ 𝑘√1 + 𝑥 2 . Luego, tomando k=max(𝜎, |𝑀|) para 𝑡 ∈ [𝑡0 , 𝑇] y 𝜎0 = 𝜎𝜀 (𝑐𝑜𝑛 𝜀 > 0 𝑡. 𝑞. 𝜀 < 𝑥), se verificarían las desigualdades. Para comprobar la condición de Hölder, basta tomar el k anterior y 𝛾 = 1 pues |ℎ(𝑡)𝑥 − ℎ(𝑡)𝑦| ≤ |ℎ(𝑡)||𝑥 − 𝑦| , |𝜎𝑥 − 𝜎𝑦| = 𝜎|𝑥 − 𝑦| Veamos ahora que las condiciones se cumplen también para las expresiones siguientes 𝜕𝐴2 (𝑥, 𝑡) 𝜕 2 𝐴2 (𝑥, 𝑡) 𝜕𝐴1 (𝑥, 𝑡) = ℎ(𝑡); = 2𝜎 2 𝑥 ; = 2𝜎 2 𝜕𝑥 𝜕𝑥 𝜕𝑥 2 Para las dos primeras expresiones, se tiene que |ℎ(𝑡)| ≤ |M| ≤ |M|√1 + x 2 , y que 0 < 𝜎0 ≤ √2𝜎 2 𝑥 ≤ k√1 + x 2 . Luego ambas desigualdades se verifican tomando 𝑘 = 𝑚𝑎𝑥�|𝑀|, √2σ2 � y 𝜎0 = √2σ2 ε (con ϵ < √x). Para el tercer caso, 0 < 𝜎0 ≤ √2𝜎 2 ≤ k√1 + x 2 , desigualdades que se verifican tomando 𝑘 = √2σ2 y 𝜎0 = √2σ2 Por último, veamos la condición de Hölder para las tres expresiones |h(t) − h(t)| = 0 ≤ k|x − y|, válido ∀k > 0, ∀𝛾 > 0 (𝑒𝑛 𝑝𝑎𝑟𝑡𝑖𝑐𝑢𝑙𝑎𝑟 𝛾 = 1) �√2𝜎 2 𝑥 − �2𝜎 2 𝑦� = √2𝜎 2 �√x − �y� ≤ √2𝜎 2 |x − y|, tomar 𝑘 = √2σ2 y γ = 1 �√2𝜎 2 − √2𝜎 2 � = 0 ≤ k|x − y|, válido ∀k > 0, ∀𝛾 > 0 (𝑒𝑛 𝑝𝑎𝑟𝑡𝑖𝑐𝑢𝑙𝑎𝑟 𝛾 = 1) Por tanto concluimos que nuestro proceso verifica las condiciones de proceso de difusión y que tiene por función de distribución de transición F(x,t;y,s). Además su función de densidad de transición es la única solución de las ecuaciones atrasadas y adelantada de Kolmogorov, y como γ=1, dicha función de transición también verifica que es la densidad de transición de la única solución de la ecuación integral estocástica 𝑡 𝑡 𝑋(𝑡) = 𝑋(𝑡0 ) + � 𝐴1 (𝑋(𝑠), 𝑠)𝑑𝑠 + � �𝐴2 (𝑋(𝑠), 𝑠)𝑑𝑊(𝑠) 𝑡0 José Antonio Anguita Izquierdo 𝑡0 Página 7 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo A continuación, vamos a introducir este proceso de dos maneras distintas. La primera, usando ecuaciones diferenciales estocásticas, obtenidas a partir de la ecuación de Langevin, y la segunda, a través de las ecuaciones de Fokker-Planck y Kolmogorov, es decir, desde un punto de vista de ecuaciones en derivadas parciales. 1.3. El proceso a partir de la ecuación diferencial estocástica Consideremos la ecuación diferencial estocástica de Itô 𝑑𝑋(𝑡) = ℎ(𝑡)𝑋(𝑡)𝑑𝑡 + 𝜎𝑋(𝑡)𝑑𝑊(𝑡) � 𝑋(𝑡0 ) = 𝑋0 siendo 𝑊(𝑡) un proceso Wiener estándar, independiente de 𝑋0 , 𝑡 ≥ 𝑡0 . Esta ecuación se obtiene de la ecuación diferencial ordinaria 𝑑𝑥(𝑡) = ℎ(𝑡)𝑥(𝑡), 𝑑𝑡 que puede ser vista como una generalización del modelo de crecimiento malthusiano con tasa de fertilidad ℎ(𝑡). Si cambiamos dicha tasa por ℎ(𝑡) + Λ(𝑡), con Λ(𝑡) un ruido blanco con varianza 𝜎 2 , se obtiene la ecuación de Langevin, la cual reescrita como una ecuación diferencial estocástica da paso a nuestra ecuación inicial. Veamos en primer lugar, que esta ecuación verifica las condiciones de existencia y unicidad del siguiente teorema para ecuaciones diferenciales estocásticas: Teorema 1.3. Sea la ecuación diferencial estocástica 𝑑𝑋(𝑡) = 𝑎(𝑋(𝑡), 𝑡)𝑑𝑡 + 𝑏(𝑋(𝑡), 𝑡)𝑑𝑊(𝑡); 𝑋(𝑡0 ) = 𝑋0 ; 𝑡0 ≤ 𝑡 ≤ 𝑇 < ∞ con 𝑊(𝑡) un proceso Wiener estándar y 𝑋0 una variable independiente de 𝑊(𝑡) − 𝑊(𝑡0 ), para 𝑡0 ≤ 𝑡. Supongamos que las funciones 𝑎 y 𝑏 están definidas y son medibles en [𝑡0 , 𝑇]𝑥ℝ, y verifican las siguientes condiciones: ∃𝑘 > 0 constante tal que 1. |𝑎(𝑥, 𝑡) − 𝑎(𝑦, 𝑡)| + |𝑏(𝑥, 𝑡) − 𝑏(𝑦, 𝑡)| ≤ 𝑘|𝑥 − 𝑦|, ∀𝑡 ∈ [𝑡0 , 𝑇], ∀𝑥, 𝑦 ∈ ℝ 2. |𝑎(𝑥, 𝑡)|2 + |𝑏(𝑥, 𝑡)|2 ≤ 𝑘(1 + |𝑥|2 ), ∀𝑡 ∈ [𝑡0 , 𝑇], ∀𝑥 ∈ ℝ Entonces, la ecuación inicial del enunciado tiene una única solución en [𝑡0 , 𝑇] y con valores en ℝ, continua con probabilidad uno, que satisface la condición inicial. Usando la misma notación que en este resultado, es decir, 𝑎(𝑥, 𝑡) = ℎ(𝑡)𝑥; 𝑏(𝑥, 𝑡) = 𝑏(𝑥) = 𝜎𝑥, tenemos que se cumplen las siguientes desigualdades 1. |𝑎(𝑥, 𝑡) − 𝑎(𝑦, 𝑡)| + |𝑏(𝑥, 𝑡) − 𝑏(𝑦, 𝑡)| = (|ℎ(𝑡)|𝜎)|𝑥 − 𝑦| ≤ (max𝑡0 ≤𝑡≤𝑇 |ℎ(𝑡)| + 𝜎) |𝑥 − 𝑦| 2. |𝑎(𝑥, 𝑡)|2 + |𝑏(𝑥, 𝑡)|2 = (ℎ(𝑡)2 + 𝜎 2 )𝑥 2 ≤ (max𝑡0 ≤𝑡≤𝑇 ℎ(𝑡)2 + 𝜎 2 ) (1 + 𝑥 2 ) José Antonio Anguita Izquierdo Página 8 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Ahora bien, considerando 𝑘 = 𝑚𝑎𝑥{𝑘1 , 𝑘2 } con 𝑘1 = max |ℎ(𝑡)| + 𝜎, y 𝑘2 = max ℎ(𝑡)2 + 𝜎 2 , se 𝑡0 ≤𝑡≤𝑇 verifican las condiciones del teorema. 𝑡0 ≤𝑡≤𝑇 Pasamos ahora a resolver la ecuación. Para ello, consideramos la transformación 𝑌(𝑡) = ln�𝑋(𝑡)� y utilizando el lema de Itô, la ecuación diferencial inicial se convierte en la ecuación autónoma 𝑑𝑌(𝑡) = �ℎ(𝑡) − cuya solución es 𝜎2 � 𝑑𝑡 + 𝜎𝑑𝑊(𝑡); 𝑌(𝑡0 ) = 𝑙𝑛𝑋0 , 2 𝑡 𝑌(𝑡) = 𝑙𝑛𝑋0 + � ℎ(𝑢)𝑑𝑢 − 𝑡0 𝜎2 (𝑡 − 𝑡0 ) + 𝜎(𝑊(𝑡) − 𝑊(𝑡0 )) 2 Así, siguiendo a Arnold, Y(t) será un proceso gaussiano sí y sólo sí 𝑙𝑛𝑋0 es constante o distribuida normalmente. En tales casos, las funciones media y covarianza de Y(t) serán: 𝑡 𝑚(𝑡) = 𝐸[𝑙𝑛𝑋0 ] + � ℎ(𝑢)𝑑𝑢 − 𝑡0 𝜎2 (𝑡 − 𝑡0 ) 2 𝑅(𝑡, 𝑠) = 𝑉𝑎𝑟[𝑙𝑛𝑋0 ] + 𝜎 2 (𝑡 ∧ 𝑠 − 𝑡0 ), con 𝑡 ∧ 𝑠 = min (𝑡, 𝑠) Por tanto, las distribuciones finito-dimensionales de Y(t) son normales, es decir, �𝑌(𝑡1 ), 𝑌(𝑡2 ), … , 𝑌(𝑡𝑛 )�´ ∼ 𝑁𝑛 (𝜇, Σ) donde la i-ésima componente del vector 𝜇 es 𝑚(𝑡𝑖 ), 𝑖 = 1, … , 𝑛 y donde Σ es una matriz definida positivamente, cuyas componentes son 𝑅�𝑡𝑖 , 𝑡𝑗 �, 𝑖, 𝑗 = 1, … , 𝑛. Deshaciendo el cambio de variable, obtenemos 𝑡 𝑋(𝑡) = 𝑒𝑥𝑝 (𝑌(𝑡)) = 𝑋0 ∙ 𝑒𝑥𝑝 (� ℎ(𝑢)𝑑𝑢 − 𝑡0 𝜎2 (𝑡 − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )�) 2 donde 𝑋0 puede ser una distribución degenerada (𝑃[𝑋(𝑡0 ) = 𝑋0 ] = 1) ó 𝑋0 ~Λ1 (𝜇0 , 𝜎02 ) (nótese que el primer caso es un caso particular de este segundo caso, tomando 𝜇0 = 𝑙𝑜𝑔𝑥0 y 𝜎02 = 0). Así, en ambas situaciones, las distribuciones finito-dimensionales serán lognormales 𝛬𝑛 (𝜇, 𝛴). Es decir, ∀𝑛 ∈ ℕ 𝑦 𝑡1 < 𝑡2 < ⋯ < 𝑡𝑛 ,; �𝑋(𝑡1 ), 𝑋(𝑡2 ), … , 𝑋(𝑡𝑛 )�´ ∼ Λ 𝑛 (𝜇, Σ) donde las componentes del vector 𝜇 = (𝜇1 , … , 𝜇𝑛 )´ y de la matriz 𝛴 = �𝜎𝑖𝑗 �, 𝑖, 𝑗 = 1, … , 𝑛 son respectivamente 𝑡 𝜇𝑖 = 𝜇0 + � ℎ(𝑢)𝑑𝑢 − 𝜎𝑖𝑗 = 𝜎02 𝑡0 𝜎2 (𝑡 − 𝑡0 ), 𝑖 = 1, … , 𝑛 2 𝑖 + 𝜎 2 �𝑀𝑖𝑛{𝑡𝑖 , 𝑡𝑗 } − 𝑡0 �, 𝑖, 𝑗 = 1, … , 𝑛 Concretamente, la distribución unidimensional seguirá la siguiente distribución 𝑡 y la bidimensional 𝑋(𝑡)~𝛬1 [𝜇0 + � ℎ(𝑢)𝑑𝑢 − José Antonio Anguita Izquierdo 𝑡0 𝜎2 (𝑡 − 𝑡0 ); 𝜎02 + 𝜎 2 (𝑡 − 𝑡0 )] 2 Página 9 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑡∨𝑠 𝜎2 ⎡ 𝜇0 + � ℎ(𝑢)𝑑𝑢 − (𝑡 ∨ 𝑠 − 𝑡0 ) 2 ⎞ 2 𝑡 − 𝑡0 𝑋(𝑡) ⎢⎛ 𝑡0 2 � � ~Λ2 ⎢⎜ 𝑡∧𝑠 2 ⎟ ; 𝜎0 𝐼2 + 𝜎 �𝑡 ∧ 𝑠 − 𝑡0 𝑋(𝑠) 𝜎 ⎢ 𝜇0 + � ℎ(𝑢)𝑑𝑢 − (𝑡 ∧ 𝑠 − 𝑡0 ) 2 ⎣⎝ 𝑡0 ⎠ 1 1 con 𝐼2 = � � 1 1 ⎤ 𝑡 ∧ 𝑠 − 𝑡0 ⎥ 𝑠 − 𝑡0 �⎥ , 𝑡, 𝑠 > 𝑡0 ⎥ ⎦ A partir de esta distribución bidimensional y usando las propiedades de las distribuciones condicionadas en el caso lognormal, se obtiene que 𝑡 [𝑋(𝑡)|𝑋(𝑠) = 𝑦]~𝛬1 �𝑙𝑛𝑦 + � ℎ(𝑢)𝑑𝑢 − 𝑠 con función de densidad de transición 𝜎2 (𝑡 − 𝑠); 𝜎 2 (𝑡 − 𝑠)� , 𝑡 > 𝑠 2 2 𝑡 𝜎2 𝑥 − ℎ(𝑠)𝑑𝑠 + �𝑙𝑛 ∫ 1 𝑠 ⎛ 2 (𝑡 − 𝑠)� ⎞ 𝑦 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 𝑒𝑥𝑝 ⎜− ⎟ 2𝜎 2 (𝑡 − 𝑠) 𝑥�2𝜋𝜎 2 (𝑡 − 𝑠) 1.4. ⎝ El proceso a partir de las ecuaciones de Kolmogorov ⎠ Como mencionamos en el apartado 1.2, la función de densidad de transición es la única solución de las ecuaciones atrasadas y adelantadas de Kolmogorov. Para resolver esta ecuación atrasada, realizaremos la búsqueda de una función que transforme dicha ecuación en la del proceso Wiener estándar, cuya solución es conocida. En nuestro caso, la ecuación adelantada (o de Fokker-Planck) es de la forma 𝜕[𝑥𝑓(𝑥, 𝑡|𝑦, 𝑠)] 𝜎 2 𝜕 2 [𝑥 2 𝑓(𝑥, 𝑡|𝑦, 𝑠)] 𝜕𝑓(𝑥, 𝑡|𝑦, 𝑠) = −ℎ(𝑡) + 𝜕𝑥 2 𝜕𝑥 2 𝜕𝑡 y la ecuación atrasada (o de Kolmogorov) es 𝜕[𝑓(𝑥, 𝑡|𝑦, 𝑠)] 𝜎 2 2 𝜕 2 [𝑓(𝑥, 𝑡|𝑦, 𝑠)] 𝜕𝑓(𝑥, 𝑡|𝑦, 𝑠) + ℎ(𝑠)𝑦 + 𝑦 =0 𝜕𝑦 2 𝜕𝑦 2 𝜕𝑠 Estas ecuaciones verifican las condiciones de existencia y unicidad de la solución con condiciones iniciales respectivas lim 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 𝛿(𝑥 − 𝑦) 𝑦 lim 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 𝛿(𝑥 − 𝑦) 𝑡↓𝑠 𝑠↑𝑡 siendo 𝛿(. ) la función delta de Dirac. Por otro lado, las transformaciones en las que estamos interesados son del tipo 𝑥´ = 𝜓(𝑥, 𝑡); 𝑥0́ = 𝜓(𝑥0 , 𝑡0 ) 𝑡´ = 𝜙(𝑡); 𝑡0́ = 𝜙(𝑡0 ) que cambia la ecuación atrasada de nuestro proceso X(t) en la del proceso Wiener 𝜕𝑓´(𝑥´, 𝑡´|𝑥0́ , 𝑡0́ ) cuya solución es conocida José Antonio Anguita Izquierdo 𝜕𝑡0́ + 1 𝜕 2 𝑓´(𝑥´, 𝑡´|𝑥0́ , 𝑡0́ ) =0 2 𝜕𝑥0́ Página 10 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑓´�𝑥´, 𝑡´�𝑥0́ , 𝑡0́ � = 2 1 1 �𝑥´ − 𝑥0́ � exp �− � 2 �𝑡´ − 𝑡0́ � �2𝜋(𝑡´ − 𝑡0́ ) En este contexto, Chersakov (1957) y Ricciardi (1976) estudiaron con detalle el problema de cuándo se podrá transformar un proceso de difusión cualquiera en el Wiener, dando condiciones suficientes y necesarias para que existan tal tipo de transformación, obteniéndose el siguiente teorema. Teorema. Una condición necesaria y suficiente para que un proceso de difusión con función densidad de transición 𝑓�𝑥, 𝑡�𝑥0 , 𝑡0 � y momentos infinitesimales 𝐴1 (𝑥, 𝑡) y 𝐴2 (𝑥, 𝑡) pueda transformarse al proceso Wiener estándar es que existan funciones arbitrarias 𝐶1 (𝑡)) y 𝐶2 (𝑡) que verifiquen 1� 2 1 𝜕𝐴2 (𝑥, 𝑡) (𝐴2 (𝑥, 𝑡)) 𝐴1 (𝑥, 𝑡) = + 2 𝜕𝑥 4 En tal caso la transformación es 1 𝑡 1� 2 exp �− � 2 𝑡0 𝑥´ = 𝜓(𝑥, 𝑡) = (𝑘1 ) 1� 2 (𝑘1 ) − 2 𝑡 𝜕𝐴2 (𝑦, 𝑡) 𝜕𝑡 𝑑𝑦� 3� (𝐴2 (𝑦, 𝑡)) 2 𝑥 𝐶 (𝑡)𝐴 (𝑦, 𝑡) 2 2 �𝐶1 (𝑡) + � 𝑧 𝑥 𝐶2 (𝑠) 𝑑𝑠� � 𝑧 1 + 1� 𝑑𝑦 2 �𝐴2 (𝑦, 𝑡)� 𝑡 1 𝑠 � 𝐶1 (𝑠) exp �− � 𝐶2 (𝜃) 𝑑𝜃� 𝑑𝑠 + 𝑘2 2 𝑡0 𝑡2 𝑠 𝑡´ = 𝜙(𝑡) = 𝑘1 � exp (− � 𝐶2 (𝜃) 𝑑𝜃)𝑑𝑠 + 𝑘3 𝑡1 𝑡0 con z un valor del intervalo de definición del proceso, 𝑡𝑖 ∈ [𝑡0 , +∞) 𝑦 𝑘𝑖 constantes arbitrarias, con k1>0. Nota. Puesto que, para cada t, 𝜕𝜓(𝑥,𝑡) 𝜕𝑥 1 𝜙´(𝑡) �2 � 2 (𝑥,𝑡) = �𝐴 la transformación 𝑥´ = 𝜓(𝑥, 𝑡) es biyectiva, la relación entre las densidades de transición será 𝑓(𝑥, 𝑡|𝑥0 , 𝑡0 ) = 𝜕𝜓(𝑥, 𝑡) ∙ 𝑓´(𝑥´, 𝑡´|𝑥´0 , 𝑡´0 ) 𝜕𝑥 Veamos si este proceso verifica las condiciones de este teorema En efecto ℎ(𝑡)𝑥 = 𝑥𝜎 2 𝜎𝑥 2𝑥𝜎 2 𝜎𝑥 𝜎𝑥 𝑥 𝑐2 (𝑡)𝜎 2 𝑦 2 𝑐2 (𝑡)𝑥 𝑥 1 (𝑡) + 𝑐1 (𝑡) + � 𝑑𝑦 = + 𝑐 � 𝑑𝑦 + 4 𝜎3𝑦3 2 2 2 1 2 𝑧 2 𝑧 𝑦 𝜎2 𝜎 𝑥 𝑐2 (𝑡) = � + 𝑐1 (𝑡) + 𝑙𝑛 � �� 𝑥 2 2 2 𝑧 por lo que basta tomar 𝑐1 (𝑡) = 2ℎ(𝑡) −𝜎 𝜎 𝑐2 (𝑡) = 0 para que se verifique la condición. Así, la transformación al proceso Wiener será: José Antonio Anguita Izquierdo Página 11 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑥´ = 𝜓(𝑥, 𝑡) = 𝜎2𝑡−𝑡2+𝑘2 1 � 𝑘1 2 𝜎 𝑥1 ∫𝑧 𝑑𝑦 − 𝑦 1 (𝑘1 ) �2 𝑡 2ℎ(𝑡) ∫𝑡 � 𝜎 − 𝜎� 𝑑𝑠 2 2 1� 1 𝑥 1 𝑡 + 𝑘2 = 𝑘1 2 �𝜎 𝑙𝑛 �𝑧 � − 𝜎 ∫𝑡 ℎ(𝑠)𝑑𝑠 + 2 𝑡 𝑡´ = 𝜙(𝑡) = 𝑘1 � ds + 𝑘3 = 𝑘1 (𝑡 − 𝑡1 ) + 𝑘3 + 𝑡1 con 𝑧 ∈ ℝ , 𝑡𝑖 > 0 𝑦 𝑘𝑖 constantes arbitrarias, con k1>0. Para terminar, siguiendo la nota anterior 1� 𝜕𝜓(𝑥, 𝑡) 𝑘1 2 = 𝜕𝑥 𝜎𝑥 por lo que la función de densidad de transición del proceso será 1� Es decir, 𝑘 2 1 𝑓�𝑥, 𝑡�𝑥0 , 𝑡0 � = 1 𝑓´�𝑥´, 𝑡´�𝑥0́ , 𝑡0́ � = 𝑥 𝜎𝑥 1� 2 𝑘1 2 �2𝜋𝜎 2 �𝑡´ − 𝑡0́ � 1 �𝑥´ − 𝑥0́ � exp �− � 2 �𝑡´ − 𝑡0́ � 2 𝑡 𝜎2 𝑥 − ℎ(𝑠)𝑑𝑠 + �𝑙𝑛 ∫ 1 𝑠 ⎛ 2 (𝑡 − 𝑠)� ⎞ 𝑦 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 𝑒𝑥𝑝 ⎜− ⎟ 2𝜎 2 (𝑡 − 𝑠) 𝑥�2𝜋𝜎 2 (𝑡 − 𝑠) ⎝ ⎠ que como se puede observar, coincide con la obtenida en el apartado anterior. 1.5. Características del proceso Una vez calculadas las distribuciones finito-dimensionales, se pueden obtener las principales características del proceso. Para ello, consideramos 𝑋0 ~Λ1 (𝜇0 , 𝜎02 ), pues como hemos mencionado anteriormente, el caso degenerado es un caso particular de éste tomando 𝜇0 = 𝑙𝑜𝑔𝑥0 y 𝜎02 = 0 Todas las características principales se pueden definir a partir de la siguiente función: 𝜆4 𝐺 𝜆 (𝑡|𝑦, 𝜏) = 𝑀(𝑡|𝑦, 𝜏)𝜆1 𝑒𝑥𝑝 �𝜆2 �𝜆3 𝜎02 + 𝜎 2 (𝑡 − 𝜏)� � con 𝜆 = (𝜆1 , 𝜆2 , 𝜆3 , 𝜆4 )´ y con 𝑡 𝑀(𝑡|𝑦, 𝜏) = 𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢 + 𝑦 − Así, se tiene que, por ejemplo 𝜏 • Para 𝑦 = 𝜇0 ; 𝜏 = 𝑡0 ; 𝜆 = �𝑛, 𝑇 𝑛2 , 1,1� , 2 • 𝐸[𝑋(𝑡)𝑛 |𝑋(𝑠) = 𝑥𝑠 ] • Para 𝑦 = 𝑙𝑛𝑥𝑠 ; 𝜏 = 𝑠; 𝜆 = �𝑛, 𝜎 2 (𝑡 − 𝜏) � 2 se obtienen los momentos n-ésimos 𝐸[𝑋(𝑡)𝑛 ] 𝑇 𝑛2 , 0,1� , 2 se obtienen los momentos n-ésimos condicionados Para 𝑦 = 𝜇0 ; 𝜏 = 𝑡0 ; 𝜆 = (1, −1,1,1)𝑇 , se obtiene la función moda 𝑀𝑜𝑑𝑒[𝑋(𝑡)] José Antonio Anguita Izquierdo Página 12 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑦 = 𝑙𝑛𝑥𝑠 ; 𝜏 = 𝑠; 𝜆 = (1, −1,0,1)𝑇 , • Para • 𝑀𝑜𝑑𝑒[𝑋(𝑡)|𝑋(𝑠) = 𝑥𝑠 ] • se obtiene la función moda condicionada 1 𝑇 2 Para 𝑦 = 𝜇0 ; 𝜏 = 𝑡0 ; 𝜆 = �1, 𝑧𝛼 , 1, � , se obtiene la función cuantil de orden 𝛼, 𝐶𝛼 [𝑋(𝑡)] 1 𝑇 2 Para 𝑦 = 𝑙𝑛𝑥𝑠 ; 𝜏 = 𝑠; 𝜆 = �1, 𝑧𝛼 , 0, � , se obtiene la función cuantil de orden 𝛼 condicionada, 𝐶𝛼 [𝑋(𝑡)|𝑋(𝑠) = 𝑥𝑠 ], donde 𝑧𝛼 es el cuantil de orden alfa de una normal estándar. En concreto, las expresiones de estas funciones quedan de la siguiente forma: Función media: 𝑡 𝑚(𝑡) = 𝐸[𝑋(𝑡)] = 𝐸[𝑋(𝑡0 )]𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢� = 𝑒𝑥𝑝 �𝜇0 + 𝑡0 Función moda: 𝑀𝑜(𝑡) = 𝑀𝑜𝑑𝑒[𝑋(𝑡)] = 𝑒𝑥𝑝(𝜇0 − Función cuantil de orden 𝛼 : 𝐶𝛼 (𝑡) = 𝑒𝑥𝑝 �𝜇0 + 𝑡 2 )𝑒𝑥𝑝 𝜎0 �� ℎ(𝑢)𝑑𝑢 𝑡0 𝑡 𝜎02 + � ℎ(𝑢)𝑑𝑢� , 𝑡 ≥ 𝑡0 2 𝑡0 − (𝑡 − 𝑡0 ) 3𝜎 2 � , 𝑡 ≥ 𝑡0 2 𝑡 𝜎02 𝜎2 � 𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢 − (𝑡 − 𝑡0 ) + 𝑧𝛼 �𝜎02 + 𝜎 2 (𝑡 − 𝑡0 )� 2 2 𝑡0 En cuanto a sus respectivas expresiones condicionadas, dados s y 𝑥𝑠 , se tiene: Función media condicionada: 𝑡 𝑚(𝑡|𝑠) = 𝐸[𝑋(𝑡)|𝑋(𝑠) = 𝑥𝑠 ] = 𝑥𝑠 𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢� , 𝑡 > 𝑠 ≥ 𝑡0 𝑡0 Función moda condicionada: 𝑡 𝑀𝑜(𝑡|𝑠) = 𝑀𝑜𝑑𝑒[𝑋(𝑡)|𝑋(𝑠) = 𝑥𝑠 ] = 𝑥𝑠 𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢 − (𝑡 − 𝑠) 𝑠 Función cuantil condicionada de orden alfa: 𝑡 𝐶𝛼 (𝑡|𝑠) = 𝑥𝑠 𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢 − 𝑠 3𝜎 2 � , 𝑡 > 𝑠 ≥ 𝑡0 2 𝜎2 (𝑡 − 𝑠) + 𝑧𝛼 𝜎�𝑡 − 𝑡0 � 𝑡 > 𝑠 ≥ 𝑡0 2 Escribimos las expresiones de otras características: Momentos de orden 𝑛: 𝑡 𝐸[𝑋(𝑡)𝑛 ] = 𝐸[𝑋(𝑡0 )𝑛 ]𝑒𝑥𝑝 �𝑛 � ℎ(𝑢)𝑑𝑢 + Momentos cruzados de órdenes 𝑘1 y 𝑘2 : 𝑡0 𝑡∨𝑠 𝐸[𝑋(𝑡 ∨ 𝑠)𝑘1 𝑋(𝑡 ∧ 𝑠)𝑘2 ] = 𝐸[𝑋(𝑡 ∧ 𝑠)𝑘1 +𝑘2 ]𝑒𝑥𝑝 �𝑘1 � con 𝑠, 𝑡 ≥ 𝑡0 José Antonio Anguita Izquierdo 𝑛𝜎 2 (𝑡 − 𝑡0 )(𝑛 − 1)� , 𝑡 ≥ 𝑡0 2 𝑡∧𝑠 ℎ(𝑢)𝑑𝑢 + 𝑘1 𝜎 2 (𝑡 ∨ 𝑠 − 𝑡 ∧ 𝑠) (𝑘1 − 1)� 2 Página 13 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Así para 𝑘1 = 𝑘2 = 1, se tienen los momentos cruzados de orden 1 𝑡∨𝑠 𝑡 𝑠 𝐸[𝑋(𝑡)𝑋(𝑠)] = 𝐸[𝑋(𝑡 ∧ 𝑠)2 ]𝑒𝑥𝑝 �∫𝑡∧𝑠 ℎ(𝑢)𝑑𝑢� = 𝐸[𝑋(𝑡0 )2 ]𝑒𝑥𝑝 �∫𝑡 ℎ(𝑢)𝑑𝑢 + ∫𝑡 ℎ(𝑢)𝑑𝑢 + 𝜎2𝑡∧𝑠−𝑡0,𝑠, 𝑡≥𝑡0 0 0 Función Varianza: 𝑡 𝑉𝑎𝑟[𝑋(𝑡)] = 𝐸[𝑋(𝑡)2 ] − 𝐸 2 [𝑋(𝑡)] = 𝑒𝑥𝑝 �2 � ℎ(𝑢)𝑑𝑢� �𝐸[𝑋(𝑡0 )2 ]𝑒 𝜎 𝑡0 𝑡 = 𝑒𝑥𝑝 �2 � ℎ(𝑢)𝑑𝑢� �𝑉𝑎𝑟[𝑋(𝑡0 )]𝑒 𝜎 Función Covarianza 𝑡0 2 (𝑡−𝑡 0) 𝑠 = 𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢 + � ℎ(𝑢)𝑑𝑢� �𝐸[𝑋(𝑡0 )2 ]𝑒 𝜎 𝑡0 0) + 𝐸 2 [𝑋(𝑡0 )]�𝑒 𝜎 𝑅(𝑡, 𝑠) = 𝐶𝑜𝑣[𝑋(𝑡), 𝑋(𝑠)] = 𝐸[𝑋(𝑡)𝑋(𝑠)] − 𝑚(𝑡)𝑚(𝑠) 𝑡 2 (𝑡−𝑡 𝑡0 2 (𝑠−𝑡 0) − 𝐸 2 [𝑋(𝑡0 )]� 2 (𝑡−𝑡 0) − 1��, 𝑡 ≥ 𝑡0 − 𝐸 2 [𝑋(𝑡0 )]�; 𝑠, 𝑡 ≥ 𝑡0 Si consideramos el caso 𝑠 < 𝑡, la anterior función se puede expresar de la siguiente manera: 𝑡 𝑅(𝑡, 𝑠) = 𝑉𝑎𝑟[𝑋(𝑠)]𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢� 𝑠 José Antonio Anguita Izquierdo Página 14 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Capítulo 2. Curvas de crecimiento El crecimiento es una característica importante en muchos campos de aplicación. El estudio de este fenómeno se asoció inicialmente con la evolución de las poblaciones de animales. Hoy en día, sin embargo, se considera en muchos contextos, por ejemplo, en los de la economía, la biología y la ecología. Por esta razón, se han hecho muchos intentos por construir modelos matemáticos para describir este tipo de comportamiento. Se han propuesto muchas y diversas representaciones del crecimiento, con una amplia variedad de curvas asociadas con modelos deterministas que describen el comportamiento mostrado por cada uno de ellos. Generalmente dichas curvas de crecimiento se clasifican en curvas acotadas y no acotadas. La más representativa del primer grupo es la curva exponencial, que es monótona, cóncava, y se conoce como curva J. El modelo determinista asociado a ella es el modelo de Malthus, propuesto para representar el patrón de comportamiento de las poblaciones humanas. Malthus mantenía que estas poblaciones tenían un crecimiento no acotado cuya relación dependía de la densidad de población. Sin embargo, este modelo sólo es adecuado en condiciones ideales ya que en la naturaleza, todo el crecimiento tiende a ser equilibrado. De hecho, en situaciones de la vida real, las poblaciones no aumentan indefinidamente. Esto nos lleva a considerar modelos que estarán asociados con determinadas curvas acotadas, como la logística, Gompertz, Bertalanffy y Richards. Dichas curvas son conocidas como curvas en forma de S o sigmoidales pues son monótonas y presentan un punto de inflexión donde la curva cambia de cóncava a convexa. Por ello, son usadas en fenómenos de crecimiento con dos características distintivas: crecimiento acotado y tendencia sigmoidal. Estas curvas se han aplicado en numerosos campos del conocimiento y han sido intensamente utilizadas para modelizar y describir patrones de comportamiento. A parte de la aplicación en ecología, donde han servido para el propósito de explicar el crecimiento de poblaciones, por ejemplo, el crecimiento del bosque secundario en el Amazonas Central (Neeff y dos Santos [23]), crecimiento de especies animales y vegetales (Cooper [3], Przybylski y García-Berthou [24], Román-Román, P. y Torres-Ruiz, F [26], [29], etc), también se han utilizado en Biología y Medicina, para el análisis del crecimiento de bacterias y tumores (ver, Tsoularis y Wallace [33], G. Albano et al [1] y sus referencias). Por ejemplo, una de las grandes aplicaciones del modelo Gompertz (Kozusko y Bajzer [20]), fue explicar el crecimiento de tumores en vista de observaciones experimentales, utilizando esta curva en lugar del modelo exponencial que es el que se había considerado siempre. Además, en los últimos años, sus aplicaciones se han ampliado, y las curvas incluso se han empleado en Economía, por ejemplo, para la ilustración de cómo se propaga la innovación (Giovanis y Skiadas, [7]); para el análisis de la producción mundial de petróleo y para localizar picos de producción (Gallagher [6]). Pasamos, a continuación, a describir cada una de las curvas con las que vamos a trabajar en este documento. Hay que destacar, que en todas ellas se ha llevado a cabo una reparametrización de sus José Antonio Anguita Izquierdo Página 15 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo expresiones originales con la finalidad de hacer depender su cota superior de los valores iniciales, lo cual puede ser de utilidad para estudiar el comportamiento de individuos particulares de la población en estudio. • Curva Gompertz Su nombre procede del matemático Benjamin Gompertz, el cual la introduce para un estudio sobre mortalidad humana, como la función doble exponencial siguiente 𝑚𝑞−𝑎 ⎧ 𝑙𝑜𝑔 𝑔 = 1−𝑞𝑟 1 ⎪ ⎪ 𝑞 = 𝑝 �𝑟 𝑥 𝐿𝑋 = 𝑑𝑔𝑞 , con 𝑚 = 𝑙𝑛𝐿𝑎 − 𝑙𝑛𝐿𝑎+𝑟 ⎨ 𝐿 𝑑 = 𝜀𝑎 ⎪ ⎪ 𝑚 𝑙𝑛𝜀 = ⎩ 1−𝑞𝑟 con 𝐿𝑋 : tamaño de la población en el instante x 𝑎: instante inicial 𝑟: unidad de salto considerada en el tiempo 𝑝: razón de la progresión geométrica que hay entre el número de personas vivas en el tiempo. Desde entonces, la curva ha sufrido varios cambios y ha sido reescrita en diversas formas para facilitar su estudio. En este trabajo, se usará una variante de esta curva dada por Tan en 1986: 𝛼 𝑥(𝑡) = 𝑥0 𝑒𝑥𝑝 � �1 − 𝑒 −𝛽(𝑡−𝑡0 ) �� , 𝑡 ≥ 𝑡0 ≥ 0, 𝑐𝑜𝑛 𝛼 > 𝛽 > 0, 0 < 𝑥0 𝛽 Ahora bien, si tomamos 𝛼 = 𝑚𝑒 −𝛽𝑡0 , esta expresión queda reparametrizada de la siguiente forma 𝑚 𝑥(𝑡) = 𝑥0 𝑒𝑥𝑝 � �𝑒 −𝛽𝑡0 − 𝑒 −𝛽𝑡 �� , 𝑡 ≥ 𝑡0 ≥ 0, 𝑐𝑜𝑛 𝑚 > 0, 𝛽 > 0, 0 < 𝑥0 𝛽 Sus características principales son: 1. Estrictamente creciente y acotada. Forma sigmoidal 2. Cota superior: 𝑚 𝑘 = lim 𝑥(𝑡) = 𝑥0 𝑒𝑥𝑝 ( �𝑒 −𝛽𝑡0 �) 𝑡→+∞ 𝛽 3. Presenta un único punto de inflexión en 𝑡𝐼 = � 𝑙𝑛 (𝑚⁄𝛽 ) 𝑘 , � 𝛽 𝑒 que puede ser visible, es decir, 𝑡𝐼 > 𝑡0 sí y sólo sí 𝑚 > 𝛽𝑒 𝛽𝑡0 4. Es solución de la ecuación diferencial José Antonio Anguita Izquierdo 𝑑𝑥(𝑡) = ℎ(𝑡)𝑥(𝑡) � 𝑑𝑡 𝑥(𝑡0 ) = 𝑥0 Página 16 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo con ℎ(𝑡) = 𝑚𝑒 −𝛽𝑡 modelo determinístico asociado a esta clase de problemas de crecimiento. A continuación mostramos algunos ejemplos de la curva. En la cabecera aparecen los valores de los parámetros, donde se ha de entender que cuando sólo aparece un valor en alguno de los parámetros, es que las cuatro curvas toman el mismo, y se corresponden respectivamente con los colores rojo, azul, verde y naranja José Antonio Anguita Izquierdo Página 17 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo • Curva logística La curva logística fue introducida por Verhulst en el siglo XIX, con el propósito de estudiar el crecimiento de poblaciones. En la década de 1920 el interés se reavivó y muchos trabajos de investigación se han centrado en ella desde entonces, debido al hecho de que es un excelente modelo para el desarrollo y evolución de muchos fenómenos de crecimiento. Además ha sido la génesis de muchas de las curvas que aparecieron más tarde (ver Birch, 1999;Tsoularis y Wallace, 2002). El modelo logístico determinista se define en términos de la ecuación diferencial 𝑑𝑥(𝑡) = 𝛼𝑥(𝑡) − 𝛽𝑥 2 (𝑡) � 𝑑𝑡 𝑥(𝑡0 ) = 𝑥0 con 𝛼 y 𝛽 constantes positivas. La constante 𝛼 define la tasa de crecimiento, mientras que el término −𝛽𝑥 2 sirve para inhibir o retardar esta tasa. En este sentido es, en general, 𝛽 menor que 𝛼. La solución del modelo anterior es la curva logística 𝑥(𝑡) = cuya expresión más general es 𝛼 ⁄𝛽 𝛼 ⁄𝛽 1 + ( 𝑥 − 1)𝑒 −𝛼(𝑡−𝑡0 ) 0 𝑥(𝑡) = 𝑎 , 1 + 𝑏𝑒 −𝑐𝑡 , 𝑡 ≥ 𝑡0 ; 𝛼, 𝛽 > 0 𝑎, 𝑏, 𝑐 > 0 Ahora bien, en el presente trabajo, se trabajará con una reparametrización que consigue que el valor de la cota dependa del valor inicial 𝑥0 . Para ello, si asumimos que 𝑓(𝑡0 ) = 𝑥0 > 0, entonces 𝑎 = 𝑥0 (1 + 𝑏𝑒 −𝑐𝑡0 ), luego la nueva expresión de la curva será 𝑥(𝑡) = 𝑥0 1 + 𝑏𝑒 −𝑐𝑡0 , 𝑡 ≥ 𝑡0 ; con (𝑏, 𝑐) ∈ ℝ+ xℝ+ 1 + 𝑏𝑒 −𝑐𝑡 Sus características principales son: 1. Estrictamente creciente y acotada, presentando una figura sigmoidal 2. Cota superior: 3. Presenta un punto de inflexión en 𝑘 = 𝑥0 (1 + 𝑏𝑒 −𝑐𝑡0 ) 𝑡𝐼 = � 𝑙𝑛𝑏 𝑘 , � 𝑐 2 siendo visible sí y sólo sí 𝑏 > 𝑒 𝑐𝑡0 y se observa que el valor de la función en el punto de inflexión es la mitad del crecimiento total. 4. Verifica la ecuación diferencial con 𝑥´(𝑡) = ℎ(𝑡)𝑥(𝑡) ℎ(𝑡) = José Antonio Anguita Izquierdo 𝑏𝑐 𝑏 + 𝑒 𝑐𝑡 Página 18 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo A continuación mostramos algunos ejemplos de la curva. En la cabecera aparecen los valores de los parámetros, donde se ha de entender que cuando sólo aparece un valor en alguno de los parámetros, es que las cuatro curvas toman el mismo, y se corresponden respectivamente con los colores rojo, azul, verde y naranja. José Antonio Anguita Izquierdo Página 19 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo • Curva Bertalanffy El biólogo austriaco Karl Ludwig von Bertalanffy introdujo en 1938, un modelo para estudiar el crecimiento de individuos pertenecientes a poblaciones animales. Dicho modelo, al igual que los principales modelos de crecimiento, surgió tras una adaptación del modelo logístico de Verhulst. En él se asume que la característica en estudio de la población considerada posee un valor máximo (o cota), que puede en teoría ser alcanzado, y que la tasa de crecimiento es proporcional a la diferencia entre dicho valor máximo y el que la población posee en un instante de tiempo determinado. Actualmente es el modelo más comúnmente empleado en el estudio del crecimiento (en longitud o peso) de poblaciones de peces, si bien ha demostrado su utilidad al aplicarlo en otras especies animales, por ejemplo, especies vacunas El modelo está asociado a una curva sigmoidal, conocida como curva de von Bertalanffy, y cuya expresión más extendida es 𝐿(𝑡) = 𝐿∞ �1 − 𝑒 −𝑘(𝑡−𝑎) � donde 𝐿∞ es la cota superior de la variable en estudio, que indica el máximo valor que podría alcanzar la variable cuando el tiempo tiende a infinito, y k es el parámetro de curvatura, o tasa de crecimiento de von Bertalanffy, que indica la velocidad con la que el individuo alcanza la cota. El parámetro a, a veces denominado condición inicial, determina el instante en el que la variable en estudio toma el valor cero, si bien desde el punto de vista biológico no tiene gran importancia ya que es usual que en las primeras etapas de crecimiento la variable considerada no se ajuste bien a este tipo de patrón de crecimiento, adoptándolo en etapas posteriores (cuando realmente se tienen observaciones de dicha variable). Con posterioridad se generalizo la expresión de esta curva, apareciendo la denominada curva de von Bertalanffy generalizada (ver por ejemplo García-Rodríguez et al., [9]): 𝑏 𝑆(𝑡) = 𝑆∞ �1 − 𝑒 −𝑘(𝑡−𝑎) � ; 𝑡 ≥ 𝑎, 𝑘 > 0, 𝑏 ≥ 1 donde el valor b puede ser conocido o desconocido. Por ejemplo, el valor b = 1 es usado cuando la variable en estudio es la longitud. Por otro lado, y teniendo en cuenta la relación existente entre el peso y la longitud, el valor b = 3 está asociado con el peso cuando el crecimiento del animal es isométrico (la relación longitud/peso permanece constante para todos los individuos de la especie), mientras que el caso 𝑏 ≠ 1 está relacionado con el crecimiento alométrico (la relación anterior no permanece constante). En el presente trabajo se utilizará una nueva expresión de la curva de von Bertalanffy generalizada, propuesta por Román-Román y Torres-Ruiz, [42], que como ya hemos mencionado más arriba, hace depender el valor de la cota superior del valor inicial. Para ello, vamos a considerar que el tiempo desde el que vamos a observar la variable (que toma valores positivos) es, en principio, 𝑡0 ≥ 0, con valor asociado 𝑥0 > 0. Con esta hipótesis realista y fijándonos en la anterior expresión, deducimos que 𝑎 < 𝑡0 , ya que esta función es creciente y 𝑆(𝑎) = 0. Por otro lado, suponiendo que 𝑆(𝑡0 ) = 𝑥0 y denotando 𝑐 = 𝑒 𝑘𝑎 , se concluye que José Antonio Anguita Izquierdo Página 20 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑆∞ = de donde se tiene que 𝑥0 (1 − 𝑐𝑒 −𝑘𝑡0 )𝑏 𝑏 1 − 𝑐𝑒 −𝑘𝑡 𝑥(𝑡) = 𝑥0 � � ; 𝑡 ≥ 𝑡0 ; 𝑐, 𝑘 > 0; 𝑏 ≥ 1 1 − 𝑐𝑒 −𝑘𝑡0 Además, dado que la curva toma valores positivos, se debe verificar 𝑡0 > Sus características principales son: 𝑙𝑛𝑐 𝑘 1. Estrictamente creciente y acotada. Sigmoidal 2. Cota superior: 3. Presenta un punto de inflexión en 𝑘 = 𝑥0 /(1 − 𝑐𝑒 −𝑘𝑡0 )𝑏 ln(𝑏𝑐) 1 𝑏 𝑡𝐼 = � , 𝑘 �1 − � � 𝑘 𝑏 cumpliendo que 𝑡𝐼 > 𝑡0 sí y sólo sí 𝑏 > 4. Verifica la ecuación diferencial 𝑒 𝑐𝑡0 𝑞 𝑥´(𝑡) = ℎ(𝑡)𝑥(𝑡) con ℎ(𝑡) = 𝑏𝑐𝑘 −𝑐 𝑒 𝑘𝑡 Curva Bertalanffy para diferentes valores del parámetro c y para k=1,5 José Antonio Anguita Izquierdo Página 21 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo • Curva Richards En 1959 F. J. Richards introdujo la curva que lleva su nombre, extendiendo los trabajos desarrollados por Von Bertalanffy (de hecho algunos autores denominan a esta curva como Bertalanffy-Richards). La idea de este autor fue crear una curva que mostrara una mayor flexibilidad para el ajuste de datos que las existentes hasta la fecha. Su expresión es la siguiente 𝑓(𝑡) = con 𝛼, 𝛽, 𝑝 > 0; 𝑡 ≥ 𝑡0 𝛼 ⁄𝛽 1 𝑝 𝛼 ⁄𝛽 �1 + � 𝑝 − 1� 𝑒𝑥𝑝{−𝑝𝛼(𝑡 − 𝑡0 )}� 𝑥0 Como en los casos anteriores, daremos una reformulación de su expresión, [ver 29], para adaptarla a nuestros propósitos. A partir de la expresión general de la curva 𝑎 𝑓(𝑡) = (1 + 𝑏𝑒𝑥𝑝{−𝑐𝑡})𝑞 con 𝑎, 𝑏, 𝑐, 𝑞 > 0; 𝑡 ≥ 𝑡0 , y obligando a que 𝑓(𝑡0 ) = 𝑥0 > 0, obtenemos que 𝑎 = 𝑥0 (1 + 𝑏𝑒 −𝑐𝑡0 )𝑞 Luego la expresión queda de la siguiente manera 𝑥(𝑡) = 𝑥0 � 1 + 𝑏𝑒 −𝑐𝑡0 � 1 + 𝑏𝑒 −𝑐𝑡 con parámetros 𝜃 = (𝑏, 𝑐, 𝑞)𝑇 ∈ Θ = ℝ+ 𝑥ℝ+ 𝑥 ℝ+ , 𝑡 ≥ 𝑡0 > 𝑞 −𝑙𝑛𝑏 𝑐 Comparando con la expresión anterior encontramos las siguientes relaciones entre los parámetros 𝛼 𝑝 ⎧𝛽 = 𝑥0 [1 + 𝑏𝑒𝑥𝑝{−𝑐𝑡0 }] ⎪ ⎪ 𝑐 = 𝛼𝑝 𝑞 = 1 ⁄𝑝 ⎨ 𝛼 ⁄𝛽 ⎪ ⎪ 𝑏 = � 𝑝 − 1� 𝑒 𝑐𝑡0 𝑥0 ⎩ Sus características principales son: 1. Estrictamente creciente y acotada. Sigmoidal 2. Presenta un punto de inflexión en donde es la cota superior de la curva. 𝑙𝑛 (𝑏𝑞) 𝑞 𝑞 𝑡𝐼 = ( ,𝑘� � ) 𝑐 1+𝑞 𝑘 = 𝑥0 (1 + 𝑏𝑒 −𝑐𝑡0 )𝑞 3. Este punto de inflexión cumple 𝑡𝐼 > 𝑡0 ⇔ 𝑏 > José Antonio Anguita Izquierdo 𝑒 𝑐𝑡0 𝑞 Página 22 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 4. Verifica la ecuación 𝑥´(𝑡) = ℎ(𝑡)𝑥(𝑡) con ℎ(𝑡) = 𝑏𝑐𝑞 𝑏 + 𝑒 𝑐𝑡 Curva Richards para valores de los parámetro c=1,2; b=10 y q=1/3 y distintos instantes iniciales En el siguiente gráfico, para valores constantes de los parámetros c=1.2 y q=3 con instante inicial x(0)=1, podemos observar que cuando b=0.3 el punto de inflexión queda antes de 𝑡0 , y cuando b=1 se observa después. José Antonio Anguita Izquierdo Página 23 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Capítulo 3. Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Como hemos visto en el capítulo anterior, todas las curvas obedecían una ecuación diferencial ordinaria común de la forma 𝑓´(𝑡) = 𝑓(𝑡)ℎ(𝑡). Esto nos permite definir un proceso de difusión lognormal no homogéneo, con función media 𝑓(𝑡), y utilizarlo para modelizar patrones de comportamiento asociados a dichas curva. En este capítulo, desarrollaremos esta teoría, y daremos ejemplos de distintos procesos de difusión no homogéneos asociados a cada tipo de curva. Por un lado, tenemos que la función media y media condicionada de nuestro proceso con distribución inicial 𝑋0 , 𝑚(𝑡) 𝑦 𝑚(𝑡|𝑡0 ), verifican la ecuación ordinaria diferencial siguiente 𝑑𝑥(𝑡) = ℎ(𝑡)𝑥(𝑡) 𝑑𝑡 que como ya dijimos puede ser vista como una generalización del modelo malthusiano con tasa de fertilidad ℎ(𝑡), es decir, � 𝑚´(𝑡) = 𝑚(𝑡)ℎ(𝑡) 𝑚´(𝑡|𝑡0 ) = 𝑚(𝑡|𝑡0 )ℎ(𝑡) Esta propiedad hace que el proceso de difusión definido por la ecuación diferencial estocástica 𝑑𝑋(𝑡) = ℎ(𝑡)𝑋(𝑡)𝑑𝑡 + 𝜎𝑋(𝑡)𝑑𝑊(𝑡) � 𝑋(𝑡0 ) = 𝑋0 permita modelar varios patrones de comportamiento (concretamente aquellos que muestran comportamientos ajustados por 𝑚(𝑡)). Además, la función 𝑚(𝑡|𝑡0 ) permite considerar situaciones en las cuales las propiedades de la función media puedan depender del valor inicial. A continuación, se presenta una familia de curvas de crecimiento verificando la anterior ecuación diferencial ordinaria, para las que es posible definir casos particulares de procesos de difusión lognormales no homogéneos asociados con cada curva. Además, en todos los casos se tiene que la función media (condicionada al valor inicial) de cada proceso coincide con la curva correspondiente Sea 𝑓𝜃 (𝑡) una función positiva en un intervalo [𝑡0 , +∞) verificando: a) Es continua, acotada y diferenciable b) Depende del parámetro 𝜃 = (𝜃1 , … , 𝜃𝑘 )´ ∈ Θ, siendo Θ el espacio paramétrico asociado. c) 𝑓𝜃 (𝑡) = 𝑘(𝜃)𝑔𝜃 (𝑡) con lim𝑡→+∞ 𝑔𝜃 (𝑡) = 1 d) 𝑓´𝜃 (𝑡) = 𝑓𝜃 (𝑡)ℎ𝜃 (𝑡) con ℎ𝜃 (𝑡) una función continua y acotada en [𝑡0 , +∞) e) 𝑓𝜃 (𝑡) tiene al menos un punto de inflexión (en este trabajo trataremos aquellas curvas que presentan un único punto de inflexión) José Antonio Anguita Izquierdo Página 24 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Notemos que la condición d) nos permite considerar un proceso de difusión lognormal no homogéneo del tipo 𝑡 𝑋(𝑡) = 𝑋0 ∙ 𝑒𝑥𝑝 (� ℎ(𝑢)𝑑𝑢 − 𝑡0 𝜎2 (𝑡 − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )�) 2 cuya función media (o media condicionada) tiene un patrón de comportamiento asociado a la función 𝑓𝜃 (𝑡). Para ello debemos considerar ℎ𝜃 (𝑡) = 𝑓´𝜃 (𝑡) 𝑔´𝜃 (𝑡) = 𝑓𝜃 (𝑡) 𝑔𝜃 (𝑡) Además se considerará el caso de que el valor del límite de 𝑓𝜃 (𝑡) cuando 𝑡 → +∞, depende del valor inicial (un razonamiento similar se puede hacer si depende de otro valor de la curva). Luego, si 𝑓𝜃 (𝑡0 ) = 𝑥0 = 𝑘(𝜃)𝑔𝜃 (𝑡) se puede escribir 𝑓𝜃 (𝑡) = 𝑥0 Otras características de la curva son: 𝑔𝜃 (𝑡) 𝑔𝜃 (𝑡0 ) - Los intervalos de crecimiento dependen del signo de ℎ𝜃 (𝑡) - Los instantes en los que se alcanzan los puntos de inflexión son las soluciones de la ecuación ℎ𝜃2 (𝑡) + ℎ𝜃´ (𝑡) = 0 Pasamos ya, a plantear determinados procesos de difusión no homogéneos asociados a las curvas Gompertz, logística, Bertalanffy y Richards. 3.1. Proceso de difusión tipo Gompertz Este proceso asociado a la curva Gompertz 𝑓𝜃 (𝑡) = 𝑥0 𝑒𝑥𝑝 � 𝑚 −𝛽𝑡 �𝑒 0 − 𝑒 −𝛽𝑡 �� 𝛽 con parámetros 𝜃 = (𝑚, 𝛽)𝑇 ∈ Θ = ℝ+ 𝑥ℝ+ , 𝑡 ≥ 𝑡0 > 0, es una difusión definida en ℝ+ y con momentos infinitesimales 𝐴1 (𝑥, 𝑡) = 𝑚𝑒 −𝛽𝑡 𝑥; proceso de difusión lognormal no homogénea con 𝐴2 (𝑥) = 𝜎 2 𝑥 2, es decir, es un caso particular del ℎ𝜃 (𝑡) = 𝑚𝑒 −𝛽𝑡 Luego sus trayectorias serán de la forma 𝜎2 𝑚 −𝛽𝑡 �𝑒 0 − 𝑒 −𝛽𝑡 � − (𝑡 − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )�� 2 𝛽 𝑋(𝑡) = 𝑥0 ∙ exp � con asíntota de la forma José Antonio Anguita Izquierdo 𝑚 𝑘(𝜃) = 𝑥0 𝑒𝑥𝑝 ( �𝑒 −𝛽𝑡0 � 𝛽 Página 25 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo La función de probabilidad de transición del proceso es 2 𝜎2 𝑥 𝑚 �𝑙𝑛 𝑦 + �𝑒 −𝛽𝑡 − 𝑒 −𝛽𝑠 � + 2 (𝑡 − 𝑠)� 1 𝛽 𝑓(𝑥, 𝑡|𝑦, 𝑠) = exp (− ,𝑡 > 𝑠 2 2𝜎 2 (𝑡 − 𝑠) 𝑥�2𝜋𝜎 (𝑡 − 𝑠) que se corresponde con una distribución lognormal [𝑋(𝑡)|𝑋(𝑠) = 𝑦]~𝛬1 �𝑙𝑛𝑦 − 𝜎2 𝑚 −𝛽𝑡 − 𝑒 −𝛽𝑠 � − (𝑡 − 𝑠); 𝜎 2 (𝑡 − 𝑠)� , 𝑡 > 𝑠 �𝑒 2 𝛽 Utilizando que el proceso es de Markov y que la distribución inicial 𝑋0 ~Λ1 (𝜇0 , 𝜎02 ), se deduce que las distribuciones finito-dimensionales son lognormales. En concreto, la distribución unidimensional y bidimensional siguen las siguientes distribuciones Para 𝑡, 𝑠 > 𝑡0 𝑋(𝑡)~𝛬1 [𝜇0 − 𝜎2 𝑚 −𝛽𝑡 − 𝑒 −𝛽𝑡0 � − (𝑡 − 𝑡0 ); 𝜎02 + 𝜎 2 (𝑡 − 𝑡0 )] �𝑒 2 𝛽 2 ⎡ 𝜇 + 𝑚 �𝑒 −𝛽𝑡 − 𝑒 −𝛽𝑡0 � − 𝜎 (𝑡 − 𝑡 ) 0 0 ⎞ 2 𝑡−𝑡 𝑋(𝑡) 2 𝛽 ⎢⎛ � � ~Λ2 ⎢⎜ ; 𝜎0 𝐼2 + 𝜎 2 �𝑡 ∧ 𝑠 −0𝑡 2 ⎟ 𝑋(𝑠) 𝜎 𝑚 0 ⎢ 𝜇0 + �𝑒 −𝛽𝑠 − 𝑒 −𝛽𝑡0 � − (𝑠 − 𝑡0 ) 2 𝛽 ⎣⎝ ⎠ Las características principales en este caso son: ⎤ 𝑡 ∧ 𝑠 − 𝑡0 ⎥ 𝑠 − 𝑡0 �⎥, ⎥ ⎦ Función media Función moda 𝑚 𝑚(𝑡) = 𝐸[𝑋(𝑡0 )]𝑒𝑥𝑝 ( �𝑒 −𝛽𝑡0 − 𝑒 −𝛽𝑡 �), 𝑡 ≥ 𝑡0 𝛽 𝑚 −𝛽𝑡 3𝜎 2 (𝑡 − 𝑡0 ), 𝑡 ≥ 𝑡0 �𝑒 0 − 𝑒 −𝛽𝑡 �� 𝑒𝑥𝑝 (− 𝛽 2 𝑀𝑜(𝑡) = 𝑀𝑜𝑑𝑒[𝑋(𝑡0 )]𝑒𝑥𝑝 � Función cuantil de orden 𝛼 𝑚 −𝛽𝑡 𝜎2 �𝑒 0 − 𝑒 −𝛽𝑡 �� 𝑒𝑥𝑝 �− (𝑡 − 𝑡0 ) 𝛽 2 𝐶𝛼 (𝑡) = 𝛼 − 𝑐𝑢𝑎𝑛𝑡𝑖𝑙[𝑋(𝑡0 )]𝑒𝑥𝑝 � + 𝑧𝛼 ��𝜎 2 (𝑡 − 𝑡0 ) + 𝑉𝑎𝑟�𝑙𝑛𝑋(𝑡0 )� − �𝑉𝑎𝑟�𝑙𝑛𝑋(𝑡0 )��� con 𝑧𝛼 el 𝛼-ésimo cuantil de una normal estándar En cuanto a las expresiones condicionadas, dados s y 𝑥𝑠 , se tiene: Función media condicionada: 𝑚 −𝛽𝑠 − 𝑒 −𝛽𝑡 �� , 𝑡 > 𝑠 ≥ 𝑡0 �𝑒 𝛽 𝑚(𝑡|𝑠) = 𝑥𝑠 𝑒𝑥𝑝 � Función moda condicionada: 𝑀𝑜(𝑡|𝑠) = 𝑥𝑠 𝑒𝑥𝑝 � José Antonio Anguita Izquierdo 3𝜎 2 𝑚 −𝛽𝑠 − 𝑒 −𝛽𝑡 � − (𝑡 − 𝑠) �𝑒 � , 𝑡 > 𝑠 ≥ 𝑡0 2 𝛽 Página 26 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Función cuantil condicionada de orden alfa: 𝜎2 𝑚 −𝛽𝑠 − 𝑒 −𝛽𝑡 �� 𝑒𝑥𝑝 �− (𝑡 − 𝑠) + 𝑧𝛼 ��𝜎 2 (𝑡 − 𝑠)�� 𝑡 > 𝑠 ≥ 𝑡0 �𝑒 2 𝛽 𝐶𝛼 (𝑡|𝑠) = 𝑥𝑠 𝑒𝑥𝑝 � Otras características: Momentos de orden 𝑛: 𝐸[𝑋(𝑡)𝑛 ] = 𝐸[𝑋(𝑡0 )𝑛 ]𝑒𝑥𝑝 � Función Varianza: 𝑉𝑎𝑟[𝑋(𝑡)] = 𝑒𝑥𝑝 � Función Covarianza 2𝑚 −𝛽𝑡 2 2 �𝑒 0 − 𝑒 −𝛽𝑡) �� �𝑉𝑎𝑟[𝑋(𝑡0 )]𝑒 𝜎 (𝑡−𝑡0 ) + 𝐸 2 [𝑋(𝑡0 )]�𝑒 𝜎 (𝑡−𝑡0 ) − 1��, 𝑡 ≥ 𝑡0 𝛽 𝑅(𝑡, 𝑠) = 𝐶𝑜𝑣[𝑋(𝑡), 𝑋(𝑠)] 2 = 𝑒 2𝜇0 +𝜎0 𝑒𝑥𝑝 � Si 𝑠 < 𝑡: 𝑛𝑚 −𝛽𝑠 𝑛𝜎 2 (𝑡 − 𝑡0 )(𝑛 − 1)� , 𝑡 ≥ 𝑡0 − 𝑒 −𝛽𝑡 � + �𝑒 𝛽 2 ≥ 𝑡0 𝑚 �2𝑒 −𝛽𝑡0 − 𝑒 −𝛽𝑡 − 𝑒 −𝛽𝑠) �� [𝑒𝑥𝑝(𝜎 2 (𝑡 ∧ 𝑠 − 𝑡0 ) + 𝜎02 ) − 1], 𝑠, 𝑡 𝛽 𝑅(𝑡, 𝑠) = 𝑉𝑎𝑟[𝑋(𝑠)]𝑒𝑥𝑝 � 𝑚 −𝛽𝑠 − 𝑒 −𝛽𝑡) �� �𝑒 𝛽 3.2. Proceso de difusión tipo von Bertalanffy El proceso de difusión relacionado con la curva von Bertalanffy 1 − 𝑐𝑒 −𝑘𝑡 𝑓𝜃 (𝑡) = 𝑥0 � � 1 − 𝑐𝑒 −𝑘𝑡0 𝑏 con parámetros 𝜃 = (𝑐, 𝑘, 𝑏)𝑇 ∈ Θ = ℝ+ 𝑥ℝ+ 𝑥 [1, +∞), 𝑡 ≥ 𝑡0 > de difusión lognormal no homogéneo considerando Luego posee los momentos infinitesimales 𝐴1 (𝑥, 𝑡) = 𝑏𝑐𝑘 𝑥; 𝑒 𝑘𝑡 −𝑐 ℎ𝜃 (𝑡) = 𝑙𝑛𝑐 , 𝑘 es un caso particular del proceso 𝑏𝑐𝑘 𝑒 𝑘𝑡 − 𝑐 𝐴2 (𝑥) = 𝜎 2 𝑥 2 , y toma valores en ℝ+ . La distribución de probabilidad del proceso, determinado por las distribuciones finito- dimensionales, puede obtenerse a partir de la teoría de las ecuaciones diferenciales estocásticas, aplicada a la ecuación José Antonio Anguita Izquierdo Página 27 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo � 𝑑𝑋(𝑡) = 𝑏𝑐𝑘 𝑋(𝑡)𝑑𝑡 𝑒 𝑘𝑡 −𝑐 + 𝜎𝑋(𝑡)𝑑𝑊(𝑡) , 𝜎 > 0, 𝑋(𝑡0 ) = 𝑋0 cuya solución nos proporciona las trayectorias del proceso 1−𝑐𝑒 −𝑘𝑡 con asíntotas 𝑏 𝜎2 (𝑡 2 𝑋(𝑡) = 𝑥0 ∙ �1−𝑐𝑒 −𝑘𝑡0 � 𝑒𝑥 𝑝 �− 𝑘(𝜃) = − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )�� , 𝑡 ≥ 𝑡0 , 𝑥0 (1 − 𝑐𝑒 −𝑘𝑡0 )𝑏 La función de distribución del proceso es 2 1 − 𝑐𝑒 −𝑘𝑡 𝜎2 𝑥 − 𝑏𝑙𝑛 � � + (𝑡 − 𝑠)� ⎞ �𝑙𝑛 1 ⎛ 2 𝑦 1 − 𝑐𝑒 −𝑘𝑠 𝑓(𝑥, 𝑡|𝑦, 𝑠) = exp ⎜− ⎟ ,𝑡 > 𝑠 2𝜎 2 (𝑡 − 𝑠) 𝑥�2𝜋𝜎 2 (𝑡 − 𝑠) ⎝ que corresponde a una distribución lognormal de la forma [𝑋(𝑡)|𝑋(𝑠) = 𝑦]~𝛬1 �𝑙𝑛𝑦 + 𝑏𝑙𝑛 � ⎠ 𝜎2 1 − 𝑐𝑒 −𝑘𝑡 (𝑡 − 𝑠); 𝜎 2 (𝑡 − 𝑠)� , 𝑡 > 𝑠 − � 1 − 𝑐𝑒 −𝑘𝑠 2 Análogamente a lo planteado para el proceso tipo Gompertz, las distribuciones unidimensional y bidimensional serán Para 𝑡, 𝑠 > 𝑡0 𝑋(𝑡)~𝛬1 [𝜇0 + 𝑏𝑙𝑛 � 𝜎2 1 − 𝑐𝑒 −𝑘𝑡 (𝑡 − 𝑡0 ); 𝜎02 + 𝜎 2 (𝑡 − 𝑡0 )] − � 1 − 𝑐𝑒 −𝑘𝑡0 2 𝜎2 1 − 𝑐𝑒 −𝑘𝑡 ⎡ 𝜇0 + 𝑏𝑙𝑛 � (𝑡 − 𝑡0 ) − � 1 − 𝑐𝑒 −𝑘𝑡0 2 ⎞ 2 𝑡−𝑡 𝑋(𝑡) ⎢⎛ � ~Λ2 ⎢⎜ � ; 𝜎0 𝐼2 + 𝜎 2 �𝑡 ∧ 𝑠 −0𝑡 ⎟ −𝑘𝑠 2 𝑋(𝑠) 0 𝜎 1 − 𝑐𝑒 ⎢ 𝜇0 + 𝑏𝑙𝑛 � � − (𝑠 − 𝑡0 ) −𝑘𝑡 0 1 − 𝑐𝑒 2 ⎣⎝ ⎠ En general, ∀𝑛 ∈ ℕ 𝑦 𝑡1 < 𝑡2 < ⋯ < 𝑡𝑛 , se tendrá que ⎤ 𝑡 ∧ 𝑠 − 𝑡0 ⎥ 𝑠 − 𝑡0 �⎥ ⎥ ⎦ �𝑋(𝑡1 ), 𝑋(𝑡2 ), … , 𝑋(𝑡𝑛 )�´ ∼ Λ 𝑛 (𝜇, Σ) donde las componentes del vector 𝜇 = (𝜇1 , … , 𝜇𝑛 )´ y 𝛴 = �𝜎𝑖𝑗 �, 𝑖, 𝑗 = 1, … , 𝑛 con 𝜇𝑖 = 𝜇0 + 𝑏𝑙𝑛 � 𝜎2 1 − 𝑐𝑒 −𝑘𝑡𝑖 (𝑡 − 𝑡0 ), 𝑖 = 1, … , 𝑛 − � 1 − 𝑐𝑒 −𝑘𝑡0 2 𝑖 𝜎𝑖𝑗 = 𝜎02 + 𝜎 2 �𝑀𝑖𝑛{𝑡𝑖 , 𝑡𝑗 } − 𝑡0 �, 𝑖, 𝑗 = 1, … , 𝑛 Las características principales del proceso son: Función media: 𝑏 Función moda: 1 − 𝑐𝑒 −𝑘𝑡 𝑚(𝑡) = 𝐸[𝑋(𝑡0 )] � � , 𝑡 ≥ 𝑡0 1 − 𝑐𝑒 −𝑘𝑡0 José Antonio Anguita Izquierdo Página 28 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑏 1 − 𝑐𝑒 −𝑘𝑡 3𝜎 2 (𝑡 − 𝑡0 ), 𝑡 ≥ 𝑡0 𝑀𝑜(𝑡) = 𝑀𝑜𝑑𝑒[𝑋(𝑡0 )] � 𝑒𝑥𝑝 (− � 1 − 𝑐𝑒 −𝑘𝑡0 2 Función cuantil de orden 𝛼 : 𝑏 1 − 𝑐𝑒 −𝑘𝑡 𝜎2 (𝑡 − 𝑡0 ) 𝑒𝑥𝑝 𝐶𝛼 (𝑡) = 𝛼 − 𝑐𝑢𝑎𝑛𝑡𝑖𝑙[𝑋(𝑡0 )] � � �− 1 − 𝑐𝑒 −𝑘𝑡0 2 + 𝑧𝛼 ��𝜎 2 (𝑡 − 𝑡0 ) + 𝑉𝑎𝑟�𝑙𝑛𝑋(𝑡0 )� − �𝑉𝑎𝑟�𝑙𝑛𝑋(𝑡0 )��� con 𝑧𝛼 el 𝛼-ésimo cuantil de una normal estándar En cuanto a las expresiones condicionadas, dados s y 𝑥𝑠 , se tiene: Función media condicionada 𝑏 Función moda condicionada: 1 − 𝑐𝑒 −𝑘𝑡 𝑚(𝑡|𝑠) = 𝑥𝑠 � � ,𝑡 > 𝑠 1 − 𝑐𝑒 −𝑘𝑠 𝑏 1 − 𝑐𝑒 −𝑘𝑡 3𝜎 2 𝑀𝑜(𝑡|𝑠) = 𝑥𝑠 � 𝑒𝑥𝑝 − 𝑠) � �,𝑡 > 𝑠 �−(𝑡 1 − 𝑐𝑒 −𝑘𝑡0 2 Función cuantil condicionada de orden alfa: 𝑏 1 − 𝑐𝑒 −𝑘𝑡 𝜎2 (𝑡 − 𝑠) + 𝑧𝛼 ��𝜎 2 (𝑡 − 𝑠)�� 𝑡 > 𝑠 𝐶𝛼 (𝑡|𝑠) = 𝑥𝑠 � 𝑒𝑥𝑝 � �− 1 − 𝑐𝑒 −𝑘𝑡0 2 Otras características, para t y s cualesquiera: Momentos de orden 𝑛: 𝐸[𝑋(𝑡)𝑛 ] = 𝐸[𝑋(𝑡0 )𝑛 ] � Función Varianza: 1 − 𝑐𝑒 −𝑘𝑡 𝑉𝑎𝑟[𝑋(𝑡)] = � � 1 − 𝑐𝑒 −𝑘𝑡0 2𝑏 Función Covarianza 1 − 𝑐𝑒 −𝑘𝑡 � 1 − 𝑐𝑒 −𝑘𝑡0 𝑛𝑏 �𝑉𝑎𝑟[𝑋(𝑡0 )]𝑒 𝜎 𝑛𝜎 2 (𝑡 − 𝑡0 )(𝑛 − 1)� , 𝑡 ≥ 𝑡0 𝑒𝑥𝑝 � 2 2 (𝑡−𝑡 𝑏 0) + 𝐸 2 [𝑋(𝑡0 )]�𝑒 𝜎 2 (𝑡−𝑡 0) − 1��, 𝑡 ≥ 𝑡0 𝑏 1 − 𝑐𝑒 −𝑘𝑡 1 − 𝑐𝑒 −𝑘𝑠 2 2 2 𝑅(𝑡, 𝑠) = 𝐶𝑜𝑣[𝑋(𝑡), 𝑋(𝑠)] = � � � � 𝑒 2𝜇0 +𝜎0 �𝑒 𝜎 (𝑡∧𝑠−𝑡0 )+𝜎0 − 1�, 𝑠, 𝑡 ≥ 𝑡0 −𝑘𝑡 −𝑘𝑡 0 0 1 − 𝑐𝑒 1 − 𝑐𝑒 Si 𝑠 < 𝑡: 𝑅(𝑡, 𝑠) = 𝑉𝑎𝑟[𝑋(𝑠)] � José Antonio Anguita Izquierdo 1 − 𝑐𝑒 −𝑘𝑡 � 1 − 𝑐𝑒 −𝑘𝑠 𝑏 Página 29 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 3.3. Proceso de difusión tipo Richards El proceso de difusión relacionado con la curva Richards 1 + 𝑏𝑒 −𝑐𝑡0 𝑓𝜃 (𝑡) = 𝑥0 � � 1 + 𝑏𝑒 −𝑐𝑡 con parámetros 𝜃 = (𝑏, 𝑐, 𝑞)𝑇 ∈ Θ = ℝ+ xℝ+ x ℝ+ , 𝑡 ≥ 𝑡0 > difusión lognormal no homogéneo considerando Luego posee los momentos infinitesimales ℎ𝜃 (𝑡) = 𝐴1 (𝑥, 𝑡) = Las trayectorias del proceso son 𝑞 𝑞 −𝑙𝑛𝑏 , 𝑐 es un caso particular del proceso de 𝑏𝑐𝑞 𝑏 + 𝑒 𝑐𝑡 𝑏𝑐𝑞 𝑥 𝑏 + 𝑒 𝑐𝑡 𝐴2 (𝑥) = 𝜎 2 𝑥 2 . 1 + 𝑏𝑒 −𝑐𝑡0 𝜎2 (𝑡 − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )�� , 𝑡 ≥ 𝑡0 𝑒𝑥 𝑝 �− 𝑋(𝑡) = 𝑥0 ∙ � � 1 + 𝑏𝑒 −𝑐𝑡 2 con asíntotas 𝑘(𝜃) = 𝑥0 (1 + 𝑏𝑒 −𝑐𝑡0 )𝑞 La función de distribución del proceso es 2 1 + 𝑏𝑒 −𝑐𝑠 𝜎2 𝑥 − 𝑞𝑙𝑛 � � + �𝑙𝑛 1 ⎛ 2 (𝑡 − 𝑠)� ⎞ 𝑦 1 + 𝑏𝑒 −𝑐𝑡 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 𝑒𝑥𝑝 ⎜− ⎟,𝑡 > 𝑠 2𝜎 2 (𝑡 − 𝑠) 𝑥�2𝜋𝜎 2 (𝑡 − 𝑠) ⎝ que corresponde a una distribución lognormal de la forma [𝑋(𝑡)|𝑋(𝑠) = 𝑦]~𝛬1 �𝑙𝑛𝑦 + 𝑞𝑙𝑛 � ⎠ 𝜎2 1 + 𝑏𝑒 −𝑐𝑠 � − (𝑡 − 𝑠); 𝜎 2 (𝑡 − 𝑠)� , 𝑡 > 𝑠 1 + 𝑏𝑒 −𝑐𝑡 2 Las distribuciones unidimensional y bidimensional serán Para 𝑡, 𝑠 > 𝑡0 𝑋(𝑡)~𝛬1 [𝜇0 + 𝑞𝑙𝑛 � 𝜎2 1 + 𝑏𝑒 −𝑐𝑡0 (𝑡 − 𝑡0 ); 𝜎02 + 𝜎 2 (𝑡 − 𝑡0 )] − � 1 + 𝑏𝑒 −𝑐𝑡 2 𝜎2 1 + 𝑏𝑒 −𝑐𝑡0 ⎡ 𝜇0 + 𝑞𝑙𝑛 � (𝑡 − 𝑡0 ) − � 1 + 𝑏𝑒 −𝑐𝑡 2 ⎞ 2 𝑡 − 𝑡0 𝑋(𝑡) ⎢⎛ 2 � � ~Λ2 ⎢⎜ ; 𝜎 𝐼 + 𝜎 � 2 0 −𝑐𝑡 2 ⎟ 𝑡 ∧ 𝑠 − 𝑡0 𝑋(𝑠) 𝜎 1 + 𝑏𝑒 0 ⎢ 𝜇0 + 𝑞𝑙𝑛 � � − (𝑠 − 𝑡0 ) −𝑐𝑠 1 + 𝑏𝑒 2 ⎣⎝ ⎠ José Antonio Anguita Izquierdo ⎤ 𝑡 ∧ 𝑠 − 𝑡0 ⎥ 𝑠 − 𝑡0 �⎥ ⎥ ⎦ Página 30 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo En general, ∀𝑛 ∈ ℕ 𝑦 𝑡1 < 𝑡2 < ⋯ < 𝑡𝑛 , se tendrá que �𝑋(𝑡1 ), 𝑋(𝑡2 ), … , 𝑋(𝑡𝑛 )�´ ∼ Λ 𝑛 (𝜇, Σ) donde las componentes del vector 𝜇 = (𝜇1 , … , 𝜇𝑛 )´ y 𝛴 = �𝜎𝑖𝑗 �, 𝑖, 𝑗 = 1, … , 𝑛 con 𝜇𝑖 = 𝜇0 + 𝑞𝑙𝑛 � 𝜎2 1 + 𝑏𝑒 −𝑐𝑡0 (𝑡 − 𝑡0 ), 𝑖 = 1, … , 𝑛 − � 1 + 𝑏𝑒 −𝑐𝑡𝑖 2 𝑖 𝜎𝑖𝑗 = 𝜎02 + 𝜎 2 �𝑀𝑖𝑛{𝑡𝑖 , 𝑡𝑗 } − 𝑡0 �, 𝑖, 𝑗 = 1, … , 𝑛 Las características principales del proceso son: Función media: 𝑞 1 + 𝑏𝑒 −𝑐𝑡0 𝑚(𝑡) = 𝐸[𝑋(𝑡0 )] � � , 𝑡 ≥ 𝑡0 1 + 𝑏𝑒 −𝑐𝑡 Función moda: 𝑞 1 + 𝑏𝑒 −𝑐𝑡0 3𝜎 2 (𝑡 − 𝑡0 ), 𝑡 ≥ 𝑡0 𝑀𝑜(𝑡) = 𝑀𝑜𝑑𝑒[𝑋(𝑡0 )] � 𝑒𝑥𝑝 (− � 1 + 𝑏𝑒 −𝑐𝑡 2 Función cuantil de orden 𝛼 : 𝑞 1 + 𝑏𝑒 −𝑐𝑡0 𝜎2 (𝑡 − 𝑡0 ) 𝐶𝛼 (𝑡) = 𝛼 − 𝑐𝑢𝑎𝑛𝑡𝑖𝑙[𝑋(𝑡0 )] � 𝑒𝑥𝑝 � �− 1 + 𝑏𝑒 −𝑐𝑡 2 + 𝑧𝛼 ��𝜎 2 (𝑡 − 𝑡0 ) + 𝑉𝑎𝑟�𝑙𝑛𝑋(𝑡0 )� − �𝑉𝑎𝑟�𝑙𝑛𝑋(𝑡0 )��� con 𝑧𝛼 el 𝛼-ésimo cuantil de una normal estándar En cuanto a las expresiones condicionadas, dados s y 𝑥𝑠 , se tiene: Función media condicionada: Función moda condicionada: 𝑚(𝑡|𝑠) = 𝑥𝑠 � 𝑞 1 + 𝑏𝑒 −𝑐𝑡0 � ,𝑡 > 𝑠 1 + 𝑏𝑒 −𝑐𝑡 𝑞 1 + 𝑏𝑒 −𝑐𝑡0 3𝜎 2 𝑀𝑜(𝑡|𝑠) = 𝑥𝑠 � 𝑒𝑥𝑝 − 𝑠) � �,𝑡 > 𝑠 �−(𝑡 1 + 𝑏𝑒 −𝑐𝑡 2 Función cuantil condicionada de orden alfa: 𝑞 1 + 𝑏𝑒 −𝑐𝑡0 𝜎2 (𝑡 − 𝑠) + 𝑧𝛼 ��𝜎 2 (𝑡 − 𝑠)�� 𝑡 > 𝑠 𝐶𝛼 (𝑡|𝑠) = 𝑥𝑠 � 𝑒𝑥𝑝 � �− 1 + 𝑏𝑒 −𝑐𝑡 2 Otras características, para t y s cualesquiera: Momentos de orden 𝑛: 𝑛] 𝐸[𝑋(𝑡) Función Varianza: 𝑛] = 𝐸[𝑋(𝑡0 ) José Antonio Anguita Izquierdo 1 + 𝑏𝑒 −𝑐𝑡0 � � 1 + 𝑏𝑒 −𝑐𝑡 𝑛𝑞 𝑛𝜎 2 (𝑡 − 𝑡0 )(𝑛 − 1)� , 𝑡 ≥ 𝑡0 𝑒𝑥𝑝 � 2 Página 31 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 2𝑞 1 + 𝑏𝑒 −𝑐𝑡0 𝑉𝑎𝑟[𝑋(𝑡)] = � � 1 + 𝑏𝑒 −𝑐𝑡 Función Covarianza �𝑉𝑎𝑟[𝑋(𝑡0 )]𝑒 𝜎 2 (𝑡−𝑡 0) + 𝐸 2 [𝑋(𝑡0 )]�𝑒 𝜎 𝑞 2 (𝑡−𝑡 0) − 1��, 𝑡 ≥ 𝑡0 𝑞 1 + 𝑏𝑒 −𝑐𝑡0 1 + 𝑏𝑒 −𝑐𝑡0 2 2 2 𝑅(𝑡, 𝑠) = 𝐶𝑜𝑣[𝑋(𝑡), 𝑋(𝑠)] = � � � � 𝑒 2𝜇0 +𝜎0 �𝑒 𝜎 (𝑡∧𝑠−𝑡0 )+𝜎0 − 1�, 𝑠, 𝑡 ≥ 𝑡0 −𝑐𝑡 −𝑐𝑠 1 + 𝑏𝑒 1 + 𝑏𝑒 Si 𝑠 < 𝑡: 𝑅(𝑡, 𝑠) = 𝑉𝑎𝑟[𝑋(𝑠)] � 1 + 𝑏𝑒 −𝑐𝑠 � 1 + 𝑏𝑒 −𝑐𝑡 𝑞 3.4. Proceso de difusión tipo logístico El proceso de difusión relacionado con la curva Richards 𝑓𝜃 (𝑡) = 𝑥0 1 + 𝑏𝑒 −𝑐𝑡0 1 + 𝑏𝑒 −𝑐𝑡 con parámetros 𝜃 = (𝑏, 𝑐)𝑇 ∈ Θ = ℝ+ 𝑥ℝ+ , 𝑡 ≥ 𝑡0 > lognormal no homogéneo considerando Luego posee los momentos infinitesimales 𝐴1 (𝑥, 𝑡) = ℎ𝜃 (𝑡) = 𝑏𝑐 𝑥 𝑏 + 𝑒 𝑐𝑡 −𝑙𝑛𝑏 , 𝑐 es un caso particular del proceso de difusión 𝑏𝑐 𝑏 + 𝑒 𝑐𝑡 𝐴2 (𝑥) = 𝜎 2 𝑥 2 Las trayectorias del proceso serán en este caso con asíntotas 𝑋(𝑡) = 𝑥0 ∙ 1 + 𝑏𝑒 −𝑐𝑡0 𝜎2 (𝑡 − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )�� , 𝑡 ≥ 𝑡0 𝑒𝑥 𝑝 �− 1 + 𝑏𝑒 −𝑐𝑡 2 𝑘(𝜃) = 𝑥0 (1 + 𝑏𝑒 −𝑐𝑡0 ) Su correspondiente función de distribución del proceso será 2 1 + 𝑏𝑒 −𝑐𝑠 𝜎2 𝑥 − 𝑙𝑛 � � + �𝑙𝑛 1 2 (𝑡 − 𝑠)� 𝑦 1 + 𝑏𝑒 −𝑐𝑡 exp (− ,𝑡 > 𝑠 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 2𝜎 2 (𝑡 − 𝑠) 𝑥�2𝜋𝜎 2 (𝑡 − 𝑠) que corresponde a una distribución lognormal de la forma [𝑋(𝑡)|𝑋(𝑠) = 𝑦]~𝛬1 �𝑙𝑛𝑦 + 𝑞𝑙𝑛 � 𝜎2 1 + 𝑏𝑒 −𝑐𝑠 (𝑡 − 𝑠); 𝜎 2 (𝑡 − 𝑠)� , 𝑡 > 𝑠 − � 1 + 𝑏𝑒 −𝑐𝑡 2 Las distribuciones unidimensional y bidimensional serán José Antonio Anguita Izquierdo Página 32 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑋(𝑡)~𝛬1 [𝜇0 + 𝑙𝑛 � 𝜎2 1 + 𝑏𝑒 −𝑐𝑡0 (𝑡 − 𝑡0 ); 𝜎02 + 𝜎 2 (𝑡 − 𝑡0 )] − � 1 + 𝑏𝑒 −𝑐𝑡 2 Para 𝑡, 𝑠 > 𝑡0 𝜎2 1 + 𝑏𝑒 −𝑐𝑡0 ⎡ 𝜇0 + 𝑙𝑛 � � − (𝑡 − 𝑡0 ) 1 + 𝑏𝑒 −𝑐𝑡 2 ⎞ 2 𝑡 − 𝑡0 𝑋(𝑡) ⎢⎛ 2 � � ~Λ 2 ⎢⎜ −𝑐𝑡 2 ⎟ ; 𝜎0 𝐼2 + 𝜎 �𝑡 ∧ 𝑠 − 𝑡0 𝑋(𝑠) 𝜎 1 + 𝑏𝑒 0 ⎢ 𝜇0 + 𝑙𝑛 � � − (𝑠 − 𝑡0 ) 1 + 𝑏𝑒 −𝑐𝑠 2 ⎣⎝ ⎠ En general, ∀𝑛 ∈ ℕ 𝑦 𝑡1 < 𝑡2 < ⋯ < 𝑡𝑛 , se tendrá que ⎤ 𝑡 ∧ 𝑠 − 𝑡0 ⎥ 𝑠 − 𝑡0 �⎥ ⎥ ⎦ �𝑋(𝑡1 ), 𝑋(𝑡2 ), … , 𝑋(𝑡𝑛 )�´ ∼ Λ 𝑛 (𝜇, Σ) donde las componentes del vector 𝜇 = (𝜇1 , … , 𝜇𝑛 )´ y 𝛴 = �𝜎𝑖𝑗 �, 𝑖, 𝑗 = 1, … , 𝑛 con 𝜇𝑖 = 𝜇0 + 𝑙𝑛 � 𝜎2 1 + 𝑏𝑒 −𝑐𝑡0 (𝑡 − 𝑡0 ), 𝑖 = 1, … , 𝑛 − � 1 + 𝑏𝑒 −𝑐𝑡𝑖 2 𝑖 𝜎𝑖𝑗 = 𝜎02 + 𝜎 2 �𝑀𝑖𝑛{𝑡𝑖 , 𝑡𝑗 } − 𝑡0 �, 𝑖, 𝑗 = 1, … , 𝑛 Las características principales del proceso son: Función media: 𝑚(𝑡) = 𝐸[𝑋(𝑡0 )] Función moda: 𝑀𝑜(𝑡) = 𝑀𝑜𝑑𝑒[𝑋(𝑡0 )] Función cuantil de orden 𝛼 : 𝐶𝛼 (𝑡) = 𝛼 − 𝑐𝑢𝑎𝑛𝑡𝑖𝑙[𝑋(𝑡0 )] 1 + 𝑏𝑒 −𝑐𝑡0 , 𝑡 ≥ 𝑡0 1 + 𝑏𝑒 −𝑐𝑡 3𝜎 2 1 + 𝑏𝑒 −𝑐𝑡0 (𝑡 − 𝑡0 ), 𝑡 ≥ 𝑡0 𝑒𝑥𝑝 (− 1 + 𝑏𝑒 −𝑐𝑡 2 𝜎2 1 + 𝑏𝑒 −𝑐𝑡0 (𝑡 − 𝑡0 ) 𝑒𝑥𝑝 �− 1 + 𝑏𝑒 −𝑐𝑡 2 + 𝑧𝛼 ��𝜎 2 (𝑡 − 𝑡0 ) + 𝑉𝑎𝑟�𝑙𝑛𝑋(𝑡0 )� − �𝑉𝑎𝑟�𝑙𝑛𝑋(𝑡0 )��� con 𝑧𝛼 el 𝛼-ésimo cuantil de una normal estándar En cuanto a las expresiones condicionadas, dados s y 𝑥𝑠 , se tiene: Función media condicionada: 𝑚(𝑡|𝑠) = 𝑥𝑠 Función moda condicionada: 𝑀𝑜(𝑡|𝑠) = 𝑥𝑠 1 + 𝑏𝑒 −𝑐𝑡0 ,𝑡 > 𝑠 1 + 𝑏𝑒 −𝑐𝑡 3𝜎 2 1 + 𝑏𝑒 −𝑐𝑡0 𝑒𝑥𝑝 − 𝑠) �,𝑡 > 𝑠 �−(𝑡 1 + 𝑏𝑒 −𝑐𝑡 2 Función cuantil condicionada de orden alfa: 𝐶𝛼 (𝑡|𝑠) = 𝑥𝑠 𝜎2 1 + 𝑏𝑒 −𝑐𝑡0 (𝑡 − 𝑠) + 𝑧𝛼 ��𝜎 2 (𝑡 − 𝑠)�� 𝑡 > 𝑠 𝑒𝑥𝑝 �− 1 + 𝑏𝑒 −𝑐𝑡 2 José Antonio Anguita Izquierdo Página 33 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Otras características, para t y s cualesquiera: Momentos de orden 𝑛: 𝑛] 𝐸[𝑋(𝑡) Función Varianza: 𝑛] = 𝐸[𝑋(𝑡0 ) 𝑛 1 + 𝑏𝑒 −𝑐𝑡0 𝑛𝜎 2 (𝑡 − 𝑡0 )(𝑛 − 1)� , 𝑡 ≥ 𝑡0 𝑒𝑥𝑝 � � � 1 + 𝑏𝑒 −𝑐𝑡 2 2 1 + 𝑏𝑒 −𝑐𝑡0 2 2 𝑉𝑎𝑟[𝑋(𝑡)] = � � �𝑉𝑎𝑟[𝑋(𝑡0 )]𝑒 𝜎 (𝑡−𝑡0 ) + 𝐸 2 [𝑋(𝑡0 )]�𝑒 𝜎 (𝑡−𝑡0 ) − 1��, 𝑡 ≥ 𝑡0 −𝑐𝑡 1 + 𝑏𝑒 Función Covarianza 𝑅(𝑡, 𝑠) = 𝐶𝑜𝑣[𝑋(𝑡), 𝑋(𝑠)] = � Si 𝑠 < 𝑡: 1 + 𝑏𝑒 −𝑐𝑡0 1 + 𝑏𝑒 −𝑐𝑡0 2 2 2 � � � 𝑒 2𝜇0 +𝜎0 �𝑒 𝜎 (𝑡∧𝑠−𝑡0 )+𝜎0 − 1�, 𝑠, 𝑡 ≥ 𝑡0 1 + 𝑏𝑒 −𝑐𝑡 1 + 𝑏𝑒 −𝑐𝑠 José Antonio Anguita Izquierdo 𝑅(𝑡, 𝑠) = 𝑉𝑎𝑟[𝑋(𝑠)] 1 + 𝑏𝑒 −𝑐𝑠 1 + 𝑏𝑒 −𝑐𝑡 Página 34 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Capítulo 4. Simulación de los procesos La simulación de trayectorias de la muestra para un proceso lognormal no homogénea puede ser abordado de las siguientes maneras: I) Mediante la aplicación de las trayectorias de los proceso 𝑡 𝑋(𝑡) = exp (𝑌(𝑡) = 𝑋0 ∙ exp �� ℎ(𝑢)𝑑𝑢 − 𝑡0 𝜎2 (𝑡 − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )��) 2 con 𝑋0 una distribución degenerada (𝑃[𝑋(𝑡0 ) = 𝑋0 ] = 1) o 𝑋0 ~Λ1 (𝜇0 , 𝜎02 ),simulando las trayectorias de la muestra de un proceso Wiener estándar. II) Resolviendo la ecuación diferencial estocástica utilizando métodos numéricos 𝑑𝑋(𝑡) = ℎ(𝑡)𝑋(𝑡)𝑑𝑡 + 𝜎𝑋(𝑡)𝑑𝑊(𝑡) � 𝑋(𝑡0 ) = 𝑋0 En este trabajo nos centraremos en la primera forma, por lo que comenzaremos simulando una trayectoria de tamaño n del proceso Wiener, que consistirá en generar un vector de tamaño n tal que: -Su primer valor es cero -Como 𝑊(𝑡 + ℎ) − 𝑊(𝑡0 ) = 𝑊(𝑡) − 𝑊(𝑡0 ) + 𝑊(𝑡 + ℎ) − 𝑊(𝑡) y el proceso Wiener es de incrementos independientes, se calcula 𝑤𝑖 = 𝑤𝑖−1 + 𝑧𝑖 , 𝑖 = 2, … , 𝑛, donde 𝑧𝑖 es un número aleatorio generado de una normal de media cero y varianza h. Los valores de las trayectorias, 𝑥𝑖 , de X(t) serán: 𝑥1 = 𝑥0 𝑡 𝑥𝑖 = 𝑥0 𝑒𝑥𝑝 �� ℎ(𝑢)𝑑𝑢� 𝑒𝑥𝑝 � 𝑡0 𝜎2 (𝑡 − 𝑡0 ) + 𝜎𝑤𝑖 � 2 A continuación, generaremos trayectorias para cada proceso de difusión concreto, representando sus gráficas para distintos valores del parámetro sigma, así como de sus respectivas funciones media. Con ello visualizaremos si nuestros procesos se adaptan bien a dichas medias y pueden ser utilizados para su modelización. Además, se representan estos procesos para los casos cuya distribución inicial es degenerada y lognormal José Antonio Anguita Izquierdo Página 35 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo • Proceso de difusión tipo Gompertz Las trayectorias de este proceso son 𝜎2 𝑚 𝑋(𝑡) = 𝑥0 ∙ 𝑒𝑥𝑝 ( �𝑒 −𝛽𝑡0 − 𝑒 −𝛽𝑡 � − (𝑡 − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )�) 2 𝛽 Mostramos las gráficas de 10 trayectorias simuladas de este proceso, con 101 datos cada una (de 0 a 10, con paso 0´1), para el caso de una distribución inicial degenerada y lognormal. Los parámetros utilizados son 𝑚 = 1; 𝛽 = 0´5, mientras que la varianza cambia para cada gráfico. Respecto a la distribución inicial, en el cado degenerado se ha tomado 𝑥0 = 1, mientras que para el caso lognormal, 𝑋0 ~Λ1 (1´5,0´3). Distribución inicial degenerada Distribución inicial lognormal Trayectorias simuladas con sig 30 Trayectorias 5 1 2 10 3 20 4 Trayectorias 6 7 40 8 T rayectorias simuladas con sig 0 2 4 6 8 10 0 2 4 6 8 10 Tiempo Tiempo Proceso Gompertz con sigma 40 trayectorias 10 2 20 4 trayectorias 30 6 50 8 60 Proceso Gompertz con sigma 0 0 2 4 6 8 10 0 2 4 tiempo 6 8 10 tiempo T rayectorias simuladas con sig 60 Trayectorias 8 0 2 20 4 40 6 Trayectorias 80 10 100 12 Trayectorias simuladas con si 0 2 4 6 Tiempo José Antonio Anguita Izquierdo 8 10 0 2 4 6 8 10 Tiempo Página 36 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo • Proceso de difusión tipo Bertalanffy 𝑏 1 − 𝑐𝑒 −𝑘𝑡 𝜎2 (𝑡 − 𝑡0 ) + 𝜎�𝑊(𝑡) − 𝑊(𝑡0 )�) 𝑋(𝑡) = 𝑥0 ∙ � 𝑒𝑥𝑝 (− � 1 − 𝑐𝑒 −𝑘𝑡0 2 A continuación, se muestran las gráficas de 50 trayectorias simuladas de este proceso, con 501 datos cada una (de 0 a 10, con paso 0´1), para el caso de una distribución inicial degenerada y lognormal. Los parámetros utilizados son 𝑏 = 200; 𝑐 = 0´25, mientras que la varianza cambia para cada gráfico. Respecto a la distribución inicial, en el cado degenerado se ha tomado 𝑥0 = 5, mientras que para el caso lognormal, 𝑋0 ~Λ1 (1,5; 0,3). Distribución inicial degenerada Distribución inicial lognormal Proceso Bertalanffy con sigma 0 0 50 100 trayectorias 100 50 trayectorias 150 150 Proceso Bertalanffy con sigm 0 10 20 30 40 0 50 10 20 30 40 50 Proceso Bertalanffy con sigma 400 300 trayectorias 0 0 100 50 200 100 trayectorias 150 500 200 600 Proceso Bertalanffy con sigma 0.0 0 10 20 30 40 0 50 10 20 Proceso Bertalanffy con sigma 30 40 50 1000 1500 trayectorias 300 0 0 500 100 200 trayectorias 400 2000 500 Proceso Bertalanffy con sigma 0 10 20 30 40 50 0 José Antonio Anguita Izquierdo 10 20 30 40 50 Página 37 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Proceso de difusión tipo Richards Distribución inicial degenerada Distribución inicial lognormal Proceso Richards con sigma 0 600 trayectorias 0 0 200 200 400 400 trayectorias 800 600 1000 1200 Proceso Richards con sigma 0 0 10 20 30 40 50 0 10 20 Proceso Richards con sigma 0.0 40 50 800 trayectorias 0 0 200 200 400 400 600 1000 1000 1200 1200 1400 Proceso Richards con sigma 0 600 800 trayectorias 30 0 10 20 30 40 50 0 10 20 Proceso Richards con sigma 0 30 40 50 2000 trayectorias 0 0 500 500 1000 1000 1500 2000 1500 trayectorias 2500 2500 3000 3000 3500 Proceso Richards con sigma 0 0 10 20 30 40 50 0 José Antonio Anguita Izquierdo 10 20 30 40 50 Página 38 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo • Proceso de difusión tipo logística Distribución inicial degenerada Distribución inicial lognormal Proceso logistico con sigma 0. 4000 trayectorias 0 0 1000 200 2000 3000 600 400 trayectorias 800 5000 1000 6000 1200 Proceso logistico con sigma 0. 0 10 20 30 40 50 0 10 20 Proceso logistico con sigma 0.0 30 40 50 4000 trayectorias 1000 0 2000 500 trayectorias 6000 1500 Proceso logistico con sigma 0.0 10 20 30 40 50 0 0 0 10 20 30 40 50 Proceso logistico con sigma 0. 30000 trayectorias 0 0 10000 20000 2000 1000 trayectorias 3000 40000 Proceso logistico con sigma 0. 0 10 20 30 40 50 0 José Antonio Anguita Izquierdo 10 20 30 40 50 Página 39 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Capítulo 5. Inferencia en los procesos 5.1. Planteamiento general En este capítulo abordaremos la estimación máxima verosimilitud en procesos de difusión. Para ello consideraremos el caso de muestreo discreto, es decir, supondremos que se dispone de observaciones del proceso en instantes de tiempo 𝑡1 , … , 𝑡𝑛 en los cuales se observan las variables 𝑋(𝑡1 ), … , 𝑋(𝑡𝑛 ) cuyos valores observados constituirán la muestra base del estudio inferencial. El procedimiento que se seguirá está basado en el método de estimación por máxima verosimilitud. Para ello será necesario conocer la distribución conjunta de la muestra observada, lo cual conlleva conocer las distribuciones finito-dimensionales del proceso. Además, en nuestro caso, y como los procesos de difusión son procesos de Markov, nos permite que a partir de la distribución inicial del proceso y las transiciones se tengan cualquier distribución finito-dimensional y, con ello, podamos aplicar la teoría de estimación máximo verosímil. Sea {𝑋(𝑡); 𝑡 ≥ 𝑡0 } un proceso de difusión, del cual conocemos sus distribuciones unidimensionales y transiciones, y para el cual es posible realizar observaciones del mismo en instantes de tiempo prefijados. Sean 𝑡1 , … , 𝑡𝑛 dichos instantes de tiempo y llamemos 𝑥1 , … , 𝑥𝑛 a los valores observados, con 𝑥𝑘 = 𝑋(𝑡𝑘 ) realizaciones del proceso. Notemos 𝑓1 y 𝑓 a la densidad de la variable 𝑋(𝑡1 ) y a la función de densidad de transición, respectivamente, y sean 𝜃1 y 𝜃 los parámetro asociados a ambas. Así, la función de verosimilitud de la muestra observada 𝑥 = (𝑥1 , … , 𝑥𝑛 )´ es 𝑑 𝑛𝑖 𝑖=1 𝑗=2 𝕃𝑥 (𝜃1 , 𝜃) = � 𝑓1 (𝑥𝑖1 ) ∙ � 𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 � a partir de la cual se obtendrán los estimadores máximo verosímiles de 𝜃1 y 𝜃. En concreto, asociadas a la muestra observada x, se tendrán las estimaciones 𝜃�1 = 𝜃�1 (𝑥) y 𝜃� = 𝜃�(𝑥), tales que 𝕃𝑥 �𝜃�1 , 𝜃�� = 𝑆𝑢𝑝 𝜃1 ,𝜃 𝕃𝑥 (𝜃1 , 𝜃) Para el caso de una trayectoria con distribución inicial degenerada, es decir, 𝑃[𝑋(𝑡1 ) = 𝑥1 ] = 1, la función de verosimilitud queda que depende sólo del parámetro 𝜃. 𝑛 𝕃𝑥 (𝜃) = � 𝑓(𝑥𝑖 , 𝑡𝑖 |𝑥𝑖−1 , 𝑡𝑖−1 ) 𝑖=2 En otras ocasiones disponemos de información sobre d trayectorias, observadas en instantes de tiempo 𝑡𝑖𝑗 ; 𝑖, 𝑗 = 1, … , 𝑛𝑖 . Para este caso, no es necesario que los instantes de observación sean los mismos para cada trayectoria, si bien el instante inicial conviene que sí lo sea, ya que hay que imponer una distribución inicial. Así pues, consideremos que 𝑡𝑖1 = 𝑡1 ; 𝑖 = 1, … , 𝑑. Llamando �𝑥𝑖𝑗 �, 𝑖 = José Antonio Anguita Izquierdo Página 40 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 1, … , 𝑑; 𝑗 = 1, … , 𝑛𝑖 a los valores observados, y xal vector conteniendo dichos valores, la función de verosimilitud queda en este caso 𝑑 𝑛𝑖 𝑖=1 𝑗=2 𝕃𝑥 (𝜃1 , 𝜃) = � 𝑓1 (𝑥𝑖1 ) ∙ � 𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 �. En este caso, si la distribución inicial es degenerada, dicha función será 𝑛𝑖 𝑑 𝕃𝑥 (𝜃) = � � 𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 � 𝑖=1 𝑗=2 A continuación, es usual considerar el logaritmo de dichas funciones, para calcular el estimador máximo verosímil. Nos centraremos en el caso de d trayectorias con distribución inicial no degenerada, quedando 𝑑 𝑑 𝑛𝑖 𝑙𝑜𝑔�𝕃𝑥 (𝜃1 , 𝜃)� = � 𝑙𝑜𝑔�𝑓1 (𝑥𝑖1 )� + � � log �𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 �� 𝑖=1 𝑗=2 𝑖=1 con lo que, en el caso de que 𝜃1 y 𝜃 sean independientes, las estimaciones de ambos también lo serán. En tal caso, para la estimación de 𝜃1 sólo se considera la información del instante inicial de observación, mientras que la estimación de 𝜃 coincide en el caso de distribución inicial degenerada y no degenerada. 5.2. Inferencia en el proceso lognormal no homogéneo En este caso, si 𝑓(𝑥, 𝑡|𝑦, 𝑠) es la función de densidad de transición del proceso y la distribución inicial es degenerada, la función de verosimilitud es 𝕃𝑥 (𝜃, 𝜎 2) 𝑑 𝑛𝑖 = � � 𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 � 𝑖=1 𝑗=2 mientras que si 𝑋(𝑡1 )~Λ1 (𝜇0 , 𝜎02 ), entonces 𝑑 𝑛𝑖 𝑖=1 𝑗=2 𝕃𝑥 (𝜇0 , 𝜎02 , 𝜃, 𝜎 2 ) = � 𝑓1 (𝑥𝑖1 ) ∙ � 𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 � Hacemos notar de nuevo, que la estimación de 𝜇0 y 𝜎02 sólo depende de los valores iniciales de cada trayectoria muestral, y no influye en la del resto de los parámetros. Por tanto, la estimación máxima verosímil de 𝜃 y 𝜎 2 son la misma para ambos casos. A partir de ahora, consideraremos el caso cuando la distribución inicial es lognormal. La función de densidad de transición es 2 ⎧ �𝑙𝑛 𝑥 − 𝑙𝑛 𝑓𝜃 (𝑡) + 𝜎 2 (𝑡 − 𝑠)� ⎪ 1 𝑦 𝑓𝜃 (𝑠) 2 exp − 𝑓(𝑥, 𝑡|𝑦, 𝑠) = 2 2𝜎 2 (𝑡 − 𝑠) ⎨ 𝑥�2𝜋𝜎 (𝑡 − 𝑠) ⎪ ⎩ José Antonio Anguita Izquierdo ⎫ ⎪ ⎬ ⎪ ⎭ ,𝑡 > 𝑠 Página 41 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Tomando logaritmo y considerando 𝑛 = ∑𝑑𝑖=1 𝑛𝑖 , obtenemos ln (𝕃𝑥 (𝜇0 , 𝜎02 , 𝜃, 𝜎 2 )) 𝑑 𝑑 𝑖=1 𝑖=1 𝑛 𝑑 1 𝑛−𝑑 = − 𝑙𝑛(2𝜋) − 𝑙𝑛(𝜎02 ) − 𝑙𝑛(𝜎 2 ) − � 𝑙𝑛(𝑥𝑖1 ) − 2 �[𝑙𝑛(𝑥𝑖1 ) − 𝜇0 ]2 2 2 2 2𝜎0 𝑛𝑖 𝑑 𝑛𝑖 𝑑 1 − � � 𝑙𝑛 (𝑥𝑖𝑗 ) − � � 𝑙𝑛(𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 ) 2 𝑖=1 𝑗=2 𝑖=1 𝑗=2 𝑓𝜃 �𝑡𝑖𝑗 � 𝑥𝑖𝑗 𝜎2 − 𝑙𝑛 + 2 �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 𝑖𝑗−1 𝑓𝜃 �𝑡𝑖𝑗−1 � 1 − 2�� 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 2𝜎 𝑑 𝑛𝑖 𝑖=1 𝑗=2 Para estimar los parámetros 𝜇0 y 𝜎02 : 𝑑 𝑑 1 1 𝜕𝑙𝑛 (𝕃𝑥 (𝜇0 , 𝜎02 , 𝜃, 𝜎 2 )) = 2 �(𝑙𝑛 (𝑥𝑖1 ) − 𝜇0 ) = 0 ⇒ 𝜇̂ 0 = � 𝑙𝑛 (𝑥𝑖1 ) 𝜕𝜇0 𝑑 𝜎0 𝑖=1 𝑖=1 𝑑 𝑑 (𝑙𝑛 (𝑥𝑖1 ) − 𝜇0 )2 𝜕𝑙𝑛 (𝕃𝑥 (𝜇0 , 𝜎02 , 𝜃, 𝜎 2 )) 𝑑 1 = − + � = 0 ⇒ 𝜎�02 = �(𝑙𝑛 (𝑥𝑖1 ) − 𝜇̂ 0 )2 2 2 4 𝑑 2𝜎0 𝜕𝜎0 2𝜎0 𝑖=1 𝑖=1 Sin embargo, la estimación del resto de parámetros plantea algunas dificultades. Normalmente, los sistemas de ecuaciones resultantes son muy complejos y no tienen una solución explícita, por lo que se deben usar procedimientos numéricos para encontrar sus soluciones aproximadas. No obstante, las ecuaciones que se obtienen dependen de los valores muestrales de las trayectorias observadas, y por tanto, pueden presentar comportamientos imprevisibles, por lo que no se puede garantizar siempre que los métodos empleados puedan ser utilizados. Por ejemplo, se han descrito casos concretos en los que métodos como el de Newton-Raphson o el de bisección presentan problemas al no verificarse las hipótesis que permiten su empleo. Por lo tanto la estimación máximo verosímil de los parámetros debe abordarse de forma directa maximizando la función de verosimilitud. Una alternativa sería el uso de procedimientos de optimización estocásticos como Simulated Annealing (SA) o Variable Neighborhood Search (VNS), algoritmos diseñados para resolver problemas del tipo 𝑚𝑖𝑛 𝑓(𝑤), con 𝑤 ∈ Ω. En nuestro caso, una vez estimado los parámetros de la distribución inicial 𝜇0 y 𝜎02 , el problema es maximizar la función 𝑙𝑛 (𝕃𝑋 (𝜇0 , 𝜎02 , 𝜃, 𝜎 2 )) 𝑑 𝑑 𝑖=1 𝑖=1 𝑛 𝑑 1 𝑛−𝑑 = − 𝑙𝑛(2𝜋) − 𝑙𝑛(𝜎02 ) − 𝑙𝑛(𝜎 2 ) − � 𝑙𝑛(𝑥𝑖1 ) − 2 �[𝑙𝑛(𝑥𝑖1 ) − 𝜇0 ]2 2 2 2 2𝜎0 𝑑 𝑛𝑖 𝑑 𝑛𝑖 1 − � � 𝑙𝑛 (𝑥𝑖𝑗 ) − � � 𝑙𝑛(𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 ) 2 𝑖=1 𝑗=2 𝑖=1 𝑗=2 𝑓𝜃 �𝑡𝑖𝑗 � 𝑥𝑖𝑗 𝜎2 − 𝑙𝑛 + 2 �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 𝑖𝑗−1 𝑓𝜃 �𝑡𝑖𝑗−1 � 1 − 2�� 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 2𝜎 𝑑 𝑛𝑖 𝑖=1 𝑗=2 José Antonio Anguita Izquierdo Página 42 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Dado que los anteriores algoritmos se formulan para problemas de minimización, la función objetivo que se considerará es 𝑓𝜃 �𝑡𝑖𝑗 � 𝑥𝑖𝑗 𝜎2 − 𝑙𝑛 + 2 �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 𝑖𝑗−1 𝑓𝜃 �𝑡𝑖𝑗−1 � 𝑛−𝑑 1 �𝑋 (𝜃, 𝜎 2 )) = 𝕃 𝑙𝑛(𝜎 2 ) + 2 � � 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 2 2𝜎 𝑛𝑖 𝑑 𝑖=1 𝑗=2 A continuación, veamos cómo quedan las ecuaciones de verosimilitud para cada proceso de difusión de los aquí tratados. 5.2.1. Inferencia en el proceso tipo Gompertz Llamando 𝑎 = 𝑚 𝛽 𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 � = y 𝑏 = 𝑒 −𝛽 , la función de densidad de transición queda de la siguiente manera 1 𝑥𝑖𝑗 �2𝜋𝜎 2 (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 ) exp �− �𝑙𝑛𝑥 𝑥𝑖𝑗 𝑖𝑗−1 2 2 𝜎 𝑡 𝑡 +𝑎�𝑏 𝑖𝑗 −𝑏 𝑖𝑗−1 �+ (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 )� 2 2𝜎 2 �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 � �,𝑡 > 𝑠 Tomando logaritmo queda: ln (𝕃𝑋𝑖𝑗 (𝜇0 , 𝜎02 , 𝑎, 𝑏, 𝜎 2 )) 𝑑 𝑑 𝑖=1 𝑖=1 𝑑 1 𝑛 𝑛−𝑑 𝑙𝑛(𝜎 2 ) − � 𝑙𝑛(𝑥𝑖1 ) − 2 �[𝑙𝑛(𝑥𝑖1 ) − 𝜇0 ]2 = − 𝑙𝑛(2𝜋) − 𝑙𝑛(𝜎02 ) − 2 2 2 2𝜎0 𝑛𝑖 𝑑 𝑑 𝑛𝑖 1 − � � 𝑙𝑛 (𝑥𝑖𝑗 ) − � � 𝑙𝑛(𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 ) 2 𝑖=1 𝑗=2 − 𝑑 𝑛𝑖 1 �� 2𝜎 2 𝑖=1 𝑗=2 𝑖=1 𝑗=2 𝑥𝑖𝑗 𝜎2 + 𝑎(𝑏𝑡𝑖𝑗 − 𝑏𝑡𝑖𝑗−1 ) + 2 �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 𝑖𝑗−1 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 Ahora derivando respecto de los parámetros e igualando a cero, se obtiene el siguiente sistema de ecuaciones: • • 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑥𝑖𝑗 𝜎2 𝑡 𝑡 +𝑎�𝑏 𝑖𝑗 −𝑏 𝑖𝑗−1 �+ �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 �)2 𝑥𝑖𝑗−1 2 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 𝑖 (𝑛 − 𝑑)𝜎 2 + 𝜎 2 ∑𝑑𝑖=1 ∑𝑛𝑗=2 �𝑙𝑛 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 • (𝑙𝑛 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑥𝑖𝑗 𝑥𝑖𝑗−1 + 𝑎(𝑏𝑡𝑖𝑗 − 𝑏𝑡𝑖𝑗−1 ) + 𝑥𝑖𝑗 𝜎2 𝑡 𝑡 +𝑎�𝑏 𝑖𝑗 −𝑏 𝑖𝑗−1 �+ �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 �)2 𝑥𝑖𝑗−1 2 (𝑙𝑛 𝑙𝑛 [𝑏𝑡𝑖𝑗 − 𝑏𝑡𝑖𝑗−1 ] = 0 𝜎2 �𝑡𝑖𝑗 2 − 𝑡𝑖𝑗−1 �� = 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 𝑥𝑖𝑗 𝜎2 𝑡 𝑡 +𝑎�𝑏 𝑖𝑗 −𝑏 𝑖𝑗−1 �+ �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 � 𝑥𝑖𝑗−1 2 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 José Antonio Anguita Izquierdo �𝑡𝑖𝑗 𝑏𝑡𝑖𝑗−1 − 𝑡𝑖𝑗−1 𝑏𝑡𝑖𝑗−1 −1 � = 0 Página 43 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo para el que no existe una solución explícita, y por tanto, son necesarios algunos procedimientos numéricos para encontrar una solución aproximada. En el caso particular de que 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 = ℎ; ∀𝑖 = 1, … , 𝑑; 𝑗 = 1, … , 𝑛𝑖 (lo más usado en la práctica), las ecuaciones se pueden simplificar: 𝐴3,𝑏 + 𝑎�𝑏 ℎ − 1�𝐴2,𝑏 + • 2 𝜎2ℎ 𝐴1,𝑏 2 =0 𝐴4,𝑏 + 𝑎2 �𝑏 ℎ − 1� 𝐴2,𝑏 + 2𝑎�𝑏 ℎ − 1�𝐴3,𝑏 − • 𝐴∗ 3,𝑏 + 𝑎�𝑏 ℎ − 1�𝐴∗ 2,𝑏 + • 𝜎2ℎ ∗ 𝐴 1,𝑏 2 =0 𝜎 4 ℎ2 (𝑛 2 (G1) − 𝑑) − (𝑛 − 𝑑)𝜎 2 ℎ = 0 (G2) (G3) donde 𝑛 𝑖 𝐴1,𝑏 = ∑𝑑𝑖=1 ∑𝑗=2 𝑏𝑡𝑖𝑗−1 ; 𝐴∗1,𝑏 = 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑡𝑖𝑗−1 𝑏𝑡𝑖𝑗−1 ; 𝑛 𝑛 𝑖 𝐴2,𝑏 = ∑𝑑𝑖=1 ∑𝑗=2 𝑏 2𝑡𝑖𝑗−1 ; 𝑥𝑖𝑗 𝑖 𝐴∗ 3,𝑏 = ∑𝑑𝑖=1 ∑𝑗=2 𝑡𝑖𝑗−1 𝑏𝑡𝑖𝑗−1 𝑙𝑛 𝑥 Denotamos 𝐴 𝐶𝑏 = 𝐴1,𝑏 ∗ 𝐴∗ 3,𝑏 −𝐴∗ 1,𝑏 𝐴3,𝑏 ∗ 1,𝑏 𝐴2,𝑏 −𝐴1,𝑏 𝐴 2,𝑏 𝑖𝑗−1 𝑥𝑖𝑗 𝑛 𝑖 𝐴3,𝑏 = ∑𝑑𝑖=1 ∑𝑗=2 𝑏𝑡𝑖𝑗−1 𝑙𝑛 𝑥 𝐴∗ 2,𝑏 = 𝑥𝑖𝑗 𝑛 𝑖 𝐴4,𝑏 = ∑𝑑𝑖=1 ∑𝑗=2 𝑙𝑛2 𝑥 ; 𝐴∗ 𝑖𝑗−1 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑡𝑖𝑗−1 𝑏 2𝑡𝑖𝑗−1 𝐴 −𝐴 𝐴∗ 𝑖𝑗−1 𝐷𝑏 = 𝐴∗ 2,𝑏 𝐴3,𝑏 −𝐴2,𝑏 𝐴∗ 3,𝑏 ; y después de algunos cálculos, del sistema de ecuaciones se obtiene 1,𝑏 2,𝑏 1,𝑏 2,𝑏 𝐶𝑏 2𝐷𝑏 𝑦 𝜎𝑏2 = 𝑏ℎ − 1 ℎ y sustituyendo estas expresiones en (G2), aparece la ecuación en b: 𝑎𝑏 = 𝑔(𝑏) = 𝐴4,𝑏 + 𝐴2,𝑏 𝐶𝑏2 + 2𝐴3,𝑏 𝐶𝑏 − (𝑛 − 𝑑)𝐷𝑏2 − 2(𝑛 − 𝑑)𝐷𝑏 = 0 que debe ser tratada por métodos numéricos y cuya solución proporcionará la estimación máxima verosimilitud de b. Una vez obtenido 𝑏�, el estimador ML de 𝑎 y 𝜎 2 , serán 𝑎� = 𝑎𝑏� 𝜎� 2 = 𝜎𝑏�2 José Antonio Anguita Izquierdo Página 44 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 5.2.2. Inferencia en el proceso tipo logístico 1 𝑏 En este caso, si llamamos 𝛾 = 𝑒 −𝑐 y 𝜂 = , y denotamos 𝑛 = ∑𝑑𝑖=1 𝑛𝑖 , la densidad de transición puede ser escrita como 𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 � = 1 𝑥𝑖𝑗 �2𝜋𝜎 2 (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 ) exp �− �𝑙𝑛𝑥 𝑥𝑖𝑗 𝑖𝑗−1 2 2 𝜎 𝑡 𝑡 −𝑙𝑛��𝜂+𝛾 𝑖𝑗−1 �/�𝜂+𝛾 𝑖𝑗 ��+ (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 )� 2 2𝜎 2 �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 � � Así, el logaritmo de la función de verosimilitud de las muestras es 𝑙𝑛 (𝕃𝑋𝑖𝑗 (𝜇0 , 𝜎02 , 𝛾, 𝜂, 𝜎 2 )) 𝑑 𝑑 𝑖=1 𝑖=1 𝑑 1 𝑛 𝑛−𝑑 𝑙𝑛(𝜎 2 ) − � 𝑙𝑛(𝑥𝑖1 ) − 2 �[𝑙𝑛(𝑥𝑖1 ) − 𝜇0 ]2 = − 𝑙𝑛(2𝜋) − 𝑙𝑛(𝜎02 ) − 2 2 2 2𝜎0 𝑛𝑖 𝑑 𝑑 𝑛𝑖 1 − � � 𝑙𝑛 (𝑥𝑖𝑗 ) − � � 𝑙𝑛(𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 ) 2 𝑖=1 𝑗=2 − 𝑑 𝑖=1 𝑗=2 𝑛𝑖 1 �� 2𝜎 2 𝑖=1 𝑗=2 𝑥𝑖𝑗 𝜎2 − 𝑙𝑛�(𝜂 + 𝛾 𝑡𝑖𝑗−1 )/(𝜂 + 𝛾 𝑡𝑖𝑗 )� + 2 �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 𝑖𝑗−1 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 Y las ecuaciones de verosimilitud quedarán en este caso • • • donde 𝜂,𝛾 𝑥𝑖𝑗 𝜂,𝛾 𝑙𝑛 −𝑇𝑖𝑗 𝑥𝑖𝑗−1 𝜂,𝛾 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝜂,𝛾 𝑊𝑖𝑗 �𝑡 −𝑡 �𝑆 𝑖𝑗 𝑖𝑗−1 𝑥𝑖𝑗 𝑖𝑗 𝜂,𝛾 𝑙𝑛 −𝑇𝑖𝑗 𝑥𝑖𝑗−1 𝜂,𝛾 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝜂,𝛾 𝑉𝑖𝑗 �𝑡 −𝑡 �𝑆 𝑖𝑗 𝜎 4 ∑𝑑𝑖=1�𝑡𝑖𝑛𝑖 𝑖𝑗−1 𝑖𝑗 − 𝑡𝑖1 � + 4𝜎 𝑥𝑖𝑗 𝜂,𝛾 𝑙𝑛 𝑇 𝑥𝑖𝑗−1 𝑖𝑗 𝑛𝑖 8 ∑𝑑𝑖=1 ∑𝑗=2 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 + + 2 (𝑛 𝜂,𝛾 𝑊𝑖𝑗 𝜎2 𝑑 𝑖 ∑𝑖=1 ∑𝑛𝑗=2 𝜂,𝛾 2 𝑆𝑖𝑗 𝜂,𝛾 𝑉𝑖𝑗 𝜎2 𝑑 𝑖 ∑𝑖=1 ∑𝑛𝑗=2 𝜂,𝛾 2 𝑆𝑖𝑗 − 𝑑) − =0 =0 𝑥𝑖𝑗 𝑙𝑛2 𝑥𝑖𝑗−1 𝑛𝑖 4 ∑𝑑𝑖=1 ∑𝑗=2 𝑡 −𝑡 𝑖𝑗 𝑖𝑗−1 − 𝜂,𝛾 2 𝑛𝑖 �𝑇𝑖𝑗 � 4 ∑𝑑𝑖=1 ∑𝑗=2 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 =0 𝜂,𝛾 𝑆𝑖𝑗 = (𝜂 + 𝛾 𝑡𝑖𝑗−1 )(𝜂 + 𝛾 𝑡𝑖𝑗 ); 𝜂,𝛾 𝑉𝑖𝑗 • • donde 𝜂,𝛾 𝑋1 𝜂,𝛾 𝑊𝑖𝑗 Este sistema de ecuaciones puede ser expresado de la siguiente forma 𝜂,𝛾 𝜎 2 𝑋1 𝜂,𝛾 𝜂,𝛾 𝜂,𝛾 + 2𝑋2 − 2𝑋3 𝜂,𝛾 𝜂,𝛾 𝜎 2 𝑋4 + 2𝑋5 − 2𝑋6 𝑛 𝜂,𝛾 𝑊𝑖𝑗 𝜂,𝛾 𝑆𝑖𝑗 𝑡 𝜂+𝛾 𝑖𝑗 � = 𝛾 𝑡𝑖𝑗−1 − 𝛾 𝑡𝑖𝑗 =0 =0 𝜂,𝛾 𝜎 4 𝑍2 + 4𝜎 2 (𝑛 − 𝑑) − 4𝑌2 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑡 𝜂+𝛾 𝑖𝑗−1 𝑇𝑖𝑗 = 𝑙𝑛 � = 𝑡𝑖𝑗−1 𝛾 𝑡𝑖𝑗−1 −1 (𝜂 + 𝛾 𝑡𝑖𝑗 ) − 𝑡𝑖𝑗 𝛾 𝑡𝑖𝑗−1 (𝜂 + 𝛾 𝑡𝑖𝑗−1 ); • + ; José Antonio Anguita Izquierdo (L1) (L2) 𝜂,𝛾 + 8𝑌1 − 4𝑍1 = 0 𝜂,𝛾 𝑋2 (L3) 𝑛 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝜂,𝛾 𝑊𝑖𝑗 𝜂,𝛾 �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 �𝑆𝑖𝑗 𝑥𝑖𝑗 𝑙𝑛 𝑥 𝑖𝑗−1 Página 45 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑛 𝜂,𝛾 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑋3 𝑛𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝜂,𝛾 𝑋5 𝜂,𝛾 𝑌1 = 𝑍1 = 𝜂,𝛾 𝜂,𝛾 𝑇𝑖𝑗 𝑊𝑖𝑗 𝜂,𝛾 �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 �𝑆𝑖𝑗 𝜂,𝛾 𝑉𝑖𝑗 𝜂,𝛾 𝑋4 ; 𝜂,𝛾 �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 �𝑆𝑖𝑗 𝜂,𝛾 𝑥𝑖𝑗 𝑙𝑛 𝑥 𝑇𝑖𝑗 𝑥 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑙𝑛 𝑖𝑗 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 𝑥𝑖𝑗−1 𝑖𝑗−1 𝜂,𝛾 𝑋6 ; 𝜂,𝛾 𝑌2 𝑥𝑖𝑗 𝑙𝑛2 � � 𝑥𝑖𝑗−1 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 𝑛 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑛𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 = 𝜂,𝛾 𝑉𝑖𝑗 𝜂,𝛾 𝑆𝑖𝑗 𝜂,𝛾 𝜂,𝛾 𝑇𝑖𝑗 𝑉𝑖𝑗 𝜂,𝛾 �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 �𝑆𝑖𝑗 𝜂,𝛾 2 �𝑇𝑖𝑗 � 𝑥 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑙𝑛 𝑖𝑗 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 𝑥𝑖𝑗−1 𝑍2 = ∑𝑑𝑖=1�𝑡𝑖𝑛𝑖 − 𝑡𝑖1 � y de (L1) se obtiene 𝜂,𝛾 2 = 2𝑆 𝜎𝜂,𝛾 donde 𝑆 𝜂,𝛾 = 𝜂,𝛾 𝜂,𝛾 𝑋3 − 𝑋2 𝜂,𝛾 𝑋1 que puede sustituirse en las ecuaciones (L2) y (L3), resultando finalmente el sistema • • 𝜂,𝛾 𝑋6 − 𝑆 𝑆 𝜂,𝛾 �𝑆 𝜂,𝛾 𝜂,𝛾 𝜂,𝛾 𝜂,𝛾 𝑋4 − 𝑋5 =0 𝜂,𝛾 𝑍2 + 2(𝑛 − 𝑑)� + �2𝑌1 𝜂,𝛾 𝜂,𝛾 − 𝑌2 𝑋6 � − 𝑍1 = 0 La solución a este sistema proporciona la estimación máximo verosimilitud de 𝜂 y 𝛾, de donde se obtiene la de 𝜎 2 dada por 2𝑆 � ,𝛾 � 𝜂 . 5.2.3. Inferencia en el proceso tipo Bertalanffy Reparametrizando mediante 𝜂 = siguiente forma 𝑓�𝑥𝑖𝑗 , 𝑡𝑖𝑗 �𝑥𝑖𝑗−1 , 𝑡𝑖𝑗−1 � = 1 1 𝑐 𝑥𝑖𝑗 �2𝜋𝜎 2 (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 ) y 𝛼 = 𝑒 −𝑘 , podemos escribir la función de transición de la exp �− �𝑙𝑛𝑥 𝑥𝑖𝑗 𝑖𝑗−1 2 2 𝜎 𝑡 𝑡 −𝑏𝑙𝑛��𝜂−𝛼 𝑖𝑗 �/�𝜂−𝛼 𝑖𝑗−1 ��+ (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 )� 2 2𝜎 2 �𝑡𝑖𝑗 −𝑡𝑖𝑗−1 � Si llamamos 𝑛 = ∑𝑑𝑖=1 𝑛𝑖 , el logaritmo de la función de verosimilitud queda 𝑙𝑛 (𝕃𝑋𝑖𝑗 (𝜇0 , 𝜎02 , 𝑏, 𝜂, 𝛼, 𝜎 2 )) 𝑑 𝑑 𝑖=1 𝑖=1 � 𝑑 1 𝑛 𝑛−𝑑 𝑙𝑛(𝜎 2 ) − � 𝑙𝑛(𝑥𝑖1 ) − 2 �[𝑙𝑛(𝑥𝑖1 ) − 𝜇0 ]2 = − 𝑙𝑛(2𝜋) − 𝑙𝑛(𝜎02 ) − 2 2 2 2𝜎0 𝑑 𝑛𝑖 𝑑 𝑛𝑖 1 − � � 𝑙𝑛 (𝑥𝑖𝑗 ) − � � 𝑙𝑛(𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 ) 2 𝑖=1 𝑗=2 − 𝑑 𝑛𝑖 1 �� 2𝜎 2 𝑖=1 𝑗=2 𝑖=1 𝑗=2 𝑥𝑖𝑗 𝜎2 − 𝑏𝑙𝑛�(𝜂 − 𝛼 𝑡𝑖𝑗 )/(𝜂 − 𝛼 𝑡𝑖𝑗−1 )� + 2 �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 José Antonio Anguita Izquierdo 𝑖𝑗−1 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 Página 46 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Derivando respecto de 𝑏, 𝜂, 𝛼 y 𝜎 2 , e igualando a cero, se obtiene un sistema de ecuaciones bastante complejo. Si consideramos instantes de tiempo igualmente espaciados, es decir, 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 = ℎ, se tiene que 𝛼 𝑡𝑖𝑗 − 𝛼 𝑡𝑖𝑗−1 = 𝛼 𝑡𝑖𝑗−1 +ℎ − 𝛼 𝑡𝑖𝑗−1 = 𝛼 𝑡𝑖𝑗−1 �𝛼 ℎ − 1� 𝑡𝑖𝑗−1 𝛼 𝑡𝑖𝑗−1 −1 (𝜂 − 𝛼 𝑡𝑖𝑗 ) − 𝑡𝑖𝑗 𝛼 𝑡𝑖𝑗−1 (𝜂 − 𝛼 𝑡𝑖𝑗−1 ) = 𝑡𝑖𝑗−1 𝛼 𝑡𝑖𝑗−1 −1 �𝜂 − 𝛼 𝑡𝑖𝑗−1 +ℎ � − �ℎ + 𝑡𝑖𝑗−1 �𝛼 𝑡𝑖𝑗−1 +ℎ−1 (𝜂 − 𝛼 𝑡𝑖𝑗−1 ) = 𝛼 𝑡𝑖𝑗−1 −1 𝑡𝑖𝑗−1 𝜂�1 − 𝛼 ℎ � − ℎ𝛼 ℎ−1 𝜂𝛼 𝑡𝑖𝑗−1 + ℎ𝛼 ℎ−1 𝛼 2𝑡𝑖𝑗−1 por lo que el sistema queda de la siguiente forma • • • • 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 4𝜎 2 (𝑛 𝑙𝑛 𝑥𝑖𝑗 𝜎2 𝑡 𝑡 −𝑏𝑙𝑛��𝜂−𝛼 𝑖𝑗 �/�𝜂−𝛼 𝑖𝑗−1 ��+ ℎ 𝑥𝑖𝑗−1 2 𝑙𝑛 𝑥𝑖𝑗 𝜎2 𝑡 𝑡 −𝑏𝑙𝑛��𝜂−𝛼 𝑖𝑗 �/�𝜂−𝛼 𝑖𝑗−1 ��+ ℎ 𝑥𝑖𝑗−1 2 𝑙𝑛 𝑥𝑖𝑗 𝜎2 𝑡 𝑡 −𝑏𝑙𝑛��𝜂−𝛼 𝑖𝑗 �/�𝜂−𝛼 𝑖𝑗−1 ��+ ℎ 𝑥𝑖𝑗−1 2 ℎ ℎ ℎ 4 − 𝑑) + 𝜎 ℎ(𝑛 − 𝑑) − 𝑛𝑖 8𝑏 ∑𝑑𝑖=1 ∑𝑗=2 𝑙𝑛 𝑛𝑖 4 ∑𝑑𝑖=1 ∑𝑗=2 𝑥𝑖𝑗 𝑡 𝑡 𝑙𝑛��𝜂−𝛼 𝑖𝑗 �/�𝜂−𝛼 𝑖𝑗−1 �� 𝑥𝑖𝑗−1 ℎ 𝑙𝑛2 𝑙𝑛�(𝜂 − 𝛼 𝑡𝑖𝑗 )/(𝜂 − 𝛼 𝑡𝑖𝑗−1 )� = 0 𝑡 −1 𝑡 2𝑡 𝛼 𝑖𝑗−1 𝑡𝑖𝑗−1 𝜂�1−𝛼ℎ �−ℎ𝛼 ℎ−1 𝜂𝛼 𝑖𝑗−1 +ℎ𝛼 ℎ−1 𝛼 𝑖𝑗−1 𝑡 𝑡 �𝜂−𝛼 𝑖𝑗 ��𝜂−𝛼 𝑖𝑗−1 � 𝑡 𝛼 𝑖𝑗−1 �𝛼 ℎ −1� 𝑡 𝑡 �𝜂−𝛼 𝑖𝑗 ��𝜂−𝛼 𝑖𝑗−1 � 𝑥𝑖𝑗 𝑥𝑖𝑗−1 − ℎ =0 =0 =0 𝑡 𝑡 𝑙𝑛2 (�𝜂−𝛼 𝑖𝑗 �/�𝜂−𝛼 𝑖𝑗−1 �) 2 ∑𝑑 ∑𝑛𝑖 4𝑏 𝑖=1 𝑗=2 + ℎ Estas ecuaciones pueden reescribirse de forma más concisa considerando 𝜂,𝛼 En este caso • • 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 • 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 • 2 (𝑛 4𝜎 𝜂,𝛼 𝑆𝑖𝑗 = (𝜂 − 𝛼 𝑡𝑖𝑗−1 ); 𝑇𝑖𝑗 = 𝑙𝑛 � 𝑡 𝜂−𝛼 𝑖𝑗 𝑡 𝜂−𝛼 𝑖𝑗−1 � 𝑙𝑛 𝑥𝑖𝑗 𝜂,𝛼 𝜎2 −𝑏𝑇𝑖𝑗 + ℎ 𝑥𝑖𝑗−1 2 𝑙𝑛 𝑥𝑖𝑗 𝜂,𝛼 𝜎2 −𝑏𝑇𝑖𝑗 + ℎ 𝑥𝑖𝑗−1 2 𝑡 −1 𝑡 2𝑡 𝛼 𝑖𝑗−1 𝑡𝑖𝑗−1 𝜂�1−𝛼 ℎ �−ℎ𝛼 ℎ−1 𝜂𝛼 𝑖𝑗−1 +ℎ𝛼 ℎ−1 𝛼 𝑖𝑗−1 𝑙𝑛 𝑥𝑖𝑗 𝜂,𝛼 𝜎2 −𝑏𝑇𝑖𝑗 + ℎ 𝑥𝑖𝑗−1 2 𝑡 𝛼 𝑖𝑗−1 �𝛼 ℎ −1� ℎ ℎ ℎ 𝜂,𝛼 𝑇𝑖𝑗 𝜂,𝛼 4 − 𝑑) + 𝜎 ℎ(𝑛 − 𝑑) − 𝑛𝑖 8𝑏 ∑𝑑𝑖=1 ∑𝑗=2 𝑙𝑛 𝑥𝑖𝑗 𝜂,𝛼 𝑇 𝑥𝑖𝑗−1 𝑖𝑗 ℎ =0 =0 𝜂,𝛼 𝑆𝑖𝑗 𝑆𝑖𝑗 =0 𝑛𝑖 4 ∑𝑑𝑖=1 ∑𝑗=2 𝑙𝑛2 𝑥𝑖𝑗 𝑥𝑖𝑗−1 ℎ − =0 𝜂,𝛼 2 𝑛𝑖 �𝑇𝑖𝑗 � 4𝑏 2 ∑𝑑𝑖=1 ∑𝑗=2 ℎ + Operando en las expresiones anteriores, y simplificando convenientemente, se tiene • 𝜂,𝛼 𝑥𝑖𝑗 𝑇𝑖𝑗 𝑙𝑛 𝑥𝑖𝑗−1 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 ℎ 𝑛 − 𝜂,𝛼 2 𝑏 𝑑 𝜂,𝛼 2 𝑖 ∑𝑖=1 ∑𝑛𝑗=2 �𝑇 𝑖𝑗 � ℎ 𝑛 𝜂,𝛼 𝑖 𝑖 𝑇𝑖𝑗 2𝑏 ∑𝑑𝑖=1 ∑𝑗=2 �𝑇𝑖𝑗 � + 𝜎 2 ℎ ∑𝑑𝑖=1 ∑𝑗=2 José Antonio Anguita Izquierdo + 𝜎2 ℎ 2 ℎ =0 𝑥𝑖𝑗 𝑛𝑖 𝑛𝑖 𝜂,𝛼 𝜂,𝛼 ∑𝑑𝑖=1 ∑𝑗=2 𝑇𝑖𝑗 𝑙𝑛 𝑥 𝑇𝑖𝑗 = 2 ∑𝑑𝑖=1 ∑𝑗=2 𝑖𝑗−1 − Página 47 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo • 𝑛 𝑖 𝑙𝑛 𝜂�1 − 𝛼 ℎ � �2 ∑𝑑𝑖=1 ∑𝑗=2 𝑡 −1 𝑥𝑖𝑗 𝛼 𝑖𝑗−1 𝑡𝑖𝑗−1 𝑥𝑖𝑗−1 𝜂,𝛼 𝑆𝑖𝑗 𝑡 −1 𝜂,𝛼 𝛼 𝑖𝑗−1 𝑡𝑖𝑗−1 𝜂,𝛼 𝑆𝑖𝑗 𝑛 𝑖 − 2𝑏 ∑𝑑𝑖=1 ∑𝑗=2 𝑇𝑖𝑗 + 𝜎2ℎ𝑖=1𝑑𝑗=2𝑛𝑖𝛼𝑡𝑖𝑗−1−1𝑡𝑖𝑗−1𝑆𝑖𝑗𝜂,𝛼+ℎ𝛼ℎ−12𝑖=1𝑑𝑗=2𝑛𝑖𝑙𝑛𝑥𝑖𝑗𝑥𝑖𝑗−1𝛼2𝑡𝑖𝑗−1𝑆𝑖𝑗𝜂,𝛼−2𝑏𝑖= 1𝑑𝑗=2𝑛𝑖𝑇𝑖𝑗𝜂,𝛼𝛼2𝑡𝑖𝑗−1𝑆𝑖𝑗𝜂,𝛼+𝜎2ℎ𝛼2𝑡𝑖𝑗−1𝑆𝑖𝑗𝜂,𝛼−ℎ𝜂𝛼ℎ−12𝑖=1𝑑𝑗=2𝑛𝑖𝑙𝑛𝑥𝑖𝑗𝑥𝑖𝑗−1𝛼𝑡𝑖𝑗−1 𝑆𝑖𝑗𝜂,𝛼+2𝑏𝑖=1𝑑𝑗=2𝑛𝑖𝑇𝑖𝑗𝜂,𝛼𝛼𝑡𝑖𝑗−1𝑆𝑖𝑗𝜂,𝛼−𝜎2ℎ𝑖=1𝑑𝑗=2𝑛𝑖𝛼𝑡𝑖𝑗−1𝑆𝑖𝑗𝜂,𝛼=0 • • 𝑥𝑖𝑗 𝛼 𝑡𝑖𝑗−1 𝑛 𝑖 2 ∑𝑑𝑖=1 ∑𝑗=2 𝑙𝑛 𝑥 𝑛 𝑛 𝑥𝑖𝑗 𝑛 𝑖𝑗−1 𝜂,𝛼 𝑇𝑖𝑗 =0 Ahora, denotando por 𝜂,𝛼 𝜂,𝛼 𝑌2 𝜂,𝛼 𝑛 𝑡 𝛼 𝑖𝑗−1 𝑛 𝜂,𝛼 𝑡 𝑇𝑖𝑗 𝛼 𝑖𝑗−1 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝜂,𝛼 𝑋3 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝜂,𝛼 𝑆𝑖𝑗 𝜂,𝛼 𝜂,𝛼 𝑆𝑖𝑗 𝑛 𝑥𝑖𝑗 𝜂,𝛼 𝜂,𝛼 𝑡 𝑡𝑖𝑗−1 𝛼 𝑖𝑗−1 𝑛 𝑡 𝑡𝑖𝑗−1 𝛼 𝑖𝑗−1 𝑖 𝑋3∗ = ∑𝑑𝑖=1 ∑𝑗=2 𝜂,𝛼 𝑛 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑛 𝜂,𝛼 𝑆𝑖𝑗 𝜂,𝛼 𝑆𝑖𝑗 2𝑡 𝛼 𝑖𝑗−1 𝜂,𝛼 𝑆𝑖𝑗 𝑥𝑖𝑗 𝑖 𝑍 = ∑𝑑𝑖=1 ∑𝑗=2 𝑙𝑛2 �𝑥 obtenemos el sistema • 𝜂,𝛼 𝑖𝑗−1 𝜂,𝛼 − 2𝑏𝑌3 • 2𝑌2 • ℎ𝜂𝛼 ℎ−1 �2𝑋2 • 𝑖𝑗−1 𝑛 𝑖 𝑋1∗ = ∑𝑑𝑖=1 ∑𝑗=2 𝜂,𝛼 𝜂,𝛼 𝑌3 ; 𝜂,𝛼 𝜂,𝛼 𝑥𝑖𝑗 𝑖𝑗−1 𝜂,𝛼 𝜂,𝛼 =0 𝜂,𝛼 2𝑋2 𝜂,𝛼 − 2𝑏𝑋3 𝜂,𝛼 − 2𝑏𝑋3 𝑡 𝛼 𝑖𝑗−1 𝑛 𝜂,𝛼 𝜂,𝛼 =0 𝜂,𝛼 4𝜎 2 (𝑛 − 𝑑) − 4𝑍 − 4𝑏 2 𝑌3 𝜂,𝛼 𝑆𝑖𝑗 𝑛 𝑛 =0 𝜂,𝛼 2 𝑙𝑛 𝑥𝑖𝑗 𝑥𝑖𝑗−1 𝜂,𝛼 2 𝑡 𝑡𝑖𝑗−1 𝛼 𝑖𝑗−1 𝜂,𝛼 𝑆𝑖𝑗 𝑛 2𝑡 𝛼 𝑖𝑗−1 𝑛 2𝑡 𝛼 𝑖𝑗−1 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑥𝑖𝑗 𝑙𝑛 𝑥 𝑖𝑗−1 𝜂,𝛼 𝑆𝑖𝑗 𝜂,𝛼 𝑆𝑖𝑗 𝜂,𝛼 𝑇𝑖𝑗 (B1) 𝜂,𝛼 𝜂,𝛼 𝜂,𝛼 + 𝜎 2 ℎ𝑋1 � = 0 + 𝜎 2 ℎ𝑋1 𝜂,𝛼 𝑆𝑖𝑗 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 �𝑇𝑖𝑗 � 𝜂�1 − 𝛼 ℎ ��2𝑋2∗ − 2𝑏𝑋3∗ + 𝜎 2 ℎ𝑋1∗ � + ℎ𝛼 ℎ−1 �2𝑊2 𝜂,𝛼 𝑛 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑇𝑖𝑗 𝜂,𝛼 𝑊3 + 𝜎 2 ℎ𝑌1 𝜂,𝛼 𝑛 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝜂,𝛼 𝑊1 𝑡 𝛼 𝑖𝑗−1 𝑖 − 4𝑏 2 ∑𝑑𝑖=1 ∑𝑗=2 �𝑇𝑖𝑗 � + 𝑖 𝑋2∗ = ∑𝑑𝑖=1 ∑𝑗=2 𝑇𝑖𝑗 𝑙𝑛 𝑥 � 𝑌1 ; 𝑛 𝑖 + 𝜎 2 ℎ ∑𝑑𝑖=1 ∑𝑗=2 𝑖𝑗−1 𝑋2 ; 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑇𝑖𝑗 𝑙𝑛 𝑥 𝑊2 𝑥𝑖𝑗 𝑖 4𝜎 2 ℎ(𝑛 − 𝑑) + 𝜎 4 ℎ2 (𝑛 − 𝑑) − 4 ∑𝑑𝑖=1 ∑𝑗=2 𝑙𝑛2 𝑥 𝑖 8𝑏 ∑𝑑𝑖=1 ∑𝑗=2 𝑙𝑛 𝑥 𝑋1 𝑡 𝜂,𝛼 𝛼 𝑖𝑗−1 𝜂,𝛼 𝑆𝑖𝑗 𝑖 − 2𝑏 ∑𝑑𝑖=1 ∑𝑗=2 𝑇𝑖𝑗 𝜂,𝛼 𝑖𝑗−1 𝑆𝑖𝑗 𝜂,𝛼 − 2𝑏𝑊3 𝜂,𝛼 + 𝜎 2 ℎ𝑊1 �− (B2) (B3) 𝜂,𝛼 + 𝜎 4 ℎ2 (𝑛 − 𝑑) + 8𝑏𝑌2 =0 (B4) Se observa que la ecuación (B2) se puede simplificar a partir de la ecuación (B3), por lo que las ecuaciones de nuestro sistema son • • 𝜂,𝛼 2𝑌2 𝜂,𝛼 − 2𝑏𝑌3 𝜂,𝛼 + 𝜎 2 ℎ𝑌1 𝜂,𝛼 𝜂,𝛼 =0 (B5) 𝜂,𝛼 𝜂,𝛼 𝜂�1 − 𝛼 ℎ ��2𝑋2∗ − 2𝑏𝑋3∗ + 𝜎 2 ℎ𝑋1∗ � + ℎ𝛼 ℎ−1 �2𝑊2 José Antonio Anguita Izquierdo 𝜂,𝛼 − 2𝑏𝑊3 𝜂,𝛼 + 𝜎 2 ℎ𝑊1 � = 0 (B6) Página 48 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo • • 𝜂,𝛼 𝜂,𝛼 2𝑋2 𝜂,𝛼 + 𝜎 2 ℎ𝑋1 − 2𝑏𝑋3 =0 𝜂,𝛼 4𝜎 2 (𝑛 − 𝑑) − 4𝑍 − 4𝑏 2 𝑌3 (B7) 𝜂,𝛼 + 𝜎 4 ℎ2 (𝑛 − 𝑑) + 8𝑏𝑌2 =0 (B8) Después de algunas operaciones, de las ecuaciones (B5) y (B7), obtenemos 𝑏 𝜂,𝛼 = 𝜂,𝛼 𝜂,𝛼 𝑋2 𝑌1 𝜂,𝛼 𝜂,𝛼 𝑋3 𝑌1 2 𝜎𝜂,𝛼 = 2𝐶 𝜂,𝛼 ℎ 𝐶 𝜂,𝛼 = 𝑋2 𝑌3 donde • • 𝜂,𝛼 𝜂,𝛼 − 𝑋1 𝑌2 𝜂,𝛼 𝜂,𝛼 − 𝑋1 𝑌3 𝜂,𝛼 𝜂,𝛼 𝜂,𝛼 𝜂,𝛼 −𝑋3 𝑌2 𝜂,𝛼 𝜂,𝛼 𝜂,𝛼 𝜂,𝛼 𝑋3 𝑌1 −𝑋1 𝑌3 (B9) , (B10) Reemplazando estas expresiones en (B6) y (B8), tenemos el siguiente sistema: 𝜂,𝛼 𝜂,𝛼 𝜂,𝛼 𝜂,𝛼 𝜂�1 − 𝛼 ℎ ��𝑋2∗ − 𝑏 𝜂,𝛼 𝑋3∗ + 𝐶 𝜂,𝛼 𝑋1∗ � + ℎ𝛼 ℎ−1 �𝑊2 𝜂,𝛼 − 𝑏 𝜂,𝛼 𝑊3 (𝑛 − 𝑑)(𝐶 𝜂,𝛼 )2 + 2(𝑛 − 𝑑)𝐶 𝜂,𝛼 − (𝑏 𝜂,𝛼 )2 𝑌3𝜂,𝛼 + 2𝑏 𝜂,𝛼 𝑌2𝜂,𝛼 − 𝑍 = 0 𝜂,𝛼 + 𝐶 𝜂,𝛼 𝑊1 �=0 (B11) Nota: Si b fuese conocido, la ecuación (B6) desaparece y (B10) se transforma en 𝐶 𝜂,𝛼 = 𝜂,𝛼 𝜂,𝛼 𝑏𝑋3 −𝑋2 𝜂,𝛼 𝑋1 , mientras en el anterior sistema, la expresión 𝑏 𝜂,𝛼 se debe cambiar por b 5.2.4. Inferencia en el proceso tipo Richards En este caso, el logaritmo de la función de verosimilitud es 𝑙𝑛 (𝕃𝑋𝑖𝑗 (𝜇0 , 𝜎02 , 𝑞, 𝜂, 𝑘, 𝜎 2 )) 𝑑 𝑑 𝑖=1 𝑖=1 𝑑 1 𝑛 𝑛−𝑑 𝑙𝑛(𝜎 2 ) − � 𝑙𝑛(𝑥𝑖1 ) − 2 �[𝑙𝑛(𝑥𝑖1 ) − 𝜇0 ]2 = − 𝑙𝑛(2𝜋) − 𝑙𝑛(𝜎02 ) − 2 2 2 2𝜎0 𝑛𝑖 𝑑 𝑑 𝑛𝑖 1 − � � 𝑙𝑛 (𝑥𝑖𝑗 ) − � � 𝑙𝑛(𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 ) 2 𝑖=1 𝑗=2 − 𝜂,𝑘 𝑑 𝑛𝑖 1 �� 2𝜎 2 𝑖=1 𝑗=2 𝑖=1 𝑗=2 𝑥𝑖𝑗 𝜎2 𝜂,𝛼 − 𝑞𝑇𝑖𝑗 + �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 2 𝑖𝑗−1 donde 𝑇𝑖𝑗 = 𝑙𝑛�(𝜂 + 𝑘 𝑡𝑖𝑗−1 )/(𝜂 + 𝑘 𝑡𝑖𝑗 )� 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 A continuación, derivamos respecto de los parámetros e igualamos a cero, obreniendo el siguiente sistema de ecuaciones, que, al igual que en los casos anteriores, es muy complejo y no tiene solución explícita. • • • 𝜂,𝑘 2𝑌2 𝜂,𝑘 2𝑋2 𝜂,𝑘 2𝑋4 𝜂,𝑘 − 2𝑞𝑌3 𝜂,𝑘 − 2𝑞𝑋3 𝜂,𝑘 − 2𝑞𝑋6 𝜂,𝑘 + 𝜎 2 ℎ𝑌1 𝜂,𝑘 + 𝜎 2 𝑋1 𝜂,𝑘 + 𝜎 2 𝑋1 =0 =0 =0 José Antonio Anguita Izquierdo (R1) (R2) (R3) Página 49 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝜂,𝑘 4𝜎 2 (𝑛 − 𝑑) − 4𝑍1 − 4𝑞 2 𝑌3 • donde 𝜂,𝑘 𝑋1 𝜂,𝑘 𝑋3 𝜂,𝑘 𝑋5 𝜂,𝑘 = 𝜂,𝑘 + 𝜎 2 𝑍2 + 8𝑞𝑌2 𝜂,𝑘 𝑊𝑖𝑗 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝜂,𝑘 ; 𝑆𝑖𝑗 𝑛 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑛 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑛 𝜂,𝑘 𝜂,𝑘 𝑋2 𝜂,𝑘 𝑇𝑖𝑗 𝑊𝑖𝑗 𝜂,𝑘 (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 )𝑆𝑖𝑗 𝜂,𝑘 𝑉𝑖𝑗 𝜂,𝛼 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑇𝑖𝑗 𝜂,𝑘 𝑌3 = = 𝜂,𝑘 𝑥𝑖𝑗 𝜂,𝑘 𝑙𝑛 𝑥 𝑖𝑗−1 𝜂,𝑘 2 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝜂,𝑘 𝑊𝑖𝑗 𝜂,𝑘 (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 )𝑆𝑖𝑗 𝜂,𝑘 𝑉𝑖𝑗 𝜂,𝑘 𝑆𝑖𝑗 𝜂,𝑘 𝜂,𝑘 𝑇𝑖𝑗 𝑉𝑖𝑗 𝜂,𝑘 𝑇𝑖𝑗 𝑖𝑗 −𝑡𝑖𝑗−1 𝑥𝑖𝑗 𝑙𝑛2 � � 𝑥𝑖𝑗−1 𝑛𝑖 𝑑 ∑𝑖=1 ∑𝑗=2 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 𝑥𝑖𝑗 𝑙𝑛 𝑥 𝑖𝑗−1 𝜂,𝑘 (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 )𝑆𝑖𝑗 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑡 𝑍1 = 𝑑 𝑛 𝑛 𝜂,𝑘 𝑌2 �𝑇𝑖𝑗 � 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑡𝑖𝑗 −𝑡𝑖𝑗−1 𝑖 ∑𝑑𝑖=1 ∑𝑛𝑗=2 𝑛 𝜂,𝑘 𝑋6 ; (R4) 𝑖 = ∑𝑑𝑖=1 ∑𝑗=2 𝑋4 ; (𝑡𝑖𝑗 −𝑡𝑖𝑗−1 )𝑆𝑖𝑗 𝑌1 =0 𝑥𝑖𝑗 𝑙𝑛 𝑥 𝑖𝑗−1 𝑍2 = ��𝑡𝑖𝑛𝑖 − 𝑡𝑖1 � 𝑖=1 siendo 𝜂,𝑘 𝑆𝑖𝑗 = (𝜂 + 𝑘 𝑡𝑖𝑗−1 )(𝜂 + 𝑘 𝑡𝑖𝑗 ) 𝜂,𝑘 𝑉𝑖𝑗 = 𝑡𝑖𝑗−1 𝑘 𝑡𝑖𝑗−1 −1 (𝜂 + 𝑘 𝑡𝑖𝑗 ) − 𝑡𝑖𝑗 𝑘 𝑡𝑖𝑗−1 (𝜂 + 𝑘 𝑡𝑖𝑗−1 ) 𝜂,𝑘 𝑊𝑖𝑗 = 𝑘 𝑡𝑖𝑗−1 − 𝑘 𝑡𝑖𝑗 A partir de las ecuaciones (R1) y (R2), obtenemos 𝑞 donde 𝑆 𝜂,𝑘 = 𝜂,𝑘 𝜂,𝑘 𝜂,𝑘 = 𝜂,𝑘 𝜂,𝑘 𝑋2 𝑌3 −𝑋3 𝑌2 𝜂,𝑘 𝜂,𝑘 𝜂,𝑘 𝜂,𝑘 𝑋3 𝑌1 −𝑋1 𝑌3 𝜂,𝑘 𝜂,𝑘 𝑋2 𝑌1 𝜂,𝑘 𝜂,𝑘 𝑋3 𝑌1 𝜂,𝑘 𝜂,𝑘 − 𝑋1 𝑌2 𝜂,𝑘 𝜂,𝑘 − 𝑋1 𝑌3 2 𝜎𝜂,𝑘 = 2𝑆 𝜂,𝑘 (R5) Reemplazando estas expresiones en (R3) y (R4), aparece el siguiente sistema de ecuaciones dependiente de 𝑘 y 𝜂 • • 𝜂,𝑘 𝜂,𝑘 𝜂,𝑘 𝑞 𝜂,𝑘 𝑋6 − 𝑆 𝜂,𝑘 𝑋4 − 𝑋5 =0 𝜂,𝑘 𝑆 𝜂,𝑘 �𝑆 𝜂,𝑘 𝑍2 + 2(𝑛 − 𝑑)� + 𝑞 𝜂,𝑘 �2𝑌2 𝜂,𝑘 − 𝑞 𝜂,𝑘 𝑌3 � − 𝑍1 = 0 (R6) Nota: si el parámetro q es conocido, como ocurre en el modelo logístico (q=1), la ecuación (R1) desaparece y (R5) se transforma en 𝑆 𝜂,𝑘 = debe ser cambiada por q. José Antonio Anguita Izquierdo 𝜂,𝑘 𝜂,𝑘 𝑞𝑋3 −𝑋2 𝜂,𝑘 𝑋1 , mientras en el sistema (R6), la expresión 𝑞 𝜂,𝑘 Página 50 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 5.3. Aspectos sobre procedimientos SA y VNS Como hemos comentado anteriormente, una alternativa para resolver estos sistemas de ecuaciones sería el uso de procedimientos de optimización estocásticos, tales como Simulated Annealing (SA) o Variable Neighborhood Search (VNS). Estos algoritmos están diseñados para resolver problemas del tipo 𝑚𝑖𝑛 𝑓(𝑤), con 𝑤 ∈ Ω, y en la mayoría de los casos son más apropiados que los métodos numéricos clásicos, ya que imponen menos restricciones en el espacio de soluciones y en las propiedades analíticas de la función objetivo. En el contexto de las estimaciones de los parámetros de los procesos aquí estudiados, se ha usado en obras como, por ejemplo, en [31], donde SA es usado en el contexto del proceso de difusión tipo Gompertz, mientras que en [30] un proceso híbrido VNS-SA se desarrolla para el caso Richards. Pasamos a exponer un resumen muy conciso de estos procedimientos • Algoritmo Simulated Annealing (SA) Es un algoritmo metaheurístico de búsqueda local introducido por Kirkpatrick et al [19], inspirado en el proceso metalúrgico de recocido estudiado en la estadística mecánica. En general el algoritmo sigue este procedimiento: Dada una solución 𝜃 para una iteración y 𝑓(𝜃) el valor de la función objetivo. En la siguiente iteración seleccionamos un nuevo valor 𝜃´ en un entorno 𝑁𝜃 de 𝜃, y evaluamos el aumento de la función objetivo ∆= 𝑓(𝜃´) − 𝑓(𝜃). Si ∆≤ 0, entonces 𝜃´ es seleccionada como la nueva solución. En caso contrario podría ser aceptada con probabilidad 𝑝 = exp (−∆/𝑇) con T llamado temperatura. Así, un bucle interno genera una cadena de Markov que será tan larga como el número de iteraciones del bucle. Al final del bucle, la temperatura disminuye gradualmente y se genera una nueva cadena de Markov. Al principio, el proceso de enfriamieno permite seleccionar soluciones que empeoran la función objetivo (a altas temperaturas), pero a medida que disminuye la temperatura este tipo de soluciones ya no son aceptadas. • Algoritmo Variable Neighborhood Search (VNS) El concepto básico de este algoritmo, introducido por Mladenovic y Hansen [18], es explorar varios entornos en el espacio de la solución cuando un óptimo local es encontrado a través de un método de búsqueda local. El algoritmo es aplicado en dos fases distintas: La primera, es determinar una estructura de entornos en el espacio de soluciones, 𝑁𝑘 , 𝑘 = 1, … , 𝑘𝑚𝑎𝑥 y elegir una solución inicial 𝜃0 La segunda fase, usa un método de búsqueda local para determinar una solución nueva 𝜃 ∗ en 𝑁𝑘 (𝜃0 ). Si 𝜃 ∗ provoca una mejora en la función objetivo, entonces 𝜃0 = 𝜃 ∗, y la búsqueda continúa con el siguiente entorno 𝑁𝑘+1 (𝜃0 ). El procedimiento descrito cambia los entornos cada vez que una mejora se lleva a cabo en la función objetivo. Así, existen variaciones de este algoritmo, para adaptarse a las diferentes José Antonio Anguita Izquierdo Página 51 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo formas en que la estructura de entornos puede cambiar cuando se ha alcanzado un óptimo local, así como varios métodos de búsqueda local. En este trabajo usaremos VND (Basic Variable Neighborhood Descent) y para su aplicación hay que tener en cuenta la estructura de entorno y el método de búsqueda local. 5.3.1 Acotación del espacio paramétrico Uno de los problemas fundamentales para la aplicación de estos métodos es el espacio de soluciones. Para la función objetivo anterior, este espacio es Ω = Θxℝ+, donde Θ se especificará posteriormente para cada modelo concreto. El conjunto Ω es continuo y no acotado, lo cual podría conducir a cálculos innecesarios y a algoritmos poco eficientes. Para evitar esto, veremos algunas estrategias para acotar dicho espacio de soluciones, basadas en combinar los datos de la muestra y en algunas de las características de cada curva. Con respecto al parámetro 𝜎 2 , se sabe que, cuando tiene valores altos, conduce a trayectorias muestrales con gran variabilidad alrededor de la media del proceso, por lo que el modelo sería desaconsejable. Apoyándonos en numerosas simulaciones realizadas (ver Capítulo 4), consideraremos 𝜎 2 ∈ (0; 0,01) o equivalentemente 𝜎 ∈ (0; 0,1). Para el resto de parámetros, dada la naturaleza de las curvas en cuestión, es necesario llevar a cabo su reparametrización. Esto producirá un nuevo espacio paramétrico Θ∗ , que en general es más pequeño que el inicial. Veamos esto en cada caso particular. • Proceso tipo Gompertz 𝑚 En este caso 𝑓𝜃 (𝑡) = 𝑥0 𝑒𝑥𝑝 � �𝑒 −𝛽𝑡0 − 𝑒 −𝛽𝑡 �� , 𝑡 ≥ 𝑡0 , y su espacio paramétrico es 𝛽 𝛩 = {(𝑚, 𝛽) ∈ ℝ+ 𝑥ℝ+ }. Llamando 𝛼 = 𝑒 −𝛽 y 𝑎 = −𝑚 , 𝑙𝑛𝛼 y su espacio paramétrico se obtiene la curva 𝑓𝜃 (𝑡) = 𝑥0 𝑒𝑥𝑝{𝑎(𝛼 𝑡0 − 𝛼 𝑡 )} Θ∗ = {(𝑎, 𝛼) ∈ ℝ+ x(0; 1)} por lo que sólo debemos acotar el espacio paramétrico asociado al parámetro 𝑎. Ahora bien, sabemos que para una trayectoria muestral, su valor límite asociado, a partir de un valor inicial 𝑥0 , es 𝑥0 𝑒𝑥𝑝(𝑎𝛼 𝑡0 ). Así, si las trayectorias muestrales consideradas para la inferencia tienen acotaciones 𝑡 𝑘 𝑘 0 𝑘𝑖 , 𝑖 = 1, … , 𝑑, entonces 𝑒 𝑎�𝛼� estaría comprendida entre el 𝑚𝑖𝑛 �𝑥 𝑖 � y el 𝑚𝑎𝑥 �𝑥 𝑖 �. Por tanto si 𝑡0 = 0, podemos considerar José Antonio Anguita Izquierdo 𝑖0 𝑖0 Página 52 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 𝑘𝑖 𝑘𝑖 𝑎� ∈ �𝑙𝑛 �𝑚𝑖𝑛 � �� , 𝑙𝑛 �𝑚𝑎𝑥 � ��� 𝑥𝑖0 𝑥𝑖0 Y en el caso 𝑡0 ≠ 0, y para 𝛼0 ∈ (0; 1), se considerará ⎛ 𝑎� ∈ ⎜ 𝑘 𝑘 𝑙𝑛 �𝑚𝑖𝑛 � 𝑖 �� 𝑙𝑛 �𝑚𝑎𝑥 � 𝑖 �� 𝑥𝑖0 𝑥𝑖0 ⎞ , 𝑡 𝑡 ⎟ 𝛼00 𝛼00 ⎝ ⎠ Luego el espacio se soluciones quedará de la siguiente manera ⎛ 𝛺=⎜ ⎝ 𝑘 𝑘 𝑙𝑛 �𝑚𝑖𝑛 �𝑥 𝑖 �� 𝑙𝑛 �𝑚𝑎𝑥 �𝑥 𝑖 �� ⎞ 𝑖0 𝑖0 ; 𝑡0 𝑡0 ⎟ x(0; 1)x(0; 0,01) 𝛼0 𝛼0 ⎠ • Proceso tipo Bertalanffy 1−𝑐𝑒 −𝑘𝑡 𝑏 En este caso, 𝑓𝜃 (𝑡) = 𝑥0 �1−𝑐𝑒 −𝑘𝑡0 � , 𝑡 ≥ 𝑡0 > 𝛩 = {(𝑐, 𝑘, 𝑏) ∈ ℝ+ xℝ+ x[1, +∞)}. 1 𝑐 𝑙𝑛𝑐 , 𝑘 y su espacio paramétrico es Llamando 𝛼 = 𝑒 −𝑘 y 𝜂 = , se obtiene la curva reparametrizada 𝑓𝜃 (𝑡) = 𝑥0 � y su espacio paramétrico 𝜂 − 𝛼𝑡 � 𝜂 − 𝛼 𝑡0 𝑏 Θ∗ = {(𝜂, 𝛼, 𝑏) ∈ ℝ+ x(0; 1)x[1, +∞)} donde el parámetro b puede ser conocido o no. En este caso, el dominio de 𝛼 es acotado, por lo que tendremos que acotar el de 𝜂 y b. 𝜂 Se sabe que la curva presenta un punto de inflexión en 𝑡𝐼 = 𝑙𝑛� �𝑏�/𝑙𝑛𝛼 que puede ser visualizado sí y sólo sí 𝜂 < 𝑏𝛼 𝑡0 . Como en la vida real es normal que el punto de inflexión se pueda ver, podemos considerar la acotación anterior como cierta, o de forma más amplia 0 < 𝜂 < 𝑏. Veamos ahora cómo acotar b. A partir de las propiedades de la curva Bertalanffy, se deduce que 𝜂 = 𝑏𝛼 𝑡𝐼 , mientras que 1 𝑥0 𝑏 1 𝑡0 −𝑡𝐼 𝛼 = �𝑏 �1 − � � �� 𝑘 con k el valor límite de la curva. Ahora consideramos las siguientes funciones: 1 𝑥0 𝑏 -) 𝑔(𝑡, 𝑏) = �𝑏 �1 − � 𝑘 � �� 1 𝑡0 −𝑡 , 𝑏 ≥ 1, 𝑡 ∈ 𝐼 = [𝑡1 , 𝑡2 ] José Antonio Anguita Izquierdo Página 53 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo siendo I un intervalo conteniendo el instante en el que el punto de inflexión se alcanza. Esta función es continua y como es creciente, a partir de 𝑓𝜃 (𝑡𝐼 ), se deduce que 0 < 𝑔(𝑡, 𝑏) < 1, ∀(𝑡, 𝑏). Si b es conocido, g es estrictamente creciente y alcanzan su mínimo en 𝑡1 y su máximo en 𝑡2 . Y si b es desconocido, y restringiendo 𝑏 ∈ [𝑏1 , 𝑏2 ] (intervalo que contiene el valor verdadero de b), se verifica que g crece cuando cualquiera de sus argumentos es fijo. Además, no posee extremos locales, y por lo tanto su mínimo se alcanza en (𝑡1 , 𝑏1 ) y su máximo en (𝑡2 , 𝑏2 ). -) ℎ(𝑡, 𝛼, 𝑏) = 𝑏𝛼 𝑡 , 𝑏 ≥ 1, 𝑡 ∈ 𝐼, 𝛼 ∈ [𝛼1 , 𝛼2 ] ⊂ (0; 1). Esta función también es continua, y para un b conocido, se prueba que no tiene extremos locales, que es decreciente en t para un 𝛼 fijo, y es creciente en 𝛼 para un t fijo. Luego alcanza su mínimo en (𝑏, 𝛼1 , 𝑡2 ) y su máximo en (𝑏, 𝛼2 , 𝑡1 ). Para un b desconocido, y restringiendo de nuevo al intervalo [𝑏1 , 𝑏2 ], la función no tiene extremos locales. Por último, realizando un análisis similar al anterior (simplemente variando cada uno de los argumentos), llegamos a la conclusión de que esta función alcanza su mínimo en (𝑏1 , 𝛼1 , 𝑡2 ) y su máximo en (𝑏2 , 𝛼2 , 𝑡1 ) • Partiendo de esto, se propone la siguiente estrategia para acotar Θ∗ : 1 𝑏 𝑏 Caso b conocido: a partir de �1 − � que es el cociente entre el valor de la curva en 𝑡𝐼 y su valor límite, podemos aproximar 𝑡𝐼 tomando el primer instante de tiempo en el cual la media de 1 𝑏 𝑏 las trayectorias de la muestra supera 𝑘 ∗ �1 − � , donde 𝑘 ∗ es el límite de la media de las trayectorias muestrales. Este procedimiento se aplica cuando se conoce tal valor límite, aunque sólo sea aproximadamente. Para este fin, se emplea el último valor de la media, 𝑡𝐼∗ . Consideramos intervalos [𝑡1 , 𝑡2 ] con 𝑡1 el instante previo a 𝑡𝐼∗ y 𝑡2 = 𝑡𝐼∗ , y a partir de tal • intervalo, se tiene que 𝛼 ∈ [𝑔(𝑡1 , 𝑏); 𝑔(𝑡2 , 𝑏)] 𝑦 𝜂 ∈ [ℎ(𝑏, 𝛼1 , 𝑡2 ); ℎ(𝑏, 𝛼2 , 𝑡1 )] Caso b desconocido: a partir de que el instante de la inflexión está contenido dentro del intervalo de tiempo observado, se sugiere la interpolación de una función S (normalmente un spline natural cúbico) para la media de las trayectorias muestrales y posteriormente encontrar el ∗ ∗ instante de tiempo 𝑡𝐼∗ en el que se alcanza el máximo de su derivada. Sea [𝑡𝐼−1 , 𝑡𝐼+1 ] el intervalo determinado por los instantes de tiempo observados antes y después de 𝑡𝐼∗. Dado que 1 𝑏 𝑏 𝑓𝜃 (𝑡𝐼 ) = 𝑘(𝜃) �1 − � , existe la posibilidad de que el intervalo anterior contenga instantes de tiempo que verifiquen esa condición. Para ello, consideraremos una fina partición del intervalo anterior y seleccionaremos 𝑡2 como el anterior instante que verifique 𝑆(𝑡𝑖 ) 𝑘∗ > 𝑒 −1 donde 𝑘 ∗ se ∗ para define como en el caso anterior. Así, consideramos un intervalo [𝑡1 , 𝑡2 ] con 𝑡1 = 𝑡𝐼−1 posteriormente calcular un primer intervalo [𝑏1∗ , 𝑏2∗ ] para b a partir de las soluciones de las 1 𝑏 𝑏 ecuaciones 𝑆(𝑡𝑖 ) = 𝑘 ∗ �1 − � , 𝑖 = 1, 2. Este último intervalo puede ser muy grande, ya que 1 𝑏 𝑏 la función �1 − � crece muy lentamente y pequeñas variaciones en José Antonio Anguita Izquierdo 𝑆(𝑡1 ) 𝑘∗ puede dar lugar a Página 54 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo valores muy grandes de b. Por ello, se sugiere un procedimiento para mejorar la selección realizada para b, basado en el procedimiento usado para encontrar un rango de valores para el parámetro de la transformación de Box-Cox en modelos lineales. Para ello, si llamamos 𝐿∗ (𝑏) = 𝑠𝑢𝑝𝜂,𝛼,𝜎2 𝑙𝑛 (𝕃𝑋 (𝜇0 , 𝜎02 , 𝜂, 𝛼, 𝑏, 𝜎 2 )) y consideramos 𝐿∗ �𝑏�� = 𝑠𝑢𝑝𝜂,𝛼,𝑏,𝜎2 𝑙𝑛 (𝕃𝑋 (𝜇0 , 𝜎02 , 𝜂, 𝛼, 𝑏, 𝜎 2 )) entonces se tiene que 2(𝐿∗ �𝑏�� − 𝐿∗ (𝑏))~𝒳12 para lo cual 1 2 𝑃 �𝐿∗ (𝑏) ≥ 𝐿∗ �𝑏�� − 𝒳1,𝛼 �=1−𝛼 2 2 siendo 𝒳1,𝛼 el (1 − 𝛼)-ésimo percentil de una 𝒳 2 con un grado de libertad. Dividiendo 𝐿∗ (𝑏) 1 2 encontramos dos valores para b que determinan el intervalo que con ordenada 𝐿∗ �𝑏�� − 𝒳1,𝛼 2 consideraremos. Por cuestiones prácticas, este procedimiento se realiza considerando una red de valores entre 𝑏1∗ y 𝑏2∗ y calculando 𝐿∗ (𝑏) usando el método para la estimación de parámetros para el caso de b conocido. Esto produce un conjunto de valores 𝑙𝑖∗ . La ordenada usada para determinar 1 2 2 . De este modo para el intervalo así encontrado los valores de b serán 𝑚𝑎𝑥𝑖 {𝑙𝑖∗ } − 𝒳1,𝛼 [𝑏1 , 𝑏2 ], se determina que 𝛼 ∈ [𝑔(𝑡1 , 𝑏1 ); 𝑔(𝑡2 , 𝑏2 )] y 𝜂 ∈ [ℎ(𝑏1 , 𝛼1 , 𝑡2 ); ℎ(𝑏2 , 𝛼2 , 𝑡1 )] • Proceso tipo Richards 𝑞 1+𝑏𝑒 −𝑐𝑡0 En este caso, 𝑓𝜃 (𝑡) = 𝑥0 � 1+𝑏𝑒 −𝑐𝑡 � , 𝑡 ≥ 𝑡0 > {𝜃 ∗ = (𝑏, 𝑐, 𝑞) ∈ ℝ+ xℝ+ xℝ+ }. 1 𝑏 −𝑙𝑛𝑏 , 𝑐 siendo su espacio paramétrico 𝛩 = Llamando 𝛼 = 𝑒 −𝑐 y 𝜂 = , se obtiene la curva reparametrizada 𝜂 + 𝛼 𝑡0 𝑓𝜃 (𝑡) = 𝑥0 � � 𝜂 + 𝛼𝑡 y su espacio paramétrico 𝑞 Θ∗ = {(𝜂, 𝛼, 𝑞) ∈ ℝ+ x(0; 1)xℝ+ } El procedimiento discutido anteriormente para la curva Bertalanffy es también válido para este caso, considerando 1 𝑞 1 𝑡0 −𝑡 𝑘 𝑔(𝑡, 𝑞) = �𝑞 �� � − 1�� 𝑥0 José Antonio Anguita Izquierdo 𝑦 ℎ(𝑡, 𝛼, 𝑞) = 𝑞𝛼 𝑡 Página 55 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo con 𝑞 > 0, 𝑡 ∈ 𝐼 = [𝑡1 , 𝑡2 ], 𝛼 ∈ [𝛼1 , 𝛼2 ] ⊂ (0; 1), siendo k el valor límite de la curva, y además usando 𝜂 las propiedades que presenta la curva Richards, esto es, su punto de inflexión es 𝑡𝐼 = 𝑙𝑛� �𝑞 �/𝑙𝑛𝛼, que puede ser visto sí y sólo sí 𝜂 < 𝛼 𝑡0 , y cuyo valor en la función es 𝑞 𝑞 𝑓𝜃 (𝑡𝐼 ) = 𝑘(𝜃 ∗ ) � � 1+𝑞 con 𝑘(𝜃 ∗ ) = 𝑥0 �1 + 𝛼 𝑡0 � 𝜂 𝑞 • Proceso tipo logístico En este caso, 𝑓𝜃 (𝑡) = 𝑥0 𝛩 = {𝜃 ∗ = (𝑏, 𝑐) ∈ ℝ+ xℝ+ }. 1+𝑏𝑒 −𝑐𝑡0 1+𝑏𝑒 −𝑐𝑡 1 𝑏 , 𝑡 ≥ 𝑡0 > −𝑙𝑛𝑏 , 𝑐 y su espacio paramétrico es Llamando 𝛼 = 𝑒 −𝑐 y 𝜂 = , se obtiene la curva reparametrizada y su espacio paramétrico 𝑓𝜃 (𝑡) = 𝑥0 𝜂 + 𝛼 𝑡0 𝜂 + 𝛼𝑡 Θ∗ = {(𝜂, 𝛼) ∈ ℝ+ x(0; 1)} Está claro que para esta curva se puede seguir el procedimiento anterior, pues es un caso particular de la curva Richards, tomando 𝑞 = 1 José Antonio Anguita Izquierdo Página 56 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo 5.4. Estimación de los parámetros para el caso Bertalanffy Recordemos que nuestro objetivo (una vez estimados 𝜇0 y 𝜎02 ) es minimizar la función objetivo 𝑓𝜃 �𝑡𝑖𝑗 � 𝑥𝑖𝑗 𝜎2 − 𝑙𝑛 + 2 �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 𝑖𝑗−1 𝑓𝜃 �𝑡𝑖𝑗−1 � 𝑛−𝑑 1 �𝑋 (𝜃, 𝜎 2 ) = 𝕃 𝑙𝑛(𝜎 2 ) + 2 � � 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 2 2𝜎 𝑑 𝑛𝑖 𝑖=1 𝑗=2 que en nuestro caso queda de la siguiente manera con �𝑋 (𝑏, 𝛼, 𝜂, 𝜎 2 ) = 𝕃 𝑑 𝑛𝑖 𝑛−𝑑 1 𝑙𝑛(𝜎 2 ) + 2 � � 2 2𝜎 𝑖=1 𝑗=2 𝜂,𝛼 𝑇𝑖𝑗 = 𝑙𝑛 � 𝑥𝑖𝑗 𝜎2 𝜂,𝛼 − 𝑏𝑇𝑖𝑗 + 2 �𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 �)2 (𝑙𝑛 𝑥 𝑖𝑗−1 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 𝜂 − 𝛼 𝑡𝑖𝑗 � 𝜂 − 𝛼 𝑡𝑖𝑗−1 Para este caso, y una vez que el espacio de soluciones ha sido acotado, especificamos los parámetros iniciales del algoritmo SA, así como la condición de parada: 1. La solución inicial (𝜃0 )se elige al azar en el subespacio paramétrico acotado 2. La temperatura inicial (𝑇0 ) debe ser alta, por lo que al principio hay una alta probabilidad, 𝑝0 , de aceptar valores que aumentan el valor de la función objetivo. En nuestro caso, hemos considerado 𝑝0 = 0,9 así que 𝑇0 = −∆𝑓 + /𝑙𝑛𝑝0 , donde ∆𝑓 + denota el incremento medio de la función objetivo cuando los valores que producen un aumento son aceptamos después de considerar N valores en el espacio de soluciones. Se ha considerado N=100 3. Para enfriar el proceso se ha tomado un esquema geométrico, 𝑇𝑖 = 𝛾𝑇𝑖−1 , 𝑖 ≥ 1 con 𝛾 normalmente entre 0,8 y 0,99. Aquí se ha considerado 𝛾 = 0,95 4. La longitud seleccionada de la cadena de Markov, para la aplicación de cada secuencia completa del algoritmo es L=50. Luego en cada paso se generará una cadena de 50 soluciones antes de comprobar la regla de parada y modificar la temperatura si es necesario 5. La regla de parada será doble. Primero, se comprueba si los últimos 50 valores generados son iguales, en cuyo caso se detiene el algoritmo. De lo contrario, se continúa hasta que la temperatura alcanza un valor cercano a cero (0,1 en nuestro caso) Para aplicar el algoritmo VND, como hemos mencionado anteriormente, hay que tener en cuenta la estructura de entorno y el método de búsqueda local. En cuanto a la estructura de entorno y una vez seleccionado un valor de 𝑘𝑚𝑎𝑥 (10 en nuestro caso), procedemos de la siguiente manera. José Antonio Anguita Izquierdo Página 57 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Sea 𝛩´ = [𝑏1 , 𝑏2 ]x[𝛼1 , 𝛼2 ]x[𝜂1 , 𝜂2 ]x(0; 0,1) el subespacio de soluciones acotado. ℎ11 = ℎ31 = Dada una solución inicial 𝜃0 = (𝑏0 , 𝛼0 , 𝜂0 , 𝜎0 ), consideramos las cantidades 𝑏0 −𝑏1 𝑘𝑚𝑎𝑥 𝜂0 −𝜂1 𝑘𝑚𝑎𝑥 ℎ12 = ℎ32 = 𝑏2 −𝑏0 𝑘𝑚𝑎𝑥 𝜂2 −𝜂0 𝑘𝑚𝑎𝑥 ℎ21 = 𝛼0 −𝛼1 𝑘𝑚𝑎𝑥 ℎ41 = 𝑘 𝜎0 𝑚𝑎𝑥 ℎ22 = ℎ42 = 𝜎2 −𝛼1 𝑘𝑚𝑎𝑥 0,1−𝜎0 𝑘𝑚𝑎𝑥 La estructura de entornos es: 𝑁𝑘 (𝜃) = [𝑏0 − 𝑘ℎ11 , 𝑏0 + 𝑘ℎ12 ]x[𝛼0 − 𝑘ℎ21 , 𝛼0 + 𝑘ℎ22 ]x[𝜂0 − 𝑘ℎ31 , 𝜂1 + 𝑘ℎ32 ]x para 𝑘 = 1, … , 𝑘𝑚𝑎𝑥 [𝜎0 − 𝑘ℎ41 , 𝜎0 + 𝑘ℎ42 ] Por otro lado, respecto a la búsqueda local, se ha seleccionado el algoritmo SA. Esto nos permite realizar un procedimiento híbrido VND, que ha demostrado ser útil en varias aplicaciones. Con el fin de validar los procedimientos descritos anteriormente que se aplican a la estimación de los parámetros del proceso, llevaremos a cabo los siguientes estudios de simulación. Comenzaremos por evaluar la utilidad del método propuesto al espacio de soluciones acotado. Como veremos, en estos intervalos los algoritmos SA y VND realizan bien las estimaciones de esos parámetros. Para ello, se han generado 25 trayectorias muestrales, cada una con 401 datos, a partir del instante inicial 𝑡0 = 0, tomando ℎ = 0,1 como paso de integración y una distribución inicial Λ(1; 0,2). Con respecto a los otros parámetros del proceso, se han considerado 𝑏 = 5; 𝛼 = 0,8; 𝜂 = 1,5; 𝜎 = 0,01. Estos valores nos aseguran que el instante de tiempo de inflexión es visible, siendo su valor teórico 𝑡𝐼 = 5,396. Con el objetivo de realizar la posterior inferencia, hemos considerado 41 datos con 𝑡𝑖𝑗 − 𝑡𝑖𝑗−1 = 1 con 𝑖 = 1, … ,25; 𝑗 = 1, … ,41. El gráfico siguiente muestra la media de las trayectorias simuladas José Antonio Anguita Izquierdo Página 58 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo La Tabla 1 muestra los resultados obtenidos cuando el valor de b se considera conocido y desconocido. Esta tabla presenta el intervalo estimado para el tiempo de inflexión, así como los encontrados para los demás parámetros. Se puede ver como en todos los casos los intervalos contienen el verdadero valor del tiempo de inflexión y de cada parámetro. Además se aprecia que los intervalos en el caso b desconocido son más amplios que en el caso b conocido (como era de esperar, pues la incertidumbre aumenta) b conocido (b=5) b desconocido Tinf (5,6) 𝛼 Tinf (4,28; 5,8368) 𝛼 (0,7544;0,812) (0,7859;0,8181) 𝜂 𝜂 (1,1786;1,8328) b (0,9585;2,1115) (4,9138; 5,1298) Tabla 1 Una vez acotados los espacios paramétricos, aplicamos los algoritmos SA y VND a la estimación de los parámetros. Hay que tener en cuenta que en el procedimiento SA la solución inicial se selecciona aleatoriamente a partir del espacio acotado, mientras que para el procedimiento VND usamos la solución aportada por SA. En la Tabla 2, se muestran las estimaciones de nuestros parámetros para el caso de b conocido y de b desconocido, usando SA y VND, así como los valores de la función de verosimilitud. Podemos apreciar como ambos procedimientos proporcionan buenas estimaciones, aunque se ve claramente como VND proporciona mejores resultados que SA, en particular para el caso de un b desconocido. b conocido Valor real b desconocido Valor estimado Valor estimado SA SA VND 5,0251 5,0209 VND b 2 𝛼 0,8 0,8003 0,8002 0,7975 0,7995 1,25 1,4982 1,4994 1,508 1,5038 0,01 0,0103 0,0099 0,0117 0,0101 -4103,825 -4092,384 -4103,765 -4086,842 -4103,077 𝜂 𝜎 f. verosimilitud Tabla 2 José Antonio Anguita Izquierdo Página 59 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo ANEXO A. Simulación de las trayectorias Parámetros de las funciones utilizadas en la simulación n: número de datos de cada trayectoria tra: número de trayectorias a simular h: paso de la simulación x0: valor de la distribución inicial para el caso degenerado t0: instante inicial m0 y sigam0: parámetros de la distribución inicial para el caso lognormal Ini: variable con dos valores (0 si la distribución inicial es degenerada y 1 si sigue una distribución lognormal) El código R para generar tra trayectorias del proceso Wiener con n datos cada una y un paso h, será: Wiener=function(n,tra,h) { Wiener=array(0,c(n,tra)) for (i in 1:tra) Wiener[,i]=cumsum(c(0,rnorm(n-1,0,sqrt(h)))) Wiener } Gompertz Primero definimos la función 𝑥(𝑡) = Gompertz=function(t0,t,m,beta) 𝑚 �𝑒 −𝛽𝑡0 𝛽 − 𝑒 −𝛽𝑡 � { m*(exp(-beta*t0)-exp(-beta*t))/beta } Ahora, definimos la función que genera las trayectorias simuladas. GeneraGompertz=function(Ini,x0,n,tra,h,t0,m,beta,sigma,m0,sigma0) { Win=Wiener(n,tra,h) if (Ini==0) Inicial=rep(x0,tra) else Inicial=rlnorm(tra,m0,sigma0) GeneraGompertz=array(0,c(n,tra)) Tiempo=seq(t0,t0+(n-1)*h,h) GeneraGompertz=t(Inicial*t(exp(Gompertz(t0,Tiempo,m,beta)+(sigma*Win)José Antonio Anguita Izquierdo Página 60 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo (sigma^2/2)*(Tiempo-t0)))) GeneraGompertz } Bertalanffy 1−𝑐𝑒 −𝑘𝑡 𝑏 Primero definimos la función 𝑥(𝑡) = �1−𝑐𝑒 −𝑘𝑡0 � Bertalanffy=function(t0,t,b,c,k) { ((1-c*exp(-k*t))/(1-c*exp(-k*t0)))^b } Ahora, definimos la función que genera las trayectorias simuladas. GeneraBertalanffy=function(Ini,x0,n,tra,h,t0,b,c,k,sigma,m0,sigma0) { Win=Wiener(n,tra,h) if (Ini==0) Inicial=rep(x0,tra) else Inicial=rlnorm(tra,m0,sigma0) GeneraBertalanffy =array(0,c(n,tra)) Tiempo=seq(t0,t0+(n-1)*h,h) GeneraBertalanffy =t(Inicial*t(Bertalanffy(t0,Tiempo,b,c,k)*exp((sigma*Win)(sigma^2/2)*(Tiempo-t0)))) GeneraBertalanffy } Richards 1+𝑏𝑒 −𝑐𝑡0 𝑞 Primero definimos la función 𝑥(𝑡) = � 1+𝑏𝑒 −𝑐𝑡 � Richards=function(t0,t,b,c,q) { ((1+b*exp(-c*t0))/(1+b*exp(-c*t)))^q } Ahora, definimos la función que genera las trayectorias simuladas. GeneraRichards=function(Ini,x0,n,tra,h,t0,b,c,q,sigma,m0,sigma0) { Win=Wiener(n,tra,h) if (Ini==0) Inicial=rep(x0,tra) else Inicial=rlnorm(tra,m0,sigma0) GeneraRichards =array(0,c(n,tra)) Tiempo=seq(t0,t0+(n-1)*h,h) José Antonio Anguita Izquierdo Página 61 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo GeneraRichards =t(Inicial*t(Richards(t0,Tiempo,b,c,q)*exp((sigma*Win)(sigma^2/2)*(Tiempo-t0)))) GeneraRichards } Logística Primero definimos la función 𝑥(𝑡) = Richards=function(t0,t,b,c) 1+𝑏𝑒 −𝑐𝑡0 1+𝑏𝑒 −𝑐𝑡 { (1+b*exp(-c*t0))/(1+b*exp(-c*t)) } Ahora, definimos la función que genera las trayectorias simuladas. GeneraLogística=function(Ini,x0,n,tra,h,t0,b,c,sigma,m0,sigma0) { Win=Wiener(n,tra,h) if (Ini==0) Inicial=rep(x0,tra) else Inicial=rlnorm(tra,m0,sigma0) GeneraLogística =array(0,c(n,tra)) Tiempo=seq(t0,t0+(n-1)*h,h) GeneraLogística =t(Inicial*t(Logistica(t0,Tiempo,b,c)*exp((sigma*Win)(sigma^2/2)*(Tiempo-t0)))) GeneraLogistica José Antonio Anguita Izquierdo Página 62 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo ANEXO B. Estimación de parámetros FUNCIÓN QUE GENERA TRAYECTORIAS DEL PROCESO GeneraBertalanffy2<-function(Win,Inicial,n,tra,h,t0,eta,alfa,q,sigma) { GeneraBertalanffy<-array(0,c(n,tra)) Tiempo<-seq(t0,t0+(n-1)*h,h) GeneraBertalanffy<-t(Inicial*t(Bertalanffy(t0,Tiempo,eta,alfa,b)* } GeneraBertalanffy exp(sigma*Win-(sigma^2/2)*(Tiempo-t0)))) FUNCIÓN QUE EXTRAE VALORES DE TRAYECTORIAS CALCULADAS PREVIAMENTE # n: Tamaño de la trayectoria # tra: número de trayectorias # h: paso entre dos instantes sucesivos # Trayectorias: trayectorias simuladas # Se extraen (n-1)*h+1 valores igualmente espaciados ExtraeTrayectorias<-function(Trayectorias,n0,n1,tra,h) { ExtraeTrayectorias<-array(0,c(n1,tra)) ExtraeTrayectorias<-Trayectorias[seq(1,n0,(n0-1)/(n1-1)),] ExtraeTrayectorias } José Antonio Anguita Izquierdo Página 63 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo FUNCIÓN OBJETIVO PARA EL PROCESO BERTALANFFY # Param: vector de parámetros # x: Matriz con los logaritmos de los incrementos de las trayectorias # t: vector con los instantes de tiempo # h: Diferencia entre tiempos (en principio los datos son equidistantes) # n: Longitud de las trayectorias # N: (n-1)*NumTrayectorias # b0: en el caso b conocido Caso b conocido f.Bertalanffy1<-function(b0,param,x,t,h,n,N) { a<-b0*log((param[1]-param[2]^t[2:n])/(param[1]-param[2]^t[1:n-1]))-param[3]^2*h/2 f.Bertalanffy1<-N*log(param[3]^2)/2+sum((x-a)^2)/(2*h*param[3]^2) } Caso b desconocido f.Bertalanffy2<-function(param,x,t,h,n,N) { a<-param[3]*log((param[1]-param[2]^t[2:n])/(param[1]-param[2]^t[1:n-1]))-param[4]^2*h/2 f.Bertalanffy2<-N*log(param[4]^2)/2+sum((x-a)^2)/(2*h*param[4]^2) } FUNCIONES PARA LA ACOTACIÓN DEL ESPACIO PARAMÉTRICO funcion1 <- function (x) ((1-(1/x))^x) funcion2 <- function (x,cota,x0,t0,t) ((x*(1-(x0/cota)^(1/x)))^(1/(t0-t))) funcion3 <- function (b,a,t) a^(t)*b José Antonio Anguita Izquierdo Página 64 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo ACOTACIÓN DEL ESPACIO PARAMÉTRICO Caso b conocido acota1<- function(x,t,cota,b0,x0,t0,decide) { if(which(x/cota>funcion1(b0))[1]==1) t1<-t0 else t1<-t[which(x/cota>funcion1(b0))[1]-1] t2<-t[which(x/cota>funcion1(b0))[1]] if(t0==t1) alfa1<-0 else alfa1<-funcion2(b0,cota,x0,t0,t1) if(t2==t1) alfa2<-1 else alfa2<-funcion2(b0,cota,x0,t0,t2) if(decide == 0) { eta1<-0 eta2<-b0 } else { eta1<-funcion3(b0,alfa1,t2) eta2<-funcion3(b0,alfa2,t1) } acota1<-rbind(c(eta1,eta2),c(alfa1,alfa2),c(0,.1),c(t1,t2)) } Caso b desconocido acota3<-function(y,x,t,x0,t0,h,nvalor,N,nparticion,p0,p,gamma,decide) { a<-splinefun(t,x,method="natural") # Calcula spline cúbico natural a la media del proceso v1<-curve(a(x,deriv=1),t[1],t[nvalor],n=nvalor)$y v3<-which(v1==max(v1),arr.ind=TRUE) if(v3==1 | v3==nvalor) José Antonio Anguita Izquierdo Página 65 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo { if(v3==1) { paso=(t[v3+1]-t[v3])/nparticion t1<-seq(t[v3],t[v3]+(nparticion-1)*paso,paso) } else { paso=(t[v3]-t[v3-1])/nparticion t1<-seq(t[v3-1],t[v3-1]+(nparticion-1)*paso,paso) } } else { paso=(t[v3+1]-t[v3-1])/nparticion t1<-seq(t[v3-1],t[v3-1]+(nparticion-1)*paso,paso) } tinf1<-t1[1] fun1<- function (y) (a(tinf1)/x[nvalor]-funcion1(y)) sigue<-1 lim1<-1 while(sigue>0) { lim1<-lim1+.01 if (fun1(lim1)<0) sigue=0 } if(lim1==1.01) b1<-1 else b1<- uniroot(fun1, c(1, lim1))$root if(length(which(a(t1)/x[nvalor]>exp(-1)))==0) { tinf2<-t1[nparticion] José Antonio Anguita Izquierdo Página 66 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo } else { tinf2<-t1[which(a(t1)/x[nvalor]>exp(-1))[1]-1] } fun2<- function (y) (a(tinf2)/x[nvalor]-funcion1(y)) sigue<-1 lim2<-1 while(sigue>0) { lim2<-lim2+.01 if (fun2(lim2)<0) sigue=0 } b3<- uniroot(fun2, c(lim1, lim2))$root logvero<-numeric(0) ini<-b1 sigue<-1 cuenta1<-0 cuenta2<-0 while(sigue==1) { cuenta2<-cuenta2+1 if(cuenta2>1) ini<-ini+.1 ent<-acota1(x,t,x[nvalor],ini,xini,t0,decide) temp<-temperatura.Bertalanffy1(ent,ini,y,t,h,nvalor,N,p0) sol2<-simann.Bertalanffy1(ent,temp,gamma,ini,y,t,h,nvalor,N) vero<--f.Bertalanffy1(ini,sol2,y,t,h,nvalor,N) logvero<-c(logvero,vero) if(vero<max(logvero)) José Antonio Anguita Izquierdo Página 67 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo { cuenta1<-cuenta1+1 if(cuenta1==5) sigue<-0 } else cuenta1<-0 } vero2<-which(logvero>max(logvero)-.5*qchisq(p,1),arr.ind=TRUE) b2<-b1+(vero2[length(vero2)])*.1 if(vero2[1]>2) b1<-b1+(vero2[1]-2)*.1 alfa1<-funcion2(b1,x[nvalor],x[1],t[1],tinf1) alfa2<-funcion2(b2,x[nvalor],x[1],t[1],tinf2) eta1<-funcion3(b1,alfa1,tinf2) eta2<-funcion3(b2,alfa2,tinf1) acota3<-rbind(c(eta1,eta2),c(alfa1,alfa2),c(b1,b2),c(0,.1),c(tinf1,tinf2),c(b1,b3)) } TEMPERATURA: Calcula la media de los incrementos Caso b conocido temperatura.Bertalanffy1<-function(entorno,b0,x,t,h,n,N,p0) { sigue<-1 while(sigue>0) { solaleatoria1<c(runif(1,entorno[1,1],entorno[1,2]),runif(1,entorno[2,1],entorno[2,2]),runif(1,entorno[3,1],entorno[3, 2])) if (log(solaleatoria1[1])/log(solaleatoria1[2])<t[1]) sigue=0 José Antonio Anguita Izquierdo Página 68 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo } tempini<-0 k<-1 for(i in 1:100) { sigue<-1 while(sigue>0) { solaleatoria2<c(runif(1,entorno[1,1],entorno[1,2]),runif(1,entorno[2,1],entorno[2,2]),runif(1,entorno[3,1],entorno[3, 2])) if (log(solaleatoria2[1])/log(solaleatoria2[2])<t[1]) sigue=0 } Dif=f.Bertalanffy1(b0,solaleatoria2,x,t,h,n,N)-f.Bertalanffy1(b0,solaleatoria1,x,t,h,n,N) if(Dif>0) { k<-k+1 tempini<-tempini+Dif } solaleatoria1<-solaleatoria2 } tempini<-(-tempini/k)/log(p0) } Caso b desconocido temperatura.Bertalanffy2<-function(entorno,x,t,h,n,N,p0) { sigue<-1 while(sigue>0) { José Antonio Anguita Izquierdo Página 69 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo solaleatoria1<c(runif(1,entorno[1,1],entorno[1,2]),runif(1,entorno[2,1],entorno[2,2]),runif(1,entorno[3,1],entorno[3, 2]),runif(1,entorno[4,1],entorno[4,2])) if (log(solaleatoria1[1])/log(solaleatoria1[2])<t[1]) sigue=0 } tempini<-0 k<-1 for(i in 1:100) { sigue<-1 while(sigue>0) { solaleatoria2<c(runif(1,entorno[1,1],entorno[1,2]),runif(1,entorno[2,1],entorno[2,2]),runif(1,entorno[3,1],entorno[3, 2]),runif(1,entorno[4,1],entorno[4,2])) if (log(solaleatoria2[1])/log(solaleatoria2[2])<t[1]) sigue=0 } Dif=f.Bertalanffy2(solaleatoria2,x,t,h,n,N)-f.Bertalanffy2(solaleatoria1,x,t,h,n,N) if(Dif>0) { k<-k+1 tempini<-tempini+Dif } solaleatoria1<-solaleatoria2 } tempini<-(-tempini/k)/log(p0) } José Antonio Anguita Izquierdo Página 70 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo ALGORITMO SA Caso b conocido simann.Bertalanffy1<-function(entorno,temp,alpha,b0,x,t,h,n,N) { ini<-c(runif(1,entorno[1,1],entorno[1,2]),runif(1,entorno[2,1],entorno[2,2]), runif(1,entorno[3,1],entorno[3,2])) while(temp>0.1) { for(k in 1:50) { sol<-c(runif(1,entorno[1,1],entorno[1,2]),runif(1,entorno[2,1],entorno[2,2]), runif(1,entorno[3,1],entorno[3,2])) delta<-f.Bertalanffy1(b0,sol,x,t,h,n,N)-f.Bertalanffy1(b0,ini,x,t,h,n,N) if(delta<=0) ini<-sol else { if(exp(-delta/temp)>runif(1)) ini<-sol } } temp<-temp*alpha } simann.Bertalanffy1<-ini } José Antonio Anguita Izquierdo Página 71 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Caso b desconocido simann.Bertalanffy2<-function(entorno,temp,alpha,x,t,h,n,N) { ini<-c(runif(1,entorno[1,1],entorno[1,2]),runif(1,entorno[2,1],entorno[2,2]), runif(1,entorno[3,1],entorno[3,2]),runif(1,entorno[4,1],entorno[4,2])) while(temp>0.1) { for(k in 1:50) { sol<-c(runif(1,entorno[1,1],entorno[1,2]),runif(1,entorno[2,1],entorno[2,2]), runif(1,entorno[3,1],entorno[3,2]),runif(1,entorno[4,1],entorno[4,2])) delta<-f.Bertalanffy2(sol,x,t,h,n,N)-f.Bertalanffy2(ini,x,t,h,n,N) if(delta<=0) ini<-sol else { if(exp(-delta/temp)>runif(1)) ini<-sol } } temp<-temp*alpha } simann.Bertalanffy2<-ini } José Antonio Anguita Izquierdo Página 72 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo ALGORITMO VNS DESCENDENTE Caso b conocido vns.descendente.Bertalanffy1<-function(kmax,solini,entorno,b0,x,t,h,n,N,p0,gamma) { paso11<-(solini[1]-entorno[1,1])/kmax paso12<-(entorno[1,2]-solini[1])/kmax paso21<-(solini[2]-entorno[2,1])/kmax paso22<-(entorno[2,2]-solini[2])/kmax paso31<-(solini[3]-entorno[3,1])/kmax paso32<-(entorno[3,2]-solini[3])/kmax ini<-solini k<-1 while(k<=kmax) { if(k==1) ent<-rbind(c(solini[1]-paso11,solini[1]+paso12),c(solini[2]-paso21,solini[2]+paso22), c(solini[3]-paso31,solini[3]+paso32)) temp<-temperatura.Bertalanffy1(ent,b0,x,t,h,n,N,p0) sol<-simann.Bertalanffy1(ent,temp,gamma,b0,x,t,h,n,N) if(f.Bertalanffy1(b0,sol,x,t,h,n,N)<f.Bertalanffy1(b0,ini,x,t,h,n,N)) { ini<-sol k<-1 } else k<-k+1 ent<-rbind(c(solini[1]-k*paso11,solini[1]+k*paso12),c(solini[2]-k*paso21, solini[2]+k*paso22),c(solini[3]-k*paso31,solini[3]+k*paso32)) } José Antonio Anguita Izquierdo Página 73 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo ini } Caso b desconocido vns.descendente.Bertalanffy2<-function(kmax,solini,entorno,x,t,h,n,N,p0,gamma) { paso11<-(solini[1]-entorno[1,1])/kmax paso12<-(entorno[1,2]-solini[1])/kmax paso21<-(solini[2]-entorno[2,1])/kmax paso22<-(entorno[2,2]-solini[2])/kmax paso31<-(solini[3]-entorno[3,1])/kmax paso32<-(entorno[3,2]-solini[3])/kmax paso41<-(solini[4]-entorno[4,1])/kmax paso42<-(entorno[4,2]-solini[4])/kmax ini<-solini k<-1 while(k<=kmax) { if(k==1) ent<-rbind(c(solini[1]-paso11,solini[1]+paso12),c(solini[2]-paso21,solini[2]+paso22), c(solini[3]-paso31,solini[3]+paso32),c(solini[4]-paso41,solini[4]+paso42)) temp<-temperatura.Bertalanffy2(ent,x,t,h,n,N,p0) sol<-simann.Bertalanffy2(ent,temp,gamma,x,t,h,n,N) if(f.Bertalanffy2(sol,x,t,h,n,N)<f.Bertalanffy2(ini,x,t,h,n,N)) { ini<-sol k<-1 } else k<-k+1 José Antonio Anguita Izquierdo Página 74 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo ent<-rbind(c(solini[1]-k*paso11,solini[1]+k*paso12),c(solini[2]-k*paso21,solini[2]+k*paso22), c(solini[3]-k*paso31,solini[3]+k*paso32),c(solini[4]-k*paso41,solini[4]+k*paso42)) } ini José Antonio Anguita Izquierdo Página 75 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo Bibliografía [1] Albano, G., Giorno, V., Román-Román, P., Romero, D. y Torres-Ruiz, F. (2011). Inferring the effect of therapy on tumors showing stochastic gompertzian growth. Journal of Theoretical Biology, 276, 67-77. [2] Capocelli, R.M. y Ricciardi, L.M. (1974). A diffusion model for population growth in random envionment. Theoretical Population Biology, 5, 28–41. [3] Cooper R. G. (2005). Growth in the ostrich (Struthio camelus var. domesticus), Animal Science, 76(1), 1-4. [4] Cox, J.C. y Ross, S.A. (1976). The evaluation of options for alternative stochastic processes. Journal of Financial Economy, 3, 145–166. [5] Crow, E.L. and K. Shimizu (1988). Lognormal Distributions. Theory and Applications. Marcel Dekker. [6] Gallhager, B.(2011), Peak oil analyzed with a logistic function and idealized hubbert curve, Energy Policy, 790-802. [7] Giovanis, A. y Skiadas, C. (2006). A new modeling approach investigating the diffusion speed of mobile telecommunication services in EU-15. Computational Econom, 29, 97-106. [8] Gutiérrez, R., Angulo, J.M., González, A. y Pérez, R. (1991): Inference in lognormal multidimensional diffusion process with exogenous factors: application to modelling in economics. Applied Stochastic Models and Data Analysis, 7, 295–316. [9] Gutiérrez, R., Román, P. y F. Torres (1993). Inference on univariate lognormal diffusion processes via first-passage-times. Proceedings of the Sixth International Symposium on A.S.M.D.A. (J. Jansen and Ch. Skiadas, eds.). [10] Gutiérrez, R.; Gutiérrez-Sánchez, R.; Ramos E.; Román P. y Torres, F. (2003). Modelo de Difusión Lognormal para la Descripción y Predicción del Precio de la Vivienda Nueva en España. XXVII Congreso Nacional de Estadística e Investigación Operativa, Lérida. [11] Gutiérrez, R., Román, P. y Torres, F. (1995). A note on the Volterra integral equation for the firstpassage-time density. Journal of Applied Probability, 32, 635-648. [12] Gutiérrez, R., González, A. y Torres F. (1997). Estimation in multivariate lognormal diffusion process with exogenous factors. Applied Statistics (Journal of the Royal Statistical Society, Serie C.), 46(1), 140-146. [13] Gutiérrez, R., Ricciardi, L., Román, P. y Torres, F.(1997). First-passage-time densities for timenon-homogeneous diffusion processes. Journal of Applied Probability, 34, 623-631. José Antonio Anguita Izquierdo Página 76 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo [14] Gutiérrez, R., Román, P. y Torres, F.(1999). Inference and first-passage-times for the lognormal diffusion process with exogenous factors: application to modelling in economics. Applied Stochastic Models in Business and Industry, 15, 325-332. [15] Gutiérrez, R., Román, P., Romero, D. y Torres, F. (2003). Forecasting for the univariate lognormal diffusion process with exogenous factors. Cybernetics and Systems, 34, 709-724. [16] Gutiérrez-Jáimez, R., Román, P., Romero, D., Serrano, J.J. y Torres, F. (2007). A new gompertz diffusion process with application to random growth. Mathematical Biosciences, 208, 147-165. [17] Gutiérrez, R., Rico, N., Román, P., Romero, D., Serrano, J.J. y Torres, F. (2006). Approximating the nonhomogeneous lognormal diffusion process via polynomial exogenous factors. Cybernetics and Systems, 37, 293-309. [18] Hansen, P., Mladenovic, N y Moreno, J.(2003). Búsqueda de entorno variable, Revista Iberoamericana de Inteligencia Artificial, 19, 77-92. [19] Kirkpatrick, S., Gelatt, C., y Vecchi, M. (1983). Optimization by simulated annealing, Science, 220, 671-680. [20] Kozusko, F. y Bajzer, Z. (2003). Combining Gompertzian growth and cell population dynamics, Mathematical Biosciences, 185(2), 153-167. [21] Marcus, A. y Shaked. (1984). The relationship between accounting measures and prospective probabilities of insolvency: an application to the banking industry. Financial Review, 19, 67–83. [22] Merton, R.C. (1976). Option pricing when underlying stock returns are discontinuous. Journal of Financial Economy, 3, 125–144. [23] Neeff, T. y dos Santos, J.R. (2005). A growth model for secondary forest in Central Amazonia. Forest Ecology and Management, 216, 270-282. [24] Przybylski, M. y García-Berthou, E. (2004). Age and growth of European bitterling (Rhodeus sericeus) in the Wieprz-Krzna Canal, Poland, Ecohydrology. Hydrobiology. 4(2), 207-213. [25] Ricciardi, L.M. (1997). Diffusion Processes and Related Topics in Biology. Springer Verlag. [26] Román-Román, P. y Torres-Ruiz, F. (2014). Forecasting fruit size and caliber by means of diffusion processes. Application to Valencia Late oranges. Journal of Agricultural, Biological, and Environmental Statistics, 10(2), 292-313. [27] Román-Román, P., Romero, D. y Torres-Ruiz, F. (2012). Estimating the parameters of a gompertz diffusion process by means of simulated annealing. Applied Mathematics and Computation, 218, 51215131. [28] Román-Román, P., Romero, D. y Torres-Ruiz, F., 2010. A diffusion process to model generalized Bertalanffy growth patterns: Fitting to real data. Journal of Theoretical Biology. 263,. 59-69. José Antonio Anguita Izquierdo Página 77 Modelización de curvas de crecimiento a partir del proceso lognormal no homogéneo [29] Román-Román, P. y Torres-Ruiz, F. (2012). Modelling logistic growth by a new diffusion process: Application to biological systems. BioSystems, 110, 9-21. [30] Román-Román, P. y Torres-Ruiz, F. (2010). A stochastic model related to the Richards growth curve. 3rd International Conference of the ERCIM Working Group on Computing & Statistics (ERCIM’10). [31] Román-Román, P. y Torres-Ruiz, F. (2015). A stochastic model related to the Richards-type growth curve. Estimation by means of simulated annealing and variable neighborhood search. Applied Mathematics and Computation, 266, 579-598. [32] Torres-Ruiz, F. (1993). Aportaciones al estudio de difusiones estocásticas no homogéneas. PhD. Thesis. Universidad de Granada [33] Tsoularis, A. y Wallace, J. (2002). Analysis of logistic growth models. Mathematical Biosciences, 179, 21-55. José Antonio Anguita Izquierdo Página 78