See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/309779625 CARACTERIZACION DE ALGORITMOS PARA UN SISTEMA DE COMPROBACION Y SELECCION FISCAL Article · January 2009 CITATIONS READS 0 17 1 author: Gabriel Reinaldo Rodríguez Barrios SERVICIO NACIONAL INTEGRADO DE ADMINISTRACION ADUANERA Y TRIBUTARIA SENIAT VENEZUELA 3 PUBLICATIONS 0 CITATIONS SEE PROFILE Some of the authors of this publication are also working on these related projects: Construction and implementation of a model-of-default-tax-prediction of national taxpayers View project All content following this page was uploaded by Gabriel Reinaldo Rodríguez Barrios on 09 November 2016. The user has requested enhancement of the downloaded file. CARACTERIZACION DE ALGORITMOS PARA UN SISTEMA DE COMPROBACION Y SELECCIÓN FISCAL. Propuesta realizada por: MSc. Marcial STAGG. Gerencia regional de Tributos Internos – Región Zuliana Lic. Gabriel Rodriguez. Gerencia General de Fiscalización. Octubre 2009 1 Algoritmos de Comprobación y Selección Ficha 1 Algoritmo T1 ,para realizar la selección de contribuyentes a partir de la distribución muestral del ratio AX Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la distribución muestral de los indicadores de selección. Cálculo de AX: Dado el año j, el Contribuyente X, el RIF k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030 del IVA en el mes i del año j del contribuyente con Rif k. El indicador AX se describe mediante la fórmula: AX ( j, k ) = (VN ( j, k ) − CN ( j , k )) = 1 − CN ( j, k ) VN ( j, k ) VN ( j, k ) Donde AX(j,k): Valor Agregado (VA) generado por el contribuyente con Rif K, como proporción de sus Ventas Netas anuales, al final del periodo fiscal j VN(j,k)= ventas netas del año j del contribuyente con Rif k CN(j,k)= compras netas del año j del contribuyente con Rif k 12 VN ( j , k ) = ∑ ITEM 47(i, j , k ) i =1 12 CN(j,k)= 12 12 12 i =1 i =1 i =1 ∑ ITEM 32(i, j, k ) + ∑ ITEM 322(i, j, k ) + ∑ ITEM 323(i, j, k ) + ∑ ITEM 34(i, j, k ) + i =1 12 12 i =1 i =1 ∑ ITEM 342(i, j, k ) + ∑ ITEM 343(i, j, k ) 2 12 AX ( j , k ) = ∑ ITEM 47(i, j , k ) − i =1 12 12 12 12 12 ITEM 32(i, j, k ) + ∑ ITEM 322(i, j , k ) + ∑ ITEM 323(i, j , k ) + ∑ ITEM 34(i, j , k ) + ∑ ITEM 342(i, j , k ) +∑ ITEM 343(i, j , k ) i =1 i =1 i =1 i =1 i =1 12 ∑ ITEM 47(i, j, k ) i =1 12 12 12 12 12 12 ∑ ITEM 32(i, j , k ) + ∑ ITEM 322(i, j , k ) + ∑ ITEM 323(i, j , k ) + ∑ ITEM 34(i, j , k ) + ∑ ITEM 342(i, j , k ) + ∑ ITEM 343(i, j , k ) i =1 i =1 i =1 i =1 i =1 i =1 = 1− 12 ∑ ITEM 47(i, j, k ) i =1 Algoritmo de la distribución muestral de AX. Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x que pertenece al conjunto C. ∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador AX y n representa el número de elementos muestreados. Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la Desviación Estándar, utilizando = ∑ ( ) donde S es la Desviación estándar de la muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores individuales de x con respecto a la Media Aritmética calculada con anterioridad. A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión: Seleccionar xi si xi > + 3 ó xi < − 3 3 Descripción Formal: Función selec_AX // C es un conjunto no vacío de razones AX.// % ← // Se selecciona una muestra correspondiente a un sector económico particular. // Se calcula la media aritmética de la muestra// ' ← 0 // Ponemos en cero el acumulador X. Para ' ← 1 ℎ+,-+ % ℎ+./ ' = ' + Si ' = % entonces = ' % Devolver // Se calcula la Varianza y Desviación Estándar de la muestra// Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ( ) // Se suman los cuadr de las difs de las obs indiv con respecto a la media// Si ' = % entonces ← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.// // Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P// 11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector Z // Para ' ← 1 ℎ+,-+ % ℎ+./ Si > +31 || 345 ← < −31 entonces Devolver 345 Fin 4 Diagrama de Flujo AX. %← ' ← 0 Para ' ← 1 ' = ' + ¿' == %? No Si = ' % Almacenar Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ∑( − ) ; i++ " 1 5 '++ 1 ←6 " %−1 Para ' ← 1 ℎ+./ '1 = ± ' Almacenar: 1 = '1 ¿' == 3? Si 1 2 6 No '++ 2 Para ' ← 0 Asignar: 34 5 ⇔ ' 8 − 1 || < ¿ ;, ' == %? Si Devolver [AX] Fin 7 ' 8+ 1 > No '++ Ficha 2 Algoritmo T2 ,para realizar la selección de contribuyentes a partir de la distribución muestral del ratio BX Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la distribución muestral de BX. Cálculo de BX: Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030 del IVA en el mes i del año j del contribuyente con Rif k. El indicador BX se describe mediante la fórmula: BX ( j , k ) = (VE ( j, k ) − CE ( j , k )) VN ( j , k ) BX(j,k)= Expresa la proporción de las Ventas Exentas Netas sobre las Ventas Netas Totales en el año j del contribuyente con Rif k. VE(j,k)= Ventas Exentas del año j del contribuyente con Rif k. CE(j,k)= Compras exentas del año j del contribuyente con Rif k. 12 12 VE ( j , k ) = ∑ ITEM 40(i, j , k ) VN ( j , k ) = ∑ ITEM 46(i, j , k ) i =1 i =1 12 CE ( j , k ) = ∑ ITEM 30(i, j , k ) i =1 12 12 ∑ ITEM 40(i, j , k ) − ∑ ITEM 30(i, j , k ) i =1 i =1 BX ( j, k ) = 12 ∑ ITEM 46(i, j, k ) i =1 8 Algoritmo de la distribución muestral de BX. Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x que pertenece al conjunto C. ∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador BX y n representa el número de elementos muestreados. Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la Desviación Estándar, utilizando = ∑ ( ) , donde S es la Desviación estándar de la muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores individuales de x con respecto a la Media Aritmética calculada con anterioridad. A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión: Seleccionar xi si xi > + 3 ó xi < − 3 9 Descripción Formal: Función selec_BX // C es un conjunto no vacío de razones BX.// % ← // Se selecciona una muestra correspondiente a un sector económico particular. // Se calcula la media aritmética de la muestra// ' ← 0 // Ponemos en cero el acumulador X. Para ' ← 1 ℎ+,-+ % ℎ+./ ' = ' + Si ' = % entonces = ' % Devolver // Se calcula la Varianza y Desviación Estándar de la muestra// Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ( ) // Se suman los cuadr de las difs de las obs indiv con respecto a la media// Si ' = % entonces ← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.// // Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P// 11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector Z // Para ' ← 1 ℎ+,-+ % ℎ+./ Si > +31 || 3=5 ← < −31 entonces Devolver 3=5 Fin 10 Diagrama de Flujo BX %← ' ← 0 Para ' ← 1 ' = ' + ¿' == %? No Si = ' % Almacenar Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ∑( − ) ; i++ " 1 11 '++ 1 ←6 " %−1 Para ' ← 1 ℎ+./ '1 = ± ' Almacenar: 1 = '1 ¿' == 3? Si 1 2 12 No '++ 2 Para ' ← 0 Asignar: 3= 5 ⇔ ' 8 − 1 || < ¿ ;, ' == %? Si Devolver [BX] Fin 13 ' 8+ 1 > No '++ Ficha 3 Algoritmo T3 ,para realizar la selección de contribuyentes a partir de la distribución muestral del ratio CX Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la distribución muestral de CX. Cálculo de CX: Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030 del IVA en el mes i del año j del contribuyente con Rif k. El indicador CX se describe mediante la fórmula: CX ( j , k ) = (IP ( j, k ) + SCFPA( j, k ) − SCFPP ( j , k ) ) VN ( j , k ) CX(j,k)= Representa el Impuesto Pagado como proporción del las Ventas Netas anuales, considerando el saldo neto de Créditos Fiscales del año j del contribuyente con Rif k.. IP(j,k)= Impuesto pagado en el año j del contribuyente con Rif k. SCFPA(j,k)=Saldo de créditos fiscales del año anterior al año j del contribuyente con Rif k. SCFPP(j,k)= Saldo de créditos fiscales del año posterior al año j del contribuyente con Rif K. 12 12 12 12 12 12 I =1 I =1 i =1 i =1 i =1 i =1 IP( j, k ) = ∑ ITEM 22(i, j , k ) + ∑ ITEM 51(i, j, k ) + ∑ ITEM 24(i, j, k ) + ∑ ITEM 55(i, j , k ) + ∑ ITEM 58(i, j , k ) + ∑ ITEM 90(i, j , k ) 12 SCFPA(j,k)= ∑ ITEM 20(i, j, k ) i =1 12 SCFPP ( j , k ) = ∑ ITEM 60(i, j , k ) i =1 14 12 VN ( j , k ) = ∑ ITEM 46(i, j , k ) i =1 12 12 12 12 12 12 CX ( j, k ) = ∑ ITEM 22(i, j, k ) + ∑ ITEM 51(i, j, k ) + ∑ ITEM 24(i, j , k ) + ∑ ITEM 55(i, j , k ) + ∑ ITEM 58(i, j, k ) + ∑ ITEM 90(i, j , k ) + I =1 I =1 i =1 i =1 i =1 i =1 12 12 i =! i =1 ∑ ITEM 20(i, j, k ) −∑ ITEM 60(i, j, k ) 12 ∑ ITEM 46(i, j , k ) i =1 Algoritmo de la distribución muestral de CX. Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x que pertenece al conjunto C. ∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador CX y n representa el número de elementos muestreados. Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la Desviación Estándar, utilizando = ∑ ( ) , donde S es la Desviación estándar de la muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores individuales de x con respecto a la Media Aritmética calculada con anterioridad. A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión: Seleccionar xi si xi > + 3 ó xi < − 3 15 Descripción Formal: Función selec_CX // C es un conjunto no vacío de razones CX.// % ← // Se selecciona una muestra correspondiente a un sector económico particular. // Se calcula la media aritmética de la muestra// ' ← 0 // Ponemos en cero el acumulador X. Para ' ← 1 ℎ+,-+ % ℎ+./ ' = ' + Si ' = % entonces = ' % Devolver // Se calcula la Varianza y Desviación Estándar de la muestra// Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ( ) // Se suman los cuadr de las difs de las obs indiv con respecto a la media// Si ' = % entonces ← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.// // Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P// 11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector CX// Para ' ← 1 ℎ+,-+ % ℎ+./ Si > +31 || 35 ← < −31 entonces Devolver 35 Fin 16 Diagrama de Flujo CX %← ' ← 0 Para ' ← 1 ' = ' + ¿' == %? No Si = ' % Almacenar Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ∑( − ) ; i++ " 1 17 '++ 1 ←6 " %−1 Para ' ← 1 ℎ+./ '1 = ± ' Almacenar: 1 = '1 ¿' == 3? Si 1 2 18 No '++ 2 Para ' ← 0 Asignar: 3 5 ⇔ ' 8 − 1 || < ¿ ;, ' == %? Si Devolver [CX] Fin 19 ' 8+ 1 > No '++ Ficha 4 Algoritmo T4, para realizar la selección de contribuyentes a partir de la distribución muestral del ratio DX Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la distribución muestral de DX. Cálculo de DX: Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030 del IVA en el mes i del año j del contribuyente con Rif k. El indicador DX se describe mediante la fórmula: DX ( j, k ) = VX ( j, k ) VN ( j , k ) VX(j,k)=Total de venta de exportación del período j del contribuyente con Rif k. VN(j,k)=Total de ventas en el período j del contribuyente con Rif k. DX(j,k)= representa la proporción de Ventas de Exportación con respecto al total de ventas netas de la empresa en el período j del contribuyente con Rif k. 12 12 VX ( j , k ) = ∑ ITEM 41(i, j , k ) VN ( j , k ) = ∑ ITEM 46(i, j , k ) i =1 i =1 12 DX ( j , k ) = ∑ ITEM 41(i, j, k ) i =1 12 ∑ ITEM 46(i, j, k ) i =1 20 Algoritmo de la distribución muestral de DX. Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x que pertenece al conjunto C. ∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador DX y n representa el número de elementos muestreados. Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la Desviación Estándar, utilizando = ∑ ( ) , donde S es la Desviación estándar de la muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores individuales de x con respecto a la Media Aritmética calculada con anterioridad. A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión: Seleccionar xi si xi > + 3 ó xi < − 3 21 Descripción Formal: Función selec_DX // C es un conjunto no vacío de razones DX.// % ← // Se selecciona una muestra correspondiente a un sector económico particular. // Se calcula la media aritmética de la muestra// ' ← 0 // Ponemos en cero el acumulador X. Para ' ← 1 ℎ+,-+ % ℎ+./ ' = ' + Si ' = % entonces = ' % Devolver // Se calcula la Varianza y Desviación Estándar de la muestra// Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ( ) // Se suman los cuadr de las difs de las obs indiv con respecto a la media// Si ' = % entonces ← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.// // Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P// 11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector DX// Para ' ← 1 ℎ+,-+ % ℎ+./ Si > +31 || 3>5 ← < −31 entonces Devolver 3>5 Fin 22 Diagrama de Flujo DX %← ' ← 0 Para ' ← 1 ' = ' + ¿' == %? No Si = ' % Almacenar Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ∑( − ) ; i++ " 1 23 '++ 1 ←6 " %−1 Para ' ← 1 ℎ+./ '1 = ± ' Almacenar: 1 = '1 ¿' == 3? Si 1 2 24 No '++ 2 Para ' ← 0 Asignar: 3> 5 ⇔ ' 8 − 1 || < ¿ ;, ' == %? Si Devolver [DX] Fin 25 ' 8+ 1 > No '++ Ficha 5 Algoritmo T5, para realizar la selección de contribuyentes a partir de la distribución muestral del ratio EX Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la distribución muestral de EX. Cálculo de EX: Dado el año j, el Contribuyente X, el RIF k donde el ITEMZ(i,j,k) es el ITEMZ del formulario DPJ00026 del ISLR del año j del contribuyente con Rif k. El indicador EX se describe mediante la fórmula: EX ( j, k ) = (IN ( j, k ) − CV ( j, k ) ) IN ( j, k ) IN(j,k)=Ingresos Netos en el año j del contribuyente con Rif k. CV(j,k)=Costos de Venta del año j del contribuyente con Rif k. IN(j,k)= ITEM 708( j , k ) + ITEM 709( j, j ) ) − ITEM 710( j, k )]. IN(j,k)= ITEM 708( j , k ) + ITEM 709( j, k ) ) − ITEM 710( j, k )] . CV ( j, k ) = [(ITEM 712( j, k ) + ITEM 713( j , k ) + ITEM 714( j , k ) − ITEM 717( j , k ) + ITEM 723( j , k ) + ITEM 724( j, k ) + ITEM 725( j, k ) + ITEM 726( j, k ) + ITEM 732( j , k ) + ITEM 733( j, k )]) . 26 ITEM 701( j , k ) + ITEM 702( j , k ) + ITEM 703( j , k ) + ITEM 704( j , k ) + ITEM 705( j , k ) + ITEM 706( j , k ) + ITEM 707( j , k ) + ITEM 708( j , k ) + ITEM 709( j , k ) − ITEM 710( j , k ) ) − ITEM 712( j , k ) + ITEM 713( j , k ) + ITEM 714( j , k ) − ITEM 717( j , k ) + ITEM 723( j , k ) + ITEM 724( j , k ) + ITEM 725( j , k ) + ITEM 726( j , k ) + ITEM 732( j , k ) + ITEM 733( j , k ) EX ( j , k ) = ITEM 701( j , k ) + ITEM 702( j , k ) + ITEM 703( j , k ) + ITEM 704( j , k ) + ITEM 705( j , k ) + ITEM 706( j , k ) + ITEM 707( j , k ) + ITEM 708( j , k ) + ITEM 709( j , k ) − ITEM 710( j , k ) Algoritmo de la distribución muestral de EX. Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x que pertenece al conjunto C. ∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador EX y n representa el número de elementos muestreados. Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la Desviación Estándar, utilizando = ∑ ( ) , donde S es la Desviación estándar de la muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores individuales de x con respecto a la Media Aritmética calculada con anterioridad. A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión: Seleccionar xi si xi > + 3 ó xi < − 3 27 Descripción Formal: Función selec_EX // C es un conjunto no vacío de razones EX.// % ← // Se selecciona una muestra correspondiente a un sector económico particular. // Se calcula la media aritmética de la muestra// ' ← 0 // Ponemos en cero el acumulador X. Para ' ← 1 ℎ+,-+ % ℎ+./ ' = ' + Si ' = % entonces = ' % Devolver // Se calcula la Varianza y Desviación Estándar de la muestra// Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ( ) // Se suman los cuadr de las difs de las obs indiv con respecto a la media// Si ' = % entonces ← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.// // Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P// 11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector EX// Para ' ← 1 ℎ+,-+ % ℎ+./ Si > +31 || 3;5 ← < −31 entonces Devolver 3;5 Fin 28 Diagrama de Flujo EX %← ' ← 0 Para ' ← 1 ' = ' + ¿' == %? No Si = ' % Almacenar Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ∑( − ) ; i++ " 1 29 '++ 1 ←6 " %−1 Para ' ← 1 ℎ+./ '1 = ± ' Almacenar: 1 = '1 ¿' == 3? Si 1 2 30 No '++ 2 Para ' ← 0 Asignar: 3; 5 ⇔ ' 8 − 1 || < ¿ ;, ' == %? Si Devolver [EX] Fin 31 ' 8+ 1 > No '++ Ficha 6 Algoritmo T6, para realizar la selección de contribuyentes a partir de la distribución muestral del ratio FX Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la distribución muestral de FX. Cálculo de FX: Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario DPJ00026 del ISLR del año j del contribuyente con Rif k. El indicador FX se describe mediante la fórmula FX ( j , k ) = ( ISLRP ( j , k ) − ISLRC ( j , k )) VN ( j , k ) FX(j,k): Evalúa la tasa efectiva de recaudación del contribuyente con Rif k en el año j. FX(j,k) es una razón que cuantifica la proporción del Impuesto Sobre la Renta neto pagado en el año j, como proporción del total de Ingresos por ventas netas de la empresa en el año j del contribuyente con Rif k. Mide la tasa efectiva de tributación del ISLR del contribuyente con Rif k, en el año j.. ISLRP(j,k)=impuesto sobre la renta pagado en el año j del contribuyente con Rif k. ISLRC(j,k)=impuesto sobre la renta compensado en el año j del contribuyente con Rif k. VN(j,k)=ventas netas en el año j del contribuyente con Rif k. Si ITEM 90( j , k ) > 0 entonces: FX ( j , k ) = ITEM 241( j , k ) + ITEM 291( j , k ) + ITEM 90( j , k ) ITEM 711( j , k ) − ITEM 710( j , k ) Si ITEM 90( j , k ) <= 0 entonces: FX ( j , k ) = (−!) * ITEM 87( j , k ) ITEM 711( j , k ) − ITEM 710( j , k ) 32 Algoritmo de la distribución muestral de FX. Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x que pertenece al conjunto C. ∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador FX y n representa el número de elementos muestreados. Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la Desviación Estándar, utilizando = ∑ ( ) , donde S es la Desviación estándar de la muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores individuales de x con respecto a la Media Aritmética calculada con anterioridad. A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión: Seleccionar xi si xi > + 3 ó xi < − 3 33 Descripción Formal: Función selec_FX // C es un conjunto no vacío de razones FX.// % ← // Se selecciona una muestra correspondiente a un sector económico particular. // Se calcula la media aritmética de la muestra// ' ← 0 // Ponemos en cero el acumulador X. Para ' ← 1 ℎ+,-+ % ℎ+./ ' = ' + Si ' = % entonces = ' % Devolver // Se calcula la Varianza y Desviación Estándar de la muestra// Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ( ) // Se suman los cuadr de las difs de las obs indiv con respecto a la media// Si ' = % entonces ← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.// // Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P// 11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector FX// Para ' ← 1 ℎ+,-+ % ℎ+./ Si > +31 || 3?5 ← < −31 entonces Devolver 3?5 Fin 34 Diagrama de Flujo FX %← ' ← 0 Para ' ← 1 ' = ' + ¿' == %? No Si = ' % Almacenar Para ' ← 1 ℎ+,-+ % ℎ+./ " ← ∑( − ) ; i++ " 1 35 '++ 1 ←6 " %−1 Para ' ← 1 ℎ+./ '1 = ± ' Almacenar: 1 = '1 ¿' == 3? Si 1 2 36 No '++ 2 Para ' ← 0 Asignar: 3? 5 ⇔ ' 8 − 1 || < ¿ ;, ' == %? Si Devolver [FX] Fin 37 ' 8+ 1 > No '++ Ficha 7 Algoritmo T7, para calcular intervalos de confianza para la media real de los ratios analizados. Problema: Calcular el intervalo de confianza para la media real de cada uno de los indicadores analizados. Planteamiento Formal: Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de actividad (C), se tiene el problema de calcular el Intervalo de Confianza para la media real @ con A " desconocida. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn Es decir, dada una muestra de contribuyentes fiscales = , , … . , límites del intervalo, CB −- F ; E √ ≤ @ ≤ CB + - F ; E √ se pide encontrar, los , donde i representa a los indicadores (ratios) de selección calculados para diferentes grupos de contribuyentes. En la construcción del intervalo, se tiene que: CB : es la media muestral del j-ésimo ratio. - ; E : es el valor crítico de t que corresponde a un área específica de la cola superior H de la distribución t de student. F √ : Es la desviación estándar muestral dividida entre la raíz cuadrada del tamaño de la muestra. Como las medias Muestrales y las desviaciones estándares fueron calculadas en base a los algoritmos T1…T6, sólo resta implementar un procedimiento para calcular CB ± - F ; E √ En función de esto, primero se fija un nivel de significación ó error máximo admisible H, el cual generalmente es del 5%, con lo cual se consigue un nivel de confianza del 95%. Luego se consigue el valor crítico de t, con n-1 grados de libertad y él H seleccionado en una tabla t de student, cuyo valor crítico de tabla se multiplica por el cociente obtenido de de la división de la desviación estándar entre la raíz cuadrada de n. Seguidamente, se suma el resultado de - ; E F √ más la media aritmética muestral con lo cual obtenemos el límite derecho del intervalo representado por: CB +- límite izquierdo se resta la media muestral menos el resultado de obtiene: : CB − - F ; E √ . 38 F ; E √ F ; E √ . Para obtener el , con lo cual se Finalmente se ensambla el intervalo con la forma: I CB − - F ; E √ ≤ @ ≤ CB + - F ; E √ J Si la media muestral calculada para el j-ésimo ratio cae dentro del intervalo no habrá razones que permitan negar que dicha media pudiera ser la real. Es decir, con un 95% de confianza podrá afirmarse que la media real del ratio j estará comprendida entre CB − - F ; E √ y CB + - F ; E √ . Descripción Formal: Función intervalo_media_real 8 es la media muestral de la j-ésima razón de selección. // // K 8 L←K // S es la desviación estándar de la j-ésima razón de selección// M←N // Se fija O =0,05 como nivel de significación; es decir 1- O =95% como nivel de confianza del intervalo// O ← 0,05 //Se consigue el valor crítico de t en la tabla t de student, para n-1 grados de libertad y O , se multiplica por el cociente resultante de la división de S entre la raíz cuadrada de n y se almacena en tc // - ← - ; E ∗ √% // Se obtienen los límites del intervalo sumando y restando tc a la media muestral// R' ← CB − - ; R, ← CB + - Devolver 3R', R,5 Fin 39 Diagrama de Flujo para la obtención del intervalo de confianza para S con TU desconocida. 8V L←K M ← NV O← 0,05O ← O ← 0,05 ← 0,05 - ← - ; E ∗ √% ' = ' + 8 V − - R' ← K 8 V + - R, ← K Tomar nueva muestra de contribuyentes del mismo sector Almacenar R', R, 8 V ≤ R,? ¿ ;, R' ≤ K Si 1 40 No Existe evidencia estadística significativa, que permite no aceptar que C está dentro del intervalo. 1 Al 95% de confianza puede afirmarse que la media real del ratio j, está entre CB −- F ; E √ y CB + ∴ F ; E √ . No existe evidencia estadística que permita no aceptar que C está dentro de ese rango. Almacena C . Es posible usar a C Como promedio del sector Fin 41 Ficha 8 Algoritmo T8, para realizar una prueba de igualdad de medias con TU desconocida y poblaciones independientes. Problema: Calcular la prueba de igualdad de medias con la varianza desconocida y en muestras provenientes de poblaciones independientes. Se entiende por poblaciones independientes aquellas que son colectivamente exclusivas. p.ej: AX y EX. Planteamiento Formal: La estructura de los ratios AX y EX plantean la medición del valor agregado generado por el contribuyente. La primera vista desde los datos aportados por las declaraciones del IVA y la segunda por los datos provenientes de las declaraciones del ISLR. Es así que en busca de la consistencia contable, ambas razones deberían ser iguales ó similares durante un período determinado. Para determinar, la igualdad de ambas razones se propone lo siguiente: Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de actividad (C), se tiene el problema de realizar la prueba de hipótesis para comprobar la igualdad de las medias reales de dos poblaciones independientes @ X @" con A " desconocidas. Esto a efecto de comprobar si ambas razones AX y EX demuestran similitud en el sector económico de análisis. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn Es decir, ⇔ ambos resultados de los intervalos de confianza de las medias reales de AX y EX, incluyen a las medias Muestrales de cada uno respectivamente, se procede a la comparación de las medias reales asumiendo que: Y Z [ ∃ .% ( CB − - F ; E √ ∴ ≤ @ ≤ CB + - F ; E √ ) ] : @ = @" ] : @ ≠ @" Donde: @ = Y Z @" = [ ∴ Planteada la restricción anterior, dadas dos muestras de ratios AX y EX → AX= + , + , … . , + y EX= . , . , … . , . se pide comparar las medias reales de ambos grupos independientes, para determinar si los mismos tienen comportamientos similares durante un período determinado. 42 Para ello se utiliza el siguiente estadístico de prueba: -a = − " 6 " "" + % %" Cuya regla de decisión para una prueba de dos colas es: Rechazar ] → - a > b(c d bc d ) d bd De lo contrario no rechazar ] ó → -a < (c d bc d ) ó d bd Donde: - = valor t crítico al nivel H de significación con (n1 – 1) grados de libertad. -" = valor t crítico al nivel H de significación con (n2 – 1) grados de libertad. f = f" = F = es la razón de la varianza de n1 en proporción a n1. F = es la razón de la varianza de n2 en proporción a n2. Obtenidas las medias y desviaciones estándares Muestrales de AX y EX se calcula - a . A continuación se fija el nivel de significación H de la prueba, el cual generalmente será del 5%. Posteriormente se hallan los valores críticos t1 y t2 en la tabla t de Student. En caso de que las muestras sean de igual tamaño t1 = t2 se encuentra un solo valor de t. Seguidamente se procede al cálculo de ±(c d bc d ) d bd para realizar la comparación con - a de la cual resultará el rechazo ó no rechazo de ] , según la regla de decisión planteada anteriormente. En caso de no rechazarse la ] podrá concluirse que con un 95% de confianza, las medias reales de ambas poblaciones de ratios pueden ser iguales. De lo contrario, al rechazar la ] se confirmará la diferencia entre las medias; lo cual permite concluir en la diferencia de ambas razones. 43 Descripción Formal: Función comparar_medias // 1 y 2 son las medias Muestrales de dos ratios de selección y se almacenas en M1 y M2 // M1 ← 1 M2 ← 2 // Se obtienen las varianzas de ambas muestras y se amacenas en P1 y P2// P1 ← " P2 ← 1"" //Se obtiene el valor crítico t’ a partir del estadístico de prueba y se almacena en Z// i← j − j" 6 1" 1"" + % %" // Se fija H =0,05 como nivel de significación; es decir 1- H =95% como nivel de la prueba// H ← 0,05 //Se consiguen los valores críticos de t1 y t2 en la tabla t de student, para n-1 grados de libertad y H // t1=-1 t2=-2 ; E ; E //Se calculan las razones de las varianzas con respecto a los tamaños de muestras.// f ← f" ← " % "" %" 44 //Se obtiene la suma de los productos de los valores críticos de t1 y t2 por las razones de las varianzas con respecto a los tamaños de muestras y se divide entre la suma las razones de las varianzas con respecto a los tamaños de muestras. −R ← R← −(- f + -" f" ) f + f" +(-f + -" f" ) f + f" // Se comparan los valores de ±R con respecto a Z. Rechazar ] → i > R ó → i < −R ó De lo contrario no rechazar ] Devolver 3i, R, −R5 Fin 45 Diagrama de Flujo para la prueba de igualdad de medias para dos poblaciones independientes con TU desconocidas. M1 ← 1 M2 ← 2 P1 ← " P2 ← 1"" i← j − j" 6 1" 1"" + % %" O ← 0,05 ← 0,05 t1=-1 t2=-2 ; E ; E f ← f" ← " % "" %" ¿ ;, i > R ó i < −R? Si No Existe evidencia estadística significativa al 95%, que permite concluir que las medias reales de AX y EX son iguales. Fin 1 46 1 ' - a > b(c d bc d ) d bd ó → -a < ∴ (c d bc d ) d bd No existe evidencia estadística significativa que permita aceptar la igualdad de medias reales entre AX y EX. Fin 47 View publication stats