Subido por logopraxis2000

GABRIEL REINALDO RODRIGUEZ BARRIOS ALGORITMOS DE FISCALIZACION

Anuncio
See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/309779625
CARACTERIZACION DE ALGORITMOS PARA UN SISTEMA DE COMPROBACION
Y SELECCION FISCAL
Article · January 2009
CITATIONS
READS
0
17
1 author:
Gabriel Reinaldo Rodríguez Barrios
SERVICIO NACIONAL INTEGRADO DE ADMINISTRACION ADUANERA Y TRIBUTARIA SENIAT VENEZUELA
3 PUBLICATIONS 0 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Construction and implementation of a model-of-default-tax-prediction of national taxpayers View project
All content following this page was uploaded by Gabriel Reinaldo Rodríguez Barrios on 09 November 2016.
The user has requested enhancement of the downloaded file.
CARACTERIZACION DE ALGORITMOS PARA UN
SISTEMA DE COMPROBACION Y SELECCIÓN FISCAL.
Propuesta realizada por:
MSc. Marcial STAGG.
Gerencia regional de Tributos Internos – Región Zuliana
Lic. Gabriel Rodriguez.
Gerencia General de Fiscalización.
Octubre 2009
1
Algoritmos de Comprobación y Selección
Ficha 1
Algoritmo T1 ,para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio AX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de los indicadores de selección.
Cálculo de AX:
Dado el año j, el Contribuyente X, el RIF k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030
del IVA en el mes i del año j del contribuyente con Rif k. El indicador AX se describe mediante la
fórmula:
AX ( j, k ) =
(VN ( j, k ) − CN ( j , k )) = 1 − CN ( j, k )
VN ( j, k )
VN ( j, k )
Donde
AX(j,k): Valor Agregado (VA) generado por el contribuyente con Rif K, como proporción de sus
Ventas Netas anuales, al final del periodo fiscal j
VN(j,k)= ventas netas del año j del contribuyente con Rif k
CN(j,k)= compras netas del año j del contribuyente con Rif k
12
VN ( j , k ) = ∑ ITEM 47(i, j , k )
i =1
12
CN(j,k)=
12
12
12
i =1
i =1
i =1
∑ ITEM 32(i, j, k ) + ∑ ITEM 322(i, j, k ) + ∑ ITEM 323(i, j, k ) + ∑ ITEM 34(i, j, k ) +
i =1
12
12
i =1
i =1
∑ ITEM 342(i, j, k ) + ∑ ITEM 343(i, j, k )
2
 12

AX ( j , k ) =  ∑ ITEM 47(i, j , k )  −

 i =1
12
12
12
12
12


 ITEM 32(i, j, k ) + ∑ ITEM 322(i, j , k ) + ∑ ITEM 323(i, j , k ) + ∑ ITEM 34(i, j , k ) + ∑ ITEM 342(i, j , k ) +∑ ITEM 343(i, j , k ) 
i =1
i =1
i =1
i =1
i =1


12
∑ ITEM 47(i, j, k )
i =1
12
12
12
12
12
 12

 ∑ ITEM 32(i, j , k ) + ∑ ITEM 322(i, j , k ) + ∑ ITEM 323(i, j , k ) + ∑ ITEM 34(i, j , k ) + ∑ ITEM 342(i, j , k ) + ∑ ITEM 343(i, j , k ) 
i =1
i =1
i =1
i =1
i =1
i =1


= 1−
12
∑ ITEM 47(i, j, k )
i =1
Algoritmo de la distribución muestral de AX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x
que pertenece al conjunto C.
∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador AX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando = ∑
( )
donde S es la Desviación estándar de la muestra
y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores individuales de x
con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener
los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > + 3 ó xi < − 3
3
Descripción Formal:
Función selec_AX
// C es un conjunto no vacío de razones AX.//
% ← // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
' ← 0 // Ponemos en cero el acumulador X.
Para ' ← 1 ℎ+,-+ % ℎ+./
' = ' +
Si ' = % entonces
=
'
%
Devolver // Se calcula la Varianza y Desviación Estándar de la muestra//
Para ' ← 1 ℎ+,-+ % ℎ+./
" ←
( )
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ' = % entonces
← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector Z //
Para ' ← 1 ℎ+,-+ % ℎ+./
Si
> +31 ||
345 ←
< −31 entonces
Devolver 345
Fin
4
Diagrama de Flujo AX.
%←
' ← 0
Para ' ← 1
' = ' +
¿' == %?
No
Si
=
'
%
Almacenar Para ' ←
1 ℎ+,-+ % ℎ+./
" ← ∑( − ) ;
i++
"
1
5
'++
1
←6
"
%−1
Para ' ← 1 ℎ+./
'1 = ± '
Almacenar:
1 = '1
¿' == 3?
Si
1
2
6
No
'++
2
Para ' ← 0 Asignar:
34 5 ⇔
'
8 − 1 ||
<
¿ ;, ' == %?
Si
Devolver [AX]
Fin
7
'
8+ 1
>
No
'++
Ficha 2
Algoritmo T2 ,para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio BX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de BX.
Cálculo de BX:
Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030
del IVA en el mes i del año j del contribuyente con Rif k. El indicador BX se describe mediante la
fórmula:
BX ( j , k ) =
(VE ( j, k ) − CE ( j , k ))
VN ( j , k )
BX(j,k)= Expresa la proporción de las Ventas Exentas Netas sobre las Ventas Netas Totales en el
año j del contribuyente con Rif k.
VE(j,k)= Ventas Exentas del año j del contribuyente con Rif k.
CE(j,k)= Compras exentas del año j del contribuyente con Rif k.
12
12
VE ( j , k ) = ∑ ITEM 40(i, j , k )
VN ( j , k ) = ∑ ITEM 46(i, j , k )
i =1
i =1
12
CE ( j , k ) = ∑ ITEM 30(i, j , k )
i =1
12
 12

 ∑ ITEM 40(i, j , k ) − ∑ ITEM 30(i, j , k ) 
i =1
i =1

BX ( j, k ) = 
12
∑ ITEM 46(i, j, k )
i =1
8
Algoritmo de la distribución muestral de BX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x
que pertenece al conjunto C.
∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador BX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando = ∑
( )
, donde S es la Desviación estándar de la
muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener
los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > + 3 ó xi < − 3
9
Descripción Formal:
Función selec_BX
// C es un conjunto no vacío de razones BX.//
% ← // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
' ← 0 // Ponemos en cero el acumulador X.
Para ' ← 1 ℎ+,-+ % ℎ+./
' = ' +
Si ' = % entonces
=
'
%
Devolver // Se calcula la Varianza y Desviación Estándar de la muestra//
Para ' ← 1 ℎ+,-+ % ℎ+./
" ←
( )
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ' = % entonces
← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector Z //
Para ' ← 1 ℎ+,-+ % ℎ+./
Si
> +31 ||
3=5 ←
< −31 entonces
Devolver 3=5
Fin
10
Diagrama de Flujo BX
%←
' ← 0
Para ' ← 1
' = ' +
¿' == %?
No
Si
=
'
%
Almacenar Para ' ←
1 ℎ+,-+ % ℎ+./
" ← ∑( − ) ;
i++
"
1
11
'++
1
←6
"
%−1
Para ' ← 1 ℎ+./
'1 = ± '
Almacenar:
1 = '1
¿' == 3?
Si
1
2
12
No
'++
2
Para ' ← 0 Asignar:
3= 5 ⇔
'
8 − 1 ||
<
¿ ;, ' == %?
Si
Devolver [BX]
Fin
13
'
8+ 1
>
No
'++
Ficha 3
Algoritmo T3 ,para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio CX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de CX.
Cálculo de CX:
Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030
del IVA en el mes i del año j del contribuyente con Rif k. El indicador CX se describe mediante la
fórmula:
CX ( j , k ) =
(IP ( j, k ) + SCFPA( j, k ) − SCFPP ( j , k ) )
VN ( j , k )
CX(j,k)= Representa el Impuesto Pagado como proporción del las Ventas Netas anuales,
considerando el saldo neto de Créditos Fiscales del año j del contribuyente con Rif k..
IP(j,k)= Impuesto pagado en el año j del contribuyente con Rif k.
SCFPA(j,k)=Saldo de créditos fiscales del año anterior al año j del contribuyente con Rif k.
SCFPP(j,k)= Saldo de créditos fiscales del año posterior al año j del contribuyente con Rif K.
12
12
12
12
12
12
I =1
I =1
i =1
i =1
i =1
i =1
IP( j, k ) = ∑ ITEM 22(i, j , k ) + ∑ ITEM 51(i, j, k ) + ∑ ITEM 24(i, j, k ) + ∑ ITEM 55(i, j , k ) + ∑ ITEM 58(i, j , k ) + ∑ ITEM 90(i, j , k )
12
SCFPA(j,k)=
∑ ITEM 20(i, j, k )
i =1
12
SCFPP ( j , k ) = ∑ ITEM 60(i, j , k )
i =1
14
12
VN ( j , k ) = ∑ ITEM 46(i, j , k )
i =1
12
12
12
12
12
 12

CX ( j, k ) =  ∑ ITEM 22(i, j, k ) + ∑ ITEM 51(i, j, k ) + ∑ ITEM 24(i, j , k ) + ∑ ITEM 55(i, j , k ) + ∑ ITEM 58(i, j, k ) + ∑ ITEM 90(i, j , k )  +
 I =1
I =1
i =1
i =1
i =1
i =1

12
12

i =!
i =1

∑ ITEM 20(i, j, k ) −∑ ITEM 60(i, j, k ) 
 12

 ∑ ITEM 46(i, j , k ) 
 i =1

Algoritmo de la distribución muestral de CX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x
que pertenece al conjunto C.
∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador CX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando = ∑
( )
, donde S es la Desviación estándar de la
muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener
los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > + 3 ó xi < − 3
15
Descripción Formal:
Función selec_CX
// C es un conjunto no vacío de razones CX.//
% ← // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
' ← 0 // Ponemos en cero el acumulador X.
Para ' ← 1 ℎ+,-+ % ℎ+./
' = ' +
Si ' = % entonces
=
'
%
Devolver // Se calcula la Varianza y Desviación Estándar de la muestra//
Para ' ← 1 ℎ+,-+ % ℎ+./
" ←
( )
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ' = % entonces
← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector CX//
Para ' ← 1 ℎ+,-+ % ℎ+./
Si
> +31 ||
35 ←
< −31 entonces
Devolver 35
Fin
16
Diagrama de Flujo CX
%←
' ← 0
Para ' ← 1
' = ' +
¿' == %?
No
Si
=
'
%
Almacenar Para ' ←
1 ℎ+,-+ % ℎ+./
" ← ∑( − ) ;
i++
"
1
17
'++
1
←6
"
%−1
Para ' ← 1 ℎ+./
'1 = ± '
Almacenar:
1 = '1
¿' == 3?
Si
1
2
18
No
'++
2
Para ' ← 0 Asignar:
3 5 ⇔
'
8 − 1 ||
<
¿ ;, ' == %?
Si
Devolver [CX]
Fin
19
'
8+ 1
>
No
'++
Ficha 4
Algoritmo T4, para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio DX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de DX.
Cálculo de DX:
Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030
del IVA en el mes i del año j del contribuyente con Rif k. El indicador DX se describe mediante la
fórmula:
DX ( j, k ) =
VX ( j, k )
VN ( j , k )
VX(j,k)=Total de venta de exportación del período j del contribuyente con Rif k.
VN(j,k)=Total de ventas en el período j del contribuyente con Rif k.
DX(j,k)= representa la proporción de Ventas de Exportación con respecto al total de ventas
netas de la empresa en el período j del contribuyente con Rif k.
12
12
VX ( j , k ) = ∑ ITEM 41(i, j , k )
VN ( j , k ) = ∑ ITEM 46(i, j , k )
i =1
i =1
12
DX ( j , k ) =
∑ ITEM 41(i, j, k )
i =1
12
∑ ITEM 46(i, j, k )
i =1
20
Algoritmo de la distribución muestral de DX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x
que pertenece al conjunto C.
∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador DX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando = ∑
( )
, donde S es la Desviación estándar de la
muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener
los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > + 3 ó xi < − 3
21
Descripción Formal:
Función selec_DX
// C es un conjunto no vacío de razones DX.//
% ← // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
' ← 0 // Ponemos en cero el acumulador X.
Para ' ← 1 ℎ+,-+ % ℎ+./
' = ' +
Si ' = % entonces
=
'
%
Devolver // Se calcula la Varianza y Desviación Estándar de la muestra//
Para ' ← 1 ℎ+,-+ % ℎ+./
" ←
( )
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ' = % entonces
← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector DX//
Para ' ← 1 ℎ+,-+ % ℎ+./
Si
> +31 ||
3>5 ←
< −31 entonces
Devolver 3>5
Fin
22
Diagrama de Flujo DX
%←
' ← 0
Para ' ← 1
' = ' +
¿' == %?
No
Si
=
'
%
Almacenar Para ' ←
1 ℎ+,-+ % ℎ+./
" ← ∑( − ) ;
i++
"
1
23
'++
1
←6
"
%−1
Para ' ← 1 ℎ+./
'1 = ± '
Almacenar:
1 = '1
¿' == 3?
Si
1
2
24
No
'++
2
Para ' ← 0 Asignar:
3> 5 ⇔
'
8 − 1 ||
<
¿ ;, ' == %?
Si
Devolver [DX]
Fin
25
'
8+ 1
>
No
'++
Ficha 5
Algoritmo T5, para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio EX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de EX.
Cálculo de EX:
Dado el año j, el Contribuyente X, el RIF k donde el ITEMZ(i,j,k) es el ITEMZ del formulario DPJ00026 del ISLR del año j del contribuyente con Rif k. El indicador EX se describe mediante la
fórmula:
EX ( j, k ) =
(IN ( j, k ) − CV ( j, k ) )
IN ( j, k )
IN(j,k)=Ingresos Netos en el año j del contribuyente con Rif k.
CV(j,k)=Costos de Venta del año j del contribuyente con Rif k.
IN(j,k)= ITEM 708( j , k ) + ITEM 709( j, j ) ) − ITEM 710( j, k )].
IN(j,k)= ITEM 708( j , k ) + ITEM 709( j, k ) ) − ITEM 710( j, k )] .
CV ( j, k ) = [(ITEM 712( j, k ) + ITEM 713( j , k ) + ITEM 714( j , k ) − ITEM 717( j , k ) + ITEM 723( j , k ) +
ITEM 724( j, k ) + ITEM 725( j, k ) + ITEM 726( j, k ) + ITEM 732( j , k ) + ITEM 733( j, k )]) .
26








 ITEM 701( j , k ) + ITEM 702( j , k ) + ITEM 703( j , k ) + ITEM 704( j , k ) + 

 ITEM 705( j , k ) +


 ITEM 706( j , k ) + ITEM 707( j , k ) +

 ITEM 708( j , k ) + ITEM 709( j , k ) − ITEM 710( j , k ) ) −



  ITEM 712( j , k ) + ITEM 713( j , k ) + ITEM 714( j , k ) − ITEM 717( j , k ) +  
 
 
  ITEM 723( j , k ) + ITEM 724( j , k ) + ITEM 725( j , k ) + ITEM 726( j , k ) +  
 
  ITEM 732( j , k ) + ITEM 733( j , k )
 
 

EX ( j , k ) =
 ITEM 701( j , k ) + ITEM 702( j , k ) + ITEM 703( j , k ) + ITEM 704( j , k ) + 


 ITEM 705( j , k ) + ITEM 706( j , k ) + ITEM 707( j , k ) +

 ITEM 708( j , k ) + ITEM 709( j , k ) − ITEM 710( j , k )



Algoritmo de la distribución muestral de EX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x
que pertenece al conjunto C.
∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador EX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando = ∑
( )
, donde S es la Desviación estándar de la
muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener
los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > + 3 ó xi < − 3
27
Descripción Formal:
Función selec_EX
// C es un conjunto no vacío de razones EX.//
% ← // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
' ← 0 // Ponemos en cero el acumulador X.
Para ' ← 1 ℎ+,-+ % ℎ+./
' = ' +
Si ' = % entonces
=
'
%
Devolver // Se calcula la Varianza y Desviación Estándar de la muestra//
Para ' ← 1 ℎ+,-+ % ℎ+./
" ←
( )
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ' = % entonces
← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector EX//
Para ' ← 1 ℎ+,-+ % ℎ+./
Si
> +31 ||
3;5 ←
< −31 entonces
Devolver 3;5
Fin
28
Diagrama de Flujo EX
%←
' ← 0
Para ' ← 1
' = ' +
¿' == %?
No
Si
=
'
%
Almacenar Para ' ←
1 ℎ+,-+ % ℎ+./
" ← ∑( − ) ;
i++
"
1
29
'++
1
←6
"
%−1
Para ' ← 1 ℎ+./
'1 = ± '
Almacenar:
1 = '1
¿' == 3?
Si
1
2
30
No
'++
2
Para ' ← 0 Asignar:
3; 5 ⇔
'
8 − 1 ||
<
¿ ;, ' == %?
Si
Devolver [EX]
Fin
31
'
8+ 1
>
No
'++
Ficha 6
Algoritmo T6, para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio FX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de FX.
Cálculo de FX:
Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario DPJ00026 del ISLR del año j del contribuyente con Rif k. El indicador FX se describe mediante la
fórmula
FX ( j , k ) =
( ISLRP ( j , k ) − ISLRC ( j , k ))
VN ( j , k )
FX(j,k): Evalúa la tasa efectiva de recaudación del contribuyente con Rif k en el año j. FX(j,k) es
una razón que cuantifica la proporción del Impuesto Sobre la Renta neto pagado en el año j, como
proporción del total de Ingresos por ventas netas de la empresa en el año j del contribuyente con
Rif k. Mide la tasa efectiva de tributación del ISLR del contribuyente con Rif k, en el año j..
ISLRP(j,k)=impuesto sobre la renta pagado en el año j del contribuyente con Rif k.
ISLRC(j,k)=impuesto sobre la renta compensado en el año j del contribuyente con Rif k.
VN(j,k)=ventas netas en el año j del contribuyente con Rif k.
Si ITEM 90( j , k ) > 0 entonces:
FX ( j , k ) =
ITEM 241( j , k ) + ITEM 291( j , k ) + ITEM 90( j , k )
ITEM 711( j , k ) − ITEM 710( j , k )
Si ITEM 90( j , k ) <= 0 entonces:
FX ( j , k ) =
(−!) * ITEM 87( j , k )
ITEM 711( j , k ) − ITEM 710( j , k )
32
Algoritmo de la distribución muestral de FX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales = , , … . , se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que < 3 ∪ > 3 , para toda x
que pertenece al conjunto C.
∑ Para ello, primero se calcula la Media Aritmética de la muestra, mediante = donde representa la media muestral de los datos. xi representa a cada observación del indicador FX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando = ∑
( )
, donde S es la Desviación estándar de la
muestra y ∑ ( − )" representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la en ambos sentidos para obtener
los pasos a partir de la media ± donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > + 3 ó xi < − 3
33
Descripción Formal:
Función selec_FX
// C es un conjunto no vacío de razones FX.//
% ← // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
' ← 0 // Ponemos en cero el acumulador X.
Para ' ← 1 ℎ+,-+ % ℎ+./
' = ' +
Si ' = % entonces
=
'
%
Devolver // Se calcula la Varianza y Desviación Estándar de la muestra//
Para ' ← 1 ℎ+,-+ % ℎ+./
" ←
( )
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ' = % entonces
← √ " // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
11 = ± ; 21 = ± ; 31 = ± // Se seleccionan los contribuyentes más atípicos y se almacenan en un vector FX//
Para ' ← 1 ℎ+,-+ % ℎ+./
Si
> +31 ||
3?5 ←
< −31 entonces
Devolver 3?5
Fin
34
Diagrama de Flujo FX
%←
' ← 0
Para ' ← 1
' = ' +
¿' == %?
No
Si
=
'
%
Almacenar Para ' ←
1 ℎ+,-+ % ℎ+./
" ← ∑( − ) ;
i++
"
1
35
'++
1
←6
"
%−1
Para ' ← 1 ℎ+./
'1 = ± '
Almacenar:
1 = '1
¿' == 3?
Si
1
2
36
No
'++
2
Para ' ← 0 Asignar:
3? 5 ⇔
'
8 − 1 ||
<
¿ ;, ' == %?
Si
Devolver [FX]
Fin
37
'
8+ 1
>
No
'++
Ficha 7
Algoritmo T7, para calcular intervalos de confianza para la media real de los ratios analizados.
Problema: Calcular el intervalo de confianza para la media real de cada uno de los indicadores
analizados.
Planteamiento Formal:
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de calcular el Intervalo de Confianza para la media real @ con A "
desconocida. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será
vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales = , , … . , límites del intervalo,
CB
−-
F
; E √
≤ @ ≤ CB + -
F
; E √
se pide encontrar, los
, donde i representa a los indicadores
(ratios) de selección calculados para diferentes grupos de contribuyentes.
En la construcción del intervalo, se tiene que:
CB :
es la media muestral del j-ésimo ratio.
- ; E : es el valor crítico de t que corresponde a un área específica de la cola superior H de la
distribución t de student.
F
√
: Es la desviación estándar muestral dividida entre la raíz cuadrada del tamaño de la muestra.
Como las medias Muestrales y las desviaciones estándares fueron calculadas en base a los
algoritmos T1…T6, sólo resta implementar un procedimiento para calcular CB ± -
F
; E √
En función de esto, primero se fija un nivel de significación ó error máximo admisible H, el cual
generalmente es del 5%, con lo cual se consigue un nivel de confianza del 95%. Luego se consigue
el valor crítico de t, con n-1 grados de libertad y él H seleccionado en una tabla t de student, cuyo
valor crítico de tabla se multiplica por el cociente obtenido de de la división de la desviación
estándar entre la raíz cuadrada de n.
Seguidamente, se suma el resultado de -
; E
F
√
más la media aritmética muestral con lo cual
obtenemos el límite derecho del intervalo representado por:
CB
+-
límite izquierdo se resta la media muestral menos el resultado de obtiene: : CB − -
F
; E √
.
38
F
; E √
F
; E √
. Para obtener el
, con lo cual se
Finalmente se ensambla el intervalo con la forma:
I CB − -
F
; E √
≤ @ ≤ CB + -
F
; E √
J
Si la media muestral calculada para el j-ésimo ratio cae dentro del intervalo no habrá razones que
permitan negar que dicha media pudiera ser la real. Es decir, con un 95% de confianza podrá
afirmarse que la media real del ratio j estará comprendida entre CB − -
F
; E √
y CB + -
F
; E √
.
Descripción Formal:
Función intervalo_media_real
8 es la media muestral de la j-ésima razón de selección. //
// K
8
L←K
// S es la desviación estándar de la j-ésima razón de selección//
M←N
// Se fija O =0,05 como nivel de significación; es decir 1- O =95% como nivel de confianza del
intervalo//
O ← 0,05
//Se consigue el valor crítico de t en la tabla t de student, para n-1 grados de libertad y O , se
multiplica por el cociente resultante de la división de S entre la raíz cuadrada de n y se almacena
en tc //
- ← -
; E
∗
√%
// Se obtienen los límites del intervalo sumando y restando tc a la media muestral//
R' ←
CB
− - ; R, ← CB + -
Devolver 3R', R,5
Fin
39
Diagrama de Flujo para la obtención del intervalo de confianza para S con
TU desconocida.
8V
L←K
M ← NV
O←
0,05O ←
O ← 0,05
← 0,05
- ← -
; E
∗
√%
' = ' +
8 V − -
R' ← K
8 V + -
R, ← K
Tomar nueva
muestra de
contribuyentes del
mismo sector
Almacenar
R', R,
8 V ≤ R,?
¿ ;, R' ≤ K
Si
1
40
No
Existe evidencia
estadística
significativa, que
permite no aceptar
que C está dentro
del intervalo.
1
Al 95% de confianza puede afirmarse que
la media real del ratio j, está entre
CB
−-
F
; E √
y CB + ∴
F
; E √
.
No existe evidencia estadística que
permita no aceptar que C está dentro de
ese rango.
Almacena C . Es
posible
usar
a
C Como promedio
del sector
Fin
41
Ficha 8
Algoritmo T8, para realizar una prueba de igualdad de medias con TU desconocida y poblaciones
independientes.
Problema: Calcular la prueba de igualdad de medias con la varianza desconocida y en muestras
provenientes de poblaciones independientes. Se entiende por poblaciones independientes
aquellas que son colectivamente exclusivas. p.ej: AX y EX.
Planteamiento Formal:
La estructura de los ratios AX y EX plantean la medición del valor agregado generado por el
contribuyente. La primera vista desde los datos aportados por las declaraciones del IVA y la
segunda por los datos provenientes de las declaraciones del ISLR. Es así que en busca de la
consistencia contable, ambas razones deberían ser iguales ó similares durante un período
determinado. Para determinar, la igualdad de ambas razones se propone lo siguiente:
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de realizar la prueba de hipótesis para comprobar la igualdad de
las medias reales de dos poblaciones independientes @ X @" con A " desconocidas. Esto a efecto
de comprobar si ambas razones AX y EX demuestran similitud en el sector económico de análisis.
Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los
mismos se enumeran como c1, c2, c3,….., cn
Es decir, ⇔ ambos resultados de los intervalos de confianza de las medias reales de AX y EX,
incluyen a las medias Muestrales de cada uno respectivamente, se procede a la comparación de
las medias reales asumiendo que:
Y Z [ ∃ .% ( CB − -
F
; E √
∴
≤ @ ≤ CB + -
F
; E √
)
] : @ = @"
] : @ ≠ @"
Donde:
@ = Y Z @" = [
∴
Planteada la restricción anterior, dadas dos muestras de ratios AX y EX → AX= + , + , … . , + y
EX= . , . , … . , . se pide comparar las medias reales de ambos grupos independientes, para
determinar si los mismos tienen comportamientos similares durante un período determinado.
42
Para ello se utiliza el siguiente estadístico de prueba:
-a =
− "
6
" ""
+
% %"
Cuya regla de decisión para una prueba de dos colas es:
Rechazar ] → - a >
b(c d bc d )
d bd
De lo contrario no rechazar ]
ó → -a <
(c d bc d )
ó
d bd
Donde:
- = valor t crítico al nivel H de significación con (n1 – 1) grados de libertad.
-" = valor t crítico al nivel H de significación con (n2 – 1) grados de libertad.
f =
f" =
F
= es la razón de la varianza de n1 en proporción a n1.
F
= es la razón de la varianza de n2 en proporción a n2.
Obtenidas las medias y desviaciones estándares Muestrales de AX y EX se calcula - a . A
continuación se fija el nivel de significación H de la prueba, el cual generalmente será del 5%.
Posteriormente se hallan los valores críticos t1 y t2 en la tabla t de Student. En caso de que las
muestras sean de igual tamaño t1 = t2 se encuentra un solo valor de t.
Seguidamente se procede al cálculo de
±(c d bc d )
d bd
para realizar la comparación con - a de la cual
resultará el rechazo ó no rechazo de ] , según la regla de decisión planteada anteriormente.
En caso de no rechazarse la ] podrá concluirse que con un 95% de confianza, las medias reales
de ambas poblaciones de ratios pueden ser iguales. De lo contrario, al rechazar la ] se
confirmará la diferencia entre las medias; lo cual permite concluir en la diferencia de ambas
razones.
43
Descripción Formal:
Función comparar_medias
// 1 y 2 son las medias Muestrales de dos ratios de selección y se almacenas en M1 y M2 //
M1 ← 1
M2 ← 2
// Se obtienen las varianzas de ambas muestras y se amacenas en P1 y P2//
P1 ← "
P2 ← 1""
//Se obtiene el valor crítico t’ a partir del estadístico de prueba y se almacena en Z//
i←
j − j"
6
1" 1""
+
% %"
// Se fija H =0,05 como nivel de significación; es decir 1- H =95% como nivel de la prueba//
H ← 0,05
//Se consiguen los valores críticos de t1 y t2 en la tabla t de student, para n-1 grados de libertad y
H //
t1=-1
t2=-2
; E
; E
//Se calculan las razones de las varianzas con respecto a los tamaños de muestras.//
f ←
f" ←
"
%
""
%"
44
//Se obtiene la suma de los productos de los valores críticos de t1 y t2 por las razones de las
varianzas con respecto a los tamaños de muestras y se divide entre la suma las razones de las
varianzas con respecto a los tamaños de muestras.
−R ←
R←
−(- f + -" f" )
f + f"
+(-f + -" f" )
f + f"
// Se comparan los valores de ±R con respecto a Z.
Rechazar ] → i > R ó → i < −R ó
De lo contrario no rechazar ]
Devolver 3i, R, −R5
Fin
45
Diagrama de Flujo para la prueba de igualdad de medias para dos
poblaciones independientes con TU desconocidas.
M1 ← 1
M2 ← 2
P1 ← "
P2 ← 1""
i←
j − j"
6
1" 1""
+
% %"
O ← 0,05
← 0,05
t1=-1
t2=-2
; E
; E
f ←
f" ←
"
%
""
%"
¿ ;, i > R ó i < −R?
Si
No
Existe evidencia
estadística
significativa al 95%,
que permite concluir
que las medias
reales de AX y EX
son iguales.
Fin
1
46
1
' - a >
b(c d bc d )
d bd
ó → -a <
∴
(c d bc d )
d bd
No existe evidencia estadística significativa que
permita aceptar la igualdad de medias reales
entre AX y EX.
Fin
47
View publication stats
Descargar