Métodos biyectivos de detección de errores: ventajas del metodo ABC

Anuncio
ESTADlSTlCA ESPAÑOLA
Núm. 94, 1982, págs. 67 a 101
Métodos biyectivos de detecció n de errores :
ventaj as del metodo ABC ( *)
por EMILIANO GAROIA RUBIO,
PEDRO RODRIGUEZ-PONGA SALAM/^ ^NCA,
I LD EFONSO VI LLAN CRIADO
Instituto Nacional de Estadfstica
RESUMEN
En este traba^jo se considera el problema de incorporar un dígito de
contral a un código numérico con la finalidad de detectar errores en la
transcripción o transmisián de dicho código. Se describe el método «7» y
los basados en las transformaciones biyectivas « 1-2» y« 1-3-?» . Se estud ian
las propiedades generales de los métodos biyectivos y se introduce un
nuevo método biyectivo: el método ^ A^BC» , cuyas probabilidades de detección son mayores, o cuanda menos iguales, para los errores más usuales, que las de los métodos anteriores.
Palabras clave: Digito de control, método «7», método « 1-2», método
« 1-3-?^, mttodo «ABC», transformaciones biyectivas, error de transcripción, error por baile simpie, error por baite con eje, error por ^baiie
doble, error r^or omisión.
INTRODUCCION
Con la generalización del tratamiento automático de los datos se han podido observar los siguientes fenámenos:
(*) Este articulo constituye un resumen de un trabajo más amptio cuyo título es: Detección de
errores mediante un dígito de controt. Estudio comparativo del ABC con otros rnétodos que ha
sido realizado en ta Sección de Metodologia lnformática del I. N. E. Los autores agradecen las
facilidades recibidas y la autorización para publicar los resuitados.
ESTADISTICA ESPAÑOLA
.
2.
El enorme incremento del volumen de datus transmitidos y manejados.
EI aurnento en la velociddd del tratamientc^ de los dat^^s,
3. El proceso de abstracción de los datos, yue en muchos casos pierden su
significado inmediato al codificarse en informaciones numéricas.
En el tratamiento de los datos intervienen medios mecánicos y humanos, siendo
estos últimos los responsables de la mayor parte de los errores. Además, al haber
perdido la informaciQn su significado inmediato, resulta más dificil la detección de los
errores por parte del hc^mbre; así, por ejemplo, si para loa identificadores de
provincia-municipio se tiene OSOq7, que corresponde a la Horcajada {Avila), en caso de
deslizarse un error durante la codifwcación o tr~ansmisión y aparecer 05047 (Candeleda,
Avila) no se advertiría fácilrnente.
Por ello, parece necesario, por lo menos para algunas informaciones, introducir un
mecanismo autodetectar de errores. Este mecanismo debe ser simple y tener la mayor
capacidad de detección posible.
Los ordenadores digitales, que trabajan en binario, ya incorporan estos mecanismos
que van desde et muy sencillo control de paridad, hasta otros más sofisticados que
permiten no sóÍo detectar, sino también corregir los errores.
Para códigos decimales se utilizan también mecanismos de autodetección, consistentes en añadir una clave o dígito de control relucívnudo con el ciutv, de forma que si se
ha producido un error, esa relación desaparezca. En lo que sigue se describir•án tres
métodos de autodetección, basados en el dígito de control y tras un análisis de sus
propiedades se expondrá un nuevo método que intenta, bajo unas hipótesis bastante
razonables, ser óptimo en cuanto a la capacidad de detección de errores.
HIPOTESIS SUB`^ACENTES
Ante todo, una cuestión terminalógica previa.
Consideramos, en general, un número cariginal de tamaño n que representamos por:
^n^n - 1 . . . ,
Ú1
AI incorporarle la clave o dígito de control, que representamos pur c^^,, se obtendrá
el n ^ mero completo de tdmaño n+ l:
^n^n - t +
. . . , CÍ ^CI'u
METODOS BiYECTIVOS
Las hipcítesis que se utilizan para el cálculo de las probabilidades que tiene un
método para detectar los diferentes errores san las siguientes:
1.
tfipcitesrs de equiprobahílidad de l^^s d; (i =
1, 2, ..., n).
El dígito i-ésimo del número sin clave puede tomar cada uno de los 10 valores
comprendidos entre 0 y 9 con probabilidad 1/ I0,
2.
Hip©tesis de independencia de los d;(i = 1, ..., n).
Las variables aleatorias a^ 1, ..., d„ son independientes.
3.
Hipc^tesis de eqctiprohuhilidad de las posiciones de error.
Si un determinado error ha de afectar a K posiciones del número con o sin clave
incluida, se supone que todas las combinaciones de las n+ I o, en su caso, de las n
posiciones tomadas de K en K son equiprobables.
4.
Nipótesis de equlprobahilidad de los números erróneos.
Por cada tipo de error, se supone que todos los números erráneos que se pueden
obtener a partir del correcto son equiprobables. Asi, por ejemplo, en el error de
transcripcián, se supone, que si el dígito correcto es d^, ei incorrecto podrá ser
cualquier dígito comprendido entre 0 y^ que sea distinto de d1, tomando cada uno de
1
éstos con probabilidad
ERRORES CONSIDERADOS
Los errores que se han tratada en el estudio siguiente de cara a encontrar métodos
para su deiección y calcular las probabilidades de detección son:
1.
ERRORES DE TRANSCRIPCION
a) Error de transcripcián simple ( o de orden 1; E. T. S.).
Se produce cuando un dígito cualquiera se cambia por cualquier otro dígito decimal.
Ejemplo: se quiere escribir 387422 y se escribre 3(7)7422.
b) Error de transcipción de orden k.
Se produce cuando se dan simultáneamente k errores de transcripción simple.
ESTADISTtCl1 ESPAt^IOLA
7'a
Ejemplo de error de transcripción de orden 3: se quiere escribir 3137422 y se escribe
3( 7)7( 2)(1) 2.
2.
ERRO^ RES POR BAILES
a) Error por baile sitnple tE. B. S.).
Se produce cuando dos digitos consecutivos se cambian entre si. No hay tal baile
cuando los das digitos son iguales.
Ejemplo: se quiere escribir 387422 y se escribe 3(78)422.
ó) Errar por bail^ doble.
Se produce cuando dos grupos de dos dígitos consecutivos se cambian entre si.
Consideraremos que no hay baile si ambos grupos son iguales; pero trataremos como
baile doble el caso en el cual un digito se repite en igual posición en ambos grupos.
Ejemplos: s+e quiere escribir 387422 y se escribe 3(42}(87)2.
Se quiere escribir 374241 ^^ se escribe 3^24)(74)1. ( Este caso podría considerarse
como un baile simpte con eje.)
c) Error por baile con eje.
Se produce cuando dos dígitos separados por otro (que recibe el nombre de eje) se
carnbian entre st.
Ejemplo: se quiere escribir 378422 y se escribe 3(4^7)22.
3.
ERRORES POR OMISION
a} Error por omisión simple (E. O. S.}.
Se produce cuando al escribir un número se omite uno de sus digitos; en este caso,
el campo en el que se escribe el número tiene mayor tamaño que el número y^ste se
completa añadiéndole un cero a la izquierda.
Ejemplo: se quiere escribir 378422 y se omite el 8, resultando 037422.
6) Error por omisión de orden k.
Ocurre cuando se dan k omisiones simples. Las digitos restantes se desplazan hacia
la derecha y el número se completa con ceros a la izquier+da.
METOD4S B[YECTtVOS
Ejemplo: se quiere escribir 12345ó y se omiten 1, 3, 5, y b, resultando U00024.
4.
Se podrían considerar otros errores más complejos, pero seguramente menos
frecuentes. De hecho, entre los anteriores, parece lógico yue nu todos sean igualmente
probables, Por ejemplo, el baile simple ocurre con más frecuencia que el baile doble y
el error de transcirpcit^n simple es más corriente que el que afecta a varios dígitos. En
general, Ios errores más simples son más frecuentes y, por tanto, es más importante su
detección.
DESCRIPCION DE L+C.^S METODUS
En este trabajo, vamos a considerar dos tipos de métodos que utilizan un único
dígito de control:
El método «7», un método clásico basado en la división por 7.
- Los métodos biyectivos, yue consideran transformaciones biyeciivas de los dígitos. Dentr© de este grupo, estudiaremos los métodos « 1-2», « 1-3-7» y el nuevo rnétodo
«ABC».
Veamos ahora una breve descripción de cada uno de estos métodos.
1.
Método del ^ 7^^
a)
Descripc ión
Para obtener el dígito de control, según este método, se halla el resto de la división
por 7, es decir, el módulo 7 del número. Así sea el número 725^1:
725^31 = 7 x
103ó8 + S
E1 digito de control es 5 y se añade a la derecha del número original, resultando el
número completo, 725815.
b)
Comprvbac•ivn de r^n núm^rc^
Supongamos que se ha recibido el número 725715. Para comprobar si tiene algún
error, se calcula el resto de dividir por 7 el número sin la clave: 72571 = 7 x 103ó7 +
+ 2, y se compara el resto obtenido con la clave. Cuando éstos sean distintos, corno en
este caso ( 2 ^ 5), se detecta la presencia de un error. En el caso de que fuesen iguales,
ESTADISTfCA ESPAÑOLA
72
na se detectaría la presencia de error, lo cual no siempre quiere decir que no exista; así,
por ejemplo, si en el número 725712 se comete un error de transcripción y se escribe
725782, este error no se detecta con este método.
La Tabla 2 contiene los porcenta^jes de detección de este método para distintos tipos
de error (los cálculos pueden encontrarse en el Capítulo II de nuestro citado trab^jo).
2.
Método «1-2^^ ( Utilizado por la UIC, Unión Internationale de Chemins de fer}.
a)
I^escripeic.in
Se multiplican los digitos de rango par (desde la derecha) por 1 y los de rango impar
por 2. Para cada producto, se suman los dígitos que resultan de la operación. La clave
será la cifra que es necesario añadir a la suma total para obtener un múltiplo de 10. Así,
sea el número 72.581:
Númera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dígitos de rango par, por 1 . . .. . . . .. . .. .
Dígitos de rango impar, por 2...........
Suma de las cifras resultantes . . . . . . . . . . .
Clave ..................................
Suma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2
2
l4
S
1Q
8
8
1
2
1 + 4 + 2 + l + 0 + 8 + 2 = 18
2
,
20 (múltiplo de 10}
EI número con la clave es 725812
.^)
Comprobaeión de un núrnero
Sea e^ número A25812. Para la comprobacián se realiza la transformación siguiente:
Número (con clave) ... . .. .. . ... . ... . .. . 4 2 5 8 1 2
10
2
Digitos de rango par, por 2 . . . . . . . . . . . . . 8
2
8
2
Dfgitos de rango impar, por 1....... ... .
Suma de las cifras resultantes .........
8+ 2+ 1+ 0+ 8+ 2+ 2= 23, q ue
no es múltiplo de 10, y, por tanto, el
número se considera erróneo.
La Tabla 2 contiene los porcent^jes de detección de este método para distintos tipos
de error (los cálculos pueden encontrarse en el Capitulo IV de nuestro citado trabajo).
73
l1tETODOS BtYE+CTt VUS
3.
Método ^ 1-3-7y ( estudiado por el 1NSEE y el Banco de Francia)
a)
Descripción
Ahora se distinguen tres posiciones de los dígitos, realizando para cada posición una
transformación distinta. Así, sea el número 75281:
Número ...............................
Dígitos de rango 3i + 1, por 3.........
Dígitos de rango 3i + 2, por 7........ .
7
5
2
8
1
6
3
49
Só
S
Dígitos de rango 3i + 3, por 1 , . . . . . . . .
Suma cifra de las unidades ...... ... ..
Clave ..................................
9+ 6+ 5+ 6+ 3= 29
1
Suma ( múltiplo de lo) .. .. . ... . .. .. ...
30
EI número con la clave incorporada es 725811.
b)
Comprobación de un número
Sea el Número 725.831. Para la comprobación se realiza la transformción siguiente:
Número (con clave)
Dígitos de rango 3i
Dígitos de rango 3i
Dígitos de rango 3i
.. . .
+ 1,
+ 2,
+ 3,
.. . .. . .. .. . .. . ... .
por 1.........
por 3.... ... ..
por 7.... .. ...
Suma de las cifras de las unidades ....
7
2
S
5
8
1
1
b
49
3
9
Sb
9+ 6+ 5+ 6+ 9+ 1 = 36, que no
es múltiplo de 10, y, por tanto, el número se considera incorrecto.
La Tabla 2 contiene los porcenta^jes de detección de este método para distintos tipos
de error {los cálculos pueden encontrarse en el Capítulo V de nuestro citado trabajo}.
4.
Método KABC^^ (ideado y estudiado por los autores de este trab^ja en el Instituto
Nacional de Estadística. Madrid)
a)
Descripción
Se distinguen tres posiciones en los dígitos A, B y C, realizando en cada posición la
transformación que resulta de la siguiente matriz:
74
ESTADiSTECA ESPA^oLA
d
C
B
A
0
1
2
3
4
S
6
0
2
4
6
8
I
3
5
7
9
0
3
8
2
7
4
I
S
9
6
0
1
2
3
4
7
8
9
5
6
7
8
9
Así, sea el número 72581
N úmero
Posición
Posición
Posíción
........................................
3i + 1, columna 8 . . . . . . . . . . . . . . . . . . . . .
3i + 2, columna C . . . . . . . . . . . . . . . . . . . . .
3i + 3, columna A ....................
7
2
8
S
8
l
3
S
7
S
Suma de las cifras resultantes . .. . . ... . .. . ... . .
Clave .... ......................................
S + 8 + S + 7 + 3 = 28
2
Suma {múltiplo de 10) .. . .. . . ... . .... ... . ... . .
30
+l número con la clave incorporada es 725812
b)
Comprvb^cic^n de r^n númern
Sea e! número 125814. Para la comprobacíón se realiza la transformación siguiente:
Número (con clave) .. .. .. . ... ... . .... ..
Dígitos de rango 3i + 1, columna A....
Dígitos de rango 3i + 2, columna B....
Dígítos de rango 3í + 3, columna C.. ..
1
2
S
8
1
S
8
2
4
4
3
7
Suma de las cifras resultantes . . . . . . . . .
2+ 8+ S+ 7+ 3+ 4= 29,queno
es múltiplo de 10, y, por tanto, el número se considera incorrecto.
L,a Tabla 2 contiene los porcentajes de detección de este método para distintos tipos
de errores (los cálculos pueden encontrarse en el Capitulo ^tI de nuestro citado tra.bajo).
^TOnos s[v^rr[vos
75
CARACT'ERISTICAS DE ESTOS METt?DOS
Los rnétodos expuestos están basados en diferentes algoritmos y no buscan otra
cosa que hacer una partición del conjunto de núrneros. Los elernentos de cada clase
tienen una misma clave (ello los identifica) y no son distinguibles entre sí .
Así, por ejemplo, el número 72581 tiene S como resto de la división por 7. Con la
clave incorporada se convierte en 725815. Si en vez de ese número apareciera el 7251 15
no se detectaria el error, ya que 72S t 1 tiene también S como resto de la división por 7,
y, por lo tanto, pertenece a la misma clase.
EI algoritmo ha de ser tal que los diferentes errores hagan cambiar la clase al
número y se detecte el error. Por ello, con un mayor número de clases mejora la
detección.
Si la clave es de un solo dígito decimal, sólo se p^teden distinguir diez clases (*). El
método 7, sin embargo, no las aprovecha todas; solamente utiliza de 0 a 6 como resto
en módulo ? y no existen las claves 7, 8 y 9. A pesar de ello, es el mejor método
basado en la divisibilidad por un número de un solo dígito.
Nuestro objetivo es la búsqueda del método óptimo. Esta búsqueda se concentra
entre los métodos de un solo dígito decimal, puesto que se quieren evitar las dificultades que pueden introducirse al utilizar métodos más complejos. Las caracteristicas a
exigir a un método para considerarlo como «bueno^, son básicamente:
La sencillez de cálculo. Esto otorgaba especial interés a algunos métodos como,
por ejemplo, al método de 7; pero con el proceso automático de cálculo y cornprobación de clave, esta propiedad pierde importancia.
La capacidad de detección. La capacidad de un método de detección para
detectar los diferentes errores constituye, en realidad, su caracteristica fundamental.
En este punto, nos hemos encontrado con el problema de la no disponibilidad de un
estudio empírico sobre las frecuencias de los distintos tipos de errores (habiendo, por
otra parte, constatado la dificultad de llevarlos a cabo). La importancia de tal estudio
sería doble: por una parte, permitiña graduar los errores, situando a cada tipo de error
en su verdadera dimensión; y, por otra parte, permitiría ponderar la probabilidad de
detección de cada tipo de error por su frecuencia, par•a obtener un indice de detección media para cada uno de los diferentes métodos.
(*) Una posible rnejora consistirá en utilizar varios dígitos de control, caracteres alfab^ticos,
etc..., pero tiene el inconveniente de complicar el sistema, de forma que haría más costoso el
proceso e incluso podrfa introducir errores adicionales.
7á
ESTAI3l3TICA ESPAÑ^L.A
En consecuencia, se procederá a ordenar o jerarquizar los tipos de errores en
funcián de su importancia «aparente^, tratando de lograr una optimización jerarquizada en las capacidades de detección. Este método no es tan restrictivo como quizd
pudiera pensarse, al menos por cuanto respecta a un óptimo o cuasi-óptimo relativo
(ésto es, en compara^cián con los métodos del «7^, «l-2» y«1-3-7^), por cuanto que,
corno se ver^, tas probabitidades de detección del método «ABC» son mayores (o,
cuando menos, iguales) que las de los otros métodos en estudio, para todos y cada
uno de !os errores considerados en este trab^jo.
Para acercarnos a nuestro objetivo, veamos nuevamente los métodos descritos, pero
.
utilizando un len,gua^je míits formalizado y apto para el estudio de sus propiedades
generales.
DESCRIPCION DE LOS 11^ETODOS DE DETECCION DE ERRORES COMO
METODOS BASADOS EN TRANSFORMA+^IONES
Cuando se describieron anteriormente los métodos «7^, « 1-2», K 1-3-^^, se hizo can
algoritmos simples {división por 7, multiplicar las cifras según su posición, etc,). Un
enfoque diferente consiste en plantear dichos métodos como resultado de transformaciones de los digitos según sus posiciones en el número. Aparece, entonces, como
diferenc^ia básiea el que los métodos « 1-2^^ y« 1-3-7^^ son biyectivos, mientras que el
«7^^ no lo es.
A)
Métodos basados en transformaciones biyectivas
Estos métodos utilizan,
en el proceso de añadir la clave al número original (que
^
representaremos por d,,, ... , d ^), y en la asociada detección de errores, unas aplicaciones
de transformación, f, i= l, ..., n, definidas en el subconjunto de los números naturales
{4, I, 2, 3, 4, S, 6, 7, 8, 9} sobre el mismo, que tienen la propiedad de ser biyectivas y
de satisfacer la condición f^(o) = 0 para todo i,
La clave, que representaremos por do, se obtiene de la siguiente forma:
d• ^ ^^ - ^^o ^Í^{d n) + .fM- ^{d R- ^) + . .. + f, {d , )]
y, por tanto, se cumple:
f^(d„) + .,^,^-^(d^-i) + ... + f,(d,) + d^, = 4 mod,o {*)
(*)
Si representamos por fo 1a aplicación identidad, podemos expr^esar esta condición en !a
^
forma mod,o
^ f^^d^)
=0
^f ^^
METODOS BIYECT[ VCiS
E1 tratamiento para detectar errores cuando se recibe ei número cl,^ ... ci,do será
obtener la suma de los transformados de los dígitos y si f R(dn) +... + f, (d ,)+ d^ no es
rnúltiplo de 10 se detecta la presencia de error y si es múltiplo de 10 no se detecta.
B^;jo e sta nue va óptica, los métodos « 1-2» y« 1-3-7» pueden desc ribirse como sigue :
1.
Métvdo « 1-2a
a)
Cálculo de clave
Dado el número d„ ... d2d,, su clave se calcula de la siguiente forma:
dQ =
10 - mod,u {f',(d,) + f2(d2) + ... + fM{d,^}),
donde:
fci^(d;) = d,, si i= 2I{, K- 0, 1, ...
J 1\d;l
=
f(2^(d;) = mod,o ( suma de las cifras de 2 x d1), si i= 2 K+
b)
1
C^mprobac^ón de c•lave
Se calcula: f{a}(d„) + ... + f^^^(d 2) + .f<2^(d ,) + .f^^,^(do),
donde:
1, si n = 2k
a =
2, si n= 2k + 1
Si esta suma es múltiplo de 10 no se detecta presencia de error; y, si no lo es, sí se
detecta.
2.
Métc^dv' K 1-.^-7^
a)
Cálculo de clave
Dado el número dn .. . d 2d ^, su clave se calcuía de la siguente forma:
d =
10 - modlo ^^(d,) + f2(d2) + ... + .Ín(dn)}
donde:
fc^>(d;) = d„ si i - 3k, k - 0, l, ..
f,(d r) =
ft3)(d;) = mod,^, ( 3d;), si i= 3k + 1
fc^)(d;) = mod,^ ( 7d;), si i= 3k + 2
ESTADISTICA ESPA1qOt.A
b)
C«mpr^^hucitin de c1U^•e
Se calc ula:
.^^a,^d,^) + ... + f^^^(á2) + .f•c3>(d ^) + fc>>^do)
donde:
, si n = 3k
a=^ 3, si n= 3k + 1
7, si n= 3k + 2
Si esta suma es múltiplo de 10 na se detecta presencia de error, y si no lo es, si se
detecta.
B)
Método de! «7^ (consic^erado como un conjunto de transformaciones)
Como en los casos anteriores, el método del «7^ ^ puede considerarse como el
resultado de transformar, mediante las apropiadas aplicaciones, los dígitos del número;
siendo la clave ia suma, en módulo 7, de los transformados. Así como en el método
^ 1-2^ se manejaban dos transformaciones y tres en el « 1-3-7», en el método del «7^ se
manejan seis transformaciones, que se aplican de modo ciclico y empezando por el
dígito de menor orden.
Las seis transformaciones aparecen en la Tabla 0. En ella, se puede observar su
falta de biyectividad, que se manifiesta en que, para todas ellas, los iransformados del
o, 1 y 2 coinciden, respectivamente, con los del 7, 8 y 9.
Tabla 0
d^
fb
f^
f^
^^
^3
^,
0
1
2
3
4
5
ó
0
5
3
1
b
4
2
a
4
1
5
2
6
3
0
ó
5
4
3
2
1
0
2
4
6
1
4
1
2
3
S
0
3
6
2
S
1
4
3
4
S
ó
^
o
a
o
0
0
0
8
9
S
4
1
6
S
2
4
3
6
1
2
3
1^rtBTODOS OIYECT[vo^S
donde:
79
fb(d^) = mod, (Sd,;); .f^s(d^) = mod,(4d^);
f4(df) = mod, (6d.;); f3(d.;) = mod, (2d;);
f2(d^) = mod,(3c^;): f,(d^) = mod, (d;);
Dado el número d„d,^_ ^... d,, la clave, d^, se obtiene asi:
do = mod, (f ^ (d , ) + f2 (d 2) + . . . + f,^ (d,^))
donde fak+; = f;, para k= 0, 1, 2, 3, .. ., i=
C)
1, 2, 3, 4, 5, 6.
Optimización jerarquizada
Como se dijo anteriormente, es necesario jerarquizar los errores que aparecen en el
proceso de datos, para poder decidir si un método es mejor que otro. A estos efectos,
los errores simples son más importantes (frecuentes) que los más complejos, y puesto
que ningún método de un solo digito puede detectar al cien por cien los tres errores
simples (ETS, EBS y EOS), éstos han de ser, a su vez, ordenados para poder decidir.
La principal venta^ja de los métodos biyectivos radica en que son los únicos que
detectan al cien por cien el ETS; por lo que siendo éste el error principaí (hipótesis
razonable y fácil de aceptar), se buscará el óptimo dentro de la clase de los biyecti vos.
Todos los métodos biyectivos no sólo tienen la misma probabilidad { P^ = 1) de
detectar el error de transcripeión simple, sino que también detectan con iguales probabilidades los errores de transcripción de orden superior (Pk = 1- 1 Pk_ ^). For tanto,
9
podemos decir que los métodos biyectivos maximizan la probabilidad de detección del
error de transcripción de orden K z 1 con la restricción de detección total en eí error
de transcripción de orden 1.
Asimismo, una vez fijada la condición de biyectividad, quedan totalmente determinadas las probabilidades de deteccián del error por omisión de cualquier orden. Por
tanto, los métodos biyectivos también maximizan estas probabilidades de detección con
la sujeción a lá anterior restricción.
Dentro de los métodos que maximizan la detección deí error de transcripción simple
(métodos biyectivos) podemos buscar métodos que maximicen la detección del error
por baiie simple. Asi, los métodos « 1_2» y«ABC» tienen probabilidad de detección
máxima para el baile simple ( máximo candicionado por la biyectividad). No asi el
« 1-3-7» que, siencio biyectivo, no maximiza la detección del error por baile si mple.
Ahora podemos tratar de maximizar la probabilidad de detección del baile doble con
las restricciones (por orden jerárquico) de maximizar la detección del error de trans-
í30
ESTADISTiCA ESPAI^^L.A
cripcidn simple y la del baile slmple. Así, aparece el método «ABC^, que consigue
al^anzar el máximo.
Po^demos, pues, presentar los cuatro métodos estudiadas: «7^, « l-2^+, « 1-3-^^+ y
«ABC^ mediante el siguiente diagrama:
«ABC^
« 1-2^
« 1-3-7»
«7»
Con^junta de métodos
biyectivos y que maxirnizan ta detección
del baile simple, que
maximizan la detección del baile doble.
Conjunto de métodos
para el cálculo de un
dígito de control.
Conjunto de métodos
biyectivos que maximizaa la detección
del baile simple.
Conjunto de métodos
para el cálculo de un
dégito de control que
haceñ máxima la detección del error de
transcripción simple
{métodos biyectivas).
METODOS BASADOS EN APLICACIONES BIYECTI VAS: CALC ULO DE LAS
PROBABILIDADES DE DETECCION (TEOREMAS GENERALES)
Se demuestran aquí unas teoremas, especialrnente diseñadas par las autores, que
permiten estable^er las probabilidades de detección de algunos errores;` probabilidades
que son generales a todos los métodos biyectivos.
!^^ETODOS B[YECTI VOS
1.
8l
Errar de transcripc•ic^n d^ ord^n k
Tevre^na 1
«Si Pk representa la probabilidad de detección del error de transcripción de orden K
se tiene^:
Pk = 1-
1
9 Pk_i, K= 2, .,. , n + 1
P, = 1
Para la demostración (*) del teorema utilizaremos las cuatro proposiciones siguientes.
Prvposlción 1
«P, = t, es decir, la probabilidad de detección del error de transcripción simple
{error de orden 1) es l. ^
Demostración:
Supongamos que un determinado dígito ^en posicián i-ésima, que llamarernos d;, se
sustituye por otro dígito, que llamaremos d;`.
Sea X = mod,o
^ f^^d.)
J
el módulo 10 de la suma de los transformados de los
^ ^^
dígitos en los que no se ha cometido error,
El mod,o de la suma de los transformados del número correcto será:
mod,o (X + f;(d;))
Ahora bien, al ser la transformación f; biyectiva, por ser d; ^ d; será f;(d;) ^ f(d;').
Por tanto:
0 "'°d= = X + f; {d ^ ) ^^
X + f.(d' ) ^^ ^ 0
Por consiguiente, el error de transcripción simple se detecta siempre. Es decir, el
porcentaje de detección es el cien por cien.
(*) La demostración constructiva que se da a continuación es la que condujo al enunciado del
teorema; pero, una vez demostrado y comprobada la sencillez de su enunciado, se encont^ una
demostracián directa. Sin embargo, y sin perjuicio de que al final de la demostración constructiva
se ofrece la directa, se ha creído de interés facilitar aquélla, por cuanto que permite conocer con
más detalle el problema, porque, quizá su técnica puede utilizarse para demostrar otras propiedades relevantes y porque algunas de las proposiciones que se utilizan tienen interés por sí mismas.
82
ESTAD[ST^1CA E,SPA140LA
Prc^posición 2
«Cualesquiera dos números que provengan de un mismo número correcto (con o sin
clave incorporada) y que constituyan, respecto a éste, error de transcripcicín no detectable de orden K^ 2, se diferencian entre sí al menos en dos dígitos.»
Demostración:
Pong,^monos en el caso más desfavorable, que es aquél en el que ambos números
incorrectos provienen de cometer errores de transcripción en las mismas K posiciones
r ^, r Z, ..,. tk.
Sean d;,, d;=, ... , d;k los dígitos correctos que han sido transcritos por:
d;',, d,^2, ..., dik en un caso,
y por:
d^;, d;;, ..., d;k en el otro caso.
Por ser ambos errores no detectables tendremos:
J``^r ^( C^f J ^
...-^-;,^ik-1(dik-1^
_ n^°'d,o ^i'^r;^ -F-
...
-^-
+ ✓ ik^dik^^^o
Jik-!{drk-1)
_
+ `^ikC+^fkÍ
Si fuese posible que sálo se diferenciasen en un dígito, por ejemplo, el ^k-ésimo,
tendríamos, en virtud de lo anterior:
,%!ik{d;k^
_ .f;k^^;k^
lo que a su vez irnplicaría, pues f;^ es biyectiva, que
d'k - ^ik
q ue contradice la hipótesis _ d;k ^ d^k .
Proposición 3
«E1 número de errores no detectabies de orden k^ 2, en cualesquiera k posiciones
fjadas, es igual al número de errores detectables de orden k- 1, en cualesquiera k- 1
posiciones fijadas elegidas entre las anteriores k posiciones.»
Demostración:
Consideremos fijas k posiciones de entre las n de que consta el número. Sean
83
METOL1tJ6 B[YECTI Vos
i,, i 2, .. . , i,t tales posiciones fíjadas. Sean d^,, .. ., d'rk los dígitos correctos en estas
posiciones y d;,, ..., d;,^ los incorrectos.
Por ser el error no detectable, tendremos:
.f^^(d^,)
+ ... + f;k(d;k)m°'d,^
^ fr',^^r;')
+
...
+ f;k(d;k)
Fijemos ahora k- 1 de entre las k posiciones de error anteriormente fijadas; por
ejemplo, i,, ..., ^k_^.
Se verifcará que:
f^,{d^,) + ... + f;k- i(d^k- i) ^^° ^ -^^,(d^ ) + ... + f^ _ ^{d;k,
^
k
ya que si se diese la igualdad, como f;k(d;,^) ^ f^^(d^k} {por ser d;k ^ d;k), tendriamos:
f^^(d^f) +
+ fik(d rAt^
rr^od,o
^ .f^ ^{d ^ ^)
+ .. . + ,^Ik(d ik}
en contra de la hipátesis de error de orden k no detectable.
Por tanto, para cada error de orden k no detectable en las posiciones i,,.. ., i^ hay
uno detectable de orden k- 1 en tas posiciones i,, ..., ik_,. La Proposicián 2 asegura,
además, que todos estos errores de orden k- 1 van a ser distintos entre sí. En efecto,
si los errores no detectables de orden k son tales que los dígitos en posición i^
coinciden, habrá al menos dos posiciones, enire las k- 1 restantes, en que los dígitos
difieran y si los dígitos en posicián i,^ son diferentes, aún existirá al menos una posición
en que difieran. Por consiguiente:
Número de errores detectables de orden k en posiciones i,,...., i^ S número de
errores detectables de orden k- 1 en posiciones i,,..., i,^ _^.
Recíprocamente, supongamos dado un error detectable de orden k- 1 en las
posiciones i , , . . , , i,^ _ ^ ; esto es:
,
,
f;^(d^^) + ... + ,f;k-^^d^k-^)^'° ^
,
.f^ ^td ^ , + , . . + .f k - ^d ^.k - ^)
,,f ,(d ^,)
; ,
^ ^ ,f;,^( d^
.f;k- ^^d^k- ^) ^ ^^^- ^^d%k- ^)
Entonces, existirá asociado a él un único d;k ^ d;k tal que
.
,
,
f;^(d;^) + ... + f;^_^(d;^_,) + ^;k(d; )
k
^` fik-l^d^k-1^
+ f^k(dik)
^° _ ,f;,d;,) +
ESTADISTICA ESPAI^OLA
Es decir, existe un error no detectable de orden k en las posiciones i^, ..., ik, Todos
los errores de orden k obtenidos de este mcxio van a ser distintos entre si, puesta que
los errores de orden k-- 1 de los que se parte lo son.
Por tanto:
Númera de errores detectables de orden k- 1 en posiciones i^, ..., ik_,
S número de errores no detectabies de orden k en posiciones i,,... , ik.
De esta desigualdad y de la anterior se obtiene la igualdad que establece el enunciado de !a Proposición 3.
Propvsicitin 4 ^
^^ado un número correcto de n dígitos, el número de errores detectables de
orden k es^:
k-
_ ^}^ gk-^
Demastracián:
Utilicemos la siguiente notación (para r^ Ky:
!C, = número de errores no detectables de orden r en posiciones i,, ..., ir;
Yr = número de errores detectables de orden r en posiciones i,,.. ., i,
For la Proposición 3, tenemos:
Xr -
Dado que el número de errores de orden r en las posiciones i^, ..., ir es 9' (pues,
cada digito correcto se puede cambiar erróneamente por uno de los otros nueve},
tendremos:
}C, = 9r - Y
de donde (sustituyendo X, = Y,_ 1)
Y,. = 9' -- Yr -1
que es una ecuación en diferencias de orden l. Resolvámosla por recurrencia, recordando que Y^ = 9(pues P^ = 1).
Yk = 9^` - (9k^' - Yk-2} = 9k _ 9k-^ + Yk_z = 9k - 9k--i -^- (9k-2 ..^..
^ 9k _ ^k-1 ^,. 9k-2 - Yk-3
Yk-3) -
METODOS BiYECT[VOS
eS declf:
Yk = 9k -- 9k- l + 9k-2 _... + 9,
si k es impar
Yk = 9k - 9k- l+ 9k-2 -... - 9, si k es par
Por tanto:
_ ^)^ 9^-^
^=o
es el núrnero de errores detectables de orden k en posiciones i,,... , ik. Como estas
posiciones pueden elegirse de
n
k
forrnas distintas y cada elección da lugar a errores
diferentes, queda demostrado el enunciado de la proposición.
+^vrvlario de la Propr^sicivn 4. Se verifica la siguiente relación entre el número de
errores no detectables de orden k y el número de errores detectables de orden k-- l:
.
n gk _^
n- k+ 1 Z
k
^ k
k-l
En efecto:
Zk _ n
k
^9k _ gk-
+ 9k-z _ ...)
n 9k _ Zk = n 9k _ n ^9k _ 9k-1 + gk-2 _
.) _ n
k
k
k
'f
k
_
n
n --- k +
k -- 1
1 (9k-1 ^ 9k-2
k
^9k-l
_ 9k-2 +
+ ...) = n - k +
k
Demvstracián del Teorema 1. Hallem,os Pk como el cociente entre el número de los
casos favorables y el de los posibles.
El número de casos posibles es n 9k y en virtud del corolario tendrernos:
k
Pk =
Zk
n
k
-
n 9k _
n-- k+ 1 Z
k
k
Ck 19k
9k
n- k + 1
kil
J
Zk-1
1
Pk _ l,
= 1 -
1
9
k
n 9k_l
k
para K= 2, ..., n +
ESTAI?lST1CA E3PAl^(JLA
Corno, según la Proposición l, P, = l, queda concluida la demostración del Teorema 1 (*).
Demosxracicín directa de! Teorerna 1
Por la Proposición 1, queda demostrado que P, = l. Por el Teorema de la prababilidad total, se tiene:
Pk+^ = Pk • P[Error orden k+ 1 detectable / Error orden k detectable] +
.
+( i--- P,^) • P[ Error orden k+ 1 detectable / Error orden k no detectablej
Ahora bien:
8
P[Error orden k+ 1 detectable f Error orden k detectable] _-, ya que siendo
9
detectable el error de orden k, esto es, siendo
k
^ f. (d;^
) ^ ^ .f1, (d,,),
^=1 ^
el error de
. orden k+ I será detectable siempre que el error (k + 1)-ésimo no consista
en que 2d^k+! tome justamente (en virtud de la biyectividad de las transformaciones)
aquel valor, de entre los 9 posibles, que produce la igualdad:
k
^^.J
; ^ (d ^^1) + .f * + 1(d l k+l ) r
^^1
^^
1(d^ ^) + f k+ ^(d k+,)
=1
Por otra parte:
P[ Error orden k+ 1 detectable / Error k no detectable j= 1, ya q ue s ie ndo no
detectable el error de orden K, esto es, siendo:
k
^,f
(d^^,) _
^=1 '
(*) Notu:
Obsérvese que
.f 1(d^ ,)
9
kl-.^ Pk
l^
Por tanto, y como era de esperar, a medida que aumenta el orden de error de
transcripción, la probabilidad de detección asociada se va aproximando a la que tiene
un número aleatorio de ser incorrecto.
87
11tETODOS BlYECTI VOS
en virtud de la biyectividad de las transformaciones se verifícará que, cualquiera que sea
^'k+i ^ d'k+l'
k
k
^
-f^^(d!^
^
'
i=1
+ .f'k+l^dik+l ^
^
^_!
^ 1(d^ 1^
+ f Ar+l(^ik+l^
Por consiguiente:
S
Pk + ! _ pk •
9
g
^- (1 - P,^) • 1 = 1 - 1 - Pk = 1 -9
I
Pk _
9
como queríamos demostrar.
2.
ERROR POR OMISIC?N DE ORDEN K
Vamos a estudiar la probabilidad que tienen los métodos basados en aplicaciones
biyectivas de detectar omisiones que producen error.
Dembstraremos el siguiente;
Teorema 2. «La probabilidad, Pk, de detectar un e rror por ornisián de k dígitos en
un número de longitud n+ 1(*) es^ ^ :
r ^r -k + 1
9
Pk -
n- r
10"T'
k_ j 10" -r+ 1- 1
+
n
k-- 1
10"^1
10" - 1
k = l, ..., n
Antes de realizar la demostración del Teorema, veamos un Lema previo y un
corolario de dicho Lema.
Lema 1.
K La variable aleatoria rnod,o (f^^(d^) + f,^(d^)), para i, j = 1, ..., n, i^ j
toma cada uno de los 10 dígitos con probabilidad ^ 1-J
10 ^^
Demostraeión del Lema 1. De la hipótesis de equiprobabilidad de d; j unto con la
biyectividad de las f^ se deduce que fr(d^) toma con equiprobabilidad cualquier dígito de
0 a 9.
Para unos valores fijos de f; (d^) y de j, y para cada m= 0, 1, ..., 9, existe un ú nico
d.^ tal q ue :
^
mod,o (f,.(d^) + f^+(dj}) = m
(*) I.a longétud del número sin clave es n y al incorporar la clave será n+ l,
88
ESTAD[ST1CA ESPAI^©^.A
como es tri vial comprobar. Por tanto:
P (mod,^ (f;(d;) + f (d )) _
1
m = 0, 1,
líJ '
ColorarRO de! Lema 1. La var^able aleataria mod,^[f.^ (d; ^} +
^
^
cada uno de Ios lU dígitos con probabilidad 1/ l0.
,j^k(d kf)) toma
Se demuestra inmediatamente, por inducción, a partir del Lema 1.
Demostración de! Teorema 2. Si al transcribir un número se omiten k dígitos se
produce, en general, un desplazamiento a la derecha de los dígitos no omitidos, completándose el número con k ceros por la izquierda. Así, si el número correcto es 123456 y
se omiten el 2 y el 4, el número incorrecto sería 0013Sb.
Los dígitos situados a la derecha del dígito de menor arden entre los omitidos no se
ven afectados pc^r el desplazamiento.
Como dado un número completa de n+ 1 dígitos el de orden inferior es la clave,
será necesario hacer la precisión siguiente:
Considerando números de n+ 1 dígitos (elave incluida), estudiaremos, en primer
lugar, la omisión de k dígitos cuanda ninguno de ellos sea el de orden inferior (posición
de clave). En segundo lugar, estudiaremos el caso en que uno de los k dígitos que
se omiten sea el de orden inferior (dígito de clave).
Sea el número d„ ... d ^cio. Supongamos que se omiten k dígitos.
Sean los dígitos no omitidos:
d;o, d;^, ..., d^^-k
donde 4 ^ i^ S... !n_k S n.
Sea r el dígito de menor orden entre los k omitidos. Los valores que puede tomar r
son 0, 1, ..., n - k+ 1.
a)
Errvr fuera de clave. E1 número que resulta de la omisión de orden k será:
^, . . . , ^,
d+n-k . . . d^ ^d^o
donde sabemos que d^o = d o, pues el error no afecta a la clave.
METODOS HIYECTI VOS
Teniendo en cuenta que J^(o) = 0, para todo i, la omisián será no detectable si y sólo
si:
^i'©(d,o + f ^ (d; ^) +
+ f,^ -k (d ;,^ _k )
_
^^o
= fo(dv) + f^(d ^) + ... + .Ír(dr) + .Ír+l(d.#1) + ... + fn(d„)
Ahora bien, como los dígitos situados a la derecha del dígito de menor orden entre
los omitidos no se ven afectados par el desplazamiento, tendremos que la omisión será
no detectable si y sólo si:
.f^(d^,) + ... + .Í^-k(d^n-k)
donde, r=
1, ..., n- k+
^^o
- f,(d;) + .. . + .Í^,(dn)
l.
Dados d,+l, dr+^, ..., d^ y fijadas las posiciones en las que se producir^án las omisiones, quedarán fijados:
fr+l(^r+l) + ... + fie^dh), y
fr(d ir) -^ . . . -^-' ,fn - k (d in -k ^
por lo que sólo existirá un único valor de fr(dr), tal que se verifique la anterior igualdad.
Los valores de f r(dr) distintos de éste llevarán consigo la detectabilidad de la omisión.
Por consiguiente, asociado a cada (n - r)-upla de valores d,+ ^, d r+2, ..., d„ y a I as
k- 1 posiciones de omisión elegidas entre las n - r posiciones de orden superior,
tendremos un caso de error no detectable. Por lo tanto, para las k- 1 posiciones
fijadas, habrá:
lo^-r
casos no detectables entre los lo"-r+l posibles, donde r es el dígito de menor orden
entre los k omitidos.
Sin embargo, no todas las omisiones producen error. Así, en el caso de omisión de
orden 1, si el dígito de orden superior es 0 y se omite, como ei n ^ mero compuesto por
los dígitos restantes sería completado con un 0 a la izquierda, la omisión no prod uciría
error.
En el caso de que el dígito de menor orden entre los k que se omiten sea el r-ésimo,
no se produciría error si éste y todos los que le preceden son 0.
ESTADiST1CA ESPA^OL.A
Entonces, tanto al número de casos no detectables como al número de los posibles
habrá que restar el número de los que, no siendo detectables, no constituyen error.
Al número de (n - r)-uplas le retaremos l(caso d„ _... = d, = 0) y, por tanto, el
número de amisiones que producen error no detectable será:
^
!ow-r ^ ^
^?e forma que la probabilidad de no detección será:
lo"-' -- 1
^^re-r+ 1
_ j
Como el razonamiento anterior es válido cualesquiera que sean d t,... , d r_ ^ y las
k- 1 posiciones de omisión que se esçoján entre las n - r posibles, resulta que
^on-r
^ow-r - ^
lon-r+l _ j^` 9 10^-r+^ - l
es la probabilidad de detección de error de omisión de orden k, cuando el dígito de
menor orden entre los omitidos es el r-ésimo, r= l, 2, ..., n- k.
b) Errvr a,f'ectando a clave. ^onsidereremos ahora la situación en la que el error de
omisión afecta a la clave.
Tendremos para el número correcto que:
mod ^ a
^o(do) + ^^(d ^)
f 2(d Z) +
+f„(dn) = 0
Si se omiten k dígitos, sean d;o, ..., d;,^_k los no omitidos, sabiendo que entre ellos se
encuentra da.
El n ^ mero incorrecto sería:
0 . . . 0 d;,^ -,^ . . . d; o
donde, d;o ocupa ahora la posición de clave (d;^, ^ do).
E1 error será no detectable si y sólo si:
^^a
fo (d;^ + . . . + fR -k(d;,, -k) =
o
91
MBTODOS ®1YECTI VQS
En virtud del Lema l, la variable aleatoria:
mod,o ^Í'o^d io} + .. . + .Í„ --k(^^" -k))
toma con equiprobabilidad los valores 0, 1, .. ., 9.
1
Por ello, se vecificará la igualdad anterior con probabilidad - .
•
10
El número total de omisiones cuando se fijan las k-- 1 posiciones de error distintas
de la posición de clave será el número de cifras que se puedan formar con n di,gitos [al
ser el {n + 1)-ésimo la clave, é ste vendrá exactamente determinado por los n anterioresj. Es decir, el número total de omisiones será 10".
EI número de omisiones que producen error será 10" - 1, pues hay que descontar el
caso en que los n+ 1 dígitos sean 4(*).
Veamos ahora cuál es el número de omisiones que producen error no detectable.
1
Por la utilización hecha del I..ema l, sabemos que 10 de los números correctos
serán tales que al producirse una omisión de orden k afectando a la clave, la ornisi^in
l
será detectable. Ahora bien, entre este 10 de casas está incluido aquel en el que todos
los dígitos del número correcto son D. Deduciendo este caso, tenemos que el número de
omisiones que producen error no detectable será:
1
10" -- 1 = 10" -1
10
Así ^pues, la prababilidad de detección será:
10"^ 1 -- 1
1
10" -- 1
10n-1
- 9
10" - 1
Como el razonamiento anterior es válido cualesquiera que sean las k- 1 posiciones
de omisión que se escojan entre las n posiciones, resulta que la anterior probabilidad
será la probabilidad de detección del error de omisión de orden ^{ cuando éste afecta a
la clave.
c) Error general. La probabilidad de que el dígito de menor orden entre los k
omitidos sea el r-simo será:
(*) Nótese que en este punto es imprescindible utilizar que el transformado del 0 es 0. Si no
fuese así no sabríamos si el número d, ._ ... = d"+ i= 0 es posible o no. Si la omisión no afectase
a la clave, aunque el transformado dei ^7 no fuese 4 seguirían valiendo los argumentos utilizados.
ESTADiSTlCA ESPA14ULA
92
= 0, l, ..., n- k+ 1
Por tanto, por el Teorema de la probabilidad tatal, tendremos:
,.-k+i
Pk
^
n - l
k- 1
n+1
k
r= 1
9
n-^- 1
• g • 10" ^r + ^ -- 1 +
-,^-^+i
^ n r
r= i
n
k- 1
lfi^^r
la"'r
k- ] ^(^" -r+ 1,_
n+1
k
lU^": ^
^ g • 10" - 1
+ j n ^ i^"^t
1
lk)
k = l, ..., n
como queríamos demostrar.
METODCI «ABC^
l,
Introduccián
La idea de buscar un nuevo método surgió de la siguente forma:
Está claro que el método del «7^, aunque su cálculo sea sencillo, no es un método
«bueno^ porque no asegura el cien por cien de detección en el ETS. De ahí, el interés
de los métodos biyectivos. Ahora bien, la búsqueda no acaba con asegurar la detección
del ETS, pues así como la probabilidad de detección del error de omisión viene
determinada por la biyectividad, no ocurre otro tanto con los bailes de dígitos^. E1
inconveniente principal de manejar dos columnas, como en el « 1-2», es que no detecta
en absoluto algunos bailes complejos ( con eje, baile doble, etc.}. E1 «1-3-7», al tener
tres columnas, sí que detecta éstos, pero a cambio de empeorar en la detección del
baile simple ( ver cuadro de probabilidades en la Tabla 1).
Llegados a este punto, la búsqueda se centra en un método biyectivo que maximice
la probabilidad de detección del error por baile simple. Para ello es necesario demostrar
el siguiente teorema.
lytETODOS BIYECT[ VOS
2.
93
Te^}re mu 3.
No existen aplicaciones biyectivas que detecten el EBS al cien por cien. ^
Antes de su demostracicín, interpretemos el signifcado de este teorema.
Sean las aplicaciones I y II que transforman los dígitos A y B, respectivamente, en:
Si se prod uce u n baile si mple e n u na c ifra A B dando 1 ugar a la c ifra B A y no se
detecta el error utilizando una clave en mod ^o es porque:
a+ b'' ^,o u' + b,
u- a' ^,o b- b'
Lo ideal seria encontrar dos transformaciones tales que d A y B dígitos decimales
distintos se verificase:
Q - q' , ^^o
b - 6'
es decir, transformaciones tales que los mod 1U de las diferencias entre los transformados
según una y otra columna no coincidan para cada dos dígitos decimales distintos. Sin
embargo, y lamentablemente, tales columnas no existen.
Demostración:
Fara ello, es suficiente comprobar que la resta, elemento a elemento, de dos col umnas
biyectivas es una columna no biyectiva. En efecto, sean las columnas N y X:
N
X
45
45
9^4
ESTAD^STICA ESPAI^OLA
donde, sin pérdida de generalidad, hemos supuesto que la columna N está en orden
natural. La suma de los elementos de ambas columnas es 45.
Por las propiedades de los módulos:
9
mod ^a ^ ( N; - X;} = mod,© mod,o
i=0
9
$
^ N; - mod ^o ^ X;
= mod,o (S - S) = 0
i=0
i=0
Por consiguiente, la columna obtenida por diferencia no puede ser biyectiva, porque,
si lo fuese, el mádulo 10 de la suma de sus elementos habría de ser S.
3.
Consecuencia
Como consecuencia del teorema 3 tenemos que, a efectos del baile simple, la mejor
situación posible para los métodos biyectivos es aquella en la que las columnas sean
tales que en toda columna obtenida por diferencia de dos de ellas sálo se repita un
único dígito. Obsérvese que es la mejor situación posible cuando se impone la condición
de que las columnas sean biyectivas, esto es, cuando se quiere maximizar la probabilidad de detección de errores de transcripción. De no imponer esta condición, podrían
encontrarse columnas que dieran el cien por cien de la detección del baile simple,
aunque a costa de reducir la detección del error de transcripción. Así, las columnas
N
X
3
4
S
7
9
0
b
4
son tales que detectan al cien por cien el baile simple (la columna diferencia es 0, 2, 4,
S, 8, l, 3, 5, 7, 9) pero la probabilidad de detectar el error de transcripción simple en la
columna X sería ahora 88 en lugar del cien por cien.
90
Veamos el caso del método « 1-2^. La columna obtenida por diferencia de columnas
« 1 ^ y «2» es:
9S
b[ETOD^OS BIYECTiYOS
«^^,
«2^^
0
0
l
2
2
3
^4
S
ó
7
8
9
4
b
8
1
3
S
7
9
mod,a («l^ _ «2^^
repetición única
En cambio, dos col^mnas cualquiera del método « 1-3-?^ generan más repeticiones
en la columna diferencia. Asi, por ejemplo:
«1^^
«3^
mod,o (« 1 ^ - «3^^
0
l
2
3
0
3
ó
9
0
8
6
4
2
5^
6
7
5
8
1
8
9
4
7
4
2
0
8
b
4
2
Al aparecer más repeticiones en la columna diferencia, el método « 1-3-7^ es inferiar
al t< 1-2» en la detección del baile simple.
EI objetivo aparece ahora clarar^^lente: encontrar una tercera columna biyectiva para
un ir a las « 1^ y«2» , tal que si se resta elemento a elemento de cualquiera de las « 1^ y
«2» se obten^a una repetición única. Si tal columna existe evitaremos las limitaciones
del « 1-^» para el baile con eje y baile doble y mejoraremos las probabilidades de
detección del « 1-3-7» respecto a1 baile simple, manteniéndose además las propiedades
de la biyectividad.
9^6
ESTADtSTICA ESPA1^10í^..A
Esta columna existe y junta a las otras dos da lugar a un nuevo método, el ABC que
se basa, por tanto, en la matriz de la transformacián siguiente (*):
4,
;
.ÍE^^
C
.ft^^
B
.ft^,
A
0
1
0
2
0
3
0
1
2
4
8
2
3
4
S
6
7
8
9
6
8
1
3
S
7
9
2
7
4
1
5
3
b
3
4
S
6
7
8
9
Cálc: ulo y cvrnproóuc irín de la clave
Dacio el número d„ ., . d^d 2 d , calculamos:
fz(d.,) + .. . + f^(d ;) + fc(d 2) + fe(d ^ )
donde: Z=
A si n = 3k
B si n = 3k + l
C si n = 3k + 2
k = 0, t, 2...
El complemento hasta el múltiplo de l0 inmediato superior, esto es,
d^ = 10 - mod,^, ^,f'z(d„} + ... + f^(d;) + fc(dz) + fe(d,)]
serú la clave y se añadirá al número original. E1 n ^ mero con la clave incorporada sec-á,
por tanta:
d^du
{*) Esta tercera columna, que en la matriz que sigue aparece en posición B, no es, desde luego,
única. Aisí, otra columna B posible serfa: 0, 3, b, 9, 2, 8, 1, 4, 7, S. De hecho, esta última es la que
se utiliza en nuestro trabajo citado. Es importante observar, a este respecto, que las pmbabilidades
de detección no dependen de las columnas concretas que se utilicen, sino de sus propiedades
{biyectividad y repetición única en las columnas obtenidas por diferencia). Por ello, tanto si se
utiliza la columna B que aparece en la matriz como si se utiliza la otra citada, las propiedades
generales de ^ietección serán las mismas; aparecienco únicamente discrepancias si se le imponen a
los n^ meros controles de recorrido. Por otro lado, y como es evidente, tampoco es única la
columna C.
IItETODUS BIYECTI VOS
Si se recibe el número d,^ ... d z d,do, para comprobar su clave se calcula:
fi(d„) +... + f^(d3) + fc(d2) + fe(d,) + f^(do)
donde Z tiene el mismo significado que antes.
Si esta suma no es múltiplo de 10 se detecta presencia de error, y en caso contrario
no se detecta.
Ejemplo: Consideremos el número 37.842. Su clave será:
do = 10 -- mod,o (f c(3) + fB(?) + f^{8) + fc(4) + fe(2)) =
= l0 -- mod,o (6 + S+ 8+ 8+ 8) = 5
Por tanto, el número completado con su clave será: 378.425.
Si por un error de transcripción recibiésemos el número 378(S)2(8), veamos que se
detectaría el error. En efecto:
fc(3) + f8(7) + f^(8) + f c(5) + f^(2) + f^(8) _
= 6+ S+ 8+ 1+ 8 + 8= 36 ^ 0 mod , o
S.
Aplicaciore^es
El método ABC ha sido ya utilizado por el Instituto Nacional de Estadistica en el
Diccionario Geográfico de 1980 para los códigos de provincia-municipio y, a causa de
ello, en el Censo de Edificios de 1980 y en el Censo de Población y Viviendas de 1981.
También, y para varios códigos, en el Censo Agrario de 1982.
DESCRIPCION DE LAS TABLAS
Tabla 1.
l.°
Su contenido es el siguiente:
Fórmulas generales para la probabilidad de detectar los errores de transcrip-
ción y de omisión de un orden arbitrario ^, correspondientes a los métodos biyectivos
(« 1-2», «1-3-7» y«ABC»), siendo n la longitud o tamaño del número original dn ... d,,
esto es, sin contar la clave.
2.°
Probabilidades de detección ( en tanto por ciento) del baile sirnple, baile con eje
y baile doble, correspondientes a los métodos biyectivos (« 1-2», « 1-3-7» y«ABC»};
probabilidades que no dependen del tamaño del número.
3.°
Fórmulas generales para la prababilidad de detectar el error de iranscripción
F.^tTADl3iT^CA B^PA1^iO!LA
simple y los errores por baile, correspondientes al m^todo «?^; no habiéndose encontrado una expresión general para el error de omisión.
Tablr^ 2.
Contiene las prababilidades de detección (en tanto por ciento) calcula^cias
para los diferentes errores y métodos en dos casos particulares del tamaño del número
(sin coniar la clave): ^e = S y n= l2.
Cuando ia probabilidad depende del tamaño, la casilla correspondiente se ha dividido en dos iriángulos: el triángulo superior contiene el valor de la probabilidard para n
= S, y el inferior, el valor para n= 12.
METODOS BIYECTtvOS
.^^^
^ ^
^
^
.
^..
+
o
^ --,
^
+
8
N
M
^.
...
^
^
-I
^. ^^
_
I
^
^^
^^^
^
+
^
^
.-.
^
^` ^ :
^ ^
^ -, ^
,=
,,,._..^ ,.., :^
^ ^ ^,
-~
-^
^, + ^
^ ^
♦
^
^.___•^
^^
^^
z
o
....
^
-^
o
^
r------^
.^
^ .at
^--^^
00
00
^
^
o
N
(
^
^
^
^
w
.^ ^ ^
.-^
^
^
^
OC
Q^
+
a^
á.
E
^
=
^
^
` ..
,.. ( ^,
^
o0
^
^
f---^,,
r
^f ^ v^
... .^,
C
.p_
. ^,
j
^
^ I ^
+
`^
_ '
I
•^
u
--
^
E,,,,
~ +
^
,_„
U
•.^
II
i^
a.^
a^
á
^
^
^
^
U
[^.
N
^
K1
^
^
Y
^
Y
o
^
^,^,
^
^
^
Q
ESTADlSTtCA ESPAI^OLA
C
r
...
r
p
^.^
,,.'
í
1^
V
.^ ^
^
^
^
1^
...,
^
O
^
^
^
^..r
.
•y ^
E
^ ^
^
Op
.
00
Q^
h
,^G ^ ^Á
V
f+"f
^
^
^
8
v c ^
^
^
O
^
^
,u
^
•
w
O
^
^
^
^
^
^
^
^.
^
V^
A
^
V
`
^
^ V
. .^^ ^
^
^
©
^
^
^
^
N
^
4
^
. ^ ^,
^ .E
^
o^q
E--^
-
v^^
$^
ñ
r^
o^
^
'
°o^
r
t^
o^,
^
a^
W
A
^O
^
u ó_
^
^
C^
^
^•
^
N
^
00
0^0
C
^
C10
.r
C
u ^s
-v
°'
^ • C^
^
.
oá
áó..
r^..
^
^ ^ -ov
..
c
^, ^o
-v ^ a+
^. • ` a
^
W
tT
00
^
ao
^
^
ó
H
`r ^^
f/^
~
^M
W
i"^i
^
^
^
ó
^
-^
,°Ñ
.r ^
^^`
.r ^
^^u .^
^^ ^
^
^ Y
^
^
o
^
^a^ ^
^
áV
«r A4 .
^
IIr[ETO^DtJS BIYECT1VdS
l01
SUMMARY
This paper considers the problem of incorporaiing a contro^ digit into a numerical
code in order to detect errors in the transcription or tramissian of the code in question.
Method «7» and those based on an the biyective transformations « 1-2^ ^ and « 1-3-7^, are
described. The general properties of the biyective methods are considered and a new
biyective cnethod introduced: the «ABC^ ^ m+ethod, whose detecting probabilities for the
mast usual errors are greater than, or at least as great as, the previous methods.
Key words: control digit, method «7» , method « 1-2^ , method « 1-3-7», method
«ABC^•, biyective transformations, transcniption error, simple transposition error, axis
transpasition error, double transposition error, error of omission.
A.M.S., 1970. Subject classification: 68A10.
Descargar