ESTADlSTlCA ESPAÑOLA Núm. 94, 1982, págs. 67 a 101 Métodos biyectivos de detecció n de errores : ventaj as del metodo ABC ( *) por EMILIANO GAROIA RUBIO, PEDRO RODRIGUEZ-PONGA SALAM/^ ^NCA, I LD EFONSO VI LLAN CRIADO Instituto Nacional de Estadfstica RESUMEN En este traba^jo se considera el problema de incorporar un dígito de contral a un código numérico con la finalidad de detectar errores en la transcripción o transmisián de dicho código. Se describe el método «7» y los basados en las transformaciones biyectivas « 1-2» y« 1-3-?» . Se estud ian las propiedades generales de los métodos biyectivos y se introduce un nuevo método biyectivo: el método ^ A^BC» , cuyas probabilidades de detección son mayores, o cuanda menos iguales, para los errores más usuales, que las de los métodos anteriores. Palabras clave: Digito de control, método «7», método « 1-2», método « 1-3-?^, mttodo «ABC», transformaciones biyectivas, error de transcripción, error por baile simpie, error por baite con eje, error por ^baiie doble, error r^or omisión. INTRODUCCION Con la generalización del tratamiento automático de los datos se han podido observar los siguientes fenámenos: (*) Este articulo constituye un resumen de un trabajo más amptio cuyo título es: Detección de errores mediante un dígito de controt. Estudio comparativo del ABC con otros rnétodos que ha sido realizado en ta Sección de Metodologia lnformática del I. N. E. Los autores agradecen las facilidades recibidas y la autorización para publicar los resuitados. ESTADISTICA ESPAÑOLA . 2. El enorme incremento del volumen de datus transmitidos y manejados. EI aurnento en la velociddd del tratamientc^ de los dat^^s, 3. El proceso de abstracción de los datos, yue en muchos casos pierden su significado inmediato al codificarse en informaciones numéricas. En el tratamiento de los datos intervienen medios mecánicos y humanos, siendo estos últimos los responsables de la mayor parte de los errores. Además, al haber perdido la informaciQn su significado inmediato, resulta más dificil la detección de los errores por parte del hc^mbre; así, por ejemplo, si para loa identificadores de provincia-municipio se tiene OSOq7, que corresponde a la Horcajada {Avila), en caso de deslizarse un error durante la codifwcación o tr~ansmisión y aparecer 05047 (Candeleda, Avila) no se advertiría fácilrnente. Por ello, parece necesario, por lo menos para algunas informaciones, introducir un mecanismo autodetectar de errores. Este mecanismo debe ser simple y tener la mayor capacidad de detección posible. Los ordenadores digitales, que trabajan en binario, ya incorporan estos mecanismos que van desde et muy sencillo control de paridad, hasta otros más sofisticados que permiten no sóÍo detectar, sino también corregir los errores. Para códigos decimales se utilizan también mecanismos de autodetección, consistentes en añadir una clave o dígito de control relucívnudo con el ciutv, de forma que si se ha producido un error, esa relación desaparezca. En lo que sigue se describir•án tres métodos de autodetección, basados en el dígito de control y tras un análisis de sus propiedades se expondrá un nuevo método que intenta, bajo unas hipótesis bastante razonables, ser óptimo en cuanto a la capacidad de detección de errores. HIPOTESIS SUB`^ACENTES Ante todo, una cuestión terminalógica previa. Consideramos, en general, un número cariginal de tamaño n que representamos por: ^n^n - 1 . . . , Ú1 AI incorporarle la clave o dígito de control, que representamos pur c^^,, se obtendrá el n ^ mero completo de tdmaño n+ l: ^n^n - t + . . . , CÍ ^CI'u METODOS BiYECTIVOS Las hipcítesis que se utilizan para el cálculo de las probabilidades que tiene un método para detectar los diferentes errores san las siguientes: 1. tfipcitesrs de equiprobahílidad de l^^s d; (i = 1, 2, ..., n). El dígito i-ésimo del número sin clave puede tomar cada uno de los 10 valores comprendidos entre 0 y 9 con probabilidad 1/ I0, 2. Hip©tesis de independencia de los d;(i = 1, ..., n). Las variables aleatorias a^ 1, ..., d„ son independientes. 3. Hipc^tesis de eqctiprohuhilidad de las posiciones de error. Si un determinado error ha de afectar a K posiciones del número con o sin clave incluida, se supone que todas las combinaciones de las n+ I o, en su caso, de las n posiciones tomadas de K en K son equiprobables. 4. Nipótesis de equlprobahilidad de los números erróneos. Por cada tipo de error, se supone que todos los números erráneos que se pueden obtener a partir del correcto son equiprobables. Asi, por ejemplo, en el error de transcripcián, se supone, que si el dígito correcto es d^, ei incorrecto podrá ser cualquier dígito comprendido entre 0 y^ que sea distinto de d1, tomando cada uno de 1 éstos con probabilidad ERRORES CONSIDERADOS Los errores que se han tratada en el estudio siguiente de cara a encontrar métodos para su deiección y calcular las probabilidades de detección son: 1. ERRORES DE TRANSCRIPCION a) Error de transcripcián simple ( o de orden 1; E. T. S.). Se produce cuando un dígito cualquiera se cambia por cualquier otro dígito decimal. Ejemplo: se quiere escribir 387422 y se escribre 3(7)7422. b) Error de transcipción de orden k. Se produce cuando se dan simultáneamente k errores de transcripción simple. ESTADISTtCl1 ESPAt^IOLA 7'a Ejemplo de error de transcripción de orden 3: se quiere escribir 3137422 y se escribe 3( 7)7( 2)(1) 2. 2. ERRO^ RES POR BAILES a) Error por baile sitnple tE. B. S.). Se produce cuando dos digitos consecutivos se cambian entre si. No hay tal baile cuando los das digitos son iguales. Ejemplo: se quiere escribir 387422 y se escribe 3(78)422. ó) Errar por bail^ doble. Se produce cuando dos grupos de dos dígitos consecutivos se cambian entre si. Consideraremos que no hay baile si ambos grupos son iguales; pero trataremos como baile doble el caso en el cual un digito se repite en igual posición en ambos grupos. Ejemplos: s+e quiere escribir 387422 y se escribe 3(42}(87)2. Se quiere escribir 374241 ^^ se escribe 3^24)(74)1. ( Este caso podría considerarse como un baile simpte con eje.) c) Error por baile con eje. Se produce cuando dos dígitos separados por otro (que recibe el nombre de eje) se carnbian entre st. Ejemplo: se quiere escribir 378422 y se escribe 3(4^7)22. 3. ERRORES POR OMISION a} Error por omisión simple (E. O. S.}. Se produce cuando al escribir un número se omite uno de sus digitos; en este caso, el campo en el que se escribe el número tiene mayor tamaño que el número y^ste se completa añadiéndole un cero a la izquierda. Ejemplo: se quiere escribir 378422 y se omite el 8, resultando 037422. 6) Error por omisión de orden k. Ocurre cuando se dan k omisiones simples. Las digitos restantes se desplazan hacia la derecha y el número se completa con ceros a la izquier+da. METOD4S B[YECTtVOS Ejemplo: se quiere escribir 12345ó y se omiten 1, 3, 5, y b, resultando U00024. 4. Se podrían considerar otros errores más complejos, pero seguramente menos frecuentes. De hecho, entre los anteriores, parece lógico yue nu todos sean igualmente probables, Por ejemplo, el baile simple ocurre con más frecuencia que el baile doble y el error de transcirpcit^n simple es más corriente que el que afecta a varios dígitos. En general, Ios errores más simples son más frecuentes y, por tanto, es más importante su detección. DESCRIPCION DE L+C.^S METODUS En este trabajo, vamos a considerar dos tipos de métodos que utilizan un único dígito de control: El método «7», un método clásico basado en la división por 7. - Los métodos biyectivos, yue consideran transformaciones biyeciivas de los dígitos. Dentr© de este grupo, estudiaremos los métodos « 1-2», « 1-3-7» y el nuevo rnétodo «ABC». Veamos ahora una breve descripción de cada uno de estos métodos. 1. Método del ^ 7^^ a) Descripc ión Para obtener el dígito de control, según este método, se halla el resto de la división por 7, es decir, el módulo 7 del número. Así sea el número 725^1: 725^31 = 7 x 103ó8 + S E1 digito de control es 5 y se añade a la derecha del número original, resultando el número completo, 725815. b) Comprvbac•ivn de r^n núm^rc^ Supongamos que se ha recibido el número 725715. Para comprobar si tiene algún error, se calcula el resto de dividir por 7 el número sin la clave: 72571 = 7 x 103ó7 + + 2, y se compara el resto obtenido con la clave. Cuando éstos sean distintos, corno en este caso ( 2 ^ 5), se detecta la presencia de un error. En el caso de que fuesen iguales, ESTADISTfCA ESPAÑOLA 72 na se detectaría la presencia de error, lo cual no siempre quiere decir que no exista; así, por ejemplo, si en el número 725712 se comete un error de transcripción y se escribe 725782, este error no se detecta con este método. La Tabla 2 contiene los porcenta^jes de detección de este método para distintos tipos de error (los cálculos pueden encontrarse en el Capítulo II de nuestro citado trab^jo). 2. Método «1-2^^ ( Utilizado por la UIC, Unión Internationale de Chemins de fer}. a) I^escripeic.in Se multiplican los digitos de rango par (desde la derecha) por 1 y los de rango impar por 2. Para cada producto, se suman los dígitos que resultan de la operación. La clave será la cifra que es necesario añadir a la suma total para obtener un múltiplo de 10. Así, sea el número 72.581: Númera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dígitos de rango par, por 1 . . .. . . . .. . .. . Dígitos de rango impar, por 2........... Suma de las cifras resultantes . . . . . . . . . . . Clave .................................. Suma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2 2 l4 S 1Q 8 8 1 2 1 + 4 + 2 + l + 0 + 8 + 2 = 18 2 , 20 (múltiplo de 10} EI número con la clave es 725812 .^) Comprobaeión de un núrnero Sea e^ número A25812. Para la comprobacián se realiza la transformación siguiente: Número (con clave) ... . .. .. . ... . ... . .. . 4 2 5 8 1 2 10 2 Digitos de rango par, por 2 . . . . . . . . . . . . . 8 2 8 2 Dfgitos de rango impar, por 1....... ... . Suma de las cifras resultantes ......... 8+ 2+ 1+ 0+ 8+ 2+ 2= 23, q ue no es múltiplo de 10, y, por tanto, el número se considera erróneo. La Tabla 2 contiene los porcent^jes de detección de este método para distintos tipos de error (los cálculos pueden encontrarse en el Capitulo IV de nuestro citado trabajo). 73 l1tETODOS BtYE+CTt VUS 3. Método ^ 1-3-7y ( estudiado por el 1NSEE y el Banco de Francia) a) Descripción Ahora se distinguen tres posiciones de los dígitos, realizando para cada posición una transformación distinta. Así, sea el número 75281: Número ............................... Dígitos de rango 3i + 1, por 3......... Dígitos de rango 3i + 2, por 7........ . 7 5 2 8 1 6 3 49 Só S Dígitos de rango 3i + 3, por 1 , . . . . . . . . Suma cifra de las unidades ...... ... .. Clave .................................. 9+ 6+ 5+ 6+ 3= 29 1 Suma ( múltiplo de lo) .. .. . ... . .. .. ... 30 EI número con la clave incorporada es 725811. b) Comprobación de un número Sea el Número 725.831. Para la comprobación se realiza la transformción siguiente: Número (con clave) Dígitos de rango 3i Dígitos de rango 3i Dígitos de rango 3i .. . . + 1, + 2, + 3, .. . .. . .. .. . .. . ... . por 1......... por 3.... ... .. por 7.... .. ... Suma de las cifras de las unidades .... 7 2 S 5 8 1 1 b 49 3 9 Sb 9+ 6+ 5+ 6+ 9+ 1 = 36, que no es múltiplo de 10, y, por tanto, el número se considera incorrecto. La Tabla 2 contiene los porcenta^jes de detección de este método para distintos tipos de error {los cálculos pueden encontrarse en el Capítulo V de nuestro citado trabajo}. 4. Método KABC^^ (ideado y estudiado por los autores de este trab^ja en el Instituto Nacional de Estadística. Madrid) a) Descripción Se distinguen tres posiciones en los dígitos A, B y C, realizando en cada posición la transformación que resulta de la siguiente matriz: 74 ESTADiSTECA ESPA^oLA d C B A 0 1 2 3 4 S 6 0 2 4 6 8 I 3 5 7 9 0 3 8 2 7 4 I S 9 6 0 1 2 3 4 7 8 9 5 6 7 8 9 Así, sea el número 72581 N úmero Posición Posición Posíción ........................................ 3i + 1, columna 8 . . . . . . . . . . . . . . . . . . . . . 3i + 2, columna C . . . . . . . . . . . . . . . . . . . . . 3i + 3, columna A .................... 7 2 8 S 8 l 3 S 7 S Suma de las cifras resultantes . .. . . ... . .. . ... . . Clave .... ...................................... S + 8 + S + 7 + 3 = 28 2 Suma {múltiplo de 10) .. . .. . . ... . .... ... . ... . . 30 +l número con la clave incorporada es 725812 b) Comprvb^cic^n de r^n númern Sea e! número 125814. Para la comprobacíón se realiza la transformación siguiente: Número (con clave) .. .. .. . ... ... . .... .. Dígitos de rango 3i + 1, columna A.... Dígitos de rango 3i + 2, columna B.... Dígítos de rango 3í + 3, columna C.. .. 1 2 S 8 1 S 8 2 4 4 3 7 Suma de las cifras resultantes . . . . . . . . . 2+ 8+ S+ 7+ 3+ 4= 29,queno es múltiplo de 10, y, por tanto, el número se considera incorrecto. L,a Tabla 2 contiene los porcentajes de detección de este método para distintos tipos de errores (los cálculos pueden encontrarse en el Capitulo ^tI de nuestro citado tra.bajo). ^TOnos s[v^rr[vos 75 CARACT'ERISTICAS DE ESTOS METt?DOS Los rnétodos expuestos están basados en diferentes algoritmos y no buscan otra cosa que hacer una partición del conjunto de núrneros. Los elernentos de cada clase tienen una misma clave (ello los identifica) y no son distinguibles entre sí . Así, por ejemplo, el número 72581 tiene S como resto de la división por 7. Con la clave incorporada se convierte en 725815. Si en vez de ese número apareciera el 7251 15 no se detectaria el error, ya que 72S t 1 tiene también S como resto de la división por 7, y, por lo tanto, pertenece a la misma clase. EI algoritmo ha de ser tal que los diferentes errores hagan cambiar la clase al número y se detecte el error. Por ello, con un mayor número de clases mejora la detección. Si la clave es de un solo dígito decimal, sólo se p^teden distinguir diez clases (*). El método 7, sin embargo, no las aprovecha todas; solamente utiliza de 0 a 6 como resto en módulo ? y no existen las claves 7, 8 y 9. A pesar de ello, es el mejor método basado en la divisibilidad por un número de un solo dígito. Nuestro objetivo es la búsqueda del método óptimo. Esta búsqueda se concentra entre los métodos de un solo dígito decimal, puesto que se quieren evitar las dificultades que pueden introducirse al utilizar métodos más complejos. Las caracteristicas a exigir a un método para considerarlo como «bueno^, son básicamente: La sencillez de cálculo. Esto otorgaba especial interés a algunos métodos como, por ejemplo, al método de 7; pero con el proceso automático de cálculo y cornprobación de clave, esta propiedad pierde importancia. La capacidad de detección. La capacidad de un método de detección para detectar los diferentes errores constituye, en realidad, su caracteristica fundamental. En este punto, nos hemos encontrado con el problema de la no disponibilidad de un estudio empírico sobre las frecuencias de los distintos tipos de errores (habiendo, por otra parte, constatado la dificultad de llevarlos a cabo). La importancia de tal estudio sería doble: por una parte, permitiña graduar los errores, situando a cada tipo de error en su verdadera dimensión; y, por otra parte, permitiría ponderar la probabilidad de detección de cada tipo de error por su frecuencia, par•a obtener un indice de detección media para cada uno de los diferentes métodos. (*) Una posible rnejora consistirá en utilizar varios dígitos de control, caracteres alfab^ticos, etc..., pero tiene el inconveniente de complicar el sistema, de forma que haría más costoso el proceso e incluso podrfa introducir errores adicionales. 7á ESTAI3l3TICA ESPAÑ^L.A En consecuencia, se procederá a ordenar o jerarquizar los tipos de errores en funcián de su importancia «aparente^, tratando de lograr una optimización jerarquizada en las capacidades de detección. Este método no es tan restrictivo como quizd pudiera pensarse, al menos por cuanto respecta a un óptimo o cuasi-óptimo relativo (ésto es, en compara^cián con los métodos del «7^, «l-2» y«1-3-7^), por cuanto que, corno se ver^, tas probabitidades de detección del método «ABC» son mayores (o, cuando menos, iguales) que las de los otros métodos en estudio, para todos y cada uno de !os errores considerados en este trab^jo. Para acercarnos a nuestro objetivo, veamos nuevamente los métodos descritos, pero . utilizando un len,gua^je míits formalizado y apto para el estudio de sus propiedades generales. DESCRIPCION DE LOS 11^ETODOS DE DETECCION DE ERRORES COMO METODOS BASADOS EN TRANSFORMA+^IONES Cuando se describieron anteriormente los métodos «7^, « 1-2», K 1-3-^^, se hizo can algoritmos simples {división por 7, multiplicar las cifras según su posición, etc,). Un enfoque diferente consiste en plantear dichos métodos como resultado de transformaciones de los digitos según sus posiciones en el número. Aparece, entonces, como diferenc^ia básiea el que los métodos « 1-2^^ y« 1-3-7^^ son biyectivos, mientras que el «7^^ no lo es. A) Métodos basados en transformaciones biyectivas Estos métodos utilizan, en el proceso de añadir la clave al número original (que ^ representaremos por d,,, ... , d ^), y en la asociada detección de errores, unas aplicaciones de transformación, f, i= l, ..., n, definidas en el subconjunto de los números naturales {4, I, 2, 3, 4, S, 6, 7, 8, 9} sobre el mismo, que tienen la propiedad de ser biyectivas y de satisfacer la condición f^(o) = 0 para todo i, La clave, que representaremos por do, se obtiene de la siguiente forma: d• ^ ^^ - ^^o ^Í^{d n) + .fM- ^{d R- ^) + . .. + f, {d , )] y, por tanto, se cumple: f^(d„) + .,^,^-^(d^-i) + ... + f,(d,) + d^, = 4 mod,o {*) (*) Si representamos por fo 1a aplicación identidad, podemos expr^esar esta condición en !a ^ forma mod,o ^ f^^d^) =0 ^f ^^ METODOS BIYECT[ VCiS E1 tratamiento para detectar errores cuando se recibe ei número cl,^ ... ci,do será obtener la suma de los transformados de los dígitos y si f R(dn) +... + f, (d ,)+ d^ no es rnúltiplo de 10 se detecta la presencia de error y si es múltiplo de 10 no se detecta. B^;jo e sta nue va óptica, los métodos « 1-2» y« 1-3-7» pueden desc ribirse como sigue : 1. Métvdo « 1-2a a) Cálculo de clave Dado el número d„ ... d2d,, su clave se calcula de la siguiente forma: dQ = 10 - mod,u {f',(d,) + f2(d2) + ... + fM{d,^}), donde: fci^(d;) = d,, si i= 2I{, K- 0, 1, ... J 1\d;l = f(2^(d;) = mod,o ( suma de las cifras de 2 x d1), si i= 2 K+ b) 1 C^mprobac^ón de c•lave Se calcula: f{a}(d„) + ... + f^^^(d 2) + .f<2^(d ,) + .f^^,^(do), donde: 1, si n = 2k a = 2, si n= 2k + 1 Si esta suma es múltiplo de 10 no se detecta presencia de error; y, si no lo es, sí se detecta. 2. Métc^dv' K 1-.^-7^ a) Cálculo de clave Dado el número dn .. . d 2d ^, su clave se calcuía de la siguente forma: d = 10 - modlo ^^(d,) + f2(d2) + ... + .Ín(dn)} donde: fc^>(d;) = d„ si i - 3k, k - 0, l, .. f,(d r) = ft3)(d;) = mod,^, ( 3d;), si i= 3k + 1 fc^)(d;) = mod,^ ( 7d;), si i= 3k + 2 ESTADISTICA ESPA1qOt.A b) C«mpr^^hucitin de c1U^•e Se calc ula: .^^a,^d,^) + ... + f^^^(á2) + .f•c3>(d ^) + fc>>^do) donde: , si n = 3k a=^ 3, si n= 3k + 1 7, si n= 3k + 2 Si esta suma es múltiplo de 10 na se detecta presencia de error, y si no lo es, si se detecta. B) Método de! «7^ (consic^erado como un conjunto de transformaciones) Como en los casos anteriores, el método del «7^ ^ puede considerarse como el resultado de transformar, mediante las apropiadas aplicaciones, los dígitos del número; siendo la clave ia suma, en módulo 7, de los transformados. Así como en el método ^ 1-2^ se manejaban dos transformaciones y tres en el « 1-3-7», en el método del «7^ se manejan seis transformaciones, que se aplican de modo ciclico y empezando por el dígito de menor orden. Las seis transformaciones aparecen en la Tabla 0. En ella, se puede observar su falta de biyectividad, que se manifiesta en que, para todas ellas, los iransformados del o, 1 y 2 coinciden, respectivamente, con los del 7, 8 y 9. Tabla 0 d^ fb f^ f^ ^^ ^3 ^, 0 1 2 3 4 5 ó 0 5 3 1 b 4 2 a 4 1 5 2 6 3 0 ó 5 4 3 2 1 0 2 4 6 1 4 1 2 3 S 0 3 6 2 S 1 4 3 4 S ó ^ o a o 0 0 0 8 9 S 4 1 6 S 2 4 3 6 1 2 3 1^rtBTODOS OIYECT[vo^S donde: 79 fb(d^) = mod, (Sd,;); .f^s(d^) = mod,(4d^); f4(df) = mod, (6d.;); f3(d.;) = mod, (2d;); f2(d^) = mod,(3c^;): f,(d^) = mod, (d;); Dado el número d„d,^_ ^... d,, la clave, d^, se obtiene asi: do = mod, (f ^ (d , ) + f2 (d 2) + . . . + f,^ (d,^)) donde fak+; = f;, para k= 0, 1, 2, 3, .. ., i= C) 1, 2, 3, 4, 5, 6. Optimización jerarquizada Como se dijo anteriormente, es necesario jerarquizar los errores que aparecen en el proceso de datos, para poder decidir si un método es mejor que otro. A estos efectos, los errores simples son más importantes (frecuentes) que los más complejos, y puesto que ningún método de un solo digito puede detectar al cien por cien los tres errores simples (ETS, EBS y EOS), éstos han de ser, a su vez, ordenados para poder decidir. La principal venta^ja de los métodos biyectivos radica en que son los únicos que detectan al cien por cien el ETS; por lo que siendo éste el error principaí (hipótesis razonable y fácil de aceptar), se buscará el óptimo dentro de la clase de los biyecti vos. Todos los métodos biyectivos no sólo tienen la misma probabilidad { P^ = 1) de detectar el error de transcripeión simple, sino que también detectan con iguales probabilidades los errores de transcripción de orden superior (Pk = 1- 1 Pk_ ^). For tanto, 9 podemos decir que los métodos biyectivos maximizan la probabilidad de detección del error de transcripción de orden K z 1 con la restricción de detección total en eí error de transcripción de orden 1. Asimismo, una vez fijada la condición de biyectividad, quedan totalmente determinadas las probabilidades de deteccián del error por omisión de cualquier orden. Por tanto, los métodos biyectivos también maximizan estas probabilidades de detección con la sujeción a lá anterior restricción. Dentro de los métodos que maximizan la detección deí error de transcripción simple (métodos biyectivos) podemos buscar métodos que maximicen la detección del error por baiie simple. Asi, los métodos « 1_2» y«ABC» tienen probabilidad de detección máxima para el baile simple ( máximo candicionado por la biyectividad). No asi el « 1-3-7» que, siencio biyectivo, no maximiza la detección del error por baile si mple. Ahora podemos tratar de maximizar la probabilidad de detección del baile doble con las restricciones (por orden jerárquico) de maximizar la detección del error de trans- í30 ESTADISTiCA ESPAI^^L.A cripcidn simple y la del baile slmple. Así, aparece el método «ABC^, que consigue al^anzar el máximo. Po^demos, pues, presentar los cuatro métodos estudiadas: «7^, « l-2^+, « 1-3-^^+ y «ABC^ mediante el siguiente diagrama: «ABC^ « 1-2^ « 1-3-7» «7» Con^junta de métodos biyectivos y que maxirnizan ta detección del baile simple, que maximizan la detección del baile doble. Conjunto de métodos para el cálculo de un dígito de control. Conjunto de métodos biyectivos que maximizaa la detección del baile simple. Conjunto de métodos para el cálculo de un dégito de control que haceñ máxima la detección del error de transcripción simple {métodos biyectivas). METODOS BASADOS EN APLICACIONES BIYECTI VAS: CALC ULO DE LAS PROBABILIDADES DE DETECCION (TEOREMAS GENERALES) Se demuestran aquí unas teoremas, especialrnente diseñadas par las autores, que permiten estable^er las probabilidades de detección de algunos errores;` probabilidades que son generales a todos los métodos biyectivos. !^^ETODOS B[YECTI VOS 1. 8l Errar de transcripc•ic^n d^ ord^n k Tevre^na 1 «Si Pk representa la probabilidad de detección del error de transcripción de orden K se tiene^: Pk = 1- 1 9 Pk_i, K= 2, .,. , n + 1 P, = 1 Para la demostración (*) del teorema utilizaremos las cuatro proposiciones siguientes. Prvposlción 1 «P, = t, es decir, la probabilidad de detección del error de transcripción simple {error de orden 1) es l. ^ Demostración: Supongamos que un determinado dígito ^en posicián i-ésima, que llamarernos d;, se sustituye por otro dígito, que llamaremos d;`. Sea X = mod,o ^ f^^d.) J el módulo 10 de la suma de los transformados de los ^ ^^ dígitos en los que no se ha cometido error, El mod,o de la suma de los transformados del número correcto será: mod,o (X + f;(d;)) Ahora bien, al ser la transformación f; biyectiva, por ser d; ^ d; será f;(d;) ^ f(d;'). Por tanto: 0 "'°d= = X + f; {d ^ ) ^^ X + f.(d' ) ^^ ^ 0 Por consiguiente, el error de transcripción simple se detecta siempre. Es decir, el porcentaje de detección es el cien por cien. (*) La demostración constructiva que se da a continuación es la que condujo al enunciado del teorema; pero, una vez demostrado y comprobada la sencillez de su enunciado, se encont^ una demostracián directa. Sin embargo, y sin perjuicio de que al final de la demostración constructiva se ofrece la directa, se ha creído de interés facilitar aquélla, por cuanto que permite conocer con más detalle el problema, porque, quizá su técnica puede utilizarse para demostrar otras propiedades relevantes y porque algunas de las proposiciones que se utilizan tienen interés por sí mismas. 82 ESTAD[ST^1CA E,SPA140LA Prc^posición 2 «Cualesquiera dos números que provengan de un mismo número correcto (con o sin clave incorporada) y que constituyan, respecto a éste, error de transcripcicín no detectable de orden K^ 2, se diferencian entre sí al menos en dos dígitos.» Demostración: Pong,^monos en el caso más desfavorable, que es aquél en el que ambos números incorrectos provienen de cometer errores de transcripción en las mismas K posiciones r ^, r Z, ..,. tk. Sean d;,, d;=, ... , d;k los dígitos correctos que han sido transcritos por: d;',, d,^2, ..., dik en un caso, y por: d^;, d;;, ..., d;k en el otro caso. Por ser ambos errores no detectables tendremos: J``^r ^( C^f J ^ ...-^-;,^ik-1(dik-1^ _ n^°'d,o ^i'^r;^ -F- ... -^- + ✓ ik^dik^^^o Jik-!{drk-1) _ + `^ikC+^fkÍ Si fuese posible que sálo se diferenciasen en un dígito, por ejemplo, el ^k-ésimo, tendríamos, en virtud de lo anterior: ,%!ik{d;k^ _ .f;k^^;k^ lo que a su vez irnplicaría, pues f;^ es biyectiva, que d'k - ^ik q ue contradice la hipótesis _ d;k ^ d^k . Proposición 3 «E1 número de errores no detectabies de orden k^ 2, en cualesquiera k posiciones fjadas, es igual al número de errores detectables de orden k- 1, en cualesquiera k- 1 posiciones fijadas elegidas entre las anteriores k posiciones.» Demostración: Consideremos fijas k posiciones de entre las n de que consta el número. Sean 83 METOL1tJ6 B[YECTI Vos i,, i 2, .. . , i,t tales posiciones fíjadas. Sean d^,, .. ., d'rk los dígitos correctos en estas posiciones y d;,, ..., d;,^ los incorrectos. Por ser el error no detectable, tendremos: .f^^(d^,) + ... + f;k(d;k)m°'d,^ ^ fr',^^r;') + ... + f;k(d;k) Fijemos ahora k- 1 de entre las k posiciones de error anteriormente fijadas; por ejemplo, i,, ..., ^k_^. Se verifcará que: f^,{d^,) + ... + f;k- i(d^k- i) ^^° ^ -^^,(d^ ) + ... + f^ _ ^{d;k, ^ k ya que si se diese la igualdad, como f;k(d;,^) ^ f^^(d^k} {por ser d;k ^ d;k), tendriamos: f^^(d^f) + + fik(d rAt^ rr^od,o ^ .f^ ^{d ^ ^) + .. . + ,^Ik(d ik} en contra de la hipátesis de error de orden k no detectable. Por tanto, para cada error de orden k no detectable en las posiciones i,,.. ., i^ hay uno detectable de orden k- 1 en tas posiciones i,, ..., ik_,. La Proposicián 2 asegura, además, que todos estos errores de orden k- 1 van a ser distintos entre sí. En efecto, si los errores no detectables de orden k son tales que los dígitos en posición i^ coinciden, habrá al menos dos posiciones, enire las k- 1 restantes, en que los dígitos difieran y si los dígitos en posicián i,^ son diferentes, aún existirá al menos una posición en que difieran. Por consiguiente: Número de errores detectables de orden k en posiciones i,,...., i^ S número de errores detectables de orden k- 1 en posiciones i,,..., i,^ _^. Recíprocamente, supongamos dado un error detectable de orden k- 1 en las posiciones i , , . . , , i,^ _ ^ ; esto es: , , f;^(d^^) + ... + ,f;k-^^d^k-^)^'° ^ , .f^ ^td ^ , + , . . + .f k - ^d ^.k - ^) ,,f ,(d ^,) ; , ^ ^ ,f;,^( d^ .f;k- ^^d^k- ^) ^ ^^^- ^^d%k- ^) Entonces, existirá asociado a él un único d;k ^ d;k tal que . , , f;^(d;^) + ... + f;^_^(d;^_,) + ^;k(d; ) k ^` fik-l^d^k-1^ + f^k(dik) ^° _ ,f;,d;,) + ESTADISTICA ESPAI^OLA Es decir, existe un error no detectable de orden k en las posiciones i^, ..., ik, Todos los errores de orden k obtenidos de este mcxio van a ser distintos entre si, puesta que los errores de orden k-- 1 de los que se parte lo son. Por tanto: Númera de errores detectables de orden k- 1 en posiciones i^, ..., ik_, S número de errores no detectabies de orden k en posiciones i,,... , ik. De esta desigualdad y de la anterior se obtiene la igualdad que establece el enunciado de !a Proposición 3. Propvsicitin 4 ^ ^^ado un número correcto de n dígitos, el número de errores detectables de orden k es^: k- _ ^}^ gk-^ Demastracián: Utilicemos la siguiente notación (para r^ Ky: !C, = número de errores no detectables de orden r en posiciones i,, ..., ir; Yr = número de errores detectables de orden r en posiciones i,,.. ., i, For la Proposición 3, tenemos: Xr - Dado que el número de errores de orden r en las posiciones i^, ..., ir es 9' (pues, cada digito correcto se puede cambiar erróneamente por uno de los otros nueve}, tendremos: }C, = 9r - Y de donde (sustituyendo X, = Y,_ 1) Y,. = 9' -- Yr -1 que es una ecuación en diferencias de orden l. Resolvámosla por recurrencia, recordando que Y^ = 9(pues P^ = 1). Yk = 9^` - (9k^' - Yk-2} = 9k _ 9k-^ + Yk_z = 9k - 9k--i -^- (9k-2 ..^.. ^ 9k _ ^k-1 ^,. 9k-2 - Yk-3 Yk-3) - METODOS BiYECT[VOS eS declf: Yk = 9k -- 9k- l + 9k-2 _... + 9, si k es impar Yk = 9k - 9k- l+ 9k-2 -... - 9, si k es par Por tanto: _ ^)^ 9^-^ ^=o es el núrnero de errores detectables de orden k en posiciones i,,... , ik. Como estas posiciones pueden elegirse de n k forrnas distintas y cada elección da lugar a errores diferentes, queda demostrado el enunciado de la proposición. +^vrvlario de la Propr^sicivn 4. Se verifica la siguiente relación entre el número de errores no detectables de orden k y el número de errores detectables de orden k-- l: . n gk _^ n- k+ 1 Z k ^ k k-l En efecto: Zk _ n k ^9k _ gk- + 9k-z _ ...) n 9k _ Zk = n 9k _ n ^9k _ 9k-1 + gk-2 _ .) _ n k k k 'f k _ n n --- k + k -- 1 1 (9k-1 ^ 9k-2 k ^9k-l _ 9k-2 + + ...) = n - k + k Demvstracián del Teorema 1. Hallem,os Pk como el cociente entre el número de los casos favorables y el de los posibles. El número de casos posibles es n 9k y en virtud del corolario tendrernos: k Pk = Zk n k - n 9k _ n-- k+ 1 Z k k Ck 19k 9k n- k + 1 kil J Zk-1 1 Pk _ l, = 1 - 1 9 k n 9k_l k para K= 2, ..., n + ESTAI?lST1CA E3PAl^(JLA Corno, según la Proposición l, P, = l, queda concluida la demostración del Teorema 1 (*). Demosxracicín directa de! Teorerna 1 Por la Proposición 1, queda demostrado que P, = l. Por el Teorema de la prababilidad total, se tiene: Pk+^ = Pk • P[Error orden k+ 1 detectable / Error orden k detectable] + . +( i--- P,^) • P[ Error orden k+ 1 detectable / Error orden k no detectablej Ahora bien: 8 P[Error orden k+ 1 detectable f Error orden k detectable] _-, ya que siendo 9 detectable el error de orden k, esto es, siendo k ^ f. (d;^ ) ^ ^ .f1, (d,,), ^=1 ^ el error de . orden k+ I será detectable siempre que el error (k + 1)-ésimo no consista en que 2d^k+! tome justamente (en virtud de la biyectividad de las transformaciones) aquel valor, de entre los 9 posibles, que produce la igualdad: k ^^.J ; ^ (d ^^1) + .f * + 1(d l k+l ) r ^^1 ^^ 1(d^ ^) + f k+ ^(d k+,) =1 Por otra parte: P[ Error orden k+ 1 detectable / Error k no detectable j= 1, ya q ue s ie ndo no detectable el error de orden K, esto es, siendo: k ^,f (d^^,) _ ^=1 ' (*) Notu: Obsérvese que .f 1(d^ ,) 9 kl-.^ Pk l^ Por tanto, y como era de esperar, a medida que aumenta el orden de error de transcripción, la probabilidad de detección asociada se va aproximando a la que tiene un número aleatorio de ser incorrecto. 87 11tETODOS BlYECTI VOS en virtud de la biyectividad de las transformaciones se verifícará que, cualquiera que sea ^'k+i ^ d'k+l' k k ^ -f^^(d!^ ^ ' i=1 + .f'k+l^dik+l ^ ^ ^_! ^ 1(d^ 1^ + f Ar+l(^ik+l^ Por consiguiente: S Pk + ! _ pk • 9 g ^- (1 - P,^) • 1 = 1 - 1 - Pk = 1 -9 I Pk _ 9 como queríamos demostrar. 2. ERROR POR OMISIC?N DE ORDEN K Vamos a estudiar la probabilidad que tienen los métodos basados en aplicaciones biyectivas de detectar omisiones que producen error. Dembstraremos el siguiente; Teorema 2. «La probabilidad, Pk, de detectar un e rror por ornisián de k dígitos en un número de longitud n+ 1(*) es^ ^ : r ^r -k + 1 9 Pk - n- r 10"T' k_ j 10" -r+ 1- 1 + n k-- 1 10"^1 10" - 1 k = l, ..., n Antes de realizar la demostración del Teorema, veamos un Lema previo y un corolario de dicho Lema. Lema 1. K La variable aleatoria rnod,o (f^^(d^) + f,^(d^)), para i, j = 1, ..., n, i^ j toma cada uno de los 10 dígitos con probabilidad ^ 1-J 10 ^^ Demostraeión del Lema 1. De la hipótesis de equiprobabilidad de d; j unto con la biyectividad de las f^ se deduce que fr(d^) toma con equiprobabilidad cualquier dígito de 0 a 9. Para unos valores fijos de f; (d^) y de j, y para cada m= 0, 1, ..., 9, existe un ú nico d.^ tal q ue : ^ mod,o (f,.(d^) + f^+(dj}) = m (*) I.a longétud del número sin clave es n y al incorporar la clave será n+ l, 88 ESTAD[ST1CA ESPAI^©^.A como es tri vial comprobar. Por tanto: P (mod,^ (f;(d;) + f (d )) _ 1 m = 0, 1, líJ ' ColorarRO de! Lema 1. La var^able aleataria mod,^[f.^ (d; ^} + ^ ^ cada uno de Ios lU dígitos con probabilidad 1/ l0. ,j^k(d kf)) toma Se demuestra inmediatamente, por inducción, a partir del Lema 1. Demostración de! Teorema 2. Si al transcribir un número se omiten k dígitos se produce, en general, un desplazamiento a la derecha de los dígitos no omitidos, completándose el número con k ceros por la izquierda. Así, si el número correcto es 123456 y se omiten el 2 y el 4, el número incorrecto sería 0013Sb. Los dígitos situados a la derecha del dígito de menor arden entre los omitidos no se ven afectados pc^r el desplazamiento. Como dado un número completa de n+ 1 dígitos el de orden inferior es la clave, será necesario hacer la precisión siguiente: Considerando números de n+ 1 dígitos (elave incluida), estudiaremos, en primer lugar, la omisión de k dígitos cuanda ninguno de ellos sea el de orden inferior (posición de clave). En segundo lugar, estudiaremos el caso en que uno de los k dígitos que se omiten sea el de orden inferior (dígito de clave). Sea el número d„ ... d ^cio. Supongamos que se omiten k dígitos. Sean los dígitos no omitidos: d;o, d;^, ..., d^^-k donde 4 ^ i^ S... !n_k S n. Sea r el dígito de menor orden entre los k omitidos. Los valores que puede tomar r son 0, 1, ..., n - k+ 1. a) Errvr fuera de clave. E1 número que resulta de la omisión de orden k será: ^, . . . , ^, d+n-k . . . d^ ^d^o donde sabemos que d^o = d o, pues el error no afecta a la clave. METODOS HIYECTI VOS Teniendo en cuenta que J^(o) = 0, para todo i, la omisián será no detectable si y sólo si: ^i'©(d,o + f ^ (d; ^) + + f,^ -k (d ;,^ _k ) _ ^^o = fo(dv) + f^(d ^) + ... + .Ír(dr) + .Ír+l(d.#1) + ... + fn(d„) Ahora bien, como los dígitos situados a la derecha del dígito de menor orden entre los omitidos no se ven afectados par el desplazamiento, tendremos que la omisión será no detectable si y sólo si: .f^(d^,) + ... + .Í^-k(d^n-k) donde, r= 1, ..., n- k+ ^^o - f,(d;) + .. . + .Í^,(dn) l. Dados d,+l, dr+^, ..., d^ y fijadas las posiciones en las que se producir^án las omisiones, quedarán fijados: fr+l(^r+l) + ... + fie^dh), y fr(d ir) -^ . . . -^-' ,fn - k (d in -k ^ por lo que sólo existirá un único valor de fr(dr), tal que se verifique la anterior igualdad. Los valores de f r(dr) distintos de éste llevarán consigo la detectabilidad de la omisión. Por consiguiente, asociado a cada (n - r)-upla de valores d,+ ^, d r+2, ..., d„ y a I as k- 1 posiciones de omisión elegidas entre las n - r posiciones de orden superior, tendremos un caso de error no detectable. Por lo tanto, para las k- 1 posiciones fijadas, habrá: lo^-r casos no detectables entre los lo"-r+l posibles, donde r es el dígito de menor orden entre los k omitidos. Sin embargo, no todas las omisiones producen error. Así, en el caso de omisión de orden 1, si el dígito de orden superior es 0 y se omite, como ei n ^ mero compuesto por los dígitos restantes sería completado con un 0 a la izquierda, la omisión no prod uciría error. En el caso de que el dígito de menor orden entre los k que se omiten sea el r-ésimo, no se produciría error si éste y todos los que le preceden son 0. ESTADiST1CA ESPA^OL.A Entonces, tanto al número de casos no detectables como al número de los posibles habrá que restar el número de los que, no siendo detectables, no constituyen error. Al número de (n - r)-uplas le retaremos l(caso d„ _... = d, = 0) y, por tanto, el número de amisiones que producen error no detectable será: ^ !ow-r ^ ^ ^?e forma que la probabilidad de no detección será: lo"-' -- 1 ^^re-r+ 1 _ j Como el razonamiento anterior es válido cualesquiera que sean d t,... , d r_ ^ y las k- 1 posiciones de omisión que se esçoján entre las n - r posibles, resulta que ^on-r ^ow-r - ^ lon-r+l _ j^` 9 10^-r+^ - l es la probabilidad de detección de error de omisión de orden k, cuando el dígito de menor orden entre los omitidos es el r-ésimo, r= l, 2, ..., n- k. b) Errvr a,f'ectando a clave. ^onsidereremos ahora la situación en la que el error de omisión afecta a la clave. Tendremos para el número correcto que: mod ^ a ^o(do) + ^^(d ^) f 2(d Z) + +f„(dn) = 0 Si se omiten k dígitos, sean d;o, ..., d;,^_k los no omitidos, sabiendo que entre ellos se encuentra da. El n ^ mero incorrecto sería: 0 . . . 0 d;,^ -,^ . . . d; o donde, d;o ocupa ahora la posición de clave (d;^, ^ do). E1 error será no detectable si y sólo si: ^^a fo (d;^ + . . . + fR -k(d;,, -k) = o 91 MBTODOS ®1YECTI VQS En virtud del Lema l, la variable aleatoria: mod,o ^Í'o^d io} + .. . + .Í„ --k(^^" -k)) toma con equiprobabilidad los valores 0, 1, .. ., 9. 1 Por ello, se vecificará la igualdad anterior con probabilidad - . • 10 El número total de omisiones cuando se fijan las k-- 1 posiciones de error distintas de la posición de clave será el número de cifras que se puedan formar con n di,gitos [al ser el {n + 1)-ésimo la clave, é ste vendrá exactamente determinado por los n anterioresj. Es decir, el número total de omisiones será 10". EI número de omisiones que producen error será 10" - 1, pues hay que descontar el caso en que los n+ 1 dígitos sean 4(*). Veamos ahora cuál es el número de omisiones que producen error no detectable. 1 Por la utilización hecha del I..ema l, sabemos que 10 de los números correctos serán tales que al producirse una omisión de orden k afectando a la clave, la ornisi^in l será detectable. Ahora bien, entre este 10 de casas está incluido aquel en el que todos los dígitos del número correcto son D. Deduciendo este caso, tenemos que el número de omisiones que producen error no detectable será: 1 10" -- 1 = 10" -1 10 Así ^pues, la prababilidad de detección será: 10"^ 1 -- 1 1 10" -- 1 10n-1 - 9 10" - 1 Como el razonamiento anterior es válido cualesquiera que sean las k- 1 posiciones de omisión que se escojan entre las n posiciones, resulta que la anterior probabilidad será la probabilidad de detección del error de omisión de orden ^{ cuando éste afecta a la clave. c) Error general. La probabilidad de que el dígito de menor orden entre los k omitidos sea el r-simo será: (*) Nótese que en este punto es imprescindible utilizar que el transformado del 0 es 0. Si no fuese así no sabríamos si el número d, ._ ... = d"+ i= 0 es posible o no. Si la omisión no afectase a la clave, aunque el transformado dei ^7 no fuese 4 seguirían valiendo los argumentos utilizados. ESTADiSTlCA ESPA14ULA 92 = 0, l, ..., n- k+ 1 Por tanto, por el Teorema de la probabilidad tatal, tendremos: ,.-k+i Pk ^ n - l k- 1 n+1 k r= 1 9 n-^- 1 • g • 10" ^r + ^ -- 1 + -,^-^+i ^ n r r= i n k- 1 lfi^^r la"'r k- ] ^(^" -r+ 1,_ n+1 k lU^": ^ ^ g • 10" - 1 + j n ^ i^"^t 1 lk) k = l, ..., n como queríamos demostrar. METODCI «ABC^ l, Introduccián La idea de buscar un nuevo método surgió de la siguente forma: Está claro que el método del «7^, aunque su cálculo sea sencillo, no es un método «bueno^ porque no asegura el cien por cien de detección en el ETS. De ahí, el interés de los métodos biyectivos. Ahora bien, la búsqueda no acaba con asegurar la detección del ETS, pues así como la probabilidad de detección del error de omisión viene determinada por la biyectividad, no ocurre otro tanto con los bailes de dígitos^. E1 inconveniente principal de manejar dos columnas, como en el « 1-2», es que no detecta en absoluto algunos bailes complejos ( con eje, baile doble, etc.}. E1 «1-3-7», al tener tres columnas, sí que detecta éstos, pero a cambio de empeorar en la detección del baile simple ( ver cuadro de probabilidades en la Tabla 1). Llegados a este punto, la búsqueda se centra en un método biyectivo que maximice la probabilidad de detección del error por baile simple. Para ello es necesario demostrar el siguiente teorema. lytETODOS BIYECT[ VOS 2. 93 Te^}re mu 3. No existen aplicaciones biyectivas que detecten el EBS al cien por cien. ^ Antes de su demostracicín, interpretemos el signifcado de este teorema. Sean las aplicaciones I y II que transforman los dígitos A y B, respectivamente, en: Si se prod uce u n baile si mple e n u na c ifra A B dando 1 ugar a la c ifra B A y no se detecta el error utilizando una clave en mod ^o es porque: a+ b'' ^,o u' + b, u- a' ^,o b- b' Lo ideal seria encontrar dos transformaciones tales que d A y B dígitos decimales distintos se verificase: Q - q' , ^^o b - 6' es decir, transformaciones tales que los mod 1U de las diferencias entre los transformados según una y otra columna no coincidan para cada dos dígitos decimales distintos. Sin embargo, y lamentablemente, tales columnas no existen. Demostración: Fara ello, es suficiente comprobar que la resta, elemento a elemento, de dos col umnas biyectivas es una columna no biyectiva. En efecto, sean las columnas N y X: N X 45 45 9^4 ESTAD^STICA ESPAI^OLA donde, sin pérdida de generalidad, hemos supuesto que la columna N está en orden natural. La suma de los elementos de ambas columnas es 45. Por las propiedades de los módulos: 9 mod ^a ^ ( N; - X;} = mod,© mod,o i=0 9 $ ^ N; - mod ^o ^ X; = mod,o (S - S) = 0 i=0 i=0 Por consiguiente, la columna obtenida por diferencia no puede ser biyectiva, porque, si lo fuese, el mádulo 10 de la suma de sus elementos habría de ser S. 3. Consecuencia Como consecuencia del teorema 3 tenemos que, a efectos del baile simple, la mejor situación posible para los métodos biyectivos es aquella en la que las columnas sean tales que en toda columna obtenida por diferencia de dos de ellas sálo se repita un único dígito. Obsérvese que es la mejor situación posible cuando se impone la condición de que las columnas sean biyectivas, esto es, cuando se quiere maximizar la probabilidad de detección de errores de transcripción. De no imponer esta condición, podrían encontrarse columnas que dieran el cien por cien de la detección del baile simple, aunque a costa de reducir la detección del error de transcripción. Así, las columnas N X 3 4 S 7 9 0 b 4 son tales que detectan al cien por cien el baile simple (la columna diferencia es 0, 2, 4, S, 8, l, 3, 5, 7, 9) pero la probabilidad de detectar el error de transcripción simple en la columna X sería ahora 88 en lugar del cien por cien. 90 Veamos el caso del método « 1-2^. La columna obtenida por diferencia de columnas « 1 ^ y «2» es: 9S b[ETOD^OS BIYECTiYOS «^^, «2^^ 0 0 l 2 2 3 ^4 S ó 7 8 9 4 b 8 1 3 S 7 9 mod,a («l^ _ «2^^ repetición única En cambio, dos col^mnas cualquiera del método « 1-3-?^ generan más repeticiones en la columna diferencia. Asi, por ejemplo: «1^^ «3^ mod,o (« 1 ^ - «3^^ 0 l 2 3 0 3 ó 9 0 8 6 4 2 5^ 6 7 5 8 1 8 9 4 7 4 2 0 8 b 4 2 Al aparecer más repeticiones en la columna diferencia, el método « 1-3-7^ es inferiar al t< 1-2» en la detección del baile simple. EI objetivo aparece ahora clarar^^lente: encontrar una tercera columna biyectiva para un ir a las « 1^ y«2» , tal que si se resta elemento a elemento de cualquiera de las « 1^ y «2» se obten^a una repetición única. Si tal columna existe evitaremos las limitaciones del « 1-^» para el baile con eje y baile doble y mejoraremos las probabilidades de detección del « 1-3-7» respecto a1 baile simple, manteniéndose además las propiedades de la biyectividad. 9^6 ESTADtSTICA ESPA1^10í^..A Esta columna existe y junta a las otras dos da lugar a un nuevo método, el ABC que se basa, por tanto, en la matriz de la transformacián siguiente (*): 4, ; .ÍE^^ C .ft^^ B .ft^, A 0 1 0 2 0 3 0 1 2 4 8 2 3 4 S 6 7 8 9 6 8 1 3 S 7 9 2 7 4 1 5 3 b 3 4 S 6 7 8 9 Cálc: ulo y cvrnproóuc irín de la clave Dacio el número d„ ., . d^d 2 d , calculamos: fz(d.,) + .. . + f^(d ;) + fc(d 2) + fe(d ^ ) donde: Z= A si n = 3k B si n = 3k + l C si n = 3k + 2 k = 0, t, 2... El complemento hasta el múltiplo de l0 inmediato superior, esto es, d^ = 10 - mod,^, ^,f'z(d„} + ... + f^(d;) + fc(dz) + fe(d,)] serú la clave y se añadirá al número original. E1 n ^ mero con la clave incorporada sec-á, por tanta: d^du {*) Esta tercera columna, que en la matriz que sigue aparece en posición B, no es, desde luego, única. Aisí, otra columna B posible serfa: 0, 3, b, 9, 2, 8, 1, 4, 7, S. De hecho, esta última es la que se utiliza en nuestro trabajo citado. Es importante observar, a este respecto, que las pmbabilidades de detección no dependen de las columnas concretas que se utilicen, sino de sus propiedades {biyectividad y repetición única en las columnas obtenidas por diferencia). Por ello, tanto si se utiliza la columna B que aparece en la matriz como si se utiliza la otra citada, las propiedades generales de ^ietección serán las mismas; aparecienco únicamente discrepancias si se le imponen a los n^ meros controles de recorrido. Por otro lado, y como es evidente, tampoco es única la columna C. IItETODUS BIYECTI VOS Si se recibe el número d,^ ... d z d,do, para comprobar su clave se calcula: fi(d„) +... + f^(d3) + fc(d2) + fe(d,) + f^(do) donde Z tiene el mismo significado que antes. Si esta suma no es múltiplo de 10 se detecta presencia de error, y en caso contrario no se detecta. Ejemplo: Consideremos el número 37.842. Su clave será: do = 10 -- mod,o (f c(3) + fB(?) + f^{8) + fc(4) + fe(2)) = = l0 -- mod,o (6 + S+ 8+ 8+ 8) = 5 Por tanto, el número completado con su clave será: 378.425. Si por un error de transcripción recibiésemos el número 378(S)2(8), veamos que se detectaría el error. En efecto: fc(3) + f8(7) + f^(8) + f c(5) + f^(2) + f^(8) _ = 6+ S+ 8+ 1+ 8 + 8= 36 ^ 0 mod , o S. Aplicaciore^es El método ABC ha sido ya utilizado por el Instituto Nacional de Estadistica en el Diccionario Geográfico de 1980 para los códigos de provincia-municipio y, a causa de ello, en el Censo de Edificios de 1980 y en el Censo de Población y Viviendas de 1981. También, y para varios códigos, en el Censo Agrario de 1982. DESCRIPCION DE LAS TABLAS Tabla 1. l.° Su contenido es el siguiente: Fórmulas generales para la probabilidad de detectar los errores de transcrip- ción y de omisión de un orden arbitrario ^, correspondientes a los métodos biyectivos (« 1-2», «1-3-7» y«ABC»), siendo n la longitud o tamaño del número original dn ... d,, esto es, sin contar la clave. 2.° Probabilidades de detección ( en tanto por ciento) del baile sirnple, baile con eje y baile doble, correspondientes a los métodos biyectivos (« 1-2», « 1-3-7» y«ABC»}; probabilidades que no dependen del tamaño del número. 3.° Fórmulas generales para la prababilidad de detectar el error de iranscripción F.^tTADl3iT^CA B^PA1^iO!LA simple y los errores por baile, correspondientes al m^todo «?^; no habiéndose encontrado una expresión general para el error de omisión. Tablr^ 2. Contiene las prababilidades de detección (en tanto por ciento) calcula^cias para los diferentes errores y métodos en dos casos particulares del tamaño del número (sin coniar la clave): ^e = S y n= l2. Cuando ia probabilidad depende del tamaño, la casilla correspondiente se ha dividido en dos iriángulos: el triángulo superior contiene el valor de la probabilidard para n = S, y el inferior, el valor para n= 12. METODOS BIYECTtvOS .^^^ ^ ^ ^ ^ . ^.. + o ^ --, ^ + 8 N M ^. ... ^ ^ -I ^. ^^ _ I ^ ^^ ^^^ ^ + ^ ^ .-. ^ ^` ^ : ^ ^ ^ -, ^ ,= ,,,._..^ ,.., :^ ^ ^ ^, -~ -^ ^, + ^ ^ ^ ♦ ^ ^.___•^ ^^ ^^ z o .... ^ -^ o ^ r------^ .^ ^ .at ^--^^ 00 00 ^ ^ o N ( ^ ^ ^ ^ w .^ ^ ^ .-^ ^ ^ ^ OC Q^ + a^ á. E ^ = ^ ^ ` .. ,.. ( ^, ^ o0 ^ ^ f---^,, r ^f ^ v^ ... .^, C .p_ . ^, j ^ ^ I ^ + `^ _ ' I •^ u -- ^ E,,,, ~ + ^ ,_„ U •.^ II i^ a.^ a^ á ^ ^ ^ ^ U [^. N ^ K1 ^ ^ Y ^ Y o ^ ^,^, ^ ^ ^ Q ESTADlSTtCA ESPAI^OLA C r ... r p ^.^ ,,.' í 1^ V .^ ^ ^ ^ ^ 1^ ..., ^ O ^ ^ ^ ^..r . •y ^ E ^ ^ ^ Op . 00 Q^ h ,^G ^ ^Á V f+"f ^ ^ ^ 8 v c ^ ^ ^ O ^ ^ ,u ^ • w O ^ ^ ^ ^ ^ ^ ^ ^. ^ V^ A ^ V ` ^ ^ V . .^^ ^ ^ ^ © ^ ^ ^ ^ N ^ 4 ^ . ^ ^, ^ .E ^ o^q E--^ - v^^ $^ ñ r^ o^ ^ ' °o^ r t^ o^, ^ a^ W A ^O ^ u ó_ ^ ^ C^ ^ ^• ^ N ^ 00 0^0 C ^ C10 .r C u ^s -v °' ^ • C^ ^ . oá áó.. r^.. ^ ^ ^ -ov .. c ^, ^o -v ^ a+ ^. • ` a ^ W tT 00 ^ ao ^ ^ ó H `r ^^ f/^ ~ ^M W i"^i ^ ^ ^ ó ^ -^ ,°Ñ .r ^ ^^` .r ^ ^^u .^ ^^ ^ ^ ^ Y ^ ^ o ^ ^a^ ^ ^ áV «r A4 . ^ IIr[ETO^DtJS BIYECT1VdS l01 SUMMARY This paper considers the problem of incorporaiing a contro^ digit into a numerical code in order to detect errors in the transcription or tramissian of the code in question. Method «7» and those based on an the biyective transformations « 1-2^ ^ and « 1-3-7^, are described. The general properties of the biyective methods are considered and a new biyective cnethod introduced: the «ABC^ ^ m+ethod, whose detecting probabilities for the mast usual errors are greater than, or at least as great as, the previous methods. Key words: control digit, method «7» , method « 1-2^ , method « 1-3-7», method «ABC^•, biyective transformations, transcniption error, simple transposition error, axis transpasition error, double transposition error, error of omission. A.M.S., 1970. Subject classification: 68A10.