Nomenclatura de las mutaciones Estas mezclas de cifras y letras

Anuncio
Nomenclatura de las mutaciones
Estas mezclas de cifras y letras obedecen a las estrictas normas de nomenclatura ideadas por
la Sociedad de Variaciones del Genoma Humano (HGVS, por sus siglas inglesas), con el fin de
normalizar internacionalmente la terminología de las variaciones en la secuencia de los ácidos
nucleicos o las proteínas por ellos codificadas.
Como toda nomenclatura normalizada, también la nomenclatura de las mutaciones busca la
máxima precisión, de tal modo que cada variación génica se nombre de una sola forma en todos
los rincones del mundo, y cada denominación utilizada designe siempre una única variación
génica.
Lo primero de todo es indicar claramente si la variación que vamos a describir afecta al
ADN, al ARN o a la proteína resultante.
En el primer caso escribiremos en mayúscula las iniciales de los nucleótidos afectados, y
haremos preceder la descripción por la letra c (para el ADN copia), por la letra g (para el ADN
genómico) o por la letra m (para el ADN mitocondrial).
Si se trata de una mutación del ARN, en cambio, escribiremos en minúscula las iniciales de
los nucleótidos afectados, y haremos preceder la descripción por la letra r.
Por último, si se trata de una variación de la secuencia de una proteína, escribiremos los
símbolos de letra única de los aminoácidos afectados, y haremos preceder la descripción por la
letra p.
Así las cosas, resulta ya obvio que c.67T>G sólo puede corresponder a una mutación del
ADN copia; r.67u>g a una mutación del ARN, y p.K16W, a una variación en la secuencia
aminoacídica de una proteína.
Para describir las variaciones en la secuencia del ADN, que pueden afectar a uno o varios de
sus cuatro nucleótidos: adenina (A), citosina (C), guanina (G) y timina (T), denotados con letra
mayúscula.
La descripción empieza habitualmente con un número que indica la posición del primer
nucleótido afectado. Los nucleótidos del ADN se numeran desde la A del codón iniciador ATG
hasta el tercer nucleótido del codón finalizador; para indicar el nucleótido 5′ del codón iniciador
se usa la posición negativa –1, y para indicar el nucleótido 3′ del codón finalizador, la posición
con asterisco *1.
Para los nucleótidos intrónicos iniciales se indica el número de posición del último nucleótido
del exón precedente, el signo de suma y la posición dentro del intrón (por ejemplo: 67+2T); para
los nucleótidos intrónicos finales se indica el número de posición del primer nucleótido del
exón siguiente, el signo de resta y la posición dentro del intrón en sentido inverso (por ejemplo:
68–1A). Un intervalo de dos o más nucleótidos se marca con la raya de subrayado entre las
posiciones del primer y del último nucleótidos afectados (por ejemplo: 66_68).
Una sustitución se designa con el símbolo > entre las iniciales de los nucleótidos implicados.
Por ejemplo, 66A>C indica la sustitución de adenina por citosina en la posición 66; 78+1T>G
indica la sustitución de timina por guanina en el primer nucleótido del intrón situado entre los
nucleótidos 78 y 79, y 79-2C>A indica la sustitución de citosina por adenina en el penúltimo
nucleótido del intrón situado entre los nucleótidos 78 y 79.
1
Una eliminación se designa con la abreviatura del (del inglés deletion) tras el intervalo
correspondiente a los nucleótidos eliminados. Por ejemplo, 66_68delATC indica la
eliminación de una adenina, una timina y una citosina en los nucleótidos 66 a 68, y
87_88delGT indica la eliminación de una guanina y una timina en los nucleótidos 87 y
88.
Una duplicación se designa con la abreviatura dup tras el intervalo correspondiente a
los nucleótidos duplicados. Por ejemplo, 55_57dupTCG indica la duplicación de la
timina, la citosina y la guanina de los nucleótidos 55 a 57.
Una inserción se designa con la abreviatura ins tras el intervalo correspondiente a los dos
nucleótidos que flanquean la inserción. Por ejemplo, 66_67insA indica la inserción de
una adenina entre los nucleótidos 66 y 67, y 91_92insTG describe la inserción de una
timina y una guanina entre los nucleótidos 91 y 92. La combinación de los símbolos de
eliminación e inserción permite describir sustituciones amplias; por ejemplo,
122_127delinsGA indica que los seis nucleótidos situados entre las posiciones 122 y 127
han sido sustituidos por una guanina y una adenina.
Una inversión se designa con la abreviatura inv tras el intervalo correspondiente al
primer y al último nucleótidos invertidos. Por ejemplo, 218_527inv310 indica una
inversión de los 310 nucleótidos comprendidos entre la posición 218 y la posición 527,
ambas inclusive.
Por último, dos mutaciones en un mismo alelo se describen dentro de un mismo corchete y
separadas por punto y coma (por ejemplo: [56T>C ; 63C>G]), mientras que dos mutaciones en
distintos alelos se describen entre corchetes aparte y separadas por el signo de suma (por
ejemplo: [56T>C] + [63C>G]).
La nomenclatura de las mutaciones del ácido ribonucleico (ARN) sigue básicamente las
mismas normas pasada para el ADN, con la diferencia de que la descripción va precedida de la
letra r, y que los nucleótidos implicados se designan por la inicial de las cuatro bases en
minúscula: adenina (a), citosina (c), guanina (g) y uracilo (u). Por lo demás, las normas básicas
de nomenclatura son idénticas a las comentadas al ADN. La numeración de los nucleótidos se
hace desde el uracilo del codón iniciador (posición 1) hasta el último nucleótido del codón
finalizador, y una mutación como r.75u>a, por ejemplo, indica la sustitución del uracilo en
posición 75 por una adenina.
Conviene destacar que, cuando una mutación del ADN puede dar lugar a dos o más
transcritos de ARN, estos se describen entre corchetes y separados por una coma. Por ejemplo,
[r.56c>a, r.56c>a; r.53_68del] indica que la mutación c.56C>A en el ADN copia ocasiona la
aparición de dos moléculas de ARN: una portadora únicamente de esa variación, y otra que
contiene además una eliminación de los nucleótidos 53 a 68. De forma parecida, una variación
descrita como [r.=, r.68_69ins68+1_68+10; r.68+2u>c] indica que la mutación intrónica
c.68+2T>C en el ADN copia ocasiona la aparición de dos moléculas de ARN: una normal (r.=) y
otra que contiene una inserción de los nucleótidos intrónicos 68+1 a 68+10 con sustitución del
uracilo por citosina en el segundo nucleótido del intrón.
2
Nomenclatura de las mutaciones de las variaciones en la secuencia aminoacídica de una
proteína:
Cada aminoácido se representa por su clave unilítera en mayúscula: A (alanina), C (cisteína),
D (ácido aspártico), E (ácido glutámico), F (fenilalanina), G (glicina), H (histidina), I (isoleucina),
K (lisina), L (leucina), M (metionina), N (asparagina), P (prolina), Q (glutamina), R (arginina), S
(serina), V (valina), W (treonina), Y (tirosina). La letra X se reserva para marcar la presencia de
un codón finalizador. Para indicar la posición de un residuo, los aminoácidos se numeran
comenzando por la metionina de inicio, y la cifra de posición, a diferencia de la nomenclatura
de las mutaciones de los ácidos nucleicos, se coloca tras la letra correspondiente al primer
aminoácido implicado.
Una sustitución se designa colocando el número de posición entre el aminoácido sustituido y
el aminoácido de reemplazo. Por ejemplo, W54C indica que el triptófano de la posición 54 ha
sido sustituido por una cisteína, y W54X indica que el triptófano de la posición 54 ha sido
sustituido por un codón finalizador.
Una eliminación se designa con la abreviatura del (del inglés deletion) tras el o los
aminoácidos eliminados y su posición. Por ejemplo, K39del indica la eliminación de la lisina
situada en la posición 39, y C38_M40del indica la eliminación de tres aminoácidos: los
comprendidos entre la cisteína de la posición 38 y la metionina de la posición 40, ambos
inclusive.
Una duplicación se designa con la abreviatura dup tras el o los aminoácidos afectados y su
posición. Por ejemplo, G42_Q44dup indica la duplicación de los tres aminoácidos
comprendidos entre la glicina de la posición 42 y la glutamina de la posición 44.
Una inserción se designa con la abreviatura ins tras la inicial y la posición de los dos
aminoácidos que flanquean la inserción. Por ejemplo, K39_M40insQFK indica la inserción de la
secuencia glutamina-fenilalanina-lisina entre la lisina de la posición 39 y la metionina de la
posición 40. La combinación de los símbolos de eliminación e inserción permite describir
eliminaciones o inserciones que generan un nuevo aminoácido por ejemplo, C18_R19delinsY
indica la eliminación de tres pares de bases en los codones de cisteína 18 y arginina 19, para
generar en su lugar un codón que codifica el aminoácido tirosina, y C18delinsYI indica la
inserción de tres pares de bases en el codón de cisteína 18, para generar dos codones que
codifican los aminoácidos tirosina e isoleucina.
Finalmente, una mutación por desplazamiento del marco de lectura se describe recurriendo a
la abreviatura fs (del inglés frame shifting). Por ejemplo, E87fsX111 indica un desplazamiento
del marco de lectura con el ácido glutámico de la posición 87 como primer aminoácido afectado
y apertura de un nuevo marco de lectura para 23 aminoácidos.
3
Descargar