Biology at a glance Aplicações biomédicas em plataformas computacionais de alto desempenho Aplicaciones biomédicas sobre plataformas gráficas de altas prestaciones Biomedical applications in High performance computing platforms Oswaldo Trelles, PhD University of Malaga The fundamentals of life are stored in the material that constitute organisms but specially in the information that governs their organization, development, proliferation, identity and evolution. This section surveys the sources of information in living organisms and their relationships O.Trelles, PhD Cells, DNA, chromosomes, genes and proteins O.Trelles, PhD All living organisms are made of cells All living things are made of cells. Different and specialized types of cells make up all of the parts of an organism and are responsible for all the events that occur in the organism. The principles of cell theory stated by Dr. Charles Mallory include: 1. All organisms are made up of cells. 2. Cells are the basic units that form the structure of the organism. 3. Cells are derived only from other cells. 4. Cells contain the genetic instructions of organisms. 5. Cells contains the mechanism that control the metabolism and biochemistry of organisms. O.Trelles, PhD Cells reproduction Cell reproduction is the process of a cell splitting and becoming two similar cells. Prokaryotes reproduce in a process called binary fission, that first replicates the DNA, then attaches each copy to a different part of the cell membrane following cell splitting producing two cells of identical genetic composition, except for spontaneous mutations. Eukaryotic cells reproduce using either mitosis or meiosis. Mitosis creates two daughter cells with an equal number of chromosomes. Meiosis creates four daughter cells, each with half the number chromosomes as the parent, and is used in sexual reproduction. O.Trelles, PhD Prokaryote cells are the ancients living organisms and eukaryote cells have a nucleus with most of the genetic information Prokaryote and Eukaryote are the two main types of cells. Prokaryotes are much simpler in their organization than are eukaryotes, do not have membrane nucleus and their genetic information is organized in a circular chromosome. Eukaryotes have a membrane-bound nucleus were is stored most of the hereditary material and it also contains many other structures called organelles. A coarse analogy can be made with the chicken egg, an eukaryote organism, hence a cell with nucleus, the yolk. However, this is a germinal cell, therefore it only contains half of the genetic information, that will be completed during fecundation O.Trelles, PhD Unicellular Prokaryote organisms do not have nucleus Bacteria are prokaryotes (the most abundant in the planet), unicellular and without nucleus Viruses are small biological entities that need a host for reproduction. ¿ are viruses living organisms? This is an open question. Different strains of Lactococus lactis bacteria used in cheeses and yogurth production in food industry. The DNA in prokaryotes is plenty of genes and is organized in a circular chromosome. Some particular bacteria have been deeply studied and are used as molecular models. O.Trelles, PhD Eukaryote cells have nucleus In the eukaryote cell some other organelles are present in the cytoplasm that surround the nucleus (the white section in our egg example) and is border by the cellular membrane that differentiates the cell from the other cells. The mitochondria organelle is present in all eukaryotes, and the chloroplast is present in all plants. These organelles are of interest because they have their own genetic material. DNA organization in eukaryotes is more complex, and we are still learning the rules for its interpretation. Organisms, as the well accepted evolutionary theory states, changes from one generation to another, by random mutations or errors during cell reproduction. Specially important in the germinal or sexual cells since mutations will pass to descendants. Mutations have substantial impacts on evolution, in particular, beneficial mutations could make the life organism longer, produce more offspring, etc. (thus mutation not necessarily means something negative). Thus, it will live long and thrive and have healthy progeny. This is called Evolution Question 1.- At the end of this session, explain why the mitochondrial DNA is inherited by maternal way (results at the end of the chapter) O.Trelles, PhD The DNA carries the hereditary information The Genetic information that living organisms transmit from parents to progeny is coded in the ADN (deoxyribonucleic acid) stored in the cell (nucleus in eukaryotes). DNA conforms a long linear polymer using 4 different molecules or monomers: Adenine, Cytosine, Guanine y Thymine (A, C, G and T) also called nucleotides or bases. If we make the analogy of a nucleotide as a colored pearl, the DNA would be a long necklace or a chain –see the image-. This chain contains the instructions in a particular language using a fourth letter alphabet, in the same way as we use a 26 letter alphabet (plus some punctuation symbols) to write our instructions. It is only a matter of language, that we are in the way to descipher O.Trelles, PhD The paired double helix organization of the DNA explains replication DNA is arranged in two long strands that form a spiral called a double helix. Both strands are complementary when one strand contains an A the other has a T (and C with G), to form units called base pairs. This important property of DNA allow it to replicate, or make copies of itself. Each strand of DNA in the double helix is used as a pattern for duplicating the sequence of bases. This is critical when cells divide because each new cell needs to have an exact copy of the DNA present in the old cell. Transcription is another important cell mechanism. It allows the partial copy of DNA to produce RNA, a more ancient molecule than DNA in which Thymine is replaced by Uracil. The RNA molecules are singlestranded (named at this point messenger RNA or mRNA) and it carries the genetic information to direct the synthesis of proteins on ribosomes. DNA replication O.Trelles, PhD The full genome of the organism is present in every cell of the organism, except in the germinal or sexual cell. A “DNA sequence” is represented as a string in a fourth letter alphabet of DNA-nucleotides. A “protein sequence” refers to the consecutive string of the 20 letters amino acid alphabet. The genome is the full genetic endowment (replicated in each cell) and can be as short as few thousands of bases, need about 200 pages in bacteria or about 28 volumes each with about 1500 pages and 1500 letters by page.. A good library, the library of life. Each chromosome can be associated o a recipes volume, with different chapters that contains instructions (genes) to produce a protein. O.Trelles, PhD The DNA is organised in chromosomes in the cell. The number of chromosomes differs along organisms During mitosis (cell reproduction), DNA is organized in X shaped molecular structures called chromosomes (most of the time, DNA is spread inside the nucleus). The double strained DNA folds as that old telephone cables spiral Each specie has a particular number of chromosomes. Prokaryotes have only one circular chromosome but also some eukaryotes (e.g. the yeast Sacharomyces Serevisiae), but in general eukaryotes have more than one chromosome. But neither the number nor the size of the genome is related to the organism complexity (even if we could define the concept of complexity for living organisms). Therefore it is better to talk about evolution. Humans have 23 pairs of chromosomes, same as hare but less than horse or dogs. Activity: Mitosis: see http://www.biologia.arizona.edu/cell/tutor/mitosis/cells3.html O.Trelles, PhD The human chromosome pair number 23 is different in males and females 22 of the 23 pairs of human chromosomes are equal in size and shape –each couple-- (named autosomes), but the last pair depends on the gender: females have 2 equal X chromosomes, while males have one X and the other Y (heterosomes). Germinal cells (ovules and sperm) have half of the genetic information (one haploid chromosome of the 23 pair of the organism) and during fecundation the new organism receives the pair (diploid). Question 2.- ¿ which pairs combination during fecundation produce a male or a female new organism? (results at the end of the chapter) O.Trelles, PhD The main function of genes is to carry out the instructions to synthetize a protein (or even several proteins) By unwinding the DNA its nucleotide composition is exposed in a paired complementary double helix. The sequence is typically read in the 5 'end (that will later be the amino terminus in the protein) to the 3' (carboxyl) and as is usually stored in databases or flat text files. In the figure above, the DNA strand would read "ACGTTGA .... ACAG ..." O.Trelles, PhD The main function of genes is to carry out the instructions to synthetize a protein (or even several proteins) Genes code for proteins. This modern model of the DNA double helix shows that the two long strands forming the backbones of the helix are made of identical sugar and phosphate molecules. Only the bases vary. Starting at a particular place of the helix, every group of three bases acts as “codon” and translates into a particular aminoacid. Each gene consist of thousand of bases and codes for one (or several alternative) protein. These proteins include thousand of enzymes, which control all the chemical reactions taking place in the body, producing growth, movement, behavior, digestion, and all other life processes; controlling every aspect of living things Analogy representing several proteins working together to close a wound (blood coagulation cascade O.Trelles, PhD Genes are dispersed along the genome Ancient prokaryotes organism organize all their genetic endowment in a circular chromosome (on the left, the genome of “Odontella sinensis”) In the Eukaryote organisms only a small fraction of DNA correspond to genes (see on the right) Scheme of the zones with genes in the mouse genome. Each band represents one of the 20 pairs of chromosomes Circular chromosome of “Odeontella” with 119,704 base pairs that code for 174 genes source: http://chloroplast.ocean.washington.edu/chloroplast_files/images/odontella_genome.png O.Trelles, PhD Central Dogma of molecular biology The central dogma of molecular biology states: (1) DNA carries the genetic information of organisms and replicates during cell division to allow each daughter cell to contain a full complement of chromosomes. (2) The genetic information in the DNA is used in a process called transcription to produce a complementary one-strand messenger of mRNA (3) mRNA is interpreted (translation) in the ribosomes using the genetic-code to produce a protein. Replication DNA Trascription RNA Translation Protein O.Trelles, PhD From Genes to Proteins Genes contains the instructions for protein synthesis. That instructions are translated by the cellular machinery using the so called genetic code that translate each consecutive codon (DNA triple) into an specific amino acid O.Trelles, PhD Messenger RNA contains only coding DNA Protein synthesis start with a copy of one of the DNA strands into RNA inside the cellular nucleus. This RNA is spliced to remove the introns (mature mRNA). Small signals for starting (donors) of introns and exons and ending points (acceptors) are used to identify the right cutting position, including the stop signals for ending the translation. To ribosomes O.Trelles, PhD The Genetic code establish the correspondence between each codon (3 consecutive DNA bases) and a given amino acid As DNA, Proteins are also linear chains but of amino acids (20 different AA). The order of the amino acid in the protein chain is the same as the order of their corresponding codons in the DNA. Translation is the mechanism by which the sequence of codons (DNA) produce a sequence of amino acids (proteins) Each combination of 3 nucleotides determine a specific amino acid. That correspondence is called the Genetic Code. Thus, the AAA codon codes for the Lysine (K) amino acid, while, the TGC codes for a Cysteine (C) See table Noteworthy observe, there are only 20 amino acids (and 3 stop signals) but up to 64 different codons (from AAA to TTT). When the initial base of a codon is unknown, there are 6 different possible coding chains (or ORF, open reading frames). O.Trelles, PhD Although the DNA is extemelly important, organisms are made of proteins. The main function of DNA is to contain the instructions to drive the synthesis of proteins (i.e. as response to external stimuli) Coarsely, organisms are made of proteins (bones, muscles, nervous… Protein function is associated to its 3D spatial conformation that allow interactions with other proteins (see on the left), forming muscles, nervous, or being used to catalyze chemical reactions. Proteins are present in food Organisms are made of proteins. Although all the DNA is present in every cell, each cell produces only those proteins the cell needs (cell specialization) (below: heparin (green) interaction with sulphate (blue) O.Trelles, PhD La forma espacial de la proteína tiene que ver con la función que desempeña Las proteínas se caracterizan por su forma espacial lo que les permite interactuar entre sí a la manera de piezas de un puzzle (figura a la izquierda: interacción de heparina (en color verde) con el sulfato (en azul) Esta forma espacial se conserve bien a lo largo de la evolución (una vez que algo funciona tiende a ser usado en adelante). Una forma de “organizar” o catalogar las proteínas es por su forma espacial o su función Los organismos están hechos de proteínas y aunque todo el ADN está en todas nuestras células, las proteínas que se producen en cada una de dichas células no son las mismas ni en las mismas cantidades. Esas diferencias hacen que las células se especialicen para formar tejidos, músculos, señales, etc. Consulte acerca de proteínas en: http://www.aula21.net/Nutriweb/proteinas.htm O.Trelles, PhD Forma 3D y función La función de una proteína está muy asociada a su forma o plegamiento tridimensional, de forma que las zonas activas quedan expuestas para una mejor interacción con otras moléculas. Por ello, al igual que en secuencia, hay motivos estructurales en las proteínas (ver figura superior); e incluso es posible hacer un catálogo de “familias” de proteínas según su plegamiento característico. Las búsquedas en bases de datos, usando métodos de comparación en 3D son también una herramienta fundamental para predecir la estructura de una proteína desconocida. O.Trelles, PhD Niveles de organización estructural de las proteinas La estructura primaria de una proteína es su secuencia (lineal) de aminoácidos. La estructura secundaria está formada por las disposiciones regulares de átomos que forman elementos característicos: hélices Alfa (a-helix), láminas Beta (ß-strands) y giros (turns). La estructura terciara de una proteína corresponde a la disposición espacial de la cadena polipeptídica. La estructura cuaternaria es la producida por varias cadenas polipeptídicas. En la figura, estructura cuaternaria del canal de potasio presente en las neuronas del cerebro de rata y que regula el paso de iones K+ a través de la membrana para el proceso de sinapsis. Está formado por 6 cadenas polipeptídicas y se aprecia el canal central que forman las 6 cadenas y que es vital para la actividad de la estructura. O.Trelles, PhD Descubriendo la estructura o forma espacial de las proteínas (a) (b) (c) Las estructuras se determinan por medio de tres grandes técnicas experimentales: (a) cristalografía de rayos X para proteínas previamente cristalizadas y que alcanza gran resolución; (b) la resonancia magnética nuclear, que permite el estudio de proteínas en disolución pero sólo de pequeño tamaño y (c) la microscopia electrónica tridimensional en la que se obtienen diferentes vistas de proyección de una molécula a través del microscopio electrónico para luego ser combinadas mediante el uso de algoritmos de reconstrucción para obtener un mapa tridimensional de la densidad de la proteína. Esta técnica se puede utilizar con grandes complejos moleculares, pero no se llega a resolución atómica salvo en casos muy favorables. O.Trelles, PhD Bases de datos de estructuras de proteínas HEADER TITLE TITLE COMPND COMPND COMPND SOURCE SOURCE KEYWDS EXPDTA AUTHOR AUTHOR REVDAT SPRSDE JRNL JRNL JRNL JRNL JRNL REMARK REMARK REMARK REMARK REMARK DBREF DBREF SEQRES SEQRES HELIX HELIX HELIX TURN SSBOND SSBOND SSBOND CRYST1 ORIGX1 SCALE1 SCALE2 MODEL ATOM ATOM ATOM HORMONE 08-OCT-96 2HIU NMR STRUCTURE OF HUMAN INSULIN IN 20% ACETIC ACID, 2 ZINC-FREE, 10 STRUCTURES MOLECULE: INSULIN; 2 CHAIN: A, B; 3 BIOLOGICAL_UNIT: HETERODIMER ORGANISM_SCIENTIFIC: HOMO SAPIENS; 2 ORGANISM_COMMON: HUMAN INSULIN, HORMONE, GLUCOSE METABOLISM NMR, 10 STRUCTURES Q.X.HUA,S.N.GOZANI,R.E.CHANCE,J.A.HOFFMANN,B.H.FRANK, 2 M.A.WEISS 1 01-APR-97 2HIU 0 01-APR-97 2HIU 1HIU AUTH Q.X.HUA,S.N.GOZANI,R.E.CHANCE,J.A.HOFFMANN, AUTH 2 B.H.FRANK,M.A.WEISS TITL STRUCTURE OF A PROTEIN IN A KINETIC TRAP REF NAT.STRUCT.BIOL. V. 2 129 1995 REFN ASTM NSBIEW US ISSN 1072-8368 2024 1 NUMBER OF NON-HYDROGEN ATOMS USED IN REFINEMENT. 1 PROTEIN ATOMS : 785 1 NUCLEIC ACID ATOMS : 0 1 HETEROGEN ATOMS : 0 1 SOLVENT ATOMS : 0 2HIU A 1 21 SWS P01308 INS_HUMAN 90 110 2HIU B 1 30 SWS P01308 INS_HUMAN 25 54 1 A 21 GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU 2 A 21 TYR GLN LEU GLU ASN TYR CYS ASN 1 1 ILE A 2 THR A 8 1 2 2 LEU A 13 TYR A 19 1 3 3 SER B 9 CYS B 19 1 1 T1 GLY B 20 GLY B 23 1 CYS A 6 CYS A 11 2 CYS A 7 CYS B 7 3 CYS A 20 CYS B 19 1.000 1.000 1.000 90.00 90.00 90.00 P 1 1 1.000000 0.000000 0.000000 0.00000 1.000000 0.000000 0.000000 0.00000 0.000000 1.000000 0.000000 0.00000 1 1 N GLY A 1 -6.132 6.735 1.016 1.00 0.00 2 CA GLY A 1 -4.686 6.753 1.376 1.00 0.00 3 C GLY A 1 -3.864 6.149 0.235 1.00 0.00 Una vez obtenida la información sobre la estructura espacial de la proteína, esta se almacena en bases de datos (por ejemplo, PDB: Protein Data Bank) en las que se incluye la posición espacial de cada uno de sus átomos lo que permite obtener la forma 3D de la estructura. 7 7 11 N C C O.Trelles, PhD Crecimiento de las bases de datos Aunque las tasas de crecimiento de las bases de datos de proteínas (secuencias en SwissProt) y estructuras (PDB) no son tan espectaculares como en el caso de secuencias de ADN, la tendencia es muy parecida. Es necesario tener en cuenta las mayores dificultades para la determinación de la estructura. Actualmente contamos con unas 200 mil secuencias de proteínas y unas 20 mil estructuras 3D. O.Trelles, PhD Rutas metabólicas Los genes y las proteínas no trabajan individualmente sino que participan en complejas reacciones bioquímicas, unas activando o inhibiendo la producción de otras, o combinándose entre ellas para poder realizar estas tareas, en lo que se conoce como “rutas metabólicas” o redes de interacción. Ejemplos típicos son las cadenas de coagulación sanguínea en la que los distintos factores de coagulación (proteínas) actúan coordinadamente para detener el sangrado. Cuestión 1.- busque en la Web información sobre la “cascada de coagulación”. Qué enfermedad produce la deficiencia de producción de los factores F8 o F9 ? (las respuestas al final de la presentación) O.Trelles, PhD Expresion de genes Las células portan el ADN y los genes con instrucciones para sintetizar proteínas. Cada proteína cumple una determinada función, sin embargo no trabajan de forma aislada sino interactuando y formando compuestos entre ella como respuesta al entorno o a sus cambios. O.Trelles, PhD La respuesta biológica Los cambios en los niveles de proteínas en las células tiene profundos efectos en la función biológica del organismo y pueden ser fuente de la alteración de procesos fisiológicos con efectos patológicos. En cada momento, los niveles de proteínas guardan relación con el estado celular o de adecuación al entorno. Por ejemplo, un organismo en reposo mostraría unos determinados niveles de proteínas, y diferentes para cada una de ellas. Si dicho organismo realiza una actividad, determinas proteínas cambiarán sus niveles para responder adecuadamente a dicha actividad (deporte) o produciendo adrenalina para escapar al peligro. Para producir cambios en los niveles de proteínas la maquinaria celular modifica proporcionalmente la actividad de los genes que controlan dicha producción. Si pudiéramos medir los niveles de proteínas en cada momento, podríamos conocer qué proteínas cambian como respuesta a un estímulo, y por tanto averiguar qué genes están involucrados en la respuesta O.Trelles, PhD Los niveles de proteínas Relación de proteínas Nivel de expresión Imaginemos que podemos medir esos niveles y obtener una lista como la mostrada (arriba) para todas las proteínas, que sería similar a aquellas que observamos cuando nos hacemos un análisis clínico, aunque ésta contendría unas 30 mil proteínas en humanos. (Nota: recordará que el médico observa los niveles “anormales” para hacer su diagnóstico e intentar restablecerlo) La imagen de la derecha representa esa lista completa. Cada línea horizontal correspondería a una determinada proteína y lo largo de la línea indicaría su “nivel” de expresión o abundancia. Nota 1: el ADN es más fácil de manipular que las proteínas. Por ello se suelen medir los niveles de expresión de los genes y considerar que los niveles de proteínas guardan proporción lineal con ellos. Nota 2: además de la respuesta a los estímulos, los niveles de abundancia de proteínas en cada célula depende de tejido en que se encuentra, es decir, algunas proteínas “se expresan” en hígado, otras en cerebro, otras en corazón etc. o mostrando distintos niveles de ello O.Trelles, PhD Cambios en los niveles de proteína Los genes modifican sus niveles de expresión en respuesta a determinados estímulos externos, o dependiendo del tejido en que se encuentran, etc. Para determinar qué genes (proteínas) están involucrados en la respuesta biológica, se suele estudiar varias muestras del organismo en la misma condición “experimental” (haciendo deporte) frente a una condición de control (reposo en la figura). En el esquema se han pintado en rojo las proteínas que han aumentado su concentración y en verde las que lo han disminuido (ver la página anterior que explica el significado de cada figura). Estas variaciones alteran las proporciones relativas de proteínas en la célula y pueden tener efectos muy profundos en las funciones biológicas en las que intervienen, siendo la razón clave para detectar las alteraciones fisiológicas o patológicas. Por ejemplo, la expresión de determinados genes en células cancerosas podría indicar que están involucrados en ese malfuncionamiento. La terapia busca reestablecer los niveles. Recuerde que lo que interesa medir es la concentración de proteínas. Esta concentración se mide de forma “indirecta” a través de la expresión de los genes y asumiendo proporcionalidad, es decir asumimos que si se observa cambios en un gen (ha doblado su producción, por ejemplo), asumimos que la proteína correspondiente también lo ha hecho O.Trelles, PhD Experimentos Los genes modifican sus niveles de expresión en respuesta a estímulos externos, o dependiendo del tejido en que se encuentran, etc. Estos cambios alteran las proporciones relativas de proteínas en la célula y pueden tener efectos muy profundos en las funciones biológicas en las que intervienen, siendo la razón clave para detectar las alteraciones fisiológicas o patológicas. Cuando un organismo no funciona correctamente se estima que los genes involucrados en el malfuncionamiento están teniendo niveles de expresión diferentes que el que tendrían en un tejido u organismo sano. Esta es la idea que subyace en los experimentos de expresión génica: detectar que genes (de un tejido enfermo, por ejemplo) tienen una expresión diferencial con respecto a un tejido de referencia (sano). En la figura inferior se muestran diferentes tejidos afectados de cáncer, de los cuales se tomarán muestras para detectar cuales son los genes involucrados en la enfermedad. Importante: Hoy en dia los experimentos de expresion han sido reemplazados por la tecnología de RNAseq O.Trelles, PhD Datos de expresión génica Control (T sTb ) r (Cs Cb ) Diana Aunque existen diferentes tecnologías (doble híbrido, affymetrix, PCR, etc); la idea general es tomar muestras de RNA de dos tejidos, o estados celulares, o en diferentes tiempos, marcarlas con cromóforos y obtener por trascripción inversa el cDNA (ADN codificante o complementario) que se hibrida competitivamente. Para ello se coloca en cada posillo una muestra de cada gen a estudiar. Luego de la hibridación (formación de ADN de doble hebra) se desnaturaliza el ADN no hibridado y se obtienen dos imágenes con un dispositivo láser de lectura. Una usando longitud de onda en verde y otra en rojo (o según los cromóforos usados), con lo cual se tiene una medida de la intensidad que se asume es proporcional al nivel de expresión de cada gen. A partir de estos valores de intensidad es posible obtener un ratio que indica –para cada gen- como se está expresando (si sobre-expresando o inhibiendo- con respecto al correspondiente gen en la muestra control. O.Trelles, PhD Aplicaciones Los genes modifican sus niveles de expresión en respuesta a determinados estímulos externos, o dependiendo del tejido en que se encuentran, etc. Estas variaciones alteran las proporciones relativas de proteínas en la célula y pueden tener efectos muy profundos en las funciones biológicas en las que intervienen, siendo la razón clave para detectar las alteraciones fisiológicas o patológicas. Cuando un organismo no funciona correctamente se estima que los genes involucrados en el malfuncionamiento están teniendo niveles de expresión diferentes que el que tendrían en un tejido u organismo sano. Esta es la idea que subyace en los experimentos de expresión génica: detectar que genes (de un tejido enfermo, por ejemplo) tienen una expresión diferencial con respecto a un tejido de referencia (sano). En la figura inferior se muestran diferentes tejidos afectados de cáncer, de los cuales se tomarán muestras para detectar cuales son los genes involucrados en la enfermedad. O.Trelles, PhD Some answers Cuestión 1.- deduzca porqué el ADN mitocondrial se transmite sólo por línea materna Aunque los espermatozoides también tienen mitocondrias solo las usan para generar la energía que necesitan para alcanzar su objetivo. Realmente solo el núcleo del espermatozoide se combina con el óvulo. En otras palabras, todos los orgánulos de la nueva célula son aportados por el óvulo o por vía materna (este hecho ha sido utilizado para trazar la progresión y dispersión de las razas alrededor del mundo. Cuestión 2.- ¿ qué combinaciones óvulo / espermatozoide dan como resultado un nuevo organismo hembra o macho ? Observe que un óvulo contendrá siempre un cromosoma X (puesto que la pareja 23 de la hembra es X-X), mientras que un espermatozoide puede portar un cromosoma X o un cromosoma Y. Si el espermatozoide con una X fertiliza el óvulo, el resultado será una hembra, mientras que si el espermatozoide afortunado porta la pareja Y, resultará un macho. Cuestión 3.- Acceda a la dirección http://www.ebi.ac.uk/embl/Services/DBStats/ (o “googling” la web buscando “estadísticas bases datos moleculares” (statistics molecular databases) y observe el ritmo de crecimiento de los datos genómicos. Debería obtener información del tipo: “This morning the EMBL Database contained 248,286,458,386 nucleotides in 156,521,233 entries”, como hoy 17 Abril 2009 (Acceder a esta información es una tarea frecuente en bioinformática) O.Trelles, PhD The distribution of course material, all assignments, submissions, markings, etc. are handled by means of BiTLAB Moodle platform. Review the contents to complement your knowledge O.Trelles, PhD