ESTRUCTURAS de PROTEINAS

Anuncio
ESTRUCTURAS de PROTEINAS
Wikimedia Commons
by LadyofHats
Paolo Maietta
Grupo de Biología Computacional Estructural
Centro Nacional de Investigaciónes
Oncológicas (CNIO)
Summer School 2013
Introducción a la Bioinformática
Bioinformática estructural
Julio 2013
 Estructura de proteínas
 Determinación experimental de la estructura
Cristalografía de rayos X
Resonancia magnética nuclear (NMR)
Microscopía electrónica 3D
 Estructura de proteínas
 Determinación experimental de la estructura
Cristalografía de rayos X
Resonancia magnética nuclear (NMR)
Microscopía electrónica 3D
Proteínas
•
•
•
•
•
Polímeros de los 20 aminoácidos naturales en conformación L
Con un número de resíduos típico entre 100 y 300, aunque pueden llegar a
más de 1000 (titina, ~34000). Por debajo de 20-30 se les llama péptidos
La mayoría de las proteínas tiene poca estructura regular, en forma de
hojas o fibrilar, y forman forman grandes agregados con misión estructural.
Proteínas estructurales (colágeno), pelo, lana, etc...
La estructura proteica se mantiene por interacciones entre los
resíduos que la componen. Enlaces de H, enlaces disulfuro, puentes
salinos. La rotura de estas interacciones por calor, cambios de pH,
conduce a la desnaturalización
Aunque hay proteínas que se pliegan con ayuda de chaperonas, es
hipótesis generalizada que la mayoría de la información para su
estructura 3D se encuentra en la secuencia.
De los aminoácidos ….
Cada aminoácido tiene unas
características físico - químicas
distintas; Estas influyen en el
plegamiento de la proteína
De los aminoácidos ….
Cada aminoácido tiene unas
características físico - químicas
distintas; Estas influyen en el
plegamiento de la proteína
Y además los aminoácidos están conectados
entre si en una cadena ….
>Estructura Primaria
ASKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTT
GKLPVPWPTLVTTFSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTIFF
KDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNV
YIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHY
LSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYK
… a la Estructura
Diagramas de Ramachandran
Pro
Gly
Matthews/Van Holde
Biochemistry, 2nd edition
α helices
α
El esqueleto de la proteína adopta una conformación de hélice y en cada giro entran
3.6 residuos.
Los enlaces de hidrógenos entre los grupos carboxilo del residuo n y el grupo amino
del residuo n+4 estabilizan la estructura.
Las hélices son flexibles y las cadenas laterales miran hacia fuera.
β strands
βa
βp
α
Los β strands se juntan para
generar β sheets gracias a la
energía de estabilización de los
enlaces de hidrógeno entre las
diferentes láminas.
Más β strands and turns ...
Los β sheets pueden estar
plegados o torcidos pero no son
flexibles !!
Los β sheets pueden contener
láminas paralelas, anti-paralelas o
una mezcla de ambas.
Más β strands and turns ...
Los β sheets pueden estar
plegados o torcidos pero no son
flexibles !!
Los β sheets pueden contener
láminas paralelas, anti-paralelas o
una mezcla de ambas.
Estructura terciaria
•
Interacciones entre resíduos.
O
C (+)
N CH
(-)
H
O
C
NH
Enlaces
disulfuro
CH
Enlaces de H
Interacciones hidrofóbicas
Puentes salinos
O
C
+
O
H N CH
3
Estructura terciaria
Interacciones con el disolvente
Hydrophobic
Hydrophilic
H-bond
!
Denaturation
Renaturation
Native (ordered, folded)
state
!
!
Denatured (unfolded)
state
Estructura terciaria
Un fold es la unidad básica de plegamiento en las proteínas.
●
Formados por varias unidades de estructura secundaria
dispuestas de una manera característica.
●
Cuando en una proteína se presentan varios folds, se habla de
dominios estructurales. Con frecuencia, un dominio
representa una parte de una proteína con una función
característica.
●
Los elementos del fold se juntan por interacciones no
covalentes, normalmente entre las cadenas laterales.
●
Existen bases de datos para la caracterización estructural de
proteínas
●
●
●
SCOP: Clasificación jerárquica hecha manualmente
CATH: Clasificación automática y supervisada visualmente.
Clase, Arquitectura, Topología, Homología
Estructura terciaria
α
Orthogonal
bundle
Updown
bundle
horseshoe solenoide α
Barril α/α
β
trefoil
Sandwich β
Barril β
4-propellor
8-propellor
α/β. Principalmente láminas B paralelas con motivo β-α-β
α+β. Principalmente láminas β antiparalelas, con zonas α y β separadas
Superroll
Tim-barrel
horseshoe
Sandwich−βαβ inmunoglobulin
Clustering jerárquico
αααα
α
α
α
α
αααα
α
α
α
α
α
α
α
ααααα
α
α
α
α
α
α
α
ααα
ααα
α
α
α
α
α
αααα
α
α
αα
αα
αα
α
αα
α
α
α
αα
αααα
α
α
α
α
αα
α
β
α
ββα
α
α
α
αααα
β
β
β
β
β
ααα
α
βββ
ααα
βββ
αααα
β
ββββ βββ
β
βββα β
β
ββββββββββββββββββββββ
β
Determinación estructura
 Estructura de proteínas
 Determinación experimental de la estructura
Cristalografía de rayos X
Resonancia magnética nuclear (NMR)
Microscopía electrónica 3D
Cristalografia de Rayos X
●
●
●
●
Fuente de Rayos X: Ánodo rotatorio. Mejor un sincrotón
Monocromador o espejos de enfoque
Goniómetro para determinar el ángulo de inclinación del cristal.
Detector de área: Usualmente placas fotográficas o dispositivos CCD
Cristalografia de Rayos X
●
●
●
●
Patrón de difracción
Los rayos X son dispersados por la
nube electrónica de los átomos de la
proteína. Cuantos más electrones tiene
un átomo, más poder de dispersión.
●
Un pequeño cristal de proteína
es expuesto a rayos X.
Los rayos difractados son
recogidos por un detector.
El resultado del experimento es
un patrón de reflexiones de
diferente intensidad
Deben recogerse muchos
patrones para cubrir todo el
espacio de orientaciones del
cristal.
Tras el procesado de los
datos, se acaba con una lista
de intensidades en una red
tridimensional de índices.
Lo que mide el detector es la
intensidad de los factores de
estructura
Cristalografia de Rayos X
●
Es la parte crítica del proceso
Subtilisina
Celulasa
Calmodulina
Toxina del tetanos
Cómo hacer un cristal
Los cristales de proteína son frágiles y
contienen alrededor de un 50 % de disolvente.
●
Se comienza con un solución concentrada
(2-50 mg/ml) y se añaden agentes
precipitantes.
●
El proceso debe ser lento y con frecuencia
hay que probar muchas condiciones.
Right : The hanging drop technique. Center : 24
such hanging drop experiments are set up in a
Linbro plate. Right : A kit of different screening
solutions, a set-up Linbro plate, dialysis buttons
and a micro batch plate behind a goniometer head.
●
Los cristales deben tener
decenas de nm. En todas
direcciones para ser útiles en
difracción.
●
Cristalografia de Rayos X
Enhebrado de secuencia de la proteína en el
mapa de densidad electrónica
NMR
Ciertos núcleos (1H, 13C, 15N, 31P) tienen momento angular ≠ 0. Bajo
campos magnéticos fuertes se puede separar los niveles de energía de
núcleos con distinto número de spin (número cuántico magnético).
el spin se va a alinear en relación al
campo, pero la absorción de radiación
electromagnética de frecuencia
apropiada
(radio) induce una transición.
Cuando los núcleos revierten al estado de equilibrio (relajación) emiten
una radiación que puede ser medida. La frecuencia exacta de esta
radiación emitida depende del entorno en el que se encuentra el
núcleo.
NMR
NMR
NMR vs Rayos X
ME
ME
●
●
●
Número limitado de
imágenes de proyección
Imágenes
de
proyección
Especimen
original
Resolución limitada
Hay mucho ruido en las
imágenes. Translacional y
rotacional
Algoritmos de
reconstrucción
Reconstrucción
tridimensional
ME
ME
Protein Data Bank
El repositorio de las
estructuras 3D
The Protein Data Bank
El wwPDB es un repositorio para estructuras de proteínas y otras macromoleculas
biológicas
El wwPDB está constituido por 4 grupos: RCSB, BRMB, PDBe y PDB-Japan. Cada
uno ofrece la misma información básica pero con presentación gráfica personalizada
y también enlazando a servicios especificos.
The Protein Data Bank
The RCSB Protein Data Bank
The RCSB Protein Data Bank
The RCSB Protein Data Bank
The RCSB Protein Data Bank
The RCSB Protein Data Bank
The RCSB Protein Data Bank
The RCSB Protein Data Bank
Sequence Tab
Uniprot Sequence
Cross-reference
Secondary
structure
The RCSB Protein Data Bank
The RCSB Protein Data Bank
Header
Chain ID
Journal
The RCSB Protein Data Bank
Atom
Residues
Co-ordinates
Chain ID
Flexibility
Documentación de referencia
http://www.wwpdb.org/docs.html
Bases de Datos basadas en
información estructural
Alineamiento estructural
Se define como la superposición de 2 o más
estructuras 3D, intentando que cuantos más
átomos coincidan
Normalmente los programas tienen en cuenta
principalmente de los carbonos alpha
Los alineamientos de estructuras no son
alineamientos de secuencias, pero a partir de
ellos se pueden obtener
Los alineamientos estructurales además son
importantes para comparaciones evolutivas y
estudios funcionales
Existen distintos métodos, cada uno
basado en ideas distintas.
For example,
DALI (contact maps),
Mammoth (secondary structure),
SSAP (dynamic programming)
LGA (longest segment).
SCOP (Structural Classification of Proteins)
La base de datos proporciona una detallada descripción de las relaciones
estructurales entre proteínas. Está curada manualmente.
FOLD: Major structural similarity.
Proteins are defined as having a
common fold if they have the same
secondary structures arrangement
and the same topological
connections.
SUPERFAMILY: Probable common
evolutionary origin. Proteins often
have low sequences identities, but
structural and functional features
suggest a common evolutionary
origin.
FAMILY: Clear evolutionary
relationship. Proteins in families are
clearly evolutionarily related.
Generally the pairwise residue
identities are greater than 30%.
The CATH Database
Es la misma idea de SCOP, pero la clasificación es distinta y hay 4 niveles.
La clasificación de CATH se lleva a cabo de forma semi-automática
Class: Secondary structure and packing
Architecture: overall shape, domain
structure and orientation (no connectivities
between the secondary structures)
Topology (FOLD family): overall shape and
connectivities.
Homologous superfamily: proteins are
thought to share common ancestor.
Similarities by sequence alignment and then
by structure comparison using the SSAP
structural alignment program.
CATH & SCOP statistics
FIN (xFIN)
=
2
FIN
Descargar