An lisis y predicci n de caracteres complejos utilizando m todos de regresi n de genoma completo

Anuncio
FORMULARIO DE PROPUESTA DE ASIGNATURAS
(curso, seminario, taller, otros)
1.Datos generales de la asignatura
Nombre de la asignatura
Análisis y predicción de caracteres complejos utilizando métodos de
regresión de genoma completo.
Abreviación para Bedelía (41
caracteres como máximo)
Análisis y Predicción Genómica
Nombre de la asignatura en
Inglés
Analysis & Prediction of Complex Traits Using
Whole-Genome Regression Methods
Pregrado
Grado
Educación
Permanente
Cupos
Carreras
(Marque las que corresponda)
Nivel
Tec. Agroenergético
Tec. Cárnico
Lic. en Diseño de Paisaje
Ingeniero Agrónomo
Mínimo
Tec. de la Madera
Lic. en Viticultura y Enología
Ingeniero de Alimentos
Marque si este curso es ofrecido exclusivamente como EP
Diploma y Maestría en Agronomía
Posgrados
Profesionales
Diploma y Maestría en Desarrollo Rural
Sustentable
Académicos
Maestría en Ciencias Agrarias
5
CUPO TOTAL
Modalidad
de
dictado
de
la
asignatura:
(Marque con X lo que corresponda)
A distancia
Presencial
X
2.Equipo docente
Docente responsable
Nombre (incluir el título académico):
Cargo
(especificar
grado
dedicación horaria global):
Ing. Agr. (Ph.D.) Gustavo de los Campos (Docente)
docente, Assistant Professor, Department of Biostatistics, University of
Alabama at Birmingham, USA
Otros Docentes participantes
Nombre (incluir el título académico):
Cargo
(especificar
grado
dedicación horaria global):
Ph.D. Daniel Gianola (Docente)
docente, Professor, Department of Animal Sciences
Institución y país:
Wisconsin University, USA
Docentes colaboradores:
Nombre (incluir el título académico):
Cargo
(especificar
grado
dedicación horaria global):
Institución y país:
Ing. Agr. (Ph.D.) Lucia Gutierrez (Coordina curso)
docente, G4, DT
FAGRO, UdelaR
3.Programa de la asignatura
Objetivos
Generales
Introducir diferentes modelos estadísticos para la predicción genómica.
Específicos
a.Introducir los conceptos genéticos y estadísticos fundamentales
asociados a la predicción de valores genéticos utilizando información
genómica.
b.Introducir los conceptos y modelos asociados a la predicción
genética con modelos paramétricos (Bayesian Ridge Regression, GBLUP, Bayesian Lasso, BayesA-B&-C)
c.Introducir los conceptos y modelos asociados a la predicción
genética con métodos semi paramétricos (RKHS, Neural-Networks).
d.Ilustrar el uso de modelos paramétricos y semi paramétricos usando
software disponible de forma gratuita y datos reales.
Unidades Temáticas
1. Introduction and glossary. Basic tenets of quantitative and molecular genetics. Predictive inference.
Cross-validation. Overview of some penalized methods.
2.
Review of least-squares and maximum likelihood. Best linear unbiased prediction
3.
Brief overview of Bayesian inference, MCMC and Bayesian regression
4.
Challenges from complexity and use of “phenomic “data
5.
Genomic BLUP; the Bayesian alphabet (Bayes A, B, C, Bayesian Lasso, Bayes R)
6.
The problem of dealing with gene-gene-gene-….-gene interactions
7.
Introduction to non-parametric regression: LOESS, kernel regression, RKHS, and neural networks.
8.
GWAS and pitfalls (Genome-wide association study)
9.
Results from animals, plant and human studies (student presentation will address these, mostly)
Computer Labs
LAB1: Variable Selection Using Single Marker Regression
1.1. Linear models and ordinary least squares
1.2. Sampling Properties of Ordinary Least Squares Estimates
1.3. Variable Selection Using Single Marker Regressions
LAB2: Shrinkage Estimation
2.1. Penalized Estimates
2.2. Effect of regularization on estimates, goodness of fit and model DF
2.3. Bayesian View of Ridge Regression
2.4. The Genomic Best Linear Unbiased Predictor (G-BLUP)
LAB3: The ‘Bayesian Alphabet’
3.1. The Bayesian Alphabet
3.2. Joint modeling of genetic and non-genetic effects
LAB4: Semi-parametric Genomic Regression Using Kernel Methods
4.1. Reproducing Kernel Hilbert Spaces (RKHS) regressions
4.2. Scatter plot smoothing with a Gaussian kernel
4.3. Bayesian view of RKHS
4.4. Genomic-Enabled Prediction Using RKHS
4.5. Kernel Averaging
LAB 5: Penalized Neural Networks
5.1. Introduction
5.2. Scatter-plot smoothing using a penalized NN
5.3. Penalized Neural Network Using Pre-selected Markers
5.4. Penalized Neural Networks Using Marker-derived Basis Functions as Inputs
Metodología
Clases teóricas y ejemplos prácticos serán discutidos.
Evaluación
Pregrado/
Grado
Sistema de prueba de evaluación
Evaluación continua
Pruebas parciales
Pruebas parciales y
Seminario
trabajo
Monografía
Revisión bibliográfica
Trabajos prácticos
Exoneración (*)
Otros (especificar):
Posgrado y
Educación
Permanente
Presentación de trabajo final
(*)Reglamento del Plan de Estudio de Ingeniero Agrónomo. Artículo Nº15, literal B "...al menos el 80% del puntaje exigido ...y
más el 50% del puntaje de cada prueba de evaluación...".
Bibliografía
References Linear-Models
Akaike, H. 1973. “Information Theory and an Extension of the Maximum Likelihood Principle.” In Second
International Symposium on Information Theory, 1:267–281.
de los Campos, G., and P. Pérez. 2010. BLR: Bayesian Linear Regression. R Package Version 1.2.
http://cran.r-project.org/web/packages/BLR/index.html.
Hoerl, A. E, and R. W Kennard. 1970. “Ridge Regression: Biased Estimation for Nonorthogonal Problems.”
Technometrics 12 (1): 55–67.
Pérez, Paulino, Gustavo de los Campos, José Crossa, and Daniel Gianola. 2010. “Genomic-Enabled
Prediction Based on Molecular Markers and Pedigree Using the Bayesian Linear Regression
Package in R.” The Plant Genome Journal 3 (2): 106–116. doi:10.3835/plantgenome2010.04.0005.
References Penalized Regression
Frank, I.E., and J.H. Friedman. 1993. “A Statistical View of Some Chemometrics Regression Tools.”
Technometrics: 109–135.
Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. 2009. The Elements of Statistical Learning: Data
Mining, Inference, and Prediction, Second Edition. 2nd ed. 2009. Corr. 3rd printing 5th Printing.
Springer.
Hoerl, A. E, and R. W Kennard. 1970. “Ridge Regression: Biased Estimation for Nonorthogonal Problems.”
Technometrics 12 (1): 55–67.
Tibshirani, R. 1996. “Regression Shrinkage and Selection via the Lasso.” Journal of the Royal Statistical
Society. Series B (Methodological) 58 (1): 267–288.
Zou, H., and T. Hastie. 2005. “Regularization and Variable Selection via the Elastic Net.” Journal of the
Royal Statistical Society: Series B (Statistical Methodology) 67 (2): 301–320.
References Bayesian Alphabet
de los Campos, Gustavo, John M. Hickey, Ricardo Pong-Wong, Hans D. Daetwyler, and Mario P. L.
Calus. 2012. “Whole Genome Regression and Prediction Methods Applied to Plant and Animal
Breeding.”
Genetics
(June
28).
doi:10.1534/genetics.112.143313.
http://www.genetics.org/content/early/2012/06/28/genetics.112.143313.
George, E.I., and R.E. McCulloch. 1993. “Variable Selection via Gibbs Sampling.” Journal of the
American Statistical Association: 881–889.
Habier, D., R. Fernando, K. Kizilkaya, and D. Garrick. 2011. “Extension of the Bayesian Alphabet for
Genomic Selection.” BMC Bioinformatics 12 (1): 186.
Ishwaran, H., and J. S Rao. 2005. “Spike and Slab Variable Selection: Frequentist and Bayesian
Strategies.” The Annals of Statistics 33 (2): 730–773.
Meuwissen, T H, B J Hayes, and M E Goddard. 2001. “Prediction of Total Genetic Value Using
Genome-wide Dense Marker Maps.” Genetics 157 (4) (April): 1819–1829.
Park, T., and G. Casella. 2008. “The Bayesian Lasso.” Journal of the American Statistical Association
103 (482): 681–686.
Pérez, Paulino, Gustavo de los Campos, José Crossa, and Daniel Gianola. 2010. “Genomic-Enabled
Prediction Based on Molecular Markers and Pedigree Using the Bayesian Linear Regression
Package
in
R.”
The
Plant
Genome
Journal
3
(2):
106–116.
doi:10.3835/plantgenome2010.04.0005.
References RKHS
de los Campos, G., D. Gianola, G. J. M. Rosa, K. A Weigel, and J. Crossa. 2010. “Semi-parametric
Genomic-enabled Prediction of Genetic Values Using Reproducing Kernel Hilbert Spaces
Methods.” Genetics Research 92 (04): 295–308.
de los Campos, G., D. Gianola, and G. J.M Rosa. 2009. “Reproducing Kernel Hilbert Spaces
Regression: a General Framework for Genetic Evaluation.” Journal of Animal Science 87 (6):
1883.
Cressie, N. 1988. “Spatial Prediction and Ordinary Kriging.” Mathematical Geology 20 (4): 405–421.
Gianola, D., R.L. Fernando, and A. Stella. 2006. “Genomic-Assisted Prediction of Genetic Value With
Semiparametric
Procedures.”
Genetics
173
(3)
(July
1):
1761–1776.
doi:10.1534/genetics.105.049510.
Gianola, D., and J. B van Kaam. 2008. “Reproducing Kernel Hilbert Spaces Regression Methods for
Genomic Assisted Prediction of Quantitative Traits.” Genetics 178 (4): 2289.
Vapnik, V. N. 1998. “Statistical Learning Theory.”
Wahba, G. 1990. “Spline Methods for Observational Data.” SIAM: Philadelphia.
References Neural-Networks
Craven, P., and G. Wahba. 1978. “Smoothing Noisy Data with Spline Functions.” Numerische Mathematik
31 (4): 377–403.
Gianola, D., H. Okut, K. Weigel, and G. Rosa. 2011. “Predicting Complex Quantitative Traits with
Bayesian Neural Networks: a Case Study with Jersey Cows and Wheat.” BMC Genetics 12 (1): 87.
Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. 2009. The Elements of Statistical Learning: Data
Mining, Inference, and Prediction, Second Edition. 2nd ed. 2009. Corr. 3rd printing 5th Printing.
Springer.
Wahba, G. 1991. “Spline Functions for Observational Data.” SIAM, Philadelphia, PA.
Frecuencia con que se ofrece la asignatura
(anual, cada dos años, a demanda)
Cada 2 años
Cronograma de la
asignatura
Año:
2014
Semestre:
3
Bimestre
Fecha de inicio
15 Dic.
Fecha de finalización
19 Dic.
Días y Horarios
Localidad:
Montevideo
Salón: a
confirmar
Lunes a viernes de
8:30 a 17hs
Asignatura presencial - Carga horaria (hs. demandada al estudiante)
Exposiciones Teóricas
Talleres
Actividades Grupales o
individuales de preparación
de informes
Otras (indicar cual/es)
Total
20
10
Teórico - Prácticos
Seminarios
Presentaciones orales,
defensas de informes o
evaluaciones
40
Asignatura a distancia (indique recurso a utilizar)
10
Prácticos (campo o laboratorio)
Excursiones
Lectura o trabajo domiciliario
Video-conferencia:
Localidad emisora
Plataforma Educativa (AGROS u otra)
Materiales escritos
Internet
Total de horas (equivalente a presencial):
Localidad receptora
Interservicio (indique cuál/es)
Otros datos de interés:
El curso será ofrecido en español, pero todo el material estará disponible en inglés. Es requisito para
cursar poseer conocimientos de genética, genética cuantitativa y modelos lineales.
POR FAVOR NO COMPLETE LA SIGUIENTE INFORMACIÓN, la misma será completada por
las Unidades Técnicas (UE / UPEP / Bedelía)
Créditos de Grado:
Código
Grado:
de
la
asignatura
Resolución del Consejo
cursos de Grado Nº:
Año que entra en vigencia:
Departamento o Unidad:
Créditos de Posgrados:
de
para
Código de la asignatura de Posgrado:
Resolución del CAP para cursos de
Posgrados:
Descargar