Subido por Ximena Armas

Aprendizaje Supervisado y No supervisado

Anuncio
Regresión
Supervisado
Es un subconjunto del manchine learning y
su principal objetivo es generar modelos
para predecir resultados.
Los modelos se realizan a partir de datos
conocidos y etiquetados y se obtiene un
resultado que también es conocido y
etiquetado.
KNN
Se trata de dar una predicción a partir
de un conjunto de datos pasados.
Los datos son continuos y no discretos
Se trata de un algoritmo de clasificación, este
algoritmo consiste en seleccionar un valor
para "k" que se refiere al número de vecinos
que se tomarán en cuenta
Para esto, el algoritmo construye un modelo basado en las características y los
valores de salida de los datos de entrenamiento y este modelo se usa para predecir
los valores para nuevos datos.
¿Cómo funciona?
Ejemplos de aplicación
*Predecir el precio de una vivienda
*Predecir cantidades de compra
*Predecir ingresos a partir de una campaña de marketing
Teniendo el punto que se quiere predecir, se calcula la distancia a los demás datos,
después, se toma el valor de "k" como el número de vecinos que se tendrán en cuenta.
Por último, cada vecino "vota" por el grupo al que pertenece.
El grupo que gane será el resultado de la predicción.
¿Cómo funciona?
En la clasificación de imágenes en diferentes categorías como
animales, plantas, etc.
Ejemplos de aplicación
Algoritmos
Máquinas de soporte vectorial
Se trata de una técnica usada para predecir
variables continuas dependientes a partir de un
grupo de variables continuas independientes.
Estima los coeficientes de la línea que se ajustan mejor a los datos. Estos coeficientes
se utilizan para predecir la variable dependiente en función de las variables
independientes.
*Análisis de demanda de productos: se pueden utilizar variables como la
temporada, la publicidad para predecir la demanda de un producto.
*Análisis de la relación entre la salud y el estilo de vida: se pueden utilizar variables
como la dieta, el ejercicio, para predecir la incidencia de enfermedades crónicas.
Ejemplos de aplicación
¿Cómo funciona?
Agrupamiento o Clustering (Kmeans)
Aprendizaje
Supervisado y No
supervisado
No Supervisado
Es otro método de machine learning,
en este método, los datos de entrada
no presentan etiquetas.
El principal objetivo es encontrar
subgrupos que compartan
caraterísticas.
*Análisis de texto: Clasifica documentos en diferentes categorías,
como noticias, correo electrónico, spam
*Clasificación de genes: Clasificar genes en diferentes categorías
basadas en su función y expresión.
Ejemplos de aplicación
¿Cómo funciona?
Regresión Lineal
Funcionan separando los datos en diferentes categorías mediante una
línea o hiperplano que maximiza la distancia entre las categorías.
¿Cómo funciona?
Se trata de un algoritmo que se enfoca en
encontrar la mejor frontera de separación
entre dos o más clases de datos, el
algoritmo genera un hiperplano óptimo
que clasifica los datos.
Organiza los datos en distintos clústeres
según la distancia de los datos con
respecto al centroide de un clúster.
Se define el número de grupos que se quieren obtener; este será el número de
centroides, después, el algoritmo coloca los centroides de forma aleatoria en un
plano, seguido de esto, calcula la distancia entre el centroide y los demás puntos,
si el punto está más cercano al centroide uno, entonces se asigna al centroide 1, si
no, se asigna del grupo 2, por último se ubica cada centroide en la media de los
demás puntos de su grupo y se da otra iteración para volver a asignar a todos los
puntos. Esta iteración se hace una y otra vez hasta que los centroides quedan fijos.
Ejemplos de aplicación
*Segmentación de clientes en marketing para agrupar los clientes según
características demográficas y su comportamiento de compra.
*Análisis de imágenes: se pueden agrupar imágenes similares en clusters para
mejorar la eficiencia en la búsqueda de imágenes y facilitar la clasificación
automática
Algoritmos
¿Cómo funciona?
Ximena Armas Cuatecontzi 8°A
3 de febrero 2023
Agrupamiento jerárquico
Crea un árbol de clústeres .El algoritmo nos dice todas
las combinaciones posibles de elementos dependiendo
de la jerarquía de distancias entre los puntos.
Ejemplos de aplicación
Se utilizan datos etiquetados, las etiquetas son
esenciales para el entrenamiento.
Datos
Es objetivo es predecir la variable de salida a partir de las variables de
entrada.
Objetivo
Supervisado
Resultado
Uso
Se conoce el resultado
Se utiliza cuando se conoce la relación entre las variables y se desea
hacer predicciones sobre una variable dependiente
Aprendizaje
Es un proceso dirigido y busca una solución específica
Supervisado Vs No Supervisado
Se usan datos no etiquetados, las etiquetas
no son necesarias
Datos
Resultado
Uso
Solamente se incluye la variable independiente
El objetivo es encontrar patrones o estructuras en los datos que permitan agrupar los
datos en categorías similares.
Objetivo
No Supervisado
Incluyen las variables dependientes e independientes
No se conoce el resultado
Se utiliza cuando se desconoce la relación entre las variables y se busca explorar y entender la
estructura de los datos.
Aprendizaje
Se trata de un proceso de exploración que busca patrones
El algoritmo analiza las distancias entre 2 observaciones. Mientras menor sea la
distancia entre las observaciones menor será la jerarquía. El algoritmo va buscando
los elementos con menor distancia, los compara y crea distintos grupos, después
de esto, el algoritmo va creando jerarquías más grandes hasta que crea una
jerarquía que engloba todos las otras jerarquías.
Por último, la agrupación se realiza por la distancia calculada
*Análisis de redes sociales: se pueden agrupar usuarios similares en
comunidades en función de sus relaciones y comportamientos en la red
social.
*Clasificación de productos en un sitio web: se pueden agrupar productos
similares en categorías y subcategorías para mejorar la experiencia de
navegación y búsqueda del usuario.
Descargar