Regresión Supervisado Es un subconjunto del manchine learning y su principal objetivo es generar modelos para predecir resultados. Los modelos se realizan a partir de datos conocidos y etiquetados y se obtiene un resultado que también es conocido y etiquetado. KNN Se trata de dar una predicción a partir de un conjunto de datos pasados. Los datos son continuos y no discretos Se trata de un algoritmo de clasificación, este algoritmo consiste en seleccionar un valor para "k" que se refiere al número de vecinos que se tomarán en cuenta Para esto, el algoritmo construye un modelo basado en las características y los valores de salida de los datos de entrenamiento y este modelo se usa para predecir los valores para nuevos datos. ¿Cómo funciona? Ejemplos de aplicación *Predecir el precio de una vivienda *Predecir cantidades de compra *Predecir ingresos a partir de una campaña de marketing Teniendo el punto que se quiere predecir, se calcula la distancia a los demás datos, después, se toma el valor de "k" como el número de vecinos que se tendrán en cuenta. Por último, cada vecino "vota" por el grupo al que pertenece. El grupo que gane será el resultado de la predicción. ¿Cómo funciona? En la clasificación de imágenes en diferentes categorías como animales, plantas, etc. Ejemplos de aplicación Algoritmos Máquinas de soporte vectorial Se trata de una técnica usada para predecir variables continuas dependientes a partir de un grupo de variables continuas independientes. Estima los coeficientes de la línea que se ajustan mejor a los datos. Estos coeficientes se utilizan para predecir la variable dependiente en función de las variables independientes. *Análisis de demanda de productos: se pueden utilizar variables como la temporada, la publicidad para predecir la demanda de un producto. *Análisis de la relación entre la salud y el estilo de vida: se pueden utilizar variables como la dieta, el ejercicio, para predecir la incidencia de enfermedades crónicas. Ejemplos de aplicación ¿Cómo funciona? Agrupamiento o Clustering (Kmeans) Aprendizaje Supervisado y No supervisado No Supervisado Es otro método de machine learning, en este método, los datos de entrada no presentan etiquetas. El principal objetivo es encontrar subgrupos que compartan caraterísticas. *Análisis de texto: Clasifica documentos en diferentes categorías, como noticias, correo electrónico, spam *Clasificación de genes: Clasificar genes en diferentes categorías basadas en su función y expresión. Ejemplos de aplicación ¿Cómo funciona? Regresión Lineal Funcionan separando los datos en diferentes categorías mediante una línea o hiperplano que maximiza la distancia entre las categorías. ¿Cómo funciona? Se trata de un algoritmo que se enfoca en encontrar la mejor frontera de separación entre dos o más clases de datos, el algoritmo genera un hiperplano óptimo que clasifica los datos. Organiza los datos en distintos clústeres según la distancia de los datos con respecto al centroide de un clúster. Se define el número de grupos que se quieren obtener; este será el número de centroides, después, el algoritmo coloca los centroides de forma aleatoria en un plano, seguido de esto, calcula la distancia entre el centroide y los demás puntos, si el punto está más cercano al centroide uno, entonces se asigna al centroide 1, si no, se asigna del grupo 2, por último se ubica cada centroide en la media de los demás puntos de su grupo y se da otra iteración para volver a asignar a todos los puntos. Esta iteración se hace una y otra vez hasta que los centroides quedan fijos. Ejemplos de aplicación *Segmentación de clientes en marketing para agrupar los clientes según características demográficas y su comportamiento de compra. *Análisis de imágenes: se pueden agrupar imágenes similares en clusters para mejorar la eficiencia en la búsqueda de imágenes y facilitar la clasificación automática Algoritmos ¿Cómo funciona? Ximena Armas Cuatecontzi 8°A 3 de febrero 2023 Agrupamiento jerárquico Crea un árbol de clústeres .El algoritmo nos dice todas las combinaciones posibles de elementos dependiendo de la jerarquía de distancias entre los puntos. Ejemplos de aplicación Se utilizan datos etiquetados, las etiquetas son esenciales para el entrenamiento. Datos Es objetivo es predecir la variable de salida a partir de las variables de entrada. Objetivo Supervisado Resultado Uso Se conoce el resultado Se utiliza cuando se conoce la relación entre las variables y se desea hacer predicciones sobre una variable dependiente Aprendizaje Es un proceso dirigido y busca una solución específica Supervisado Vs No Supervisado Se usan datos no etiquetados, las etiquetas no son necesarias Datos Resultado Uso Solamente se incluye la variable independiente El objetivo es encontrar patrones o estructuras en los datos que permitan agrupar los datos en categorías similares. Objetivo No Supervisado Incluyen las variables dependientes e independientes No se conoce el resultado Se utiliza cuando se desconoce la relación entre las variables y se busca explorar y entender la estructura de los datos. Aprendizaje Se trata de un proceso de exploración que busca patrones El algoritmo analiza las distancias entre 2 observaciones. Mientras menor sea la distancia entre las observaciones menor será la jerarquía. El algoritmo va buscando los elementos con menor distancia, los compara y crea distintos grupos, después de esto, el algoritmo va creando jerarquías más grandes hasta que crea una jerarquía que engloba todos las otras jerarquías. Por último, la agrupación se realiza por la distancia calculada *Análisis de redes sociales: se pueden agrupar usuarios similares en comunidades en función de sus relaciones y comportamientos en la red social. *Clasificación de productos en un sitio web: se pueden agrupar productos similares en categorías y subcategorías para mejorar la experiencia de navegación y búsqueda del usuario.