Formato de Artículo de Semillero o investigación TÍTULO: Influencia de la Inteligencia Artificial en la proyección de presupuestos. TITLE: Influence of Artificial Intelligence on budget projection. Autor 1: Norma Yohanna Vidales Rincon Programa de Contaduría pública virtual, Facultad de Ciencias Económicas y Administrativas, Universidad El Bosque, Bogotá Correo electrónico: [email protected] Director Héctor Rodrigo Ospina Estupiñán Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 1 | 29 Resumen y abstract: Propósito: El presente estudio tiene como propósito documentar la influencia que genera la inteligencia artificial sobre la proyección de presupuestos y la forma en que trata de mejorar los procesos presupuestarios en las compañías que aun utilizan los métodos tradicionales. Diseño / metodología / enfoque: En el presente estudio el (los) autor(es) utilizó (utilizaron) como instrumento… (Enunciar brevemente cómo se hizo el estudio: Entrevistas, grupos focales, revisión documental, etc. No más de cuarenta palabras). Estos aspectos sólo para cuando la investigación ha terminado (no para el proyecto). Hallazgos: Resaltar los resultados más sobresalientes. No más de cuarenta palabras. Limitaciones / implicaciones de la investigación: En dos o tres oraciones, describir el tema y el motivo de la revisión, incluir alguna tendencia o perspectiva emergente que surja de su revisión o estudio. Para el caso de revisiones de la literatura, en dos o tres oraciones, describir el tema y el motivo de la revisión, incluir alguna tendencia o perspectiva emergente que provoque su revisión o surja de su revisión. Palabras claves: Presupuesto, inteligencia artificial, aprendizaje automático, proyección. Keywords: Budget; artificial intelligence; automatic learning Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 2 | 29 Introducción La introducción del artículo científico es la parte que hace referencia a la apertura del mismo, situando al lector en contexto y exponiendo, entre otras cosas, el tema que se va a tratar, el problema de investigación, los antecedentes en los que se basa el estudio, los objetivos, el valor del trabajo realizado, así como su justificación y aporte final. Es por ello la parte del artículo que resume en qué consiste el mismo, incorporando una síntesis de sus aspectos más determinantes. La introducción debe contener al menos los siguientes datos: ● Definición del problema: Se debe abordar la naturaleza y el alcance del problema de investigación, de manera concisa, enunciando la pregunta de investigación o las hipótesis que desean ser testeadas. ● Objetivos: deben estar en concordancia con la pregunta o hipótesis de investigación y ser coherente con el resto del artículo. ● Importancia del tema: Debe introducirse el qué y el porqué del trabajo realizado, soportado por una bibliografía actual y robusta, y destacándose el valor académico del mismo. También debiera establecerse la delimitación del tema por razones de espacio editorial, recursos investigativos, o de otra índole, si fuera pertinente. En este aparte debe incluir por lo menos los siguientes aspectos: ✔ Implicaciones prácticas: Esta investigación será de gran utilidad para aquellos estudiantes y empresarios que deseen aprenden sobre modelos de inteligencia artificial aplicados a la gestión financiera, con el objetivo de predecir, clasificar y simplificar procesos. ✔ Implicaciones sociales: Los beneficiarios serán aquellos empresarios que deseen aplicar este tipo de modelos de inteligencia artificial a sus procesos de proyección presupuestaria, tomando como base el estudio documental de la investigación. ✔ Originalidad / valor: Se encuentran muy pocas publicaciones científicas o tesis que daten al respecto sobre la influencia de la inteligencia artificial con los modelos presupuestarios existentes. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 3 | 29 ● Antecedentes: Para la búsqueda de los artículos pertinentes como apoyo teórico para la investigación en curso se utilizaron buscadores y gestores de bases de datos como ScienceDirect, Scopus, Pubmed, ProQuest, Springer, Redalyc, Biblioteca Juan Roa Vásquez, Google Académico para la búsqueda digital se insertaron las siguientes palabras claves: Búsqueda Presupuestos Inteligencia Artificial aprendizaje automático Google Acad. Total 32.532 Bib. Juan Roa V 83 654.000 858.608 3.649 1.874 33 130.000 189.207 44 183 1 143.000 149.112 Science Direct Scopus Pubmed ProQuest Springer Redalyc 3.516 160 24 167.561 732 1.404 260 249 51.738 565 282 9 5.028 con estas palabras clave la búsqueda se hacía muy extensa así que se tomó la decisión de con operadores booleanos delimitar la búsqueda para empezar a filtrar, así que la búsqueda inicio nuevamente con las siguientes frases y operadores booleanos, Presupuesto AND Inteligencia AND artificial donde de acuerdo con las bases de datos anteriormente consultadas solo le hallaron resultados en: Búsqueda avanzada Presupuesto AND Inteligencia AND artificial Presupuesto AND aprendizaje AND automático Proyección AND presupuestal AND inteligencia AND artificial Science Direct Scopus ProQuest Springer Google Acad. Total 37 9 2.740 8 39.000 41.794 35 - 436 10 16.700 17.181 - - 28 - 322 350 Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 4 | 29 Tabla 1. Estado del arte Título Estudio de la gestión del presupuesto en el ISMMM utilizando minería de datos Aplicación de la Ciencia de Datos para la predicción de la Demanda Financial Forecasting Using Machine Learning Análisis comparado de técnicas de aprendizaje automático con la regresión logística en la detección de procesos de dificultad financiera en la empresa española. Bitcoin financial forecasting Año de Publicación Autor Yiezenia Rosario Ferrer, Yanelis Gé Guilarte Marta Pérez Ramis 2013 2017 2016 Solomon Addai Pedro Carmona Ibáñez, Julián Martínez Vargas, José Pozuelo Campillo 2016 Amit Chauhan, Manish Kumar, Vinay Kumar Saini 2019 Presupuestos Enfoque de gestión, planeación y control de recursos Jorge E. Burbano Ruiz 2010 Elaboración de los presupuestos generales y estado de resultados en la empresa industrial "xx" en sus operaciones trimestrales. Peñafiel Cruz Diana Dennisse 2019 Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 5 | 29 Desarrollo de un software para la gestión de proyectos de desarrollo PM4R que permita automatizar la etapa de planificación para estimar tiempos a través de algoritmos de aprendizaje automático. * Jorge Enrique Espinoza Muñoz 2019 Evaluación de un modelo de predicción del gasto farmacéutico en atención primaria de salud basado en variables demográficas Sonia Santamargarita-Pérez, Carla Sancho-Mestre, David VivasConsuelo, Ruth Usó-Talamantes 2013 Análisis, evaluación y predicción de riesgos financieros mediante métodos de aprendizaje automático * Institute of new imaging technologies 2018 Machine Learning, una pieza clave en la transformación de los modelos de negocio * Management Solutions 2019 Fernando Pavón Pérez 2016 Propuesta de un modelo de elaboración de presupuesto sistematizado, para la adecuada toma de decisiones gerenciales de la compañía Agrovictoria S.A. productora y exportadora de banano ubicado en la ciudad de Guayaquil * Mendoza Silva Zoila Isabel 2018 Estudio y predicción de activos financieros mediante redes neuronales * Fernando Santamaría Vázquez 2019 Modelos predictivos para el mercado FOREX Alejandro Huertas López 2015 Generación de Conocimiento basado en Aprendizaje Automático y Aplicación en Diferentes Sectores. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 6 | 29 Identificación Predictiva de Fallos POS A Través del Uso de Algoritmos de Aprendizaje Automático Carlos Huérfano Lenis 2020 Una mirada al presupuesto anual de ventas de rautenstrauch & villers a partir de los números borrosos: el manejo de la incertidumbre y la subjetividad Fabián Alberto Castiblanco Ruiz 2014 Presupuestos, planificación y control Welsch Hilton Gordon Rivera 2005 Tras realizar una exhaustiva búsqueda de 322 investigaciones a nivel europeo y Latinoamericano relacionado con el tema de proyección presupuestaria con inteligencia artificial, se han resaltado 50 investigaciones por ser de naturaleza mixta que dan luz a este estudio, aportando variables que influyen de manera directa e indirecta al mismo, finalmente para el análisis de información se incluyeron los 7 artículos de alta significancia por sus directos aportes a la investigación, aportes que se citan a continuación: Estudio de la gestión del presupuesto en el ISMMM utilizando minería de datos de los autores Yiezenia Rosario Ferrer, Yanelis Gé Guilarte (2013) tiene como objetivo realizar el descubrimiento de conocimiento oculto en los datos del presupuesto almacenados desde el 2004, registrados en documentos en formato Excel, por medio del uso de las técnicas obtención de modelos para lograr mejoras en el proceso de elaboración del presupuesto en el ISMMM. El proceso de obtención de conocimiento fue realizado utilizando la metodología CRISP-DM y a la herramienta de análisis de datos WEKA. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 7 | 29 Aplicación de la Ciencia de Datos para la predicción de la Demanda de Marta Pérez Ramis (2017), tiene como objetivo partir de la aplicación de Ciencias de Datos mediante el empleo de la herramienta de programación Python en distintos algoritmos de regresión para identificar la tendencia del mercado mediante las distintas variables del modelo recogido en el histórico. La predicción de las distintas variables de conteo de la demanda se establecerá a través de la aplicación de los algoritmos de Machine Learning sobre los modelos de regresión. Evaluando, mediante distintas métricas de puntuación, la aproximación de los modelos de ajustes a los datos, calculados a partir de los algoritmos de predicción, a los valores históricos. Financial Forecasting Using Machine Learning, de Solomon Addai (2016) tiene como propósito aplicar cinco técnicas diferentes para predecir el movimiento de los rendimientos diarios del índice bursátil Standard and Poor 500 (S&P 500) con técnicas son la Red Neuronal Artificial (RNA), el modelo Logit, Análisis Discriminante Lineal (LDA), Análisis Discriminante Cuadrático (QDA) y Vecino KCercano clasificación del capó (KNN). Los resultados mostraron que la RNA se desempeñó relativamente mejor en las clasificaciones de los movimientos ascendentes y descendentes de los retornos que las otras técnicas. Análisis comparado de técnicas de aprendizaje automático con la regresión logística en la detección de procesos de dificultad financiera en la empresa española por los autores Pedro Carmona Ibáñez, Julián Martínez Vargas, José Pozuelo Campillo (2016) tiene como objetivo analizar nuevos modelos de predicción de fracaso empresarial basados en las técnicas del AdaBoost y del “Gradient Boosting Machine” (GBM) con la técnica Logit, con objeto de determinar si añade mejoras en eficacia y precisión. Analizando una muestra de 1.506 empresas se ha comprobado que GBM logra la mayor capacidad predictiva, seguida de AdaBoost y la Regresión Logística. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 8 | 29 Desarrollo de un software para la gestión de proyectos de desarrollo PM4R que permita automatizar la etapa de planificación para estimar tiempos a través de algoritmos de aprendizaje automático, de Jorge Enrique Espinoza Muñoz (2019) tiene como propósito de desarrollar un software para permitir una estimación de la duración de los proyectos (tiempos) haciendo uso de la data histórica, para lo cual se procede a generar data en base a un conjunto de datos público del Banco Mundial. usando Machine Learning. Propuesta de un modelo de elaboración de presupuesto sistematizado, para la adecuada toma de decisiones gerenciales de la compañía Agrovictoria S.A. productora y exportadora de banano ubicado en la ciudad de Guayaquil del autor Mendoza Silva Zoila Isabel (2018) el estudio tuvo como objetivo principal la propuesta de un modelo de elaboración de presupuesto sistematizado para la adecuada toma de decisiones gerenciales en la compañía, permitiéndonos aportar con recomendaciones para obtener procesos contables eficientes, así mismo facilitar a las personas involucradas una manera práctica de elaboración de presupuestos. Estudio y predicción de activos financieros mediante redes neuronales del autor Fernando Santamaría Vázquez (2018) tiene como objetivo explorar la posibilidad de predecir el comportamiento de los mercados financieros mediante el uso de las técnicas de aprendizaje automático y más concretamente con redes neuronales. Para ello se experimentó con una serie de indicadores financieros implementados en una red neuronal. Los resultados de las predicciones muestran respuestas bastante ajustadas a la realidad, con errores máximos pequeños. El marco teórico y/o conceptual Entre las muchas definiciones presupuestarias que existen en el mundo financiero, podemos mencionar las siguientes, de acuerdo con Burbano (2005), el presupuesto es una expresión cuantitativa formal de los objetivos que se propone Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 9 | 29 alcanzar la administración de la empresa en un periodo, con adopción de estrategias necesarias para lograrlos. (p. 18). Por otra parte, Welsch et al. (2005) considera que la planificación y el control de la utilidad de la empresa está en gran medida relacionada con la visión estructural y reglamentaria de esta, en la cual se desempeñan roles importantes a nivel administrativo, los cuales influyen en el comportamiento del presupuesto, es por ello por lo que plantea seis procesos claves para lograr la eficiencia de dicho presupuesto. El planteamiento de objetivos generales a largo plazo destinados a la empresa. Abarcar procesos para el entendimiento de metas de la empresa. Determinaciones estratégicas generales a largo plazo. Determinaciones estratégicas y específicas en un corto periodo de tiempo desarrollado por asignaciones. Establecer un sistema de seguimiento continuo que detalle el comportamiento por responsabilidades asignadas. Implantación, seguimiento y verificación de procesos. En este orden de ideas, se puede determinar que, para una planificación armónica y ejecución eficiente del presupuesto, es necesario adaptar los objetivos y distribución de funciones y tareas específicas a los deseos de las organizaciones, adicional todos los departamentos implicados deben interiorizar dichos objetivos de forma directa o indirecta, ya que esto asegura una implementación óptima o, por el contrario, el no cumplimiento de los objetivos. Actualmente en el procedimiento presupuestario de la Unión Europea se puede apreciar la intervención de varios actores como, el parlamento europeo, la comisión europea y el consejo de la unión europea, los cuales comparten el poder de decidir sobre todo el presupuesto anual de la UE. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 10 | 29 A diferencia de la proyección, aprobación y ejecución del presupuesto que se plantea desde una mirada más empresarial, este tipo de presupuestos implican una serie de procesos especiales los cuales inician desde el planteamiento del presupuesto anual el cual es centralizado en la comisión y esta se encarga de enviarlo al Parlamento y al consejo de la UE. Se debe tener en cuenta tanto la posición del parlamento como la del consejo, si no hay un acuerdo entre las partes se debe llevar hasta el comité de conciliación que cuenta tanto con representantes del consejo como del parlamento donde se debe generar un acuerdo en un término de 21 días. Finalmente, si se llega a un acuerdo la aprobación de dicho presupuesto será dada por el Parlamento y el consejo de la UE. Por otra parte, el proceso de planeación y aprobación del presupuesto en Estados Unidos, según USA.GOV (s.f) empieza a aproximadamente 18 meses antes de la entrada en vigor de este, los departamentos junto con las agencias encargadas se reúnen a trabajar en las propuestas para que estas sean enviadas a la Casa Blanca y así solicitar un pedido de presupuesto al presidente. Adicional al plan o propuestas presentadas por los departamentos y agencias el presidente también debe presentar su plan de presupuesto ante el Congreso, el cual es enviado el primer lunes del mes de febrero. Una vez enviadas las propuestas de ambas partes, la Cámara de Representantes y el Senado deben analizar las propuestas sus niveles de gasto, para finalmente resolver las diferencias de las dos propuestas y generar una versión final para que tanto la Cámara de representantes como el senado voten por estas. Una vez finalizado el proceso anterior, los respectivos comités de asignaciones distribuyen los fondos aprobados entre 12 subcomités dado que ellos serán los encargarán de la supervisión y monitoreo de los fondos de agencias como medio ambiente, transporte y viviendo o del interior. Nuevamente estas asignaciones pasan por un proceso de aprobación y votación ante la Cámara y el Senado para que sean aprobadas como ley de asignaciones, una vez Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 11 | 29 aprobadas estas pasan al presidente para ser firmadas antes del 30 de septiembre y si por algún motivo no llegasen a ser firmadas por el mandatario el Gobierno no tendría presupuesto para el nuevo año fiscal. Dentro de las funciones del presupuesto, es importante destacar que una buena planeación, ejecución y control del presupuesto, dependerá en gran medida de la dirección de las organizaciones, estas incluyen a todos aquellos colaboradores que formen parte del esquema de las compañías. Con la intensión de fortalecer aún más porque es necesario llevar a cabo una planeación de presupuesto, Doncel y Montes (2017, p. 29), nos comparten algunas ventajas y desventajas del presupuesto: Ventajas: El presupuesto permite identificar cuanto se ha ejecutado en los procesos y cuanto hay comprometido o que hay en el momento por ejecutar. Permite identificar los posibles riesgos financieros que puede tener las compañías durante la ejecución del presupuesto; con el fin de buscar una alternativa inmediatamente para solventar la crisis. El presupuesto a su vez facilita la coordinación y el control adecuado de los diferentes recursos y procesos que esté realizando la empresa. (se establece una estructura organizacional en cuanto a lo referente a costos y gastos). El presupuesto reconoce ser una herramienta estratégica a la hora de tomar decisiones por parte de la gerencia financiera o planificar futuros eventos y a su vez están apoyados en los estados financieros de la empresa. Desventajas: En el presupuesto en algunas ocasiones no se cuenta con la información actualizada por parte de las personas que están involucradas en su Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 12 | 29 elaboración, ejecución y control. (falta de información contable adecuada y oportunamente). Falta de una cultura de responsabilidad y control por parte de los encargados del presupuesto y demás agentes involucrados. Los puntos anteriormente mencionados dan luz al trabajo que debería facilitar el uso de la inteligencia artificial en el proceso la proyección de presupuesto, puesto que permitiría identificar y minimizar errores humanos, la información estaría actualizada a la fecha de consulta, garantizando una adecuada toma de decisiones, adicional generaría ahorro en tiempo, mano de obra y gastos por malas proyecciones. Asimismo, Luján (2016, p, 17), precisa que la proyección, ejecución y control del presupuesto son la base para conseguir el éxito de la organización, puesto que mediante este se pueden realizar comparaciones de resultados frente a los años anteriores, determinando cuales fueron las causantes de su variación y como estas pueden generar acciones correctivas hacia el futuro, es decir hacia las nuevas proyecciones. Enfatiza en que “la ausencia de presupuestos imposibilita cuestionar los resultados conseguidos en cuanto a venta, abastecimientos producción y/o utilidades”. Desde el siglo pasado una gran cantidad de empresas han venido trabajando según la metodología SIT (Systematic Inventive Thinking), que se centra en el desarrollo de innovaciones entre los empleados basadas en el diseño, la estrategia, la gestión del conocimiento y la cultura. Esto se logra bajo un proceso sistemático, en donde el primer paso es encontrar una necesidad seguido de proponer posibles soluciones, mejoras o transformaciones a los productos, servicios o procesos de las compañías, desde el pensamiento creativo orgánico de la empresa. Para Mendoza (2018), dentro de los procesos de las compañías la proyección presupuestal ha tenido lugar de alta importancia, con la característica Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 13 | 29 base de una totalidad de procesos manuales, donde el tiempo de presentación y consolidación de la información, en muchos casos presentan inexactitudes, lo que genera sobre costos a las compañías, retrasos en los proyectos y pérdidas económicas De acuerdo con lo anterior y en el marco de la metodología del aprendizaje automático , en lo que respecta a la transformación de carácter administrativo u operativo, este artículo de investigación busca documentar como la inteligencia artificial mejora la calidad de las mediciones y pronósticos, aumentando razonablemente la precisión de las variables que tienen mayor importancia en los modelos manualmente implementados, reduciendo las variables exógenas que modifican las mediciones y afectan negativamente la calidad de los pronósticos presupuestarios Definición modelo de inteligencia artificial El aprendizaje automático es el campo de estudio que le da a la computadora la capacidad de aprender sin ser programada explícitamente Arthur Samuel (1959), donde ese aprendizaje se da a partir del desarrollo de algoritmos y su aplicación a los datos. A partir de esto los algoritmos el machine Learning permiten realizar predicciones o clasificaciones para tomar decisiones en función de la extracción de características o patrones provenientes de los datos, logrando así precisión y efectividad dado los ajustes de los parámetros e hiperparámetros de los modelos. Los algoritmos de machine Learning fundamentalmente son usados para: Cálculo de fronteras bayesianas entre clases etiquetadas y no etiquetadas. Regresiones lineales y no lineales para datos etiquetados y no etiquetados. Generación de políticas con base al reforzamiento del aprendizaje. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 14 | 29 Existen diversidad de campos de aplicación de este tipo de algoritmos como el sector salud para el diagnóstico de lesiones dermatológicas, cáncer de mama, retinopatía diabética, neumonía infantil, hemorragias intracraneales entre otros; en el sector banca como predicción del comportamiento del consumidor y otorgamiento de créditos, probabilidad de incumplimiento de nuevos pagos de los clientes en función de los pagos atrasados, predicción de quiebras de empresas dado por información sobre los mercados emergentes de todo el mundo, pérdida de clientes comportamiento del mercado, detección de fraude bancario entre otros y el sector gobierno en el procesamiento de lenguaje natural para realizar trámites a través de la voz, reconocimiento visual para verificar y autentificar las facturas electrónicas, detección de emociones de clientes en las instalaciones y determinar el clima emocional, detección de fraude y robo de identidad o finalmente predicción de precios de viviendas en el territorio nacional. En síntesis, el aprendizaje automático (ML) es una herramienta para extraer características de los datos o patrones de los datos cuyo uso en el campo financiero, podría pronosticar o predecir la oferta, la demanda o inventario del mercado y mejorar el desempeño comercial de una compañía. Terminología del aprendizaje automático: A continuación, se dan a conocer algunos de los conceptos básicos mayormente usados en los algoritmos de aprendizaje automático. En este apartado se presenta una definición de cada uno de estos conceptos. Instancia: se le llama instancia a una fila de información que proviene de una base de datos (Müller y Guido, 2017). Característica (Feature): A una sola columna de datos se le llama característica. Así mismo se les conocen como predictores a las características que son usadas para hacer predicciones (Gollapudi, 2016). Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 15 | 29 Dimensión. Es un conjunto de atributos usados para describir una propiedad de la información (Gollapudi, 2016). Datos de entrenamiento: En el contexto del aprendizaje de maquina es el conjunto de datos (dataset) o colección de muestras usados para entrenar el modelo de aprendizaje (Bowles, 2015). Datos de prueba: Conjunto de datos usados para validar la precisión del modelo pero que no se utiliza para entrenarlo. Puede llamarse conjunto de datos de validación (Hackeling, 2014). Modelo. Un modelo es el resultado de los algoritmos aplicados a un conjunto de datos (Gollapudi, 2016). Parámetros del modelo: Son los coeficientes finales que pertenecen al modelo encontrado (Hackeling, 2014). Hiperparámetros: Es un parámetro de un algoritmo de aprendizaje (no del modelo). Estos se definen antes al entrenamiento y permanece constante durante el entrenamiento por medio de las reglas de aprendizaje generadoras del modelo (Müller y Guido, 2017). Métrica: Medida cuantitativa usada para evaluar el rendimiento del algoritmo (Hackeling, 2014). Clasificación de los algoritmos del aprendizaje automático. Los algoritmos de aprendizaje de máquinas se clasifican en tres grandes grupos: Aprendizaje supervisado, Aprendizaje no supervisado y Aprendizaje por reforzamiento. Aprendizaje supervisado Según Ozdemir (2016) el aprendizaje supervisado es una técnica que "encuentra asociaciones entre las características de un conjunto de datos y una variable objetivo (...) estas asociaciones le permiten al aprendizaje supervisado Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 16 | 29 hacer predicciones basados en información pasada". El aprendizaje supervisado implica modelar la relación entre las características de los datos y una clase final o etiqueta; una vez que se determinan los parámetros del modelo junto con las métricas de validación, se puede usar para determinar etiquetas a datos desconocidos. El aprendizaje supervisado se subdivide en algoritmos de regresión y de clasificación: Algoritmos de regresión: - Regresión Lineal Multivariada: metodología basada en la minimización de la suma de mínimos cuadrados del conjunto de datos X (variables explicativas o independientes) para devolver una aproximación lineal del valor Y (variable predicha o dependiente), creando una función de hiperplano destinada a comprobar hipótesis y relaciones causales. 𝑦𝑖 = 𝛽1 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 + ⋯ + 𝛽𝑗 𝑥𝑗𝑖 Imagen 1. Elaboración propia a partir de simulaciones Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 17 | 29 - Regresión Ridge: En este tipo de algoritmo se impondrá una penalidad sobre los coeficientes calculados, de tal manera que se modificará el error de los mínimos cuadrados como: El hiperparámetros α, llamado complejidad, controla qué tanto se penaliza los coeficientes, haciendo que éstos sean más pequeños y por tanto estabilizando las soluciones, aunque a costa de una menor sensibilidad a los datos. - Regresión Lasso: Al igual que el algoritmo Ridge, Lasso impone una penalidad sobre la función de error del OLS, pero ésta en cambio está dada por el valor absoluto de los coeficientes, así: Esto hace que a diferencia de Ridge que buscaba hacer pequeños los valores de algunos wi, Lasso fuerza a que sean 0. Así, puede decirse que Ridge es bueno cuando esperamos que todos los predictores tengan una influencia sobre el predictor así sea pequeña, mientras que Lasso se usará cuando esperamos que el número de predictores relevantes sea pequeño (predictores con peso diferente de 0). - Regresión Elástica: Es posible hacer una combinación de los métodos de la regresión rigde y la regresión lasso. A las regresiones que usan una combinación de ambas penalidades se les conoce como ElasticNet. Note que cuando ρ=1 tenemos la regresión Lasso, y con ρ=0 tendremos la de Ridge, por tanto, en las redes elásticas 0≤ρ≤1. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 18 | 29 Algoritmos de clasificación: Los algoritmos de clasificación se utilizan en escenarios de donde las etiquetas están discretizadas para la agrupación de datos numéricos en categorías (Alatrista Salas, 2016). - SVM (Maquina de Vector de Soporte): Este modelo busca seleccionar un hiperplano (objeto divisor) de separación equidistante a los puntos más cercanos a cada clase para conseguir un margen máximo. Los puntos que caen en la frontera de dichos márgenes se denominan vectores de soporte (Carmona Suárez, 2014). Imagen 2. Regresor delegado, un enfoque sólido para la detección automatizada de anomalías en los datos de series temporales de radón del suelo. - Regresión Logística: La regresión logística es una variación de la regresión lineal, la cual resulta útil en los casos en que la variable dependiente, y, es categórica, la regresión logística produce un resultado de la probabilidad que una instancia pertenezca a una clase dada. La regresión logística ajusta entonces una curva en forma de "S", tomando la regresión lineal (xTw) y transformando la estimación numérica en una probabilidad (entre 0 y 1), mediante la función sigmoide: Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 19 | 29 Imagen 3. Elaboración propia a partir de simulaciones - Navie Bayes: Los modelos de Naive Bayes representan un conjunto de algoritmos de clasificación los cuales se basan en el teorema de Bayes, Los modelos de Naive Bayes representan un conjunto de algoritmos de clasificación los cuales se basan en el teorema de Bayes. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 20 | 29 Imagen 4. Elaboración propia a partir de simulaciones - k-Nearest Neighbourhood (k-NN): El modelo consiste solo en el almacenamiento en memoria de los datos de entrenamiento. Mediante este algoritmo, la clase de una instancia se predice al buscar dentro de los datos los vecinos más cercanos a la instancia. Imagen 5. Elaboración propia a partir de simulaciones Aprendizaje no supervisado Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 21 | 29 Según Marsland (2015) donde "las respuestas correctas no son proporcionadas, sino en su lugar el algoritmo intenta identificar similitudes entre la información de entrada de tal manera que al tener algo en común son categorizadas en conjunto." El aprendizaje no supervisado implica modelos que describen datos sin referencia a cualquier etiqueta conocida. Un caso común de aprendizaje no supervisado es el de agrupamiento (clustering) en el que los datos se asignan automáticamente a un cierto número de grupos discretos. Por ejemplo, podríamos tener algunos datos bidimensionales. Imagen 6. Elaboración propia a partir de simulaciones A simple vista, está claro que cada uno de estos puntos es parte de un grupo distinto. Dada esta entrada, un modelo de agrupamiento utilizará la estructura intrínseca de los datos para determinar qué puntos están relacionados, con un resultado como el siguiente. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 22 | 29 Imagen 7. Elaboración propia a partir de simulaciones El principal reto en el aprendizaje no supervisado consiste en evaluar cuándo un algoritmo aprende algo útil. Los algoritmos no supervisados se usan, normalmente, en datos de los cuales no se tiene etiquetas, de tal forma que no sabemos cuál debe ser la salida correcta. Por tal motivo, resulta muy difícil identificar cuando un modelo se desempeña bien. - K-means: La agrupación k-means es uno de los algoritmos de agrupación más simples y más usados. Mediante éste, se intenta encontrar los centros de los clusters que sean representativos de ciertas regiones de los datos. Imagen 8. Elaboración propia a partir de simulaciones Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 23 | 29 Aprendizaje por reforzamiento Según Raschka (2015) este aprendizaje es "el desarrollo de un sistema (agente) que mejora su rendimiento basado en interacciones con el entorno". El entorno es el encargado de proporcionar información acerca de que tan buena es la estrategia través de una función de recompensa (Marsland, 2015). Se deben presentar los enfoques teóricos desde donde se va abordar la investigación y, por ende, el problema planteado. De igual manera se deben aportar los conceptos claves o base que comprende el desarrollo del artículo. Emplear como mínimo mil (1000) palabras y como máximo mil quinientas (1500) palabras. Tenga en cuenta la rúbrica del curso de Trabajo de Grado. Método ● Tipo de investigación: El desarrollo se da bajo la técnica de investigación cualitativa con un enfoque ● Las técnicas de investigación que se emplearon para desarrollar los objetivos específicos de la investigación. Se deben describir diseños estadísticos, simulaciones y pruebas, entre otros. ● Instrumentos de investigación de manera detallada. ● Describir el proceso de recolección, organización y sistematización de la información. Organice por cada uno de los títulos de lo solicitado. Estos aspectos sólo para cuando la investigación ha terminado (no para el proyecto). Resultados Lo que se busca en esta sección es identificar con claridad qué se ha encontrado en el estudio. Sólo se deben presentar resultados representativos de la investigación. Los resultados deben ser esenciales para la discusión. Se recomienda seguir los siguientes lineamientos: Usar descriptivos tales como tablas, con los respectivos soportes estadísticos en el caso de estudios cualitativos, la articulación de las categorías de análisis y los Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 24 | 29 objetivos de investigación. Agregar materiales de soporte que ayuden a soportar los resultados que se hallaron. Utilizar subtítulos para mantener juntos los resultados del mismo tipo y así facilitar la revisión y lectura. Para los datos, elija un orden lógico que cuente una historia clara y la haga fácil de entender. En general, esto será en el mismo orden que se presenta en la sección de métodos. No incluir referencias en esta sección. Se están presentando los propios resultados, por lo que no puede referirse a otros aquí. Si se hacen referencias a otros, es porque se están discutiendo sus resultados, y esto debe incluirse en la sección de Discusión. Discusión Aquí se debe responder lo que significan los resultados. Probablemente es la sección más fácil de escribir, pero la más difícil de acertar, y esto se debe a que es la sección más importante del artículo. Se debe realizar la Discusión correspondiente a los Resultados, pero no reiterar los resultados. La discusión debe responder a por lo menos las siguientes preguntas: ¿Cuáles son los nuevos puntos de vista / perspectivas / posiciones que se ofrecen sobre los temas que se trataron y respecto a la literatura? ¿Cuáles son las implicaciones para futuras investigaciones? ¿Cuáles son las limitaciones que se encontraron en el estudio? Se deben tener en cuenta las siguientes recomendaciones: Evitar declaraciones que vayan más allá de lo que los resultados pueden respaldar. Evitar expresiones inespecíficas como "valor más alto", "grado más bajo", "altamente significativo", etc. Evitar la introducción repentina de nuevos términos o ideas. Se debe presentar todo en la introducción y para enfrentar los resultados obtenidos aquí. Siempre articular los objetivos y categorías de análisis para estudios cualitativos. Para lograr buenas interpretaciones, pensar en articular las siguientes respuestas: ¿Cómo se relacionan los resultados con la pregunta u objetivos originales delineados en la Introducción? ¿Los datos apoyan las Hipótesis? (Cuando se hayan formulado). ¿Son los resultados del estudio consistentes con la literatura? ¿Qué investigación adicional sería necesaria para responder a las preguntas planteadas por los resultados del estudio? Explicar qué hay de nuevo utilizando lenguaje objetivo y racional Estos aspectos sólo para cuando la investigación ha terminado (no para el proyecto). Conclusiones Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 25 | 29 Esta sección muestra cómo el trabajo avanza el campo desde el estado actual del conocimiento. No se debe repetir el resumen o solo enumerar los resultados experimentales. Las declaraciones triviales de los resultados del estudio son inaceptables en esta sección. Proponer conclusiones generales en relación al objetivo general y conclusiones específicas respecto a los objetivos específicos. En esta sección se debe proporcionar una justificación científica clara para el trabajo desarrollado e indicar usos y extensiones, si corresponden. Además, se puede sugerir experimentos o debates futuros. Declaración ética (no modifique el texto, ni lo omita). Señale brevemente los criterios básicos de consentimiento informado cuando la investigación contemple intervención de población humana, bajo los criterios de “esta investigación no tiene ningún riesgo para los participantes” El autor declara que este trabajo de grado, se acoge a los principios, preceptos, definiciones e indicaciones establecidos en la “Política de propiedad intelectual” vigente en la Universidad El Bosque (Acuerdo No. 12746 de 2014), así como la Circular No. 06 de 2002 de la Dirección nacional de derechos de autor. Al tenor de lo anterior el autor (los autores) de este trabajo de grado ratifica(n) que su trabajo es original y cumple con todo lo reglamentario sobre derechos de autor, siendo el autor (los autores) el (los) único(s) responsable(s) del contenido y las ideas planteadas en el presente manuscrito. Referencias Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 26 | 29 Alatrista Salas, H. (2016). Orientación del curso Aplicaciones de Ciencias de la Computación: Pre-procesamiento de datos. Lima. Bowles, M. (2015). Machine Learning in Python. (Wiley, Ed.) Burbano, Jorge. Presupuesto: Enfoque de gestion planeacion y control de recursos. Mexico: Mac graw hill, 2005 Carmona Suárez, E. J. (2014). Máquinas de Vectores Soporte (SVM). Dpto. de Inteligencia Artificial, ETS de Ingeniería Inforática, Universidad Nacional de Educación a Distancia (UNED), 1–25. Retrieved from http://www.ia.uned.es/~ejcarmona/publicaciones/[2013Carmona]%20SVM.pdf Doncel, E., & Montes, C. (2017). El presupuesto como herramienta de control de gestión en la gerencia financiera en las empresas comerciales mi pyme. [Tesis de especialización, Universidad la Gran Colombia]. Repositorio Institucional UGC. https://repository.ugc.edu.co/bitstream/handle/11396/4334/Presupuesto_her ramienta_financiera_pymes.pdf?sequence=1&isAllowed=y Gollapudi, S. (2016). Practical Machine Learning. (Packt Publishing, Ed.). Hackeling, G. (2014). Mastering Machine Learning with scikit-learn. Luján, J. (2016). Presupuestos. [módulo de estudio, cuarta versión]. Corporación Universitaria Remington. http://imagenes.uniremington.edu.co/moodle/M%C3%B3dulos%20de%20ap rendizaje/presupuestos/Presupuestos%202016.pdf Marsland, S. (2015). Machine Learning: An Algorithmic Perspective. Chapman and Hall/CRC. Mendoza, Z. I. (2018). “Propuesta de un modelo de elaboración de presupuesto sistematizado, para la adecuada toma de decisiones gerenciales de la compañía Agrovictoria S.A. productora y exportadora de banano ubicado en la ciudad de Guayaquil” [tesis de pregrado, Universidad de Guayaquil]. Repositorio institucional de la universidad de guayaquil. http://repositorio.ug.edu.ec/handle/redug/30807 Müller, A. C., & Guido, S. (2016). Introduction to Machine Learning with Python. https://doi.org/10.1017/CBO9781107415324.004 Ozdemir, S. (2016). Principles of Data Science (1a ed.). Packt Publishing. Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 27 | 29 Raschka, S. (2015). Python Machine Learning. Packt Publishing. https://doi.org/10.1007/s13398-014-0173-7.2 Samuel, A. L. (1959). Some studies in machine learning using the game of checkers. IBM Journal of research and development, 3(3), 210-229. Unión Europea. (s.f). Competencias presupuestarias. https://www.europarl.europa.eu/about-parliament/es/powers-andprocedures/budgetary-powers USAGov. Budget of the U.S. Government. https://www.usa.gov/budget Welsch, Glenn, Ronald Hilton, Paul Gordon, y Carlos Rivera. Presupuestos, planificación y control. 6. Mexico: Pearson Prentice Hall, 2005 Se recomienda consultar los recursos de la biblioteca en: http://biblioteca.unbosque.edu.co/node/409 Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 28 | 29 Reglamentación Semilleros y otros procesos - Facultad de Ciencias Económicas y Administrativas Universidad El Bosque Página 29 | 29