Machine Learning vs Data Mining (en español: Aprendizaje Automático o Minería de Datos). Seguramente en alguna ocasión, sobre todo para aquellos que estamos en el mundo de la tecnología, nos haya pasado por la mente la pregunta: ¿en qué se diferencian el Machine Learning y el Data Mining?

Yo recuerdo que la primera vez que me lo cuestioné fue cuando me lo preguntó una amiga que se acababa de graduar y estaba empezando la ardua tarea de hacer entrevistas de trabajo para empresas. Así que si alguna vez, por el motivo que sea, te lo has cuestionado, aquí voy a hacer un pequeño resumen de lo que le contesté a mi amiga.

La verdad es que ambas abarcan muchos conceptos en común, por eso a veces es difícil ver la diferencia entre el Machine Learning (ML) y el Data Mining (DM). Al final ambos campos son  muy utilizados por las empresas para desarrollar su tecnología, sus herramientas, las soluciones de sus problemas y poder tomar decisiones que es para lo que se usa la Estadística en la empresa.

Sin embargo, el DM, como su nombre lo indica, en castellano sería Minería de Datos, trata de sacar toda la información posible de los datos que tenemos, descubrir todo lo que se pueda cuando hay poco o nulo conocimiento de antemano, o ser capaz de «predecir» de manera acertada nuevos elementos que vengan en el futuro.

La diferencia principal entre ambas viene ahora. Todo lo que se puede hacer en DM sin duda requiere de la participación humana, sin ella el proceso no puede empezar, no puede funcionar y no puede terminar. Sin embargo, en ML, el esfuerzo humano es reducido, porque sólo está involucrado en el momento en que se define el algoritmo.

Los procedimientos pueden ser de dos tipos: “no supervisados” (no conocemos la respuesta) o “supervisados” (sabemos la respuesta). Seguramente te suenen algunas de las técnicas más comunes: análisis de conglomerados, árboles de clasificación y regresión, redes neuronales.

El ML y el DM utilizan los mismos algoritmos clave para descubrir patrones en los datos.

Sin embargo, su proceso y, en consecuencia, su utilidad, son diferentes. A diferencia del DM, en el ML, la máquina debe aprender automáticamente los parámetros de los modelos a partir de los datos. El ML utiliza algoritmos de auto-aprendizaje para mejorar su rendimiento. ML está orientado hacia el resultado mientras que DM se orienta hacia el descubrimiento de conocimiento. Esa es la única separación ya que ambas utilizan las mismas técnicas.

Es necesario tener presente las diferencias, ya que la cantidad de datos sólo aumentará. Para el año 2025, nuestro universo de datos digitales acumulados crecerá a 175 zettabytes.

z

A medida que acumulemos más datos, la demanda de habilidades técnicas avanzadas de Data Mining y Machine Learning obligará a la industria a evolucionar para mantenerse al día. Es probable que veamos una mayor superposición entre las dos tecnologías, debido a que se cruzan para mejorar la recopilación y la facilidad de uso de grandes cantidades de datos con fines analíticos.

Hasta la próxima.


Aprovecha los descuentos de hasta un 95% en todos mis cursos, solo por 9.99€

Descuento

Sígueme por mis redes sociales: