Uno de los conceptos de moda hoy en día es el de Big Data y Machine Learning. Sin embargo hay pocas personas no especializadas que sepan definir con claridad de qué hablamos cuando hablamos de Machine Learning.
En Ubiqum Code Academy, tenemos un curso especializado en Data Analytics y Machine Learning y en este breve artículo te vamos a contar en qué consiste el Machine Learning y cómo se utiliza en el análisis de datos.
Si vamos a la definición “oficial” nos encontramos con lo siguiente: El machine learning o aprendizaje automático es la rama de la inteligencia artificial que dota a las máquinas de la habilidad de “aprender” a partir del análisis de datos con el fin de identificar patrones y apoyar en la toma decisiones con la mínima intervención humana; personas y máquinas trabajan de la mano.
A nuestro modo de ver esta definición es bastante abstracta e inexacta. En primer lugar porque las “máquinas” no “aprenden”. Los ordenadores siguen siendo “tontos muy rápidos” que ejecutan cálculos muy complejos muy rápidos, pero todo lo que ejecutan ha sido programado por humanos. Aún no se ha inventado, y tardaremos mucho en verlo, un ordenador que se “autoprograma”, es decir, que de forma dinámica y a voluntad altere el código de sus programas según su propia experiencia, algo que sí hace la mente y la memoria humana.
En cualquier caso, lo que sí es cierto es que la ingeniería de software junto con la capacidad y potencia de los ordenadores actuales y la enorme cantidad de datos digitales almacenada y disponible han hecho posible la aparición de unos programas muy complejos ¡y muy ingeniosos! que nos permiten procesar, y analizar, una enorme cantidad de datos de forma eficiente. Esta capacidad es nueva, no existía solo un par de décadas atrás y está cambiando la forma de hacer negocios.
Para empezar a clarificar este tema al lector que está buscando un curso que le permita acceder a una nueva y prometedora profesión, empezaremos por describir los tres perfiles que componen la moderna y muy reciente profesión del Big Data, Machine Learning y Analisis de Datos. Podemos decir que en esta nueva profesión existen tres perfiles bien diferenciados:
Data Engineering
En primer lugar necesitamos a las personas que se ocupan de los datos. Desde que existen ordenadores ha habido personas que se han ocupado de los datos. En los departamentos de administración de sistemas siempre ha habido un equipo de administración de bases de datos. Pero este trabajo se ha sofisticado mucho en los últimos 20 años. Este perfil sigue siendo muy técnico y especializado en la gestión de los nuevos productos alrededor de la administración de bases de datos.
Data Scientist
En segundo lugar necesitamos a las personas que desarrollan los algoritmos. Estos algoritmos son programas de software muy complejos y para ello se necesita un gran especialización. Un Data Scientist, tal y como lo describimos aquí, es un software engineer on steroids. Desarrollar esta especialización requiere entre 10 y 15 años de trabajo y posiblemente un PhD cuya tesis sea el desarrollo de un nuevo algoritmo de ML.
Business data analyst
Finalmente tenemos a las persona que analizan y aprovechan los datos para mejorar el negocio. Este es el perfil que desarrollamos, en Ubiqum, con los alumnos que participan en nuestro curso Data Analytics & Machine Learning . Nos gusta afirmar que, en un plazo de 5 a 10 años, cualquier ejecutivo de alto nivel en cualquier empresa deberá haber desarrollado estas habilidades.
Estos tres perfiles surgen de diferentes grados e intensidades de estudios y experiencias profesionales, tienen muchos aspectos en común pero también tienen grandes diferencias y especialidades concretas.
¿Cómo y cuándo se utilizan los algoritmos de Machine Learning?
Podríamos decir que los algoritmos de Machine Learning tiene dos grandes aplicaciones. La primera está más relacionada con el perfil de Business Data Analyst descrito arriba:
- A la vista de la definición anterior los algoritmos de Machine Learning son parte integral de un proceso más complejo, el proceso de business data analytics (Cross Industry Standard Process for Data Mining). (Data Mining es otra forma de denominar al análisis de datos)
Este proceso se compone de los siguientes pasos :
- Formulación de una hipótesis o problema de negocio a resolver mediante el análisis de datos.
- Creación, limpieza, preparación y preproceso de un dataset.
- Modelado del problema mediante el uso de algún algoritmo de Machine Learning.
- Análisis de resultados e iteración entre los pasos 2, 3 y 4 hasta alcanzar unos resultados satisfactorios (entrenamiento del modelo).
- Convertir los resultados en conclusiones válidas y ejecutables para el negocio.
Se ve pues que en el análisis de datos, el uso de los algoritmos es una condición necesaria, aunque no suficiente, del proceso.
La segunda aplicación se relaciona con el perfil descrito más arriba de Data Scientist:
La automatización de procesos es uno de los campos de investigación más relevantes y consiste en la capacidad de automatizar los procesos de negocio que suponen tomas de decisiones complejas que, hasta ahora, las tomaban las personas. Algunos de ellos:
- Recomendaciones personalizadas. Las películas que te pueden gustar en tu plataforma de VoD preferida, otros productos que a lo mejor te interesan cuando compras por internet o incluso los anuncios que ves en tus redes sociales son tan precisos y se ajustan tan bien a tu gusto personal.
- Comunicación más orgánica con los motores de búsqueda y con los asistentes virtuales, los chatbots de las webs de diferentes empresas… Es a través del Machine Learning que se hace posible que las máquinas entiendan mejor nuestro lenguaje normal y puedan interactuar de forma más orgánica con nosotros.
- Seguridad. Tanto en instalaciones como en Internet, la seguridad es de las aplicaciones más comunes del Machine Learning. Esta tecnología hace posible la detección de anomalías o descartar falsas alarmas. Una aplicación muy común hoy en día, es el reconocimiento facial, para identificar posibles problemas, por ejemplo en aeropuertos.
- Decisiones sobre inversiones. Las grandes bolsas y bancos tiene algoritmos que sugieren cuando comprar y vender activos en los mercados financieros, manejando grandes cantidades de datos a gran velocidad.
Y estos son solamente algunos ejemplos cotidianos en los que ya se utilizan dichos algoritmos.
Un camino hacia el futuro… que empieza hoy en Ubiqum
El carácter multidisciplinar de las aplicaciones del Machine Learning es una de las razones por las que la formación en esta área está viviendo una gran demanda a día de hoy. Cada vez son más los profesionales que se deciden a incluir algún tipo de formación en este campo. Esta decisión supone convertirse en un profesional más versátil y diversificado. Independientemente del campo en el que desarrolles tu actividad profesional, el Análisis de datos y Machine Learning resulta un gran complemento para cualquier profesional de cualquier sector industrial y área funcional. En Ubiqum te ofrecemos programas full time o part time con flexibilidad para adaptarnos a las diversas necesidades nuestros estudiantes.
Recibe el syllabus de tu curso de Data Analytics & Machine Learning
>