Acelerando el Proceso de Analítica Avanzada a través de Automated Machine Learning

Share
Por Elio Espinoza, Líder de Desarrollo de Negocios de Analítica & Datos.

De acuerdo con el estudio sobre Tendencias y Prioridades IT Ecuador 2023 realizado por IT ahora, entre las tecnologías emergentes de mayor adopción en las empresas ecuatorianas están la Inteligencia Artificial (IA) y el Machine Learning (ML). El 45.3% de las organizaciones asegura que existen altas posibilidades de adopción en el corto plazo de  esta tecnología para impulsar sus negocios y tomar mejores decisiones.

Son indudables los potenciales beneficios que puede proveer la Inteligencia Artificial. Grandes empresas, como Amazon, la utilizan a través de herramientas de Aprendizaje Automático (ML) para hacer recomendaciones sobre productos; Google para hacer búsquedas más eficientes; Netflix para las recomendaciones de películas; y, ahora, tenemos alternativas de bots inteligentes como ChatGPT de OpenAI, que tiene múltiples aplicaciones para los usuarios con una interacción más eficiente mediante el lenguaje natural.

La proliferación de herramientas y casos de uso para la IA, está llevando a todo tipo de empresas a intentar resolver sus necesidades de negocio mediante esta tecnología. Desafortunadamente, la gran mayoría de las veces, las organizaciones no pasan de un estado inicial o “piloto” debido a los múltiples retos al momento de implementar un proyecto de este tipo.

Potenciales casos de uso

Existen diferentes necesidades de negocio o casos de uso que se abordan con Inteligencia Artificial (Analítica Avanzada). Por ejemplo, conocer qué clientes no pagarán sus cuotas de crédito el siguiente mes o qué clientes podrían dejar de contratar sus servicios el próximo trimestre.

Para desarrollar estos casos de uso, se utiliza técnicas de «Aprendizaje de Máquina» o Machine Learning, una disciplina que está dentro del campo de la Inteligencia Artificial, en donde la máquina aprende con los datos que se entregan, a fin de elaborar predicciones utilizando algoritmos y modelos estadísticos.

Estas técnicas se usan normalmente en una fase de maduración analítica denominada fase «Predictiva«, en la que se pretende responder preguntas orientadas al futuro como: ¿Qué pasará el siguiente mes/trimestre?). Luego tenemos la fase «Descriptiva», que sirve para entender qué ha pasado y por qué.

Considerando que la empresa ha pasado la fase descriptiva y desea Para una proyección hacia el futuro, la empresa puede optar por utilizar aplicaciones de software libre como R o Python -asumiendo que la empresa cuenta con los conocimientos estadísticos, matemáticos y metodológicos necesarios para el desarrollo y la elección de los algoritmos más apropiados, según el caso de uso que desea implementar.

Desde el punto de vista empresarial, la elección del software libre tiene algunas ventajas. Además del no-pago de licenciamiento, el desarrollo se puede adaptar más fácilmente a las necesidades específicas del negocio.

Por otro lado, es conveniente seguir una metodología que permita definir el objetivo, obtener los datos necesarios, desarrollar los modelos estadísticos e implementar los modelos para, finalmente, tomar acciones efectivas. A esto le llamamos el ciclo de vida de la ciencia de datos.

RETOS DE LA IMPLEMENTACIÓN DE ANALÍTICA AVANZADA POR CUENTA PROPIA

A pesar de los beneficios y la metodología, la implementación de los modelos de analítica avanzada a través del desarrollo propio presenta algunos retos.

  1. Un proceso lento, ya que se empieza el desarrollo desde cero.
  2. Los errores que se cometen, por lo que se requiere revisiones continuas que toman tiempo.
  3. Una curva de aprendizaje alta.

A la final, es que no se logra el resultado esperado en el espacio de tiempo que el negocio necesita.

AUTOMATED MACHINE LEARNING

Una alternativa al desarrollo propio es utilizar herramientas que se denominan «aprendizaje de máquina automático» o Automated Machine Learning (AutoML). Estas herramientas buscan automatizar ciertas partes del proceso de ciclo de vida de ciencias de datos. Específicamente, la parte correspondiente al «Desarrollo del Modelo» e «Implementación del Modelo», tal como se ve en la siguiente imagen.

AutoML simplifica y facilita ciertas tareas de análisis que requieren de conocimiento especializado y que, de otra manera, estarían sujetas a errores y tiempos de desarrollo más extensos.

Por ejemplo, analiza las diferentes variables o datos que se tiene, e indica si hay campos vacíos que podrían alterar la predicción. O sugiere qué algoritmo es el más adecuado para el caso de uso que se quiere desarrollar, ya que dependiendo de los datos que se tengan, la máquina elige de manera automática diferentes algoritmos y los pone a competir considerando varios parámetros -como la tasa de error al hacer una proyección. Inclusive, advierte cuántos falsos positivos se podría tener al implementar ese modelo.

Todo esto reduce el tiempo que los científicos de datos o analistas de negocios tienen que invertir para desarrollar una solución de analítica avanzada, permitiendo que el enfoque esté en el entendimiento del negocio, reduciendo la curva de aprendizaje y aumentando la confianza, al documentar de forma automática cada paso que se lleva a cabo.

Beneficios AutoML

  • Automatiza la etapa de desarrollo del modelo
  • La interacción es rápida
  • Evita la pérdida de tiempo y reduce la curva de aprendizaje
  • Permite el enfoque en tareas críticas
  • Se obtiene explicaciones automáticas y flujo documentado