Algunos consejos para la investigación ágil de la ciencia de datos

Algunos consejos para la investigación ágil de la ciencia de datos

¿Cómo aportar el máximo valor en un tiempo mínimo?

La investigación ágil «rápida» en ciencia de datos no es sencilla y requiere muchos ajustes. Ágil no significa de baja calidad, por el contrario debe cumplir con altos estándares de calidad y debe estar bajo el enfoque de modelos o metodologías para el desarrollo ágil de procesos.

Una metodología orientada a los procesos de minería de datos corresponde al modelo de proceso CRISP–DM (Cross Industry Standard Process for Data Mining) que significa Proceso estándar de la industria para la minería de datos. Comprende las siguientes fases:

  1. Comprensión del negocio
  2. Comprensión de los datos
  3. Preparación de los datos
  4. Modelado
  5. Evaluación
  6. Implantación o Presentación de los Datos

De igual manera se puede utilizar una metodología de desarrollo ágil como SCRUM en la que se tienen como línea base las siguientes fases:

  • Planificación
  • Diseño
  • Desarrollo
  • Pruebas
  • Despliegue
  • Revisión
  • Lanzamiento

Este modelo de proceso se fundamenta en las siguientes fase:

Bajo estas premisas, algunos consejos útiles para abordar una investigación ágil en ciencia de datos son:

  1. Establecer los objetivos del proyecto. Los objetivos deben estar enfocados a responder las siguientes preguntas:
    • ¿Cuál es el KPI (Indicador Clave de Desempeño) que deseamos optimizar?
    • ¿Cuál es el método de evaluación?
    • ¿Cuál es el valor mínimo deseado del KPI que se va a optimizar?
  2. Siempre iniciar construyendo un modelo de línea de base simple que permita ir comparando y evaluando su precisión con lo nuevo que se va desarrollando.
  3. Planear objetivos específicos. Que sean medibles y alcanzables en corto tiempo.
  4. Fallar rápido. Es la parte más compleja pero entre más rápido falle mi modelo más rápido lo puedo ajustar. Aquí viene un proceso iterativo e incremental donde se va mejorando el producto deseado o buscado.
  5. Mover a producción lo antes posible

Elaborado por Fredy Yarney Romero Moreno, basado en:

  1. https://medium.com/@yonatan.hadar
  2. http://www.proglobalbusinesssolutions.com/six-steps-in-crisp-dm-the-standard-data-mining-process/

Leave a Reply