fbpx

Automated Machine Learning

En este artículo aprenderás a utilizar la herramienta Automated Machine Learning (AutoML) de Google para crear tu propio modelo de machine learning en base a los datos que prefieras.

Para saber cómo utilizar Natural Language de Google y entender el propósito de esa herramienta, te recomiendo que veas primero el artículo Natural Language Processing que publiqué hace unos días. Partiremos del fichero CSV con datos de Reddit que comento en el vídeo de ese artículo.

AutoML (Automated Machine Learning) de Google

Como siempre, te acompaño en esta artículo con un vídeo en el que explico paso a paso cómo utilizar la herramienta Automated Machine Learning de Google para obtener un modelo de ML entrenado para entender y analizar las opiniones de Reddit del canal “r/Coronavirus”.

Para simplificar los pasos a seguir y que lo tengas bien claro, quedarían resumidos en los siguientes:

  1. Importar CSV. Del CSV generado a partir de los posts hechos en el subreddit “r/Coronavirus” conjuntamente con sus puntuaciones ponderadas entre 0 y 2, lo importamos en Google Cloud Natural Language como fichero de análisis de opiniones.
  2. Revisión de los datos importados. Asegurarse que no hay errores en la importación de los datos, y que las etiquetas tanto de puntuación como de Preparación, Validación y Test (explicado en el vídeo).
  3. Iniciar preparación. Con el set de datos ya revisado, iniciamos la preparación de nuestro modelo. Este paso puede tardar varias horas y serás notificado por email una vez preparados.
  4. Realizar pruebas. Una vez preparado el modelo, ya tienes tu primera versión de tu modelo de machine learning adaptado a los datos introducidos. A partir de aquí puedes tanto seguir entrenándolo más, proporcionándole más datos, como ya utilizarlo para predicción.

En este link podrás encontrar el código en python que enseño en el vídeo. Te lo puedes descargar desde GitHub.

Aparte del ejemplo que utilizo en el vídeo sobre el análisis de opiniones, se pueden generar modelos de clasificación de documentos, de extracción de entidades dentro de contenido masivo. Además , como ya comentado, entender el sentimiento que se respira en un artículo, noticia, red social, etc.

Aplicaciones de AutoML

Para que tengas claro cómo te puede ayudar esta herramienta de Machine Learning potente de Google, te explico varias casuísticas en las que estos modelos se adaptan perfectamente para cubrir necesidades de hoy en día:

  • Modelo de clasificación. Imagínate que quieres hacer una web donde publicas noticias y artículos interesantes filtrados que van saliendo de 100 fuentes distintas. Antiguamente estarías revisando y leyendo cada noticia para saber en qué sección o categoría la debes poner en tu web. Con AutoML puedes generar un modelo ML adaptado a las noticias que enseñas en tu portal y será capaz, automáticamente, de categorizarte cada noticia a qué sección iría. Ahorrarías en tiempo y recursos en tener que hacerlo manualmente
  • Modelo de entidades. Imagínate que tienes una cuenta en una red social, con bastantes seguidores pero los quieres incrementar aún más empatizando y hablando de los temas que gustan a la gente. Puedes entrenar un modelo de entidades para que, dado un gran volumen de posts o comentarios bajo los hastags relacionados con tu especialidad, te saque las entidades que más aparecen el los textos y así generar tu contenido adaptado a lo que los usuarios les gusta. En esta sección podríamos entrar dentro de la generación de contenido automático.
  • Modelo de opiniones. Sin ir más lejos y ya habiéndolo explicado: si nos interesase entender cómo se siente la gente que nos está siguiendo, con modelos de opiniones entrenados con los comentarios de te dejan en tu propia cuenta puedes entender cómo están cayendo de bien o mal tus publicaciones y tomar acciones.

Es posible que Google alargue más la lista de opciones que ofrece su herramienta de Machine Learning. Recuerda que sólo con Natural Language ya puedes consultar análisis de opiniones, clasificación y de entidades a partir de modelos que Google tiene por defecto. AutoML te ofrece crear tu propio modelo entrenado en base a datos que tú mismo le vas dando y así tener un modelo personalizado y adaptado a tus propósitos.

Conclusión

La tecnología Machine Learning es un mercado en auge, dejando en la sombra temas de Business Intelligence y BigData. No significa que vaya a ser un sustituto, más bien las 3 tecnologías son complementarias unas con otras. Aunque los grandes proveedores de este tipo de tecnologías sobre los datos (Google, Microsoft, Amazon) aún están en fase experimental si hablamos de Machine Learning. Cada uno tiene su producto ofertado y el mercado ahora mismo es el juez que va dictando qué herramienta es la que más necesidades cubre dentro del mercado actual. Por tanto, es muy probable que vayamos viendo mejoras e incluso nuevas funcionalidades a lo largo de estos meses.

8 comentarios
  1. Avatar
    • Avatar

Deja un comentario