Big Data e Inteligencia Artificial

14. Etapas de un proyecto de Machine Learning: Los datos


Listen Later

📝 Podéis encontrar las notas del programa completas en https://datos.ninja/podcast/14-etapas-proyecto-machine-learning-parte-2/

En el episodio de hoy de Un Podcast Ninja sobre Big Data seguimos con la saga de episodios dedicados a las etapas de un proyecto de Machine Learning. Vamos a tratar la parte más importante: los datos.

La disponibilidad de los datos suele ser la parte más limitante cuando queremos resolver un problema mediante Machine Learning.

Por eso, una de las averiguaciones más importantes que tenemos que hacer es saber qué datos tendremos disponibles tanto para entrenar nuestro modelo de Machine Learning como para utilizarlo.

  • Tiene que ser datos representativos. Es decir, reflejan con exactitud el entorno que estamos modelando.
  • Los datos tienen que ser consistentes.
  • Deberían proceder de fuentes fiables y estar disponibles.
  • Los datos deberían ser abundantes. Cuantos más ejemplos mostremos a nuestro modelo de Machine Learning mejor.
  • El siguiente paso en el camino para construir un dataset sería etiquetar los datos. Dependiendo del caso de uso y los recursos de los que dispongamos tendremos las siguientes opciones:

    • Etiquetarlos nosotros mismos.
    • Contratar a alguien para que lo haga por nosotros. Existen empresas que se dedican exclusivamente al etiquetado de datos.
    • Utilizar Mechanical Turk, una plataforma de Amazon que pone en contacto a gente que quiere etiquetar datos con gente dispuesta a hacerlo por un módico precio.
    • Una vez recogidos y etiquetados, una buena práctica es familiarizarnos con ellos antes de comenzar  con  el entrenamiento del modelo de Machine Learning. Esto nos ayudará a reconocer errores que puedan surgir en nuestros resultados.

      Y recordad que si disponéis de tiempo extra para vuestro proyecto de Machine Learning tal vez sea más efectivo dedicarlas a recoger más datos que a tunear el modelo que habéis entrenado.

      Espero que el episodio os sea de provecho 😊

      Si es así, no olvidéis dejar un «Me gusta» y algún comentario al episodio en Ivoox o una valoración de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuchéis el podcast.

      Recordad que si tenéis cualquier duda o pregunta podéis contactar conmigo a través del formulario de contacto o podemos seguir la conversación en Twitter.

      Muchas gracias por estar ahí y os espero en el próximo episodio de Un Podcast Ninja sobre Big Data.

      ...more
      View all episodesView all episodes
      Download on the App Store

      Big Data e Inteligencia ArtificialBy Marta Arroyo


      More shows like Big Data e Inteligencia Artificial

      View all
      HISTORIAS DE LA HISTORIA by VIVA RADIO

      HISTORIAS DE LA HISTORIA

      68 Listeners

      Applelianos by Applelianos

      Applelianos

      56 Listeners

      Topes de Gama Unplugged by Topes De Gama

      Topes de Gama Unplugged

      48 Listeners

      Coffee Break: Señal y Ruido by Coffee Break: Señal y Ruido

      Coffee Break: Señal y Ruido

      49 Listeners

      Radio Fitness Revolucionario by Marcos Vázquez

      Radio Fitness Revolucionario

      132 Listeners

      Entiende Tu Mente by Molo Cebrián

      Entiende Tu Mente

      382 Listeners

      Inteligencia Artificial by Pocho Costa

      Inteligencia Artificial

      17 Listeners

      Dimes y Billetes by Moris Dieck

      Dimes y Billetes

      143 Listeners

      Cracks Podcast con Oso Trava by Oso Trava

      Cracks Podcast con Oso Trava

      539 Listeners

      Curiosidades de la Historia National Geographic by National Geographic España

      Curiosidades de la Historia National Geographic

      182 Listeners

      Loop Infinito (by Xataka) by Webedia

      Loop Infinito (by Xataka)

      58 Listeners

      Tengo un Plan by Sergio Beguería y Juan Domínguez

      Tengo un Plan

      67 Listeners

      monos estocásticos by Antonio Ortiz, Matías S. Zavia

      monos estocásticos

      3 Listeners

      Black Mango Podcast by Black Mango

      Black Mango Podcast

      78 Listeners

      WORLDCAST by Pedro Buerbaum

      WORLDCAST

      4 Listeners