A continuación se presenta un listado de temas relacionados a Machine Learning que todos deben conocer, este listado fue elaborado por Daniel Tunkelang y publicado en Quora, como What should everyone know about machine learning?

1.- Machine Learning significa aprender de los datos, IA es una palabra de moda. Machine Learning está a la altura de las expectativas: hay una cantidad increíble de problemas que se puede resolver al proporcionar los datos de entrenamiento correctos a los algoritmos de aprendizajes correctos. Llámelo IA si eso le ayuda a venderlo, pero sepa que la IA, al menos como se usa fuera de las universidades, es a menudo una palabra de moda que puede significar lo que la gente quiere que signifique.

 2.- Machine Learning es acerca de datos y algoritmos, pero principalmente de datos. Hay mucho entusiasmo por los avances en los algoritmos de Machine Learning y, en particular, sobre Deep Learning. Pero los datos son el ingrediente clave que hace posible Machine Learning. Puede tener Machine Learning sin algoritmos sofisticados, pero no sin buenos datos.

3.- A menos que tenga una gran cantidad de datos, debe atenerse a modelos simples. Machine Learning entrena un modelo a partir de patrones en sus datos, explorando un espacio de posibles modelos definidos por parámetros. Si su espacio de parámetros es demasiado grande, se adaptará a sus datos de entrenamiento y capacitará a un modelo que no se generalice más allá. Una explicación detallada requiere más cálculos matemáticos, pero como regla, debe mantener sus modelos lo más simples posibles.

4.- Machine Learning solo puede ser tan bueno como los datos que utiliza para entrenarlos. La frase “basura entra, basura sale” es anterior a Machine Learning, pero caracteriza adecuadamente una limitación clave de Machine Learning. Machine Learning solo puede descubrir patrones que están presentes en sus datos de entrenamiento. Para tareas de Machine Learning supervisadas, como la clasificación, necesitará una colección robusta de datos de capacitación con etiquetas completas y correctamente etiquetados.

5.- Machine Learning solo funciona si sus datos de entrenamiento son representativos. Al igual que un prospecto de fondos advierte que “el rendimiento pasado no es garantía de resultados futuros”, Machine Learning debe advertir que solo se garantiza que funcione para los datos generados por la misma distribución que genero sus datos de entrenamiento. Esté atento a los sesgos entre los datos de entrenamiento y los datos de producción, y vuelva a entrenar sus modelos con frecuencia para que no se vuelvan obsoletos.

6.- La mayor parte del trabajo duro para Machine Learning es la transformación de los datos. Al leer las exageraciones acerca de las nuevas técnicas de Machine Learning, podría pensar que Machine Learning consiste principalmente en seleccionar y ajustar algoritmos. La realidad es más prosaica: la mayor parte de su tiempo y esfuerzo se dedica a la limpieza de datos y la ingeniería de características, es decir, la transformación de características sin formato en características que mejor representen la señal en sus datos.

7.- Deep Learning es un avance revolucionario, pero no es una bala de plata. Deep Learning se ha ganado su nombre al ofrecer avances en una amplia gama de áreas de aplicación de Machine Learning. Además, Deep Learning automatiza parte del trabajo que tradicionalmente se realiza a través de la ingeniería de características, especialmente para datos de imagen y video. Pero Deep Learning no es una bala de plata. No puede usarlo de inmediato, y aún tendrá que invertir esfuerzo significativo en la limpieza y transformación de datos.

8.- Los sistemas de Machine Learning son altamente vulnerables al error del operador. Se debe considerar lo siguiente “Machine Learning no mata a las personas, la gente mata a la gente”. Cuando los sistemas de Machine Learning fallan, rara vez se debe a problemas con el algoritmo de Machine Learning. Lo más probable es que haya introducido un error humano en los datos de entrenamiento, creando sesgo o algún otro error sistemático. Siempre sea escéptico y acérquese a Machine Learning con la disciplina que aplica la ingeniería de software.

9.- Machine Learning puede crear inadvertidamente una profecía autocumplida. En muchas aplicaciones de Machine Learning, las decisiones que toma hoy afectan los datos de entrenamiento que recopilamos mañana. Una vez que su sistema de Machine Learning integra sesgos en su modelo, puede continuar generando nuevos datos de entrenamiento que refuerzan esos sesgos. Y algunos prejuicios pueden arruinar la vida de las personas. Sé responsable: no crees profecías autocumplidas.

10.- IA no va a volverse consciente de sí mismo, se levantará y destruirá a la humanidad. Un sorprendente número de personas parecen estar obteniendo sus ideas sobre inteligencia artificial de películas de ciencia ficción. Deberíamos estar inspirados por la ciencia ficción, pero no tan crédulos que la confundamos con la realidad. Hay suficientes peligros reales y presentes de los que preocuparse, desde seres humanos conscientemente  malvados hasta modelos de Machine Learning inconscientemente sesgados. Así que puedes dejar de preocuparte por SkyNet y la “super inteligencia”.

Machine Learning tiene mucho más de lo que se puede explicar en un listado, pero esperemos que esto sirva como una introducción útil para los no expertos.

¿Que deberían saber todos sobre Machine Learning?
Si te gusto, comparte ...Email this to someone
email
Share on Facebook
Facebook
Tweet about this on Twitter
Twitter
Share on LinkedIn
Linkedin
Share on Google+
Google+
Etiquetado en:    

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Facebook