Se ha considerado al año 2018 como excelente para AI y Machine Learning. Muchas nuevas aplicaciones de Aprendizaje Automático de alto impacto han sido descubiertas y traídas a la luz, especialmente en campos como la salud, finanzas, reconocimiento de voz, realidad aumentada y aplicaciones 3D y de vídeo con mayor complejidad.
Desde entonces hemos visto un gran impulso hacia una investigación orientada a la aplicación, en lugar de la simple teoría que estaba bien establecida desde hace más de 20 años. Aunque esto puede tener sus inconvenientes, por el momento ha repercutido en pasos agigantados positivos, generando una nueva I + D que puede convertirse rápidamente en valor para el negocio y el cliente. Esta tendencia se refleja fuertemente en gran parte del trabajo de código abierto de ML.
Echemos un vistazo a los 6 principales proyectos de Machine Learning más útiles en el último año. Estos proyectos han publicado códigos y conjuntos de datos que permiten a los programadores individuales y equipos más pequeños aprender y crear un valor agregado de forma casi inmediata. Puede que no sean las obras más innovadoras, pero son aplicables y prácticas.
Fasttext
Se trata de un proyecto diseñado y publicado por Facebook. Es una biblioteca de texto rápido diseñada para la representación y clasificación de texto. Viene con modelos pre-entrenados de vectores de palabras para más de 150 idiomas. Dichos vectores de palabras se pueden usar para muchas tareas, incluida la clasificación de texto, el resumen y la traducción.
Detectron
Detectron es la plataforma de investigación de Facebook AI para la detección de objetos y la investigación de segmentación de instancias, escrita en Caffe2 (marco basado en Deep Learning). Contiene implementaciones de una amplia variedad de algoritmos de detección de objetos que incluyen:
- Mask R-CNN : Detección de objetos y segmentación de instancias utilizando una estructura Faster R-CNN
- RetinaNet : una red basada en pirámide de características con una pérdida focal única para manejar ejemplos difíciles.
- R-CNN más rápido : la estructura más común para redes de detección de objetos
Todas las redes pueden usar una de varias redes troncales de clasificación opcionales:
- RESUMEN {50,101,152}
- RESN {50101152}
- Redes de pirámide de funciones (con ResNet / ResNeXt)
- VGG16
Aún más, ¡todos estos vienen con modelos pre-entrenados en el conjunto de datos de COCO para que pueda usarlos de inmediato! Todos han sido probados utilizando métricas de evaluación estándar en el zoológico modelo de Detectron .
Fast.ai
La biblioteca Fast.ai fue escrita para simplificar el entrenamiento de redes neuronales rápidas y precisas utilizando las mejores prácticas modernas. Extrae todo el trabajo esencial que puede venir con la implementación de redes neuronales profundas en la práctica. Es muy fácil de usar y está diseñado con la mentalidad de desarrollo de aplicaciones de un profesional. Originalmente creada para los estudiantes del curso Fast.ai, la biblioteca está escrita en la parte superior de la biblioteca Pytorch fácil de usar de una manera limpia y concisa. Su documentación es de primera categoría también.
AutoKeras
Auto-Keras es una biblioteca de software de código abierto para el aprendizaje automático (AutoML). Fue desarrollado por DATA Lab en Texas A&M University y colaboradores de la comunidad. El objetivo final de AutoML es proporcionar herramientas de aprendizaje profundo de fácil acceso para expertos en dominios con conocimientos limitados de ciencia de datos o aprendizaje automático. Auto-Keras proporciona funciones para buscar automáticamente la mejor arquitectura e hiperparámetros para modelos de aprendizaje profundo.
Dopamina
La dopamina es un marco de investigación para la creación rápida de prototipos de algoritmos de aprendizaje por refuerzo, creado por Google. Pretende ser flexible pero fácil de usar, implementando algoritmos de RL estándar, métricas y marcas.
Según la documentación de Dopamine, sus principios de diseño son:
- Fácil experimentación : para ayudar a los nuevos usuarios a realizar experimentos de referencia.
- Desarrollo flexible : para facilitar la generación de ideas nuevas e innovadoras para nuevos usuarios.
- Compacto y confiable : proporciona implementaciones para algunos de los algoritmos más antiguos y más populares
- Reproducible : Asegurar que los resultados sean reproducibles.
vid2vid
El proyecto vid2vid es una implementación pública de Pytorch del algoritmo de síntesis de video a video de Nvidia. El objetivo de la síntesis de video a video es aprender una función de mapeo de un video fuente de entrada (por ejemplo, una secuencia de máscaras de segmentación semántica) a un video fotorrealista de salida que describa con precisión el contenido del video fuente.
Lo mejor de esta biblioteca son sus opciones: proporciona varias aplicaciones diferentes de vid2vid que incluyen auto-conducción / escenas urbanas, caras y posturas humanas. ¡También viene con instrucciones y capacidades extensas que incluyen carga de datos, evaluación de tareas, funcionalidad de entrenamiento y multi-gpu!
Menciones Especiales para:
- ChatterBot: aprendizaje automático para el motor de diálogo conversacional y creación de robots de chat.
- Kubeflow: kit de herramientas de aprendizaje automático para Kubernetes
- imgaug: aumento de imagen para aprendizaje profundo.
- imbalance-learn: un paquete de python bajo scikit learn específicamente para abordar conjuntos de datos desequilibrados
- mlflow: plataforma de código abierto para administrar el ciclo de vida de ML, incluida la experimentación, la reproducibilidad y la implementación.
- AirSim: simulador para vehículos autónomos construido en Unreal Engine / Unity, de Microsoft AI & Research