En los últimos tres años los temas en mi biblioteca personal han cambiado para inclinarse más hacia MLOps; He leído demasiados libros sobre el tema que finalmente puedo elegir mis favoritos; echemos un vistazo:
Mis favoritos
Building Machine Learning Powered Applications
Este libro de Emmanuel Ameisen (O’Reilly) fue el que me empujó a dejar mi trabajo como científico de datos y comenzar a mover mi carrera hacia MLOps.
El libro es muy ligero en contenido práctico, si bien trae código para practicar, las ideas que presenta son lo que más vale la pena; lo que me encantó de él es la vista de alto nivel que quita el enfoque del desarrollo del modelo de machine learning y lo pone en los componentes que rodean a una aplicación práctica de aprendizaje automático. Cómpralo en Amazon México o en otras partes del mundo.
Reliable Machine Learning
Este libro de Cathy Chen et al. (O’Reilly) fue un hallazgo realmente agradable. No habla de una tecnología en específico y, a pesar de no mencionar MLOps en el título, MLOps es el tema de todo el libro.
Pone ML a través de una lente del concepto de “reliability” (confiabilidad), cubriendo una amplia gama de temas, desde problemas que pueden ocurrir en la capa de datos y almacenamiento, pasando por alto algunas técnicas para calcular costos, hasta quién debe estar a cargo de la calidad del modelo. Cómpralo en Amazon México o en otras partes del mundo.
Machine Learning Engineering in Action
Este es un libro de Ben Wilson (Manning), es extremadamente denso, pero cada una de sus más de 500 páginas vale completamente la pena porque cubre todos los aspectos involucrados en poner en producción una aplicación exitosa de aprendizaje automático, incluida la planificación y el alcance de un proyecto, experimentación, pruebas, despliegue y seguimiento.
Este libro está lleno de ejemplos y diagramas que facilitan la comprensión de los conceptos. Muy recomendable. Cómpralo en Amazon México o en otras partes del mundo.
Effective Data Science Infrastructure
Lo que me encanta de este libro de Ville Tuulos (Manning) es que, a pesar de ser un libro técnico centrado en una herramienta, Metaflow, los conceptos que toca son atemporales cuando se trata de una buena plataforma de experimentación y despliegue de modelos de machine learning.
El autor se basa en su experiencia en la construcción de la infraestructura de ciencia de datos para una de las grandes empresas tecnológicas. Incluso si no estás interesado en Metaflow en absoluto, te recomiendo que consulte este libro. En mi caso, este libro fue una fuente de inspiración a la hora de diseñar la experiencia de ciencia de datos en mi empresa actual. Cómpralo en Amazon México o en otras partes del mundo.
Machine Learning Design Patterns
Si bien este libro de Valliappa Lakshmanan (O’Reilly) no trata sobre MLOps como tal, me pareció un libro de referencia interesante que ayuda a resolver algunos de los problemas comunes que un ingeniero relacionado con ML puede encontrar en el día a día.
No pienses en este libro como el que te guiará de principio a fin mientras crea una aplicación de aprendizaje automático; piensa en este libro como un libro de recetas al que puede seguir haciendo referencia. Hay algunas críticas con respecto a las opciones tecnológicas de los autores, pero para mí, el valor compartido en este libro supera la molesta promoción que los autores hacen de GCP, Tensorflow y BigQuery. Cómpralo en Amazon México o en otras partes del mundo.
Designing Machine Learning Systems
Todavía estoy leyendo este libro de Chip Huyen (O’Reilly), pero hasta ahora es prometedor, de ahí su posición en la lista. Actualizaré este listado cuando lo termine. Cómpralo en Amazon México o en otras partes del mundo.
Estos libros están buenos
Machine Learning Engineering with Python
Un libro de Andrew P. McMahon (Packt) que trata de cubrir muchos temas pero que la cantidad de páginas impide darle profundidad a alguno de ellos. Lo bueno es que cubre algunos de los aspectos que otros libros no cubren, como los flujos de trabajo de Git y el empaquetado de proyectos en Python.
También tiene algunas preguntas de autoevaluación que son buenas para evaluar su conocimiento a medida que avanza en el libro. Cómpralo en Amazon México o en otras partes del mundo.
MLOps engineering at Scale
Un libro relativamente pequeño de Carl Osipov (Manning), es una introducción ligera a PyTorch y cómo servirlo en AWS. Tiene buenas ideas, pero no puedo deshacerme de la sensación de que su tamaño se interpone en el camino de una explicación profunda. Si trabajas con las tecnologías que cubre el libro, sería una buena adición a tu biblioteca. Cómpralo en Amazon México o en otras partes del mundo.
Machine Learning Engineering
Un buen libro de referencia de Andriy Burkov (True Positive Inc) es una descripción general concisa, aunque desorganizada, del campo de la ingeniería de aprendizaje automático. No es un libro que te va a cambiar radicalmente tu visión sobre machine learning en producción, pero tiene algunas ideas valiosas.
Se lo recomiendo a ese científico de datos que recién comienza y quiere comunicarse con científicos de datos experimentados o ingenieros de aprendizaje automático, pero si ya tienes experiencia, no será muy útil. Cómpralo en Amazon México o en otras partes del mundo.
Introducing MLOps
Como sugiere el título, este libro de Mark Treveil et al. (O’Reilly) es una buena introducción a MLOps; Recomiendo este libro si eres completamente nuevo en el tema. Léelo sin esperar demasiada profundidad técnica y más una descripción general de alto nivel. Cómpralo en Amazon México o en otras partes del mundo.
Recomendados solo si…
Building Machine Learning Pipelines
Libro de Hannes Hapke et al. (O’Reilly), es solo un libro de “recetas” que se parece a la documentación de Tensorflow Extended, excepto que está un poco desactualizado.
No doy una peor opinión de este libro porque los autores fueron sinceros sobre el uso de Tensorflow en la portada; Sabía en lo que me estaba metiendo. Si Tensorflow es su tecnología preferida, léelo; sin embargo, ten en cuenta los cambios en la API de TFX desde que se lanzó el libro. Cómpralo en Amazon México o en otras partes del mundo.
Nota: uno de los autores me comentó que están trabajando en una nueva versión.
Engineering MLOps
Lamentablemente, este libro de Emmanuel Raj (Packt) es demasiado superficial y trata de cubrir demasiado terreno, pero no logra abordar ningún tema en particular con confianza.
El autor usa Azure para generar el proyecto al que se hace referencia en todo el libro (cuando compré el libro, esto fue una sorpresa para mí, ya que nunca se mencionó en ninguna parte de la descripción del libro). Puede que le guste este libro si ya conoces de MLOps y necesitas trabajar con Azure como back-end en la nube. De lo contrario, no puedo recomendarlo. Cómpralo en Amazon México o en otras partes del mundo.
Machine Learning Systems
Si usas Scala para tu día a día, considera este libro de Jeff Smith (Manning). Si no te gusta Scala, evítalo. El libro es demasiado superficial para mi gusto y habla más sobre el desarrollo de software con Scala que sobre el aprendizaje automático (o su relación con ML). Cómpralo en Amazon México o en otras partes del mundo.
Estos no te los recomiendo
Practical MLOps
No puedo entender qué se trata este libro de Noah Gift et al. (O’Reilly); definitivamente no se trata de MLOps. Hay un montón de ejemplos irrelevantes y experiencias personales que se sienten forzadas. Pero lo que acaba con el libro son los cambios de tema tan radicales de un capítulo a otro; me recordó cuando tenía que trabajar en equipo con personas con las que no me llevaba bien en la universidad y cada quien hacía su parte por separado.
Probablemente uno de los peores libros de O’Reilly que he leído en mi carrera tecnológica. Mantente alejado de él.
Conclusión
Espero que esta lista te dé una buena idea de qué libros agregar a tu biblioteca (o cuáles evitar), y si ya ha leído los que menciono, siéntase libre de comentar sobre ellos o discrepar conmigo en el comentarios.
Siempre estoy abierto a sugerencias de libros, así que déjalas también en los comentarios.