Koalas: La librería que aprovecha el potencial de Pandas en combinación con Spark para proyectos Data Science

pandas es una herramienta magnífica para analizar pequeños datasets en una única máquina. Cuando necesitamos trabajar con datasets más grandes, los Data Scientists normalmente escogemos hacerlo usando PySpark. Sin embargo, convertir código de pandas a PySpark no es sencillo, ya que las APIs de ambas herramientas son considerablemente distintas. En este post presentamos Koalas, una…

MLflow, el gran aliado para los Data Scientists

Desde hace más de 50 años el mundo de la inteligencia Artificial no ha dejado de evolucionar, pasando por los sistemas expertos, los modelos más estadísticos del Machine Learning, las redes neuronales y en la actualidad estamos inmersos en los modelos de Deep Learning. Aunque en este caso la evolución no ha implicado una transición…

Inteligencia Artificial y Desarrollo Sostenible

Creo que ya no es necesario que recuerde las numerosas oportunidades y amenazas estratégicas que plantea la Inteligencia Artificial. Según IDC, el gasto en tecnología enfocada a la IA está aumentando a un ritmo del 24%. Los proyectos impulsados por ésta se convertirán rápidamente en un porcentaje sustancial de la inversión en tecnología de cualquier…

Kubernetes, un fantástico aliado para seguir creciendo

Si antes de la pandemia había dudas, éstas se han despejado en cuestión de meses: las aplicaciones en la nube han permitido que las empresas sigan avanzando. Durante este tiempo, la gente ha podido comprar, conectarse con sus amigos y, por supuesto, trabajar desde casa. Hay cientos, si no miles, de empresas que han tenido…

El potencial de Kubernetes para las empresas

Ya han pasado unos cuantos años desde que Google cedió el control de Kubernetes, su plataforma de gestión de contenedores de código abierto, a la Cloud Native Computing Foundation. Desde entonces, Kubernetes se ha convertido rápidamente en la principal solución de gestión de contenedores del mercado. Un estudio de mercado de hace ya un par…

CI/CD con Databricks Y Azure DevOps

Si no has estado viviendo en una cueva en los últimos años, seguro que ya conoces lo que es Databricks. Pero por si acaso, te lo recordamos: Databricks es una herramienta líder de ingeniería de datos basada en la nube que se utiliza para procesar y transformar cantidades masivas de datos y explorar los datos…

Machine Learning Operations (MLOps)… ¡Manos a la obra!

En el anterior artículo comentábamos qué era exactamente Machine Learning Operations, y el porqué de su reciente aparición. Es momento de ponerse manos a la obra con un pequeño laboratorio que hemos preparado. ¿Y por dónde puedo empezar? Pues obviamente por este artículo (risas y aplausos). En los siguientes puntos te explicaremos como puedes empezar…