Koalas: La librería que aprovecha el potencial de Pandas en combinación con Spark para proyectos Data Science

pandas es una herramienta magnífica para analizar pequeños datasets en una única máquina. Cuando necesitamos trabajar con datasets más grandes, los Data Scientists normalmente escogemos hacerlo usando PySpark. Sin embargo, convertir código de pandas a PySpark no es sencillo, ya que las APIs de ambas herramientas son considerablemente distintas. En este post presentamos Koalas, una … Leer más