Blog >

Certified Datasets en Power BI


La elaboración de informes de calidad acostumbra a ser un punto importante a tener en cuenta en cualquier organización centrada en los datos. La utilización de Certified Datasets en Power BI supone un gran paso en ese objetivo al facilitar que estos informes se puedan crear de una forma más corporativa y reforzando la labor de todo un equipo para potenciar el nivel de cada informe. Mediante Certified Datasets, un gran grupo de miembros de una organización puede tener acceso a bases de datos de calidad selladas por un experto y que le sirvan como punto de partida para realizar informes. En este artículo, se lleva a cabo un análisis minucioso de esta funcionalidad de Power BI, haciendo un repaso de las diferentes formas de compartir información que ofrece esta tecnología.

En primer lugar, se comentan situaciones en las que la utilización de Certified Datasets u otras formas de compartir bases de datos en Power BI pueden resultar beneficiosas, lo cual debe servir para poner en contexto el uso de esta funcionalidad.

A continuación, se explica el funcionamiento de la solución y la arquitectura llevada a cabo desde Power BI Desktop, así como desde Power BI Service para hacer uso de esta herramienta. Durante la explicación, se hace referencia a la terminología relacionada y el alcance de la compartición de datasets en función de la configuración.

Más tarde, se mencionan posibles mejoras que podría implementar Power BI para hacer de la compartición de bases de datos un arma todavía más fuerte que permita a las organizaciones unificar de forma óptima sus informes.

Por último, se comentan las conclusiones teniendo en cuenta el estudio de Certified Datasets y Shared Datasets llevado a cabo.

 Aplicabilidad

Como posibles aplicaciones y casos en los que la utilización de métodos encaminados a compartir la información de bases de datos en Power BI es positiva, se puede destacar la necesidad que habitualmente surge en grandes proyectos de elaborar una enorme cantidad de informes que deben estar construidos en base a una información muy similar entre ellos. En este caso, es altamente aprovechable el hecho de tener un buen modelo ya elaborado que unifique todos los informes, reduciendo el tiempo destinado a elaborar los modelos, así como otros costes asociados a bases de datos menos óptimas computacionalmente que la que posee este sello de calidad. Esta unificación también puede ser positiva para sortear posibles ambigüedades a la hora de elaborar medidas y columnas calculadas.

La existencia de datasets compartidos con el sello de calidad también puede ayudar a crear un precedente de buenas prácticas entre los miembros de la organización, tomando como ejemplo la estructura de esta base de datos, que debe ser óptima en todos los aspectos. El acceso a este dataset puede permitir que el nivel técnico de los miembros suba gracias a su posterior adquisición.

También cabe la posibilidad de que miembros ajenos al departamento de visualización tengan interés en la base de datos, por ejemplo, haciendo uso de ciertas métricas insertadas en el modelo de las que se pueda sacar provecho en diversas áreas de la organización, como Data Science, Recursos Humanos o Marketing. 

Arquitectura y funcionamiento

Para que un dataset pueda adquirir el certificado o sello de calidad, tiene que ser validado por un miembro que previamente haya obtenido el permiso para certificar datasets. Este permiso lo adjudica un Administrador de Inquilinos de Office 365 de la organización. Para validarlo, dicho miembro simplemente debe tener acceso a la configuración del dataset. Para que el miembro certificador pueda tener acceso a la configuración del dataset, es necesario que previamente se le haya incluido en el “workspace” en el que reside la base de datos que se pretende validar, teniendo un rol de “Administrador”, “Miembro” o “Colaborador”.

Una vez el dataset es compartido con un usuario de la forma explicada previamente, éste aparece visible para aquellos miembros que se dispongan a crear un informe en Power BI Service o para aquellos que lo hagan desde Power BI Desktop, desde la opción de obtener datos desde un “Conjunto de datos de Power BI”, siempre y cuando tengan alguno de los roles explicados o, en su defecto, se le haya otorgado la posibilidad de “ver y compilar” el dataset al configurar la ventana de “Administrar permisos”.

Una vez se tiene acceso a una base de datos, todos los cambios que se hagan en el informe a nivel de datos y modelado afectan exclusivamente al informe en particular, sin manifestarse en la base de datos original. A su vez, cualquier transformación en la base de datos original, se hereda a todos los informes que “beben” de ella.

Cabe destacar la existencia de otro sello intermedio entre un dataset común y el Certified Dataset, se trata del Promoted Dataset. Esta etiqueta le es asignada a bases de datos cuyo creador considera de calidad y exportable para su uso entre otros usuarios de la compañía. Este dataset debe pasar un control de calidad para pasar al siguiente nivel y convertirse en un Certified Dataset.

Es importante destacar que los sellos de calidad como tal no suponen ninguna ventaja funcional en el sentido estricto de la palabra, sino que son empleados a modo de etiqueta con una labor más informativa. En el momento de crear un informe, los datasets disponibles vienen ordenados por defecto, atendiendo al siguiente orden: certificado, promocionado y común.

Por otra parte, en el momento de agregar un usuario a la base de datos, también se puede determinar si el nuevo usuario tiene permisos para compartir de nuevo el dataset o no. Para poder compartir, el usuario debe, o bien tener el rol de “Administrador” o “Miembro” en el “workspace”, o bien haber recibido el permiso de “Volver a compartir” cuando se le da acceso al dataset.

Posibles mejoras

En cuanto a las posibles mejoras que se podrían llevar a cabo relacionadas con la compartición de bases de datos, probablemente una de las más destacadas sería dar la posibilidad a los Certified Datasets de ser compartidos directamente a todos los miembros de la organización, sin tener que agregar a los usuarios uno a uno. Esta medida sería especialmente útil para aquellas bases de datos que se considera que podrían suponer una ventaja para una buena parte de la compañía, es decir, bases de datos “corporativas”.

Otra posible implementación estaría relacionada con el vínculo de cada usuario con la base de datos una vez la ha importado. Quizás sería una buena solución ofrecer una alternativa que permitiese importar la base de datos y desentenderse de ella a partir de ahí, haciendo que las posteriores transformaciones en el dataset nativo no tengan efecto en el informe del usuario que importó la base de datos en un estado anterior. Esta alternativa permitiría evitar algunas incompatibilidades entre los cambios del usuario a la base de datos primigenia y las transformaciones posteriores de esta base de datos en su origen.

De forma más avanzada, otra mejora consistiría en dar la posibilidad de compartir sólo una parte del dataset. Esta funcionalidad podría dar la capacidad de incluir o no medidas en el informe. Se trataría de segmentar la compartición en diferentes capas, y podría ser útil en casos en los que las necesidades de distintos departamentos no fueran las mismas en cuanto a información requerida.

Conclusión

En relación al estudio llevado a cabo, considero que la implementación en las empresas de los Certified Datasets, así como de otros métodos de compartición de bases de datos en Power BI, es una metodología con un buen potencial, si bien todavía está por desarrollar y presenta algunas carencias a la hora de agilizar los permisos en función de cada usuario.

En los próximos meses, es posible que se aprecien más cambios en relación con los puntos vistos en este artículo, puesto que algunas de las últimas novedades se encuentran en vista previa. Estas últimas implementaciones desarrolladas en los últimos meses deben servir de nexo para dar un salto cualitativo en la agilidad y funcionalidad de esta metodología.

No obstante, a falta de las mejoras que estén por llegar, las posibilidades ya son lo suficientemente grandes como para aprovechar la idea global de establecer bases de datos que sirvan como patrimonio a la organización para que una buena parte de sus usuarios saquen provecho y de ese modo mejorar el nivel medio global de calidad de los informes

También podéis seguirnos en Twitter, LinkedIn y Facebook.

Suscríbete a nuestra newsletter para enterarte de las novedades más Geek

Newsletter Banner
RGPD

Contenido Relacionado