Configuración de dos Software Update Points usando una única base de datos
12 diciembre, 2013
Nuevas herramientas gratuitas para SQL Server
18 diciembre, 2013

En SharePoint 2013 aparece un nuevo servicio de búsquedas (Search) que se basa en una combinación de lo mejor de SharePoint Search y FAST Search.

A continuación se muestran varias de las principales diferencias con su antecesor:

ARQUITECTURA
Este nuevo servicio de búsquedas tiene una nueva arquitectura formada por los siguientes componentes y bases de datos:


1 – Crawl component: rastrea (crawl) las fuentes de contenido. Puede rastrear una amplia gama de fuentes de contenido como por ejemplo, archivos compartidos, contenido en SharePoint o aplicaciones de línea de negocios. Para recuperar la información, se conecta a las fuentes de contenido invocando al conector o protocol handler correspondiente. Tras recuperar el contenido, pasa los elementos rastreados al componente de procesamiento de contenido.

2 – Content processing component: procesa los elementos rastreados y los envía al componente de índice. Lleva a cabo operaciones como, por ejemplo, el análisis de documentos o la asignación de propiedades. También lleva a cabo procesamiento lingüístico como, por ejemplo, la extracción de entidades y la detección de idioma.

Transforma los elementos rastreados en elementos que se incluyen en el índice de búsqueda. También escribe información sobre enlaces y direcciones URL a la base de datos Link. A su vez, el componente de procesamiento de Analytics escribe información relacionada con la relevancia de estos enlaces y direcciones URL al índice de búsqueda mediante el componente de procesamiento de contenido.

3 – Analytics processing component: analiza los elementos rastreados, lo que se denomina análisis de búsqueda, y el modo en que los usuarios interactúan con la búsqueda, lo que se denomina análisis de uso. Los enlaces y los metadatos son ejemplos de análisis de búsqueda. El número de veces que se visualiza un elemento es un ejemplo de análisis de uso. La información de análisis de búsqueda se almacena en la base de datos Link, y la información de análisis de uso se almacena en la base de datos Analytics reporting.

4 – Index component: el índice de búsquedas se puede dividir en varias partes denominadas particiones del índice, de tal forma que el índice de búsquedas es la suma de todas las particiones del índice. Cada partición del índice tiene una o varias réplicas que contienen la misma información. Para conseguir tolerancia a fallos y redundancia es necesario crear réplicas adicionales para cada partición del índice y distribuirlas en diferentes servidores.

El componente de índice es la representación lógica de una réplica del índice. En la topología de búsqueda hay que aprovisionar un componente de índice para cada réplica de índice. El componente de índice recibe los elementos procesados del componente de procesamiento de contenido y los escribe en un archivo índice. Los archivos índice se almacenan en un disco de la réplica del índice.

El componente de índice recibe las consultas del componente de procesamiento de consultas y devuelve conjuntos de resultados.

5 – Query processing component: analiza y procesa las consultas y los resultados. Cuando el componente de procesamiento de consultas recibe una consulta, la analiza y la procesa para optimizar la precisión, la recuperación y la relevancia. La consulta procesada se envía al componente de índice. El componente de índice devuelve un conjunto de resultados basado en la consulta procesada al componente de procesamiento de consultas que, a su vez, procesa dicho conjunto de resultados antes de devolverlo al frontal web.

6 – Search administration component: ejecuta procesos que son esenciales para el sistema de búsqueda. Este componente lleva a cabo el aprovisionamiento, que consiste en agregar e iniciar instancias de otros componentes de búsqueda.

A – Base de datos Crawl: almacena la información acerca de los elementos rastreados. Por ejemplo, almacena información como la hora del último rastreo, el Id. del último rastreo y el tipo de actualización durante el último rastreo.

B – Base de datos Link: almacena la información que extrae el componente de procesamiento de contenido. También almacena información sobre el número de veces que los usuarios hacen clic sobre un resultado de búsqueda. La información se almacena sin procesar para que el componente de procesamiento de Analytics la analice.

C – Base de datos Analytics reporting: almacena los resultados de análisis de uso y extrae información de la base de datos Link cuando es necesario.

D – Base de datos Search administration: almacena información de configuración del sistema de búsquedas como por ejemplo topología, reglas de rastreo (crawl rules), reglas de consulta (query rules) y la asignación de propiedades rastreadas (crawl properties) a propiedades gestionadas (managed properties). También almacena la lista de control de acceso (ACL) para el componente de rastreo. Sólo puede haber una base de datos de administración de búsqueda por cada aplicación de servicio de búsqueda.

Cabe destacar que a diferencia con el sistema de búsquedas de SharePoint 2010, en SharePoint 2013 la topología del servicio de búsqueda no se puede modificar a través de la consola de administración. Para ello, hay que utilizar Powershell.
INTERFAZ DE BÚSQUEDA PARA EL USUARIO
Sin tener que abrir cada resultado de la búsqueda, los usuarios pueden identificar rápidamente los resultados útiles de la siguiente forma:

  • Los usuarios pueden dejar el puntero sobre un resultado de la búsqueda para obtener una vista previa del contenido en un panel emergente a la derecha del resultado.
  • Los usuarios pueden diferenciar rápidamente los resultados de las búsquedas en función de su tipo (documentos Office, conversaciones, sitios, personas…).
  • Los usuarios pueden ver contenidos relacionados en bloques de resultados. Por ejemplo, los resultados que son documentos de PowerPoint se muestran en un bloque de resultados cuando la palabra “presentación” forma parte de los términos de búsqueda.

Además, los resultados de los elementos que se buscaron y seleccionaron con anterioridad se muestran como sugerencias de consulta en la parte superior de la página de resultados.
RELEVANCIA DE LOS RESULTADOS
Un resultado de una búsqueda es más relevante cuanto mejor satisface la intención de la persona que realiza la consulta.

Análisis de contenido e interacción del usuario
El sistema de búsquedas, a través del componente de procesamiento de Analytics, analiza la frecuencia con la que los resultados aparecen en las búsquedas y los que son más seleccionados por los usuarios para mejorar la relevancia de los resultados.

Reglas de consulta
Cuando una consulta cumple determinadas condiciones, el sistema de búsquedas realiza las acciones determinadas para mejorar la relevancia de los resultados.

Una regla de consulta puede determinar las siguientes acciones:

  • Agregar resultados promocionados (Best Bets en SharePoint 2010) para que aparezcan por encima del resto de resultados.
  • Agregar uno o más bloques de resultados.
  • Cambiar la relevancia de los resultados normales favoreciendo unos frente a otros.

Fuentes de resultados
En Sharepoint 2013 las fuentes de resultados sustituyen a los ámbitos y las ubicaciones federadas para limitar las búsquedas a un conjunto concreto de contenidos o a un subconjunto de resultados de búsquedas.
MODIFICACIONES EN EL RASTREO
Rastreo continuo
En SharePoint Server 2013, existe un nuevo modo de planificar el rastreo de las fuentes de contenidos de SharePoint (el rastreo continuo). Con esta nueva planificación, los rastreos se lleven a cabo continuamente, eliminando la necesidad de planificar rastreos incrementales, y se inician según sea necesario para mantener actualizado el índice de búsqueda.

Reglas de distribución de host
En SharePoint Server 2010, las reglas de distribución de host se usan para asociar un host con una base de datos Crawl específica. Debido a los cambios llevados a cabo en la arquitectura del sistema de búsqueda, SharePoint Server 2013 no utiliza reglas de distribución de host. En su lugar, se puede determinar si la base de datos Crawl debería volver a equilibrarse a través de la vista de bases de datos en el log del crawl.

Eliminar elementos del índice de búsqueda
En SharePoint Server 2010, los administradores pueden eliminar elementos del índice de búsqueda utilizando el Search Result Removal. En SharePoint Server 2013, pueden eliminar elementos del índice de búsqueda sólo usando el log del crawl.
DESCUBRIMIENTO DE ESTRUCTURA Y ENTIDADES EN CONTENIDO SIN ESTRUCTURA
El componente de rastreo se puebe configurar para buscar “entidades” en un contenido sin estructura, como por ejemplo, en el texto o el título de un documento. Estas entidades pueden ser palabras, frases o nombres de productos. Para especificar las entidades a buscar en el contenido se pueden crear diccionarios o utilizar otros ya creados.
ESQUEMA DE BÚSQUEDAS
El esquema de búsqueda determina cómo se guardan las propiedades del contenido rastreado en el índice de búsqueda. Para ello, define las propiedades rastreadas (crawl properties), las propiedades gestionadas (managed properties) y la asignaciones entre ellas. Las propiedades rastreadas y cómo se asignan a las propiedades gestionadas definen cómo se transforma el contenido rastreado en propiedades gestionadas. El índice de búsqueda guarda el contenido de las propiedades gestionadas. Los atributos de las propiedades gestionadas determinan la estructura del índice de búsqueda.

SharePoint Server 2013 introduce nuevos atributos que se pueden aplicar a las propiedades gestionadas (sortable y refinable). El atributo sortable reduce el tiempo necesario para devolver grandes conjuntos de resultados de búsqueda organizando los resultados antes de devolverlos. El atributo refinable permite refinar los resultados de búsquedas basándose en una propiedad gestionada concreta.
INFORMES DE BÚSQUEDAS
SharePoint 2013 proporciona más informes de salud de consultas y rastreos.

 

Compártelo: Share on FacebookTweet about this on TwitterShare on LinkedInPin on Pinterest

Comments are closed.

NEWSLETTER