Microsoft SharePoint Connector

Author: Rolf Schenck

2 downloads 1 Views 1MB Size

Report

Download PDF

Recommend Documents

Configuring ADOBE LIVECYCLE ES4 Connector for MICROSOFT SHAREPOINT

SharePoint. Microsoft SharePoint. Deployment Guide

Microsoft SharePoint Branding & Customization ~

Microsoft Exchange 2010 Connector

Microsoft SharePoint Server

Microsoft SharePoint Server 2010

Microsoft Office SharePoint Server. PingFederate. SharePoint And

Microsoft. SharePoint Designer

Vertragsmanagement mit Microsoft SharePoint

Microsoft SharePoint Training. Proposal

Microsoft Sharepoint For Dummies

Microsoft Microsoft SharePoint 2010 Application Development

WORKING WITH >> MICROSOFT SHAREPOINT plantemoran.com

UPGRADING MICROSOFT DYNAMICS AX CONNECTOR

Microsoft Sharepoint VMware Sample Blueprint

Deployment Guide. Microsoft SharePoint 2013

Microsoft Office SharePoint Server (MOSS)

Deployment Guide Microsoft SharePoint 2013

The Microsoft SharePoint 2007 Analysis

Microsoft SharePoint 2010, Application Development

Jive Connects for Microsoft SharePoint: Making SharePoint Jive

Microsoft SharePoint 2013 for SharePoint Readers, Authors and Site Managers

Microsoft SharePoint Server and SnapManager for SharePoint Deployment Guide

Microsoft SharePoint Connector Installation und Konfiguration Version 2017 Winter Release Status: 13. April 2017

Copyright © Mindbreeze GmbH, A-4020 Linz, 2017.

Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen sind Handelsnamen und/oder Marken der jeweiligen Hersteller. Diese Unterlagen sind streng vertraulich. Durch die Übermittlung und Präsentation dieser Unterlagen alleine werden keine Rechte an unserer Software, an unseren Dienstleistungen und Dienstleistungsresultaten oder sonstigen geschützten Rechten begründet. Die Weitergabe, Veröffentlichung oder Vervielfältigung ist nicht gestattet. Aus Gründen der einfacheren Lesbarkeit wird auf die geschlechtsspezifische Differenzierung, z.B. Benutzer/innen, verzichtet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für beide Geschlechter.

Microsoft SharePoint Connector

2

Inhalt 1 Installation____________________________________________________________________ 4 1.1 Erweitern von Mindbreeze für den Gebrauch des Microsoft SharePoint Connectors ________ 4 1.2 Benötigte Crawling-User Rechte ________________________________________________ 4 1.3 Installation von Services für Microsoft SharePoint __________________________________ 6 1.4 Installation des Sharepoint SSL Zertifikats für Java _________________________________ 7 2 Konfiguration von Mindbreeze ___________________________________________________ 7 2.1 Konfiguration der Datenquelle __________________________________________________ 9 2.1.1 Microsoft Sharepoint Connection ____________________________________________ 9 2.1.2 Crawl URLs ____________________________________________________________ 10 2.1.3 Security Settings ________________________________________________________ 10 2.1.4 Alias URLs Mapping _____________________________________________________ 11 2.1.5 Content Type Settings____________________________________________________ 11 2.1.6 Synchronization Settings__________________________________________________ 12 2.1.7 Crawler Performance Settings _____________________________________________ 12 2.1.8 Content Metadata Extract Setting ___________________________________________ 12 2.2 Bearbeiten von Microsoft Office Dokumenten im SharePoint _________________________ 13 2.3 Konfiguration der integrierten Authentifikation des Microsoft SharePoint Crawlers ________ 13 3 Problemlösungsmöglichkeiten __________________________________________________ 14 3.1 Crawling User Unauthorized __________________________________________________ 14 3.2 SharePoint URL – FQDN_____________________________________________________ 15 3.3 SharePoint Webservices mit SOAP-Calls mittels curl testen _________________________ 16 3.3.1 SOAP-Calls vorbereiten __________________________________________________ 16 3.3.2 SOAP-Calls testen ______________________________________________________ 17 3.4 Dokumente von Crawler IGNORED ____________________________________________ 19 3.5 Konfiguration von Metadatenkonvertierungsregeln in der ConnectorMetadataMapping.xml Datei ________________________________________________________________________ 20 3.5.1 Content XPath Konfiguration ______________________________________________ 20 3.5.2 Referenzierung _________________________________________________________ 20 3.5.3 String Formatierung _____________________________________________________ 20 4 Deinstallation des Microsoft SharePoint Connectors _______________________________ 21

Microsoft SharePoint Connector

3

1 Installation Bevor der Microsoft SharePoint Connector installiert wird, muss sichergestellt werden, dass der Mindbreeze Server bereits installiert ist und dieser Connector auch in der Mindbreeze Lizenz inkludiert ist.

1.1 Erweitern von Mindbreeze für den Gebrauch des Microsoft SharePoint Connectors Der Microsoft SharePoint Connector ist als ZIP File erhältlich. Dieses File muss wie folgt im Mindbreeze Server via mesextension.exe registriert werden: mesextension --interface=plugin --type=archive -file=MicrosoftSharePointConnector.zip install

ACHTUNG: Der Connector kann über mesextention auch upgedatet werden. Mindbreeze wird automatisch die erforderlichen Updates durchführen.

1.2 Benötigte Crawling-User Rechte Der Microsoft SharePoint Connector erlaubt das Crawlen und Durchsuchen von Microsoft SharePoint Elementen und Objekten. Um eine Microsoft Sharepoint Datenquelle konfigurieren zu können, müssen folgende Voraussetzungen erfüllt sein 

Die verwendete Microsoft SharePoint Version muss SharePoint 2013, SharePoint 2010 oder SharePoint 2007 sein.



Für eine Kerberos Authentifizierung des Service Benutzers auf dem Mindbreeze Node mit der SharePoint Datenquelle muss der Benutzer zumindest Full Read Rechte in der SharePoint Web Applikation besitzen. Kerberos muss als Authentifizierungs - Methode für diese Web Applikation ausgewählt sein.



Für eine Basis Authentifizierung mittels Benutzernamen und Passwort eines Accounts mit vollen Leserechten auf der SharePoint Web Applikation muss dies in der Mindbreeze Manager Konfiguration unterstützt werden. Für diese Web Applikationen muss Basic Authentication als Authentifizierungsrichtlinie ausgewählt werden.

Ein Benutzer kann wie folgt zu den SharePoint Site Administratoren hinzugefügt werden: 

Central Administration -> Application Management -> Manage web applications



Web Application -> User Policy (Siehe unten)



Dem Service-Benutzer “Full Read”-Rechte geben.

Microsoft SharePoint Connector

4

Konfiguration von “Authentication Provider”: 

Navigiere zu Central Administration -> Application Management



Web Application auswählen



Authentication Providers konfigurieren (Sieh unten)



Für NTLM und Basic Authentication soll der Benutzer-Name und Passwort im Mindbreeze Konfiguration eingegeben werden. (Siehe Abschnitt 2.1)

Microsoft SharePoint Connector

5



Für das Crawlen von Benutzerprofile in SharePoint 2013 muss der Service Benutzer zur List der Search Crawlers hinzugefügt werden.

Dafür navigieren Sie zu Central Administratation  Manage service application  User Profile Service Application und fügen Sie den Service Benutzer zur Liste der Search Crawlers hinzu. (Siehe unten)

1.3 Installation von Services für Microsoft SharePoint Die Services für Microsoft SharePoint müssen folgendermaßen installiert werden: 1. Login auf dem SharePoint Server dessen Seiten vom Connector gecrawlt werden sollen. 2. Öffnen des ISAPI Verzeichnisses in SharePoint. Wird die Standard Installation verwendet, lautet der Verzeichnispfad C:\Program Files\Common Files\Microsoft Shared\web server extensions\14\ISAPI (SharePoint 2010) und C:\Program Files\Common Files\Microsoft Shared\web server extensions\15\ISAPI (SharePoint 2013) 3. Kopieren Sie diese Files aus den Systemvoraussetzungen, wie in Schritt 2 definiert, in den ISAPI Ordner. 

GSBulkAuthorization.asmx



GSBulkAuthorizationdisco.aspx



GSBulkAuthorizationwsdl.aspx



GSSiteDiscovery.asmx



GSSiteDiscoverydisco.aspx



GSSiteDiscoverywsdl.aspx



GssAcl.asmx



GssAcldisco.aspx



GssAclwsdl.aspx



MesAcl.asmx

Microsoft SharePoint Connector

6



MesAcldisco.aspx



MesAclwsdl.aspx

4. Die Konnektivität des Web Servers kann mit folgenden URLs verifiziert werden: http://mycomp.com/_vti_bin/GSBulkAuthorization.asmx http://mycomp.com/_vti_bin/GSSiteDiscovery.asmx http://mycomp.com/_vti_bin/GssAcl.asmx

http://mycomp.com ist die SharePoint Seiten URL. Nachdem die oben genannten URLs geöffnet wurden, sollten alle Web Methoden des Web Services sichtbar sein.

1.4 Installation des Sharepoint SSL Zertifikats für Java Speichern Sie die SSL Zertifikat des Sharepoints z.B. in c:\temp\sharepointserver.cer

Installation: /bin>keytool -import -noprompt -trustcacerts -alias sharepointserver.cer -file /tmp/sharepointserver.cer -keystore ../lib/security/cacerts –storepass changeit

2 Konfiguration von Mindbreeze Wählen Sie die “Advanced” Installation:

Microsoft SharePoint Connector

7

Klicken sie auf “Indices” und auf das “Add new index” Symbol um einen neuen Index zu erstellen.

Eingabe eines neuen Index Pfades z.B, “/data/indices/sharepointt”. Falls notwendig muss der Display Name des Index Services und des zugehörigen Filter Services geändert werden. Mit “Add new custom source” unten rechts kann eine neue Datenquelle hinzugefügt werden.

Microsoft SharePoint Connector

8

2.1 Konfiguration der Datenquelle 2.1.1 Microsoft Sharepoint Connection Diese Information wird nur für Basic Authentifizierung benötigt: 

SharePoint Server URL: Um den gesamten Inhalt von Microsoft SharePoint zu crawlen, muss der URL von Microsoft SharePoint Servers in das Feld eingegeben werden. Es ist auch möglich nur eine bestimmte SharePoint Seite URL hier einzutrage. Damit wird nur diese Seite gecrawlt. Die Anmeldedaten für diese Seite sollen über Endpoints im Network Registerkarte konfiguriert werden wenn kein Kerberos Authentisierung vewendet wird. SharePoint Server URL und Location Feld im Endpoint müssen identisch sein.



Logon Account For Principal Resolution, Domain und Password: Falls ein „Principal Resolution Cache“ Service oder Kerberos verwendet wird, sind diese Anmeldedaten nicht notwendig.

Wenn ein Sharepoint Principal Cache verwendet wird, können die Anmeldeinformationen nicht in der Datenquelle definiert werden. Sondern sie werden im Network-Reiter unter Credentials einmal konfiguriert und für mehrere SharePoint Server URLs unter Endpoints ausgewählt.

Microsoft SharePoint Connector

9

2.1.2 Crawl URLs Es ist möglich die zu crawlenden Daten z.B. bestimmte Seiten zu limitieren. Dafür müssen die zu crawlenden Seiten in das Feld “Included URL” eingefügt werden. Es ist auch möglich, Seiten auszuschließen oder nicht zu crawlen. Diese Seiten müssen in das Feld “Excluded URL” eingetragen werden. Es ist möglich hier eine Regular Expression zu verwenden. Eine Regular Expression muss „regexp:“ oder „regexpIgnoreCase:“ Präfix haben. Für das Crawlen von Benutzer Profilen muss „Crawl User Profile“ ausgewählt werden und die „MySite URL“ und „Collection Name for User Profiles“ entsprechend konfiguriert werden.

2.1.3 Security Settings

Durch das Verschieben von Dokumente von einem Verzeichnis zum anderen Verzeichnis ändern sich auch URLs dieser Dokumente. Um diese Änderungen auch im Index zu aktualisieren sollte die „Track Document URL Changes“ Option ausgewählt werden. „Resolve Sharepoint Groups“ sollte nicht ausgewählt werden, wenn „Sharepoint Principals Cache Service“ ausgewählt ist. Mit der Konfiguration von „Normalize ACLs“ werden alle AD Benutzer und Gruppen in ACLs in Distinguished Name Format umgewandelt. Für das Crawlen von SharePoint Seiten mit anonymer Zugriffsrechten muss „Include Documents without ACLs“ ausgewählt werden. Um SharePoint Seiten durch aktivieren von bestimmten Feature vom Crawlen auszuschließen ist es notwendig die ID (GUID) von diesen Features im Feld „Exclude Documents From Sites With These Features“ einzutragen.

Microsoft SharePoint Connector

10

2.1.4 Alias URLs Mapping „Alias URLs“ ermöglichen es, interne URLs von Sharepoint zu überschreiben und zu indizieren. Das ist nur dann notwendig wenn der Benutzer keine Zugriffsrechte auf diese interne URLs haben. Die Alias URLs sind entsprechend der „Alternative Access Mapping“ am Sharepoint Server zu konfiguriert.

2.1.5 Content Type Settings Um nicht publizierte Dokumente crawlen zu können, muss die „Include Unpublished Documents“ selektiert werden. Um weitere spezifische Inhaltstypen crawlen zu können, müssen diese dem „Additional Content Types“ Muster entsprechen. Der SharePoint Connector verwendet eine vorkonfigurierte Content Type Mapping Description XML Datei, die in der Connector Archivdatei vorhanden ist. Falls eine spezifische Änderung erwünscht ist kann diese Datei bearbeitet werden und in einem anderen Verzeichnis gespeichert werden. Um diese bearbeitete Konfiguration zu verwenden ist es notwendig im „Content Type Mapping Description File“ Feld der Pfad zur der bearbeitete Datei einzutragen. In Content Type Mapping Description Datei kann man Regeln für bestimmte Inhaltstypen definieren. Z.B. nur Dokumente von Inhaltstype „Document“ zu crawlen. Daher kann es sein, dass nach der Änderung von dieser Regel das Löschen von bereits indizierten anderen Inhaltstypen vom Index notwendig wird. Mit der Option „Delete Ignored Documents From Index“ können dann diese Dokumente vom Index gelöscht werden.

Microsoft SharePoint Connector

11

2.1.6 Synchronization Settings 

Synchronize with Index on Startup: Der crawler speichert lokal sein Zustand vom letzten Lauf. Dadurch wird das Abgleichen einzelner Dokumente im Index mit denen vom Sharepoint Server vermieden. Manchmal, wegen Transport oder Filter Problemen, kann es passieren dass dieser Zustand von Index abweicht. Um diese Abweichung zu korrigieren ist die „Synchronize with Index on Startup“ Option auszuwählen.



Synchronization Timeout (Hours): Gibt eine Anzahl von Stunden an, nach dem das Synchronisieren abgebrochen und er gespeicherte Zustand verwendet wird.



Reset Connector State if it is not consistent with index: Wenn der crawler Status nicht konsistent mit dem Indexstatus ist, wird er gelöscht und ein voller Indizierungslauf gestartet. Wird diese Option deaktiviert, so wird der Status nicht gelöscht.

2.1.7 Crawler Performance Settings



Bach Size: Definiert die Anzahl von Dokumente die von Sharepoint Server geholt werden, bevor sie zum Index geschickt werden.



Number of Threads: Threads, die parallel die gesammlten Dokumente an Index schicken.



Document Size Limit (MB): Dieses Wert muss „Maximum Input Size (MB)“ von Filter Service entsprechen.

2.1.8 Content Metadata Extract Setting Um Metadaten aus dem HTML Inhalt zu extrahieren wird folgende Konfiguration benötigt.

Microsoft SharePoint Connector

12



Name: Name des Metadatums.



XPath: zum Metadatumswert.



Format: String, Datum, URL, Path und Signatur.



Format Options:

2.2 Bearbeiten von Microsoft Office Dokumenten im SharePoint Beim Öffnen der Office Dokumente vom Suchresultat im Internet Explorer können die geöffneten Dokumente bearbeitet und im SharePoint gespeichert werden. Dafür werden Schreibrechte auf das Dokument benötigt. Bei der Verwendung anderer Browser werden die Dokumente schreibgeschützt geöffnet.

2.3 Konfiguration der integrierten Authentifikation des Microsoft SharePoint Crawlers Windows: Wenn die Installation auf einem Microsoft Windows Server durchgeführt wird, kann die Kerberos Authentifizierung des aktuellen Mindbreeze Services für den Microsoft SharePoint Crawler benutzt werden. In diesem Fall muss der Service Benutzer für die Microsoft SharePoint Web Services authentifiziert sein. Linux: Für eine Installation unter Linux müssen folgende Schritte ausgeführt werden: 

Erzeugen eines keytab für den privileged user mittels ktutil: o

Start ktutil on the command line and carry out these commands in the ktutil shell:

 addent -password -p @ -k 0 -e arcfour-hmac  (for example: addent -password -p [email protected] -k 0 -e arcfour-hmac)  Enter the user password.  wkt 

Hochladen des Keytab:

Microsoft SharePoint Connector

13



Konfiguration des Keytab und des enthaltenen Principals (im Reiter Authentication):

WICHTIG: Das keytab muss den Schlüssel des oben genannten Benutzers enthalten. Das keytab für das Mindbreeze Client Service kann hier nicht verwendet werden.

3 Problemlösungsmöglichkeiten Allgemein können Probleme bei der Indizierung von SharePoint-Datenquellen zuallererst in den entsprechenden Logdateien des Mindbreeze Log-Ordners gefunden werden. Im Mindbreeze Basis-Log-Ordner gibt es für den konfigurierten SharePoint-Crawler einen entsprechenden Unterordner der z.B. wie folgt heißen könnte: C:\logs\current\log-mescrawler_launchedserviceMicrosoft_SharePoint_Sharepoint+2007

Darin befindet sich dann für jeden Crawl-Lauf ein Datums-Unterordner und darin zwei Log-Dateien: 

log-mescrawler_launchedservice.log: Log-Datei mit allen relevanten Log-Informationen und

möglichen Fehlern 

mes-pusher.csv: CSV-Datei mit SharePoint-URLs die vom Crawler gefunden wurden und

deren Status Sollte die Datei mes-pusher.csv nicht auftauchen, gibt es vermutlich ein Konfigurations- oder Berechtigungsproblem, welches anhand der Fehlermeldungen in der ersten Log-Datei analysiert werden muss.

3.1 Crawling User Unauthorized Problem-Verhalten: Der Crawler bekommt keine Dokumente von SharePoint und erzeugt auch keine Datei-Liste in der Logdatei mes-pusher.csv. In der Logdatei log-mescrawler_launchedservice.log ist eine Fehlermeldung folgender Art zu finden: com.mindbreeze.enterprisesearch.gsabase.crawler.InitializationException: Invalid connector config: message Cannot connect to the given SharePoint Site URL with the supplied Domain/Username/Password.Reason:(401)Unauthorized

oder: com.mindbreeze.enterprisesearch.gsabase.crawler.InitializationException: Unable to set connector config, response message: Cannot connect to the Services for SharePoint on the given Crawl URL with the supplied

Microsoft SharePoint Connector

14

Domain/Username/Password.Reason:(401)Unauthorized, status message:null, status code:5223 (INVALID_CONNECTOR_CONFIG)

oder: enterprise.connector.sharepoint.wsclient.soap.GSBulkAuthorizationWS INTERNALWARNING: Can not connect to GSBulkAuthorization web service. cause:(401)Unauthorized

Problembeschreibung und -lösung: Aufgrund von Berechtigungsproblemen ist es dem verwendeten Service-Benutzer nicht möglich Datei-Auflistungen von SharePoint abzufragen. Folgende Punkte sind zu prüfen: 

Verwendete Authentisierungsmethoden bei SharePoint/IIS prüfen: o

Soll Integrated/Kerberos Authentisierung verwendet werden, muss das Mindbreeze Node Service unter diesem Benutzer-Account laufen.

o

Für NTLM/Basic Authentisierung muss der Service-Benutzer in der Mindbreeze Konfiguration der SharePoint Datenquelle eingetragen sein.



Berechtigungen des verwendeten Service-Benutzers in SharePoint prüfen



GssSiteDiscovery.asmx und GSBulkAuthorization.asmx Webservice testen (siehe später)



Testen Sie auch das Öffnen der SharePoint Dokument-Seiten sowie das Öffnen ausgewählter Dokumente aus SharePoint über einen Web-Browser ausgehend vom Mindbreeze Server mit dem konfigurierten Service-Benutzer

3.2 SharePoint URL – FQDN Problem-Verhalten: Der Crawler bekommt keine Dokumente von SharePoint und erzeugt auch keine Datei-Liste in der Logdatei mes-pusher.csv. In der Logdatei log-mescrawler_launchedservice.log ist eine Fehlermeldung folgender Art zu finden: com.mindbreeze.enterprisesearch.gsabase.crawler.InitializationException: Unable to set connector config, response message: The SharePoint Site URL must contain a fully qualified domain name., status message:null, status code:5223 (INVALID_CONNECTOR_CONFIG)

Problembeschreibung und -lösung: Für den Mindbreeze SharePoint Connector ist es essentiell, dass der SharePoint-Server über den FQDN-Hostnamen angesprochen wird. 

Sowohl in der SharePoint Konfiguration muss die externe URL konsistent als FQDN-Eintrag konfiguriert sein (siehe SharePoint „Operations“ > group „Global Configuration“ > „Alternate access mappings“)

Microsoft SharePoint Connector

15



Auch in der Mindbreeze-Konfiguration muss diese externe (FQDN) URL als Crawling Root konfiguriert sein.

3.3 SharePoint Webservices mit SOAP-Calls mittels curl testen Um Berechtigungsprobleme sowie Probleme mit den SharePoint Webservices zu analysieren kann man von der Kommandozeile aus SOAP-Calls mittels curl absetzen und das Ergebnis der einzelnen SOAP-Calls analysieren. Das Kommandozeilen Tool curl wird mit Mindbreeze InSpire (für Microsoft Windows) in folgendem Ordner mit ausgeliefert: C:\setup\tools\curl\bin und muss nur mehr zur Microsoft Windows Umgebungsvariable PATH hinzugefügt werden um einfach verwendbar zu sein.

3.3.1 SOAP-Calls vorbereiten Die Vorgehensweise zur Vorbereitung der SOAP-Calls für die einzelnen Tests ist immer die gleiche und wird hier einmalig anhand eines Beispiels beschrieben und kann für alle Checks analog angewandt werden. Als Beispiel verwenden wir CheckConnectivity von GSSiteDiscovery.asmx

Das entsprechende SharePoint Webservice im Browser öffnen und die gewünschte AktionsMethode für den Test auswählen um den Content der abgeschickt werden muss zu bekommen.

Microsoft SharePoint Connector

16

Der Einfachheit halber verwenden wir die Interface-Beschreibung für SOAP 1.2 und kopieren den XML-Content des ersten Blocks (Request Teil) in eine Datei und speichern den Inhalt unter einem frei wählbaren Namen (z.B. C:\Temp\sp-site-check.xml).

Je nach Interface-Definition müssen möglicherweise gewisse Werte im XML-Content an die eigene Infrastruktur angepasst werden.

3.3.2 SOAP-Calls testen Aufbauend auf dem vorbereiteten Beispiel testen wir nun den SOAP-Call mittels curl in einem Commandline-Fenster: Man wechselt in den Ordner, in dem auch die XML-Content-Datei liegt und führt das curlKommando analog zu folgendem Beispiel aus: ( sind entsprechend zu ersetzen)

Microsoft SharePoint Connector

17

C:\Temp>curl --ntlm --user : --header "ContentType: application/soap+xml;charset=utf-8" --data @ http:///_vti_bin/GSSiteDiscovery.asmx

Die Ausgabe wird direkt angezeigt, kann aber auch in eine Datei umgeleitet werden: > out.xml Folgende SharePoint Webservices und Methoden können Probleme relativ rasch aufdecken: 



http:///_vti_bin/GSSiteDiscovery.asmx

o

CheckConnectivity: sollte success zurückliefern

o

GetAllSiteCollectionFromAllWebApps: benötigt einen SharePoint Admin-Account!

http:///_vti_bin/GSBulkAuthorization.asmx

o 

CheckConnectivity: sollte success zurückliefern

http:///Docs/_vti_bin/GssAcl.asmx (dieser Test sollte auf das Unterverzeichnis in dem die SharePoint-Dokumente liegen (Bsp.: /Docs) ausgeführt werden)

o

CheckConnectivity: sollte success zurückliefern

o

GetAclForUrls: das ist der erste Test bei dem die Content-XML-Datei angepasst werden muss (siehe unterhalb) … man gibt z.B. die Basis AllItems.aspx URL an, in der alle

Dokumente enthalten sind, oder die SharePoint-URL eines ausgewählten Dokuments und sollte alle berechtigen Benutzer in der Antwort zurückbekommen … GetAclForUrls Content-XML: http://spserver2007.testlab.mindbreeze.fabagl.fabasoft.com/Docs/Documents/ Forms/AllItems.aspx http://spserver2007.testlab.mindbreeze.fabagl.fabasoft.com/Docs/Documents/ testdoc2_server2007.rtf

SOAP-Call mit curl: C:\Temp>curl --ntlm --user : --header "ContentType: application/soap+xml;charset=utf-8" --data @data.xml http://spserver2007.testlab.mindbreeze.fabagl.fabasoft.com/Docs/_vti_bin/GssAcl.as mx > out.xml

Das Ergebnis zeigt dann alle SharePoint-Berechtigungen zu den angegebenen URLs:

Microsoft SharePoint Connector

18

3.4 Dokumente von Crawler IGNORED Werden die Dokumente von SharePoint korrekt ausgelesen aber gelangen trotzdem nicht in den Index, ist dies in der Logdatei mes-pusher.csv ersichtlich. Zeigt die Spalte ActionType den Wert „IGNORED“ an, ist in der Spalte Message der Grund dafür zu finden. Mögliche Ursachen und deren Lösung: 

IGNORED, property ContentType with value null not matched pattern …

o



Haben die zu indizierenden SharePoint Dokumente einen Typ der nicht in der vom Standard-Connector vordefinierten Liste enthalten ist, werden diese ignoriert. Die Liste der zu indizierenden Dokumenttypen kann allerdings in der Mindbreeze Konfiguration mit der Eigenschaft „Additional Content Types“ erweitert werden.

Unable to generate SecurityToken from acl null

o

Können keine ACLs für ein Dokument von SharePoint ausgelesen werden, so wird das Dokument ebenfalls ignoriert. Hier ist zu prüfen ob die Berechtigungen des ServiceBenutzers ausreichend sind und ob die gssAcl.asmx Webservice Calls einwandfrei funktionieren.

Microsoft SharePoint Connector

19

3.5 Konfiguration von Metadatenkonvertierungsregeln in der ConnectorMetadataMapping.xml Datei Folgende Beispiele zeigen wie man bestimmte Regeln im ConnectorMetadataMapping.xml konfigurieren kann um neue Metadaten aus bestehende Metadaten zu generieren.

3.5.1 Content XPath Konfiguration //*[@id='ArticleContent'] //*[starts-with(@id, 'ECBItems_']

3.5.2 Referenzierung srcName mappedRef http://site/list/AllItems.aspx|%s

3.5.3 String Formatierung Zusammenführung von Metadaten: srcName1,srcName2 mappedName %s|%s

Trennung von einem Metadatum: srcName mapped1,mapped2 :

Ersetzung von Metadaten: srcName mappedName

Microsoft SharePoint Connector

20

.*src="([^"]*)".* http://mycompany.com$1

4 Deinstallation des Microsoft SharePoint Connectors Um den Microsoft SharePoint Connector zu deinstallieren, müssen zuerst alle Microsoft SharePoint Crawler gelöscht und danach folgender Befehl ausgeführt werden: mesextension --interface=plugin --type=archive -file=MicrosoftSharePointConnector.zip uninstall

Microsoft SharePoint Connector

21