Identifikation schwacher Signale durch Auswertung externer Daten Ralf Hennemann, GBI-Genios Deutsche Wirtschaftsdatenbank GmbH DGI-Praxistage, Frankfurt, 11.11.2016
Inhalt 1| Wer wir sind 2| Erste Erfahrungen 3| Ausblick
2
Wer wir sind
…Spezialist für Informationslösungen: Recherchelösungen, Online-Archive, Mediatheken, individuellen Firmensolutions u.v.m.
…Erfahrener Partner bei der Datenaufbereitung, Datenanreicherung, ContentErschließung
…Contentbroker für Ihre Inhalte. Vermarktung über unsere Portale an Unternehmen, öffentliche Einrichtungen, Hochschulen u.v.m.
3
Was wir haben Big Data •
Mehr als 400 Mio. Dokumente auf GENIOS.de
•
Millionen Webseiten, Foren, Blogs + soziale Netzwerke
Strukturierte Daten •
Handelsregister, Jahresabschlüsse, Firmenprofile, Bonitäten
Unstrukturierte Daten
•
Presse, Fachpresse
4
Die zentrale Frage
© Lars Trieloff, blueyonder, GENIOS Datenbankfrühstück 2015
5
Wie funktioniert Wertschöpfung? Mehrwert entsteht durch das Verändern einer „Ware“ auf eine Weise, die sie für den Kunden attraktiver und wertvoller macht.
• •
Wir schaffen keine neuen Inhalte, das tun unsere Content-Lieferanten Wir schaffen aus diesen Inhalten „neue Werte“
6
Indem wir… Analysieren
Presse => Firmen, Personen => Geschäftsvorfälle, Signale für…
Zuordnen
Relevanz bewerten
Lorem ipsum => bedeutet z.B. „neuer Standort wird eröffnet“
z.B. für Bonitätsentwicklung relevant oder nicht?
Komprimieren
7
Analytics that drive business decisions
Im Browser
8
Big – smart – predictive Automatische Indexierung
• Intelligentes automatisches Verfahren • Thesaurus-basiert • Einheitlich
• Nicht Nutzerspezifisch Präzises Finden
Textanalytische Ergebnisqualifizierung
• Interpretationsalgorithmen • Natural Language Processing • Verstehen statt Vergleichen • Individueller Ansatz Basis für die Signalerkennung
Signalgeber
• Identifikation und Verknüpfung von Signalen • Presse und Social Media
Neues Wissen
Predictive Analytics
• Durch Analyse von Vergangenheitsdaten • Erkennen wiederkehrender Muster • Folgerichtige Interpretation Möglichkeit der Prognose
9
Erste Projekte Matching von Kundenstamm-Daten mit Presse / Fachpresse / Handelsregister
Um welche Firma geht es hier?
„Die Aktie der abc Logistikfirma legte zwölf Prozent zu.“ „Neue abc Fachschule in Gelsenkirchen geplant!“ „Vor über 130 geladenen Gästen weihte der Max Muster, Geschäftsführer von abc Firma, die neuen Räumlichkeiten der Geschäftsstelle Mannheim ein.“
10
Erste Projekte Wie entwickeln sich diese Kunden hinsichtlich…?
…Risikoeinstufung
…vertriebsrelevanter Ansätze
???
erfordert Erkennen von Signalen 11
Typischer Projektablauf
Auswahl Datenbestand (welche Quellen, welche Historie, welche Kunden…)
Analyse / Training / Nachjustierung
Szenario (welche Signale, wie kann man diese beschreiben, welche Synonyme, was soll das Ergebnis sein…)
Testbetrieb
Auswahl Kooperationspartner
Ergebnisevaluation / Regelbetrieb
12
Erfahrungen •
Beschreibung der Situation Parameter, Modelle, Szenarien Aus den Köpfen in den Algorithmus
Trefferliste
Ampel-Indikator
Volltext
•
Ergebnispräsentation Trefferliste / Lesen von Volltexten / Ampel-Indikatoren
•
Integration in den Arbeitsprozess Systemintegration, z.B. ins CRM (Zuordnung Dokumente/Signale Firmen/Branchen/Vertriebsgebiete/Account Manager Handlung)
•
Komplexe Koordination und Entscheidungsfindung (verschiedenste Fachbereiche, IT, Einkauf)
•
Neue Anforderungen an Lizenzmodelle 13
Erfahrungen
Zeit Viel Geld
Geduld
Automatisierung
14
GENIOS Smart Data Services
Automatische Event Analyse auf Basis von mehr als 200 Millionen Presseartikeln!
15
GENIOS Smart Data Services
16
GENIOS Smart Data Services
17
Erfahrungen •
Gut fürs „Einfangen“
•
Weniger gut für konkrete Problemlösung
•
Individualisierung
•
„Massenvorfälle“
18
Automatisierung von „Massen“-Recherchen • Presse enthält Signale für Geschäftsansätze
• Vorteile: Interpretationsalgorithmen „verstehen“ Texte kein Buchstabenabgleich Lernendes System mit steigender Präzisierung Automatisierte und treffsichere Relevanzbewertung Qualitätssicherung bei Kosteneffizienz
• Kooperativer Ansatz: Kundenseitiges Branchen-Know-how Daten und technisches Know-how bei GBI-Genios Data Analytics mit Kooperationspartnern (z.B. Fraunhofer, SAS, diSCIS, KIT…) 19
Beispiel „Projekt-Datenbank“ Ausgangslage (manuell)
• Diverse komplexe Suchstrings • Bewerten der Ergebnisse durch kompetente Leser
Bauvorhaben keine Bauvorhaben
Zielsetzung (automatisiert)
• modularisierte Suche zur einfachen Erweiterung
Bauvorhaben
der Suchlogik mit Synonymen
• umfangreichere Interpretationsalgorithmen NLP (Bezug von Suchmustern in einem Satz, Erkennung von Semantik)
• Kombination mit Ausschluss-Suchen auf Metaebene (z.B. nicht wenn es sich um „Grundstein für die Rückrunde gelegt“ handelt)
keine Bauvorhaben 20
Beispiel „Projekt-Datenbank“ Suchquery (((Baubeginn* OR Baustart* OR Bauwerber OR Bauantrag* OR Bauprojekt* OR Bauvorhaben OR Baumaßnahme* OR Baugenehmigung* OR Bauträger OR Bauherr* OR Erstbezug OR Entkern* OR Grundstein OR Grundsteinlegung OR *Neubau OR *Umbau* OR Spatenstich OR Richtfest* OR Generalunternehmer* OR Generalsanier* OR "vorhabenbezogenen Bebauungsplan") OR ((*Abriss* OR abgerissen OR abzureißen OR Abbruch* OR Architekt* OR Bau* OR *Bau OR *baus OR *gebaut OR Entkern* OR Erricht* OR Erweiter* OR Invest* OR Modernisier* OR Sanier* OR *sanierung OR *saniert OR *sanieren) ndj20 (*Bibliothek* OR *Bücherei* OR *Kaserne* OR *Feuerwehr* OR *Gemeindehaus* OR *Kindergarten* OR *Kita* OR *Kindertagesstätte* OR *Mensa* OR *Museum* OR *Radstation* OR *Gymnasium* OR *Schule* OR Uni OR *Universität* OR *Fakultät* OR *Schwimmbad* OR *Freibad* OR *Sportplatz* OR Flüchtlingsunterk* OR *Theater* OR *Altenheim* OR *Seniorenheim* OR *Seniorenstift* OR *Pflegeheim* OR Bahnhof* OR *Behindertenheim* OR Biogasanlage OR *Hotel* OR *Kirche* OR *Klinik* OR *Krankenh* OR *Markt OR Mastanlage* OR *Pension OR Stadtwerke OR *haus OR *häuser OR *gebäude OR *halle OR *bauten OR *Komplex OR *Zentrum OR *Center OR *anlage OR *heim OR *wohnungen))) NOT (Bauhaus* OR Landschaftsarchit* OR Landschaftsgest*))
21
Prof. Bauckhage auf dem GENIOS Datenbankfrühstück 2016
© Prof. Dr.-Ing. Christian Bauckhage, Fraunhofer IAIS
22
Prof. Bauckhage auf dem GENIOS Datenbankfrühstück 2016
© Prof. Dr.-Ing. Christian Bauckhage, Fraunhofer IAIS
23
Beispiel „Projekt-Datenbank“ Kalkulation:
Anzahl
pro Jahr
Suchergebnis
1.172.952
100 %
geöffnete Artikel
239.688
20 %
relevante Artikel
93.012
8%
39 %
1. Schritt der Relevanzbewertung: Titel & Trefferumgebung der Suchergebnisse lesen (je 10 Sek) 3.258 Stunden
2. Schritt der Relevanzbewertung: Artikel öffnen und querlesen (je 20 Sek) 1.332 Stunden Kosten Arbeitsaufwand bei 30 € pro Stunde 4.590 Stunden 138 T Euro
24
Beispiel Kundenakquise •
Bestandskundenanalyse Erstellung von Zielkundenprofilen
•
Identifikation potenzieller Neukunden durch Matchen der ZG-Profile mit Firmeninformationen bei GENIOS
•
Monitoring der Presse richtiger Zeitpunkt für die Zielkundenansprache
Bestandskundenanalyse
Zielkundenprofil
25
Beispiel Kundenakquise •
Bestandskundenanalyse Erstellung von Zielkundenprofilen
•
Identifikation potenzieller Neukunden durch Matchen der Zielkunden-Profile mit Firmen- und Presseinformationen bei GENIOS
•
Monitoring der Presse richtiger Zeitpunkt für die Zielkundenansprache
Zielkundenprofil
Identifikation potenzieller Neukunden 26
Use Case Predictive Analytics in der Kundenakquise •
Bestandskundenanalyse Erstellung von Zielkundenprofilen
•
Identifikation potenzieller Neukunden durch Matchen der ZG-Profile mit Firmeninformationen bei GENIOS
•
Monitoring der Presse richtiger Zeitpunkt für die Zielkundenansprache
Signal Identifikation potenzieller Neukunden
Screening von Presse + Social Media
Einspielung in CRM-Systeme
27
Beispiel Riskmanagement
„Historische“ Finanzdaten
Handelsregister Warum kam es zu der Entwicklung? Wie wurde damit umgegangen?
Benchmarking Firmen/Branchen
„Historischen“ Pressedaten
Aktuelle Signale aus Presse / Social Media / Web
Intelligente neuronale Systeme identifizieren Indikatoren und erstellen Prognosen für die weitere Entwicklung
28
How to Get Value out of Big Data? Vortrag auf dem GENIOS Datenbankfrühstück 2015
Lars Trieloff, blueyonder 29
Moderne Textanalyse Vortrag auf dem GENIOS Datenbankfrühstück 2016
Prof. Christian Bauckhage, Fraunhofer IAIS
30
Kontaktieren Sie uns Sie interessieren sich für unsere Vorträge oder ein Beratungsgespräch?
Sprechen Sie mich an!
31
Kontakt
Ralf Hennemann Fon:
089 / 99 28 79 41
Mail:
[email protected]
GBI-Genios Deutsche Wirtschaftsdatenbank GmbH Freischützstraße 96 81927 München. Ein Unternehmen der Frankfurter Allgemeinen Zeitung und der Verlagsgruppe Handelsblatt. Die Onlineangebote aus unserem Haus:
www.genios.de
www.wiso-net.de 32