Identifikation schwacher Signale durch Auswertung externer Daten

Identifikation schwacher Signale durch Auswertung externer Daten Ralf Hennemann, GBI-Genios Deutsche Wirtschaftsdatenbank GmbH DGI-Praxistage, Frankfu...
Author: Juliane Grosse
5 downloads 0 Views 4MB Size
Identifikation schwacher Signale durch Auswertung externer Daten Ralf Hennemann, GBI-Genios Deutsche Wirtschaftsdatenbank GmbH DGI-Praxistage, Frankfurt, 11.11.2016

Inhalt 1| Wer wir sind 2| Erste Erfahrungen 3| Ausblick

2

Wer wir sind

…Spezialist für Informationslösungen: Recherchelösungen, Online-Archive, Mediatheken, individuellen Firmensolutions u.v.m.

…Erfahrener Partner bei der Datenaufbereitung, Datenanreicherung, ContentErschließung

…Contentbroker für Ihre Inhalte. Vermarktung über unsere Portale an Unternehmen, öffentliche Einrichtungen, Hochschulen u.v.m.

3

Was wir haben Big Data •

Mehr als 400 Mio. Dokumente auf GENIOS.de



Millionen Webseiten, Foren, Blogs + soziale Netzwerke

Strukturierte Daten •

Handelsregister, Jahresabschlüsse, Firmenprofile, Bonitäten

Unstrukturierte Daten



Presse, Fachpresse

4

Die zentrale Frage

© Lars Trieloff, blueyonder, GENIOS Datenbankfrühstück 2015

5

Wie funktioniert Wertschöpfung? Mehrwert entsteht durch das Verändern einer „Ware“ auf eine Weise, die sie für den Kunden attraktiver und wertvoller macht.

• •

Wir schaffen keine neuen Inhalte, das tun unsere Content-Lieferanten Wir schaffen aus diesen Inhalten „neue Werte“

6

Indem wir… Analysieren

Presse => Firmen, Personen => Geschäftsvorfälle, Signale für…

Zuordnen

Relevanz bewerten

Lorem ipsum => bedeutet z.B. „neuer Standort wird eröffnet“

z.B. für Bonitätsentwicklung relevant oder nicht?

Komprimieren

7

Analytics that drive business decisions

Im Browser

8

Big – smart – predictive Automatische Indexierung

• Intelligentes automatisches Verfahren • Thesaurus-basiert • Einheitlich

• Nicht Nutzerspezifisch Präzises Finden

Textanalytische Ergebnisqualifizierung

• Interpretationsalgorithmen • Natural Language Processing • Verstehen statt Vergleichen • Individueller Ansatz Basis für die Signalerkennung

Signalgeber

• Identifikation und Verknüpfung von Signalen • Presse und Social Media

Neues Wissen

Predictive Analytics

• Durch Analyse von Vergangenheitsdaten • Erkennen wiederkehrender Muster • Folgerichtige Interpretation Möglichkeit der Prognose

9

Erste Projekte Matching von Kundenstamm-Daten mit Presse / Fachpresse / Handelsregister

Um welche Firma geht es hier?

„Die Aktie der abc Logistikfirma legte zwölf Prozent zu.“ „Neue abc Fachschule in Gelsenkirchen geplant!“ „Vor über 130 geladenen Gästen weihte der Max Muster, Geschäftsführer von abc Firma, die neuen Räumlichkeiten der Geschäftsstelle Mannheim ein.“

10

Erste Projekte Wie entwickeln sich diese Kunden hinsichtlich…?

…Risikoeinstufung

…vertriebsrelevanter Ansätze

???

erfordert Erkennen von Signalen 11

Typischer Projektablauf

Auswahl Datenbestand (welche Quellen, welche Historie, welche Kunden…)

Analyse / Training / Nachjustierung

Szenario (welche Signale, wie kann man diese beschreiben, welche Synonyme, was soll das Ergebnis sein…)

Testbetrieb

Auswahl Kooperationspartner

Ergebnisevaluation / Regelbetrieb

12

Erfahrungen •

Beschreibung der Situation Parameter, Modelle, Szenarien Aus den Köpfen in den Algorithmus

Trefferliste

Ampel-Indikator

Volltext



Ergebnispräsentation Trefferliste / Lesen von Volltexten / Ampel-Indikatoren



Integration in den Arbeitsprozess Systemintegration, z.B. ins CRM (Zuordnung Dokumente/Signale  Firmen/Branchen/Vertriebsgebiete/Account Manager  Handlung)



Komplexe Koordination und Entscheidungsfindung (verschiedenste Fachbereiche, IT, Einkauf)



Neue Anforderungen an Lizenzmodelle 13

Erfahrungen

Zeit Viel Geld

Geduld

Automatisierung

14

GENIOS Smart Data Services

Automatische Event Analyse auf Basis von mehr als 200 Millionen Presseartikeln!

15

GENIOS Smart Data Services

16

GENIOS Smart Data Services

17

Erfahrungen •

Gut fürs „Einfangen“



Weniger gut für konkrete Problemlösung



Individualisierung



„Massenvorfälle“

18

Automatisierung von „Massen“-Recherchen • Presse enthält Signale für Geschäftsansätze

• Vorteile:  Interpretationsalgorithmen „verstehen“ Texte  kein Buchstabenabgleich  Lernendes System mit steigender Präzisierung  Automatisierte und treffsichere Relevanzbewertung  Qualitätssicherung bei Kosteneffizienz

• Kooperativer Ansatz:  Kundenseitiges Branchen-Know-how  Daten und technisches Know-how bei GBI-Genios  Data Analytics mit Kooperationspartnern (z.B. Fraunhofer, SAS, diSCIS, KIT…) 19

Beispiel „Projekt-Datenbank“ Ausgangslage (manuell)

• Diverse komplexe Suchstrings • Bewerten der Ergebnisse durch kompetente Leser

Bauvorhaben keine Bauvorhaben

Zielsetzung (automatisiert)

• modularisierte Suche zur einfachen Erweiterung

Bauvorhaben

der Suchlogik mit Synonymen

• umfangreichere Interpretationsalgorithmen NLP (Bezug von Suchmustern in einem Satz, Erkennung von Semantik)

• Kombination mit Ausschluss-Suchen auf Metaebene (z.B. nicht wenn es sich um „Grundstein für die Rückrunde gelegt“ handelt)

keine Bauvorhaben 20

Beispiel „Projekt-Datenbank“ Suchquery (((Baubeginn* OR Baustart* OR Bauwerber OR Bauantrag* OR Bauprojekt* OR Bauvorhaben OR Baumaßnahme* OR Baugenehmigung* OR Bauträger OR Bauherr* OR Erstbezug OR Entkern* OR Grundstein OR Grundsteinlegung OR *Neubau OR *Umbau* OR Spatenstich OR Richtfest* OR Generalunternehmer* OR Generalsanier* OR "vorhabenbezogenen Bebauungsplan") OR ((*Abriss* OR abgerissen OR abzureißen OR Abbruch* OR Architekt* OR Bau* OR *Bau OR *baus OR *gebaut OR Entkern* OR Erricht* OR Erweiter* OR Invest* OR Modernisier* OR Sanier* OR *sanierung OR *saniert OR *sanieren) ndj20 (*Bibliothek* OR *Bücherei* OR *Kaserne* OR *Feuerwehr* OR *Gemeindehaus* OR *Kindergarten* OR *Kita* OR *Kindertagesstätte* OR *Mensa* OR *Museum* OR *Radstation* OR *Gymnasium* OR *Schule* OR Uni OR *Universität* OR *Fakultät* OR *Schwimmbad* OR *Freibad* OR *Sportplatz* OR Flüchtlingsunterk* OR *Theater* OR *Altenheim* OR *Seniorenheim* OR *Seniorenstift* OR *Pflegeheim* OR Bahnhof* OR *Behindertenheim* OR Biogasanlage OR *Hotel* OR *Kirche* OR *Klinik* OR *Krankenh* OR *Markt OR Mastanlage* OR *Pension OR Stadtwerke OR *haus OR *häuser OR *gebäude OR *halle OR *bauten OR *Komplex OR *Zentrum OR *Center OR *anlage OR *heim OR *wohnungen))) NOT (Bauhaus* OR Landschaftsarchit* OR Landschaftsgest*))

21

Prof. Bauckhage auf dem GENIOS Datenbankfrühstück 2016

© Prof. Dr.-Ing. Christian Bauckhage, Fraunhofer IAIS

22

Prof. Bauckhage auf dem GENIOS Datenbankfrühstück 2016

© Prof. Dr.-Ing. Christian Bauckhage, Fraunhofer IAIS

23

Beispiel „Projekt-Datenbank“ Kalkulation:

Anzahl

pro Jahr

Suchergebnis

1.172.952

100 %

geöffnete Artikel

239.688

20 %

relevante Artikel

93.012

8%

39 %

1. Schritt der Relevanzbewertung: Titel & Trefferumgebung der Suchergebnisse lesen (je 10 Sek) 3.258 Stunden

2. Schritt der Relevanzbewertung: Artikel öffnen und querlesen (je 20 Sek) 1.332 Stunden Kosten Arbeitsaufwand bei 30 € pro Stunde 4.590 Stunden 138 T Euro

24

Beispiel Kundenakquise •

Bestandskundenanalyse  Erstellung von Zielkundenprofilen



Identifikation potenzieller Neukunden durch Matchen der ZG-Profile mit Firmeninformationen bei GENIOS



Monitoring der Presse  richtiger Zeitpunkt für die Zielkundenansprache

Bestandskundenanalyse

Zielkundenprofil

25

Beispiel Kundenakquise •

Bestandskundenanalyse  Erstellung von Zielkundenprofilen



Identifikation potenzieller Neukunden durch Matchen der Zielkunden-Profile mit Firmen- und Presseinformationen bei GENIOS



Monitoring der Presse  richtiger Zeitpunkt für die Zielkundenansprache

Zielkundenprofil

Identifikation potenzieller Neukunden 26

Use Case Predictive Analytics in der Kundenakquise •

Bestandskundenanalyse  Erstellung von Zielkundenprofilen



Identifikation potenzieller Neukunden durch Matchen der ZG-Profile mit Firmeninformationen bei GENIOS



Monitoring der Presse  richtiger Zeitpunkt für die Zielkundenansprache

Signal Identifikation potenzieller Neukunden

Screening von Presse + Social Media

Einspielung in CRM-Systeme

27

Beispiel Riskmanagement

„Historische“ Finanzdaten

Handelsregister Warum kam es zu der Entwicklung? Wie wurde damit umgegangen?

Benchmarking Firmen/Branchen

„Historischen“ Pressedaten

Aktuelle Signale aus Presse / Social Media / Web

Intelligente neuronale Systeme identifizieren Indikatoren und erstellen Prognosen für die weitere Entwicklung

28

How to Get Value out of Big Data? Vortrag auf dem GENIOS Datenbankfrühstück 2015

Lars Trieloff, blueyonder 29

Moderne Textanalyse Vortrag auf dem GENIOS Datenbankfrühstück 2016

Prof. Christian Bauckhage, Fraunhofer IAIS

30

Kontaktieren Sie uns Sie interessieren sich für unsere Vorträge oder ein Beratungsgespräch?

Sprechen Sie mich an!

31

Kontakt

Ralf Hennemann Fon:

089 / 99 28 79 41

Mail:

[email protected]

GBI-Genios Deutsche Wirtschaftsdatenbank GmbH  Freischützstraße 96  81927 München. Ein Unternehmen der Frankfurter Allgemeinen Zeitung und der Verlagsgruppe Handelsblatt. Die Onlineangebote aus unserem Haus:

www.genios.de

www.wiso-net.de 32