Grundprinzipien der KI-Systeme

Grundprinzipien der KI-Systeme Cristina Vertan Inhaltsübersicht • Was ist und mit was sich KI beschäftigt ? • Wie versteht ein Computer Bilder ? • W...
Author: Ludo Dressler
0 downloads 0 Views 131KB Size
Grundprinzipien der KI-Systeme

Cristina Vertan

Inhaltsübersicht • Was ist und mit was sich KI beschäftigt ? • Wie versteht ein Computer Bilder ? • Wie verstehet ein Computer natürliche Sprache?

19.04.2004

SoSe'04

2

1

Was ist KI ? • KI = Künstliche Intelligenz ist eine wissenschaftliche Disziplin , die das Ziel verfolgt menschliche Wahrnehmungs- und Verstandesleistungen zu operationalisieren (Görz95) • Man entwickelt Modelle und untersucht Berechnungsverfahren die es ermöglichen maschinell (mit Hilfe eines Computers) wahrzunehmen, zu schlussfolgern und zu handeln . • KI hat ein interdisziplinäres Karakter: – erzeugt wurde das Gebiet erstmal von Informatiker – schnell verankert mit der Arbeit von Ingenieurwisenschaftler – bald ist klar geworden dass ein enger Zuammenarbeit mit Philosophie, Psychologie, Linguistik und Neurowissenschaft wird benötigt

19.04.2004

SoSe'04

3

Was untersucht KI ? • Die Psihologie, Philosophie und Neurowissenschaft erzeugen mehrere Annahme über die meschliche Repräsentation und Verarbeitung von Wissen. • Ziele der KI sind: – a) zu bestimmen welche von dieser Annahmen verschidenen Aspekte der Intelligenz erklären können – b) zu entwickeln Systeme die das menschliche Intelligenz simulieren können. Die Architektur solcher systeme ist sie selbst ein untersuchung Gebiet für KI und greift zurück auf a)

• z.B. eine Theorie ist dass im menschlichen Gehirn, mehrere Prozesse kooperieren ein Problem zu lösen. Dies Prozesse könnte man durch Softwareprozesse simulieren 19.04.2004

SoSe'04

4

2

Wie hat sich KI enwickelt ? -1Man kann 4 Phasen unterscheiden: 1. Die Gründungsphase (ende der fünfziger und Anfang der sechziger Jahre): -

2.

erste Ansätze zur symbolischen, nicht numerischen Informationsverarbeitung Lösung einfacher Puzzels, Beweisen von Sätzen der Logik und Geometrie, symbolischen mathematischen Operationen (z.B. unbestimmter Integration), Spielen (Damen und Schach) bezeichent als „Power-Based Approach“ man erwartete sehr viel von allgemeinen Problemlösungsverfahren deren begrentzte Einsatzerfolg bald erkennbar wurde

Einrichtungs von Forschungsgruppen an führenden amerikanischen Universitäten (1960-1970): -

man begann zentrale Fragestellungen der KI wurden systematisch durchzusuchen (Sprachverarbeitung, visuelle Szenenanalyse, automatisches Problemlösen) massive Förderung durch die „Advanced Research Projects Agency“ (ARPA) des amerikabischen Verteidigungsministerium.

19.04.2004

SoSe'04

5

Wie hat sich KI enwickelt ? -21.

Entwurf integrierter Robotersysteme und „expertenhaft problemlösender Systeme“ (1970 - 1980) -

2.

Umfassende Mathematisierung der KI, Präzisierung des Konzepts der Wisensverarbeitung (nach 1980) -

19.04.2004

Für „experte Systeme“ brauchte man umfangreiche codierten wissenbestände über bestimmte Gebiete („Knowledge-Based Approach“) -erste Fördeprogramme erscheinen auch in Europa (UK und Deutschalndvor allem) grosse Fortschritte bei Techniken der Wissenrepräsentation und Systemarchitektur wurden gemacht.

neue Themen: Verteilte KI (Intelligente Agenten), Neuronale Netzweke Integration von mehrere Kognition-mechanismen: z.B Sprach- und Bildverstehen

SoSe'04

6

3

Teilgebiete der KI • • • •

Wissensrepräsentation Kognition (Wahrnehmung) Maschinelles Lernen Entwicklung von KI-Systeme zur: – Bildverstehen – Sprachverstehen – Bild-Sprache und Gestik/Mimik-Verstehen (Multimodale Systeme)

19.04.2004

SoSe'04

7

Inhaltsübersicht • Was ist und mit was sich KI beschäftigt ? • Wie versteht ein Computer Bilder ? • Wie versteht ein Computer die natürliche Sprache?

19.04.2004

SoSe'04

8

4

Was ist Bildverstehen ? -1• Bildverstehen ist das Teilgebiet der KI das sich mit der Analyse und Interpretation von visueller Information befaßt • Zentrale Fragen dieses Gebiet: – wie kann man das Sehvermögen biologischer Systeme durch Berechnungstheorien erklären und maschinell nachbilden ? – wie kann man maschinelle Sehsysteme zur Lösung technischer Probleme einsetzen ?

• Obwohl wird das Gebiet seit mehr als 40 Jahre geforscht es gibt noch heute viele offene Fragen • Es gibt sehr wenige (wenn überhaupt) maschinellen Sehsysteme die annährend die Leistungsfähigkeit und Flexibilität des menschlichen Sehsystemserreichen dieses Teil folgt ©Neumann Kap.6.1 in Einführung in der KI G.Görz Hrsg. 19.04.2004

SoSe'04

9

Was ist Bildverstehen ? -2• Gründe: – Terminologie und Konzepte mehrfach wandelten – Enorme Komplexität biologisher Sehsysteme, deren Funktion teilweise nicht entschlüsselt ist – sehr komplizierte mathematische Modelle als formale Repräsentation – gewaltige Rechenleistung

• Erfolgreich Bildverstehensysteme wurden für bestimmte Anwendungen geabut: Zeichenerkennung, medizinische Bildanalyse, Luftbildauswertung

19.04.2004

SoSe'04

10

5

Wie hat sich Bildverstehen entwickelt? -1• Erste Forschungsarbeiten Anfang fünfziger Jahre): Aufbereitung (z.B. Geometrieentzerrung) von Luftbildern. Eigentlich das war nur Bildverarbeitung (image processing), d.h. Bild-zu-Bild Transformationen • Erste Schritt in der Richtung Objekterkennung war die Erkennung von handgeschriebener Druckbuchstaben. Die Forschung war stark von pattern recognition geprägt • Mustererkennung hat sich dannach als selbständige Gebiet entwickelt • Das Hauptproblem: die Zeichenerkennung wurde zewidimensional gemacht, während Objekte dreidimensional rekonstruiert werden müssen • Ein weitere Schritt war in der mitte sibzieger Jahre die Verarbeitung von digitlisierten Bildfolgen zeitverändelicher Szenen

19.04.2004

SoSe'04

11

Wie hat sich Bildverstehen entwickelt? -2• Seit Mitte der achtzieger Jahre die zunehmende Präzisierung und formale Durchdringung des Gebietes führte zu einer Neuformulierung zahlreicher Bildverarbeitungsprozesse, besonders im Bereich der visuellen Wahrnehmung (z.B. die extraktion von Kanten) • Heute sind Bildverstehensysteme noch in der PrototypPhase. Für die entwicklung komerzieler System muss man erstmal die Realzeitbedigungen lösen.

19.04.2004

SoSe'04

12

6

Ziele von Bildverstehen • Bildverstehen ist die Rekonstruktion und Deutung einer Szene anhand von Bildern, so dass mindestens eine der folgenden operationalen Leistungen erbracht werden kann: – – – –

Ausgabe einer sprachlichen Szenenbeschreibung Beantworten sprachlicher Anfragen bezüglich der Szene kollisionsfreies Navigieren eiens Roboters in der Szene planmaßiges Greifen und Manipulieren von Objekten in der Szene

• Bildverstehen muß als ein komplexes Zusammenwirken zahlreicher Teilprozesse angesehen werden, die jeweils spezielle Aufagaben erfüllen und Zwischenrepräsentationen erforderlich machen

19.04.2004

SoSe'04

13

Grobarchitektur eines Bildverstehenssystem Alltags-Wissen

Vorgänge Situationen

Situations-Modelle

Objektkonfigurationen

Vorgangs-Modelle

Objekte

Höhere Bilddeutung

Objekt-erkennung

Trajektorien Objekt-Modelle

projektive Geometrie

Szenenelemente:

Niedere Bilddeutung,

3D Oberflächen,Volumina, Konturen

frühere visuelle Wahrnehmung

Photometrie Physik allgemeine Realwelteingenschaften

Bildelemente: Kanten, Bereiche, Textur, Bewegungsfluß

Segmentierung, primäre Bildanalyse

Rohbilder

19.04.2004

SoSe'04

14

7

Allgemeine Charakteristika von Bildverstehen • Bildverstehen ist ein wissensbasierter Prozeß. Für die Verarbeitungsschritte müssen unterschiedliche Wisensarten zur Anwendung gebracht werden. Wissen kann explizit (z.B. Objektmodellen) oder implizit (z.B. ein algorithmus zum Kantenfinden) kodiert sein • Bildverstehen umfasst bottm-up und top-daown Prozesse. – Bottom-up (Datengetriebene) Prozesse müssen Ambiguitätten lösen – Top-down Prozesse produzieren normalerweise Hypothese die verifiziert werden müssen – Bildverstehen ist in der Regel ein zielgerichtete Aktivität

19.04.2004

SoSe'04

15

Inhaltsübersicht • Was ist und mit was sich KI beschäftigt ? • Wie versteht ein Computer Bilder ? • Wie versteht ein Computer die natürliche Sprache?

19.04.2004

SoSe'04

16

8

Ergonomie - Thesen zur natürlichsprachlichen Kommunikation (I) (1) Allgemeinheit für mensch und maschine Die natürliche Sprache ist der am weitesten verbreitete Kommunikationsstandard. Als Mittel der Mensch-MaschineInteraktion ermöglicht sie daher einen “weichen” Übergang zwischen verschiedenen natürlichen und künstlichen kooperierenden Systemen (2) Vefügbarkeit Computerprozesse und deren Nutzung basieren bereits auf so vielen verschiedenen formalen sprachen, daß für gelegentliche Benutzer das Erlernen von immer neuern Sprachen bei jedem Technologieschub unzumutbar wird. Natürliche Sprachen beherrscht jeder. Natürliche Sprachen veralten nicht.

©vHahn 19.04.2004

SoSe'04

17

Ergonomie - Thesen zur natürlichechsprachlichen Kommunikation (II) (3) Umfang Die natürliche sprache ist vollständig. Alles, was man kommunizieren kann, ist, im Prinzip, in natürlicher Sprache ausdrückbar (4) Vagheit t Die Möglichkeit der Vagheit in der natürlichen sprache ist eine hochwircksame Arbeitsmethode und die Basis für innovatives Denken. Sie sollte auch grundlage der Mensch-Maschine-Kommunikation sein.

©vHahn 19.04.2004

SoSe'04

18

9

Ergonomie - Thesen zur natürlichechsprachlichen Kommunikation (III)

(5) Mehrschichtigkeit Der mensch ist gewöhnt, seine Sprache genauso als Objekt zu behandeln wie den eigentlichen Gesprächsgegenstand. Menschmaschine-Kommunikation kommt, z.B. Bei Klärungsdialogen ohne “Sprache über Sprache” nicht aus. (6) Verkürzbarkeit Natürliche Sprache ist in realistisch komplexen Anfragesituationen fast immer kürzer als Anfragesprache. Außerdem wird natürliche Sprache über längere Sequenzen hin kohärent verstanden. Explizites Wiederholen von bereits im selben Kontext Gesagtem muß auch bei der Mensch-Maschine-Kommunikation entfallen. Verkürzte Sätze in einer Sequenz sind eindeutig und effizient. ©vHahn 19.04.2004

SoSe'04

19

Notwendige Wissensquellen eines natürlichsprachlichen Systems (I) Syntaktisches und lexikalisches Wissen • Lexikalisches Wissen: - Wort-Lexikon - Syntagmen-Lexikon • Syntaktisches Wissen - Morphologisches Wissen - Grammatik Allgemeines Hintergrundwissen und referentielles Wissen • Begriffliches Wissen (Domänen / Weltmodell) • Referentielles Wissen (Inferenzregeln)

©Schröder 19.04.2004

SoSe'04

20

10

Notwendige Wissensquellen eines natürlichsprachlichen Systems (II) Dialogwissen und -gedächtnisse • Regeln der Dialog- und Textgestaltung • Syntaktisches Dialoggedächtnis • Semantisches Dialoggedächtnis Jedes natürlichsprachliche System ist • Partnermodell durch eine spezifische Kombination von • Inferenzgedächtnis geeigneten Wissensquellen gekennzeichnet. Kein System vereinigt alle Systembezogenes Wissen Wissensquellen in gleichem Maße. • Modell des Datenbankschemas • Wissen über das Hintergrundsystem Sprachsignalverarbeitung • akustisch-phonetisches Wissen • phonologisch-prosodisches Wissen

19.04.2004

SoSe'04

21

Grobarchitektur eines natürlichsprachlichen Systems User Input

Morphological Analysis Lexicon

Syntactic-Semantic Analysis

Domain/ World Model

Database Mapping



K n o w l e d g e S o u r c e s

Semantic Representation

Semantic Pragmatic Evaluation

DB Access

Database

Semantic Representation

Syntactic-Semantic Dialog Memory

Generation Morphological Synthesis

System Response

19.04.2004

SoSe'04

22

11

Sprache kommuniziert nicht nur Propositionen, sondern... -1•



Intentionen, Pläne: – Warum sagt der Sprecher das? Was will er erreichen (Indirekte Spechakte) – Warum sagt er etwas gerade jetzt? – Warum sagt er etwas nicht? Einstellungen – Ist dem sprecher das Gesagte wichtig? – Glaubt der Sprecher an das Gesagte (Ironie, Lüge) – Wie wrtet der Sprecher das Gesagte?

©Menzel 19.04.2004

SoSe'04

23

Sprache kommuniziert nicht nur Propositionen, sondern... -2•

• • •

Verhältnis zum Gesprächspartner – Warum drückt sich der sprecher gerade so aus (Höflichkeit, Ablehnung) – Was teilt der sprecher damit über sich selbst mit? (Bildung, soziale Stellung) Stimmungen, Emotionen gesundheitlicheer und psychischer Zustand Manchmal wird gar kein propositionaler inhalt kommuniziert, sondern wichtig ist nur der Aufbau, Erhalt oder Abbbau von sozialem Kontakt.

©Menzel 19.04.2004

SoSe'04

24

12

Was heißt eigentlich "Sprache verstehen"? (I)

(1) feststellen daß es sich um korrekte Sprache handelt: "Die Elbe zwitschert blechern" korrekter Satz! (2) Wichtige Inhaltswörter erkennen: "Können Sie mir bitte sagen, wie ich nach Pinneberg komme" Fahrplan Pinneberg ausgeben (3) den Inhalt mit anderen Worten wiedergeben können: "Ich gehe jetzt nach Hause" = "Ich begebe mich zum Vogelbarg 23" (4) erwartungsgemäß handeln: "Drucke von Dokument 37 an zweizeilig"

19.04.2004

SoSe'04

25

Was heißt eigentlich "Sprache verstehen"? (II)

(5) auf das Motiv des Sprechers reagieren "Hast Du eine Uhr?" "Es ist 15 Uhr 13" (6) Eine Persönlichkeit verstehen (7) Verstehen und Verzeihen

19.04.2004

SoSe'04

26

13

Harte Verarbeitungsprobleme (I) Vage Quantoren Vage Adjektive Frageoperatoren Konjunktion Komplexe Quantifikation Hecken Modalpartikeln Komparative Deixis Kontinua Metaphorik Ellipsen 19.04.2004

"Viele", "die meisten" "groß", "selten" "Warum", "Wie" "Jan und Mareike sind verheiratet" "Etwa die Hälfte dieser 20 - 30 verkauften Stücke" "ziemlich", "weniger" "vermutlich", "hoffentlich" "der größere von beiden" "dort", "vorher", "Sie" "Wasser", "Verkehr" "Kopf (-zeile)" "den auch?" SoSe'04

27

Harte Verarbeitungsprobleme (II)

Anaphora Kataphora Präsuppositionen und Implikaturen

"diesen", "tu ich!" "das Folgende:" "ich komme mit dem Maserati" fi Es gibt einen Maserati, fi ich habe einen Maserati

Prosodie

"Ich bin hier, um Ihnen zu sagen…" “Ich bin hier, um Ihnen zu sagen…" "Njawomasahn"

Verschleifung

19.04.2004

SoSe'04

28

14

Grenzen der "Sprachtechnologie" Technische Grenzen: • Die meisten Sachgebiete aus dem Berufsleben sind heute noch zu komplex für sprachverstehende Systeme. • Gegennwärtige Computer sind nicht in der Lage, die Verarbeitung von gesprochener Sprache mit geeigneter Ergonomie zu leisten. Erkenntnisgrenzen: • Unsere Sprache ist eingebettet in die Wahrnehmung aller anderen Organe (Sehen, Hören, etc), in unsere eigene Lebensgeschichte und in die der Gesellschaft. • Diese Bedingungen unserer Erkenntnis selbst zu erkennen und formal für einen Computer aufzuschreiben, ist unmöglich. Ethische Grenzen: • Sprachtechnologie kann nur sinnvoll angewendet werden in technischen Zusammenhängen, in denen es um die Steuerung von physikalischen oder abstrakten Maschinen geht. Soziale Kommunikation ist dem Computer unzugänglich und soll es auch bleiben. 19.04.2004

SoSe'04

29

Strategie

• • • • •

19.04.2004

Keine 100% theoretische linguistische Lösungen Nur 95% Lösungen Eingaberestriktionen Domänenabhängigkeit HLT Engineering

SoSe'04

30

15

Wichtige Eigenschaften von NLIs Eingaben sind nicht nur: – isolierte, korrekte geschriebene Sätze

sondern, sehr oft: - mit Tippfehlern oder Aussprachefehlern, - Teilsätze, besonders bei gesprochener Sprache nicht immer syntaktisch korrekt; - Klärungdialoge (Metakommunikation) - Anaphorische Sätze

19.04.2004

SoSe'04

31

Beispiel für NLI Phänomene B: Was für ist geplant nächste Woche ? S: Termin 10 - 12 B: Donnerstag?

Syntax-Fehler sonst verständlich Teilsatz (Ellipse)

S: Vorlesung 13 - 17 B: Ändere das bitte zu einem Termin

Anaphora

S: OK B: Lösche bitte den Termin am Mittwoch. S: Es gibt keinen Termin am Mittwoch

MetaKommunikation

B: Ich meinte Freitag. S: OK B: Was ist am Aug. 18-20 geplannt ? 19.04.2004

PräsuppositionsFehler + Korrektur

SoSe'04

Abkürzung + Schreibfehler

32

16

Geschichte Erste Systeme : In den ‘60er Jahren Interpretation von natürlichsprachlichen Einzelsätzen für Datenbankanfragen Expertensysteme

und erste

Forschungs und Technologieschub ATN, Semantische Grammatiken, pattern matching In den ‘80er Jahren: kooperative Systemen, Präsuppositionserkennung, inhaltlioch verbreiterte Systeme (besonders Datenbankanwendungen) Heute: Einsatz von NLI -Systemen die Sprache, Sprachsignale, Graphik und Hypermedia integrieren (Multimodalität) 19.04.2004

SoSe'04

33

Beispiel für Worteindeutigkeit • • • •

U: How many Whitney shipments have shipdate 6/10/1975 ? S: Is 6/10/1975 intended to be a date ? (Yes or No) U: Yes S: We are trying to interpret 6/10/1975 as a date. Which of the following dates do you intend: 1 June 10 2 October 6 3 None of the above Select one item by number ...... RENDEZVOUS Dialogue

19.04.2004

SoSe'04

34

17

Beispiel : Sub-Dialoge während der BenutzerSystem Interaktion • • • • • • • •

19.04.2004

U: When is the next JICAI meeting ? S: I presume you mean IJCAI U: Yes S: Do you mean the next conference or the next conveners meeting? U: Conference S: 12 August U 1985 ? LOKI Dialog S: Yes

SoSe'04

35

Mögliche Probleme mit NLI - Systemen • Der Benutzer erwartet mehr als das System kann, • Domäneninformation ist stark mit der Sprachinterpretation verbunden Änderung der Domäne bedeutet mindestens die Änderung von Lexikon und Domänmodell und umgekehrt

Transformierbare NLI Systeme: Erweiterungsfähigkeit von Domänenwissen 19.04.2004

SoSe'04

36

18

Suggest Documents