Wprowadzenie do Systemu SAS ´ Krzysztof Dembczynski Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji ´ Politechnika Poznanska

Technologie Wytwarzania Oprogramowania Semestr letni 2007/08 Studia uzupełniajace ˛ magisterskie

Wprowadzenie do Systemu SAS

Plan laboratorium

1

Wprowadzenie do Systemu SAS

2

Architektura Systemu

3

Instalacja

4

SAS Base i SAS 4GL

5

Podsumowanie

Wprowadzenie do Systemu SAS

Plan laboratorium

1

Wprowadzenie do Systemu SAS

2

Architektura Systemu

3

Instalacja

4

SAS Base i SAS 4GL

5

Podsumowanie

Wprowadzenie do Systemu SAS

System SAS nie jest systemem zarzadzania ˛ bazami danych. System SAS jest systemem statystyczno-analizycznym. System SAS jest pakietem wspierajacym ˛ typowe zadania zwiazane ˛ z hurtowniami danych, analiza˛ i eksploracja˛ danych, a tak˙ze marketingkiem bezpo´srednim, zarzadzaniem ˛ finansami i zarzadzaniem ˛ klientami.

Wprowadzenie do Systemu SAS

Mo˙zliwo´sci oprogramowania SAS: system statystyczno-analityczny, wsparcie do tworzenia i wykorzystywania hurtowni danych, wspomaganie procesu ekstrakcji, transformacji i ładowania danych, optymalizacja wydajno´sci dostepu ˛ do danych, wspomaganie tworzenie wielowymiarowych zbiorów danych, modele analizy i eksploracji danych, modułu zarzadzania ˛ finansami, rozwiazania ˛ dedykowane.

Wprowadzenie do Systemu SAS

Komponenty SAS Enterprise Intelligence Platform

Wprowadzenie do Systemu SAS

Integracja danych:

Narz˛edzia, rozwiazania, ˛ techniki i technologie wykorzystywane w szeroko rozumianym procesie przetwarzania danych: budowa i administracja procesami ekstrakcji, transformacji i ładowania danych, kontrola i poprawy jako´sci danych, dostep ˛ i administracja z´ rodłami danych, projektowanie procesów przetwarzania danych.

Wprowadzenie do Systemu SAS

Skalowalny serwer dostepu ˛ do danych:

Rozwiazanie ˛ pozwalajace ˛ na szybki dostep ˛ do bardzo du˙zych zbiorów danych poprzez wielowatkowe ˛ jadro ˛ realizujace ˛ operacje obliczeniowe oraz operacje wej´scia/wyj´scia. Dane moga˛ by´c przechowywane w formatach wielowymiarowych i relacyjnych. Mo˙zliwy jest wielowatkowy ˛ dostep ˛ do danych z´ ródłowych.

Wprowadzenie do Systemu SAS

Rozwiazanie ˛ analityczne:

Zintegrowane s´ rodowisko do modelowania predykcyjnego i opisowego, prognozowania, optymalizacji, symulacji, . . . . . .

Wprowadzenie do Systemu SAS

Inteligencja biznesowa:

Architektura oraz narz˛edzia procesu projektowania i tworzenia modelu obiegu i dystrybucji informacji u˙zytecznej z punktu widzenia analitycznego opartego na spójnych danych korporacyjnych zgromadzonych w hurtowni danych.

Wprowadzenie do Systemu SAS

SAS stara sie˛ zapewni´c wysoka˛ jako´sc´ z puntku widzenia: u˙zyteczno´sci, zarzadzalno´ ˛ sci, skalowalno´sci, otwarto´sci.

Wprowadzenie do Systemu SAS

´ U˙zytecznos´ c: Mo˙zliwo´sc´ wykorzytania wielu interfejsów u˙zytkownika od podstawowego jezyka ˛ SAS 4GL, klientów napisanych w Javie umo˙zliwiajacych: ˛ zarzadzanie ˛ i tworzenie procesu ekstrakcji, transformacji i ładowania danych, zarzadzenie ˛ i tworzenie struktur “olapowych”, eksploracje˛ danych, do wtyczek pozwalajacych ˛ na przegladanie ˛ raportów i uruchamianie analiz z poziomu Microsoft Office oraz technologii pozwalajacych ˛ na korzystanie z cienkich klientów w postaci stron www.

Wprowadzenie do Systemu SAS

´ Zarzadzalno ˛ s´ c: Architektura SAS9 pozwala na zarzadzanie ˛ systemem i s´ rodowiskiem wokół systemu za pomoca˛ jednej, centralnej struktury metadanych. Podej´scie takie pozwala na: spójne zarzadzanie ˛ infrastruktura˛ sprz˛etowa˛ i oprogramowaniem, zarzadzenie ˛ i opis biznesowy z´ ródeł danych, definiowanie i zarzadzenie ˛ procesami przetwarzania danych i analizy danych, zarzadzenie, ˛ autentykacje˛ i autoryzacje˛ u˙zytkowników.

Wprowadzenie do Systemu SAS

´ Skalowalnos´ c: Skalowalno´sc´ dotyczy wolumenów danych, u˙zytkowników, sprz˛etu praz technologii. SAS9 umo˙zliwia: przetwarzanie równoległe z wykorzystaniem wielu procesorów, pełne wykorzystanie architektury urzadze ˛ n´ dyskowych, równoległy dostep ˛ do danych, prace˛ w sieci z u˙zyciem wielu komputerów.

Wprowadzenie do Systemu SAS

´ Otwartos´ c: Otwarto´sc´ dotyczy: integracji z innymi s´ rodowiskami i aplikacjami (jak systemy baz danych, systemy zarzadzania ˛ zasobami, itp.), korzystania z otwartych standardów , oraz mo˙zliwo´sci rozwijania i dopasowywania oprogramowania do swoich potrzeb.

Wprowadzenie do Systemu SAS

Plan laboratorium

1

Wprowadzenie do Systemu SAS

2

Architektura Systemu

3

Instalacja

4

SAS Base i SAS 4GL

5

Podsumowanie

Wprowadzenie do Systemu SAS

Architektura SAS Intelligence Platform

Wprowadzenie do Systemu SAS

Przykładowa konfiguracja komponentów serwera aplikacji SAS

Wprowadzenie do Systemu SAS

Aplikacje klienckie wykorzystywane na laboratorium SAS Management Console SAS Enterprise Guide SAS ETL Studio SAS OLAP Cube Studio SAS Enterprise Miner Bedziemy ˛ równie˙z korzysta´c bezpo´srednio z SAS Base.

Wprowadzenie do Systemu SAS

Zarzadzenie ˛ architektura˛ i procesami w SAS9

Wprowadzenie do Systemu SAS

Plan laboratorium

1

Wprowadzenie do Systemu SAS

2

Architektura Systemu

3

Instalacja

4

SAS Base i SAS 4GL

5

Podsumowanie

Wprowadzenie do Systemu SAS

Zawarto´sc´ katalogu (lub płyty) SAS_INSTALL: depot – zawiera pliki i katalogii instalacyjne, enterprise_guide – zawiera numer licencyjny dla programu Enterprise Guide, plan – zawiera liste˛ sprawdzajac ˛ a˛ z opisem czynno´sci przed instalacja˛ oraz tzw. plan instalacji, setinit – zawiera pliki z licencja (nazywane setinit lub sid) dla ró˙znych systemów operacyjnych, metadata – zawiera program pozwalajacy ˛ na podmiane˛ metadanych (narz˛edzie dla zaawansowanych).

Wprowadzenie do Systemu SAS

Katalog Plan: preInstallationChecklist_windows_913.html zawiera opis czynno´sci, jakie nale˙zy wykona´c przed instalacja˛ oprogramowania: zało˙zenie kont u˙zytkownika w systemie Windows: sasadm, sassrv, sastrust, sasdemo, sasguest itp., zało˙zenie odpowiednich grup, nadanie odpowiednich praw u˙zytkownikom i grupom,

plan.xml zawiera plan instalacji.

Wprowadzenie do Systemu SAS

W celu instalacji najlepiej wykorzysta´c SAS Software Navigator (depot\setup.exe). Kolejne wa˙zne kroki sa˛ nastepuj ˛ ace: ˛ wybranie instalacji zaawansowanej, wskazanie pliku z licencja˛ (setinit, sid), wskazanie pliku z planem instalacji, ´ instalacji uruchomi sie˛ oprogramowanie na koncu konfiguracyjne.

Wprowadzenie do Systemu SAS

Wybranie instalacji zaawansowanej

Wprowadzenie do Systemu SAS

Wskazanie pliku z licencja˛ (setinit, sid)

Wprowadzenie do Systemu SAS

Wskazanie pliku z planem instalacji

Wprowadzenie do Systemu SAS

Konfiguracja SAS9: wskazanie katalogu przeznaczonego do składowania metadanych, uruchomienie serwerów w trybie usług, poprawne podanie nazwy komputera (najlepiej poda´c windowsowa˛ nazwe˛ komputera), poprawne podanie nazw i haseł u˙zytkowników zdefiniowanych w systemie Windows, dodatkowa edycja pliku z własno´sciami configuration.properties (wa˙zne!!!: warto sprawdzi´c jeszcze raz ustawiona˛ nazwe˛ komputera i w razie potrzeby poprawi´c ja) ˛ zdefiniowanie metadanych zgodnie z instukcjami zawartymi w instructions.html

Wprowadzenie do Systemu SAS

Wskazanie katalogu przeznaczonego do składowania metadanych

Wprowadzenie do Systemu SAS

Poprawne podanie nazwy komputera

Wprowadzenie do Systemu SAS

Poprawne podanie nazw i haseł u˙zytkowników zdefiniowanych w systemie Windows

Wprowadzenie do Systemu SAS

´ Dodatkowa edycja pliku z własnosciami configuration.properties

Wprowadzenie do Systemu SAS

Plan laboratorium

1

Wprowadzenie do Systemu SAS

2

Architektura Systemu

3

Instalacja

4

SAS Base i SAS 4GL

5

Podsumowanie

Wprowadzenie do Systemu SAS

SAS Base

Wprowadzenie do Systemu SAS

Biblioteki w SAS’ie – foldery logiczne

Wprowadzenie do Systemu SAS

Biblioteki w SAS’ie – foldery logiczne

LIBNAME Moja ’C:\My SAS Files\Moja’;

Wprowadzenie do Systemu SAS

SAS 4GL jezyk ˛ czwartej generacji, DATA STEP jest procesem przekształcania danych, PROC STEP jest procedura˛ wykonywana˛ na wskazanym zbiorze danych, ´ jak mo˙zliwo´sc´ Wiele specyficznych rozszerzen, korzystania z SQL, MDX, IML i innych jezyków ˛ ´ programowania oraz jezyka ˛ makropolecen.

Wprowadzenie do Systemu SAS

SAS 4GL DATA marine; INPUT Name $ Family $ Length; datalines; beluga whale 15 whale shark 40 basking shark 30 gray whale 50 mako shark 12 sperm whale 60 dwarf shark .5 whale shark 40 humpback . 50 blue whale 50 killer whale 30 ;

Wprowadzenie do Systemu SAS

SAS 4GL * To jest komentarz; /*To tez jest komentarz*/ /*Pierwszy komentarz zaczyna sie gwiazdka i konczy srednikiem */ /*Drugi komentarz zaczyna sie ukosnikiem i gwiazdka, a konczy sie gwiazdka i ukosnikiem */ *Sortujemy dane; PROC SORT DATA = marine OUT = seasort NODUPKEY; BY Family DESCENDING Length; /*To jest krok danych*/ PROC PRINT Data = seasort; TITLE "Whales and Sharkes";

/* To jest krok procdeduralny*/

/*Przetwarzanie procedur rozpoczyna sie po wyslaniu intrukcji RUN;*/ RUN; Wprowadzenie do Systemu SAS

SAS 4GL DATA sales; INPUT CustomerID $ @9 SaleData MMDDYY10. Petunia SnapDragon Marigold; Month = MONTH(SaleData); FORMAT SaleData MMDDYY10.; INFORMAT SaleData MMDDYY10.; datalines; 756-01 05/04/2001 120 80 110 834-01 05/02/2001 90 160 50 901-02 05/18/2001 50 100 75 834-01 06/01/2001 80 60 100 756-01 06/11/2001 100 160 75 ; PROC SORT DATA = sales; BY Month; PROC Means DATA = sales; /*Najpierw trzeba dane posortowac!*/ BY Month; VAR Petunia SnapDragon Marigold; TITLE "Summay of Flower Sales by Month"; RUN; Wprowadzenie do Systemu SAS

SAS 4GL DATA orders; INPUT Coffee $ Window datalines; esp w cap d cap w kon kon d esp d kon w ice cap w esp d cap d Kon kon w esp d cap w ice ;

$ @@; w d d w

ice w esp d . d kon w

PROC FREQ DATA = orders; TABLES Window Window * Coffee; RUN;

Wprowadzenie do Systemu SAS

SAS 4GL DATA boats; INPUT Name $13. Length Locomotion $ @25 Type $9.; Port = "Maalea"; datalines; Silent Lady 64 sail schooner America II 65 sail yacht Ocean Spirit 65 power catamaran Lavengro 52 sail schooner Pride of Maui 110 power catamaran Leilani 45 power yacht Kalakaua 70 power catamaran Blue Dolphin 65 sail catamaran ;

Wprowadzenie do Systemu SAS

SAS 4GL PROC TABULATE DATA = boats; CLASS Port Locomotion Type; TABLE Port, Locomotion, Type; TITLE "Number of Boats by Port, Locomotion, and Type"; RUN; PROC TABULATE DATA = boats; CLASS Locomotion Type; VAR Length; TABLE Locomotion ALL, MEAN*Length*(Type ALL); TITLE "Number of Boats by Port, Locomotion, and Type"; PROC TABULATE DATA = boats; CLASS Locomotion; VAR Length; TABLE Locomotion ALL, MEAN*Length*(Type ALL); TITLE "Number of Boats by Port, Locomotion, and Type"; RUN;

Wprowadzenie do Systemu SAS

SAS 4GL DATA bus; INPUT BusType $ OnTimeOrLate $ @@; datalines; E O E L E L R O E O E O E O R L R O R L R O E O R L E O R L E O E O R L R L E L ; PROC FREQ DATA = bus; TABLES BusType * OnTimeOrLate / CHISQ; TITLE; RUN;

Wprowadzenie do Systemu SAS

SAS 4GL DATA boats_2; INPUT Name $13. datalines; Silent Lady 64 America II 65 Ocean Spirit 65 Lavengro 52 Pride of Maui 110 Leilani 45 Kalakaua 70 Blue Dolphin 65 ;

Length Locomotion $ @27 Type $ @37 Port $; sail sail power sail power power power sail

schooner yacht catamaran schooner catamaran yacht catamaran catamaran

Maalea Maalea Maalea Maalea Torres Torres Torres Torres

PROC TABULATE DATA = boats_2; CLASS Port Locomotion Type; TABLE Port, Locomotion, Type; TITLE "Number of Boats by Port, Locomotion, and Type"; RUN;

Wprowadzenie do Systemu SAS

SAS 4GL DATA RANDOM; INPUT SUBJ NAME $20.; GROUP=RANUNI(0); DATALINES; 1 CODY 2 SMITH 3 HELM 4 GREGORY ;

Wprowadzenie do Systemu SAS

SAS 4GL PROC SQL; select product, avg(ACTUAL) from sashelp.prdsal2 group by product; PROC SORT DATA = sashelp.prdsal2; BY PRODUCT; PROC MEANS DATA = sashelp.prdsal2; BY PRODUCT; VAR ACTUAL; TITLE ’PIERWSZA SREDNIA’; RUN;

Wprowadzenie do Systemu SAS

Plan laboratorium

1

Wprowadzenie do Systemu SAS

2

Architektura Systemu

3

Instalacja

4

SAS Base i SAS 4GL

5

Podsumowanie

Wprowadzenie do Systemu SAS

Jaki SAS jest ka˙zdy widzi :) Jest to przede wszystkim system statystyczno-analityczny, SAS pretenduje do miana najlepszego produktu w dziedzinie inteligencji biznesowej, ´ Srodowisko do´sc´ elitarne . . . Ma swoje zalety, ale te˙z wady, Jakie? Zobaczymy podczas tego semestru . . .

Wprowadzenie do Systemu SAS

Celem laboratorium nie jest szkolenie z oprogramowania SAS!!! Celem jest zapoznanie z zagadnieniemi zwiazanymi ˛ z hurtowniami danych i demonstracja oprogramowania jednego z producentów.

Wprowadzenie do Systemu SAS

Bibliografia: http://www.sas.com http://support.sas.com http://support.sas.com/documentation/ onlinedoc/91pdf/index_913.html Warto przeczyta´c: SAS Intelligence Platform: Overview SAS Intelligence Platform: Administration Guide SAS Intelligence Platform: Installation Guide Base SAS Procedures Guide SAS ETL Studio: User’s Guide SAS Management Console: User’s Guide SAS OLAP Server: Administrator’s Guide SAS OLAP Server: MDX Guide SAS/ACCESS for Relational Databases: Reference

Wprowadzenie do Systemu SAS