UNIT PELAJARAN 3 PENGUMPULAN DAN PENGURUSAN DATA

Unit 3 Pengumpulan dan Pengurusan Data | 15 UNIT PELAJARAN 3 PENGUMPULAN DAN PENGURUSAN DATA HASIL PEMBELAJARAN Di akhir unit ini, anda diharap da...
Author: Eileen Rose
22 downloads 0 Views 720KB Size
Unit 3 Pengumpulan dan Pengurusan Data | 15

UNIT PELAJARAN 3

PENGUMPULAN DAN PENGURUSAN DATA

HASIL PEMBELAJARAN

Di akhir unit ini, anda diharap dapat:

1.

Mengumpul dan mengklasifikasi data mengikut jenis-jenisnya.

2.

Mengurus data ke dalam jadual-jadual tertentu.

PENGENALAN

S

tatistik deskriptif mengandungi pelbagai kaedah, bukan sahaja untuk menguruskan data malahan meringkaskan maklumat atau data yang diperoleh agar mudah dibaca dengan jelas dan berkesan. Dalam Unit 3 ini, kita akan membincangkan mengenai bagaimana data

Unit 3 Pengumpulan dan Pengurusan Data | 16

dikumpulkan dan diuruskan dengan kaedah yang bersesuaian. Sebelum itu, kita akan mengenali dengan lebih dekat lagi apa itu pembolehubah kuantitatif dan pembolehubah kualitatif. Begitu juga dengan data kuantitatif dan data kualitatif. Kita juga akan diperkenalkan dengan dua jenis data kuantitatif iaitu data diskret dan data selanjar.

Setelah kita mengenali apa itu pembolehubah dan jenis-jenis data, kita akan mempelajari pula bagaimana hendak mengumpulkan data mengikut taburan-taburan tertentu. Penerangan berserta contoh-contoh berkaitan dengan taburan kekerapan dan taburan kekerapan relatif disertakan untuk kita lebih memahami dan mendalami data dan taburannya.

Selain daripada itu, kita juga akan diuji dengan latihan-latihan formatif berkaitan subtajuksubtajuk yang dipelajari. Akhir sekali, kita akan diuji dengan latihan sumatif yang merangkumi apa yang telah kita bincangkan dalam unit ini.

PEMBOLEHUBAH DAN DATA

Ciri yang berbeza antara seseorang atau sesuatu benda kepada yang lain dikenali sebagai pembolehubah. Contoh-contoh pembolehubah yang melibatkan manusia termasuklah tinggi, berat, bilangan adik-beradik, jantina, taraf perkahwinan dan warna mata. Tiga contoh pertama yang diberikan melibatkan maklumat yang boleh dihitung ialah pembolehubah kuantitatif. Tiga

Unit 3 Pengumpulan dan Pengurusan Data | 17

contoh yang terakhir melibatkan maklumat yang tidak boleh dihitung ialah pembolehubah kualitatif.

Terdapat dua jenis pembolehubah kuantitatif, iaitu pembolehubah diskret dan pembolehubah selanjar. Satu pembolehubah diskret ialah nilai mungkin yang membentuk satu set nombor terhingga (atau terbilangkan tak terhingga), kebiasaannya melibatkan nombor bulat. Bilangan adik-beradik yang dipunyai oleh seseorang merupakan satu contoh pembolehubah diskret. Pembolehubah selanjar ialah nilai mungkin yang membentuk julat nombor. Ketinggian seseorang ialah satu contoh pembolehubah selanjar. Secara ringkasnya, perbincangan tentang pembolehubah boleh disimpulkan seperti berikut dalam jadual dan rajah di bawah:

Pembolehubah

:

Satu ciri yang berbeza antara seseorang atau sesuatu benda kepada yang lain.

Pembole ubah kuantitatif

:

Satu pembolehubah nilai berangka.

Pembolehubah kualitatif

:

Satu pembolehubah nilai tak berangka.

Pembolehubah diskret

:

Satu pembolehubah kuantitatif dengan nilai mungkin membentuk satu set nombor terhingga (atau terbilangkan tak terhingga).

Pembolehubah selanjar

:

Satu pembolehubah kuantitatif dengan nilai mungkin yang membentuk julat nombor.

Unit 3 Pengumpulan dan Pengurusan Data | 18

Pemerhatian yang dijalankan terhadap nilai-nilai satu pembolehubah berkaitan seseorang atau sesuatu benda dikenali sebagai data. Maka, maklumat yang dikumpulkan, diuruskan dan dianalisis oleh pakar-pakar statistik ialah data. Terma-terma yang digunakan untuk menggambarkan satu pembolehubah juga digunakan dalam menggambarkan data.

Data kualitatif

Data kualitatif ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai pembolehubah kualitatif yang mana ia terdiri daripada angka-angka atau skor-skor yang tidak mempunyai nilai kuantiti. Angka-angka atau skor-skor ini cuma menunjukkan kategori, nama, jenis, kelas atau

Unit 3 Pengumpulan dan Pengurusan Data | 19

pangkat bandingan. Contohnya, jantina (1 = lelaki, 2 = perempuan), jenis rumah (1 = banglo, 2 = teres, 3 = pangsapuri), gred peperiksaan (1 = A, 2 = B, 3 = C) dan lain-lain lagi. Data kualitatif menyukat kualiti dan bukan kuantiti.

Data kuantitatif

Data kuantitatif pula ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai pembolehubah kuantitatif yang mana ia tediri daripada angka-angka atau skor-skor yang mempunyaii nilai berangka. Angka-angka atau skor-skor ini menunjukkan banyak, kekuatan atau saiz sesuatu ciri seperti berat, umur, tinggi, markah ujian dan lain-lain. Data kuantitatif terdiri daripada data diskret dan data selanjar.

Data diskret

Data diskret ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah diskret dengan cara membilang. Data diskret cuma boleh mengambil nilai tetap atau nilai tepat sahaja. Contohnya, bilangan buah buku atas rak, bilangan kenderaan yang melalui plaza tol, bilangan ahli dalam sebuah keluarga, bilangan murid dalam sebuah kelas, dan lain-lain lagi.

Unit 3 Pengumpulan dan Pengurusan Data | 20

Data selanjar

Data selanjar ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah selanjar yang hanya boleh diberi nilai dalam suatu julat dan tidak boleh mengambil satu nilai tunggal atau satu nilai tepat. Contohnya, tinggi orang, berat orang atau benda, halaju sebuah kapal terbang dan lain-lain lagi.

Data

:

Maklumat yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah.

Data kualitatif :

Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah kualitatif.

Data kuantitatif :

Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah kuantitatif.

Data diskret

:

Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah diskret dengan cara membilang.

Data selanjar :

Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah selanjar.

Contoh 3.1 Manusia diklasifikasikan hanya mempunyai satu daripada empat jenis darah: A, B, AB, atau O. Apakah jenis data yang anda terima apabila anda diberitahu jenis darah anda?

Unit 3 Pengumpulan dan Pengurusan Data | 21

Penyelesaian: Jenis darah tergolong dalam data kualitatif – data diperolehi dengan memerhatikan nilai pembolehubah “jenis darah”.

Contoh 3.2 Banci perumahan dijalankan sekali dalam tempoh 10 tahun untuk mengetahui bilangan ahli dalam sebuah keluarga. Apakah jenis data yang diperolehi melalui bilangan ahli dalam sebuah keluarga? Penyelesaian: Bilangan ahli dalam sebuah keluarga tergolong dalam data kuantitatif iaitu data diskret – data diperolehi dengan memerhatikan nilai pembolehubah “bilangan ahli dalam sebuah keluarga”.

Contoh 3.3 Di awal persekolahan, Cikgu Ali telah mengukur tinggi dan berat murid-murid kelasnya. Apakah jenis data yang diperolehi melalui tinggi dan berat? Penyelesaian: Tinggi dan berat tergolong dalam data kuantitatif iaitu data selanjar – data diperolehi dengan memerhatikan nilai pembolehubah “tinggi dan berat”.

Unit 3 Pengumpulan dan Pengurusan Data | 22

Cuba anda fikirkan tiga contoh yang berkaitan dengan data diskret, data selanjar dan data kualitatif selain daripada contoh-contoh di atas.

Latihan Formatif 3.1

Untuk soalan-soalan 1 – 2, klasifikasikan sama ada data yang diberikan ialah data kualitatif atau data kuantitatif. Jika kuantitatif, nyatakan sama ada data tersebut ialah data diskret atau data selanjar. Juga kenal pasti pembolehubahnya. 1.

Mengikut kajian yang dijalankan oleh Sidney S. Culbert (Universiti Washington), bahasabahasa utama yang digunakan dalam tahun 1993 adalah seperti berikut. Kedudukan

Bahasa

Pengguna (juta)

1

Mandarin

930

2

Inggeris

463

3

Hindi

400

4

Sepanyol

371

5

Russia

291

6

Arab

214

7

Bengali

192

a. Apakah jenis data yang diberikan dalam lajur pertama jadual ini?

Unit 3 Pengumpulan dan Pengurusan Data | 23

b. Apakah jenis data yang didapati melalui maklumat bahawa Sally Ride bercakap dalam Bahasa Inggeris? c. Apakah jenis data yang didapati melalui maklumat dalam lajur tiga jadual ini?

2.

Jadual berikut menunjukkan anggaran statistik keluasan tanah dan populasi setiap benua dalam tahun 1992. Benua

Keluasan tanah

Populasi

(1000 batu persegi)

(Juta)

Asia

10644

3207

Afrika

11707

654

Amerika Utara

9360

436

Amerika Selatan

6883

300

Eropah

1905

511

Oceania

3284

28

a. Apakah jenis data yang diberikan oleh keluasan tanah? b. Apakah jenis data yang didapati melalui kenyataaan, “Afrika mempunyai keluasan tanah yang terbesar dan kedua dalam jumlah populasi penduduk”? c. Apakah jenis data yang didapati melalui maklumat dalam lajur tiga jadual ini? d. Apakah jenis data yang didapati melalui maklumat bahawa Ronaldo dilahirkan di Eropah?

Unit 3 Pengumpulan dan Pengurusan Data | 24

PENGUMPULAN DATA

Apabila kita berbincang berkenaan dengan jenis-jenis data sebelum ini, contoh-contoh yang diberikan tidak mengandungi kuantiti data yang besar. Namun demikian, dalam dunia yang nyata kadang-kadang data yang dikumpulkan boleh berkemungkinan terlalu banyak. Sebagai contohnya, profil pelajar-pelajar universiti di Malaysia, bilangan guru-guru di Malaysia dan lain-lain lagi. Untuk itu, kita perlu menguruskan data yang banyak ini dalam bentuk yang senang difahami. Dalam subtajuk ini, kita akan membincangkan tentang pengumpulan data, iaitu meletakkan data di dalam kumpulan-kumpulan. Pengumpulan data merupakan salah satu cara yang biasa digunakan untuk menguruskan data.

Cuba anda nyatakan kebaikan dan kelemahan dalam pengumpulan data.

Contoh 3.4 Jadual 3.1 menunjukkan kematangan 40 pelaburan jangka pendek dalam hari.

Adalah sukar untuk memahami data jika data dipaparkan seperti dalam Jadual 3.1. Oleh itu, kita perlu mengumpulkan data tersebut mengikut kategori-kategori tertentu atau pun kelas-kelas tertentu untuk memudahkan kita memahami data tersebut.

Unit 3 Pengumpulan dan Pengurusan Data | 25

Langkah pertama ialah menentukan kelasnya. Paling mudah, data dikelaskan mengikut selang atau saiz 10. Oleh kerana nilai data yang terkecil ialah 36 dan yang terbesar ialah 99, pengumpulan data mengikut saiz 10 akan menghasilkan kelas-kelas: 30 – 39 , 40 – 49, dan seterusnya hingga 90 – 99. Kelas-kelas ini dinyatakan dalam lajur pertama Jadual 3.2 di bawah.

Jadual 3.1 Kematangan 40 pelaburan jangka pendek dalam hari

70

64

99

55

64

89

87

65

62

38

67

70

60

69

78

39

75

56

71

51

99

68

95

86

57

53

47

50

55

81

80

98

51

36

63

66

85

79

83

70

Jadual 3.2 Kelas dan bilangan pelaburan Hari matang 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99

Gundal /// / //// /// //// //// //// // //// // ////

Bilangan pelaburan 3 1 8 10 7 7 4 40

Unit 3 Pengumpulan dan Pengurusan Data | 26

Langkah kedua dalam pengumpulan data ialah untuk menentukan berapakah bilangan pelaburan dalam setiap kelas. Untuk itu, kita perlu rujuk kepada Jadual 3.1 dan mengira bilangan pelaburan (data) dengan membuat tanda gundal (lajur 2) dan menulis bilangan pelaburan (lajur 3). Sebagai contoh, pelaburan pertama yang ditunjukkan dalam Jadual 3.1 ialah pelaburan yang matang dalam tempoh 70 hari. Oleh itu, tandakan satu garis pada lajur gundal untuk kelas 70 – 79. Keputusan untuk tanda gundal adalah seperti yang ditunjukkan dalam Jadual 3.2. Selepas selesai mengisi lajur gundal, kita teruskan dengan menjumlahkan bilangan gundal untuk setiap kelas dan isikan lajur bilangan pelaburan, seperti yang telah dilakukan dalam Jadual 3.2.

Dengan merujuk Jadual 3.2, kita boleh memperolehi maklumat-maklumat yang dikehendaki. Sebagai contoh, kita boleh mengetahui bilangan pelaburang jangka pendek yang tertinggi melibatkan tempoh kematangan 60 – 69 hari. Jika dibuat perbandingan antara Jadual 3.1 dan 3.2, pengumpulan data memudahkan kita membaca dan memahami data yang disampaikan.

Untuk contoh 3.4, kita menggunakan pendekatan mengumpulkan data dalam kelas. Terdapat tiga tatacara yang penting dalam melaksanakan pengumpulan data dalam kelas iaitu: 1. Bilangan kelas seharusnya antara 5 hingga 20 yang dapat memberikan maklumat ringkas berkaitan tentang data iaitu ciri-ciri yang relevan antara data.

Unit 3 Pengumpulan dan Pengurusan Data | 27

2. Setiap data mesti berada dalam satu kelas sahaja. Sebagai contoh, jika dalam contoh 4, kita menggunakan kelas 30 – 40, 40 – 50, 50 – 60, dan seterusnya, untuk pelaburan yang tempoh matangnya 50 hari, kelas yang manakah akan kita masukkan data ini? Oleh itu, kita harus berhati-hati dalam membentuk sesuatu kelas supaya data dapat dimasukkan dalam satu kelas sahaja. 3. Saiz untuk semua kelas mestilah sama melainkan jika ada keperluan lain. Semua kelas dalam Jadual 3.2 mempunyai saiz yang sama iaitu 10. Kita pilih saiz kelas yang sama sebab ini akan memudahkan kita untuk memaparkan data dalm bentuk graf.

Banyak lagi tatacara yang boleh dimasukkan, namun tiga tatacara ini sudah mencukupi sebagai asas yang kukuh dalam perbincangan kita tentang pengumpulan data.

Cuba anda senaraikan tatacara yang boleh digunapakai dalam pengumpulan data.

KEKERAPAN DAN TABURAN RELATIF KEKERAPAN Bilangan data yang terkumpul dalam sesuatu kelas dipanggil kekerapan kelas tersebut. Sebagai contoh, dalam Jadual 3.2, kekerapan kelas 50 – 59 ialah lapan kerana terdapat lapan pelaburan jangka pendek yang matang dalam tempoh 50 – 59 hari. Satu jadual yang menyenaraikan kelaskelas dan kekerapan-kekerapannya disebut sebagai taburan kekerapan. Lajur pertama dan ketiga

Unit 3 Pengumpulan dan Pengurusan Data | 28

dalam Jadual 3.2 membentuk satu taburan kekerapan untuk tempoh matang pelaburan jangka pendek dalam hari.

Sebagai tambahan kepada kekerapan sesuatu kelas, kita biasanya berminat dengan peratus sesuatu kelas. Kita boleh mendapatkan peratus yang dikehendaki dengan membahagikan kekerapan sesuatu kelas dengan jumlah bilangan data dan mendarabkannya dengan 100. Merujuk kembali kepada Jadual 3.2, kita dapat lihat bahawa peratus pelaburan untuk kelas 50 -59 ialah:

8 = 0.20 atau 20% 40 Maka, 20% daripada pelaburan mempunyai tempoh kematangan antara 50 hingga 59 hari.

Peratus sesuatu kelas, yang dinyatakan dalam bentuk perpuluhan, dikenali sebagai kekerapan relatif sesuatu kelas. Untuk kelas 50 – 59, kekerapan relatifnya ialah 0.20. Jadual yang menyenaraikan kesemua kelas dan kekerapan relatifnya dikenali sebagai taburan kekerapan relatif. Jadual 3.3 menunjukkan satu taburan kekerapan relatif untuk tempoh kematangan pelaburan jangka pendek dalam hari. Perhatikan bahawa jumlah kekerapan relatif keseluruhannya ialah 1 (100%).

Cuba anda fikirkan kegunaan-kegunaan taburan kekerapan relatif.

Unit 3 Pengumpulan dan Pengurusan Data | 29

Jadual 3.3 taburan kekerapan relatif untuk tempoh kematangan pelaburan jangka pendek Hari matang

Kekerapan relatif

30 – 39

0.075 (3/40)

40 – 49

0.025 (1/40)

50 – 59

0.200 (8/40)

60 – 69

0.250 (10/40)

70 – 79

0.175 (7/40)

80 – 89

0.175 (7/40)

90 – 99

0.100 (4/40) 1.000

Apabila kita membandingkan dua set data, taburan kekerapan relatif adalah lebih baik daripada taburan kekerapan. Ini ialah kerana kekerapan relatif sentiasa dalam julat antara 0 dan 1 yang memberikan perbandingan yang standard. Dua set data akan mempunyai taburan kekerapan yang serupa jika taburan kekerapan relatif adalah serupa. Namun demikian, dua set data yang mempunyai taburan kekerapan relatif yang serupa akan hanya mempunyai taburan kekerapan yang serupa jika kedua-dua set data mengandungi jumlah bilangan data yang sama.

TERMINOLOGI DATA TERKUMPUL

Untuk memudahkan pengumpulan data dilakukan, kita mesti membiasakan diri dan memahami terma-terma yang digunakan. Kita sudah pun membincangkan beberapa terma yang digunakan.

Unit 3 Pengumpulan dan Pengurusan Data | 30

Untuk memperkenalkan terma-terma yang lain, kita rujuk kembali kepada contoh 3.4 (data tentang tempoh matang pelaburan jangka pendek). Pertimbangkan, kelas 50 – 59. Tempoh kematangan pelaburan paling pendek yang boleh dimasukkan dalam kelas ini ialah 50. Nilai ini (50) dikenali sebagai had bawah kelas kelas ini. Manakala, tempoh kematangan yang paling tinggi yang boleh dimasukkan dalam kelas ini ialah 59. Nilai ini (59) disebut sebagai had atas kelas kelas ini.

Titik tengah kelas 50 – 59 ialah (50 + 59)/2 = 54.5. Ini dikenali sebagai tanda kelas untuk kelas 50 – 59. Tanda kelas ialah satu nilai yang mewakili suatu kelas dan akan digunakan dalam graf serta penghitungan berbentuk deskriptif.

Saiz kelas 50 – 59 boleh didapati melalui beza antara had bawah kelas yang sedia ada (50) dan had bawah kelas kemudiannya (60) iaitu 10.

Untuk maklumat lebih lanjut tentang data terkumpul, boleh layari laman sesawang berikut: http://www.wyzant.com/Help/Math/Statistics_and_Probability/Introduction/Data.a spx

Unit 3 Pengumpulan dan Pengurusan Data | 31

Berikut merupakan terminologi data terkumpul.

Kelas

:

Kategori untuk data terkumpul.

Kekerapan

:

Bilangan data dalam satu kelas.

Taburan kekerapan

:

Satu jadual yang mengandungi kelas-kelas dan kekerapan-kekerapannya.

Kekerapan relatif

:

Nisbah kekerapan sesuatu kelas dengan jumlah bilangan data.

Taburan kekerapan relatif

:

Satu jadual yang mengandungi kelas-kelas dan kekerapan relatifnya.

Had bawah kelas

:

Data yang paling kecil yang boleh dimasukkan dalam kelas tersebut.

Had atas kelas

:

Data yang paling besar yang boleh dimasukkan dalam kelas tersebut.

Tanda kelas

:

Titik tengah suatu kelas.

Saiz kelas

:

Beza antara had bawah kelas yang sedia ada dan had bawah kelas kemudiannya.

Satu jadual yang mengandungi kelas, kekerapan, kekerapan relatif dan tanda kelas untuk satu set data dipanggil jadual data terkumpul. Jadual 3.4 menunjukkan satu jadual data terkumpul untuk tempoh matang pelaburan jangka pendek.

Unit 3 Pengumpulan dan Pengurusan Data | 32

Jadual 3.4 Jadual data terkumpul untuk tempoh matang pelaburan jangka pendek Tempoh matang 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99

Kekerapan (Bilangan pelaburan) 3

Kekerapan relatif

Tanda kelas

0.075

34.5

1

0.025

44.5

8

0.200

54.5

10

0.250

64.5

7

0.175

74.5

7

0.175

84.5

4

0.100

94.5

40

1.000

Contoh 3.5 Seorang doktor yang menguji tahap kolesterol para remaja telah mendapati ada di antara mereka yang mempunyai tahap kolesterol melebihi 200 mg per 100mL. Bacaan 20 orang remaja yang mempunyai tahap kolesterol yang tinggi ditunjukkan dalam jadual di bawah. Bina satu jadual data terkumpul. Guna saiz kelas, 5 dan mula pada 195.

Unit 3 Pengumpulan dan Pengurusan Data | 33

210

209

212

208

217

207

210

203

208

210

210

199

215

221

213

218

202

218

200

214

Penyelesaian: Oleh kerana kita akan menggunakan saiz kelas, 5 dan bermula pada 195, maka kelas yang pertama ialah 195 – 199. Jadual 3.4 menunjukkan kelas dan kekerapan data untuk tahap kolesterol. Jadual 3.5 Kelas dan kekerapan tahap kolesterol pelajar Tahap kolesterol

Gundal

Kekerapan

195 – 199

/

1

200 – 204

///

3

205 – 209

////

4

210 – 214

//// //

7

215 – 219

////

4

220 – 224

/

1

Daripada Jadual 3.5, kita boleh membina jadual data terkumpul seperti dalam Jadual 3.6.

Unit 3 Pengumpulan dan Pengurusan Data | 34

Jadual 3.6 Jadual data terkumpul untuk data tahap kolesterol Tahap Kolesterol

Kekerapan

Kekerapan relatif

Tanda kelas

195 – 199

1

0.05

197

200 – 204

3

0.15

202

205 – 209

4

0.20

207

210 – 214

7

0.35

212

215 – 219

4

0.20

217

220 – 224

1

0.05

222

20

1.00

Untuk mengilustrasi nilai yang didapati dalam lajur 3 dan lajur 4 dalam Jadual 3.6, kita pertimbangkan kelas 210 – 214. Kita ada Kekerapan relatif = 7 = 0.35 20 dan tanda kelas = 210 + 214 = 212 2

Unit 3 Pengumpulan dan Pengurusan Data | 35

Latihan Formatif 3.2

1. Satu syarikat pengusaha minuman ringan yang menjual “1 liter” botol air soda mendapati bahawa isi kandungan air soda dalam botol-botol yang dikeluarkan adalah tidak sama. Tiga puluh botol air soda telah dipilih secara rawak. Isi kandungan, dalam mililiter, botol-botl tersebut adalah seperti yang ditunjukkan. 1025

977

1018

975

977

990

959

957

1031 964

986

914

1010

988

1028

989

1001

984

974

1017

1060

1030

991

999

997

996

1014

946

995

987

Bina satu jadual data terkumpul untuk data minuman ringan ini. Gunakan saiz kelas yang sama dan mulakan dengan kelas 910 – 929.

2. Satu kajian telah dijalankan untuk mengumpul maklumat berkaitan dengan umur seseorang dengan penyakit diabetes. Data berikut merupakan umur 35 orang yang menghidap penyakit kencing manis.

Unit 3 Pengumpulan dan Pengurusan Data | 36

48

41

57

83

41

55

59

61

38

48

79

75

77

7

54

23

47

56

79

68

61

64

45

53

82

68

38

70

10

60

83

76

21

65

47

Bina satu jadual data terkumpul untuk data umur tersebut. Gunakan saiz kelas yang sama dan mulakan dengan kelas 0 – 9.

DATA TERKUMPUL UNTUK NILAI TUNGGAL

Setakat ini, perbincangan kita tertumpu kepada pengumpulan data yang menggunakan selang kelas untuk mewakili nilai-nilai tertentu. Sebagai contoh, Jadual 3.6, setiap kelas tahap kolesterol mewakili lima tahap kolesterol yang mungkin. Kelas yang pertama, 195 – 199 mewakili tahap-tahap 195, 196, 197, 198 dan 199; kelas yang kedua, 200 – 204 mewakili tahap-tahap 200, 201, 202, 203 dan 204; dan seterusnya.

Namun yang demikian, terdapat juga kes-kes yang mana kelas-kelas hanya diwakili oleh satu nilai tunggal sahaja. Ini selalu terjadi kepada data diskret. Pertimbangkan Contoh 3.6.

Unit 3 Pengumpulan dan Pengurusan Data | 37

Contoh 3.6

Satu kajian telah dijalankan untuk mengumpul maklumat tentang bilangan anak dalam sesebuah keluarga yang masih bersekolah di Bukit Bangsar. Jadual 3.7 menunjukkan bilangan anak yang bersekolah dalam setiap keluarga daripada 30 buah keluarga yang dipilih. Jadual 3.7 Bilangan anak yang bersekolah 0

3

0

0

3

0

2

2

0

1

2

1

0

0

1

2

4

0

4

2

1

0

1

0

0

2

0

1

3

2

a. Kumpulkan data tersebut menggunakan kelas-kelas yang mewakili nilai tunggal. b. Kenal pasti had-had kelas dan tanda kelas. c. Bina satu jadual data terkumpul.

Penyelesaian: a. Dengan menggundalkan data yang terdapat dalam Jadual 3.7, kita akan dapat kekerapan seperti dalam lajur dua Jadual 3.8. Dengan membahagikan kekerapan dengan jumlah bilangan data, 30, kita akan dapat kekerapan relatif seperti dalam lajur tiga.

Unit 3 Pengumpulan dan Pengurusan Data | 38

b. Jadual 3.8 Taburan kekerapan dan kekerapan relatif bilangan anak yang bersekolah Bilangan anak yang bersekolah

Kekerapan

Kekerapan relatif

0

12

0.400

1

6

0.200

2

7

0.233

3

3

0.100

4

2

0.067

30

1.000

b. Untuk kenal pasti had-had kelas, kita pertimbangkan kelas “3” (tiga orang anak yang bersekolah). Kita dapati bahawa: Had bawah kelas = 3 (nilai yang terkecil yang boleh dimasukkan ke dalam kelas) Had atas kelas = 3 (nilai yang terbesar yang boleh dimasukkan ke dalam kelas) dan Tanda kelas = 3 + 3 = 3 (titik tengah kelas) 2

Kesimpulannya, untuk kelas “3”, had bawah kelas, had atas kelas dan tanda kelas, semuanya bersamaan dengan 3. Ini adalah benar untuk semua kelas.

Unit 3 Pengumpulan dan Pengurusan Data | 39

c. Untuk membina satu jadual data terkumpul, kita cuma perlu menambah satu lajur lagi iaitu lajur untuk tanda kelas dalam Jadual 3.8. Namun demikian, dalam bahagian (b), kita dapati bahawa tanda kelas untuk setiap kelas adalah bersamaan dengan kelas masing-masing. Oleh itu, kita TIDAK perlu untuk menambahkan lajur tanda kelas kerana ia akan bersamaan dengan lajur pertama. Dengan kata lain, Jadual 3.8 ialah jadual data terkumpul untuk bilangan anak yang bersekolah.

Cuba fikirkan mengapa kita tidak menggunakan selang kelas untuk nilai tunggal.

Latihan Formatif 3.3

1. Bancian telah dijalankan di seluruh negara untuk mengenal pasti bilangan ahli dalam sebuah keluarga. Berikut adalah data bilangan ahli dalam sebuah keluarga untuk 40 keluarga. 2

5

2

1

1

2

3

4

1

4

4

2

1

4

3

3

7

1

2

2

3

4

2

2

6

5

2

5

1

3

2

5

2

1

3

3

2

2

3

3

Unit 3 Pengumpulan dan Pengurusan Data | 40

Bina satu jadual data terkumpul untuk bilangan ahli dalam sebuah keluarga menggunakan kelas-kelas nilai tunggal. 2. Seorang penjual kereta telah mencatatkan bilangan buah kereta yang dijual setiap minggu. Bilangan buah kereta yang dijual setiap minggu pada tahun lepas adalah seperti berikut.

1

0

3

3

1

0

2

1

4

0

4

1

2

3

6

4

3

0

2

2

1

1

2

2

2

3

5

1

0

2

5

3

1

3

1

1

1

1

2

2

3

0

4

4

1

0

1

1

3

2

5

2

Bina satu jadual data terkumpul untuk bilangan buah kereta yang dijual setiap minggu menggunakan kelas-kelas nilai tunggal.

DATA TERKUMPUL UNTUK DATA KUALITATIF

Walaupun konsep had bawah dan had atas kelas serta tanda kelas boleh diaplikasikan ke atas data kuantitatif, namun demikian konsep ini tidak bersesuaian untuk data kualitatif. Sebagai contoh, data yang mengkategorikan orang sebagai lelaki atau perempuan, kelas-kelas yang terlibat ialah “lelaki’ atau “perempuan”. Untuk kelas kualitatif begini, had kelas dan tanda kelas tidak membawa sebarang makna. Apa yang boleh kita lakukan ialah mendapatkan kekerapan dan kekerapan relatif untuk data kualitatif. Pertimbangkan contoh 3.7.

Unit 3 Pengumpulan dan Pengurusan Data | 41

Contoh 3.7 Seorang guru meminta murid-muridnya memilih sama ada rumah Biru (B), Merah (M), atau Kuning (K) yang akan muncul johan keseluruhan untuk sukan tahunan tahun ini? Respon murid-muridnya adalah seperti yang dipaparkan dalam jadual di bawah. Tentukan taburan kekerapan dan kekerapan relatif untuk data tersebut. B

M

K

M

M

M

M

M

B

K

M

B

K

K

M

B

B

M

K

B

M

M

K

M

B

K

B

B

B

M

K

B

K

M

B

M

M

M

M

B

Penyelesaian: Kelas-kelas untuk data terkumpul yang akan kita gunakan ialah “Biru”, “Merah” dan “Kuning”. Taburan kekerapan dan kekerapan relatif yang akan kita peroleh ialah seperti jadual di bawah. Rumah sukan

Kekerapan

Kekerapan relatif

Biru

13

0.325

Merah

18

0.450

Kuning

9

0.225

40

1.000

Unit 3 Pengumpulan dan Pengurusan Data | 42

Dengan membahagikan setiap kekerapan dalam lajur dua dengan jumlah bilangan pelajar, kita akan peroleh kekerapan relatif.

Cuba fikirkan apakah perbezaan taburan kekerapan nilai tunggal dan taburan kekerapan data kualitatif.

Latihan Formatif 3.4

1. Negara-negara yang menjuarai kejohanan bola sepak negara-negara Eropah sejak ia dimulakan adalah seperti senarai berikut. Tahun 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004 2008 2012

Juara USSR Sepanyol Itali Jerman Czechoslovakia Jerman Perancis Belanda Denmark Jerman Perancis Greece Sepanyol Sepanyol

Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.

Unit 3 Pengumpulan dan Pengurusan Data | 43

2. Ujian darah untuk mengenalpasti jenis darah setiap murid telah dijalankan dalam sebuah sekolah menengah. Diidapati bahawa murid-murid sekolah tersebut mempunyai darah jenis kumpulan A, B, AB, dan O. Jadual di bawah menunjukkan kumpulan darah 30 orang murid yang dipilh secara rawak. A

A

O

O

AB

B

B

B

B

AB

A

A

O

O

AB

AB

AB

AB

A

B

O

O

AB

O

B

A

O

B

AB

AB

Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.

RUMUSAN Secara keseluruhannya, kita telah didedahkan dengan apa itu pembolehubah kuantitatif dan kualitatif. Apa yang lebih penting, kita sudah pun mengenali dengan lebih mendalam tentang data kuantitatif dan data kualitatif. Diharapkan penerangan dan contoh-contoh dalam unit ini telah dapat membantu kita untuk memahami apa itu data diskret dan data selanjar. Secara ringkasnya, data diskret ialah data yang cuma boleh mengambil nilai tetap atau nilai tepat sahaja (dalam bahasa mudah: yang boleh dibilang dan yang ambil nilai nombor bulat). Data selanjar pula ialah data yang hanya boleh diberi nilai dalam suatu julat dan tidak boleh mengambil satu nilai tunggal atau satu

Unit 3 Pengumpulan dan Pengurusan Data | 44

nilai tepat (dalam bahasa mudah: boleh ambil nilai perpuluhan). Disamping itu, kita juga ada data kualitatif yang mana data jenis ini merupakan angka-angka atau skor-skor yang tidak mempunyai nilai kuantiti (contohnya: jantina, warna mata, dan lain-lain).

Perbincangan kita juga menjurus kepada tatacara pengumpulan data yang melibatkan data terkumpul untuk skor yang biasa (yang melibatkan selang kelas), nilai tunggal dan kualitatif. Kita telah didedahkan dengan dua jenis taburan: taburan kekerapan dan taburan kekerapan relatif. Diharapkan agar kita telah berjaya menguasai unit ini dengan jayanya. Unit yang seterusnya akan membincangkan tentang miskonsepsi dalam pengumpulan dan pengurusan data.

KATA KUNCI

Pembolehubah kuantitatif, pembolehubah kualitatif, pembolehubah diskret, pembolehubah selanjar, data kuantitatif, data kualitatif, data diskret, data selanjar, taburan kekerapan, taburan kekerapan relatif.

Unit 3 Pengumpulan dan Pengurusan Data | 45

Latihan Sumatif 1. Berikan satu sebab mengapa mengklasifikasi data adalah penting? (Ia boleh membantu dalam memilih kaedah statistik yang betul).

2. Berikut merupakan lima sungai yang terpanjang dalam dunia. Kedudukan

Sungai

Panjang (km)

1

Nil

6650

2

Amazon

6400

3

Yangtze

6300

4

Mississipi

6275

5

Yenisei-Angara-Selanga

5539

a. Apakah jenis data yang diberikan dalam lajur pertama jadual di atas? (data kuantitatif: data diskret, pembolehubah – kedudukan) b. Apakah jenis data yang diperoleh daripada maklumat “Sungai Nil ialah sungai yang terpanjang dalam dunia.”? (Data kuantitatif: data diskret, pembolehubah – kedudukan) c. Apakah jenis data yang diberikan dalam lajur ketiga dalam jadual di atas? (Data kuantitatif: data selanjar, pembolehubah – panjang)

Unit 3 Pengumpulan dan Pengurusan Data | 46

3. Satu kajian telah dijalankan ke atas pelancong-pelancong dari luar negara tentang tempoh tinggal semasa melancong ke Malaysia. Jadual berikut menunjukkan data tempoh tinggal 36 orang pelancong yang dipilih secara rawak, dalam hari. 41

16

6

21

1

21

5

31

20

27

17 10

3

32

2

48

8

12

21

44

1

56

5

12

3

13

15

10

18

3

1

11

14

12

64 10

Bina satu jadual data terkumpul untuk data tempoh tinggal tersebut. Gunakan saiz kelas yang sama dan mulakan dengan kelas 1 – 7.

4. Satu ujian kecerdasan telah dijalankan ke atas 50 orang kanak-kanak Tahun Satu di sebuah sekolah. Berikut merupakan data skor yang diperoleh kanak-kanak tersebut. 100

92

96

91

81

110

70

119 94

88

104

83

115 97

73

108

93

116 86

98

89

123

78 108 127

91 114

95

105

63 112 102

117 106 126

94 124

92

99

76 105 90

81 109 116

96 107

84 101 121

Unit 3 Pengumpulan dan Pengurusan Data | 47

Bina satu jadual data terkumpul untuk data skor tersebut. Gunakan saiz kelas yang bersesuaian.

5. 25 orang murid Tahun Lima telah diminta untuk menjawab satu kuiz yang mengandungi lapan soalan tentang tajuk Pecahan. Bilangan soalan yang gagal dijawab dengan betul oleh setiap murid adalah seperti yang ditunjukkan. 3

4

2

3

1

1

1

6

1

2

0

5

1

2

1

0

3

4

0

3

2

0

3

1

1

Bina satu jadual data terkumpul untuk bilangan soalan yang gagal dijawab oleh murid-murid Tahun Lima menggunakan kelas-kelas nilai tunggal.

Unit 3 Pengumpulan dan Pengurusan Data | 48

6. Sebuah bank mempunyai 80 orang pekerja. Ketidakhadiran setiap pekerja, dalam hari yang dicatatkan tahun lalu adalah seperti berikut.

2

3

6

2

6

5

5

2

4

7

5

3

6

4

4

4

2

2

4

5

4

0

2

1

6

3

5

3

6

6

4

7

5

2

5

0

5

6

5

2

4

2

6

2

4

3

5

4

2

4

4

3

3

4

0

5

6

3

5

5

2

4

4

2

0

7

5

5

7

6

1

5

3

3

4

7

7

2

5

5

Bina satu jadual data terkumpul untuk data ketidakhadiran pekerja, dalam hari menggunakan kelas-kelas nilai tunggal.

7. Tiga unit beruniform telah ditubuhkan dalam sebuah sekolah rendah: Pengakap Kanakkanak (PK), Persatuan Bulan Sabit Merah (PBSM), Kadet Remaja Sekolah (KRS). Setiap murid adalah diwajibkan untuk mengganggotai salah satu daripada unit beruniform tersebut. Jadual di bawah menunjukkan keanggotaan unit beruniform 40 orang murid yang dipilih secara rawak.

Unit 3 Pengumpulan dan Pengurusan Data | 49

PK

PBSM

KRS

PBSM

PBSM

PBSM

PBSM

PBSM

PK

KRS

PBSM

PK

KRS

KRS

PBSM

PK

PK

PBSM

KRS

PK

PBSM

PBSM

KRS

PBSM

PK

KRS

PK

PK

PK

PBSM

KRS

PK

KRS

PBSM

PK

PBSM

PBSM

PBSM

PBSM

PK

Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.

8. Pada pengajian semester yang lepas, pelajar-pelajar Program Pendidikan Matematik telah memilih untuk mengikuti salah satu daripada kursus-kursus berikut: Kalkulus Permulaan (K), Pengenalan Statistik (S) dan Linear Algebra (A). Berikut merupakan pilihan kursus 40 orang pelajar yang dipilih secara rawak.

A

K

K

A

S

A

S

K

S

S

A

K

A

A

K

K

S

A

S

A

K

S

S

K

A

A

A

K

S

A

A

K

K

A

S

S

K

K

S

S

Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.

Unit 3 Pengumpulan dan Pengurusan Data | 50

Rujukan

Dunn, S.D. (2001). Statistic and data analysis for the behavioral sciences. New York: McGraw-Hill. Haylock, D. (2010). Mathematics Explained For Primary Teachers (4th Ed.). London: Sage Publications Howitt, D., & Cramer, D. (2000). An introduction to statistics in psychology: A complete guide for students. (2nd Ed.). Harlow, England: Prentice Hall. Iran Herman.(2004). Statistik dan analisis data sains sosial. Alor Star: Percetakan Ustaras Sdn.Bhd. Kennedy, L. M, & Tipps, S. (2011).Guiding Children’s Learning of Mathematics.(12th Ed.). Bermont: Wadsworth.

Weiss, N. A. (2005). Introductory Statistics (7th Ed.). Boston: Pearson & Addison Wesley. Utts, J. M., & Heckard, R. F.(2004). Mind on Statistics (2nd Ed.). Belmont, CA: Thomson Learning. http://www.epcae.org/uploads/documents/Central_Tendency_pck_SEP20.pdf

Unit 3 Pengumpulan dan Pengurusan Data | 51

Jawapan Latihan Formatif 3.1 1. (a) data kuantitatif: data diskret; pembolehubah – kedudukan (b) data kualitatif; pembolehubah – bahasa (c) data kuantitatif: data diskret; pembolehubah – pengguna 2. (a) data kuantitatif: data selanjar; pembolehubah – keluasan tanah (b) data kuantitatif: data diskret; pembolehubah – pangkat/kedudukan keluasan tanah dan populasi (c) data kuatitaif: data diskret; pembolehubah – populasi (d) data kualitatif; pembolehubah – benua dia dilahirkan

Latihan Formatif 3.2 1. Kandungan

Kekerapan

Kekerapan relatif

Tanda kelas

910 – 929

1

0.033

919.5

930 – 949

1

0.033

939.5

950 – 969

3

0.100

959.5

970 – 989

9

0.300

979.5

990 – 1009

7

0.233

999.5

1010 – 1029

6

0.200

1019.5

1030 – 1049

2

0.067

1039.5

1050 - 1069

1

0.033

1059.5

30

0.999

Unit 3 Pengumpulan dan Pengurusan Data | 52

2. Umur

Kekerapan

Kekerapan relatif

Tanda kelas

0–9

1

0.029

4.5

10 – 19

1

0.029

14.5

20 – 29

2

0.057

24.5

30 – 39

2

0.057

34.5

40 – 49

7

0.200

44.5

50 – 59

6

0.171

54.5

60 – 69

7

0.200

64.5

70 – 79

6

0.171

74.5

80 – 89

3

0.086

84.5

35

1.000

Latihan Formatif 3.3 1. Bilangan ahli

Kekerapan

Kekerapan relatif

1

7

0.175

2

13

0.325

3

9

0.225

4

5

0.125

5

4

0.100

6

1

0.025

7

1

0.025

40

1.000

Unit 3 Pengumpulan dan Pengurusan Data | 53

2. Bilangan buah kereta

Kekerapan

Kekerapan relatif

0

7

0.135

1

15

0.288

2

12

0.231

3

9

0.173

4

5

0.096

5

3

0.058

6

1

0.019

52

1.000

Juara

Kekerapan

Kekerapan relatif

Sepanyol

3

0.214

Jerman

3

0.214

Itali

1

0.071

Perancis

2

0.143

Denmark

1

0.071

Belanda

1

0.071

Greece

1

0.071

USSR

1

0.071

Czechoslovakia

1

0.071

14

0.997

Latihan Formatif 3.4 1.

Unit 3 Pengumpulan dan Pengurusan Data | 54

2. Kumpulan darah

Kekerapan

Kekerapan relatif

A

6

0.200

B

7

0.233

O

8

0.267

AB

9

0.300

30

1.000

Unit 3 Pengumpulan dan Pengurusan Data | 55

Latihan Sumatif 1. Mengklasifikasi data adalah penting kerana ia boleh membantu dalam memilih kaedah statistik yang betul.

2. (a) data kuantitatif: data diskret; pembolehubah – kedudukan (b) data kuantitatif: data diskret; pembolehubah – kedudukan (c) data kuantitatif: data selanjar; pembolehubah – panjang

3. Tempoh tinggal

Kekerapan

Kekerapan relatif

Tanda kelas

1–7

10

0.278

4

8 – 14

10

0.278

11

15 – 21

8

0.222

18

22 – 28

1

0.028

25

29 – 35

2

0.056

32

36 – 42

1

0.028

39

43 – 49

2

0.056

46

50 – 56

1

0.028

53

57 – 64

1

0.028

60

36

1.000

(Hari)

Unit 3 Pengumpulan dan Pengurusan Data | 56

4. Skor

Kekerapan

Kekerapan relatif

Tanda kelas

60 – 69

1

0.020

64.5

70 – 79

4

0.080

74.5

80 – 89

7

0.140

84.5

90 – 99

14

0.280

94.5

100 – 109

11

0.220

104.5

110 – 119

8

0.160

114.5

120 - 129

5

0.100

124.5

50

1.000

5. Bilangan soalan yang gagal dijawab 0 1 2 3 4 5 6

Kekerapan

Kekerapan relatif

4 8 4 5 2 1 1 25

0.160 0.320 0.160 0.200 0.080 0.040 0.040 1.000

Unit 3 Pengumpulan dan Pengurusan Data | 57

6. Ketidakhadiran bekerja (Hari)

Kekerapan

Kekerapan relatif

0

4

0.050

1

2

0.025

2

14

0.175

3

10

0.125

4

16

0.200

5

18

0.225

6

10

0.125

7

6

0.075

80

1.000

7. Unit Beruniform

Kekerapan

Kekerapan relatif

Pengakap Kanak-kanak

13

0.325

Persatuan Bulan Sabit Merah

18

0.450

Kadet Remaja Sekolah

9

0.225

40

1.000

Kursus

Kekerapan

Kekerapan relatif

Kalkulus Permulaan

13

0.325

Pengenalan Statistik

13

0.325

Linear Algebra

14

0.350

40

1.000

8.

Suggest Documents