Unit 3 Pengumpulan dan Pengurusan Data | 15
UNIT PELAJARAN 3
PENGUMPULAN DAN PENGURUSAN DATA
HASIL PEMBELAJARAN
Di akhir unit ini, anda diharap dapat:
1.
Mengumpul dan mengklasifikasi data mengikut jenis-jenisnya.
2.
Mengurus data ke dalam jadual-jadual tertentu.
PENGENALAN
S
tatistik deskriptif mengandungi pelbagai kaedah, bukan sahaja untuk menguruskan data malahan meringkaskan maklumat atau data yang diperoleh agar mudah dibaca dengan jelas dan berkesan. Dalam Unit 3 ini, kita akan membincangkan mengenai bagaimana data
Unit 3 Pengumpulan dan Pengurusan Data | 16
dikumpulkan dan diuruskan dengan kaedah yang bersesuaian. Sebelum itu, kita akan mengenali dengan lebih dekat lagi apa itu pembolehubah kuantitatif dan pembolehubah kualitatif. Begitu juga dengan data kuantitatif dan data kualitatif. Kita juga akan diperkenalkan dengan dua jenis data kuantitatif iaitu data diskret dan data selanjar.
Setelah kita mengenali apa itu pembolehubah dan jenis-jenis data, kita akan mempelajari pula bagaimana hendak mengumpulkan data mengikut taburan-taburan tertentu. Penerangan berserta contoh-contoh berkaitan dengan taburan kekerapan dan taburan kekerapan relatif disertakan untuk kita lebih memahami dan mendalami data dan taburannya.
Selain daripada itu, kita juga akan diuji dengan latihan-latihan formatif berkaitan subtajuksubtajuk yang dipelajari. Akhir sekali, kita akan diuji dengan latihan sumatif yang merangkumi apa yang telah kita bincangkan dalam unit ini.
PEMBOLEHUBAH DAN DATA
Ciri yang berbeza antara seseorang atau sesuatu benda kepada yang lain dikenali sebagai pembolehubah. Contoh-contoh pembolehubah yang melibatkan manusia termasuklah tinggi, berat, bilangan adik-beradik, jantina, taraf perkahwinan dan warna mata. Tiga contoh pertama yang diberikan melibatkan maklumat yang boleh dihitung ialah pembolehubah kuantitatif. Tiga
Unit 3 Pengumpulan dan Pengurusan Data | 17
contoh yang terakhir melibatkan maklumat yang tidak boleh dihitung ialah pembolehubah kualitatif.
Terdapat dua jenis pembolehubah kuantitatif, iaitu pembolehubah diskret dan pembolehubah selanjar. Satu pembolehubah diskret ialah nilai mungkin yang membentuk satu set nombor terhingga (atau terbilangkan tak terhingga), kebiasaannya melibatkan nombor bulat. Bilangan adik-beradik yang dipunyai oleh seseorang merupakan satu contoh pembolehubah diskret. Pembolehubah selanjar ialah nilai mungkin yang membentuk julat nombor. Ketinggian seseorang ialah satu contoh pembolehubah selanjar. Secara ringkasnya, perbincangan tentang pembolehubah boleh disimpulkan seperti berikut dalam jadual dan rajah di bawah:
Pembolehubah
:
Satu ciri yang berbeza antara seseorang atau sesuatu benda kepada yang lain.
Pembole ubah kuantitatif
:
Satu pembolehubah nilai berangka.
Pembolehubah kualitatif
:
Satu pembolehubah nilai tak berangka.
Pembolehubah diskret
:
Satu pembolehubah kuantitatif dengan nilai mungkin membentuk satu set nombor terhingga (atau terbilangkan tak terhingga).
Pembolehubah selanjar
:
Satu pembolehubah kuantitatif dengan nilai mungkin yang membentuk julat nombor.
Unit 3 Pengumpulan dan Pengurusan Data | 18
Pemerhatian yang dijalankan terhadap nilai-nilai satu pembolehubah berkaitan seseorang atau sesuatu benda dikenali sebagai data. Maka, maklumat yang dikumpulkan, diuruskan dan dianalisis oleh pakar-pakar statistik ialah data. Terma-terma yang digunakan untuk menggambarkan satu pembolehubah juga digunakan dalam menggambarkan data.
Data kualitatif
Data kualitatif ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai pembolehubah kualitatif yang mana ia terdiri daripada angka-angka atau skor-skor yang tidak mempunyai nilai kuantiti. Angka-angka atau skor-skor ini cuma menunjukkan kategori, nama, jenis, kelas atau
Unit 3 Pengumpulan dan Pengurusan Data | 19
pangkat bandingan. Contohnya, jantina (1 = lelaki, 2 = perempuan), jenis rumah (1 = banglo, 2 = teres, 3 = pangsapuri), gred peperiksaan (1 = A, 2 = B, 3 = C) dan lain-lain lagi. Data kualitatif menyukat kualiti dan bukan kuantiti.
Data kuantitatif
Data kuantitatif pula ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai pembolehubah kuantitatif yang mana ia tediri daripada angka-angka atau skor-skor yang mempunyaii nilai berangka. Angka-angka atau skor-skor ini menunjukkan banyak, kekuatan atau saiz sesuatu ciri seperti berat, umur, tinggi, markah ujian dan lain-lain. Data kuantitatif terdiri daripada data diskret dan data selanjar.
Data diskret
Data diskret ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah diskret dengan cara membilang. Data diskret cuma boleh mengambil nilai tetap atau nilai tepat sahaja. Contohnya, bilangan buah buku atas rak, bilangan kenderaan yang melalui plaza tol, bilangan ahli dalam sebuah keluarga, bilangan murid dalam sebuah kelas, dan lain-lain lagi.
Unit 3 Pengumpulan dan Pengurusan Data | 20
Data selanjar
Data selanjar ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah selanjar yang hanya boleh diberi nilai dalam suatu julat dan tidak boleh mengambil satu nilai tunggal atau satu nilai tepat. Contohnya, tinggi orang, berat orang atau benda, halaju sebuah kapal terbang dan lain-lain lagi.
Data
:
Maklumat yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah.
Data kualitatif :
Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah kualitatif.
Data kuantitatif :
Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah kuantitatif.
Data diskret
:
Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah diskret dengan cara membilang.
Data selanjar :
Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah selanjar.
Contoh 3.1 Manusia diklasifikasikan hanya mempunyai satu daripada empat jenis darah: A, B, AB, atau O. Apakah jenis data yang anda terima apabila anda diberitahu jenis darah anda?
Unit 3 Pengumpulan dan Pengurusan Data | 21
Penyelesaian: Jenis darah tergolong dalam data kualitatif – data diperolehi dengan memerhatikan nilai pembolehubah “jenis darah”.
Contoh 3.2 Banci perumahan dijalankan sekali dalam tempoh 10 tahun untuk mengetahui bilangan ahli dalam sebuah keluarga. Apakah jenis data yang diperolehi melalui bilangan ahli dalam sebuah keluarga? Penyelesaian: Bilangan ahli dalam sebuah keluarga tergolong dalam data kuantitatif iaitu data diskret – data diperolehi dengan memerhatikan nilai pembolehubah “bilangan ahli dalam sebuah keluarga”.
Contoh 3.3 Di awal persekolahan, Cikgu Ali telah mengukur tinggi dan berat murid-murid kelasnya. Apakah jenis data yang diperolehi melalui tinggi dan berat? Penyelesaian: Tinggi dan berat tergolong dalam data kuantitatif iaitu data selanjar – data diperolehi dengan memerhatikan nilai pembolehubah “tinggi dan berat”.
Unit 3 Pengumpulan dan Pengurusan Data | 22
Cuba anda fikirkan tiga contoh yang berkaitan dengan data diskret, data selanjar dan data kualitatif selain daripada contoh-contoh di atas.
Latihan Formatif 3.1
Untuk soalan-soalan 1 – 2, klasifikasikan sama ada data yang diberikan ialah data kualitatif atau data kuantitatif. Jika kuantitatif, nyatakan sama ada data tersebut ialah data diskret atau data selanjar. Juga kenal pasti pembolehubahnya. 1.
Mengikut kajian yang dijalankan oleh Sidney S. Culbert (Universiti Washington), bahasabahasa utama yang digunakan dalam tahun 1993 adalah seperti berikut. Kedudukan
Bahasa
Pengguna (juta)
1
Mandarin
930
2
Inggeris
463
3
Hindi
400
4
Sepanyol
371
5
Russia
291
6
Arab
214
7
Bengali
192
a. Apakah jenis data yang diberikan dalam lajur pertama jadual ini?
Unit 3 Pengumpulan dan Pengurusan Data | 23
b. Apakah jenis data yang didapati melalui maklumat bahawa Sally Ride bercakap dalam Bahasa Inggeris? c. Apakah jenis data yang didapati melalui maklumat dalam lajur tiga jadual ini?
2.
Jadual berikut menunjukkan anggaran statistik keluasan tanah dan populasi setiap benua dalam tahun 1992. Benua
Keluasan tanah
Populasi
(1000 batu persegi)
(Juta)
Asia
10644
3207
Afrika
11707
654
Amerika Utara
9360
436
Amerika Selatan
6883
300
Eropah
1905
511
Oceania
3284
28
a. Apakah jenis data yang diberikan oleh keluasan tanah? b. Apakah jenis data yang didapati melalui kenyataaan, “Afrika mempunyai keluasan tanah yang terbesar dan kedua dalam jumlah populasi penduduk”? c. Apakah jenis data yang didapati melalui maklumat dalam lajur tiga jadual ini? d. Apakah jenis data yang didapati melalui maklumat bahawa Ronaldo dilahirkan di Eropah?
Unit 3 Pengumpulan dan Pengurusan Data | 24
PENGUMPULAN DATA
Apabila kita berbincang berkenaan dengan jenis-jenis data sebelum ini, contoh-contoh yang diberikan tidak mengandungi kuantiti data yang besar. Namun demikian, dalam dunia yang nyata kadang-kadang data yang dikumpulkan boleh berkemungkinan terlalu banyak. Sebagai contohnya, profil pelajar-pelajar universiti di Malaysia, bilangan guru-guru di Malaysia dan lain-lain lagi. Untuk itu, kita perlu menguruskan data yang banyak ini dalam bentuk yang senang difahami. Dalam subtajuk ini, kita akan membincangkan tentang pengumpulan data, iaitu meletakkan data di dalam kumpulan-kumpulan. Pengumpulan data merupakan salah satu cara yang biasa digunakan untuk menguruskan data.
Cuba anda nyatakan kebaikan dan kelemahan dalam pengumpulan data.
Contoh 3.4 Jadual 3.1 menunjukkan kematangan 40 pelaburan jangka pendek dalam hari.
Adalah sukar untuk memahami data jika data dipaparkan seperti dalam Jadual 3.1. Oleh itu, kita perlu mengumpulkan data tersebut mengikut kategori-kategori tertentu atau pun kelas-kelas tertentu untuk memudahkan kita memahami data tersebut.
Unit 3 Pengumpulan dan Pengurusan Data | 25
Langkah pertama ialah menentukan kelasnya. Paling mudah, data dikelaskan mengikut selang atau saiz 10. Oleh kerana nilai data yang terkecil ialah 36 dan yang terbesar ialah 99, pengumpulan data mengikut saiz 10 akan menghasilkan kelas-kelas: 30 – 39 , 40 – 49, dan seterusnya hingga 90 – 99. Kelas-kelas ini dinyatakan dalam lajur pertama Jadual 3.2 di bawah.
Jadual 3.1 Kematangan 40 pelaburan jangka pendek dalam hari
70
64
99
55
64
89
87
65
62
38
67
70
60
69
78
39
75
56
71
51
99
68
95
86
57
53
47
50
55
81
80
98
51
36
63
66
85
79
83
70
Jadual 3.2 Kelas dan bilangan pelaburan Hari matang 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99
Gundal /// / //// /// //// //// //// // //// // ////
Bilangan pelaburan 3 1 8 10 7 7 4 40
Unit 3 Pengumpulan dan Pengurusan Data | 26
Langkah kedua dalam pengumpulan data ialah untuk menentukan berapakah bilangan pelaburan dalam setiap kelas. Untuk itu, kita perlu rujuk kepada Jadual 3.1 dan mengira bilangan pelaburan (data) dengan membuat tanda gundal (lajur 2) dan menulis bilangan pelaburan (lajur 3). Sebagai contoh, pelaburan pertama yang ditunjukkan dalam Jadual 3.1 ialah pelaburan yang matang dalam tempoh 70 hari. Oleh itu, tandakan satu garis pada lajur gundal untuk kelas 70 – 79. Keputusan untuk tanda gundal adalah seperti yang ditunjukkan dalam Jadual 3.2. Selepas selesai mengisi lajur gundal, kita teruskan dengan menjumlahkan bilangan gundal untuk setiap kelas dan isikan lajur bilangan pelaburan, seperti yang telah dilakukan dalam Jadual 3.2.
Dengan merujuk Jadual 3.2, kita boleh memperolehi maklumat-maklumat yang dikehendaki. Sebagai contoh, kita boleh mengetahui bilangan pelaburang jangka pendek yang tertinggi melibatkan tempoh kematangan 60 – 69 hari. Jika dibuat perbandingan antara Jadual 3.1 dan 3.2, pengumpulan data memudahkan kita membaca dan memahami data yang disampaikan.
Untuk contoh 3.4, kita menggunakan pendekatan mengumpulkan data dalam kelas. Terdapat tiga tatacara yang penting dalam melaksanakan pengumpulan data dalam kelas iaitu: 1. Bilangan kelas seharusnya antara 5 hingga 20 yang dapat memberikan maklumat ringkas berkaitan tentang data iaitu ciri-ciri yang relevan antara data.
Unit 3 Pengumpulan dan Pengurusan Data | 27
2. Setiap data mesti berada dalam satu kelas sahaja. Sebagai contoh, jika dalam contoh 4, kita menggunakan kelas 30 – 40, 40 – 50, 50 – 60, dan seterusnya, untuk pelaburan yang tempoh matangnya 50 hari, kelas yang manakah akan kita masukkan data ini? Oleh itu, kita harus berhati-hati dalam membentuk sesuatu kelas supaya data dapat dimasukkan dalam satu kelas sahaja. 3. Saiz untuk semua kelas mestilah sama melainkan jika ada keperluan lain. Semua kelas dalam Jadual 3.2 mempunyai saiz yang sama iaitu 10. Kita pilih saiz kelas yang sama sebab ini akan memudahkan kita untuk memaparkan data dalm bentuk graf.
Banyak lagi tatacara yang boleh dimasukkan, namun tiga tatacara ini sudah mencukupi sebagai asas yang kukuh dalam perbincangan kita tentang pengumpulan data.
Cuba anda senaraikan tatacara yang boleh digunapakai dalam pengumpulan data.
KEKERAPAN DAN TABURAN RELATIF KEKERAPAN Bilangan data yang terkumpul dalam sesuatu kelas dipanggil kekerapan kelas tersebut. Sebagai contoh, dalam Jadual 3.2, kekerapan kelas 50 – 59 ialah lapan kerana terdapat lapan pelaburan jangka pendek yang matang dalam tempoh 50 – 59 hari. Satu jadual yang menyenaraikan kelaskelas dan kekerapan-kekerapannya disebut sebagai taburan kekerapan. Lajur pertama dan ketiga
Unit 3 Pengumpulan dan Pengurusan Data | 28
dalam Jadual 3.2 membentuk satu taburan kekerapan untuk tempoh matang pelaburan jangka pendek dalam hari.
Sebagai tambahan kepada kekerapan sesuatu kelas, kita biasanya berminat dengan peratus sesuatu kelas. Kita boleh mendapatkan peratus yang dikehendaki dengan membahagikan kekerapan sesuatu kelas dengan jumlah bilangan data dan mendarabkannya dengan 100. Merujuk kembali kepada Jadual 3.2, kita dapat lihat bahawa peratus pelaburan untuk kelas 50 -59 ialah:
8 = 0.20 atau 20% 40 Maka, 20% daripada pelaburan mempunyai tempoh kematangan antara 50 hingga 59 hari.
Peratus sesuatu kelas, yang dinyatakan dalam bentuk perpuluhan, dikenali sebagai kekerapan relatif sesuatu kelas. Untuk kelas 50 – 59, kekerapan relatifnya ialah 0.20. Jadual yang menyenaraikan kesemua kelas dan kekerapan relatifnya dikenali sebagai taburan kekerapan relatif. Jadual 3.3 menunjukkan satu taburan kekerapan relatif untuk tempoh kematangan pelaburan jangka pendek dalam hari. Perhatikan bahawa jumlah kekerapan relatif keseluruhannya ialah 1 (100%).
Cuba anda fikirkan kegunaan-kegunaan taburan kekerapan relatif.
Unit 3 Pengumpulan dan Pengurusan Data | 29
Jadual 3.3 taburan kekerapan relatif untuk tempoh kematangan pelaburan jangka pendek Hari matang
Kekerapan relatif
30 – 39
0.075 (3/40)
40 – 49
0.025 (1/40)
50 – 59
0.200 (8/40)
60 – 69
0.250 (10/40)
70 – 79
0.175 (7/40)
80 – 89
0.175 (7/40)
90 – 99
0.100 (4/40) 1.000
Apabila kita membandingkan dua set data, taburan kekerapan relatif adalah lebih baik daripada taburan kekerapan. Ini ialah kerana kekerapan relatif sentiasa dalam julat antara 0 dan 1 yang memberikan perbandingan yang standard. Dua set data akan mempunyai taburan kekerapan yang serupa jika taburan kekerapan relatif adalah serupa. Namun demikian, dua set data yang mempunyai taburan kekerapan relatif yang serupa akan hanya mempunyai taburan kekerapan yang serupa jika kedua-dua set data mengandungi jumlah bilangan data yang sama.
TERMINOLOGI DATA TERKUMPUL
Untuk memudahkan pengumpulan data dilakukan, kita mesti membiasakan diri dan memahami terma-terma yang digunakan. Kita sudah pun membincangkan beberapa terma yang digunakan.
Unit 3 Pengumpulan dan Pengurusan Data | 30
Untuk memperkenalkan terma-terma yang lain, kita rujuk kembali kepada contoh 3.4 (data tentang tempoh matang pelaburan jangka pendek). Pertimbangkan, kelas 50 – 59. Tempoh kematangan pelaburan paling pendek yang boleh dimasukkan dalam kelas ini ialah 50. Nilai ini (50) dikenali sebagai had bawah kelas kelas ini. Manakala, tempoh kematangan yang paling tinggi yang boleh dimasukkan dalam kelas ini ialah 59. Nilai ini (59) disebut sebagai had atas kelas kelas ini.
Titik tengah kelas 50 – 59 ialah (50 + 59)/2 = 54.5. Ini dikenali sebagai tanda kelas untuk kelas 50 – 59. Tanda kelas ialah satu nilai yang mewakili suatu kelas dan akan digunakan dalam graf serta penghitungan berbentuk deskriptif.
Saiz kelas 50 – 59 boleh didapati melalui beza antara had bawah kelas yang sedia ada (50) dan had bawah kelas kemudiannya (60) iaitu 10.
Untuk maklumat lebih lanjut tentang data terkumpul, boleh layari laman sesawang berikut: http://www.wyzant.com/Help/Math/Statistics_and_Probability/Introduction/Data.a spx
Unit 3 Pengumpulan dan Pengurusan Data | 31
Berikut merupakan terminologi data terkumpul.
Kelas
:
Kategori untuk data terkumpul.
Kekerapan
:
Bilangan data dalam satu kelas.
Taburan kekerapan
:
Satu jadual yang mengandungi kelas-kelas dan kekerapan-kekerapannya.
Kekerapan relatif
:
Nisbah kekerapan sesuatu kelas dengan jumlah bilangan data.
Taburan kekerapan relatif
:
Satu jadual yang mengandungi kelas-kelas dan kekerapan relatifnya.
Had bawah kelas
:
Data yang paling kecil yang boleh dimasukkan dalam kelas tersebut.
Had atas kelas
:
Data yang paling besar yang boleh dimasukkan dalam kelas tersebut.
Tanda kelas
:
Titik tengah suatu kelas.
Saiz kelas
:
Beza antara had bawah kelas yang sedia ada dan had bawah kelas kemudiannya.
Satu jadual yang mengandungi kelas, kekerapan, kekerapan relatif dan tanda kelas untuk satu set data dipanggil jadual data terkumpul. Jadual 3.4 menunjukkan satu jadual data terkumpul untuk tempoh matang pelaburan jangka pendek.
Unit 3 Pengumpulan dan Pengurusan Data | 32
Jadual 3.4 Jadual data terkumpul untuk tempoh matang pelaburan jangka pendek Tempoh matang 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99
Kekerapan (Bilangan pelaburan) 3
Kekerapan relatif
Tanda kelas
0.075
34.5
1
0.025
44.5
8
0.200
54.5
10
0.250
64.5
7
0.175
74.5
7
0.175
84.5
4
0.100
94.5
40
1.000
Contoh 3.5 Seorang doktor yang menguji tahap kolesterol para remaja telah mendapati ada di antara mereka yang mempunyai tahap kolesterol melebihi 200 mg per 100mL. Bacaan 20 orang remaja yang mempunyai tahap kolesterol yang tinggi ditunjukkan dalam jadual di bawah. Bina satu jadual data terkumpul. Guna saiz kelas, 5 dan mula pada 195.
Unit 3 Pengumpulan dan Pengurusan Data | 33
210
209
212
208
217
207
210
203
208
210
210
199
215
221
213
218
202
218
200
214
Penyelesaian: Oleh kerana kita akan menggunakan saiz kelas, 5 dan bermula pada 195, maka kelas yang pertama ialah 195 – 199. Jadual 3.4 menunjukkan kelas dan kekerapan data untuk tahap kolesterol. Jadual 3.5 Kelas dan kekerapan tahap kolesterol pelajar Tahap kolesterol
Gundal
Kekerapan
195 – 199
/
1
200 – 204
///
3
205 – 209
////
4
210 – 214
//// //
7
215 – 219
////
4
220 – 224
/
1
Daripada Jadual 3.5, kita boleh membina jadual data terkumpul seperti dalam Jadual 3.6.
Unit 3 Pengumpulan dan Pengurusan Data | 34
Jadual 3.6 Jadual data terkumpul untuk data tahap kolesterol Tahap Kolesterol
Kekerapan
Kekerapan relatif
Tanda kelas
195 – 199
1
0.05
197
200 – 204
3
0.15
202
205 – 209
4
0.20
207
210 – 214
7
0.35
212
215 – 219
4
0.20
217
220 – 224
1
0.05
222
20
1.00
Untuk mengilustrasi nilai yang didapati dalam lajur 3 dan lajur 4 dalam Jadual 3.6, kita pertimbangkan kelas 210 – 214. Kita ada Kekerapan relatif = 7 = 0.35 20 dan tanda kelas = 210 + 214 = 212 2
Unit 3 Pengumpulan dan Pengurusan Data | 35
Latihan Formatif 3.2
1. Satu syarikat pengusaha minuman ringan yang menjual “1 liter” botol air soda mendapati bahawa isi kandungan air soda dalam botol-botol yang dikeluarkan adalah tidak sama. Tiga puluh botol air soda telah dipilih secara rawak. Isi kandungan, dalam mililiter, botol-botl tersebut adalah seperti yang ditunjukkan. 1025
977
1018
975
977
990
959
957
1031 964
986
914
1010
988
1028
989
1001
984
974
1017
1060
1030
991
999
997
996
1014
946
995
987
Bina satu jadual data terkumpul untuk data minuman ringan ini. Gunakan saiz kelas yang sama dan mulakan dengan kelas 910 – 929.
2. Satu kajian telah dijalankan untuk mengumpul maklumat berkaitan dengan umur seseorang dengan penyakit diabetes. Data berikut merupakan umur 35 orang yang menghidap penyakit kencing manis.
Unit 3 Pengumpulan dan Pengurusan Data | 36
48
41
57
83
41
55
59
61
38
48
79
75
77
7
54
23
47
56
79
68
61
64
45
53
82
68
38
70
10
60
83
76
21
65
47
Bina satu jadual data terkumpul untuk data umur tersebut. Gunakan saiz kelas yang sama dan mulakan dengan kelas 0 – 9.
DATA TERKUMPUL UNTUK NILAI TUNGGAL
Setakat ini, perbincangan kita tertumpu kepada pengumpulan data yang menggunakan selang kelas untuk mewakili nilai-nilai tertentu. Sebagai contoh, Jadual 3.6, setiap kelas tahap kolesterol mewakili lima tahap kolesterol yang mungkin. Kelas yang pertama, 195 – 199 mewakili tahap-tahap 195, 196, 197, 198 dan 199; kelas yang kedua, 200 – 204 mewakili tahap-tahap 200, 201, 202, 203 dan 204; dan seterusnya.
Namun yang demikian, terdapat juga kes-kes yang mana kelas-kelas hanya diwakili oleh satu nilai tunggal sahaja. Ini selalu terjadi kepada data diskret. Pertimbangkan Contoh 3.6.
Unit 3 Pengumpulan dan Pengurusan Data | 37
Contoh 3.6
Satu kajian telah dijalankan untuk mengumpul maklumat tentang bilangan anak dalam sesebuah keluarga yang masih bersekolah di Bukit Bangsar. Jadual 3.7 menunjukkan bilangan anak yang bersekolah dalam setiap keluarga daripada 30 buah keluarga yang dipilih. Jadual 3.7 Bilangan anak yang bersekolah 0
3
0
0
3
0
2
2
0
1
2
1
0
0
1
2
4
0
4
2
1
0
1
0
0
2
0
1
3
2
a. Kumpulkan data tersebut menggunakan kelas-kelas yang mewakili nilai tunggal. b. Kenal pasti had-had kelas dan tanda kelas. c. Bina satu jadual data terkumpul.
Penyelesaian: a. Dengan menggundalkan data yang terdapat dalam Jadual 3.7, kita akan dapat kekerapan seperti dalam lajur dua Jadual 3.8. Dengan membahagikan kekerapan dengan jumlah bilangan data, 30, kita akan dapat kekerapan relatif seperti dalam lajur tiga.
Unit 3 Pengumpulan dan Pengurusan Data | 38
b. Jadual 3.8 Taburan kekerapan dan kekerapan relatif bilangan anak yang bersekolah Bilangan anak yang bersekolah
Kekerapan
Kekerapan relatif
0
12
0.400
1
6
0.200
2
7
0.233
3
3
0.100
4
2
0.067
30
1.000
b. Untuk kenal pasti had-had kelas, kita pertimbangkan kelas “3” (tiga orang anak yang bersekolah). Kita dapati bahawa: Had bawah kelas = 3 (nilai yang terkecil yang boleh dimasukkan ke dalam kelas) Had atas kelas = 3 (nilai yang terbesar yang boleh dimasukkan ke dalam kelas) dan Tanda kelas = 3 + 3 = 3 (titik tengah kelas) 2
Kesimpulannya, untuk kelas “3”, had bawah kelas, had atas kelas dan tanda kelas, semuanya bersamaan dengan 3. Ini adalah benar untuk semua kelas.
Unit 3 Pengumpulan dan Pengurusan Data | 39
c. Untuk membina satu jadual data terkumpul, kita cuma perlu menambah satu lajur lagi iaitu lajur untuk tanda kelas dalam Jadual 3.8. Namun demikian, dalam bahagian (b), kita dapati bahawa tanda kelas untuk setiap kelas adalah bersamaan dengan kelas masing-masing. Oleh itu, kita TIDAK perlu untuk menambahkan lajur tanda kelas kerana ia akan bersamaan dengan lajur pertama. Dengan kata lain, Jadual 3.8 ialah jadual data terkumpul untuk bilangan anak yang bersekolah.
Cuba fikirkan mengapa kita tidak menggunakan selang kelas untuk nilai tunggal.
Latihan Formatif 3.3
1. Bancian telah dijalankan di seluruh negara untuk mengenal pasti bilangan ahli dalam sebuah keluarga. Berikut adalah data bilangan ahli dalam sebuah keluarga untuk 40 keluarga. 2
5
2
1
1
2
3
4
1
4
4
2
1
4
3
3
7
1
2
2
3
4
2
2
6
5
2
5
1
3
2
5
2
1
3
3
2
2
3
3
Unit 3 Pengumpulan dan Pengurusan Data | 40
Bina satu jadual data terkumpul untuk bilangan ahli dalam sebuah keluarga menggunakan kelas-kelas nilai tunggal. 2. Seorang penjual kereta telah mencatatkan bilangan buah kereta yang dijual setiap minggu. Bilangan buah kereta yang dijual setiap minggu pada tahun lepas adalah seperti berikut.
1
0
3
3
1
0
2
1
4
0
4
1
2
3
6
4
3
0
2
2
1
1
2
2
2
3
5
1
0
2
5
3
1
3
1
1
1
1
2
2
3
0
4
4
1
0
1
1
3
2
5
2
Bina satu jadual data terkumpul untuk bilangan buah kereta yang dijual setiap minggu menggunakan kelas-kelas nilai tunggal.
DATA TERKUMPUL UNTUK DATA KUALITATIF
Walaupun konsep had bawah dan had atas kelas serta tanda kelas boleh diaplikasikan ke atas data kuantitatif, namun demikian konsep ini tidak bersesuaian untuk data kualitatif. Sebagai contoh, data yang mengkategorikan orang sebagai lelaki atau perempuan, kelas-kelas yang terlibat ialah “lelaki’ atau “perempuan”. Untuk kelas kualitatif begini, had kelas dan tanda kelas tidak membawa sebarang makna. Apa yang boleh kita lakukan ialah mendapatkan kekerapan dan kekerapan relatif untuk data kualitatif. Pertimbangkan contoh 3.7.
Unit 3 Pengumpulan dan Pengurusan Data | 41
Contoh 3.7 Seorang guru meminta murid-muridnya memilih sama ada rumah Biru (B), Merah (M), atau Kuning (K) yang akan muncul johan keseluruhan untuk sukan tahunan tahun ini? Respon murid-muridnya adalah seperti yang dipaparkan dalam jadual di bawah. Tentukan taburan kekerapan dan kekerapan relatif untuk data tersebut. B
M
K
M
M
M
M
M
B
K
M
B
K
K
M
B
B
M
K
B
M
M
K
M
B
K
B
B
B
M
K
B
K
M
B
M
M
M
M
B
Penyelesaian: Kelas-kelas untuk data terkumpul yang akan kita gunakan ialah “Biru”, “Merah” dan “Kuning”. Taburan kekerapan dan kekerapan relatif yang akan kita peroleh ialah seperti jadual di bawah. Rumah sukan
Kekerapan
Kekerapan relatif
Biru
13
0.325
Merah
18
0.450
Kuning
9
0.225
40
1.000
Unit 3 Pengumpulan dan Pengurusan Data | 42
Dengan membahagikan setiap kekerapan dalam lajur dua dengan jumlah bilangan pelajar, kita akan peroleh kekerapan relatif.
Cuba fikirkan apakah perbezaan taburan kekerapan nilai tunggal dan taburan kekerapan data kualitatif.
Latihan Formatif 3.4
1. Negara-negara yang menjuarai kejohanan bola sepak negara-negara Eropah sejak ia dimulakan adalah seperti senarai berikut. Tahun 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004 2008 2012
Juara USSR Sepanyol Itali Jerman Czechoslovakia Jerman Perancis Belanda Denmark Jerman Perancis Greece Sepanyol Sepanyol
Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.
Unit 3 Pengumpulan dan Pengurusan Data | 43
2. Ujian darah untuk mengenalpasti jenis darah setiap murid telah dijalankan dalam sebuah sekolah menengah. Diidapati bahawa murid-murid sekolah tersebut mempunyai darah jenis kumpulan A, B, AB, dan O. Jadual di bawah menunjukkan kumpulan darah 30 orang murid yang dipilh secara rawak. A
A
O
O
AB
B
B
B
B
AB
A
A
O
O
AB
AB
AB
AB
A
B
O
O
AB
O
B
A
O
B
AB
AB
Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.
RUMUSAN Secara keseluruhannya, kita telah didedahkan dengan apa itu pembolehubah kuantitatif dan kualitatif. Apa yang lebih penting, kita sudah pun mengenali dengan lebih mendalam tentang data kuantitatif dan data kualitatif. Diharapkan penerangan dan contoh-contoh dalam unit ini telah dapat membantu kita untuk memahami apa itu data diskret dan data selanjar. Secara ringkasnya, data diskret ialah data yang cuma boleh mengambil nilai tetap atau nilai tepat sahaja (dalam bahasa mudah: yang boleh dibilang dan yang ambil nilai nombor bulat). Data selanjar pula ialah data yang hanya boleh diberi nilai dalam suatu julat dan tidak boleh mengambil satu nilai tunggal atau satu
Unit 3 Pengumpulan dan Pengurusan Data | 44
nilai tepat (dalam bahasa mudah: boleh ambil nilai perpuluhan). Disamping itu, kita juga ada data kualitatif yang mana data jenis ini merupakan angka-angka atau skor-skor yang tidak mempunyai nilai kuantiti (contohnya: jantina, warna mata, dan lain-lain).
Perbincangan kita juga menjurus kepada tatacara pengumpulan data yang melibatkan data terkumpul untuk skor yang biasa (yang melibatkan selang kelas), nilai tunggal dan kualitatif. Kita telah didedahkan dengan dua jenis taburan: taburan kekerapan dan taburan kekerapan relatif. Diharapkan agar kita telah berjaya menguasai unit ini dengan jayanya. Unit yang seterusnya akan membincangkan tentang miskonsepsi dalam pengumpulan dan pengurusan data.
KATA KUNCI
Pembolehubah kuantitatif, pembolehubah kualitatif, pembolehubah diskret, pembolehubah selanjar, data kuantitatif, data kualitatif, data diskret, data selanjar, taburan kekerapan, taburan kekerapan relatif.
Unit 3 Pengumpulan dan Pengurusan Data | 45
Latihan Sumatif 1. Berikan satu sebab mengapa mengklasifikasi data adalah penting? (Ia boleh membantu dalam memilih kaedah statistik yang betul).
2. Berikut merupakan lima sungai yang terpanjang dalam dunia. Kedudukan
Sungai
Panjang (km)
1
Nil
6650
2
Amazon
6400
3
Yangtze
6300
4
Mississipi
6275
5
Yenisei-Angara-Selanga
5539
a. Apakah jenis data yang diberikan dalam lajur pertama jadual di atas? (data kuantitatif: data diskret, pembolehubah – kedudukan) b. Apakah jenis data yang diperoleh daripada maklumat “Sungai Nil ialah sungai yang terpanjang dalam dunia.”? (Data kuantitatif: data diskret, pembolehubah – kedudukan) c. Apakah jenis data yang diberikan dalam lajur ketiga dalam jadual di atas? (Data kuantitatif: data selanjar, pembolehubah – panjang)
Unit 3 Pengumpulan dan Pengurusan Data | 46
3. Satu kajian telah dijalankan ke atas pelancong-pelancong dari luar negara tentang tempoh tinggal semasa melancong ke Malaysia. Jadual berikut menunjukkan data tempoh tinggal 36 orang pelancong yang dipilih secara rawak, dalam hari. 41
16
6
21
1
21
5
31
20
27
17 10
3
32
2
48
8
12
21
44
1
56
5
12
3
13
15
10
18
3
1
11
14
12
64 10
Bina satu jadual data terkumpul untuk data tempoh tinggal tersebut. Gunakan saiz kelas yang sama dan mulakan dengan kelas 1 – 7.
4. Satu ujian kecerdasan telah dijalankan ke atas 50 orang kanak-kanak Tahun Satu di sebuah sekolah. Berikut merupakan data skor yang diperoleh kanak-kanak tersebut. 100
92
96
91
81
110
70
119 94
88
104
83
115 97
73
108
93
116 86
98
89
123
78 108 127
91 114
95
105
63 112 102
117 106 126
94 124
92
99
76 105 90
81 109 116
96 107
84 101 121
Unit 3 Pengumpulan dan Pengurusan Data | 47
Bina satu jadual data terkumpul untuk data skor tersebut. Gunakan saiz kelas yang bersesuaian.
5. 25 orang murid Tahun Lima telah diminta untuk menjawab satu kuiz yang mengandungi lapan soalan tentang tajuk Pecahan. Bilangan soalan yang gagal dijawab dengan betul oleh setiap murid adalah seperti yang ditunjukkan. 3
4
2
3
1
1
1
6
1
2
0
5
1
2
1
0
3
4
0
3
2
0
3
1
1
Bina satu jadual data terkumpul untuk bilangan soalan yang gagal dijawab oleh murid-murid Tahun Lima menggunakan kelas-kelas nilai tunggal.
Unit 3 Pengumpulan dan Pengurusan Data | 48
6. Sebuah bank mempunyai 80 orang pekerja. Ketidakhadiran setiap pekerja, dalam hari yang dicatatkan tahun lalu adalah seperti berikut.
2
3
6
2
6
5
5
2
4
7
5
3
6
4
4
4
2
2
4
5
4
0
2
1
6
3
5
3
6
6
4
7
5
2
5
0
5
6
5
2
4
2
6
2
4
3
5
4
2
4
4
3
3
4
0
5
6
3
5
5
2
4
4
2
0
7
5
5
7
6
1
5
3
3
4
7
7
2
5
5
Bina satu jadual data terkumpul untuk data ketidakhadiran pekerja, dalam hari menggunakan kelas-kelas nilai tunggal.
7. Tiga unit beruniform telah ditubuhkan dalam sebuah sekolah rendah: Pengakap Kanakkanak (PK), Persatuan Bulan Sabit Merah (PBSM), Kadet Remaja Sekolah (KRS). Setiap murid adalah diwajibkan untuk mengganggotai salah satu daripada unit beruniform tersebut. Jadual di bawah menunjukkan keanggotaan unit beruniform 40 orang murid yang dipilih secara rawak.
Unit 3 Pengumpulan dan Pengurusan Data | 49
PK
PBSM
KRS
PBSM
PBSM
PBSM
PBSM
PBSM
PK
KRS
PBSM
PK
KRS
KRS
PBSM
PK
PK
PBSM
KRS
PK
PBSM
PBSM
KRS
PBSM
PK
KRS
PK
PK
PK
PBSM
KRS
PK
KRS
PBSM
PK
PBSM
PBSM
PBSM
PBSM
PK
Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.
8. Pada pengajian semester yang lepas, pelajar-pelajar Program Pendidikan Matematik telah memilih untuk mengikuti salah satu daripada kursus-kursus berikut: Kalkulus Permulaan (K), Pengenalan Statistik (S) dan Linear Algebra (A). Berikut merupakan pilihan kursus 40 orang pelajar yang dipilih secara rawak.
A
K
K
A
S
A
S
K
S
S
A
K
A
A
K
K
S
A
S
A
K
S
S
K
A
A
A
K
S
A
A
K
K
A
S
S
K
K
S
S
Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.
Unit 3 Pengumpulan dan Pengurusan Data | 50
Rujukan
Dunn, S.D. (2001). Statistic and data analysis for the behavioral sciences. New York: McGraw-Hill. Haylock, D. (2010). Mathematics Explained For Primary Teachers (4th Ed.). London: Sage Publications Howitt, D., & Cramer, D. (2000). An introduction to statistics in psychology: A complete guide for students. (2nd Ed.). Harlow, England: Prentice Hall. Iran Herman.(2004). Statistik dan analisis data sains sosial. Alor Star: Percetakan Ustaras Sdn.Bhd. Kennedy, L. M, & Tipps, S. (2011).Guiding Children’s Learning of Mathematics.(12th Ed.). Bermont: Wadsworth.
Weiss, N. A. (2005). Introductory Statistics (7th Ed.). Boston: Pearson & Addison Wesley. Utts, J. M., & Heckard, R. F.(2004). Mind on Statistics (2nd Ed.). Belmont, CA: Thomson Learning. http://www.epcae.org/uploads/documents/Central_Tendency_pck_SEP20.pdf
Unit 3 Pengumpulan dan Pengurusan Data | 51
Jawapan Latihan Formatif 3.1 1. (a) data kuantitatif: data diskret; pembolehubah – kedudukan (b) data kualitatif; pembolehubah – bahasa (c) data kuantitatif: data diskret; pembolehubah – pengguna 2. (a) data kuantitatif: data selanjar; pembolehubah – keluasan tanah (b) data kuantitatif: data diskret; pembolehubah – pangkat/kedudukan keluasan tanah dan populasi (c) data kuatitaif: data diskret; pembolehubah – populasi (d) data kualitatif; pembolehubah – benua dia dilahirkan
Latihan Formatif 3.2 1. Kandungan
Kekerapan
Kekerapan relatif
Tanda kelas
910 – 929
1
0.033
919.5
930 – 949
1
0.033
939.5
950 – 969
3
0.100
959.5
970 – 989
9
0.300
979.5
990 – 1009
7
0.233
999.5
1010 – 1029
6
0.200
1019.5
1030 – 1049
2
0.067
1039.5
1050 - 1069
1
0.033
1059.5
30
0.999
Unit 3 Pengumpulan dan Pengurusan Data | 52
2. Umur
Kekerapan
Kekerapan relatif
Tanda kelas
0–9
1
0.029
4.5
10 – 19
1
0.029
14.5
20 – 29
2
0.057
24.5
30 – 39
2
0.057
34.5
40 – 49
7
0.200
44.5
50 – 59
6
0.171
54.5
60 – 69
7
0.200
64.5
70 – 79
6
0.171
74.5
80 – 89
3
0.086
84.5
35
1.000
Latihan Formatif 3.3 1. Bilangan ahli
Kekerapan
Kekerapan relatif
1
7
0.175
2
13
0.325
3
9
0.225
4
5
0.125
5
4
0.100
6
1
0.025
7
1
0.025
40
1.000
Unit 3 Pengumpulan dan Pengurusan Data | 53
2. Bilangan buah kereta
Kekerapan
Kekerapan relatif
0
7
0.135
1
15
0.288
2
12
0.231
3
9
0.173
4
5
0.096
5
3
0.058
6
1
0.019
52
1.000
Juara
Kekerapan
Kekerapan relatif
Sepanyol
3
0.214
Jerman
3
0.214
Itali
1
0.071
Perancis
2
0.143
Denmark
1
0.071
Belanda
1
0.071
Greece
1
0.071
USSR
1
0.071
Czechoslovakia
1
0.071
14
0.997
Latihan Formatif 3.4 1.
Unit 3 Pengumpulan dan Pengurusan Data | 54
2. Kumpulan darah
Kekerapan
Kekerapan relatif
A
6
0.200
B
7
0.233
O
8
0.267
AB
9
0.300
30
1.000
Unit 3 Pengumpulan dan Pengurusan Data | 55
Latihan Sumatif 1. Mengklasifikasi data adalah penting kerana ia boleh membantu dalam memilih kaedah statistik yang betul.
2. (a) data kuantitatif: data diskret; pembolehubah – kedudukan (b) data kuantitatif: data diskret; pembolehubah – kedudukan (c) data kuantitatif: data selanjar; pembolehubah – panjang
3. Tempoh tinggal
Kekerapan
Kekerapan relatif
Tanda kelas
1–7
10
0.278
4
8 – 14
10
0.278
11
15 – 21
8
0.222
18
22 – 28
1
0.028
25
29 – 35
2
0.056
32
36 – 42
1
0.028
39
43 – 49
2
0.056
46
50 – 56
1
0.028
53
57 – 64
1
0.028
60
36
1.000
(Hari)
Unit 3 Pengumpulan dan Pengurusan Data | 56
4. Skor
Kekerapan
Kekerapan relatif
Tanda kelas
60 – 69
1
0.020
64.5
70 – 79
4
0.080
74.5
80 – 89
7
0.140
84.5
90 – 99
14
0.280
94.5
100 – 109
11
0.220
104.5
110 – 119
8
0.160
114.5
120 - 129
5
0.100
124.5
50
1.000
5. Bilangan soalan yang gagal dijawab 0 1 2 3 4 5 6
Kekerapan
Kekerapan relatif
4 8 4 5 2 1 1 25
0.160 0.320 0.160 0.200 0.080 0.040 0.040 1.000
Unit 3 Pengumpulan dan Pengurusan Data | 57
6. Ketidakhadiran bekerja (Hari)
Kekerapan
Kekerapan relatif
0
4
0.050
1
2
0.025
2
14
0.175
3
10
0.125
4
16
0.200
5
18
0.225
6
10
0.125
7
6
0.075
80
1.000
7. Unit Beruniform
Kekerapan
Kekerapan relatif
Pengakap Kanak-kanak
13
0.325
Persatuan Bulan Sabit Merah
18
0.450
Kadet Remaja Sekolah
9
0.225
40
1.000
Kursus
Kekerapan
Kekerapan relatif
Kalkulus Permulaan
13
0.325
Pengenalan Statistik
13
0.325
Linear Algebra
14
0.350
40
1.000
8.