UJI KAI KUADRAT (CHI SQUARE)
A. PENDAHULUAN
Uji
“t” walaupun popular an dipergunakan secara luas, kadang-kadang tidak relevan
digunakan pada permasalahan kesehatan tertentu yang memerlukan pengujian
kemaknaan. Hal ini biasanya disebabkan data yang akan di uji merupakan data
kualitatif yang didapat dari hasil mencacah jumlah pengamatan yang
diklasifikasikan atas beberapa kategori. Hasil mencacah (menghitung) ini
disebut juga data kategori (categorical data). Untuk analisis yang berbentuk
data kategorik, uji yang tepat digunakan adalah uji beda proporsi. Misalnya,
dari suatu pengamatan terhadap kebiasaan merokok sejumlah orang didapatkan
kategori (kelompok) tidak perokok, perokok ringan, dan perokok berat (tiga
kategori). Disamping mengamati kebiasaan merokok, mungkin saja juga diamati
nilai tekanan darahnya yang setelah diukur dikategorikan lagi menjadi
normotensi dan hipertensi. Apabila pengamatan diatas disusun dalam suatu
table,table tersebut dinamakan kontingensi (table silang). Dari data tersebut
dapat dilakukan uji “chi square” untuk melihat ada tidaknya asosiasi antara dua
sifat tadi (variable kebiasaan merokok dan variable tekanan darah).
B. DASAR-DASAR
UJI KAI KUADRAT
Dasar
dari uji kai kuadrat adalah membandingkan frekuensi yang diamati dengan
frekuensi yang diharapkkan. Misalnya, sebuah uang logam yang memiliki dua
permukaan, yaitu M dan B, dilambungkan seratus kali, kita amati yang keluar
permukaan B sebanyak 60 kali. Kalau uang logam tersebut seimbang, tentu
permukaan B diharapkan keluar sebanyak 50 kali. Maka, sebetulnya disini kita
melihat perbedaan antara frekuensi yang diamati (observed = O) yakni 60 kali
dan yang diharapkan (expected = E) yakni 50 kali. Jadi, ada perbedaan antara
pengamatan dengan yang diharapkan (O-E), apakah perbedaan itu cukup berarti
(bermakna) atau hanya karena factor variasi sampel.
Percobaan melambungkan mata uang tersebut dapat dilihat
dalam table dibawah ini.
(1)
|
(2)
|
(3)
|
(4)
|
(5)
|
|
O(observed)
|
E(expected)
|
O-E
|
(O-E)2
|
(O-E)2
E
|
|
M
|
40
|
50
|
10
|
100
|
2
|
B
|
60
|
50
|
10
|
100
|
2
|
Total
|
100
|
100
|
0
|
200
|
4
|
Pada
table diatas dapat dilihat bahwa jika penyimpangan/deviasi (O-E) dijumlahkan
(lihat kolom 3), hasilnya adalah 0 (nol). Untuk menghindari hal ini,
masing-massing penyimpangan dikuadratkan terlebih dahulu, seperti terlihat pada
kolom (4), jumlah akan tidak sama dengan nol lagi. Pendekatan ini akan
menimbulkan persoalan baru dimana hasil kuadrat yang sama akan diperoleh untuk
penyimpangan yang sama besar tanpa memperhitungkan besar frekuensi pengamatan
atau harapan. Misalnya, O-E untuk 60-50 = 10 dan 510-500 = 10 secara aritmatik
adalah identik, tetapi arti sebenarnya sangat berbeda. Penyimpangan 10 dari
harga harapan 50 cukup besar bila dibandingkan dengan penyimpangan 10 dari
nilai harapan 500. Untuk mengatasi hal ini, sebaiknya digunakan deviasi kuadrat
yang proporsional, yaitu (O-E)2/E. Dengan cara ini hasil perhitungan
untuk contoh di atas menjadi (60-50)2/50 = 2, sedangkan (510-500)2/500
= 0,2.
Tampak
bahwa deviasi baru ini lebih berarti secara statistic. Untuk persoalan
pelambungan mata uang diatas pada kolom (5) table diatas dapat dilihat bahwa
jumlah deviasi kuadrat proporsioanal adalah 4.
Pertanyaan
berikutnya ialah apakah harga yang telah dihitung = 4 memiliki kemungkinan
besar untuk terjadi secara kebetulan ataukah merupakan peristiwa yang jarang
terjadi, misalnya kemungkinannya lebih kecil daripada 5%. Untuk menjawab
pertanyaan ini perlu diketahui distribusi kuantitas X2 (chi square =
kai kuadrat), yakni distribusi probabilitas untuk statistic :
X2 = Ʃ
(O-E)2
E
Para
ahli statistic telah membuktikan bahwa kuantitas ini mempunyai kemencengan
positif. Dengan menghitung luas daerah di luar harga 4 pada distribusi kai
kuadrat, dapat ditentukan harga “p” serta keputusan untuk menolak hipotesis nol
atau gagal menolak hipotesis nol.
Sebenarnya
ada suatu keluarga distribusi kai kaudrat, anggota mana yang tepat untuk
digunakan, sebagaimana pada distribusi “t” tergantung pada “derajat bebas
(degree of freedom = df)”. Derajat bebas adalah banyaknya kategori dikurangi
satu. Seperti contoh diatas, kategorinya ada dua (permukaan M dan B), maka
derajat bebas adalah 2-1 = 1. Kalau yang dilambungkan adalah dadu, kategorinya
ada enam, derajat bebasnya 6-1 = 5. Kalau didalam suatu kontingensi table ada
beberapa baris dan kolom, derajat bebasnya adalah baris dikurangi satu dikali
kolom dikurangi satu.
Rumusnya adalah sebagai berikut.
df =
(b-1) (k-1)
contoh
tidak
perokok perokok ringan perokok berat
normotensi
hipertensi
pada
table diatas kolom ada 3 dan baris ada 2
df
= (3-1) (2-1) = 2
dalam
gambar diatas dapat dilihat bentuk beberapa distribusi kai kuadrat.
Untuk setiap distribusi luas 5%
terkanan (paling kanan) adalah daerah yang diarsir. Perhatikan bahwa semakin
besar derajat bebas, semakin besar pula harga kritis yang diperlukan untuk
menolak hipotesis nol. Secara intuisi, hal ini tampaknya benar karena derajat
bebas sebanding dengan jumlah kategori yang independen/saling bebas. Dapat
diharapkan bahwa dengan semakin baiknya kategori, akan semakin besar pula harga
kai kuadrat kritis.
Kembali pada
pertanyaan semula “apakah mata uang logam yang dilambungkan tadi seimbang ?”
jumlah X2-nya adalah 4, untuk df 1 harga ini terletak dalam daerah
kritis 5%, karena itu Ho ditolak. Kesimpulannya adalah mata uang tersebut tidak
seimbang. Suatu hal yang perlu diperhatikan adalah bahwa tidak seperti uji
lain, kai kuadrat selalu merupakan uji satu sisi.
A. TIPE UJI KAI KUADRAT
Dalam
penerapan praktis, sering dijumpai berbagai persoalan mencakup dua variable.
Secara spesifik, uji kai kuadrat dapat digunakan untuk menentukan :
a.
ada tidaknya asosiasi antara dua variable (independency
test)
b.
apakah suatu kelompok homogeny (homogenitas antar-subkelompok = homogeneity test)
c.
seberapa jauh suatu pengamatan sesuai dengan parameter yang dispesifikasikan (goodness of fit)
1.
Uji independensi
Pada
tahun 1981 kuzma & Kissinger melakukan suatu studi melihat hubungan
penggunaan alcohol dan rokok pada ibu selama kehamilan (studi terhadap 11.127
wanita hamil). Status alcohol dari ibu hamil dikategorikan didalam empat
kelompok (tidak minum, peminum ringan, sedang, dan berat). Adapun status rokok
dikategorikan menjadi dua kelompok (perokok dan tidak perokok), seperti
terlihat pada table dibawah ini.
Status
perokok
|
Konsumsi
alkohol
|
||||
Tidak
minum
|
Peminum
ringan
|
p.sedang
|
p.berat
|
total
|
|
perokok
|
1880(30,5%)
|
2048(45,7%)
|
194(53,0%)
|
76(67,3%)
|
4.198(37,7%)
|
Tidak
perokok
|
4290(69,5%)
|
2430(54,3%)
|
172(47,0%)
|
37(32,7%)
|
6.929(62,3%)
|
total
|
6170(55,5%)
|
4478(40,2%)
|
366(3,3%)
|
113(1,0%)
|
11.127(100%)
|
Tampak
bahwa 30,5% wanita hamil yang tidak peminum dan 67,3% peminum berat adalah
merokok selama kehamilan. Akan terpikir apakah variable minum alcohol ini berhubungan dengan variable kebiasaan
merokok ? untuk menjawab permasalahan ini akan diuji hipotesis nol yang
menyatakan tidak ada hubungan antara kebiasaan merokok dengan kebiasaan minum
alcohol selama kehamilan. Untuk menghitung nilai X2 dari data pada
table diatas sesuai dengan rumus :
X2 = Ʃ
(O-E)2
E
Dibutuhkan nilai harapan dari
masing-masing sel.
Untuk
diskusi ini digunakan notasi khusus dimana kedelapan sel untuk table diatas
dinyatakan sebagai E11, sampai E24 terlihat sebagai table berikut.
Status
perokok
|
Konsumsi
alkohol
|
||||
Tidak
minum
|
Peminum
ringan
|
p.sedang
|
p.berat
|
total
|
|
perokok
|
E11
|
E12
|
E13
|
E14
|
Tp
|
Tidak
perokok
|
E21
|
E23
|
E23
|
E24
|
TTP
|
total
|
TTM
|
TPR
|
TPS
|
TPB
|
Total perokok
adalah Tp probabilitas
perokok Tp/T
Total
tidak minum adalah TTM probabilitas
tidak minum TTM/T
Probabilitas
perokok dan tidak minum (Tp/T XTTM/T)….> hukum
perkalian untuk kejadian yang independen ….> = Tp X TTM
T2
Dengan ini nilai expected untuk sel E11
adalah : Tp X TTM
X T = Tp X TTM
T2 T
Jadi
dari hasil jabaran diatas dapat secara ringkas dikatakan :
Nilai expected setiap sel adalah
subtotal baris dikali subtotal kolom dibagi total general.
Contoh : nilai E11 (4.198 x
6.170) / 11.127 = 2327,8
E 12 (4.198 x 4.478) /
11.127 = 1689,4
E24 (6.929 x 113) / 11.127 =
70,4
Hasil
keseluruhan nilai expected (harapan) dapat dilihat pada table berikut.
Status
perokok
|
Konsumsi
alkohol
|
||||
Tidak
minum
|
Peminum
ringan
|
p.sedang
|
p.berat
|
total
|
|
perokok
|
2.327,8
|
1.689,4
|
138,1
|
42,6
|
4.198
|
Tidak
perokok
|
3.842,2
|
2788,6
|
227,9
|
70,4
|
6.929
|
Total
|
6.170
|
4.478
|
366
|
113
|
11.127
|
Catatan
: df = 3 berarti juga bahwa dari delapan sel yang ada hanya tiga sel kita yang
bebas menentukan nilai expected (harapan) dengan rumus diatas, sedangkan sel
yang lainnya dapat dengan mengurangi nilai E yang sudah ada dengan jumlah kolom
atau jumlah baris.
Walaupun tampaknya tidak masuk akal
adanya jumlah orang pada nilai harapan dalm decimal (pecahan), hal ini sering
dikerjakan untuk menghindari kesalahan pembulatan dan menjamin jumlah baris
“harapan” dan “pengamatan” tetap sama (identik).
Sekarang sudah dapat dihitung harga
statistic X2 (kai kuadrat) yaitu :
X2 = (1880 – 2327,8)2
+ (2048 – 1689,4)2 + (194 – 138,1)1 + (76 – 42,7)2 +
(4290 – 3842,2)2 +
2327,8 1689,4 138,1 42,7 3842,2
(2430 –
2788,5)2 + (172 – 227,9)2 + (137 – 70,4)2 =
338,7
2788,5 227,9 70,4
Apakah
harga X2 sebesar 338,7 bermakna ? untuk itu ditentukan dengan
mencocokkan pada table distribusi kai kuadrat derajat bebas adalah (df) = (4-1)
(2-1) = 3 …..> p < 0,001
Kesimpulan Ho ditolak …> ada
hubungan antara kebiasaan minum alcohol ibu selama kehamilan dengan kebiasaan
merokok.
2. Uji
homogenitas
Sering kali perlu ditentukan apakah
distribusi suatu karakteristik tertentu sama untuk berbagai kelompok. Misalnya
ada dua sampel random yang terdiri
dari 100 orang laki-laki dan sampel kedua 100 orang wanita. Kepada mereka
ditanyakan apakah mereka setuju atau tidak atas pernyataan “kesetaraan” antara
wanita dan pria. Hasil telah disusun didalam table silang dibawah ini.
Sikap
jenis
|
setuju
|
Tidak setuju
|
Ukuran sampel
|
pria
|
30
|
70
|
100
|
Wanita
|
45
|
55
|
100
|
Jumlah
|
75
|
135
|
200
|
Langkah pengujian sebetulnya tidak
berbeda dengan uji independensi dimana langkah-langkah ujinya sebagai berikut.
a) Tidak
ada perbedaan sikap setuju/tidak setuju terhadap “kesetaraan pria-wanita”
antara wanita dan pria
b) Tentukan
batas kritis α
=(misalnya 0,05) !
c) Df
…. > (2-1) (2-1) = 1
d) Besarnya statistic uji dengan X2
= Ʃ (O-E)2
E
Untuk
permasalahan diatas didapatkan nilai X2 adalah
(30 – 37,5)2 + (70 – 62,5)2
+ (45 – 37,5)2 + (55 – 62,5)2 = 4,8
37,5 62,5 37,5 62,5
e) Untuk
nilai X2 = 4,8 dan df = 1 didapatkan nilai p = < 0,05
table (10.8)
table (10.8)
f)
Kesimpulan
Ho ditolak …..> ada perbedaan sikap antara pria dan wanita mengenai
pernyataan “kesetaraan antara pria dan wanita”.
Penerapan lain dari uji X2
ini adalah perbedaan antara dua proporsi, untuk mempelajari apakah proporsi
sukses dalam kelompok perlakuan berbeda secara bermakna dengan proporsi sukses
dalam kelompok control.
Contoh :
selama bertahun-tahun telah ada
perbedaan pendapat medis tentang manfaat vitamin C dalam “pencegahan
influenza.” Beberapa studi menyimpulkan bahwa vitamin C tidak bermanfaat. Suatu
studi dilakukan dengan membandingkan antara kelompok yang diberikan vitamin C
dan kelompok placebo. Hasilnya seperti table dibawah ini.
Table 1.7 jumlah anak menurut kelompok dan status kesehatannya
status
|
Vit C
|
plasebo
|
total
|
Menderita flu
|
36 (63%)
|
35 (76%)
|
32
|
Anak yang tidak flu
|
21 (37%)
|
11 (24%)
|
71
|
total
|
57 (100%)
|
46 (100%)
|
103
|
Tampak bahwa 63% anak-anak yang
diberikan vitamin C dan 76% dari kelompok placebo terserang influenza. Apakah
yang terserang flu berbeda antara dua kelompok ini ? dari hasil uji kai kuadrat
didapatkan = 0,05 , maka Ho tidak dapat ditolak. Jadi, kesimpulan uji adalah
perbedaan proporsi ini bisa saja terjadi karena factor sampel.
3.
Uji goodness of fit
Uji
ini berfungsi untuk melihat kesesuaian suatu pengamatan dengan suatu distribusi
tertentu. Hipotesis lain yang dapat diselidiki dengan uji kai kuadrat adalah
penetuan apakah suatu himpunan data sesuai (fit) dengan model tertentu,
misalnya hendak diketahui apakah data yang kita miliki sesuai dengan distribusi
normal atau apakah distribusi golongan darah sesuai/konsisten dengan suatu
standar yang telah ditentukan sebelumnya. Untuk menguji permasalahan ini,
seperti juga permasalahan-permasalahan pada tes homogenitas maupun tes
independensi, selalu dicari freekuensi harpan dari data yang dipunyai,
selanjutnya dihitung nilai statistic X2, dan ditentukan kemaknaannya
sebagai contoh-contoh diatas.
Untuk
table yang terdiri dari banyak sel, maka untuk mempercepat perhitungan dapat
digunakan perhitungan :
X2 = Ʃ
O2 - N
E
Dimana
N adalah total frekuensi keseluruhan pengamatan
Table kontingensi 2 x 2
Agaknya
analisis kai kuadrat yang tersering digunakan dalam penelitian kesehatan adalah
yang menyajikan data dalam bentuk table 2x2 (four fold table) yakni dua
kelompok dan dua kemungkinan respons seperti table 1.8
Bentuk
umum dari table 2x2 adalah sebagai berikut
Table
1.8 bentuk umum table 2x2
kelompok
respons
|
kasus
|
Control
|
jumlah
|
Ada
(+)
|
a
|
b
|
a+b
|
Tidak
(-)
|
c
|
d
|
c+d
|
Jumlah
|
a+c
|
b+d
|
a+b+c+d
|
(N)
|
Dengan
data sedemikian, maka nilai statistic kai kuadrat dapat dicari tanpa menghitung
frekuensi harapan dengan rumus :
X2 = N (ad – bc)2_
(a+c) (b+d) (a+d) (c+d)
Persamaan
ini kalau dipakaikan untuk mencari nilai kai kaudrat pada permasalahan dalam
table 1.8, akan didapatkan hasil yang sama untuk nilai X2.
X2
= 200 (30 x 55 – 70 x 45)2 = 4,8
75 x 125 x 100 x 100
Keterbatasan penggunaan uji kai kuadrat
Telah
dinyatakan bahwa teknik uji kai kuadrat adalah memakai data yang diskrit dengan
pendekatan distribusi kontinu. Dekatnya pendekatan yang dihasilkan tergantung
pada ukuran dalam berbagai sel dari table kontingensi. Untuk menjamin
pendekatan yang memadai digunakan aturan dasar : frekuensi harapan tidak boleh terlalu kecil. Secara umum
ketentuannya sebagai berikut.
Uji
X2 dapat digunakan dengan syarat :
1.
Jumlah sampel > 40
2.
jumlah sampel antara 20-40 dan tidak ada sel yang nilai E-nya <5
Uji
X2 tidak dapat digunakan dengan syarat :
1.
Jumlah sampel < 20
2.
jumlah sampel 20-40 dan ada sel yang nilai E-nya kurang dari 5, lebih di 20%
total selnya.
Kalau
hal ini ditemui didalam suatu table kontingensi,teknik ini dianggap dapat
menanggulangi permasalahan adalah menggabungkan nilai dari sel yang kecil
dengan sel lainnya (meng-collaps). Artinya, kategori dari variable dikurangi
sehingga kategori yang nilai harapannya kecil dapat digabung ke kategori yang
nilai harapannya kecil dapat digabung ke kategori lain. Untuk table 2x2, hal
ini tidak dapat dilakukan, maka solusinya adalah melakukan uji “fisher exact”.
Uji fisher exact, dengan formula :
p = (a+b) ! (c+d) ! ( a+c) ! (b+d) !
p = (a+b) ! (c+d) ! ( a+c) ! (b+d) !
a
! b ! c ! d ! n !
--------------------------------------------------------------------------------------------------------------------
DELIMA
AGUSTINA, DESTRY
KURNIATI, EDDY
RUSDI ARAS, EKA
RAHIMA RAHMAN, EVA
NURDIANA, FADIAH, FARID
DERMAWAN, FITRIA
ANGGRAINI, GINDA
BRANPOMPI M, IMELDA ROHANI LUBIS
Tidak ada komentar:
Posting Komentar