Kamis, 28 Juni 2012

uji kai kuadrat


UJI KAI KUADRAT (CHI SQUARE)
                 
      A.  PENDAHULUAN
Uji “t” walaupun popular an dipergunakan secara luas, kadang-kadang tidak relevan digunakan pada permasalahan kesehatan tertentu yang memerlukan pengujian kemaknaan. Hal ini biasanya disebabkan data yang akan di uji merupakan data kualitatif yang didapat dari hasil mencacah jumlah pengamatan yang diklasifikasikan atas beberapa kategori. Hasil mencacah (menghitung) ini disebut juga data kategori (categorical data). Untuk analisis yang berbentuk data kategorik, uji yang tepat digunakan adalah uji beda proporsi. Misalnya, dari suatu pengamatan terhadap kebiasaan merokok sejumlah orang didapatkan kategori (kelompok) tidak perokok, perokok ringan, dan perokok berat (tiga kategori). Disamping mengamati kebiasaan merokok, mungkin saja juga diamati nilai tekanan darahnya yang setelah diukur dikategorikan lagi menjadi normotensi dan hipertensi. Apabila pengamatan diatas disusun dalam suatu table,table tersebut dinamakan kontingensi (table silang). Dari data tersebut dapat dilakukan uji “chi square” untuk melihat ada tidaknya asosiasi antara dua sifat tadi (variable kebiasaan merokok dan variable tekanan darah).

      B.   DASAR-DASAR UJI KAI KUADRAT
Dasar dari uji kai kuadrat adalah membandingkan frekuensi yang diamati dengan frekuensi yang diharapkkan. Misalnya, sebuah uang logam yang memiliki dua permukaan, yaitu M dan B, dilambungkan seratus kali, kita amati yang keluar permukaan B sebanyak 60 kali. Kalau uang logam tersebut seimbang, tentu permukaan B diharapkan keluar sebanyak 50 kali. Maka, sebetulnya disini kita melihat perbedaan antara frekuensi yang diamati (observed = O) yakni 60 kali dan yang diharapkan (expected = E) yakni 50 kali. Jadi, ada perbedaan antara pengamatan dengan yang diharapkan (O-E), apakah perbedaan itu cukup berarti (bermakna) atau hanya karena factor variasi sampel.

Percobaan melambungkan mata uang tersebut dapat dilihat dalam table dibawah ini.

(1)
(2)
(3)
(4)
(5)

O(observed)
E(expected)
O-E
(O-E)2
(O-E)2
E
M
40
50
10
100
2
B
60
50
10
100
2
Total
100
100
0
200
4

Pada table diatas dapat dilihat bahwa jika penyimpangan/deviasi (O-E) dijumlahkan (lihat kolom 3), hasilnya adalah 0 (nol). Untuk menghindari hal ini, masing-massing penyimpangan dikuadratkan terlebih dahulu, seperti terlihat pada kolom (4), jumlah akan tidak sama dengan nol lagi. Pendekatan ini akan menimbulkan persoalan baru dimana hasil kuadrat yang sama akan diperoleh untuk penyimpangan yang sama besar tanpa memperhitungkan besar frekuensi pengamatan atau harapan. Misalnya, O-E untuk 60-50 = 10 dan 510-500 = 10 secara aritmatik adalah identik, tetapi arti sebenarnya sangat berbeda. Penyimpangan 10 dari harga harapan 50 cukup besar bila dibandingkan dengan penyimpangan 10 dari nilai harapan 500. Untuk mengatasi hal ini, sebaiknya digunakan deviasi kuadrat yang proporsional, yaitu (O-E)2/E. Dengan cara ini hasil perhitungan untuk contoh di atas menjadi (60-50)2/50 = 2, sedangkan (510-500)2/500 = 0,2.
Tampak bahwa deviasi baru ini lebih berarti secara statistic. Untuk persoalan pelambungan mata uang diatas pada kolom (5) table diatas dapat dilihat bahwa jumlah deviasi kuadrat proporsioanal adalah 4.
Pertanyaan berikutnya ialah apakah harga yang telah dihitung = 4 memiliki kemungkinan besar untuk terjadi secara kebetulan ataukah merupakan peristiwa yang jarang terjadi, misalnya kemungkinannya lebih kecil daripada 5%. Untuk menjawab pertanyaan ini perlu diketahui distribusi kuantitas X2 (chi square = kai kuadrat), yakni distribusi probabilitas untuk statistic :
X2 = Ʃ (O-E)2
          E

Para ahli statistic telah membuktikan bahwa kuantitas ini mempunyai kemencengan positif. Dengan menghitung luas daerah di luar harga 4 pada distribusi kai kuadrat, dapat ditentukan harga “p” serta keputusan untuk menolak hipotesis nol atau gagal menolak hipotesis nol.
Sebenarnya ada suatu keluarga distribusi kai kaudrat, anggota mana yang tepat untuk digunakan, sebagaimana pada distribusi “t” tergantung pada “derajat bebas (degree of freedom = df)”. Derajat bebas adalah banyaknya kategori dikurangi satu. Seperti contoh diatas, kategorinya ada dua (permukaan M dan B), maka derajat bebas adalah 2-1 = 1. Kalau yang dilambungkan adalah dadu, kategorinya ada enam, derajat bebasnya 6-1 = 5. Kalau didalam suatu kontingensi table ada beberapa baris dan kolom, derajat bebasnya adalah baris dikurangi satu dikali kolom dikurangi satu.
Rumusnya adalah sebagai berikut.

 df = (b-1) (k-1)
  
contoh
                        tidak perokok  perokok ringan            perokok berat
normotensi
hipertensi


 
pada table diatas kolom ada 3 dan baris ada 2
df = (3-1) (2-1) = 2
  
      dalam gambar diatas dapat dilihat bentuk beberapa distribusi kai kuadrat.

   Untuk setiap distribusi luas 5% terkanan (paling kanan) adalah daerah yang diarsir. Perhatikan bahwa semakin besar derajat bebas, semakin besar pula harga kritis yang diperlukan untuk menolak hipotesis nol. Secara intuisi, hal ini tampaknya benar karena derajat bebas sebanding dengan jumlah kategori yang independen/saling bebas. Dapat diharapkan bahwa dengan semakin baiknya kategori, akan semakin besar pula harga kai kuadrat kritis.
   Kembali pada pertanyaan semula “apakah mata uang logam yang dilambungkan tadi seimbang ?” jumlah X2-nya adalah 4, untuk df 1 harga ini terletak dalam daerah kritis 5%, karena itu Ho ditolak. Kesimpulannya adalah mata uang tersebut tidak seimbang. Suatu hal yang perlu diperhatikan adalah bahwa tidak seperti uji lain, kai kuadrat selalu merupakan uji satu sisi.

A.  TIPE UJI KAI KUADRAT
Dalam penerapan praktis, sering dijumpai berbagai persoalan mencakup dua variable. Secara spesifik, uji kai kuadrat dapat digunakan untuk menentukan :
a. ada tidaknya asosiasi antara dua variable (independency test)
b. apakah suatu kelompok homogeny (homogenitas antar-subkelompok = homogeneity test)
c. seberapa jauh suatu pengamatan sesuai dengan parameter yang dispesifikasikan (goodness of fit)

1.        Uji independensi
Pada tahun 1981 kuzma & Kissinger melakukan suatu studi melihat hubungan penggunaan alcohol dan rokok pada ibu selama kehamilan (studi terhadap 11.127 wanita hamil). Status alcohol dari ibu hamil dikategorikan didalam empat kelompok (tidak minum, peminum ringan, sedang, dan berat). Adapun status rokok dikategorikan menjadi dua kelompok (perokok dan tidak perokok), seperti terlihat pada table dibawah ini.

Status perokok
                                              Konsumsi alkohol
Tidak minum
Peminum ringan
p.sedang
p.berat
total
perokok
1880(30,5%)
2048(45,7%)
194(53,0%)
76(67,3%)
4.198(37,7%)
Tidak perokok
4290(69,5%)
2430(54,3%)
172(47,0%)
37(32,7%)
6.929(62,3%)
total
6170(55,5%)
4478(40,2%)
366(3,3%)
113(1,0%)
11.127(100%)

Tampak bahwa 30,5% wanita hamil yang tidak peminum dan 67,3% peminum berat adalah merokok selama kehamilan. Akan terpikir apakah variable minum alcohol ini berhubungan dengan variable kebiasaan merokok ? untuk menjawab permasalahan ini akan diuji hipotesis nol yang menyatakan tidak ada hubungan antara kebiasaan merokok dengan kebiasaan minum alcohol selama kehamilan. Untuk menghitung nilai X2 dari data pada table diatas sesuai dengan rumus :

X2 = Ʃ (O-E)2
         E

Dibutuhkan nilai harapan dari masing-masing sel.
      Untuk diskusi ini digunakan notasi khusus dimana kedelapan sel untuk table diatas dinyatakan sebagai E11, sampai E24 terlihat sebagai table berikut.

Status perokok
Konsumsi alkohol
Tidak minum
Peminum ringan
p.sedang
p.berat
total
perokok
E11
E12
E13
E14
Tp
Tidak perokok
E21
E23
E23
E24
TTP
total
TTM
TPR
TPS
TPB


Total perokok adalah Tp                probabilitas perokok Tp/T
Total tidak minum adalah TTM                   probabilitas tidak minum TTM/T
Probabilitas perokok dan tidak minum (Tp/T XTTM/T)….> hukum perkalian untuk kejadian yang independen ….> =       Tp X TTM
                                                                            T2
     Dengan ini nilai expected untuk sel E11 adalah :  Tp X TTM X T = Tp X TTM
                                                                                                     T2                    T
                  Jadi dari hasil jabaran diatas dapat secara ringkas dikatakan :
Nilai expected setiap sel adalah subtotal baris dikali subtotal kolom dibagi total general.
Contoh : nilai E11 (4.198 x 6.170) / 11.127 = 2327,8
   E 12 (4.198 x 4.478) / 11.127 = 1689,4
   E24 (6.929 x 113) / 11.127 = 70,4
Hasil keseluruhan nilai expected (harapan) dapat dilihat pada table berikut.

Status perokok
Konsumsi alkohol
Tidak minum
Peminum ringan
p.sedang
p.berat
total
perokok
2.327,8
1.689,4
138,1
42,6
4.198
Tidak perokok
3.842,2
2788,6
227,9
70,4
6.929
Total
6.170
4.478
366
113
11.127

Catatan : df = 3 berarti juga bahwa dari delapan sel yang ada hanya tiga sel kita yang bebas menentukan nilai expected (harapan) dengan rumus diatas, sedangkan sel yang lainnya dapat dengan mengurangi nilai E yang sudah ada dengan jumlah kolom atau jumlah baris.
    Walaupun tampaknya tidak masuk akal adanya jumlah orang pada nilai harapan dalm decimal (pecahan), hal ini sering dikerjakan untuk menghindari kesalahan pembulatan dan menjamin jumlah baris “harapan” dan “pengamatan” tetap sama (identik).
Sekarang sudah dapat dihitung harga statistic X2 (kai kuadrat) yaitu :
 
 
X2 = (1880 – 2327,8)2 + (2048 – 1689,4)2 + (194 – 138,1)1 + (76 – 42,7)2 + (4290 – 3842,2)2 +
                               2327,8                     1689,4                      138,1                  42,7                  3842,2
           (2430 – 2788,5)2 + (172 – 227,9)2 + (137 – 70,4)2 = 338,7
                                2788,5                 227,9                  70,4


Apakah harga X2 sebesar 338,7 bermakna ? untuk itu ditentukan dengan mencocokkan pada table distribusi kai kuadrat derajat bebas adalah (df) = (4-1) (2-1) = 3 …..> p < 0,001
Kesimpulan Ho ditolak …> ada hubungan antara kebiasaan minum alcohol ibu selama kehamilan dengan kebiasaan merokok.
2.       Uji homogenitas
Sering kali perlu ditentukan apakah distribusi suatu karakteristik tertentu sama untuk berbagai kelompok. Misalnya ada dua sampel random yang terdiri dari 100 orang laki-laki dan sampel kedua 100 orang wanita. Kepada mereka ditanyakan apakah mereka setuju atau tidak atas pernyataan “kesetaraan” antara wanita dan pria. Hasil telah disusun didalam table silang dibawah ini.

                       Sikap
jenis
setuju
Tidak setuju
Ukuran sampel
pria
30
70
100
Wanita
45
55
100
Jumlah
75
135
200

Langkah pengujian sebetulnya tidak berbeda dengan uji independensi dimana langkah-langkah ujinya sebagai berikut.
a)      Tidak ada perbedaan sikap setuju/tidak setuju terhadap “kesetaraan pria-wanita” antara wanita dan pria
b)     Tentukan batas kritis α =(misalnya 0,05) !
c)      Df …. > (2-1) (2-1) = 1
d)     Besarnya statistic uji dengan X2 = Ʃ (O-E)2
                                                                                E         
Untuk permasalahan diatas didapatkan nilai X2 adalah
(30 – 37,5)2 + (70 – 62,5)2 + (45 – 37,5)2 + (55 – 62,5)2 = 4,8
                          37,5              62,5                 37,5                    62,5
e)      Untuk nilai X2 = 4,8 dan df = 1 didapatkan nilai p = < 0,05
table (10.8)
f)       Kesimpulan Ho ditolak …..> ada perbedaan sikap antara pria dan wanita mengenai pernyataan “kesetaraan antara pria dan wanita”.
                                                    
Penerapan lain dari uji X2 ini adalah perbedaan antara dua proporsi, untuk mempelajari apakah proporsi sukses dalam kelompok perlakuan berbeda secara bermakna dengan proporsi sukses dalam kelompok control.

Contoh :
selama bertahun-tahun telah ada perbedaan pendapat medis tentang manfaat vitamin C dalam “pencegahan influenza.” Beberapa studi menyimpulkan bahwa vitamin C tidak bermanfaat. Suatu studi dilakukan dengan membandingkan antara kelompok yang diberikan vitamin C dan kelompok placebo. Hasilnya seperti table dibawah ini.
Table 1.7 jumlah anak menurut kelompok dan status kesehatannya

status
Vit C
plasebo
total
Menderita flu
36 (63%)
35 (76%)
32
Anak yang tidak flu
21 (37%)
11 (24%)
71
total
57 (100%)
46 (100%)
103

Tampak bahwa 63% anak-anak yang diberikan vitamin C dan 76% dari kelompok placebo terserang influenza. Apakah yang terserang flu berbeda antara dua kelompok ini ? dari hasil uji kai kuadrat didapatkan = 0,05 , maka Ho tidak dapat ditolak. Jadi, kesimpulan uji adalah perbedaan proporsi ini bisa saja terjadi karena factor sampel.

3.        Uji goodness of fit
            Uji ini berfungsi untuk melihat kesesuaian suatu pengamatan dengan suatu distribusi tertentu. Hipotesis lain yang dapat diselidiki dengan uji kai kuadrat adalah penetuan apakah suatu himpunan data sesuai (fit) dengan model tertentu, misalnya hendak diketahui apakah data yang kita miliki sesuai dengan distribusi normal atau apakah distribusi golongan darah sesuai/konsisten dengan suatu standar yang telah ditentukan sebelumnya. Untuk menguji permasalahan ini, seperti juga permasalahan-permasalahan pada tes homogenitas maupun tes independensi, selalu dicari freekuensi harpan dari data yang dipunyai, selanjutnya dihitung nilai statistic X2, dan ditentukan kemaknaannya sebagai contoh-contoh diatas.
            Untuk table yang terdiri dari banyak sel, maka untuk mempercepat perhitungan dapat digunakan perhitungan :
X2 = Ʃ O2  - N
                          E
Dimana N adalah total frekuensi keseluruhan pengamatan
Table kontingensi 2 x 2
            Agaknya analisis kai kuadrat yang tersering digunakan dalam penelitian kesehatan adalah yang menyajikan data dalam bentuk table 2x2 (four fold table) yakni dua kelompok dan dua kemungkinan respons seperti table 1.8
Bentuk umum dari table 2x2 adalah sebagai berikut
Table 1.8 bentuk umum table 2x2
kelompok
respons
kasus
Control
jumlah
Ada (+)
a
b
a+b
Tidak (-)
c
d
c+d
Jumlah
a+c
b+d
a+b+c+d



(N)

Dengan data sedemikian, maka nilai statistic kai kuadrat dapat dicari tanpa menghitung frekuensi harapan dengan rumus :
X2 =            N (ad – bc)2_
            (a+c) (b+d) (a+d) (c+d)
Persamaan ini kalau dipakaikan untuk mencari nilai kai kaudrat pada permasalahan dalam table 1.8, akan didapatkan hasil yang sama untuk nilai X2.
  X2 = 200 (30 x 55 – 70 x 45)2 = 4,8
         75 x 125 x 100 x 100

Keterbatasan penggunaan uji kai kuadrat
Telah dinyatakan bahwa teknik uji kai kuadrat adalah memakai data yang diskrit dengan pendekatan distribusi kontinu. Dekatnya pendekatan yang dihasilkan tergantung pada ukuran dalam berbagai sel dari table kontingensi. Untuk menjamin pendekatan yang memadai digunakan aturan dasar : frekuensi harapan tidak boleh terlalu kecil. Secara umum ketentuannya sebagai berikut.
Uji X2 dapat digunakan dengan syarat :
1. Jumlah sampel > 40
2. jumlah sampel antara 20-40 dan tidak ada sel yang nilai E-nya <5
Uji X2 tidak dapat digunakan dengan syarat :
1. Jumlah sampel < 20
2. jumlah sampel 20-40 dan ada sel yang nilai E-nya kurang dari 5, lebih di 20% total selnya.
Kalau hal ini ditemui didalam suatu table kontingensi,teknik ini dianggap dapat menanggulangi permasalahan adalah menggabungkan nilai dari sel yang kecil dengan sel lainnya (meng-collaps). Artinya, kategori dari variable dikurangi sehingga kategori yang nilai harapannya kecil dapat digabung ke kategori yang nilai harapannya kecil dapat digabung ke kategori lain. Untuk table 2x2, hal ini tidak dapat dilakukan, maka solusinya adalah melakukan uji “fisher exact”.
Uji fisher exact, dengan formula :

p = (a+b) ! (c+d) ! ( a+c) ! (b+d) !
                                               
a ! b ! c ! d ! n !



--------------------------------------------------------------------------------------------------------------------
 DELIMA AGUSTINA, DESTRY KURNIATI, EDDY RUSDI ARAS, EKA RAHIMA RAHMAN, EVA NURDIANA, FADIAH, FARID DERMAWAN, FITRIA ANGGRAINI, GINDA BRANPOMPI M, IMELDA ROHANI LUBIS