Uji Normalitas Data dengan Menggunakan Uji Kolmogorov-Smirnov

Uji Kolmogorov-Smirnov

Uji normalitas Kolmogorov-Smirnov, atau kadang dirujuk lebih singkat sebagai uji Kolmogorov-Smirnov (uji K-S) adalah uji statistis yang digunakan untuk memeriksa kenormalan dari data sampel yang diberikan. Dengan kata lain, uji K-S digunakan untuk memeriksa apakah suatu data berasal dari distribusi normal atau bukan. Sesuai namanya, uji ini dirancang oleh dua orang matematikawan Soviet, yaitu Andrey Nikolaevich Kolmogorov (1903–1987) dan Nikolai Vasilyevich Smirnov (1900–1966). Uji K-S merupakan salah satu uji nonparametrik sehingga penggunaannya tidak melibatkan adanya asumsi terkait distribusi yang mendasari data yang akan diuji.

Uji K-S melibatkan perbandingan fungsi distribusi kumulatif dari data sampel dengan fungsi distribusi kumulatif dari suatu distribusi normal yang memiliki rata-rata dan simpangan baku yang sama seperti data sampel. Jika sampel berdistribusi normal, fungsi distribusi kumulatifnya seharusnya mendekati/serupa dengan fungsi distribusi kumulatif dari distribusi normal tersebut.

Statistik uji yang digunakan dalam uji K-S adalah jarak maksimum (d) dari dua nilai fungsi distribusi kumulatif yang terlibat. Jarak tersebut dihitung sebagai selisih positif terbesar dari nilai fungsi distribusi kumulatif sampel dan distribusi normal di sepanjang titik-titik yang terdefinisi dalam distribusi.

Perlu dicatat bahwa uji K-S hanya dapat diaplikasikan pada data kontinu dan cukup sensitif terhadap ukuran sampel. Oleh karena itu, penggunaan uji tersebut sebaiknya diikuti oleh uji normalitas yang lain atau melibatkan analisis secara visual dari data yang diolah. Lebih lanjut, uji tersebut juga hanya berlaku pada data tunggal (ungrouped data), bukan data kelompok.

Baca: Materi, Soal, dan Pembahasan – Uji Rata-Rata Satu Populasi

Rumusan hipotesis yang diajukan ketika melakukan uji K-S adalah sebagai berikut.
Hipotesis nol:Data berdistribusi normal.Hipotesis alternatif:Data tidak berdistribusi normal.Statistik uji yang akan dihitung dalam uji K-S cukup rumit jika dikerjakan secara manual. Oleh karena itu, kita akan mengerjakannya secara semi-manual dengan menggunakan bantuan aplikasi Microsoft Excel

Sebagai contoh, diberikan data tunggal nilai sejumlah siswa sebagai berikut.
Nilai70503010100403050Untuk menguji normalitas data tersebut, langkah pertama yang perlu dilakukan adalah memasukkan data tersebut ke dalam Excel untuk diolah. Kemudian, lengkapi informasi terkait ukuran data, rata-rata, dan simpangan baku seperti gambar di bawah.Rumus Excel yang digunakan untuk menghitung ukuran data adalah =COUNT(A2:A9). Rata-rata dan simpangan baku berturut-turut dihitung dengan menggunakan rumus =AVERAGE(A2:A9) dan =STDEV.S(A2:A9).

Selanjutnya, buat tabel baru yang meliputi 7 kolom, yaitu kolom X, Frekuensi, f(X), F(X), Z, F(Z), dan d=|F(X)F(Z)|.  Kolom frekuensi menginformasikan banyaknya kemunculan datum dengan nilai tertentu. f(X) menyatakan fungsi distribusi, yaitu hasil bagi dari frekuensi datum oleh frekuensi keseluruhan (ukuran sampel). Sebagai contoh, untuk X=30, frekuensinya bernilai 2, sedangkan frekuensi keseluruhan (ukuran sampel) sama dengan 8 sehingga f(30)=2/8=0,25. Lebih lanjut, F(X) menyatakan fungsi distribusi kumulatif dari f(X). Kemudian, Z merupakan nilai-z, yaitu nilai normal baku yang merupakan hasil transformasi dari X dengan melibatkan rata-rata sampel x dan simpangan baku sampel s, yaitu
Z=Xxs.Di kolom sampingnya, F(Z) menyatakan nilai peluang yang direpresentasikan oleh luas daerah di sebelah kiri titik z. Umumnya, kita menggunakan tabel-z untuk menentukan F(Z). Namun, karena nilai-z sendiri berupa bilangan irasional, kita dianjurkan memanfaatkan Excel untuk menentukan F(Z) agar perhitungan menjadi lebih presisi. Kita dapat menggunakan fungsi NORM.DIST. Sebagai contoh, rumus yang digunakan untuk menentukan F(Z) pada saat X=10 adalah =NORM.DIST(F2; $D$3; $D$4; TRUE).Pada kolom terakhir, nilai d dihitung dengan mencari selisih positif dari F(X) dan F(Z). Tanda mutlak di Excel dimasukkan dengan menggunakan fungsi ABS.

Terakhir, d maksimum dihitung dengan menentukan nilai d yang paling besar. Dengan menggunakan Excel, gunakan fungsi MAX. Dalam hal ini, d maksimum yang diperoleh adalah dmaks0,21397.Inilah nilai statistik uji yang kita inginkan saat menjalankan uji K-S. Anda dapat mengakses data pada perhitungan yang telah dilakukan di atas melalui tautan ini pada sheet Contoh.

Setelah nilai statistik uji didapat, langkah berikutnya adalah menentukan nilai kritis Kolmogorov-Smirnov yang dapat diketahui melalui tabel K-S. Pada tabel tersebut, kolom menyatakan taraf signifikansi yang digunakan, sedangkan baris menyatakan ukuran sampel. Sebagai contoh, jika taraf signifikansi yang digunakan adalah α=5%, sedangkan ukuran sampel dari data yang diberikan di atas adalah 8, maka nilai kritis K-S dalam kasus ini adalah d0,05; 80,45427. Daerah kritis terletak di d>0,45427. 
Uji Kolmogorov-Smirnov

Langkah terakhir adalah membandingkan nilai statistik uji dmaks dan nilai kritis K-S d0,05; 8. Jika dmaks lebih kecil dari nilai kritis K-S, maka H0 tidak ditolak sehingga data disimpulkan berdistribusi normal. Sebaliknya, jika dmaks lebih besar atau sama dengan nilai kritis K-S, maka H0 ditolak sehingga data disimpulkan tidak berdistribusi normal.


Artikel ini ditulis berdasarkan beberapa sumber, termasuk sumber berbahasa Inggris. Oleh karena itu, untuk meminimalisasi kesalahan penafsiran, padanan untuk beberapa kata/istilah diberikan dalam tabel berikut.

No.Bahasa IndonesiaBahasa Inggris1.Uji Kolmogorov-SmirnovKolmogorov-Smirnov Test2.Distribusi NormalNormal Distribution3.Fungsi Distribusi KumulatifCumulative Distribution Function4.Uji NonparametrikNonparametric Test5.Statistik UjiTest Statistics6.Nilai KritisCritical Value7.Daerah KritisCritical Region8.Taraf SignifikansiSignificance Value


Quote by Karl Pearson

Statistics are the grammar of science.

Catatan: Hasil perhitungan yang dilakukan dalam setiap soal bisa jadi sedikit berbeda karena masalah pembulatan.  Anda seharusnya tidak dianggap salah jika terjadi kasus seperti itu.

Bagian Uraian

Soal Nomor 1

Seorang peneliti ingin melakukan studi terkait kemampuan berpikir kreatif pada siswa kelas X di suatu sekolah. Sebelum itu, ia perlu menguji normalitas data nilai siswa kelas X di sekolah tersebut. Oleh karena itu, ia mengambil data sampel berupa 10 nilai siswa yang diperoleh saat penilaian sumatif semester sebelumnya, yaitu sebagai berikut.
Nilai506090401008050506090Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data nilai siswa kelas X tersebut pada taraf signifikansi 5%.

Pembahasan

Baca: Materi, Soal, dan Pembahasan – Uji Selisih Rata-Rata Dua Populasi Berpasangan

Soal Nomor 2

Sebanyak 8 pasien di rumah sakit X dipilih secara acak untuk diukur berat badannya (dalam kg). Data berat badan pasien tersebut disajikan dalam tabel berikut.
Berat Badan5056607065605752Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data berat badan pasien di rumah sakit tersebut pada taraf signifikansi 5%.

Pembahasan

Soal Nomor 3

Seorang biolog melakukan penelitian terhadap tinggi kecambah kacang hijau (Vigna radiata) yang diletakkan di tempat dengan kondisi cahaya yang remang-remang. Sebanyak 11 biji kacang hijau disiapkan, kemudian tinggi kecambah kacang hijau (dalam cm) yang tumbuh pada hari ke-6 diukur sehingga diperoleh data berikut.
Tinggi Kecambah3,43,84,03,92,52,83,05,04,64,54,2Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data tinggi kecambah kacang hijau tersebut pada taraf signifikansi 10%.

Pembahasan

Soal Nomor 4

Sebanyak 20 orang dewasa dipilih secara acak untuk dicatat ukuran sepatu yang digunakan. Data tersebut disajikan dalam tabel berikut.
Ukuran SepatuFrekuensi383395402411425434Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data ukuran sepatu tersebut pada taraf signifikansi 1%.

Pembahasan

Soal Nomor 5

Suatu acara kuis diikuti oleh 100 peserta. Dari 10 soal yang diberikan, banyaknya orang yang menjawab sejumlah soal dengan benar diberikan dalam tabel berikut.
Banyaknya Jawaban yang BenarFrekuensi410515618720817912108Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data banyaknya jawaban yang benar tersebut pada taraf signifikansi 2%.

Pembahasan