Uji normalitas Kolmogorov-Smirnov, atau kadang dirujuk lebih singkat sebagai uji Kolmogorov-Smirnov (uji K-S) adalah uji statistis yang digunakan untuk memeriksa kenormalan dari data sampel yang diberikan. Dengan kata lain, uji K-S digunakan untuk memeriksa apakah suatu data berasal dari distribusi normal atau bukan. Sesuai namanya, uji ini dirancang oleh dua orang matematikawan Soviet, yaitu Andrey Nikolaevich Kolmogorov (1903–1987) dan Nikolai Vasilyevich Smirnov (1900–1966). Uji K-S merupakan salah satu uji nonparametrik sehingga penggunaannya tidak melibatkan adanya asumsi terkait distribusi yang mendasari data yang akan diuji.
Uji K-S melibatkan perbandingan fungsi distribusi kumulatif dari data sampel dengan fungsi distribusi kumulatif dari suatu distribusi normal yang memiliki rata-rata dan simpangan baku yang sama seperti data sampel. Jika sampel berdistribusi normal, fungsi distribusi kumulatifnya seharusnya mendekati/serupa dengan fungsi distribusi kumulatif dari distribusi normal tersebut.
Statistik uji yang digunakan dalam uji K-S adalah jarak maksimum dari dua nilai fungsi distribusi kumulatif yang terlibat. Jarak tersebut dihitung sebagai selisih positif terbesar dari nilai fungsi distribusi kumulatif sampel dan distribusi normal di sepanjang titik-titik yang terdefinisi dalam distribusi.
Perlu dicatat bahwa uji K-S hanya dapat diaplikasikan pada data kontinu dan cukup sensitif terhadap ukuran sampel. Oleh karena itu, penggunaan uji tersebut sebaiknya diikuti oleh uji normalitas yang lain atau melibatkan analisis secara visual dari data yang diolah. Lebih lanjut, uji tersebut juga hanya berlaku pada data tunggal (ungrouped data), bukan data kelompok.
Baca: Materi, Soal, dan Pembahasan – Uji Rata-Rata Satu Populasi
Rumusan hipotesis yang diajukan ketika melakukan uji K-S adalah sebagai berikut.
Statistik uji yang akan dihitung dalam uji K-S cukup rumit jika dikerjakan secara manual. Oleh karena itu, kita akan mengerjakannya secara semi-manual dengan menggunakan bantuan aplikasi Microsoft Excel.
Sebagai contoh, diberikan data tunggal nilai sejumlah siswa sebagai berikut.
Untuk menguji normalitas data tersebut, langkah pertama yang perlu dilakukan adalah memasukkan data tersebut ke dalam Excel untuk diolah. Kemudian, lengkapi informasi terkait ukuran data, rata-rata, dan simpangan baku seperti gambar di bawah.
Rumus Excel yang digunakan untuk menghitung ukuran data adalah =COUNT(A2:A9). Rata-rata dan simpangan baku berturut-turut dihitung dengan menggunakan rumus dan
Selanjutnya, buat tabel baru yang meliputi kolom, yaitu kolom Frekuensi, dan Kolom frekuensi menginformasikan banyaknya kemunculan datum dengan nilai tertentu. menyatakan fungsi distribusi, yaitu hasil bagi dari frekuensi datum oleh frekuensi keseluruhan (ukuran sampel). Sebagai contoh, untuk frekuensinya bernilai sedangkan frekuensi keseluruhan (ukuran sampel) sama dengan sehingga Lebih lanjut, menyatakan fungsi distribusi kumulatif dari Kemudian, merupakan nilai- yaitu nilai normal baku yang merupakan hasil transformasi dari dengan melibatkan rata-rata sampel dan simpangan baku sampel yaitu
Di kolom sampingnya, menyatakan nilai peluang yang direpresentasikan oleh luas daerah di sebelah kiri titik Umumnya, kita menggunakan tabel- untuk menentukan Namun, karena nilai- sendiri berupa bilangan irasional, kita dianjurkan memanfaatkan Excel untuk menentukan agar perhitungan menjadi lebih presisi. Kita dapat menggunakan fungsi Sebagai contoh, rumus yang digunakan untuk menentukan pada saat adalah Pada kolom terakhir, nilai dihitung dengan mencari selisih positif dari dan Tanda mutlak di Excel dimasukkan dengan menggunakan fungsi

Terakhir, maksimum dihitung dengan menentukan nilai yang paling besar. Dengan menggunakan Excel, gunakan fungsi Dalam hal ini, maksimum yang diperoleh adalah Inilah nilai statistik uji yang kita inginkan saat menjalankan uji K-S. Anda dapat mengakses data pada perhitungan yang telah dilakukan di atas melalui tautan ini pada sheet Contoh.
Setelah nilai statistik uji didapat, langkah berikutnya adalah menentukan nilai kritis Kolmogorov-Smirnov yang dapat diketahui melalui tabel K-S. Pada tabel tersebut, kolom menyatakan taraf signifikansi yang digunakan, sedangkan baris menyatakan ukuran sampel. Sebagai contoh, jika taraf signifikansi yang digunakan adalah sedangkan ukuran sampel dari data yang diberikan di atas adalah maka nilai kritis K-S dalam kasus ini adalah Daerah kritis terletak di

Langkah terakhir adalah membandingkan nilai statistik uji dan nilai kritis K-S Jika lebih kecil dari nilai kritis K-S, maka tidak ditolak sehingga data disimpulkan berdistribusi normal. Sebaliknya, jika lebih besar atau sama dengan nilai kritis K-S, maka ditolak sehingga data disimpulkan tidak berdistribusi normal.
Artikel ini ditulis berdasarkan beberapa sumber, termasuk sumber berbahasa Inggris. Oleh karena itu, untuk meminimalisasi kesalahan penafsiran, padanan untuk beberapa kata/istilah diberikan dalam tabel berikut.
Quote by Karl Pearson
Statistics are the grammar of science.
Catatan: Hasil perhitungan yang dilakukan dalam setiap soal bisa jadi sedikit berbeda karena masalah pembulatan. Anda seharusnya tidak dianggap salah jika terjadi kasus seperti itu.
Bagian Uraian
Soal Nomor 1
Seorang peneliti ingin melakukan studi terkait kemampuan berpikir kreatif pada siswa kelas X di suatu sekolah. Sebelum itu, ia perlu menguji normalitas data nilai siswa kelas X di sekolah tersebut. Oleh karena itu, ia mengambil data sampel berupa nilai siswa yang diperoleh saat penilaian sumatif semester sebelumnya, yaitu sebagai berikut.
Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data nilai siswa kelas X tersebut pada taraf signifikansi
Pembahasan
Misalkan merupakan variabel acak kontinu yang menyatakan nilai siswa kelas X di sekolah tersebut.
Rumusan hipotesis:
Statistik uji:
Dari data sampel yang diberikan, dengan menggunakan bantuan Excel (lihat sheet Nilai), diperoleh informasi penting berikut.
Perhitungan akhir menunjukkan bahwa nilai
Daerah kritis:
Berdasarkan tabel K-S, nilai kritis K-S pada tingkat signifikansi dan ukuran sampel adalah Dengan demikian, daerah kritis terletak di
Keputusan:
Karena disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, tidak ditolak.
Kesimpulan:
Pada taraf signifikansi data nilai siswa kelas X tersebut berdistribusi normal.
[collapse]
Baca: Materi, Soal, dan Pembahasan – Uji Selisih Rata-Rata Dua Populasi Berpasangan
Soal Nomor 2
Sebanyak pasien di rumah sakit X dipilih secara acak untuk diukur berat badannya (dalam kg). Data berat badan pasien tersebut disajikan dalam tabel berikut.
Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data berat badan pasien di rumah sakit tersebut pada taraf signifikansi
Pembahasan
Misalkan merupakan variabel acak kontinu yang menyatakan berat badan pasien (dalam kg) di rumah sakit tersebut.
Rumusan hipotesis:
Statistik uji:
Dari data sampel yang diberikan, dengan menggunakan bantuan Excel (lihat sheet Berat Badan), diperoleh informasi penting berikut.
Perhitungan akhir menunjukkan bahwa nilai
Daerah kritis:
Berdasarkan tabel K-S, nilai kritis K-S pada tingkat signifikansi dan ukuran sampel adalah Dengan demikian, daerah kritis terletak di
Keputusan:
Karena disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, tidak ditolak.
Kesimpulan:
Pada taraf signifikansi data berat badan pasien di rumah sakit tersebut berdistribusi normal.
[collapse]
Soal Nomor 3
Seorang biolog melakukan penelitian terhadap tinggi kecambah kacang hijau (Vigna radiata) yang diletakkan di tempat dengan kondisi cahaya yang remang-remang. Sebanyak biji kacang hijau disiapkan, kemudian tinggi kecambah kacang hijau (dalam cm) yang tumbuh pada hari ke-6 diukur sehingga diperoleh data berikut.
Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data tinggi kecambah kacang hijau tersebut pada taraf signifikansi
Pembahasan
Misalkan merupakan variabel acak kontinu yang menyatakan tinggi kecambah kacang hijau (dalam cm) tersebut.
Rumusan hipotesis:
Statistik uji:
Dari data sampel yang diberikan, dengan menggunakan bantuan Excel (lihat sheet Kecambah Kacang Hijau), diperoleh informasi penting berikut.
Perhitungan akhir menunjukkan bahwa nilai
Daerah kritis:
Berdasarkan tabel K-S, nilai kritis K-S pada tingkat signifikansi dan ukuran sampel adalah Dengan demikian, daerah kritis terletak di
Keputusan:
Karena disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, tidak ditolak.
Kesimpulan:
Pada taraf signifikansi data tinggi kecambah kacang hijau (dalam cm) tersebut berdistribusi normal.
[collapse]
Soal Nomor 4
Sebanyak orang dewasa dipilih secara acak untuk dicatat ukuran sepatu yang digunakan. Data tersebut disajikan dalam tabel berikut.
Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data ukuran sepatu tersebut pada taraf signifikansi
Pembahasan
Misalkan merupakan variabel acak kontinu yang menyatakan ukuran sepatu.
Rumusan hipotesis:
Statistik uji:
Dari data sampel yang diberikan, dengan menggunakan bantuan Excel (lihat sheet Ukuran Sepatu), diperoleh informasi penting berikut.
Perhitungan akhir menunjukkan bahwa nilai
Daerah kritis:
Berdasarkan tabel K-S, nilai kritis K-S pada tingkat signifikansi dan ukuran sampel adalah Dengan demikian, daerah kritis terletak di
Keputusan:
Karena disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, tidak ditolak.
Kesimpulan:
Pada taraf signifikansi data ukuran sepatu tersebut berdistribusi normal.
[collapse]
Soal Nomor 5
Suatu acara kuis diikuti oleh peserta. Dari soal yang diberikan, banyaknya orang yang menjawab sejumlah soal dengan benar diberikan dalam tabel berikut.
Dengan menggunakan uji Kolmogorov-Smirnov, ujilah normalitas data banyaknya jawaban yang benar tersebut pada taraf signifikansi
Pembahasan
Misalkan merupakan variabel acak diskret yang menyatakan banyaknya jawaban yang benar.
Rumusan hipotesis:
Statistik uji:
Dari data sampel yang diberikan, dengan menggunakan bantuan Excel (lihat sheet Kuis), diperoleh informasi penting berikut.
Perhitungan akhir menunjukkan bahwa nilai
Daerah kritis:
Berdasarkan tabel K-S, nilai kritis K-S pada tingkat signifikansi dan ukuran sampel adalah Dengan demikian, daerah kritis terletak di
Keputusan:
Karena disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, tidak ditolak.
Kesimpulan:
Pada taraf signifikansi data banyaknya jawaban yang benar tersebut berdistribusi normal.
[collapse]