Analisis varians (ANAVA), atau dalam bahasa Inggris dikenal sebagai analysis of variance (ANOVA), adalah salah satu alat statistika yang digunakan untuk menguji apakah terdapat perbedaan yang signifikan dari rata-rata setidaknya dua populasi. Dengan kata lain, ANAVA dapat dipakai untuk melihat ada tidaknya perbedaan yang signifikan dari rata-rata tiga populasi atau lebih. Di sisi lain, ANAVA juga tentu dapat dipakai untuk kasus dua populasi, meskipun sebenarnya kita sudah memiliki uji-$t.$ Sesuai namanya, ANAVA menggunakan perhitungan yang melibatkan ukuran penyebaran (varians) dari masing-masing populasi untuk menarik inferensi yang berkaitan dengan perbedaan rata-rata populasi yang terlibat.
Baca: Materi, Soal, dan Pembahasan – Uji Rata-Rata Satu Populasi
Lebih lanjut, ANAVA dapat digunakan jika memenuhi syarat berikut.
- Setiap populasi harus berdistribusi normal.
- Varians setiap populasi harus sama (atau sering disebut sebagai asumsi homogenitas).
- Populasi yang satu dengan populasi yang lain bersifat bebas (independent).
Jika salah satu dari tiga syarat tersebut tidak terpenuhi, ANAVA tidak boleh digunakan sebagai alat statistika untuk melakukan inferensi.
Perhitungan dalam ANAVA dibedakan berdasarkan banyaknya faktor sebagai variabel terikatnya. Jika penelitian hanya melibatkan satu variabel terikat, kita akan menggunakan ANAVA satu jalur (one-way ANOVA). Untuk dua variabel terikat, kita akan menggunakan ANAVA dua jalur (two-way ANOVA), begitu seterusnya. Pada artikel ini, kita akan fokus untuk membahas ANAVA satu jalur.
ANAVA satu jalur merupakan salah satu alat uji hipotesis yang sering digunakan. Sebagai contoh, seorang mahasiswa melakukan penelitian untuk melihat ada tidaknya perbedaan yang signifikan dari rata-rata nilai siswa yang mendapat pembelajaran dengan menggunakan media berupa ChatGPT, YouTube, dan PowerPoint. Dalam kasus ini, kita dapat melihat bahwa variabel terikat dalam penelitian ini hanya ada satu, yaitu media pembelajaran yang digunakan. Lebih lanjut, akan ada tiga populasi yang diteliti, yaitu nilai siswa yang mendapat pembelajaran dengan menggunakan media ChatGPT, YouTube, dan PowerPoint. Perhatikan juga bahwa perbedaan populasi tersebut terjadi karena adanya perbedaan perlakuan yang sengaja dilakukan oleh peneliti. Oleh karena itu, istilah ‘perlakuan’ (treatment) akan sering muncul sebagai penentu banyaknya populasi yang terlibat. Karena melibatkan lebih dari dua populasi dan hanya melibatkan satu faktor sebagai variabel terikat, ANAVA satu jalur dapat dipertimbangkan untuk digunakan selama tiga syarat yang disebutkan sebelumnya telah terpenuhi.
Rumusan hipotesis yang diajukan ketika menggunakan ANAVA satu jalur yang melibatkan $k$ populasi adalah sebagai berikut.
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \cdots = \mu_k . \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Secara verbal, dapat dikatakan bahwa hipotesis nol $H_0$ berbunyi tidak ada perbedaan yang signifikan dari rata-rata $k$ populasi yang terlibat. Sebaliknya, hipotesis alternatif $H_1$ menyatakan bahwa ada perbedaan yang signifikan dari rata-rata $n$ populasi yang terlibat. Perhatikan bahwa $H_1$ tidak menyatakan bahwa semua rata-rata populasi berbeda, tetapi cukup dua populasi saja. Jadi, menuliskan $H_1$ sebagai
$$\mu_1 \ne \mu_2 \ne \cdots \mu_k$$merupakan hal yang keliru. Lebih lanjut, jika $H_0$ ditolak, ANAVA tidak dapat dipakai untuk menentukan populasi mana yang rata-ratanya berbeda. Kita memerlukan uji lanjut untuk menentukan kondisi tersebut, misalnya dengan menggunakan uji beda nyata terkecil (least significance difference test) atau uji Dunnett (Dunnett’s test).
Perhitungan ANAVA cukup rumit jika tanpa menggunakan kalkulator. Caranya adalah sebagai berikut. Katakanlah kita memiliki data interval yang melibatkan satu variabel terikat dan $k$ populasi. Masing-masing populasi diwakili oleh sampel berukuran $n_1, n_2, \cdots, n_k.$ Setelah disajikan dalam bentuk tabel, kita dapat melengkapi tabel dengan menambahkan kolom jumlah dan rata-rata dari masing-masing kelompok sampel sebagai perwakilan dari populasi. Tabel yang dimaksud akan menjadi seperti berikut.
Keterangan tabel:
- $y_{ij} \rightarrow$ pengamatan ke-$j$ dalam perlakuan ke-$i$ untuk $i \cdots \{1, 2, \cdots, k\}$ dan $j \in \{1, 2, \cdots, n_i\}.$
- $\overline{y}_{i*} \rightarrow$ rata-rata sampel dari perlakuan ke-$i.$
- $T_{**} \rightarrow$ jumlah nilai dari semua observasi yang ada.
- $\overline{y}_{**} \rightarrow$ rata-rata nilai dari semua observasi yang ada, yaitu sebanyak $N.$
Perhitungan ANAVA melibatkan besaran-besaran berikut.
$$\begin{array}{c|c} \textbf{Faktor Koreksi} & \text{FK} = \dfrac{T_{**}^2}{N}. \\ \textbf{Jumlah Kuadrat Total} & \text{JKT} = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK}. \\ \textbf{Jumlah Kuadrat Perlakuan} & \text{JKP} = \displaystyle \sum_{i=1}^k \dfrac{T_{i*}^2}{n_i}-\text{FK}. \\ \textbf{Jumlah Kuadrat Galat} & \text{JKG} = \text{JKT}-\text{JKP}. \end{array}$$Setelah besaran tersebut dicari, buatlah tabel ANAVA seperti berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & \text{JKP} & k-1 & \dfrac{\text{JKP}}{k-1} \\ \text{Galat} & \text{JKG} & N-k & \dfrac{\text{JKG}}{N-k} \\ \text{Total} & \text{JKT} & N-1 & \\ \hline \end{array}$$ANAVA menggunakan uji-$F$ dalam proses pengambilan keputusan. $f_{\text{hitung}}$ adalah hasil bagi dari rata-rata kuadrat perlakuan $(\text{RKP})$ oleh rata-rata kuadrat galat $(\text{RKG}),$ yaitu
$$f_{\text{hitung}} = \dfrac{\text{RKP}}{\text{RKG}}.$$Lebih lanjut, $f_{\text{tabel}} = f_{\alpha;~\text{dk}_1, \text{dk}_2}$ adalah nilai yang didapat dari distribusi-$F$ dengan $\alpha$ adalah taraf signifikansi yang digunakan, $\text{dk}_1 = k-1$ adalah derajat kebebasan pertama dan $\text{dk}_2 = N-k$ adalah derajat kebebasan kedua. $H_0$ dinyatakan ditolak jika $f_{\text{hitung}} > f_{\text{tabel}}.$ Sebaliknya, $H_0$ tidak ditolak. Penolakan $H_0$ menandakan bahwa ada perbedaan (yang signifikan) rata-rata dari populasi-populasi yang diuji. Sebaliknya, kegagalan dalam menolak $H_0$ menandakan bahwa tidak ada perbedaan (yang signifikan) rata-rata dari populasi-populasi yang diuji.
Artikel ini ditulis berdasarkan beberapa sumber, termasuk sumber berbahasa Inggris. Salah satu sumber yang digunakan di antaranya adalah buku “Probability & Statistics for Engineers & Scientists” yang ditulis oleh Ronald E. Walpole dkk. Oleh karena itu, untuk meminimalisasi kesalahan penafsiran, padanan untuk beberapa kata/istilah diberikan dalam tabel berikut.
$$\begin{array}{ccc} \hline \text{No.} & \text{Bahasa Indonesia} & \text{Bahasa Inggris} \\ \hline 1. & \text{Analisis Varians (ANAVA)} & \text{Analysis of Variance (ANOVA)} \\ 2. & \text{Rata-Rata} & \text{Mean} \\ 3. & \text{Galat} & \text{Error} \\ 4. & \text{Perlakuan} & \text{Treatment} \\ 5. & \text{Homogenitas} & \text{Homogeneity} \\ 6. & \text{Uji-}F & F\text{-Test} \\ 7. & \text{Jumlah Kuadrat Total (JKT)} & \text{Total Sum of Squares (SST)} \\ 8. & \text{Jumlah Kuadrat Perlakuan (JKP)} & \text{Treatment Sum of Squares (SSA)} \\ 9. & \text{Jumlah Kuadrat Galat (JKG)} & \text{Error Sum of Squares (SSE)} \\ 10. & \text{Daerah Kritis} & \text{Critical Region} \\ 11. & \text{Hipotesis Nol} & \text{Null Hypothesis} \\ 12. & \text{Hipotesis Alternatif} & \text{Alternative Hypothesis} \\ 13. & \text{Statistik Uji} & \text{Test Statistic} \\ 14. & \text{Taraf Signifikansi} & \text{Significance Value} \\ 15. & \text{Uji Satu Arah} & \text{One-Tailed Test} \\ 16. & \text{Derajat Kebebasan} & \text{Degree of Freedom} \\ 17. & \text{ANAVA Satu Jalur} & \text{One-Way ANOVA} \\ \hline \end{array}$$
Quote by Steve Jobs
Catatan: Hasil perhitungan yang dilakukan dalam setiap soal bisa jadi sedikit berbeda karena masalah pembulatan. Anda seharusnya tidak dianggap salah jika terjadi kasus seperti itu. Lebih lanjut, silakan unduh tabel-$F$ untuk menjawab soal-soal ANAVA di bawah.
Bagian Uraian
Soal Nomor 1
Tabel berikut menyatakan waktu kesembuhan (dalam jam) penderita sakit kepala karena mengonsumsi tiga merek obat sakit kepala yang berlainan.
$$\begin{array}{c|ccccccccc} \textbf{Obat A} & 5 & 4 & 8 & 6 & 3 & 3 & 5 & 2 & \\ \hline \textbf{Obat B} & 9 & 7 & 8 & 6 & 9 & 3 & 7 & 4 & 1 \\ \hline \textbf{Obat C} & 7 & 6 & 9 & 4 & 7 & 2 & 3 & 4 & \\ \end{array}$$Asumsikan ketiga populasi berdistribusi normal dan homogen. Ujilah hipotesis yang menyatakan bahwa rata-rata waktu kesembuhan yang diakibatkan oleh tiga merek obat tersebut tidak berbeda. Gunakan taraf signifikansi $5\%.$
Misalkan $X_1, X_2,$ dan $X_3$ merupakan variabel acak kontinu yang berturut-turut menyatakan waktu kesembuhan (dalam jam) penderita sakit kepala karena mengonsumsi obat $A, B,$ dan $C.$ Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2,$ dan $\mu_3,$ berturut-turut adalah rata-rata populasi dari waktu kesembuhan (dalam jam) penderita sakit kepala karena mengonsumsi obat $A, B,$ dan $C.$
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N = 8 + 9 + 8 = 25.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Obat), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{132^2}{25} = 696,\!96 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (5^2 + 4^2 + 8^2 + \cdots + 4^2)-696,\!96 = 137,\!04 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{36^2}{8} + \dfrac{54^2}{9} + \dfrac{42^2}{8}-696,\!96 = 9,\!54 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 137,\!04-9,\!54 = 127,\!5. \end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 9,\!54 & 3-1=2 & \dfrac{9,\!54}{2} = 4,\!77 \\ \text{Galat} & 127,\!5 & 25-3=22 & \dfrac{127,\!5}{22} \approx 5,\!7955 \\ \text{Total} & 137,\!04 & 25-1=24 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{4,\!77}{5,\!7955} \approx 0,\!8231.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 3-1=2$ dan $\text{dk}_2 = N-k=24-2=22,$ diperoleh $f_{0,05;~2,~22} \approx 3,\!44.$ Dengan demikian, daerah kritis terletak di $f > 3,\!44.$
Keputusan:
Karena $f_{\text{hitung}}= 0,\!8231 < 3,\!44 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, $H_0$ tidak ditolak.
Kesimpulan:
Jadi, rata-rata waktu kesembuhan penderita sakit kepala karena mengonsumsi obat $A, B,$ dan $C$ tidak berbeda secara signifikan.
Baca: Materi, Soal, dan Pembahasan – Uji Selisih Rata-Rata Dua Populasi Bebas
Soal Nomor 2
Seorang peneliti menduga bahwa ada perbedaan hasil belajar dari penerapan metode pembelajaran ceramah, diskusi, dan berbasis proyek pada materi statistika. Untuk itu, ia melakukan eksperimen dengan melibatkan tiga kelas berbeda yang berdistribusi normal dan homogen. Satu kelas mendapat metode pembelajaran yang berbeda. Alhasil, ia memperoleh nilai tes akhir (dalam skala 0–100) sebagai berikut.
$$\begin{array}{c|cccccccccc} \textbf{Ceramah} & 70 & 75 & 80 & 80 & 75 & 70 & 80 & 60 & 50 & 70 \\ \textbf{Diskusi} & \hline 50 & 70 & 80 & 80 & 80 & 85 & 90 & 70 & 70 & 80 \\ \hline \textbf{Berbasis Proyek} & 60 & 80 & 85 & 95 & 90 & 80 & 70 & 70 & 65 & 85 \\ \end{array}$$Ujilah dugaan peneliti tersebut dengan menggunakan taraf signifikansi $5\%.$
Misalkan $X_1, X_2,$ dan $X_3$ merupakan variabel acak kontinu yang berturut-turut menyatakan nilai tes akhir setelah diterapkan metode pembelajaran ceramah, diskusi, dan berbasis proyek. Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2,$ dan $\mu_3,$ berturut-turut adalah rata-rata populasi dari nilai tes akhir setelah diterapkan metode pembelajaran ceramah, diskusi, dan berbasis proyek.
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N = 10 + 10 + 10 = 30.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Metode Pembelajaran), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{2.245^2}{30} = 168.001 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (70^2 + 75^2 + 80^2 + \cdots + 85^2)-168.001 = 3.374 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{710^2}{10} + \dfrac{755^2}{10} + \dfrac{780^2}{10}-168.001 = 251,\!5 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 3.374-251,\!5 = 3.122,\!5.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 251,\!5 & 3-1=2 & \dfrac{251,\!5}{2} = 125,\!75 \\ \text{Galat} & 3.122,\!5 & 30-3=27 & \dfrac{3.122,\!5}{27} \approx 115,\!6481 \\ \text{Total} & 3.374 & 30-1=29 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{125,\!75}{115,\!6481} \approx 1,\!0874.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 3-1=2$ dan $\text{dk}_2 = N-k=30-3=27,$ diperoleh $f_{0,05;~2,~27} \approx 3,\!35.$ Dengan demikian, daerah kritis terletak di $f > 3,\!35.$
Keputusan:
Karena $f_{\text{hitung}}= 1,\!0874 < 3,\!35 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, $H_0$ tidak ditolak.
Kesimpulan:
Jadi, hasil belajar dari penerapan metode pembelajaran ceramah, diskusi, dan berbasis proyek pada materi statistika tidak berbeda secara signifikan.
Soal Nomor 3
Banyaknya anggota rumah tangga hasil suatu survei di tiga desa adalah sebagai berikut.
$$\begin{array}{c|cccccccccc} \hline \textbf{Desa A} & 6 & 8 & 4 & 4 & 7 & 5 & 4 \\ \hline \textbf{Desa B} & 4 & 4 & 4 & 7 & 4 & 4 & 3 & 3 & 8 & 8 \\ \hline \textbf{Desa C} & 7 & 5 & 3 & 6 & 5 & 5 & 3 & 3 & 3 \end{array}$$Asumsikan ketiga populasi berdistribusi normal dan homogen. Dengan taraf signifikansi $5\%,$ apakah terdapat perbedaan rata-rata banyaknya anggota rumah tangga di tiga desa tersebut?
Misalkan $X_1, X_2,$ dan $X_3$ merupakan variabel acak diskret yang berturut-turut menyatakan banyaknya anggota rumah tangga di Desa $A, B,$ dan $C.$ Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2,$ dan $\mu_3,$ berturut-turut adalah rata-rata populasi dari banyaknya anggota rumah tangga di Desa $A, B,$ dan $C.$
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N =7 + 10 + 9 = 26.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Desa), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{127^2}{26} \approx 620,\!3462 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (6^2 + 8^2 + 4^2 + \cdots + 3^2)-620,\!3462 = 72,\!6538 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{38^2}{7} + \dfrac{49^2}{10} + \dfrac{40^2}{9}-620,\!3462 \approx 3,\!8173 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 72,\!6538-3,\!8173 = 68,\!8365.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 3,\!8173 & 3-1=2 & \dfrac{3,\!8173}{2} \approx 1,\!9087 \\ \text{Galat} & 68,\!8365 & 26-3 = 23 & \dfrac{68,\!8365}{23} \approx 2,\!9929 \\ \text{Total} & 72,\!6538 & 26-1=25 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{1,\!9087}{2,\!9929} \approx 0,\!6377.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 3-1=2$ dan $\text{dk}_2 = N-k=26-3=23,$ diperoleh $f_{0,05;~2,~23} \approx 3,\!42.$ Dengan demikian, daerah kritis terletak di $f > 3,\!42.$
Keputusan:
Karena $f_{\text{hitung}}= 0,\!6377 < 3,\!42 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, $H_0$ tidak ditolak.
Kesimpulan:
Jadi, tidak ada perbedaan rata-rata banyaknya anggota rumah tangga di tiga desa tersebut.
Baca: Materi, Soal, dan Pembahasan – Uji Selisih Rata-Rata Dua Populasi Berpasangan
Soal Nomor 4
Pak Rizal membudidayakan $3$ jenis kentang berbeda di kebunnya. Sebanyak $5$ sampel kentang dipilih secara acak dari masing-masing jenis untuk diukur beratnya dalam satuan gram. Alhasil, Pak Rizal memperoleh data berikut.
$$\begin{array}{c|cccccccccc} \hline \textbf{Jenis 1} & 254 & 263 & 241 & 237 & 251 \\ \hline \textbf{Jenis 2} & 234 & 218 & 235 & 227 & 216 \\ \hline \textbf{Jenis 3} & 200 & 222 & 197 & 206 & 204 \end{array}$$Asumsikan ketiga populasi berdistribusi normal dan homogen. Dengan taraf signifikansi $1\%,$ apakah ada perbedaan rata-rata dari berat tiga jenis kentang tersebut?
Misalkan $X_1, X_2, $ dan $X_3$ merupakan variabel acak kontinu yang berturut-turut menyatakan berat kentang jenis $1, 2,$ dan $3$ (dalam gram). Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2,$ dan $\mu_3,$ berturut-turut adalah rata-rata populasi dari berat kentang jenis $1, 2,$ dan $3$ (dalam gram).
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N =5+5+5=15.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Kentang), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{3.405^2}{15} = 772.935 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (254^2 + 263^2 + 241^2 + \cdots + 204^2)-772.935 = 5.836 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{1.246^2}{5} + \dfrac{1.130^2}{5} + \dfrac{1.029^2}{5}-772.935= 4.716,\!4 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 5.836-4.716,\!4 = 1.119,\!6.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 4.716,\!4 & 3-1=2 & \dfrac{4.716,\!4}{2} = 2.358,\!2 \\ \text{Galat} & 1.119,\!6& 15-3 = 12 & \dfrac{1.119,\!6}{12} = 93,\!3 \\ \text{Total} & 5.836 & 15-1=14 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{2.358,\!2 }{93,\!3} \approx 25,\!2755.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 1\% = 0,\!01$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 3-1=2$ dan $\text{dk}_2 = N-k=15-3=12,$ diperoleh $f_{0,01;~2,~12} \approx 6,\!93.$ Dengan demikian, daerah kritis terletak di $f > 6,\!93.$
Keputusan:
Karena $f_{\text{hitung}}= 25,\!2755 > 6,\!93 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji jatuh pada daerah kritis. Dengan demikian, $H_0$ ditolak.
Kesimpulan:
Jadi, terdapat perbedaan rata-rata dari berat tiga jenis kentang tersebut.
Soal Nomor 5
Seorang ahli botani sedang melakukan penelitian terhadap tinggi tanaman bambu hoki (lucky bamboo) yang dibudidayakannya. Ia ingin mengetahui pengaruh pemberian pupuk jenis $A, B,$ dan $C$ terhadap tinggi tanaman tersebut. Sebanyak $8$ pot tanaman bambu hoki diberi pupuk jenis $A,$ $7$ pot lainnya diberi pupuk jenis $B,$ dan $9$ pot lainnya diberi pupuk jenis $C.$ Beberapa waktu kemudian, ahli botani tersebut mengukur tinggi tanaman bambu hoki (dalam cm) yang telah tumbuh di $24$ pot berbeda dan memperoleh data berikut.
$$\begin{array}{c|ccccccccc} \textbf{Pupuk Jenis A} & 25 & 11 & 16 & 26 & 32 & 25 & 30 & 17 \\ \hline \textbf{Pupuk Jenis B} & 17 & 16 & 18 & 20 & 10 & 14 & 19 \\ \hline \textbf{Pupuk Jenis C} & 26 & 20 & 17 & 26 & 43 & 46 & 35 & 34 & 18 \end{array}$$Asumsikan ketiga populasi berdistribusi normal dan homogen. Dengan taraf signifikansi $1\%,$ apakah ada perbedaan rata-rata dari tinggi tanaman bambu hoki karena pemberian $3$ jenis pupuk tersebut?
Misalkan $X_1, X_2, $ dan $X_3$ merupakan variabel acak kontinu yang berturut-turut menyatakan tinggi tanaman bambu hoki (dalam cm) karena pemberian pupuk jenis $A, B,$ dan $C.$ Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2,$ dan $\mu_3,$ berturut-turut adalah rata-rata populasi dari tinggi tanaman bambu hoki (dalam cm) karena pemberian pupuk jenis $A, B,$ dan $C.$
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N =8+7+9=24.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Bambu Hoki), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{561^2}{24} = 13.113,\!375 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (25^2 + 11^2 + 16^2 + \cdots + 18^2)-13.113,\!375 = 2.039,\!625 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{182^2}{8} + \dfrac{114^2}{7} + \dfrac{265^2}{9}-13.113,\!375 \approx 686,\!4742 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 2.039,\!625-686,\!4742 = 1.353,\!1508.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 686,\!4742 & 3-1=2 & \dfrac{686,\!4742}{2} = 343,\!2371 \\ \text{Galat} & 1.353,\!1508 & 24-3 = 21 & \dfrac{1.353,\!1508}{21} \approx 64,\!4358 \\ \text{Total} & 2.039,\!625 & 24-1=23 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{343,\!2371 }{64,\!4358} \approx 5,\!3268.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 1\% = 0,\!01$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 3-1=2$ dan $\text{dk}_2 = N-k=24-3=21,$ diperoleh $f_{0,01;~2,~21} \approx 5,\!78.$ Dengan demikian, daerah kritis terletak di $f > 5,\!78.$
Keputusan:
Karena $f_{\text{hitung}}= 5,\!3268 < 5,\!78 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, $H_0$ tidak ditolak.
Kesimpulan:
Jadi, tidak terdapat perbedaan rata-rata dari tinggi tanaman bambu hoki karena pemberian $3$ jenis pupuk tersebut.
Baca: Materi, Soal, dan Pembahasan – Uji Varians Satu Populasi
Soal Nomor 6
Seorang peneliti memiliki $15$ biji kacang merah (Phaseolus vulgaris) yang dikelompokkan secara acak menjadi $3$ kelompok, masing-masing terdiri dari $5$ biji. Kelompok pertama, kedua, dan ketiga berturut-turut diberi perlakuan dengan menambahkan hormon auksin, sitokinin, dan giberelin dengan kadar $4$ bpj (bagian per juta). Setelah $14$ hari observasi, diperoleh panjang tanaman kacang merah (dalam cm) tersebut sebagai berikut.
$$\begin{array}{c|ccccc} \textbf{Auksin} & 32 & 37 & 34 & 33 & 30 \\ \hline \textbf{Sitokinin} & 36 & 38 & 37 & 30 & 34 \\ \hline \textbf{Giberelin} & 35 & 30 & 36 & 29 & 31 \end{array}$$Asumsikan ketiga populasi berdistribusi normal dan homogen. Ujilah hipotesis yang menyatakan bahwa terdapat perbedaan yang signifikan pada panjang tanaman kacang merah karena penambahan tiga hormon tersebut $(\alpha =5\%).$
Misalkan $X_1, X_2, $ dan $X_3$ merupakan variabel acak kontinu yang berturut-turut menyatakan panjang tanaman kacang merah (dalam cm) setelah ditambah hormon auksin, sitokinin, dan giberelin. Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2,$ dan $\mu_3,$ berturut-turut adalah rata-rata populasi dari panjang tanaman kacang merah (dalam cm) setelah ditambah hormon auksin, sitokinin, dan giberelin.
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N =5+5+5=15.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Hormon), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{502^2}{15} \approx 16.800,\!2667 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (32^2 + 37^2 + 34^2 + \cdots + 31^2)-16.800,\!2667 = 125,\!7333 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{166^2}{5} + \dfrac{175^2}{5} + \dfrac{161^2}{5}-16.800,\!2667 = 20,\!1333 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 125,\!7333- 20,\!1333 = 105,\!6.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 20,\!1333 & 3-1=2 & \dfrac{20,\!1333}{2} = 10,\!0667 \\ \text{Galat} & 105,\!6 & 15-3 = 12 & \dfrac{105,\!6}{12} = 8,\!8 \\ \text{Total} & 125,\!7333 & 15-1=14 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{10,\!0667 }{8,\!8} \approx 1,\!1439.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 3-1=2$ dan $\text{dk}_2 = N-k=15-3=12,$ diperoleh $f_{0,05;~2,~12} \approx 3,\!89.$ Dengan demikian, daerah kritis terletak di $f > 3,\!89.$
Keputusan:
Karena $f_{\text{hitung}}= 1,\!1439 < 3,\!89 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, $H_0$ tidak ditolak.
Kesimpulan:
Jadi, tidak ada perbedaan yang signifikan pada panjang tanaman kacang merah karena penambahan hormon auksin, sitokinin, dan giberelin.
Soal Nomor 7
Suatu penelitian dilakukan untuk mengetahui apakah terdapat perbedaan rata-rata jumlah uang yang dibelanjakan pengguna $4$ jenis kartu kredit berbeda. Berikut ini merupakan jumlah uang yang dibelanjakan (dalam USD) ibu rumah tangga dengan menggunakan kartu kredit. Masing-masing responden hanya menggunakan satu kartu kredit.
$$\begin{array}{c|cccccccccc} \textbf{ASTAR} & 8 & 7 & 10 & 19 & 11 \\ \hline \textbf{BAC} & 12 & 11 & 16 & 10 & 12 \\ \hline \textbf{TON} & 19 & 20 & 15 & 18 & 19 \\ \hline \textbf{ANEX} & 13 & 12 & 14 & 15 \end{array}$$Asumsikan keempat populasi berdistribusi normal dan homogen. Dengan taraf signifikansi $5\%,$ jawablah tujuan dari penelitian tersebut.
Misalkan $X_1, X_2, X_3,$ dan $X_4$ merupakan variabel acak kontinu yang berturut-turut menyatakan jumlah uang yang dibelanjakan (dalam USD) ibu rumah tangga dengan menggunakan kartu kredit jenis ASTAR, BAC, TON, dan ANEX. Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2, \mu_3,$ dan $\mu_4,$ berturut-turut adalah rata-rata populasi dari jumlah uang yang dibelanjakan (dalam USD) ibu rumah tangga dengan menggunakan kartu kredit jenis ASTAR, BAC, TON, dan ANEX.
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3 = \mu_4. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N =5 + 5+5+4=19.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Kartu Kredit), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{261^2}{19} \approx 3.585,\!3158 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (8^2 + 7^2 + 10^2 + \cdots + 15^2)-3.585,\!3158 = 279,\!6842 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{55^2}{5} + \dfrac{61^2}{5} + \dfrac{91^2}{5}+\dfrac{54^2}{4}-3.585,\!3158= 149,\!0842 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 279,\!6842-149,\!0842 = 130,\!6.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 149,\!0842 & 4-1=3 & \dfrac{149,\!0842}{3} \approx 49,\!6947 \\ \text{Galat} & 130,\!6 & 19-4 = 15 & \dfrac{130,\!6}{15} \approx 8,\!7067 \\ \text{Total} & 279,\!6842 & 19-1=18 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{49,\!6947 }{8,\!7067} \approx 5,\!7076.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 4-1=3$ dan $\text{dk}_2 = N-k=19-4=15,$ diperoleh $f_{0,05;~3,~15} \approx 3,\!29.$ Dengan demikian, daerah kritis terletak di $f > 3,\!29.$
Keputusan:
Karena $f_{\text{hitung}}= 5,\!7076 > 3,\!29 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji jatuh pada daerah kritis. Dengan demikian, $H_0$ ditolak.
Kesimpulan:
Jadi, terdapat perbedaan rata-rata jumlah uang yang dibelanjakan pengguna $4$ jenis kartu kredit berbeda.
Soal Nomor 8
Empat lokasi berbeda di daerah timur laut digunakan untuk eksperimen yang melibatkan pengukuran jumlah ozon (dalam bagian per juta [bpj]). Jumlah ozon diukur dalam $5$ sampel di setiap lokasi dengan data sebagai berikut.
$$\begin{array}{c|cccccccccc} \textbf{Lokasi 1} & 0,\!09 & 0,\!10 & 0,\!08 & 0,\!08 & 0,\!11 \\ \hline \textbf{Lokasi 2} & 0,\!15 & 0,\!12 & 0,\!17 & 0,\!18 & 0,\!14 \\ \hline \textbf{Lokasi 3} & 0,\!10 & 0,\!13 & 0,\!08 & 0,\!08 & 0,\!09 \\ \hline\textbf{Lokasi 4} & 0,\!10 & 0,\!07 & 0,\!05 & 0,\!08 & 0,\!09 \end{array}$$Asumsikan keempat populasi berdistribusi normal dan homogen. Dengan taraf signifikansi $5\%,$ apakah cukup bukti untuk mengatakan bahwa terdapat perbedaan rata-rata jumlah ozon di antara lokasi-lokasi tersebut?
Misalkan $X_1, X_2, X_3,$ dan $X_4$ merupakan variabel acak kontinu yang berturut-turut menyatakan jumlah ozon (dalam bpj) yang terukur di lokasi $1, 2, 3,$ dan $4.$ Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2, \mu_3,$ dan $\mu_4,$ berturut-turut adalah rata-rata populasi dari jumlah ozon (dalam bpj) yang terukur di lokasi $1, 2, 3,$ dan $4.$
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3 = \mu_4. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N =4\times 5=20.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Ozon), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{2,\!09^2}{20} \approx 0,\!2184 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (0,\!09^2 + 0,\!10^2 + 0,\!08^2 + \cdots + 0,\!09^2)-0,\!2184 = 0,\!0221 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{0,\!46^2}{5} + \dfrac{0,\!76^2}{5} + \dfrac{0,\!48^2}{5}+\dfrac{0,\!39^2}{4}-0,\!2184 \approx 0,\!0159 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 0,\!0221-0,\!0159 = 0,\!0062.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 0,\!0159 & 4-1=3 & \dfrac{0,\!0159}{3} = 0,\!0053 \\ \text{Galat} & 0,\!0062 & 20-4 = 16 & \dfrac{0,\!0062}{16} \approx 0,\!0004 \\ \text{Total} & 0,\!0221 & 20-1=19 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{0,\!0053 }{0,\!0004} = 13,\!25.$$Daerah kritis:
Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 4-1=3$ dan $\text{dk}_2 = N-k=20-4=16,$ diperoleh $f_{0,05;~3,~16} \approx 3,\!24.$ Dengan demikian, daerah kritis terletak di $f > 3,\!24.$
Keputusan:
Karena $f_{\text{hitung}}= 13,\!25 > 3,\!24 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji jatuh pada daerah kritis. Dengan demikian, $H_0$ ditolak.
Kesimpulan:
Jadi, cukup bukti untuk mengatakan bahwa terdapat perbedaan rata-rata jumlah ozon di antara lokasi-lokasi tersebut.
Soal Nomor 9
Beberapa pengusaha enggan melakukan rapat di New York karena mahalnya biaya sewa hotel di sana dibandingkan kota-kota lainnya. Seorang peneliti ingin mengetahui apakah terdapat perbedaan signifikan pada biaya sewa hotel-hotel di New York (NY) dibandingkan dengan kota lain, yaitu Los Angeles (LA), Washington DC (DC), dan San Fransisco (SF). Tabel berikut menunjukkan biaya sewa (dalam USD) hotel-hotel di $4$ kota tersebut.
$$\begin{array}{c|ccccc} \textbf{LA} & 119 & 150 & 110 & 79 & 145 & 140 & 165 & 175 \\ \hline \textbf{SF} & 99 & 185 & 265 & 109 & 169 & 99 & 175 \\ \hline \textbf{DC} & 115 & 185 & 166 & 189 & 125 & 64 & 120 \\ \hline \textbf{NY} & 170 & 135 & 185 & 250 & 250 & 170 \end{array}$$Asumsikan keempat populasi berdistribusi normal dan homogen. Ujilah dugaan peneliti tersebut dengan menggunakan taraf signifikansi $5\%.$
Misalkan $X_1, X_2, X_3,$ dan $X_4$ merupakan variabel acak kontinu yang berturut-turut menyatakan biaya sewa hotel (dalam USD) di Kota Los Angeles, San Fransisco, Washington DC, dan New York. Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2, \mu_3,$ dan $\mu_4,$ berturut-turut adalah rata-rata populasi dari biaya sewa hotel (dalam USD) di Kota Los Angeles, San Fransisco, Washington DC, dan New York.
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3 = \mu_4. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N =8+7+7+6=28.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Hotel), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{4.308^2}{28} \approx 662.816,\!5714 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (119^2 + 150^2 + 110^2 + \cdots + 170^2)-662.816,\!5714 = 65.877,\!4286 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{1.083^2}{8} + \dfrac{1.101^2}{7} + \dfrac{964^2}{7}+\dfrac{1.160^2}{6}-662.816,\!5714 \approx 13.989,\!3631 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 65.877,\!4286-13.989,\!3631 = 51.888,\!0655.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 13.989,\!3631 & 4-1=3 & \dfrac{13.989,\!3631}{3} \approx 4.663,\!1210 \\ \text{Galat} & 51.888,\!0655 & 28-4 = 24 & \dfrac{51.888,\!0655 }{24} \approx 2.162,\!0027 \\ \text{Total} & 65.877,\!4286 & 28-1=27 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{4.663,\!1210 }{2.162,\!0027} \approx 2,\!1569.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 4-1=3$ dan $\text{dk}_2 = N-k=28-4=24,$ diperoleh $f_{0,05;~3,~24} \approx 3,\!01.$ Dengan demikian, daerah kritis terletak di $f > 3,\!01.$
Keputusan:
Karena $f_{\text{hitung}}= 2,\!1569 < 3,\!01 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji tidak jatuh pada daerah kritis. Dengan demikian, $H_0$ tidak ditolak.
Kesimpulan:
Jadi, tidak ada perbedaan yang signifikan pada biaya sewa hotel-hotel di New York (NY) dibandingkan dengan kota lain, yaitu Los Angeles (LA), Washington DC (DC), dan San Fransisco (SF).
Baca: Materi, Soal, dan Pembahasan – Uji Kesamaan Varians dari Dua Populasi
Soal Nomor 10
Seorang peneliti melakukan eksperimen untuk membandingkan panjang batang suatu tanaman yang diberi micin dengan kadar $0\%,$ $5\%,$ $10\%,$ $15\%,$ dan $20\%.$ Masing-masing kelompok terdiri atas $4$ ulangan. Panjang batang tanaman (dalam cm) yang diukur dapat dilihat pada tabel berikut.
$$\begin{array}{c|ccccc} \textbf{U} & 0\% & 5\% & 10\% & 15\% & 20\% \\ \hline 1 & 4 & 3 & 5 & 7 & 8 \\ 2 & 3 & 4 & 4 & 8 & 9 \\ 3 & 4 & 5 & 3 & 7 & 8 \\ 4 & 4 & 5 & 5 & 9 & 7 \end{array}$$ Asumsikan kelima populasi berdistribusi normal dan homogen. Dengan taraf signifikansi $5\%,$ ujilah hipotesis yang menyatakan bahwa tidak ada perbedaan rata-rata panjang batang tanaman yang diberi micin dengan $5$ ukuran kadar tersebut.
Misalkan $X_1, X_2,$ $X_3, X_4,$ dan $X_5$ merupakan variabel acak kontinu yang berturut-turut menyatakan panjang batang tanaman tersebut (dalam cm) setelah diberi micin dengan kadar $0\%,$ $5\%,$ $10\%,$ $15\%,$ dan $20\%.$ Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2,$ $\mu_3, \mu_4,$ dan $\mu_5,$ berturut-turut adalah rata-rata populasi dari panjang batang tanaman tersebut (dalam cm) setelah diberi micin dengan kadar $0\%,$ $5\%,$ $10\%,$ $15\%,$ dan $20\%.$
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3 = \mu_4 = \mu_5. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N = 5\times 4 = 20.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Panjang Batang), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{112^2}{20} = 627,\!2 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (4^2 + 3^2 + 5^2 + \cdots + 7^2)-627,\!2= 80,\!8 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{15^2}{4} + \dfrac{17^2}{4} + \dfrac{17^2}{4}+\dfrac{31^2}{4} + \dfrac{32^2}{4}-627,\!2 = 69,\!8 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 80,\!8-69,\!8 = 11.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 69,\!8 & 5-1=4 & \dfrac{69,\!8}{4} = 17,\!45 \\ \text{Galat} & 11 & 20-5 = 15 & \dfrac{11}{15} \approx 0,\!7333 \\ \text{Total} & 80,\!8 & 20-1=19 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{17,\!45}{0,\!7333} \approx 23,\!7956.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 5-1=4$ dan $\text{dk}_2 = N-k=20-5=15,$ diperoleh $f_{0,05;~4,~15} \approx 3,\!06.$ Dengan demikian, daerah kritis terletak di $f > 3,\!06.$
Keputusan:
Karena $f_{\text{hitung}}= 23,\!7956 > 3,\!06 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji jatuh pada daerah kritis. Dengan demikian, $H_0$ ditolak.
Kesimpulan:
Jadi, ada perbedaan yang signifikan dari rata-rata pertumbuhan panjang batang tanaman tersebut yang diberi micin dengan kadar $0\%,$ $5\%,$ $10\%,$ $15\%,$ dan $20\%.$
Soal Nomor 11
Data berikut menginformasikan banyak bungkus mi instan merek $A, B, C, D,$ dan $E$ yang terjual di suatu pasar swalayan pada $8$ hari yang dipilih secara acak.
$$\begin{array}{c|ccccccccc} \textbf{Merek A} & 21 & 35 & 32 & 28 & 14 & 47 & 25 & 38 \\ \hline \textbf{Merek B} & 35 & 12 & 27 & 41 & 19 & 23 & 31 & 20 \\ \hline \textbf{Merek C} & 45 & 60 & 33 & 36 & 31 & 40 & 43 & 48 \\ \hline \textbf{Merek D} & 32 & 53 & 29 & 42 & 40 & 23 & 35 & 42 \\ \hline \textbf{Merek E} & 45 & 29 & 31 & 22 & 36 & 29 & 42 & 30 \end{array}$$Asumsikan kelima populasi berdistribusi normal dan homogen. Dengan taraf signifikansi $5\%,$ apakah rata-rata penjualan $5$ merek mi instan di pasar swalayan tersebut sama?
Misalkan $X_1, X_2,$ $X_3, X_4,$ dan $X_5$ merupakan variabel acak diskret yang berturut-turut menyatakan banyak bungkus mi instan merek $A, B, C, D,$ dan $E$ yang terjual pada satu hari di pasar swalayan tersebut. Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2,$ $\mu_3, \mu_4,$ dan $\mu_5,$ berturut-turut adalah rata-rata populasi dari banyak bungkus mi instan merek $A, B, C, D,$ dan $E$ yang terjual pada satu hari di pasar swalayan tersebut.
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3 = \mu_4 = \mu_5. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N = 5\times 8 = 40.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Mi Instan), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{1.344^2}{40} = 45.158,\!4 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (21^2 + 35^2 + 32^2 + \cdots + 30^2)-45.158,\!4= 4.211,\!6 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{240^2}{8} + \dfrac{208^2}{8} + \dfrac{336^2}{8}+\dfrac{296^2}{8} + \dfrac{264^2}{8}-45.158,\!4 = 1.225,\!6 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 4.211,\!6-1.225,\!6 = 2.986.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 1.225,\!6 & 5-1=4 & \dfrac{1.225,\!6}{4} = 306,\!4 \\ \text{Galat} & 2.986 & 40-5 = 35 & \dfrac{2.986}{35} \approx 85,\!3143 \\ \text{Total} & 4.211,\!6 & 40-1=39 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{306,\!4}{85,\!3143} \approx 3,\!5914.$$Daerah kritis: Untuk taraf signifikansi $\alpha = 5\% = 0,\!05$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 5-1=4$ dan $\text{dk}_2 = N-k=40-5=35,$ diperoleh $f_{0,05;~4,~35} \approx 2,\!64.$ Dengan demikian, daerah kritis terletak di $f > 2,\!64.$
Keputusan:
Karena $f_{\text{hitung}}= 3,\!5914 > 2,\!64 = f_{\text{tabel}},$ disimpulkan bahwa statistik uji jatuh pada daerah kritis. Dengan demikian, $H_0$ ditolak.
Kesimpulan:
Jadi, rata-rata penjualan $5$ merek mi instan di pasar swalayan tersebut tidak sama, melainkan memiliki perbedaan yang signifikan.
Soal Nomor 12
Seorang insinyur sedang meneliti kekuatan tekan beton dari empat teknik pencampuran yang berbeda (dalam pounds per square inch [psi]). Data berikut merupakan data yang dikumpulkan oleh insinyir tersebut.
$$\begin{array}{c|cccc} \text{Teknik Pencampuran A} & 3.129 & 3.000 & 2.865 & 2.890 \\ \hline \text{Teknik Pencampuran B} & 3.200 & 3.300 & 2.975 & 3.150 \\ \hline \text{Teknik Pencampuran C} & 2.800 & 2.900 & 2.985 & 3.050 \\ \hline \text{Teknik Pencampuran D} & 2.600 & 2.700 & 2.600 & 2.765 \end{array}$$Berdasarkan penelitian sebelumnya, empat teknik pencampuran tersebut memiliki performansi yang tidak berbeda. Asumsikan bahwa data berasal dari distribusi norma dan setiap teknik memiliki varians kekuatan tekan beton yang hampir sama. Di antara tingkat signifikansi $1\%, 5\%,$ dan $10\%,$ manakah tingkat signifikansi minimum yang harus digunakan agar hasil penelitian sebelumnya tersebut didukung oleh sampel yang ada?
Misalkan $X_1, X_2, X_3,$ dan $X_4$ merupakan variabel acak kontinu yang berturut-turut menyatakan kekuatan tekan beton (dalam psi) dari teknik pencampuran $A, B, C,$ dan $D.$ Ini merupakan kasus uji kesamaan rata-rata lebih dari dua populasi dengan satu faktor. Oleh karena itu, akan digunakan ANAVA satu jalur.
Rumusan hipotesis:
Parameter populasi yang akan diuji adalah $\mu_1, \mu_2, \mu_3,$ dan $\mu_4,$ berturut-turut adalah rata-rata populasi dari kekuatan tekan beton (dalam psi) dari teknik pencampuran $A, B, C,$ dan $D.$
$$\begin{array}{cc} \text{Hipotesis nol} & H_0: \mu_1 = \mu_2 = \mu_3 = \mu_4. \\ \text{Hipotesis alternatif} & H_1: \mu_i \ne \mu_j,~~i \ne j \\ \end{array}$$Statistik uji:
Banyak observasi seluruhnya adalah $N =4\times 4=16.$ Kemudian, berdasarkan perhitungan dengan bantuan Excel (lihat sheet Beton), diperoleh
$$\begin{aligned} \text{FK} & = \dfrac{\left(\displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}\right)^2}{N} = \dfrac{46.909^2}{16} = 137.528.392,\!5625 \\ \text{JKT} & = \displaystyle \sum_{i=1}^k \sum_{j=1}^{n_i} y_{ij}^2-\text{FK} = (3.129^2 + 3.000^2 + 2.865^2 + \cdots + 2.765^2)-137.528.392,\!5625 = 643.648,\!4375 \\ \text{JKP} & = \displaystyle \sum_{i=1}^k \dfrac{T_i^2}{n_i}-\text{FK} = \dfrac{11.884^2}{4} + \dfrac{12.625^2}{4} + \dfrac{11.735^2}{4}+\dfrac{10.665^2}{4}-137.528.392,\!5625 = 489.740,\!1875 \\ \text{JKG} & = \text{JKT}-\text{JKP} = 643.648,\!4375-489.740,\!1875 = 153.908,\!2500.\end{aligned}$$Setelah itu, tabel ANAVA dapat dibuat sebagai berikut.
$$\begin{array}{cccc} \hline \textbf{Sumber Varians} & \textbf{Jumlah Kuadrat} & \textbf{Derajat Kebebasan} & \textbf{Rata-Rata Kuadrat} \\ \hline \text{Perlakuan} & 489.740,\!1875 & 4-1=3 & \dfrac{489.740,\!1875}{3} \approx 163.246,\!7292 \\ \text{Galat} & 153.908,\!2500 & 16-4 = 12 & \dfrac{153.908,\!2500 }{24} \approx 12.825,\!6875 \\ \text{Total} & 643.648,\!4375 & 16-1=15 & \\ \hline \end{array}$$Dari tabel ANAVA, diperoleh $$f_{\text{hitung}} = \dfrac{163.246,\!7292 }{12.825,\!6875} \approx 12,\!7281.$$Daerah kritis dan Keputusan: Misalkan taraf signifikansi yang dipilih adalah $\alpha.$ Dalam kasus ini, kita menginginkan $H_0$ ditolak sehingga harus memenuhi $f_{\text{hitung}} = 12,\!7281 > f_{\text{tabel}}.$ Karena yang diinginkan adalah taraf signifikansi minimum, pilih $\alpha = 1\%.$ Dapat diperiksa bahwa untuk taraf signifikansi $\alpha = 1\%$ dengan derajat kebebasan $\text{dk}_1 = k-1 = 4-1=3$ dan $\text{dk}_2 = N-k=16-4=12,$ nilai $f_{0,01;~3,~12} \approx 5,\!95.$ Dengan demikian, daerah kritis terletak di $f > 5,\!95.$ Akibatnya, $H_0$ bakal ditolak karena $f_{\text{hitung}} = 12,\!7281 > 5,\!95 = f_{\text{tabel}}.$
Jadi, taraf signifikansi minimum yang harus digunakan agar hasil penelitian sebelumnya tersebut didukung oleh sampel yang ada adalah $\boxed{1\%}.$
Baca: Soal dan Pembahasan – Regresi Linear Sederhana