Metode Statistika: Cheatsheet Komprehensif
Cheatsheet lengkap untuk memahami metode statistika dari konsep dasar hingga aplikasi inferensia.
Prerequisite
Integral
Konsep: Integral digunakan untuk menghitung luas di bawah kurva, yang penting dalam menghitung peluang untuk peubah acak kontinu.
Rumus Dasar:
- Integral tak tentu: $\int f(x) dx = F(x) + C$
- Integral tentu: $\int_a^b f(x) dx = F(b) - F(a)$
- Integral untuk peluang: $P(a \leq X \leq b) = \int_a^b f(x) dx$ dimana $f(x)$ adalah fungsi kepekatan peluang
Contoh: Untuk menghitung peluang peubah acak kontinu $X$ antara 2 dan 5: $$P(2 \leq X \leq 5) = \int_2^5 f(x) dx$$
Peluang (Probability)
Konsep: Peluang mengukur kemungkinan terjadinya suatu kejadian, dengan nilai antara 0 (mustahil) dan 1 (pasti).
Aksioma Peluang:
- $P(A) \geq 0$ untuk setiap kejadian $A$
- $P(S) = 1$ dimana $S$ adalah ruang contoh
- Untuk kejadian saling lepas: $P(A \cup B) = P(A) + P(B)$
Contoh: Peluang munculnya angka genap pada pelemparan dadu: $$P(\text{genap}) = P(2) + P(4) + P(6) = \frac{1}{6} + \frac{1}{6} + \frac{1}{6} = \frac{1}{2}$$
Aturan Sturges (Untuk Penyajian Data Numerik)
Konsep: Aturan untuk menentukan banyaknya kelas interval dalam histogram atau tabel distribusi frekuensi.
Rumus: $$k = 1 + 3.322 \log_{10}(n)$$
dimana:
- $k$ = banyaknya kelas
- $n$ = banyaknya data
Contoh: Jika memiliki 100 data: $$k = 1 + 3.322 \log_{10}(100) = 1 + 3.322 \times 2 = 7.644 \approx 8 \text{ kelas}$$
Panjang Kelas: $$\text{Panjang kelas} = \frac{\text{Range}}{k} = \frac{X_{\max} - X_{\min}}{k}$$
Sebaran Normal
Sebaran Normal Baku (Standard Normal Distribution)
Konsep: Sebaran normal dengan rata-rata $\mu = 0$ dan simpangan baku $\sigma = 1$. Dilambangkan dengan $Z \sim N(0, 1)$.
Fungsi Kepekatan Peluang: $$f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}$$
Transformasi ke Normal Baku: $$Z = \frac{X - \mu}{\sigma}$$
dimana:
- $X$ = peubah acak normal dengan $\mu$ dan $\sigma$
- $Z$ = peubah acak normal baku
Contoh: Jika $X \sim N(100, 15^2)$, untuk mengubah $X = 115$ ke normal baku: $$Z = \frac{115 - 100}{15} = \frac{15}{15} = 1$$
Tabel Normal Baku (Nilai Peluang Z)
Konsep: Tabel yang memberikan nilai peluang kumulatif $P(Z \leq z)$ untuk berbagai nilai $z$.
Cara Membaca:
- Baris menunjukkan digit pertama dan kedua setelah koma
- Kolom menunjukkan digit ketiga setelah koma
- Nilai di dalam tabel adalah $P(Z \leq z)$
Contoh:
- $P(Z \leq 1.96) = 0.9750$ (dari tabel)
- $P(Z \leq -1.96) = 0.0250$ (menggunakan simetri: $1 - 0.9750$)
Peluang Sebaran Normal
Konsep: Menghitung peluang untuk sebaran normal menggunakan integral atau tabel normal baku.
Rumus Umum: $$P(a \leq X \leq b) = P\left(\frac{a-\mu}{\sigma} \leq Z \leq \frac{b-\mu}{\sigma}\right)$$
Langkah-langkah:
- Transformasi: $Z = \frac{X - \mu}{\sigma}$
- Gunakan tabel normal baku
- Hitung peluang dengan sifat: $P(a \leq Z \leq b) = P(Z \leq b) - P(Z \leq a)$
Contoh: Jika $X \sim N(50, 10^2)$, hitung $P(45 \leq X \leq 60)$:
-
Transformasi:
- $Z_1 = \frac{45-50}{10} = -0.5$
- $Z_2 = \frac{60-50}{10} = 1.0$
-
Dari tabel:
- $P(Z \leq -0.5) = 0.3085$
- $P(Z \leq 1.0) = 0.8413$
-
Peluang: $$P(45 \leq X \leq 60) = P(-0.5 \leq Z \leq 1.0) = 0.8413 - 0.3085 = 0.5328$$
Transformasi ke Normal Baku (Z-Score)
Nilai Kritis dari Sebaran Normal
Konsep: Nilai $z_\alpha$ yang memenuhi $P(Z > z_\alpha) = \alpha$ atau $P(Z \leq z_\alpha) = 1 - \alpha$.
Notasi:
- $z_\alpha$ = nilai kritis untuk peluang $\alpha$ di ekor kanan
- $z_{1-\alpha}$ = nilai kritis untuk peluang $\alpha$ di ekor kiri
Nilai Kritis Umum:
- $z_{0.05} = 1.645$ (untuk $\alpha = 0.05$ ekor kanan)
- $z_{0.025} = 1.96$ (untuk $\alpha = 0.025$ ekor kanan, atau $\alpha = 0.05$ dua ekor)
- $z_{0.01} = 2.326$ (untuk $\alpha = 0.01$ ekor kanan)
- $z_{0.005} = 2.576$ (untuk $\alpha = 0.005$ ekor kanan, atau $\alpha = 0.01$ dua ekor)
Contoh: Untuk uji hipotesis dua ekor dengan $\alpha = 0.05$:
- Daerah penolakan: $Z < -1.96$ atau $Z > 1.96$
- Daerah penerimaan: $-1.96 \leq Z \leq 1.96$
Pengantar Pendugaan Parameter
Populasi (p) vs Sampel (p̂)
Konsep:
- Populasi: Seluruh objek yang menjadi perhatian penelitian. Parameter populasi dilambangkan dengan huruf Yunani (misal: $\mu$, $\sigma$, $p$).
- Sampel: Bagian dari populasi yang diambil untuk dianalisis. Statistik sampel dilambangkan dengan huruf Latin (misal: $\bar{x}$, $s$, $\hat{p}$).
Contoh:
- Populasi: Semua mahasiswa di universitas (parameter: $\mu$ = rata-rata tinggi badan)
- Sampel: 100 mahasiswa yang diukur (statistik: $\bar{x}$ = rata-rata tinggi badan sampel)
Populasi vs Sampel
Variabel (Peubah) vs Parameter (Penduga) vs Statistik
Konsep:
- Peubah (Variable): Karakteristik yang diukur dari setiap anggota populasi atau sampel (misal: tinggi badan, berat badan).
- Parameter: Nilai numerik yang menggambarkan karakteristik populasi (misal: $\mu$, $\sigma^2$, $p$).
- Statistik: Nilai numerik yang dihitung dari sampel untuk menduga parameter (misal: $\bar{x}$, $s^2$, $\hat{p}$).
Tabel Perbandingan:
| Konsep | Populasi | Sampel |
|---|---|---|
| Rata-rata | $\mu$ (parameter) | $\bar{x}$ (statistik) |
| Ragam | $\sigma^2$ (parameter) | $s^2$ (statistik) |
| Proporsi | $p$ (parameter) | $\hat{p}$ (statistik) |
| Simpangan Baku | $\sigma$ (parameter) | $s$ (statistik) |
Sifat Penduga Titik
Konsep: Karakteristik yang diharapkan dari penduga yang baik.
1. Tidak Bias (Unbiased) Penduga $\hat{\theta}$ dikatakan tidak bias jika: $$E(\hat{\theta}) = \theta$$
Contoh:
- $\bar{X}$ adalah penduga tidak bias untuk $\mu$: $E(\bar{X}) = \mu$
- $S^2$ adalah penduga tidak bias untuk $\sigma^2$: $E(S^2) = \sigma^2$
2. Efisien Penduga dengan ragam terkecil di antara semua penduga tidak bias.
3. Konsisten Penduga yang semakin mendekati parameter sebenarnya ketika ukuran sampel meningkat: $$\lim_{n \to \infty} P(|\hat{\theta} - \theta| < \epsilon) = 1$$
4. Cukup (Sufficient) Penduga yang memuat semua informasi tentang parameter dari sampel.
Penduga Selang
Penduga Selang (Selang Kepercayaan)
Konsep: Interval yang diharapkan memuat parameter populasi dengan tingkat kepercayaan tertentu.
Rumus Umum: $$\text{Penduga titik} \pm \text{Margin of error}$$
Tingkat Kepercayaan: Peluang bahwa selang kepercayaan memuat parameter sebenarnya (biasanya 90%, 95%, atau 99%).
Interpretasi: Jika kita membuat 100 selang kepercayaan 95%, maka sekitar 95 di antaranya akan memuat parameter sebenarnya.
Visualisasi Selang Kepercayaan 95%
Margin of Error
Konsep: Setengah dari lebar selang kepercayaan, menunjukkan ketidakpastian dalam pendugaan.
Rumus: $$\text{Margin of error} = z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}$$
atau untuk ragam tidak diketahui: $$\text{Margin of error} = t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}$$
Faktor yang Mempengaruhi:
- Tingkat kepercayaan (semakin tinggi, semakin besar margin of error)
- Simpangan baku populasi (semakin besar, semakin besar margin of error)
- Ukuran sampel (semakin besar, semakin kecil margin of error)
Contoh: Untuk $\bar{x} = 50$, $s = 10$, $n = 100$, tingkat kepercayaan 95%:
- $z_{0.025} = 1.96$
- Margin of error = $1.96 \times \frac{10}{\sqrt{100}} = 1.96 \times 1 = 1.96$
- Selang kepercayaan: $50 \pm 1.96$ atau $(48.04, 51.96)$
Contoh Kasus Selang Kepercayaan
Contoh 1: Rata-rata Populasi (Ragam Diketahui) Sebuah pabrik ingin menduga rata-rata berat produk. Dari sampel 50 produk, diperoleh $\bar{x} = 250$ gram. Diketahui $\sigma = 20$ gram. Buat selang kepercayaan 95% untuk $\mu$.
Penyelesaian:
- $n = 50$, $\bar{x} = 250$, $\sigma = 20$, $\alpha = 0.05$
- $z_{0.025} = 1.96$
- Margin of error = $1.96 \times \frac{20}{\sqrt{50}} = 1.96 \times 2.828 = 5.54$
- Selang kepercayaan: $250 \pm 5.54$ atau $(244.46, 255.54)$
Interpretasi: Dengan tingkat kepercayaan 95%, kita yakin bahwa rata-rata berat produk populasi berada antara 244.46 dan 255.54 gram.
Statistika
Statistika Deskriptif vs Statistika Inferensia
Statistika Deskriptif:
- Menggambarkan dan meringkas data yang dikumpulkan
- Tidak membuat kesimpulan tentang populasi
- Contoh: menghitung rata-rata, median, membuat grafik
Statistika Inferensia:
- Menarik kesimpulan tentang populasi berdasarkan sampel
- Melibatkan pendugaan parameter dan uji hipotesis
- Contoh: selang kepercayaan, uji hipotesis, analisis regresi
Perbandingan:
| Aspek | Deskriptif | Inferensia |
|---|---|---|
| Tujuan | Menggambarkan data | Menarik kesimpulan |
| Cakupan | Hanya data yang ada | Populasi yang lebih luas |
| Metode | Grafik, tabel, ukuran ringkasan | Pendugaan, uji hipotesis |
| Ketidakpastian | Tidak ada | Ada (margin of error, p-value) |
Skala Pengukuran Peubah
Konsep: Klasifikasi peubah berdasarkan sifat dan operasi matematika yang dapat dilakukan.
1. Kategorik (Categorical)
- Nominal: Kategori tanpa urutan (contoh: jenis kelamin, warna, agama)
- Operasi: hanya menghitung frekuensi
- Contoh: Laki-laki, Perempuan
- Ordinal: Kategori dengan urutan (contoh: tingkat pendidikan, rating)
- Operasi: menghitung frekuensi, median
- Contoh: SD, SMP, SMA, S1, S2
2. Numerik (Numerical)
- Interval: Memiliki urutan dan jarak yang sama, tetapi tidak ada nol mutlak (contoh: suhu dalam Celsius)
- Operasi: penjumlahan, pengurangan, mean
- Contoh: Suhu 20°C vs 30°C (beda 10°C, tapi 0°C bukan “tidak ada suhu”)
- Rasio: Memiliki semua sifat interval + ada nol mutlak (contoh: berat, tinggi, pendapatan)
- Operasi: semua operasi matematika termasuk perkalian dan pembagian
- Contoh: Berat 0 kg berarti tidak ada berat, berat 100 kg adalah 2× dari 50 kg
Hierarki Skala Pengukuran
Peubah vs Data
Peubah (Variable): Karakteristik yang diukur dari setiap anggota populasi atau sampel.
Data: Hasil pengukuran atau pengamatan dari peubah.
Contoh:
- Peubah: Tinggi badan
- Data: 170 cm, 165 cm, 175 cm, 180 cm, …
Pengumpulan Data
1. Eksperimen (Experiment)
- Peneliti mengontrol kondisi dan memanipulasi variabel
- Dapat menentukan hubungan sebab-akibat
- Contoh: uji coba obat baru dengan kelompok kontrol dan perlakuan
2. Survei (Survey)
- Mengumpulkan data dari responden melalui kuesioner atau wawancara
- Tidak memanipulasi variabel
- Contoh: survei kepuasan pelanggan, survei pendapat publik
3. Administratif (Administrative)
- Data yang dikumpulkan untuk keperluan administrasi atau operasional
- Bukan untuk tujuan penelitian
- Contoh: data penjualan, data absensi, data transaksi bank
Big Data
Konsep: Data dalam volume besar yang memerlukan teknologi khusus untuk pengolahan.
3V Big Data:
-
Volume: Jumlah data yang sangat besar
- Contoh: jutaan transaksi per hari, terabyte hingga petabyte data
-
Variety: Beragam jenis dan format data
- Contoh: teks, gambar, video, audio, data terstruktur dan tidak terstruktur
-
Velocity: Kecepatan data masuk dan perlu diproses
- Contoh: data real-time dari sensor, streaming data, update setiap detik
Statistika Deskriptif
Penyajian Data Kategorik
1. Tabel Frekuensi
Tabel Frekuensi Mutlak: Menampilkan jumlah kejadian untuk setiap kategori.
| Kategori | Frekuensi |
|---|---|
| Laki-laki | 45 |
| Perempuan | 55 |
| Total | 100 |
Tabel Frekuensi Relatif: Menampilkan proporsi atau persentase.
| Kategori | Frekuensi | Frekuensi Relatif | Persentase |
|---|---|---|---|
| Laki-laki | 45 | 0.45 | 45% |
| Perempuan | 55 | 0.55 | 55% |
| Total | 100 | 1.00 | 100% |
2. Grafik
Diagram Batang (Bar Chart):
- Sumbu X: kategori
- Sumbu Y: frekuensi atau persentase
- Cocok untuk membandingkan kategori
Diagram Lingkaran (Pie Chart):
- Menampilkan proporsi setiap kategori
- Total = 100%
- Cocok untuk melihat komposisi
Contoh: Data jenis kelamin: Laki-laki (45), Perempuan (55)
- Diagram batang: batang dengan tinggi 45 dan 55
- Diagram lingkaran: sektor 45% dan 55%
Penyajian Data Numerik
1. Tabel Distribusi Frekuensi
Langkah-langkah:
- Tentukan banyak kelas (gunakan Aturan Sturges)
- Tentukan panjang kelas
- Tentukan batas kelas
- Hitung frekuensi setiap kelas
Contoh: Data tinggi badan (cm): 150, 155, 160, 165, 170, 175, 180, 185, 190
- $n = 9$, maka $k = 1 + 3.322 \log_{10}(9) \approx 4$
- Range = 190 - 150 = 40
- Panjang kelas = 40/4 = 10
| Kelas | Frekuensi |
|---|---|
| 150-159 | 2 |
| 160-169 | 2 |
| 170-179 | 3 |
| 180-189 | 2 |
2. Grafik
Histogram:
- Sumbu X: interval kelas
- Sumbu Y: frekuensi atau kepadatan
- Batang saling menempel (kontinu)
Poligon Frekuensi:
- Garis yang menghubungkan titik tengah setiap kelas
- Titik tengah = (batas bawah + batas atas) / 2
Ogive (Kurva Frekuensi Kumulatif):
- Menampilkan frekuensi kumulatif
- Sumbu X: batas atas kelas
- Sumbu Y: frekuensi kumulatif
Ukuran Peringkasan Data
Ukuran Pemusatan
1. Mean (Rata-rata)
Populasi ($\mu$): $$\mu = \frac{\sum_{i=1}^{N} x_i}{N}$$
Sampel ($\bar{x}$): $$\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}$$
Contoh: Data: 10, 20, 30, 40, 50 $$\bar{x} = \frac{10 + 20 + 30 + 40 + 50}{5} = \frac{150}{5} = 30$$
Mean Tertimbang: $$\bar{x}_w = \frac{\sum w_i x_i}{\sum w_i}$$
2. Median
Konsep: Nilai tengah setelah data diurutkan.
Langkah:
- Urutkan data dari terkecil ke terbesar
- Jika $n$ ganjil: median = nilai ke-$\frac{n+1}{2}$
- Jika $n$ genap: median = rata-rata nilai ke-$\frac{n}{2}$ dan $\frac{n}{2}+1$
Contoh:
- Data ganjil: 10, 20, 30, 40, 50 → Median = 30 (nilai ke-3)
- Data genap: 10, 20, 30, 40 → Median = $\frac{20+30}{2} = 25$
3. Modus
Konsep: Nilai yang paling sering muncul.
Contoh: Data: 5, 7, 7, 9, 10, 10, 10, 12
- Modus = 10 (muncul 3 kali)
Catatan: Data bisa memiliki lebih dari satu modus (bimodal, multimodal) atau tidak ada modus.
Ukuran Penyebaran
1. Kisaran (Range)
Rumus: $$\text{Range} = X_{\max} - X_{\min}$$
Contoh: Data: 10, 20, 30, 40, 50
- Range = 50 - 10 = 40
2. Inter Quartile Range (IQR)
Konsep: Selisih antara kuartil ketiga dan kuartil pertama.
Rumus: $$\text{IQR} = Q_3 - Q_1$$
Contoh: Jika $Q_1 = 25$ dan $Q_3 = 75$, maka IQR = 75 - 25 = 50
3. Ragam (Variance) dan Simpangan Baku (Standard Deviation)
Ragam Populasi ($\sigma^2$): $$\sigma^2 = \frac{\sum_{i=1}^{N} (x_i - \mu)^2}{N}$$
Ragam Sampel ($s^2$): $$s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}$$
Simpangan Baku:
- Populasi: $\sigma = \sqrt{\sigma^2}$
- Sampel: $s = \sqrt{s^2}$
Contoh: Data: 10, 20, 30, 40, 50
- $\bar{x} = 30$
- $(10-30)^2 = 400$, $(20-30)^2 = 100$, $(30-30)^2 = 0$, $(40-30)^2 = 100$, $(50-30)^2 = 400$
- $s^2 = \frac{400 + 100 + 0 + 100 + 400}{5-1} = \frac{1000}{4} = 250$
- $s = \sqrt{250} = 15.81$
Rumus Alternatif (Lebih Mudah Dihitung): $$s^2 = \frac{\sum x_i^2 - n\bar{x}^2}{n-1}$$
Kuartil
Konsep: Nilai yang membagi data menjadi 4 bagian sama besar.
Kuartil:
- $Q_1$ (Kuartil pertama): 25% data di bawahnya
- $Q_2$ (Kuartil kedua): Sama dengan median, 50% data di bawahnya
- $Q_3$ (Kuartil ketiga): 75% data di bawahnya
Cara Menghitung:
- Urutkan data
- Tentukan posisi kuartil:
- $Q_1$: posisi = $\frac{n+1}{4}$
- $Q_2$: posisi = $\frac{n+1}{2}$ (median)
- $Q_3$: posisi = $\frac{3(n+1)}{4}$
Contoh: Data: 10, 20, 30, 40, 50, 60, 70, 80, 90
- $n = 9$
- $Q_1$: posisi = $\frac{9+1}{4} = 2.5$ → nilai antara data ke-2 dan ke-3 = $\frac{20+30}{2} = 25$
- $Q_2$: posisi = $\frac{9+1}{2} = 5$ → data ke-5 = 50
- $Q_3$: posisi = $\frac{3(9+1)}{4} = 7.5$ → nilai antara data ke-7 dan ke-8 = $\frac{70+80}{2} = 75$
IQR dan Boxplot
IQR (Inter Quartile Range): $$\text{IQR} = Q_3 - Q_1$$
Boxplot (Diagram Kotak-Garis): Menampilkan 5 ringkasan data:
- Minimum ($X_{\min}$)
- $Q_1$
- Median ($Q_2$)
- $Q_3$
- Maximum ($X_{\max}$)
Komponen Boxplot:
- Kotak: Dari $Q_1$ sampai $Q_3$ (mengandung IQR)
- Garis di dalam kotak: Median
- Whisker (kumis):
- Bawah: dari $Q_1$ sampai $X_{\min}$ (atau $Q_1 - 1.5 \times \text{IQR}$ jika ada pencilan)
- Atas: dari $Q_3$ sampai $X_{\max}$ (atau $Q_3 + 1.5 \times \text{IQR}$ jika ada pencilan)
- Pencilan (Outlier): Data di luar $Q_1 - 1.5 \times \text{IQR}$ atau $Q_3 + 1.5 \times \text{IQR}$
Contoh: Jika $Q_1 = 25$, $Q_3 = 75$, maka:
- IQR = 75 - 25 = 50
- Batas bawah pencilan = 25 - 1.5 × 50 = 25 - 75 = -50
- Batas atas pencilan = 75 + 1.5 × 50 = 75 + 75 = 150
- Data di luar (-50, 150) adalah pencilan
Anatomi Boxplot (Diagram Kotak-Garis)
Peluang
Deterministik vs Probabilistik
Deterministik:
- Hasil pasti dan dapat diprediksi
- Contoh: Hukum gravitasi, $2 + 2 = 4$
Probabilistik:
- Hasil tidak pasti, hanya dapat dihitung peluangnya
- Contoh: Hasil pelemparan dadu, cuaca besok
Peluang = Ruang Kejadian / Ruang Contoh
Konsep:
- Ruang Contoh (Sample Space): Himpunan semua kemungkinan hasil
- Ruang Kejadian (Event): Himpunan hasil yang diinginkan
Rumus Klasik: $$P(A) = \frac{n(A)}{n(S)} = \frac{\text{banyaknya hasil kejadian A}}{\text{banyaknya semua kemungkinan hasil}}$$
Contoh: Pelemparan dadu:
- Ruang contoh $S = {1, 2, 3, 4, 5, 6}$, $n(S) = 6$
- Kejadian A: muncul angka genap, $A = {2, 4, 6}$, $n(A) = 3$
- $P(A) = \frac{3}{6} = \frac{1}{2}$
Permutasi vs Kombinasi
Permutasi (Memerhatikan Urutan): Banyaknya cara menyusun $r$ objek dari $n$ objek dengan memerhatikan urutan.
Rumus: $$P(n, r) = \frac{n!}{(n-r)!} = n \times (n-1) \times … \times (n-r+1)$$
Contoh: Berapa banyak cara menyusun 3 buku dari 5 buku berbeda? $$P(5, 3) = \frac{5!}{(5-3)!} = \frac{5!}{2!} = 5 \times 4 \times 3 = 60$$
Kombinasi (Tidak Memerhatikan Urutan): Banyaknya cara memilih $r$ objek dari $n$ objek tanpa memerhatikan urutan.
Rumus: $$C(n, r) = \binom{n}{r} = \frac{n!}{r!(n-r)!}$$
Contoh: Berapa banyak cara memilih 3 buku dari 5 buku (urutan tidak penting)? $$C(5, 3) = \frac{5!}{3!(5-3)!} = \frac{5!}{3!2!} = \frac{5 \times 4}{2 \times 1} = 10$$
Perbedaan:
- Permutasi: ABC ≠ ACB (urutan penting)
- Kombinasi: ABC = ACB (urutan tidak penting)
Aksioma Peluang
1. Non-negatif: $$P(A) \geq 0 \text{ untuk setiap kejadian } A$$
2. Normalisasi: $$P(S) = 1 \text{ dimana } S \text{ adalah ruang contoh}$$
3. Aditivitas: Untuk kejadian saling lepas (mutually exclusive): $$P(A \cup B) = P(A) + P(B)$$
Umum untuk kejadian saling lepas: $$P(A_1 \cup A_2 \cup … \cup A_n) = P(A_1) + P(A_2) + … + P(A_n)$$
Contoh: Pelemparan dadu:
- $P(\text{genap}) = P(2) + P(4) + P(6) = \frac{1}{6} + \frac{1}{6} + \frac{1}{6} = \frac{1}{2}$
Peluang Komplemen
Konsep: Peluang kejadian tidak terjadi.
Rumus: $$P(A^c) = 1 - P(A)$$
dimana $A^c$ adalah komplemen dari $A$ (kejadian $A$ tidak terjadi).
Contoh: Jika peluang hujan $P(\text{hujan}) = 0.3$, maka: $$P(\text{tidak hujan}) = 1 - 0.3 = 0.7$$
Penjumlahan Peluang
1. Kejadian Saling Lepas (Mutually Exclusive): $$P(A \cup B) = P(A) + P(B)$$
Contoh: Peluang muncul angka 1 atau 2 pada dadu: $$P(1 \text{ atau } 2) = P(1) + P(2) = \frac{1}{6} + \frac{1}{6} = \frac{1}{3}$$
2. Kejadian Tidak Saling Lepas: $$P(A \cup B) = P(A) + P(B) - P(A \cap B)$$
Contoh: Dari 100 siswa: 60 suka matematika, 40 suka fisika, 30 suka keduanya.
- $P(\text{matematika}) = 0.6$
- $P(\text{fisika}) = 0.4$
- $P(\text{matematika dan fisika}) = 0.3$
- $P(\text{matematika atau fisika}) = 0.6 + 0.4 - 0.3 = 0.7$
Perkalian Peluang
1. Kejadian Bebas (Independent): $$P(A \cap B) = P(A) \times P(B)$$
Contoh: Pelemparan 2 koin:
- $P(\text{koin 1 kepala}) = \frac{1}{2}$
- $P(\text{koin 2 kepala}) = \frac{1}{2}$
- $P(\text{keduanya kepala}) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4}$
2. Kejadian Tidak Bebas (Dependent): $$P(A \cap B) = P(A) \times P(B|A) = P(B) \times P(A|B)$$
dimana $P(B|A)$ adalah peluang $B$ terjadi jika $A$ sudah terjadi.
Contoh: Dari 10 bola (6 merah, 4 biru), ambil 2 tanpa pengembalian:
- $P(\text{pertama merah}) = \frac{6}{10} = 0.6$
- $P(\text{kedua merah | pertama merah}) = \frac{5}{9}$ (sisa 5 merah dari 9 bola)
- $P(\text{keduanya merah}) = 0.6 \times \frac{5}{9} = \frac{1}{3}$
Peluang Bersyarat
Konsep: Peluang kejadian $A$ terjadi jika kejadian $B$ sudah terjadi.
Rumus: $$P(A|B) = \frac{P(A \cap B)}{P(B)}$$
Contoh: Dari 100 siswa: 60 laki-laki, 40 perempuan. 30 laki-laki suka matematika, 20 perempuan suka matematika.
Peluang suka matematika jika laki-laki:
- $P(\text{matematika | laki-laki}) = \frac{30}{60} = 0.5$
Atau menggunakan rumus:
- $P(\text{matematika} \cap \text{laki-laki}) = \frac{30}{100} = 0.3$
- $P(\text{laki-laki}) = \frac{60}{100} = 0.6$
- $P(\text{matematika | laki-laki}) = \frac{0.3}{0.6} = 0.5$
Peubah Acak dan Sebaran Peluang
Fungsi Peluang Acak dan Sebaran Peluang Acak
Peubah Acak (Random Variable): Fungsi yang memetakan setiap hasil eksperimen ke bilangan real.
Notasi: $X$ untuk peubah acak, $x$ untuk nilai spesifik.
Fungsi Peluang:
- Diskret: $f(x) = P(X = x)$ (fungsi massa peluang)
- Kontinu: $f(x)$ adalah fungsi kepekatan peluang, dimana $P(a \leq X \leq b) = \int_a^b f(x) dx$
Syarat Fungsi Peluang:
- $f(x) \geq 0$ untuk semua $x$
- $\sum_{x} f(x) = 1$ (diskret) atau $\int_{-\infty}^{\infty} f(x) dx = 1$ (kontinu)
Contoh Diskret: Pelemparan 2 koin, $X$ = banyaknya kepala:
- $P(X = 0) = P(\text{TT}) = \frac{1}{4}$
- $P(X = 1) = P(\text{HT, TH}) = \frac{2}{4} = \frac{1}{2}$
- $P(X = 2) = P(\text{HH}) = \frac{1}{4}$
Contoh Kontinu: Sebaran normal dengan $f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$
Klasifikasi Peubah Acak
1. Diskret:
- Nilai yang mungkin adalah bilangan bulat atau dapat dihitung
- Contoh: banyaknya kepala, banyaknya produk cacat, banyaknya kecelakaan
Sebaran Diskret:
- Bernoulli
- Binomial
- Poisson
- Hipergeometrik
- Geometrik
2. Kontinu:
- Nilai yang mungkin adalah bilangan real pada selang tertentu
- Contoh: tinggi badan, berat badan, waktu, suhu
Sebaran Kontinu:
- Normal
- Lognormal
- Eksponensial
- Uniform
- Chi-square
- t-student
- F
Ukuran Pemusatan dan Penyebaran Peubah Acak
Nilai Harapan (Expected Value) - $E(X)$
Konsep: Rata-rata tertimbang dari semua nilai yang mungkin, dengan bobot adalah peluangnya.
Diskret: $$E(X) = \mu = \sum_{x} x \cdot P(X = x) = \sum_{x} x \cdot f(x)$$
Kontinu: $$E(X) = \mu = \int_{-\infty}^{\infty} x \cdot f(x) dx$$
Contoh Diskret: Pelemparan dadu, $X$ = nilai yang muncul: $$E(X) = 1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6} = \frac{21}{6} = 3.5$$
Sifat Nilai Harapan:
- $E(a) = a$ (konstanta)
- $E(aX + b) = aE(X) + b$
- $E(X + Y) = E(X) + E(Y)$
Ragam (Variance) - $\text{Var}(X)$
Rumus: $$\text{Var}(X) = \sigma^2 = E[(X - \mu)^2] = E(X^2) - [E(X)]^2$$
Diskret: $$\text{Var}(X) = \sum_{x} (x - \mu)^2 \cdot f(x) = \sum_{x} x^2 \cdot f(x) - \mu^2$$
Kontinu: $$\text{Var}(X) = \int_{-\infty}^{\infty} (x - \mu)^2 \cdot f(x) dx = \int_{-\infty}^{\infty} x^2 \cdot f(x) dx - \mu^2$$
Simpangan Baku: $$\sigma = \sqrt{\text{Var}(X)}$$
Contoh: Pelemparan dadu:
- $E(X) = 3.5$
- $E(X^2) = 1^2 \times \frac{1}{6} + 2^2 \times \frac{1}{6} + … + 6^2 \times \frac{1}{6} = \frac{91}{6}$
- $\text{Var}(X) = \frac{91}{6} - (3.5)^2 = \frac{91}{6} - 12.25 = \frac{35}{12} \approx 2.92$
- $\sigma = \sqrt{2.92} \approx 1.71$
Sifat Ragam:
- $\text{Var}(a) = 0$
- $\text{Var}(aX + b) = a^2 \text{Var}(X)$
- $\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)$ (jika $X$ dan $Y$ bebas)
Sebaran Peubah Acak Diskret
Sebaran Bernoulli
Konsep: Eksperimen dengan 2 hasil: sukses (1) atau gagal (0).
Contoh: Melamar kerja (diterima = 1, ditolak = 0)
Fungsi Peluang:
$$ P(X = x) = \begin{cases} p & \text{jika } x = 1 \ 1-p & \text{jika } x = 0 \end{cases} $$
atau: $$P(X = x) = p^x (1-p)^{1-x}, \quad x = 0, 1$$
dimana:
- $p$ = peluang sukses
- $1-p$ = peluang gagal
Nilai Harapan: $$E(X) = p$$
Ragam: $$\text{Var}(X) = p(1-p)$$
Contoh: Peluang diterima kerja = 0.3, maka:
- $P(X = 1) = 0.3$ (diterima)
- $P(X = 0) = 0.7$ (ditolak)
- $E(X) = 0.3$
- $\text{Var}(X) = 0.3 \times 0.7 = 0.21$
Sebaran Binomial
Konsep: Banyaknya sukses dalam $n$ percobaan Bernoulli bebas.
Contoh: Melamar ke lebih dari satu tempat kerja, banyaknya yang menerima.
Fungsi Peluang: $$P(X = x) = \binom{n}{x} p^x (1-p)^{n-x}, \quad x = 0, 1, 2, …, n$$
dimana:
- $n$ = banyaknya percobaan
- $p$ = peluang sukses setiap percobaan
- $x$ = banyaknya sukses
Syarat:
- $n$ percobaan bebas
- Setiap percobaan hanya 2 hasil (sukses/gagal)
- Peluang sukses sama untuk setiap percobaan ($p$)
Nilai Harapan: $$E(X) = np$$
Ragam: $$\text{Var}(X) = np(1-p)$$
Contoh: Melamar ke 5 perusahaan, peluang diterima = 0.3. Peluang diterima di 2 perusahaan: $$P(X = 2) = \binom{5}{2} (0.3)^2 (0.7)^3 = 10 \times 0.09 \times 0.343 = 0.3087$$
- $E(X) = 5 \times 0.3 = 1.5$ (rata-rata diterima di 1.5 perusahaan)
- $\text{Var}(X) = 5 \times 0.3 \times 0.7 = 1.05$
Sebaran Poisson
Konsep: Banyaknya kejadian dalam interval waktu atau ruang tertentu, dimana kejadian terjadi secara acak dan bebas.
Contoh: Banyaknya kecelakaan per hari, banyaknya panggilan telepon per jam.
Fungsi Peluang: $$P(X = x) = \frac{\lambda^x e^{-\lambda}}{x!}, \quad x = 0, 1, 2, …$$
dimana:
- $\lambda$ = rata-rata banyaknya kejadian dalam interval
- $e \approx 2.71828$ (bilangan Euler)
Syarat:
- Kejadian terjadi secara acak dan bebas
- Rata-rata banyaknya kejadian ($\lambda$) konstan
- Peluang lebih dari satu kejadian dalam interval sangat kecil mendekati nol
Nilai Harapan: $$E(X) = \lambda$$
Ragam: $$\text{Var}(X) = \lambda$$
Catatan: Pada Poisson, nilai harapan = ragam = $\lambda$
Contoh: Rata-rata 3 kecelakaan per hari. Peluang terjadi 2 kecelakaan hari ini: $$P(X = 2) = \frac{3^2 e^{-3}}{2!} = \frac{9 \times 0.0498}{2} = 0.2241$$
- $E(X) = 3$
- $\text{Var}(X) = 3$
Pendekatan Binomial ke Poisson: Jika $n$ besar dan $p$ kecil, binomial dapat didekati dengan Poisson dengan $\lambda = np$.
Contoh: $n = 1000$, $p = 0.001$, maka $\lambda = 1$:
- Binomial: $P(X = 2) = \binom{1000}{2} (0.001)^2 (0.999)^{998}$
- Poisson: $P(X = 2) = \frac{1^2 e^{-1}}{2!} = \frac{e^{-1}}{2} \approx 0.184$
Perbandingan Sebaran Diskret
Sebaran Peubah Acak Kontinu
Sebaran Normal dan Sifatnya
Konsep: Sebaran yang paling penting dalam statistika, berbentuk lonceng simetris.
Notasi: $X \sim N(\mu, \sigma^2)$
Sifat-sifat:
- Simetris terhadap $\mu$ (rata-rata)
- Berbentuk lonceng (bell-shaped)
- Asimtotik terhadap sumbu X (tidak pernah menyentuh sumbu X)
- Empirical Rule (68-95-99.7):
- 68% data dalam $(\mu - \sigma, \mu + \sigma)$
- 95% data dalam $(\mu - 2\sigma, \mu + 2\sigma)$
- 99.7% data dalam $(\mu - 3\sigma, \mu + 3\sigma)$
Contoh: Jika tinggi badan $X \sim N(170, 10^2)$:
- 68% orang memiliki tinggi antara 160-180 cm
- 95% orang memiliki tinggi antara 150-190 cm
- 99.7% orang memiliki tinggi antara 140-200 cm
Empirical Rule: 68-95-99.7 Rule
Fungsi Kepekatan Peluang Normal
Rumus: $$f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}, \quad -\infty < x < \infty$$
dimana:
- $\mu$ = rata-rata (pusat sebaran)
- $\sigma$ = simpangan baku (menentukan lebar sebaran)
- $\pi \approx 3.14159$
- $e \approx 2.71828$
Karakteristik Kurva:
- Puncak di $x = \mu$
- Semakin besar $\sigma$, semakin lebar kurva
- Luas total di bawah kurva = 1
Peluang Sebaran Normal (dengan Integral)
Konsep: Peluang dihitung sebagai luas di bawah kurva fungsi kepekatan.
Rumus: $$P(a \leq X \leq b) = \int_a^b \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx$$
Kesulitan: Integral ini tidak dapat diselesaikan secara analitik, sehingga menggunakan:
- Tabel normal baku (setelah transformasi)
- Software/kalkulator
- Pendekatan numerik
Contoh: $X \sim N(50, 10^2)$, hitung $P(45 \leq X \leq 60)$:
-
Transformasi ke normal baku:
- $Z_1 = \frac{45-50}{10} = -0.5$
- $Z_2 = \frac{60-50}{10} = 1.0$
-
Gunakan tabel atau software: $$P(45 \leq X \leq 60) = P(-0.5 \leq Z \leq 1.0) = 0.5328$$
Sebaran Normal Baku
Konsep: Normal dengan $\mu = 0$ dan $\sigma = 1$. Dilambangkan $Z \sim N(0, 1)$.
Fungsi Kepekatan: $$f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}$$
Transformasi: $$Z = \frac{X - \mu}{\sigma}$$
Kebalikan: $$X = \mu + Z\sigma$$
Keuntungan:
- Satu tabel untuk semua sebaran normal
- Memudahkan perhitungan peluang
Contoh: $X \sim N(100, 15^2)$, hitung $P(X > 130)$:
- Transformasi: $Z = \frac{130-100}{15} = 2$
- $P(X > 130) = P(Z > 2) = 1 - P(Z \leq 2) = 1 - 0.9772 = 0.0228$
Statistika Inferensia
Pendugaan Parameter
Konsep: Menggunakan statistik sampel untuk menduga parameter populasi.
Jenis Pendugaan:
-
Penduga Titik: Memberikan satu nilai sebagai penduga
- Contoh: $\bar{x} = 50$ sebagai penduga $\mu$
-
Penduga Selang: Memberikan interval yang diharapkan memuat parameter
- Contoh: $48 \leq \mu \leq 52$ dengan tingkat kepercayaan 95%
Penduga Tidak Bias:
- $\bar{X}$ untuk $\mu$
- $S^2$ untuk $\sigma^2$
- $\hat{p} = \frac{X}{n}$ untuk $p$ (proporsi)
Penduga Selang (Detail)
Selang Kepercayaan Rata-rata Populasi
1. Ragam Populasi Diketahui ($\sigma^2$ diketahui)
Rumus: $$\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$$
Syarat:
- Populasi normal ATAU $n \geq 30$ (CLT)
- $\sigma$ diketahui
Contoh: $\bar{x} = 50$, $\sigma = 10$, $n = 100$, tingkat kepercayaan 95%:
- $z_{0.025} = 1.96$
- Selang: $50 \pm 1.96 \times \frac{10}{\sqrt{100}} = 50 \pm 1.96$
- $(48.04, 51.96)$
2. Ragam Populasi Tidak Diketahui
Rumus: $$\bar{x} \pm t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$$
Syarat:
- Populasi normal ATAU $n \geq 30$
- $\sigma$ tidak diketahui, gunakan $s$
Contoh: $\bar{x} = 50$, $s = 10$, $n = 25$, tingkat kepercayaan 95%:
- $t_{0.025, 24} = 2.064$ (dari tabel t)
- Selang: $50 \pm 2.064 \times \frac{10}{\sqrt{25}} = 50 \pm 4.128$
- $(45.872, 54.128)$
Catatan: Jika $n \geq 30$, dapat menggunakan $z$ sebagai pendekatan $t$.
Selang Kepercayaan Dua Sampel Bebas
1. Ragam Populasi Diketahui
Rumus: $$(\bar{x}_1 - \bar{x}_2) \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}$$
Contoh: Sampel 1: $\bar{x}_1 = 50$, $\sigma_1 = 10$, $n_1 = 100$ Sampel 2: $\bar{x}_2 = 45$, $\sigma_2 = 12$, $n_2 = 80$ Tingkat kepercayaan 95%:
- Selisih: $50 - 45 = 5$
- Standard error: $\sqrt{\frac{10^2}{100} + \frac{12^2}{80}} = \sqrt{1 + 1.8} = \sqrt{2.8} = 1.673$
- Selang: $5 \pm 1.96 \times 1.673 = 5 \pm 3.28$
- $(1.72, 8.28)$
2. Ragam Populasi Tidak Diketahui (Asumsi Sama)
Rumus: $$(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2, df} \sqrt{s_p^2\left(\frac{1}{n_1} + \frac{1}{n_2}\right)}$$
dimana:
- $s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2}$ (pooled variance)
- $df = n_1 + n_2 - 2$ (derajat bebas)
Contoh: Sampel 1: $\bar{x}_1 = 50$, $s_1 = 10$, $n_1 = 25$ Sampel 2: $\bar{x}_2 = 45$, $s_2 = 12$, $n_2 = 30$
- $s_p^2 = \frac{(25-1)10^2 + (30-1)12^2}{25+30-2} = \frac{24 \times 100 + 29 \times 144}{53} = \frac{6576}{53} = 124.08$
- $df = 25 + 30 - 2 = 53$
- $t_{0.025, 53} \approx 2.006$
- Standard error: $\sqrt{124.08 \times (\frac{1}{25} + \frac{1}{30})} = \sqrt{124.08 \times 0.0733} = 3.01$
- Selang: $5 \pm 2.006 \times 3.01 = 5 \pm 6.04$
- $(-1.04, 11.04)$
3. Ragam Populasi Tidak Diketahui (Asumsi Berbeda)
Rumus: $$(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2, df} \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}$$
dimana: $$df = \frac{\left(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}\right)^2}{\frac{(s_1^2/n_1)^2}{n_1-1} + \frac{(s_2^2/n_2)^2}{n_2-1}}$$ (Welch’s formula)
Selang Kepercayaan Data Berpasangan
Konsep: Data yang diukur dua kali pada subjek yang sama (sebelum-sesudah, matched pairs).
Rumus: $$\bar{d} \pm t_{\alpha/2, n-1} \frac{s_d}{\sqrt{n}}$$
dimana:
- $d_i = x_{i1} - x_{i2}$ (selisih pasangan ke-$i$)
- $\bar{d} = \frac{\sum d_i}{n}$ (rata-rata selisih)
- $s_d = \sqrt{\frac{\sum(d_i - \bar{d})^2}{n-1}}$ (simpangan baku selisih)
Contoh: Data sebelum dan sesudah program diet (kg):
| Subjek | Sebelum | Sesudah | $d$ |
|---|---|---|---|
| 1 | 80 | 75 | 5 |
| 2 | 85 | 82 | 3 |
| 3 | 90 | 88 | 2 |
| 4 | 75 | 73 | 2 |
| 5 | 88 | 85 | 3 |
- $\bar{d} = \frac{5+3+2+2+3}{5} = 3$
- $s_d = 1.225$ (dihitung dari data)
- $n = 5$, $t_{0.025, 4} = 2.776$
- Selang: $3 \pm 2.776 \times \frac{1.225}{\sqrt{5}} = 3 \pm 1.52$
- $(1.48, 4.52)$
Interpretasi: Dengan tingkat kepercayaan 95%, rata-rata penurunan berat badan antara 1.48 dan 4.52 kg.
Penduga Titik dan Selang Kepercayaan Proporsi Populasi
Penduga Titik: $$\hat{p} = \frac{X}{n}$$
dimana:
- $X$ = banyaknya sukses dalam sampel
- $n$ = ukuran sampel
Selang Kepercayaan (Sampel Besar, $n\hat{p} \geq 5$ dan $n(1-\hat{p}) \geq 5$): $$\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
Contoh: Dari 1000 responden, 600 setuju dengan kebijakan baru:
- $\hat{p} = \frac{600}{1000} = 0.6$
- Tingkat kepercayaan 95%: $z_{0.025} = 1.96$
- Standard error: $\sqrt{\frac{0.6 \times 0.4}{1000}} = \sqrt{0.00024} = 0.0155$
- Selang: $0.6 \pm 1.96 \times 0.0155 = 0.6 \pm 0.0304$
- $(0.5696, 0.6304)$ atau $(56.96%, 63.04%)$
Penduga Titik dan Selang Kepercayaan Beda Dua Proporsi
Penduga Titik: $$\hat{p}_1 - \hat{p}_2$$
Selang Kepercayaan: $$(\hat{p}_1 - \hat{p}_2) \pm z_{\alpha/2} \sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}$$
Contoh: Sampel 1: 600 dari 1000 setuju ($\hat{p}_1 = 0.6$) Sampel 2: 400 dari 800 setuju ($\hat{p}_2 = 0.5$) Tingkat kepercayaan 95%:
- Selisih: $0.6 - 0.5 = 0.1$
- Standard error: $\sqrt{\frac{0.6 \times 0.4}{1000} + \frac{0.5 \times 0.5}{800}} = \sqrt{0.00024 + 0.0003125} = 0.0235$
- Selang: $0.1 \pm 1.96 \times 0.0235 = 0.1 \pm 0.0461$
- $(0.0539, 0.1461)$ atau $(5.39%, 14.61%)$
Uji Hipotesis
Konsep: Prosedur statistik untuk menguji klaim tentang parameter populasi.
Langkah-langkah Uji Hipotesis
1. Menulis Hipotesis Statistik
- $H_0$ (Hipotesis Nol): Klaim yang akan diuji, biasanya mengandung tanda $=$, $\leq$, atau $\geq$
- $H_1$ atau $H_a$ (Hipotesis Alternatif): Klaim yang ingin dibuktikan, biasanya mengandung tanda $\neq$, $>$, atau $<$
Jenis Uji:
- Dua ekor: $H_0: \mu = \mu_0$ vs $H_1: \mu \neq \mu_0$
- Ekor kanan: $H_0: \mu \leq \mu_0$ vs $H_1: \mu > \mu_0$
- Ekor kiri: $H_0: \mu \geq \mu_0$ vs $H_1: \mu < \mu_0$
Daerah Penolakan dalam Uji Hipotesis (α = 0.05)
2. Menghitung Statistik Uji
Bergantung pada kasus:
- Z-test: Jika $\sigma$ diketahui atau sampel besar
- t-test: Jika $\sigma$ tidak diketahui dan sampel kecil
3. Menentukan Daerah Penolakan/Kriteria Pengujian
Berdasarkan tingkat signifikansi $\alpha$ (biasanya 0.05, 0.01, atau 0.10):
- Dua ekor: Tolak $H_0$ jika $|Z| > z_{\alpha/2}$ atau $|t| > t_{\alpha/2, df}$
- Ekor kanan: Tolak $H_0$ jika $Z > z_\alpha$ atau $t > t_{\alpha, df}$
- Ekor kiri: Tolak $H_0$ jika $Z < -z_\alpha$ atau $t < -t_{\alpha, df}$
4. Mengambil Kesimpulan
- Tolak $H_0$: Ada bukti cukup untuk mendukung $H_1$
- Gagal tolak $H_0$: Tidak ada bukti cukup untuk mendukung $H_1$ (bukan berarti $H_0$ benar!)
Uji Hipotesis Rata-rata Populasi Satu Sampel
1. Ragam Diketahui (Z-test)
Statistik Uji: $$Z = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}}$$
Contoh: Klaim: Rata-rata tinggi mahasiswa = 170 cm Data: $\bar{x} = 172$, $\sigma = 10$, $n = 100$, $\alpha = 0.05$
- $H_0: \mu = 170$ vs $H_1: \mu \neq 170$ (dua ekor)
- $Z = \frac{172 - 170}{10/\sqrt{100}} = \frac{2}{1} = 2$
- Daerah penolakan: $|Z| > 1.96$
- Karena $2 > 1.96$, tolak $H_0$
- Kesimpulan: Ada bukti bahwa rata-rata tinggi tidak sama dengan 170 cm
2. Ragam Tidak Diketahui (t-test)
Statistik Uji: $$t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}$$
Contoh: Klaim: Rata-rata berat = 60 kg Data: $\bar{x} = 62$, $s = 8$, $n = 25$, $\alpha = 0.05$
- $H_0: \mu = 60$ vs $H_1: \mu \neq 60$
- $t = \frac{62 - 60}{8/\sqrt{25}} = \frac{2}{1.6} = 1.25$
- $t_{0.025, 24} = 2.064$
- Karena $|1.25| < 2.064$, gagal tolak $H_0$
- Kesimpulan: Tidak ada bukti bahwa rata-rata berat berbeda dari 60 kg
Uji Hipotesis Beda Dua Rata-rata Populasi (Dua Sampel Bebas)
1. Ragam Diketahui
Statistik Uji: $$Z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)_0}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}$$
Contoh: Uji apakah rata-rata kelompok 1 lebih besar dari kelompok 2:
-
Kelompok 1: $\bar{x}_1 = 50$, $\sigma_1 = 10$, $n_1 = 100$
-
Kelompok 2: $\bar{x}_2 = 45$, $\sigma_2 = 12$, $n_2 = 80$
-
$\alpha = 0.05$
-
$H_0: \mu_1 \leq \mu_2$ vs $H_1: \mu_1 > \mu_2$ (ekor kanan)
-
$Z = \frac{(50 - 45) - 0}{\sqrt{\frac{10^2}{100} + \frac{12^2}{80}}} = \frac{5}{\sqrt{1 + 1.8}} = \frac{5}{1.673} = 2.99$
-
$z_{0.05} = 1.645$
-
Karena $2.99 > 1.645$, tolak $H_0$
-
Kesimpulan: Ada bukti bahwa rata-rata kelompok 1 lebih besar
2. Ragam Tidak Diketahui (Asumsi Sama)
Statistik Uji: $$t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)_0}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$$
dimana $s_p^2$ adalah pooled variance (lihat bagian selang kepercayaan).
Uji Hipotesis Rata-rata Data Berpasangan
Statistik Uji: $$t = \frac{\bar{d} - \mu_{d0}}{s_d/\sqrt{n}}$$
dimana $\mu_{d0}$ adalah nilai hipotesis untuk rata-rata selisih (biasanya 0).
Contoh: Uji apakah program diet efektif (penurunan berat badan > 0):
-
Data dari contoh sebelumnya: $\bar{d} = 3$, $s_d = 1.225$, $n = 5$
-
$\alpha = 0.05$
-
$H_0: \mu_d \leq 0$ vs $H_1: \mu_d > 0$ (ekor kanan)
-
$t = \frac{3 - 0}{1.225/\sqrt{5}} = \frac{3}{0.548} = 5.47$
-
$t_{0.05, 4} = 2.132$
-
Karena $5.47 > 2.132$, tolak $H_0$
-
Kesimpulan: Ada bukti bahwa program diet efektif
Uji Hipotesis Proporsi Populasi
Statistik Uji (Sampel Besar): $$Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}$$
Contoh: Klaim: Proporsi setuju = 50% Data: 600 dari 1000 setuju, $\alpha = 0.05$
- $H_0: p = 0.5$ vs $H_1: p \neq 0.5$
- $\hat{p} = 0.6$
- $Z = \frac{0.6 - 0.5}{\sqrt{\frac{0.5 \times 0.5}{1000}}} = \frac{0.1}{0.0158} = 6.33$
- Daerah penolakan: $|Z| > 1.96$
- Karena $6.33 > 1.96$, tolak $H_0$
- Kesimpulan: Ada bukti bahwa proporsi setuju tidak sama dengan 50%
Uji Hipotesis Beda Dua Proporsi Populasi
Statistik Uji: $$Z = \frac{(\hat{p}_1 - \hat{p}_2) - (p_1 - p_2)_0}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1} + \frac{\hat{p}(1-\hat{p})}{n_2}}}$$
dimana $\hat{p} = \frac{X_1 + X_2}{n_1 + n_2}$ adalah pooled proportion.
Contoh: Uji apakah proporsi kelompok 1 berbeda dari kelompok 2:
-
Kelompok 1: 600 dari 1000 ($\hat{p}_1 = 0.6$)
-
Kelompok 2: 400 dari 800 ($\hat{p}_2 = 0.5$)
-
$\alpha = 0.05$
-
$H_0: p_1 = p_2$ vs $H_1: p_1 \neq p_2$
-
$\hat{p} = \frac{600 + 400}{1000 + 800} = \frac{1000}{1800} = 0.556$
-
$Z = \frac{0.6 - 0.5}{\sqrt{\frac{0.556 \times 0.444}{1000} + \frac{0.556 \times 0.444}{800}}} = \frac{0.1}{0.0235} = 4.26$
-
Karena $|4.26| > 1.96$, tolak $H_0$
-
Kesimpulan: Ada bukti bahwa proporsi kedua kelompok berbeda
Hubungan Dua Peubah Numerik / Analisis Korelasi
Scatter Plot
Konsep: Grafik yang menampilkan hubungan antara dua peubah numerik.
Cara Membuat:
- Sumbu X: peubah bebas (independent variable)
- Sumbu Y: peubah terikat (dependent variable)
- Setiap titik mewakili satu observasi
Pola Hubungan:
- Positif: Jika $X$ naik, $Y$ cenderung naik (garis miring ke atas)
- Negatif: Jika $X$ naik, $Y$ cenderung turun (garis miring ke bawah)
- Tidak ada hubungan: Titik-titik tersebar acak
- Non-linear: Pola kurva (bukan garis lurus)
Pola Hubungan dalam Scatter Plot
Contoh: Data tinggi (cm) vs berat (kg):
- Scatter plot menunjukkan pola positif: semakin tinggi, semakin berat
- Titik-titik membentuk pola yang mengarah ke atas kanan
Koefisien Korelasi
Konsep: Ukuran kekuatan dan arah hubungan linear antara dua peubah.
Koefisien Korelasi Pearson (Populasi): $$\rho = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y}$$
Koefisien Korelasi Pearson (Sampel): $$r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}$$
Rumus Alternatif (Lebih Mudah): $$r = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{\sqrt{[n\sum x_i^2 - (\sum x_i)^2][n\sum y_i^2 - (\sum y_i)^2]}}$$
Sifat-sifat:
- $-1 \leq r \leq 1$
- $r = 1$: Korelasi positif sempurna (garis lurus naik)
- $r = -1$: Korelasi negatif sempurna (garis lurus turun)
- $r = 0$: Tidak ada korelasi linear
- $|r|$ mendekati 1: Hubungan linear kuat
- $|r|$ mendekati 0: Hubungan linear lemah
Interpretasi:
- $|r| > 0.7$: Kuat
- $0.3 < |r| \leq 0.7$: Sedang
- $|r| \leq 0.3$: Lemah
Contoh: Data tinggi (X) dan berat (Y):
| $x$ | $y$ | $x^2$ | $y^2$ | $xy$ |
|---|---|---|---|---|
| 160 | 50 | 25600 | 2500 | 8000 |
| 165 | 55 | 27225 | 3025 | 9075 |
| 170 | 60 | 28900 | 3600 | 10200 |
| 175 | 65 | 30625 | 4225 | 11375 |
| 180 | 70 | 32400 | 4900 | 12600 |
| 850 | 300 | 144750 | 18250 | 51250 |
- $n = 5$
- $\sum x = 850$, $\sum y = 300$
- $\sum x^2 = 144750$, $\sum y^2 = 18250$, $\sum xy = 51250$
$$r = \frac{5 \times 51250 - 850 \times 300}{\sqrt{[5 \times 144750 - 850^2][5 \times 18250 - 300^2]}}$$
$$r = \frac{256250 - 255000}{\sqrt{[723750 - 722500][91250 - 90000]}} = \frac{1250}{\sqrt{1250 \times 1250}} = \frac{1250}{1250} = 1$$
Interpretasi: Korelasi positif sempurna (dalam contoh ini karena data dibuat linear sempurna).
Catatan Penting:
- Korelasi tidak berarti kausalitas (hubungan sebab-akibat)
- Korelasi hanya mengukur hubungan linear
- Korelasi bisa tinggi meskipun hubungan sebenarnya non-linear
Analisis Regresi Linear
Konsep: Mencari Garis Lurus yang Paling Menggambarkan Pola Hubungan
Tujuan: Menemukan persamaan garis lurus yang paling baik memprediksi $Y$ berdasarkan $X$.
Model Regresi Linear Sederhana: $$Y = \beta_0 + \beta_1 X + \varepsilon$$
dimana:
- $Y$ = peubah terikat (dependent variable)
- $X$ = peubah bebas (independent variable)
- $\beta_0$ = intercept (titik potong sumbu Y)
- $\beta_1$ = slope (kemiringan garis)
- $\varepsilon$ = error (selisih antara nilai observasi dan nilai prediksi)
Menentukan Persamaan Regresi
Populasi
Model: $$Y = \beta_0 + \beta_1 X + \varepsilon$$
dimana:
- $\beta_0$ dan $\beta_1$ adalah parameter populasi (tidak diketahui)
- $\varepsilon \sim N(0, \sigma^2)$ (error berdistribusi normal dengan rata-rata 0)
Sampel
Persamaan Regresi Terduga: $$\hat{y} = b_0 + b_1 x$$
dimana:
- $\hat{y}$ = nilai prediksi $Y$
- $b_0$ = penduga $\beta_0$
- $b_1$ = penduga $\beta_1$
Metode Kuadrat Terkecil (Least Squares Method):
Mencari $b_0$ dan $b_1$ yang meminimumkan: $$\sum (y_i - \hat{y}_i)^2 = \sum (y_i - b_0 - b_1 x_i)^2$$
Rumus Koefisien Regresi:
Slope: $$b_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2} = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{n\sum x_i^2 - (\sum x_i)^2}$$
Intercept: $$b_0 = \bar{y} - b_1 \bar{x}$$
Contoh: Data tinggi (X, cm) dan berat (Y, kg):
| $x$ | $y$ | $x^2$ | $y^2$ | $xy$ |
|---|---|---|---|---|
| 160 | 50 | 25600 | 2500 | 8000 |
| 165 | 55 | 27225 | 3025 | 9075 |
| 170 | 60 | 28900 | 3600 | 10200 |
| 175 | 65 | 30625 | 4225 | 11375 |
| 180 | 70 | 32400 | 4900 | 12600 |
| 850 | 300 | 144750 | 18250 | 51250 |
- $n = 5$
- $\bar{x} = \frac{850}{5} = 170$
- $\bar{y} = \frac{300}{5} = 60$
Menghitung $b_1$: $$b_1 = \frac{5 \times 51250 - 850 \times 300}{5 \times 144750 - 850^2} = \frac{256250 - 255000}{723750 - 722500} = \frac{1250}{1250} = 1$$
Menghitung $b_0$: $$b_0 = 60 - 1 \times 170 = 60 - 170 = -110$$
Persamaan Regresi: $$\hat{y} = -110 + 1 \times x$$
Garis Regresi: ŷ = -110 + x
Interpretasi:
- $b_1 = 1$: Setiap kenaikan tinggi 1 cm, berat meningkat 1 kg
- $b_0 = -110$: Jika tinggi = 0 (tidak masuk akal), berat = -110 kg (hanya untuk perhitungan, tidak untuk interpretasi praktis)
Prediksi: Untuk tinggi 172 cm: $$\hat{y} = -110 + 1 \times 172 = 62 \text{ kg}$$
Uji Parameter Regresi
Uji untuk Slope ($\beta_1$):
Hipotesis:
- $H_0: \beta_1 = 0$ (tidak ada hubungan linear)
- $H_1: \beta_1 \neq 0$ (ada hubungan linear)
Statistik Uji: $$t = \frac{b_1}{SE(b_1)}$$
dimana: $$SE(b_1) = \frac{s_e}{\sqrt{\sum (x_i - \bar{x})^2}}$$
dan: $$s_e = \sqrt{\frac{\sum (y_i - \hat{y}_i)^2}{n-2}} = \sqrt{MSE}$$
Keputusan: Tolak $H_0$ jika $|t| > t_{\alpha/2, n-2}$
Uji untuk Intercept ($\beta_0$):
Hipotesis:
- $H_0: \beta_0 = 0$
- $H_1: \beta_0 \neq 0$
Statistik Uji: $$t = \frac{b_0}{SE(b_0)}$$
dimana: $$SE(b_0) = s_e \sqrt{\frac{1}{n} + \frac{\bar{x}^2}{\sum (x_i - \bar{x})^2}}$$
Menilai Kebaikan Model Regresi: Koefisien Determinasi
Konsep: Mengukur seberapa baik model regresi menjelaskan variasi dalam data.
Koefisien Determinasi ($R^2$):
Rumus: $$R^2 = \frac{SSR}{SST} = 1 - \frac{SSE}{SST}$$
dimana:
- SST (Total Sum of Squares): $\sum (y_i - \bar{y})^2$ (total variasi dalam $Y$)
- SSR (Regression Sum of Squares): $\sum (\hat{y}_i - \bar{y})^2$ (variasi yang dijelaskan oleh regresi)
- SSE (Error Sum of Squares): $\sum (y_i - \hat{y}_i)^2$ (variasi yang tidak dijelaskan)
Sifat-sifat:
- $0 \leq R^2 \leq 1$
- $R^2 = 1$: Model sempurna (semua titik tepat di garis)
- $R^2 = 0$: Model tidak menjelaskan variasi sama sekali
- $R^2$ mendekati 1: Model baik
Hubungan dengan Korelasi: $$R^2 = r^2$$
dimana $r$ adalah koefisien korelasi.
Contoh: Dari data sebelumnya, jika dihitung:
- SST = 250
- SSR = 250
- SSE = 0
Maka: $$R^2 = \frac{250}{250} = 1$$
Interpretasi: Model menjelaskan 100% variasi dalam berat badan (dalam contoh ini karena data dibuat linear sempurna).
Rumus Alternatif: $$R^2 = \frac{[\sum (x_i - \bar{x})(y_i - \bar{y})]^2}{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2} = r^2$$
Koefisien Determinasi Disesuaikan (Adjusted $R^2$):
Untuk model dengan lebih dari satu peubah bebas: $$R_{adj}^2 = 1 - \frac{SSE/(n-k-1)}{SST/(n-1)}$$
dimana $k$ adalah banyaknya peubah bebas.
Ringkasan Rumus Penting
Statistika Deskriptif
- Mean: $\bar{x} = \frac{\sum x_i}{n}$
- Ragam sampel: $s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$
- Simpangan baku: $s = \sqrt{s^2}$
- IQR: $Q_3 - Q_1$
Peluang
- Peluang klasik: $P(A) = \frac{n(A)}{n(S)}$
- Peluang komplemen: $P(A^c) = 1 - P(A)$
- Penjumlahan: $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
- Perkalian: $P(A \cap B) = P(A) \times P(B|A)$
- Peluang bersyarat: $P(A|B) = \frac{P(A \cap B)}{P(B)}$
Sebaran Normal
- Transformasi: $Z = \frac{X - \mu}{\sigma}$
- Peluang: $P(a \leq X \leq b) = P\left(\frac{a-\mu}{\sigma} \leq Z \leq \frac{b-\mu}{\sigma}\right)$
Selang Kepercayaan
- Rata-rata ($\sigma$ diketahui): $\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$
- Rata-rata ($\sigma$ tidak diketahui): $\bar{x} \pm t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$
- Proporsi: $\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$
Uji Hipotesis
- Z-test: $Z = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}}$
- t-test: $t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}$
- Proporsi: $Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}$
Regresi Linear
- Slope: $b_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}$
- Intercept: $b_0 = \bar{y} - b_1 \bar{x}$
- Koefisien determinasi: $R^2 = \frac{SSR}{SST} = r^2$