Metode Statistika: Cheatsheet Komprehensif

Akmal
math statistic probability inference

Cheatsheet lengkap untuk memahami metode statistika dari konsep dasar hingga aplikasi inferensia.

Prerequisite

Integral

Konsep: Integral digunakan untuk menghitung luas di bawah kurva, yang penting dalam menghitung peluang untuk peubah acak kontinu.

Rumus Dasar:

  • Integral tak tentu: $\int f(x) dx = F(x) + C$
  • Integral tentu: $\int_a^b f(x) dx = F(b) - F(a)$
  • Integral untuk peluang: $P(a \leq X \leq b) = \int_a^b f(x) dx$ dimana $f(x)$ adalah fungsi kepekatan peluang

Contoh: Untuk menghitung peluang peubah acak kontinu $X$ antara 2 dan 5: $$P(2 \leq X \leq 5) = \int_2^5 f(x) dx$$

Peluang (Probability)

Konsep: Peluang mengukur kemungkinan terjadinya suatu kejadian, dengan nilai antara 0 (mustahil) dan 1 (pasti).

Aksioma Peluang:

  1. $P(A) \geq 0$ untuk setiap kejadian $A$
  2. $P(S) = 1$ dimana $S$ adalah ruang contoh
  3. Untuk kejadian saling lepas: $P(A \cup B) = P(A) + P(B)$

Contoh: Peluang munculnya angka genap pada pelemparan dadu: $$P(\text{genap}) = P(2) + P(4) + P(6) = \frac{1}{6} + \frac{1}{6} + \frac{1}{6} = \frac{1}{2}$$

Aturan Sturges (Untuk Penyajian Data Numerik)

Konsep: Aturan untuk menentukan banyaknya kelas interval dalam histogram atau tabel distribusi frekuensi.

Rumus: $$k = 1 + 3.322 \log_{10}(n)$$

dimana:

  • $k$ = banyaknya kelas
  • $n$ = banyaknya data

Contoh: Jika memiliki 100 data: $$k = 1 + 3.322 \log_{10}(100) = 1 + 3.322 \times 2 = 7.644 \approx 8 \text{ kelas}$$

Panjang Kelas: $$\text{Panjang kelas} = \frac{\text{Range}}{k} = \frac{X_{\max} - X_{\min}}{k}$$

Sebaran Normal

Sebaran Normal Baku (Standard Normal Distribution)

Konsep: Sebaran normal dengan rata-rata $\mu = 0$ dan simpangan baku $\sigma = 1$. Dilambangkan dengan $Z \sim N(0, 1)$.

Fungsi Kepekatan Peluang: $$f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}$$

Transformasi ke Normal Baku: $$Z = \frac{X - \mu}{\sigma}$$

dimana:

  • $X$ = peubah acak normal dengan $\mu$ dan $\sigma$
  • $Z$ = peubah acak normal baku

Contoh: Jika $X \sim N(100, 15^2)$, untuk mengubah $X = 115$ ke normal baku: $$Z = \frac{115 - 100}{15} = \frac{15}{15} = 1$$

Tabel Normal Baku (Nilai Peluang Z)

Konsep: Tabel yang memberikan nilai peluang kumulatif $P(Z \leq z)$ untuk berbagai nilai $z$.

Cara Membaca:

  • Baris menunjukkan digit pertama dan kedua setelah koma
  • Kolom menunjukkan digit ketiga setelah koma
  • Nilai di dalam tabel adalah $P(Z \leq z)$

Contoh:

  • $P(Z \leq 1.96) = 0.9750$ (dari tabel)
  • $P(Z \leq -1.96) = 0.0250$ (menggunakan simetri: $1 - 0.9750$)

Peluang Sebaran Normal

Konsep: Menghitung peluang untuk sebaran normal menggunakan integral atau tabel normal baku.

Rumus Umum: $$P(a \leq X \leq b) = P\left(\frac{a-\mu}{\sigma} \leq Z \leq \frac{b-\mu}{\sigma}\right)$$

Langkah-langkah:

  1. Transformasi: $Z = \frac{X - \mu}{\sigma}$
  2. Gunakan tabel normal baku
  3. Hitung peluang dengan sifat: $P(a \leq Z \leq b) = P(Z \leq b) - P(Z \leq a)$

Contoh: Jika $X \sim N(50, 10^2)$, hitung $P(45 \leq X \leq 60)$:

  1. Transformasi:

    • $Z_1 = \frac{45-50}{10} = -0.5$
    • $Z_2 = \frac{60-50}{10} = 1.0$
  2. Dari tabel:

    • $P(Z \leq -0.5) = 0.3085$
    • $P(Z \leq 1.0) = 0.8413$
  3. Peluang: $$P(45 \leq X \leq 60) = P(-0.5 \leq Z \leq 1.0) = 0.8413 - 0.3085 = 0.5328$$

Transformasi ke Normal Baku (Z-Score)

X ~ N(μ, σ²)
μ = 50
Z = (X - μ) / σ
Z ~ N(0, 1)
μ = 0, σ = 1

Nilai Kritis dari Sebaran Normal

Konsep: Nilai $z_\alpha$ yang memenuhi $P(Z > z_\alpha) = \alpha$ atau $P(Z \leq z_\alpha) = 1 - \alpha$.

Notasi:

  • $z_\alpha$ = nilai kritis untuk peluang $\alpha$ di ekor kanan
  • $z_{1-\alpha}$ = nilai kritis untuk peluang $\alpha$ di ekor kiri

Nilai Kritis Umum:

  • $z_{0.05} = 1.645$ (untuk $\alpha = 0.05$ ekor kanan)
  • $z_{0.025} = 1.96$ (untuk $\alpha = 0.025$ ekor kanan, atau $\alpha = 0.05$ dua ekor)
  • $z_{0.01} = 2.326$ (untuk $\alpha = 0.01$ ekor kanan)
  • $z_{0.005} = 2.576$ (untuk $\alpha = 0.005$ ekor kanan, atau $\alpha = 0.01$ dua ekor)

Contoh: Untuk uji hipotesis dua ekor dengan $\alpha = 0.05$:

  • Daerah penolakan: $Z < -1.96$ atau $Z > 1.96$
  • Daerah penerimaan: $-1.96 \leq Z \leq 1.96$

Pengantar Pendugaan Parameter

Populasi (p) vs Sampel (p̂)

Konsep:

  • Populasi: Seluruh objek yang menjadi perhatian penelitian. Parameter populasi dilambangkan dengan huruf Yunani (misal: $\mu$, $\sigma$, $p$).
  • Sampel: Bagian dari populasi yang diambil untuk dianalisis. Statistik sampel dilambangkan dengan huruf Latin (misal: $\bar{x}$, $s$, $\hat{p}$).

Contoh:

  • Populasi: Semua mahasiswa di universitas (parameter: $\mu$ = rata-rata tinggi badan)
  • Sampel: 100 mahasiswa yang diukur (statistik: $\bar{x}$ = rata-rata tinggi badan sampel)

Populasi vs Sampel

👥
POPULASI
N = seluruh anggota
Parameter: μ, σ², p
👤
SAMPEL
n = sebagian anggota
Statistik: x̄, s², p̂
Inferensia: Menggunakan statistik sampel untuk menduga parameter populasi

Variabel (Peubah) vs Parameter (Penduga) vs Statistik

Konsep:

  • Peubah (Variable): Karakteristik yang diukur dari setiap anggota populasi atau sampel (misal: tinggi badan, berat badan).
  • Parameter: Nilai numerik yang menggambarkan karakteristik populasi (misal: $\mu$, $\sigma^2$, $p$).
  • Statistik: Nilai numerik yang dihitung dari sampel untuk menduga parameter (misal: $\bar{x}$, $s^2$, $\hat{p}$).

Tabel Perbandingan:

KonsepPopulasiSampel
Rata-rata$\mu$ (parameter)$\bar{x}$ (statistik)
Ragam$\sigma^2$ (parameter)$s^2$ (statistik)
Proporsi$p$ (parameter)$\hat{p}$ (statistik)
Simpangan Baku$\sigma$ (parameter)$s$ (statistik)

Sifat Penduga Titik

Konsep: Karakteristik yang diharapkan dari penduga yang baik.

1. Tidak Bias (Unbiased) Penduga $\hat{\theta}$ dikatakan tidak bias jika: $$E(\hat{\theta}) = \theta$$

Contoh:

  • $\bar{X}$ adalah penduga tidak bias untuk $\mu$: $E(\bar{X}) = \mu$
  • $S^2$ adalah penduga tidak bias untuk $\sigma^2$: $E(S^2) = \sigma^2$

2. Efisien Penduga dengan ragam terkecil di antara semua penduga tidak bias.

3. Konsisten Penduga yang semakin mendekati parameter sebenarnya ketika ukuran sampel meningkat: $$\lim_{n \to \infty} P(|\hat{\theta} - \theta| < \epsilon) = 1$$

4. Cukup (Sufficient) Penduga yang memuat semua informasi tentang parameter dari sampel.

Penduga Selang

Penduga Selang (Selang Kepercayaan)

Konsep: Interval yang diharapkan memuat parameter populasi dengan tingkat kepercayaan tertentu.

Rumus Umum: $$\text{Penduga titik} \pm \text{Margin of error}$$

Tingkat Kepercayaan: Peluang bahwa selang kepercayaan memuat parameter sebenarnya (biasanya 90%, 95%, atau 99%).

Interpretasi: Jika kita membuat 100 selang kepercayaan 95%, maka sekitar 95 di antaranya akan memuat parameter sebenarnya.

Visualisasi Selang Kepercayaan 95%

μ (parameter sebenarnya) Sampel 1 Sampel 2 Sampel 3 Sampel 4 Sampel 5 Sampel 6 Sampel 7
━━ Selang memuat μ
━━ Selang tidak memuat μ
┆┆ Parameter sebenarnya (μ)

Margin of Error

Konsep: Setengah dari lebar selang kepercayaan, menunjukkan ketidakpastian dalam pendugaan.

Rumus: $$\text{Margin of error} = z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}$$

atau untuk ragam tidak diketahui: $$\text{Margin of error} = t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}$$

Faktor yang Mempengaruhi:

  1. Tingkat kepercayaan (semakin tinggi, semakin besar margin of error)
  2. Simpangan baku populasi (semakin besar, semakin besar margin of error)
  3. Ukuran sampel (semakin besar, semakin kecil margin of error)

Contoh: Untuk $\bar{x} = 50$, $s = 10$, $n = 100$, tingkat kepercayaan 95%:

  • $z_{0.025} = 1.96$
  • Margin of error = $1.96 \times \frac{10}{\sqrt{100}} = 1.96 \times 1 = 1.96$
  • Selang kepercayaan: $50 \pm 1.96$ atau $(48.04, 51.96)$

Contoh Kasus Selang Kepercayaan

Contoh 1: Rata-rata Populasi (Ragam Diketahui) Sebuah pabrik ingin menduga rata-rata berat produk. Dari sampel 50 produk, diperoleh $\bar{x} = 250$ gram. Diketahui $\sigma = 20$ gram. Buat selang kepercayaan 95% untuk $\mu$.

Penyelesaian:

  • $n = 50$, $\bar{x} = 250$, $\sigma = 20$, $\alpha = 0.05$
  • $z_{0.025} = 1.96$
  • Margin of error = $1.96 \times \frac{20}{\sqrt{50}} = 1.96 \times 2.828 = 5.54$
  • Selang kepercayaan: $250 \pm 5.54$ atau $(244.46, 255.54)$

Interpretasi: Dengan tingkat kepercayaan 95%, kita yakin bahwa rata-rata berat produk populasi berada antara 244.46 dan 255.54 gram.


Statistika

Statistika Deskriptif vs Statistika Inferensia

Statistika Deskriptif:

  • Menggambarkan dan meringkas data yang dikumpulkan
  • Tidak membuat kesimpulan tentang populasi
  • Contoh: menghitung rata-rata, median, membuat grafik

Statistika Inferensia:

  • Menarik kesimpulan tentang populasi berdasarkan sampel
  • Melibatkan pendugaan parameter dan uji hipotesis
  • Contoh: selang kepercayaan, uji hipotesis, analisis regresi

Perbandingan:

AspekDeskriptifInferensia
TujuanMenggambarkan dataMenarik kesimpulan
CakupanHanya data yang adaPopulasi yang lebih luas
MetodeGrafik, tabel, ukuran ringkasanPendugaan, uji hipotesis
KetidakpastianTidak adaAda (margin of error, p-value)

Skala Pengukuran Peubah

Konsep: Klasifikasi peubah berdasarkan sifat dan operasi matematika yang dapat dilakukan.

1. Kategorik (Categorical)

  • Nominal: Kategori tanpa urutan (contoh: jenis kelamin, warna, agama)
    • Operasi: hanya menghitung frekuensi
    • Contoh: Laki-laki, Perempuan
  • Ordinal: Kategori dengan urutan (contoh: tingkat pendidikan, rating)
    • Operasi: menghitung frekuensi, median
    • Contoh: SD, SMP, SMA, S1, S2

2. Numerik (Numerical)

  • Interval: Memiliki urutan dan jarak yang sama, tetapi tidak ada nol mutlak (contoh: suhu dalam Celsius)
    • Operasi: penjumlahan, pengurangan, mean
    • Contoh: Suhu 20°C vs 30°C (beda 10°C, tapi 0°C bukan “tidak ada suhu”)
  • Rasio: Memiliki semua sifat interval + ada nol mutlak (contoh: berat, tinggi, pendapatan)
    • Operasi: semua operasi matematika termasuk perkalian dan pembagian
    • Contoh: Berat 0 kg berarti tidak ada berat, berat 100 kg adalah 2× dari 50 kg

Hierarki Skala Pengukuran

NOMINAL
Kategorik
Warna, Agama
ORDINAL
Kategorik
Rating, Pendidikan
INTERVAL
Numerik
Suhu °C, Tahun
RASIO
Numerik
Berat, Tinggi
← Kualitatif | Kuantitatif →

Peubah vs Data

Peubah (Variable): Karakteristik yang diukur dari setiap anggota populasi atau sampel.

Data: Hasil pengukuran atau pengamatan dari peubah.

Contoh:

  • Peubah: Tinggi badan
  • Data: 170 cm, 165 cm, 175 cm, 180 cm, …

Pengumpulan Data

1. Eksperimen (Experiment)

  • Peneliti mengontrol kondisi dan memanipulasi variabel
  • Dapat menentukan hubungan sebab-akibat
  • Contoh: uji coba obat baru dengan kelompok kontrol dan perlakuan

2. Survei (Survey)

  • Mengumpulkan data dari responden melalui kuesioner atau wawancara
  • Tidak memanipulasi variabel
  • Contoh: survei kepuasan pelanggan, survei pendapat publik

3. Administratif (Administrative)

  • Data yang dikumpulkan untuk keperluan administrasi atau operasional
  • Bukan untuk tujuan penelitian
  • Contoh: data penjualan, data absensi, data transaksi bank

Big Data

Konsep: Data dalam volume besar yang memerlukan teknologi khusus untuk pengolahan.

3V Big Data:

  1. Volume: Jumlah data yang sangat besar

    • Contoh: jutaan transaksi per hari, terabyte hingga petabyte data
  2. Variety: Beragam jenis dan format data

    • Contoh: teks, gambar, video, audio, data terstruktur dan tidak terstruktur
  3. Velocity: Kecepatan data masuk dan perlu diproses

    • Contoh: data real-time dari sensor, streaming data, update setiap detik

Statistika Deskriptif

Penyajian Data Kategorik

1. Tabel Frekuensi

Tabel Frekuensi Mutlak: Menampilkan jumlah kejadian untuk setiap kategori.

KategoriFrekuensi
Laki-laki45
Perempuan55
Total100

Tabel Frekuensi Relatif: Menampilkan proporsi atau persentase.

KategoriFrekuensiFrekuensi RelatifPersentase
Laki-laki450.4545%
Perempuan550.5555%
Total1001.00100%

2. Grafik

Diagram Batang (Bar Chart):

  • Sumbu X: kategori
  • Sumbu Y: frekuensi atau persentase
  • Cocok untuk membandingkan kategori

Diagram Lingkaran (Pie Chart):

  • Menampilkan proporsi setiap kategori
  • Total = 100%
  • Cocok untuk melihat komposisi

Contoh: Data jenis kelamin: Laki-laki (45), Perempuan (55)

  • Diagram batang: batang dengan tinggi 45 dan 55
  • Diagram lingkaran: sektor 45% dan 55%

Penyajian Data Numerik

1. Tabel Distribusi Frekuensi

Langkah-langkah:

  1. Tentukan banyak kelas (gunakan Aturan Sturges)
  2. Tentukan panjang kelas
  3. Tentukan batas kelas
  4. Hitung frekuensi setiap kelas

Contoh: Data tinggi badan (cm): 150, 155, 160, 165, 170, 175, 180, 185, 190

  • $n = 9$, maka $k = 1 + 3.322 \log_{10}(9) \approx 4$
  • Range = 190 - 150 = 40
  • Panjang kelas = 40/4 = 10
KelasFrekuensi
150-1592
160-1692
170-1793
180-1892

2. Grafik

Histogram:

  • Sumbu X: interval kelas
  • Sumbu Y: frekuensi atau kepadatan
  • Batang saling menempel (kontinu)

Poligon Frekuensi:

  • Garis yang menghubungkan titik tengah setiap kelas
  • Titik tengah = (batas bawah + batas atas) / 2

Ogive (Kurva Frekuensi Kumulatif):

  • Menampilkan frekuensi kumulatif
  • Sumbu X: batas atas kelas
  • Sumbu Y: frekuensi kumulatif

Ukuran Peringkasan Data

Ukuran Pemusatan

1. Mean (Rata-rata)

Populasi ($\mu$): $$\mu = \frac{\sum_{i=1}^{N} x_i}{N}$$

Sampel ($\bar{x}$): $$\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}$$

Contoh: Data: 10, 20, 30, 40, 50 $$\bar{x} = \frac{10 + 20 + 30 + 40 + 50}{5} = \frac{150}{5} = 30$$

Mean Tertimbang: $$\bar{x}_w = \frac{\sum w_i x_i}{\sum w_i}$$

2. Median

Konsep: Nilai tengah setelah data diurutkan.

Langkah:

  1. Urutkan data dari terkecil ke terbesar
  2. Jika $n$ ganjil: median = nilai ke-$\frac{n+1}{2}$
  3. Jika $n$ genap: median = rata-rata nilai ke-$\frac{n}{2}$ dan $\frac{n}{2}+1$

Contoh:

  • Data ganjil: 10, 20, 30, 40, 50 → Median = 30 (nilai ke-3)
  • Data genap: 10, 20, 30, 40 → Median = $\frac{20+30}{2} = 25$

3. Modus

Konsep: Nilai yang paling sering muncul.

Contoh: Data: 5, 7, 7, 9, 10, 10, 10, 12

  • Modus = 10 (muncul 3 kali)

Catatan: Data bisa memiliki lebih dari satu modus (bimodal, multimodal) atau tidak ada modus.

Ukuran Penyebaran

1. Kisaran (Range)

Rumus: $$\text{Range} = X_{\max} - X_{\min}$$

Contoh: Data: 10, 20, 30, 40, 50

  • Range = 50 - 10 = 40

2. Inter Quartile Range (IQR)

Konsep: Selisih antara kuartil ketiga dan kuartil pertama.

Rumus: $$\text{IQR} = Q_3 - Q_1$$

Contoh: Jika $Q_1 = 25$ dan $Q_3 = 75$, maka IQR = 75 - 25 = 50

3. Ragam (Variance) dan Simpangan Baku (Standard Deviation)

Ragam Populasi ($\sigma^2$): $$\sigma^2 = \frac{\sum_{i=1}^{N} (x_i - \mu)^2}{N}$$

Ragam Sampel ($s^2$): $$s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}$$

Simpangan Baku:

  • Populasi: $\sigma = \sqrt{\sigma^2}$
  • Sampel: $s = \sqrt{s^2}$

Contoh: Data: 10, 20, 30, 40, 50

  • $\bar{x} = 30$
  • $(10-30)^2 = 400$, $(20-30)^2 = 100$, $(30-30)^2 = 0$, $(40-30)^2 = 100$, $(50-30)^2 = 400$
  • $s^2 = \frac{400 + 100 + 0 + 100 + 400}{5-1} = \frac{1000}{4} = 250$
  • $s = \sqrt{250} = 15.81$

Rumus Alternatif (Lebih Mudah Dihitung): $$s^2 = \frac{\sum x_i^2 - n\bar{x}^2}{n-1}$$

Kuartil

Konsep: Nilai yang membagi data menjadi 4 bagian sama besar.

Kuartil:

  • $Q_1$ (Kuartil pertama): 25% data di bawahnya
  • $Q_2$ (Kuartil kedua): Sama dengan median, 50% data di bawahnya
  • $Q_3$ (Kuartil ketiga): 75% data di bawahnya

Cara Menghitung:

  1. Urutkan data
  2. Tentukan posisi kuartil:
    • $Q_1$: posisi = $\frac{n+1}{4}$
    • $Q_2$: posisi = $\frac{n+1}{2}$ (median)
    • $Q_3$: posisi = $\frac{3(n+1)}{4}$

Contoh: Data: 10, 20, 30, 40, 50, 60, 70, 80, 90

  • $n = 9$
  • $Q_1$: posisi = $\frac{9+1}{4} = 2.5$ → nilai antara data ke-2 dan ke-3 = $\frac{20+30}{2} = 25$
  • $Q_2$: posisi = $\frac{9+1}{2} = 5$ → data ke-5 = 50
  • $Q_3$: posisi = $\frac{3(9+1)}{4} = 7.5$ → nilai antara data ke-7 dan ke-8 = $\frac{70+80}{2} = 75$

IQR dan Boxplot

IQR (Inter Quartile Range): $$\text{IQR} = Q_3 - Q_1$$

Boxplot (Diagram Kotak-Garis): Menampilkan 5 ringkasan data:

  1. Minimum ($X_{\min}$)
  2. $Q_1$
  3. Median ($Q_2$)
  4. $Q_3$
  5. Maximum ($X_{\max}$)

Komponen Boxplot:

  • Kotak: Dari $Q_1$ sampai $Q_3$ (mengandung IQR)
  • Garis di dalam kotak: Median
  • Whisker (kumis):
    • Bawah: dari $Q_1$ sampai $X_{\min}$ (atau $Q_1 - 1.5 \times \text{IQR}$ jika ada pencilan)
    • Atas: dari $Q_3$ sampai $X_{\max}$ (atau $Q_3 + 1.5 \times \text{IQR}$ jika ada pencilan)
  • Pencilan (Outlier): Data di luar $Q_1 - 1.5 \times \text{IQR}$ atau $Q_3 + 1.5 \times \text{IQR}$

Contoh: Jika $Q_1 = 25$, $Q_3 = 75$, maka:

  • IQR = 75 - 25 = 50
  • Batas bawah pencilan = 25 - 1.5 × 50 = 25 - 75 = -50
  • Batas atas pencilan = 75 + 1.5 × 50 = 75 + 75 = 150
  • Data di luar (-50, 150) adalah pencilan

Anatomi Boxplot (Diagram Kotak-Garis)

0 10 25 50 75 90 100 Pencilan Min Q₁ Median (Q₂) Q₃ Max Pencilan IQR = 50
📦 Kotak: Mengandung 50% data tengah (IQR)
Garis merah: Median
Whisker: Data dalam rentang normal
Titik: Pencilan (outlier)

Peluang

Deterministik vs Probabilistik

Deterministik:

  • Hasil pasti dan dapat diprediksi
  • Contoh: Hukum gravitasi, $2 + 2 = 4$

Probabilistik:

  • Hasil tidak pasti, hanya dapat dihitung peluangnya
  • Contoh: Hasil pelemparan dadu, cuaca besok

Peluang = Ruang Kejadian / Ruang Contoh

Konsep:

  • Ruang Contoh (Sample Space): Himpunan semua kemungkinan hasil
  • Ruang Kejadian (Event): Himpunan hasil yang diinginkan

Rumus Klasik: $$P(A) = \frac{n(A)}{n(S)} = \frac{\text{banyaknya hasil kejadian A}}{\text{banyaknya semua kemungkinan hasil}}$$

Contoh: Pelemparan dadu:

  • Ruang contoh $S = {1, 2, 3, 4, 5, 6}$, $n(S) = 6$
  • Kejadian A: muncul angka genap, $A = {2, 4, 6}$, $n(A) = 3$
  • $P(A) = \frac{3}{6} = \frac{1}{2}$

Permutasi vs Kombinasi

Permutasi (Memerhatikan Urutan): Banyaknya cara menyusun $r$ objek dari $n$ objek dengan memerhatikan urutan.

Rumus: $$P(n, r) = \frac{n!}{(n-r)!} = n \times (n-1) \times … \times (n-r+1)$$

Contoh: Berapa banyak cara menyusun 3 buku dari 5 buku berbeda? $$P(5, 3) = \frac{5!}{(5-3)!} = \frac{5!}{2!} = 5 \times 4 \times 3 = 60$$

Kombinasi (Tidak Memerhatikan Urutan): Banyaknya cara memilih $r$ objek dari $n$ objek tanpa memerhatikan urutan.

Rumus: $$C(n, r) = \binom{n}{r} = \frac{n!}{r!(n-r)!}$$

Contoh: Berapa banyak cara memilih 3 buku dari 5 buku (urutan tidak penting)? $$C(5, 3) = \frac{5!}{3!(5-3)!} = \frac{5!}{3!2!} = \frac{5 \times 4}{2 \times 1} = 10$$

Perbedaan:

  • Permutasi: ABC ≠ ACB (urutan penting)
  • Kombinasi: ABC = ACB (urutan tidak penting)

Aksioma Peluang

1. Non-negatif: $$P(A) \geq 0 \text{ untuk setiap kejadian } A$$

2. Normalisasi: $$P(S) = 1 \text{ dimana } S \text{ adalah ruang contoh}$$

3. Aditivitas: Untuk kejadian saling lepas (mutually exclusive): $$P(A \cup B) = P(A) + P(B)$$

Umum untuk kejadian saling lepas: $$P(A_1 \cup A_2 \cup … \cup A_n) = P(A_1) + P(A_2) + … + P(A_n)$$

Contoh: Pelemparan dadu:

  • $P(\text{genap}) = P(2) + P(4) + P(6) = \frac{1}{6} + \frac{1}{6} + \frac{1}{6} = \frac{1}{2}$

Peluang Komplemen

Konsep: Peluang kejadian tidak terjadi.

Rumus: $$P(A^c) = 1 - P(A)$$

dimana $A^c$ adalah komplemen dari $A$ (kejadian $A$ tidak terjadi).

Contoh: Jika peluang hujan $P(\text{hujan}) = 0.3$, maka: $$P(\text{tidak hujan}) = 1 - 0.3 = 0.7$$

Penjumlahan Peluang

1. Kejadian Saling Lepas (Mutually Exclusive): $$P(A \cup B) = P(A) + P(B)$$

Contoh: Peluang muncul angka 1 atau 2 pada dadu: $$P(1 \text{ atau } 2) = P(1) + P(2) = \frac{1}{6} + \frac{1}{6} = \frac{1}{3}$$

2. Kejadian Tidak Saling Lepas: $$P(A \cup B) = P(A) + P(B) - P(A \cap B)$$

Contoh: Dari 100 siswa: 60 suka matematika, 40 suka fisika, 30 suka keduanya.

  • $P(\text{matematika}) = 0.6$
  • $P(\text{fisika}) = 0.4$
  • $P(\text{matematika dan fisika}) = 0.3$
  • $P(\text{matematika atau fisika}) = 0.6 + 0.4 - 0.3 = 0.7$

Perkalian Peluang

1. Kejadian Bebas (Independent): $$P(A \cap B) = P(A) \times P(B)$$

Contoh: Pelemparan 2 koin:

  • $P(\text{koin 1 kepala}) = \frac{1}{2}$
  • $P(\text{koin 2 kepala}) = \frac{1}{2}$
  • $P(\text{keduanya kepala}) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4}$

2. Kejadian Tidak Bebas (Dependent): $$P(A \cap B) = P(A) \times P(B|A) = P(B) \times P(A|B)$$

dimana $P(B|A)$ adalah peluang $B$ terjadi jika $A$ sudah terjadi.

Contoh: Dari 10 bola (6 merah, 4 biru), ambil 2 tanpa pengembalian:

  • $P(\text{pertama merah}) = \frac{6}{10} = 0.6$
  • $P(\text{kedua merah | pertama merah}) = \frac{5}{9}$ (sisa 5 merah dari 9 bola)
  • $P(\text{keduanya merah}) = 0.6 \times \frac{5}{9} = \frac{1}{3}$

Peluang Bersyarat

Konsep: Peluang kejadian $A$ terjadi jika kejadian $B$ sudah terjadi.

Rumus: $$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

Contoh: Dari 100 siswa: 60 laki-laki, 40 perempuan. 30 laki-laki suka matematika, 20 perempuan suka matematika.

Peluang suka matematika jika laki-laki:

  • $P(\text{matematika | laki-laki}) = \frac{30}{60} = 0.5$

Atau menggunakan rumus:

  • $P(\text{matematika} \cap \text{laki-laki}) = \frac{30}{100} = 0.3$
  • $P(\text{laki-laki}) = \frac{60}{100} = 0.6$
  • $P(\text{matematika | laki-laki}) = \frac{0.3}{0.6} = 0.5$

Peubah Acak dan Sebaran Peluang

Fungsi Peluang Acak dan Sebaran Peluang Acak

Peubah Acak (Random Variable): Fungsi yang memetakan setiap hasil eksperimen ke bilangan real.

Notasi: $X$ untuk peubah acak, $x$ untuk nilai spesifik.

Fungsi Peluang:

  • Diskret: $f(x) = P(X = x)$ (fungsi massa peluang)
  • Kontinu: $f(x)$ adalah fungsi kepekatan peluang, dimana $P(a \leq X \leq b) = \int_a^b f(x) dx$

Syarat Fungsi Peluang:

  1. $f(x) \geq 0$ untuk semua $x$
  2. $\sum_{x} f(x) = 1$ (diskret) atau $\int_{-\infty}^{\infty} f(x) dx = 1$ (kontinu)

Contoh Diskret: Pelemparan 2 koin, $X$ = banyaknya kepala:

  • $P(X = 0) = P(\text{TT}) = \frac{1}{4}$
  • $P(X = 1) = P(\text{HT, TH}) = \frac{2}{4} = \frac{1}{2}$
  • $P(X = 2) = P(\text{HH}) = \frac{1}{4}$

Contoh Kontinu: Sebaran normal dengan $f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$

Klasifikasi Peubah Acak

1. Diskret:

  • Nilai yang mungkin adalah bilangan bulat atau dapat dihitung
  • Contoh: banyaknya kepala, banyaknya produk cacat, banyaknya kecelakaan

Sebaran Diskret:

  • Bernoulli
  • Binomial
  • Poisson
  • Hipergeometrik
  • Geometrik

2. Kontinu:

  • Nilai yang mungkin adalah bilangan real pada selang tertentu
  • Contoh: tinggi badan, berat badan, waktu, suhu

Sebaran Kontinu:

  • Normal
  • Lognormal
  • Eksponensial
  • Uniform
  • Chi-square
  • t-student
  • F

Ukuran Pemusatan dan Penyebaran Peubah Acak

Nilai Harapan (Expected Value) - $E(X)$

Konsep: Rata-rata tertimbang dari semua nilai yang mungkin, dengan bobot adalah peluangnya.

Diskret: $$E(X) = \mu = \sum_{x} x \cdot P(X = x) = \sum_{x} x \cdot f(x)$$

Kontinu: $$E(X) = \mu = \int_{-\infty}^{\infty} x \cdot f(x) dx$$

Contoh Diskret: Pelemparan dadu, $X$ = nilai yang muncul: $$E(X) = 1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6} = \frac{21}{6} = 3.5$$

Sifat Nilai Harapan:

  • $E(a) = a$ (konstanta)
  • $E(aX + b) = aE(X) + b$
  • $E(X + Y) = E(X) + E(Y)$

Ragam (Variance) - $\text{Var}(X)$

Rumus: $$\text{Var}(X) = \sigma^2 = E[(X - \mu)^2] = E(X^2) - [E(X)]^2$$

Diskret: $$\text{Var}(X) = \sum_{x} (x - \mu)^2 \cdot f(x) = \sum_{x} x^2 \cdot f(x) - \mu^2$$

Kontinu: $$\text{Var}(X) = \int_{-\infty}^{\infty} (x - \mu)^2 \cdot f(x) dx = \int_{-\infty}^{\infty} x^2 \cdot f(x) dx - \mu^2$$

Simpangan Baku: $$\sigma = \sqrt{\text{Var}(X)}$$

Contoh: Pelemparan dadu:

  • $E(X) = 3.5$
  • $E(X^2) = 1^2 \times \frac{1}{6} + 2^2 \times \frac{1}{6} + … + 6^2 \times \frac{1}{6} = \frac{91}{6}$
  • $\text{Var}(X) = \frac{91}{6} - (3.5)^2 = \frac{91}{6} - 12.25 = \frac{35}{12} \approx 2.92$
  • $\sigma = \sqrt{2.92} \approx 1.71$

Sifat Ragam:

  • $\text{Var}(a) = 0$
  • $\text{Var}(aX + b) = a^2 \text{Var}(X)$
  • $\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)$ (jika $X$ dan $Y$ bebas)

Sebaran Peubah Acak Diskret

Sebaran Bernoulli

Konsep: Eksperimen dengan 2 hasil: sukses (1) atau gagal (0).

Contoh: Melamar kerja (diterima = 1, ditolak = 0)

Fungsi Peluang:

$$ P(X = x) = \begin{cases} p & \text{jika } x = 1 \ 1-p & \text{jika } x = 0 \end{cases} $$

atau: $$P(X = x) = p^x (1-p)^{1-x}, \quad x = 0, 1$$

dimana:

  • $p$ = peluang sukses
  • $1-p$ = peluang gagal

Nilai Harapan: $$E(X) = p$$

Ragam: $$\text{Var}(X) = p(1-p)$$

Contoh: Peluang diterima kerja = 0.3, maka:

  • $P(X = 1) = 0.3$ (diterima)
  • $P(X = 0) = 0.7$ (ditolak)
  • $E(X) = 0.3$
  • $\text{Var}(X) = 0.3 \times 0.7 = 0.21$

Sebaran Binomial

Konsep: Banyaknya sukses dalam $n$ percobaan Bernoulli bebas.

Contoh: Melamar ke lebih dari satu tempat kerja, banyaknya yang menerima.

Fungsi Peluang: $$P(X = x) = \binom{n}{x} p^x (1-p)^{n-x}, \quad x = 0, 1, 2, …, n$$

dimana:

  • $n$ = banyaknya percobaan
  • $p$ = peluang sukses setiap percobaan
  • $x$ = banyaknya sukses

Syarat:

  1. $n$ percobaan bebas
  2. Setiap percobaan hanya 2 hasil (sukses/gagal)
  3. Peluang sukses sama untuk setiap percobaan ($p$)

Nilai Harapan: $$E(X) = np$$

Ragam: $$\text{Var}(X) = np(1-p)$$

Contoh: Melamar ke 5 perusahaan, peluang diterima = 0.3. Peluang diterima di 2 perusahaan: $$P(X = 2) = \binom{5}{2} (0.3)^2 (0.7)^3 = 10 \times 0.09 \times 0.343 = 0.3087$$

  • $E(X) = 5 \times 0.3 = 1.5$ (rata-rata diterima di 1.5 perusahaan)
  • $\text{Var}(X) = 5 \times 0.3 \times 0.7 = 1.05$

Sebaran Poisson

Konsep: Banyaknya kejadian dalam interval waktu atau ruang tertentu, dimana kejadian terjadi secara acak dan bebas.

Contoh: Banyaknya kecelakaan per hari, banyaknya panggilan telepon per jam.

Fungsi Peluang: $$P(X = x) = \frac{\lambda^x e^{-\lambda}}{x!}, \quad x = 0, 1, 2, …$$

dimana:

  • $\lambda$ = rata-rata banyaknya kejadian dalam interval
  • $e \approx 2.71828$ (bilangan Euler)

Syarat:

  1. Kejadian terjadi secara acak dan bebas
  2. Rata-rata banyaknya kejadian ($\lambda$) konstan
  3. Peluang lebih dari satu kejadian dalam interval sangat kecil mendekati nol

Nilai Harapan: $$E(X) = \lambda$$

Ragam: $$\text{Var}(X) = \lambda$$

Catatan: Pada Poisson, nilai harapan = ragam = $\lambda$

Contoh: Rata-rata 3 kecelakaan per hari. Peluang terjadi 2 kecelakaan hari ini: $$P(X = 2) = \frac{3^2 e^{-3}}{2!} = \frac{9 \times 0.0498}{2} = 0.2241$$

  • $E(X) = 3$
  • $\text{Var}(X) = 3$

Pendekatan Binomial ke Poisson: Jika $n$ besar dan $p$ kecil, binomial dapat didekati dengan Poisson dengan $\lambda = np$.

Contoh: $n = 1000$, $p = 0.001$, maka $\lambda = 1$:

  • Binomial: $P(X = 2) = \binom{1000}{2} (0.001)^2 (0.999)^{998}$
  • Poisson: $P(X = 2) = \frac{1^2 e^{-1}}{2!} = \frac{e^{-1}}{2} \approx 0.184$

Perbandingan Sebaran Diskret

Bernoulli (p=0.3)
0 1 0.7 0.3
Sukses (1) atau Gagal (0)
Binomial (n=5, p=0.4)
0 1 2 3 4 5
Banyak sukses dalam n percobaan
Poisson (λ=3)
0 1 2 3 4 5 6
Kejadian dalam interval waktu

Sebaran Peubah Acak Kontinu

Sebaran Normal dan Sifatnya

Konsep: Sebaran yang paling penting dalam statistika, berbentuk lonceng simetris.

Notasi: $X \sim N(\mu, \sigma^2)$

Sifat-sifat:

  1. Simetris terhadap $\mu$ (rata-rata)
  2. Berbentuk lonceng (bell-shaped)
  3. Asimtotik terhadap sumbu X (tidak pernah menyentuh sumbu X)
  4. Empirical Rule (68-95-99.7):
    • 68% data dalam $(\mu - \sigma, \mu + \sigma)$
    • 95% data dalam $(\mu - 2\sigma, \mu + 2\sigma)$
    • 99.7% data dalam $(\mu - 3\sigma, \mu + 3\sigma)$

Contoh: Jika tinggi badan $X \sim N(170, 10^2)$:

  • 68% orang memiliki tinggi antara 160-180 cm
  • 95% orang memiliki tinggi antara 150-190 cm
  • 99.7% orang memiliki tinggi antara 140-200 cm

Empirical Rule: 68-95-99.7 Rule

-3σ μ +3σ 68% 95% 99.7%
68% dalam μ ± σ
95% dalam μ ± 2σ
99.7% dalam μ ± 3σ

Fungsi Kepekatan Peluang Normal

Rumus: $$f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}, \quad -\infty < x < \infty$$

dimana:

  • $\mu$ = rata-rata (pusat sebaran)
  • $\sigma$ = simpangan baku (menentukan lebar sebaran)
  • $\pi \approx 3.14159$
  • $e \approx 2.71828$

Karakteristik Kurva:

  • Puncak di $x = \mu$
  • Semakin besar $\sigma$, semakin lebar kurva
  • Luas total di bawah kurva = 1

Peluang Sebaran Normal (dengan Integral)

Konsep: Peluang dihitung sebagai luas di bawah kurva fungsi kepekatan.

Rumus: $$P(a \leq X \leq b) = \int_a^b \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx$$

Kesulitan: Integral ini tidak dapat diselesaikan secara analitik, sehingga menggunakan:

  1. Tabel normal baku (setelah transformasi)
  2. Software/kalkulator
  3. Pendekatan numerik

Contoh: $X \sim N(50, 10^2)$, hitung $P(45 \leq X \leq 60)$:

  1. Transformasi ke normal baku:

    • $Z_1 = \frac{45-50}{10} = -0.5$
    • $Z_2 = \frac{60-50}{10} = 1.0$
  2. Gunakan tabel atau software: $$P(45 \leq X \leq 60) = P(-0.5 \leq Z \leq 1.0) = 0.5328$$

Sebaran Normal Baku

Konsep: Normal dengan $\mu = 0$ dan $\sigma = 1$. Dilambangkan $Z \sim N(0, 1)$.

Fungsi Kepekatan: $$f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}$$

Transformasi: $$Z = \frac{X - \mu}{\sigma}$$

Kebalikan: $$X = \mu + Z\sigma$$

Keuntungan:

  • Satu tabel untuk semua sebaran normal
  • Memudahkan perhitungan peluang

Contoh: $X \sim N(100, 15^2)$, hitung $P(X > 130)$:

  1. Transformasi: $Z = \frac{130-100}{15} = 2$
  2. $P(X > 130) = P(Z > 2) = 1 - P(Z \leq 2) = 1 - 0.9772 = 0.0228$

Statistika Inferensia

Pendugaan Parameter

Konsep: Menggunakan statistik sampel untuk menduga parameter populasi.

Jenis Pendugaan:

  1. Penduga Titik: Memberikan satu nilai sebagai penduga

    • Contoh: $\bar{x} = 50$ sebagai penduga $\mu$
  2. Penduga Selang: Memberikan interval yang diharapkan memuat parameter

    • Contoh: $48 \leq \mu \leq 52$ dengan tingkat kepercayaan 95%

Penduga Tidak Bias:

  • $\bar{X}$ untuk $\mu$
  • $S^2$ untuk $\sigma^2$
  • $\hat{p} = \frac{X}{n}$ untuk $p$ (proporsi)

Penduga Selang (Detail)

Selang Kepercayaan Rata-rata Populasi

1. Ragam Populasi Diketahui ($\sigma^2$ diketahui)

Rumus: $$\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$$

Syarat:

  • Populasi normal ATAU $n \geq 30$ (CLT)
  • $\sigma$ diketahui

Contoh: $\bar{x} = 50$, $\sigma = 10$, $n = 100$, tingkat kepercayaan 95%:

  • $z_{0.025} = 1.96$
  • Selang: $50 \pm 1.96 \times \frac{10}{\sqrt{100}} = 50 \pm 1.96$
  • $(48.04, 51.96)$

2. Ragam Populasi Tidak Diketahui

Rumus: $$\bar{x} \pm t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$$

Syarat:

  • Populasi normal ATAU $n \geq 30$
  • $\sigma$ tidak diketahui, gunakan $s$

Contoh: $\bar{x} = 50$, $s = 10$, $n = 25$, tingkat kepercayaan 95%:

  • $t_{0.025, 24} = 2.064$ (dari tabel t)
  • Selang: $50 \pm 2.064 \times \frac{10}{\sqrt{25}} = 50 \pm 4.128$
  • $(45.872, 54.128)$

Catatan: Jika $n \geq 30$, dapat menggunakan $z$ sebagai pendekatan $t$.

Selang Kepercayaan Dua Sampel Bebas

1. Ragam Populasi Diketahui

Rumus: $$(\bar{x}_1 - \bar{x}_2) \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}$$

Contoh: Sampel 1: $\bar{x}_1 = 50$, $\sigma_1 = 10$, $n_1 = 100$ Sampel 2: $\bar{x}_2 = 45$, $\sigma_2 = 12$, $n_2 = 80$ Tingkat kepercayaan 95%:

  • Selisih: $50 - 45 = 5$
  • Standard error: $\sqrt{\frac{10^2}{100} + \frac{12^2}{80}} = \sqrt{1 + 1.8} = \sqrt{2.8} = 1.673$
  • Selang: $5 \pm 1.96 \times 1.673 = 5 \pm 3.28$
  • $(1.72, 8.28)$

2. Ragam Populasi Tidak Diketahui (Asumsi Sama)

Rumus: $$(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2, df} \sqrt{s_p^2\left(\frac{1}{n_1} + \frac{1}{n_2}\right)}$$

dimana:

  • $s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2}$ (pooled variance)
  • $df = n_1 + n_2 - 2$ (derajat bebas)

Contoh: Sampel 1: $\bar{x}_1 = 50$, $s_1 = 10$, $n_1 = 25$ Sampel 2: $\bar{x}_2 = 45$, $s_2 = 12$, $n_2 = 30$

  • $s_p^2 = \frac{(25-1)10^2 + (30-1)12^2}{25+30-2} = \frac{24 \times 100 + 29 \times 144}{53} = \frac{6576}{53} = 124.08$
  • $df = 25 + 30 - 2 = 53$
  • $t_{0.025, 53} \approx 2.006$
  • Standard error: $\sqrt{124.08 \times (\frac{1}{25} + \frac{1}{30})} = \sqrt{124.08 \times 0.0733} = 3.01$
  • Selang: $5 \pm 2.006 \times 3.01 = 5 \pm 6.04$
  • $(-1.04, 11.04)$

3. Ragam Populasi Tidak Diketahui (Asumsi Berbeda)

Rumus: $$(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2, df} \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}$$

dimana: $$df = \frac{\left(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}\right)^2}{\frac{(s_1^2/n_1)^2}{n_1-1} + \frac{(s_2^2/n_2)^2}{n_2-1}}$$ (Welch’s formula)

Selang Kepercayaan Data Berpasangan

Konsep: Data yang diukur dua kali pada subjek yang sama (sebelum-sesudah, matched pairs).

Rumus: $$\bar{d} \pm t_{\alpha/2, n-1} \frac{s_d}{\sqrt{n}}$$

dimana:

  • $d_i = x_{i1} - x_{i2}$ (selisih pasangan ke-$i$)
  • $\bar{d} = \frac{\sum d_i}{n}$ (rata-rata selisih)
  • $s_d = \sqrt{\frac{\sum(d_i - \bar{d})^2}{n-1}}$ (simpangan baku selisih)

Contoh: Data sebelum dan sesudah program diet (kg):

SubjekSebelumSesudah$d$
180755
285823
390882
475732
588853
  • $\bar{d} = \frac{5+3+2+2+3}{5} = 3$
  • $s_d = 1.225$ (dihitung dari data)
  • $n = 5$, $t_{0.025, 4} = 2.776$
  • Selang: $3 \pm 2.776 \times \frac{1.225}{\sqrt{5}} = 3 \pm 1.52$
  • $(1.48, 4.52)$

Interpretasi: Dengan tingkat kepercayaan 95%, rata-rata penurunan berat badan antara 1.48 dan 4.52 kg.

Penduga Titik dan Selang Kepercayaan Proporsi Populasi

Penduga Titik: $$\hat{p} = \frac{X}{n}$$

dimana:

  • $X$ = banyaknya sukses dalam sampel
  • $n$ = ukuran sampel

Selang Kepercayaan (Sampel Besar, $n\hat{p} \geq 5$ dan $n(1-\hat{p}) \geq 5$): $$\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$

Contoh: Dari 1000 responden, 600 setuju dengan kebijakan baru:

  • $\hat{p} = \frac{600}{1000} = 0.6$
  • Tingkat kepercayaan 95%: $z_{0.025} = 1.96$
  • Standard error: $\sqrt{\frac{0.6 \times 0.4}{1000}} = \sqrt{0.00024} = 0.0155$
  • Selang: $0.6 \pm 1.96 \times 0.0155 = 0.6 \pm 0.0304$
  • $(0.5696, 0.6304)$ atau $(56.96%, 63.04%)$

Penduga Titik dan Selang Kepercayaan Beda Dua Proporsi

Penduga Titik: $$\hat{p}_1 - \hat{p}_2$$

Selang Kepercayaan: $$(\hat{p}_1 - \hat{p}_2) \pm z_{\alpha/2} \sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}$$

Contoh: Sampel 1: 600 dari 1000 setuju ($\hat{p}_1 = 0.6$) Sampel 2: 400 dari 800 setuju ($\hat{p}_2 = 0.5$) Tingkat kepercayaan 95%:

  • Selisih: $0.6 - 0.5 = 0.1$
  • Standard error: $\sqrt{\frac{0.6 \times 0.4}{1000} + \frac{0.5 \times 0.5}{800}} = \sqrt{0.00024 + 0.0003125} = 0.0235$
  • Selang: $0.1 \pm 1.96 \times 0.0235 = 0.1 \pm 0.0461$
  • $(0.0539, 0.1461)$ atau $(5.39%, 14.61%)$

Uji Hipotesis

Konsep: Prosedur statistik untuk menguji klaim tentang parameter populasi.

Langkah-langkah Uji Hipotesis

1. Menulis Hipotesis Statistik

  • $H_0$ (Hipotesis Nol): Klaim yang akan diuji, biasanya mengandung tanda $=$, $\leq$, atau $\geq$
  • $H_1$ atau $H_a$ (Hipotesis Alternatif): Klaim yang ingin dibuktikan, biasanya mengandung tanda $\neq$, $>$, atau $<$

Jenis Uji:

  • Dua ekor: $H_0: \mu = \mu_0$ vs $H_1: \mu \neq \mu_0$
  • Ekor kanan: $H_0: \mu \leq \mu_0$ vs $H_1: \mu > \mu_0$
  • Ekor kiri: $H_0: \mu \geq \mu_0$ vs $H_1: \mu < \mu_0$

Daerah Penolakan dalam Uji Hipotesis (α = 0.05)

Uji Dua Ekor
H₀: μ = μ₀ Terima H₀ Tolak Tolak -1.96 +1.96 0
Uji Ekor Kanan
H₀: μ ≤ μ₀ Terima H₀ Tolak H₀ +1.645 0
Uji Ekor Kiri
H₀: μ ≥ μ₀ Terima H₀ Tolak H₀ -1.645 0

2. Menghitung Statistik Uji

Bergantung pada kasus:

  • Z-test: Jika $\sigma$ diketahui atau sampel besar
  • t-test: Jika $\sigma$ tidak diketahui dan sampel kecil

3. Menentukan Daerah Penolakan/Kriteria Pengujian

Berdasarkan tingkat signifikansi $\alpha$ (biasanya 0.05, 0.01, atau 0.10):

  • Dua ekor: Tolak $H_0$ jika $|Z| > z_{\alpha/2}$ atau $|t| > t_{\alpha/2, df}$
  • Ekor kanan: Tolak $H_0$ jika $Z > z_\alpha$ atau $t > t_{\alpha, df}$
  • Ekor kiri: Tolak $H_0$ jika $Z < -z_\alpha$ atau $t < -t_{\alpha, df}$

4. Mengambil Kesimpulan

  • Tolak $H_0$: Ada bukti cukup untuk mendukung $H_1$
  • Gagal tolak $H_0$: Tidak ada bukti cukup untuk mendukung $H_1$ (bukan berarti $H_0$ benar!)

Uji Hipotesis Rata-rata Populasi Satu Sampel

1. Ragam Diketahui (Z-test)

Statistik Uji: $$Z = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}}$$

Contoh: Klaim: Rata-rata tinggi mahasiswa = 170 cm Data: $\bar{x} = 172$, $\sigma = 10$, $n = 100$, $\alpha = 0.05$

  • $H_0: \mu = 170$ vs $H_1: \mu \neq 170$ (dua ekor)
  • $Z = \frac{172 - 170}{10/\sqrt{100}} = \frac{2}{1} = 2$
  • Daerah penolakan: $|Z| > 1.96$
  • Karena $2 > 1.96$, tolak $H_0$
  • Kesimpulan: Ada bukti bahwa rata-rata tinggi tidak sama dengan 170 cm

2. Ragam Tidak Diketahui (t-test)

Statistik Uji: $$t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}$$

Contoh: Klaim: Rata-rata berat = 60 kg Data: $\bar{x} = 62$, $s = 8$, $n = 25$, $\alpha = 0.05$

  • $H_0: \mu = 60$ vs $H_1: \mu \neq 60$
  • $t = \frac{62 - 60}{8/\sqrt{25}} = \frac{2}{1.6} = 1.25$
  • $t_{0.025, 24} = 2.064$
  • Karena $|1.25| < 2.064$, gagal tolak $H_0$
  • Kesimpulan: Tidak ada bukti bahwa rata-rata berat berbeda dari 60 kg

Uji Hipotesis Beda Dua Rata-rata Populasi (Dua Sampel Bebas)

1. Ragam Diketahui

Statistik Uji: $$Z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)_0}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}$$

Contoh: Uji apakah rata-rata kelompok 1 lebih besar dari kelompok 2:

  • Kelompok 1: $\bar{x}_1 = 50$, $\sigma_1 = 10$, $n_1 = 100$

  • Kelompok 2: $\bar{x}_2 = 45$, $\sigma_2 = 12$, $n_2 = 80$

  • $\alpha = 0.05$

  • $H_0: \mu_1 \leq \mu_2$ vs $H_1: \mu_1 > \mu_2$ (ekor kanan)

  • $Z = \frac{(50 - 45) - 0}{\sqrt{\frac{10^2}{100} + \frac{12^2}{80}}} = \frac{5}{\sqrt{1 + 1.8}} = \frac{5}{1.673} = 2.99$

  • $z_{0.05} = 1.645$

  • Karena $2.99 > 1.645$, tolak $H_0$

  • Kesimpulan: Ada bukti bahwa rata-rata kelompok 1 lebih besar

2. Ragam Tidak Diketahui (Asumsi Sama)

Statistik Uji: $$t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)_0}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$$

dimana $s_p^2$ adalah pooled variance (lihat bagian selang kepercayaan).

Uji Hipotesis Rata-rata Data Berpasangan

Statistik Uji: $$t = \frac{\bar{d} - \mu_{d0}}{s_d/\sqrt{n}}$$

dimana $\mu_{d0}$ adalah nilai hipotesis untuk rata-rata selisih (biasanya 0).

Contoh: Uji apakah program diet efektif (penurunan berat badan > 0):

  • Data dari contoh sebelumnya: $\bar{d} = 3$, $s_d = 1.225$, $n = 5$

  • $\alpha = 0.05$

  • $H_0: \mu_d \leq 0$ vs $H_1: \mu_d > 0$ (ekor kanan)

  • $t = \frac{3 - 0}{1.225/\sqrt{5}} = \frac{3}{0.548} = 5.47$

  • $t_{0.05, 4} = 2.132$

  • Karena $5.47 > 2.132$, tolak $H_0$

  • Kesimpulan: Ada bukti bahwa program diet efektif

Uji Hipotesis Proporsi Populasi

Statistik Uji (Sampel Besar): $$Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}$$

Contoh: Klaim: Proporsi setuju = 50% Data: 600 dari 1000 setuju, $\alpha = 0.05$

  • $H_0: p = 0.5$ vs $H_1: p \neq 0.5$
  • $\hat{p} = 0.6$
  • $Z = \frac{0.6 - 0.5}{\sqrt{\frac{0.5 \times 0.5}{1000}}} = \frac{0.1}{0.0158} = 6.33$
  • Daerah penolakan: $|Z| > 1.96$
  • Karena $6.33 > 1.96$, tolak $H_0$
  • Kesimpulan: Ada bukti bahwa proporsi setuju tidak sama dengan 50%

Uji Hipotesis Beda Dua Proporsi Populasi

Statistik Uji: $$Z = \frac{(\hat{p}_1 - \hat{p}_2) - (p_1 - p_2)_0}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n_1} + \frac{\hat{p}(1-\hat{p})}{n_2}}}$$

dimana $\hat{p} = \frac{X_1 + X_2}{n_1 + n_2}$ adalah pooled proportion.

Contoh: Uji apakah proporsi kelompok 1 berbeda dari kelompok 2:

  • Kelompok 1: 600 dari 1000 ($\hat{p}_1 = 0.6$)

  • Kelompok 2: 400 dari 800 ($\hat{p}_2 = 0.5$)

  • $\alpha = 0.05$

  • $H_0: p_1 = p_2$ vs $H_1: p_1 \neq p_2$

  • $\hat{p} = \frac{600 + 400}{1000 + 800} = \frac{1000}{1800} = 0.556$

  • $Z = \frac{0.6 - 0.5}{\sqrt{\frac{0.556 \times 0.444}{1000} + \frac{0.556 \times 0.444}{800}}} = \frac{0.1}{0.0235} = 4.26$

  • Karena $|4.26| > 1.96$, tolak $H_0$

  • Kesimpulan: Ada bukti bahwa proporsi kedua kelompok berbeda


Hubungan Dua Peubah Numerik / Analisis Korelasi

Scatter Plot

Konsep: Grafik yang menampilkan hubungan antara dua peubah numerik.

Cara Membuat:

  • Sumbu X: peubah bebas (independent variable)
  • Sumbu Y: peubah terikat (dependent variable)
  • Setiap titik mewakili satu observasi

Pola Hubungan:

  1. Positif: Jika $X$ naik, $Y$ cenderung naik (garis miring ke atas)
  2. Negatif: Jika $X$ naik, $Y$ cenderung turun (garis miring ke bawah)
  3. Tidak ada hubungan: Titik-titik tersebar acak
  4. Non-linear: Pola kurva (bukan garis lurus)

Pola Hubungan dalam Scatter Plot

Korelasi Positif Kuat
X Y
r ≈ +0.95
Korelasi Negatif Kuat
X Y
r ≈ -0.95
Tidak Ada Korelasi
X Y
r ≈ 0
Korelasi Positif Sedang
X Y
r ≈ +0.65

Contoh: Data tinggi (cm) vs berat (kg):

  • Scatter plot menunjukkan pola positif: semakin tinggi, semakin berat
  • Titik-titik membentuk pola yang mengarah ke atas kanan

Koefisien Korelasi

Konsep: Ukuran kekuatan dan arah hubungan linear antara dua peubah.

Koefisien Korelasi Pearson (Populasi): $$\rho = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y}$$

Koefisien Korelasi Pearson (Sampel): $$r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}$$

Rumus Alternatif (Lebih Mudah): $$r = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{\sqrt{[n\sum x_i^2 - (\sum x_i)^2][n\sum y_i^2 - (\sum y_i)^2]}}$$

Sifat-sifat:

  • $-1 \leq r \leq 1$
  • $r = 1$: Korelasi positif sempurna (garis lurus naik)
  • $r = -1$: Korelasi negatif sempurna (garis lurus turun)
  • $r = 0$: Tidak ada korelasi linear
  • $|r|$ mendekati 1: Hubungan linear kuat
  • $|r|$ mendekati 0: Hubungan linear lemah

Interpretasi:

  • $|r| > 0.7$: Kuat
  • $0.3 < |r| \leq 0.7$: Sedang
  • $|r| \leq 0.3$: Lemah

Contoh: Data tinggi (X) dan berat (Y):

$x$$y$$x^2$$y^2$$xy$
160502560025008000
165552722530259075
1706028900360010200
1756530625422511375
1807032400490012600
8503001447501825051250
  • $n = 5$
  • $\sum x = 850$, $\sum y = 300$
  • $\sum x^2 = 144750$, $\sum y^2 = 18250$, $\sum xy = 51250$

$$r = \frac{5 \times 51250 - 850 \times 300}{\sqrt{[5 \times 144750 - 850^2][5 \times 18250 - 300^2]}}$$

$$r = \frac{256250 - 255000}{\sqrt{[723750 - 722500][91250 - 90000]}} = \frac{1250}{\sqrt{1250 \times 1250}} = \frac{1250}{1250} = 1$$

Interpretasi: Korelasi positif sempurna (dalam contoh ini karena data dibuat linear sempurna).

Catatan Penting:

  • Korelasi tidak berarti kausalitas (hubungan sebab-akibat)
  • Korelasi hanya mengukur hubungan linear
  • Korelasi bisa tinggi meskipun hubungan sebenarnya non-linear

Analisis Regresi Linear

Konsep: Mencari Garis Lurus yang Paling Menggambarkan Pola Hubungan

Tujuan: Menemukan persamaan garis lurus yang paling baik memprediksi $Y$ berdasarkan $X$.

Model Regresi Linear Sederhana: $$Y = \beta_0 + \beta_1 X + \varepsilon$$

dimana:

  • $Y$ = peubah terikat (dependent variable)
  • $X$ = peubah bebas (independent variable)
  • $\beta_0$ = intercept (titik potong sumbu Y)
  • $\beta_1$ = slope (kemiringan garis)
  • $\varepsilon$ = error (selisih antara nilai observasi dan nilai prediksi)

Menentukan Persamaan Regresi

Populasi

Model: $$Y = \beta_0 + \beta_1 X + \varepsilon$$

dimana:

  • $\beta_0$ dan $\beta_1$ adalah parameter populasi (tidak diketahui)
  • $\varepsilon \sim N(0, \sigma^2)$ (error berdistribusi normal dengan rata-rata 0)

Sampel

Persamaan Regresi Terduga: $$\hat{y} = b_0 + b_1 x$$

dimana:

  • $\hat{y}$ = nilai prediksi $Y$
  • $b_0$ = penduga $\beta_0$
  • $b_1$ = penduga $\beta_1$

Metode Kuadrat Terkecil (Least Squares Method):

Mencari $b_0$ dan $b_1$ yang meminimumkan: $$\sum (y_i - \hat{y}_i)^2 = \sum (y_i - b_0 - b_1 x_i)^2$$

Rumus Koefisien Regresi:

Slope: $$b_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2} = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{n\sum x_i^2 - (\sum x_i)^2}$$

Intercept: $$b_0 = \bar{y} - b_1 \bar{x}$$

Contoh: Data tinggi (X, cm) dan berat (Y, kg):

$x$$y$$x^2$$y^2$$xy$
160502560025008000
165552722530259075
1706028900360010200
1756530625422511375
1807032400490012600
8503001447501825051250
  • $n = 5$
  • $\bar{x} = \frac{850}{5} = 170$
  • $\bar{y} = \frac{300}{5} = 60$

Menghitung $b_1$: $$b_1 = \frac{5 \times 51250 - 850 \times 300}{5 \times 144750 - 850^2} = \frac{256250 - 255000}{723750 - 722500} = \frac{1250}{1250} = 1$$

Menghitung $b_0$: $$b_0 = 60 - 1 \times 170 = 60 - 170 = -110$$

Persamaan Regresi: $$\hat{y} = -110 + 1 \times x$$

Garis Regresi: ŷ = -110 + x

Tinggi (cm) Berat (kg) 160 165 170 175 180 50 60 70 80
Data observasi
Garis regresi
Residual (error)

Interpretasi:

  • $b_1 = 1$: Setiap kenaikan tinggi 1 cm, berat meningkat 1 kg
  • $b_0 = -110$: Jika tinggi = 0 (tidak masuk akal), berat = -110 kg (hanya untuk perhitungan, tidak untuk interpretasi praktis)

Prediksi: Untuk tinggi 172 cm: $$\hat{y} = -110 + 1 \times 172 = 62 \text{ kg}$$

Uji Parameter Regresi

Uji untuk Slope ($\beta_1$):

Hipotesis:

  • $H_0: \beta_1 = 0$ (tidak ada hubungan linear)
  • $H_1: \beta_1 \neq 0$ (ada hubungan linear)

Statistik Uji: $$t = \frac{b_1}{SE(b_1)}$$

dimana: $$SE(b_1) = \frac{s_e}{\sqrt{\sum (x_i - \bar{x})^2}}$$

dan: $$s_e = \sqrt{\frac{\sum (y_i - \hat{y}_i)^2}{n-2}} = \sqrt{MSE}$$

Keputusan: Tolak $H_0$ jika $|t| > t_{\alpha/2, n-2}$

Uji untuk Intercept ($\beta_0$):

Hipotesis:

  • $H_0: \beta_0 = 0$
  • $H_1: \beta_0 \neq 0$

Statistik Uji: $$t = \frac{b_0}{SE(b_0)}$$

dimana: $$SE(b_0) = s_e \sqrt{\frac{1}{n} + \frac{\bar{x}^2}{\sum (x_i - \bar{x})^2}}$$

Menilai Kebaikan Model Regresi: Koefisien Determinasi

Konsep: Mengukur seberapa baik model regresi menjelaskan variasi dalam data.

Koefisien Determinasi ($R^2$):

Rumus: $$R^2 = \frac{SSR}{SST} = 1 - \frac{SSE}{SST}$$

dimana:

  • SST (Total Sum of Squares): $\sum (y_i - \bar{y})^2$ (total variasi dalam $Y$)
  • SSR (Regression Sum of Squares): $\sum (\hat{y}_i - \bar{y})^2$ (variasi yang dijelaskan oleh regresi)
  • SSE (Error Sum of Squares): $\sum (y_i - \hat{y}_i)^2$ (variasi yang tidak dijelaskan)

Sifat-sifat:

  • $0 \leq R^2 \leq 1$
  • $R^2 = 1$: Model sempurna (semua titik tepat di garis)
  • $R^2 = 0$: Model tidak menjelaskan variasi sama sekali
  • $R^2$ mendekati 1: Model baik

Hubungan dengan Korelasi: $$R^2 = r^2$$

dimana $r$ adalah koefisien korelasi.

Contoh: Dari data sebelumnya, jika dihitung:

  • SST = 250
  • SSR = 250
  • SSE = 0

Maka: $$R^2 = \frac{250}{250} = 1$$

Interpretasi: Model menjelaskan 100% variasi dalam berat badan (dalam contoh ini karena data dibuat linear sempurna).

Rumus Alternatif: $$R^2 = \frac{[\sum (x_i - \bar{x})(y_i - \bar{y})]^2}{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2} = r^2$$

Koefisien Determinasi Disesuaikan (Adjusted $R^2$):

Untuk model dengan lebih dari satu peubah bebas: $$R_{adj}^2 = 1 - \frac{SSE/(n-k-1)}{SST/(n-1)}$$

dimana $k$ adalah banyaknya peubah bebas.


Ringkasan Rumus Penting

Statistika Deskriptif

  • Mean: $\bar{x} = \frac{\sum x_i}{n}$
  • Ragam sampel: $s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$
  • Simpangan baku: $s = \sqrt{s^2}$
  • IQR: $Q_3 - Q_1$

Peluang

  • Peluang klasik: $P(A) = \frac{n(A)}{n(S)}$
  • Peluang komplemen: $P(A^c) = 1 - P(A)$
  • Penjumlahan: $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
  • Perkalian: $P(A \cap B) = P(A) \times P(B|A)$
  • Peluang bersyarat: $P(A|B) = \frac{P(A \cap B)}{P(B)}$

Sebaran Normal

  • Transformasi: $Z = \frac{X - \mu}{\sigma}$
  • Peluang: $P(a \leq X \leq b) = P\left(\frac{a-\mu}{\sigma} \leq Z \leq \frac{b-\mu}{\sigma}\right)$

Selang Kepercayaan

  • Rata-rata ($\sigma$ diketahui): $\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$
  • Rata-rata ($\sigma$ tidak diketahui): $\bar{x} \pm t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$
  • Proporsi: $\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$

Uji Hipotesis

  • Z-test: $Z = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}}$
  • t-test: $t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}$
  • Proporsi: $Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}$

Regresi Linear

  • Slope: $b_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}$
  • Intercept: $b_0 = \bar{y} - b_1 \bar{x}$
  • Koefisien determinasi: $R^2 = \frac{SSR}{SST} = r^2$