Biostatistik inferensial 2: Mei 2019

Novi Nurwahyuningsih (1805015008)

Biostatistik inferensial 2F

PENDAHULUAN

Statistik

Dalam arti sempit yaitu angka atau data.

Dalam arti luas yaitu prosedur atau metode dalam pengumpulan data. pengolahan data, analisis data, dan penyajian data.

Skala pengukuran data dibagi menjadi 4 bagian :

1. Nominal

Data yang hanya bisa membedakan nilai datanya dan tidak tahu nilai data mana yang

lebih tinggi atau rendah.

Contoh: Jenis kelamin, Jenis warna, dsb.

2. Ordinal

Data yang membedakan satu sama yang lain dan mempunyai arti tingkatan (lebih rendah,

lebih besar).

Contoh: Tingkat pendidikan, status pekerjaan, dsb.

3. Interval

Data yang membedakan, mempunyai besaran/jarak/interval yang tetap antara satu data

dengan yang lainnya.

Ciri khasnya: Tidak mempunyai nol mutlak.

Contoh: Suhu

4. Rasio

Data yang membedakan, mempunyai arti tingkatan, mempunyai besaran/jarak tertentu antar

datanya.

Ciri khasnya: Mempunyai nilai mutlak(absolut)

Contoh:Tinggi badan, berat badan dsb.

Peran Statistik dalam Penelitian

Untuk menghitung besarnya sampel yang akan diteliti.
Alat untuk menguji validitas dan reliabitas intrumen.
Alat untuk pengolahan data.
Alat untuk analisis data.
Alat untuk penyajian data.

Langkah-langkah Metode Statistik:

Pembatasan masalah
pengumpulan data
pengolahan data
analisis data
penyajian informasi

Statistik terbagi menjadi 2 bagian, yaitu:

Statistik Deskriptif
Statistik Inferensial

Pengertian

Statistik Inferensial :Statistik yang digunakan oleh peneliti untuk menarik kesimpulan tentang dunia atau untuk menguji hipotensis formal ( Chernick and Fris 2003)

Statistik Inferensial :Statistik yang terdiri dari prosedur yang digunakan untuk membuat kesimpulan tentang karakteristik populasi berdasarkan informasi pada sampel digambarkan dari populasi tersebut ( Mendenhall et al., 2009 )

Statistik inferensial ada 2 macam. yaitu:

1. Parametrik test

Membutuhkan data bersifat kategorikal ( continuous data ) dan data harus berdistribusi normal atau mendekati normal.

Beberapa syarat penggunaan uji parametrik :

1. Data harus berdistribusi normal.

2. Data bersifat numerik ( interval atau rasio ).

Contoh parametrik test :
→Pearson product moment ( r-test )
→Independent t - test
→Dependent t - test
→Anova ( analysis of variance)

2. Non - parametrik test

Data bersifat kategorikal ( orginal atau nominal ) dan data Tidak harus berdistribusi normal. Bila datanya numerik, maka masih dapat dilakukan convert kenominal atau ordinal. Namun perlu diingat, uji non parametrik tidak sekuat / setepat uji parametrik.

Beberapa syarat penggunaan non parametrik :

1. Data tidak harus berdistribusi normal ( boleh berdistribusi tidak normal)

2. Data bersifat kategorikal ( nominal atau ordinal )

3. Biasanya dipakai sebagai uji alternatif dari paramentik test ( bila paramentrik test tidak memenuhi syarat ).

Contoh non parametrik test :

→Test Sperman (rho)

→Chi squere

→Fisher exact test

→Mc Nemar s test

→Mann Whitney

→Wilcoxon

→Kruskal walls

→Logistic regression

Populasi

Dalam statistik, term “populasi” tidak hanya merujuk pada orang atau makhluk hidup, seperti

populasi penduduk Indonesia, populasi ayam di DKI Jakarta. Tetapi juga merujuk pada populasi

objek atau event atau prosedur, termasuk juga jumlah suatu zat dalam urin, kunjungan ke dokter, atau

tindakan operasi. Jadi, Populasi bisa berupa kumpulan makhluk hidup, sesuatu, kasus, dsb.

Sampel

Kumpulan dari satuan/unit yang kita ambil dari populasi studi (n).

Syarat Sampel Random :

1.Setiap unit/individu dalam populasi memiliki kesempatan yang sama untuk terpilih sebagai sampel

2.Harus secara akurat mewakili populasi di mana sampel diambil → Representatif →menghindari

adanya penyimpangan atau bias

3.Besarnya atau jumlahnya memadai

Beda Parameter dan Sampel

Parameter yaitu sejumlah angka yang menggambarkan populasi, sedangkan

Statistik yaitu sejumlah angka yang dihitung dari sampel.

Dalil Penting dari Statistik Inferens adalah

Distribusi Sampel

↡

Distribusi Sampel:

Distribusi dari mean-mean sampel yang diambil secara berulang-ulang dari suatu populasi.

Sifat- Sifat distribusi Sampel

Sifat distribusi Sampel disebut sebagai Central Limit Theorem (Theorema Limit Pusat)

1. Jika sampel random diambil dari populasi normal dengan mean = µ dan varian 2

distribusi sampel harga mean adalah x = µ dan varian 2/n = /√n (SEM)

SEM = Standar Error of Mean

2. Apabila populasi berdistribusi normal → distribusi sampel harga mean juga akan berdistribusi

normal, maka berlaku persamaan Z

Z = x - µ

3. Walaupun populasi berdistribusi sembarang, jika sampel diambil berulang-ulang maka distribusi

harga meannya akan membentuk distribusi normal

Distribusi sampel memperlihatkan hubungan antara probabilitas statistik dan nilai statistik untuk semua sample size (sampel yang diambil) yang menggambarkan populasi

Pengambilan sampel pada populasi distribusi normal

1.Kesalahan baku (SE) lebih kecil dibandingkan dengan simpangan baku (sd) populasinya.

2.Makin besar sample makin kecil kesalahan baku (SE).

Contoh Soal

1. Distribusi Kadar kolesterol serum untuk laki-laki usia 20 sampai 74 tahun di Indonesia tahun 2000

menunjukkan bahwa mean untuk populasi adalah (µ) = 211 mg/100 ml dan standar deviasi

(၈) = 46 mg/100 ml.

Jika kita memiliki sampel size = 25 orang dari populasi, berapa proporsi dari sampel yang akan diambil untuk nilai mean 230 mg/100 ml atau lebih tinggi?

Jawaban

1. Z = X - µ

SE = /√n = 46/√25 = 9.2 mg/100 ml

Z = X – 211

9.2

X = 230 → Z = 230 – 211

9.2

Z = 2.07

Atau Cara Lain:

Z = 2.07 à lihat pada tabel Distribusi Normal Standar à Didapat 0.4808

Karena tabelnya distribusi Normal Standar

maka dihitung dengan cara : 0.5 – 0.4808 = 0.0192 = 1.9%

211 230

Interpretasinya:

(Hanya) 1,92% dari sampel laki-laki usia 20 sampai 74 tahun di Indonesia tahun 2000 memiliki Kadar kolesterol serum mean yang sama dengan atau lebih besar dari nilai 230 mg/100 ml.

SD (Standar Deviasi)

⟹Disebut juga Simpangan Baku

⟹Ukuran sebaran statistik yang paling lazim. SD mengukur bagaimana nilai-nilai data tersebar.

⟹Atau Rata-rata jarak penyimpangan titik-titik data (nilai-nilai observasi) diukur dari nilai rata-rata

data tersebut.

⟹SD = 0, berarti datanya homogen = sama

⟹Semakin kecil SD, semakin sempit rentang (beda) antara nilai tertinggi dengan nilai terendah,

begitu sebaliknya.

Standard Error (SE)

Standard Error adalah standar deviasi dari rata-rata

Jika kita hitung nilai standar deviasi dari tiga buah nilai rata-rata, maka nilai standar deviasi dari nilai

rata-rata tersebut disebut sebagai standard error.

➣Nilai SE kecil berarti penyebaran mean/rata-rata sampel juga kecil maka estimasi terhadap parameter populasi akan lebih tepat.

➣Bila nilai SE besar berarti penyebaran mean/rata-rata sampel juga besar maka estimasi terhadap parameter populasi menjadi kurang tepat.

➣Nilai SE akan turun (semakin kecil) apabila jumlah sampel diperbanyak dan varians atau SD sampel dikurangi.

➣SE mengukur presisi dari perkiraan parameter populasi.

➣Ukuran statistik ini dapat menunjukkan seberapa dekat nilai mean populasi dengan nilai estimasi yang didapat dari nilai mean sampel.

Oleh karena itu, SE dapat digunakan untuk menentukan dan mengontrol jumlah sampel.

PERBEDAAN RUMUS VARIANS, SD, DAN SE

Varian = Var = ∑(xi – x)2

n - 1

Standard error of mean

Standard Error (SE) dalam beberapa referensi disebut juga dengan Standard Error of Mean

(SEM) adalah estimasi dari standar deviasi yang didapat dari mean-mean dari sejumlah

sampel yang menggambarkan populasi

➤SEM = SD(dari Mean)/√n = SE

Standard error untuk proporsi/prosentase

SE juga dapat dihubungkan dengan prosentase atau proporsi.Dalam hal ini, jumlah sampel akan dipengaruhi oleh nilai standard error, tetapi jumlah variasinya ditentukan oleh nilai dari prosentase atau proporsi dalam populasi itu sendiri sehingga tidak dibutuhkan estimasi dari SD.

Jika p mewakili 100% maka 100 – p adalah nilai yang lainnya. Dengan demikian,

Rumus yang digunakan adalah

SE Prosentase =

√ p(100 – p)

Margin error

➤Margin Error adalah suatu tingkat ketidaksesuaian hasil statistik dengan kenyataan di lapangan

➤Margin of Error ini dapat menunjukkan keakuratan dalam suatu penelitian/poling/ survei

➤Margin of Error = Critical value * Standard error

➤Critical value diambil dari nilai skor z, misalnya untuk tingkat kepercayaan 95% maka didapat nilai skor Z adalah 1.96 (didapat dari tabel distribusi normal)

ESTIMASI

Estimasi merupakan ketrampilan untuk hidup (skill for life)

Jika Anda berangkat ke kampus untuk mengikuti kelas, Anda mengestimasi berapa lama perjalanan dari tempat tinggal ke UHAMKA dengan menggunakan jenis kendaraan tertentu. Dengan estimasi tersebut, Anda akan terhindar dari keterlambatan sampai di kelas

Jika waktu dan informasi cukup memadai, maka estimasi yang akurat, menghasilkan ukuran yang dapat dipertanggung jawabkan

Estimasi dalam Statistik

SAMPEL ⟹ POPULASI

Estimasi:

Metode memperkirakan nilai populasi (parameter) dengan memakai nilai sampel (statistik) ⟹karena perhitungan langsung pada seluruh populasi tidak mungkin dilalukan

Dengan estimasi, tidak perlu mengambil sampel berulang kali utk mengetahui distribusi samping.

Estimator

Merupakan Nilai statistik atau statistik sampel yang dipakai untuk menduga nilai populasi (parameter).

Sifat estimator :

1. Tidak bias.

2. Efisien.

3. Konsisten.

Bentuk estimasi :

1. Estimasi Titik

Mengandung perhitungan angka tunggal untuk mengestimasi nilai parameter.

2. Estimasi Selang

Metode yang memberikan hasil perhitungan nilai berupa nilai jangkauan untuk mengestimasi nilai parameter.

Rumus umum Estimasi Selang/Confidence Interval (CI)

St – Z ½α. SE ≤ parameter ≤ St + Z ½α. SE

Di mana:

St = nilai statistik (sampel = xbar)

Z1/2 α = deviasi relatif (standar score, ditentukan oleh confident

interval : Z1/2 α 95% = 1.96, Z1/2α 90% = 1.645

SE = standar d error (σ/√n)

Parameter = nilai populasi yg diduga (µ)

Atau

xbar – Z ½α.SE ≤ µ ≤ xbar + Z ½α.SE

Nilai Confidence Interval

•CI 99% → Z ½ α = ± 2.575

•CI 95% →Z ½ α = ± 1.96

•CI 90% → Z ½ α = ± 1.645

•CI 80% → Z ½ α = ± 1.28

•⇒Di dapat dari tabel distribusi Normal Standar

Distribusi student t

Ketika jumlah sampel tidak besar, dua aspek yang dapat berubah :

1)Standard deviasi sampel (s) , yang tunduk pada variasi sampel, mungkin tidak dapat diandalkan untuk mengestimasi nilai standard deviasi populasi (σ)

2)Ketika distribusi di populasi tidak normal maka distribusi sample dari mean mungkin juga tidak normal

SE = s/√n df = n – 1

UJI HIPOTESIS

Uji hipotesis adalah suatu prosedur yang dilakukan dengan tujuan memutuskan apakah

ada perbedaan atau hubungan, cukup meyakinkan untuk ditolak atau tidak(gagal) ditolak.

Uji hipotesis di gunakan untuk mencapai keputusan tentang sesuatu populasi yang dinilai

dari sampel yang diambil dari populasi.Secara luas Uji hipotesis digunakan untuk

penelitian di bidang kedokteran, kedokteran gigi, kesehatan masyarakat, dan bidang

lainnya untuk menggambarkan keputusan dari populasi. Keyakinan untuk ditolak atau

tidaknya suatu hipotesis didasarkan pada peluang untuk memperoleh hubungan tersebut

secara kebetulan (by chance).

Prinsip Uji Hipotesis

⇓

Melakukan perbandingan antara nilai data sampel (data hasil penelitian) dengan nilai

hipotesis (nilai populasi).

Peluang diterima atau ditolaknya Hipotesis

Tergantung besar kecilnya perbedaan antara nilai sampel dengan nilai hipotesis. Bila

perbedaan cukup besar, peluang-peluang untuk menolak hipotesis pun besar. Begitu

sebaliknya.

Kesimpulan Yang di Dapat dari Pengujian Hipotesis:

1. Menolak hipotesis

2. Menerima hipotesis (gagal menolak hipotesis)⇒ Penelitian tidak cukup bukti untuk menolak hipotesis, hingga disebut "gagal menolak hipotesis"

Jenis Hipotesis

1. Hipotesis nol (Ho)

Menyatakan tidak ada hubungan antara variabel satu (exposure) dengan variabel yang

lain(disease/outcome)

Contoh: Tidak ada hubungan antara jenis kelamin dengan tekanan darah.

2. Hipotesis Alternatif (Ha)

Menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok

Contoh: Ada hubungan antara kebiasaan merokok pada ibu hamil dengan berat badan bayi waktu lahir.

Bentuk Uji Hipotesis atau dua sisi (two tail)

1. One tail

apabila hipotesis alternatif menyatakan adanya perbedaan dan ada pernyataan yang mengatakan bahwa hal yang satu lebih rendah/tinggi daripada yang lain.

Contoh: BB bayi dari ibu hamil yang merokok lebih kecil dibandingkan BB bayi dari ibu hamil yang tidak merokok

2. Two tail

apabila hipotesis alternatif hanya menyatakan perbedaan tanpa melihat apakah yang satu lebih tinggi/rendah daripada yang lain.

Contoh: BB bayi dari ibu hamil yang merokok berbeda dibandingkan BB bayi dari ibu yang tidak merokok

Ada 2 jenis kesalahan pengambilan keputusan dalam uji statistik

1. Kesalahan tipe I (𝟃)

Kesalahan menolak Ho, padahal sesungguhnya Ho benar.

⇒Menyimpulkan adanya perbedaan, padahal sesungguhnya tidak ada perbedaan.

2. Kesalahan tipe II (ß)

Kesalahan tidak menolak Ho,padahal sesungguhnya Ho salah.

⇒Menyimpulkan tidak ada perbedaan, padahal sesungguhnya ada perbedaan.

Menentukan Tingkat Kemaknaan

➔Nilai yang menunjukkan besarnya peluang salah dalam menolak H0

➔Tingkat kemaknaan sering disebut dengan Nilai 𝟃 ⇒merupakan batas toleransi

peluang salah dalam menolak H0

➔merupakan nilai batas maksimal kesalahan menolak H0

➔Juga sebagai batas maksimal kita salah menyatakan adanya perbedaan/ada

hubungan

Nilai PValue

Nilai Pvalue merupakan nilai yang menunjukkan besarnya peluang salah menolak

Ho dari data penelitian.

→Harapan kita nilai Pvalue adalah sekecil mungkin, sebab bila nilai Pvalue kecil maka kita yakin bahwa adanya perbedaan pada hasil penelitian menunjukkan pula adanya perbedaan di populasi

→Dengan kata lain kalau nilai Pvalue nya kecil maka perbedaan yang ada pada penelitian terjadi bukan karena faktor kebetulan (by chance).

→Nilai Pvalue adalah Jika didapat nilai Pvalue ≤  atau Pvalue ≤ 0.05 à Ho ditolak →menunjukkan bahwa ada perbedaan atau ada hubungan antara kelompok yang diteliti.

Tentang PValue

⇒Pvalue, atau kemaknaan secara statistik, tidak mengukur besarnya suatu efek atau pentingnya suatu hasil penelitian

⇒Kemaknaan statistik tidak sama dengan kemaknaan ilmiah

⇒Efek yang identik bisa saja menghasilkan p-values yang berbeda jika presisi hasil pengukurannya berbeda

⇒Analisis data tidak boleh berhenti pada Pvalue

⇒Analisis data seharusnya menyertakan pula pendekatan lain untuk sampai pada suatu kesimpulan .

Biostatistik inferensial 2

Selasa, 07 Mei 2019

Resume Biostatistik inferensial