Selasa, 07 Mei 2019

Resume Biostatistik inferensial

Novi Nurwahyuningsih (1805015008)

Biostatistik inferensial 2F


PENDAHULUAN

Statistik
Dalam arti sempit yaitu angka atau data.
Dalam arti luas yaitu prosedur atau metode dalam pengumpulan data. pengolahan data, analisis data, dan penyajian data.
Skala pengukuran data dibagi menjadi 4 bagian :
1. Nominal
    Data yang hanya bisa membedakan nilai datanya dan tidak tahu nilai data mana yang              
    lebih tinggi atau rendah.
    Contoh: Jenis kelamin, Jenis warna, dsb.
2. Ordinal
    Data yang membedakan satu sama yang lain dan mempunyai arti tingkatan (lebih rendah,       
    lebih besar).
    Contoh: Tingkat pendidikan, status pekerjaan, dsb.
3. Interval
    Data yang membedakan, mempunyai besaran/jarak/interval yang tetap antara satu data         
    dengan yang lainnya.
    Ciri khasnya: Tidak mempunyai nol mutlak.
    Contoh: Suhu
4. Rasio
    Data yang membedakan, mempunyai arti tingkatan, mempunyai besaran/jarak tertentu antar
    datanya.
    Ciri khasnya: Mempunyai nilai mutlak(absolut)


    Contoh:Tinggi badan, berat badan dsb.

Peran Statistik dalam Penelitian
  1. Untuk menghitung besarnya sampel yang akan diteliti.
  2. Alat untuk menguji validitas dan reliabitas intrumen.
  3. Alat untuk pengolahan data.
  4. Alat untuk analisis data.
  5. Alat untuk penyajian data. 
Langkah-langkah Metode Statistik:
  • Pembatasan masalah
  • pengumpulan data
  • pengolahan data
  • analisis data
  • penyajian informasi 
Statistik terbagi menjadi 2 bagian, yaitu:
  1. Statistik Deskriptif
  2. Statistik Inferensial
Pengertian

Statistik Inferensial :Statistik yang digunakan oleh peneliti untuk menarik kesimpulan tentang                                               dunia atau untuk menguji hipotensis formal ( Chernick and Fris 2003)

Statistik Inferensial :Statistik yang terdiri dari prosedur yang digunakan untuk membuat kesimpulan                                    tentang karakteristik populasi berdasarkan informasi pada sampel digambarkan dari populasi tersebut ( Mendenhall et al., 2009 )

 Statistik inferensial ada 2 macam. yaitu:

1.  Parametrik test
     Membutuhkan data  bersifat kategorikal ( continuous data ) dan data harus berdistribusi                       normal atau mendekati normal.


     Beberapa syarat penggunaan uji parametrik :
     1. Data harus berdistribusi normal.

     2. Data bersifat numerik ( interval atau rasio ).

     Contoh parametrik test :
→Pearson product moment ( r-test )
→Independent t - test
→Dependent t - test
→Anova ( analysis of variance)
2.  Non - parametrik test
    Data bersifat kategorikal ( orginal atau nominal ) dan data Tidak harus berdistribusi normal. Bila        datanya numerik, maka masih dapat dilakukan convert kenominal atau ordinal. Namun perlu              diingat, uji non parametrik tidak sekuat / setepat uji parametrik.

     Beberapa syarat penggunaan non parametrik :
    1. Data tidak harus berdistribusi normal ( boleh berdistribusi tidak normal)
    2. Data bersifat kategorikal ( nominal atau ordinal )
    3. Biasanya dipakai sebagai uji alternatif dari paramentik test ( bila paramentrik test tidak   memenuhi syarat ).
     Contoh non parametrik test :
→Test Sperman (rho)
→Chi squere
→Fisher exact test
→Mc Nemar s test
→Mann Whitney
→Wilcoxon
→Kruskal walls
Logistic regression

Populasi
Dalam statistik, term “populasi” tidak hanya merujuk pada orang atau makhluk hidup, seperti
populasi penduduk Indonesia, populasi ayam di DKI Jakarta. Tetapi juga merujuk pada populasi
objek atau event atau prosedur, termasuk juga jumlah suatu zat dalam urin, kunjungan ke dokter, atau
tindakan operasi. Jadi, Populasi bisa berupa kumpulan makhluk hidup, sesuatu, kasus, dsb.

Sampel
Kumpulan dari satuan/unit yang kita ambil dari populasi studi (n).

Syarat Sampel Random :
1.Setiap unit/individu dalam populasi memiliki kesempatan yang sama untuk terpilih sebagai sampel
2.Harus secara akurat mewakili populasi di mana sampel diambil → Representatifmenghindari
   adanya penyimpangan atau bias
3.Besarnya atau jumlahnya memadai

Beda Parameter dan Sampel
Parameter yaitu sejumlah angka yang menggambarkan populasi, sedangkan
Statistik yaitu sejumlah angka yang dihitung dari sampel.

Dalil Penting dari Statistik Inferens adalah
Distribusi Sampel
Distribusi Sampel:
Distribusi dari mean-mean sampel yang diambil secara berulang-ulang dari suatu populasi.


Sifat- Sifat distribusi Sampel
Sifat distribusi Sampel disebut sebagai Central Limit Theorem (Theorema Limit Pusat)

1. Jika sampel random diambil dari populasi normal dengan mean = µ dan varian 
    distribusi sampel harga mean adalah x = µ dan varian 2/n = /√n (SEM)
SEM = Standar Error of Mean
2. Apabila populasi berdistribusi normal → distribusi sampel harga mean juga akan berdistribusi
    normal, maka berlaku persamaan Z

                                                Z = x - µ
  SE
3. Walaupun populasi berdistribusi sembarang, jika sampel diambil berulang-ulang maka distribusi
    harga meannya akan membentuk distribusi normal

Distribusi sampel memperlihatkan  hubungan antara probabilitas statistik dan nilai statistik untuk semua sample size (sampel yang diambil) yang menggambarkan populasi
  Pengambilan sampel pada populasi distribusi normal

1.Kesalahan baku (SE) lebih kecil dibandingkan dengan simpangan baku (sd) populasinya.


2.Makin besar sample makin kecil kesalahan baku (SE).

Contoh Soal
1. Distribusi Kadar kolesterol serum untuk laki-laki usia 20 sampai 74 tahun di Indonesia tahun 2000
     menunjukkan bahwa mean untuk populasi adalah (µ) = 211 mg/100 ml dan standar deviasi
     (၈) = 46 mg/100 ml.
     Jika kita memiliki sampel size = 25 orang dari populasi, berapa proporsi dari sampel yang akan           diambil untuk nilai mean 230 mg/100 ml atau lebih tinggi?
Jawaban
1. Z = X - µ
     SE
SE = /√n = 46/√25 = 9.2 mg/100 ml
Z = X – 211
   9.2
 X = 230 → Z = 230 – 211
                            9.2
                   Z = 2.07
Atau Cara Lain:
Z = 2.07 à lihat pada tabel Distribusi Normal Standar à Didapat 0.4808

Karena tabelnya distribusi  Normal Standar 
maka dihitung dengan cara : 0.5 – 0.4808 = 0.0192 = 1.9%

                                    211                            230
Interpretasinya:
(Hanya) 1,92% dari sampel laki-laki usia 20 sampai 74 tahun di Indonesia tahun 2000 memiliki Kadar kolesterol serum mean yang sama dengan atau lebih besar dari nilai 230 mg/100 ml.

SD (Standar Deviasi)
⟹Disebut juga Simpangan Baku
⟹Ukuran sebaran statistik yang paling lazim. SD mengukur bagaimana nilai-nilai data tersebar.
⟹Atau Rata-rata jarak penyimpangan titik-titik data (nilai-nilai observasi) diukur dari nilai rata-rata
    data tersebut.
⟹SD = 0, berarti datanya homogen = sama


⟹Semakin kecil SD, semakin sempit rentang (beda) antara nilai tertinggi dengan nilai terendah,
     begitu sebaliknya.

Standard Error (SE)
Standard Error adalah standar deviasi dari rata-rata
Jika kita hitung nilai standar deviasi dari tiga buah nilai rata-rata, maka nilai standar deviasi dari nilai
rata-rata tersebut disebut sebagai standard error.

➣Nilai SE kecil berarti penyebaran mean/rata-rata sampel juga kecil maka estimasi terhadap parameter populasi akan lebih tepat.
➣Bila nilai SE besar berarti penyebaran mean/rata-rata sampel juga besar maka estimasi terhadap parameter populasi menjadi kurang tepat.
➣Nilai SE akan turun (semakin kecil) apabila  jumlah sampel diperbanyak dan varians atau SD sampel dikurangi.
➣SE mengukur presisi dari perkiraan parameter populasi.
➣Ukuran statistik ini dapat menunjukkan seberapa dekat nilai mean populasi dengan nilai estimasi yang didapat dari nilai mean sampel.

Oleh karena itu, SE dapat digunakan untuk menentukan dan mengontrol jumlah sampel


PERBEDAAN RUMUS VARIANS, SD, DAN SE



Varian = Var = ∑(xi – x)2

                           n - 1






Standard error of mean
Standard Error (SE) dalam beberapa referensi disebut juga dengan Standard Error of Mean
(SEM) adalah estimasi dari standar deviasi yang didapat dari mean-mean dari sejumlah
sampel yang menggambarkan populasi

SEM = SD(dari Mean)/√n = SE

Standard error untuk proporsi/prosentase
     SE juga dapat dihubungkan dengan prosentase atau proporsi.Dalam hal ini, jumlah sampel akan dipengaruhi oleh nilai standard error, tetapi jumlah variasinya ditentukan oleh nilai dari prosentase atau proporsi dalam populasi itu sendiri sehingga tidak dibutuhkan estimasi dari SD.
Jika p mewakili 100% maka 100 – p adalah nilai yang lainnya. Dengan demikian,
Rumus yang digunakan adalah
  SE Prosentase =
                                   p(100 – p)
                                             n

Margin error
Margin Error adalah suatu tingkat ketidaksesuaian hasil statistik dengan kenyataan di lapangan
Margin of Error ini dapat menunjukkan keakuratan dalam suatu penelitian/poling/ survei
Margin of Error = Critical value * Standard error
Critical value diambil dari nilai skor z, misalnya untuk tingkat kepercayaan 95% maka didapat nilai skor Z adalah 1.96 (didapat dari tabel distribusi normal)

ESTIMASI 
Estimasi merupakan ketrampilan untuk hidup (skill for life)
Jika Anda berangkat ke kampus untuk mengikuti kelas, Anda mengestimasi berapa lama perjalanan dari tempat tinggal ke UHAMKA dengan menggunakan jenis kendaraan tertentu. Dengan estimasi tersebut, Anda akan terhindar dari keterlambatan sampai di kelas
Jika waktu dan informasi cukup memadai, maka estimasi yang akurat,   menghasilkan ukuran yang dapat  dipertanggung jawabkan

Estimasi dalam Statistik

                                                               SAMPEL ⟹  POPULASI
Estimasi:
Metode memperkirakan nilai populasi (parameter) dengan memakai nilai sampel (statistik) ⟹karena perhitungan langsung pada seluruh populasi tidak mungkin dilalukan


Dengan estimasi, tidak perlu mengambil sampel berulang kali utk mengetahui distribusi samping.

Estimator
Merupakan Nilai statistik atau statistik sampel yang dipakai untuk menduga nilai populasi (parameter).
Sifat estimator :
1. Tidak bias.
2. Efisien.
3. Konsisten.

Bentuk estimasi :
1. Estimasi Titik
    Mengandung perhitungan angka tunggal untuk mengestimasi nilai parameter.
2. Estimasi Selang
    Metode yang memberikan hasil perhitungan nilai berupa nilai jangkauan untuk mengestimasi nilai      parameter.

Rumus umum Estimasi Selang/Confidence Interval (CI)

  St – Z ½α. SE ≤ parameter ≤ St + Z ½α.  SE
Di mana:
St              = nilai statistik (sampel = xbar)
Z1/2 α       = deviasi relatif (standar score, ditentukan oleh confident                 
                     interval : Z1/2 α 95% = 1.96, Z1/2α  90% = 1.645
SE            = standar d error (σ/n)
Parameter = nilai populasi yg diduga (µ)
Atau


  xbar Z ½α.SE  ≤ µ ≤  xbar + Z ½α.SE

Nilai Confidence Interval
CI 99% → Z ½ α = ± 2.575
CI 95% Z ½ α = ± 1.96
CI 90% → Z ½ α = ± 1.645
CI 80% → Z ½ α = ± 1.28
•⇒Di dapat dari tabel distribusi Normal Standar

Distribusi student t
Ketika jumlah sampel tidak besar, dua aspek yang dapat berubah :
1)Standard deviasi sampel (s) , yang tunduk pada variasi sampel, mungkin tidak dapat diandalkan untuk mengestimasi nilai standard deviasi populasi (σ)
2)Ketika distribusi di populasi tidak normal maka distribusi sample dari mean mungkin juga tidak normal
SE = s/√n                                       df   = n – 1 
                              



UJI HIPOTESIS

Uji hipotesis adalah suatu prosedur yang dilakukan dengan tujuan memutuskan apakah

ada perbedaan atau hubungan, cukup meyakinkan untuk ditolak atau tidak(gagal) ditolak.
Uji hipotesis di gunakan untuk mencapai keputusan tentang sesuatu populasi yang dinilai
dari sampel yang diambil dari populasi.Secara luas Uji hipotesis digunakan untuk
penelitian di bidang kedokteran, kedokteran gigi, kesehatan masyarakat, dan bidang
lainnya untuk menggambarkan keputusan dari populasi. Keyakinan untuk ditolak atau
tidaknya suatu hipotesis didasarkan pada peluang untuk memperoleh hubungan tersebut
secara kebetulan (by chance).

Prinsip Uji Hipotesis
             
Melakukan perbandingan antara nilai data sampel (data hasil penelitian) dengan nilai
hipotesis (nilai populasi).

Peluang diterima atau ditolaknya Hipotesis

Tergantung besar kecilnya perbedaan antara nilai sampel dengan nilai hipotesis. Bila
perbedaan cukup besar, peluang-peluang untuk menolak hipotesis pun besar. Begitu
sebaliknya.

Kesimpulan Yang di Dapat dari Pengujian Hipotesis:

1. Menolak hipotesis
2. Menerima hipotesis (gagal menolak hipotesis)⇒ Penelitian tidak cukup bukti untuk menolak hipotesis, hingga disebut "gagal menolak hipotesis

Jenis Hipotesis
1. Hipotesis nol (Ho)
    Menyatakan tidak ada hubungan antara variabel satu (exposure) dengan variabel yang
    lain(disease/outcome)
Contoh: Tidak ada hubungan antara jenis kelamin dengan tekanan darah.

2. Hipotesis Alternatif (Ha)
    Menyatakan ada perbedaan sesuatu kejadian antara kedua kelompok
Contoh: Ada hubungan antara kebiasaan merokok pada ibu hamil dengan berat badan              bayi waktu lahir.

Bentuk Uji Hipotesis atau dua sisi (two tail)
1. One tail
     apabila hipotesis alternatif menyatakan adanya perbedaan dan ada pernyataan yang mengatakan bahwa hal yang satu lebih rendah/tinggi daripada yang lain. 
Contoh: BB bayi dari  ibu hamil yang merokok lebih kecil dibandingkan BB bayi dari ibu hamil yang tidak merokok

2. Two tail
    apabila hipotesis alternatif hanya menyatakan perbedaan tanpa melihat apakah yang satu lebih tinggi/rendah daripada yang lain.
Contoh: BB bayi dari ibu hamil yang merokok berbeda dibandingkan BB bayi dari ibu yang tidak merokok 


Ada 2 jenis kesalahan pengambilan keputusan dalam uji statistik
1. Kesalahan tipe I (𝟃)
    Kesalahan menolak Ho, padahal sesungguhnya Ho benar.
Menyimpulkan adanya perbedaan, padahal sesungguhnya tidak ada perbedaan.

2. Kesalahan tipe II (ß)
   Kesalahan tidak menolak Ho,padahal sesungguhnya Ho salah.
Menyimpulkan tidak ada perbedaan, padahal sesungguhnya ada perbedaan. 


Menentukan Tingkat Kemaknaan

➔Nilai yang menunjukkan besarnya peluang salah dalam menolak H0
➔Tingkat kemaknaan sering disebut dengan Nilai 𝟃 ⇒merupakan batas toleransi
    peluang salah dalam menolak H0
merupakan nilai batas maksimal kesalahan menolak H0
➔Juga sebagai batas maksimal kita salah menyatakan adanya perbedaan/ada 
    hubungan


Nilai PValue

Nilai Pvalue merupakan nilai yang menunjukkan besarnya peluang salah menolak
Ho dari data penelitian.

→Harapan kita nilai Pvalue adalah sekecil mungkin, sebab bila nilai Pvalue kecil maka kita yakin bahwa adanya perbedaan pada hasil penelitian menunjukkan pula adanya perbedaan di populasi


→Dengan kata lain kalau nilai Pvalue nya kecil maka perbedaan yang ada pada penelitian terjadi bukan karena faktor kebetulan (by chance). 

 →Nilai Pvalue adalah Jika didapat nilai Pvalue atau Pvalue ≤ 0.05 à Ho ditolak →menunjukkan bahwa ada perbedaan atau ada hubungan antara kelompok  yang diteliti.





Tentang PValue
Pvalue, atau kemaknaan secara statistik, tidak mengukur besarnya suatu efek atau pentingnya suatu hasil penelitian
⇒Kemaknaan statistik tidak sama dengan kemaknaan ilmiah 
⇒Efek yang identik bisa saja menghasilkan p-values yang berbeda jika presisi hasil pengukurannya berbeda 

⇒Analisis data tidak boleh berhenti pada Pvalue


⇒Analisis data seharusnya menyertakan pula pendekatan lain untuk sampai pada suatu kesimpulan .