Statistics Center
Logo Statistics Center
STATISTICS CENTER
Berdasarkan hasil survey yang telah dilakukan pada beberapa mahasiswa, 75% responden menyatakan bahwa statistika itu sulit dan cukup mahalnya biaya untuk melakukan analisis data pada beberapa lembaga analisis di kota malang membuat enggan mahasiswa untuk menggunakan layanan ini . Untuk itu, rencana dalam program ini kami ingin mendirikan lembaga di bidang jasa konsultasi statistika yang bernama ”Statistics Center (SCe)”. Lembaga ini diharapkan mampu membantu menyelesaikan masalah-masalah yang ada khususnya dalam hal penelitian baik dari akademisi, instansi pemerintah maupun swasta.
Factor Analysis
Exploratory research on a topic may identify many variables of possible interest, so many that their sheer number can become a hindrance to effective and efficient analysis.
Factor analysis is a "data reduction" technique that reduce the number of variables studied to a more limited number of underlying "factors."
Factor analysis is based on a model that supposes that correlations between pairs of measured variables can be explained by the connections of the measured variables to a small number of non-measurable (latent), but meaningful variables, which are termed factors.
The aims of factor analysis are to: (i) identify the number of factors; (ii) define the factors as functions of the measured variables; (iii) study the factors which have been defined.
Cluster Analysis
In multivariate analysis, cluster analysis refers to methods used to divide up objects into similar groups, or, more precisely, groups whose members are all close to one another on various dimensions being measured. In cluster analysis, one does not start with any apriori notion of group characteristics. The definition of clusters emerges entirely from the cluster analysis - i.e. from the process of identifying "clumps" of objects.
Hypothesis testing
The philosophical basis for hypothesis testing lies in the fact that random variation pervades all aspects of life, and in the desire to avoid being fooled by what might be chance variation. The alternative hypothesis typically describes some change or effect that you expect or hope to see confirmed by data. For example, new drug A works better than standard drug B. Or the accuracy of a new weapon targeting system is better than historical standards. The null hypothesis embodies the presumption that nothing has changed, or that there is no difference.
Hypothesis testing comes into play if the observed data do, in fact, suggest that the alternative hypothesis is true (the new drug produces better survival times than the old one in an experiment, for example). We ask the question "is it possible that chance variation might have produced this result?"
As noted, the null hypothesis stands ("is accepted") unless the data at hand provide strong enough evidence against it. "Strong enough" means that probability that you would obtain a result as extreme as the observed result, given that the null hypothesis is true, is small enough (usually < 0.05) given the null hypothesis is true.
Regresi
Regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dan variabel(-variabel) yang lain. Variabel "penyebab" disebut dengan bermacam-macam istilah: variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak.
Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini.
Istilah regresi diperkenalkan oleh Sir Francis Galton, yang menemukan bahwa meskipun ada kecenderungan bagi orang tua yang tinggi mempunyai anak yang tinggi dan orang tua yang pendek mempunyai anak yang pendek, distribusi tinggi populasi tidak berubah secara mencolok dari generasi ke generasi. Penjelasannya adalah bahwa kecenderungan bagi rata-rata tinggi anak dengan orang tua yang mempunyai tinggi tertentu untuk bergerak atau mundur (regress) ke arah tinggi rata-rata seluruh populasi. Hukum regresi semesta (law of universal regression), yang bersifat biologis ini diperkuat oleh Karl Pearson. Ia menemukan bahwa rata-rata tinggi anak laki-laki kelompok ayah yang tinggi kurang daripada tinggi ayah mereka dan rata-rata tinggi anak laki-laki kelompok ayah yang pendek lebih tinggi dari pada tinggi ayah mereka.
Sesuai dengan perkembangan metodologi dan penerapannya, definisi regresi pada saat ini telah berbeda jauh dari pengertian awal tersebut. Umpamanya, dengan regresi pendugaan-pendugaan terhadap sesuatu performa dapat dilakukan, selama variabel-variabel penentu dapat ditentukan sebelumnya.
Regresi berkaitan dengan ketergantungan stokastik, yang berarti memiliki peluang untuk meleset dari prediksi. Setiap pengambilan dugaan yang menggunakan regresi harus didasari dengan kesadaran bahwa hasil perkiraan tidak akan 100% sama dengan kenyataan (ketergantungan deterministik).
Sejarah Statistika
Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa latin modern statisticum collegium ("dewan negara") dan bahasa Italia statista ("negarawan" atau "politikus").
Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai "ilmu tentang negara (state)". Pada awal abad ke-19 telah terjadi pergeseran arti menjadi "ilmu mengenai pengumpulan dan klasifikasi data". Sir John Sinclair memperkenalkan nama (Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap saat.
Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-bidang dalam matematika, terutama probabilitas. Cabang statistika yang pada saat ini sangat luas digunakan untuk mendukung metode ilmiah, statistika inferensi, dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher (peletak dasar statistika inferensi), Karl Pearson (metode regresi linear), dan William Sealey Gosset (meneliti problem sampel berukuran kecil). Penggunaan statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak dipengaruhi oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika.
Meskipun ada kubu yang menganggap statistika sebagai cabang dari matematika, tetapi orang lebih banyak menganggap statistika sebagai bidang yang banyak terkait dengan matematika melihat dari sejarah dan aplikasinya. Di Indonesia, kajian statistika sebagian besar masuk dalam fakultas matematika dan ilmu pengetahuan alam, baik di dalam departemen tersendiri maupun tergabung dengan matematika.
DATA & ANALISIS DATA
A. PENGERTIAN DATA DAN JENISNYA
Data : Merupakan keterangan-keterangan tentang suatu hal, dapat berupa sesuatu yang diketahui atau yang dianggap atau anggapan.
Dapat digambarkan lewat angka, simbol, kode dan lain-lain.
Data perlu dikelompokan, pengelompokan data dapat dibagi menjadi :
· Sumber Pengambilannya
a. Data Primer
b. Data Sekunder
· Waktu Pengumpulannya
a. Data Berkala (time series)
b. Kerat Lintang (cross section)
· Menurut Sifatnya
a. Data Kualitatif
b. Data Kuantitatif
· Menurut Tingkat Pengukurannya
a. Data Nominal
b. Data Ordinal
c. Data Interval
d. Data Rasio
B. PENGUMPULAN DATA
Pengumpulan Data : Pencatatan peristiwa-peristiwa atau hal-hal atau keterangan-keterangan atau karakteristik-karakteristik sebagian atau seluruh elemen populasi yang akan menunjang atau mendukung penelitian
Beberapa kegiatan pengumpulan data, adalah sebagai berikut :
Angket (kuisioner)
1.1. Angket Terbuka (opened questionare)
1.2. Angket Tertutup (closed questionare)
1.3. Angket Semi Terbuka (semi opened questionare)
2. Wawancara (interview)
a. Wawancara berstruktur
b. Wawancara tidak berstruktur
3. Observasi
3.1. Berdasarkan cara pengamatan yang dilakukan
a. Observasi berstruktur
b. Observasi tak berstruktur
3.2. Berdasarkan keterlibatan pengamatan dalam kegiatan seseorang
a. Observasi partisipan
c. Observasi tak partisipan
Komponen-komponen observasi :
Pemilihan
Pengubahan
Pencatatan
Pengodean
Rangkaian prilaku dan suasana
Tujuan Empiris
4. Studi Dokumentasi
Studi dolumentasi adalah teknik pengumpulan data yang tidak langsung ditujukan pada subyek penelitian, namun melalui dokumen (dapat berupa buku harian /otobiograpi, catatan kasus dalam pekerjaan sosial atau dokumen lainnya.
5. Analisis Isi
Berdasarkan teknik pengumpulan datanya, analisis isi ini dapat dibagi menjadi :
5.1. Sensus
5.2. Sampling
C. PENGERTIAN ANALISA DATA
Definisi analisa data dapat diuraikan sebagai berikut :
Menurut Patton (1980)
Analisa Data adalah proses mengatur urutan data, mengorganisasikannya kedalam suatu pola, kategori dan satuan uraian dasar.
Menurut Bogdan dan Taylor (1975)
Analisa Data adalah proses yang merinci usaha formal untuk menemukan tema dan merumuskan hipotesis (ide) seperti yang disarankan oleh data dan sebagai usaha untuk memberikan bantuan pada tema dan hipotesis itu
Menurut Lexy J. Moleong (2000)
Analisa Data adalah proses mengorganisasikan dan mengurutkan data kedalam pola, kategori, dan satuan uraian dasar sehingga dapat ditemukan tema dan dapat dirumuskan hipotesis kerja seperti yang disarankan oleh data.
Dari definisi tersebut diatas, analisa data dapat diartikan sebagai berikut :
a. Membandingkan dua hal atau nilai variabel untuk mengetahui selisihnya atau rasionya, kemudian diambil kesimpulannya ( X – Y) = selisih, X / Y = rasio
b. Menguraikan atau memecahkan suatu keseluruhan menjadi bagian-bagian atau komponen-komponen yang lebih kecil, agar dapat :
b.1. Mengetahui komponen yang menonjol (memiliki nilai ekstrim)
b.2. Membandingkan antara komponen yang satu dengan komponen lainnya (dengan menggunakan angka selisih atau angka rasio)
b.3. Membandingkan salah satu atau beberapa kkomponen dengan keseluruhan (secara persentase)
c. Memperkirakan atau besarnya pengaruh secara kuantitatif dari perubahan suatu (beberapa) kejadian terhadap sesuatu (beberapa) kejadian lainnya, serta memperkirakan /meramalkan kejadian lainnya. Kejadian (event) dapat dinyatakan sebagai perubahan nilai variabel.
Bentuk-bentuk analisa data adalah sebagai berikut :
1. Analisa Kuantitatif
Analisa yang menggunakan alat analisa bersifat kuantitatif, dimana alat yang digunakan berupa model-model (ex. Matematika) dengan hasil yang disajikan berupa angka-angka yang kemudian diuraikan/dijelaskan atau diinterpretasikan dalam suatu uraian.
2. Analisa Kualitatif
Analisa Kualitatif terbatas pada teknik pengolahan datanya, seperti pengecekan data dan tabulasi, dalam hal ini sekedar membaca tabel-tabel, grafik-grafik atau angka-angka yang tersedia, kemudian melakukan uraian dan penafsiran.
D. TUJUAN ANALISIS DATA
Tujuan analisa data, antara lain sebagai berikut :
1. Data dapat diberi makna yang berguna dalam memecahkan masalah-masalah penelitian
2. Memperlihatkan hubungan-hubungan antara fenomena yang terdapat dalam penelitian
3. Untuk memberikan jawaban terhadap hipotesis yang diajukan dalam penelitian
4. Bahan untuk membuat keseimpulan serta implikasi-implikasi dan saran-saran yang berguna untuk kebijakan penelitian selanjutnya.
Model-Model Analisis Statistik Non Parametrik
Binomial Test
Binomial Test (Uji Binomial) merupakan metode analisis jika populasi terdiri dari 2 kelompok klas, jadi datanya mempunyai skala pengukuran nominal.
X 2 Test
X 2 Test (Uji Chi Square) merupakan metode analisis untuk menguji independensi, dimana suatu variabel ada atau tidak ada hubungan dengan variabel lain.
Sign Test
Sign Test (Uji Tanda) merupakan metode analisis untuk menguji hipotesis komparatif dua sampel yang berkorelasi, dimana datanya mempunyai skala pengukuran ordinal. Metode analisis ini menggunakan data yang dinyatakan dalam bentuk tanda-tanda positif dan negatif, dari perbedaan antara pengamatan yang berpasangan.
Run Test
Run Test (Uji Run = Uji Randomness) merupakan metode analisis yang digunakan untuk menguji hipotesis deskriptif satu sampel, datanya mempunyai skala pengukuran ordinal. Metode analisis Run Test ini untuk mengukur kerandoman populasi yang didasarkan atas data sampel.
Mc. Nemar Test
Mc. Nemar Test merupakan metode analisis untuk menguji hipotesis komparatif dua sampel yang berkorelasi, datanya mempunyai skala pengukuran nominal/diskrit. Rancangan penelitian biasanya berbentuk “before-after”.
Wilcoxon Test.
Wilcoxon Test (Uji Jenjang Wilcoxon) merupakan metode analisis penyempurnaan dari Uji Tanda. Metode analisis ini selain tandanya (positif atau negatif) juga memperhatikan besarnya, jumlahnya, atau stratanya.
Median Test.
Median Test (Uji Median) merupakan metode analisis data untuk menguji hipotesis komparatif dua sampel independen, datanya mempunyai skala pengukuran nominal atau ordinal. Metode analisis ini menguji ada tidaknya perbedaan duakelompok populasi berdasarkan mediannya.
Mann-Whitney Test.
Mann-Whitney Test (Uji Mann-Whitney = Uji U) merupakan metode analisis untuk menguji hipotesis komparatif dua sampel independen, datanya mempunyai skala pengukuran oedinal. Jika datanya mempunyai skala pengukuran interval, dapat dilakukan dengan analisis Uji t, jadi untuk menggunakan analisis ini skala pengukuran datanya harus diubah dahulu menjadi skala ordinal. Hal ini dapat dilakukan jika asumsi untuk Uji t tidak terpenuhi, yaitu populasinya tidak mengikuti distribusi normal.
Kolmogorov-Smirnov Test.
Kolmogorov-Smirnov Test merupakan metode analisis untuk mengetahui apakah distribusi frekuensi hasil pengamatan (observed frequencies distribution) sesuai dengan normal frequencies distribution. Dalam analisis ini yang diperbandingkan adalah distribusi frekuensi kumulatif hasil pengamatan dengan distribusi frekuensi kumulatif yang diharapkan (actual observed cumulative frequency) dengan expected cumulative frequency).
Statistics Center
METODE ANALISIS DATA
1. Analisis Deskriptif
Analisis deskriptif ini mempunyai tujuan untuk memberikan gambaran atau deskripsi suatu populasi. Misalnya populasi dilihat dari nilai rata-ratanya (mean, median, modus), standar deviasi, variansi, nilai minimum dan maksimum, kurtosis dan skewness (kemencengan distribusi). Data yang dianalisis dapat berupa data kualitatif atau data kuantitatif. Cara penyajiannya dapat dilengkapi dengan menggunakan tabel, grafik dan diagram (garis, batang, lingkaran maupun yang lain baik dengan 2 dimensi maupun 3 dimensi).
2. Analisis Univariate
Analisis ini digunakan untuk memecahkan permasalahan yang hanya terdiri dari 1 variabel. Analisis yang sering digunakan dalam univariate ini diantaranya : Uji t (uji beda untuk 2 populasi), Analisis Variansi (Anova, Uji F) jika digunakan untuk menguji perbedaan lebih dari 2 populasi.
3. Analisis Multivariate
Analisis Multivariate digolongkan menjadi 2 golongan analisis :
a. Model Dependen.
Pada model dependen ini, dapat dibedakan dengan jelas mana variabel dependennya dan mana variabel independennya.
(1) Model dengan 1 variabel dependen dan > 1 variabel independen. Jika variabel dependen maupun variabel independen mempunyai skalapengukuran interval atau rasio, maka analisis data yang sesuai adalah : “Analisis Regresi Berganda” (Multiple Regression Analysis). Jika variabel dependen mempunyai skala pengukuran nominal yang terdiri dari 2 kategori, sedangkan variabel independen semuanya mempunyai skala pengukurannominal, ordinal, interval maupun rasio, atau campuran diantara keempat skala pengukuran, maka analisis data yang sesuai adalah : “Analisis Regresi Logistik” (Logistic Regression Analysis). Analisis yang mirip dengan analisis regresi tetapi variabel dependennya dinyatakan dengan skor diskriminan (D), maka analisis ini dikenal dengan “Analisis Diskriminan” (Discriminant Analysis). Analisis Diskriminan ini menitik beratkan pada teknik pengelompokan yaitu dengan mencari kombinasi linier variabel independen (variabel diskriminator) mana saja yang bisa mengelompokkan individu menjadi 2 kelompok, 3 kelompok dan sebagainya.
(2) Model dengan > 1 variabel dependen dan 1 variabel independen. Jika Variabel dependen semuanya mempunyai skala pengukuran interval atau rasio, dan variabel independennya mempunyai skala pengukuran nominal dengan 2 atau lebih kategori, maka analisis data yang sesuai adalah : “Analisis Varian Multivariate” (Multivariate Analysis of Variance = MANOVA). Jika variabel independen mempunyai skala pengukuran nominal dengan 2 kategori maka analisis data yang sesuai adalah : “Hotelling’s T”. Jika variabel independen mempunyai skala pengukuran nominal dengan > 2kategori maka analisis data yang sesuai adalah : “Wilk’s Lambda”. Jika variabel dependen mempunyai skala pengukuran nominal sedangkan variabel independen skala pengukuran interval atau rasio maka dapat digunakan : “Analisis Korelasi Kanonikal” (Canonical Correlation Analysis). Pada analisis korelasi kanonikal ini kita mencari kombinasi linier diantara sejumlah variabel independen yang mempunyai korelasi yang kuat dengan sejumlah variabel dependen.
b. Model Interdependen.
Pada model interdependen ini, tidak dapat dibedakan dengan jelas mana variabel dependennya dan mana variabel independennya, keduanya saling interdependensi.
(1) Semua variabel mempunyai skala pengukuran interval atau rasio, maka ada 4 jenis analisis data yang dapat digunakan.
“Analisis Komponen Utama” (Principal Component Analysis = PCA).
Analisis Komponen Utama ini merupakan teknik untuk mereduksi variabel dengan menyusun kombinasi linier variabel asal sehingga jumlahnya menjadi lebih sedikit dan satu sama yang lain menjadi orthogonal (independen). Ini salah satu cara untuk mengatasi adanya kolinieritas variabel independen pada analisis regresi.
“Analisis Faktor” (Factor Analysis).
Analisis Faktor ini juga merupakan teknik untuk mereduksi variabel menjadi faktor yang merupakan kumpulan variabel.
“Penskalaan Multidimensi Metrik” (Metric Multidimension Scaling).
Analisis Penskalaan Multidimensi Metrik ini merupakan teknik matematik yang memungkinkan seseorang untuk menyajikan kedekatan atau kemiripan (proximity or similarity) antara obyek secara meruang (spatial) sebagimana dalam suatu peta. Jadi intinya adalah memetakan obyek dalam ruang multidimensi sedemikian rupa sehingga posisi relatif di suatu ruang mencerminkan derajat kemiripan antara obyek.
“Analisis Rumpun” (Cluster Analysis).
Analisis Rumpun merupakan teknik untuk mereduksi data sehingga menjadi kelompok yang lebih kecil sedemikian rupa sehingga elemen yang berada di dalam satu rumpun mempunyai kemiripan yang tinggi dibandingkan dengan elemen lain yang berada di dalam rumpun lain. Penggunaannya sering dikacaukan dengan analisis diskriminan. Pada analisis diskriminan penentuan jumlah kelompok (dua atau lebih) dilakukan dari awal, sedangkan pada analisis rumpun pada akhir alanisis diperoleh sejumlah rumpun atas dasar kemiripan (similarity).
(2) Semua variabel mempunyak skala pengukuran nominal.
Jika semua variabel mempunyai skala pengukuran nominal, maka analisis data yang sesuai adalah “Model Log Linier” (Loglinear Model). Model Log Linier ini mempelajari hubungan antar multivariabel yang mempunyai skla pengukuran nominal yang membentuk tabel kontingensi multidimensional (Multidimensional Contingency Table). Model Log Linier ini menyatakan probabilitas sel dari tabel kontingensi multidimensional dalam bentuk efek utama (main Effect) dan efek interaksi (interaction effect). Dalam hal model, Model Log Linier ini ada kemiripan dengan Analisis Variansi Dua Arah.
c. Model-Model Analisis Multivariate Yang Lain.
“Analisis regresi Ordinal” (Ordinal Regression Analysis) .
Analisis regresi Ordinal adalah analisis regresi dimana variabel dependen maupun variabel independennya mempunyai skala pengukuran ordinal.
“Analisis Regresi Polikhotomus” (Polychotomous Regression Analysis).
Analisis Regresi Polikhotomus ini mirip dengan Analisis Logistik. Jika pada analisis logistik variabel dependen adalah dikhotomus (2 kategori) maka pada analisis regresi polikhotomus variabel dependen adalah polikhotomus (>2 kategori).
“Analisis Regresi Poisson” (Poisson Regression Analysis).
Analisis Regresi Poisson adalah analisis regresi yang variabel dependennya mengikuti distribusi Poisson.
“Analisis Jalur” (Path Analysis).
Analisis Jalur ini mirip dengan analisis regresi. Perbedaannya adalah bahwa pada analisis jalur ini dapat membantu dalam mempelajari efek langsung, efek tidak langsung maupun efek total dari variabel-variabel yang dianggap menjadi penyebab dari variabel-variabel lain yang dianggap sebagai variabel akibat.
“Analisis Model Persamaan Struktural” (Structural Equation Model = SEM).
Analisis Model Persamaan Struktural (Structural Equation Model = SEM),
merupakan metode statistik yang menggunakan pendekatan konfirmatory yang mengandung dua aspek penting, yaitu : proses yang dikaji dapat ditampilkan dalam bentuk persamaan struktural (regresi) dan hubungan struktural dari persamaan tersebut dapat divisualisasikan dalam bentuk gambar (diagram).
Dalam analisis SEM ini peneliti dapat melakukan tiga kegiatan sekaligus secara serempak yaitu :
- Pemeriksaan validitas dan reliabilitas instrumen (setara dengan analisis faktor konfirmatory).
- Pengujian model hubungan antar variabel laten (setara dengan analisis jalur).
- Membuat model prakiraan (setara dengan model struktural atau analisis regresi).