REGRESI LINIER SEDERHANA
1. Hubungan Antarvariabel
Hubungan antarvariabel
dapat berupa hubungan linier ataupun hubungan tidak linier. Misalnya, berat
badan laki-laki dewasa sampai pada taraf tertentu bergantung pada
tinggi badan, keliling lingkaran bergantung pada diameternya, dan tekanan gas
bergantung pada suhu dan volumenya. Hubungan-hubungan itu bila dinyatakan dalam
bentuk matematis akan memberikan persamaan-persamaaan tertentu.
Untuk dua variable,
hubungan liniernya dapat dinyatakan dalam bentuk persamaan linier, yaitu:
y= a+bx
Keterangan :
Y, X = variabel
a, b = bilangan konstan
(konstanta)
Hubungan antara dua
variabel pada persamaan linier jika digambarkan secara grafis (scatter
diagram), semua nilai Y dan X akan berada pada suatu garis lurus. Dalam
ilmu ekonomi, garis itu disebut garis regresi.
Karena antara Y dan X
memiliki hubungan, maka nilai X dapat digunakan untuk menduga atau
meramal nilai Y. Dalam hal ini, X disebut variabel bebas, yaitu variabel yang
nilai-nilainya bergantung pada variabel lain.
Hubungan
antarvariabel yang akan dipelajari disini hanyalah hubungan
linier sederhana, yaitu hubungan yang hanya melibatkan dua variabel
(X dan Y) dan berpangkat satu.
2. Persamaan Garis Regresi Linier
Sederhana
Regresi yang berarti
peramalan, penaksiran, atau pendugaan pertama kali diperkenalkan pada tahun
1877 oleh Sir Francis Galton (1822-1911) sehubungan dengan penelitiannya
terhadap tinggi manusia. Penelitian tersebut membandingkan antara tinggi anak
laki-laki dan tinggi badan ayahnya.
Analisis regresi juga
digunakan untuk menentukan bentuk hubungan antar variabel. Tujuan utama dalam
penggunaan analisis itu adalah untuk meramalkan atau memperkirakan nilai dari
satu variabel dalam hubungannya dengan variabel yang lain yang diketahui
melalui persamaan garis regresinya.
Untuk populasi,
persamaan garis regresi linier sederhananya dapat dinyatakan dalam bentuk:
Keterangan:
rata-rata Y bagi X
tertentu.
konstanta atau
parameter atau koefisien regresi populasi
Karena populasi jarang
diamati secara langsung, maka digunakan persamaan regresi linier sederhana
sampel sebagai penduga persamaan regresi linier sederhana populasi. Bentuk
persamaannya adalah :
Keterangan:
Y =
penduga bagi
variabel terikat
(variabel yang diduga)
X = variabel
bebas (variabel yang diketahui)
a,b = penduga parameter
A dan B = koefisien regresi sampel
a =
intersep (nilai Y, bila X = 0)
b
= slop (kemiringan garis regresi)
Persamaan memberikan
arti jika variabel X mengeluarkan satu satuan maka variabel Y akan mengalami
peningkatan atau penurunan sebesar 1 b.
Untuk membuat peramalan, penaksiran, atau
pendugaan dengan persamaan regresi, maka nilai dan b harus
ditentukan terlebih dahulu. Dengan metode kuadrat terkecil (least square),
nilai dan b dapat ditentukan dengan rumus berikut.
2. PENDUGAAN DAN PENGUJIAN KOEFISIEN REGRESI
2.1 Kesalahan Baku Regresi dan Koefisien Regresi Sederhana
Kesalahan baku atau
selisih taksir standar merupakan indeks yang digunakan untuk mengukur tingkat
ketepatan regresi (pendugaan) dan koefisien regresi (penduga) atau mengukur
variasi titik-titik observasi di sekitar garis regresi. Dengan kesalahan baku,
batasan seberapa jauh melesetnya perkiraan kita dalam meramal data dapat
diketahui. Apabila semua titik observasi berada tepat pada garis regresi maka
kesalahan baku akan bernilai sama dengan nol. Hal itu berarti perkiraan yang
kita lakukan terhadap data sesuai dengan data yang sebenarnya,
Berikut ini rumus-rumus yang secara
langsung digunakan untuk menghitung kesalahan baku regresi dan koefisien
regresi.
1. Untuk regresi, kesalahan bakunya dirumuskan:
2. Untuk koefisien regresi (penduga ), kesalahan bakunya
dirumuskan:
3. Untuk koefisien regresi (penduga ), kesalahan bakunya
dirumuskan:
2.2 Pendugaan Interval Koefisien Regresi (Parameter A dan
B)
Pendugaan interval bagi
parameter A dan B menggunakan distribusi t dengan derajat kebebasan (db) = n –
2.
1. Pendugaan interval untuk parameter A
Untuk parameter A, pendugaan intervalnya
menggunakan:
Atau dalam bentuk sederhana:
Artinya: dengan interval keyakinan dalam
jangka panjang, jika sampel diulang-ulang, kasus pada interval sampai
dengan interval akan berisi A yang benar.
2. Pendugaan interval untuk parameter B
Untuk parameter B, pendugaan intervalnya
dirumuskan:
Atau dalam bentuk sederhana:
Artinya: dengan interval keyakinan dalam
jangka panjang, jika sampel diulang-ulang, kasus pada interval sampai
dengan interval akan berisi B yang benar.
2.3 Pengujian Hipotesis Koefisien Regresi (Parameter A dan
B)
Pengujian hipotesis bagi parameter A dan B
menggunakan uji t, dengan langkah-langkah pengujian sebagai
berikut:
1. Menentukan formula hipotesis
1. Untuk parameter A:
2. Untuk parameter B:
3. Menentukan taraf nyata ( ) dan nilai t tabel.
Taraf nyata dan nilai t
tabel ditentukan dengan derajat bebas (db) = n – 2.
4. Menentukan kriteria pengujian
4. Menentukan nilai uji statistik
1. Untuk parameter A
2. Untuk parameter B
3. Membuat kesimpulan
Menyimpulkan apakah diterima
atau ditolak.
Catatan:
1. Dari kedua koefisien regresi A dan B, koefisien regresi B, yaitu koefisien
regresi sebenanya adalah yang lebih penting, karena dari koefisien ini, ada
atau tidak adanya pengaruh X terhadap Y dapat diketahui.
2. Khusus untuk koefisien regresi B, pengujian hipotesisnya dapat juga
dirumuskan sebagai berikut:
3. PERAMALAN (PREDIKSI)
sebagai penduga
memiliki nilai yang mungkin sama atau tidak sama dengan nilai sebenarnya. Untuk
membuat sebagai penduga yang dapat dipercaya, maka dibuat pendugaan
bagi Y dengan menggunakan penduga itu sendiri. Dengan demikian, sebagai
penduga dapat digunakan sebagai peramalan atau prediksi.
Ada tiga bentuk peramalan sehubungan
dengan penduga tersebut, yaitu sebagai berikut.
3.1 Peramal Tunggal
Peramalan tunggal atau prediksi
titik dirumuskan:
3.2 Peramalan Interval Individu
Peramalan interval individu atau prediksi
interval bagi Y dirumuskan:
= nilai untuk
X = X0
3.3 Peramalan Interval Rata-rata
Peramalan interval
rata-rata atau prediksi interval bagi E(Y) dirumuskan:
4. KOEFISIEN KORELASI LINIER SEDERHANA
4.1 Pengertian Koefisien Korelasi (KK)
Koefisien korelasi
merupakan indeks atau bilangan yang digunakan untuk mengukur keeratan (kuat,
lemah, atau tidak ada) hubungan antarvariabel.
Koefisien korelasi ini memiliki nilai
antara -1 dan +1 .
1. Jika KK bernilai positif, maka variabel-variabel berkorelasi positif.
Semakin dekat nilai KK ini ke +1 semakin kuat korelasinya, demikian pula
sebaliknya.
2. Jika KK bernilai negatif, maka variabel-variabel berkolerasi negatif.
Semakin dekat nilai KK ini ke -1 semakin kuat korelasinya, demikian pula
sebaliknya.
3. Jika KK bernilai 0 (nol), maka variabel-variabel tidak menunjukkan
korelasi.
4. Jika KK bernilai +1 atau -1, maka variabel menunjukkan korelasi positif
atau negatif yang sempurna.
Untuk menentukan keeratan
hubungan/korelasi antarvariabel tersebut, berikut ini diberikan nilai-nilai
dari KK sebagai patokan>
1. KK = 0, tidak ada korelasi.
2. 0 < KK 0,20, korelasi sangat rendah/lemah sekali.
3. 0,20 < KK 0,40, korelasi rendah/lemah tapi pasti.
4. 0,40 < KK 0,70, korelasi yang cukup berarti/sedang.
5. 0,70 < KK 0,90, korelasi yang tinggi/kuat.
6. 0,90 < KK < 1,00, korelasi sangat tinggi; kuat sekali, dapat
diandalkan.
7. KK = 1, korelasi sempurna.
4.2 Jenis-jenis Koefisien
Korelasi
Jenis-jenis koefisien korelasi yang sering
digunakan adalah koefisien korelasi Pearson, koefisien korelasi Rank Spearman,
koefisien korelasi Konteingensi, dan koefisien penentu (KP).
1. Koefisien Korelasi Perason
Koefisien korelasi ini digunakan untuk
mengukur keeratan hubungan antara dua variabel yang datanya berbentuk data
interval atau rasio. Disimbolkan dengan r dan dirumuskan:
Nilai dari koefisien korelasi (r) terletak
antara -1 dan +1 .
1. Jika r = +1, terjadi korelasi positif sempurna antara
variabel X dan Y.
2. Jika r = -1, terjadi korelasi negatif sempurna antara
variabel X dan Y.
3. Jika r = 0, tidak terdapat korelasi antara variabel X dan
Y.
4. Jika 0 < r < +1, terjadi korelasi positif antara
variabel X dan Y.
5. Jika -1 < r < 0, terjadi korelasi negatif antara
variabel X dan Y.
2. Koefisien Korelasi Rank Spearman
Koefisien korelasi ini digunakan untuk
mengukur keeratan hubungan antara dua variabel yang datanya berbentuk data
ordinal (data bertingkat). Disimbolkan denganrs dan
dirumuskan:
Keterangan:
d = selisih ranking X dan Y
n = banyaknya pasangan data
3. Koefisien Korelasi Kontingensi
Koefisien korelasi ini digunakan untuk
mengukur keeratan hubungan antara dua variabel yang datanya berbentuk data
nominal (data kualitatif). Disimbolkan denganC dan dirumuskan:
Keterangan:
= kai kuadrat
= jumlah semua
frekuensi
4. Koefisien Penentu (KP) atau Koefisien Determinasi (R)
Apabila koefisien korelasi dikuadratkan,
akan menjadi koefisien penentu (KP) atau koefisien determinai, yang artinya
penyebab perubahan pada variabel Y yang datang dari variabel X, sebesar kuadrat
koefisien korelasinya. Koefisien penentu ini menjelaskan besarnya pengaruh
nilai suatu variabel (variabel X) terhadap naik/turunnya (variasi) nilai
variabel lainnya (variabel Y). Dirumuskan:
Keterangan:
KK = koefisien korelasi
Nilai koefisien penentu
ini terletak antara 0 dan +1 . Jika koefisien korelasinya adalah koefisien
korelasi Pearson (r), maka koefisien penentunya adalah:
Dalam bentuk rumus,
koefisien penentu (KP) dituliskan:
5. HUBUNGAN KOEFISIEN KORELASI DENGAN KOEFISIEN REGRESI
Antara koefisien korelasi (r) dan
koefisien regresi (b), terdapat hubungan. Hubungan tersebut dalam bentuk rumus
dituliskan:
6. PENDUGAAN DAN PENGUJIAN HIPOTESIS KOEFISIEN KORELASI POPULASI ( )
Koefisien korelasi populasi dari variabel
X dan Y yang keduanya merupakan variabel random dan memiliki distribusi
bivariat, dirumuskan:
Dalam prakteknya,
koefisien korelasi populasi ( ) tidak diketahui, namun
dapat diduga dengan koefisien korelasi sampel (r). Dengan demikian, r merupakan
penduga dari .
6.1 Pendugaan Koefisien Korelasi Populasi
Pendugaan koefisien korelasi populasi
(interval keyakinan ) menggunakan distribusi Z. Pendugaannya dapat
dilakukan dengan terlebih dahulu mengubah koefisien korelasi sampel r menjadi
nilai Zr, yang dalam bentuk persamaan dituliskan:
Dengan melakukan transformasi nilai ,
maka diperoleh pendugaan interval bagi koefisien korelasi populasi ( ) dengan tingkat keyakinan .
Selain menggunakan pendugaan interval ,
interval bagi koefisien korelasi populasi ( ) dapat pula dibuat
dengan menggunakan tabel hubungan antara Zr dan r.
7. REGRESI DAN
KORELASI LINEAR DATA BERKELOMPOK
7.1 Regresi Linier Data Berkelompok
Untuk data yang tersusun dalam distribusi
frekuensi bivariabel (data berkelompok dengan dua veriabel), persamaan regresi
linearnya berbentuk:
Dengan
Keterangan:
M = rata-rata hitung sementara, biasanya
diambil titik tengah dengan frekuensi terbesar.
ix = interval kelas X
iy = interval kelas Y
fx = frekuensi kelas X
fy = frekuensi kelas Y
7.2 Koefisien Korelasi Linier Data Berkelompok
Untuk data yang tersusun dalam distribusi
frekuensi bivariabel, koefisien korelasinya dirumuskan:
DAFTAR PUSTAKA
Hasan, Ikbal. 2003. Pokok-pokok
Materi Statistik 2. Jakarta: Bumi Aksara.
Sudjana. 2005. Metoda
Statistika. Bandung: Tarsito
Tidak ada komentar:
Posting Komentar