Rabu, 11 September 2013

Quasi-Experimental Studies?Effects of Television Ind


Quasi-Experimental
Studies?Effects of Television
Definition of Quasi-Experimental Research  Analysis of the "Sesame Street" Study
A Nonequivalent Control Group Study: "Sesame  Statistical Conclusion Validity
Street"  Internal Validity
Construct Validity
Methodology
External Validity
Results
A Time-Series Study: TV and Reading
Threats to Valid Inference
Analysis of the TV and Reading Study
Threats to Statistical Conclusion Validity
Using Randomization in Field Research
Threats to Internal Validity
Examples of Situations Where Randomization
Threats to Construct Validity of Causes and Effects
May Be Possible
Threats to External Validity
Relationships Among the Four Types of Validity   Randomization in Quasi-Experimental Studies
Summary
Suggested Readings


Science is simply common sense at its best-that is, rigidly accurate in observation, and merciless to fallacy in logic.
-Thomas H. Huxley

Quasi-Experimental - Studi Pengaruh Televisi
Quasi-Experimental
Studi? Pengaruh Televisi
Definisi Quasi-Eksperimental Penelitian Analisis dari "Sesame Street" Studi
A nonequivalent Kontrol Group Study: "Sesame statistik Kesimpulan Validitas
Validitas jalan "internal
Membangun Validitas
Metodologi
Validitas Eksternal
Hasil
Time-Series Studi: TV dan Membaca
Ancaman terhadap Valid Inference
Analisis TV dan Reading Study
Ancaman terhadap statistik Kesimpulan Validitas
Menggunakan Pengacakan di Bidang Penelitian
Ancaman terhadap Validitas internal
Contoh Situasi Dimana Pengacakan
Ancaman untuk Membangun Validitas Penyebab dan Efek
Mungkin Kemungkinan
Ancaman terhadap Validitas Eksternal
Hubungan antara Empat Jenis Validitas Randomisasi Studi Quasi-Experimental
Ringkasan
Disarankan Bacaan



Sains hanya akal sehat yang terbaik-yaitu, kaku akurat dalam  observasi, dan tanpa ampun untuk kesalahan dalam logika.
-Thomas H. Huxley


Misalkan Anda adalah seorang peneliti mencoba untuk mempelajari hasil program baru pendidikan atau medis? Mungkin program TV pendidikan untuk anak-anak, atau prosedur pengobatan baru dimaksudkan untuk mencegah kambuhnya kanker setelah operasi. Anda mungkin ingin untuk mempelajari efek program eksperimental secara acak menugaskan individu untuk berbagai perlakuan dan kontrol kondisi. Namun, pihak sekolah atau administrator rumah sakit mungkin tidak mengizinkan itu, untuk 'tugas kelas atau pasien' siswa rencana perawatan mungkin sudah telah ditentukan, berdasarkan pertimbangan nonexperimental.



Anda bisa, tentu saja, beralih rencana penelitian Anda untuk desain korelasional pasif, dan hanya mengambil data dari catatan lembaga untuk menghubungkan program pengobatan untuk siswa atau pasien 'kemajuan nanti. Tapi pilihan Anda tidak terbatas pada desain eksperimental aktif atau desain korelasional pasif.
Pilihan Penelitian lain adalah dengan menggunakan pendekatan aktif dan merencanakan studi kuasi-eksperimental. Metode kuasi-eksperimental jatuh antara eksperimen dan penelitian korelasional dalam tingkat ketelitian dan kontrol. Mereka berusaha untuk hidup sesuai dengan standar Huxley dalam kutipan di atas, karena mereka sangat menekankan observasi yang cermat atau pengukuran, dan analisis logis menyeluruh dari semua hubungan kausal yang masuk akal dalam situasi diselidiki.
Awalan quasi berarti "hampir." Menurut definisi kuasi-eksperimen tidak memenuhi salah satu karakteristik mendefinisikan percobaan: penyidik tidak memiliki kontrol penuh atas manipulasi variabel independen, dan karena itu tidak dapat menetapkan subyek secara acak dengan kondisi. Namun, dalam hal lain mereka bisa sama ketat, untuk penyidik tidak memiliki kontrol atas bagaimana dan kapan variabel dependen diukur, dan biasanya juga atas apa yang kelompok mata pelajaran diukur. Campbell dan Stanley (1966) memelopori konsep kuasi-eksperimen, dan mereka telah menekankan bahwa dengan hati-hati memilih prosedur pengukuran dan kelompok mata pelajaran, kita dapat membuat desain penelitian yang dekat dengan desain expertmental benar dalam kekuasaan mereka untuk menghasilkan kesimpulan kausal yang valid. Akibatnya, desain kuasi-eksperimental "dianggap layak digunakan di mana desain yang lebih baik tidak layak" (Campbell & Stanley, 1966, p. 34).
Ada sejumlah besar kemungkinan desain kuasi-eksperimental, mulai dari yang sederhana dengan banyak aspek bermasalah untuk menyelesaikan orang, yang menjaga terhadap banyak ancaman kemungkinan kesimpulan yang valid.
Campbell dan Stanley (1966), Masak dan Campbell (1979), dan Cook, Campbell, dan Perrachio (1990) berdiskusi penuh desain mungkin dan kekuatan mereka dan kelemahan dalam menyangkal hipotesis kausal alternatif. Dalam bab ini kita akan meringkas konsep ancaman terhadap kesimpulan yang valid, seperti yang dibahas oleh Masak et al. (1990), dan menggambarkan dua studi yang menggambarkan dua jenis utama dari desain quasiexperimental: desain kelompok kontrol nonequivalent dan deret waktu desain.

Dalam nonequivalent KONTROL GROUP
STUDI: "SESAME STREET"
Program TV awardwinning, "Sesame Street," menarik banyak perhatian dan penelitian ilmiah yang cukup besar dalam tahun-tahun awal. Salah satu studi adalah sebuah proyek disertasi oleh Judith Anton (1975), di mana ia membandingkan kesiapan sekolah anak-anak TK yang telah menyaksikan "Sesame Street" dengan yang cukup sebanding (tapi tidak secara acak) anak-anak yang belum menontonnya ? desain kelompok kontrol nonequivalent.
Untuk melihat mengapa Minton harus menggunakan metode penelitian kuasi-eksperimental, membayangkan bagaimana percobaan acak benar akan dilakukan dengan melihat dari "Sesame Street" sebagai variabel independen. Anak-anak akan secara acak ditugaskan untuk setidaknya dua kondisi, dan mereka dalam kondisi melihat akan diperlukan untuk menonton program (mungkin selama kelas TK mereka), sedangkan pada kondisi kontrol akan dicegah dari menonton itu. Anak-anak harus berada di kelas TK yang sama kecuali untuk tugas wo atau lebih kelas telah dibuat dengan metode random ketat (prosedur langka di sistem sekolah). Jika mereka berada di kelas yang sama, kelompok nonviewing mungkin akan membenci kehilangan program baru, dan n hal apapun mereka mungkin bisa melihat program setelah chool atau pada akhir pekan, atau bahkan mendengar tentang hal itu dari lassmates mereka, sehingga merusak kontras eksperimental.
Meskipun dalam beberapa situasi eksperimen mungkin memiliki kontrol yang cukup untuk mencapai benar, Xperiment acak pada menonton TV, situasi tersebut cerainly langka (dan mereka akan mengangkat isu-isu etis tentang menyangkal manfaat mungkin untuk kelompok kontrol).
Minton tidak memiliki jumlah kontrol, jadi dia harus mencari situasi di mana beberapa anak menyaksikan "Sesame Street" sebagai bagian dari kegiatan normal sehari-hari mereka dan yang lain tidak. Beberapa situasi seperti ome mudah ke pikiran seluruh kelas TK yang menonton program tersebut selama masa sekolah versus satu yang tidak,? Anak-anak yang memiliki TV di rumah mereka dibandingkan orang-orang yang tidak, dan sebagainya.Namun, langkah berikutnya harus untuk memastikan bahwa kedua kelompok anak-anak, meskipun tidak secara acak, yang semirip mungkin dalam segala hal kecuali untuk melihat "Sesame Street", jika anak-anak nonviewing tidak akan menjadi kelompok kontrol yang memadai. Ini adalah langkah yang sangat rumit karena biasanya banyak perbedaan lain yang menyertai setiap kontras. Misalnya, keluarga yang memiliki ets TV cenderung menjadi lebih makmur, atau (pada hari-hari awal TV) lebih berpikiran teknologi, dibandingkan dengan keluarga tanpa mereka. Demikian pula, dua kelas TK, yang tudents telah ditetapkan sesuai dengan prefrences orangtua, penilaian sekolah-distrik kompatibilitas atau kesiapan chool, atau beberapa pendekatan sistematis lainnya, yang cenderung berbeda dalam banyak hal. Jika kelas tidak rom sekolah yang sama, mereka yang cenderung berbeda masih lebih karena perbedaan demografis di wilayah yang dilayani oleh sekolah.

Metodologi
Sebagai hasil dari pertimbangan tersebut, Minton memilih untuk ompare anak-anak yang berada di taman kanak-kanak selama 1969-1970, tahun pertama bahwa "Sesame Street" disiarkan, dengan mereka yang anak TK dalam beberapa tahun sebelumnya. Dengan demikian dia bisa memastikan bahwa kelompok kontrol tidak pernah menonton program tersebut, dan dia mampu membentuk kelompok kontrol dari masyarakat yang sama, dengan latar belakang yang sama dan pengalaman lain untuk kelompok eksperimental. Ini disebut studi kohort, melainkan membandingkan dua kohort, yang didefinisikan sebagai kelompok yang memiliki pengalaman yang sama di sekitar titik yang sama dalam waktu.Misalnya, kelompok kelahiran terdiri dari orang yang lahir pada tahun yang sama, dan kohort pernikahan meliputi pasangan yang menikah di tahun yang sama. Meskipun ini masih desain kelompok kontrol nonequivalent, kedua kelompok harus cukup erat sebanding, dan Minton menggunakan beberapa teknik tambahan pintar untuk membuat mereka bahkan lebih sebanding.
Para siswa dipilih untuk penelitian terdiri dari semua anak TK di sebuah distrik sekolah tunggal dengan populasi yang heterogen (sekitar 500 setiap tahun selama beberapa tahun).Variabel dependen adalah nilai mereka di Metropolitan Readiness Test (MRT), sebuah tes standar secara rutin diberikan kepada semua anak TK di distrik setiap Mei. Ini, kemudian, merupakan penelitian arsip, karena pengujian adalah kegiatan distrik sekolah rutin dan eksperimen tidak harus mengumpulkan skor kesiapan sekolah sendiri;? Dan akibatnya prosedur penelitian yang mengagumkan bebas dari reaktivitas apapun serta lebih murah dan lebih layak untuk melaksanakan.
Penulis membandingkan skor MRTtahun 1970  dengan skor tahun-tahun sebelumnya untuk beberapa kelompok yang berbeda.
Perbandingan 1 adalah untuk semua anak TK di kabupaten selama tahun-tahun.Perbandingan 2, salah satu fitur pintar, menggunakan subset dari Anak-anak yang harus lebih sebanding daripada total kelompok: anak-anak yang memiliki saudara kandung di kelas TK sebelumnya, dengan skor sebelumnya MRT saudara tua 'melayani sebagai data kontrol. Penulis bahkan termasuk kontrol untuk perbedaan mungkin karena agar saudara (lebih tua dibandingkan yang lebih muda) dengan menambahkan analisis data untuk 1969 anak TK (sebelum "Sesame Street" dimulai) dibandingkan dengan saudara mereka yang lebih tua di tahun-tahun sebelumnya. Perbandingan 3, lain melihat subset demografis lebih sebanding anak-anak, diperiksa hanya anak-anak yang pergi ke sekolah paroki.
(Karena sekolah paroki tidak memiliki TK, semua anak di kabupaten pergi ke TK umum.)
Akhirnya, Perbandingan 4 meneliti faktor ---- == status sosial ekonomi dengan membandingkan nilai dari kelompok "diuntungkan" anak-anak dari masyarakat terutama kaya di distrik dengan skor dari "kurang beruntung" kelompok musim panas Head Start anak-anak yang orang tuanya berada di dekat tingkat kemiskinan.
MRT menghasilkan nilai pada enam subyek dan skor total. Meskipun semua nilai ini mungkin telah dipengaruhi oleh informasi yang diperoleh dari menonton "Sesame Street," subtest yang jelas paling relevan dengan isi program adalah Alphabet, tes 16-item pengakuan dari huruf abjad huruf kecil.
Titik yang didirikan oleh analisis isi intensif tahun pertama program, yang menunjukkan bahwa lebih banyak waktu yang dikhususkan untuk surat mengajar daripada topik lain (Ball & Bogatz, 1970).

Hasil
Meskipun tes dilakukan pada semua skor MRT, ternyata perbedaan yang signifikan yang diperoleh hanya pada subtes Alphabet. Temuan ini menunjukkan beberapa validitas yang berbeda dalam data, karena total skor perbedaan yang lebih tinggi pada tahun 1970. Satu-satunya kelompok yang tidak menunjukkan peningkatan yang ditandai pada tahun 1970 adalah kelompok yang kurang beruntung, yang juga memiliki skor terendah rata-rata.

TABEL 6-1 Mayor Pengaruh Menonton "Sesame Street" di TK Belajar 'di Minton
Penelitian


Hasil ini memberikan konfirmasi yang cukup hipotesis penelitian bahwa paparan "Sesame Street" akan meningkatkan kesiapan sekolah anak-anak.
Meskipun banyak perbandingan dibuat dalam penelitian ini, itu bukan hanya "ekspedisi memancing," karena pola temuan itu sangat konsisten perbaikan? Pada subtest Alphabet di hampir setiap kelompok anak-anak, dan tidak ada peningkatan yang signifikan pada salah satu nilai lain . Selain itu, tes tambahan dilakukan pada sub kelompok anak-anak, terutama kelompok saudara kandung dipasangkan, memberikan bukti-bukti yang nyata berdasarkan perlakuan dan kelompok kontrol yang mungkin sebagai sebanding seperti yang bisa dicapai tanpa tugas acak dari pasangan yang cocok anak-anak.
Namun, ini komentar pujian tidak berarti bahwa studi Minton adalah bebas dari segala bahaya mencapai kesimpulan yang salah, untuk itu tidak. Untuk melihat mengapa demikian, sekarang kita akan membahas banyak faktor yang dapat menyebabkan kesimpulan kausal yang salah yang dibuat dari hasil penelitian.

ANCAMAN TERHADAP INFERENCE VALID
Ingatlah bahwa tujuan utama dalam melakukan penelitian adalah untuk mencapai kesimpulan tentang sebab dan akibat hubungan antara variabel, dan kesimpulan tersebut selalu kesimpulan?
pernah terbukti dalam arti utama. Kami mencapai kesimpulan tersebut dengan menggunakan semua informasi yang relevan yang tersedia untuk membantu kami menginterpretasikan hasil studi penelitian. Dalam prosesnya, banyak ancaman terhadap kesimpulan yang valid mungkin timbul? Faktor yang akan membawa kita ke kesimpulan kausal yang salah. Semakin baik desain penelitian, ancaman tersebut sedikit akan hadir, tapi bahkan desain penelitian terbaik cenderung memiliki beberapa aspek yang tidak sepenuhnya dikendalikan atau terbuka untuk interpretasi yang berbeda.
Secara umum, percobaan memiliki relatif sedikit ancaman terhadap kesimpulan yang valid, sedangkan penelitian korelasional memiliki lebih.
Quasi-eksperimen adalah di antara dan, tergantung pada desain tertentu yang terlibat, mereka dapat berkisar dari sangat miskin untuk sangat baik dalam perlindungan mereka terhadap kesimpulan yang tidak valid.
Apa sajakah ancaman ini untuk kesimpulan yang valid?
Masak et al. (1990) telah menggambarkan sejumlah besar dan diklasifikasikan mereka di bawah empat judul utama (lihat Tabel 6-2 untuk daftar nyaman). Ini bukan satu-satunya ancaman terhadap validitas, untuk setiap desain penelitian tertentu mungkin menderita dari ancaman istimewa lainnya dan dapat menghindari banyak ancaman ini. Oleh karena daftar ini tidak harus digunakan dalam "buku resep" fashion. Sebaliknya, hal yang penting adalah bahwa setiap desain penelitian harus secara sistematis dianalisis untuk ancaman dari hipotesis saingan yang bisa menjelaskan temuan akan.

Ancaman terhadap statistik
Kesimpulan Validitas
Pertanyaan pertama dalam menganalisis temuan penelitian biasanya: Apakah ada efek apapun? Artinya, yang variabel independen dan dependen dianggap benar-benar berhubungan?
Ini adalah pertanyaan tentang validitas kesimpulan statistik.
Beberapa masalah utama yang dapat menyebabkan jawaban yang salah untuk pertanyaan ini adalah:
1. Low statistik Daya. Hal ini dapat hasil dari penggunaan sampel kecil atau uji statistik yang memiliki daya rendah untuk mendeteksi efek. Selain itu, setiap uji statistik membuat seperangkat asumsi yang mendasari tentang data, dan asumsi ini perlu diperiksa, karena melanggar beberapa dari mereka dapat menyebabkan kesimpulan nyata terdistorsi.
2. Fishing. A "ekspedisi memancing," di mana banyak nilai yang berbeda dibandingkan statistik, biasanya akan menemukan beberapa palsu perbandingan "signifikan" hanya karena faktor kebetulan. Misalnya, dari 100 EST, sekitar 5% harus signifikan pada The .05 tingkat karena kebetulan saja. Dalam studi di mana banyak tes harus dilakukan, ada prosedur untuk menyesuaikan tingkat kesalahan (alpha) untuk mengkompensasi masalah ini.
3. Keandalan rendah Ukuran. Instrumen yang tidak dapat diandalkan, atau tidak sensitif (misalnya, yang memiliki begitu beberapa poin skala bahwa mereka hanya memberikan skor kasar), dapat mengakibatkan kesimpulan palsu "tidak berpengaruh." Dimana masalah ini diantisipasi sebelumnya, ada beberapa cara untuk meningkatkan keandalan pengukuran (lih. Sechrest, Perrin, & Bunker, 1990).
4. Keandalan rendah Pelaksanaan Pengobatan (dari IV). Semacam ini nonstandardization sering terjadi ketika pengobatan eksperimental diberikan harus dilakukan berkali-kali oleh satu orang atau oleh beberapa orang yang berbeda. Jika perawatan ini dilaksanakan dengan cara yang berbeda-beda, efektivitasnya mungkin berbeda sesuai, sehingga hasil rata-rata dapat menyesatkan.
5. Tidak relevan acak dalam Eksperimental
Pengaturan. Ancaman ini sering terjadi dalam situasi lapangan dimana banyak aspek dari situasi tidak dapat dipertahankan konstan (seperti PHK dalam pengaturan kerja atau cuaca dalam studi lingkungan). Ketika variabel asing tersebut nampaknya dapat memiliki efek pada variabel dependen, mereka harus diukur secermat mungkin dan dimasukkan sebagai faktor dalam analisis statistik.
6. Heterogenitas acak Responden. Semakin heterogen sekelompok individu, semakin hey akan berbeda dalam respon mereka terhadap pengobatan. Jika beberapa karakteristik pribadi mereka terkait dengan respon pewaris pengobatan, yang akan meningkatkan varians dari ukuran hasil, dan dengan demikian membuat lebih sulit untuk mendeteksi efek pengobatan melalui EST statistik. Ancaman ini dapat dihindari dengan memilih sekelompok cukup homogen responden, seperti mahasiswa inroductory psikologi laki-laki (seperti yang sering dilakukan dalam dekade terakhir). Namun, prosedur yang memberitahu kita apa-apa tentang karakteristik perempuan atau geheralizability hasil untuk kelompok usia atau pendidikan lainnya (suatu jar ngan validitas eksternal). Cara terbaik untuk menangani masalah tersebut adalah untuk mengukur variabel individu-perbedaan dan memasukkan mereka sebagai faktor dalam analisis data.
Beberapa cara untuk memerangi ini potensi kesalahan dalam kesimpulan statistik telah diusulkan. Salah satunya adalah untuk memperkirakan ukuran sampel yang akan diperlukan untuk mendeteksi efek eksperimental ukuran wajar atau ikely (Lipsey, 1990).Misalnya, jika penurunan 20% dalam tingkat residivisme anak nakal tampaknya tujuan yang wajar, seberapa besar sampel akan diperlukan untuk mendeteksi perubahan yang sebenarnya sejauh itu? Cara lain adalah untuk mengurangi istilah kesalahan dalam analisis statistik sebanyak mungkin. Hal ini dapat dilakukan dengan usng desain sendiri-kontrol, dengan cara mencocokkan subyek sebelum tugas acak untuk pengobatan (rancangan randomzed), atau dengan menggunakan analisis kovarians o menghilangkan efek dari responden asing atau variabel situaional pada ukuran variabel depeodent. Pendekatan hird adalah untuk meningkatkan keandalan atau sensitivty instance measuresfor, dengan menggabungkan beberapa sistem pendokumentasian menjadi komposit lebih dapat diandalkan (Cook & Campbell, 1979; Masak et al, 1990.).

TABEL 6-2 Daftar Kemungkinan Ancaman terhadap Valid kausal
Kesimpulan


Kesimpulan

Ancaman terhadap statistik Kesimpulan Validitas
1. Kekuatan statistik yang rendah
2. Fishing (uji statistik dari banyak nilai yang berbeda)
3. Keandalan rendah dari langkah-langkah
4. Keandalan rendah pelaksanaan pengobatan
5. Tidak relevan acak dalam pengaturan eksperimental
6. Heterogenitas acak responden

Ancaman terhadap Validitas internal
1. Sejarah (peristiwa kontemporer asing)
2. Pematangan (perubahan sistematis dalam peserta)
3. Pengujian (efek pengujian sebelumnya)
4. Instrumentasi (perubahan pada alat ukur)
5. Regresi statistik (kelompok ekstrim)
6. Seleksi (perbandingan kelompok nonequivalent)
7. Kematian (drop-out)
8. Interaksi dengan seleksi
9. Ambiguitas tentang arah pengaruh kausal

Ancaman untuk Membangun Validitas Penyebab dan Efek
1. Penjelasan praoperasional memadai konstruksi
2. Bias Mono-operasi (hanya satu operasi untuk dikonstruksikan suatu)
3. Mono-metode Bias (bervariasi operasi tetapi hanya satu metode pengukuran)
4. Interaksi prosedur dan pengobatan
5. Difusi atau imitasi perawatan
6. Pemerataan Kompensasi perawatan
7. Persaingan Kompensasi dari peserta lain
8. Demoralisasi benci peserta lain
9. Hipotesis menebak-nebak dalam kondisi eksperimental
10. Evaluasi ketakutan
11. Percobaan harapan
12. Pengganggu konstruksi dengan tingkat konstruksi

Ancaman terhadap Validitas Eksternal
1. Interaksi perlakuan yang berbeda
2. Interaksi pengujian dan pengobatan
3. Interaksi seleksi dan pengobatan
4. Interaksi pengaturan dan pengobatan
5. Interaksi sejarah dan Sumber pengobatan: Diadaptasi dari Cook, Campbell, & Peracchio (1990, pp.498-510).


Ancaman terhadap Validitas internal
Jika uji statistik menunjukkan pengaruh yang signifikan (atau jika mereka tidak), pertanyaan besar berikutnya dalam penelitian adalah: Apakah hubungan kausal menunjukkan satu daripada hasil dari beberapa faktor asing (atau sebaliknya, apakah ada faktor pembaur yang mencegah kausal hubungan yang benar-benar ada dari yang ditunjukkan)?

Isu-isu ini berkaitan dengan validitas internal penelitian? Yaitu, apakah variabel independen benar-benar memiliki efek kausal dalam studi tertentu. Di antara banyak kemungkinan ancaman terhadap validitas internal adalah faktor-faktor berikut:
1. Sejarah. Istilah ini mengacu pada efek dari beberapa peristiwa asing selama studi. Sebagai contoh, sebuah perang yang pecah di Timur Tengah selama studi sikap terhadap pertahanan nasional mungkin akan mempengaruhi variabel dependen penelitian, dan dampaknya mungkin keliru bagi mereka dari apa pun variabel independen yang diteliti (seperti kampanye presiden menampilkan perdebatan tentang kesiapan militer).
2. Pematangan. Istilah ini mengacu pada setiap perubahan sistematis dalam responden selama penelitian, seperti mereka menjadi lebih tua, lebih terinformasi, atau lebih mampu melakukan tugas-tugas tertentu. Ini adalah ancaman ketika efek dari perubahan ini dapat dikacaukan dengan orang-orang dari variabel independen. Sebagai contoh, adalah peningkatan kemampuan membaca anak karena program instruksional atau kemajuan perkembangan yang normal?
3. Pengujian. Ketika pretest digunakan dalam penelitian, pengalaman yang telah diukur sebelum dapat mengubah tanggapan pada readministration kemudian sama atau alat pengukur yang sama. Misalnya, peningkatan diukur IQ karena mengambil tes yang sama untuk kedua kalinya mungkin bingung dengan efek dari program pendidikan yang sedang dipelajari.
4. Instrumentasi. Perubahan alat ukur selama penelitian dapat mendistorsi makna dari hasil. Contohnya adalah perubahan dalam penilaian standar pengamat 'karena mereka menjadi lebih berpengalaman, atau penurunan kesulitan item tes karena publisitas luas tentang mereka, atau revisi terhadap kata-kata dari item pada skala.
5. Regresi statistik. Ini adalah ancaman ketika pernah subjek yang dipilih untuk studi sebagian atau sebagian besar karena mereka luar biasa tinggi atau rendah pada beberapa karakteristik, seperti kecerdasan, aktivisme, kemiskinan, atau prestasi. Skor pada setiap karakteristik pribadi seperti selalu mengandung beberapa kesalahan pengukuran, serta komponen yang benar. Akibatnya, karena ekstremitas dari nilai sebagian karena kesalahan pengukuran, selalu ada kecenderungan untuk skor kemudian skor ekstrim 'pada instrumen yang sama atau terkait dengan mundur ke arah rata-rata populasi (yaitu, menjadi kurang ekstrim). Masalahnya di sini adalah bahwa efek statistik ini mungkin akan bingung dengan pengaruh variabel independen yang diteliti. Kebingungan seperti sering terjadi dalam studi program pendidikan kompensasi, di mana dimaksudkan "kontrol" kelompok siswa-kinerja rendah cenderung menjadi lebih berbeda dari rata-rata populasi mereka dari penerima perawatan yang kurang beruntung berasal dari populasi mereka berarti. Akibatnya, "kontrol" kelompok biasanya akan mundur lebih dari kelompok perlakuan yang kurang beruntung, dan efek ini menentang efek dari pengobatan pendidikan, cenderung membuatnya terlihat tidak efektif meskipun mungkin akan membantu.
6. Seleksi. Istilah ini mengacu pada macam sistematis berbeda dari orang-orang yang dipilih untuk berbagai kelompok perlakuan. Tentu, perbedaan mereka cenderung menjadi bingung dengan efek pengobatan. Sejak penelitian kuasi-eksperimental, menurut definisi, melibatkan situasi di mana kelompok perlakuan tidak dapat dipilih dengan cara yang menjamin kesetaraan mereka, pilihan efek adalah bahaya yang selalu ada.
7. Kematian, atau Terputus-putus. Putus Diferensial dapat membuat bahkan acak, kelompok setara non-setara di lain waktu. Oleh karena itu, jumlah responden erosi dan ekstremitas dari individu-individu yang putus perlu diperiksa dalam setiap kelompok, dan dibandingkan seluruh kelompok.
8. Interaksi dengan Selection. Beberapa ancaman di atas untuk validitas internal dapat menggabungkan dengan perbedaan seleksi untuk menghasilkan efek thartan mudah keliru untuk efek pengobatan. Misalnya, interaksi seleksi pematangan terjadi ketika dua atau lebih kelompok yang jatuh tempo pada tingkat yang berbeda. Ancaman umum lainnya adalah interaksi seleksi-sejarah atau interaksi seleksi instrumentasi.
9. Ambiguitas Tentang Arah Pengaruh kausal. Bahkan ketika ancaman terhadap validitas internal telah berkurang, arah sebab-akibat antara variabel mungkin tidak jelas. Hal ini biasanya tidak menjadi masalah dalam percobaan, di mana variabel kausal biasanya salah satu yang dimanipulasi. Namun, sangat tepat menjadi masalah dalam penelitian korelasional atau quasi-eksperimental jika semua tindakan dikumpulkan pada waktu yang sama. Misalnya, apakah prestasi sekolah yang buruk penyebab membolos, atau apakah pembolosan menyebabkan prestasi sekolah yang buruk, atau apakah masing-masing memiliki pengaruh kausal pada yang lain?
Dalam memutuskan tentang validitas internal, peneliti harus mempertimbangkan apakah, dan bagaimana, masing-masing ancaman yang mungkin dapat mempengaruhi data penelitian dan kemudian melakukan tes apa saja yang layak untuk menyingkirkan sebanyak ancaman potensial sebanyak mungkin. Secara umum, sebuah percobaan acak biasanya akan menyingkirkan semua sembilan dari ancaman terhadap validitas internal, yang mengapa percobaan sangat membantu dalam menyimpulkan sebab-akibat. Namun, putus sekolah diferensial dapat menjadi masalah dalam percobaan, dan dalam kasus yang jarang terjadi ancaman lain mungkin terjadi (misalnya, tugas kadang-kadang acak untuk kondisi-tidak menghasilkan kelompok-kelompok yang setara, sehingga kelompok langkah-langkah pra-eksperimental perlu diperiksa untuk menyingkirkan seleksi ancaman).
Titik penting lainnya tentang validitas dalam penelitian kuasi-eksperimental adalah nilai desain ditambal-up. Meskipun desain yang diberikan memiliki kelemahan yang melekat (misalnya, pemilihan atau ancaman sejarah untuk validitas internal), mereka sering dapat diatasi dengan "menambal itu" melalui data internal tambahan analisis, atau dengan menambahkan kelompok kontrol lainnya untuk memeriksa efek ancaman khusus terhadap validitas desain dasar.

Ancaman untuk Membangun Validitas Penyebab dan Efek
Setelah kita telah menentukan apa kausal kesimpulan yang bisa kita mencapai dalam setiap studi tertentu, pertanyaan berikutnya adalah:
Apa hasil penelitian tertentu berarti dalam hal konseptual? Sebagai Masak dan Campbell (1979, p. 38) mengungkapkan hal itu, validitas konstruk mengacu pada "kesesuaian antara operasional dan definisi konseptual." Dalam rangka untuk memiliki validitas konstruk, operasi penelitian harus berhubungan erat dengan konsep yang mendasari bahwa penyidik ingin belajar. Operasi harus mewujudkan semua dimensi penting dari konstruk tetapi tidak ada dimensi yang mirip tapi tidak relevan? Yaitu, mereka harus tidak underrepresent atau overrepresent membangun.
Ancaman terhadap validitas konstruk datang dari pengganggu? "Kemungkinan bahwa definisi operasional dari penyebab atau efek dapat ditafsirkan dalam hal lebih dari satu gagasan" (Masak et al., 1990, p. 503). Sebagai contoh, apakah obat atau efek placebo (keyakinan dalam kedokteran dan dokter) yang menyebabkan penderita untuk meningkatkan? Cara lain untuk menempatkan itu adalah bahwa validitas konstruk mengacu pada label yang tepat dari "bahan aktif" dalam pengobatan kausal dan sifat sebenarnya dari perubahan dalam efek yang diamati.
Setelah proposal dari Campbell dan Fiske (1959), Cook and Campbell (. 1979, p 61) menyarankan dua cara untuk menilai validitas konstruk: pertama, pengujian untuk konvergensi di ukuran yang berbeda atau manipulasi "hal" yang sama dan, kedua, pengujian untuk perbedaan antara tindakan dan manipulasi terkait tetapi secara konseptual berbeda "hal." Sebagai contoh, jika kita tertarik dalam mengukur kemampuan alfabet kalangan anak-anak, kita bisa mengukur jumlah detik yang dibutuhkan setiap anak untuk membaca alfabet, kemampuan mereka untuk mengenali huruf Inggris, atau nilai mereka pada tes kata-pengakuan terdiri dari

Kata-kata 3 huruf. Jika tiga langkah tersebut sangat berkaitan, mereka akan memiliki validitas konvergen konstruk.
Langkah-langkah kita juga harus menunjukkan validitas diskriminan? Mereka tidak harus berkorelasi tinggi dengan konstruksi teoritis yang berbeda. Misalnya, ukuran kemampuan alfabet tidak harus berkorelasi dengan ukuran variabel kepribadian seperti harga diri atau ekstroversi, yang secara konseptual berbeda.
Masak et al. (1990) juga mencatat bahwa penelitian terapan cenderung jauh lebih peduli tentang validitas konstruk efek dari penyebab, karena sering tampaknya lebih penting untuk memiliki dampak pada masalah sosial tertentu daripada untuk tahu persis apa dimensi program bersifat memperbaiki disebabkan dampak. Misalnya, diterapkan ilmuwan sosial yang bekerja pada topik.
kemiskinan akan sangat khawatir bahwa tindakan mereka cukup terwakili konsep-konsep seperti "pengangguran" atau "pendapatan keluarga" (efek), tetapi mereka mungkin akan kurang terlibat dalam mengukur dampak dari setiap komponen yang terpisah dari program antikemiskinan (penyebabnya).
Topik validitas konstruk seringkali sulit untuk dipahami secara abstrak, tetapi harus diklarifikasi melalui contoh-contoh berikut ancaman yang berbeda untuk validitas konstruk:
1. Memadai praoperasional penjelasan dari Constructs. Sebelum langkah-langkah dan manipulasi dapat dirancang, berbagai dimensi semua konstruksi yang terlibat dalam penelitian ini harus dinyatakan secara eksplisit. Misalnya, jika membangun "agresi" didefinisikan sebagai melakukan kerusakan fisik kepada orang lain dengan sengaja, menggunakan instrumen yang dikembangkan untuk mengukur tidak harus mempertimbangkan ekspresi verbal ancaman atau kekerasan, atau cedera fisik disengaja.
2. Mono-Operasi Bias. Jika memungkinkan, selalu lebih baik untuk menggunakan dua atau lebih cara operasionalisasi konstruk kausal, dan dua atau lebih cara untuk mengukur efek membangun. Jadi, jika perilaku membantu adalah variabel konseptual, peneliti mungkin merancang beberapa situasi yang berbeda di mana membantu bisa ditunjukkan dan menggunakan masing-masing dengan kelompok yang berbeda dari mata pelajaran.Prosedur ini harus baik mewakili definisi membantu lebih memadai, dan juga mengurangi efek dari aspek relevan dari berbagai situasi, karena setiap situasi mungkin akan berisi tidak relevan yang berbeda.
3. Mono-Metode Bias. Bahkan di mana beberapa operasi suatu konstruksi yang digunakan, mereka masih dapat diukur dengan cara dasar yang sama, yang mengarah ke ancaman mono-metode untuk validitas. Sebuah contoh umum adalah dengan menggunakan beberapa skala yang berbeda untuk mengukur sikap, tetapi memungkinkan mereka semua untuk menjadi paperand-pensil, langkah-langkah laporan diri. Pendekatan yang lebih baik akan mencakup beberapa tindakan perilaku dan beberapa langkah-langkah pengamatan sikap, serta self-laporan kertas dan pensil.
4. Interaksi Prosedur dan Pengobatan.
Kadang-kadang konteks di mana variabel independen terjadi dapat mempengaruhi cara di mana peserta bereaksi terhadap pengobatan? Contoh mengacaukan dua faktor penyebab yang mungkin. Misalnya, Percobaan Pemeliharaan Penghasilan yang dilakukan di New fersey dijamin peserta pendapatan minimum untuk: tree tahun. Dengan demikian, efek dari pengobatan ini mungkin telah Seen diproduksi oleh pembayaran, atau alternatif oleh cnowledge bahwa itu akan berlangsung selama tiga tahun (Masak et 11., 1990).
5. Difusi atau imitasi dari perawatan. Ini nay menjadi ancaman ketika orang-orang di berbagai pengobatan dan; ontrol kelompok berada di dekat dan dapat Komunis & makan satu sama lain. Karena itu, kondisi variabel dimaksudkan inlependent (seperti informaion khusus) dapat menyebar ke kelompok lain dan mengurangi r menghilangkan perbedaan kelompok direncanakan. Misalnya, siswa yang melihat "Sesame Street" mungkin mengatakan kontrol informasi grup non-melihat mereka telah belajar dari program ini.
6. Persamaan kompensasi dari perawatan.
Hal ini dapat terjadi jika pengobatan yang direncanakan dihargai oleh anggota masyarakat, seperti dalam kasus dari program Head Start atau perawatan medis ditingkatkan. Ada banyak contoh dalam literatur dimana perbandingan dari pengobatan tersebut dengan kelompok kontrol yang dimaksudkan itu ditumbangkan oleh pemerintah atau administrator, yang memberi "kontrol" kelompok manfaat yang sama atau offsetting untuk menghindari munculnya perlakuan yang tidak adil dari individu yang berbeda atau kelompok. Sayangnya, upaya tersebut pada "keadilan" dapat merusak prosedur penelitian penting.
7. Rivalitas Kompensasi dari peserta lain. Hal ini mirip dengan pemerataan-of-pengobatan ancaman kecuali bahwa itu merupakan respon dari peserta dalam kelompok perlakuan kurang diinginkan, bukan dari administrator. Ketika tugas orang untuk kondisi pengobatan diketahui publik, mereka yang berada di kelompok kontrol atau perawatan yang kurang diinginkan dapat bekerja ekstra keras untuk menunjukkan dengan baik, dan sebagai hasilnya perbandingan pengobatan mungkin tidak berlaku. Saretsky (1972) menunjukkan contoh ini dalam program pendidikan eksperimental di mana para guru kelompok kontrol melihat keamanan pekerjaan mereka sebagai terancam. Dia menyebutnya "efek John Henry," setelah kereta api baja-supir pria legendaris 'yang memenangkan kontes dengan bor uap yang baru ditemukan, meskipun ia bunuh diri dalam proses.
8. Demoralisasi benci Peserta lainnya. Ini adalah kebalikan dari persaingan kompensasi.
Jika peserta penelitian dalam kondisi yang kurang diinginkan menjadi marah atas kekurangan mereka, mereka mungkin sengaja atau tidak sengaja mengurangi kualitas atau kuantitas pekerjaan mereka. Output berkurang ini tidak akan mencerminkan kinerja yang biasa mereka, tentu saja, sehingga tidak akan menjadi perbandingan yang valid untuk pengobatan lainnya, kondisi.
9. Hipotesis-Menebak Dalam Kondisi Eksperimental. Ini adalah aspek reaktivitas dalam penelitian, di mana tindakan mempelajari sesuatu dapat mengubah fenomena yang dipelajari. Jika memungkinkan, yang terbaik adalah untuk menyamarkan prosedur sehingga peserta penelitian tidak bisa menebak hipotesis penelitian dan mengubah perilaku mereka sesuai. Namun, seperti yang ditunjukkan dalam Bab 4, ada bukti empiris yang relatif kecil dari subjek penelitian yang konsisten negativistik atau konsisten overcooperative, bahkan ketika hipotesis penelitian mudah ditebak.
10. Evaluasi Apprehension. Seperti dijelaskan dalam Bab 4, ini adalah efek subjek yang tampaknya terjadi cukup sering dalam penelitian laboratorium. Meskipun mungkin kurang umum dalam studi lapangan, masih bisa menjadi ancaman bagi validitas karena efeknya dapat dikacaukan dengan hasil dari setiap variabel kausal lain. Oleh karena itu, upaya-upaya harus dilakukan untuk menguranginya.
11. Eksperimen harapan. Aspek efek eksperimen juga dibahas dalam Bab 4.

Karena efek harapan eksperimen dapat dikacaukan dengan efek dari variabel kausal dimaksudkan, mereka harus dihindari sedapat mungkin, dengan menggunakan teknik yang dijelaskan sebelumnya.
12. Konstruk pengganggu dengan Tingkat Constructs. Seringkali penelitian hanya menggunakan satu atau dua tingkat variabel, dan karena praktis serta keterbatasan etis, tingkat digunakan cenderung menjadi orang-orang yang lemah. Jika hasil penelitian yang tidak signifikan, kesimpulan dari "efek" variabel A pada variabel B dapat ditarik.Sebaliknya, jika tingkat yang lebih tinggi dari variabel A telah digunakan, efek sejati mungkin telah ditemukan. Untuk menghindari ancaman ini, adalah keinginan untuk melakukan penelitian parametrik, di mana banyak tingkat variabel independen yang digunakan. Jika tidak, penting untuk memenuhi syarat kesimpulan penelitian dengan secara khusus menyatakan tingkat variabel yang terlibat.
Salah satu cara penting untuk menilai validitas konstruk adalah dengan menggunakan cek manipulasi, seperti dibahas dalam Bab 4. Prosedur ini memverifikasi apakah pengobatan benar-benar menciptakan perbedaan dalam konstruksi dimaksudkan dan dibiarkan tidak berubah fitur lain yang itu tidak dimaksudkan untuk mempengaruhi. Setelah data penelitian telah dikumpulkan, pendekatan lain yang penting untuk validitas konstruk adalah untuk menghasilkan multitrait-multimethod (MTMM) matriks. Seperti dibahas di atas, penelitian harus menggunakan lebih dari satu ukuran masing-masing membangun utama, dan sebaiknya langkah-langkah ini harus menggunakan metode yang berbeda (misalnya, laporan diri, pengamatan, tindakan fisiologis, dll). The MTMM matrix hanyalah sebuah tabel koefisien korelasi antara tindakan. Validitas konvergen tercermin dalam korelasi tinggi antara berbagai ukuran konstruk yang sama, sedangkan validitas diskriminan tercermin dalam korelasi rendah antara langkah-langkah konstruksi yang berbeda. Pendekatan kuantitatif lebih untuk menilai validitas konstruk yang tersedia melalui penggunaan teknik yang disebut analisis faktor konfirmatori (Gorsuch, 1983), yang merupakan jenis khusus dari prosedur pemodelan persamaan struktural yang telah disebutkan dalam Bab 5.

Ancaman terhadap Validitas Eksternal
Pertanyaan terakhir dalam menilai temuan penelitian adalah: Sampai sejauh mana temuan digeneralisasi untuk orang lain, pengaturan, dan waktu? Pertanyaan ini mendefinisikan validitas eksternal, atau generalisasi, penelitian.
Ketika sampel peserta dipilih karena mereka mudah tersedia (seperti mahasiswa psikologi pengantar), sulit untuk mengetahui apa yang mendasari mereka mewakili populasi, dan bahkan lebih sulit untuk mengetahui apakah temuan berlaku untuk kelompok lain tertentu.Jika pengobatan memiliki efek yang diberikan pada salah satu kelompok individu tetapi tidak pada kelompok lain, ini adalah interaksi statistik. Oleh karena itu, ancaman berikut untuk validitas eksternal dinyatakan sebagai efek interaksi antara pengobatan eksperimental dan beberapa kondisi lain.
1. Interaksi Perawatan yang berbeda. Ketika pernah subjek yang terkena lebih dari satu pengobatan, efek gabungan atau interaksi dari perawatan mungkin berbeda dari efek masing-masing. Dalam kasus seperti itu penting untuk menganalisis pengaruh setiap perlakuan secara terpisah maupun dalam kombinasi. Misalnya, apakah program instruksional menghasilkan lebih baik
belajar hanya untuk siswa yang telah diberi incent motivasi? ve, dan bukan untuk orang lain?
2. Interaksi Pengujian dan Pengobatan. Kondisi pengukuran penelitian, seperti pengujian berulang, dapat berinteraksi dengan pengobatan dimaksudkan untuk menghasilkan efek gabungan. Misalnya, ukuran pretest mungkin peka subyek untuk pengobatan kemudian (sinyal mereka bahwa ada sesuatu yang mereka harus belajar tentang suatu topik tertentu), atau mungkin menyuntik subyek terhadap efek dari pengobatan kemudian. Meskipun penelitian yang cermat (misalnya, Lana, 1969) telah menunjukkan bahwa tak satu pun dari ini kemungkinan interaksi umum dalam studi eksperimental, adalah bijaksana untuk mengambil tindakan pencegahan terhadap mereka. Hal ini akan melibatkan menggunakan posttest-satunya kelompok kontrol, yang, karena mereka tidak punya pretest, tidak bisa menampilkan sensitisasi atau efek inokulasi.
3. Interaksi Seleksi dan Pengobatan. Perlakuan A dapat bekerja dengan satu tipe orang (seperti introvert) tapi tidak dengan jenis lain (seperti ekstrovert), atau cara kerja yang berbeda dengan dua jenis.
Ancaman ini bisa dilawan dengan membuat kelompok peserta sebagai heterogen mungkin, dan salah satu cara untuk mencapai hal ini adalah untuk membuat tugas penelitian sehingga nyaman yang relatif sedikit orang akan menolak atau gagal untuk berpartisipasi.
4. Interaksi Setting dan Pengobatan. Hasil penelitian dalam satu pengaturan (seperti sistem sekolah) mungkin tidak berlaku dalam pengaturan lain (seperti tim tempur militer). "Solusi di sini adalah bervariasi pengaturan dan menganalisis untuk hubungan kausal dalam setiap" (Cook & Campbell, 1979, hal. 74). Penelitian Fiedler tentang kepemimpinan (dibahas dalam Bab 5) memberikan banyak contoh masalah ini, dan solusi di atas adalah persis yang ia diadopsi.
5. Interaksi Sejarah dan Pengobatan. Sebuah pengobatan yang diberikan mungkin memiliki efek yang berbeda pada satu waktu (misalnya, selama ketakutan perang, kekurangan bensin, atau re
penyerahan) dibandingkan pada waktu lain. Untuk memberikan keyakinan yang lebih besar dalam penerapan melanjutkan temuan, penelitian dapat direplikasi pada waktu yang berbeda, atau tinjauan pustaka dapat dilakukan untuk mencari bukti-bukti yang mendukung atau bertentangan sebelumnya.
Selain mereplikasi studi, kita dapat meningkatkan validitas eksternal dengan memilih sampel penelitian yang baik wakil dari ponulation penting atau sebagai heterogen mungkin.Karena perwakilan random sampling sering tidak mungkin dalam pengaturan diterapkan, model yang sangat berguna adalah untuk memilih pengaturan untuk studi yang
berbeda-beda di sepanjang dimensi penting. Misalnya, dalam penelitian tentang metode pendidikan yang inovatif, pengobatan harus diadili dalam satu atau lebih dari "terbaik" sekolah tersedia, dan di beberapa "terburuk" sekolah masalah, dan dalam beberapa "khas"
sekolah. Komposisi rasial dan di mensions penting lainnya mungkin bervariasi dengan cara yang sama. Meskipun prosedur ini tidak menjamin generalisasi ke sekolah lain di wilayah geografis lainnya, tentu meningkatkan kemungkinan nya.

Hubungan antara Empat Jenis Validitas
Untuk meringkas diskusi kita dari ancaman berbagai macam validitas, kita dapat mencatat bahwa validitas kesimpulan statistik adalah kasus khusus dari validitas internal. Artinya, mereka berdua kesepakatan dengan apakah kesimpulan benar dapat ditarik dari data penelitian tertentu di tangan. Validitas internal yang bersangkutan dengan sumber bias sistematis, yang dapat mempengaruhi nilai rata-rata, sedangkan validitas kesimpulan statistik yang bersangkutan
dengan sumber kesalahan acak, yang dapat meningkatkan variabilitas, dan dengan penggunaan yang tepat dari uji statistik (Masak et al 1990;. Cook & Shadish, 1994).
Demikian pula, validitas konstruk dan validitas eksternal sangat erat berhubungan karena keduanya berurusan dengan membuat generalisasi dengan kondisi lain. Dengan kata lain, mereka berdua menanggung pada kondisi di mana hubungan sebab akibat berlaku.Perbedaan utama antara mereka adalah bahwa validitas eksternal berkaitan dengan generalisasi beton, contoh-contoh spesifik dari orang lain, pengaturan, dan waktu, sedangkan validitas konstruk berkaitan dengan generalisasi contoh-contoh lain dari konsep-konsep seperti agresi, kerjasama, atau otoritarianisme.
Beberapa metode peningkatan satu jenis of_validity cenderung untuk mengurangi jenis lain. Misalnya, melakukan percobaan acak akan memaksimalkan validitas internal, tetapi organisasi (seperti sistem sekolah atau bisnis) yang akan memungkinkan prosedur tersebut cenderung atipikal, yang mengurangi validitas eksternal. Demikian pula, dengan menggunakan subyek heterogen dan pengaturan akan meningkatkan validitas eksternal tetapi mengurangi validitas kesimpulan statistik.
Masak et al. (1990) menekankan bahwa validitas internal yang baik adalah kebutuhan yang paling penting untuk studi penelitian, tapi itu kadang-kadang trade-off untuk mencapainya hanya terlalu mahal dalam hilangnya nilai-nilai lain. Karena tidak ada satu bagian dari penelitian akan pernah menghindari semua masalah validitas, prosedur terbaik adalah program replika lanjutannya tions menggunakan metode penelitian yang berbeda dan pengaturan.
Masak et al. (1990, hal. 516) menyatakan bahwa, untuk banyak topik penelitian sosial terapan, pentingnya berbagai jenis validitas berjalan dari validitas internal (tertinggi) melalui validitas eksternal, validitas konstruk efek, dan validitas kesimpulan statistik, bawah untuk validitas konstruk penyebabnya.

 +? ? ? +? ? +? ? ? + +? ? ? +? ? ? ? ? ? ?
Foto pemberian Donald Campbell dan Lehigh University Kantor
Informasi Publik. Dicetak ulang dengan izin.
Kotak 6-1
DONALD CAMPBELL, GURU DARI METODOLOGI PENELITIAN


Selain tulisan berpengaruh pada metodologi penelitian psikologis, yang disorot dalam bab ini, Donald Campbell merasa terhormat untuk karyanya sebagai seorang filsuf ilmu pengetahuan, sebagai peneliti lapangan serta eksperimen laboratorium, dan atas kontribusi untuk sosiologi, antropologi , dan ilmu politik. Di antara penghargaan yang luar biasa di bidang psikologi adalah pemilihan sebagai presiden dari American Association Psycho-logis, penerimaan Distinguished Scientific Award dari APA, dan pemilihan menjadi anggota National Academy of Sciences dan American Academy of Arts and Sciences.
Lahir di Michigan pada tahun 1916, Campbell dijelaskan dalam bab otobiografi bagaimana ia bekerja di sebuah peternakan kalkun setelah sekolah tinggi, menghadiri junior college, dan tidak memiliki sebuah artikel yang diterbitkan sampai ia berusia 33. Setelah mendapatkan gelar BA di

+? ? ? +? ? +? ? ? + +? ? ? +? ? ? ? ? ? ?

University of California, Berkeley, ia bertugas di Angkatan Laut dan OSS selama Perang Dunia II. Melengkapi gelar Ph.D. at Berkeley pada tahun 1947, ia mengajar selama beberapa tahun di Ohio State University dan University of Chicago. Dia menetap di Northwestern University pada tahun 1953 dan tinggal di sana sampai tahun 1979, bergerak kemudian ke Syracuse dan kemudian untuk Lehigh University, di mana ia meninggal pada tahun 1996.
Meskipun terlambat nya di penerbitan, Campbell tulis bersama lebih dari 10 buku dan 200 artikel dan bab buku. Dia paling dikenal dalam psikologi untuk bekerja mani pada metode penelitian kuasi-eksperimental, penelitian mengganggu, pengukuran sikap, dan karena anjurannya bagi direncanakan eksperimen pada program-program sosial dan pemerintah.
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? +?

ANALISIS "SESAME STREET"
STUDI
Sekarang mari kita kembali ke (1975) studi Minton pada efek dari "Sesame Street" dan menganalisanya dalam hal daftar sebelumnya ancaman terhadap inferensi yang valid.Untuk memulai, kita mungkin diagram skematik penelitian, berikut


Lanjutannya === Masak et al. 'S (1990) notasi. Dalam diagram berikut, kelompok eksperimen dan kontrol ditunjukkan pada baris yang berbeda, dengan garis putus-putus di antara mereka yang menunjukkan bahwa mereka nonequivalent (karena anak-anak tidak secara acak). Urutan waktu peristiwa ditunjukkan oleh posisi mereka di telepon, dengan peristiwa-peristiwa sebelumnya jauh tertinggal. Surat 0 singkatan pengamatan (dalam hal ini pemerintahan MRT) dan huruf X untuk pengobatan eksperimental (paparan "Sesame Street"), sedangkan subscript numerik hanya menunjukkan urutan peristiwa ini. Dengan demikian, penelitian ini dapat digambarkan:

Kelompok kontrol:
Kelompok eksperimen: X 0 2

Ini adalah contoh dari institusi-siklus atau co-hort desain, fitur dasar yang, seperti yang disebutkan sebelumnya, adalah bahwa berbagai kohort (dalam hal ini kelas yang masuk tahunan) melalui dasarnya siklus kelembagaan yang sama (di sini, TK ) pada waktu yang berbeda. Desain Cohort sering berguna, karena sering masuk akal untuk mengasumsikan bahwa kohort berturut-turut sangat mirip satu sama lain pada kebanyakan karakteristik.
Selain itu, banyak lembaga seperti distrik sekolah atau bisnis menyimpan catatan arsip-hati, yang dapat kadang-kadang digunakan untuk mengukur variabel kepentingan dan juga dapat memberikan pemeriksaan pada komparabilitas diasumsikan kohort berturut-turut.

Kesimpulan statistik Validitas

Mari kita periksa masing-masing jenis utama validitas pada gilirannya. Pertama, validitas kesimpulan statistik tampaknya baik dalam studi Minton. Secara umum, temuan positif menimbulkan pertanyaan sedikit tentang validitas kesimpulan statistik daripada hasil negatif, dan temuan Minton yang sangat positif (pada subtes Alphabet). Oleh karena itu kita dapat mengabaikan pertanyaan tentang kekuatan statistik yang rendah dan keandalan miskin langkah-langkah (untuk subtes bahwa setidaknya), meskipun ada angka reliabilitas diberikan. Dalam satu contoh Minton tidak melaporkan cek pada asumsi dari analisis varians, dan tampaknya yang melanggar asumsi statistik tidak masalah di sana. Meskipun jumlah tes signifikansi dibuat, keteraturan temuan menunjukkan bahwa penelitian ini tidak hanya "ekspedisi memancing."
Satu-satunya ancaman terhadap validitas kesimpulan statistik yang tampaknya sekarang ini berbagai tingkat pelaksanaan pengobatan? Yaitu, separuh anak-anak menonton "Sesame Street" setiap hari, sebagian lain melihat kadang-kadang, dan sangat sedikit tidak pernah melihatnya. Dalam sebuah studi kuasi-eksperimental seperti ini di mana kondisi pengobatan tidak dapat diberikan, seperti perbedaan dalam pelaksanaannya tidak dapat dihindari, dan untungnya Minton melakukan data yang jelas ada pada tingkat paparan program untuk semua subkelompok anak-anak. Namun, itu akan menjadi diinginkan baginya untuk melangkah lebih jauh dan menyajikan analisis skor MRT untuk pemirsa berat, pemirsa ringan, dan nonviewers, karena itu akan menjadi mungkin operasionalisasi jelas menonton "Sesame Street."

Validitas internal

Kategori penting dari validitas internal juga tampaknya cukup baik dalam studi Minton, meskipun ada beberapa pertanyaan yang tersisa. Mengambil poin pertama yang baik, tidak ada masalah dengan pematangan (semua kelompok adalah usia yang sama saat diuji), pengujian (tidak ada pretest diberikan), statistik regresi (seluruh TK kohort digunakan untuk setiap tahun), atau mortalitas (semua anak hadir Mei diuji). Juga, tidak ada ambiguitas tentang arah kausal (dari menonton "Sesame Street" untuk skor MRT, bukan sebaliknya). Karena semua anak-anak di beberapa kohort yang sama dipelajari, ada sedikit bahaya interaksi dengan seleksi (meskipun ini bisa menjadi masalah, misalnya, jika hanya nilai anak-anak diuntungkan itu dibandingkan dengan orang-orang dari kelompok yang kurang beruntung). Karena MRT adalah tes standar kelompok, ancaman akibat perubahan instrumentasi tidak mungkin (meskipun mereka dibayangkan bisa terjadi jika para penguji di tahun-tahun sebelumnya adalah nyata dan berpengalaman sehingga digunakan prosedur pengujian yang berbeda dari yang digunakan pada tahun 1970). Hanya dua faktor menimbulkan ancaman masuk akal untuk validitas internal: seleksi dan sejarah. Perbedaan Seleksi antara kohort masih mungkin meskipun kesamaan umum mereka. Salah satu contoh yang jelas adalah bahwa tahun-tahun sebelumnya 'kohort akan memiliki proporsi yang lebih besar dari anak sulung daripada akan 1970 kohort, dan jika anak sulung dilakukan kurang baik pada MRT, yang bisa salah untuk efek menguntungkan menonton " Sesame Street. " Hal ini mungkin lebih mungkin bahwa pertama lahir akan tampil lebih baik, tetapi dalam kedua kasus ada pembaur mungkin. Namun, Minton menangani masalah yang sangat baik dengan membandingkan 1970 kinder-gartners dan saudara mereka yang lebih tua dengan 1969 kelas dan saudara mereka yang lebih tua. Karena perbandingan yang terakhir tidak menunjukkan keunggulan yang signifikan dalam skor MRT untuk adik-adik, hipotesis yang umumnya kakak dilakukan lebih buruk pada MRT bisa meyakinkan diberhentikan.
Sejarah adalah ancaman paling umum untuk validitas internal dalam desain (seperti ini) yang tidak memiliki kelompok kontrol simultan. Artinya, apa pun yang terjadi pada anak-anak ini antara Mei 1969 dan Mei 1970 bisa salah untuk efek menonton "Sesame Street."Anggaplah, misalnya, bahwa distrik sekolah telah menetapkan program membaca-kesiapan baru di taman kanak-kanak pada musim gugur 1969. Efeknya mungkin terlihat seperti yang ditemukan dalam penelitian Minton.
Salah satu cara untuk memeriksa efek dari perubahan sejarah bertahap adalah untuk memiliki lebih dari satu kelompok sebelumnya, seperti Minton lakukan. Namun, prosedur ini tidak akan mendeteksi setiap kejadian sejarah yang memiliki onset mendadak pada waktu yang sama dengan pengobatan eksperimental. Sebuah kontrol yang baik untuk efek sejarah, yang Minton bisa digunakan tapi tidak, akan partisi pengobatan eksperimental menjadi dua atau lebih tingkat (seperti pemirsa berat dan ringan) dan kemudian memeriksa jumlah komparatif mereka belajar. Jika tingkat yang lebih tinggi dari pengobatan eksperimental diklaim diproduksi secara signifikan lebih banyak belajar dari tingkat yang lebih rendah, temuan yang tidak bisa masuk akal dijelaskan sebagai efek dari beberapa efek bersejarah lainnya, seperti program sekolah yang baru. Namun, Minton digunakan prosedur lain, yang memberikan beberapa-apa serupa perlindungan terhadap ancaman dari sejarah. Alih-alih partisi variabel independen, ia membagi variabel dependen menjadi tujuh nilai MRT yang berbeda. Karena hanya skor yang berhubungan erat dengan isi dari "Sesame Street" (subtest Alphabet) menunjukkan temuan yang signifikan, ada alasan kuat untuk percaya bahwa faktor penyebab menonton "Sesame Street." Sebaliknya, jika ada program sekolah yang baru yang bertujuan untuk meningkatkan kesiapan sekolah, itu mungkin akan mempengaruhi beberapa skor subtes lain juga. Oleh karena itu, ancaman terhadap validitas penelitian Minton dari peristiwa sejarah yang tidak diketahui, meskipun tidak mustahil, tampaknya sangat tidak mungkin.
Tiga paragraf sebelumnya memberikan contoh yang sangat baik bagaimana desain dapat "ditambal" untuk mengatasi kelemahan yang melekat itu mungkin.

Membangun Validitas
Daerah validitas konstruk menyajikan sebagian besar pertanyaan dalam penelitian Minton.Pada bagian, ini adalah hasil yang tak terelakkan dari kekhususan pertanyaan penelitian tentang efek dari satu program tertentu TV, "Sesame Street," pada satu baterai tes tertentu.Dengan demikian, masalah bias mono-operasi dan mono-metode Bias dibangun ke dalam penelitian. Akibatnya, kita tahu efek dari program TV pada satu tes tapi tidak pada tes atau ukuran kinerja TK lainnya, dan kami juga tidak tahu bagaimana program TV pendidikan lainnya untuk anak-anak akan mempengaruhi MRT atau tindakan lainnya. Minimal, itu akan menjadi lebih baik untuk menyelidiki validitas konvergen dengan memasukkan tes lain keterampilan alfabet dalam penelitian ini. Cita-cita validitas konstruk akan lebih baik bertemu jika kedua variabel independen dan variabel dependen dianggap sebagai wakil dari kelas program pendidikan dan tes masing-masing, dan jika perwakilan lain dari masing-masing kelas juga dimasukkan dalam penelitian ini. Tentu saja, ini adalah perintah tinggi, tetapi hanya penelitian multivariat skala besar tersebut dapat menghasilkan pengetahuan yang lebih lengkap dari konstruksi umum. Untuk kata lain, dari studi ini kita tahu bahwa menonton "Sesame Street" memiliki efek pada nilai MRT Alphabet anak-anak, tapi kita tidak tahu mengapa, atau apa efek lain itu mungkin memiliki.
Satu masalah validitas konstruk lainnya adalah bahwa penjelasan awal konstruksi akan lebih baik jika penulis telah ditentukan bahwa Alphabet harus menjadi satu-satunya skor MRT terpengaruh sebelum melakukan penelitian daripada setelah data dianalisis. Ancaman lain dalam kategori ini tampaknya dikontrol dengan baik? Misalnya, ada kemungkinan hipotesis-menebak, ketakutan evaluasi, atau eksperimen harapan mempengaruhi hasil.Tidak akan ada difusi pengobatan (program tidak pada udara di tahun-tahun sebelumnya), dan sama, tidak ada kesempatan untuk pemerataan kompensasi perawatan, persaingan kompensasi, atau demoralisasi marah pada bagian dari kelompok kontrol sebelumnya.Demikian pula, ancaman lain yang mungkin untuk membangun validitas tampak minim.Minton bisa menyelidiki masalah membingungkan konstruksi dengan tingkat konstruksi dengan menganalisis penonton setia "Sesame Street" terpisah dari anak-anak yang menonton kurang teratur, tapi ancaman ini tampaknya tidak serius mempengaruhi validitas konstruk penelitian.

Validitas Eksternal
Validitas eksternal penelitian Minton tampaknya baik karena hal itu dilakukan dalam pengaturan lapangan alami dengan prosedur dan langkah-langkah reaktif. Karena tidak ada pretest sebelum tahun TK, tidak mungkin ada interaksi pengujian dan pengobatan.Pertanyaan dapat diajukan mengenai setiap ancaman lain dalam kategori ini, namun tidak satupun dari mereka tampaknya sangat serius. Misalnya, hanya ada satu perlakuan dalam penelitian ini (menonton "Sesame Street") sehingga tidak ada kesempatan untuk itu untuk berinteraksi dengan pengobatan lain (misalnya, metode pengajaran TK baru). Mungkin ada interaksi seleksi dan pengobatan, tapi Minton diperiksa ini dengan berbagai sub-kelompok, dan hanya "kurang beruntung" kelompok ternyata tidak memiliki manfaat signifikan dari menonton "Sesame Street." Sebuah interaksi pengaturan dan pengobatan akan hadir jika hasil Minton itu tidak berlaku untuk sekolah kabupaten lainnya, atau untuk anak-anak pada tingkat kelas lainnya. Namun, tampaknya tidak ada alasan untuk percaya bahwa anak-anak di kota-kota lain akan merespon secara berbeda terhadap program TV, dan tingkat TK ini tentunya merupakan salah satu yang tepat di mana untuk mengukur efek acara. Akhirnya, interaksi sejarah dan pengobatan akan digambarkan jika "Sesame Street" di tahun kedua di udara atau di lain waktu tidak lagi memiliki efek yang sama bahwa Minton ditemukan. Saat ini kita hanya bisa berspekulasi tentang pertanyaan jangka panjang seperti itu, tapi mereka tampaknya tidak ancaman nyata bagi keabsahan temuan Minton.

STUDI WAKTU-SERIES:
TV DAN BACAAN
Sekarang kita beralih, singkat, dengan jenis utama lain dari penelitian kuasi-eksperimental.Dua karakteristik penting dari desain terputus time-series adalah bahwa beberapa pengamatan serupa dilakukan pada sekelompok orang atau benda selama periode waktu (sering sejumlah besar pengamatan mingguan, bulanan, atau tahunan), dan bahwa kadang-kadang selama periode itu suatu peristiwa terjadi yang diharapkan dapat mengubah tingkat dari pengamatan variabel dependen. Acara? Variabel independen dalam desain? Mungkin program pemerintah baru, bencana alam seperti banjir, sebuah acara internasional seperti perang, atau pengenalan teknologi baru seperti perekam kaset video rumah tangga. Jika acara eksperimental yang ditentukan dalam studi semacam ini disertai dengan perubahan dalam variabel dependen, sehingga membedakan titik waktu dari pola beberapa pengamatan sebelumnya, seri panjang pengamatan dapat memberikan perlindungan yang baik terhadap beberapa ancaman utama terhadap valid inferensi (seperti pematangan, testing, instrumentasi, dan regresi).
Interrupted studi time-series telah dilakukan pada berbagai topik diterapkan (Mark, Sanna, & Shotland, 1992). Sebuah contoh yang terkenal dari studi time series terganggu menunjukkan efek signifikan dari Inggris "breathalyser" tindakan keras, program nasional di mana polisi Inggris mulai memberikan on-the-spot tes napas untuk driver yang dicurigai mabuk atau melakukan pelanggaran lalu lintas ( Ross, Campbell, & Glass, 1970). Contoh lain termasuk studi tentang efek: Wajib hukum, sabuk pengaman (Wegenaar, Maybee, & Sullivan, 1988) Penerbitan nama mengutil dan mengemudi dalam keadaan mabuk pelanggar 'di koran (Ross & White, 1987) tata cara pengendalian Gun (O'Carroll et al ., 1991) Media publisitas tentang eksekusi (Stack, 1993) Munculnya televisi pada tingkat kejahatan (Hennigan et al., 1982)
Studi yang kami akan bahas di sini dilakukan oleh Edwin Parker dan beberapa rekan dan dilaporkan oleh Masak et al. (1990, hlm 566-568). Ini menyangkut efek pada sirkulasi buku perpustakaan umum dari munculnya televisi di berbagai komunitas Illinois pada 1940-an dan 1950-an, dan mengikuti metodologi dirintis dalam studi sebelumnya oleh Parker (1963). Variabel independen adalah pengenalan penerimaan televisi dalam berbagai komunitas, dan itu diperkirakan akan menyebabkan penurunan variabel dependen, sebuah compu tasi hati-hati per kapita sirkulasi buku dari perpustakaan umum masing-masing kota dalam jangka panjang tahun. Sebenarnya siaran televisi tiba pada waktu yang sangat berbeda dalam masyarakat yang berbeda karena Komisi Komunikasi Federal menempatkan pembekuan atas penerbitan lisensi untuk stasiun TV baru pada tahun 1951 dan tidak mengangkatnya sampai tahun 1953. Dengan demikian, beberapa kota Illinois memiliki penerimaan televisi selama beberapa tahun sebelum kota-kota lain yang diperoleh itu.
Perbedaan waktu ini dari TV pengenalan memungkinkan desain time-series direplikasi atau beberapa, di mana masyarakat awal-TV dapat dibandingkan dengan masyarakat akhir-TV selama bertahun-tahun. Jika pola perubahan sirkulasi buku bertepatan dengan munculnya penerimaan TV adalah serupa pada kedua kelompok kota-kota, yang akan memberikan dukungan tambahan kepada kesimpulan bahwa pengenalan televisi menyebabkan perubahan sirkulasi. Parker memilih 55 pasang awal dan akhir-TV-TV komunitas, yang dipasangkan pada variabel yang relevan seperti penduduk dan sirkulasi perpustakaan.Dengan demikian, desain ini dapat digambarkan sebagai terendah fol, menunjukkan masing-masing kelompok masyarakat oleh garis pengamatan, dipisahkan oleh garis putus-putus untuk menunjukkan bahwa mereka tidak benar-benar setara (lagi 0 menunjukkan sebuah pengamatan dari variabel dependen, sirkulasi buku, dan X menunjukkan peristiwa eksperimental, pengenalan penerimaan TV).
Awal-TV: 0, 0 0 X 0 0 0 0 0 0
3 4 5 6 7 8 9
2
Akhir-TV: 0, 0 0 0 0 0 0 X, 0 0
2 3 4 9 9 8 9

Hasil penelitian ditunjukkan pada Gambar 6-1, yang menampilkan kapita sirkulasi perpustakaan tahunan per untuk tahun 1945-1960. Melihat kurva atas, bagi masyarakat lateTV, Anda dapat melihat penurunan sirkulasi untuk tahun 1953 dan 1954, yang persis ketika TV itu menjadi tersedia bagi mereka.
Meskipun uji statistik menunjukkan pentingnya penurunan itu, tidak akan menjadi seperti meyakinkan dalam dirinya sendiri seperti dalam hubungannya dengan kurva untuk awal-TV
Tahun


GAMBAR 6-1 Hasil TV dan membaca studi: sirkulasi perpustakaan per kapita
dalam dua set masyarakat Illinois sebagai fungsi pengenalan televisi.
(Sumber:. Thomas D. Cook and Donald T. Campbell, Kuasi-Eksperimen Copy-
tepat ? 1979 oleh Houghton Mifflin Company. Digunakan dengan izin.)

masyarakat. Ada dapat dilihat bahwa penurunan yang sangat mirip dan bahkan lebih curam dalam sirkulasi perpustakaan terjadi pada tahun 1948 dan 1949, periode ketika televisi pertama kali menjadi tersedia dalam komunitas tersebut, lagi, uji statistik menunjukkan bahwa penurunan sangat signifikan. Paralelisme dari kedua kurva ini, dengan tetes terjadi sebagai hipotesis di saat-saat TV sedang diperkenalkan, adalah bukti yang sangat kuat bahwa munculnya TV benar-benar variabel kausal. Fitur lain yang penting adalah superimposisi virtual kurva dalam tahun-tahun terakhir studi (1957-1960), dan pola yang sama sebelum tahun 1948, yang keduanya mendukung kesimpulan bahwa dua set kota-kota cocok benar-benar sebanding.

Analisis TV dan Reading Study

Kekuatan desain berasal dari kontrol untuk sebagian besar ancaman terhadap validitas internal dan dari potensi dalam memperluas eksternal dan validitas konstruk. Validitas eksternal ditingkatkan karena efek dapat ditunjukkan dengan dua populasi dalam setidaknya dua pengaturan pada saat-saat yang berbeda dalam sejarah. Selain itu, ada kemungkinan akan tidak relevan yang berbeda terkait dengan penerapan setiap perlakuan dan, jika langkah-langkah yang mencolok, tidak perlu ada rasa takut pengobatan yang berinteraksi dengan pengujian. (Masak et al., 1990, hal. 566)
Meskipun kekuatan ini, penelitian ini memiliki beberapa masalah validitas potensial. Di bidang validitas internal, sejarah dibayangkan bisa menjadi ancaman. Sebuah contoh yang spesifik dari suatu peristiwa sejarah yang efeknya bisa meniru efek prediksi TV dalam penelitian ini adalah tersedianya peningkatan buku paperback. Bahkan, penerbitan novel itu meningkat tajam selama periode ini, dan ketersediaan mereka dengan harga rendah mungkin bisa menjelaskan penurunan diamati dalam sirkulasi perpustakaan.
Namun, dalam rangka untuk penjelasan ini agar sesuai dengan studi time-series direplikasi Parker, ada harus menjadi alasan untuk mengharapkan novel untuk mempengaruhi dua kelompok masyarakat di berbagai titik dalam waktu? Interaksi seleksi dan sejarah.Meskipun tidak terlalu besar, yang setidaknya mungkin, bagi masyarakat memang berbeda dalam beberapa hal yang relevan meskipun pencocokan mereka. Masyarakat awal-TV pada umumnya perkotaan dan relatif makmur, sementara kota-kota akhir-TV kebanyakan pedesaan dan miskin. Dengan demikian, dapat dibayangkan bahwa dampak dari buku paperback bisa memukul masyarakat miskin lima tahun kemudian dari yang kaya, dan menjadi penyebab sebenarnya (atau penyebab parsial) dari penurunan sirkulasi perpustakaan. Salah satu cara untuk memeriksa kemungkinan ini lebih lanjut, karena Parker (1963) lakukan dalam penelitian sebelumnya, akan membagi variabel sirkulasi ke fiksi dan buku nonfiksi. Pada 14 pasang masyarakat Illinois, ia menemukan bahwa munculnya televisi penurunan sirkulasi perpustakaan buku fiksi signifikan lebih daripada yang nonfiksi. Dia telah meramalkan efek ini atas dasar bahwa TV, sebagai media terutama fiksi atau fantasi, akan lebih mungkin untuk menggantikan membaca fiksi, dan temuan ini membuat penjelasan sirkulasi yang lebih rendah sebagai akibat peningkatan ketersediaan novel bahkan kurang masuk akal daripada sebelumnya.
Secara umum, aspek paling mengesankan dari penelitian ini adalah validitas konstruk nya.Sebagai studi witn Minton dari "Sesame Street," ini adalah sebagian besar hasil dari mono-operasi dan mono-metode pendekatan. Perpustakaan sirkulasi hanya satu indeks jumlah membaca di masyarakat (meskipun mungkin yang paling tersedia), dan pemahaman yang lebih lengkap dari konstruk akan telah diperoleh dengan menggunakan berbagai ukuran variabel dependen.
Satu pertanyaan lain tentang studi ini menyangkut keandalan pelaksanaan pengobatan.Pengenalan televisi menjadi sebuah komunitas dapat terjadi pada satu saat yang tepat ketika stasiun lokal dimulai penyiaran, tetapi itu tidak berarti bahwa seluruh masyarakat (atau bahkan fraksi yang cukup dari populasi) akan terpengaruh olehnya pada waktu itu.Bahkan, teok empat hingga enam tahun untuk teknologi baru untuk berdifusi ke titik bahwa tiga perempat dari rumah di masyarakat Illinois memiliki televisi (Masak et al., 1990, hal. 567). Namun tanggal berkurang sirkulasi perpustakaan dalam penelitian Parker (1948 dan 1953) adalah tahun ketika hanya 10% sampai 15% dari rumah di kelompok masing-masing masyarakat memiliki TV! Dengan demikian, tidak jelas proses yang menyebabkan penurunan sirkulasi perpustakaan Apakah itu menyumbang dengan hanya 10% sampai 15% dari populasi? Atau bisa itu telah efek antisipatif pada bagian sisanya: bersiap-siap untuk TV dengan membaca kurang? Pertanyaan-pertanyaan ini melampaui hasil yang diamati untuk bertanya tentang proses dimana kedatangan televisi mempengaruhi membaca dan kegiatan masyarakat lainnya.

MENGGUNAKAN pengacakan
DALAM BIDANG PENELITIAN
Topik terakhir dalam diskusi kami kuasi-eksperimen adalah: Ketika seseorang harus menggunakan penugasan acak dari subjek dengan kondisi pengobatan (yaitu, benar percobaan yang)? Prinsip dasar penting di sini adalah bahwa pengacakan harus digunakan bila memungkinkan karena meningkatkan kekuatan kesimpulan kausal (Cook & Shadish, 1994). Sebagaimana kita bahas pada Bab 4, keuntungan besar percobaan benar adalah bahwa pengacakan menyamakan karakteristik awal pengobatan sub-kelompok, dalam batas specifiable sampling error, dan dengan demikian memungkinkan penggunaan yang tepat dari uji statistik yang paling kuat. Namun, ingat bahwa kesetaraan awal subkelompok eksperimental tidak menjamin kesetaraan akhir mereka pada akhir percobaan, karena faktor-faktor seperti gesekan diferensial, pemerataan kompensasi perawatan, persaingan kompensasi, atau demoralisasi dapat menghasilkan perbedaan yang nyata pada skor sub-grup terakhir, sepenuhnya terlepas dari pengaruh variabel pengobatan. Untuk itu, pemeriksaan terhadap adanya faktor-faktor ini harus selalu dimasukkan dalam desain penelitian eksperimental.
Percobaan acak telah kadang-kadang dikritik sebagai terlalu mahal, baik uang dan waktu, digunakan secara luas dalam penelitian sosial. Memang benar bahwa penelitian atau quasi-eksperimental studi korelasional cenderung menjadi lebih cepat dan lebih murah daripada percobaan yang benar. Bagaimana-pernah, banyak penulis telah menegaskan bahwa biaya penelitian jauh sebanding dengan biaya sosial menjadi salah tentang kesimpulan penelitian yang mempengaruhi program nasional atau bahkan urusan lokal (Masak et al, 1990;. Coyle, Boruch, & Turner, 1991 ; Manski & Garfinkel, 1992). Perhatikan, misalnya, biaya kepada publik keputusan yang salah tentang persetujuan penjualan obat berbahaya seperti thalidomide, atau sekitar penjara Program awal-release yang melibatkan narapidana yang masih berbahaya.
Meskipun kesulitan melakukan percobaan acak dalam pengaturan lapangan, ada daftar mengejutkan percobaan panjang yang diterbitkan pada program-program sosial dalam seperti pendidikan, hukum, kesehatan mental, dan pekerjaan (Boruch, 1996; Cook & Shadish, 1994). Masak dan Campbell (1979) disajikan daftar membantu jenis situasi di mana pengacakan dapat POSSI ble dan dapat diterima dalam penelitian sosial. Di antara contoh mereka, dua yang cukup umum adalah: Undian untuk pemerataan sumber daya yang langka (seperti kondominium baru) atau beban yang tidak diinginkan (seperti dinas militer). Penugasan pelamar untuk manfaat sosial untuk kelompok perlakuan atau kelompok kontrol waitinglist dalam keadaan di mana permintaan melebihi pasokan baik (seperti teknik medis baru seperti dialisis ginjal) atau kapasitas distribusi (seperti program pelatihan kerja).

Pengacakan dalam Studi Quasi-Experimental

Ada satu cara lain di mana pengacakan dapat berguna, bahkan dalam studi kuasi-eksperimental dimana peneliti tidak memiliki kontrol penuh atas tugas dari kondisi pengobatan. Ingat bahwa definisi penelitian kuasi-eksperimental menunjukkan bahwa penyidik tidak memiliki kontrol atas waktu dan metode pengukuran. Dengan demikian peneliti secara acak dapat menetapkan pengukuran untuk bagian dari total sampel pada satu waktu dan paruh di lain waktu. Salah satu contoh adalah terpisah-sample pretest-posttest design, yang dapat digambarkan sebagai berikut (R berdiri untuk tugas acak):
Kelompok pretest-posttest: R 0 X 0,
1
Posttest-satunya kelompok: R X 0
3
Mengapa ada orang yang ingin menggunakan desain seperti itu? Sebuah keadaan utama di mana itu akan berguna adalah ketika seluruh penduduk harus menjalani pengobatan (misalnya, satu tahun studi sekolah tinggi), tetapi pengukuran pretest reaktif sehingga mempengaruhi pembelajaran kemudian mereka yang terkena itu (misalnya , tes pengetahuan sejarah Amerika). Dalam situasi seperti ini, memberikan pretest untuk setengah acak dari siswa dan hanya posttest dengan semester acak lainnya akan memastikan bahwa non-reaktif pre-post perbandingan dapat dibuat (dengan membandingkan kelompok pertama 0, dengan kelompok kedua yang
1
0), yang tidak akan mungkin dalam umum lainnya
3
desain. Meskipun desain ini menderita ancaman lain terhadap validitas, mereka dapat sebagian besar diatasi dengan prinsip "menambal-up" dengan kelompok kontrol tambahan dan pengukuran (Campbell & Stanley, 1966).

RINGKASAN

Dalam penelitian kuasi-eksperimental, penyidik tidak memiliki kontrol penuh atas manipulasi variabel independen, tetapi tidak memiliki kontrol atas bagaimana, kapan, dan untuk siapa variabel dependen diukur. Banyak desain kuasi-eksperimental sangat berguna ketika desain yang lebih baik adalah tidak mungkin, dan mereka sering bisa "ditambal-up" untuk menghindari sebagian besar ancaman terhadap inferensi yang valid. Tidak ada studi tunggal yang pernah bebas dari semua masalah dapat disimpulkan, tetapi secara umum, desain quasi-eksperimen lebih lemah daripada eksperimen dan lebih kuat dari penelitian korelasional.
Empat jenis utama dari validitas adalah: (1) statistik validitas kesimpulan (ada pengaruh yang signifikan?), (2) validitas internal (apakah itu efek kausal?), (3) validitas konstruk (apa temuan artinya dalam konseptual istilah, atau dalam pemahaman tentang "bahan utama" dari ukuran kompleks?), dan (4) validitas eksternal (berlari temuan digeneralisasi untuk orang lain, pengaturan, dan waktu?). Dua yang pertama berurusan dengan apakah kesimpulan benar dapat diambil dari data tertentu di tangan, sementara dua terakhir keprihatinan generalisasi dengan kondisi lain. Validitas internal biasanya merupakan karakteristik yang paling penting, karena tanpa itu jenis validitas ada artinya. Ada banyak masalah khusus dalam desain penelitian yang merupakan ancaman terhadap masing-masing jenis validitas, dan ada banyak cara yang sesuai memerangi masalah untuk mencapai kesimpulan yang valid.
Studi Minton tentang efek dari tahun pertama ofthe Program "Sesame Street" di sekolah-kesiapan nilai tes anak-anak TK menggambarkan possiblethreats untuk validitas dalam satu kelas utama studi kuasi-eksperimental: control nonequivalent desain kelompok.
Demikian pula, studi Parker tentang bagaimana pengenalan televisi mempengaruhi perpustakaan umum exempli sirkulasi fies kelas utama lain dari studi kuasi-eksperimental: terganggu desain time-series.
Penugasan acak subyek untuk treatmentconditions adalah kekuatan besar dari desain eksperimental yang benar dan harus digunakan sedapat mungkin untuk memperkuat kesimpulan kausal. Ada banyak situasi sosial di mana percobaan acak yang mungkin, mengingat pemikiran dan perencanaan yang cermat. Bahkan dalam desain eksperimen kuasi, pengacakan dapat digunakan sangat menguntungkan untuk membagi kelompok mata pelajaran untuk prosedur pengukuran yang berbeda.



Bacaan DISARANKAN
Campbell, DT, & Fiske, DW (1959). Konvergen dan validasi diskriminan oleh matriks multimethod multitrait. Psychological Bulletin, 56, 81-105.? Kertas awal ini masih gambaran yang berguna tentang bagaimana untuk menentukan validitas konstruk melalui pola hubungan yang sama dan berbeda.
Cook, TD, Campbell, DT, & Perrachio, L. (1990). Eksperimen kuasi. Dalam M. Dunnette & L. Hough (Eds.), Handbook of psikologi industri dan organisasi
(2nd ed., Vol. 1, hlm 491-576). Palo Alto, CA: Consulting Psikolog Press gambaran yang komprehensif terbaru dari empat jenis validitas, banyak jenis.?
desain kuasi-eksperimental, dan ancaman yang khas untuk validitas masing-masing desain.
Mark, MM, Sanna, LJ, & Shotland, RL (1992). Metode time series dalam penelitian sosial terapan. Di FB Bryant, J. Edwards, S. Tindale, E. Posavac, L. Heath, putra E. Hender, & Y. Suarez-Balcazar (Eds.), isu-isu metodologis dalam psikologi sosial terapan: aplikasi psikologi sosial terhadap isu-isu sosial ( hlm 111-133). New York: Plenum.
Ross, A., & Grant, M. (1994). Desain mental yang eksperimental dan nonexperi dalam psikologi sosial. Madison, WI:.? Brown & Tolok Ukur buku singkat ini memberikan produksi intro desain eksperimental dan gambaran tentang kekuatan dan ancaman terhadap validitas banyak desain penelitian.




SUGGESTED READINGS
Campbell, D. T., & Fiske, D. W. (1959). Convergent and discriminant validation by the multitrait multimethod matrix. Psychological Bulletin, 56, 81-105.?This early paper is still a useful description of how to determine construct validity through a pattern of similar and dissimilar relationships.
Cook, T. D., Campbell, D. T., & Perrachio, L. (1990). Quasi experimentation. In M. Dunnette & L. Hough (Eds.), Handbook of industrial and organizational psychology
(2nd ed., Vol. 1, pp. 491-576). Palo Alto, CA: Consulting Psychologists Press.?The most recent comprehensive overview of the four kinds of validity, the many types of
quasi-experimental designs, and the typical threats to validity of each design.
Mark, M. M., Sanna, L. J., & Shotland, R. L. (1992). Time series methods in applied social research. In F. B. Bryant, J. Edwards, S. Tindale, E. Posavac, L. Heath, E. Hender son, & Y. Suarez-Balcazar (Eds.), Methodological issues in applied social psychology: Social psychological applications to social issues (pp. 111-133). New York: Plenum.
Ross, A., & Grant, M. (1994). Experimental and nonexperi mental designs in social psychology.  Madison, WI: Brown & Benchmark.?This short book gives an intro duction to experimental design and an overview of the strengths and threats to validity of many research designs.


Tidak ada komentar:

Poskan Komentar