Ölçme ve değerlendirmede klasik test kuramı ve madde tepki kuramı uygulamaları
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Bu çalışmanın amacı, Klasik Test Kuramı (KTK) ve Aşamalı Tepki Modeli (ATM) yöntemlerini, farklı yazılım programı (R, LISREL ve MULTILOG) kullanarak istatistiksel olarak incelemektir. Çalışmanın uygulama bölümünde Sporcu Kimliği Ölçeği kullanılmıştır. Araştırmanın örneklemini Ege Üniversitesinde okuyan 375 lisans öğrencisi oluşturmaktadır. Doğrulayıcı Faktör Analizinde (DFA) Robust ML tahmin yöntemi ve ML tahmin yöntemlerine göre LISREL programı ile çözümlemeler yapılmış, tek boyutlu bir yapı için model uyum indekslerinin iyi sonuç verdiği görülmüştür. KTK’ya göre Cronbach alpha katsayısı ve ATM’ye göre ölçeğin marjinal güvenirlik katsayısı 0.92 olarak hesaplanmıştır. Ölçekteki maddelerin veriye uyum düzeyleri, gözlenen ve beklenen oranlar arasındaki fark aracılığı ile değerlendirilmiş ve modelin veri ile uyumlu olduğu görülmüştür. ATM ile tahmin edilen madde ayırıcılık ve madde güçlük parametre değerleri MULTILOG ve R çözümlemelerinde birbirine yakın sonuçlar vermekle birlikte, farkın istatistiksel olarak anlamlı olduğu görülmüştür. Sonuç olarak ölçeğin her iki kurama göre geçerli ve güvenilir olduğu söylenebilir.
The aim of this study is to statistically analyze the Classical Test Theory (CTT) and Graded Response Model (GRM) methods using different software programs (R, LISREL and MULTILOG). Athletic Identity Measurement Scale was used in the application part of the study. The sample of the study consists of 375 students studying at Ege University. In Confirmatory Factor Analysis (CFA), analyzes were made with the LISREL program according to the Robust ML estimation method and ML estimation methods, and it was seen that the model fit indices for a one-dimensional structure gave good results. The Cronbach alpha coefficient according to CTT and marginal reliability coefficient of the scale according to GRM were calculated as 0.92. The level of compliance of the items in the scale with the data was evaluated through the difference between the observed and expected proportion, and it was seen that the model was compatible with the data. Although the item discrimination and item difficulty parameter values estimated by GRM gave similar results in MULTILOG and R analysis, the difference was found to be statistically significant. As a result, it can be said that the scale is valid and reliable according to both theories.