ISSN 1308-6278
Brunet-Lézine gelişim ölçeği Türkiye uyarlaması: Normlar, geçerlik ve güvenirlik - Özgün Araştırma

Levent Kayaalpİstanbul Üniversitesi Cerrahpaşa Tıp Fakültesi, Çocuk Ruh Sağlığı ve Hastalıkları Anabilim Dalı, İstanbul, Türkiye, Füsun Aygölüİstanbul Üniversitesi Cerrahpaşa Tıp Fakültesi, Çocuk Ruh Sağlığı ve Hastalıkları Anabilim Dalı, İstanbul, Türkiye, Burçin Alsancakİstanbul Üniversitesi Cerrahpaşa Tıp Fakültesi, Çocuk Ruh Sağlığı ve Hastalıkları Anabilim Dalı, İstanbul, Türkiye, Ekrem DüzenSabancı Üniversitesi Kampüsü, Bireysel Danışmanlık Merkezi, İstanbul, Türkiye, Burak DoğangünSabancı Üniversitesi Kampüsü, Bireysel Danışmanlık Merkezi, İstanbul, Türkiye

Özet
Amaç: Brunet-Lézine, çocukların 2-30 ay arasındaki ruhsal ve devinsel gelişimini ölçen bir testtir. Herbiri gelişimin bir boyutunu tarayan duruş, eşgüdüm, dil ve toplumsallık alt-ölçeklerinden oluşmaktadır. Bu çalışmada Brunet Lézine’nin Türk çocuklarında geçerlik ve güvenirliliğinin yapılması amaçlanmıştır.
Gereç ve Yöntem: Yaşları iki ile 30 ay arasındaki toplam 761 denek standardizasyon değerlendirilmesine alınmış olup bunların 355’i kız, 406’sı erkektir. Testin toplam iç tutarlılığını belirlemede Cronbach alfa güvenirlik katsayısına başvurulmuştur. Alt testlerin birbirleriyle ilişkisi Pearson korelasyon katsayısıyla belirlenmiş, ardışık ayların alt test ve genel toplam puanlarının kıyaslanmasında eşli t testi uygulanmıştır.
Bulgular: Duruş, eşgüdüm, dil ve toplumsallık alt testlerine göre Cronbach alfa, sırasıyla 0,98; 0,98; 0,95; ve 0,95 olarak bulundu. Tüm ölçeğe ilişkin Cronbach alfa ise 0,99 olarak saptandı. Alt-test puanlarının ve toplam puanın gelişimsel yaş aralıklarını yordama düzeyini belirlemek için, her bir alt test için bebeğin bulunduğu gelişimsel yaş aralığı bağımlı değişken kabul edilerek beş doğrusal regresyon örneği kuruldu. Analizler, tüm örneklerin yüksek açıklayıcılığa (R2>0,94) ve ileri düzeyde anlamlılığa  (p<0,001)  sahip olduğunu ortaya çıkarmaktadır.
Çıkarımlar: Bu çalışma Brunet Lézine ölçeğinin Türkçe sürümünün, 2-30 aylar arasındaki Türk çocuklarının gelişim düzeylerinin belirlenmesinde kullanılabilecek geçerlilik ve güvenirliğe sahip olduğunu göstermektedir. (Türk Ped Arş 2010; 45: 86-95)
Anahtar sözcükler: Brunet-Lézine, geçerlik, gelişim testi, güvenirlik, normlar

Summary
Aim: Brunet-Lézine-Revised  is a kind of developmental test which measures motor and mental development of children aged between 2-30 months. Brunet Lézine is composed of posture, coordination, language, socialization subscales each of which screendevelopment in one dimension. The aim of this study was to evaluate the reliability and validity of Brunet-Lézine-Revised.
Material and Method: 761 children aged between 2-30 months were included in the standardization evaluation. The sample consisted of 355 girls and 406 boys. Cronbach’s alpha reliability coefficient was used to determine total internal consistency of the test. The relation between subtests was determined by Pearson correlation coefficient. Paired t-test was used to compare the subtest and total points of consecutive months. 
Results: In the reliability analysis, the Cronbach’s alpha coefficient was calculated as 0.98; 0.98; 0.95; and 0.95 for posture, coordination, language and socialization respectively. The Cronbach’s alpha coefficient for the total scale was calculated as 0.99. To determine the predictive level of subtest points and total point for the developmental age intervals of infants, five lineer regression models were constructed regarding the developmental age interval as the dependent variable for each subtest. Analysis revealed that all of the models had high explanatory level  (R2>0.94) and high level of significance (p<0.001).
Conclusions: This study shows that the Turkish version of the Brunet Lézine has appropriate reliability and validity for assessing motor and mental development in Turkish children aged between 2-30 months. (Turk Arch Ped 2010; 45: 86-95)
Key words: Brunet-Lézine, developmental test, norms, reliability, validity


Giriş

Psikiyatrinin tıp dalları arasında yerini almasının en önemli sonuçlarından biri de ruh hastalığı ile zekâ geriliğinin birbirinden ayrılmasıdır. Bu gelişme, zekâ geriliği sergileyen kişilerin eğitilebilirliği konusunu gündeme getirmiş ve XIX. yüzyılın ikinci yarısından itibaren özellikle Avrupa’da özel eğitim veren kurumların oluşturulmasına yol açmıştır. Böylece bu okullara gidecek çocukları belirlemek üzere zekâyı ölçme gerekliliği ortaya çıkmıştır. Fransa’da Binet ve Simon bu doğrultudaki çalışmaları sonucunda, “zekâ yaşı” kavramını ortaya atmış ve 1905’de ilk zekâ testini geliştirmişlerdir (1). Hemen ardından A.B.D.’de Terman, Binet ve Simon’un “zekâ yaşı” kavramını takvim yaşıyla orantılandırarak  “zekâ bölümü” (IQ)  kavramını yaratmıştır (2).
Ortaya atılışını izleyen ilk yıllarda, yaşam boyunca sabit olduğu düşünülen “zekâ bölümü”nün belirlenmesinin çocuğun gelecekteki yetilerine ilişkin öngörüde bulunma olanağı verebileceği düşüncesi, zekâ testine yüklenen anlamı arttırmış ve testin mümkün olduğunca küçük yaşlardaki çocuklara uygulanması ihtiyacını doğurmuştur. Ancak eldeki testlerin buna imkân vermemesi yeni arayışlar doğurmuştur. Bu arayışlar içinde Gesell ve ark.’larının (3) girişimi, bir yandan ilk bebek gözlemlerini başlatırken, bir yandan da toplanan veriler yaşa uygun yeti ve davranışların belirlenmesinin yolunu açmıştır. Çocuğun, motor gelişim, dil gelişimi, toplumsal uyum gibi farklı alanlardaki gelişim düzeyini belirlemeyi hedefleyen Gesell ölçeği, daha sonraki yıllarda geliştirilecek olan Bayley ölçeği (4,5), Buhler ölçeği (6) gibi birçok gelişim testinin esin kaynağı olmuştur.
1941’de, Rene Zazzo ile genetiğin Fransa’daki öncülerinden R.Turpin’in ikizleri konu alan araştırmalarının, küçük çocukların gelişimi değerlendirebilecek bir ölçeğin gerekliliğini gündeme getirmesi üzerine Irene Lézine varolan testlerin incelenmesiyle görevlendirilir. Lézine, Gesell ve Bühler ölçeklerini Fransız çocuklarına uygular. Ancak testlerden elde edilen sonuçların birbirini tutmaması üzerine bu testlerin uyarlanması gerektiği sonucuna varır. Gözlemlenen davranışları görülme sıklıklarını göz önüne alarak, her iki testten aldığı itemleri yeniden sınıflayarak 1944’de yeni bir test bataryası oluşturur. Ancak sağlık sorunları nedeniyle testin geçerlilik güvenilirlik çaışmalarına ara vermek zorunda kalır ve 1946’da Odette Brunet, çalışmayı bırakılan noktadan devam ettirir. 1948’de önce 1-15 ay dönemini kapsayan bölümü, daha sonra da 18-30 ay dönemini kapsayan bölümü yayınlar (7,8). Ancak testin bir “bebek gelişim testi” olarak yayınlanması ve kullanıma sokulması 1951’de gerçekleşir (9). Testin bu değişik şekli Fransa yanında başka ülkelerde de yaygın kullanım alanı bulmuş ve Yani Anastasyanidis (10) tarafından Türkçeye çevrilerek ve standardizasyon çalışması yapılmaksızın uzun yıllar kullanılmıştır.
1980’den itibaren, kullanılagelen gelişim testleri üzerine yapılan çalışmaların bu testlerden elde edilen skorların zaman içinde değiştiğini göstermesi üzerine (11-13) birçok testin gözden geçirilmesi ve yeniden standardize edilmesi gerekliliği ortaya çıkmıştır. Böylece Gesell Ave Bayley ölçekleri yeniden değerlendirilmiş ve gözden geçirilmiş yeni biçimleri kullanıma sunulmuştur (14,15). Brunet-Lézine (BL-R) ölçeği’nin gözden geçirme ve yeniden ölçümlenme çalışmaları da 1994’de başlamış ve 1997’de sona ermiştir. Ölçeğin gözden geçirilmiş yeni şeklinde, bazı itemler terk edilirken 33 yeni item eklenmiş ve muhafaza edilen eski itemlerin de %40’ı ait oldukları aylardan bir ay öncesine yerleşmiştir. Yeni itemler çocuğun ilişkisel yetilerini ölçmeyi hedeflerken “birleşik dikkat” gibi yeni kavramları da göz önüne almaktadır (16).
Günümüzde gelişim testleri, gelişim açısından risk taşıyan toplulukların taranmasında, gelişim gecikmesi taşıdığı kuşkusu uyandıran çocukların belirlenmesinde ve gelişimle ilgili araştırmalarda yaygın olarak kullanılmaktadır. Aşağıda belirtilen nedenlerden dolayı BL-R ölçeğinin ülkemiz çocukları için standardize edilmesinin yararlı olacağı düşünülmüştür: 1) Çocuğun gelişimi konusunda testi uygulayan kişinin gözlem ve değerlendirmesine dayanması ve böylece ebeveynlerin bilinen yanlılıklarla bilgi vermesinden kaynaklanan öznel değerlendirmelerin dengelenmesi belirgin bir üstünlük sağlamaktadır. 2) Günümüzde kullanılan kimi gelişim testlerinden farklı olarak BL-R ölçeği sayısal bir skor vermektedir. Brunet Lézine ölçeği zekâ  testlerine benzer bir yapıda hazırlanmıştır ve yine zekâ  testlerine benzer bir uygulama biçimine sahiptir. Elde edilen sayısal skor zekâ bölümü gibi bir gelişim bölümünü ifade etmektedir. 3) Dil ve toplumsallaşma alt ölçeklerine eklenen yeni itemler yaygın gelişimsel bozukluk belirtilerine duyarlılık göstermektedir.

Gereç ve Yöntem

Testin çevirisi
Brunet-Lézine Revisé gelişim ölçeği’nin  Türk çocukları için standardizasyon çalışmasının ilk aşaması 2001 yılında test kitapçığının uygulama yöntemleri ve yönergelerinin Türkçe’ye çevrilmesiyle başlamıştır. Fransızca’dan Türkçe’ye çeviri, aynı zamanda profesyonel çevirmen olan bir araştırmacı (L.K.) tarafından gerçekleştirilmiş, daha sonra Türkçe metin özgün metinden haberdar olmayan bir profesyonel çevirmen tarafından tekrar Fransızca’ya çevrilmiştir. Daha sonra bu çeviri göz önüne alınarak Türkçe çeviride gerekli değişiklikler yapılmıştır. Bu şekilde olası çeviri hataları en aza indirilmeye çalışılırken, kültürel özellikler gösteren ifade ve sözcüklerde, özellikle de uygulama sırasında çocuğa verilen talimatlarda tam eşdeğerlik sağlanması hedeflenmiştir.
Uygulama ekibinin eğitimi
Standardizasyon çalışmasının ikinci aşaması olan uygulayıcı ekibin eğitiminde, eğitimi verecek kişilerin testin uygulanması konusunda yeterli deneyim sahibi olması gözetilmiştir. Bu anlamda, eğitimi verecek iki psikologtan birinin (F.A.) BL-R ölçeğinin Türkiye’de kullanılagelen ilk sürümünün eğitimini almış ve uygulanmasında deneyim kazanmış olması, diğerinin (B.A.) ise Tours Ünversitesi Çocuk Psikiyatrisi Kliniği’nde  (Fransa) BL-R ölçeğini uygulama ve araştırmalarda kullanma eğitimi almış olması yeterli görülmüştür. Uygulama ekibini oluşturan psikologlarda ise, klinik ortamda çocuklarla çalışma ve en az bir gelişim ya da zekâ testi eğitimi almış olma koşulu aranmıştır. Sekiz hafta (toplam 32 saat) süren eğitim süresince,  itemlerin tek tek tanıtılması ve testin uygulanmasının video kayıtlarıyla örneklenmesinden sonra deneme uygulamalarına geçilmiş ve bu uygulamalar eğiticiler tarafından denetlenmiş ve değerlendirilmiştir. Bu deneme uygulamalarında başarılı olarak değerlendirilen adaylar uygulama ekibine alınmamıştır.
Örneklem
Çalışmanın üçüncü aşamasında, 12 psikologdan oluşan uygulama ekibi Cerrahpaşa Tıp Fakültesi Çocuk Sağlığı ve Hastalıkları Anabilim Dalı Sağlam Çocuk Polikliniği, Bakırköy Devlet Hastanesi Sağlam Çocuk Polikliniği, Cerrahpaşa Tıp Fakültesi Çocuk Yuvası ve İstanbul Tıp Fakültesi Çocuk Yuvasında BL-R uygulamasına başlamıştır.
Denekler seçilirken, ikizler, beslenme bozukluğu, görsel, işitsel ya da motor özür ve global gelişim gecikmesi sergileyen denekler çalışma dışı bırakılmış, buna karşılık erken ve geç doğmuş denekler çalışmaya alınmış, ancak standardizasyon değerlendirilmesine katılmamıştır. Test uygulamasından önce deneklerin ailerinin bilgilendirilmiş onayı alınmıştır. Ayrıca test verilmeden önce her denek ve ailesi ile sosyodemografik veriler toplanmış ve gözlem kâğıdına kaydedilmiştir. Uygulamalar test koşullarına uygun gözlem odalarında, standart test ortamında yapılmıştır.
Toplam 761 denek standardizasyon değerlendirilmesine alınmış olup bunların 355’i kız, 406’sı erkektir. Kronolojik yaşları iki ile 30 ay arasında değişmektedir (en az 60 gün, en fazla 900 gün).
Araç
Brunet Lézine, çocukların 2-30 ay arasındaki ruhsal ve devinsel gelişimini ölçen bir testtir. Her biri gelişimin bir boyutunu tarayan Duruş (Posture-P), Eşgüdüm (Coordination-C), Dil (Language-L) ve Toplumsallık (Socialization-S) alt ölçeklerinden oluşmaktadır. Bu ölçeklerin itemleri 2-30 ay arasındaki yaş gruplarına dağıtılmış durumdadır. Yaş grupları 2. aydan 10. aya kadar birer ay artarak ilerlemekte, 10 aydan sonra 12, 14, 17, 20, 24 ve 30. aylar esas alınmaktadır. Toplam 15 yaş grubu ve her yaş grubunda da gelişimi tarayan 10 item vardır. Böylece tüm ölçek toplam 150 itemden oluşmaktadır. İtemler, çocukların belirli bir yaşta sergilemesi gereken yetilerin gözlem, belirli uyaranlara verilen tepkilerin değerlendirilmesi ve sınırlı alanlarda annenin bilgisine başvurulması yoluyla çocuğun gelişim düzeyine ilişkin veri toplanmasını hedefler. Çocuk, başarılı sayıldığı her item için belirli bir puan alır. Bu puanlar toplanarak çocuğun her bir alt ölçekte aldığı puan belirlenir ve bu puanlara denk düşen gelişim yaşı takvim yaşına bölünerek “Gelişim Bölümü” saptanır.
Uygulamalarda yurtdışından sağlanan özgün test malzemesi kullanılmıştır. Malzeme bebeklerin ilgisini çekecek biçimde hazırlanmış olup, büyük bir çanta içinde yer alan 10 küp, zil, fincan, peçete, çıngırak, halka, şekerler ve şişe, kaşık, ayna, üç delikli şekil tahtası, renkli kalem, resimli kitap, bebek, iskemle, 10 küçük nesne ve resimli kartlardan oluşmaktadır. Ayrıca aylara göre düzenlenmiş 150 itemden oluşan ve üzerinde puanlamanın yapıldığı test protokol kâğıdı, test gözlem formu ve test yönergesi de malzeme içerisinde yer almaktadır.
İstatistik işlemler
İstatistik işlem için UNİSTAT 5.0 ve SPSS 10.0 kullanıldı. Testin toplam iç tutarlılığını belirlemede Cronbach alfa güvenirlik katsayısına baş vuruldu. Alt testlerin birbirleriyle ilişkisi Pearson bağıntı katsayısıyla belirlendi. Ardışık ayların alt test ve genel toplam puanlarının kıyaslanmasında eşli t testi uygulandı.
Her alt testin uygulandığı andaki gün cinsinden yaş bağımlı değişken, testin skoru bağımsız değişken olarak ele alındığında uygulanan doğrusal regresyon örneği ile test sonuçlarının bebeğin yaşını tahmin etmede ne derece etkin olduğu araştırıldı. Ayrıca bu denklemlerden, topluluğun tamamı için elde edilen gün cinsinden kuramsal yaşların belirli puan aralıklarına karşılık getirilmeleri suretiyle dönüşüm tabloları hazırlandı. Böylece, regresyon denklemlerinin hareket edilerek ve uç değerler düzeltilerek tüm yaşlar tahmin edilmiş oldu.
Alt testlerin ve genel toplamın cinsiyete göre fark gösterip göstermediği student’s t testi ile değerlendirildi.

Bulgular

Ölçeğin Türkiye uyarlamasının ilk aşamasında, gelişimsel yaş dönemlerine göre gruplanan örneklemin elde ettiği puanların dağılımları incelenmiştir. Bu incelemede, tek-değişkenli ve çok değişkenli uç değerlerin varlığı sorgulanmıştır. Bu sorgulama hem alt test puanları hem de toplam puan üzerinden yapılmıştır. Sorgulama sonucunda, iki deneğe ilişkin veriler tek değişkenli, 31 deneğe ilişkin veriler ise çok değişkenli uç değer ölçütlerine uymadığı için çalışma dışı bırakılmıştır. Böylece çalışmaya 740 deneğin verileri üzerinden devam edilmiştir (Tablo 1).

Normlar
Ölçeğin Türkiye normlarının oluşturulmasında izlenen yöntem, hangi puan aralığının hangi yaş aralığına karşılık geldiğini esas almıştır. Ölçek, her dört boyuttaki gelişimi ölçen alt testlerin kendi içinde ve birbirine göre sonuçları hakkında karşılaştırma bilgisi vermeyi amaçlamaktadır. Buna göre normların belirleyicisi, yaş gruplarının alt testlerden aldıkları puanlar değil, puan aralıklarına karşılık gelen yaş aralıklarının genişlikleridir. Başka bir deyişle, yaş dönemlerinin bulunduğu gelişim düzeyi değil, belirli gelişimsel görevlerin gerçekleştirilebildiği yaş aralıklarını saptamak önemlidir. Böylece, belirli bir alt testin ölçtüğü özelliğin yaş dönemlerine göre gelişim seyri izlenebildiği gibi farklı gelişimsel görevlerin gerçekleştirilme dönemleri de karşılaştırmalara izin verecek şekilde saptanabilmektedir.
Bu yöntem uyarınca, gelişimsel görevlerle ilgili puan aralıklarına karşılık gelen yaş aralıklarının ortalama ve standart puanları kullanılarak alt test norm tabloları oluşturulmuştur (Tablo 2).
Norm tabloları okunurken, soldan sağa doğru, ilk sütunda aylara göre gelişimsel yaş dönemleri bulunmaktadır. İkinci sütunda, bu yaş dönemlerinin ilgili alt testte hangi standart puan aralığına karşılık geldiği verilmektedir. Üçüncü sütunda, örneklemin bu puan aralığına karşılık gelen ay:gün cinsinden yaş aralıkları yer almaktadır. Son olarak dördüncü sütunda yaş aralıkları doğrudan gün cinsinden verilmektedir. Buna göre, Türkiye örnekleminde hangi yaş aralıkların hangi standart puana ve bu puanın hangi gelişimsel yaş dönemine karşılık geldiği izlenebilmektedir.
Alt test normlarının yanısıra toplam puan tablosu da hazırlanmıştır (Tablo 3). Toplam puan tablosu, global norm tablosu olarak okunmaya uygundur. Başka bir deyişle toplam puan tablosu, tek tek alt testlere göre değil de ölçeğin tümüne göre değerlendirme yapmak amacıyla kullanılabilir. Öte yandan örneklemin büyüklüğü, toplam puanın en çok 30 puan dilimine ayrılmasına izin vermektedir. Bu nedenle, toplam puana genel bir fikir edinmek amacıyla başvurulması daha uygundur; bütüncül gelişimsel kararlar açısından ise toplam puanın alt-test normlarıyla birlikte kullanılması daha uygundur.
Alt test puanları ve toplam puanın cinsiyete göre fark gösterip göstermediği t testi ile incelenmiş ve anlamlı cinsiyet farkı bulunmamıştır. Dolayısıyla kızlar ve erkekler için farklı norm tabloları gereksinimi oluşmamıştır.
Güvenirlik
Güvenirlik çalışmasının ilk aşamasında, her alt test için ayrı ayrı madde toplam bağıntı katsayıları hesaplanmıştır. Bu hesaplamalar sonucu alt test iç tutarlılık katsayılarının oldukça yüksek olduğu gözlenmiştir. Duruş, eşgüdüm, dil ve toplumsallık alt testlerine göre Cronbach alfa, sırasıyla 0,98; 0,98; 0,95; ve 0,95 olarak belirlenmiştir.
Daha sonra ölçeğin tümü ele alınarak madde toplam bağıntı katsayıları hesaplanmıştır. Tüm ölçeğe ilişkin alfa 0,99 olarak gözlenmiştir.
İzleyen aşamada, her alt test için her gelişimsel yaş dönemine ait madde toplam bağıntı katsayıları hesaplanmıştır. Bu tablodan da (Tablo 4) görüleceği gibi yaş dönemlerine ait güvenirlik katsayıları da yüksek düzeyde anlamlıdır.
Cronbach alfa değerleri ve bağıntı katsayıları, ölçeğin yüksek iç tutarlılığa sahip olduğunu göstermektedir.
Geçerlik
Ölçeğin yapı geçerliği çalışması, birbirinin tamamlayıcısı olması hedeflenen, simetrik irdeleme yaklaşımıyla, iki aşamada yapılmıştır. Birinci aşamada, önce alt test puanlarının ve toplam puanın gelişimsel yaş aralıklarını yordama düzeyi irdelenmiştir. İkinci aşamada ise alt test puanları ve toplam puanın, gelişimsel yaş dönemlerini, birbirlerinden ayrıştırılabilir gruplara ayırma gücü sınanmıştır.
Alt test puanlarının ve toplam puanın gelişimsel yaş aralıklarını yordama düzeyini belirlemek için, her bir alt test için bebeğin bulunduğu gelişimsel yaş aralığı bağımlı değişken kabul edilerek beş doğrusal regresyon örneği kurulmuştur. Analizler, tüm örneklerin yüksek açıklayıcılığa (R2>0,94) ve yüksek düzeyde anlamlılığa  (p<0,001)  sahip olduğunu ortaya çıkarmaktadır.
Alt test puanları ve toplam puanın, tüm örneklemi gelişimsel yaş dönemlerini ayırma gücü diskriminan fonksiyon analiziyle sınanmıştır. Grup (her bir yaş dönemi) varyanslarının eşit olup olmadığını, diğer bir deyişle analizin geçerli bir analiz olup olmadığını test eden Box’ın M testine göre analizin geçerli olduğu anlaşılmıştır (Box M=521,883; F (45, 73171,417) = 11,140; p<0,01).
Diskriminan fonksiyon analizi sonucunda beş fonksiyon türetilmiştir. Bunlardan ilk ikisi anlamlı bulunmuştur. Bu iki fonksiyon yaş dönemlerinin ayrışmasına ilişkin varyansın %99,8’ini açıklamaktadır. Açıklanan varyans yüzdesi, ölçeğin gelişimsel yaş gruplarını birbirinden ayırma gücünün yüksek olduğunu göstermektedir. Diğer bir deyişle ölçek, ayırması beklenen yaş gruplarını, yaş gruplarının test edildiği gelişimsel görevlerin yarattığı varyans cinsinden başarıyla ayırmaktadır. Bu ise ölçeğin elde etmeyi amaçladığı sonuca yapısal olarak ulaştığının açık bir göstergesidir. Fonksiyonlara ilişkin Wilk A değerleri ve diğer katsayılar Tablo 5’te verilmiştir.
Diğer yandan, diskriminan fonksiyon analizinin her bir yaş grubunu diğerinden ayırma yüzdesi 58,5 olarak saptanmıştır. Başka bir deyişle örneklemi oluşturan yaş grupları, yaş gruplarının test edildiği gelişimsel görevler açısından %58,5 oranında doğru olarak sınıflandırılmıştır (Tablo 6).
Düzleme işlemi, her yaş grubuna, bir önceki ve bir sonraki komşusuna dağılmış oranların toplamının yarısı kadar bir değer eklenmesiyle yapılmıştır. Bu yöntem, önceki ve sonraki komşulara dağılmış oranların ikisinin birden ya da sadece birinin seçilmesi halinde oluşabilecek yanlılığı önlemek amacıyla uygulanmıştır. Başka bir deyişle, her yaş grubuna, kendi oranına komşu oranların ortalaması tayin edilmiştir.
Düzleme işlemine göre yaş gruplarının, doğru sınıflandırılma oranları Tablo 7’de verilmiştir. Bu işleme göre tüm yaş gruplarının ortalama doğru sınıflandırılma oranı 76,5 olarak ortaya çıkmaktadır. Bu oran normların bütün oluşturmasıyla ve açıklanan varyans büyüklüğüyle uyumludur.

Tartışma

Çocukların 2-30 ay arasındaki ruhsal ve devinsel gelişimini ölçen bir gelişim testi olan BL-R ölçeğinin Türk çocukları için standardizasyonunu hedefleyen bu çalışmanın ilk aşamasında test kitapçığının uygulama yöntemleri ve yönergeleri Türkçe’ye çevrilmiştir. Uygulamalar sonrasında uygulayıcılarla yapılan değerlendirmelerde, gerek uygulayıcılara yönelik yönergelerin, gerekse anne babalara sorulan soruların yeterince anlaşılır olduğu ve ek açıklamalara gerek bırakmadığı sonucuna varılmıştır.
Standardizasyon çalışmalarında en önemli noktalardan biri örneklem grubunun büyüklüğü ve genel toplumu temsil edebilirlik özelliğidir. Bu çalışmadaki örneklem ülke nüfusunun 1/5’ni barındıran İstanbul kentinde oluşturulmuştur. Bir kentin nüfusundan elde edilen örneklemin tüm ülke genelini temsil edebilme özelliğinin zayıf olabileceği düşünülebilirse de, İstanbul kentinin yoğun göç alan bir metropol olması nedeniyle çok farklı sosyoekonomik ve sosyokültürel katmandan insan barındırması temsil edebilirlik özelliğini arttırmaktadır. Öte yandan örneklemin temsil edebilirliğini arttırmak için de Cerrahpaşa Tıp Fakültesi Çocuk Sağlığı ve Hastalıkları Anabilim Dalı Sağlam Çocuk Polikliniği, Bakırköy Devlet Hastanesi Sağlam Çocuk Polikliniği, Cerrahpaşa Tıp Fakültesi Çocuk Yuvası ve İstanbul Tıp Fakültesi Çocuk Yuvası gibi farklı birimlerde çalışılmıştır. Örneklemin 2-30 ay arasındaki çocuklardan oluşması gerekliliği deneklerin toplanabileceği en önemli kaynak olan öğretim kurumlarının devre dışı kalmasına neden olmuş ve araştırmacıları Sağlam Çocuk Polikliniklerine ve küçük çocuk kabul eden kurum yuvalarına yöneltmiştir.
Standardizasyonun amaçlarından biri de uyarlanacağı toplumdaki geçerli normları belirlemek olduğu için örneklemi oluşturacak bireylerden, değerlendirmeyi olanaksız kılabilecek özellikler sergileyenler (görsel, işitsel ya da devinsel özür, beslenme bozukluğu, ağır gelişim geriliği) ya da farklı gelişim gösterebilecek ikizlik gibi durumları sergileyenler çalışma dışında bırakılmıştır. Buna karşılık erken ve geç doğmuş denekler çalışmaya alınmış, ancak aynı kaygılarla değerlendirme dışında bırakılmıştır. Deneklerin Sağlam Çocuk Polikiniklerinden ve Çocuk Yuvalarından toplanması tıbbi geçmişleri konusunda yeterli bilgi sahibi olma üstünlüğü sağlamıştır.
Diskriminan fonksiyon analizinin her bir yaş grubunu diğerinden ayırma, ölçeğin doğru sınıflama gücünün şans düzeyinin üstünde olduğunu göstermekle beraber analizin açıkladığı varyansın büyüklüğüyle uyumu beklenen düzeyde değildir. Dolayısıyla doğru sınıflandırma oranının gerçekte daha yüksek olup olmadığı araştırılmıştır. Elde edilen doğru sınıflandırma oranın global bir oran olduğu düşünüldüğünde ve ayırt edilen yaş gruplarının ayırt edilme sınırları araştırıldığında daha yüksek bir sınıflandırma oranına ulaşmanın mümkün olup olmadığı araştırılmıştır. Tüm yaş gruplarında, sınıflandırılma oranları büyük ölçüde hemen önceki ve hemen sonraki komşu yaş gruplarına dağılmıştır ve bunun ötesinde sınıflandırılmanın şansa bağlı olduğunu gösterecek dağınık bir dağılım gözlenmemektedir.
Buna ek olarak, yaş gruplarının birer ay arayla sıralandığı iki aydan 10 aya dek tüm ayların doğru sınıflandırılma oranları (dört ve dokuz ay grupları dışında) global oranın oldukça üzerindedir. Bu aylar ortalama olarak %65,9 oranında doğru sınıflandırılmıştır. Yaş grupları arasında, giderek artan aralıklarla birer aydan daha fazla aralık bulunan 12-30 ay kısmında ise 24 ay grubu dışındaki yaş gruplarının doğru sınıflandırılma oranı ortalamadan düşüktür. Bu kısmın ortalama doğru sınıflandırma oranı %52’dir. Dolayısıyla, açıklanan varyansın büyüklüğü %99,8 olduğu halde doğru sınıflama yüzdesinin 58,5 gibi bir değerde kalmasının birinci kısımdan çok ikinci kısımdaki sınıflandırma yüzdelerinin düşüklüğü nedeniyle oluştuğu anlaşılmaktadır.
Bu durum, ikinci kısımdaki doğru sınıflama yüzdesinin, yaş gruplarının birer aydan daha fazla aralıkla sıralanması nedeniyle düşük kalmış olabileceğini göstermektedir. İkinci kısımdaki her bir yaş grubuna ait sınıflandırılma yüzdesi, kendisine komşu yaş grubundan daha yakın yaş gruplarının puanlarından etkilenmiş olabilir. Diğer bir deyişle, komşu yaş grupları birer aydan daha fazla aralıkla belirlendiği için bu oranlar, sıralanmayan aylara ait sınıflandırılma yüzdelerini paylaşıyor ve bu nedenle oranları düşük kalıyor olabilir.
Bu değerlendirmeler komşu yaş gruplarına düşen sınıflandırılma oranlarının yaş gruplarının kendilerine ait sınıflandırılma oranlarına eklenerek daha yüksek oranlar elde etmeyi sağlayacak bir düzleme (smoothing) işlemine izin vermektedir. Düzleme işleminin geçerli bir işlem olduğunu destekleyen en önemli veri yine Tablo 6’dan izlenebilir. Komşularına dağılmış sınıflandırılma oranları kendilerine katılan yaş grupları, komşularının kendilerine ait oranlarını tehdit etmemektedir. Başka bir deyişle, düzleme işlemi, ilgili yaş grubuna daha yüksek bir oran tayin ederken bu oranı komşularından çalmamaktadır.
İşlemin geçerliliğine ilişkin ikinci bir tür veri ise norm tablolarından izlenebilir. Düzleme işlemine ihtiyaç duyulan yaş gruplarının ayırt edilme sınırları ile norm tablosunda bu yaş gruplarını oluşturan alt yaş grupların oluşma sınırları birbiriyle uyumludur. Diğer bir deyişle, doğru sınıflandırılma oranı ortalama sınıflandırılma oranından düşük yaş grupları aynı zamanda norm tablosuna göre az sayıda ve sıkışık alt-yaş gruplarının oluşturduğu yaş gruplarıdır. Bu yaş grupları farklı alt testlerde değişen miktarlarda sıkışma göstermektedir. Bu nedenle doğru sınıflandırma oranları, bu farklılıklardan da etkileniyor olabilir. Tüm bu özellikler göz önüne alındığında bu yaş gruplarına ilişkin sınıflandırılma oranlarının komşu yaşlara dağılmış görünmesi olağandır.
Tüm bu sonuçlar, BL-R ölçeğinin, bazı aylardaki seçicilik ve tutarlılığının düşük olmasına karşılık genelinde 2-30 aylar arasındaki çocukların gelişim düzeylerinin belirlenmesinde kullanılabilecek geçerlilik ve güvenirliğe sahip olduğunu göstermektedir. Son olarak ölçeğin geçerliğine ilişkin veriler arasına, ölçüt bağımlı geçerlik bilgilerinin eklenmesinin yararlı olacağını vurgulamak gerekir. Bu çalışmanın izleyen aşamalarında, eldeki veriler en iyi şekilde değerlendirilerek ölçeğin ölçüt bağımlı geçerliği de sunulacaktır.

Yazışma Adresi/Address for Correspondence: Dr. Levent Kayaalp, İstanbul Üniversitesi Cerrahpaşa Tıp Fakültesi, Çocuk Ruh Sağlığı ve Hastalıkları Anabilim Dalı, 34098, İstanbul, Türkiye Faks: +90 212 414 31 45  E-posta: kayaalp@istanbul.edu.tr - leventkayaalp@superonline.com Geliş Tarihi/Received: 16.100.2009 Kabul Tarihi/Accepted: 29.03.2010 - DOI: 10.4274/tpa.45.86

Kaynaklar

1. Binet A. A propos de la mesure de l’intelligence. Année Psychologique 1905; 11: 69.
2. Brooks J, Weinraub M. A history of infant intelligence testing. In: Lewis M (ed).  Origins  of  Intelligence: Infancy and Early Childhood. New York: Plenum, 1976:19-58.
3. Gesell A. Mental growth in the preschool child. New York, Macmillan, 1925.
4. Bayley N. Mental growth during the first three years. Genet Psychol Monogr 1933; 14: 1-92.
5. Bayley N. The development of the abilities during the first three years. Monogr Soc Res Child Dev 1935; 1: 1-26.
6. Buhler C, Hetzer H. Testing children’s development from birth to school age. New York, Farrar&Rinehart, 1935.
7. Brunet O. Baby- tests, une échelle de développement psychomoteur pour les enfants du premier âge. Enfance 1948; 3: 250-5.
8. Brunet  O. Baby-tests. Enfance 1948; 4; 361-6.
9. Brunet O, Lézine I. Le développement psychologique de la première enfance. Paris, PUF, 1951.
10. Öner N. Brunet Lézine Testi. İçinde: Türkiye’de kullanılan psikolojik testler: Bir başvuru kaynağı. İstanbul: Boğaziçi Üniversitesi matbaası, 1994: 161-2.
11. Campbell SK, Siegel E, Parr A, Ramey CT. Evidence for the need to renorm the Bayley Scales of Infant Development based on  the performance of a population based sample of 12 months-old-infants. Topics in Early Childhood Special Education 1986; 6: 83-96.
12. Hanson R, Aldridgesmith J, Hume W. Achievements of infants on items of the Griffiths scales: 1980 compared with 1950. Child Care and Health Dev 1985; 11: 91-104.
13. Flynn JR. Massive IQ gains in 14 nations. What IQ tests really measure ? Psychological Bulletin 1987; 101: 171-91.
14. Knobloch H, Stevens F, Malone AF. Manual of developmental diagnosis. The administration and interpretation of the revised Gesell and Amatruda developmental and neurological  examination. Hagerstown, Harper and Row 1987.
15. Bayley N. Bayley Scales of Infant Development. Second Edition. New York, Psychological Corporation,  1993.
16. Josse D. Brunet-Lézine Revisée, Echelle de développement psychomoteur de la première enfance. Editions et Applications Psychologiques. Issy-Les-Moulineaux, 1997.

[Özet] [PDF]
Yazının başına dön
Ziyaretçi Sayısı : 1007939
Aktif 31 kişi