5. 1. Merkezi Eğilim Ölçüleri
Merkezi eğilim ölçüleri bir seri hakkında bilgi edinmemizi ve çeşitli kıyaslamalar yapmamıza olanak sağlayan ölçütlerdir. Verilerin daha çok hangi değerlere eğilimli olduklarını bulmak için merkezi eğilim ölçülerini kullanırız. Bu ölçüler analitik olan (duyarlı) ve analitik olmayan (duyarsız) ortalamalardır. Analitik ortalamalar; aritmetik ortalama, tartılı ortalama, kareli ortalama, harmonik ortalama ve geometrik ortalamadır. Analitik olmayan ortalamalar ise mod, medyan ve kartillerdir.
5.1.1. Analitik (Duyarlı) Ortalamalar
Analitik ortalamalara “duyarlı” denmesinin nedeni; veri kümesindeki tüm gözlem birimlerini hesaba katmasıdır. Bu hesaplama yöntemi, özellikle uç değerler (uç değer bir diğer ifade ile sapan değer, serideki değerlerden çok farklı olan değerlerdir) söz konusu olduğunda ortalamayı uç değerlere doğru çekerek doğru tahmin yapmayı zorlaştırırlar. Bu tip durumlarda ya uç değerler hesaplamadan dışlanır, ya da analitik olmayan ortalama türlerinden faydalanılır. Bu duruma en güzel örnek, bir sınıfın ortalama notunu hesaplarken en yüksek ve en düşük değerin dışlanarak hesaba alınmamasıdır.
Örneğin örneklemimiz aşağıdaki gibi olsun ve yukarıdaki duyarlı olma durumunu aritmetik ortalamayı kullanarak basitçe anlatmaya çalışalım:
Bu örneklemin aritmetik ortalaması tüm değerlerin toplamının gözlem sayısı n’e bölünmesiyle 34,2 olarak hesaplanır. Ortalamaların taşıması gereken en önemli özellik, gözlemleri iyi bir şekilde temsil etmesidir (ortalama aslında serinin tek bir rakamla özetlenmesidir) ve bulduğumuz bu değer örneklemdeki değerleri iyi kötü temsil etmektedir.
Şimdi örnekleme bir uç değer ekleyelim, yeni örneklemimiz şöyle olsun:
Bu örneklemin aritmetik ortalaması 195,166’dır. Görüldüğü gibi uç değer ortalamayı kendine doğru çekmiş, bu durum ne küçük gözlemleri ne de uç değeri temsil edebilecek bir ortalamanın hesaplanmasına neden olmuştur. İşte böyle durumlarda, tüm gözlemleri hesaba katmayan analitik olmayan yani bir diğer adıyla duyarsız ortalamalar tercih edilmelidir.
5.1.1.1. Aritmetik Ortalama (,)
Örneklemde , kitlede ile gösterilir. Veri kümesindeki tüm gözlemlerin toplamının toplam gözlem sayısına bölümüdür.
Basit seride:
Sıklık serisinde:
Sınıflanmış seride:
k, sınıf sayısıdır. mi ise i. sınıfın orta noktasıdır (mid point)
Kitlede Gösterimi:
Örnek:
Aşağıda bir öğrencinin 5 dersten aldığı notlar verilmiştir. =?
4,5,7,8,10
=6.8
Örnek:
Bir kavşakta bir ayda meydana gelen trafik kazalarının dağılımı aşağıdaki gibidir. Günlük ortalama kaza sayısını hesaplayınız.
30
=1,1
Günlük ortalama kaza sayısı yaklaşık olarak 1’dir.
Örnek:
Aşağıdaki serinin aritmetik ortalamasını hesaplayınız.
15 58
Sınıf orta noktaları sınıfın alt sınır ile üst sınırının ortalamasıdır, yani ikiye bölümüdür. m1 = (1+3)/2= 2 v.b.
Burada biraz duralım, sınıfları tek tek ele alalım. İlk sınıfımız 1-3 aralığıdır ve bu aralıkta 4 gözlem vardır. Fakat biz bu 4 değerin tam olarak ne olduklarını bilmiyoruz, sadece [1,3) aralığında olduğunu biliyoruz değil mi? O halde standart bir ortalama bulabilmek için hepimizin ortak bir yaklaşım sergilemesi gerekir. Yani şunu anlatmak istiyoruz, diyelim ki Ali’ye göre X1= 1, X2= 1.2, X3=2.8, X4=2.9 olsun. İkinci sınıftaki değerleri de şöyle olsun; X5= 3.1, X6= 4, X7= 4.1, X8= 4.3, X9= 4.4, X10= 4.6, X11= 4.8, X12= 4.9 olsun. Son sınıftakiler de şöyle olsun; X13= 5.2, X14= 5.9, X15= 6.8
Şimdi Ali’nin serisinin ortalaması tüm bu değerlerin toplamının toplam gözlem sayısına yani 15’e bölümüdür. Ali’nin serisini açıkça bir daha yazalım:
Ortalamayı bulalım:
= 60/15=4
Umut’un serisi de şöyle olsun:
Bu ortalamayı bulalım:
= 61,1/15=4.0733333 ̴ 4.073 bulduk.
Demek ki herkes bu aralıkta sonsuz tane değer ataması yapabilir ve bunun sonucunda da herkesin bulacağı ortalama değeri farklı olacaktır. İşte bu durumun önüne geçebilmek için sınıf orta noktalarını yani mi’leri Xi gibi düşünüyoruz, yani sanki o değerlerin hepsi sınıf orta değerini alıyormuş gibi varsayıyoruz, aksi halde aynı ortalama değerini bulamayız ve herkes kendine göre bir değer bulur.
Sınıflanmış serinin basit seri hali şöyledir:
Ortalamayı bulalım;
=3,8666666 ̴ 3,867
Aritmetik Ortalamanın Özellikleri
1. En çok bilinen ve en sık kullanılan ortalamadır. Her türlü veride hesaplanabilir ve tek bir değer alır. Sıfır içeren serilerde harmonik ortalama hesaplanamaz, geometrik ortalama hesaplanabilir ama anlamsız olur. Seride negatif değer var ise, geometrik ortalama hesaplanamaz. Bazı serilerde birden fazla sayıda mod bulunabilir. Ancak aritmetik ortalama her türlü veri seti için hesaplanabilir ve tek bir tanedir.
2. duyarlı bir ortalamadır. Çünkü bütün verileri hesaba alır. Extrem (uç, outlier) değerler olduğunda bu değerlerden etkilenmesi, aritmetik ortalamanın zayıf yönüdür. Böyle durumlarda yerine, duyarsız ortala da denilen, sıralamaya dayanan ve uç değerlerden etkilenmeyen medyan tercih edilebilir.
3. Bir seride ’dan sapmaların toplamı sıfırdır.
4. Açık uçlu dağılımlarda hesaplanamaz. Açık uçlu dağılıma bir örnek verelim:
15
Son sınıfın üst sınırı açık bırakılmış, yani oradaki değerin ne olduğu bilinmeden sınıf ortası bulunamayacağı için aritmetik ortalama da hesaplanamaz. Sınıf genişlikleri eşit olmak zorunda değildir, yani biz kendiliğimizden oranın “7” olduğunu iddia edemeyiz.
5.1.1.2. Tartılı Ortalama (Ağırlıklı Ortalama)
Bazen veride yer alan bazı gözlemlere diğerlerinden daha fazla önem verilir. Böyle durumlarda ortalama hesaplanırken bu özel değerlere verilen önemi yansıtmak için belirli tartılar tahsis edilir.
Örnek: İstatistik dersine ilişkin vize notunun ağırlığı finalin üçte biri olsun. Öğrenci vizeden 80, finalden 60 almış ise, bu öğrencinin başarı notu tartılı aritmetik ortalama ile hesaplanır. Tartılı aritmetik ortalamanın formülü şöyledir:
Örneğimize dönersek;
t1=1 vizenin tartısı
t2=3 finalin tartısı (bir anlamda önemi)
Örnek: Aşağıdaki tabloda bir öğrencinin ders notları ve derslerin ağırlıkları yer almaktadır (yani her ders aynı öneme sahip değildir) öğrencinin not ortalamasını hesaplayınız.
Ders | Ağırlık | Puan | Ağırlıklı Puan |
Fizik | 2 | 70 | 140 |
Kimya | 2 | 80 | 160 |
Matematik | 2 | 85 | 170 |
Türkçe | 1 | 90 | 90 |
Tarih | 1 | 65 | 65 |
= (140 + 160 + 170 + 90 + 65) /(2 + 2 + 2 + 1 + 1) = 625/8= 78.125 ‘tir.
Normal ortalaması (yani her dersin eşit öneme sahip olduğu durumda);
= (70+80+85+90+65)/ 5= 390/5=78’dir.
5.1.1.3. Kareli Ortalama
Kareli ortalama serideki değerlerin karelerinin toplamının gözlem sayısına bölünerek karekökünün alınmasıyla hesaplanır.
Basit Seride:
KO=
Sıklık Serisinde:
KO=
Sınıflanmış Seride:
KO=
Örnek: Aşağıdaki serinin kareli ortalamasını hesaplayınız.
KO= = = 4.09878 ̴ 4.099
5.1.1.4. Geometrik Ortalama
Geometrik ortalama tüm verileri hesaba katan duyarlı bir ortalamadır. Genellikle oransal olarak artan serilerde bu artışı düzlemek (smooth etmek) amacıyla tercih edilir. Tüm gözlemlerin çarpılarak, gözlem sayısı kadar dereceden kök alınmasıyla hesaplanır.
Geometrik Ortalama ≤ Aritmetik Ortalama
X1, X2,…..Xn veri kümesinin geometrik ortalaması;
Basit seride:
Sıklık serisinde:
Sınıflanmış seride:
Örnek: Aşağıdaki serinin geometrik ortalamasını bulunuz.
Xi
4
5
7
8
16
= 7.09
logXi
0,602
0,699
0,845
0,903
1,204
Örnek: Aşağıdaki sıklık serisinin geometrik ortalamasını hesaplayınız.
=5,255/10=0,5255
GO=100,5255=3,35
Örnek: Aşağıdaki sınıflanmış serinin geometrik ortalamasını hesaplayınız.
=5,821
GO=100,5821=3,82
5.1.1.5. Harmonik Ortalama
Oransal olarak belirtilebilen değişkenlerin ortalamalarının hesaplanmasında harmonik ortalama kullanılır. Sıfır değerli ya da negatif işaretli değişkenler olduğunda hesaplanamaz.
Basit seride:
Sıklık serisinde:
Sınıflanmış seride:
Örnek:
Örnek: Harmonik ortalamasını hesaplayınız.
HO=10/3,22=3,11
Örnek: Harmonik ortalamasını hesaplayınız.
HO=10/2,92=3,42
5.1.2. Analitik Olmayan (Duyarsız) Ortalama
Analitik olmayan ortalamalara “duyarsız” denmesinin nedeni, özellikle uç değerlerin olduğu durumlarda bu gibi değerleri göz ardı etmesi, tüm gözlemleri hesaba almaması ve sıralamaya dayanmasından kaynaklanmaktadır. Bu sıralamanın ne anlama geldiğini ilerideki sayfalarda göreceğiz.
Comments