AUZEF Dersler II.SINIF Olasılık-İstatistik Yönetim Bilişim Sistemleri-Management information Systems

6. ANALİTİK OLMAYAN (DUYARSIZ) ORTALAMALAR VE ÇARPIKLIK İNCELEMESİ

6.1. Analitik Olmayan (Duyarsız) Ortalamalar

Analitik olmayan ortalamalara “duyarsız” denmesinin sebebi, duyarlı ortalamalarda olduğu gibi bütün gözlemleri hesaba katmaması ve daha ziyade sıralamaya önem vermesindendir. Başlıca duyarsız ortalamalar medyan, moddur. Kartiller de bu kapsamda ele alınabilir, kartiller yani dörde bölenler (quartile) serinin eğilimini (verilerin hangi noktada yığılım yaptığını, v.b.) ölçmeye yarayan, sıralamaya dayanan duyarsız ölçümlerdir.

6.1.1 Medyan

Medyan, duyarsız bir ortalama türüdür. Sıralamayı esas alır. Bir seride küçükten büyüğe (ya da tersi) sıralanmış veriyi tam ortadan ikiye böler. Bu nedenle bazen “ortanca” olarak da adlandırılır. Tüm değerleri hesaba katan analitik ortalamalar, şayet veride extrem (uç) değerler varsa seriyi temsil kabiliyetlerini kaybederler. Aritmetik ortalamaya kıyasla daha tutarlı bir sonuç elde edilir. Açık sınıf aralıklı veri setlerinde merkezi eğilim ölçüsü olarak kullanılabilir. Her bir veri seti için bir tek medyan söz konusudur.

Örneğin;

serisinde medyan tam ortadaki değer yani “6” dır. Aritmetik ortalaması ise 18.71 olarak elde edilir ki bu değer serideki “100” verisinden dolayı ortalama şişmiş ve temsili olma özelliğini yitirmiştir. İşte duyarsız ortalamaların önemi böyle durumlarda ortaya çıkmaktadır.

Basit seride medyan bulurken önce gözlem sayısı n’e bakarız. Eğer n tekse, medyan . terimdir. Örneğin;

Veri kümesinde n=5, medyan 3. Terim yani X3=4’tür.

Şayet n çift sayı ise, medyan, . ile . terimin ortalamasıdır. Aslında kısaca medyan şöyle de hesaplanabilir; gözlem sayısı ister tek ister çift sayı olsun  . terim medyandır, yani seriyi ortadan ikiye bölen değerdir.

Örneğin;

Veri kümesinde n=4, medyan X2.5 ‘uncu terimdir yani X2 ile X3’ün ortalamasıdır. Bu serinin medyanı 2 ile 4’ün ortalaması yani 3’tür.

Örnek: Aşağıdaki sıklık serisinin medyanını hesaplayınız.

n=20, çift sayı, medyan X10.5’uncu terimdir yani X10 ile X11’in ortalamasıdır. Birikimli sıklık kolonuna bakıyoruz, X10 ile X11’i kapsayan değer “40” tır. Yani medyan 40’tır.

Medyan=X10.5 =(40+40)/2=40

Birikimli Sıklık Kolonu Nasıl Oluşturulur?

Sıklık kolonu yani fi ‘lerin yukarıdan aşağıya doğru toplanarak oluşturulan kolona birikimli sıklık kolonu denir. Özellikle medyan hesaplarken birim sayısı çok olduğunda seriyi açmak ve medyanı görmek kolay olmayacağından, birikimli sıklık kolonundan yararlanmaktayız. Aşağıdaki örneğe bakınız:

Bu seride medyan  =10.5’inci terim olduğuna göre bize X10 ve X11 lazım. Birikimli sıklık kolonuna bakarak bunların değerlerini tespit edip ortalamasını alacağız. X10 = 40 ve X11=40 olduğunu görüyoruz. Bu durumda medyan değerimiz 40’tır.

Seriyi açarsak daha iyi anlaşılacaktır:

Medyan=

Sınıflanmış seride medyan

Q2, medyanın “ikinci bölen” gösterimidir. Medyan da bir kartildir, bu gösterim oradan gelmektedir.

Formülde yer alan ifadelerin şu anlama gelmektedir:

L: medyan sınıfının alt sınırı (tam ortadaki terimi içeren sınıf medyan sınıfıdır)

c: sınıf genişliği

F: medyan sınıfından önceki sınıfların sıklıklarının toplamı (ya da bir diğer deyişle, medyan sınıfından bir önceki sınıfın birikimli sıklık değeri)

fmed: medyan sınıfının frekansı

Örnek: Medyanı hesaplayınız.

n=30, çift sayı, medyan X15.5 yani X15 ile X16’yı kapsayan sınıf medyan sınıfıdır. Bu durumda medyan sınıfı “2-4” sınıfıdır.

Örnek: Medyanı hesaplayınız.

n=50 çift sayı, X25 ile X26 yı kapsayan sınıf medyan sınıfıdır. Yani “12-17” sınıfı medyan sınıfıdır.

6.1.2. Mod

Seride en çok tekrarlanan değere “mod” denir. Duyarsız bir ortalamadır. Genellikle kategorik değişkenlerle ilgili (cinsiyet, meslek, v.b.) uygulamalarda tercih edilir. Bir de, serilerin asimetri durumlarını incelerken yığılmanın yönünü bulmada kullanılır.

Basit seride modun elde edilişi:

Seride en çok tekrar eden değer 13 olduğundan, Mod=13’tür.

Sıklık serisinde mod:

Sıklık serisinde mod bulurken yapacağımız şey, fi sıklık kolonuna bakarak en büyük değere karşılık gelen X değerini tespit etmektir.

Örnek:

Sınıflanmış seride modun bulunuşu:

Sınıflanmış seride mod aşağıdaki formül ile hesaplanır.

L: mod sınıfının alt sınırı

c: sınıf genişliği

: mod sınıfının sıklığı ile mod sınıfından bir önceki sınıfın sıklığının farkı

: mod sınıfının sıklığı ile mod sınıfından bir sonraki sınıfın sıklığının farkı

Örnek: Modu hesaplayınız.

6.1.3. Kartiller (Dörde Bölenler, Çeyrek Bölenler, Quartiles)

Küçükten büyüğe ya da büyükten küçüğe sırlanmış bir seriyi %25’ten bölen değer Q1 yani 1. Kartildir. %50’den (tam ortadan) bölen değer Q2 yani medyandır. Seriyi %75’ten bölen değer Q3 yani 3. kartildir.

Basit Seride Kartillerin Bulunuşu:

Örnek: Kartilleri hesaplayınız.

Q1 ,  = 2 . terimdir, yani küçükten büyüğe sıralı olarak verilen bu seriyi %25’ten bölen değer 5’tir. Q1 = 5’tir.

Q2 ,  = 4 . terimdir, yani küçükten büyüğe sıralı olarak verilen bu seriyi %50’den bölen değer 11’dir. Q2 = medyan = 11’dir.

Q3 ,3( ) = 6 . terimdir, yani küçükten büyüğe sıralı olarak verilen bu seriyi %75’ten bölen değer 20’dir. Q3 = 20’dir.

Örnek: Kartilleri hesaplayınız.

Uyarı!!! n çift sayı olduğunda kartilleri hesaplamak gerekir, n tek iken kartiller hemen seriden görülüp teşhis edilebilir, n çift olduğunda bulacağımız kartiller genellikle seride olmayan yani bizim hesapladığımız değerlerdir.

Q1 ,  = 1,75 . terimdir, yani küçükten büyüğe sıralı olarak verilen bu seriyi

Aradaki mesafeyi dörde bölüp ya üç parçayı X1’e ekleyerek, ya da bir parçayı X2’den çıkararak bulacağız. X2-X1= 8 – 5 = 3 birim diyelim, bu durumda bir parçanın uzunluğu 3/4 = 0.75’tir. O halde X1.25 = 5 + 0.75 = 5.75’tir. X1.5 = 5 + 0.75+0.75 = 6.5

X1.75 = 5+ 0.75 + 0.75 + 0.75 = 7.25’tir. Q1 yani birinci çeyrek 7.25’tir.

6.2. Serinin Asimetrisinin (çarpıklığının) “Aritmetik ortalama – Mod – Medyan” Kapsamında Açıklanması

Medyan, ortanca değer olduğundan, bu üç ortalama ele alındığında daima ortada yer alır. Aritmetik ortalama ve modun yer değiştirmesine bağlı olarak serinin çarpıklığı yorumlanır. Yani,

=medyan=mod ise seri simetriktir.

 medyan mod biçiminde bir sırlama var ise; yığılma sağdadır, seri sola çarpıktır.

Sırlama modmedyan biçiminde ise; yığılma soldadır, seri sağa çarpıktır.

Şekil.6. 1. Sola çarpık serinin grafiği ( medyan mod)

Yukarıdaki şekilde aritmetik ortalamanın yerini belirlemeye ihtiyaç yoktur. Çarpıklığın tespitinde modun medyana göre konumunun bilinmesi yeterlidir. Mod medyanın sağında ise, artimetik ortalama mecburen medyanın solunda yer alır ve seri sola çarpıktır.

Şekil.6. 2. Sağa çarpık serinin grafiği (modmedyan)

Yığılma soldaki değerlerde, seri sağa çarpıktır.

Şekil.6.3. Simetrik serinin grafiği (=medyan=mod)

Simetrik seride ortalama = medyan = mod’dur yani bu üç değer hepsi aynı yerdedir, çakışıktır.

Comments