Giriş
İstatistik I dersinde olasılık dağılımının tanımı, kesikli rastlantı değişkeninin olasılık dağılımlar; Binom, Poisson, Hipergeometrik vs. dağılımlar konularına yer verilmişti. Bu derste ise rastlantı değişkeninin sürekli olması hali ele alınacak ve özel bir olasılık dağılımı olan normal dağılım anlatılacaktır.
12.1. Sürekli Dağılımlar
Sürekli rastlantı değişkenlerinin(r.d.) alacağı değerler, belirli bir aralıkta yer alır. Örneğin X rastlantı değişkeninin a ve b gibi iki değer arasında bulunması olasılığı P(a≤X≤b) şeklinde ifade edilir.
Olasılık yoğunluk fonksiyonu f(x) ile gösterilir, kesikli olmayan (sürekli) bir eğridir. f(x)’in altında kalan alan X rastlantı değişkeninin olasılıklarını verir.
Sürekli rastlantı değişkenleri söz konusu olduğunda ’dir. Eşitlikler dahil olsa da olmasa da sonuç değişmez. Çünkü söz konusu bir aralıktır ve sonsuz değer içermektedir. Halbuki kesikli rd lerde eşitliklerin dahil olmaması olasılığı doğrudan değiştirebilmektedir ve eşitliklerin dahil olup olmaması önemlidir. Sürekli rd’lerde olasılıklar bir alana tekabül etmekte olduğundan, eşitliklerin dahil olup olmaması olasılığı değiştirmez. Bu durumu şu şekilde açıklayabiliriz. Aşağıda gördüğünüz iki karenin alanı birbiriyle aynıdır ve eşittir:
Kesikli rd lerde olasılıklar toplanırken, sürekli rd’lerde olasılıklar alan hesaplayarak bulunur. Belirli bir aralıktaki olasılık değeri ise bir alana tekabül etmektedir ve söz konusu aralıkta belirli integralin hesaplanmasıyla bulunur.
12.2. Sürekli Bir Fonksiyonun Olasılık Yoğunluk Fonksiyonu Olabilmesi İçin Gerekli Şartlar
1) için f(xi)~[0,1] , Yani X rd’nin alacağı her bir x değerini alma olasılığı [0,1] aralığında olmak zorundadır. Zaten, olasılığın tanımından da bilindiği üzere, hiçbir olayın olasılığı negatif bir sayı veya 1’den büyük bir sayı olamaz.
2) ’dir. Yani f(x)’in tanım aralığındaki toplam olasılık yani f(x) eğrisinin altında kalan alan 1’e eşittir.
12.3. Normal Dağılım
İstatistikte sürekli dağılım denildiğinde ilk akla gelen en temel sürekli dağılım “normal dağılım”dır. Normal dağılım çan eğrisi biçimindedir.
µ normal dağılımın ortalamasıdır. Eğriyi iki eşit parçaya bölmektedir. Eğrinin altındaki toplam alan 1’e eşit olmak üzere, µ’nün sağındaki ve solundaki alanlar birbirine eşit ve 0.5’tir.Normal dağılım simetrik bir yapıya sahiptir. Yani çarpıklık sıfırdır. Normal dağılımda; ’dur. Basıklığı ise idealdir, yani 4.moment ile hesaplanan . Zaten diğer dağılımların basıklıkları değerlendirilirken, basık veya sivrilik durumlarına normal dağılım ile kıyaslama yapılarak karar verilir. Şayet α4<3 ise dağılım normalden basık, α4>3 ise normalden daha sivri bir dağılım olduğu söylenir.
Verilerin ortalama dolayındaki dağılımları aşağıdaki gibidir:
Verilerin %68.2’si (bu değer 2*34.1’den elde edilmiştir) ortalamanın 1 standart sapma dolayında bulunur. %95.4’ü (bu değer 2*47.7’den elde edilmiştir) ortalamanın 2 standart sapma dolayında bulunur. %99.6’sı (bu değer 2*49.8’den elde edilmiştir) ortalamanın 3 standart sapma dolayında bulunur.
12.3.1. Normal Dağılımın Olasılık Yoğunluk Fonksiyonu
Burada e=2.718, π=3.14, σ: standart sapmadır.
Dağılımların yayılımları (değişimleri) standart sapma yani σ ile belirlenir. Aşağıdaki şekilde farklı varyanslara sahip normal dağılımlar görülmektedir:
veya daha açık bir şekilde ifade edersek, ortalaması aynı fakat varyansları farklı normal dağılım eğrilerinin grafiklerine bakalım:
X sürekli rd’nin olasılığını bulmak demek, verilen aralıkta belirli integral almaktır demiştik.
Örneğin P(2<X<5)= ’tir. Bu olasılık değerinin hesaplanması mümkün olmakla birlikte, bizi oldukça karışık ve alınması zor integrallerle karşı karşıya bırakmaktadır. Ancak olasılıklar bu integraller alınmadan da hesaplanabilmektedir. Bunu sağlayan ise “standart normal dağılım” dır.
Normal dağılımın standart hale getirilmesiyle yani normal dağılan X rd’nin standardize edilmesiyle standart normal dağılım bulunmuştur. z standart normal değişken, normal dağılan X rd’nin ortalamasından saptırılarak standart sapmasına bölünmesiyle elde edilmektedir. Standart normal dağılım, normal dağılımla aynı özelliklere sahiptir, ancak, ortalaması sıfır, varyansı 1’dir.
X~Normal(µ,σ2) iken; yapılan dönüşümüyle elde edilen z standart değişkeni; z~Standart Normal(0,1) dağılmaktadır. Standart normal dağılımın olasılık yoğunluk fonksiyonu aşağıdaki gibidir:
f(z) o.y.f., f(x) normal o.y.f’da µ=0, σ=1 konularak elde edilmiştir. Bu dönüşüm sayesinde artık olasılıkların bulunması son derece kolaylaşmıştır. X’ten z’ye dönüşüm yapılarak X’in çeşitli değerleri için son derece basit hale gelen integrallerin alınmasıyla z tablosu oluşturulmuştur. Aşağıda X rd ve z std. değişkenine ilişkin o.y.f. ları görülmektedir:
Örnek 1.1: X~Normal(1,4) olmak üzere, P(2<X<3)=?
1.çözüm:
2.çözüm:
P(2<X<3)= =P(0.5<z<1) yani; standart normal dağılım eğrisinin altında (0.5,1) arasındaki alandır. Bu durum aşağıda görülmektedir:
z tablosuna bakıldığında (0,0.5) arasındaki alanın büyüklüğü yani P(0<x< 0.5)=0.1915’tir. P(0<x<1)=0.3413’tür. O halde P(0.5<x<1) olasılığını bulmak için P(0<x<1)’den P(0<x< 0.5) çıkarılmalıdır.
P(0.5<x<1)=0.3413-0.1915=0.1498
12.4. Z Tablosunun (Normal Dağılım Tablosu) Özellikleri Ve Okunuşu
Z tablosu, X rd nin çeşitli değerleri için hesaplanan belirli integrallerden oluşan bir sayılar tablosudur. Tablonun en başında şöyle bir şekil vardır:
Bu şekil, z tablosundaki değerlerin 0 ile z arasındaki alana karşılık geldiği anlamına gelmektedir. ve tablo sayılarla şu şekilde devam eder:
z | 0.00 | 0.01 | 0.02 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 |
0.0 | 0.0000 | 0.0040 | 0.0080 | 0.0120 | 0.0160 | 0.0199 | 0.0239 | 0.0279 | 0.0319 | 0.0359 |
0.1 | 0.0398 | 0.0438 | 0.0478 | … | … | … | … | … | … | 0.0753 |
0.2 | 0.0793 | … | … | … | … | … | … | … | … | 0.1141 |
0.3 | 0.1179 | … | … | … | … | … | … | … | … | … |
0.4 | … | … | … | … | … | … | … | … | … | … |
0.5 | … | … | … | … | … | … | … | … | … | … |
0.6 | … | … | … | … | … | … | … | … | … | … |
0.7 | … | … | … | … | … | … | … | … | … | … |
0.8 | … | … | … | … | … | … | … | … | … | … |
0.9 | … | … | … | … | … | … | … | … | … | 0.3389 |
1.0 | … | … | … | … | … | … | … | … | … | 0.3621 |
1.1 | … | … | … | … | … | … | … | … | … | 0.3830 |
1.2 | 0.3849 | 0.3869 | 0.3888 | 0.3907 | 0.3925 | 0.3944 | 0.3980 | 0.3997 | 0.4015 | |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
… | … | … | … | … | … | … | … | … | … | … |
2.5 | 0.4938 | 0.4940 | 0.4941 | … | … | … | … | … | … | 0.4952 |
2.6 | … | … | … | … | … | … | … | … | … | 0.4964 |
2.7 | … | … | … | … | … | … | … | … | … | 0.4974 |
2.8 | … | … | … | … | … | … | … | … | 0.4980 | 0.4981 |
2.9 | … | … | … | … | … | … | … | 0.4985 | 0.4986 | 0.4986 |
3.0 | 0.4987 | 0.4987 | 0.4987 | 0.4988 | 0.4988 | 0.4989 | 0.4989 | 0.4989 | 0.4990 | 0.4990 |
z tablosunu okurken, en soldaki sütun z’nin tam kısmını, en üst satır ,se ondalık kısmını göstermektedir. Örneğin z=1.26 değerine bakarken, en soldaki sütundan 1.2’yi bulup, 0.06’lık küsuratı en üst satırdan bularak, ikisinin kesiştiği yere bakacağız. Bulduğumuz bu değer, z tablosunun en başında görülen grafik uyarınca, z=0 ile z=1.26 arasındaki alandır. Yani P(0<z<1.26)=0.3962’dir.
Örnek 1.2 : P(-1.33<z<1.33)=?
Z tablosunda en soldaki sütundan 1.3’ü buluyoruz, en üst satırdan da küsuratı yani 0.03’ü buluyoruz, ikisinin kesiştiği yerdeki değer yani P(0<z<1.33)=0.4082 olarak buluyoruz. Fakat bize sorulan P(-1.33<z<1.33) olasılığıdır yani bizim bulduğumuz bu alanın iki katıdır, bu da 0.8164’tür.
Örnek 1.3: P(z>1.64)=?Z tablosunda en soldaki sütundan 1.6’yı buluyoruz, en üst satırdan da küsuratı yani 0.04’ü buluyoruz, ikisinin kesiştiği yerdeki değer yani P(0<z<1.64)=0.4495’tir. Fakat bize sorulan P(z>1.64) olasılığıdır yani bizim bulduğumuz bu alanı 0.5’ten çıkarmalıyız
Örnek 1.4: P(z>-0.74)=?
P(z>-0.74)=0.2704+0.5=0.7704
Örnek 1.5: P(│z│>1.96)=?
P(z<-1.96)+P(z>1.96) demektir.
P(│z│>1.96)= P(z<-1.96)+P(z>1.96)=2×0.025=0.05’tir.
Örnek 1.6: P(-3<z<-1)=?
P(-3<z<-1)=0.4987-0.3413=0.1574
Bu değer, 0 ile 3.0 arasındaki alandır yani P(0<z<3)=0.4987’dir.
Örnek 1.7: X~Normal(12,16) veriliyor. P(10<X≤20)=?
X rd’nin ortalaması 12, varyansı 16’dır. Bu olasılık aşağıdaki integralin alınmasıyla bulunur.
Fakat bu integrali almak zor olduğundan z tablosunu kullanacağız. Bunun için de öncelikle X leri z’lere dönüştüreceğiz.
Örnek1.8: X~Normal(100,225) veriliyor. P(80<X<120)=?
µ=100
σ=15
Örnek 1.9: X~Normal(27,9) veriliyor. P(X<20)=?
Örnek 1.10: P(z>a)=0.10 ise a=?
Z tablosuna bakarak 0.40 olasılığına denk gelen z değerini bulacağız. Tabloya bakıyoruz, fakat tamı tamına 0.40 değeri bulunmamakta. Böyle durumlarda 0.40’ı kapsayan en dar aralığı göz önüne alarak, interpolasyon denilen tekniği uygulamak suretiyle, 0.40’a denk gelen z tablo değerini kendimiz hesaplıyoruz. 0.40’ı kapsayan en dar aralık şöyledir:
İnterpolasyon şu şekilde uygulanır:
Bu denklemi çözünce, a’yı elde etmiş olacağız.
0.00192-0.0015a=0.0003a-0.000387’den, a=1.2816
Yani P(z>1.2816)=0.10’dur.
Örnek 1.11: P(z>a)=0.26 ise a=?
İnterpolasyon uyguladığımızda;
a=0.6433’tür.
P(z>64.33)=0.26
Bölüm Özeti
Bu bölümde normal dağılım ve standart normal dağılım, normal dağılım tablolarının okunması konuları öğrenildi.
Comments