Hipergeometrik Dağılım

  • Konbuyu başlatan Konbuyu başlatan Z1rT
  • Başlangıç tarihi Başlangıç tarihi
9
EXE RANK

Z1rT

Fexe Kullanıcısı
Puanları 0
Çözümler 0
Katılım
26 Kas 2009
Mesajlar
9,190
Tepkime puanı
0
Puanları
0
Yaş
33
Web sitesi
www.netbilgini.net
Z1rT
Olasılık kuramı ve istatistik bilim kollarında, hipergeometrik dağılım sonlu bir ana kütle içinden tekrar geri koymadan seri halinde birbiri arkasından n tane nesnelerin çekilmesi şeklinde bir işlem için başarı sayısının dağılımını bir ayrık olasılık dağılımı şekilde betimler. Bir tipik örnek, iki kategorik değişkeni sınıflandiran bir olumsallık tablosunda gösterilebilir:

Çekilmiş Çekilmemiş Toplam Hatalı k mk m Hatasız nk N + k − n − m N − m Toplam n N − n N Eğer içinde m sayıdan daha fazla hatalı mal birimi olmadığını kabul ettiğimiz N sayıda mal birimini ihtiva eden bir mal teslimi yapılmıştır. Bu N sayıdaki mal birimi içinden tam n sayıda bir örnek alınıp bunlar test kontrolünden geçilirilirse bu örnek içinde tam k tane hatalı mal birimi bulunacağı hipergeometrik dağılım ile açıklanır.

Genel olarak: Eğer bir rassal değişken X rassal değişkeni N, m ve n parametreleri olan bir hipergeometrik dağılım gösterirse, tam olarak k sayıda başarı elde edilmesi, şu fonksiyonla bulunur:
e7c9048dabbdc298109e8a1115525e09.png
k değeri max(0, n+mN) ile min{m, n) arasında olursa olasılık pozitifdir.
Bu formül şöyle daha da açıklanabilir: (Geri koyulmadan) alınabilmesi mümkün örnek sayısı
ba13c082b3aa6c8dca8cda84a527863d.png
olur. Hatalı nesne sayısının k olması için
7ca6647640a2d3616899da55d3305ca9.png
sayıda alternatif bulunur; örneğin geride kalan kısmınin hatasız nesnelerle doldurulması için de
1170c3c794a42e1b478b1f43a8ff7ef7.png
alternatif mevcuttur.
k 0 ve N arasında her tamsayı değeri alabildiği için ve olasılık değerlerinin toplamı 1 olduğu için, bu kombinatorik matemetik kuramına göre Vandermonde'nin özdeşliğidir.

Uygulama ve bir örnek

Hipergeometrik dağılımın klasik uygulaması geri koymadan örnekleme adı verilebilen bir denemedir. Bir küp problemi düşünülsün: bir küpün içinde iki tip küçük top, beyaz ve siyah, bulunduğu düşünülsün. Aynen bir binom dağılımı için yapılan deneme gibi, küpten bir beyaz top çekmeye başarı adı verilsin ve alternatif olan siyah top çekmek başarısızlık sayılsın. N küpte bulunan toplam top sayısı, m küpteki beyaz top sayısı ve böylece Nm ise küpteki siyah top sayısı olsun. Şimdi küpün içinde 5 beyaz ve 45 siyah top olduğu varsayılsın. Gözleri kapalı olarak küpten birer birer 10 tane top çekilsin ve her çekilen top küpe geri konulmasın. Bu deneme geri koyulmadan örnekleme olur.
Araştırmayı ilgilendiren soru: Bu çekişte küpten tam 4 tane beyaz top çekme (yani ima ile 6 tane de siyah top çekme) olasılığı nedir? Buna binom dağılım modeli uygulanamaz; çünkü her çekilişte başarı olasılığı değişmektedir. Bu problem iki kategorik değişkeni sınıflandıran olumsallık tablosunda şöyle özetlenebilir:

Çekilmiş Çekilmemiş Toplam Beyaz toplar 4 (k) 1 = 5 − 4 (mk) 5 (m) Siyah toplar 6 = 10 − 4 (nk) 39 = 50 + 4 − 10 − 5 (N + k − n − m) 45 (N − m) Toplam 10 (n) 40 (N − n) 50 (N) Küpten tam olarak k tane beyaz top çekmenin olasılığı şu formül kullanılarak hesaplanir:
f4cf0cb24e659360344dae53c17b8307.png
Bu problkem için k = 4 olduğundan 4 tane beyaz top (ve 6 tane siyah top) çekme olasılığı
e2da44ff4e4332c5d91abf1d664742d0.png
çok düşük bir değerde (yaklaşık 0,004) olup, olabilirliği nerede ise sıfıra eşittir. Bu bir değişik ifade ile açıklanırsa bu rassal deneme (yani içinde 50 top bulunan bir küpten 10 tane top çekip hiçbirini geri koyulmamasi denemesini) 1000 defa tekrarlanırsa 4 beyaz (ve 7 siyah) top elde etmek ancak 4 defa ortaya çıkan bir sonuç olacaktır.
Bu sefer küpten 5 tane beyaz (ve 5 tane siyah) top çekme olasığına göz atılsın. İki kategorik değişkeni sınıflandıran olumsallık tablosu şöyle kurulur:

Çekilmiş Çekilmemiş Toplam Beyaz toplar 5 (k) 0 = 5 − 5 (m − k) 5 (m) Siyah toplar 5 = 10 − 5 (n − k) 40 = 50 + 5 − 10 − 5 (N + k − n − D) 45 (N − m) Toplam 10 (n) 40 (N − n) 50 (N) Olasılık şöyle hesaplanabilir (Dikkat edilirse paydalar hep aynıdır):
6add99251a3b365bf28644c77f4857bc.png
Beklendiği gibi 5 beyaz top çekme olasılığı, 4 beyaz top çekme olasılığının çok daha altındadır.
Simetriler

Hipergeometrik dağılımda n ve m parametreleri arasında çok önemli simetriler vardır. Bu simetriler verilen küp problemi için önemli değil gibi görünmektedirler. Gercekten verilen bazı hipergeometrik dağılım gösteren problemlerde n ve m parametreleri hiçbir problem olmadan birbiriyle değiştirilebilir. Ancak hayat/ölüm sorunlarına hipergeometrik dağılım uygulanmaya başlayınca önemleri anlaşilabilir.
Parametreler olan n ve m arasindaki simetriler şöyle siralanbilirler:

  • Bu halde siyah ve beyaz en basitce rol değişstirmektdirler.
f(k;N,m,n) = f(n − k;N,N − m,n) Bunu daha kolay anlamak icin siyah toplar beyaza; beyaz toplar siyaha boyanınca neyin değiştiğıni düşünmek gerektir.

  • Bu halde çekilmiş ve çekilmemiş toplar rol değiştirmektdirler.
f(k;N,m,n) = f(m − k;N,m,N − n)
  • Bu simetriyi anlamak icin topları çekme hareketini unutup, zaten çekilmiş olan toplara dikkat
çekilmektedir ve zaten çekilmiş olan toplara etiket yapıştırma işlemine benzer:
f(k;N,m,n) = f(k;N,n,m) İlişkili dağılımlar

X ~ Hypergeometrik(m, N, n) ve p = m / N olsun.

  • Eğer n = 1 ise X rassal değişkeni p parametreli bir Bernoulli dağılımı gösterir.

  • Eğer 0 veya 1 e eşit olmayan n ve p ile karşılaştırılınca N ve m büyük değerlerde iseler, o halde
1285bed796e0ba7ecb4dc8444224098a.png
Burada Y rassal değışkeni parametreleri n ve p olan bir binom dağılım gösterir.



  • Eğer 0 veya 1 e eşit olmayan n ve p ile karşılaştırılınca N ve m büyük değerlerde iseler, o halde
d2310c5d5bcb0232c4b3b59a31ccfd70.png
Burada Φ bir standart normal dağılım gösterir.
 
Geri
Üst