Olasılık Yoğunluk Fonksiyonu (PDF)
Bu yazıda sizlerle Probability Density Function (Olasılık Yoğunluk Fonksiyonu) konusunu ele alacağız. Yazının devamında Olasılık Yoğunluk Fonksiyonu için PDF kısaltmasını kullanacağım.
Olasılık Yoğunluk Fonksiyonu (PDF) Nedir?
Olasılık Yoğunluk Fonksiyonu (PDF), değer aralığına sahip bir rastgele değişkenin, alacağı değerin hangi aralıkta bulunacağı olasılığını hesaplamak için kullanılır.
Örneğin elimizde bir değişkeni olduğunu düşünelim. Bu değişkenin değer aralığı olsun. Ancak bu aralık içerisinde değişkeni için örneğin 10 değerinin ihtimalini hesaplamak için basit bir olasılık hesabı yapalım:
Bu sonsuz aralıkta, örneğin 10 değerini elde etme olasılığını hesaplarsak, formül şu şekilde olur:
Yani sonsuz aralıkta belirli bir değeri elde etme olasılığımız sıfırdır. İşte bu noktada PDF devreye girer. PDF, bu değerin hangi aralıkta olası olduğunu bulmamıza yardımcı olan bir fonksiyondur. Örneğin 10 değerinin olasılığını hesaplamak için, bu değerin hangi iki değer aralığında olduğunu bulmalıyız.
Bu durumda PDF şu formülü vermektedir:
Olasılık Yoğunluk Fonksiyonu (PDF) Tanımı
, rastgele değişkeninin belirli bir değerine yakın olma olasılığını verir. Ayrıca bu fonksiyon, veri setinin istatistiksel dağılımlarına göre belirlenir. fonksiyonu, değişkeninin olasılık dağılımını tanımlar ve değişkeninin tüm değerleri üzerinden entegre edildiğinde 1’e eşittir:
Örnek: Normal Dağılım
Normal dağılım, yaygın olarak kullanılan bir olasılık dağılımıdır ve şu PDF ile tanımlanır:
Burada ortalamayı ve standart sapmayı temsil eder.
Örnek Soru
Bir rastgele değişken , ve parametrelerine sahip standart normal dağılıma sahiptir. olasılığını bulalım.
Çözüm
Bu soruyu çözmek için yukarıda verilen formülü kullanacağız:
Bu integrali çözmek için standart normal dağılım tabloları veya bilgisayar yazılımları kullanılabilir. Bu olasılık yaklaşık olarak 0.6827’dir.
Python ile bu olasılığı şu şekilde hesaplayabiliriz:
import scipy.stats as stats # Parametreler mu = 0 # Ortalama sigma = 1 # Standart sapma # Olasılığı hesapla p = stats.norm.cdf(1, mu, sigma) - stats.norm.cdf(-1, mu, sigma) print(f"P(-1 <= X <= 1) = {p:.4f}")
Bu Python kodu, aralığındaki olasılığı hesaplamak için SciPy kütüphanesinin norm.cdf
fonksiyonunu kullanır. norm.cdf
fonksiyonu, normal dağılımın kümülatif dağılım fonksiyonunu (CDF) hesaplar. Yukarıdaki kodda, olasılığını hesaplamak için 1 ve -1 noktalarındaki CDF değerleri arasındaki farkı alırız ve bu olasılığı ekrana yazdırırız.