Mod

İstatistik bilimi için mod bir değişken için veriler içinde en çok kaynaktır. Tepedeğer olarak da adlandırılır. Bazı kullanım alanlarında, özellikle eğitim alanında, örnek veriler çok kere puan olarak anılmakta ve örnek mod değerine ise mod puanı adı verilmektedir.[1]

İstistiksel ortalama ve medyan gibi mod bir önemli veri bilgilerini kapsayan tek bir istatistiksel özetleme dir. Genellikle, bir veri için ortalama ve medyandan değişik değerdedir ve özellikle yüksek çarpıklık özelliği gösteren dağılımlar için bu farklılık daha da açıkca olarak görülür.

Mod mutlaka eşsiz tek olmayabilir. Bazı verilerde hiç tekrarlama olmazsa hiçbir mod bulunmaz. Diğer taraftan değişik veri değerleri ayni maksimum çokluk değerine yetişebilirler. Olasılık dağılımları için çoklu mod değerine aşırı örnekler aralıklı tekdüze dağılım ve sürekli tekdüze dağılımdır; bu dağılımlar için rassal değişkenin mümkün tüm değerleri aynı olasılıkla mod değerleridir

Mod için örnek

Mod bir veri serisi içinde en çok tekrar edilen sayıdır.

Örneğin: 10 gözlemi kapsayan bir örneklem alınsın. Veriler şunlardır:

1,2,3,1,2,3,2,2,2,2

Bu veri serisinde tekrarlar bulunmakta ve çokluk sayımı şöyle verilebilmektedir:

 Veri değeri          1      2     3
 Frekans sayımı       2      6     2

Bu veri dizisinin modu 2dir; çünkü bu değer en çok tekrar edilmektedir.

Eğer veri dizisi içinde hiçbir tekrarlama bulunmuyorsa, veri için mod bulunmayabilir. Diğer taraftan, iki veya daha fazla veri aynı tekrarlamayı gösterebilirler; bu halde çoklu mod ortaya çıkar.

Örneğin: Büyüklüğü 15 olan bir örneklem veri dizisi şu olsun:

1,5,5,8,5,5,9,10,10,12,2,8,12,10,12,10

Bu veri dizisinin çokluk sayımı şöyle verilir:

  Veri değeri     1    2   5   8   10  12
  Frekans sayımı  1    1   4   2    4   3

Veri dizisinde en çok (4 defa) tekrarlanan sayı 5 ve 10 olduğu için veri dizisinin iki tane modu bulunmaktadır: 5 ile 10.

Eğer örneklem niceliksel değerler gösterip hacmi büyük ise veya değerleri orijini biraz olsun saklanmak istenmekte ise, örnek veri dizileri sıralanır; gruplanır ve çokluk dağılımı tablosu olarak verilir. Bu çokluk dağılım tablosundaki en büyük frekans gösteren gruba mod sınıfı adı verilir ve bu sınıfın kapsadığı değerler arasında bir sayı çokluk dağılım modu olarak bulunabilir. Bunun için formül şöyle verilebilir:

Bu formül ile bir çokluk dağılımından elde edilen mod değeri orijinal veri serisi içinde bulunan herhangi bir veri değerine tekabül etmeyebilir. Bu formül sadece tek modlu çokluk dağılımları için uygundur ve veri dağılımı çoklu doruk gösteriyorsa mod bulunması uygun değildir.

Hemen şunu da eklemek gerekir ki veri dizisinden elde edilen mod; bu veri dizisinin bir çeşit gruplanması ile elde edilen çokluk dağılımı mod değeri ve bu veri dizisinin diğer çeşit gruplanması ile elde edilen diğer bir çokluk dağılımının mod değerinin birbirine mutlaka eşit olmaları gerekmez; gerçekten pratikte bunların değişik olması çok büyük imkân dahilindedir. Yani aynı veri için değişik mod olması olağandır.

Olasılık dağılımı için mod

Bir aralıklı olasılık dağılımı için mod bir rassal sayı olan xdir ve bu x değerinde olasılık kütle fonksiyonu maksimum değere varır. Diğer bir deyimle, mod rassal sayı değeri en olabilir şekilde örnek alınan değerdir.

Bir sürekli olasılık dağılımı için mod bir rassal sayı olan x olup bu sayıda olasılık yoğunluk fonksiyonu maksimum değerine varır; daha gayriresmi bir ifade ile mod olasılık yoğunluk fonksiyonu için bir doruk değeridir.

Bir olasılık kütle fonksiyonu veya olasılık yoğunluk fonksiyonu için maksimum değere birkaç noktada x1, x2, vb. bulunabilinirliğinden mod mutlaka eşsiz tek değerde değildir.

Olasılık yoğunluk fonksiyonunun çoklu olarak yöresel maksimum değerleri varsa, tüm yöresel maksimum değerlerin hepsi dağılımın mod değeri olarak anılır. Ancak yukarıdaki verilen tanımlamaya göre sadece global maksimum değer mod olup bu global maksimumdan daha küçük olan yöresel maksimum değerlerinin mod sayılmaması gerekir. Bununla beraber bu şekilde çoklu yöresel maksimum değerleri bulunan sürekli olasılık dağılımları çoklu modlu dağılım olarak anılır.

Mod, ortalama ve medyan karşılaştırılması

Bir olasılık dağılımı için ortalama, rassal değişkenin beklenen değeri olarak adlandırılır. Diğer taraftan, eğer veri örneklemden gelmişse örneklem ortalaması adı verilir.

Tek modlu olan ve ve yansıtıcı simetri gösteren olasılık dağılımları arasında simetrik çan grafiği şeklinde olasılık yoğunluk fonkiyonu olan normal dağılım için ortalama, medyan ve mod birbirine aynıdır.

Mod kavramı isimsel ölçekli veri serileri için merkezsel konum ölçüsü olarak kullanilabilir ama bu halde anlamı biraz bulanıktır. Buna karşılık medyan ve ortalama hiç anlamsızdır.

Özellikler

Mod için şu özellikler ilgi çeker:

. Ortalama ise bunlarin aksine eger aykırı değerlerden çok etkilenir.

medyan ≈ (2 × ortalama + mod)/3.

Bu bir pratik kural olarak, bir normal dağılımı andıran çok az asimetri gösteren dağılımlar için doğrudur. Ancak bu kural her zaman doğru olamaz ve bu üç-zet konum istatistiğinin herhangi bir sırada olması mümkündür.[2] [3]

Çarpık bir dağılım için örnek

Bir sınıf dağılım tipi isteğe göre çarpıklık gösterebilir. Bu log-normal dağılımıdır. Bu dağılım bir normal dağılım gösteren X rassal değişkenin logaritması alınarak bir Y rassal değişkenine (yani Y= exp (X) yaparak) dönüştürmekle elde edilir. Y rassal değişkenin logaritması normal dağılım gösterir ve bu nedenle Y dağılımına log-normal adı verilir.

Özel bir X seçilerek ortalaması μ=0 olursa, Ynin medyanı 1 olacaktır ve bu X'in standart sapması olan σdan bağımsızdır. Buna neden X normal dağılım gösterdiği için ortalama ve medyan (ve mod) ayni olmakta ve ortalama 0 olursa medyan da 0 olmaktadır. Xden Y dönüşümü u monotonik olduğu için Y için medyan değerinin 1 olduğu (exp(0)=1) açıktır.

Eğer X standart sapması σ=0,2 olursa, Y dağılımı çok çarpıklık göstermez. Ortalama ve mod değerleri sırasıyla μ=1,0202 ve mod=0,9608 olur. Bu halde medyan ortalama ile mod arasında üçte bir mesafededir.

Eğer X standart sapması çok daha büyük, (diyelim σ=5) olursa, Y dağılımı büyük ölçekte çarpıklık gösterir. Ortalama ve mod değerleri sırasıyla μ=7,3891 ve mod=0,0183 olur. Bu halde Pearson'un ortaya attığı empirik ilişki kuralı, yani medyanın ortalama ile mod arasında üçte bir mesafede olması, doğru olmaz.

Dipnotlar

  1. Ingilizce matematik sözlüğü tanımlarından çeviri.
  2. Kaynak: Paul T. von Hippel (2005) "Mean, Median, and Skew: Correcting a Textbook Rule", J. of Statistics Education C.3 :2 (İngilizce) (Erişme tarihi:15.9.2009)
  3. Medyan ve diğer ortalamalar "Median". 2012-07-20 tarihinde kaynağından arşivlendi. http://archive.is/vRIw. (İngilizce)(Erişme tarihi:15.9.2009)

Ayrıca bakınız

Dışsal kaynaklar

This article is issued from Vikipedi - version of the 11/9/2016. The text is available under the Creative Commons Attribution/Share Alike but additional terms may apply for the media files.