Doğru örnek büyüklüğü toplama veya istatiksel yorumun bütünlüğünü sağlama konularını içeren istatistik alanının bileşenlerini kavramak biraz zorlayıcı olabilir. Politika, toplumsal hareketler ve daha birçok konuda istatistiği bilmenin ve kullanmanın git gide daha önemli hale geldiği günümüzde bazı temel bilgileri öğrenmek veya var olan bilgilerin üzerinden geçmekte yarar var.

İşte size betimsel istatistikle ilgili bilmeniz gerekenler!

betimsel istatistik yorumlama için tablolar önemlidir
Verileri doğru bir şekilde yorumlayabilmek temel istatistik becerilerindendir. |Kaynak:Unsplash

İstatistiğin Tarihi

Yaşadığımız dünyayı anlamak için veri analizi yapmak ve istatistiksel yöntemleri kullanmak 20.yy'a ait  bir durum olduğunu düşünüyor olabilirsiniz. Günümüzde istatistiksel yazılım ve programların gelişmesiyle istatistikçiler çok daha güçlü çıkarımlar yürütebilse de istatistik çalışmaları insanoğlunun varlığından beri süregelir aslında.

Bayesci istatistiklerin karmaşıklığı veya kategorik verileri anlama, istatistiksel verilerin ve analizin evrimi bağlamında daha uzun bir açıklamayı hak ederken, istatistiklerin kaynağını kısaca inceleyerek temellerini anlayabilirsiniz. İstatistiksel çıkarım, biyoistatistik ve iş analizi gibi diğer birçok modern disiplinle kesişirken, ilk insanların çevresindeki olayları düzenlemesi ve kaydetmesinin bir yolu olarak başladı.

Hijyen, besin ve ekonomik durumların geliştirilmesi için tarım, astorolji veya ticaret hareketlerinin kaydedilmesi ve analiz edilmesi yoluyla atalarımız aslında farkında olmadan devamlı betimsel ve çıkarımsal istatistik bilimininden yararlanıyordu.

İstatistiksel Analizin Dalları

Kullanımı yaygın olan matematiksel istatistik gibi bir alanı tanımlamaya yeltenmek samanlıkta iğne aramaya benzer. Kabul edelim ki istatistiksel teorinin jargonu bile biraz göz korkutucu: sıralı ve kategorik veri, örnek veri, nüfus ortalaması, yüzde birlik, Markov zinciri... Bu karmaşık terminolojinin arkasında temelde basit olan kavramlar yatıyor.

İstatistik bölümü okuyorsanız, alternatif bir hipoteze karşı sıfır hipotezini test etmek için olasılık dağılımı kullanan Bayes istatistiğini öğrenmişsinizdir. En basit şekilde tanımlamak gerekirse Bayes istatistiği hipotez üretmek ve o hipotezlerde verilen veri kümesine uygun olup olmadığını test etmek için ham verilerle ilgili tahminler yapar. Tahmin analizine ve ortak istatistiksel tekniklere daha fazla dalmadan önce nitel ve nicel veriyi analiz etmek için veri görselleştirmeyi kullanabileceğiniz ortak yollardan başlamak daha yardımcı olacaktır.

Betimsel İstatistik

Bir derste veya işyerinde bir proje için histogram, pasta veya sütun grafiği oluşturduysanız tebrikler, veri bilimcilerin istatistik ve analiz yaparken en çok kullandığı yollardan birine başvurmuşsunuz!

Betimsel istatistik merkezi eğilim ve varyans ölçümleridir yani verilerin ortalamayla ve belli noktaların ortalamadan ne kadar uzak olduğu bilgisiyle verilerin ölçülmesi olarak açıklanabilir. Merkezi eğilim ölçümleri aşağıdaki gibi ölçüleri içerir:

  • Örneklem ortalaması
  • Medyan
  • Mod

Değişkenlik veya yayılım ölçümleri ise şunları içerir:

  • Varyanslar
  • Kovaryanslar
  • Standart sapma

Fazla basitleştirilmiş bir süreç gibi dursa da betimsel istatistikte keşifsel bir analiz yürütmek her çalışma tasarımının bir parçasıdır. Matematikçi veya veri bilimci çok değişkenli lineer regresyon analizi yapmadan önce veya tahmincilerle güven aralığı oluşturmadan önce verilerinin içeriğini bilmeleri gerekiyor.

Yalnızca betimsel istatistik ve verilerin görselleştirilmesiyle istatistiksel veri analizini tamamlayabilirsiniz. Bunun en güzel örneklerinden biri 1850'lere kaynıyor. Florence Nightingale, Kırım Savaşı sırasında ölüm sayıları hakkında hayati bilgiler elde etmek için meşhur “coxcomb” pasta grafiğini hazırladı. Sahadaki kadınların neredeyse hiç görünür olmadığı bir zamanda Nightingale istatistik alanında yenilikçi girişimleriyle azınlık sayılabilecek grupların önünü açmıştır.

İstatistik yorumlama için tablolar kullanılır
İstatistik hayatın her alanında karşımıza çıkan bir alandır. |Kaynak: Visualhunt

Betimsel istatistiğin kullanılmasının nedenlerinden biri de, birçok istatistik veya regresyon modelinin geçerli olabilmesi için belirli varsayımlar gerektirmesidir. Bu tahminler modelden modele değişikilik gösterse de, en yaygın gereklilik verinin normal olarak dağıtılmasıdır.

Normal dağılım merkezi limit teoremini izleyen bir olasılık eğrisidir. Verilerin çoğunluğu normal dağılımı izlemez, bu nedenle birçok istatistikçi bağımlı değişkelerini veya bağımsız değişkelerini dönüştürürler. SPSS, R veya excel gibi yazılımlar kullanarak isteyen herkes verilerden merkezi eğilim ve dağılım ölçümlerini çıkarabilir.

Eğer veri normal dağılıyorsa bu ölçümler çok daha güçlü hale gelir. Örneğin maliye alanında verinin dağılımı ve belirli fiyatların veya hisse senetlerinin altına düştüğü yüzdelik değer, potansiyel ticaret anlaşmalarının avantajlarını veya risklerini anlamak için kullanılır.

Yaygın Betimsel İstatistik Sorunları

Betimsel istatistik yorumlama, istatistik alanının diğer kolu olan çıkarımsal istatistikten epey farklıdır. Çıkarımsal istatistik veriyi, istatistiksel modeller kullanan nüfuslar hakkında tahminler yapmaya çalışmak için kullanırken betimsel istatistik, verinin içinde tam olarak ne olduğuyla ilgilenir.

Kategorik, sayısal ve gözlemsel verileri analiz etmek için betimsel istatistik kullanmak, insanların aşağıdaki işlemleri yapmak istediğinde kullandıkları istatistiksel bir metodolojidir:

  • Çalışanlarının yüzde kaçının 30 yaşlarında olduğunu bilmek
  • Üniversitede notların dağılımını öğrenmek
  • Bir deneyde iki hasta grubu arasındaki etki büyüklüğünü anlamak

Regresyon analizi veya ANOVA'nın aksine bu analiz çeşidi tek değişkenli analiz olarak adlandırılır çünkü her seferinde yalnızca tek bir değişkeni analiz edebilir.

Betimsel İstatistiğe Örnekler

Ki-kare analizi, güven aralığı veya korelasyon katsayısı gibi istatistik alanları zaman zaman çok yararlı olabilir, tek ihtiyacınız olan betimsel istatistik nedir öğrenmektir.

  • Ortalama: 30
  • Standart sapma: 4

Diyelim ki bu sayılar sınıfınızın test sonuçlarıyla ilgi bir dizi veri olsun. Sınıfın bu testin konusuyla ilgili nasıl performans gösterdiğini anlamak istiyorsunuz fakat deneysel tasarımınızı nasıl kuracağınızdan emin değilsiniz.

Verinin normal dağılımı izlediğini farz edersek, sonuçların%68'inin ortalamanın bir standart sapması içinde olduğunu, % 95'inin iki standart sapma içinde ve % 99'unun üç standart sapma içinde olduğunu biliyoruz.

İstatistiksel anlamlılık, rastgeleleştirme veya en küçük kareler yöntemi kullanmadan sınıfın %95'inin 22 ve 38 puan arasında bir not aldığını görebilirsiniz.

  • Alt sınır: 30 – (2 * 4)
  • Üst sınır: 30 + (2 * 4)

Betimsel analizle ilgili diğer bir mevzu da iki değişken arasındaki ilişkiyi tanımlayan sayı, yani korelasyondur. Bunu biliyorsanız da, korelasyon ve nedensellik arasındaki farkı tam olarak anlamalısınız.

Korelasyon, bir değişkendeki değişimlerin diğerlerinde ne denli bir değişiklik yapacağını anlamak için matematiksel bir araçtır. Nedensellik ise bir değişkendeki değişikliklerin diğerinde de değişkiliklere neden olduğu fikridir.

Daha önce bir matematikçi şakası duyduysanız, o zaman istikçilerin ' korelasyon nedensellik noktası ile aynı değildir' durumunu açıklarken verdikleri genel örnekler sizi rahatsız etmez. Mesela, el boyutu ve yaş. Çeşitli yaşlardan bir grup insanı toplayalım ve elleri ile yaşları arasındaki ilişkiye bakalım. Muhtemelen yaş büyüdükçe ellerin de aynı şekilde büyüdüğünü göreceksiniz.

El boyutu ve yaş arasında açıkça bir korelasyon veya ilişki olsa da herhangi bir nedensellik olması muhtemel değildir. Eğer nedensellik olsaydı, eliniz bir şekilde küçülse yaşınızın gençleşmesi veya yerinden kopsa sizin de anında öleceğiniz anlamına gelirdi.

Çıkarımsal İstatistik

İstatistiğin bir diğer ana dalı olan çıkarımsal istatistik, insanların aklında ilk canlanan görüntülerin ait olduğu istatistik dalıdır. Çıkarımlar yapmak veya bağımlı veya daha fazla değişken üzerinde bir tahmin hesaplamak için istatistiksel modeller oluşturmak için olasılık teorisine dayanan çıkarımsal istatistiği kavramak biraz zorlayıcı olabilir. Ancak çıkarımsal istatistiğin en önemli özelliği tek bir cümlede özetlenebilir: veri kümesinin dışında tahminler yapmak için bir popülasyondaki örnek verileri kullanır.

Betimsel istatistik nedir küçük yaşta öğrenilebilir
Dağılımlar ve olasılık okullarda küçük yaşta öğretilmeye başlanır. |Kaynak: Unsplash

Uygulamalı İstatistik Öğrenmek için İpuçları

Binom dağılımları, aykırı değerler veya mükemmel parametrik testi bulmak gibi karmaşık konuları içeren istatistiğin tüm bileşenlerini anlamak ve akılda tutmak oldukça zordur. Fakat elbette istatistik öğrenmenin ve becerilerinizi geliştirmenin birçok yolu vardır

Online Yardım Alın

Rastgele değişkenler veya varyans analizi gibi istatistik konuları açıklamak üzere hazırlanmış web sitelerini keşfetmenin zamanı geldi! İnternet üzerinden ulaşabileceğiniz en iyi örneklerin ve anlatımların yer aldığı bazı siteler şunlardır:

İstatistik Öğretmeni Nereden Bulunur

Bire bir eğitim almak isterseniz mutlaka Superprof'un deneyimli ve güvenilir öğretmen kadrosuna bir göz atın. Size özel hazırlanan ders programlarında öğretmeninize dilediğiniz soruyu çekinmeden sorabilirsiniz!

öğretmenine mi ihtiyacınız var?

Makaleyi beğendiniz mi?

5,00/5, 1 votes
Loading...

Şule

Selam ben Şule! Seyahat etmeyi, keşfetmeyi ve yeni insanlar tanımayı seven, dillerin yapı ve kurallarına büyük ilgi duyan biriyim.