Veri bilimi "21. yüzyılın en seksi işi" seçildiğinden daha önceki yazımızda bahsetmiştik... Bu ilk duyduğunuzda size biraz tuhaf gelebilir çünkü insanların çoğu istatistik lafını duyduğunda bile hemen ortamı terk etmek istiyor!

Bu disiplinin birçok insan tarafından oldukça farklı ve imkansızmış gibi görünmesinin bir sebebi de, matematikle olan çok yakın ilişkisi diyebiliriz.

İstatistiksel analiz sizin için son derece korkunç bir disiplin mi? Bunu asla öğrenemeyeceğinizi mi düşünüyorsunuz? Peki en azından bu konu hakkında çok temel bilgiler edinmeyi düşünür müydünüz? Cevabınız evet ise yazımızı okumaya devam edin! Sizin için temel gitiş kavramlarından bahsedeceğiz.

İstatistiğin merkezinde aslında yalnızca dört temel kavram vardır ve bunlar veri analizinin temelini oluşturur. İlk dördü, denklemleri hakkında fazla ayrıntıya girmeden ele alınabilir:

  • Ortalama: Veri seti üzerindeki tüm veri noktalarının toplamının toplam veri noktasına bölümü ile edilen bir “ortalama” sayıdır.
  • Ortanca Değer: Veri kümesinin orta noktası, tüm veri seti en küçüğünden en büyüğüne sıralanarak ve değeri doğrudan ortadan alarak hesaplanır
  • Varyans: ortalamanın kare farklarının ortalaması olarak hesaplanan verilerin genel dağılımıdır.
  • Standart Sapma: Varyansın karekökü alınarak hesaplanan bir yayılma ölçüsüdür.
Çalışma masası hesap makinesi kadın
Ortalama, ortanca değer ve varyans hakkında bilgi sahibi olduktan sonra istatistik sizin için daha kolay bir hale gelecektir! | Kaynak: Pexels

Bir polisiye romanındaki tanıklara benzer şekilde, bu dört merkezi eğilim ölçüsü size belirli bir veri kümesinin hikayesini anlatmaya başlar. Çünkü bunlar tanımlayıcı istatistikler olarak bilinir. Bu konuyu örneklendirerek biraz daha açalım...

Bir restauranttasınız diyelim, çevrenizdeki insanlara şöyle bir bakarsanız, bu kalabalık hakkında yalnızca görünüşe dayalı bir yorum yapmanız zor olabilir.

Bununla birlikte, yaşları, aylık gelirleri, eğitim seviyeleri, cinsiyetleri ve müzik zevkleri hakkında size bilgi verildiğini varsayalım. İlk iki kavram, ortalama ve medyan, kalabalığınızın çoğunlukla üniversiteden mi yoksa hedge fonlara yatırım yapan zengin, ileri yaştaki insanlardan mı geçtiğini size söyleyebilecek merkezi eğilim ölçüleridir.

Bu kavramları ne zaman kullandığınız arasındaki fark, ölçtüğünüz değişkenin dağılımına veya bu örnekte kalabalık içindeki değişkenlik miktarına bağlıdır. Kalabalık ne kadar çok benzerse, hikayeniz için alınan ortalama o kadar doğru olacaktır. İnsanlar arasında ne kadar fazla çeşitlilik olursa, ortalama alarak çizdiğiniz resim o kadar doğru olacaktır.

Varyans ve standart sapmanın her ikisi de değişkenlik ölçüsüdür ve size verilerinizdeki her bir gözlemin belirli bir değişkene göre ortalamadan ne kadar farklı olduğunu gösterebilir.

Kalabalığın yaş açısından ne kadar benzer olduğunu görmek istiyorsanız, işe ortalama yaşı hesaplayarak başlar ve ondan her bireyin yaşını çıkararak, insanların ortalamadan ne kadar uzağa yayıldığını gösteren bir sayı bulursunuz. Öte yandan standart sapma, verilerinizin normal bir dağılıma dayalı olarak ortalamanın etrafında ne kadar uzak veya yakın kümelendiği bilgisini size verir.

Standart sapma, verilerinizin yayılmasıyla ilgili verdiği bilgiler açısından tam olarak varyans gibidir ki aslında standart sapma, varyansın karekökü alınarak hesaplanır. Aradaki fark, standart sapmanın, orijinal verilerle aynı birimlerde olmasıdır.

Temel istatistik kavramları şimdilik gayet kolay görünüyor, değil mi?

En iyi öğretmenler müsait
Esra didem @kemanatolye
5
5 (9 yorum)
Esra didem @kemanatolye
₺55
/saat
Gift icon
İlk ders ücretsiz!
Fatih
5
5 (2 yorum)
Fatih
₺50
/saat
Gift icon
İlk ders ücretsiz!
Şule
5
5 (3 yorum)
Şule
₺100
/saat
Gift icon
İlk ders ücretsiz!
Binnur
5
5 (2 yorum)
Binnur
₺75
/saat
Gift icon
İlk ders ücretsiz!
Elif
5
5 (33 yorum)
Elif
₺100
/saat
Gift icon
İlk ders ücretsiz!
Volkan
5
5 (19 yorum)
Volkan
₺120
/saat
Gift icon
İlk ders ücretsiz!
Timur
5
5 (22 yorum)
Timur
₺200
/saat
Gift icon
İlk ders ücretsiz!
Doğukan
5
5 (6 yorum)
Doğukan
₺60
/saat
Gift icon
İlk ders ücretsiz!
Eyüp
5
5 (10 yorum)
Eyüp
₺50
/saat
Gift icon
İlk ders ücretsiz!
Mustafa
5
5 (24 yorum)
Mustafa
₺300
/saat
Gift icon
İlk ders ücretsiz!
Hakan
5
5 (5 yorum)
Hakan
₺150
/saat
Gift icon
İlk ders ücretsiz!
Dilara
5
5 (6 yorum)
Dilara
₺120
/saat
Gift icon
İlk ders ücretsiz!
Giorgi
5
5 (5 yorum)
Giorgi
₺60
/saat
Gift icon
İlk ders ücretsiz!
Esra didem @kemanatolye
5
5 (9 yorum)
Esra didem @kemanatolye
₺55
/saat
Gift icon
İlk ders ücretsiz!
Fatih
5
5 (2 yorum)
Fatih
₺50
/saat
Gift icon
İlk ders ücretsiz!
Şule
5
5 (3 yorum)
Şule
₺100
/saat
Gift icon
İlk ders ücretsiz!
Binnur
5
5 (2 yorum)
Binnur
₺75
/saat
Gift icon
İlk ders ücretsiz!
Elif
5
5 (33 yorum)
Elif
₺100
/saat
Gift icon
İlk ders ücretsiz!
Volkan
5
5 (19 yorum)
Volkan
₺120
/saat
Gift icon
İlk ders ücretsiz!
Timur
5
5 (22 yorum)
Timur
₺200
/saat
Gift icon
İlk ders ücretsiz!
Doğukan
5
5 (6 yorum)
Doğukan
₺60
/saat
Gift icon
İlk ders ücretsiz!
Eyüp
5
5 (10 yorum)
Eyüp
₺50
/saat
Gift icon
İlk ders ücretsiz!
Mustafa
5
5 (24 yorum)
Mustafa
₺300
/saat
Gift icon
İlk ders ücretsiz!
Hakan
5
5 (5 yorum)
Hakan
₺150
/saat
Gift icon
İlk ders ücretsiz!
Dilara
5
5 (6 yorum)
Dilara
₺120
/saat
Gift icon
İlk ders ücretsiz!
Giorgi
5
5 (5 yorum)
Giorgi
₺60
/saat
Gift icon
İlk ders ücretsiz!
Başlayın

Olasılık nedir?

Artık dört temel kavramda bilgi sahibi olduğunuza göre, istatistiğin beşinci ve en önemli yapı taşı olan olasılık teorisini tartışmanın zamanı geldi. İpucu: olasılık teorisi yalnızca istatistik yolculuğunuzun başlangıcında göreceğiniz en önemli grafiği anlamak amacıyla kullanılır!

Bu grafik, verilerin ortalamanın etrafında simetrik olarak düzenlendiği normal bir olasılık dağılımını veya normal dağılımı temsil eder. Başka bir deyişle, olasılık, merkezi limit teoremini veya CLT'yi (Merkezi Limit Teoremi) anlamak için kullanılır.

Grafik bilgisayar çalışma masası
Veri bilimi ve istatistik hakkında donanımlı olmanız iş bulmanızı kolaylaştırır. | Kaynak: Pexels

Olasılık için en basit tabiriyle, bir şeyin olmasının veya olmamasının matematiksel değeri veya olabilirlik değeridir.

Henk Tijms'in "Olasılığı Anlamak" kitabında yazdığı üzere:

"Merkezi limit teoreminin tarihi gelişmesi çok enterasandır. Bu teoremin ilk şekli Fransız matematikçi Abraham De Moivre tarafından 1733'te yayınlanarak gayet dikkati çeken bir yazıda bulunmakta ve bu yazıda bir yansız madeni paranın yazı-tura atış sonuçların da kaç defa yazı gelme sayısının dağılımının bir normal dağılım ile yaklaşık olarak açıklanabileceğini ortaya çıkartmıştır. Bu gelişme zamanı için çok zor görünüp neredeyse unutulmuştur. Bu unutulmuş konu tanınmış Fransız matematikçisi Pierre Simon Laplace'ın 1812'de yayınladığı çok tanınmış eseri Thoerie Analytique des Probabilites (Olasılıklar İçin Analitik Kuram)'da yeniden ortaya çıkarılmıştır; Laplace, De Moivre'in buluşunu daha da geliştirerek binom dağılımlarının yaklaşık olarak normal dağılım ile ifade edilip hesaplanabileceği sonucunu ortaya atmıştır. Ancak De Moivre gibi Laplace gelişmeleri de yaşadığı çağda çok az dikkati çekmiştir. Sonunda 19. yüzyılın içinde merkezi limit teoreminin önemi anlaşılmış ve 1901 Rus matematikçisi Aleksandr Lyapunov bu teoremi genel bir şekilde açıklamış ve matematik olarak nasıl ortaya çıktığını çok kesin bir şekilde ispatlamıştır. Bugün merkezi limit teoremi olasılık kuramının en önemli ögesi, gayriresmî kralı, olduğu kabul edilmektedir."

İstatistiksel Test Seçimi Nasıl Yapılır?

Konuyla alakalı tüm temel bilgileri edindikten ve temel istatistik kavramlarını anladıktan sonra, bir sonraki adıma geçmek biraz zor görünebilir. Bahsettiğimiz bu adım, belirlediğiniz veri kümenizle hangi testi uygulayacağınıza karar vermektir. Günümüzde çok çeşitli istatistiksel testler ve yaklaşımlar mevcut olsa da, işleri kolaylaştırmak için yalnızca dört farklı test kategorisinden bahsedeceğiz.

Bağıntı
Karşılaştırma
Tahmin
Normal bir dağılımı takip etmeyen veya parametrik olmayan veriler

Hangi testleri uygulayacağınıza karar vermek için, analiz ettiğiniz değişkenlere bağlı olarak sahip olduğunuz veri türlerini ayırt etmeniz gerekmektedir. Değişkenler, ölçek veya kategorik değişkenler olabilir.

İstatistik özel dersi ile çok daha ayrıntılı bilgiye ulaşabilirsiniz!

Ölçek değişkenleri niceldir ve iki kategoriye ayrılır;

Sürekli değişken: Yükseklik gibi herhangi bir değeri alabilir
Kesik değişken: Çocuk sayısı gibi tam ve net sayılardır
Kategorik değişkenler niteldir ve ayrıca iki farklı kategoriye ayrılır:

Ordinal: 1'den 10'a kadar ne kadar mutlu olunduğu gibi bariz bir sıraya sahiptir
Nominal: Cinsiyet gibi anlamlı bir sıra yoktur

İstatistiksel Testler Nasıl Gerçekleştirilir?

"Temel istatistik nedir?" sorusundan biraz daha ilerleyip bazı varsayımlara değinmek istiyoruz. Kullanacağınız her istatistiksel teste bağlı birkaç varsayım vardır. Testlerin çalışılabilmesi öngörücü ve doğru olması için bu varsayımların yerine getirilmesi gerekir. Her farklı test türü için varsayımlar da farklı olabileceğinden, verilerinizi modellemeye başlamadan önce bunları kontrol etmeniz gerekir.

İstatistik grafik bilgisi
Temel istatistik kavramları konusunda daha fazla bilgi sahibi olmak ve verileri analiz etme yeteneği kazanmak için dersler alabilirsiniz. | Kaynak: Pexels

İstatistiksel analiz için kullanılan en yaygın programlar şunlardır:

  • Excel
  • Stata
  • SAS
  • SPSS
  • Python
  • R

Parametrik veriler için test uyguluyorsanız, verilerinizin geçmesi gereken dört ana varsayım kontrolü vardır. Bununla birlikte, her testin önceden kontrol edilmesi gereken kendi farklı varsayımları olduğunu unutmayın.

Sizin için en sık karşılaşılanları listeledik:

  • Bağımsızlık varsayımı: Örneği oluşturan gruplar birbirinden bağımsızdır.
  • Normallik varsayımı: Kümedeki veriler normaldir, yani normal bir dağılım izlerler.
  • Varyansların homojenliği varsayımı: Bağımsız değişkeninizle ilgili verilerde birden fazla grup varsa, bunlar aynı varyansa sahiptir.

Superprof aracılığıyla temel istatistik dersi veren öğretmenlerin profillerini incelemek için sitemizi ziyaret edebilirsiniz! Öğretmenlerimizin çoğu derslerini online olarak da vermektedir.

Herhangi bir video konferans programı üzerinden ekran paylaşma özelliğini kullanarak veri bilimi alanındaki her konuyu sanki öğretmeniniz hemen yanınızdaymış gibi öğrenebilirsiniz. Aynı zamanda, veri bilimi ve istatistik alanlarında sınavlara hazırlanıyor ve sınav formatını bilen bir öğretmenden okul derslerinize yardımcı olacak ek dersler almak istiyorsanız da özel dersler işinize yarayacaktır! Öğretmenlerimiz, istatistik temek kavramlar örnekleri ve işinize yarayabilecek formülleri size gösterecek ve size her konuda destek olacaklardır.

İyi şanslar diliyoruz!

>

Özel ders öğretmenleri ve öğrencilerini buluşturan platform

İlk ders ücretsiz

Bu yazıyı beğendiniz mi? Puanlayın!

5,00 (1 puanlama)
Loading...

Nazlı Ece

Merhaba! Ben Nazlı. Farklı kültürlere ve dillere ilgi duyan bir çevirmenim. Bununla birlikte Avrupa Çalışmaları alanında da aktif bir sekilde makale yazıyorum ve çeşitli bloglarda içerik üretiyorum. Kısacası yazmak ve çevirmek benim en büyük hobilerimden!