Yüzdelik değişimleri yorumlamak, binom dağılımları, tahmin ediciler veya varyans analizi kullanılan uç değerin istatistiksel önemi gibi çeşitli konuları bünyesinde barındıran istatistik, gittikçe daha da popülerleşen oldukça kapsamlı bir alandır.

İstatistiğin kısa ve öz tarihini anlattığımız bu yazıda aynı zamanada istatistiğe dair sorularınıza cevap olacak en iyi kaynakları da bulabilirsiniz.

istatistiğe giriş aşamasında bolca çalışmalısınız
Doğru bir analiz yapabilmek için istatistiksel yazılıma dair hesaplamaları öğrenmelisiniz. |Kaynak: Pixabay

Uygulamalı İstatistik Nedir?

Veri analizini son zamanlarda haberlerde duymuşsunuzdur mutlaka. Dünyadaki bazı büyük bankalarda düzenli olarak meydana gelen büyük veya küçük veri ihlallerinden dolayı, GDPR (Genel Veri Koruma Yönetmeliği) web sitesini her ziyaret ettiğinizde işaretlemeniz gereken bir kutucuk oluşturdu ve artık istatistiksel analizin çağımızın Büyük Birader'i olma yolunda ilerlediğini söylersek yanılmış olmayız.

Eğer bu okuduklarınız size çok yabancı geliyorsa Büyük Birader ismini daha yakından inceleyerek istatistiksel yöntemleri anlamanın önemindeki yerini açıklayalım: George Orwell'in 1984 kitabı.

Çok fazla spoiler vermeden içeriği özetleyecek olursak, 1984 kitabında iki ana karakterin distopik bir otoriter rejimin ideallerine baş kaldırma çabalarını anlatıyor. Baş karakterlerden biri yönetimdeki hükümetin geçmişe dair yaşananların kayıtlarını düzenlediği "Gerçek Bakanlığı"nda çalışıyor. Diğer bir deyişle tarihi veriler üzerinde değişiklikler ve düzenlemeler yapıyorlar.

İstatistiksel veriler ve tarihlerinin önemi yalnızca hayat kalitemizi artırmış olmasından kaynaklanmıyor. Evet, Bayes istatistiği ve makine öğrenimi nesli tükenmekte olan türleri izleyebilecek istatistiksel yazılımlara kapı araladı. Evet, biyostatik alanı istatistikçilerin hayatımızı kurtaran ilaçları üreten testler yapmasını sağladı.

İstatistiksel tekniklerin günlük yaşantımızda hayati öneme sahip olduğunu reddedemeyiz fakat matematiksel istatistiğin manipülasyonu kurumlar ve hükümet organları tarafından, Orwell'in çığır açan romanındaki gibi, siyasi gündemleri kontrol etmek veya toplumun belirli kesimlerini baskılamak için kullanılabiliyor.

Kategorik veri, örnek büyüklüğü, standart sapma ve olasılık dağılımı gibi kavramları içeren istatistik alanı, genellikle erişilemez gibi algılanabilir ve bu nedenle bu alana uzak olan insanların çoğunluğu kendilerini güçlendirecek bu disiplinden uzak durmayı tercih eder.

İstatistik teori ve uygulamalı istatistikler,  aşırı karmaşık fikirlerin yer aldığı modern alanlar gibi görünse de, istatistiğin tarihine göz attığımızda bu önyargının ne denli yanlış olduğunu görebiliyoruz. İnsanlar medeniyetin başlangıcından bu yana toplumun en önemli sorunlarını çözmek için istatistikleri kullanıyorlar.

Tarımsal olgular hakkında ham veri toplamaktan tarım tekniklerini geliştirmeye, evrenin gizemlerini çözebilmek için gezegen sistemlerinin hareketlerini kaydetmeye kadar bilim insanları yüzyıllardır istatistiksel veri analizini kullanıyorlar. Eğer erkeklerin tarih boyunca bu alana egemen olduklarını düşünerek gözlerinizi deviriyorsanız yanılıyor sayılmazsınız.

Fakat şunu da eklemek gerekir ki Florence Nightingale gibi kadınlar olasılıkları ve istatistikleri görselleştirme ve kullanmada devrim yarattı. Aynı zamanda günümüzde eşitlikçiliğin kaleleri olarak kabul edilen endüstrilerde bile kadınların karşılaştığı ayrımcılığı ortaya koymak için istatistiksel analizler kullanan kadınlar var.

Peki uygulamalı istatistik matematiksel olarak nasıl görünür? Bu disiplinin ismi aslında içeriği hakkında fikir veriyor ama yine de kısaca tanıtacak olursak uygulamalı istatistik; iş, sigorta, hükümetler, eğitim ve daha bir çok alanda ya bir problemi çözmek için ya da bir hipotezi test etmek için veri toplama, olasılık teorisi ve veri görselleştirme yöntemlerini kullanmayı kapsar.

Matematiksel olarak istatistik, doğrusal regresyon, çok değişkenli regresyon, ANOVA, vb. gibi bir dizi farklı model aracılığıyla boş ve alternatif hipotezi test etmek için olasılık ve merkezi eğilim teorilerinin uygulanmasını ifade eder. Geçmişte istatistik, olasılık yoğunluğu fonksiyonlarına dağılımın normalliği üzerine sıfır hipotezinin boyutlarını içeren karmaşık matematiğin arkasına gizlenmiş bir disiplin olarak görülürdü.

Fakat bugün internet erişimi olan herkes tarafından kolaylıkla ulaşılabilecek bir alan haline geldi. R gibi açık kaynaklı programlar ve online anlatımlar, daha önce istatistiğe dair hiçbir deneyimi olmayan kişilerin bile kullanabileceği Datawrapper gibi araçlarla istatistik ve veri analizinde hem yeni hem de daha demokratik bir çağ açılmış oldu.

İstatistiğe giriş ile programlama öğren
Programlama, veri analizinin gittikçe önemi artan bir unsuru haline geldi. |Kaynak: Pixabay

Betimsel İstatistiği Anlamak

İstatistik ve veri analizinin evrimine dair bir fikir edindiğinize göre sıra bu disiplinin parçalarını tanımaya geldi. Genel olarak istatistikçiler veya matematikçiler alanı iki ana kola ayırır: betimsel ve çıkarımsal istatistik.

Betimsel istatistik, örnek verilerden bir tahminci veya kestirici çıkarma ve çeşitli regresyon istatistik modellerine dayalı bir güven aralığı hazırlama karmaşıklığıyla daha az ilgilidir. Betimsel istatistik daha çok verinin nasıl göründüğüyle ilgilenir. Kulağa basit gelen istatistiğin bu dalı toplumun en fazla yararlandığı ve çoğunluğun kolayca anlayabildiği alandır.

Örneğin Britanya'da insanlar ve hükümetler belli özelliklere sahip bir ailenin ortalama gelirini tahmin etmekle pek ilgilenmez, onun yerine bir şehrin ortalama gelirini öğrenmeyi önemserler. Betimsel istatistik ya nitel veriyi ya da nicel veriyi tanımlar ve konum ile değişebilirlik istatistiğini anlamaya çalışır. Diğer bir deyişle histogram veya normal dağılım gibi şeyleri kullanan betimsel istatistik, ortalama verinin görünüşünü ve verinin ortalamadan farkını size sunar.

Konum ya da merkezi eğilim ölçülerine örneklem ortalaması, mod ve medyan dahildir. Değişebilirlik ölçüleri ise bağımlı ve bağımsız değişkenlerin varyansaları, kovaryansları veya standart sapmalarıdır.

Betimsel istatistik yorumlama için kullanılan diğer ölçüm araçları şunlardır:

  • Etki büyüklüğü
  • Korelasyon katsayısı
  • Ki-kare testleri

Çıkarımsal İstatistik Nedir

İstatistiğin bir diğer dalı olan çıkarımsal istatistik, haberlerde veya gazetelerde pek karşılaşmadığımız bir ölçüm sistemi içerir. Örneğin, en mutlu ülke sıralamalarını görmeye aşina olduğunuz için daha kolay anlasak da muhtemelen üç ayda bir yapılan gayrisafi yurt içi hasıla tahminlerini görmek için dergi karıştırmıyorsunuzdur.

Çıkarımsal istatistik, günlük hayatımızı şekillendiren oldukça güçlü istatistiksel bir araç olmasının yanında yürütmesi, yorumlaması ve anlaması da bir o kadar zorlayıcıdır.

Çıkarımsal istatistik Bayes istatistiği ve frequentist yaklaşımlar olarak ikiye ayrılır. Çıkarımsal istatistikte her iki yaklaşım önemli görülse de, günlük olarak kullanılan yöntemlerin çoğu Bayes istatistiği etrafında döner. Olasılık teorisini kullanarak veri bilimcileri ve istatistikçiler, belirli bir veri kümesi dışında tahminler yapabilen bir tasarım çalışması oluşturmak için keşifsel analizin ötesine geçebilirler.

Çıkarımsal istatistik 19.yüzyıldan beri uygulanmakla birlikte yöntemleri ve kullanımı SPSS, R ve Stata gibi istatistiklere yönelik bilgisayar ve bilgisayar yazılımlarının  icadıyla hızla arttı.

Çıkarımsal istatistikleri  yürütürken en sık kullanacağınız yöntem ve modeller şunlardır:

  • Lineer regresyon
  • Genel lineer modeller
  • Parametrik olmayan testler

Parametrik olmayan testler, verinin belli bir dağılımı izlemesini gerektirmediği için belirli durumlarda çok güçlü olabilir. Çıkarımsal istatistik hakkında daha fazla bilgi edinmek istiyorsanız, Gauss-Markov  teoremi gibi daha birçok varsayımı inceleyebilir ve korelasyon nedir istatistik konularında araştırma yaparak bu alanda kendinizi geliştirebilirsiniz.

Çıkarımsal istatistik nedir tablolarla öğren
Veri kümesindeki göstergeleri incelemek eğlencelidir! |Kaynak:Unsplash

İstatistik Nerede Öğrenilir

Sıradan en küçük karelerden profesyonel istatistiksel metodoloji gibi alanları kapsayan İstatistik alanı Ekonomi veya Edebiyat kadar geniş ve kapsamlı bir alandır. Bu durum, yeni bir beceri edinmek veya var olanları iyileştirmek isteyen istatistik alanında çalışan öğrencilerin veya profesyonellerin işini zorlaştırır.

İstatistiksel modeller içeren projelerle ilgili tavsiye veya yardım arıyorsanız ya da kodlama sırasında bir yerde takıldıysanız ilk adresiniz internet olmalı. İstatistiksel kaynaklar için tam alamıyla bir rehber olmasa da mutlaka göz atmanız gereken bazı siteler var.

Göstergeleri Analiz Etmek

İster topladığınız sayısal veriler için bir sınıflandırma sistemi oluşturmakla ilgileniyor olun, ister belirli göstergelerin nasıl ölçüldüğüne ilişkin daha fazla bilgi edinmek isteyin, yardım için başvurabileceğiniz en iyi sitelerden biri de Eurostat: Statistics Explained'dir.

Veri Görselleştirme

İster kategorik verileriniz için ister bir ANOVA veya regresyon analizi için yapılıyor olsun, görselleştirme zor olabilir. Bazı durumlarda güven aralıklarını grafiklendirmeyi veya bağımlı değişkeni en iyi nasıl sunacağınızı bilmiyor olabilirsiniz. Hızlı ve az bakım gerektiren görselleştirmelerle ilgileniyorsanız Datawrapper'a mutlaka göz atın.

Programlama

Kodlamayla ilgili herhangi bir konuda yardıma ihtiyacınız varsa Stackoverflow'u ziyaret ederek işe başlayın. Kodlamayla ilgili gerçek insanların gerçek sorunlara yönelik sorularını cevaplamaya adanmış birçok online forumdan biri.

Size En Uygun İstatistik Öğretmenini Bulun

Eğer istatistik bilgilerinizi geliştirmek istiyorsanız Superprof'un deneyimli ve güvenilir öğretmenlerinden özel ders alabilir hedefinize yönelik, sadece sizin ihtiyaçlarınıza göre şekillenmiş eğitim fırsatlarıyla tanışabilirsiniz.

öğretmenine mi ihtiyacınız var?

Makaleyi beğendiniz mi?

5,00/5 - 1 vote(s)
Loading...

Şule

Selam ben Şule! Seyahat etmeyi, keşfetmeyi ve yeni insanlar tanımayı seven, dillerin yapı ve kurallarına büyük ilgi duyan biriyim.