Güven aralığı hesaplamak veya hipotez denemesi gibi kavramları bünyesinde barındıran istatistik alanı karmaşık ve zorlayıcıdır. Neyse ki hazırladığımız bu yazı geniş bir alan olan veri analizinin kökenlerini ve düzeninin temellerini anlamanıza yardımcı olacaktır.

İstatistik Nedir?

Bu soruya cevap vermeden önce kendinize şunu sorun: verinin değeri nedir?

Bu soru modern politika yapıcıların aşırı dikkatle incelemesi gereken bir şey olsa da, verilerin değerini araştırmak yalnızca modern zamana ait bir olgu değildir. 90'lardaki veri ve veri analizi imajına, dijital çağın başlangıcında ortaya çıkan karikatürler sayesinde, oldukça aşinayız. Matrix bunun en aşikar örneğidir.

Günümüzde istatiksel veriyi analiz etmek için kullanılan istatiksel yazılım, internet erişimi olan herkes tarafından kullanılabilir. Arkadaşlık sitelerindeki profilinize en iyi eşleşen kişiyi bulan algoritmalardan mağazaların satışa sunacakları ögeleri belirleme şekline kadar, veriler modern yaşamımızda her yerde bulunur.

İstatiksel analiz yüzyıllardır yapılagelen bir işlemdir. İlk istatistikçiler, kategorik ve nicel verileri toplamak, ayırmak ve kaydetmek için ellerindeki istatistiksel metodlardan olabildiğince yararlandılar. Bir istatikçinin asıl işi Bayes teoreminde yer alan çıkarımsal araçları içermese de, temel istatik ilkeler yüzyıllar boyunca aynı kalmıştır: daha bilinçli karar verebilmek için veri toplamak, analiz etmek ve yorumlamak.

Bugün istatikçiler, örnek büyüklüğü, ham veri veya etki büyüklüğü gibi metodoloji ve analiz kavramlarına kafa yorarken tarih boyunca demografik ve ekonomik veri toplama kavramı çoğunlukla ekonomi, nüfus ve tarımın hareketlerini araştırmakla ilgilenmiştir.

İstatistiğin tarihsel evriminin birçok versiyonu mevcut olmakla birlikte, istatistiğin temelleri üç ana aşamaya ayrılabilir.

İlki hijyen ve ekonomik koşulları iyileştirmek için sayım yapma ve gözlem verileri toplamaktır. İkincisi İkinci Dünya Savaşı'nın ardından güçlü bir biçimde uygulanan demografik ve ekonomik verilerin devlet tabanlarına kaydedilmesidir. Üçüncüsü ise bugüne kadar devam eden, teknolojik gelişmelerin getirdiği istatistiksel çıkarımdaki devrimleri içermektedir.

Biyoistatik gibi canlı tasarruf alanları ile veri analizi yöntemlerinin geliştirilmesi tüm dünyada yaşam standartlarını değiştirmiştir.Bugün istatistik bilimi, veri bilimiyle iç içe geçmiş bir konumdadır. İstatistiksel modeller, genellikle sayısal olmayan verilerden çıkarımlar yapılmasına yardımcı olan yapay zeka veya makine öğreniminde kullanılanları içerecek şekilde büyüdü. İstatiksel ve analitik yazılımların icadıyla birlikte tahmin etme veya otomatik rastgeleleştirme işlemleri çok daha hızlı bir şekilde gerçekleştirilebiliyor.

İstatistik ve veri bilimi alanında karşılaşabileceğiniz en yaygın dillerden veya programlardan bazıları R, Stata, SPSS, Python, C, ve SQL'dir.

Temel istatistik öğrenmeye başlayın
İstatistik eğitimi erken yaşlarda başlar. |Kaynak: Pixabay

Betimsel İstatistik

Fen dersi projesi için bir histogram oluşturduysanız veya iş yerinde düzenli olarak veri görüntüleme araçları kullanıyorsanız, istatistik disiplininin en önemli dallarından biri olan betimsel istatistiği kullandınız demektir.

İki ana koldan oluşan betimsel istatistiğin ilk kolu veri sonrası veri toplama ile ilgilenir ve veri kümesinin kompozisyonunu anlamak için istatistik yöntemler kullanmaya çalışır. Genellikle herhangi bir çalışma tasarımının ilk bölümünde betimsel istatistikler, dikkate alınan nitel ve nicel verilere ilişkin önemli öngörüleri ortaya koymaktadır.

Veri sıralı, kategorik veya sayısal olsun, betimsel istatistikler şu iki kategoriyi kapsar: merkezi eğilim ve değişkenlik ölçüleri. Merkezi eğilim ölçüleri, bir veya daha fazla metrik için ortalamanın ne olduğunu anlamak istendiği zaman kullanılır.

Bu ölçümler örnek ortalama, medyan (Ortanca) ve mod (Tepe değer) gibi unsurları içerir. Bu üçü aynı gibi görünse de verilerin büyük miktarda aykırı değerlere sahip olup olmamasına bağlı olarak farklı durumlara uygundur. En deneyimli veri bilimcileri bile temel betimsel istatistik analizi yapmadan verileri hakkında hiçbir şey yorumlayamaz.

Değişim ölçüleri ise standart sapma, kovaryans veya varyans gibi özellikleri içerir. Verilerin merkeze ne kadar yayıldığını gösterdiği için, verinin yayılımı öğrenilmek istendiğini zaman kullanılır. Bu, verilerinizin yüzde kaçının belirli bir aralığın altına düştüğünü anlarken son derece yardımcı olabilir.

Mali istatistiğe uygulandığında standart sapma aynı zamanda belli bir veri kümesinin volatilitesi olarak da görünebilir.

Betimsel istatistikler çoğunlukla sadece bir değişkeni analiz etme eylemi olan tek değişkenli analize uygundur. Bu, gelir veya satış gibi şeylerin yapısını anlamanın bir yolu olarak işlev görürken aynı zamanda çok değişkenlilerin yapılarını karşılaştırırken de kullanılabilir. Örneğin, küçük bir işletme belli bir durumun satış verilerinden faydalanmak isterse belli bir yaşın üstünde veya altındaki müşterilerin yüzdeliğine karar vermek için betimleyici istatistiği kullanabilir.

Bireyler, şirketler ve hükümetlerin kullandığı istatistiğin çoğunluğu aslında betimleyici istatistiktir. Gelecekteki olayları öngörmek çok önemli olsa da çoğu insan karar vermelerine yardımcı olacak anlamlı bilgiler elde etmek için sadece merkezi eğilim ve değişkenlik ölçümlerine ihtiyaç duyar. Betimsel istatistikte yer alan en güçlü ölçeklerden bazıları şunlardır:

  • Korelasyon katsayısı
  • Basit veri görüntüleme
  • Dağılımlar (binom, normal, Laplace, vb.)
Olasılık istatistik kavramlarını öğrenmek
Verilerin grafiğini oluşturmak veri analizinin en temel bileşenlerindendir. |Kaynak: Pixabay

Çıkarımsal İstatistik

İstatistiğin bir diğer yaygın kullanılan dalı verinin içinde ne olduğunu anlamak ve eldeki verilerle tahmin yapmak için olasılık ve istatikleri birleştirir. Çıkarımsal istatistik olarak adlandırılan bu tür istatiksel analiz, çok değişkenli  veya birkaç değişkenli analiz yapmak için tipik olarak olasılık teorisinden ve olasılık dağılımından yararlanır.

Matematiksel istatistik olarak da bilinen bu teori kapsamında yer alan istatistiksel teori, parametrik olmayan modellerle olasılık dağılımları kullanılmadan verilerdeki önemli ilişkileri ortaya çıkarabilir.

Çıkarımsal istatiksel veri analizinin çoğunda kullanılan model türleri çoğunlukla genel doğrusal regresyon modelleri veya varyans analizi testleri (ANOVA) gibi parametrik modelleri içerir.

Bununla birlikte, parametrik veya parametrik olmayan tetikler olup olmadığına bakılmaksızın, matematikçi veya istatikçi iki kriteri karşılamalıdır: test etmek istedikleri bir dizi değişkene sahip olma ve verilerinin belirli varsayımları karşılaması.

İlk kriter basittir ve hepimizin anlayabileceği bir süreci içerir; bir bağımsız değişkeni veya daha fazlasını tahmin etmek için bir veya daha fazla bağımlı değişkeni seçmek. İstatikçilerin problem yaşadığı nokta ikinci kriterdir çünkü çoğu veri kümesi, normal bir dağılımı izleyen veriler gibi, belirli modelleri kullanmak için gereken varsayımlara tam anlamıyla uymaz.

Klasik doğrusal modeller için Gauss-Markov varsayımı en yaygın bilinenlerdendir ve çıkarımsal istatistiği anlamanın anahtarıdır. Çıkarımsal istatistik, betimsel istatistikten oldukça farklıdır çünkü alternatif bir hipoteze karşı sıfır hipotezini test etmeyi içerir. R veya SPSS istatistik yazılımlarının yanısıra mevcut modelleri kullanarak güven aralıkları ile birlikte estimatorler ve tahminler elde edebilirsiniz.

İstatistiği öğrenmeye yeni başladıysanız en yaygın parametrik modeller şunlardır:

  • Genel doğrusal modeller
  • Lojistik regresyon modelleri

Daha az bilinen parametrik olmayan modeller ise şunlardır:

  • Küme analizi
  • Faktör analizi
  • Diskriminant analizi

Bu modellerin yanı sıra ANOVA, istatistikçilerin iki veya daha fazla modelin varyanslarını karşılaştırarak hangi modelin daha kesin sonuçlar vereceğine karar verirken kullandığı modeldir.

İstatistik yöntemler telefonumuzda bile var
İstatistik aslında hayatın her alanında var, biz farketmesek de! Kaynak: Unsplash

İstatistik Kaynakları ve İpuçları

Kategorik veri analizi ile hangi istatistiksel metodolojinin kullanılacağını anlamaktan rastgele değişken kavramının en küçük kareler ve regresyon analizini nasıl etkilediğini anlamaya kadar birçok bilgi edinebileceğiniz birçok kaynak mevcut. Online ortamı etkili kullanarak bu bilgilere kolayca ulaşabilirsiniz.

İstatistiğin alt dallarıyla ilgili daha ayrıntılı bilgi edinmek için yazımıza göz atın!

Akademik

Bağımlı değişkeninizin istatistiksel önemini yorumlamak veya gözlemsel verilerinizde hangi parametrik testin uygulanacağını bilmek için yardıma mı ihtiyacınız var? Güvenilir bir istatistik forumu olan StackExchange'i inceleyerek sorularınızın cevabını bulabilirsiniz.

İstatistik alanında ders almak istiyorsanız Superprof'un yüzlerce matematik öğretmeninden birine danışabilirsiniz. Ki-kare testlerinden veri setlerinden çıkarımlar yapmaya kadar bir matematik öğretmeni size bu alanda rehberlik edebilir. İstatistik temel kavramlar ve olasılık istatistik gibi basit konularda da öğretmeninize danışabilirsiniz elbette!

Programlama

Stackoverflow ise kodlamayla ilgili, deneysel tasarımınıza belirli uç değeri eklemekten regresyon analizi yürütmeye kadar her türlü şeyde size yardımcı olacak harika bir online forumdur.

öğretmenine mi ihtiyacınız var?

Makaleyi beğendiniz mi?

5,00/5 - 1 vote(s)
Loading...

Şule

Selam ben Şule! Seyahat etmeyi, keşfetmeyi ve yeni insanlar tanımayı seven, dillerin yapı ve kurallarına büyük ilgi duyan biriyim.