Hemen hemen herkesin istatistik hakkında bir fikri vardır. Yüzde birlik yorumlamak ve ki-kare testi uygulamak gibi işlemleri içeren istatistik alanı oldukça geniştir ve hayatımızın her alanına uygulanabilir: politika, aşk hayatı, iş dünyası ve daha nicesi. Veri analizinin başlangıcı çok eski zamanlara dayanan karmaşık kuramlar içerse de temel noktalarını anlamakta pek zorlanmazsınız.

Bu yazıda istatistiksel çıkarımlardan ayrıntılarıyla bahsettik. Okumaya devam edin!

Çıkarımsal istatistik nedir bilgisayar diliyle anlayalım
Temel istatistik kavramlarını bilmek farklı bilgisayar dillerini keşfetmenize yardımcı olabilir. |Kaynak: Pixabay

İstatistiğe Giriş

Veri analizi ve istatistiksel metodlar son zamnlarda karşımıza sık sık çıkar oldu. Bunun sebebi de online internet alışverişinden sevgili bulma uygulamalarına kadar hayatımızın her alanında veri kullanımının giderek artması olabilir. Biyoistatistik ve iş analitiği gibi alanları kapsayan istatistik veri ve istatistik çıkarım, aslında bilgisayarların icadından çok daha önce de kullanılıyordu.

Eski dünyanın istatistikçileri kategorik ve sayısal verileri tarım, hava durumu ve ticaret gibi alanlardaki hareketleri kaydetmek ve analiz etmek için kullandılar. Bayes istatistiği, tahmin yapmanın daha karmaşık yöntemlerini dahil ederek istatikçilerin çalışmalarında devrim yaratmış olsa da modern dünyadaki istatistikler bu disiplinin başlangıcındaki üç temel yapıyı korumuştur.

  • Örnek büyüklüğü ile veri toplama
  • Veriyi analiz etme
  • Bu verilerden elde edilen sonuçları göstermenin veya yaymanın çeşitli yollarını kullanma

Yeni Başlayanlar için İstatistiksel Hesaplama

İstatistik analizin çetrefilli ayrıntılarını kavramak yeni başlayan biri için biraz zordur fakat en tecrübeli istatistikçi veya veri bilimcisi bile olasılık ve istatistik hakkındaki bilgilerini arada bir tazelemesi gerekir.

İstatistiksel tekniklerin veya teorilerin tamamını birkaç paragraf okuyarak anlamak imkansız görünebilir, özellikle de matematiksel istatistik becerileriniz yeterince gelişmemişse. Ancak istatistiksel veri analizi, bütçenizi ayarlamaktan işyerinde kapsamlı veri görselleştirmeleri oluşturmaya kadar günlük hayatta kullandığımız bir şeydir.

İstatistiksel analiz dünyasına giriş yaparken öncelikle istatistiğin iki ana dalının arasındaki farkları bilmemiz gerekiyor. Bakalım betimsel istatistik ve çıkarımsal istatistik arasındaki fark nelerdir. Betimsel istatistik ham veride ne olduğunu tanımlamak ve ölçmek için kullanılırken, çıkarımsal istatistikte örnek verilerle genel nüfusla ilgili kullanışlı tahminler yapmak için kullanılır.

Çıkarımsal istatistik, gerçek hayatta gerçek nüfusun ölçülmesi gibi, gerçek hayatta ölçemediğimiz ölçümleri tahmin etmek için örnek veriler üzerinde bir hipotezi ve sıfır hipotezini test eder. Veya diğer bir deyişle çıkarımsal istatistik, bir veriyle ilgili tahminler yürütmek için veri kümesini kullanır. İster nitel veriler veya nicel veriler olsun, çıkarımsal istatistik dünyadaki veri bilimcileri için en önemli araçlardan biridir.  Dünya hakkında yararlı tahminlerde bulunmak için olasılık teorisi ve lineer regresyon gibi yöntemleri kullanır.

Betimsel İstatistik

Sıralı veri regresyonu merkezi eğilim modellerine girmeden önce keşifsel analizlerde en yaygın kullanılan araçlara bir göz atalım. İstatistikte veriler tek değişkenli veya çok değişkenli metodlar yoluyla analiz edilir yani ya tek bir değişken ya da birden fazla değişken analiz edilir.

Genellikle tek değişkenli analiz yöntemlerinin kullanımı , belirli değişkenlerin ölçülerine bakmanın ve karşılaştırmanın veri kümesindeki önemli özellikleri vurgulanmasını sağlayan keşifsel analizin başlangıç safhasında daha anlamlıdır.

Betimsel istatistiğin kapsamlı bir açıklaması olmasa da bağımlı veya bağımsız değişkenleri anlamak için aşağıda bahsettiğimiz temel bilgileri çalışma tasarımınıza uygulayabilirsiniz.

Merkezi eğilim ölçüleri veya ortalama veri görünümü örneklem ortalama, etki büyüklüğü, medyan ve moddur. Değişkenlik ölçüleri ise verilerin ortalamadan ne kadar yayıldığını ölçmeye çalışır ve varyans, kovaryans ile standart sapmayı içerir.

Bu bilgiler size çok basit gelse de, istatistik kullanan birçok sanayi çıkarımsal istatistiğin altında yer alan daha karmaşık yöntemleri kullanmaya gerek bile duymuyor. Örneğin, histogram veya pasta grafiği gibi betimsel istatistiğin veri görselleştirmesini kullanarak bir şirket en büyük maliyet problemlerini bile tespit edebilir veya ortalama bir müşterinin özelliklerini belirleyebilir. Bu şekilde, keşifsel analiz hem veri görselleştirme hem de analiz için güçlü bir araca dönüşebilir.

 betimsel istatistik ve çıkarımsal istatistik arasındaki fark tablolarla anlaşılır
İstatistiksel analiz yöntemleri şirketlerde sıkça kullanılır. |Kaynak: Pixabay

Çıkarımsal İstatistik

En deneyimli matematikçileri bile tir tir titreten konuya geldik. İstatistiğin bu dalı, kategorik veriyle regresyon analizi veya binom dağılımı gibi karmaşık istatistiksel konuları içerse de temellerini kavramak aslında epey kolaydır.

Çıkarımsal istatistiğin temelinde olasılık teorisi vardır. Tahminciler için bir güven aralığı oluşturmaktan bağımlı bir değişken için istatistiksel anlamlılığa ulaşmaya kadar neredeyse tüm istatistiksel metodoloji olasılık teorisine dayanır.

Çıkarımsal istatistik nedir konusunda istatistikçiler ikiye bölünür: Frequentistler ve Bayesçiler. Frequentistler olasılığın gerçek bir deneme ya da deneyden elde edilen sonucun sıklığının ölçüsü olduğuna inanırken Bayesçi istatikçiler olasılığın soyut olduğunu ve bilgi ya da önermeye olan inancı ölçtüğünü düşünür. Eğer bu ifadeler size bir anlam vermiyorsa lineer regresyon analizi gibi temel bir istatistiksel modelde normal bir olasılık dağılımının nasıl kullanıldığına göz atmanız faydalı olabilir.

Varyans analizi (ANOVA) veya zaman serisi analizi gibi diğer tüm analiz türlerinde olduğu gibi lineer regresyon analizi yapabilmek için analizin geçerliliğini sağlamak amacıyla veri hakkında tahminler yapılır. En yaygın tahminlerden biri, verinin değişkenlerinin veya hata teriminin normal dağılımı izlediğidir. Bu da modelin geçerliliğini sağlar ve alternatif hipotez ve korelasyon katsayısından tahminci ve güven aralıklarına kadar doğru yorumlamanın temelidir.

R ve SPSS gibi yazılımlar istatistiksel modelleri otomatik olarak yürütse de, doğrusal regresyon ve diğer analiz türlerini kullanmadan önce verilerin varsayımlarını kontrol etmek her zaman önemlidir. Diğer tahminlerle ilgili biraz fikir verecek olursak, Gauss-Markov teoremine bakabiliriz: lineer regresyon modeliniz en küçük kareler yönteminin ilk altı klasik varsayımını karşılıyorsa, regresyon BLUE (best linear unbiased estimator) yani en iyi doğrusal yansız tahmin edicidir.

Bu kısaltmaların akılda kalıcı olmasının yanı sıra, bu varsayımları karşılayan herhangi bir verinin tüm olası tahmin ediciler arasında en az varyansı ile tahmin edicileri üretebileceği gerçeğinin altını çizer. Tek dezavantajı bu varsayımların gerçek hayatta neredeyse hiç karşılanmamasıdır. Aşağıdaki maddelere bir göz atın anlayacaksınız.

  • Hem katsayılar hem de hata terimi bakımından model lineerdir
  • Hata teriminin beklenen değeri ya da ortalaması sıfırdır
  • Bağımsız değişkenler hata terimiyle ilintisizdir
  • Hata teriminde sabit varyans olarak da görünen hiçbir değişen varyans yoktur
  • Bağımsız değişkenler arasında mükemmel bir korelasyon yoktur

Her deneysel tasarımda sıklıkla karşılaşabileceğiniz en yaygın istatistiksel modellerden bir tanesi de  Genel Lineer Model'dir. Bu model temelde basit bir lineer modeldir fakat faktör analizi, küme analizi ve çok değişkenli analiz yöntemlerinde kullanılır. Çok fazla detaya girmeden, hem kategorik hem de sayısal verileri analiz ederken GLM yöntemini kullanmak ve veriler için en iyi modeli belirlemeye yardımcı olmak için t-testi gbi önemli kavramları kullanır.

T-testi temelde, iki grubun ortalamalarının istatistiksel olarak birbirinden farklı olup olmadığını ve bir lineer modelin diğerinden daha iyi olup olmadığı hakkında çıkarımlar yapmak için kullanılabilirliğini değerlendirir.

istatistik terimleri ve anlamları internetten öğrenebilirsiniz
Bilgisayarın donanımlarından programlarına kadar her zerresinde istatistik kullanılır. |Kaynak:Unsplash

İstatistikçiler için Kaynaklar

Denemelerin rastgeleleştirilmesi veya parametrik modellerin analizi gibi konuları içeren istatistiklerin analizi ve yorumlaması sizi zorlayabilir. Neyse ki online veya yüz yüze derslerle bu konuda size yardımcı olabilecek çok sayıda yöntem mevcut.

Rastgele bir değişkeni, uç değeri veya gözlemsel veriyi almakta güçlük çekiyorsanız internet istatistiksel sıkıntılarınıza adeta bir ilaç gibidir. Belli bir kavram veya problemle ilgili anlamadığınız yerlerde Stack Exchange sayfasına göz atarak sorularınıza cevap bulabilirsiniz.

İstatistik Özel Dersi

Bire bir istatistik özel ders almak istiyorsanız mutlaka Superprof'un deneyimli ve güvenilir öğretmen kadrosuna bir göz atın. Size özel hazırlanan ders programlarında öğretmeninize dilediğiniz soruyu çekinmeden sorabilirsiniz!

Bu makalede tanımlayıcı ve çıkarımsal istatistik, istatistik terimleri ve anlamları hakkında bilgiler verdik. Daha fazla bilgi için diğer makalelerimize de göz atın.

öğretmenine mi ihtiyacınız var?

Makaleyi beğendiniz mi?

5,00/5, 1 votes
Loading...

Şule

Selam ben Şule! Seyahat etmeyi, keşfetmeyi ve yeni insanlar tanımayı seven, dillerin yapı ve kurallarına büyük ilgi duyan biriyim.