Lojistik regresyon nedir?

Bir veya birden fazla bağımsız değişkeni bulunan ve bir sonucu belirlemek için kullanılan istatistik yönetimidir. Var olan bir veri kümesinin analizi sonucu iki olası sonucu bize verir. Doğrusal sınıflandırma problemlerinde kullanılır.

                Lojistik regresyon, ikili(binary) 1 veya 0 olarak kodlanmış verileri içerir.

Örneğin; veri kümesini analizi sonucu makinenin bize kişinin hipertroid olup olmadığını bulacağı bir lojistik regresyon analizi için, sonuç 1 ise sonuç hipertroid, 0 ise hipertroid değil yani negatif, diyebiliriz.

                Bu örnekten yola çıkarak  lojistik regresyonun amacını şu şekilde açıklayabiliriz; iki yönlü karakteristiği olan bağımlı değişkenle ilgili bir dizi bağımsız değişken arasında uygun ilişkiyi tanımlamak için en uygun modeli bulmaktır.

                Lojistik regresyon analizinde dikkat edilmesi gereken noktalar;

  • Bağımsız değişkenler arasında uygun olan tüm değişkenlerin modele dahil edilmesi, böylece model yetersizliğinin önüne geçilebilir.
  • Bağımsız değişkenler arasından uygun olmayan tüm değişkenlerin modelden dışlanması, böylelikle model karmaşıklıktan kurtulur ve yorumlanması kolay bir hal alır.
  • Tekrarlanmış ölçümlerden kaçınılmalıdır.
  • Bağımsız değişkenlerin ölçüm hataları küçük olmalı ve kayıp veri (missing value) olmamalıdır. Hatalar büyük olursa model yanlı ve yetersiz olur.
  • Bağımsız değişkenler birbiriyle ilişkili olmaması gerekmektedir.
  • Uç değerler olmamalıdır.
  • Örneklem sayısı model kurulmasının sağlığı için büyük olmalıdır.

Lojistik regresyon analizi ile ilgili Knime Analytics üzerinden yapılmış örnek çalışmaya bir sonraki makalemizde yer verilmiştir.

Bu makaleyi faydalı bulduysanız yorum yapmayı ve yıldız vermeyi lütfen unutmayınız.

Bu desteğiniz bizi motive edecek ve sizler için daha iyi içerikler hazırlamamızı sağlayacaktır. 

Teşekkür ederiz  bilimselanketler.com ailesi

[ratings]

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.