Kalp hastalığı, dünya genelinde önemli bir sağlık sorunudur ve erken teşhis hayati önem taşır. Bu yazıda, Logistic Regression algoritması kullanarak kalp hastalığı tahmini yapmak için bir makine öğrenimi modeli geliştireceğiz ve bu modelin performansını değerlendireceğiz.
Bu projede kullanacağımız veri seti, veri_kaynağı kaynağından elde edilmiştir. Veri seti kalp hastalığı teşhisi konulan veya konulmayan bireylerin klinik ve demografik özelliklerini içermektedir. Veri setini yükledikten sonra şu adımları uygulayacağız:
- Eksik verileri doldurma
- Kategorik değişkenleri kodlama (one-hot encoding gibi)
- Özellik seçimi (characteristic choice)
- Veri standardizasyonu veya normalizasyonu
Bu ön işleme adımları, modelin daha iyi performans göstermesine ve veri setindeki potansiyel sorunları azaltmaya yardımcı olacaktır.
Logistic Regression, sınıflandırma problemleri için yaygın olarak kullanılan bir algoritmadır. Bu modeli Python’da scikit-learn
kütüphanesi ile kolayca uygulayabiliriz. Modelimizi eğitmek ve check etmek için şu adımları izleyeceğiz:
- Veri setini eğitim ve check setlerine ayırma
- Logistic Regression modelini eğitim seti üzerinde eğitme
- Modelin performansını check seti üzerinde değerlendirme
Eğitim ve check verileri üzerinde elde ettiğimiz doğruluk sonuçları şu şekildedir:
- Eğitim Verilerinde Doğruluk: 0.8512
- Take a look at Verilerinde Doğruluk: 0.8197
Bu sonuçlar, modelimizin eğitim verileri üzerinde %85.12, check verileri üzerinde ise %81.97 oranında doğru tahminler yaptığını göstermektedir. Modelin eğitim ve check verileri arasındaki doğruluk farkı, genel olarak modelin ne kadar iyi genelleme yaptığını gözlemlememize yardımcı olabilir.
Bu yazıda, Logistic Regression algoritması kullanarak kalp hastalığı tahmini yapmak için bir makine öğrenimi modeli geliştirdik. Modelimizin performansını değerlendirdik ve sonuçları yorumladık. Makine öğrenimi projelerinde modelin performansını artırmak için farklı özellik seçimi yöntemleri veya mannequin hiperparametrelerinin ayarlanması gibi ileri düzey teknikleri de deneyebilirsiniz.