- Katılım
- 23 Eki 2020
- Mesajlar
- 1,802
K-Nearest Neighbors (KNN)
Veri madenciliği ve makine öğrenimi alanlarında kullanılan bir sınıflandırma ve regresyon algoritmasıdır. Temel fikri, benzer özelliklere sahip verilerin birbirine yakın olma eğiliminde olduğunu varsayar. KNN, bu yakınlık prensibi üzerine kurulmuş bir denetimli öğrenme algoritmasıdır.
KNN'nin çalışma mantığı şu şekildedir:
Veri madenciliği ve makine öğrenimi alanlarında kullanılan bir sınıflandırma ve regresyon algoritmasıdır. Temel fikri, benzer özelliklere sahip verilerin birbirine yakın olma eğiliminde olduğunu varsayar. KNN, bu yakınlık prensibi üzerine kurulmuş bir denetimli öğrenme algoritmasıdır.
KNN'nin çalışma mantığı şu şekildedir:
- Veri Seti: KNN algoritması, etiketlenmiş verilere ihtiyaç duyar. Yani, her veri örneği bir sınıf veya değerle etiketlenmiş olmalıdır.
- Benzerlik Ölçüsü: KNN, iki veri örneği arasındaki benzerliği ölçmek için bir benzerlik ölçüsü kullanır. Öklidyen mesafe, Manhattan mesafe veya kosinüs benzerliği gibi farklı ölçüleri kullanabilirsiniz.
- K Değeri Belirleme: KNN algoritması için en önemli parametre, K değeridir. K, her bir tahminde kaç komşunun dikkate alınacağını belirler. K değeri seçilirken, genellikle deneme-yanılma yöntemi veya çapraz doğrulama kullanılır.
- Tahmin Yapma: Bir yeni veri örneği geldiğinde, bu örneğin K en yakın komşusunu bulunur. Bu komşuların etiketleri incelenir, ve örnek sınıflandırma için en yaygın olarak bulunan sınıfa atanır (sınıflandırma için) veya komşuların hedef değerlerinin ortalama değeri alınır (regresyon için).
- Basit ve kolay anlaşılır bir algoritmadır.
- Model eğitim süreci yoktur, sadece veriyi saklamak gereklidir.
- Kullanımı kolaydır ve hızlı sonuçlar üretebilir.
- Büyük veri kümeleri üzerinde yavaş çalışabilir, çünkü her tahmin için tüm veriyi karşılaştırması gerekebilir.
- Optimal K değerini seçmek bazen zor olabilir.
- Veri dengesizliği durumlarında yanıltıcı sonuçlar üretebilir.