Makine öğrenimine başlarken, bu alanda sıklıkla kullanılan terimlerin ne anlama geldiğini ve nerelerde kullanıldığını bilmek oldukça önemlidir. Makine öğrenimi için en çok kullanılan 6 terimi sizin için sıraladık:
1. Algoritma
Algoritmalar, makine öğrenimi alanında temel unsurdur. Algoritma; bir problemin nasıl çözüleceğini adım adım açıklayan mantıksal bir talimat dizisidir ve genellikle basit if → then ifadeleri dizisi olarak çalışır. Makine öğrenimine başlarken hangi algoritmanın kullanılacağına karar vermek zor olabilmektedir.
Makine öğreniminde kullanılan popüler algoritma aileleri; kümeleme, regresyon veya öneri algoritmalarıdır.
Farklı algoritmaların kullanılmasının nedeni; veri kümesinin boyut, kalite ve yapı bakımından büyük ölçüde değişiklik gösterebilmesidir. Bir algoritma seçmek aynı zamanda hesaplama gücüne erişiminiz, görevinizin aciliyeti ve nihai hedeflerle alakalıdır. Bu algoritmaları derinlemesine araştırarak, deneyerek ve çözerek kendiniz için doğru algoritma dizisini yaratabilirsiniz.
2. Derin Öğrenme
Derin öğrenme, yeni başlayanlar için göz korkutan bir kavramdır. Kısaca derin öğrenme; insan beyniyle aynı sonuçları yeniden üretmeye çalışan bir dizi algoritmadır.
Algoritmalar aslında beynimizin yapısına çok benzer olarak çalışır. Beynimizde bulunan nöronlar, derin öğrenmede katmanlar olarak adlandırılmaktadır.
Derin öğrenme algoritmaları tıpkı beynimiz gibi çalışmaktadır. Yeni birşey öğrenmek, konuşmak, araba sürmek gibi bizlerin çok kolay yaptığı eylemler gibi, derin öğrenme algoritmaları da beynimizi örnek alarak bu davranışları taklit edebilir.
3. Sinir Ağları
Sinir ağları, çoklu katmanlara sahip olan insan beyni gibi karmaşık bir yapıya sahip olan, makine öğrenimi algoritmalarıdır. Aynı beynimizde olduğu gibi; girdiler sinir ağı tarafından algılanır, daha sonra da gizli nöron katmanından geçirilir. Geçirilen girdi bir çok katmanı dolaşarak, sonucunda bir tahmin üretir.
Sinir ağları, gradyan inişi gibi optimizasyon teknikleri kullanılarak yinelemeli şekilde eğitilir. Her eğitim döngüsünden sonra, tahmin ve hedef arasındaki farka dayalı olarak bir hata ölçüsü hesaplanır.
Hata ölçüsünün türevleri de hesaplanarak, geri yayılım adı verilen teknik kullanılır ve ağ üzerine yayılır. Her bir sinirin ağırlıkları, toplamı hataya ne kadar sıklıkla katkıda bulunduklarına göre ayarlanır. Bu işlem yinelenir ve hata kabul edilebilir eşiğin altına düşene kadar tekrarlanır.
4. Veri Kümeleri
Makine öğreniminin en önemli parçalarından biri verilerdir. Makine öğrenimi projesi oluşturmak istiyorsanız, öncelikli olarak veri toplamanız ya da açık kaynaklı verilerden yararlanmanız gerekmektedir.
Veri bilimcileri, veri kümelerini 3 ayrı gruba ayırmaktadır:
Eğitim Verileri:
Oluşturduğunuz makine öğrenimi modelini eğitmek için kullanılırlar. Eğitim verileri; makine öğrenimi modelinin hangi verileri gördüğünü, tahmin sırasında ortaya çıkacak kalıpları ya da hangi özelliklerin önemli olduğunu belirlemeye de yardımcı olur.
Doğrulama Verileri:
Doğrulama verileri, model parametrelerini ayarlamak ve en iyilerini belirlemek için farklı modelleri karşılaştırır. Doğrulama verileri eğitim aşamasında kullanılacağı için, eğitim verilerinden farklı olmalıdır. Eğer doğrulama verileri farklı olmazsa, oluşturulan makine öğrenimi modelinde çok fazla uyumluluk görülecek ve yeni ortaya çıkan veriler yetersiz olacaktır. Bu durum, modelin doğruluğunun sorgulanmasına neden olabilmektedir.
Test Verileri:
Modelin daha önce karşılaşmadığı veriler üzerindeki davranışını ölçümlemek için kullanılır.
5. Regresyon
Regresyon, iki ya da daha çok değişken arasındaki ilişkiyi ölçmek için kullanılır. Problemleri çözmek için, bir değişkenin davranışını kantitatif veya nitel olabilen değişkenlere dayalı olarak modellemeye çalışır ve olası tahminler yapar. Bu esnada doğrusal regresyon, karar ağaçları, rastgele orman ve gradient-boosted regresyon ağaçları kullanılabilir.
6. Doğal Dil İşleme (NLP)
Doğal dil işleme ya da bilinen adıyla NLP (Natural Language Processing), insan iletişiminin makineler tarafından taklit edilmesi olarak açıklanabilir. NLP, hem yazılı hem de sözlü olarak insan iletişimini kapsar.
NLP'nin, oldukça fazla pratik uygulaması bulunmaktadır ve makine öğrenimindeki gelişmeler sayesinde, bu pratik uygulamaların sayısı günden güne artmaktadır.
Bu uygulamalara metin çevirisi, sesli metin okuma, sesi metne çevirme, sınıflandırma ve duygu ifadelerini örnek verebiliriz. Telefonlarımızda ve bilgisayarlarımızda kullandığımız Alexa ve Siri gibi sanal asistanlar doğal dil işlemenin güncel ve sık kullanılan örnekleridir.