top of page

Makine Öğrenimi Modellerinin Artan Eğitimi için Veri Tankları

Veri gölü (data lake) terimini biliyorsunuz. Veri gölü, sınırsız sayıda veri depolamak için kullanılan bir havuzdur. Bugünlerde, bulut hizmet sağlayıcılarının çoğu, verileri geldikçe depolamak için ölçeklenebilir veri göllerini barındırılmasına izin veriyor. Bu veri göllerini kullanmak için, verilerin yapılandırılması gerekli değildir ve üzerinde farklı türde uygulamalar çalıştırılabilir. Bunlar genellikle büyük veri analizi ve makine öğrenimi uygulamalarıdır. Bu uygulamaların tüm verilerin bir veri gölünde bulunması gerekir ve göle yeni veri kümesi eklendiğinde, analitik ve makine öğrenimi eğitim sürecini tekrar tekrar yapmamız gerekir. Bu, çözümlerin teslim tarihini etkileyen zaman alıcı bir işlemdir.


Büyük veri analizi ve makine öğrenimindeki son gelişmeler ise artımlı analitik ve artımlı eğitimdir. Artımlı öğrenme, mevcut bir makine öğrenimi modelinin bilgisini yeni verilerle daha da eğiterek genişletir. Bu ilerlemeyle, veri gölüne yeni veriler ekledikten sonra süreci tekrar tekrar yürütmeniz gerekmez. Artan öğrenmeyle, uygulamayı yeni eklenen veriler üzerinde çalıştırarak yakalanmış olan sonuçları ve yapay zekâya aktarabiliriz. Bir analiz ve makine öğrenimi iş akışını sürdürmek için, modelin ilk sürümü oluşturulduktan sonra bir veri gölüne abone olmamıza gerek yoktur. Toplu verilerle ilgili ilk analiz ve eğitim tamamlandıktan sonra, "Veri Tankları" ndaki artımlı verileri koruyarak artımlı öğrenmeyi yapabiliriz. Veri Tankları artımlı öğrenmeyi kolaylaştırır. Veri göllerinin aksine, veri tanklarının kapasitesi sınırlıdır. Bu, bulutlarda abonelik maliyetinden tasarruf edilmesine yardımcı olur. Tıpkı bir su deposu gibi, veriler veri deposuna doldurulur ve maksimum kapasiteye dolduğunda, büyük veri analizi / makine öğrenimi eğitimi tetiklenir. Bu uygulamalar, halihazırda yakalanmış sonuçlar üzerinde artan güncellemeler yapar. Artımlı öğrenme tamamlandığında, tankta depolanan veriler başka bir veri kümesinin saklanması için yer açmak üzere boşaltılabilir. Temel olarak, veri deposu yeniden kullanılır ve veriler kalıcı olarak depolanmaz.


IoT teknolojisinin evrimiyle birlikte makine öğrenme modelleri edge cihazlarda devreye giriyor. Edge cihazlara yerleştirilen modeller çok sayıda çevrimiçi veri görür ve zaten bu modelleri yeni verileri kullanarak eğitmek zordur. Tam teşekküllü makine öğrenimi eğitim sürecini yürütmek için, cihazın büyük miktarda depolama ve bellek kapasitesine sahip olması gerekir. Veri Tankları bu noktada faydalı olur. Tanklar edge cihazlara yerleştirilebilir ve tankların kapasitesine cihazdaki kullanılabilir depolama alanına göre karar verilebilir. Artımlı öğrenme, modelleri artımlı bir şekilde eğitmek için kullanılan bir dizi teknikten oluşur.


Modeller Keras kullanılarak yada TensorFlow çerçevesi kullanılarak geliştirilirse, Keras ve Creme ile çevrimiçi ve artımlı öğrenmeye sahip oluruz. Creme, özellikle artan öğrenmeye göre uyarlanmış bir kütüphanedir. Amazon SageMaker, artımlı öğrenme için yerleşik algoritmalar sağlar. Bu özellik, istihbaratını aşamalı olarak güncelleyebilme özelliği ile edge uygulamalarına öğrenme uygulamaları dağıtırken Veri Tanklarından yararlanmanıza yardımcı olur.


Artımlı öğrenme için Veri Tankları uygulamaktan çekinmeyin ve modelleri yeniden eğitmek için gereken süreyi kısaltın.

Son Yazılar

Hepsini Gör

Makine Öğreniminde En Çok Kullanılan 6 Terim

Makine öğrenimine başlarken, bu alanda sıklıkla kullanılan terimlerin ne anlama geldiğini ve nerelerde kullanıldığını bilmek oldukça önemlidir. Makine öğrenimi için en çok kullanılan 6 terimi sizin iç

bottom of page