Yapay zekâda yeni dönem: Kendiliğinden denetimli öğrenmenin gücü

​Çocuklar gibi öğrenmek
​Çocuklar gibi öğrenmek

İşte kendiliğinden denetimli öğrenme (Self- Supervised Learning, SSL), bu sayfanın spotunda bahsettiğimiz zorluğu hafifletmek için ortaya çıkmış, nispeten yenilikçi bir yöntem. Ham verideki desenleri kendi başına keşfetmeye dayalı bu yaklaşım, makine zekâsının daha esnek, daha güçlü ve insan müdahalesine daha az bağımlı hâle gelmesinde kilit rol oynuyor.

Kendiliğinden denetimli öğrenme, aslında bir çocuğun dünyayı adım adım keşfetme biçimine benzetilebilir. Düşünün ki kimse bir çocuğa, gördüğü her nesnenin adını tek tek söylemiyor veya onun her etkileşimini baştan sona etiketlemiyor. Buna rağmen o çocuk; yine de gözlemleyerek, dokunarak, dinleyerek ve kendi deneyimlerinden hareket ederek nesnelerin ne olduğunu, nasıl etkileşime girileceğini anlayabiliyor. SSL de tıpkı bu süreç gibi modelin, “Bu nedir, şu nedir?” diye kategorize edilmesine gerek duymadan ham veriyi analiz etmesini sağlıyor. Örneğin bir metin, görsel veya ses dosyasının bir kısmı modelden saklanıyor ve makineden, geri kalan ipuçlarına bakarak saklanan parçayı tahmin etmesi isteniyor. Bu sayede sistem, etiketlenmiş verilere bel bağlamadan dil kurallarını, görsel unsurları veya başka tür örüntüleri kendiliğinden kavramaya başlıyor.

Yöntemin en dikkat çekici yararı, veri etiketlemenin maliyet ve insan emeği açısından büyük oranda hafiflemesi. Sağlık alanında, binlerce radyoloji görüntüsünde tümör gibi anormallikleri işaretlemek, uzman hekimlerin uzun saatlerini alabilir. Oysa etiketleme ihtiyacını azaltacak bir mekanizma, çok daha geniş bir veri havuzundan yararlanarak modelin genel özellikleri tanımasını, sonrasında ise sadece az sayıda örnekle hastalık teşhisi yapacak kıvama gelmesini sağlar. Nitekim bazı araştırmalarda, röntgenler üzerinde tamamen etiketsiz bir şekilde ön eğitim alan bir modelin, -daha az sayıda etiketli örnekle bilebeklenenden yüksek teşhis başarısı yakaladığı bildiriliyor. Böylece nadir hastalıklar veya kısıtlı veri bulunan tıbbi durumlarda bile, yapay zekânın etkin hâle gelmesi mümkün olabiliyor.

Benzer bir tabloyu finans sektöründe de görmek mümkün. Bankalar her işlemi tek tek, “Dolandırıcılık var mı yok mu?” diye etiketlemek istese muazzam bir iş yüküyle karşılaşırdı. Kendiliğinden denetimli öğrenme temelli bir yapay zekâ modeli ise önce normal finansal akışın genel kalıplarını yakalayarak, anormal veya beklenmedik işlemleri ayırt etmeyi öğrenebiliyor. Böylece etiketli verinin çok sınırlı olduğu senaryolarda dahi, geniş çaplı sahtekârlık tespiti ve risk analizleri yapılabilmesi kolaylaşıyor. Bu da büyük kurumlar için veri işleme süreçlerini hızlandıran, güvenliği artıran bir yaklaşım olarak dikkat çekiyor.

Öte yandan doğal dil işleme (NLP) tarafında GPT benzeri devasa dil modellerinin başarıları, aslında kendiliğinden denetimli öğrenmenin somut bir meyvesi. Bu modeller, internetteki milyarlarca kelimeyi herhangi bir insan etiketine ihtiyaç duymadan inceleyerek kelime ilişkileri ve dil kuralları hakkında derin bir sezgi geliştiriyor. Ardından çok az sayıda etiketli örnekle bile özet çıkarma, duygu analizi, çeviri ve benzeri görevlerde güçlü performans gösterebiliyorlar. Böyle bir sistemin, insan gibi “deneme yanılma” yapması gerekmediği, ham veriyle dev miktarda pratik yapabildiği düşünülürse elde edilen sonuçların neden bu kadar hızlı geliştiğini anlamak zor değil.

Teknik açıdan bakmak gerekirse SSL, genellikle iki temel yaklaşımdan biriyle yürütülüyor: maskeleme (örneğin bir metindeki kelimeleri saklamak) ve karşıt (contrastive) öğrenme (farklı dönüşümleri benzer olarak, farklı verileri de farklı olarak etiketlemeye dayalı sistem). Maskeleme yaklaşımı, modelin eksik parçayı tahmin etmesini isterken ona verinin geri kalanının bütünlüğünü analiz etme becerisi kazandırıyor. Görsellerde veya videolarda eksik bölge tahmini yaparak, görüntünün genel yapısını kavrayan modeller geliştiriliyor. Kontrastive yaklaşımda ise aynı örneğin farklı versiyonlarını birbiriyle eşleştirip, bambaşka örnekleri ise uzak tutmayı öğrenerek sistemin veri içindeki benzerlikleri ve farklılıkları tanıması sağlanıyor. Her iki yöntemin ortak noktası, insan etiketçilerin devreye girmeden modelin kendi “soru-cevap” mekanizmasını kurması.

Tüm bu anlatılanlar düşünüldüğünde kendiliğinden denetimli öğrenmenin, yapay zekânın geleceğine dair büyük bir heyecan yarattığını söylemek zor olmayacaktır. Yapay zekâ araştırmacıları, sadece hazır veriler üzerinde etiketleme yapmak yerine, makinenin gündelik dünyanın karmaşık verisiyle kendi başına “muhakeme” yolunu bulmasını sağlamanın, genel yapay zekâ vizyonu için de kritik olduğunu düşünüyor. Nasıl ki bir çocuk çevresini izleyerek motor becerilerini, dil kalıplarını ve fizik kurallarını fark etmeden öğreniyorsa makinenin de veriye bu gözle bakabilmesi hedefleniyor. Bu bakış açısı, sistemin beklenmedik durumlara adaptasyonunu güçlendirebilir. Örneğin otonom araçlar, milyonlarca saatlik sürüş kaydını izleyip sıradan veya sıra dışı trafik senaryolarını kendi kendine “öğrendikten” sonra, çok az ek bilgiyle dahi güvenli sürüş dinamiklerini kavrayabilir.

Elbette bu yöntemin de hâlâ incelenmesi gereken zorlukları var. Örneğin tamamen etiketsiz veri içerisinde yanıltıcı veya dengesiz örnekler yer alabilir; model, bulduğu desenleri aşırı genelleyebilir ya da öğrenme sürecinde bazı önyargılarla karşılaşabilir. Ayrıca SSL ile temel becerileri kazanan bir yapay zekânın, belli bir göreve tam olarak uyum sağlaması için az da olsa etiketli veriye ihtiyaç duyulabiliyor. Yine de bu yaklaşımın veri toplama ve etiketleme sürecindeki yükü azaltması, onu oldukça cazip hâle getiriyor. Daha da önemlisi tıp, finans, endüstriyel otomasyon, dil işleme gibi geniş yelpazede kullanım alanı bulması, SSL’i makine öğrenmesi ekosisteminin vazgeçilmez oyuncularından biri yapıyor.

Sonuç olarak kendiliğinden denetimli öğrenme, yapay zekâda en kritik kaynaklardan biri olan etiketli veriye olan bağımlılığı önemli ölçüde azaltarak sistemi daha özgür, daha genel ve daha hızlı öğrenebilir hâle getiriyor. Çocukların dünyayı keşfindeki merak ve gözlem esaslı yaklaşımın makinelerde de kullanılması fikri, gelecekte “etrafını anlayan” ve kapsamlı çıkarımlar yapabilen bir yapay zekâya giden yolda büyük bir adım olarak görülüyor. Bu yaklaşım ilerledikçe sadece belirli veri kümelerinde uzmanlaşan dar yapay zekâ modelleri yerine, çok farklı alanlara uyarlanabilecek, daha geniş görüşlü ve becerikli sistemlerin ortaya çıkması bekleniyor. Dolayısıyla, SSL’in sunduğu potansiyel, veri etiketleme zahmetini ortadan kaldırmaktan çok daha fazlası diyebiliriz. Bir başka deyişle makine zekâsının sınırlarını yeniden tanımlamaya aday bir paradigma.

*Bu yazının başlığı yazardan bağımsız editoryal olarak hazırlanmıştır.