Microsoft'un yapay zekâsı kısa sürede metni başarılı bir şekilde konuşmaya dönüştürebiliyor

Yapay zekâ
Yapay zekâ

● Microsoft'un üzerinde çalıştığı yeni yapay zekâ, klasik metinleri hızlıca konuşma metnine çevirebiliyor.

● Sonuçlar ve konuşmalar şimdilik biraz robotik olsa da kelimelerin doğruluk oranı %99.84'e ulaşıyor.
● Artan veri miktarıyla birlikte önümüzdeki dönemlerde çok daha gerçekçi sonuçların ortaya çıkması bekleniyor.

Yapay zekâ teknolojileri birçok farklı alanda aktif olarak kullanılıyor. En basit örnekte son kullanıcılar olarak bugün elimizde tuttuğumuz akıllı telefonlardaki sesli asistanlar tamamen yapay zekâ desteğiyle yeteneklerini geliştiriyor.

Dolayısıyla Google, Facebook, Amazon, Microsoft ve Apple gibi büyük ölçekli birçok şirket aslında son yıllarda sesliasistanlara yoğunlaşıyor. Hatta bu alanda çalışmalar yapan irili-ufaklı şirketleri de bünyelerine katarak daha da güçleniyorlar.

Microsoft yapay zekâsı metinleri hızlıca ve doğru şekilde konuşmaya dökebiliyor.
Microsoft yapay zekâsı metinleri hızlıca ve doğru şekilde konuşmaya dökebiliyor.

Son olarak Microsoft'un üzerinde epey uzun süredir mesai harcadığı 'metni sese dönüştürme' sistemi güncellemeyle daha başarılı hale geliyor. Ancak bir sorun var; doğal ses çıktısı üretmek için hâlâ çok fazla eğitim süresi ve kaynak gerekiyor. Yani aslında yapay zekânın en doğru sonuçları elde edebilmesi için çok fazla veri gerekiyor.

Çinli üreticilerle birlikte çalışan Microsoft, toplamda 20 dakikayı bulan 200 ses örneğinde çeviri yazılarını kullanarak eşleştirmeleri yapıp gerçekçi bir konuşma metni üretebiliyor.

Sistem aslında kabaca nöronları taklit eden derin sinir ağlarına dayanıyor. Transformatörler sinaptik bağlantılar gibi her girdi ve çıktıyı tartıp uzun dizileri bile çok verimli şekilde işleyebiliyor. Örneğin karmaşık bir cümle bile bu sayede net bir şekilde aktarılabiliyor.

Çok büyük oranda doğru sonuçlar elde ediliyor

Evet; sonuçlar hafif robotik şekilde seslendiriliyor. Fakat kelimeler %99.84 oranında anlaşılabiliyor. Daha da önemlisi, bu konuşma metnini daha erişilebilir hale getiriyor. Gerçekçisesler elde etmek için çok çaba harcamaya gerek kalmıyor. Bu aynı zamanda gelecek için iyi bir işaret. Çünkü önümüzdeki dönemlerde artan veri miktarıyla çok daha iyi sonuçlar elde edilebileceği tahmin ediliyor.

Bugünün gazete manşetleri için tıklayın >