• Emre Kutlu

Data Is New Oil - Veri Yeni Petroldür

Büyük veri, veri madenciliği, veri analizi v.b. başlıklı tüm makalelerde kullanılan yegane klişe cümle tartışmasız “Data is new oil” yani “Veri yeni petrol” ‘dür. Ben bu makalede bunu hangi komik gerçeklerle anladığımı anlatmaya çalışacağım.


Bir yüz tanıma yapay zekası ve bu yapay zekanın üzerine entegrasyon katmanı geliştiriyoruz ki global anlamda bir çok mobil uygulamaya v.s. entegre edebilelim. Bu yapay zeka, kişilerin yüzü ile kimliklerini karşılaştırarak aynı kişi olup olmadığını ya da bu kimliklerin sahte olup olmadığını anlıyor. Buraya kadar her şey teoride güzel. Pratikte bizi zorlayan şey ne kod yazmak ne de takım kurmak oldu. Hatta buraları bu kadar kolay aşmak bende “acaba ileride beni ne sürpriz bekliyor” hissiyatını uyandırmıştı. Tam da düşündüğüm gibi oldu ve asıl zorlayan şey veri bulmak oldu. Tüm dünya ülkelerinin vize ve pasaportlarını ve vizelerini bulmak ne kadar zor tahmin edebiliyor musunuz? Bir de bu pasaportların ve vizelerin sahtelik kontrolü için her türlü ihtimal algoritmalarını üretmek ve bunları yapay zekaya göstererek yapay zekayı eğitmek… Hiç bir zaman hayatımda ne kod yazarken ne de proje yönetirken bu kadar zorlanmamışmıştım. İhtiyacımız olan şey “veri” idi ve gerçekten de petrol değerindeydi. Bu veriyi elde etmek için güzel para vermeye de hazırdık.


Bununla boğuşurken bir de yaş, cinsiyet ve ruh halini tahmin eden yapay zekamıza selfie imajları yükleyerek onu eğitme sorunuyla karşı karşıya kaldık. IMDB ‘de aktör ve aktrislerin yüzlerinin olduğu harika bir veri seti var ve bunu kullandığınızda ne mi oluyor? Ajda Pekkan 60 yaş üstü , Brat Pitt 50 yaş üstü… Yapay zekayı yanlış eğittiğimizi farkettik. Bizden genç gözüken 50–60 yaşındaki estetikli kişilerden yola çıkarak bizi dede görmesini yadırgamadım açıkçası. E peki sorun bununla bitiyor mu? Hayır. Etnik kökene göre yaz ve cinsiyet tahmini yapmak üzere eğitmeniz gerekiyor. Örneğin tüm asyalıları 18 yaş altı olarak tahmin edecek bir yapay zekanız olmamasını istiyorsanız bunu etnik kökenlere göre eğitmeniz gerekir. Tüm çinlileri gergin ve parlak hatta sakalsız ciltlerinden ötürü kadın olarak tahmin etmesi de cabası.


Pek tabi yapay zekanızı eğitmenin çok güzel yolu var ve eğittikten sonra hata payı olmayan otomatik bir sistem haline geliyor. Bunun tek yolu sonsuz veri kümesi ile yapay zekanızı besleyerek onu eğitmek. İşte o veriye olaşmak o veri setlerini bulmak ve bunları düzenlemek asıl meşakkatli olan iş. Gelecek sanki bunun üzerine kuruluyor. FaceApp in yaşlandırma uygulamasına yüklenen 15 milyon selfie’nin ne için kullanılacağını düşündünüz ki? Bu veri setinin satılması için kullanılacak.


Şu sıralar ofiste en çok kullandığımız kelime ile yazımı bitiriyorum. “Train The Engine Bro”


Emre Kutlu

0 görüntüleme

© 2023 by Emre Kutlu

  • LinkedIn - Black Circle
  • Twitter - Black Circle
  • Pinterest - Siyah Çember
  • Facebook - Black Circle

Follow me on social netwroks