Siz hiç fotoğraf arşivinizdeki bir fotoğrafa bakıp detayları kontrol etmeden fotoğrafın nerede çekildiğini bulmaya çalıştınız mı? Şimdi bir düşünün bakalım bu işi hiç bir bilgi olmadan tahmin etmek ne kadar zor değil mi?
Bugün MIT Teknik İncelemelerinde belirtilen bir yazıya göre Google‘da Bilgisayar Vizyonu Uzmanı olarak görev yapan Tobias Weyand‘ın yönettiği bir projeden bahsetti. Bahsedilene göre proje alınan resimleri piksel seviyesinde parçalayarak bu pikselleri yakınlarındaki piksellerle birlikte olabilecek ihtimalleri resim kütüphanesi içerisinde araştırıyor.
Biraz daha detaylandıracak olursak; misal resmin tam ortasından bir piksel seçiliyor. Sonrasında bu pikselin belli bir mesafe uzaklığa kadar etrafındaki tüm pikseller kullanılarak, resim kütüphanesinde bu piksel ve yakınlarındaki piksele benzeyecek yapıda uygun resimleri arıyor. Benzer yoğunluklara sahip resim yada resimler bulduğunda da fotoğrafın konumunu bulmuş oluyor.
Bu durum tıpkı bir yapbozun bir parçasının hangi konuma tam olduğunu kestirmek gibi aslında. Aradaki fark Google bu aramayı milyonlarca yapboz içerisinde yapıyor.
Bu sofistike yapay zeka altyapısına PlaNet ismini veren Google alt yapı içerisinde tüm dünya genelini kapsayan koordinat bilgileri işli 90 milyon resme sahip. 2.3 milyon resimle yapılan denemelerde PlaNet, zamana göre % 28.4 olaylara göre de %48 oranlarında ülke tahmin etmesinde başarılı oldu.
Şuan ki sonuçlar elbette ki mükemmel değil. Kimse zaten böyle büyük bir düşüncenin bir anda olmasını beklemeyecektir. Ancak düşünce itibari ile gerçekten insanların yararına olacak bir proje. Bunun dışında ilk test aşamalarında insanlar üzerinde benzer testler yapıldığında sistemin sonuç oranları insanlara göre çok daha iyi. Devam eden süreçte hem kütüphanedeki resim sayısı arttıkça hem de sistem öğrenmeye başladıkça oranlar beklenen başarı oranlarına gelecektir.