Yönlendirilmiş Gradyanların Histogramı/Histogram of Oriented Gradients(HOG)
Merhabalar, bu yazımızda makine öğrenmesinin alt başlıklarından biri olan hog algoritması hakkında bilgi aktaracağız.
Konuya bir tanımla giriş yapalım.
HOG algoritmasını nesne tanımada sıklıkla kullanılan ve bir nesneyi içerdiği açılar ile betimleyen bir tanımlayıcı olarak ifade edebiliriz.
Bu histogramlar, imgenin lokal bir bölgesindeki gradyanların oryantasyonlarının oluşma sayılarını içerir. HOG’ tanımlayıcıları gerçeklenmesindeki işlem basamaklar şu şekilde sıralanabilir:
- İmgenin gradyanın alınması,
- Belirlenen lokasyonlar için oryantasyon histogramlarının oluşturulması
- Oluşturulan lokasyon grubları içindeki histogramların normalize edilmesi.
Ayrıca performansı geliştirmek için imgede blok adı verilen büyük bir bölge arasında yoğunluk ölçümü hesabı yapılarak yerel histogramlar normalize edilir.[1]
Gradyan Hesaplama:
İmgenin gradyanı imgenin iki boyutlu filtreler kullanılarak süzgeçlenmesi ile elde edilir. Birçok yöntemde, gradyan hesaplamada yatay ve dikey filtreler bir arada uygulanmaktadır. Bu yöntemin uygulanabilmesi için imge, gri imge haline dönüştürülür.
Herhangi bir I imgesinin:
Ix I * Sy (yatay kenarı)
Iy I * Sd (dikey kenarı)
Elde edilen imgeler kullanılarak
Algoritmanın çalışma sırasını inceleyecek olursak
- Özellik Tanımlama: Bir görüntünün temsilidir. Eldeki bilgilerden gereksiz olanları atıp görüntüyü basitleştirir ve böylece geriye yararlı bilgiler kalır.
- Ön İşleme: Görüntüde çıkabilecek olası sorunları önlemek için yeniden bir boyutlandırma gerekir. Görüntnün boyutu önemli değildir. Bu sabit bir orana getirilmelidir. En yaygın en boy oranı 1:2'dir, yani görüntüler 100:200, 200:400… olabilir.
- Gradyan Hesaplama: HOG yapmadan önce görüntünün yatay ve dikey gradyanlarının hesaplanılması gerekir. Böylece görüntü filtrelenir ve kenarlar, özel noktalar belirlenir.
4. Gradyanların Histogramını Çıkarma: Görüntü hücrelere bölünür ve her hücre için gradyan histogramı hesaplanır.
5. Normalizasyon: Normalizasyon tercihe bağlı olarak yapılabilir. Parlaklık, kontrast ve diğer aydınlatma etkilerinden kaçınmak için kullanılır.
6. Görüntüyü Görselleştirme: Son olarak bu işlemle bir görüntü elde edilir ve algoritma burada son bulur.
Sonraki yazılarda görüşmek üzere…