Google'ın yeni Grafik Temeli Modeli, 40 kata kadar daha fazla hassasiyet sunuyor ve spam tespitinde geniş ölçekte test edildi.
Google, daha önce görülmemiş grafiklere genelleme yapan ve önceki yöntemlere kıyasla üç ila kırk kat daha fazla hassasiyet sağlayan, reklamlardaki spam tespiti gibi ölçekli uygulamalarda başarılı testler yapan Grafik Temel Modeli (GFM) adı verilen, grafiklere dayalı yeni bir yapay zeka türünün ayrıntılarını yayınladı.
Bu yeni teknolojinin duyurulması, bugüne kadar mümkün olanın sınırlarının genişletilmesi olarak nitelendiriliyor:
"Bugün, birbirine bağlı ilişkisel tablolarda mükemmel sonuçlar veren ve aynı zamanda ek eğitime ihtiyaç duymadan herhangi bir rastgele tablo, özellik ve görev kümesine genelleştirilebilen tek bir model tasarlama olasılığını araştırıyoruz. Grafik öğrenimi ve tablolu makine öğreniminin sınırlarını standart temel çizgilerin çok ötesine taşıyan bu tür grafik temel modelleri (GFM) geliştirme konusundaki son gelişmelerimizi paylaşmaktan heyecan duyuyoruz."
Grafik Sinir Ağları ve Grafik Temel Modelleri
Grafikler, birbirleriyle ilişkili verilerin temsilleridir. Nesneler arasındaki bağlantılara kenar, nesnelerin kendilerine ise düğüm adı verilir. SEO'da en bilinen grafik türü, bir web sayfasını diğerine bağlayan bağlantılarla tüm web'in bir haritası olan Bağlantı Grafiği olarak adlandırılabilir.
Günümüz teknolojisi, web sayfası içeriği gibi verileri temsil etmek için Grafik Sinir Ağları'nı (GNN'ler) kullanır ve bir web sayfasının konusunu belirlemek için kullanılabilir.
GNN'ler hakkında bir Google Araştırma blog yazısı, bunların önemini şöyle açıklıyor:
"Grafik sinir ağları veya kısaca GNN'ler, hem grafiğin bağlantısını (eski algoritmalar DeepWalk ve Node2Vec'de olduğu gibi) hem de çeşitli düğümler ve kenarlardaki giriş özelliklerini kullanmak için güçlü bir teknik olarak ortaya çıkmıştır. GNN'ler, grafiklerin tamamı (Bu molekül belirli bir şekilde tepki veriyor mu?), tek tek düğümler (Alıntılarına bakıldığında bu belgenin konusu nedir?) için tahminlerde bulunabilir...
Grafikler hakkında tahminler yapmanın yanı sıra, GNN'ler daha tipik sinir ağı kullanım örnekleriyle aradaki uçurumu kapatmak için kullanılan güçlü bir araçtır. Bir grafiğin ayrık, ilişkisel bilgilerini sürekli bir şekilde kodlarlar, böylece başka bir derin öğrenme sistemine doğal olarak dahil edilebilirler.
GNN'lerin dezavantajı, eğitildikleri grafiğe bağlı olmaları ve farklı bir grafik türünde kullanılamamalarıdır. Farklı bir grafikte kullanmak için Google'ın o diğer grafik için özel olarak başka bir model eğitmesi gerekir.
Bir benzetme yapmak gerekirse, bu durum, Fransızca belgeler üzerinde yeni bir üretken yapay zeka modeli eğitmek ve onu başka bir dilde çalıştırmak gibi bir şey. Ancak durum böyle değil çünkü Hukuk alanında lisans dereceleri diğer dillere genelleme yapabilirken, grafiklerle çalışan modeller için durum böyle değil. Buluşun çözdüğü sorun da bu: Önce eğitilmeden diğer grafiklere genelleme yapabilen bir model oluşturmak.
Google'ın duyurduğu çığır açan gelişme, yeni Grafik Temeli Modelleri sayesinde Google'ın artık daha önce eğitilmediği yeni grafikler arasında genelleme yapabilen ve bu grafiklerdeki kalıpları ve bağlantıları anlayabilen bir model eğitebilmesidir. Üstelik bunu üç ila kırk kat daha hassas bir şekilde yapabilir.
Duyuru Ama Araştırma Makalesi Yok
Google'ın duyurusunda bir araştırma makalesine bağlantı verilmiyor. Google'ın daha az araştırma makalesi yayınlamaya karar verdiği çeşitli kaynaklarda yer aldı ve bu, söz konusu politika değişikliğinin önemli bir örneği. Bu yenilik çok büyük olduğu için mi bunu rekabet avantajı olarak korumak istiyorlar?
Grafik Temel Modelleri Nasıl Çalışır?
Geleneksel bir grafikte, diyelim ki bir internet grafiğinde, web sayfaları düğümlerdir. Düğümler (web sayfaları) arasındaki bağlantılara kenarlar denir. Bu tür bir grafikte, sayfalar arasında benzerlikler görebilirsiniz çünkü belirli bir konuyla ilgili sayfalar, aynı konuyla ilgili diğer sayfalara bağlanma eğilimindedir.
Çok basit bir ifadeyle, bir Grafik Temeli Modeli, her tablodaki her satırı bir düğüme dönüştürür ve tablolardaki ilişkilere göre ilgili düğümleri birbirine bağlar. Sonuç, modelin mevcut verilerden öğrenmek ve yeni veriler hakkında tahminlerde bulunmak (örneğin spam tespiti) için kullandığı tek bir büyük grafiktir.
Beş Tablonun Ekran Görüntüsü

Tabloları Tek Bir Grafiğe Dönüştürme
Araştırma makalesinde, süreci gösteren aşağıdaki görseller hakkında şunlar söyleniyor:
"Veri hazırlama, tabloları tek bir grafiğe dönüştürmekten oluşur. Bu grafiğe göre, tablonun her satırı ilgili düğüm türünün bir düğümü haline gelir ve yabancı anahtar sütunları düğümler arasındaki kenarlar haline gelir. Gösterilen beş tablo arasındaki bağlantılar, ortaya çıkan grafikte kenarlar haline gelir."
Kenarlara Dönüştürülmüş Tabloların Ekran Görüntüsü

Bu yeni modeli olağanüstü kılan şey, oluşturma sürecinin "basit" olması ve ölçeklenebilir olmasıdır. Ölçeklenebilirlik kısmı önemlidir çünkü bu, buluşun Google'ın devasa altyapısında çalışabileceği anlamına gelir.
"Tablolar arasındaki bağlantı yapısının, tablolu özellik verileri (örneğin fiyat, boyut, kategori) seyrek veya gürültülü olsa bile, etkili makine öğrenimi algoritmaları ve daha iyi bir akış performansı için kilit öneme sahip olduğunu savunuyoruz. Bu amaçla, tek veri hazırlama adımı, bir tablo koleksiyonunu tek bir heterojen grafiğe dönüştürmekten ibarettir.
Süreç oldukça basittir ve ölçeklenebilir: her tablo benzersiz bir düğüm türü haline gelir ve tablodaki her satır bir düğüm haline gelir. Tablodaki her satır için, yabancı anahtar ilişkileri diğer tablolardaki ilgili düğümlere yazılmış kenarlar haline gelirken, sütunların geri kalanı düğüm özellikleri olarak ele alınır (genellikle sayısal veya kategorik değerlerle). İsteğe bağlı olarak, zamansal bilgileri düğüm veya kenar özellikleri olarak da tutabiliriz.