Yapay zeka, matematikte insan zekasıyla yarıştığı bir sınavda dönüm noktasına ulaştı. Google ve OpenAI, geliştirdikleri modellerin Uluslararası Matematik Olimpiyatları’nda (IMO) altın madalya seviyesine ulaşmayı başardığını duyurdu.

Bu sonuç, yapay zekaların lise öğrencileri arasında düzenlenen IMO’da ilk kez altın madalya barajını geçtiğini ortaya koyuyor. Her iki şirketin de modelleri altı sorudan beşini çözerek, önceki yaklaşımlardan farklı olarak matematiksel kavramları doğal dil üzerinden işleyen genel amaçlı akıl yürütme modelleriyle başarıya ulaştı.

Doğal dil ve akıl yürütme modelleri öne çıktı

Google’ın DeepMind ekibi, sonuçların doğrulanması için IMO komitesiyle iş birliği yaparken, OpenAI resmi olarak yarışmaya katılmadı. Ancak OpenAI, üç IMO madalyalısı jüri üyesinin değerlendirmesiyle modellerinin altın madalya puanını hak ettiğini açıkladı.

Brown Üniversitesi’nde matematik profesörü ve DeepMind araştırmacısı olan Junehyuk Jung, bu gelişmenin yapay zekanın önümüzdeki yıl içinde çözülmemiş matematik problemlerine de katkı sunabileceğini ifade etti. Jung, “Zorlu problemleri doğal dilde çözebildiğimiz an, matematikçilerle yapay zekalar arasında gerçek bir iş birliği doğacak” dedi.

Yapay zekanın sınırları genişliyor

OpenAI araştırmacısı Noam Brown, başarılarının, modelin daha uzun süre “düşünmesini” sağlayan ve aynı anda çoklu akıl yürütme yollarını işleyen bir sistem sayesinde gerçekleştiğini belirtti. Yöntemin “çok pahalı” olduğunu vurgulayan Brown, matematikteki bu ilerlemenin fizik gibi diğer alanlara da yayılabileceğini söyledi.

Bu yıl Avustralya’nın Sunshine Coast kentinde yapılan 66. IMO’ya 630 öğrenci katılırken, %11’i altın madalya aldı. Geçtiğimiz yıl gümüş madalya seviyesinde kalan Google, bu yıl Gemini Deep Think adını verdiği genel amaçlı modeliyle yarıştı ve doğal dil odaklı, 4,5 saatlik sürede soruları çözmeyi başardı.

Yapay zeka ve IMO iş birliği resmileşti

Bu yıl ayrıca IMO tarihinde ilk kez, yarışma resmi olarak yapay zeka geliştiricilerle koordineli bir şekilde yürütüldü. Sonuçlar, IMO jürisi tarafından 28 Temmuz’da onaylandı ve yayınlanmasına izin verildi.

Google DeepMind CEO’su Demis Hassabis, “IMO’nun öncelikle öğrencilerin takdir edilmesini istemesine saygı gösterdik” derken, OpenAI de yarışma sonrası izin alarak sonuçlarını açıkladı.