Matematik dünyasında hızlı bir savaş yolda

Guillaume Lample ve François Charton, Paris’teki Facebook Yapay Zeka Araştırmaları’nda, en zor işlemleri bile düşünmeye gerek duymadan yapan bir algoritma geliştirdi...

12.02.2020 11:14:000
Paylaş Tweet Paylaş
Matematik dünyasında hızlı bir savaş yolda

 Araştırmacılar, Facebook’un bu yaklaşıma dair planlarını açıklamıyor. Ancak pazar liderlerini geride bırakabilecek kendi sembolik cebir hizmetini oluşturacakları düşünülüyor. Rakiplerin de hiçbir şey yapmadan oturmaları pek olası değil. Kısacası hesaplamalı matematik dünyasında güçlü bir savaş yolda…

Diğer sinir ağları basit toplama ve çarpma işlemlerinin ötesine geçemiyor ancak Facebook’un ağı integralleri hesaplıyor ve diferansiyel denklemleri çözüyor. İşte aranızdaki matematik severlere bir meydan okuma. y için aşağıdaki diferansiyel denklemi çözün: 30 saniyeniz var... Bir çözüm bulamadıysanız, çok da kötü hissetmeyin. Bu ifade o kadar zor ki çeşitli güçlü matematik yazılım paketleri bile 30 saniyelik hesaplamalardan sonra başarısız oldu. Fakat bugün, Guillaume Lample ve François Charton, Paris’teki Facebook Yapay Zeka Araştırmaları’nda, işi bir an bile düşünmeye gerek duymadan yapan bir algoritma geliştirdiklerini söylüyor. Bu adamlar, ilk kez matematiksel ifadeleri ayırt etmek ve bütünleştirmek için gerekli sembolik akıl yürütmeyi yapacak bir sinir ağını eğitti. Bu çalışma, daha güçlü matematiksel akıl yürütme ve geleneksel model tanıma görevlerinin ötesinde sinir ağlarını uygulamanın yeni bir yolu için önemli bir adım. İlk önce, biraz arka plandan bahsedelim. Sinir ağları; yüz ve nesne tanıma, belirli doğal dil işleme türleri ve hatta satranç, Go ve Space Invaders gibi oyunlar oynamak gibi model tanıma görevlerinde büyük başarı elde etti. Fakat çok çaba sarf edilmesine rağmen hiç kimse onları matematikle ilgili olanlar gibi sembolik akıl yürütme görevleri için eğitemedi. Sinir ağlarının elde ettiği en iyi şey, tam sayıların toplanması ve çarpılmasıdır. Sinir ağları ve insanlar için ileri matematiksel ifadelerle ilgili zorluklardan biri, güvendikleri stenodur. Örneğin, x3 ifadesi, x’in x ve x ile çarpımının sembolle kısa biçimde yazılmasıdır. Bu örnekte, “çarpma”, tekrarlanan toplamanın sembollerle kısa biçimde yazılmasıdır. Bu da birleştirilen iki miktarın toplam değeri için bir başka kısa yol. 

SİNİR AĞI NASIL YAPIYOR? 

Basit bir matematiksel ifadenin bile çok daha basit bir matematiksel işlemler dizisinin oldukça yoğunlaştırılmış bir açıklaması olduğunu görmek kolay. Dolayısıyla sinir ağlarının bu tür bir mantıkla mücadele etmesi şaşırtıcı değil. Eğer stenografın neyi ifade ettiğini bilmiyorlarsa, onu kullanmayı öğrenme şansları çok az. Aslında, insanlar da erken yaşlardan itibaren benzer bir soruna sahip. Bununla birlikte temel düzeyde, bütünleşme ve farklılaşma gibi süreçler hala matematiksel steno ile gizlenmiş olsa da model tanıma görevlerini içeriyor. Matematiksel stenoyu temel birimlerine bölmek için zarif bir yol bulmuş olan Lample ve Charton burada devreye giriyor. Daha sonra bir sinir ağına, bütünleşme ve farklılaşmaya eşdeğer olan matematiksel manipülasyon kalıplarını tanımayı öğretiyorlar. Son olarak da sinir ağını daha önce hiç görmediği ifadelerin üstüne salıyorlar ve sonuçları Mathematica ve Matlab gibi geleneksel çözücülerden elde edilen cevaplarla karşılaştırıyorlar. Bu sürecin ilk kısmı, matematiksel ifadeleri bileşen parçalarına ayırmak. Lample ve Charton bunu ifadeleri ağaç benzeri yapılar olarak temsil ederek yapıyor. Bu ağaçlardaki yapraklar sayılar, sabitler ve x gibi değişkenler oluyor; iç düğümler toplama, çarpma, diferansiyelini alma gibi operatörlerdir vb. Örneğin, 2 + 3 x (5 +2) ifadesi şu şekilde yazılabilir: Ağaçlar matematiksel olarak eşdeğer olduklarında eşittir. Örneğin, 2 + 3 = 5 = 12 - 7 = 1 x 5’in hepsi eşdeğerdir; bu yüzden ağaçları da eşdeğerdir. Birçok matematiksel işlemin bu şekilde ele alınması daha aslında daha kolay. Lample ve Charton, “Örneğin, ifadenin basitleştirilmesi, bir ağacın daha kısa eşdeğer bir temsilini bulmak anlamına geliyor” diyor. Bu ağaçlar, her düğümü arka arkaya alan diziler olarak da yazılabilir. İlginç bir şekilde, bu yaklaşım genellikle bir dilde bir kelime dizisinin başka bir dilde bir kelime dizisine çevrilmesi gereken makine çevirisi için de kullanılıyor. Aslında, Lample ve Charton yaklaşımlarının matematiğe doğal bir dil olarak davrandığını söylüyor. Bir sonraki aşama eğitim süreci ve bu da kendisinden öğrenilecek çok sayıda örnek veritabanı gerektiriyor. Lample ve Charton, bu veritabanını matematiksel ifadeleri toplama, çarpma gibi ikili operatörlerden; kos, sin ve eksp gibi tekli operatörlerden ve π ve e gibi bir dizi değişken, tamsayı ve sabitlerden oluşan bir kitaplıktan rastgele toplayarak oluşturuyor. Ayrıca, denklemlerin çok büyük olmasını önlemek için iç düğümlerin sayısını sınırlı tutuyorlar. Nispeten az sayıda düğüm ve matematiksel bileşenle bile, olası ifadelerin sayısı çok fazla. Her rastgele denklem daha sonra bir bilgisayar cebir sistemi kullanılarak bütünleştiriliyor ve farklılaştırılıyor. Bütünleştirilemeyen herhangi bir ifadeyse atılıyor. Bu şekilde araştırmacılar, örneğin 80 milyon birinci ve ikinci dereceden diferansiyel denklem örneğinden ve parçalarla bütünleştirilmiş 20 milyon ifade örneğinden oluşan büyük bir eğitim veri seti üretiyor. Bu veri kümesini kırarak sinir ağı, belirli bir matematiksel ifadenin türevinin veya integralinin nasıl hesaplanacağını öğreniyor. 

KARŞILAŞTIRARAK HIZLANIYOR 

Son olarak, Lample ve Charton, daha önce hiç görmediği 5.000 ifadeyi besleyerek ve 500 vakada ürettiği sonuçları Maple, Matlab ve Mathematica gibi ticari olarak mevcut çözücülerle karşılaştırarak sinir ağlarını hızlandırıyor. Bu çözücüler, 1960’larda Amerikalı matematikçi Robert Risch tarafından geliştirilen algoritmik bir yaklaşım kullanıyor. Ancak Risch’in algoritması çok büyük; yalnızca entegrasyon için bile 100 sayfaya kadar çıkıyor. Bu nedenle sembolik cebir yazılımı, işleri hızlandırmak için genellikle kısaltılmış sürümleri kullanıyor. Bunlar ile sinir ağı yaklaşımı arasındaki karşılaştırmalar açıklayıcı. Araştırmacılar, “Tüm görevlerde, modelimizin Mathematica’dan önemli ölçüde daha iyi performans gösterdiğini gözlemliyoruz” diyor. “Fonksiyon entegrasyonunda, modelimiz yüzde 100’e yakın doğruluk elde ederken Mathematica yüzde 85’e zar zor ulaşıyor.” Maple ve Matlab paketleri ortalama olarak Mathematica’dan daha az performans gösteriyor. Birçok durumda, klasik çözücüler denemek için 30 saniye verildiğinde bir çözüm bulamıyorlar. Karşılaştırıldığında, sinir ağının çözümleri bulması yaklaşık bir saniye sürüyor. Bu sayfanın başındaki örnek bunlardan biri. 

FARKLI ÇÖZÜMLER BULUYOR

İlginç bir sonuç da sinir ağının genellikle aynı soruna birkaç eşdeğer çözüm bulması. Çünkü matematiksel ifadeler genellikle birçok farklı şekilde yazılabilir. Bu yetenek araştırmacılar için cezbedici bir gizemdir. Lample ve Charton, “Modelin, bunu yapmak için eğitilmeden eşdeğer ifadeleri elde etme yeteneği çok ilgi çekicidir” diyor. Bu önemli bir atılım. İkili, “Bildiğimiz kadarıyla hiçbir çalışma sinir ağlarının matematiksel ifadelerdeki kalıpları tespit etme yeteneğini araştırmamış” diyor. Şimdi araştırıldığına göre bu sonuç açık bir şekilde hesaplama matematiğinin giderek daha önemli ve karmaşık hale gelen dünyasında büyük bir potansiyele sahip. Araştırmacılar Facebook’un bu yaklaşıma dair planlarını açıklamıyor. Ancak pazar liderlerini geride bırakan kendi sembolik cebir hizmetini nasıl sunabileceğini görmek zor değil. Ancak rakiplerin de hiçbir şey yapmadan oturmaları pek olası değil. Hesaplamalı matematik dünyasında güçlü bir savaşa hazır olun.


İLGİNİZİ ÇEKEBİLİR

Yorum Yaz