Alexa anla beni

Sesle kumanda edilen AI (yapay zeka) cihazları inanılmaz bir hızla ilerliyor. Önümüzdeki dönemde hayatımıza dokundukları alanlar da çeşitleneceğe benziyor...

29 KASIM, 20170
Paylaş Tweet Paylaş
Alexa anla beni

31 Ağustos 2012 tarihinde Amazon’dan dört mühendis dünyanın en büyük ve en karmaşık veri setlerinden biri olan insan konuşmasıyla bağlantı kurmak için tasarlanmış bir yapay zeka sistemine yani Alexa’ya dönüşecek önemli bir patentin tescilini yaptırdı. Alexa’nın nasıl çalışacağını tanımlamak için bu mühendisler sadece 11 kelimeye ve basit bir diyagrama ihtiyaç duydu. Sessiz bir odada erkek bir kullanıcı şöyle konuştu: “Lütfen Beatles’dan ‘Let It Be’yi çal.” Masaüstü küçük bir makine ise şöyle cevap verdi: “Sorun değil John” ve istenilen şarkıyı çalmaya başladı. Evlere yönelik sesle kumanda edilen AI işte bu mütevazı başlangıçtan evrimleşerek Amazon’un teknolojik rakipleriyle kapıştığı stratejik bir savaş alanına dönüştü. Google, Apple, Samsung ve Microsoft gibi şirketlerin hepsi tüketicilerin onlarla konuşabileceği ve kullanımı kolay cihazların sürümlerini yaratmak için binlerce iş uzmanını ve araştırmacıyı işe alıyor. Bankalar, üniversiteler, avukatlık büroları ve diğerleri için her türlü sesle çalışan uygulama yazan Witlingo’nun CEO’su Ahmed Bouzid, “Yazma, tıklama veya okutma anlamında bugüne kadar hep biz teknolojiyi anlamaya çalışıyorduk. Şimdi ise yeni kullanıcı arayüzleri bizi anlamaya çalışıyor” diyor. Amazon için daha iyi bir müzik kutusuna yönelik bir platform olarak başlayan bu iş artık çok daha büyük bir şeye dönüştü: İnsan verileri üzerine kurulu ve sürekli onlardan öğrenen bir yapay zeka (AI) sistemine. Bugün ışıkları açıp kapatabilen, fıkralar anlatabilen veya ellerinizi kullanmaksızın size gazete haberlerini okuyabilen, Alexa ile çalışan Echo silindir ve minnacık Dot gibi her yerde bulunabilen ev içi asistanlar var. Bu asistanlar Alexa’nın daha da geliştirilebilmesi ve kullanım alanlarının artması için kendi kullanıcıları hakkında yığınla veri de topluyor. 2014 yılında pazara sürüldüklerinden bu yana Alexa ile çalışan 10 milyonlarca makine satıldı. Amazon ABD’deki sesle kumanda edilen AI cihazları pazarında birim satışların yaklaşık yüzde 70 oranında artacağına inanıyor, yani rekabet fevkalade kızışacağa benziyor. Bu arada Google Home milyonlarca birim satış gerçekleştirirken Apple ile Microsoft da kendi sürümlerini çok yakında piyasaya çıkaracak. Asıl ödül ise üç önemli pazarı kontrol altına almak veya en azından bu pazarları etkilemekte yatıyor. Bunlar; ev otomasyonu, ev eğlencesi ve alışverişi… Bugün kaç kişinin buzdolabıyla konuşmak isteyebileceğini bilmek zor. Ancak şu da bir gerçek ki günlük yaşam alışkanlıkları hızlı şekilde değişiyor. Nasıl akıllı telefonlar randevulaşma kurallarından, yayaların yürüme hızlarına kadar her şeyi değiştirdiyse sesle kumanda edilen AI de ev yaşamımızı değiştirmeye başlıyor. Alexa veya onun bir muadili varken akşam ön kapıyı kilitlemek ya da kışın buz gibi soğuk bir günde dışardaki arabanın kaloriferini çalıştırmak için neden salondaki rahat koltuğumuzdan kalkalım ki? Amazon, Alexa ile çalışan akıllı termostatlar, ampuller ve diğer türden cihazlar üreten şirketlerden şimdilik gelir tahsil etmeye çalışmıyor. Ancak ileride gelir paylaşım düzenlemeleri veya diğer ödeme türlerini ortaya çıkarabilecek yöntemleri hayal etmek hiç de zor değil. Bu üç pazardan en küçüğü olan ev otomasyonu daha şimdiden yılda 5 milyar dolardan fazla harcama hacmine ulaşmış durumda. ABD’de geçen yıl perakende satışlar 4,9 trilyon doları buldu. Bugün Amazon Dot’lar için 50 dolar ve video ekranlı en pahalı Echo’lar için 230 dolar fiyat koyuyor. Bu makinelerin kendilerinden para kazanıyor ve kullanıcının alışverişini Amazon’un uçsuz bucaksız çevrimiçi mağazasında yapması durumunda ise ikinci bir kazanç daha elde ediyor. Ancak Amazon bu trafik rakamlarını halka açıklamıyor. 

AMAZON GELİŞTİRİCİLERİ TEŞVİK EDİYOR

Echo’nun akıllı telefonlar kadar yaygınlaşabilmesi için çok daha fazla işi yapabilir duruma gelmesi gerekiyor. Amazon bu maksatla tıpkı Apple’ın uzunca bir süredir uygulama (app) geliştiricilerle yaptığı gibi bağımsız geliştiricileri bu platform üzerinde yeni servisler yaratmaya teşvik ediyor. Bugüne kadar bu şekilde 15 binden fazla uygulama geliştirildi ve uygulama geliştirme araçlarının birleştirilmesi artık o kadar kolaylaştırıldı ki bugün çok fazla yazılım deneyimi olmaksızın bile sadece bir saat içinde yeni bir app geliştirmek mümkün hale geldi. En popüler uygulamalar arasında ise Uber ve Lyft’in kaçak taksi çağırma seçenekleri var. Başarısız olanları ise dinleyicilere aşağılamalar yağdıran 48 farklı uygulama içeriyor. En iddialı geliştiriciler arasında Alexa ile birlikte çalışabilen donanım üreten veya servisler satan şirketler var. Örneğin Capital One adlı şirket bankacılık müşterilerine Alexa tabanlı bir fatura ödeme servisi sunuyor. Toronto merkezli Ecobee ise insanların sadece birkaç kelime söyleyerek oda sıcaklığını artırmalarına veya azaltmalarına olanak sağlayan Alexa uyumlu çok sayıda akıllı termostat üreticisinden biri. Bugün toplam satışlarının yaklaşık yüzde 40’ını, 10 yaşında olmasına rağmen en hızlı büyüyen ürün hattı Alexa tabanlı cihazlarından elde eden bir şirket olan Ecobee’nin CEO’su Stuart Lombard, “Bizim müşterilerimizin yaşamları koşturma içinde geçiyor” diyor ve ekliyor: “Onlar evlerine gitmek için trafikte boğuşmak ve sonra çocuklarını doyurmak, bebeklerinin altını değiştirmek ve kimbilir daha nelerle uğraşmak zorunda kalıyor. Biz onlara başka işlerle ilgilenirken bazı işleri ellerini kullanmadan yapma fırsatı sunuyoruz.” 

KONUŞMA AI İLE BULUŞTUĞUNDA

Ses ile çalışan AI’yi tüketiciler için bu kadar cazip kılan ise bizim bir klavye ile yazmamıza gerek kalmadan kendi konuşma ve düşünme tarzımıza cevap vererek bize sunduğu konfor... Bu, aynı zamanda teknik anlamda AI’yi daha da geliştirmeyi çok zorlaştırıyor. İnsanlar her zaman çok düzgün konuşmaz. Bazen kesik kesik konuşurlar. Hatta dilimiz dolanır. Kelimeler ağzımızdan uyuklayarak veya homurdanarak çıkar ve biz aslında öyle olmadığı halde mantıklı konuştuğumuzu zannederiz. Bazıları Seattle, Sunnyvale, California ve Cambridge, Massachusetts’deki araştırma merkezlerinde olmak üzere binlerce Amazon çalışanı bugün bu zorluğa çözüm bulmak için çalışıyor. Durum böyle olmasına rağmen Amazon’un iş ilanları sayfasında geçenlerde içinde 215 kişilik öğrenen makine uzmanlarının da olduğu düzinelerce bölüm için 1.100’den fazla Alexa bilimcisinin arandığı iş ilanı yayınlandı. Bu şirketin Cambridge bürosundaki bir toplantı esnasında ben Alexa’nın baş bilimcisi Rohit Prasad’a neden bu kadar çok insana ihtiyaç duyduğunu ve kendi araştırma ekibinin ne zaman tam anlamıyla kurulmuş olabileceğini düşündüğünü sordum. Prasa bana, “Sorduğun soru beni gülmekten öldürdü” diye cevap verdi. Gülmesi geçip kendisini toparladıktan birkaç saniye sonra Prasad konuşma teknolojisi üzerine 20 yıldan beri çalıştığını ve bu dönemin çoğunda sinir bozucu bir şekilde yavaş sonuç aldıklarını söyledi. Ancak son beş yılda devasa fırsatların önü açılmış. Buna rağmen sesle çalışan kusursuz bir AI yaratmak halen son derece karmaşık ve hiç tırmanılmamış bir zirve olarak duruyor. Geçmişte konuşma bilimcileri kaotik olabilecek telaffuzların tam olarak anlamlarını ilk denemede kavramakta zorlanmış olsalar da şimdi öğrenen makinelere yönelik yeni yaklaşımlarla farklı bir yol izleyerek ilerleme kaydediyorlar. Artık çabucak yaptıkları hassas ön tahminlerden sonra duydukları eksik kelimeleri düzeltip anlayabiliyorlar. Burada işin sırrı geniş kullanıcı verileri yığınları üzerinde çalışmakta ve önceki hatalardan dersler çıkarıp öğrenmekte yatıyor. Alexa kendi kullanıcılarıyla ne kadar fazla zaman geçirirse ve öğrenmek için ne kadar fazla veri toplarsa, o kadar daha zeki olacak. Bu alanda kat edilen ilerlemelerle ortaya daha fazla fırsat çıkacak ve insan gücüne daha çok gereksinim duyulacak. Prasad bana “Şimdi size bir örnek vereyim. Şayet Alexa’ya ‘Adele’in ilk albümü hangisiydi’ diye sorarsanız, cevap ‘19’ olacaktır. Eğer ardından ‘Peki şimdi onu çal’ dediğinizde Alexa o albümü çalması gerektiğini bilecektir” demişti. Peki ya konuşmanın ortasında araya başka bir konu girerse ne olur? Ya Alexa’ya önce bu albümün hangi yıl çıktığını ve kaç adet sattığını sorarsanız ne olur? Diyelim ki bu gizemli sohbetten sonra Alexa’ya “Onu çal” dediniz, o zaman Alexa’nın ilk sürümlerinin kafası karışırdı. Oysa bugün yeni teknoloji sayesinde her zaman olmasa bile Alexa “O”nun halen “19” anlamına geldiğini fark edebiliyor. 


İLGİNİZİ ÇEKEBİLİR

Yorum Yaz




Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.