Apple 2011 yılında Siri’yi ilk kez piyasaya sürdüğünde iPhone 4SŞirket, bu yeni moda sesli asistanı nasıl kullanabileceğinizi gösteren bir dizi ilgi çekici reklam hazırladı. Birinde Zooey Deschanel telefonuna domates çorbası getirmesini istiyor; bir diğerinde John Malkovich varoluşsal bir yaşam tavsiyesi istiyor. Bir tanesinde de Martin Scorsese New York’ta bir taksinin arkasından programını karıştırıyor. Reklamlarda hatırlatıcılar, hava durumu, alarmlar ve daha fazlası gösteriliyordu. Reklamların amacı, Siri’nin ihtiyacınız olan her şeyin üstesinden gelebilecek kullanışlı, sürekli bir arkadaş olduğuydu. Uygulamaya ya da dokunmaya gerek yoktu. Sadece sormanız yeterli.
Siri Apple için büyük bir olaydı. 4S’in lansman etkinliğinde Apple’dan Phil Schiller, Siri’nin yeni cihazın en iyi özelliği olduğunu söyledi. “Teknoloji uzmanları onlarca yıldır teknolojiyle konuşabileceğimiz ve onun bizim için bir şeyler yapacağı hayaliyle bizimle dalga geçtiler,” dedi. “Ama hiçbir zaman gerçekleşmedi!” Gerçekten yapmak istediğimiz tek şey, cihazımızla istediğimiz şekilde konuşup bilgi ve yardım almak” dedi. Klasik Apple kabadayılığının bir anında Schiller, Apple’ın bunu çözdüğünü ilan etti.
Elma çözememişti.. Bu ilk lansmandan bu yana geçen 13 yıl içinde Siri, çoğu insan için ya zamanlayıcıları ayarlamanın bir yolu ya da ne pahasına olursa olsun kaçınılması gereken işe yaramaz bir özellik haline geldi. Siri uzun zamandır kötüydü, öyle ki Apple’ın onu unuttuğu ya da yokmuş gibi davranmayı tercih ettiği yıllar oldu.
Ancak önümüzdeki hafta WWDC’de, söylentiler ve raporlar doğruysa, gerçek Siri ile ilk kez tanışmak üzere olabiliriz – ya da en azından ona çok daha yakın bir şey. Göre Bloomberg, The New York Timesve diğerleri, Apple’ın asistan için büyük bir revizyon yapacağını, büyük dil modelleri sayesinde Siri’yi daha güvenilir hale getireceğini ancak çok fazla yeni işlevsellik sunmayacağını açıkladı. Bu bile bir kazanç olurdu. Ancak Apple aynı zamanda Siri’nin şu özelliklere sahip bir versiyonu üzerinde çalışıyor ve neredeyse piyasaya sürmeye hazır gibi görünüyor aslında uygulamaların içine entegre edinBu da asistanın sizin adınıza cihazınızda işlem yapabileceği anlamına geliyor. En azından teoride, telefonunuzda yapabildiğiniz her şeyi Siri yakında sizin için yapabilir.
Belli ki Siri’nin vizyonu başından beri buydu. Bunu iPhone 4S reklamlarında bile görebilirsiniz: bu ünlüler Siri’den yardım istiyorlar ve Siri neredeyse hiçbir zaman işi bitirmiyor. Deschanel’e teslimattan bahseden restoranların bir listesini veriyor ama sipariş vermeyi ya da menüyü göstermeyi teklif etmiyor. Scorsese’ye trafik olduğunu söylüyor ama onu yönlendirmiyor – ve zaten toplantısına geç kalacağını bilmesi gerekmez mi? Siri, Malkovich’e insanlara karşı nazik olmasını ve iyi bir kitap okumasını söylüyor ama pratik bir yardım sunmuyor. Şu ana kadar Siri’yi kullanmak, tek işi sizin için Google’da bir şeyler aramak olan sanal bir asistana sahip olmak gibi. Bu da bir şeydir! Ama pek bir şey değil.
Siri’nin yetersizlikleri daha da sinir bozucu oldu çünkü yararlı olması için gereken her şey tam orada telefonunuzda. Pizza istediğimde, Siri neden en son sipariş verdiğimde aldığım fişi e-postamdan kontrol edemiyor, DoorDash’i açıp aynı siparişi giremiyor, Apple Cüzdanımdaki kartlardan biriyle ödeme yapıp işimi bitiremiyor? Scorsese seviyesinde yoğun bir gün geçiriyorsam, Siri tüm kişilerimin, Slack’imin, e-postamın ve benim adıma işleri hızlıca halletmek için ihtiyaç duyduğu diğer her şeyin hemen yanında gibi görünüyor. Eğer Siri, başka birinin bilgisayarınızın imlecini hareket ettirmesine izin veren uzaktan erişim araçlarından biri gibi telefonumu ele geçirebilseydi, durdurulamaz olurdu.
Siri’nin bu şekilde potansiyeline ulaşamamasının gerçekten iki nedeni var. İlki basit olanı: temel teknoloji yeterince iyi değildi. Siri’yi kullandıysanız, isimleri ne kadar sık yanlış duyduğunu, komutları yanlış anladığını ve tek istediğiniz bir podcast çalmak olduğunda “işte web’de bulduğum bazı şeyler” e geri döndüğünü bilirsiniz. İşte bu noktada büyük dil modelleri kesinlikle çok heyecan verici çünkü Whisper gibi konuşmadan metne araçlarının ne kadar iyi olduğunu ve bu modellerin dili ne kadar daha geniş bir şekilde anlayabildiğini gördük. Mükemmel değiller, ancak daha önce sahip olduklarımıza göre büyük bir gelişme kaydettiler – bu yüzden Amazon da Alexa’yı LLM’lere çevirmek ve Google’ın Asistanı Gemini tarafından istila ediliyor.
Siri’nin hiçbir zaman tam olarak çalışmamasının ikinci nedeni, ne Apple’ın ne de üçüncü taraf geliştiricilerin bunun nasıl yapılacağını çözememiş olmasıdır. gerekir İş. Siri’nin ne yapabileceğini veya nasıl sorulacağını nasıl bileceksiniz? Geliştiriciler Siri’yi nasıl entegre edecekler? Şu anda bile, yapılacaklar listesi uygulamanıza bir görev eklemek istediğinizde, Siri hangi uygulamayı kullandığınızı bulamıyor. Söylemek zorundasınız, Hey Siri, Todoist’te çimleri sulamamı hatırlatBu, hiçbir anlam ifade etmeyen ve benim deneyimlerime göre zaten yarı yarıya başarısız olan garip bir cümle. Çok adımlı bir işlem yapmak istiyorsanız, tek seçeneğiniz çok güçlü bir araç olan ancak kod yazmanızı gerektirecek kadar yetersiz kalan Kısayollar’da dolaşmaktır. Çoğu insan için bu çok fazla.
Yapay zeka Apple’a tüm sorunu çözme şansı da verebilir. Araştırmacıları bu yılın başlarında bir makale yayınladı Ekrandaki bir görüntünün küçük ayrıntılarını anlamak için bir yapay zeka modeli kullanan Ferret-UI adlı bir sistemi detaylandırıyor. Araştırmacılar, Siri kullanan genel bir uygulamanın nasıl çalışabileceğini bile detaylandırıyor: OpenAI’nin GPT-4’ü bir görüntünün ne olduğunu genel olarak anlama konusunda iyi bir iş çıkarıyor ve ardından Ferret küçük bölgeleri ve ayrıntıları anlayabiliyor. Pratikte bu, bir sistemin “Bu Ticketmaster uygulaması!”, diğerinin ise “Şuradaki satın alma düğmesi” demesi anlamına gelebilir.
Apple’ın Siri için öne sürdüğü iddialara şüpheyle yaklaşmalıyız. On yıldan uzun bir süre önce Schiller sahneye çıkıp Apple’ın daha iyi bir sesli asistan geliştirdiğini ilan etmişti ama öyle olmadı. Aynı şey şimdi de geçerli olabilir, zira yapay zeka konusundaki yutturmaca gerçek teknolojiden çok daha hızlı ilerlemeye devam ediyor. Humane, Rabbit, Google ve diğerlerinin hepsi benzer fikirler üzerinde çalışıyor – “ajan” olduğunu Buzzword .. yaz ve henüz kimse bunun hazır olduğunu gösteremedi.
Ama eğer Apple burada bir şeyi çözdüyse, bu yıllar önce bize vaat edilen gerçek Siri’yi ilk kez göreceğimiz an olabilir. Belki de bir sonraki reklamda Deschanel’in domates çorbası sihirli bir şekilde evinde belirecek ve Headspace uygulaması Malkovich’e biraz iç huzuru getirmek için çalışacak. Belki de sonunda Apple’ın her zaman yapmak istediği Siri’ye kavuşacağız.