Ana SayfaGenelApple'ın yapay zeka araştırması, Siri, sanatçılar ve daha fazlası için özelliklerin geleceğini...

Apple’ın yapay zeka araştırması, Siri, sanatçılar ve daha fazlası için özelliklerin geleceğini gösteriyor.

Published on

spot_img


Apple’ın yapay zeka konusunda oyuna geç kaldığını düşünmek kolay olacaktır. ChatGPT’nin dünyayı kasıp kavurduğu 2022’nin sonlarından bu yana Apple’ın rakiplerinin çoğu ona yetişmek için kendilerini paraladı. Apple kesinlikle yapay zeka hakkında konuşmuş ve hatta yapay zekayı göz önünde bulundurarak bazı ürünler piyasaya sürmüş olsa da, balıklama dalmak yerine ayak parmağını daldırıyor gibi görünüyordu.

Ancak son birkaç aydır, söylentiler ve raporlar Apple’ın aslında sadece zamanını beklediğini ve hamlesini yapmak için beklediğini öne sürdü. Son haftalarda Apple’ın her iki şirketle de görüştüğüne dair haberler çıktı. OpenAI ve Google yapay zeka özelliklerinden bazılarına güç sağlama konusunda ve şirket ayrıca Ajax adı verilen kendi modeli üzerinde çalışıyor.

Apple’ın yayınladığı yapay zeka araştırmalarına bakarsanız, Apple’ın yapay zekaya yaklaşımının nasıl hayata geçebileceğine dair bir resim oluşmaya başlar. Şimdi, açıkçası, araştırma makalelerine dayanarak ürün varsayımları yapmak son derece kesin olmayan bir bilimdir – araştırmadan mağaza raflarına giden yol rüzgarlı ve çukurlarla doludur. Ancak en azından şirketin ne yapmak istediğine dair bir fikir edinebilirsiniz. düşünmek ve Apple Haziran ayında yıllık geliştirici konferansı WWDC’de bunlardan bahsetmeye başladığında yapay zeka özelliklerinin nasıl çalışabileceği hakkında.

Daha küçük, daha verimli modeller

Sanırım ikimiz de aynı şeyi umuyoruz: Daha İyi Siri. Ve görünüşe göre Daha İyi Siri geliyor! Apple’ın birçok araştırmasında (ve birçok teknoloji endüstrisinde, dünyada ve her yerde) büyük dil modellerinin sanal asistanları hemen daha iyi ve daha akıllı hale getireceği varsayımı var. Apple için Better Siri’ye ulaşmak, bu modelleri olabildiğince hızlı bir şekilde oluşturmak ve her yerde olduklarından emin olmak anlamına geliyor.

Apple, iOS 18’de tüm yapay zeka özelliklerinin cihaz üzerinde, tamamen çevrimdışı bir modelde çalışmasını planlıyor, Bloomberg son zamanlarda rapor edildi. Veri merkezlerinden oluşan bir ağa ve binlerce son teknoloji GPU’ya sahip olsanız bile iyi bir çok amaçlı model oluşturmak zordur – bunu yalnızca akıllı telefonunuzun içindeki bağırsaklarla yapmak çok daha zordur. Bu yüzden Apple’ın yaratıcı olması gerekiyor.

” adlı bir makaledeBir flaşta LLM: Sınırlı Bellek ile Verimli Büyük Dil Modeli Çıkarsaması” (tüm bu makalelerin gerçekten sıkıcı başlıkları var ama gerçekten ilginçler, söz veriyorum!), araştırmacılar, genellikle cihazınızın RAM’inde depolanan bir modelin verilerini SSD’de depolamak için bir sistem geliştirdiler. “LLM’leri mevcut DRAM boyutunun iki katına kadar çalıştırabildiğimizi gösterdik [on the SSD]Araştırmacılar, “CPU’da geleneksel yükleme yöntemlerine kıyasla çıkarım hızında 4-5 kat, GPU’da ise 20-25 kat hızlanma elde ettiklerini” yazdılar. Cihazınızdaki en ucuz ve mevcut depolama alanından yararlanarak, modellerin daha hızlı ve daha verimli çalışabileceğini buldular.

Apple’ın araştırmacıları ayrıca EELBERT bir LLM’yi anlamlı derecede kötüleştirmeden çok daha küçük bir boyuta sıkıştırabilir. Google’ın Bert modelinin sıkıştırılmış hali 15 kat daha küçüktü – yalnızca 1,2 megabayt – ve kalitede yalnızca yüzde 4’lük bir azalma görüldü. Yine de bazı gecikme ödünleriyle birlikte geldi.

Genel olarak Apple, model dünyasındaki temel bir gerilimi çözmeye çalışıyor: bir model büyüdükçe daha iyi ve daha kullanışlı olabilir, ancak aynı zamanda daha hantal, güce aç ve yavaş hale gelebilir. Diğerleri gibi şirket de tüm bunlar arasında doğru dengeyi bulmaya çalışıyor ve aynı zamanda hepsine sahip olmanın bir yolunu arıyor.

Siri, ama iyi

Yapay zeka ürünleri hakkında konuştuğumuzda bahsettiğimiz şeylerin çoğu sanal asistanlardır – bir şeyleri bilen, bize bir şeyleri hatırlatabilen, soruları yanıtlayabilen ve bizim adımıza işleri halledebilen asistanlar. Bu nedenle Apple’ın yapay zeka araştırmalarının çoğunun tek bir soruya dayanması şaşırtıcı değil: Ya Siri gerçekten, gerçekten, gerçekten iyi olsaydı?

Apple araştırmacılarından oluşan bir grup Siri’yi kullanmanın bir yolu “Hey Siri” ya da “Siri “yi dinlemek yerine, cihaz kendisiyle konuşup konuşmadığınızı basitçe sezebilir. “Araştırmacılar, “Bu sorun, sesli komutun başlangıcını işaret eden öncü bir tetikleyici cümle olmayabileceğinden, ses tetikleyici algılamadan çok daha zordur” dedi. Bu nedenle başka bir grup araştırmacı, sesli komutları algılamak için bir sistem geliştirmiş olabilir. uyandırma kelimelerini daha doğru tespit eder. Başka bir gazete asistanlar tarafından genellikle iyi anlaşılmayan nadir kelimeleri daha iyi anlamak için bir model geliştirdi.

Her iki durumda da LLM’nin cazibesi, teorik olarak çok daha fazla bilgiyi çok daha hızlı bir şekilde işleyebilmesidir. Örneğin, wake-word makalesinde, araştırmacılar değil Gereksiz tüm sesleri atmaya çalışmak, bunun yerine hepsini modele beslemek ve neyin önemli neyin önemsiz olduğunu işlemesine izin vermek, uyandırma sözcüğü çok daha güvenilir bir şekilde çalıştı.

Siri sizi duyduktan sonra, Apple onun sizi daha iyi anlamasını ve iletişim kurmasını sağlamak için bir dizi çalışma yapıyor. Bir makalede, Apple STEER adı verilen bir sistem (açılımı Semantic Turn Extension-Expansion Recognition, biz STEER diyelim) ne zaman devam sorusu ne zaman yeni bir soru sorduğunuzu anlamaya çalışarak bir asistanla ileri geri iletişiminizi geliştirmeyi amaçlıyor. Bir diğerinde, nasıl söylerseniz söyleyin ne demek istediğinizi anlamak için “belirsiz sorguları” daha iyi anlamak için LLM’leri kullanıyor. “Belirsiz durumlarda,” diye yazmışlar, “akıllı diyalog ajanlarının proaktif olarak iyi sorular sorarak belirsizliklerini azaltmak için inisiyatif almaları ve böylece sorunları daha etkili bir şekilde çözmeleri gerekebilir.” Başka bir gazete bu konuda da yardımcı olmayı amaçlıyor: Araştırmacılar, asistanların cevap üretirken daha az ayrıntılı ve daha anlaşılır olmalarını sağlamak için LLM’leri kullandılar.

Çok yakında, sadece değişiklik isteyerek fotoğraflarınızı düzenleyebileceksiniz.
Resim: Apple

Sağlıkta yapay zeka, görüntü editörleri, Memojilerinizde

Apple ne zaman yapay zeka hakkında halka açık bir şekilde konuşsa, ham teknolojik güçten ziyade yapay zekanın sizin için gerçekten yapabileceği günlük şeylere odaklanma eğilimindedir. Bu nedenle, Siri’ye çok fazla odaklanılsa da – özellikle Apple Humane AI Pin, Rabbit R1 gibi cihazlarla rekabet etmeye çalışırken ve Google’ın Gemini’yi tüm Android’e yaymaya devam ederken – Apple’ın yapay zekanın yararlı olduğunu düşündüğü birçok başka yol var.

Apple’ın odaklanacağı bariz bir alan da sağlık: LLM’ler teorik olarak çeşitli aygıtlarınız tarafından toplanan biyometrik veri okyanuslarında gezinmenize ve tüm bunları anlamlandırmanıza yardımcı olabilir. Bu nedenle Apple, tüm hareket verilerinizi nasıl toplayıp harmanlayacağını, sizi tanımlamak için yürüyüş tanıma özelliğini ve kulaklığınızı nasıl kullanacağını ve kalp atış hızı verilerinizi nasıl takip edip anlayacağını araştırıyor. Apple ayrıca birden fazla vücut sensörüne sahip 50 katılımcıdan veri topladıktan sonra “mevcut en büyük çok cihazlı çok konumlu sensör tabanlı insan aktivitesi veri setini” oluşturdu ve yayınladı.

Apple da yapay zekayı yaratıcı bir araç olarak hayal ediyor gibi görünüyor. Bir makale için araştırmacılar bir grup animatör, tasarımcı ve mühendisle görüştü ve Keyframer adlı bir sistem “etkinleştirmek[s] kullanıcıların oluşturulan tasarımları yinelemeli olarak oluşturması ve iyileştirmesi.” Bir komut yazıp bir görüntü elde etmek, ardından başka bir komut yazıp başka bir görüntü elde etmek yerine, bir komutla başlayıp görüntünün bazı kısımlarını istediğiniz gibi değiştirmek ve iyileştirmek için bir araç seti elde edersiniz. Bu tür bir ileri geri sanatsal sürecin Memoji yaratıcısından Apple’ın daha profesyonel sanatsal araçlarına kadar her yerde ortaya çıktığını hayal edebilirsiniz.

İçinde başka bir gazeteApple, sadece yapmak istediğiniz düzenlemeleri tanımlayarak bir resmi düzenlemenizi sağlayan MGIE adlı bir araç tanımlıyor. (“Gökyüzünü daha mavi yap,” “yüzümü daha az tuhaf yap,” “biraz kaya ekle,” bu tür şeyler). Araştırmacılar, “MGIE, kısa ama muğlak rehberlik yerine, görsel farkındalığa sahip açık niyetler türetiyor ve makul görüntü düzenlemesine yol açıyor” diye yazdı. İlk deneyleri mükemmel değildi ama etkileyiciydi.

Apple Music’te yapay zeka bile kullanabiliriz: “Kaynak Kısıtlı Stereo Şarkı Söyleme Ses İptali” araştırmacıları şarkılardaki sesleri enstrümanlardan ayırmanın yollarını araştırdı – bu, Apple’ın insanlara TikTok veya Instagram’da yapabildiğiniz gibi şarkıları remikslemek için araçlar vermek istemesi durumunda kullanışlı olabilir.

Gelecekte Siri, telefonunuzu sizin yerinize anlayıp kullanabilir.
Resim: Apple

Zamanla, Apple’ın özellikle iOS’ta bu tür şeylere yöneldiğini göreceğinize bahse girerim. Bunların bir kısmını Apple kendi uygulamalarına dahil edecek, bir kısmını ise API olarak üçüncü taraf geliştiricilere sunacak. (Son Journaling Suggestions özelliği muhtemelen bunun nasıl çalışabileceğine dair iyi bir rehberdir). Apple, özellikle ortalama bir Android cihaza kıyasla donanım yeteneklerini her zaman ön plana çıkarmıştır; tüm bu beygir gücünü cihaz üzerinde, gizlilik odaklı yapay zeka ile eşleştirmek büyük bir fark yaratabilir.

Ancak Apple’da devam eden en büyük, en iddialı yapay zeka olayını görmek istiyorsanız, şunları bilmeniz gerekir Gelincik. Ferret, talimatları alabilen, daire içine aldığınız veya başka bir şekilde seçtiğiniz belirli bir şeye odaklanabilen ve etrafındaki dünyayı anlayabilen çok modlu bir büyük dil modelidir. Bir cihaza çevrenizdeki dünya hakkında sorular sormak gibi artık normal bir yapay zeka kullanım durumu için tasarlanmıştır, ancak ekranınızda ne olduğunu da anlayabilir. Ferret makalesinde araştırmacılar, uygulamalarda gezinmenize yardımcı olabileceğini, App Store derecelendirmeleriyle ilgili soruları yanıtlayabileceğini, neye baktığınızı tanımlayabileceğini ve daha fazlasını yapabileceğini gösteriyor. Bunun erişilebilirlik açısından gerçekten heyecan verici sonuçları var ama aynı zamanda telefonunuzu ve bir gün Vision Pro’nuzu ve/veya akıllı gözlüğünüzü kullanma şeklinizi tamamen değiştirebilir.

Burada çok ileri gidiyoruz, ancak bunun Apple’ın üzerinde çalıştığı diğer bazı şeylerle nasıl çalışacağını hayal edebilirsiniz. Ne istediğinizi anlayabilen bir Siri, ekranınızda olup biten her şeyi görebilen ve anlayabilen bir cihazla eşleştirildiğinde, kelimenin tam anlamıyla kendi kendini kullanabilen bir telefon ortaya çıkar. Apple’ın her şeyle derin entegrasyonlara ihtiyacı olmaz; uygulamaları çalıştırabilir ve doğru düğmelere otomatik olarak dokunabilir.

Tekrar ediyorum, tüm bunlar sadece bir araştırma ve bu bahardan itibaren hepsinin iyi çalışması gerçekten duyulmamış bir teknik başarı olacaktır. (Yani, sohbet robotlarını denediniz – harika olmadıklarını biliyorsunuz.) Ancak WWDC’de bazı büyük yapay zeka duyuruları alacağımıza dair her şeyine bahse girerim. Apple CEO’su Tim Cook bile Şubat ayında bu kadarını ima etti ve temelde söz verdi bu haftaki kazanç çağrısında. Ve iki şey çok açık: Apple yapay zeka yarışında çok fazla yer alıyor ve bu iPhone’un tamamen elden geçirilmesi anlamına gelebilir. Hatta Siri’yi isteyerek kullanmaya bile başlayabilirsiniz! Bu da büyük bir başarı olur.



Source link

Latest articles

Bluesky now lets you send DMs

Bluesky will now let you send a direct message to other users. For...

Lawyers say OpenAI could be in real trouble with Scarlett Johansson

OpenAI could face legal consequences for making a ChatGPT voice that sounds a...

Google could cut funding to more US news publishers

After threatening to remove links to California news outlets due to a new...

OpenAI’s News Corp deal licenses content from WSJ, New York Post, and more

OpenAI has struck a deal with News Corp, the media company that owns...

More like this

Bluesky now lets you send DMs

Bluesky will now let you send a direct message to other users. For...

Lawyers say OpenAI could be in real trouble with Scarlett Johansson

OpenAI could face legal consequences for making a ChatGPT voice that sounds a...

Google could cut funding to more US news publishers

After threatening to remove links to California news outlets due to a new...