Artık ChatGPT Resim ve Sesli Komut Yanıtlayabilir

4 Dk Okuma

Artık ChatGPT Resim ve Sesli Komut Yanıtlayabilir. Süper popüler yapay zekalı sohbet robotu her zaman sadece bir metin kutusuydu. Şimdi sorularınızı yeni yollarla anlamayı öğreniyor.

OpenAI’nin ChatGPT’de yaptığı değişikliklerin çoğu, yapay zeka destekli botun yapabileceklerini içeriyor: cevaplayabileceği sorular, erişebileceği bilgiler ve geliştirilmiş temel modeller. Ancak bu kez, ChatGPT’nin kendisini kullanma şeklinizi değiştiriyor. Şirket, yapay zeka botunu yalnızca bir metin kutusuna cümleler yazarak değil, yüksek sesle konuşarak veya yalnızca bir resim yükleyerek yönlendirmenize olanak tanıyan yeni bir hizmet sürümünü kullanıma sunuyor. OpenAI’ye göre yeni özellikler önümüzdeki iki hafta içinde ChatGPT için ödeme yapanlara sunulacak ve diğer herkes “kısa bir süre sonra” buna sahip olacak.

Sesli sohbet kısmı oldukça tanıdık: bir düğmeye dokunup sorunuzu söylüyorsunuz, ChatGPT bunu metne dönüştürüyor ve büyük dil modeline aktarıyor, bir yanıt alıyor, bunu tekrar konuşmaya dönüştürüyor ve yanıtı yüksek sesle söylüyor. Tıpkı Alexa ya da Google Assistant ile konuşmak gibi hissettirecek, sadece – OpenAI’nin umduğu gibi – altta yatan gelişmiş teknoloji sayesinde cevaplar daha iyi olacak. Görünüşe göre çoğu sanal asistan LLM’lere dayanacak şekilde yeniden inşa ediliyor – OpenAI sadece oyunun önünde.

OpenAI’nin mükemmel Whisper modeli konuşmadan metne işinin çoğunu yapıyor ve şirket “sadece metin ve birkaç saniyelik örnek konuşmadan insan benzeri ses” üretebileceğini söylediği yeni bir metinden konuşmaya modelini kullanıma sunuyor. ChatGPT’nin sesini beş seçenek arasından seçebileceksiniz, ancak OpenAI modelin bundan çok daha fazla potansiyele sahip olduğunu düşünüyor gibi görünüyor. OpenAI, örneğin podcast’leri diğer dillere çevirmek için Spotify ile birlikte çalışıyor ve bu sırada podcast yayıncısının sesini koruyor. Sentetik sesler için pek çok ilginç kullanım alanı var ve OpenAI bu sektörün büyük bir parçası olabilir.

Ancak sadece birkaç saniyelik sesle yetenekli bir sentetik ses oluşturabilmeniz, her türlü sorunlu kullanım durumuna da kapı açıyor. Şirket yeni özellikleri duyurduğu bir blog yazısında “Bu yetenekler, kötü niyetli aktörlerin kamuya mal olmuş kişileri taklit etme ya da dolandırıcılık yapma potansiyeli gibi yeni riskleri de beraberinde getiriyor” diyor. OpenAI, modelin tam da bu nedenle geniş kullanım için uygun olmadığını; çok daha kontrollü olacağını ve belirli kullanım durumları ve ortaklıklarla sınırlı kalacağını söylüyor.

Artık ChatGPT Resim ve Sesli Komut Yanıtlayabilir

Bu arada görsel arama biraz Google Lens’e benziyor. İlgilendiğiniz şeyin fotoğrafını çekiyorsunuz ve ChatGPT ne hakkında soru sorduğunuzu anlamaya çalışıyor ve buna göre yanıt veriyor. Ayrıca sorgunuzu netleştirmeye yardımcı olması için uygulamanın çizim aracını kullanabilir veya görüntüyle birlikte konuşabilir ya da sorular yazabilirsiniz. ChatGPT’nin ileri geri doğasının yararlı olduğu yer burasıdır; bir arama yapmak, yanlış cevap almak ve ardından başka bir arama yapmak yerine, botu yönlendirebilir ve ilerledikçe cevabı hassaslaştırabilirsiniz. (Bu, Google’ın multimodal arama ile yaptığı şeye çok benziyor).

Açıkçası, görsel aramanın potansiyel sorunları var. Bunlardan biri, bir chatbot’a bir kişi hakkında soru sorduğunuzda neler olabileceğidir. OpenAI, ChatGPT’nin “insanlar hakkında analiz yapma ve doğrudan ifadelerde bulunma yeteneğini” hem doğruluk hem de gizlilik nedenleriyle kasıtlı olarak sınırladığını söylüyor. Bu da yapay zeka için en bilim kurgu vizyonlardan biri olan birine bakıp “Bu kim?” diyebilme yeteneğinin yakın zamanda gerçekleşmeyeceği anlamına geliyor. – yakın zamanda gelmeyeceği anlamına geliyor. Bu da muhtemelen iyi bir şey.

ChatGPT’nin ilk lansmanından neredeyse bir yıl sonra, OpenAI hala yeni sorunlar ve dezavantajlar yaratmadan botuna nasıl daha fazla özellik ve yetenek kazandıracağını bulmaya çalışıyor gibi görünüyor. Bu sürümlerle şirket, yeni modellerinin yapabileceklerini kasıtlı olarak sınırlandırarak bu çizgide yürümeye çalıştı. Ancak bu yaklaşım sonsuza kadar işe yaramayacak. Daha fazla insan sesli kontrol ve görsel aramayı kullandıkça ve ChatGPT gerçekten çok modlu, kullanışlı bir sanal asistan olmaya yaklaştıkça, korkulukları açık tutmak gittikçe zorlaşacak.


Siz bu konu hakkında ne düşünüyorsunuz? Düşüncelerinizi bizimle yorumlar kısmından paylaşmayı unutmayın. Tüm içeriklerimiz için The Gamer Station Tüm İçerikler

ETİKETLENDİ:
Exit mobile version