OpenAI, gerçek zamanlı sesli yapay zeka alanında yeni nesil modellerini duyurdu.
Şirketin tanıttığı GPT-Realtime-2, Translate ve Whisper modelleri; konuşma, çeviri ve anlık ses transkripsiyonu süreçlerini tek bir akış içinde daha doğal ve hızlı hale getirmeyi hedefliyor.
Yeni sistemlerle birlikte kullanıcıların yapay zeka ile daha kesintisiz bir sesli iletişim kurabilmesi amaçlanıyor.
GPT-Realtime-2 modeli gerçek zamanlı konuşma üretimi ve yanıtlamada daha düşük gecikme sunarken, Translate modeli çok dilli çeviri süreçlerini anlık hale getiriyor.
Whisper ise konuşmaları yüksek doğrulukla metne dönüştürerek transkripsiyon tarafında gelişmiş bir deneyim sağlıyor.
OpenAI, bu üç modelin birlikte çalışarak ses tabanlı yapay zeka uygulamalarında daha akıcı ve bütünleşik bir yapı oluşturacağını belirtiyor.
Yeni sistemlerin özellikle asistanlar, canlı çeviri hizmetleri ve gerçek zamanlı iletişim uygulamalarında kullanılmasının bekleniyor.