Güncel OpenAI, En Gelişmiş Konuşma Modeli gpt-realtime Tanıttı!

  • Konbuyu başlatan r4dx™
  • Başlangıç tarihi
  • Cevaplar : 0
  • Görüntüleme : 41

IFGENTR Konu Bilgileri

Konu Hakkında Merhaba, tarihinde ChatGPT kategorisinde r4dx™ tarafından oluşturulan OpenAI, En Gelişmiş Konuşma Modeli gpt-realtime Tanıttı! başlıklı konuyu okuyorsunuz. Bu konu şimdiye dek 41 kez görüntülenmiş, 0 yorum ve 0 tepki puanı almıştır...
Kategori Adı ChatGPT
Konu Başlığı OpenAI, En Gelişmiş Konuşma Modeli gpt-realtime Tanıttı!
Konbuyu başlatan r4dx™
Başlangıç tarihi
Cevaplar
Görüntüleme
İlk mesaj tepki puanı
Son Mesaj Yazan r4dx™

r4dx™

IFGT Developer
l 💙 IFGENTR
7
IFGT RANK
Katılım
12 Tem 2025
Mesajlar
756
Çözümler
1
Tepkime puanı
284
IFGT Puan
58
gpt-realtime duyuruldu! OpenAI’nin en gelişmiş konuşma modeli artık daha hızlı, daha gerçekçi ve daha uygun fiyatlı. İşte detaylar.

OpenAI, En Gelişmiş Konuşma Modeli gpt-realtime Tanıttı!


OpenAI, Realtime API için geliştirdiği gpt-realtime modelini duyurdu. Daha doğal sesler, düşük gecikme ve uygun fiyat avantajı dikkat çekiyor.

gpt-realtime ile Daha Doğal ve Hızlı Konuşma Deneyimi​

OpenAI, Ekim 2024’te tanıttığı Realtime API’yi bir adım öteye taşıyarak gpt-realtime modelini duyurdu. Yeni model, geliştiricilere düşük gecikmeli, çok modlu ve daha insansı konuşma deneyimleri sunmayı hedefliyor.

Model, karmaşık talimatları daha iyi takip ediyor, araç çağırma hatalarını azaltıyor ve ürettiği seslerde daha doğal tonlama sağlıyor. Ayrıca geliştirici komutlarını ve sistem mesajlarını, önceki modellere kıyasla çok daha doğru şekilde yorumluyor.

Yeni Sesler: Marin ve Cedar​

Realtime API ilk olarak 6 ses seçeneğiyle çıkış yapmış, daha sonra bu sayı 8’e yükselmişti. gpt-realtime ile birlikte, Marin ve Cedar isimli iki yeni ses eklendi. Bunun yanında mevcut sesler de güncellenerek daha akıcı ve gerçekçi bir hale getirildi.

Testlerde Güçlü Sonuçlar​

Yeni model, performans testlerinde dikkat çekici skorlar elde etti:

  • Big Bench Audio testinde: %82,8 doğruluk (önceki %65,6).
  • MultiChallenge Audio Benchmark testinde: %30,5 skor (önceki %20,6).
Bu veriler, gpt-realtime’ın hem doğruluk hem de çoklu görev yeteneklerinde ciddi gelişim kaydettiğini gösteriyor.

API’ye Yeni Özellikler​

gpt-realtime ile birlikte Realtime API de genişletildi:

  • Uzaktan MCP sunucuları desteği
  • Görsel girdi işleme yeteneği
  • SIP (Session Initiation Protocol) ile telefon aramaları
  • Prompt kaydetme ve yeniden kullanma özelliği
Bu yenilikler sayesinde geliştiriciler, daha esnek ve güçlü uygulamalar tasarlayabiliyor.

Daha Güçlü, Daha Ucuz​

Tüm bu geliştirmelere rağmen OpenAI, fiyat politikasında indirime gitti. gpt-realtime, önceki gpt-4o-realtime-preview modeline göre %20 daha ucuz:

  • 1M ses girdi tokeni → 32 dolar
  • 1M ses çıktı tokeni → 64 dolar

gpt-realtime nedir?​

OpenAI’nin Realtime API için geliştirdiği en yeni konuşma modeli. Daha doğal sesler ve düşük gecikmeli etkileşim sunuyor.

gpt-realtime önceki modellere göre ne fark sunuyor?​

Daha doğal sesler, daha iyi talimat takibi, düşük hata oranı ve genişletilmiş API entegrasyonları öne çıkan yenilikler arasında.

Yeni ses seçenekleri var mı?​

Evet, Marin ve Cedar isimli iki yeni ses eklenirken mevcut 8 ses de güncellendi.

API’de hangi yeni özellikler geldi?​

Görsel giriş desteği, telefon aramaları için SIP entegrasyonu, uzaktan MCP sunucuları ve prompt kaydetme özellikleri eklendi.

gpt-realtime’ın fiyatı ne kadar?​

Önceki modele göre %20 daha ucuz. 1M ses girdi tokeni 32 dolar, 1M ses çıktı tokeni 64 dolar.