معظم تغييرات OpenAI على ChatGPT تتعلق بما يمكن أن يفعله الروبوت المدعوم بالذكاء الاصطناعي. مثل الأسئلة التي يمكنه الإجابة عليها، والمعلومات التي يمكنه الوصول إليها، وتحسين النماذج الأساسية. ولكن هذه المرة، يقومون بتعديل طريقة استخدام ChatGPT نفسها. تقوم الشركة بإطلاق نسخة جديدة من الخدمة تتيح لك التفاعل مع روبوت الذكاء الاصطناعي ليس فقط عن طريق كتابة الجمل في مربع النص، ولكن أيضًا عن طريق الكلام أو تحميل صورة. ستتوفر الميزات الجديدة لأولئك الذين يدفعون مقابل خدمة ChatGPT خلال الأسبوعين المقبلين، والجميع سيحصل عليها “قريبًا” وفقًا لـ OpenAI.جزء الدردشة الصوتية مألوف تمامًا، تقوم بالضغط على زر وتطرح سؤالك، ثم يحول ChatGPT الكلام إلى نص ويقدمه للنموذج اللغوي الكبير، ثم يحصل على إجابة ويحولها إلى كلام ويقرأ الإجابة بصوت عالٍ. يجب أن يشعرك هذا النظام تمامًا كما لو كنت تتحدث إلى Alexa أو Google Assistant، ولكن، كما تأمل OpenAI، ستكون الإجابات أفضل بفضل التكنولوجيا الأساسية المحسنة. يبدو أن معظم المساعدين الافتراضيين يتم إعادة بناؤهم لتعتمد على النماذج اللغوية الكبيرة، ويبدو أن OpenAI في مقدمة اللعبة.نموذج Whisper الممتاز من OpenAI يقوم بالكثير من تحويل الكلام إلى نص، والشركة تقوم بإطلاق نموذج جديد لتحويل النص إلى كلام يقول أنه يمكنه إنتاج “صوت شبيه بالإنسان من مجرد نص وبضع ثوانٍ من الكلام المسجل كعينة”. ستكون قادرًا على اختيار صوت ChatGPT من بين خمسة خيارات، ولكن يبدو أن OpenAI تعتقد أن للنموذج إمكانات أكبر بكثير من ذلك. تعمل OpenAI بالتعاون مع Spotify لترجمة البودكاست إلى لغات أخرى، على سبيل المثال، مع الحفاظ على صوت الشخصية المضيفة للبودكاست. هناك العديد من الاستخدامات المثيرة للالأصوات الاصطناعية، ويمكن أن تلعب OpenAI دورًا كبيرًا في هذه الصناعة.ومع ذلك، فإن إمكانية بناء صوت اصطناعي قادر بمجرد بضع ثوانٍ من الصوت يفتح الباب أمام جميع أنواع حالات الاستخدام. حيث تقول الشركة في منشور الإعلان عن الميزات الجديدة في مدونتها الإلكترونية:“توفر هذه القدرات أيضًا مخاطر جديدة، مثل إمكانية للأشخاص الخبيثة لتقمص الشخصيات العامة أو الاحتيال”.وبناءً على ذلك، فإن النموذج غير متاح للاستخدام العام، وفقًا لـ OpenAI سيكون أكثر سيطرة وتقييدًا لحالات الاستخدام المحددة والشراكات.