في تطور مذهل، قامت شركة مايكروسوفت بتطوير مولد كلام جديد بالذكاء الاصطناعي، قبل أن تقرر فيما بعد عدم إتاحته للجمهور، بعد أن انتاب المسؤولين حالة من القلق، حيث وصفه العلماء بأنه مشروع بحثي بحت، فما القصة؟
VALL-E 2 هو مولد يمكنه إعادة إنتاج صوت المتحدث البشري خلال بضع ثوانٍ فقط من الصوت.
مايكروسوفت تطور مولد كلام بالذكاء الاصطناعي
قال باحثو مايكروسوفت إن VALL-E 2 قادر على توليد «كلام دقيق وطبيعي بنفس صوت المتحدث الأصلي، ويمكن مقارنته بالأداء البشري».
ووصف العلماء مولد الصوت الجديد بالذكاء الاصطناعي بأنه مقنع بما يكفي ليتم الخلط بينه وبين شخص حقيقي، وفقًا لمبتكريه.
وكتب الباحثون في ورقتهم البحثية: «إن VALL-E 2 هو أحدث تقدم في نماذج لغة الترميز العصبي الذي يمثل علامة فارقة في عملية تحويل النص إلى كلام (TTS)، محققًا التكافؤ البشري لأول مرة».
«وعلاوة على ذلك، يقوم VALL-E 2 بتركيب كلام عالي الجودة، حتى بالنسبة للجمل التي تشكل تحديًا تقليديًا بسبب تعقيدها أو عباراتها المتكررة، بحسب التقرير الذي نشره موقع «livescience».
ويعني التكافؤ البشري في هذا السياق أن الكلام الذي تم إنشاؤه بواسطة VALL-E 2 يطابق أو يتفوق على جودة الكلام البشري في المعايير التي تستخدمها Microsoft.
مخاوف من إطلاق مولد الكلام للجمهور
بحسب التقرير، تعمل خاصية Repetition Aware Sampling على تحسين الطريقة التي يحول بها الذكاء الاصطناعي النص إلى كلام من خلال معالجة تكرارات الرموز، وحدات صغيرة من اللغة، مثل الكلمات أو أجزاء الكلمات، ما يمنع تكرار الأصوات أو العبارات بشكل لا نهائي أثناء عملية فك التشفير.
تساعد هذه الميزة في تغيير نمط الكلام في VALL-E 2، ما يجعله يبدو أكثر سلاسة وطبيعية.
على الرغم من قدراته، لن تتيح مايكروسوفت VALL-E 2 للجمهور بسبب مخاطر إساءة الاستخدام المحتملة، في ظل المخاوف المتزايدة بشأن استنساخ الصوت وتقنية التزييف العميق.
وكتب الباحثون في منشور على مدونتهم «إن VALL-E 2 هو مشروع بحثي بحت، وفي الوقت الحالي، ليس لدينا أي خطط لدمج VALL-E 2 في منتج أو توسيع نطاق الوصول إلى الجمهور، لأنه قد يحمل مخاطر محتملة في سوء استخدام النموذج، مثل تزوير التعرف على الصوت أو انتحال شخصية متحدث معين».
تعليقات الفيسبوك