خبير تقني يتحدث عن خطر “تزييف” الأصوات: “تسجيل 5 دقائق يكفي”
قال نوفل تونسي، مدير قطاع المبيعات في شركة “أكابيلا” المتخصصة في تقديم خدمات الأداء البشري للأصوات الرقمية، السبت، إن سوق إنشاء الأصوات الرقمية يشهد تطوراً سريعاً بشكل يفتح “آفاقاً لا محدودة” أمام المطورين وصناع المحتوى، لكنه حذر في الوقت ذاته من “مخاطر غير مسبوقة” تواجه المجتمع.
وأوضح تونسي، على هامش معرض “جيتكس 2023” التقني في دبي، أن “5 دقائق فقط من الصوت النقي المسجلة بصوت شخص ما، كافية لإنشاء نسخة رقمية من صوته، ليكون من اليسير جعله ينطق بأي كلمات بنفس لغته”، مشيراً إلى أنه “أصبح من السهل استخدام صوت أي شخص مؤثر أو مشهور في فبركة الحقائق وترويج الشائعات”.
وأضاف المسؤول في الشركة البلجيكية أنه “يجب توخي الحذر في التعامل مع تقنيات الذكاء الاصطناعي التوليدي”، منبهاً أن “محترفي الأداء الصوتي أصبحوا في خطر بسبب تطور تقنيات إنشاء الأصوات الديجيتال”.
وذكر تونسي أن شركته لا تنوي دخول سوق تقديم خدمات إنشاء الأصوات الرقمية للأفراد، والذي تتصدره بشكل كبير شركة ElevenLabs. وحض الشركات العاملة في هذا السوق على “الالتزام بمستوى متقدم من المعايير الأخلاقية، لحماية نفسها من المساءلة القانونية من ناحية، ومنع ترويج المعلومات المغلوطة من جانب آخر”.
ولفت تونسي إلى أن “أكابيلا” تعمل حالياً على تقديم خدمة الترجمة الصوتية الآنية للمقاطع المسموعة بين اللغات المختلفة، مع الحفاظ على نفس صوت وأداء المُتحدث.
ودخلت عدة شركات كبرى إلى سوق خدمات الترجمة الصوتية وعلى رأسها سبوتيفاي ويوتيوب.
وأصوات “أكابيلا” الرقمية يمكنها تحدث أكثر من 30 لغة، من بينها العربية والإنجليزية والفرنسية والتركية والإسبانية والإيطالية، وتقدم ميزة تطلق عليها Voice Smileys التي تزود الأصوات الرقمية بالقدرة على التعبير عن المشاعر المختلفة، مما يضفي ميزة من الطابع البشري على الأصوات المصنعة.
وقال تونسي إن “أكابيلا” عملت طوال 22 عاماً على بناء وتدريب نماذجها الذكية الخاصة القادرة على تقديم أداء بشري للأصوات الرقمية، لتخدم أهداف عملائها في القطاعات التسويقية والترويجية، وكذلك دعم ذوي الهمم من فاقدي القدرة على النطق، للتعبير صوتياً عن أنفسهم.
ولفت تونسي إلى أن عمل الشركة مع ذوي الهمم يعتبر الجانب الوحيد لتعاونها مع الأفراد، موضحاً أن الشركة تزود ضعاف البصر وفاقديه بمساعدين صوتيين أذكياء عبر خدمتها Infovox3، والتي تتيح للمستخدم التفاعل مع أي نص يظهر على شاشة حاسوبه، قائلاً إن “الخدمة تقرأ النص بصوت مرتفع، وعندها يمكن للمستخدم التفاعل بأوامره الصوتية مع جهازه”.
وبيّن تونسي أن “أكابيلا” تقدم خدماتها للمصابين بمشكلات في النطق من خلال تمكينهم من إنشاء نسخة رقمية من صوتهم عبر تسجيل مقاطع صوتية بأداء متنوع، حتى يستخدم المريض تلك النسخة في التفاعل مع العالم بشكل طبيعي فيما بعد.