كيف يمكن التمييز بين صوت الإنسان الحقيقي والذكاء الاصطناعي؟
اكتشف العلماء أن الفرق بين صوت الذكاء الاصطناعي وصوت الإنسان الحقيقي أصبح غير قابل للتمييز، حيث أصبح استنساخ الصوت باستخدام الذكاء الاصطناعي الآن متقدمًا جدًا لدرجة أنه أصبح قادرًا على إنشاء فقرات كاملة من مقتطفات صغيرة من التسجيلات وإصدار صوت لا يمكن تمييزه عن الإنسان الحقيقي، حسبما ذكر«telegraph».
ويخشى الخبراء من إمكانية استخدام أصوات الكمبيوتر الواقعية من قبل المحتالين الذين يقلدون البنوك وينشرون أخبارًا مزيفة.
وبحسب الدراسة، قام الباحثون بتشغيل مقاطع صوتية بصوت عالٍ على 100 شخص، ووجدوا أنهم لم يتمكنوا من معرفة ما هو بشري، وما الذي تم إنشاؤه باستخدام (AI).
وقالت البروفيسور كارولين ماكجيتيجان، إنه يمكن للأصوات الاصطناعية أن تبدو شبيهة جدًا بالإنسان، وأضافت: «هذا له آثار أخلاقية خطيرة علينا أخذها في الاعتبار، فالتكنولوجيا موجودة بالفعل، وعلينا أن نقرر أفضل السبل للاستفادة منها».
وأشارت إلى أنه من الواقعي أن نقول إن أي نوع من التكنولوجيا سيكون دائمًا عرضة لإساءة الاستخدام، لافتة إلى أنه «من المحتمل أن تكون هناك طرق نحتاج من خلالها التفكير في الطرق التي نقيم بها المعلومات».
وتابعت: «أعتقد أن هناك الكثير من احتمالات الضرر في هذه الأنواع من التقنيات التي قد تسعى إلى تكرار هوية الشخص إذا تم استخدامها لأغراض شائنة، ولكنني أفترض أن السؤال هو إلى أي مدى يمكن أن يؤدي تقليل الأضرار أيضًا إلى تعطيل المنفعة المحتملة».
وقد تم تشغيل عبارة على الأشخاص مرتين- قرأها شخص حقيقي، وأخرى بواسطة نسخة من الذكاء الاصطناعي لهذا الشخص- وتم سؤالهم عن العبارة التي يعتقدون أنها أصلية، وأجاب المشاركون بشكل صحيح 48% فقط من الوقت.
وتوصلت النتائج، إلى أن الناس كانت أفضل في التعرف على الذكاء الاصطناعي عندما كان ينتحل شخصية شخص يعرفونه، مع تحديد صحيح بنسبة 88% من الوقت عندما كان صوت صديق.
وقالت البروفيسور كارولين ماكجيتيجان: «ما وجدناه هو أنه بالنسبة للأشخاص الذين يعرفون الصوت الأصلي، فإنهم في الواقع حساسون للغاية بشأن ما إذا كان ما يسمعونه هو استنساخ أو تسجيل أصلي»، لكن عندما يتعلق الأمر بصوت شخص غريب، فإنهم في الأساس يخمنون.
وتابعت: «ما نراه الآن هو أن التكنولوجيا جيدة بما يكفي ليعني أن المستمعين قد لا يتمكنون من معرفة ما إذا كان ما يستمعون إليه هو صوت شخص حقيقي أم لا».
ومن خلال تجربة مخصصة، تم تشغيل تسجيل لحكاية إيسوب، الرياح الشمالية والشمس، بصوت عالٍ للصحفيين في المهرجان. وطلب منهم تحديد ما إذا كان المقطع الصوتي حقيقيًا أم مزيفًا.
واعتقد كل شخص في التجربة المخصصة أن التسجيل حقيقي، لكن البروفيسور ماكجيتيجان كشف أنه مجرد وهم، حيث يتشابك كل من الذكاء الاصطناعي والأصوات البشرية في مقطع واحد.
وقال البروفيسور ماكجيتيجان: «لقد كان من الصعب عليك أن تعتقد أن هذا كان صوتًا تم إنشاؤه بواسطة الكمبيوتر في أي جزء، وربما لم تكن لتظن أن هناك مصدرين مختلفين للكلام هناك».
وأوضحت، أنه يمكن للأصوات الاصطناعية أن تبدو شبيهة جدًا بالإنسان، لافتة إلى أن التكنولوجيا أصبحت الآن متاحة بسهولة وكفاءة لدرجة أن الأشخاص والشركات يفكرون في فكرة السماح للأشخاص باستخدام نسخ الذكاء الاصطناعي لصوت معين للمساعدين الأذكياء مثل سيري وأليكسا، أو قراءة الكتب الصوتية للأفراد.
وقالت البروفيسور ماكجيتيجان، إن هناك أسئلة أخلاقية خطيرة حول كيفية نشر وتنظيم هذه التكنولوجيا وكذلك كيفية حماية الناس من الخداع، كما أن هناك أيضًا إمكانية استخدام هذه التكنولوجيا لإعادة إنشاء صوت أحد أفراد أسرته المتوفى، بأسلوب برنامج الخيال العلمي التلفزيوني Black Mirror.
وأضافت ماكجيتيجان، أن هذا له آثار أخلاقية خطيرة يتعين علينا جميعًا أخذها في الاعتبار- فالتكنولوجيا موجودة بالفعل، لذا فإن الأمر متروك لنا لنقرر أفضل السبل للاستفادة منها.
وتابعت: «أعتقد أنه من الواقعي أن نقول إن أي نوع من التكنولوجيا سيكون دائما عرضة لإساءة الاستخدام، بغض النظر عن فوائده، و«يبدو أنه من المحتمل أن تكون هناك طرق نحتاج من خلالها، كمجتمع بأكمله، إلى التفكير في الطرق التي نقيم بها المعلومات.
وقالت: «أعتقد أن هناك الكثير من احتمالات الضرر في هذه الأنواع من التقنيات التي قد تسعى إلى تكرار هوية الشخص إذا تم استخدامها لأغراض شائنة، ولكنني أفترض أن السؤال هو إلى أي مدى يمكن أن يؤدي تقليل الأضرار أيضًا إلى تعطيل المنفعة المحتملة».