هل أصوات الكتب المسموعة فائقة الإعجاب هذه جيدة أم سيئة؟

جدول المحتويات:

هل أصوات الكتب المسموعة فائقة الإعجاب هذه جيدة أم سيئة؟
هل أصوات الكتب المسموعة فائقة الإعجاب هذه جيدة أم سيئة؟
Anonim

الوجبات الجاهزة الرئيسية

  • يستخدم DeepZen الذكاء الاصطناعي (الذكاء الاصطناعي) لإنشاء كتب صوتية واقعية بشكل مذهل من النص.
  • تستخدم التقنية ممثلين حقيقيين للصوت البشري لتوفير اللبنات الأساسية.
  • لا تقبل Amazon و Audible حاليًا الكتب الصوتية التي تم إنشاؤها بواسطة الكمبيوتر.
Image
Image

DeepZen هي شركة تنتج أصوات الكمبيوتر المستخدمة في الكتب الصوتية ، بناءً على الأصوات الحقيقية لممثلين بشريين. الجودة مخيفة - بسهولة جيدة بما يكفي للاستماع إليها لساعات في كل مرة.الحيلة هنا هي عنصر AI (الذكاء الاصطناعي) ، والذي يمكنه قراءة النص واستنتاج الاستجابة العاطفية الصحيحة بناءً على السياق. ثم يضع تلك المشاعر في الصوت.

إنه مثير للإعجاب ومريح للغاية. لكن هل نريد حقًا تجربة كتاب مسموع متجانسة؟ وماذا عن هؤلاء الممثلين الصوتيين؟

"من وجهة نظر الناشر المستقل ، فإن أي شيء يقلل من تكلفة إنتاج الكتب المسموعة مثير جدًا للاهتمام ،" هذا ما قاله ريك كارليل ، مالك الناشر المستقل كارلايل ميديا ، لموقع لايف واير عبر البريد الإلكتروني.

"لكن هذا الجذب يفترض أن المنتج سيكون ذا جودة متساوية مع السرد التقليدي. لا أعتقد أننا مائة بالمائة هناك حتى الآن. لا تفهموني خطأ ، DeepZen جيد بشكل مذهل. إنه اختراق هائل ، ومنشئوه يستحقون ثناءً ونجاحًا هائلين. لكنه ليس مثاليًا بعد."

الصوت هذا جيد بما فيه الكفاية

أفضل طريقة لفهم جودة DeepZen هي الاستماع إلى العينات.إذا لم تكن تعلم أنها تم إنشاؤها بواسطة الكمبيوتر ، فقد لا تدرك ذلك. ليس لفترة على أي حال. لنفترض أن DeepZen's AI مثالي وأنه لا يسيء أبدًا تفسير الملاحظات العاطفية التي من المفترض أن يضربها.

Image
Image

حتى مع ذلك ، يمكن للإنسان أن يقدم تفسيرات أكثر دقة وأكثر إثارة للدهشة في كثير من الأحيان. قد يضع الممثل تحريفًا غير متوقع على الكلمات التي لن يفكر فيها الكمبيوتر أبدًا. وفي الواقع ، من المؤكد أن تفسير الذكاء الاصطناعي ليس بجودة ممثل الصوت المحترف بعد.

"بصفتي شخصًا يعمل في مجال الأفلام ومؤخرًا في عالم السرد الصوتي ، فأنا معجب بالذكاء الاصطناعي - أعرف حقيقة أن هناك أعماق عميقة للمعنى لا تستطيع الآلة تفسيرها ،" صوت احترافي قال الممثل بول كرام لـ Lifewire عبر البريد الإلكتروني.

"هل سيكون هناك عدد كبير من المؤلفين المجهولين الذين يستخدمونها؟ أضمن وجودها لأنها" جيدة بما فيه الكفاية. ""

أن تكون جيدًا بما فيه الكفاية ، بالإضافة إلى توفير الراحة والتكلفة ، قد يكون كافياً لدفع الناشرين المستقلين إلى الخدمة.

"يمكن أن تكلف الكتب المسموعة ما يصل إلى 500 دولار لكل ساعة مكتملة من الصوت (أكثر بكثير لصوت المشاهير) ، وهذا لا يشمل تكلفة الوقت للإدارة والمشرف" ، كما يقول كارلايل. "إن القدرة على خفض هذه التكلفة إلى النصف بمجرد تحميل مخطوطة إلى مزود مثل DeepZen أمر جذاب للغاية."

مشكلة في الحديث

الأمر ليس بنفس سهولة طرد الممثلين الصوتيين وتحميل المخطوطات إلى DeepZen. يوجد حاليًا عائق واحد أمام الخطاب المسموع السهل للذكاء الاصطناعي ، وهو من أمازون.

Image
Image

"حاليًا ، لن يقبل ACX ، طريق الناشر الذاتي لتوزيع Audible و Amazon للكتب الصوتية ، الكتب المسموعة التي لم يسجلها الإنسان" ، كما يقول كارلايل.

لماذا؟ جودة. إليك إدخال الأسئلة الشائعة من الموقع:

"تحويل النص إلى كلام أو التسجيلات الآلية الأخرى غير مسموح بها. يختار المستمعون المسموعون الكتب الصوتية لأداء المادة ، بالإضافة إلى القصة. لتلبية هذا التوقع ، يجب أن يتم تسجيل كتابك الصوتي بواسطة إنسان."

هذا يعني أن الكتب الصوتية التي تم إنشاؤها بواسطة DeepZen أصبحت خارج الخدمة الآن ، على الأقل. هذه تكهنات خالصة ، لكن DeepZen يبدو وكأنه استحواذ جيد جدًا لشركة Amazon ، مما يسمح لها ببيع الخدمة والاحتفاظ بها فقط للكتب المسموعة. وحتى إذا لم يحدث ذلك ، إذا كانت جودة الكتب الصوتية التي تم إنشاؤها بواسطة الكمبيوتر جيدة مثل هذا ، فلا يبدو أن هناك سببًا يدعو إلى عدم إجراء استثناء لهذه القاعدة.

هل ستكون سعيدًا بالاستماع إلى الكتب الصوتية المصنوعة بهذه الطريقة؟ عندما يحدث ذلك ، لن يشك معظم الناس. قد يفضل البعض إتقان الأصوات التي يتم إنشاؤها بواسطة الكمبيوتر لأنها ستكون خالية من التشنجات اللاإرادية والعادات الصوتية التي يمكن أن تشتت الانتباه في بعض الأحيان. هذه التقنية مناسبة أيضًا لألعاب الفيديو والإعلانات التلفزيونية والإذاعية وأي سيناريو آخر تقوم فيه بتعيين ممثل صوتي.

تقنية DeepZen أيضًا ستجعل طريقة رائعة لإنشاء بث إخباري تلقائيًا من المقالات المكتوبة ، والتي يمكن أن تكون في متناول اليد أثناء التنقل.

وماذا عن هؤلاء الممثلين الصوتيين؟ حسنًا ، ستكون هناك فرصة واحدة على الأقل: يمكنهم الذهاب والعمل لدى DeepZen.

موصى به: