قريبًا ، قد لا تعرف أنك تتحدث إلى جهاز كمبيوتر

2025 مؤلف: Abigail Brown | [email protected]. آخر تعديل: 2025-01-24 12:01

الوجبات الجاهزة الرئيسية

يقترب اليوم بسرعة عندما لا تكون قادرًا على تمييز الكلام الناتج عن الكمبيوتر من الشيء الحقيقي.
كشفت Google مؤخرًا عن LaMDA ، وهو نموذج يمكن أن يسمح بمحادثات أكثر طبيعية.
إنتاج كلام يشبه الإنسان يتطلب أيضًا قدرًا هائلاً من قوة المعالجة.

في الوقت الحالي ، من السهل معرفة ما إذا كنت تتحدث إلى جهاز كمبيوتر ، ولكن هذا قد يتغير قريبًا بفضل التطورات الحديثة في الذكاء الاصطناعي.

كشفت Google مؤخرًا عن نموذج LaMDA ، وهو نموذج تجريبي تدعي الشركة أنه يمكن أن يعزز قدرة مساعدي الذكاء الاصطناعي للمحادثة ويسمح بمزيد من المحادثات الطبيعية.يهدف LaMDA في النهاية إلى التحدث بشكل طبيعي عن أي شيء تقريبًا دون أي نوع من التدريب المسبق.

إنه واحد من عدد متزايد من مشاريع الذكاء الاصطناعي التي قد تجعلك تتساءل عما إذا كنت تتحدث إلى إنسان.

"تقديري هو أنه في غضون الـ 12 شهرًا القادمة ، سيبدأ المستخدمون في التعرف على هذه الأصوات الجديدة الأكثر عاطفية والتعود عليها ،" جيمس كابلان ، الرئيس التنفيذي لشركة MeetKai ، وهو مساعد صوت افتراضي ومحادثات يعمل بالذكاء الاصطناعي المحرك ، قال في مقابلة عبر البريد الإلكتروني.

"بمجرد حدوث ذلك ، سيبدو الكلام المركب اليوم للمستخدمين مثل خطاب أوائل العقد الأول من القرن الحادي والعشرين لنا اليوم."

مساعدين صوتيين بالحرف

تم إنشاء LaMDA من Google على Transformer ، وهي بنية شبكة عصبية اخترعتها Google Research. على عكس نماذج اللغات الأخرى ، تم تدريب LaMDA من Google على الحوار الحقيقي.

كتب إيلي كولينز من Google في منشور مدونةجزء من التحدي المتمثل في جعل خطاب الذكاء الاصطناعي يبدو طبيعيًا هو الطبيعة المفتوحة للمحادثات.

"يمكن أن تتطور الدردشة مع صديق حول برنامج تلفزيوني إلى نقاش حول البلد الذي تم فيه تصوير العرض قبل الاتفاق على نقاش حول أفضل المأكولات الإقليمية في ذلك البلد" ، أضاف.

الأشياء تتحرك بسرعة مع كلام الروبوت. قال إريك روزنبلوم ، الشريك الإداري في Tsingyuan Ventures ، التي تستثمر في الذكاء الاصطناعي للمحادثات ، إن بعض المشكلات الأساسية في الكلام بمساعدة الكمبيوتر يتم حلها تقريبًا.

على سبيل المثال ، معدل الدقة في فهم الكلام مرتفع للغاية بالفعل في الخدمات مثل النسخ التي يتم إجراؤها بواسطة برنامج Otter.ai أو الملاحظات الطبية التي تم تسجيلها بواسطة DeepScribe.

وأضاف: "لكن الحدود التالية أصعب بكثير".

"الاحتفاظ بفهم السياق ، وهي مشكلة تتجاوز معالجة اللغة الطبيعية ، والتعاطف ، مثل أجهزة الكمبيوتر التي تتفاعل مع البشر تحتاج إلى فهم الإحباط ، والغضب ، ونفاد الصبر ، وما إلى ذلك.يتم العمل على هاتين المسألتين ، لكن كلاهما بعيد كل البعد عن أن يكون مرضيًا."

الشبكات العصبية هي المفتاح

لإنشاء أصوات تشبه الحياة ، تستخدم الشركات تقنية مثل الشبكات العصبية العميقة ، وهو شكل من أشكال التعلم الآلي الذي يصنف البيانات من خلال الطبقات ، مات مولدون ، رئيس أمريكا الشمالية في ReadSpeaker ، وهي شركة تطور برامج تحويل النص إلى كلام ، قال في مقابلة عبر البريد الإلكتروني.

"هذه الطبقات تحسن الإشارة ، وتصنفها في تصنيفات أكثر تعقيدًا" ، أضاف. "النتيجة هي كلام اصطناعي يبدو وكأنه إنسان غريب."

هناك تقنية أخرى قيد التطوير هي Prosody Transfer ، والتي تتضمن الجمع بين صوت تحويل النص إلى كلام مع أسلوب التحدث الخاص بآخر ، كما قال مولدون. هناك أيضًا نقل التعلم ، مما يقلل من كمية بيانات التدريب اللازمة لإنتاج صوت عصبي جديد لتحويل النص إلى كلام.

قال كابلان إن إنتاج كلام يشبه الإنسان يتطلب أيضًا قدرًا هائلاً من قوة المعالجة. تقوم الشركات بتطوير رقائق التسريع العصبي ، وهي وحدات مخصصة تعمل جنبًا إلى جنب مع المعالجات العادية.

"المرحلة التالية في هذا ستكون وضع هذه الرقائق في أجهزة أصغر ، كما هو الحال حاليًا للكاميرات عندما يكون الذكاء الاصطناعي للرؤية مطلوبًا" ، أضاف. "لن يمر وقت طويل قبل أن يتوفر هذا النوع من القدرة الحاسوبية في سماعات الرأس نفسها."

أحد التحديات التي تواجه تطوير الكلام الذي يحركه الذكاء الاصطناعي هو أن كل شخص يتحدث بشكل مختلف ، لذلك تميل أجهزة الكمبيوتر إلى صعوبة فهمنا.

قالت مونيكا ديما ، التي تعمل في تحليلات البحث الصوتي في MDinc ، في رسالة بالبريد الإلكتروني"فكر في جورجيا مقابل لهجات بوسطن مقابل لهجات نورث داكوتا ، وما إذا كانت اللغة الإنجليزية هي لغتك الأساسية أم لا". "بالتفكير عالميًا ، من المكلف القيام بذلك في جميع مناطق ألمانيا والصين والهند ، لكن هذا لا يعني أنه لا يتم أو لا يمكن القيام به."

موصى به:

ستتمكن قريبًا من بث ألعاب الجيل التالي إلى جهاز Xbox One الخاص بك

سيتمكن مستخدمو Xbox One الذين لم يتمكنوا من تعقب Series X أو Series S من بث ألعاب الجيل التالي من خلال Xbox Cloud Gaming بدلاً من ذلك

فوائد جهاز iPad على جهاز كمبيوتر محمول أو كمبيوتر مكتبي

بينما لا يمكن لجهاز iPad نسخ كل برنامج كمبيوتر ، هناك فوائد محددة لاستخدام جهاز iPad لا يمكن نسخه بسهولة على جهاز كمبيوتر محمول

Back Tap هو الزر الإضافي الذي لم تعرف أنك بحاجة إليه مطلقًا

في iOS 14 ، أضافت Apple زرًا جديدًا لجهاز iPhone الخاص بك. إذا قمت بالنقر مرتين أو ثلاث مرات على الجزء الخلفي من جهاز iPhone الخاص بك ، فيمكنك فتح تطبيق أو التقاط لقطة شاشة أو استدعاء Siri أو حتى تشغيل اختصار

Acer Aspire TC-885-ACCFLi3O مراجعة كمبيوتر سطح المكتب: جهاز كمبيوتر ميسور التكلفة لتحرير الوسائط

مكونات الجيل الثامن من Acer Spire TC-885 المقترنة بذاكرة وصول عشوائي (RAM) سعة 8 جيجابايت ونظام ذاكرة Intel Optane سعة 16 جيجابايت تسمح لها بالتفوق في تحرير مقاطع الفيديو المنزلية والصور والتدفق وتشغيل الوسائط والمزيد. قمنا باختباره لنرى كيف يعمل كجهاز كمبيوتر مكتبي منزلي أو تجاري مضغوط

مراجعة كمبيوتر HP Flagship Pro: جهاز كمبيوتر تم تجديده بأسعار معقولة بمواصفات صلبة

أداء HP Flagship Pro لسطح المكتب بشكل لائق في الاختبار المعياري ، ولكن قد يتم اختبار ضمان الأجزاء بمرور الوقت. كجهاز كمبيوتر تم تجديده من Amazon Renewed ، قمنا باختباره لمعرفة مدى نجاحه في مقابل الخيارات الأحدث

قريبًا ، قد لا تعرف أنك تتحدث إلى جهاز كمبيوتر

جدول المحتويات:

الوجبات الجاهزة الرئيسية

مساعدين صوتيين بالحرف

الشبكات العصبية هي المفتاح

موصى به:

ستتمكن قريبًا من بث ألعاب الجيل التالي إلى جهاز Xbox One الخاص بك

فوائد جهاز iPad على جهاز كمبيوتر محمول أو كمبيوتر مكتبي

Back Tap هو الزر الإضافي الذي لم تعرف أنك بحاجة إليه مطلقًا

Acer Aspire TC-885-ACCFLi3O مراجعة كمبيوتر سطح المكتب: جهاز كمبيوتر ميسور التكلفة لتحرير الوسائط

مراجعة كمبيوتر HP Flagship Pro: جهاز كمبيوتر تم تجديده بأسعار معقولة بمواصفات صلبة

كيفية استخدام سماعة الميكروفون على جهاز الكمبيوتر مع مقبس واحد

كيفية استخدام Live Photo Editor على iPhone

نصائح لأخذ كاميرا إلى عالم ديزني

كيفية حفظ ملفات GIF على iPhone

كيفية الطباعة من جهاز iPhone الخاص بك باستخدام AirPrint

أفضل أدوات العصف الذهني لعام 2022

أفضل 5 تطبيقات جداول بيانات لنظام Android في عام 2022

أفضل مواقع البطاقات الإلكترونية لعيد الأب لعام 2022

أفضل 10 تطبيقات إنتاجية لعام 2022

IPad iCloud: كيفية النسخ الاحتياطي والاستعادة

لماذا يعد إحياء Microsoft لـ Clippy خطوة رائعة

استكشاف أخطاء كاميرات Vivitar وإصلاحها

كيفية تغيير الأصوات على Waze

لماذا يشعر الخبراء بالقلق من التشفير على Facebook Messenger

مكون أو محوري: بناء صوت سيارة أفضل