كيف يبقى التعرف على الصوت بطلاقة سريعًا ودقيقًا وخاصًا

جدول المحتويات:

كيف يبقى التعرف على الصوت بطلاقة سريعًا ودقيقًا وخاصًا
كيف يبقى التعرف على الصوت بطلاقة سريعًا ودقيقًا وخاصًا
Anonim

الوجبات الجاهزة الرئيسية

  • Fluent هو محرك التعرف على الصوت فائق السرعة يحترم الخصوصية ولا يحتاج إلى اتصال بالإنترنت.
  • يمكن تضمينه في أي جهاز تقريبًا.
  • يعمل بأي لغة
Image
Image

Fluent.ai هو محرك افتراضي للتعرف على الصوت لا يرسل أوامرك إلى الإنترنت ، ويعمل على الفور تقريبًا ، ويمكن أن يعمل بأي لغة ، وهو صغير جدًا بحيث يمكن بناؤه حتى بسعر رخيص ومنخفض -قوة الأجهزة مثل ساعة اللياقة ، على سبيل المثال.

على عكس Siri و Alexa ، يعد Fluent مساعدًا قائمًا بذاته يفهمك على الفور ويتعلم منك حتى يتحسن كلما زاد استخدامه. ليس لديها عمق المساعدين الافتراضيين المنتظمين ، لكن ليس المقصود بذلك. بدلاً من ذلك ، فهو أسرع وأكثر دقة وأكثر خصوصية من جهود Apple و Amazon و Google.

"الكلام إلى نص يستخدم معالجة اللغة الطبيعية ، ثم يستمد القصد" ، هذا ما قاله الرئيس التنفيذي لشركة Fluent Probal Lala لـ Lifewire خلال مقابلة مع Zoom. "إنها تتطلب الكثير من البيانات ، والكثير من قوة المعالجة. ينتقل الطلاقة مباشرة من الكلام إلى النية ، مع أخذ صوتك وتحويله مباشرة إلى فعل."

الخط السفلي

Fluent هو برنامج للتحكم في الصوت. إنه يعمل من خلال الاستماع إلى أمرك وتجريد كل الكلمات التي لا تحتاجها ، مع ترك الأسماء والأفعال الأساسية فقط. يصبح "إطفاء الأنوار" مجرد إطفاء وأضواء. يتم تجريد العناصر الأساسية من حكم بشري فوضوي وتحويلها إلى خطوات.إنها تشبه برمجة جهاز كمبيوتر ، وتحويل فكرة معقدة إلى أبسط مجموعة من التعليمات.

ما الذي يمكن استخدامه؟

يمكن استخدام بطلاقة لأي شيء. المفتاح هو أنه يتم تدريبه على موقف معين. باستخدام ساعة ذكية ، على سبيل المثال ، قد يتم تدريبها على أوامر اللياقة ، أو التشغيل الآلي للمنزل ، وإنشاء التقويم والمؤقت ، وما إلى ذلك. يجعل تقييد قاعدة البيانات كل شيء أكثر تركيزًا ويبقيها سريعة.

"حقيقة الأمر هي أنه مع الأجهزة القابلة للارتداء ، لا تتطلع إلى إجراء محادثة ،" قالت لالا ، "ربما أريد أن يبدأ روتين التمرين المفضل لدي ، وأريده بسرعة كبيرة."

السرعة والدقة هي بيت القصيد. يستغرق تشغيل وإطفاء الأضواء أجزاء من الثانية ، بدلاً من الاضطرار إلى الانتظار حتى يرسل Siri صوتك إلى السحابة ، انتظر حتى تتم معالجته ، ثم بعد ثوانٍ - تنطفئ الأضواء.

هذا التدريب الضيق يحافظ أيضًا على انخفاض حجم التطبيق. في العام الماضي ، قدمت Google نسخة قابلة للتنزيل وغير متصلة بالإنترنت من مساعدها. كانت ، كما تقول لالا ، 85 ميغا بايت ، عملت باللغة الإنجليزية فقط ، واستغرق تدريبها ستة أشهر.

قال"لدينا نموذج واحد يعمل مع 13000 أمر ويعمل في 500 كيلو بايت".

الخط السفلي

الميزة الأخرى لمحرك التعرف على الصوت في وضع عدم الاتصال هي الخصوصية. في الساعة الذكية للطفل ، على سبيل المثال ، تقول لالا: "لا تريد أن ينتقل صوت الطفل إلى السحابة". في الواقع ، يمكن لـ Fluent العمل داخل الأجهزة التي لا تتصل بالإنترنت مطلقًا. هذا ليس مفيدًا فقط للخصوصية ، ولكن أيضًا للأمان. يمكنك استخدام محرك التعرف على الصوت دون اتصال بالإنترنت داخل مختبرات الأبحاث والمنشآت العسكرية والأماكن الأخرى التي تحظر الهواتف المحمولة والكاميرات.

حدود

بالطبع ، هناك بعض الجوانب السلبية لهذا النموذج. الأول هو أنه لا يمكن إضافة الأوامر لاحقًا. بمجرد اكتمال التدريب الأولي ، هذا كل شيء. ولا يمكن لمساعدك القائم على Fluent أن يبحث عن أشياء على الإنترنت لنتائج رياضتك ، والممثل الذي تعرفه في هذا الفيلم ، ولكن لا يمكنك وضعه ، وما إلى ذلك.

Image
Image

بدلاً من ذلك ، النظام ذكي بما يكفي للتعرف على الوقت الذي لا يمكنه فيه المساعدة وسينقل الطلب إلى شيء يمكنه ذلك. إذا سألت ساعتك عن توقعات الطقس ، فسوف يدرك Fluent أنه لا يفهم. "بعد ذلك سوف يستدعي خدمة مبرمجة مسبقًا في الساعة ، سواء كانت Amazon's Alexa أو Google ، ثم إجراء مكالمة إلى السحابة" ، ويمرر الأمر الصوتي الخام للحصول على الإجابة.

يحافظ هذا النهج المختلط على سرعة المساعد المحلي غير المتصل ، مع قوة Alexa أو Google Assistant كنسخة احتياطية.

هل يمكنك شراء أي أجهزة بطلاقة؟

ليس بعد. تقوم الشركة بترخيص تقنيتها وإجراء التدريب لشركات أخرى. بفضل COVID ، تم تأجيل إطلاق عمليتين رئيسيتين إلى العام المقبل. ولكن يمكنك أن تتوقع رؤيتها تظهر في الساعات وأجهزة اللياقة البدنية الأخرى ، ومكبرات الصوت ، ومراكز التشغيل الآلي للمنزل ، وما إلى ذلك.

سيكون رائعًا إذا تم دمج هذا أيضًا مباشرةً في الهواتف الذكية مثل iPhone ، مما يجعل المهام اليومية أسرع ، واللجوء إلى Siri فقط عند الضرورة. سيكون هذا هو التطبيق القاتل الحقيقي.

تحديث: 22 أكتوبر ، 10:12 ص. تم إجراء تغييرات للإشارة إلى Fluent كمحرك للتعرف على الصوت بدلاً من مساعد الصوت.

موصى به: