عینک مجهز به هوش مصنوعی گفتار بی صدا را تشخیص می دهد
زمان مطالعه: 4 دقیقه از 5

عینک مجهز به هوش مصنوعی گفتار بی صدا را تشخیص می دهد

عینک مجهز به هوش مصنوعی

Glasses equipped with artificial intelligence

محققان دانشگاه کرنل یک رابط تشخیص گفتار بی‌صدا که از حسگر صوتی و هوش‌مصنوعی استفاده می‌کند تا به طور مداوم تا 31 فرمان بدون صدا را بر اساس حرکات لب و دهان تشخیص دهد را توسعه داده اند.

ژانگ ، دانشجوی دکترای علوم اطلاعات، محقق اصلی این ایده است که گفته : تشخیص گفتار بی‌صدا پیوسته روی عینک‌های با حداقل مزاحمت با استفاده از حس آکوستیک، که در کنفرانس ماشین‌های محاسباتی انجمن در مورد عوامل انسانی در سیستم‌های محاسباتی (CHI) این ماه در هامبورگ، آلمان ارائه خواهد شد. برای افرادی که نمی‌توانند صدا داشته باشند ، این فناوری گفتار بی‌صدا می‌تواند ورودی عالی برای یک ترکیب‌کننده صدا باشد.

از  این عینک برای چه استفاده می شود؟

ژانگ در مورد استفاده بالقوه این فناوری با توسعه بیشتر گفت: این می تواند صدای بیماران را بازگرداند. در شکل فعلی‌اش، EchoSpeech می‌تواند برای برقراری ارتباط با دیگران از طریق تلفن هوشمند در مکان‌هایی که گفتار ناخوشایند یا نامناسب است، مانند رستوران‌های پر سر و صدا یا کتابخانه‌ای آرام، استفاده شود.رابط گفتار بی‌صدا را نیز می‌توان با یک قلم جفت کرد و با نرم‌افزارهای طراحی مانند CAD بدون نیاز به صفحه کلید و ماوس استفاده کرد.

این عینک با یک جفت میکروفون و بلندگوی کوچک‌تر از پاک‌کن‌های مدادی، به یک سیستم مجهز به هوش مصنوعی تبدیل می‌شود که امواج صوتی را در سراسر صوت ارسال و دریافت می‌کند و حرکات دهان را حس می‌کند. سپس یک الگوریتم یادگیری عمیق این پروفایل‌های اکو را با دقت 95 درصد در زمان واقعی تجزیه و تحلیل می‌کند.

چنگ ژانگ، استادیار علوم اطلاعات و مدیر آزمایشگاه رابط های کامپیوتری هوشمند کورنل گفت: "ما در مورد این سیستم بسیار هیجان‌زده هستیم، زیرا این سیستم واقعاً زمینه را برای عملکرد و حریم خصوصی پیش می‌برد.کوچک، کم مصرف و حساس به حریم خصوصی است که همگی ویژگی های مهمی برای استقرار فناوری های پوشیدنی جدید در دنیای واقعی هستند."

اکثر فناوری‌های تشخیص گفتار بی‌صدا به مجموعه‌ای از دستورات از پیش تعیین‌شده محدود می‌شوند و کاربر را ملزم می‌کند که با دوربین روبرو شود یا آن را بپوشد، که نه عملی است و نه امکان‌پذیر. همچنین نگرانی‌های عمده‌ای در خصوص حفظ حریم خصوصی مربوط به دوربین‌های پوشیدنی وجود دارد هم برای کاربر و هم برای کسانی که کاربر با آنها در تعامل است. فناوری سنجش آکوستیک مانند نیاز به دوربین‌های ویدیویی پوشیدنی را از بین می‌برد.

François Guimbretère، استاد علوم اطلاعات گفت: از آنجایی که داده‌های صوتی بسیار کوچک‌تر از داده‌های تصویری یا ویدیویی هستند، برای پردازش به پهنای باند کمتری نیاز دارند و می‌توان آن‌ها را از طریق بلوتوث در زمان واقعی به تلفن هوشمند منتقل کرد. او گفت: «و از آنجایی که داده‌ها به‌جای آپلود در فضای ابری، به‌صورت محلی در تلفن هوشمند شما پردازش می‌شوند، «اطلاعات حساس به حریم خصوصی هرگز از کنترل شما خارج نمی‌شوند».


دیدگاه و پرسش
  • اتنا  حاجوی

    اتنا حاجوی

    1 سال پیش

    ثبت امتیاز بسیار عالی

مقالات مرتبط

دوره های برنامه نویسی جدید

تخفیف
دوره مقدماتی طراحی سایت
دوره مقدماتی طراحی سایت
25 ساعت 100 درس

17

(دانشجو)

5.0

( 1 نظر )
تخفیف
برنامه نویسی پایتون از مقدماتی تا پیشرفته
دوره کامل CSS3
دوره کامل CSS3
10 ساعت 55 درس

4

(دانشجو)

5.0

( 1 نظر )
دوره کامل PHP
دوره کامل PHP
10 ساعت 100 درس

1

(دانشجو)
دوره کامل HTML5
دوره کامل HTML5
10 ساعت 26 جلسه

1

(دانشجو)

شش مقاله اخیر