عینک مجهز به هوش مصنوعی گفتار بی صدا را تشخیص می دهد
عینک مجهز به هوش مصنوعی
Glasses equipped with artificial intelligence
محققان دانشگاه کرنل یک رابط تشخیص گفتار بیصدا که از حسگر صوتی و هوشمصنوعی استفاده میکند تا به طور مداوم تا 31 فرمان بدون صدا را بر اساس حرکات لب و دهان تشخیص دهد را توسعه داده اند.
ژانگ ، دانشجوی دکترای علوم اطلاعات، محقق اصلی این ایده است که گفته : تشخیص گفتار بیصدا پیوسته روی عینکهای با حداقل مزاحمت با استفاده از حس آکوستیک، که در کنفرانس ماشینهای محاسباتی انجمن در مورد عوامل انسانی در سیستمهای محاسباتی (CHI) این ماه در هامبورگ، آلمان ارائه خواهد شد. برای افرادی که نمیتوانند صدا داشته باشند ، این فناوری گفتار بیصدا میتواند ورودی عالی برای یک ترکیبکننده صدا باشد.
از این عینک برای چه استفاده می شود؟
ژانگ در مورد استفاده بالقوه این فناوری با توسعه بیشتر گفت: این می تواند صدای بیماران را بازگرداند. در شکل فعلیاش، EchoSpeech میتواند برای برقراری ارتباط با دیگران از طریق تلفن هوشمند در مکانهایی که گفتار ناخوشایند یا نامناسب است، مانند رستورانهای پر سر و صدا یا کتابخانهای آرام، استفاده شود.رابط گفتار بیصدا را نیز میتوان با یک قلم جفت کرد و با نرمافزارهای طراحی مانند CAD بدون نیاز به صفحه کلید و ماوس استفاده کرد.
این عینک با یک جفت میکروفون و بلندگوی کوچکتر از پاککنهای مدادی، به یک سیستم مجهز به هوش مصنوعی تبدیل میشود که امواج صوتی را در سراسر صوت ارسال و دریافت میکند و حرکات دهان را حس میکند. سپس یک الگوریتم یادگیری عمیق این پروفایلهای اکو را با دقت 95 درصد در زمان واقعی تجزیه و تحلیل میکند.
چنگ ژانگ، استادیار علوم اطلاعات و مدیر آزمایشگاه رابط های کامپیوتری هوشمند کورنل گفت: "ما در مورد این سیستم بسیار هیجانزده هستیم، زیرا این سیستم واقعاً زمینه را برای عملکرد و حریم خصوصی پیش میبرد.کوچک، کم مصرف و حساس به حریم خصوصی است که همگی ویژگی های مهمی برای استقرار فناوری های پوشیدنی جدید در دنیای واقعی هستند."
اکثر فناوریهای تشخیص گفتار بیصدا به مجموعهای از دستورات از پیش تعیینشده محدود میشوند و کاربر را ملزم میکند که با دوربین روبرو شود یا آن را بپوشد، که نه عملی است و نه امکانپذیر. همچنین نگرانیهای عمدهای در خصوص حفظ حریم خصوصی مربوط به دوربینهای پوشیدنی وجود دارد هم برای کاربر و هم برای کسانی که کاربر با آنها در تعامل است. فناوری سنجش آکوستیک مانند نیاز به دوربینهای ویدیویی پوشیدنی را از بین میبرد.
François Guimbretère، استاد علوم اطلاعات گفت: از آنجایی که دادههای صوتی بسیار کوچکتر از دادههای تصویری یا ویدیویی هستند، برای پردازش به پهنای باند کمتری نیاز دارند و میتوان آنها را از طریق بلوتوث در زمان واقعی به تلفن هوشمند منتقل کرد. او گفت: «و از آنجایی که دادهها بهجای آپلود در فضای ابری، بهصورت محلی در تلفن هوشمند شما پردازش میشوند، «اطلاعات حساس به حریم خصوصی هرگز از کنترل شما خارج نمیشوند».
دیدگاه و پرسش
-
اتنا حاجوی
2 سال پیش
شش مقاله اخیر
دوره های برنامه نویسی برگزیده
790000 تومان
325000 تومان
845000 تومان
98000 تومان
100000 تومان
150000 تومان
مقالات برگزیده
مقالات مرتبط
دوره های برنامه نویسی جدید
برنامه نویسی وب، طراحی سایت از مقدماتی تا پیشرفته ( پروژه محور)
67
(دانشجو)3.3
( 8 نظر )