اخبار صنعت

فناوری ردیابی چشم چیست؟ – تعریف، ویژگی‌ها و اهداف Eye Tracking

فناوری ردیابی چشم، که گاهی به‌عنوان ردیابی نگاه شناخته می‌شود، روشی مبتنی بر حسگر است که محل نگاه فرد، مدت زمان تمرکز بر نقاط خاص، و مسیر حرکت چشم‌ها را ثبت می‌کند. این فناوری که در اواخر قرن نوزدهم با مشاهدات دستی آغاز شد. فناوری ردیابی چشم با استفاده از دوربین‌های مادون قرمز، الگوریتم‌های پیشرفته، و یادگیری ماشین به سیستم‌های پیچیده‌ای تبدیل شده است. ردیابی چشم در زمینه‌هایی مانند تشخیص بیماری‌های عصبی، بهبود طراحی محصولات، و کنترل بدون دست دستگاه‌ها کاربرد دارد. پیشرفت‌های اخیر در سخت‌افزارهای مقرون‌به‌صرفه و نرم‌افزارهای دقیق، این فناوری را برای تحقیقات و کاربردهای تجاری قابل‌دسترس کرده است.

به گزارش ابرار صنعتی، فناوری ردیابی چشم با ثبت حرکات چشم، بینش‌های عمیقی درباره توجه بصری، فرآیندهای شناختی، و حالت‌های احساسی ارائه می‌دهد. این فناوری در حوزه‌های مختلفی از پزشکی و روان‌شناسی گرفته تا آموزش، خودروهای هوشمند، و واقعیت مجازی کاربرد دارد. با پیشرفت‌های اخیر در سخت‌افزار و نرم‌افزار، ردیابی چشم به ابزاری قدرتمند برای بهبود تجربه کاربری و افزایش دسترسی‌پذیری تبدیل شده است.

ردیابی چشم

فناوری ردیابی چشم چیست؟

ردیابی چشم شامل اندازه‌گیری موقعیت چشم، حرکات آن، و اندازه مردمک برای تعیین نقطه نگاه و توجه بصری فرد است. این فناوری داده‌هایی درباره تثبیت‌ها (fixations، زمانی که چشم برای پردازش اطلاعات متوقف می‌شود)، جهش‌ها (saccades، حرکات سریع چشم بین نقاط)، و پیگیری‌های نرم (smooth pursuits، ردیابی اشیاء متحرک) جمع‌آوری می‌کند. سیستم‌های مدرن از روش‌های غیرتهاجمی مانند نور مادون قرمز و دوربین‌های با وضوح بالا برای ثبت انعکاس‌های قرنیه و موقعیت مردمک استفاده می‌کنند. این فناوری در حوزه‌های متنوعی از جمله علوم اعصاب، بازاریابی، بازی‌های ویدئویی، و دسترسی‌پذیری برای افراد معلول کاربرد دارد.

نحوه عملکرد

سیستم‌های ردیابی چشم عمدتاً از روش انعکاس مرکز مردمک-قرنیه (PCCR) استفاده می‌کنند. در این روش، یک منبع نور مادون قرمز به چشم تابانده می‌شود و انعکاس نور روی قرنیه (glint) و مردمک را برجسته می‌کند. دوربین‌های با وضوح بالا این انعکاس‌ها را ثبت می‌کنند و الگوریتم‌ها با محاسبه رابطه بین مرکز مردمک و glint، جهت نگاه را تعیین می‌کنند. سیستم‌های پیشرفته مانند Tobii Pro از روش‌های ردیابی روشن-مردمک (bright-pupil) و تاریک-مردمک (dark-pupil) برای دقت در شرایط نوری مختلف استفاده می‌کنند. کالیبراسیون برای تنظیم سیستم با ویژگی‌های منحصربه‌فرد چشم کاربر ضروری است.

فناوری Eye Tracking

اجزای اصلی سیستم‌های ردیابی چشم

  • نورافکن‌های مادون قرمز: نور نزدیک به مادون قرمز را برای ایجاد انعکاس قرنیه منتشر می‌کنند بدون اینکه کاربر را اذیت کنند.
  • دوربین‌های با وضوح بالا: تصاویر چشم را با نرخ 60 تا 2000 هرتز برای ثبت دقیق حرکات ضبط می‌کنند.
  • نرم‌افزار پردازش: الگوریتم‌هایی که تصاویر چشم را تحلیل کرده و نقاط نگاه، تثبیت‌ها، و جهش‌ها را محاسبه می‌کنند.
  • رابط کالیبراسیون: برای تنظیم دقیق سیستم با دنبال کردن نقاط روی صفحه توسط کاربر.
  • دستگاه‌های خروجی: نمایشگرها یا سیستم‌هایی که داده‌های نگاه را به‌صورت نقشه‌های حرارتی یا مسیرهای نگاه ارائه می‌دهند.

برخی سیستم‌ها با نمایشگرهای نصب‌شده روی سر (HMD) یا دستگاه‌های پوشیدنی برای کاربردهای VR ادغام می‌شوند.

کاربردهای ردیابی چشم

فناوری ردیابی چشم کاربردهای گسترده‌ای در صنایع مختلف دارد. در پزشکی، برای تشخیص اختلالات عصبی مانند اوتیسم و پارکینسون استفاده می‌شود. در بازاریابی، توجه مصرف‌کنندگان به تبلیغات یا طراحی محصولات را تحلیل می‌کند. در آموزش، فرآیندهای یادگیری و خواندن را بررسی می‌کند. در صنعت خودرو، توجه راننده را برای ایمنی بیشتر رصد می‌کند، و در بازی‌های ویدئویی و واقعیت مجازی، تعاملات immersive را تقویت می‌کند. برای افراد معلول، ردیابی چشم امکان کنترل دستگاه‌ها بدون استفاده از دست را فراهم می‌کند، که دسترسی‌پذیری را بهبود می‌بخشد.

کاربردها در پزشکی

ردیابی چشم در پزشکی به‌عنوان ابزاری تشخیصی و آموزشی تحول‌آفرین است. این فناوری به‌عنوان یک نشانگر زیستی برای اختلالات عصبی مانند اوتیسم، پارکینسون، و آلزایمر عمل می‌کند. برای مثال، افراد مبتلا به اوتیسم اغلب تماس چشمی کمتری دارند و الگوهای نگاه غیرمعمولی نشان می‌دهند که می‌تواند تشخیص زودهنگام را تسهیل کند. در بیماری پارکینسون، کاهش سرعت جهش‌ها یا طولانی شدن تثبیت‌ها نشانه‌های تشخیصی هستند. همچنین، ردیابی چشم در آموزش پزشکی با تحلیل نحوه اسکن تصاویر تشخیصی مانند ECG توسط پزشکان، دقت آن‌ها را بهبود می‌بخشد. چالش‌ها شامل خطاهای کالیبراسیون و هزینه بالای تجهیزات است.

استفاده از ردیابی چشم در خودروهای هوشمند

در خودروهای هوشمند، ردیابی چشم ایمنی را با نظارت بر توجه راننده و تشخیص خستگی یا حواس‌پرتی بهبود می‌بخشد. سیستم‌های یکپارچه، مانند محصولات Tobii، داده‌های نگاه را برای اطمینان از تمرکز راننده بر جاده تحلیل می‌کنند. مطالعه‌ای توسط Gupta و همکاران نشان داد که ردیابی چشم تنها فناوری قابل‌اعتماد برای نظارت بلادرنگ خستگی در محیط‌های دریایی است، که در خودروها نیز کاربرد دارد. در صورت انحراف نگاه راننده، هشدارها یا مداخلات خودکار فعال می‌شوند. چالش‌ها شامل حفظ دقت در شرایط نوری متغیر و ادغام با حسگرهای دیگر است.

رازهای علمی پشت پرده حرکت چشم انسان و فناوری‌های ثبت آن

حرکات چشم انسان توسط فرآیندهای فیزیولوژیکی و عصبی پیچیده‌ای هدایت می‌شوند. شبکیه با سلول‌های حساس به نور (میله‌ها و مخروط‌ها) محرک‌های بصری را پردازش می‌کند و داده‌ها را از طریق عصب بینایی به مغز می‌فرستد. تثبیت‌ها زمانی رخ می‌دهند که چشم برای جمع‌آوری اطلاعات با وضوح بالا از ناحیه فووآ (fovea) توقف می‌کند.

عینک مخصوص

جهش‌ها چشم را به‌سرعت بین نقاط جابه‌جا می‌کنند، و پیگیری‌های نرم اشیاء متحرک را دنبال می‌کنند. فناوری‌های ردیابی چشم از این حرکات با استفاده از نور مادون قرمز برای اندازه‌گیری انعکاس‌های قرنیه و دینامیک مردمک بهره می‌برند. روش‌های پیشرفته مانند الکترواکولوگرافی (EOG) پتانسیل‌های الکتریکی عضلات چشم را ثبت می‌کنند.

تکنیک‌های سیستم ردیابی چشم Eye Tracking

روش انعکاس مرکز مردمک-قرنیه (PCCR)

روش PCCR رایج‌ترین تکنیک در سیستم‌های ردیابی چشم مدرن است و در دستگاه‌هایی مانند Tobii Pro و EyeLink 1000 Plus استفاده می‌شود. در این روش، یک یا چند منبع نور مادون قرمز (معمولاً با طول موج 850 تا 950 نانومتر) به چشم تابانده می‌شود که دو انعکاس ایجاد می‌کند: انعکاس قرنیه (glint) و مردمک روشن یا تاریک. دوربین‌های با وضوح بالا (با نرخ فریم 60 تا 2000 هرتز) این انعکاس‌ها را ثبت می‌کنند. الگوریتم‌ها با محاسبه بردار بین مرکز مردمک و glint، زاویه نگاه را تعیین می‌کنند.

تکنیک‌های روشن-مردمک (bright-pupil، که مردمک به دلیل انعکاس نور سفید به نظر می‌رسد) و تاریک-مردمک (dark-pupil، که مردمک تیره باقی می‌ماند) برای شرایط نوری مختلف به کار می‌روند. کالیبراسیون، که معمولاً شامل دنبال کردن نقاط خاص روی صفحه توسط کاربر است، برای تنظیم مدل با ویژگی‌های چشمی فرد ضروری است. این روش دقتی بین 0.3 تا 1 درجه زاویه‌ای ارائه می‌دهد، اما به شرایط نوری پایدار و عدم وجود موانع مانند عینک وابسته است.

الکترواکولوگرافی (EOG)

الکترواکولوگرافی (EOG) روشی است که پتانسیل‌های الکتریکی تولیدشده توسط حرکات عضلات چشم را اندازه‌گیری می‌کند. چشم مانند یک دوقطبی الکتریکی عمل می‌کند، با قرنیه دارای بار مثبت و شبکیه دارای بار منفی. الکترودهای قرارگرفته روی پوست اطراف چشم، تغییرات ولتاژ را هنگام حرکت چشم (مانند جهش‌ها یا پیگیری‌های نرم) ثبت می‌کنند. EOG به دلیل عدم نیاز به نور مادون قرمز، در محیط‌های با نور متغیر یا برای افرادی با مشکلات چشمی که PCCR را مختل می‌کند، مناسب است. دقت آن (معمولاً 1 تا 2 درجه) کمتر از PCCR است و به دلیل نیاز به الکترودهای تماسی، کمتر کاربرپسند است. EOG بیشتر در تحقیقات پزشکی، مانند مطالعه خواب یا اختلالات عصبی، استفاده می‌شود.

ردیابی مبتنی بر ویدئو

ردیابی مبتنی بر ویدئو از دوربین‌های معمولی یا وب‌کم‌ها برای تحلیل تصاویر چشم بدون نیاز به نور مادون قرمز اختصاصی استفاده می‌کند. این روش با استفاده از الگوریتم‌های پردازش تصویر و یادگیری ماشین، ویژگی‌های چشم مانند لبه‌های مردمک یا پلک‌ها را شناسایی می‌کند. مدل‌های یادگیری عمیق، مانند شبکه‌های کانولوشنی (CNN) مبتنی بر MobileNet یا ResNet، برای تشخیص مردمک و تخمین نگاه آموزش داده می‌شوند. این روش با وب‌کم‌های ارزان‌قیمت (مانند سیستم‌های GazeRecorder) امکان ردیابی چشم را در محیط‌های روزمره فراهم کرده است. با این حال، دقت آن (1 تا 3 درجه) به دلیل وابستگی به نور محیط و کیفیت دوربین، کمتر از سیستم‌های PCCR است. این روش برای کاربردهای مصرفی مانند بازی‌های ویدئویی و رابط‌های کاربری مناسب است.

نقش یادگیری ماشین در ردیابی چشم

یادگیری ماشین نقش مهمی در بهبود دقت و کارایی ردیابی چشم ایفا کرده است. شبکه‌های عصبی عمیق، مانند شبکه‌های بازگشتی (RNN) برای تحلیل سری‌های زمانی حرکات چشم و شبکه‌های کانولوشنی برای پردازش تصاویر، داده‌های خام را به اطلاعات نگاه تبدیل می‌کنند. برای مثال، الگوریتم‌های مبتنی بر یادگیری عمیق می‌توانند نویز ناشی از حرکات سر یا تغییرات نوری را فیلتر کنند. در سیستم‌های مدرن، مدل‌های یادگیری ماشین مانند OpenFace و GazeNet برای تخمین نگاه در شرایط واقعی آموزش داده شده‌اند. این مدل‌ها با داده‌های گسترده‌ای از حرکات چشم کاربران مختلف آموزش می‌بینند تا تنوع فیزیولوژیکی (مانند شکل چشم یا رنگ مردمک) را پوشش دهند. چالش اصلی در این حوزه، نیاز به مجموعه داده‌های بزرگ و متنوع برای آموزش و محاسبات سنگین برای پردازش بلادرنگ است.

محاسبات لبه‌ای و بهینه‌سازی

برای کاربردهای بلادرنگ، مانند کنترل دستگاه‌ها یا ردیابی در VR، محاسبات لبه‌ای (edge computing) برای کاهش تأخیر استفاده می‌شود. این روش پردازش داده‌ها را به جای سرورهای ابری، در خود دستگاه انجام می‌دهد. برای مثال، سیستم‌های Tobii Pro Glasses 3 از پردازش لبه‌ای برای تحلیل نگاه با نرخ 100 هرتز استفاده می‌کنند. الگوریتم‌های بهینه‌شده مانند MobileNetV2، که برای دستگاه‌های کم‌قدرت طراحی شده‌اند، امکان اجرای ردیابی چشم روی گوشی‌های هوشمند را فراهم کرده‌اند. این پیشرفت‌ها هزینه‌ها را کاهش داده و دسترسی‌پذیری را افزایش داده‌اند، اما همچنان نیاز به کالیبراسیون دقیق و مدیریت نویز محیطی وجود دارد.

کاربرد ردیابی چشم

فناوری ردیابی چشم در حوزه آموزش

ردیابی چشم در آموزش بینش‌هایی درباره فرآیندهای یادگیری، درک مطلب، و بار شناختی ارائه می‌دهد. مطالعات نشان می‌دهند که این فناوری می‌تواند مشکلات در حل مسائل ریاضی یا خواندن را با تحلیل مدت تثبیت‌ها و الگوهای جهش‌ها شناسایی کند. به‌عنوان مثال، تحقیق Chen و همکاران کاربرد آن را در درک تعامل دانش‌آموزان با محتوای دیجیتال نشان داد. این فناوری همچنین در طراحی ابزارهای آموزشی با تحلیل نحوه تعامل دانش‌آموزان با محتوا کمک می‌کند. چالش‌ها شامل نیاز به محیط‌های کنترل‌شده و ناتوانی در ردیابی چشم برخی افراد به دلیل عینک یا رنگ مردمک است.

ردیابی چشم و واقعیت مجازی

ردیابی چشم در واقعیت مجازی (VR) تجربه‌های immersive را با رندر فووآتی (foveated rendering) بهبود می‌بخشد، که در آن تنها ناحیه مورد نگاه با وضوح بالا رندر می‌شود و بار محاسباتی کاهش می‌یابد. در نمایشگرهای نصب‌شده روی سر مانند HTC Vive Pro Eye، این فناوری امکان کنترل مبتنی بر نگاه را فراهم می‌کند. کاربردها شامل شبیه‌سازی‌های آموزشی، بازی‌های ویدئویی، و توان‌بخشی است. چالش‌ها شامل دقت داده‌ها در محیط‌های پویای VR و مدیریت حرکات کوچک چشم مانند میکروسکادها است که نیاز به ردیاب‌های با دقت بالا دارد.

ردیابی چشم در تحقیقات روان‌شناسی

ردیابی چشم در روان‌شناسی فرآیندهای شناختی و احساسی را آشکار می‌کند. این فناوری برای مطالعه توجه، حافظه، و شناخت اجتماعی استفاده می‌شود. برای مثال، الگوهای نگاه غیرمعمول در افراد مبتلا به اسکیزوفرنی یا اختلال دوقطبی بینش‌هایی درباره رفتار جستجوی بصری ارائه می‌دهد. همچنین، تغییر در الگوهای نگاه در بیماری پارکینسون به تشخیص پردازش احساسی کمک می‌کند. معیارهایی مانند زمان اولین تثبیت و مدت زمان کلی نگاه روی نواحی موردنظر، توزیع توجه را کمی‌سازی می‌کنند.

دقت و چالش‌های فناوری ردیابی چشم

دقت ردیابی چشم به کالیبراسیون، کیفیت سخت‌افزار، و شرایط محیطی بستگی دارد. سیستم‌های پیشرفته دقتی زیر یک درجه دارند، اما عواملی مانند حرکات سر، عینک، یا نور محیط می‌توانند دقت را کاهش دهند. مشکل لمس میداس (Midas touch)، که در آن نگاه ناخواسته باعث فعال‌سازی دستورات می‌شود، یک چالش مهم است. کالیبراسیون برای افراد غیرکلامی یا با نگاه ناپایدار دشوار است. هزینه‌های بالای سیستم‌های تحقیقاتی (ده‌ها هزار دلار) و نیاز به تخصص نیز موانعی هستند. پیشرفت‌های اخیر، مانند ردیابی مبتنی بر وب‌کم، این مشکلات را کاهش داده‌اند.

استفاده از ردیابی چشم برای افراد معلول

ردیابی چشم برای افراد با معلولیت‌های حرکتی شدید، مانند سندرم قفل‌شدگی (LIS) یا اسکلروز جانبی آمیوتروفیک (ALS)، امکان ارتباط را فراهم می‌کند. کاربران می‌توانند با نگاه خود حروف یا آیکون‌ها را انتخاب کنند. سیستم‌هایی مانند کنترل چشمی ویندوز 10 امکان شبیه‌سازی ماوس و کیبورد را دارند. مطالعه Barua و همکاران یک سیستم ردیابی چشم مبتنی بر هوش مصنوعی برای بیماران LIS توسعه داد که کیفیت زندگی را بهبود بخشید. چالش‌ها شامل نیاز به کالیبراسیون دقیق و ناتوانی در ردیابی برای برخی شرایط چشمی است.

ردیابی چشم در صنعت نظامی

در صنعت نظامی، فناوری ردیابی چشم آموزش، آگاهی موقعیت، و رابط‌های انسان-ماشین را بهبود می‌بخشد. در شبیه‌سازهای پرواز، این فناوری نگاه خلبانان را برای کاهش بار شناختی و بهبود تصمیم‌گیری رصد می‌کند. همچنین در عملیات پهپادها، توجه اپراتورها را تحلیل می‌کند. چالش‌ها شامل حفظ دقت در محیط‌های پویا و ادغام با حسگرهای دیگر مانند EEG است. نگرانی‌های حریم خصوصی نیز به دلیل ثبت داده‌های حساس رفتاری وجود دارد.

کنترل دستگاه‌ها با ردیابی چشم

ردیابی چشم امکان کنترل بدون دست دستگاه‌ها را فراهم می‌کند، به‌ویژه در بازی‌های ویدئویی و VR. بیش از 100 بازی، مانند Tom Clancy’s The Division، از هدف‌گیری مبتنی بر نگاه استفاده می‌کنند. در VR، کاربران می‌توانند با نگاه خود اشیاء را انتخاب یا در منوها حرکت کنند. سیستم‌هایی مانند GazeSense از Tobii از دوربین‌های حسگر عمق سه‌بعدی برای کنترل قوی استفاده می‌کنند. چالش‌ها شامل مشکل لمس میداس و نیاز به پردازش بلادرنگ است که منابع محاسباتی بالایی می‌طلبد.

نقش ردیابی چشم در کنترل کامپیوتر بدون دست

ردیابی چشم امکان کنترل کامپیوتر بدون دست را برای افراد با معلولیت‌های حرکتی فراهم می‌کند. سیستم‌هایی مانند کنترل چشمی ویندوز 10 یا ردیاب‌های Tobii به کاربران اجازه می‌دهند نشانگر را حرکت دهند، تایپ کنند، و با برنامه‌ها تعامل کنند. در برنامه‌های مصرفی، این فناوری رابط‌های کاربری را با تطبیق محتوا بر اساس نگاه بهبود می‌بخشد. چالش‌ها شامل تأخیر کم، مشکلات کالیبراسیون، و حفظ دقت برای کاربران با حرکات چشمی غیرمعمول است.

امتیاز post

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *