فناوری ردیابی چشم چیست؟ – تعریف، ویژگیها و اهداف Eye Tracking

فناوری ردیابی چشم، که گاهی بهعنوان ردیابی نگاه شناخته میشود، روشی مبتنی بر حسگر است که محل نگاه فرد، مدت زمان تمرکز بر نقاط خاص، و مسیر حرکت چشمها را ثبت میکند. این فناوری که در اواخر قرن نوزدهم با مشاهدات دستی آغاز شد. فناوری ردیابی چشم با استفاده از دوربینهای مادون قرمز، الگوریتمهای پیشرفته، و یادگیری ماشین به سیستمهای پیچیدهای تبدیل شده است. ردیابی چشم در زمینههایی مانند تشخیص بیماریهای عصبی، بهبود طراحی محصولات، و کنترل بدون دست دستگاهها کاربرد دارد. پیشرفتهای اخیر در سختافزارهای مقرونبهصرفه و نرمافزارهای دقیق، این فناوری را برای تحقیقات و کاربردهای تجاری قابلدسترس کرده است.
به گزارش ابرار صنعتی، فناوری ردیابی چشم با ثبت حرکات چشم، بینشهای عمیقی درباره توجه بصری، فرآیندهای شناختی، و حالتهای احساسی ارائه میدهد. این فناوری در حوزههای مختلفی از پزشکی و روانشناسی گرفته تا آموزش، خودروهای هوشمند، و واقعیت مجازی کاربرد دارد. با پیشرفتهای اخیر در سختافزار و نرمافزار، ردیابی چشم به ابزاری قدرتمند برای بهبود تجربه کاربری و افزایش دسترسیپذیری تبدیل شده است.
فناوری ردیابی چشم چیست؟
ردیابی چشم شامل اندازهگیری موقعیت چشم، حرکات آن، و اندازه مردمک برای تعیین نقطه نگاه و توجه بصری فرد است. این فناوری دادههایی درباره تثبیتها (fixations، زمانی که چشم برای پردازش اطلاعات متوقف میشود)، جهشها (saccades، حرکات سریع چشم بین نقاط)، و پیگیریهای نرم (smooth pursuits، ردیابی اشیاء متحرک) جمعآوری میکند. سیستمهای مدرن از روشهای غیرتهاجمی مانند نور مادون قرمز و دوربینهای با وضوح بالا برای ثبت انعکاسهای قرنیه و موقعیت مردمک استفاده میکنند. این فناوری در حوزههای متنوعی از جمله علوم اعصاب، بازاریابی، بازیهای ویدئویی، و دسترسیپذیری برای افراد معلول کاربرد دارد.
نحوه عملکرد
سیستمهای ردیابی چشم عمدتاً از روش انعکاس مرکز مردمک-قرنیه (PCCR) استفاده میکنند. در این روش، یک منبع نور مادون قرمز به چشم تابانده میشود و انعکاس نور روی قرنیه (glint) و مردمک را برجسته میکند. دوربینهای با وضوح بالا این انعکاسها را ثبت میکنند و الگوریتمها با محاسبه رابطه بین مرکز مردمک و glint، جهت نگاه را تعیین میکنند. سیستمهای پیشرفته مانند Tobii Pro از روشهای ردیابی روشن-مردمک (bright-pupil) و تاریک-مردمک (dark-pupil) برای دقت در شرایط نوری مختلف استفاده میکنند. کالیبراسیون برای تنظیم سیستم با ویژگیهای منحصربهفرد چشم کاربر ضروری است.
اجزای اصلی سیستمهای ردیابی چشم
- نورافکنهای مادون قرمز: نور نزدیک به مادون قرمز را برای ایجاد انعکاس قرنیه منتشر میکنند بدون اینکه کاربر را اذیت کنند.
- دوربینهای با وضوح بالا: تصاویر چشم را با نرخ 60 تا 2000 هرتز برای ثبت دقیق حرکات ضبط میکنند.
- نرمافزار پردازش: الگوریتمهایی که تصاویر چشم را تحلیل کرده و نقاط نگاه، تثبیتها، و جهشها را محاسبه میکنند.
- رابط کالیبراسیون: برای تنظیم دقیق سیستم با دنبال کردن نقاط روی صفحه توسط کاربر.
- دستگاههای خروجی: نمایشگرها یا سیستمهایی که دادههای نگاه را بهصورت نقشههای حرارتی یا مسیرهای نگاه ارائه میدهند.
برخی سیستمها با نمایشگرهای نصبشده روی سر (HMD) یا دستگاههای پوشیدنی برای کاربردهای VR ادغام میشوند.
کاربردهای ردیابی چشم
فناوری ردیابی چشم کاربردهای گستردهای در صنایع مختلف دارد. در پزشکی، برای تشخیص اختلالات عصبی مانند اوتیسم و پارکینسون استفاده میشود. در بازاریابی، توجه مصرفکنندگان به تبلیغات یا طراحی محصولات را تحلیل میکند. در آموزش، فرآیندهای یادگیری و خواندن را بررسی میکند. در صنعت خودرو، توجه راننده را برای ایمنی بیشتر رصد میکند، و در بازیهای ویدئویی و واقعیت مجازی، تعاملات immersive را تقویت میکند. برای افراد معلول، ردیابی چشم امکان کنترل دستگاهها بدون استفاده از دست را فراهم میکند، که دسترسیپذیری را بهبود میبخشد.
کاربردها در پزشکی
ردیابی چشم در پزشکی بهعنوان ابزاری تشخیصی و آموزشی تحولآفرین است. این فناوری بهعنوان یک نشانگر زیستی برای اختلالات عصبی مانند اوتیسم، پارکینسون، و آلزایمر عمل میکند. برای مثال، افراد مبتلا به اوتیسم اغلب تماس چشمی کمتری دارند و الگوهای نگاه غیرمعمولی نشان میدهند که میتواند تشخیص زودهنگام را تسهیل کند. در بیماری پارکینسون، کاهش سرعت جهشها یا طولانی شدن تثبیتها نشانههای تشخیصی هستند. همچنین، ردیابی چشم در آموزش پزشکی با تحلیل نحوه اسکن تصاویر تشخیصی مانند ECG توسط پزشکان، دقت آنها را بهبود میبخشد. چالشها شامل خطاهای کالیبراسیون و هزینه بالای تجهیزات است.
استفاده از ردیابی چشم در خودروهای هوشمند
در خودروهای هوشمند، ردیابی چشم ایمنی را با نظارت بر توجه راننده و تشخیص خستگی یا حواسپرتی بهبود میبخشد. سیستمهای یکپارچه، مانند محصولات Tobii، دادههای نگاه را برای اطمینان از تمرکز راننده بر جاده تحلیل میکنند. مطالعهای توسط Gupta و همکاران نشان داد که ردیابی چشم تنها فناوری قابلاعتماد برای نظارت بلادرنگ خستگی در محیطهای دریایی است، که در خودروها نیز کاربرد دارد. در صورت انحراف نگاه راننده، هشدارها یا مداخلات خودکار فعال میشوند. چالشها شامل حفظ دقت در شرایط نوری متغیر و ادغام با حسگرهای دیگر است.
رازهای علمی پشت پرده حرکت چشم انسان و فناوریهای ثبت آن
حرکات چشم انسان توسط فرآیندهای فیزیولوژیکی و عصبی پیچیدهای هدایت میشوند. شبکیه با سلولهای حساس به نور (میلهها و مخروطها) محرکهای بصری را پردازش میکند و دادهها را از طریق عصب بینایی به مغز میفرستد. تثبیتها زمانی رخ میدهند که چشم برای جمعآوری اطلاعات با وضوح بالا از ناحیه فووآ (fovea) توقف میکند.
جهشها چشم را بهسرعت بین نقاط جابهجا میکنند، و پیگیریهای نرم اشیاء متحرک را دنبال میکنند. فناوریهای ردیابی چشم از این حرکات با استفاده از نور مادون قرمز برای اندازهگیری انعکاسهای قرنیه و دینامیک مردمک بهره میبرند. روشهای پیشرفته مانند الکترواکولوگرافی (EOG) پتانسیلهای الکتریکی عضلات چشم را ثبت میکنند.
تکنیکهای سیستم ردیابی چشم Eye Tracking
روش انعکاس مرکز مردمک-قرنیه (PCCR)
روش PCCR رایجترین تکنیک در سیستمهای ردیابی چشم مدرن است و در دستگاههایی مانند Tobii Pro و EyeLink 1000 Plus استفاده میشود. در این روش، یک یا چند منبع نور مادون قرمز (معمولاً با طول موج 850 تا 950 نانومتر) به چشم تابانده میشود که دو انعکاس ایجاد میکند: انعکاس قرنیه (glint) و مردمک روشن یا تاریک. دوربینهای با وضوح بالا (با نرخ فریم 60 تا 2000 هرتز) این انعکاسها را ثبت میکنند. الگوریتمها با محاسبه بردار بین مرکز مردمک و glint، زاویه نگاه را تعیین میکنند.
تکنیکهای روشن-مردمک (bright-pupil، که مردمک به دلیل انعکاس نور سفید به نظر میرسد) و تاریک-مردمک (dark-pupil، که مردمک تیره باقی میماند) برای شرایط نوری مختلف به کار میروند. کالیبراسیون، که معمولاً شامل دنبال کردن نقاط خاص روی صفحه توسط کاربر است، برای تنظیم مدل با ویژگیهای چشمی فرد ضروری است. این روش دقتی بین 0.3 تا 1 درجه زاویهای ارائه میدهد، اما به شرایط نوری پایدار و عدم وجود موانع مانند عینک وابسته است.
الکترواکولوگرافی (EOG)
الکترواکولوگرافی (EOG) روشی است که پتانسیلهای الکتریکی تولیدشده توسط حرکات عضلات چشم را اندازهگیری میکند. چشم مانند یک دوقطبی الکتریکی عمل میکند، با قرنیه دارای بار مثبت و شبکیه دارای بار منفی. الکترودهای قرارگرفته روی پوست اطراف چشم، تغییرات ولتاژ را هنگام حرکت چشم (مانند جهشها یا پیگیریهای نرم) ثبت میکنند. EOG به دلیل عدم نیاز به نور مادون قرمز، در محیطهای با نور متغیر یا برای افرادی با مشکلات چشمی که PCCR را مختل میکند، مناسب است. دقت آن (معمولاً 1 تا 2 درجه) کمتر از PCCR است و به دلیل نیاز به الکترودهای تماسی، کمتر کاربرپسند است. EOG بیشتر در تحقیقات پزشکی، مانند مطالعه خواب یا اختلالات عصبی، استفاده میشود.
ردیابی مبتنی بر ویدئو
ردیابی مبتنی بر ویدئو از دوربینهای معمولی یا وبکمها برای تحلیل تصاویر چشم بدون نیاز به نور مادون قرمز اختصاصی استفاده میکند. این روش با استفاده از الگوریتمهای پردازش تصویر و یادگیری ماشین، ویژگیهای چشم مانند لبههای مردمک یا پلکها را شناسایی میکند. مدلهای یادگیری عمیق، مانند شبکههای کانولوشنی (CNN) مبتنی بر MobileNet یا ResNet، برای تشخیص مردمک و تخمین نگاه آموزش داده میشوند. این روش با وبکمهای ارزانقیمت (مانند سیستمهای GazeRecorder) امکان ردیابی چشم را در محیطهای روزمره فراهم کرده است. با این حال، دقت آن (1 تا 3 درجه) به دلیل وابستگی به نور محیط و کیفیت دوربین، کمتر از سیستمهای PCCR است. این روش برای کاربردهای مصرفی مانند بازیهای ویدئویی و رابطهای کاربری مناسب است.
نقش یادگیری ماشین در ردیابی چشم
یادگیری ماشین نقش مهمی در بهبود دقت و کارایی ردیابی چشم ایفا کرده است. شبکههای عصبی عمیق، مانند شبکههای بازگشتی (RNN) برای تحلیل سریهای زمانی حرکات چشم و شبکههای کانولوشنی برای پردازش تصاویر، دادههای خام را به اطلاعات نگاه تبدیل میکنند. برای مثال، الگوریتمهای مبتنی بر یادگیری عمیق میتوانند نویز ناشی از حرکات سر یا تغییرات نوری را فیلتر کنند. در سیستمهای مدرن، مدلهای یادگیری ماشین مانند OpenFace و GazeNet برای تخمین نگاه در شرایط واقعی آموزش داده شدهاند. این مدلها با دادههای گستردهای از حرکات چشم کاربران مختلف آموزش میبینند تا تنوع فیزیولوژیکی (مانند شکل چشم یا رنگ مردمک) را پوشش دهند. چالش اصلی در این حوزه، نیاز به مجموعه دادههای بزرگ و متنوع برای آموزش و محاسبات سنگین برای پردازش بلادرنگ است.
محاسبات لبهای و بهینهسازی
برای کاربردهای بلادرنگ، مانند کنترل دستگاهها یا ردیابی در VR، محاسبات لبهای (edge computing) برای کاهش تأخیر استفاده میشود. این روش پردازش دادهها را به جای سرورهای ابری، در خود دستگاه انجام میدهد. برای مثال، سیستمهای Tobii Pro Glasses 3 از پردازش لبهای برای تحلیل نگاه با نرخ 100 هرتز استفاده میکنند. الگوریتمهای بهینهشده مانند MobileNetV2، که برای دستگاههای کمقدرت طراحی شدهاند، امکان اجرای ردیابی چشم روی گوشیهای هوشمند را فراهم کردهاند. این پیشرفتها هزینهها را کاهش داده و دسترسیپذیری را افزایش دادهاند، اما همچنان نیاز به کالیبراسیون دقیق و مدیریت نویز محیطی وجود دارد.
فناوری ردیابی چشم در حوزه آموزش
ردیابی چشم در آموزش بینشهایی درباره فرآیندهای یادگیری، درک مطلب، و بار شناختی ارائه میدهد. مطالعات نشان میدهند که این فناوری میتواند مشکلات در حل مسائل ریاضی یا خواندن را با تحلیل مدت تثبیتها و الگوهای جهشها شناسایی کند. بهعنوان مثال، تحقیق Chen و همکاران کاربرد آن را در درک تعامل دانشآموزان با محتوای دیجیتال نشان داد. این فناوری همچنین در طراحی ابزارهای آموزشی با تحلیل نحوه تعامل دانشآموزان با محتوا کمک میکند. چالشها شامل نیاز به محیطهای کنترلشده و ناتوانی در ردیابی چشم برخی افراد به دلیل عینک یا رنگ مردمک است.
ردیابی چشم و واقعیت مجازی
ردیابی چشم در واقعیت مجازی (VR) تجربههای immersive را با رندر فووآتی (foveated rendering) بهبود میبخشد، که در آن تنها ناحیه مورد نگاه با وضوح بالا رندر میشود و بار محاسباتی کاهش مییابد. در نمایشگرهای نصبشده روی سر مانند HTC Vive Pro Eye، این فناوری امکان کنترل مبتنی بر نگاه را فراهم میکند. کاربردها شامل شبیهسازیهای آموزشی، بازیهای ویدئویی، و توانبخشی است. چالشها شامل دقت دادهها در محیطهای پویای VR و مدیریت حرکات کوچک چشم مانند میکروسکادها است که نیاز به ردیابهای با دقت بالا دارد.
ردیابی چشم در تحقیقات روانشناسی
ردیابی چشم در روانشناسی فرآیندهای شناختی و احساسی را آشکار میکند. این فناوری برای مطالعه توجه، حافظه، و شناخت اجتماعی استفاده میشود. برای مثال، الگوهای نگاه غیرمعمول در افراد مبتلا به اسکیزوفرنی یا اختلال دوقطبی بینشهایی درباره رفتار جستجوی بصری ارائه میدهد. همچنین، تغییر در الگوهای نگاه در بیماری پارکینسون به تشخیص پردازش احساسی کمک میکند. معیارهایی مانند زمان اولین تثبیت و مدت زمان کلی نگاه روی نواحی موردنظر، توزیع توجه را کمیسازی میکنند.
دقت و چالشهای فناوری ردیابی چشم
دقت ردیابی چشم به کالیبراسیون، کیفیت سختافزار، و شرایط محیطی بستگی دارد. سیستمهای پیشرفته دقتی زیر یک درجه دارند، اما عواملی مانند حرکات سر، عینک، یا نور محیط میتوانند دقت را کاهش دهند. مشکل لمس میداس (Midas touch)، که در آن نگاه ناخواسته باعث فعالسازی دستورات میشود، یک چالش مهم است. کالیبراسیون برای افراد غیرکلامی یا با نگاه ناپایدار دشوار است. هزینههای بالای سیستمهای تحقیقاتی (دهها هزار دلار) و نیاز به تخصص نیز موانعی هستند. پیشرفتهای اخیر، مانند ردیابی مبتنی بر وبکم، این مشکلات را کاهش دادهاند.
استفاده از ردیابی چشم برای افراد معلول
ردیابی چشم برای افراد با معلولیتهای حرکتی شدید، مانند سندرم قفلشدگی (LIS) یا اسکلروز جانبی آمیوتروفیک (ALS)، امکان ارتباط را فراهم میکند. کاربران میتوانند با نگاه خود حروف یا آیکونها را انتخاب کنند. سیستمهایی مانند کنترل چشمی ویندوز 10 امکان شبیهسازی ماوس و کیبورد را دارند. مطالعه Barua و همکاران یک سیستم ردیابی چشم مبتنی بر هوش مصنوعی برای بیماران LIS توسعه داد که کیفیت زندگی را بهبود بخشید. چالشها شامل نیاز به کالیبراسیون دقیق و ناتوانی در ردیابی برای برخی شرایط چشمی است.
ردیابی چشم در صنعت نظامی
در صنعت نظامی، فناوری ردیابی چشم آموزش، آگاهی موقعیت، و رابطهای انسان-ماشین را بهبود میبخشد. در شبیهسازهای پرواز، این فناوری نگاه خلبانان را برای کاهش بار شناختی و بهبود تصمیمگیری رصد میکند. همچنین در عملیات پهپادها، توجه اپراتورها را تحلیل میکند. چالشها شامل حفظ دقت در محیطهای پویا و ادغام با حسگرهای دیگر مانند EEG است. نگرانیهای حریم خصوصی نیز به دلیل ثبت دادههای حساس رفتاری وجود دارد.
کنترل دستگاهها با ردیابی چشم
ردیابی چشم امکان کنترل بدون دست دستگاهها را فراهم میکند، بهویژه در بازیهای ویدئویی و VR. بیش از 100 بازی، مانند Tom Clancy’s The Division، از هدفگیری مبتنی بر نگاه استفاده میکنند. در VR، کاربران میتوانند با نگاه خود اشیاء را انتخاب یا در منوها حرکت کنند. سیستمهایی مانند GazeSense از Tobii از دوربینهای حسگر عمق سهبعدی برای کنترل قوی استفاده میکنند. چالشها شامل مشکل لمس میداس و نیاز به پردازش بلادرنگ است که منابع محاسباتی بالایی میطلبد.
نقش ردیابی چشم در کنترل کامپیوتر بدون دست
ردیابی چشم امکان کنترل کامپیوتر بدون دست را برای افراد با معلولیتهای حرکتی فراهم میکند. سیستمهایی مانند کنترل چشمی ویندوز 10 یا ردیابهای Tobii به کاربران اجازه میدهند نشانگر را حرکت دهند، تایپ کنند، و با برنامهها تعامل کنند. در برنامههای مصرفی، این فناوری رابطهای کاربری را با تطبیق محتوا بر اساس نگاه بهبود میبخشد. چالشها شامل تأخیر کم، مشکلات کالیبراسیون، و حفظ دقت برای کاربران با حرکات چشمی غیرمعمول است.




