فناوری بینایی ماشین

بینایی ماشین [۱]یکی از شاخه­های نوین علوم کامپیوتری است که امروزه با افزایش دوربین های فیلمبرداری دیجیتال ارزان قیمت با کیفیت و بکارگیری این دوربین­ها در سیستم­های حفاظتی، نظارتی و اتوماسیون­ها منجربه افزایش نیاز برای تحلیل­ها وتصمیم­گیری­های خودکار ویدیویی را در پی داشته علاقه­مندی­های زیادی را نسبت به خود ایجاد کرده است که باعث پیشرفت سریع و قابل توجه این شاخه شده است. یکی از اهداف اصلی بینایی ماشین قادر ساختن رایانه به انجام عملکردهای پایه چشم انسان مانند درک حرکت و درک صحنه می باشد. بینایی ماشین با ترکیب روش­های مربوط به پردازش تصویر و ابزارهای یادگیری ماشینی، رایانه را قادر به درک هوشمند معنا و محتوای تصاویر می­ کند.

۲-۳-۱)کلیات سیستم

کلیه سیستم­­های کنترل اتوماتیک اساسا از یک دوربین، یک کامپیوتر مجهز به بورد رابط و یک سیستم نوردهی و حسگر تشکیل می­شوند. چنین سیستمی، ماشین بینایی نامیده می­شود که در اندازه گیری و بررسی محصولات کشاورزی و مواد غذایی موفق عمل کرده است. ماشین بینایی از لحاظ کارایی در صنعت مواد غذایی، جزو ١٠ صنعت برتر استفاده کننده از این فنآوری است. پیشرفت­های اخیر در سخت افزار و نرم افزار، به لحاظ مطالعات بیشتر و تولید لوازم ارزانتر، به توسعه این سیستم در صنعت مواد غذایی کمک کرده است. صرفه اقتصادی، دایم بودن، سرعت بالا، دقت و غیر مخرب بودن، دلایل مهم رشد در این صنعت می­باشند(بروسنان و سان، ٢٠٠٢ ).

ماشین بینایی علاوه بر بررسی نمونه در نور مرئی، قادر به بررسی در نورهای نامرئی مانند نور NIR،UV  و IR می­باشد. اطلاعات گرفته شده از اجسام در نور نامرئی در تشخیص میزان رسیدگی محصول، کیفیت و نوع محصول بسیار مفید می­باشد. همچنین در تعیین کیفیت و عیوب، ترکیبات و خصوصیات اساسی و تشخیص بیماری پس از برداشت، بسیار مورد استفاده قرار می­گیرد. فناوری ماشین بینایی، بهره وری را افزایش داده، هزینه­ها را کاهش می­دهد و کیفیت بهتر و مطمئن­تری را برای مصرف کننده فراهم می­ کند.(چن و همکاران ٢٠٠٢ ) منظور از کیفیت، مجموعه تمام صفاتی است که در صورت جمع شدن آنها در یک مجموعه، محصولی مورد قبول مصرف کننده تولید می شود. فاکتورهای طراحی آن، وابسته به اندازه و رنگ محصول و نیز ویژگی­های بارز آن بوده با تغییر آن ها، این فاکتورها متفاوت خواهند بود.
یک سیستم ماشین بینایی شامل تمام اجزاء لازم بمنظور تهیه ، تعریف دیجیتالی یک تصویر تغییر و اصلاح داده ها و ارائه نمایش داده های تصویری دیجیتالی به دنیای بیرون می باشد چنین سیستمی چنانچه در یک محیط صنعتی بکار گرفته شود ، ممکن است به دلیل اینکه متصل به سایر تجهیزات خط تولید می باشد بسیار پیچیده بنظر می رسد ولی اگر چنانچه با توجه به نقش و وظیفه سیستم بینایی اجزاء اصلی تشکیل دهنده آن بیان شوند ، مشخص خواهد شد که پیچیدگی زیادی در سیستم وجود ندارد. در ادامه جزییات بینایی ماشین را به همراه سایر ویژگی های این فناوری در حوزه پردازش تصویر را تشریح خواهیم کرد.

۲-۳-۲) بینایی ماشین(MV)

بینایی ماشین، روند بکارگیری طیف وسیعی از فن آوری­ها و روش­هایی را در فراهم کردن بازرسی خودکار را بر پایه تصویر برداری، کنترل فرایند و هدایت ربات در کاربردهای صنعتی را شامل می­شود. در حالیکه دامنه MV گسترده است و در نظر گرفتن یک تعریف جامع برای ان مشگل است، ما در اینجا یک تعریف کلی و عمومی که در باب بینایی ماشین پذیرفته شده است را بیان می­کنیم: بینایی ماشین شامل تجزیه و تحلیل تصاویر در استخراج داده­ ها برای کنترل یک فرایند یا فعالیت.

 ۲-۳-۳) کاربردهای بینایی ماشین

استفاده­های اولیه برای بینایی ماشین، بازرسی اتوماتیک و هدایت ربات است. برنامه ­های کاربردی MVمتداول شامل: تضمین کیفیت، دسته بندی، هدایت ربات، بررسی های عمده و کلی و مقیاس نوری می­باشد.

۲-۳-۴) متدها

روش بینایی ماشین با دو فرایند، تعریف و ایجاد یک راه حل MVحاصل شده است. و به عنوان فرایندی فنی در طول عملیات تعریف و ایجاد راه حل رخ می­دهد. در سال ۲۰۰۶، استاندارد کمی در واسط و تنظیمات مورد استفاده در MV وجود داشت که شامل: واسط­های کاربری و واسط­هایی برای یکپارچه سازی سیستم­های چند جزئی و تبادل خودکار اطلاعات می­باشد. بااین حال اولین قدم در MV، سلسله متوالی از عملیات برای دستیابی به یک تصویر است که به طور معمول با بهره گرفتن از دوربین، لنز و نور بوده است، که برای فراهم کردن تمایز مورد نیاز در پردازش­های بعدی طراحی شده است.

۲-۳-۵) پردازش تصویر و بینایی ماشین

هدف بسیاری از کارهای پردازش تصویر این است که ویژگی­های مشخصی از تصویر را استخراج کند، تا بر­اساس این خصایص، تفسیر و تعبیر­هایی از تصویر پدیدار شود و یا تصمیم ­گیری انجام پذیرد. این گونه عملیات مخصوصاَََ در حوزه بینایی ماشین مکرراََ مورد استفاده قرار می­گیرند. می­توان شکل کلی یک سیستم بینایی ماشین را در سه گروه اصلی تعریف کرد:

استخراج خصایص[۵]، قسمت بندی[۶]، دسته بندی[۷]

۲-۳-۵-۱) استخراج ویژگی

هر کمیت قابل اندازه ­گیری می ­تواند همانند یک ویژگی در نظر گرفته شود، که می تواند عددی و یا سمبولیک و یا ترکیبی از هر دو باشد. معمولا ویژگی­های استخراج شده را به شکل یک بردار[۸] نمایش می­ دهند. نکات مهم در انتخاب ویژگی عبارتند از: قابل محاسبه باشد، سیستم مورد نظر بتواند بر اساس ان ویژگی کار  کند و این که ویژگی باید مسئله را بهتر کند و در واقع خصوصیات مهم داده را شامل شود.

استخراج ویژگی فرایندی است که در آن از اطلاعات اولیه، یکسری خصوصیاتی که برای ارزیابی هدف مورد نیاز می­باشد، استخراج می­شود. یکی از مهم ترین نکات در انتخاب ویژگی این است که ویژگی انتخاب شده باید تحت عملیات چرخشی[۹] و تغییر مقیاس[۱۰] و جابجایی[۱۱] ثابت باقی بماند.

روش های استخراج ویژگی به چند دسته کلی تقسیم­بندی می­شوند:

۱-استخراج مشخصه­های مکانی: که شامل مشخصات دامنه­ای و مشخصات مربوط به هیستوگرام می­باشد.

–  مشخصات دامنه­ای: استخراج مشخصات دامنه­ای به­سهولت به­وسیله انتخاب نقاطی که مقدار سطح خاکستری آن­ها در محدوده یا محدوده­های مشخصی قرار دارد، قابل انجام است. این روش به نام Intensity Window Slicing  معروف است.

مشخصه­های مربوط به هیستوگرام: این مشخصه­ها بر اساس هیستوگرام ناحیه ای از تصویر تعیین می­شود. در واقع مشخصه­های استخراج شده از هر ناحیه از تصویر در این روش، از هیستوگرام ان ناحیه استخراج می­شوند.

۲- استخراج مشخصه­های تبدیلی: بسیاری از مشخصه­های یک ناحیه در حوزه فرکانس و یا در حالت کلی در حوزه یک تبدیل از آن ناحیه مشخص می­شوند.

۳- آشکارسازی لبه­ها: یکی از مسائل اساسی در تجزیه و تحلیل تصاویر است. لبه ها، مرزهای اشیاء را مشخص می­ کنند و لذا برای قسمت­بندی تصویر بر اساس اشیاء موجود در آن و نیز تشخیص و شناسایی این اشیاء به­ کار برده می­شوند. یک نقطه لبه، نقطه­ای است که در آن تغییر سریع در سطوح خاکستری نقاط مجاور مشاهده می شود. بنابراین با به­کارگیری مکانیزمی برای محاسبه تغییرات سطح خاکستری نقاط در جهات مختلف و تعیین نقاطی که تغییر آن در ­آن­ها ماکسیمم است، می­توانیم نقاط لبه را شناسایی کنیم.

۴- استخراج مرزها: مرز، تشکیل شده از لبه­های به هم پیوسته­ای است که یک شیء را مشخص می­ کند. از مرز برای محاسبه ویژگی­های هندسی شیء نظیر: موقعیت و اندازه ابعاد استفاده می­شود. مسئله اول در تشخیص مرز، تشخیص اتصال بین نقاط واقع در لبه است. مسئله دوم پیگیری مرز شیء است و مسئله سوم، پیوند دادن بین نقاط مرزی است که بین آن­ها اتصال قطع شده است. به این عمل اصطلاحاََ Edge Linking گویند.

۵- مشخص کردن ناحیه­ها: ساده­ترین روش برای این کار تعیین نقاطی است که در داخل ناحیه قرار دارند. همچنین می­توانیم مرز ناحیه را مشخص کنیم که در این صورت در مقدار حافظه مورد نیاز صرفه­جویی می­شود. روش دیگر، روش  Run- Lengthcoding است که در این روش تصویر خط به خط پویش می­شود، با رسیدن به هر قطعه از ناحیه در خط مورد نظر، نقطه شروع و تعداد نقاطی که در ادامه این نقطه و متصل به آن به ناحیه تعلق دارند، ذخیره می­شوند. چهارمین روش استفاده از Quad-Tree برای تعیین نقاط متعلق به یک ناحیه است.

۶-  گشتاورها: می­توان آن­ها را برای هر ناحیه مورد نظر استخراج و مورد استفاده قرار داد.

۷-  استخراج مشخصه­های هندسی: ویژگی­های هندسی ناحیه مورد نظر را بیان می­ کند. برخی از مهم­ترین این مشخصه­ها عبارتند از: محیط، مساحت، مرکز سطح، شعاع­های مینیمم، تعداد گوشه­ها، میزان دایروی بودن، تعداد سوراخ­ها، میزان تقارن و … می باشد.

۸- بافت: بافت عبارت از الگوی ساختاری سطح یک شیء مانند: چوب، ماسه، علفزار و پارچه. عبارت بافت معمولا اشاره دارد به ناحیه­ای که از تکرار یک عنصر بافت[۱۲] تولید می­شود. یک بافت شامل چندین پیکسل است که مقادیر آن­ها ممکن است متناوب، شبه متناوب و یا تصادفی باشد. بافت­های طبیعی ماهیتاََ تصادفی هستند. در حالیکه بافت­های مصنوعی اغلب متناوب هستند. در کل در تجزیه و تحلیل بافت­ها دو نوع بافت تصادفی و بافت ساختاری را داریم.

استخراج مشخصه­ها بوسیله شبکه ­های عصبی خودگردان: این شبکه­ها، شبکه­هایی هستند که در آن­ها یادگیری بدون نظارت صورت می­گیرد و تنظیم وزن­ها با بهره گرفتن از اطلاعات محلی انجام می­شود. به این معنی که تغییرات در وزن­های متصل به یک سلول، محدود به همسایگی آن سلول می­شود.

۲-۳-۵-۲)روش­های قسمت­بندی تصویر

۱- Thresholding: این روش در هر جا که اطلاعات دامنه­ای تصویر بطور مؤثر بتواند موضوعات مختلف موجود در آن را بیان کند، مفید واقع می­شود. با انتخاب ناحیه یا ناحیه­هایی از فضای دامنه نقاط می­توانیم یک یا چند موضوع را از بقیه جدا کنیم. نحوه انتخاب شدت­های روشنایی (دامنه نقاط) مهم­ترین مرحله در این روش می­باشد.

۲- نام گذاری مؤلفه­ها[۱۳]: اساس کار این روش بر بررسی اتصال پیکسل­ها با پیکسل های مجاور می­باشد. به این صورت که پیکسل­هایی را که به هم متصل هستند به­عنوان یک موجود مستقل در نظر گرفته و نام­گذاری می­ کنند و هنگامی که اتصال به­هم بخورد، یک موجود جدید شناسایی می­شود، این روش را نام­گذاری پیکسل گویند.

۳- روش­های مبتنی بر مرز: روش­هایی که مرز اشیاء را مشخص می­ کنند، نوعی تقسیم­بندی روی اجزای تصویر می­توانند انجام دهند. به این صورت که با پیگیری هر مرز می­توان یک شیء را تفکیک کرد و به­عنوان یک قسمت از تصویر در نظر گرفت.

۴- روش­های مبتنی بر ناحیه­ها[۱۴]: ایده اصلی در روش مبتنی بر ناحیه­ها این است که ناحیه­هایی از تصویر را که دارای خصوصیات مشابه می­باشند شناسایی نماییم.

۲-۳-۶-۳) دسته­بندی

روش­های دسته­بندی به دو گروه تقسیم­بندی می­شوند: روش با حضور ناظر[۱۵] و روش بدون حضور ناظر[۱۶].

۱- با حضور ناظر: روش­های تحت نظارت ممکن است Distribution-Free یا آماری باشند. روش­های Distribution-Free روش­هایی هستند که نیازی به دانستن توابع توزیع احتمال را ندارند. در حالی­که روش­های آماری بر اساس مدل­های احتمالاتی عمل می­ کنند.

۲- بدون حضور ناظر: در این روش سعی می­شود تا خوشه­بندی یا به عبارت دیگر گروه­بندی طبیعی نقطه­ها، در فضای مشخصه­ها انجام پذیرد. یک خوشه[۱۷]، مجموعه ای از نقاط در فضای مشخصه­هاست که چگالی محلی آن­ها در مقایسه با چگالی نقاط ناحیه احاطه کننده آن، نسبتاََ زیاد باشد. روش خوشه­ای هم برای قسمت­­بندی تصویر وهم برای دسته­بندی اطلاعات خام برای ایجاد کلاس­ها و الگوهای اساسی مناسب می باشد. همچنین خوشه برای فشرده سازی اطلاعات نیز کاربرد دارد.

در اینجا پس از به دست آوردن یک تصویر باید عملیات پردازش روی آن را انجام داد.

[۱] Machine vision

[۲] Image processing

[۳] Machine learning

[۴] Machine Vision

[۵] feature extraction

[۶] segmentation

[۷] classification فایل متن کامل این پایان نامه در سایت abisho.ir موجود است.

[۸] feature vector

[۹] Rotation

[۱۰] Scale

[۱۱] Translation

[۱۲] Texel

[۱۳] Component Labeling

[۱۴] Clustring

[۱۵] Supervised

[۱۶] Nonsupervised

[۱۷] Cluster