فرمت:word(قابل ویرایش)
تعداد صفحات:130
فهرست مطالب:
فصل اول: 7
مقدمه ای بر پردازش تصویر دیجیتال 7
1-1 : مقدمه 8
1-2 : مراحل اساسی پردازش تصویر 9
1-3 : یک مدل ساده تصویر 11
4-1: تشخیص صورت 12
1-5 : تشخیص و تعبیر 14
فصل دوم : 16
بررسی دقیق تر برخی از روش های معرفی شده توسط سایر محققین در زمینه تشخیص صورت 16
2-1 : تشخیص صورت در تصاویر رنگی با استفاده از فیلتر پوست 16
1-1-2: چکیده 17
2-1-2 : فیلتر پوست 18
شکل2-1: تصویر اصلی RGB 18
شکل2-2: نقشه بافت 19
شکل2-3: تصویر رنگمایه 20
شکل2-4: تصویر اشباع 21
شکل2-5: نقشه پوست 22
2-1-3 : تشخیص صورت در نواحی پوست 22
شکل2-6: ادغام نقشه پوست با تصویر خاکستری 23
شکل 2-7: تصویر مثبت برچسب گذاری شده 24
شکل2-8: تصویر منفی 24
شکل 2-9: نتیجه نهایی 25
2-2-1 : چکیده 26
2-2-2 : الگوریتم تشخیص صورت 26
شکل2-10: الگوریتم تشخیص صورت بر مبنای مکان یابی ویژگی های صورت 27
2-2-4 : مکان یابی ویژگی های مربوط به صورت 29
شکل 2-12 : پیاده سازی مکان یابی چشم برای دو نمونه 30
شکل2-13 : پیاده سازی مکان یابی دهان برای دو نمونه 30
شکل2-14 : مرز صورت و مثلث دهان- چشم 31
5-2-2 : نتایج 32
2-3: یک متد آماری برای تشخیص اجسام سه بعدی 32
2-3-2 : تشخیص بر مبنای ظاهر 33
شکل2-15 : نمونه های آموزشی جهت 34
2-3-3 : قانون تصمیم آماری 34
2-3-3-2 : تجزیۀ ظاهر به فضا،فراوانی و جهت 38
2-3-3-3 : نمایش نمونه ها با زیر مجموعۀ ضریب موج 38
جدول 1: نمایش موج یک تصویر 39
2-3-3-4 : فرم نهایی تشخیص دهنده 41
2-3-5 : کاربرد تشخص دهنده ها 43
2-3-6 : صحت تشخیص صورت با چرخش خارج از محدوده 43
جدول 2 : تشخیص صورت با چرخش خارج از محدوده 43
شکل 2-17 : نمونه هایی از نتایج 45
2-4 : تشخیص صورت با استفاده از روش مسافت هاسدورف 46
2-4-1 : چکیده 47
شکل 2-18 : ویرایش تصویر 49
2-4-4 : صحت 51
2-5-1 : مقدمه 53
2-5-3 : تشخیص صورت با روش هاسدورف بر پایه مسافت 54
شکل 2-21 : پروسه پیدا کردن صورت 55
2-5-4 : مدل ژنتیک 56
-5-24-1 : کد های مدل 56
2-5-4-2 : توابع تناسب 57
شکل 2-23 : عملگر تقاطع برای مدل دو بعدی 59
2-5-4-4 : مقداردهی اولیه 59
شکل 2-25 : نمونه هایی برای مقداردهی الگوریتم ژنتیک به روش لبه متوسط 60
شکل 2-27 : مدل حاصله 62
فصل سوم : 65
تشخیص صورت بر مبنای رنگ پوست 65
3-1 : استفاده از رنگ به عنوان ابزار پردازش تصاویر رنگی 66
3-1-1 : مبانی رنگ 67
3-3-1 : مدل رنگ RGB 70
3-3-2 : مدل رنگ CMY 72
3-3-3 : مدل رنگ YIQ 72
3-3-4 : مدل رنگ HSI 73
3-3-5 : مدل رنگ YCbCr 75
3-3-5-1: تبدیلات بین RGB و YCbCr 77
3-3-7 : نتیجه گیری از فضاهای رنگ 79
3-4 : ساختن مدل برای پوست 79
فصل چهارم : 83
شناسایی صورت در یک پایگاه داده اختیاری 83
4-1 : شناسائی صورت 84
4-1-2 : تاریخچه 84
: 2-3-1-4 Linear discriminant analysis 86
4-1-4 : ارزیابی دولت ایالات متحده امریکا 88
:6-1-4 نتیجه گیری 90
4-2-2 : چکیده 91
4-2-4 : مدل تحقیق 95
4-2-5 : نتایج تحقیق 97
نمودار شش : 103
نمودار هفت : 103
فصل پنجم : 105
روش انجام کار 105
5-2 : مدل کردن رنگ پوست 106
شکل 5-1: نقاب عمومی 108
شکل5-2 : نقاب حاصله 108
شکل 5-3 : توزیع گاوسی 109
5-3 : جداسازی پوست 110
شکل 5-5 : حاصله از آستانه گیری 112
5-4 : نواحی پوست 112
شکل 5-7 نتایج این مرحله را نشان می دهد. 113
شکل 5-7 : (الف) نواحی قسمت بندی شده . (ب) ناحیه احتمالی صورت 113
5-4-3 : جهت 115
5-4-4 : عرض و ارتفاع ناحیه 116
5-4-6 : الگوی صورت 117
5-5 : تطبیق الگو 117
شکل 5-10: (الف) الگوی اصلی. (ب) الگوی تغییر سایز یافته 119
شکل 5-13 : نمونه ای از روند کار 121
5-7 نتایج : 123
فهرست منابع 126
فصل اول:مقدمه ای بر پردازش تصویر دیجیتال
1-1 : مقدمه
پردازش تصویر دیجیتال دانش جدیدی است که سابقه آن به پس از اختراع رایانه های دیجیتال باز می گردد . با این حال این علم نوپا در چند دهه اخیر از هر دو جنبه نظری و عملی پیشرفت های چشمگیری داشته است . سرعت این پیشرفت به اندازه ای بوده است که هم اکنون و پس از این مدت نسبتاً کوتاه ، به راحتی می توان رد پای پردازش تصویر دیجیتال را در بسیاری از علوم و صنایع مشاهده نمود . علاقه به روش های پردازش تصویر دیجیتال از دو محدوده کاربردی اصلی نشات می گیرد که آن محدوده ها عبارتند از : بهبود اطلاعات تصویری به منظور تعبیر انسانی و پردازش داده های صحنه برای ادراک ماشینی مستقل .
چند دسته مهم از کاربرد های پردازش تصویر به شرح زیر می باشد [ 1 ] :
الف ) کاربردهای عکاسی مانند ارتقاء ، بازسازی تصاویر قدیمی ، بازسازی تصاویر خراب شده با نویز و بهبود ظاهر تصاویر معمولی.
ب ) کاربرد های پزشکی مانند ارتقاء ویژگی های تصاویر اشعه ایکس ، تولید تصاویر MRI و
CT-scan.
ج ) کاربرد های امنیتی مانند تشخیص حرکت ( در دزد گیر ها ) ، تشخیص اثر انگشت ، تشخیص چهره و تشخیص امضاء.
د ) کاربرد های نظامی مانند تشخیص و رهگیری خودکار اهداف متحرک یا ثابت از هوا یا از زمین.
ه ) کاربرد های سنجش از راه دور مانند ارتقاء و تحلیل تصاویر هوایی و ماهواره ای (برداشته شده از مناطق مختلف جغرافیایی) که در کاربرد های نقشه برداری ، کشاورزی ، هوا شناسی و موارد دیگر مفید هستند .
و ) کاربرد های صنعتی مرتبط با خودکار سازی صنایع مانند تفکیک محصولات مختلف بر اساس شکل یا اندازه ، آشکارسازی نواقص و شکستگی های موجود در محصولات ، تعیین محل اشیاء و اجرای فرایند تولید با استفاده از روبات ها و بینایی ماشینی .
ز ) کاربرد های فشرده سازی تصویر مانند ذخیره سازی ، ارسال تصاویر تلویزیون با کیفیت بالا و ارسال تصاویر متحرک و زنده از روی شبکه اینترنت و یا خط تلفن.
ح ) موارد متفرقه دیگری نیز مانند تصویر برداری از اسناد و ارسال آنها توسط دور نگار و تشخیص خودکار نویسه در ردیف کاربرد های پردازش تصویر قرار دارند.
1-2 : مراحل اساسی پردازش تصویر
پردازش تصویر دیجیتال محدوده وسیعی از سخت افزار ، نرم افراز و مبانی نظری را در بر می گیرد . در این قسمت مراحل اساسی مورد نیاز برای اجرای یک پردازش روی تصویر را نام می بریم که در شکل 1-1 نمایش داده شده است .
شکل 1-1 : مراحل اساسی پردازش تصویر دیجیتال
مرحله اول این فرایند ، تصویر برداری - یعنی به دست آوردن تصویر دیجیتال - است . انجام دادن چنین کاری نیازمند یک حسگر تصویر بردار و قابلیت دیجیتال سازی سیگنال خروجی حسگر می باشد . پس از اینکه تصویر دیجیتال به دست آمد ، مرحله بعدی پیش پردازش آن است . وظیفه اصلی پیش پردازش ، بهبود تصویر به روش هایی است که امکان توفیق سایر پردازش ها را نیز افزایش دهد . پیش پردازش ، به طور معمول به روش هایی برای ارتقاء تمایز ، حذف نویز و جداسازی آن نواحی که زمینه شان نشان دهنده احتمال وجود اطلاعات حرفی – عددی است ، می پردازد . مرحله بعدی به بخش بندی می پردازد . در تعریف وسیع ، بخش بندی فرایندی است که تصویر ورودی را به قسمت ها یا اجزای تشکیل دهنده اش تقسیم می کند . به طور کلی بخش بندی یکی از مشکل ترین کارها در پردازش تصویر دیجیتال است . از طرفی یک شیوه قوی بخش بندی ، تا حد زیادی فرایند را به حل موفق مساله نزدیک می کند . از طرف دیگر الگوریتم های ضعیف یا خطا دار بخش بندی ، تقریباً همیشه باعث خرابی اتفاقی می شوند . خروجی مرحله بخش بندی معمولاً ، داده های پیکسلی خام است که یا مرز یک ناحیه یا تمام نقاط درون آن ناحیه را تشکیل می دهند . در هر دو حالت باید داده ها را به شکل مناسب برای پردازش رایانه ای تبدیل نمود . اولین تصمیمی که باید گرفته شود این است که آیا داده ها باید به صورت مرز یا به صورت یک ناحیه کامل نمایش داده شود . نمایش مرزی وقتی مفید است که مشخصات خارجی شکل نظیر گوشه ها یا خمیدگی ها مورد نظر باشد . نمایش ناحیه ای وقتی مفید است که خواص درونی بخش های تصویر نظیر بافت یا استخوان بندی شکل مورد توجه باشد . در هر حال در بعضی کاربرد ها هر دو نمایش به کار می رود . انتخاب یک روش نمایش ، تنها قسمتی از راه تبدیل داده های خام به شکل مناسب برای پردازش بعدی رایانه ای است . توصیف ، که انتخاب ویژگی نیز خوانده می شود ، به استخراج ویژگی هایی که مقداری از اطلاعات کمی مورد نظر را به ما می دهند یا برای تشخیص گروهی از اشیاء از گروه دیگر ، اساسی هستنند ، می پردازد . مرحله آخر شکل 1-1 شامل تشخیص و تعبیر است . تشخیص فرایندی است که بر اساس اطلاعات حاصل از توصیف گرها یک برچسب را به یک شی منتسب می کند . تعبیر شامل انتساب معنا به یک مجموعه از اشیاء تشخیص داده شده است . دانش به شکل پایگاه داده دانش در درون سامانه پردازش تصویر ، ذخیره می شود . این دانش ممکن است ، تنها دانستن محل نواحی دارای جزئیات مورد علاقه باشد . بنابراین جستجوی مورد نیاز برای آن اطلاعات محدود می شود . پایگاه دانش ممکن است کاملاً پیچیده باشد ، نظیر فهرست به هم مرتبط تمام نقایص اصلی ممکن در یک مساله بازرسی مواد یا یک پایگاه داده تصویری که حاوی تصاویر ماهواره ای تفکیک بالا از یک منطقه در ارتباط با کاربرد های آشکارسازی تغییر باشد . پایگاه دانش علاوه بر هدایت عمل هر واحد پردازش ، بر تعامل بین واحد ها نیز نظارت می کند . این نمودار نشان می دهد که ارتباط بین واحد های پردازش اغلب براساس دانش قبلی در مورد نتیجه پردازش است . این پایگاه دانش نه تنها عمل هر واحد را هدایت می کند ، بلکه به عملیات بازخورد بین واحد ها نیز کمک می کند [1].
1-3 : یک مدل ساده تصویر
عبارت تصویر به تابع دو بعدی شدت نور که به صورت نوشته می شود ، اشاره دارد که مقدار یا دامنه در مختصات مکانی ، شدت روشنایی تصویر در آن نقطه می باشد . چون نور صورتی از انرژی است ، باید بزرگتر از صفر و متناهی باشد ، یعنی
تصاویر دریافتی در فعالیت های روزانه معمولاً نور منعکس شده از اشیا است . طبیعت پایه ای را می توان با دو عامل مشخص نمود : (1) مقدار نور تابشی از منبع روی صحنه ای که دیده می شود و (2) مقدار نور منعکس شده به وسیله اشیاء صحنه .
این دو عامل به ترتیب مولفه های روشنائی و انعکاس نامیده می شوند و به ترتیب با و
نشان داده می شوند . توابع و به شکل حاصل ضرب ترکیب می شوند تا ایجاد شود :
که و
معادله بیان می کند که ضریب انعکاس به بازه عددی صفر (جذب کامل) و یک (انعکاس کامل) محدود می شود . طبیعت توسط منبع نور و نیز توسط مشخصات اشیای صحنه معین می شود .
شدت تصویر تکرنگ در مختصات را سطح خاکستری تصویر در آن نقطه می نامیم .
بازه محدوده خاکستری نامیده می شود . معمولاً تلاش می شود که این بازه را به بازه که در آن بیانگر سیاه و بیانگر سفید است ، تغییر دهیم . تمام مقادیر میانی سایه های خاکستری هستند که به طور پیوسته از سیاه تا سفید تغییر می کنند[1] .
4-1: تشخیص صورت
یکی از مهم ترین کاربرد های پردازش تصویر دیجیتال در زمینه ی تشخیص صورت است . تشخیص صورت ، محبوبیت و اهمیت زیادی را در جامعه بصری کامپیوتری بدست آورده است . با حضور همزمان تکنولوژی اطلاعاتی جدید و رسانه های گروهی ، روش های موثر تر و آشنا تری برای برهم کنش های انسان – کامپیوتر (HSI) توسعه داده می شوند ، واسط های انسان – کامپیوتر که بر مبنای حالات چهره و حرکات بدن انسان می باشند ، به عنوان روش هایی مورد استفاده قرار گرفته اند که جایگزین واسط های سنتی از قبیل صفحه کلید ، ماوس و نمایشگر ها شده اند . تحقیقات در حال گسترش در ارتباط با پردازش صورت بر این اساس هستند که اطلاعاتی درباره هویت ، موقعیت و مقصود یک کاربر از تصاویر قابل استخراج باشند و متعاقباً کامپیوتر متناظر هم بتواند واکنش نشان دهد . تلاش های صورت گرفته در پردازش صورت ، شامل شناسایی صیورت ، ردیابی صورت ، شناسایی حالت چهره ، تصدیق صورت و تشخیص صورت می باشد . برای ساختن سیستم های خودکاری که اطلاعات قرار کرفته در تصاویر صورت را آنالیز کنند ، الگوریتم های موثر و قدرتمندی از تشخیص صورت مورد نیاز است . با داشتن یک تصویر مجزا ، هدف تشخیص صورت ، تعیین تمام نواحی صورت است که شامل صورت می باشند ، با صرف نظر کردن از وضعیت سه بعدی تصویر ، جهت و شرایط روشنایی آن . در سالهای اخیر فعالیت های بسیاری در زمینه ی شناسایی و تشخیص صورت انجام گرفته است . کاربردهای نظارتی و کنترلی و تجاری بسیاری در حوزه این فعالیت ها ،توسعه داده شده اند . تکنیک های بیشماری برای تشخیصی صورت در تصاویر مجزا پیشنهاد شده اند . این روش ها به دو دسته کلی تر مبتنی بر ویژگی و تصویر تقسیم بندی شده اند . که هر یک مزایا و معایب خاص خود را دارند . از بین این روش ها ، روش مبتنی بر رنگ و شبکه ی عصبی و ماشین بردار حمایتی (SVM) ، رایج تر هستند و کارایی آنها به مراتب بیشتر از سایر روش هاست . تکنیک های مبتنی بر رنگ اغلب خیلی مطمئن هستند ، اما ممکن است که منجر به تشخیص های غلط بی شماری شوند ، در نتیجه نیاز به آن دارند که با سایر روش ها ترکیت شوند . شیوه های شبکه ی عصبی و ماشین بردار حمایتی که مبتنی بر الگوریتم های یادگیری و رده بندی هستند عمدتاً شامل پارامتر های بی شماری هستند که نیار به تنظیم دارند که مسلماً این عملیات وقت گیر است . با داشتن یک تصویر دلخواه به عنوان ورودی ، که می تواند از ویدئو و یا یک عکس بی جانی ، حاصل آمده باشد ، هدف تشخیص صورت ، تعیین این مساله است که آیا صورتی در تصویر وجود دارد یا خیر ، و اگر وجود داردموقعیت و محدوده ی هر صورت را برمی گرداند . فعالیت هایی که در زمینه ی تشخیص صورت ، انجام گرفته به اوایل سال 1970 بر می گردد . هر چند برای بیشتر از بیست سال است که این امر توسط مهندسان و روانشناسان مورد مطالعه ی جدی قرار گرفته است ،و مخصوصاً از سال 1995 ، روش های بسیاری در تلاش برای حل این مسئله ، توسعه داده شده اند . در حقیقت ما تصاویری را که فقط حاوی قورت باشد را دریافت نمی کنیم . به سیستمی نیاز هست که صورت ها را در تصاویر درهم ، تشخیصی ،تعیین موقعیت و جدا کند و در نتیجه ی آن ، این صورت های جداسازی شده می توانند به عنوان ورودی به سیستم های تشخیص چهره تحویل داده شوند . عمل تشخیص صورت برای مغز بشری ، یک عمل جزئی و کم اهمیت است ، در حالی که هنوز چالش ها و مشکلات سختی را برای آنکه کامپیوتر قادر به انجام تشخیص صورت ، باشد باقی گذاشته است . چالش هایی که با تشخیص صورت مرتبط هستند را در موارد زیر خلاصه می کنیم :
- وضع صورت : تصاویر یک صورت متناظر با وضعیت های مختلف قرار گیری دوربین – صورت ، همچون روبرو ، تمام رخ ، 45 درجه ، وارون و .... تغییر می کنند . کل این وضعیت ها را به بالا ، پایین و عادی تقسیم می کنیم که قرار گیری صورت نسبت به محور مستقیم دوربین را نشان می دهند .
- وجود یا عدم وجود مولفه های ساختاری : مولفه های اضافی مرتبط با صورت همچون سبیل ، ریش ، کلاه و عینک هستند که ممکن است وجود داشته باشند یا نداشته باشند . این مولفه ها در صورت وجود تغییرات زیادی را موجب می شوند .
- حالات چهره : ظاهر صورت مستقیماً متاثر از حالات چهره ی اشخاص است .
- انسداد یا همپوشانی : صورت ها ممکن است به طور جزئی توسط اشیاء دیگر از جمله صورت دیگر یا کلاه و ... پوشیده شده باشند .
- شرایط تصویر : زمانی که تصویر ایجاد می شود ، عواملی چون روشنایی ( طیف ها ، توزیع منبع و شدت ) و مشخصات دوربین ( واکنش حسگر و لنز ها ) می توانند روی ظاهر یک صورت تاثیر بگذارند .
- تاثیر رنگ یا به هم ریختگی زمینه : صورت ها ممکن است در زمینه های پیچیده ظاهر شوند که در این صورت ، اشییایی که رنگ مشابهی با پوست دارند ، نیز به اشتباه ممکن است ، شناسایی شوند .
از نتیجه حاصله از عملیات تشخیص صورت بر روی عکس ورودی می توان در زمینه های دیگری استفاده نمود . از جمله :
مکان یابی صورت : این عمل ، موقعیت تصویر را از یک صورت تک مشخص می کند .
تشخیص خصائص صورت : هدف از انجام این عمل ، تشخیص وجود و موقعیت خصایص صورت ، همچون چشم ها ، بینی ، ابرو ، دهان ، لب ها ، گوش ها و .... می باشد .
شناسائی صورت : یک تصویر ورودی ( کاوشگر) را با یک پایگاه داده (گالری ) ، مقایسه می کند و یک تطابق را اگر وجود داشته باشد ، گزارش می دهد .
ردیابی صورت : روش های ردیابی صورت ، پیوسته موقعیت و احتمالاً جهت یک صورت را در دنباله ای از تصویر در بلادرنگ ، بر آورد می کنند .
1-5 : تشخیص و تعبیر
در این قسمت با ارائه چند روش تشخیص و تعبیرتصویر ، مبحث پردازش تصویر دیجیتال را پایان می دهیم .
تحلیل تصویر شامل فرآیند های کشف ، شناسایی و فهم الگو های مرتبط با یک کار تصویری است . یکی از اهداف اصلی تحلیل رایانه ای تصویر این است که ماشین بتواند بعضی توانایی های انسان را تا حدودی تقریب بزند . بنابراین سامانه خودکار تحلیل تصویر باید بتواند درجات گوناگونی از هوشمندی را ارائه کند . مفهوم هوشمندی تا حدی ، به ویژه راجع به ماشین ، تقریبی است . با این حال شناخت انواع مشخصه هایی که معمولاً با هوشمندی مرتبط هستند ، مشکل نیست . در این مورد چند مشخصه فوراً به ذهن می آیند : (1) توانایی استخراج اطلاعات مرتبط از زمینه ای با جزئیات نامرتبط ؛. (2) توانایی یادگیری از مثال ها و تعمیم آن طوری که در شرایط جدید و متفاوت قابل استفاده باشد و (3) توانایی استنتاج از اطلاعات ناقص .
قسمت اعظم تحلیل تصویر رایانه ای کنونی بر اساس روابط تجربی که برای حل مسائل خاصی طرح شده اند ، می باشد . مثلاً بعضی ماشین ها قادرند نوشته های چاپی را که قالب مناسبی داشته باشند ، با سرعت هایی که بارها سریع تر از سرعت خواندن ماهرترین انسان ها است ، بخوانند . با این حال این نوع سامانه ها بسیار خاص هستند و توسعه پذیری کمی دارند یا اصلاً توسعه پذیر نیستند . بنابراین محدودیت های عملی و نظری فعلی در مبحث تحلیل تصویر ، راه حل هایی را تحمیل می کنند که شدیداً وابسته به مساله هستند .
تقسیم روش های تحلیل تصویر به سه گروه اصلی مفید به نظر می رسد . این گروه ها عبارتند از : (1) پردازش سطح پایین ،(2) پردازش سطح میانی و (3) پردازش سطح بالا . گر چه این تقسیم بندی ها مرز های قطعی ندارند ، اما چهار چوب مفیدی برای دسته بندی فرآیند های مختلفی که اجزای اصلی سامانه خودکار تحلیل تصویر هستند ، فراهم می آورند . پردازش سطح پایین به اعمالی گفته می شود که واکنش هایی خودکار هستند و اصلاً نیازی به هوشمندی ندارند . ما تصویر برداری و پیش پردازش را به عنوان اعمال سطح پایین در نظر می گیریم . این گروه شامل فعالیت هایی از تشکیل تصویر تا جبران سازی هایی نظیر کاهش نویز یا مات زدایی می شود . پردازش سطح میانی به عمل استخراج و مشخص کردن اجزای ( مثلاً نواحی ) تصویر که حاصل فرآیند سطح پایین هستند ، می پردازد . فرآیندهای سطح میانی شامل بخش بندی و توصیف می باشد . در نهایت پردازش سطح بالا شامل تشخیص و تعبیر است . این دو فرآیند تشابه بیشتری به مفهوم عام درک هوشمندانه دارند . در ادامه از بین روش های موجود سه روش به طور خلاصه شرح داده می شود : (1) روش های تشخیص با نظریه تصمیم تشخیص ، (2) روش های ساختاری تشخیص و (3) روش های تعبیر تصویر . تشخیص با نظریه تصمیم بر اساس نمایش الگوها به شکل بردار و سپس جستجوی روش هایی برای گروه بندی و انتساب این بردار ها به دسته الگوهای متفاوت است . روش های اصلی تشخیص با تظریه تصمیم ، دسته بندی کننده های حداقل فاصله ، همبسته سازها ، دسته بندی کننده بیز و شبکه های عصبی هستند . در تشخیص ساختاری الگوها به شکل نمادین (نظیر رشته ها یا درخت ها ) نمایش داده می شوند و روش های تشخیص بر اساس تطبیق نماد یا براساس مدل هایی هستند که با الگوها نمادی به عنوان جمله هایی از یک زبان مصنوعی رفتار می کنند . تعبیر تصویر به مجموعه ای از عناصر تصویری تشخیص داده شده ، معنا نسبت می دهد . مهمترین مفهومی که زیر بنای روش های تعبیر تصویر است ، سازماندهی و استفاده موثر از دانش درباره حوزه مورد نظر است . روش های فعلی تعبیر تصویر بر اساس منطق گزاره ها ، شبکه های معنایی و سامانه فرآوری (به ویژه خبره ) هستند [1] .
فصل دوم :
بررسی دقیق تر برخی از روش های معرفی شده توسط سایر محققین در زمینه تشخیص صورت
2-1 : تشخیص صورت در تصاویر رنگی با استفاده از فیلتر پوست
در این روش یک تکنیک برای تشخیص چهره انسان به صورت اتوماتیک در عکس های رنگی دیجیتال بیان می شود.این سیستم برمبنای یک پروسه دو مرحله ای می باشد که در مرحله اول ناحیه احتمالی شامل پوست انسان در تصویر رنگی مشخص می شود.درقسمت دوم مختصات مکان احتمالی صورت در تصویر را می دهد. در این روش تشخیص پوست با استفاده از یک فیلتر که برپایه اطلاعات بافت , تاروپود و رنگ می باشد انجام می گیرد. در مرحله بعد تشخیص صورت روی تصویر در مقیاس خاکستری که فقط شامل نواحی کشف شده پوست می باشد صورت می گیرد. با ترکیب عملیات مورفولوژیکی و آستانه گیری , خصوصیات اجزائی که حضور صورت را مشخص می کنند از تصویر استخراج می شوند. این پروسه همان طور که نتایج نشان می دهند روشی قابل اعتماد می باشد.
1-1-2: چکیده
در این روش یک الگوریتم اولیه برای تشخیص صورت انسان در تصاویر دیجیتالی به صورت اتوماتیک بیان شده و می تواند به عنوان مقدمه ای برای تحقیقات آتی در زمینه تشخیص صورت در تصاویر باشد. سیستم های زیادی به منظور تشخیص صورت توسط گروههای تحقیقاتی زیادی طراحی و پیشنهاد شده اند. تعدادی از این برنامه ها مانند Rawley , Raluja و Kanade بر مبنای آموزش شبکه های عصبی و محاسبه اندازه فاصله بین مجموعه های آموزشی برای تشخیص صورت می باشد. بقیه بسته های نرم افزاری که در این زمینه وجود دارند، می توانند ویژگی های مربوط به صورت را در تصا ویری تشخیص دهند که در آن ها وجود چهره انسان در جائی از تصویر محرز شده باشد. اما در روشی که در ادامه ارائه می شود تشخیص صورت بر روی عکس های رنگی دلخواه متمرکز شده و با سیستم های نوع اول که بر مبنای ترکیب اطلاعات در مقیاس خاکستری و رنگی می باشند تفاوت دارد.
علاوه بر موارد فوق، این روش نیاز به صرف زمان برای آموزش شبکه های عصبی یا محاسبه اندازه های فاصله بین هر ناحیه احتمالی پوست در تصویر را ندارد. همچنین این سیستم با بسته های نرم افزاری که ویژگی های مربوط به صورت را تشخیص می دهند تفاوت دارند زیرا در این سیستم هدف تشخیص ناحیه احتمالی در هر عکس اختیاری و دلخواه در صورت وجود می باشد، نه آنالیز تصاویری که وجود یک صورت در آن ها از قبل محرز شده اند. این پروسه برمبنای دو گام می باشد؛ گام اول: در تصاویر فیلتر شده نواحی احتمالی شامل پوست انسان مشخص و علامت گذاری می شوند. این فیلتر با استفاده از توابع ریاضی ساده و توابع پردازش تصویر در متلب طراحی شده است و برمبنای فیلتر پوستی که برای The Berkeley-Iowa Naked People Finder طراحی شده می باشد. تغییرات اعمال شده در الگوریتم به منظور دست یابی به نتایج بهتر صورت گرفته شده است. در مرحله دوم نواحی پوستی مشخص شده را جدا نموده و تاریکترین و روشن ترین ناحیه ها از نقشه برداشته می شوند. روی این نواحی تاریک و روشن تست ها ی عملی و تجربی انجام می شود تا تطابق آن ها با نواحی مثل چشم و ابرو و سوراخ بینی و دهان معین شود. در نهایت نواحی که پس از انجام چند مرحله آنالیز حاوی سوراخ می باشند به عنوان نواحی احتمالی برای انجام مراحل فوق از ترکیبی از توابع متلب و برنامه Khoros استفاده می شود. در آخر، سیستم نهائی به صورت اتوماتیک در می آید و نیازی به مداخله کاربر ندارد. مرحله سوم این روش که در این پروژه بیان نشده و باید تکمیل شود شامل بررسی تمایز اندازه های سوراخ ها و فاصله ی آن ها برای دست یابی به سیستم تشخیص صورت قوی تر می باشد.
2-1-2 : فیلتر پوست
فیلتر پوست مورد استفاده بر مبنای الگوریتم Fleck & Fosyth می باشد که تغییراتی در آن اعمال شده و در [2] مورد مقایسه قرار گرفته اند. در این روش فیلتر در متلب ساخته شده است. با وجود این که چندین تابع پردازش تصویر سطح پایین در مطلب وجود دارد اما این روش احتیاج به زمان داشت تا یک الگوریتم برای فیلتر کاربردی را بسازد، نه این که کدهای تابع سطح پایین را بنویسد. در ادامه توضیح مختصری در مورد نحوه کار فیلتر داده می شود. فرمت توابع فیلتر در متلب در سایت مربوطه قابل دسترسی می باشد[3]. لازم به ذکر است که عکس رنگی ورودی باید به فرمت RGB با شدت رنگ در رنج تا باشد. به دلیل محدودیت های موجود در زمینه اجرای برنامه و سرعت آن در این روش از عکس های با سایز کوچکتر از استفاده شده است. به منظور جلوگیری از بروز اشباع حین تبدیل تصویر از فرمت RGB به IRgBy، پاسخ صفر ماتریس RGB محاسبه شده و از سه مولفه فضای رنگی RGB کم می شود.
شکل2-1: تصویر اصلی RGB
عکس RGB به IRgBy تبدیل شده وساختار و بافت، رنگمایه و اشباع محاسبه می گردد. تبدیل RGB به IRgBy بر طبق فرمول Fleck & Fosyth محاسبه می شوند که به شرح زیر می باشند :
عملوند به صورت زیر تعریف شده است :
سپس ماتریس های , به وسیله فیلتر پنجره متوسط با اضلا عی با طول فیلتر می شوند. نزدیکترین مقدار صحیح به می باشد.
یک نقشه بافت و ساختار برای پیدا کردن نواحی با اطلاعات کم در مورد بافت به کار می رود. پوست در تصاویر دارای بافت صاف و هموار می باشد، بنابراین یکی از روش های کشف نواحی پوست در عکس انتخاب نواحی با بافت هموار می باشد. نقشه بافت به روش زیر از ماتریس ساخته می شوند :
1( فیلتر کردن با استفاده از فیلتر متوسط به وسیله یک پنجره با طول
2( کم کردن عکس فیلتر شده از ماتریس اصلی
شکل2-2: نقشه بافت
3( بدست آوردن قدر مطلق تفاضل و فیلتر کردن نتیجه به وسیله پنجره ای به طول
تصاویر رنگمایه و اشباع برای انتخاب نواحی که رنگ آن ها با رنگ پوست تطابق دارد استفاده می شوند. تبدیل IRgBy به رنگمایه و IRgBy به اشباع به وسیله روابط زیر صورت می گیرد که مفدار رنگمایه با درحه بیان می شود :
Hue = (atan^2 (Rg,By))
Saturation = sqrt(Rg^2 + By^2)
با به کاربردن تصاویر نقشه بافت و ساختار، رنگمایه و اشباع نواحی شامل پوست مشخص می شود.