نظارت بر محیط، بدون واسطه انسان یکی از نیازهای بشر امروز است. با اینکه بیش از چند دهه از معرفی روش¬های نظارت اتوماتیک نمیگذرد ولی امروزه کاربرد بسیار زیادی پیدا کردهاند. یکی ازمهمترین کاربردهای آن نظارت ترافیک میباشد. در سیستم های نظارت ترافیکی از سنسورها و ابزار های مختلفی استفاده میشود. استفاده از دوربین های ویدئویی، روشی است که میتوان به کمک آن اطلاعات ترافیکی مورد نیاز را از تصاویر استخراج کرد.
جهت پردازش تصاویر ویدئویی برای تشخیص و ردیابی خودروها و در نهایت نظارت اتوماتیک در ترافیک روشهایی ارائه شده است که هرکدام با توجه به کارایی مورد نظر، از الگوریتم های مختلف بینایی ماشین استفاده می کنند. برخی از این روش ها ردیابی بر اساس مدلهای سهبعدی و برخی دیگر بر اساس ردیابی نواحی متحرک در تصویر یا نقاط مشخصه هستند.
در این پایان نامه روشی جدید جهت استخراج پارامترهای حرکتی و ترافیکی با استفاده از تشخیص و ردیابی خودروهای متحرک ارائه شده است. روش پیشنهادی بر اساس ردیابی حباب بوده و به منظور ردیابی هرچه دقیقتر خودروها از بافت نگارهای عرضی (در هر فریم) و طولی (درچند فریم متوالی) فراوانی مشخصات لبه های استخراج شده خودروها در نوارهای مشخص شده و همچنین اثر¬دهی اطلات رنگ، رشد پیکسلی،سرعت و تخمین مکانی خودروها استفاده شده است. درمرحله نخست، با استفاده از تصاویر از پیش ضبط شده ازمکان¬های مورد نظر کالیبراسیون انجام می¬شود. هدف ازم انجام کالیبراسیون در این روش بدست آوردن نسبت هرپیکسل به اندازه واقعی آن بر حسب متر در تمام نقاط تصویر می¬باشد، که به کمک روش تقریبی تخمین زده می¬شود. در مرحله بعدی تخمین پس زمینه برای جداسازی خوردروهای متحرک از تصویر و در نهایت استخراج حباب¬ها که هرکدام نمایانگر یک خودرو متحرک می¬باشد انجام می¬شود. جهت ردیابی حباب ها در تصویر جاری از یک ماتریس m در n که درآن n تعداد حباب های ردیابی شده و m تعداد مشخصه¬هایی از قبیل مختصات مکانی، ابعاد، رنگ، سرعت، مکان تخمینی در تصویر بعدی، ابعاد تخمینی در فریم بعدی و ... می¬باشد که به هر حباب ردیابی شده نسبت داده می¬شود. این ماتریس در هر فریم با استفاده از مشخصات استخراج شده حباب¬ها به روز می¬شود به طوری که صحت این ردیابی با مطابقت دادن همه مشخصه¬های فعلی و تخمین زده شده تایید می¬گردد. جهت ردیابی دقیق تر خودروهایی که به دلیل وجود سایه¬ها و مسأله اختفاء به درستی ردیابی نشده اند از فصل مشترک اطلاعات لبه در حباب های ردیابی شده با نواری از تصویر که درمکانی خاص در نظر گرفته شده است یک نمودار بافت نگار تشکیل داده و با بررسی آن در هر تصویر می-توان ردیابی اشتباه دو خودرو که به طور عرضی به هم چسبیدگی دارند و همچنین با بررسی آن در چند تصویر متوالی می¬توان ردیابی اشتباه دوخودرو که به طور طولی به هم چسبیدگی دارند را با تقریب خوبی تشخیص داد. پس از تشخیص و ردیابی خودروها، استخراج پارمترهای حرکتی و ترافیکی از قبیل تراکم، سرعت متوسط، تعداد خودروها و ... انجام می¬شود.
کلید واژه: پارامترهای حرکتی ، پارامترهای ترافیکی، ردیابی حباب، بافت نگار، کالیبراسیون.
فصل 1- مقدمه
1-1- پیشگفتار
امروزه اهدافی چون افزایش امنیت عمومی، کاهش ازدحام جادهای، بهبود دسترسی به اطلاعات حمل و نقل و سفر، کاهش هزینههای ارگانهای مرتبط دولتی (همچون وزارت راه و . . .) و نیز کاهش مناطق حادثه خیز (بر اساس تعاریف VDC وابسته به وزارت حمل و نقل امریکا) در تمامی دنیا مورد توجه مدیران ارشد دولتی بوده و برنامههای سالیانه استفاده از این تجهیزات و افزایش سیستمهای حوزه ITS در ارگانهایی چون پلیس، وزارت راه و ترابری و نیز سازمانهای تاًمین امنیت عمومی در تمامی کشورهای توسعه یافته و در حال توسعه دیده میشود.
در یک مطالعه تحقیقاتی در سال 1998 در امریکا، بر اساس داده های آماری میزان سفرهای درون و برون شهری و حوادث جاده ای، نرخ ایجاد اتوبانها و جادههای اصلی در 10 سال آینده (تا سال 2008) 25 درصد جاده های موجود برآورد شده است که پس از ایجاد سازمان دولتی ITS و بهره گیری از تجارب شرکتهای مشاور خصوصی چون VDC و . . . نتیجه به دست آمده استفاده از سیستمهای ITS را با اهداف فوق تجویز می نمود. در واقع با به کار بردن ابزارهای هوشمند کنترل حمل و نقل و مدیریت آن میتوان از هزینههای ساخت اتوبانهای جدید به شدت کاست و از منابع موجود به بهترین نحو استفاده نمود. اینگونه سیستمها با کاربریهای مختلفی چون راهنمایی مسیرهای سفر به صورت برخط ، سیستمهای اجباری و . . . نه تنها به سرعت عملیات ارگانهای مرتبط با پلیس و راهداری می افزایند بلکه در بسیاری موارد خود عواملی درآمد زا برای دولت نیز بوده و هزینه های خود را جبران می سازند. در این میان سیستمهای اجباری جاده ای که در اغلب دنیا توسط پلیس مورد استفاده قرار میگیرند از ارکان اساسی ITS به شمار میروند ، چرا که این سیستمها نه تنها درآمدزا هستند بلکه در مواردی چون روانسازی ترافیک جادهای، کاهش تصادفات، فرهنگسازی عمومی و افزایش توان پلیس که منجر به کاهش جرم و جنایت میشود نیز تاًثیر به سزایی دارند.
فهرست مطالب د
فهرست شکلها ز
فهرست جدولها ی
فهرست معادلات و روابط ک
چکیده 1
فصل 1- مقدمه 3
1-1- پیشگفتار 3
فصل 2- انواع سنسور های مورد استفاده در سیستم های مدیریت ترافیک 8
2-1- مقدمه 9
2-2- سنسورهای دفنی 12
2-2-1- لوله های بادی 12
2-2-2- آشکار سازهای حلقه القایی 13
2-2-3- سنسورهای پیزوالکتریک 15
2-2-4- سنسورهای مغناطیسی 17
2-2-5- توزین در حرکت 19
2-2-6- صفحه خمشی 20
2-2-7- سلول بار 21
2-2-8- سنسورهای غیر دفنی 22
2-2-9- پردازنده تصاویر ویدیویی 22
2-2-10- سنسورهای مادون قرمز 31
2-2-11- سنسورهای آلتراسونیک 35
فصل 3- مروری بر روشهای استخراج پارامترهای ترافیکی بااستفاده از پردازش ویدئویی 37
3-1- مقدمه 38
3-2- روش های موجود در تشخیص اشیاء 39
3-2-1- تشخیص از روی مدل هندسی آن 39
3-2-2- روش ردیابی لبه برای تشخیص شی 40
3-2-3- روش مبتنی بر عمق تصویر، به کمک چند تصویر از شی 40
3-2-4- استفاده از الگوریتم های شبکه های عصبی 42
3-2-5- تشخیص شی از روی حرکت آن 44
3-3- ردیابی حباب 55
3-4- ردیابی پیرامون فعال 61
3-5- ردیابی بر اساس مدل سه بعدی 63
3-6- ردیابی میدان تصادفی مارکوف 66
3-7- ردیابی بر اساس مشخصه 68
3-8- ردیابی بر اساس شار نوری 71
فصل 4- فصل چهارم: الگوریتم پیشنهادی برای ردیابی حباب 73
4-1- مقدمه 74
4-2- کلیات الگوریتم: 76
4-3- پایگاه داده تصاویر ویدئویی 78
4-4- بدست آوردن تصویر پسزمینه 80
4-5- بدست آوردن تصویر پییشزمینه 86
4-6- استفاده از عملگرهای شکلشناسی 89
4-7- پردازش حبابها 90
4-7-1- برچسبگذاری اولیه حبابها 90
4-7-2- استخراج مشخصات مربوط به هریک از حبابها 91
4-7-3- جداسازی حبابها براساس مشخصات آنها 92
4-8- کالیبراسیون 95
4-9- ردیابی حبابها 100
4-10- استخراج پارامترهای حرکتی و ترافیکی 102
4-11- الگوریتم های شمارش 103
4-11-1- روشهایی که وابستگی به ردیابی ندارند 103
4-11-2- روشهایی که بر اساس ردیابی عمل میکنند 105
4-12- الگوریتم پیشنهادی 105
4-12-1- استخراج نمودارهای بافتنگار 106
4-12-2- بدست آوردن اطلاعات بافتنگار در طول زمان 107
4-12-3- اطلاعات موجود در نمودارهای دو بعدی و سهبعدی به دست آمده 114
4-12-4- شمارش خودروها با استفاده از نمودار سطح زیرمنحنی بافتنگارها در طول زمان 114
4-12-5- شمارش خودروها با استفاده از نمودار سهبعدی بافتنگارها در طول زمان 116
4-12-6- شمارش خودروها با استفاده از کانتور بافتنگارها در طول زمان 116
4-12-7- شمارش خودروها با استفاده از اطلاعات دوبعدی اصلاح شده توسط اعمال قوانین شکلشناسی 119
4-12-8- جمعبندی الگوریتم پیشنهادی 121
4-13- نتایج آزمایشات 122
4-13-1- شمارش بدون استفاده از ردیابی حبابها 122
4-13-2- شمارش با استفاده از ردیابی حبابها 123
4-13-3- شمارش با استفاده از اطلاعات دوبعدی بدست آمده از ردیابی حبابها 123
4-13-4- شمارش با استفاده از اطلاعات دوبعدی اصلاح شده توسط اعمال قوانین شکلشناسی 124
جمعبندی و پیشنهادات 125
فهرست مراجع 126
شامل 141 صفحه فایل word
پایان نامه مقطع کارشناسی رشته استخراج معدن (word )
عنوان :زمین شناسی ساختمانی و مسائل زیست محیطی معدن سرب راونج دلیجان
امروزه کلیه مسائل مربوط به مهندسی پیوند عمیق و تنگاتنگی را با موضوع حفاظت محیط زیست پیدا کرده اند و این بحث علی الخصوص در زمینه علم معدنکاری نقش چشمگیر و پررنگتری دارد.هر مهندس و یا هر کارگر فنی که در معدن کار می کند باید نه تنها به توصیه های و متدهای پیشرفته در جهت ازدیاد تولید و راندمان کار توجه داشته باشد بلکه همواره در کلیه شرایط و مسیرهای منتهی به استخراج هر نوع ماده معدنی باید توجه کافی به محیط زیست را سر لوحه خود قرار دهد.
مساله حفاظت محیط زیست در عملیات معدن کاری چند سالی است که نظر متخصصان این رشته را در کشورهای در حال توسعه به خود جلب کرده است.در حالی که در کشورهای توسعه یافته وصنعتی این موضوع یکی از مسائل روز آنها است و برنامه ریزان سازمان های اجرایی در این زمینه مطالعات و تحقیقات وسیعی انجام داده اند و این امر ناشی از اهمیت موضوع مورد تحقیق می باشد.پروژه حاضر ابتدا نگاهی کوتاه به بحران منابع معدنی در جهان و در واقع میزان موجودیت و امکان دسترسی در سال های آتی به این منابع را با توجه به کنترل کننده های مختلف بررسی می کند.و اما در فصل بعد مساله از زاویه دیگر و دقیق تری بررسی خواهند شد و در واقع نگاهی دارد به ژئوشیمی نیاز و منابع معدنی چرا که بسیاری از مسائل زیست محیطی به فهم اصول پایه ژئوشیمی نیاز دارد که برحرکت آلدوه کننده ها حاکم است.و در بخش دیگر نگاهی کلی ،اما تازه تری به اثرات زیست محیطی سه بخش عمده عملیات معدنکاری یعنی اکتشاف ،استخراج وفراوری مواد معدنی دارد.
اما در بخش زمین شناسی ساختمانی معدن سرب روانج ابتدا نگاهی دارد به مشخصات عمومی معدن و سپس نگاهی دارد به بخش ها وتقسیمات و سازند هاو نوع زمین شناسی معدن سرب راونج ،و در مرحله بعد تاریخچه زمین شناسی وچینه شناسی در دوران های مختلف را مورد بررسی قرار می دهیم.
در این پژوهش سعی شده است این عوامل مورد بررسی قرار گیرد :
فصل اول :
زمین شناسی ساختمانی و توضیحات اجمالی از معدن سرب راونج - مشخصات وخصوصیات سرب - تاریخچه راه اندازی معدن وکارخانه - ذخایر سرب و روی راونج - مشخصات خوراک و محصولات کارخانه - اصول چینه شناسی در محیط های رسوبی
-تقسیم بندی محیط های دریایی از نظر نوع رسوبات و ...
فصل دوم :
محیط زیست منابع معدنی - عموامل کنترل کننده دسترسی به مواد معدنی - مواد مصرفی و الگوهای اقتصاد جهانی - بیمار های ناشی از قرارگیری در معرض سرب - دفع سرب از بدن - اثر ضد مسمومیت - داده های مسمومیت شغلی و ...
فصل سوم :
اثرات زیست محیطی اکتشاف و استخراج و فرآوری موادمعدنی - اثرات زیست محیطی اکتشاف موادمعدنی - اثرات زیست محیطیاستخراج مواد معدنی - اثرات زیست محیطی فرآوری مواد معدنی و ...
فصل چهارم:
شیمی و آنالیز سرب - مشخصات شیمیایی -زمینه های تجربی و کیفی - رده بندی روش های تجزیه ای و ...
این فایل با فرمت word و در 284ص تنظیم گشته است.
چکیده:
در این تمرین روش های استخراج ویژگی و روش های خطی و غیر خطی دسته بندی را مورد مطالعه قرار میدهیم. در ابتدا روش های مختلف استخراج ویژگی که از آن جمله PCA، LDA، روش قاب بندی و چند روش دیگر هستند را و سپس برای ویژگی های استخراج شده از روش های دسته بندی خطی بیزین و SVM خطی و سپس روش های غیرخطی RBF ، MLP و همچنین SVM غیرخطی برای دسته بندی استفاده شده است. بسته به روش شناسایی بکارگرفته شده، معمولا ویژگی های متفاوتی از دنباله نقاط استخراج می شود. در اکثر روش هایموجود استخراج ویژگی، ویژگی ها از روی مختصات نقاط نمونه برداری شده ورودی استخراجمی شوند. از مجموعه ی ویژگی های استخراج شده معمولاً تعدادی مفید تر و موثرترند. ما برای تشخیص و انتخاب ویژگی های تاثیرگذارتر از یک الگوریتم ژنتیک استفاده کرده ایم. اما پس از استخراج و انتخاب ویژگی ها نوبت به دسته بندی می رسد. در ابتدا از چند دسته بند خطی استفاده کرده ایم. به راحتی میتوان نشان داد که ناحیههای تصمیمگیری یک ماشین خطی محدودند و این محدودیت انعطافپذیری و دقت دستهبند را کاهش میدهد. مسایل بسیاری وجود دارد که توابع جداساز خطی برای داشتن حداقل خطا در آنها کافی نیستند. علاوه بر این مرزهای تصمیمگیری که کلاسها را از یکدیگر تفکیک میکنند ممکن است همیشه خطی نباشند و پیچیدگی مرزها گاهی اوقات نیاز به استفاده از سطحهای کاملاً غیر خطی را دارند. بنابراین در ادامه ی کار از چند دسته بند غیرخطی نیز استفاده نمودیم. در استفاده از شبکههای عصبی چندلایه، شکل غیر خطی بودن از مجموعهی آموزش فرا گرفته میشود. در روشهای RBF و SVM غیرخطی مشکل اصلی انتخاب توابع هسته غیر خطی مناسب است.
2) مقدمه
اولین الگوریتم دستهبندی در سال 1936 توسط Fisher ارایه شد و معیارهای آن برای بهینه بودن، کم کردن خطای دستهبندی کنندههای الگوهای آموزشی بود. بسیاری از استراتژیهای موجود نیز از همین روش پیروی میکنند. در سادهترین شکل ممکن، دسته بندهای خطی میتوانند دو دستهی متفاوت را تفکیک کنند. با توجه به این موضوع مسالهای را جداییپذیر خطی مینامند که با یک ابرصفحه بتوان محدودهی تصمیم را به دو گروه تقسیمبندی کرد. در عمل میتوان دسته بندهای خطیای را طراحی کرد که بیش از دو گروه را از هم تفکیک کنند. این عمل را با تنظیم محدودههای تصمیم متعدد و آزمونهای چندگانه بر اساس شرایط موجود میتوان انجام داد. ما در این مساله یک دسته بندی با 26 کلاس را داریم.
در روش بیزین احتمال شرطی تعلق بررسی میشود. به این ترتیب که الگوی مورد نظر به دستهای تخصیص داده میشود که احتمال شرطی تعلق بردار مشخصهی الگو به آن دسته ازتمام دستههای دیگر بیشتر باشد. روش بیزین به طور کلی می تواند برای کارایی بسیار مطلوب بهینه شوند. این روش مزایای دیگری نیز دارد که استفادهی از آن را توجیه میکند. این روش میتواند با چند فرض ساده در مورد دادهها کاملاً به شکل روشهای سادهی خطی عمل کند، به علاوه این کار میتواند به گونهای انجام شود که در پایان، مدل قطعی بدون هیچ گونه رجوع به آمار به دست آید. در روش بیزین مشکل کار تعریف احتمالات شرطی مورد نظر قاعدهی بیز است.
یک محقق روسی به نام Vladimir Vapnik در سال 1965 گام مهمی در طراحی دستهبندها برداشت [1] و نظریهی آماری یادگیری را بصورت مستحکمتری بنا نهاد و ماشین بردار پشتیبان را ارایه کرد. ماشینهای بردار پشتیبان در دو حالت جداییپذیر و جداییناپذیر برای دستهبندی الگوهای یک مسالهی چندکلاسه از چند مرز جداکنندهی خطی یا ابرصفحه استفاده میکنند و در واقع حاصلضرب داخلی بردار ورودی با هر یک از بردارهای پشتیبان در فضای d بعدی ورودی محاسبه میشود. Vapnik نشان داد که میتوان بردار ورودی را با یک تبدیل غیرخطی به یک فضای با بعد زیاد انتقال داد و در آن فضا حاصلضرب داخلی را بدست آورد که با این شرایط هستهی مفیدی را خواهیم داشت.
روش RBF یک دستهبندی و تقریبساز تابعی الگوست و شامل دو لایه میباشد که نرونهای خروجی ترکیبی خطی از توابع پایهای را به وجود میآورند که توسط نرونهای لایهی پنهان محاسبه شدهاند. زمانی که ورودی در ناحیهی تعیین شدهی کوچک از فضای ورودی قرار گیرد، توابع اساسی(غیر خطی) در لایهی پنهان، پاسخ غیر صفری به محرک ورودی میدهند. همچنین این مدل به عنوان یک شبکهی دریافتکنندهی ناحیهای شناخته شده است. ما در روش RBF از معمولترین تابع هستهی غیر خطی یعنی سیگموئید استفاده کردهایم.
به طور کلی شبکههای پرسپترون چندلایه شامل چندین پرسپترون ساده هستند که به طور ساختار سلسلهمراتبی، یک شکل پیشخورد با یک و یا چند لایهی میانی (لایههای پنهان) بین لایههای ورودی و خروجی را شکل میدهد. تعداد لایهی پنهان و تعداد نرونهای هر لایه ثابت نیستند. هر لایه ممکن است از نرونهای مختلفی تشکیل شده باشد که این موضوع به کار آنها بستگی دارد. الگوریتمهای آموزشی متفاوتی در روش چند لایه استفاده میشوند.
3) روشهای به کار رفته در این گزارش
در این قسمت روشهای استخراج ویژگی، روشهای انتخاب ویژگی ها جهت بهینه کردن آنها و کم کردن ابعاد مساله با کاهش تعداد آنها و روشهای دستهبندی (خطی و غیرخطی) به کار رفته بررسی شدهاند.
3-1) روشهای استخراج ویژگی
در این قسمت انواع روشهای استخراج ویژگی ها ذکر شده است. ذکر این نکته لازم است که برخی الگوریتم های استخراج برای انتخاب ویژگی های موثر نیز استفاده می شوند ازجمله ی آنها PCA و LDA هستند. اما در این گزارش ما برای بهینه کردن ویژگی ها و کم کردن تعداد آنها و یا به عبارت دیگر برای کاهش ابعاد (Curse of Dimensionality) از الگوریتم ژنتیک استفاده نموده ایم.
3-1-1) روش PCA خطی
روشهای استخراج ویژگی یک زیرفضای مناسب m بعدی در فضای اصلی ویژگی ها از d بعد را تعیین می کنند(m<=d). تبدیل خطی مثل PCA، آنالیز فاکتور، LDA و تعقیب تصویر بطور گسترده در شناسایی الگو برای استخراج ویژگی ها و کاهش ابعاد استفاده شده اند. بهترین استخراج کننده ی ویژگی شناخته شدهPCA یا توسعه یافته ی Karhunen-loeve است که m بردار مشخصه بزرگتر را از ماتریس کوواریانس d×d از n الگوی d بعدی محاسبه می کند. تبدیل خطی به شکل Y=XH تعریف شده است که X ماتریس الگوی n×d داده شده و Y از ماتریس الگوی n×m مشتق شده است . H ماتریس d×m از تبدیل خطی است که ستون های آن بردارهای مشخصه هستند. قبل از اینکه PCA از ویژگی های پرمعنی تر استفاده کند (بردار ویژگی های با بزرگترین مقدار ویژه)، بطور کاملاً موثر داده ها را با یک زیرفضای خطی با استفاده از معیار خطای میانگین مربعات تخمین می زند. سایر روش ها مانندتعقیب تصویر و ICA برای توزیع های غیرگاوسی تا وقتی که به مشخصه ی مرتبه ی دوم داده ها مربوط نباشد مناسب ترند. ICA با موفقیت برای جداسازی منابع دیده نشده استفاده شده است. استخراج ترکیب خطی ویژگی ها منابع نابسته را تعریف می کند. این جداسازی در صورتی امکان پذیر است که حداکثر یکی از منابع دارای توزیع گاوسی باشد.
از آجا که PCA یک روش بدون بررسی استخراج ویژگی هاست (Unsupervised)، تحلیل جداسازی از یک اطلاعات گروهی در رابطه با هر الگو برای استخراج (خطی) ویژگی های با قابلیت جداسازی زیاد استفاده می کند. در LDA جداسازی بین کلاسی با جابجایی کل ماتریس کوواریانس در PCA با یک معیار جداسازی عمومی مانند معیار Fisher تائید می شود که در یافتن بردارهای مشخصه نتیجه می شود.( حاصل معکوس ماتریس پراکندگی و ماتریس پراکندگی بین کلاسی ). معیار دیگر همراه با بررسی (Supervised) برای چگالی های شرایط کلاس غیرگاوسی بر پایه ی فاصله Patrick-Fisher با استفاده از برآورد چگالی Parzen است.
3-1-2) روش Kernel PCA (PCA با هسته یا PCA غیرخطی)
چندین روش برای تعریف روش های استخراج ویژگی غیرخطی وجود دارد. یکی از این روش ها که مستقیماً به PCA مربوط است، Kernel PCA نام دارد. ایده ی اصلی KPCA نگاشتن داده های ورودی بر روی برخی از فضاهای ویژگی F جدید بطور معمولی با استفاده از تابع غیرخطی و سپس اعمال یک PCA خطی در فضای نگاشت شده است. به هر حال فضایF معمولاً ابعاد بسیار زیادی دارد. برای دوری از محاسبات نگاشت ساده ی ، KPCA تنها هسته های Mercel که می توانند به یک نقطه تجزیه شوند را بکار می گیرد.
به عنوان یک نتیجه فضای هسته یک متریک با تعریف مناسب دارد. نمونه های هسته های Mercer شامل چندجمله ای های مرتبه P بصورت و هسته گاوسی هستند.
فرض می کنیم که X یک ماتریس الگوی n×d نرمال شده با میانگین صفر است و یک ماتریس الگو در فضای F باشد. PCA خطی در فضای F بردارهای مشخصه ی ماتریس همبستگی را حل می کند که همچنین ماتریس هسته نیز نامیده می شود. در KPCA در ابتدا m بردار ویژگی از بدست می آیند تا یک ماتریس انتقال E را تعریف کنند (E یک ماتریس n×m است که m تعداد ویژگی های دلخواه است و m<=d است). الگوهای جدید x با نگاشت می شوند که اکنون با وابستگی به مجموعه آموزش بازنمایی می شوند و نه با مقادیر ویژگی ویژگی های اندازه گیری شده. باید توجه داشت که برای یک بازنمایی کامل تا m بردار مشخصه در E (بسته به تابع هسته) توسط KPCA ممکن است نیاز باشد در حالی که در PCA خطی یک مجموعه از d بردار مشخصه فضای اصلی ویژگی ها را ارائه می کند. انتخاب تابع هسته برای یک کاربرد مشخص هنوز یک مساله باز است.
3-1-3) روش مقیاس گذاری چندبعدی(MDS)
مقیاس گذاری چند بعدی (MDS)یک روش غیرخطی دیگر برای استخراج ویژگی هاست. هدف این روش بازنمایی یک مجموعه ی چندبعدی در دو یا سه بعد است مثل آنچه ماتریس فاصله در فضای اصلی ویژگی های d بعدی به طور کاملاً ثابت در فضای تصویرشده باقی مانده است. توابع تاکید فراوانی برای اندازه گیری کارایی این نگاشت استفاده شده اند. یک مشکل MDS این است که یک تابع نگاشت ساده و روشن را ارئه نمی کند بنابراین ممکن نیست که یک الگوی جدید را در یک نگاشت برای یک مجموعه ی آموزش مشخص بدون تکرار جایگذاری کند. چندین روش برای عنوان کردن این نقص که از درون یابی خطی تا آموزش شبکه عصبی محدود است مورد بررسی قرار گرفته است. همچنین امکان دارد که الگوریتم MDS مجدداً تعریف شود بنابراین مستقیماً یک نگاشت را تهیه می کند که ممکن است برای الگوهای آزمون جدید استفاده شود.
3-1-4) روش شبکه عصبی روبه جلو (Feed-Forward Neural Network)
یک شبکه ی عصبی روبه جلو یک روال جامع را برای استخراج ویژگی هاو دسته بندی پیشنهاد می کند. خروجی هر لایه ی مخفی ممکن است به عنوان یک مجموعه ی جدید و اغلب غیرخطی از ویژگی ها تعریف شود که در لایه ی مخفی برای دسته بندی ارائه می شوند. در این شرایط شبکه های استفاده شده توسط Fukushima و Lecun که اصطلاحاً آن را لایه های وزنی مشترک نامیده اند، در حقیقت فیلترهایی برای استخراج ویژگی ها در تصاویر دوبعدی هستند. در طول آموزش فیلترها با داده ها برای بیشینه کردن کارایی دسته بندی وفق داده شده اند.
شبکه های عصبی می توانند بطور مستقیم برای استخراج ویژگی ها در یک شکل بدون بررسی (Unsupervised) استفاده شوند. شکل (a-1) معماری یک شبکه که قادر به پیدا کردن زیرفضای PCA است را نشان می دهد. به جای سیگموئیدها نرون ها توابع انتقال خطی دارند. این شبکه d ورودی و d خروجی دارد که d تعداد مشخص شده ی ویژگی هاست. ورودی ها همچنین برای رسیدن به هدف نیز با مجبور کردن لایه ی خروجی به ساخت مجدد فضای ورودی تنها با استفاده از لایه ی مخفی بکار گرفته شده اند. سه گره در لایه ی مخفی اولین سه جزء اصلی را ضبط می کنند. اگر دو لایه ی غیرخطی با واحدهای مخفی سیگموئیدی نیز وجود داشته باشند ( شکل (b-4))، آنگاه یک زیرفضای غیرخطی در لایه ی میانی یافت خواهد شد (که همچنین لایه ی گلوگاه هم نامیده می شود). غیرخطی بودن توسط اندازه ی این لایه های اضافی محدود می شود. شبکه های PCA غیر خطی یا اصطلاحاً خودشرکت پذیرها ی ابزار قوی را برای آموزش و تشریح زیرفضای غیرخطی پیشنهاد می کند. محققی به نام Oja نشان داد که چگونه شبکه های خودشرکت پذیر می توانند برای ICA استفاده شوند.