
Andrew Stellman, Jennifer Greene

Bradley Cantrell, Natalie Yates

چکیده:
در این پایان نامه، روش جدیدی جهت تشخیص حالتهای احساسی ظریف چهره ارائه میگردد. برای نمایان ساختن حرکات ظریف چهره از روش بزرگنمایی ویدئویی اولر استفاده شده است. روش بزرگنمایی ویدئویی اولر حرکات ظریف سیگنالها (تغییر رنگ یا حرکت انتقالی)را با پردازش زمانی و مکانی تقویت میکند. ورودی این روش، ویدئوهایی از چهره اشخاص میباشد و نتیجه حاصل از آن به صورت دنباله تصاویر بزرگنمایی شده است. سپس نوع حالت احساسی دنباله تصاویر بزرگنمایی شده را با استفاده از چهرههای ویژه بررسی نمودهایم. در این پژوهش، آزمایش بر روی 164 ویدئو از 16 شخص در پایگاه دادهاحساسات ظریف غیرارادی انجام گرفت. در ابتدا تشخیص تغییر در چهره به هنگام بروز حالات احساسی ظریف را بررسی کردهایم. تغییر در چهره به طور میانگین به میزان %19/65 به هنگام بروز حالت منفی، %29/68 به هنگام بروز حالت مثبت و %75/69 به هنگام بروز حالت تعجب تشخیص داده شده است. همچنین تشخیص و تفکیک دو حالت مثبت و منفی در دنباله تصاویر مورد ارزیابی قرار دادهایم. همانطور که نتایج نشان میدهند دقت تشخیص کلی بین دو حالت منفی و مثبت با به کارگیری بزرگنمایی ویدئویی اولر برابر با % 66/66 میباشد. در حالی که بدون استفاده از این روش بزرگنمایی، تشخیص کلی به %00/50 کاهش مییابد. بنابراین استفاده از بزرگنمایی ویدئویی اولر در بازیابی حرکات نامحسوس چهره به هنگام بروز احساس، عملکرد روش تشخیص حالات احساسی ظریف مبتنی بر چهرههای ویژه و همچنین تشخیص تغییر را بالا میبرد.
کلمات کلیدی: تشخیص حالات احساسی ظریف چهره، تشخیص تغییر در چهره، روش بزرگنمایی ویدئویی اولر، روش چهرههای ویژه
عنوان صفحه
1-1 پیشگفتار.............................2
1-2 بیان مسئلهی تشخیص تغییر در تصویر.............................3
1-3 بیان مسئلهی تشخیص حالات احساسی چهره.............................4
1-4 هدف از این الگو و دستورالعمل5
فصل دوم:توضیح سیستم تشخیص حالات احساسی چهره7
2-1عوامل مؤثر بر تشخیص حالت احساسی چهره.......8
2-2 تقسیم سیستمهای تحلیل حالتهای چهره.......10
2-3متدولوژی تشخیص حالات احساسی.......10
2-4 تشخیص چهره و عملیات پیش پردازش.......12
2-5 استخراج ویژگیهای احساسی.......12
2-5-1روشهای مبتنی بر ویژگی هندسی.......12
2-5-2روشهای مبتنی بر ظاهر.......13
2-6 کلاسه بندی احساسات.......15
2-6-1روشهای مبتنی بر داوری.......16
2-6-2روشهای مبتنی بر علامت.......16
فصل سوم: روشها و پیشینه تحقیقات تشخیص حالات احساسی چهره.............17
3-1ویژگیهای چهره.............18
3-2 تحلیل حالتهای چهره.......19
3-3 مدلهای تشخیص حالات احساسی چهره.......20
3-4مروری بر تحقیقات گذشته.......24
3-4-1 مروری بر پیشینه تشخیص حالات احساسی چهره بر اساس واحدهای حرکتی در سیستم FACS24
3-4-2 مروری بر پیشینه تشخیص حالات احساسی چهره بر اساس جریان نوری 28
3-4-3 مروری بر پیشینه تشخیص حالات احساسی چهره بر اساس چهرههای ویژه و PCA 31
3-4-4 مروری بر پیشینه تشخیص حالات احساسی چهره بر اساس FCP32
3-4-5 مروری بر پیشینه تشخیص حالات احساسی چهره با استفاده از روشهای مختلف دیگر32
3-4-6 مروری بر پیشینه تشخیص حالت چهره سه بعدی34
3-5-3 پایگاه داده بیان احساسات MMI43
3-5-5 پایگاه داده بیان احساسات زنان ژاپنی(JAFFE )44
3-5-6 پایگاه داده تشخیص احساس و ژست FG_Net45
3-5-7 پایگاه داده احساس چهره CMU AMP45
3-5-8 پایگاه داده سه بعدی حالات چهره45
3-5-9 پایگاه داده احساسات ظریف غیر ارادی (SMIC)47
فصل چهارم: تشخیص حالات احساسی چهره به روش چهره ویژه48
4-1 چهرههای ویژه.................49
4-2 کلیات سیستم تشخیص چهره براساس چهرههای ویژه.......50
4-3 محاسبه چهرههای ویژه.......52
4-4 کاهش بعد در روشهای مبتنی بر ظاهر52
4-5 تحلیل مؤلفههای اصلی....................53
4-6 محاسبه مقادیر و بردارهای ویژه در روش چهرههای ویژه54
فصل پنجم: بزرگنمایی ویدئویی اولر برای بازیابی تغییرات ظریف در جهان.......56
5-1 بزرگنمایی ویدئویی اولر.......57
5-3 مبحث حساسیت به نویز.......68
5-4 مقایسه روش بزرگنمایی ویدئویی اولر در مقابل روش لاگرانژى .......70
5-5 محاسبه خطا در روش بزرگنمایی ویدئویی اولر و روش لاگرانژى70
5-5-1 محاسبه خطا در روش بزرگنمایی ویدئویی اولر و روش لاگرانژى در حالت بدون نویز70
5-5-2 محاسبه خطا در روش بزرگنمایی ویدئویی اولر و روش لاگرانژى در حالت با نویز72
5-6 نتیجه گیری نهایی ........73
فصل ششم: روش پیشنهادی ........74
6-1 نمای کلی از پژوهش.......75
6-2 استفاده از چهرههای ویژه در تشخیص حالات احساسی.......75
6-3 تشخیص حالات ظریف احساسی با به کار گیری روش بزرگنمایی ویدئویی اولر و روش چهرههای ویژه 76
6-3-1 بررسی تشخیص تغییر در چهره به هنگام بروز حالات احساسی ظریف79
6-3-2 بررسی تشخیص حالات احساسی ظریف چهره (تنها یک حالت مثبت و منفی از هر شخص).......................86
6-3-3 بررسی تشخیص حالات احساسی ظریف چهره (چندین حالت مثبت و منفی از هر شخص)...................88
6-4 جمعبندی ....................90
مراجع........................ ..92
عنوان صفحه
جدول 5‑1. مقادیر α، ، و برای ویدئوهای مختلف67
جدول 6‑1. جمع بندی کلی تشخیص تغییر چهره در هر 3 حالت (منفی، مثبت و تعجب) در دو مجموعه داده83
جدول 6‑2. تشخیص دو حالت چهره (یک حالت مثبت و یک حالت منفی) 86
جدول 6‑4. تشخیص دو حالت چهره (چندین حالت مثبت و چندین حالت منفی)88
فهرست شکلها
عنوان صفحه
شکل1‑1. تصویری از نمونههای تغییر تصویر3
شکل2‑1. ژستهای مختلف از یک تصویر8
شکل2‑3. نورپردازیهای متفاوت در تصویر9
شکل2‑4. بلوک دیاگرام تشخیص حالات احساسی11
شکل2‑5. دسته بندی روشهای تشخیص حالات احساسی14
شکل3‑1. تشخیص احساس مبتنی بر مدلهای پویا و انعطاف پذیر20
شکل3‑2. تشخیص احساس مبتنی بر مدل نوارهای حاشیهای21
شکل3‑3. تشخیص احساس مبتنی بر مدل حرکت نقطه21
شکل3‑4. قابهای تعریف شده در مدل لبه-ویژگی22
شکل3‑5. مدل گراف personspotterو حذف پس زمینه22
شکل3‑6. تصویری از الگوریتم الگوی نسبت و الگوی نسبت مکانی23
شکل3‑7. کاربردی از الگوریتم الگوی نسبت و الگوی نسبت مکانی24
شکل3‑8. کدبندیهای مربوط به نواحی حرکتی چهره26
شکل3‑9. نمونهای از مدل درونیابی زمانی39
شکل3‑10. نرمال کردن چهره39
شکل3‑11. نمایش کلی از تشخیص حالات احساسی ظریف چهره به روش دورنیابی زمانی40
شکل3‑12. نمونهای از تصاویر پایگاه داده FERET41
شکل3‑13. نمونهای از تصاویر پایگاه داده Cohn-Kanade42
شکل3‑14. نمونهای از تصاویر پایگاه داده AR43
شکل3‑15. نمونهای از تصاویر پایگاه داده MMI44
شکل3‑16. نمونهای از تصاویر پایگاه داده JAFFE45
شکل3‑17. نمونهای از تصاویر پایگاه داده .BU-3DFE46
شکل3‑18. نمونهای از تصاویر پایگاه داده SMIC47
شکل4‑1. مؤلفههای اصلی در دادههای دو بعدی54
شکل5‑1. مثالی از چارچوب روش بزرگنمایی ویدئویی اولر جهت تجسم ضربان نبض انسان57
شکل5‑2. دیدگاهی از چارچوب بزرگنمایی ویدئویی اولر59
شکل5‑3. تأثیرات بزرگنمایی بر روی سیگنال یک بعدی61
شکل5‑4. بزرگنمایی نادرست حرکات به هنگام افزایش بیش از حد α63
شکل5‑5. رابطه بین فاکتور تقویت α و فرکانس مکانی63
شکل5‑6. نمونههایی از ویدئو که با استفاده از روش بزرگنمایی ویدئویی اولر ارزیابی شدهاند65
شکل5‑7. بزرگنمایی حرکت در یک دنباله از ویدئو از سایه خورشید66
شکل5‑8. به کارگیری روش بزرگنمایی ویدئویی اولر برای تقویت حرکات ظریف رگهای دست66
شکل5‑9. ادغام مکانی مناسب برای آشکارسازی سیگنالهای مورد نظر69
شکل6‑1. نمای کلی از تشخیص حالات احساسی ظریف چهره با استفاده از روش چهرههای ویژه78
شکل6‑2. نتیجه حاصل از اجرای روش بزرگنمایی ویدئویی اولر بر روی دنباله تصاویر80
شکل6‑3. نمودار حاصل از تشخیص تغییر چهره به هنگام بروز حالت منفی در دو مجموعه داده81
شکل6‑4. نمودار حاصل از تشخیص تغییر چهره به هنگام بروز حالت مثبت در دو مجموعه داده81
شکل6‑5. نمودار حاصل از تشخیص تغییر چهره به هنگام بروز حالت تعجب در دو مجموعه داده82
شکل6‑6. میانگین درصد تشخیص تغییر چهره به هنگام بروز سه حالت احساسی83
شکل6‑7. نمودار حاصل از عدم تشخیص تغییر چهره به هنگام بروز حالت منفی در دو مجموعه داده84
شکل6‑8. نمودار حاصل از عدم تشخیص تغییر چهره به هنگام بروز حالت مثبت در دو مجموعه داده.85
شکل6‑9. نمودار حاصل از عدم تشخیص تغییر چهره به هنگام بروز حالت تعجب در دو مجموعه داده..85
شکل6‑10. نمونهای از تشخیص دو حالت مثبت و منفی با به کارگیری روش بزرگنمایی ویدئویی اولر..88
فهرست علایم
|
نشانه |
علائم |
نشانه |
علائم |
|
فاکتور تقویت حرکت |
شدت تصویر در مکان x و زمانt |
I(x,t) |
|
|
طول موج قطع نویز |
S(r) |
مجموعه آموزش |
Γ |
|
فیلتر پایین گذر مکانی |
تصویر چهره iام از مجموعه آموزشی |
||
|
فیلترهای پایین گذر IIR |
تصویر ناشناخته |
||
|
فیلترهای پایین گذر IIR |
میانگین تصویر |
||
|
فیلتر پایین گذر مکانی |
ماتریس کواریانس |
C و |
|
|
فرکانس مکانی |
W |
کسر هر تصویر از میانگین تصاویر |
|
|
خطای روش بزرگنمایی لاگرانژى |
تصویر |
X |
|
|
خطای روش بزرگنمایی ویدئویی اولر |
ترانهاده ماتریس X |
||
|
سرعت فریم دوربین |
ماتریس تفاضل هر تصویر از میانگین تصاویر |
||
|
سیگنال حرکتی تصویر |
بردار ویژه |
u و V |
|
|
فیلتر زمانی |
مقدار ویژه |
و |
|
|
شعاع |
R |
چهره ویژه |
|
|
نویز در مکان x وزمانt |
وزن تصویرiام |
||
|
طرح حفظ محلیت |
LPP |
بردار وزنی برای تصویر iام |
|
|
تحلیل جداساز خطی |
LDA |
مقدار آستانه |
|
|
الگوی باینری محلی |
LBP |
احساسات ظریف غیر ارادی |
SMIC |
|
تابع پایه شعاعی |
RBF |
تشخیص حالات احساسی چهره |
FER |
|
پایگاه داده cohn-kanade |
CK |
واحد حرکتی |
AU |
|
حالات احساسی زنان ژاپنی |
JFFE |
سیستم کدبندی حرکات چهره |
FACS |
|
ماشین بردار پشتیبانی |
SVM |
تحلیل مؤلفههای اصلی |
PCA |
|
توزیع ویژگی سطح اولیه |
PSFD |
تحلیل اجزای مستقل |
ICA |
|
واحدهای پارامتری انیمیشنی چهره |
FAPUs |
نقاط مشخصه چهره |
FCP |
|
مدل شکل فعال |
ASM |
مجموعه فازی مفهومی |
CFS |
|
یادگیری هستهای چندگانه |
MKL |
روش C میانگین فازی |
FCM |
|
مدل درونیابی زمانی |
TIM |
آنتروپی نسبی |
KDL |
|
دوربین سرعت بالا |
HS |
الگوی باینری گابور محلی |
LGBP |
|
دوربین نزدیک مادون قرمز |
NIR |
دوربین معمولی دیداری |
VIS |
فصل اول
مقدمه
1-1 پیشگفتار
تشخیص تغییر یکی از تحقیقات جدید در حوزه پردازش تصویر و بینایی ماشین بوده و در طی سالهای اخیر روند رو به رشدی داشته است. تشخیص تغییر به صورت یک فرآیند تقسیمبندی زمانی است که در تصاویر و ویدئوییهایی که در طول زمانهای مختلف گرفته شدهاند، انجام میگیرد. تکنیکهای تشخیص تغییر در تصویر یک نقش اساسی در نظارت تصویری، تصویر برداری پزشکی، تصویر برداری زیر آب و نظارت بر ترافیک برای شناسایی خودکار اشیاء و اهداف در حال حرکت است. یکی از کاربردهای مهم در این زمینه، تشخیص تغییر در چهره به هنگام بروز احساس میباشد که نقش مهمی در ارتباطات بشر دارد. بنابراین تشخیص حالات احساسی چهره (FER[1]) نه تنها توسط بسیاری از محققان روانشناسی مورد مطالعه قرار گرفته است بلکه در زمینهای از علم کامپیوتر نیز مطرح شده است. دانشمندان کامپیوتر برای شناسایی و تشخیص حالات چهره واقعی انسان تلاشهای فراوانی انجام دادهاند.
حالات چهره نقش اساسی در ارتباطات کلامی و غیر کلامی و انتقال نظرات بین افراد بر عهده دارد. حالات چهره، بیانگر عمل و عکس العملهایی میباشدکه انسان نسبت به محیط اطراف خود بروز مینماید. شناسایی حالات چهره میتواند در بسیاری از زمینههای تحقیقاتی و کاربردی مفید باشد که از جمله آنها میتوان به لب خوانی، ویدئو کنفرانس، رباتیک، مطالعات روانشناسی و غیره اشاره کرد.
در شاخه رباتیک، رباتهای انسان نمایی مطرح میشوند که با کاربر در تعامل هستند و خود را با حالت روحی او تطبیق میدهند. همچنین در شاخه روانشناسی، آزمونهایی در زمینه درمانی طراحی گردیده است که با نشان دادن تصاویر به شخص بیمار، واکنشهای ایجاد شده در چهره وی بررسی شده و وضعیت روحی فرد تحلیل میشود. بحث شبیه سازی حالات احساسی چهره نیز در انیمیشنهای تصویری و کارتونی حائز اهمیت میباشد. این موارد و کاربردهای گوناگون دیگر منجر به تحقیقات متعددی در این زمینه گردیده است.
1-2 بیان مسئلهی تشخیص تغییر در تصویر
در این بخش ابتدا مسئلهی تشخیص تغییر به این صورت مطرح میشود هدف نهایی از تشخیص تغییر، شناسایی مجموعه پیکسلهای متصل به هم در یک فریم که با فریم بعدی متمایز میباشند. مجموعه پیکسلها، شامل ماسک تغییر هستند. هدف از این مسئله شناسایی این ماسک و بخشبندی پسزمینه میباشد.
این ماسک، ترکیبی از چند عامل اساسی، از جمله حرکت جسم نسبت به بیننده، تغییر شکل اشیاء و ظاهر آنها و ناپدید شدن اشیاء خواهد بود. همچنین اشیاء میتوانند با شدت نور متفاوت یا از نظر رنگ تغییر کنند. چالش اصلی این است که ماسک تغییر نباید شامل موارد نامعلوم و اشکال نادرست تغییر ناشی از حرکت دوربین، تغییرات نور و شرایط آب و هوایی باشد.
جهت تشخیص تغییر، M تصویر گرفته شده با دوربین در هر ثانیه به صورت نشان داده میشوند که هر پیکسل دارای مختصات و رنگ میباشد. مقادیرk و l وابسته به نوع تصویر است. به عنوان مثال برای تصاویر خاکستری و برای تصاویر RGB به کار میرود. همچنین برای تصاویر هوایی یا نظارت ماهوارهای و یا برای اطلاعات پزشکی یا بیولوژیکی در نظر گرفته میشود. تکنیک ریاضی تشخیص تغییر هر پیکسل برای تصویر ورودی به صورت زیر است"Chhabra et al., 2009"