دکترای پوست تخم‌مرغ Ùˆ مساله‌ی کمینه‌سازی تاسÙ‌ در انتخاب دوست‌دختر
نام‌اش را به خاطر ندارم. سال دوم راه‌نمایی بود. کلاس ØØ±ÙÙ‡ Ùˆ ÙÙ†. معلم تازه‌ای Ú©Ù‡ به جای آقای موثق (Ú©Ù‡ این هم ماجراها برای خود دارد) آمده بود. یادم نیست Ú†Ù‡ کاره بود. شاید پزشک یا چیزی در آن ØØ¯ÙˆØ¯. نام‌اش را نیز به خاطر نمی‌آورم. به نظرم جوان (یا میان‌سال) قد بلندی بود با اداهای خاص خودش. به نظرم آدم بدی نمی‌آمد. البته درست یادم نیست.
به هر ØØ§Ù„ …
به خاطر می‌آورم روزی داشت برای‌مان ØµØØ¨Øª می‌کرد Ú©Ù‡ علم چقدر تخصص‌ای است Ùˆ مردم روی مسایل خیلی جزیی‌ای کار می‌کنند Ùˆ از این ØØ±Ù‌ها. Ù…ÛŒâ€ŒÚ¯ÙØª یکی از دوستان‌اش (یا شاید هم یک بابایی به طور Ú©Ù„ÛŒ!) هست Ú©Ù‡ دکترای‌اش را روی پوست تخم مرغ Ú¯Ø±ÙØªÙ‡ است! باور کنید، همین را Ú¯ÙØª! Ùˆ باور نمی‌کنید Ú©Ù‡ ما چقدر خندیدیم. کلاس Ù…Ù†ÙØ¬Ø± شد. تاثیر این ØØ±Ù (Ùˆ میزان تخصص!)‌ آن‌قدر زیاد بود Ú©Ù‡ الان بعد از n سال (Ùˆ Ù…ØØ¶ اطلاع، n به طرز قابل قبول‌ای بیش از Ûµ سال است) هنوز آن شرایط را به خاطر دارم. دکترای پوست تخم مرغ؟! هه!
شما هم خندیدید؟ به نظرتان مسخره است که آدم برود دکترای‌اش را درباره‌ی پوست تخم مرغ بگیرد؟!
Ù…ØªØ§Ø³ÙØ§Ù†Ù‡ باید اعلام کنم Ú©Ù‡ اگر این روزها کس‌ای چنین چیزی به‌ام بگوید، ازش می‌پرسم راجع به Ú†Ù‡ چیز پوست تخم مرغ‌داری پژوهش می‌کنی. موضوع به آن کلی‌ای Ú©Ù‡ معنا ندارد!!!
دی‌شب در راه بازگشت به خانه داشتم Ùکر می‌کردم Ú©Ù‡ مساله‌ی زیر چقدر جالب است:
ÙØ±Ø¶ کنید دو تا دوست‌دختر دارید! هر کدام اخلاق خاص خودشان را دارند Ùˆ [طبیعتا] اخلاق‌شان خیلی بگیر نگیر دارد. بعضی وقت‌ها ØØ§Ù„‌شان خوب است Ùˆ سر Ú©ÛŒÙ‌اند Ùˆ ØØ³Ø§Ø¨ÛŒ شما را Ø®ÙˆØ´â€ŒØØ§Ù„ می‌کنند Ùˆ بعضی وقت‌ها ØØ§Ù„‌تان را می‌گیرند (خب، البته همه‌ی آدم‌ها این‌طوری نیستند. بعضی‌ها ØØªÙ…ا Ùˆ بدون تامل ØØ§Ù„‌تان را می‌گیرند. اندک موردی هم دیده شده است Ú©Ù‡ در بیش‌تر مواقع این‌کار را نمی‌کند. بگذریم …). شما دوست دارید بیش‌ترین لذت ممکن را از رابطه‌تان ببرید. در نتیجه به‌تر است با دختری دوست باشید Ú©Ù‡ به طور متوسط شما را بیش‌تر Ø®ÙˆØ´â€ŒØØ§Ù„ می‌کند.
اما مشکل این است Ú©Ù‡ شما نمی‌دانید کدام یک به‌تر است. بعضی وقت‌ها این به‌تر است، بعضی وقت‌ها آن. اما به هر ØØ§Ù„ یکی‌شان به طور متوسط به‌تر است Ú©Ù‡ البته شما نمی‌دانید کدام. کاری Ú©Ù‡ می‌توانید بکنید این است Ú©Ù‡ مدتی با این دوست باشید Ùˆ بعد ببینید به طور متوسط چقدر Ø®ÙˆØ´â€ŒØØ§Ù„ شده‌اید، بعد بروید سراغ دیگری Ùˆ ببینید به طور متوسط چقدر Ø®ÙˆØ´â€ŒØØ§Ù„ بوده‌اید Ùˆ در نهایت این دو متوسط را مقایسه کنید Ùˆ بعد از آن بچسبید به آن‌ای Ú©Ù‡ متوسط بالاتری دارد.
این روش یک عیب دارد. شما خیلی Ø±Ø§ØØª نمی‌توانید متوسط وضعیت شخص‌ای را خیلی Ø±Ø§ØØª در بیاورید. با دو سه تجربه نمی‌تواند نظری در مورد شخص داد. بیست تجربه چطور است؟ بد نیست، اما باز هم کاÙÛŒ نیست. در واقع همیشه Ø§ØØªÙ…ال خطا در قضاوت‌تان وجود دارد. پس نمی‌توان به صر٠چند تجربه‌ی به‌تر با یکی، دیگری را به Ú©Ù„ رد کرد چون ممکن است به طور Ø§ØªÙØ§Ù‚ÛŒ این چند نمونه تجربه با یکی به‌تر از دیگری در آمده باشد ولی واقعیت (متوسط واقعی!) برعکس باشد.
سوال این است: چطوری باید با دوست دخترهای‌تان قرار بگذارید تا در نهایت “اون به‌تره” را پیدا کنید؟ یا به عبارت دیگر، راه ØÙ„ با کم‌ترین تاس٠چیست؟ (regret minimization problem!)
البته این مساله کمینه در جوامع آکادمیک این‌قدر عملی Ù…Ø·Ø±Ø Ù†Ù…ÛŒâ€ŒØ´ÙˆØ¯. در واقع صورت اصلی‌ی این مساله به نام n-armed bandit معرو٠است Ùˆ هیچ ربطی به مسایل ناموسی ندارد. اما اساس هر دوی‌شان یکی است.
خب! همه‌ی این‌ها Ú©Ù‡ چه؟ آها! ملت سال‌ها است روی این مساله (Ùˆ تغییرات‌اش) کار کرده‌اند Ùˆ هنوز هم کار می‌کنند. در واقع Ùکر کنم بشود روی چنین مساله‌ای دکترا Ú¯Ø±ÙØª (البته طبیعتا با یک سری تغییرات). تازه به نظر شخصی‌ام (من معمولا نظرات‌ام شخصی‌اند!)ØŒ این مساله‌ی جالب‌ای است Ùˆ درباره‌اش کار کردن بامزه.
پوست٠تخم مرغ دیگر، نه؟!
29 thoughts on “دکترای پوست تخم‌مرغ Ùˆ مساله‌ی کمینه‌سازی تاسÙ‌ در انتخاب دوست‌دختر”
من Ùکر نمی کنم آدم ها تا این اندازه شبیه دستمال کاغذی باشند Ú©Ù‡ بتوانیم هر کدام شان را خواستیم تجربه کنیم Ùˆ بعد دور بیاندازیم. اگر این گونه باشد Ú©Ù‡ وجدان Ùˆ تعهد در یک رابطه ÛŒ دوستی بی ارزش Ù…ÛŒ شوند.
دوست دختر هم جز مسایل ناموسی است؟
به ری‌را: ØªÙØ³ÛŒØ± این مثال به دستمال کاغذی Ùˆ دور انداختن Ùˆ غیره به نظرم زیادی شدید Ùˆ تند است Ùˆ نه من از آن Ø§Ø³ØªÙØ§Ø¯Ù‡ کرده‌ام Ùˆ نه قصدم آن بوده است. شاید عبارت “تلاش برای شناخت” دقیق‌تر باشد. برای شناختن آدم‌ها Ùˆ پیداکردن مناسب‌ترین ÙØ±Ø¯ (شما Ú©Ù‡ منکر چنین لزومی نیستید؟) Ùˆ هم‌چنین ساختن رابطه‌ی دوستی نیاز به شناخت طر٠مقابل داریم. شناخت نیز با تجربه به دست می‌آید Ùˆ این تجربه خطاپذیر است. همه‌ی ØØ±Ù آن مثال در این است Ú©Ù‡ این مساله Ø±Ø§ØØª ØÙ„ نمی‌شود Ùˆ از نظر تئوری مساله‌ی دشواری است.
به آیدا: اممم … اگر ناموسی نباشد، شبه‌ناموسی Ú©Ù‡ هست!
Ùکر کنم داوطلبان کار Ùˆ تØÙ‚یق در این رشته زیاد باشند 🙂
ولی بدون شک پوست تخم مرغ نیست. اهمیت این موضوع را تعداد بیشتری درک میکنند.
پسران این مرز Ùˆ بوم این مقطع علمی رو به طور مادر زادی Ø§ØØªÙ…الا در دوران پر Ø§ÙØªØ®Ø§Ø± جنینی Ù…ÛŒ گذرانند :دی
آگاهان Ù…ÛŒ گویند برخی ØØªÛŒ ØªØ¨ØØ± خاصی در گزینش یک دوست دختر از بین 4 یا بیشتر را هم دارند.!
به شانه بسر: نمی‌دانم، اما Ùکر نکنم خیلی هم زیاد باشد. به هر ØØ§Ù„ این مساله پنجاه سال است درست Ùˆ ØØ³Ø§Ø¨ÛŒ ØÙ„ نشده. شاید مشکل این است Ú©Ù‡ کس‌ای این‌طوری Ú©Ù‡ من تعری٠کردم مساله را باز نمی‌کند! (;
به آهو: Ùکر نکنم خیلی به‌تر از بقیه‌ی پسران عالم باشند. بگذریم Ú©Ù‡ به هر ØØ§Ù„ دختران Ùˆ پسران با هم تکامل ÛŒØ§ÙØªÙ‡â€ŒØ§Ù†Ø¯ Ùˆ Ú©Ù… Ùˆ بیش از ابزارهای قابل مقایسه‌ای (ولی نه یک‌سان) برخوردارند.
این مسئله‌ی n-armed bandit Ú©Ù‡ اØÛŒØ§Ù†Ø§Ù‹ آن مسئله‌ی n-army معرو٠نیست؟ وقت‌داری یک‌کم درباره‌ی این مسئله بتوضیØÛŒØŸ
اممم… به نظرم هم مسئله را باید بیش‌تر باز کرد، هم به راه‌ØÙ„‌های دیگری Ú©Ù‡ متصور است Ùکر کرد. این تجربه تجربه‌ی خاصی است Ùˆ باید راه‌ØÙ„‌های آن در موارد Ù…Ø®ØªÙ„Ù ØªØ§ØØ¯ÙˆØ¯ÛŒ شخصی‌سازی شود. 🙂
how abt if u set the proposal topic to “regret minimization problem for finding the most energizer Partner, regardless the sex of the buddy”?
?then..would there be any scholarship or grant
if so, i’m the Volunteer
D:
fek konam khoshhal nashid age har 2 dokhtar ham gheire shoma pesare morede azmayeshi dashte bashand?che niazi be in kar ast vaghti mitoonid ba yeki be ham bezanid va ba dygray bemanid gozinesh oghada ham sakht nis,dokhtarha ham faghat baraye sargarm kardane shoma nistan ke haletoono khob konan in ye rabeteye ensanie rabeteye 2 adam va ba in taryf nemishe ke tarafetoon khoobe age haletoono khob kone!in toosyf bacheganas .az shoma entezare bishtar az in miraft.agar ravabetetoono bar in bana mizaryd ke taraf haletoono khob kone!khob haminam pish miad ke motevaset va average begyryd…!va natoonid entekhanb konid .agar az mozee khodkhahitoon biayn pain va bar mabnaye avatef bana bezaryd onvaght hich vaght sedaghat va rastyo ke mabnaye har rabeteyie kenar nemizaryd
به Ù…ØØ³Ù† مومنی: Ù…ØªØ§Ø³ÙØ§Ù†Ù‡ مساله‌ی n-army را نمی‌شناسم. در نتیجه نمی‌دانم همین است یا نه. اما n-armed bandit مساله‌ی معروÙ‌ای است Ùˆ Ø§ØØªÙ…الا معروÙ‌ترین نام به کار Ø±ÙØªÙ‡ برای این مساله.
این مساله این‌گونه تعری٠می‌شود:
قمارخانه‌ای را در نظر بگیرید Ú©Ù‡ در آن ماشین‌اش هست Ú©Ù‡ n دست‌گیره دارد. هر کدام از دست‌گیره‌ها را Ú©Ù‡ بکشید مقداری سود یا ضرر می‌کنید (یعنی یا Ú©Ù…ÛŒ پول به شما می‌دهد یا Ú©Ù…ÛŒ پول ازتان می‌خواهد). این مقدار تصادÙÛŒ است Ùˆ در طول زمان تغییر می‌کند. یعنی اگر یک دست‌گیره را دو بار بکشید، مقدار سود یا ضررتان یک‌سان نیست.
اینک ÙØ±Ø¶ کنیم Ú©Ù‡ متوسط سود (یا ضرر – اگر منÙÛŒ باشد) هر دست‌گیره مقدار ثابت‌ای است Ú©Ù‡ البته بر شما دانسته نیست (اما متوسط سود دست‌گیره‌های Ù…ØªÙØ§ÙˆØª یک‌سان نیستند). توجه کنید Ú©Ù‡ تنها متوسط ثابت است Ùˆ نه مقداری Ú©Ù‡ از هر بار کشیدن دست‌گیره به دست می‌آید.
ØØ§Ù„ هد٠این است Ú©Ù‡ دست‌گیره‌ها را طوری بکشید Ú©Ù‡ در نهایت بیش‌ترین سود ممکن را ببرید.
از آن‌جا که شما نمی‌دانید متوسط سود هر دست‌گیره چقدر است، پس باید سعی کنید تخمین‌ای از آن سود به دست آورید. اما توجه کنید که اگر خیلی بخواهید تخمین‌تان دقیق باشد، ممکن است سود ناشی از کشیدن دست‌گیره‌ی دیگری را که متوسط به‌تری دارد از دست بدهید. برعکس، اگر بخواهید دست‌گیره‌های دیگر را زیاد آزمایش کنید، تخمین‌تان دقت‌اش کم می‌شود و ممکن است دست‌گیره‌ای را که واقعا به‌تر است از دست بدهید.
این صورت‌ای از مساله است. مساله ÙØ±Ù…‌های دیگری هم دارد. مثلا متوسط سود هر دست‌گیره ثابت نیست اما توزیع تصادÙی‌ی هر دست‌گیره را می‌دانید (در واقع مشکل دیگر تخمین متوسط نیست، موضوع این است Ú©Ù‡ از کدام دست‌گیره باید Ø§Ø³ØªÙØ§Ø¯Ù‡ کنید). Ùˆ یا مثلا ØØ§Ù„ت‌ای Ú©Ù‡ سود هر دست‌گیره به پارامترهای دیگری هم بستگی دارد (مثلا وضعیت آب Ùˆ هوا!). Ùˆ ØØ§Ù„ت‌های دیگر …
به Rahil: شاید! به هر ØØ§Ù„ می‌شود تغییرش داد Ùˆ شاید هم هم‌چنان پول‌ای برای پرداخت باقی بماند. (;
به رکسانا:
Û±) Ù„Ø·ÙØ§ پاسخ‌ام به کامنت ری‌را را بخوانید. Ø§ØØªÙ…الا روشن‌گر است.
Û²) من به کس‌ای توصیه نکرده‌ام Ú©Ù‡ این‌گونه دوستان‌اش را پیدا کند. Ù„Ø·ÙØ§ به آن “ÙØ±Ø¶ کنید …” ابتدای پاراگرا٠مورد نظر دوباره توجه کنید. وقتی چنان چیزی ابتدای توصی٠چیزی می‌آید،‌ یک مساله با شرایط خاص٠خودش تعری٠می‌شود.
Û³) اگر به نوشته دقت کنید، من به کس‌ای توصیه نکرده‌ام این‌گونه زندگی کند، بلکه تنها یک شرایط خاص را -Ú©Ù‡ با عبارت “ÙØ±Ø¶ کنید …” توصی٠می‌شود- تØÙ„یل (Ùˆ البته تنها Ú©ÛŒÙÛŒ) کرده‌ام. تØÙ„یل شرایط معادل توصیه‌ی اخلاقی نیست.
Û´) معیار شما برای انتخاب یک ÙØ±Ø¯ چیست؟ چطوری به شناخت ÙØ±Ø¯ مقابل می‌رسید؟ روابط انسانی بدون صر٠وقت معنادار است؟ آن وقت صرÙ‌شده برای Ú†Ù‡ صر٠می‌شود؟ Ù„Ø·ÙØ§ ØªÙˆØ¶ÛŒØ Ø¯Ù‡ÛŒØ¯.
Ûµ) این‌که شما به این نتیجه رسیده‌اید Ú©Ù‡ من از موضع خودخواهی به این نتایج رسیده‌ام اشتباه است. گویا Ù…ØªØ§Ø³ÙØ§Ù†Ù‡ نتوانسته‌ام در این نوشته منظور خودم را به درستی برسانم (Ùˆ منظورم تنها چیزی Ú©Ù‡ نبود، توصیه‌ی اخلاقی برای روابط صØÛŒØ انسانی بود).
Û¶) Ù„Ø·ÙØ§ پنگلیش کامنت نگذارید. خواندن‌اش سخت است – مخصوصا وقتی راست‌چین نشان داده می‌شود.
Ú†Ù‡ بسیار جالب بود! سولو به نظرم برای اجتناب از تداوم دعواهای جنسیتی، بی خیال Ù¾ÛŒØ´Ø±ÙØª علم شو Ùˆ بگذار ملت کارشان را بکنند Ùˆ Ù…ØÙ‚قان هم با همان قمارخانه خودشان سرگرم باشند Ø›)
من یکی Ú©Ù‡ سرم گیج Ø±ÙØª!!!
میگم انقدر تجزیه تØÙ„یل کردن زیاد هم خوب نیست ها از من Ú¯ÙØªÙ† بود.
به ØÙ…یدرضا: شاید برای همین است Ú©Ù‡ می‌گویند پژوهش در ایران نهادین نیست! از یک طر٠که بروی به قبای دین برمی‌خورد، از طر٠دیگر به قبای سنت، از طر٠دیگر نیز به روابط انسانی توهین می‌شود Ùˆ طر٠نهایی نیز اوستا-کار مکانیک یا برق‌کار به‌اش برمی‌خورد اگر بگویی دست‌گاه‌ای Ú©Ù‡ می‌سازی کج است. (البته این ØØ±Ù‌ام Ú©Ù…ÛŒ شوخی بود!).
به بی‌تا: من‌ام شنیده بودم چنین چیزی را. می‌گویند در مورد عشق Ùˆ این ØØ±Ù‌ها به‌تر است زیاد به معشوق Ùکر Ù†Ú©Ù†ÛŒ (البته دلیل‌اش را معمولا نمی‌گویند). به هر ØØ§Ù„ چشم … ! (;
خوب امیر مسعود جان اون یکم ÙØ±Ø¢ÛŒÙ†Ø¯ÛŒ Ú©Ù‡ با هم از دکتر نادر یاد Ú¯Ø±ÙØªÛŒÙ… Ù…ÛŒ Ú¯ÙØª اگر سیگنالت یقینی یا دترمینیستیک!! نباشه نمی تونی ممان هاشو ثابت ÙØ± ض Ú©Ù†ÛŒ.در مورد دخترها ( یا پسر ها!! بهشون بر نخوره) Ùˆ کلا انسان ها Ú©Ù‡ یکمی زیادی غیر یقینی هستن نمیشه میانگینشون (تازه رو ØØ³Ø§Ø¨ کرد Ù…Ú¯Ù‡ اینکه مشاهداتت بی نهایت باشه Ú©Ù‡ اونم امکان پذیر نیست Ùکر کنم برای همینه Ú©Ù‡ از درس ÙØ±Ø¢ÛŒÙ†Ø¯ ها تصادÙÛŒ هم سخت ترن.
به Ù…ØÙ…د: لازمه‌اش یقینی‌بودن سیگنال نیست. سیگنال اگر غیرایستا (non-stationary) باشد نمی‌توان ممان‌های‌اش را ثابت ÙØ±Ø¶ کرد، وگرنه ÙØ±Ø¶ stationary بودن (یا wide-sense stationary) کاÙÛŒ است والبته ÙØ±Ø¶ غیرمعمول‌ای هم نیست.
اما ØØ±Ù‌ات درست است. دنیای واقعی معمولا پیچیده‌تر از مدل‌هایی است Ú©Ù‡ علم با آن سر Ùˆ کار دارد. مدل‌ها ساده‌ترند Ùˆ در نتیجه دقت‌شان کم‌تر است. اما از طر٠دیگر ممکن است اگر شانس داشته باشیم قابل تØÙ„یل باشند Ùˆ بتوانیم چیزهایی در موردشان بگوییم. آن وقت می‌توانیم با تقریب در مورد دنیای واقعی نیز ØØ±Ù بزنیم.
به هر ØØ§Ù„ کار دیگری نمی‌شود کرد. به‌ترین وسیله‌ای Ú©Ù‡ در اختیار داریم همین علم است – Ú©Ù‡ البته بعضی وقت‌ها هم بد جواب نمی‌دهد (مثلا Ùیزیک نیوتونی دقیق نیست، اما با آن می‌توانیم هواپیما بسازیم. یا مدل‌های مداری استاندارد، سیگنال را به صورت موج در نظر نمی‌گیرد اما باز هم می‌توان بسیاری از مدارات الکترونیک را با Ø§Ø³ØªÙØ§Ø¯Ù‡ از همان مدل‌ها تØÙ„یل کرد Ùˆ برای بچه‌ها اسباب‌بازی ساخت!).
آها … تا یادم Ù†Ø±ÙØªÙ‡ بگویم برای این مساله‌ی banditØŒ اگر مدل Ø§ØØªÙ…الی را بدانیم (در واقع joint distribution) دیگر لازم نیست ÙØ±Ø¶â€ŒØ§ÛŒ مثل iid بودن بکنیم. یعنی با دانستن joint distribution هم مساله قابل ØÙ„ است.
از مدل‌های ما است. در واقع کاربرد مدل‌ها هم همین است Ú©Ù‡ دنیای واقعی را با تقریب توصی٠کنند. تقریب‌ای Ú©Ù‡ دقت را Ú©Ù… می‌کند اما در عوض مساله را تا ØØ¯ÛŒ ساده می‌کند Ú©Ù‡ بتوان در موردش چیزی Ú¯ÙØª.
به سولوژن(!): Ùکر کنم معروÙ‌ترین اسم به کار Ø±ÙØªÙ‡â€Œ در مورد این مسئله multi-armed bandit باشه.
Ùˆ در ضمن دقت Ú©Ù† Ú©Ù‡ تمام ایده‌هایی‌ Ú©Ù‡ ØØ¯Ø§Ù‚Ù„ من می‌شناسم در باره‌ی این مسئله، یه ÙØ±Ø¶ اساسی در باره‌ی infinite horizon بودن دارند Ú©Ù‡ Ø®ÙØ¨…خیلی با چند سال ÙØ±Ù‚ داره، ØØªÛŒ از دیدگاه مهندسی.
یعنی اصولا وقتی زمان explore کردن‌ت قابل صر٠نظر در برابر زمان exploit کردن‌ت نیست، Ùˆ تازه معمولا راه برگشتی هم -معمولا- وجود نداره، Ùکر کنم خیلی راه نامعقول‌تری نباشه سراغ مثلا اونی Ø±ÙØªÙ† Ú©Ù‡ از اسمش بیشتر خوشم می‌اد‌. وقتی Ú©Ù‡ این همه مقایسه‌شون سخت‌ه Ú©Ù‡ مجبوری با Ú©Ù„ÛŒ Ø§Ø±ÙØ§Ù‚ با multiarmed bandit مدل‌ش کنی، شاید بهتر باشه Ú©Ù‡ انتخاب Ú©Ù†ÛŒ.
اصولا زØÙ…ت برای بالا بردن دقت از یه جایی به طور ÙˆØØ´ØªÙ†Ø§Ú©ÛŒ با شیب تندی می‌ره بالا (اگه اصولا از یه ØØ¯ÛŒ بتونه بالاتر بره).
Ùˆ Ø®ÙØ¨…طبعا همه‌ی این ØØ±Ùا در مورد یه مسئله‌ی انسانی‌ه، Ùˆ الا Ú©Ù‡ خود مسئله‌ی اصلی رو یه بار Ú©Ù‡ Ø±ÙØªÛŒÙ… لاس‌وگاس(!!) با تمام پس‌اندازمون – اعم از ارز(â€!) Ùˆ دانش‌ (!!!) – به طور کاملا اکسپریمنتال ØÙ„ می‌کنیم :دی
مسائلی مثل k-armed bandit Ùˆ البته مسائلی مثل مساله ÛŒØ§ÙØªÙ† دوست دختر بهینه تا زمانی جالب به نظر Ù…ÛŒ رسند Ú©Ù‡ خواص Ù…ØÛŒØ·ÛŒ Ú©Ù‡ پسر داستان ما در اون قرار داره (Ù…ØÛŒØ· در اینجا Ùقط شامل دو دختر میشه) با گذشت زمان تغییر نکنه Ùˆ به Ø§ØµØ·Ù„Ø§Ø stationary باشه. اما اگر سایر agent های Ù…ØÛŒØ· (دخترها) خاصیت یادگیری Ùˆ تطبیق داشته باشن اونوقت ما به روشهای یادگیری نیاز داریم Ú©Ù‡ هیچ وقت متوق٠نشن. یعنی یه جورایی همیشه باشد در ØØ§Ù„ یادگیری باشیم. مثلا اگر بعد از n مرØÙ„Ù‡ به این نتیجه رسیدیم Ú©Ù‡ دختر A دختر بهینه است، ممکن است Ø±ÙØªØ§Ø± ما با دختر B باعث بشه Ú©Ù‡ بهد از گذشت مدت زمانی دختر B بهینه بشه! پس الگوریتم یادگیری هیچ وقت نباید متوق٠بشه. اما سوال اینجاست Ú©Ù‡ در این صورت مساله exploration vs. exploitation را در یک Ù…ØÛŒØ· non-stationary Ú†Ù‡ جوری handle کنیم؟
you`ve forgotten very important point.Your mood.its just you, and what are you looking for ,in a moment
آره درست میگی ایستا بودن برای پیدا کردن ممان کاÙیه 🙂 ولی Ùکر نکنم آدما ایستا هم باشن :))
ضمنا اگر joint distribution رو داشتیم Ú©Ù‡ دیگه خیلی وضعمون خوب بود. کلا این نگاه خیلی خنده داره Ùˆ این مساله پیچیده تر از اونیه Ú©Ù‡ با این Ù…ØØ§Ø³Ø¨Ø§Øª قابل ØÙ„ باشه. البته الگوریتم های هوشمند بیولوژیکی مثل اون چیزایی Ú©Ù‡ خودمون باهاش Ùکر Ù…ÛŒ کنیم از پسش بر میان ولی نه همیشه 😉
From UTS sessions: “never choose a contraversial example to exaplain something of non-controversial nature. People will miss the point!”
عجب Ø¨ØØ« جالب توجهی بوده Ùˆ من غاÙÙ„ بودم. یه Ú©Ù… مثال ها رو عوض Ù…ÛŒ کردین هم به جایی بر نمی خورد . نه؟ مثلا یه تجدید نظر در جنس مثال ها خیال خیلی ها رو Ø±Ø§ØØª Ù…ÛŒ کرد.
Ay Polygamist
this is actually an interesting variant of the multi-armed bandit problem, since there’s a cost associated to switching! let’s say, you’re allowed to get back to a girl at most k times; what’s the optimal algorithm in this case?
به آرش: بله! multi-armed bandit نام معروÙ‌تری است از n-armed Ùˆ … . در مورد نوع ساختار نتایج باید بگویم Ú©Ù‡ روش‌ای Ú©Ù‡ به طور ضمنی اشاره کردم، نتیجه‌اش asymptotical نیست، بلکه finite-sample است. در واقع کران‌ای برای regret می‌دهد Ú©Ù‡ Ø®ÙˆØ´â€ŒÙØ±Ù… است Ùˆ اگر اشتباه نکنم، ÙØ±Ù… کران‌اش بهینه است (Ùˆ البته نه الزاما ثابت‌های‌اش). به طور مشخص‌تر منظورم الگوریتم UCB1 است Ùˆ مقاله‌ی Auer.
به آرش دیگر: بله! ØØ±Ù‌تان کاملا درست است. در این‌جا ÙØ±Ø¶ شده است Ú©Ù‡ توزیع پاداش iid است. هدÙ‌ام از این مثال توصیه‌ی یک راه‌ØÙ„ برای یک مساله‌ی واقعی نبود، بلکه نشان‌دادن این‌که یک مساله‌ی ریز چقدر می‌تواند جزییات داشته باشد بود Ùˆ البته Ú©Ù…ÛŒ شوخی‌کردن. یک مساله‌ی دیگری Ú©Ù‡ این وسط اهمیت دارد (جدا از non-stationary بودن یا adversarial بودن طر٠مقابل (Ú©Ù‡ البته دومی به Ø§ØØªÙ…ال زیاد اولی را نتیجه می‌دهد)ØŒ این است Ú©Ù‡ هیچ Ù…Ùهوم ØØ§Ù„ت‌ای در نظر Ù†Ú¯Ø±ÙØªÙ‡â€ŒØ§Ù…. انسان‌ها در شرایط مختل٠یک‌جور Ø±ÙØªØ§Ø± نمی‌کنند.
به zita: بله! در نظر Ù†Ú¯Ø±ÙØªÙ‡â€ŒØ§Ù…. به توضیØâ€ŒØ§ÛŒ Ú©Ù‡ به “آرش دیگر” داده‌ام مراجعه کنید.
به Ù…ØÙ…د: Ùˆ البته باز هم مساله‌ی ساده‌ای نبود. اما یک سوال اساسی برای‌ام پیش می‌آید: منظورت از الگوریتم‌های هوش‌مند بیولوژیکی چیست Ùˆ چرا آن‌ها می‌توانند از پس این جور سوال‌ها (ØØ¯Ø§Ù‚Ù„ بعضی وقت‌ها) بر بیاید؟ آیا آن‌ها از ریاضی‌ی دیگری Ø§Ø³ØªÙØ§Ø¯Ù‡ می‌کنند؟
به آزاد: آن توصیه بستگی دارد به هد٠شخص.
به “از زندگی”: سعی می‌کنم Ø¯ÙØ¹Ù‡â€ŒÛŒ بعد برعکس بنویسم Ú©Ù‡ عدالت در مجموع وبلاگ رعایت شده باشد.
به یکی از Ú†Ù‡Ø§Ø±Ù†ÙØ±: نه! نیستم!
به Ù…ØÙ…د: جالب شد! دقیقا Ú†Ù‡ چیزهایی را می‌دانیم؟ می‌دانیم Ú©Ù‡ توزیع پاداش هر کدام iid است، ولی توزیع را نمی‌شناسیم. در ضمن هر بار تعویض انتخاب یک بازو باعث Ø¯Ø±ÛŒØ§ÙØª هزینه‌ی ثابت‌ای می‌شود. هد٠هم بیشینه‌کردن پاداش متوسط (با اÙÙ‚ بی‌نهایت) است. درست Ùهمیده‌ام؟ (چون بیشینه k بار Ø§Ø³ØªÙØ§Ø¯Ù‡ کردن هر بازو Ú©Ù…ÛŒ مساله را به نظرم عجیب می‌کند در ØØ§Ù„ت اÙÙ‚ Ù†Ø§Ù…ØØ¯ÙˆØ¯ Ùˆ پاداش متوسط. اگر پاداش discounted باشد یا اÙÙ‚ Ù…ØØ¯ÙˆØ¯ باشد (مثلا به M ØØ±Ú©Øª) برای‌ام قابل Ùهم است.)
مرسي! از اين كه مراعات عدالت را مي كنيد سپاسگزارم
سلااااااااااااااااااااااااااااااااااااااااااااااااااااااااااااام
كسي با من رÙيق ميشه
همه مثال ها رو خوندم Ùˆ خیلی جالب بود ØŒ اما در آخر ØÙ‚ با اون دوستمونه Ú©Ù‡ Ú¯ÙØªÙ‡ هوش بیولوژیکی خیلی بهتر Ùˆ سریعتر از پس این مسدله بخصوص ( کمینگی تاس٠در انتخاب دوست دختر / پسر ) بر میاد .
یکی از دلایلش اینه Ú©Ù‡ همونطور Ú©Ù‡ سولوين Ú¯ÙØªÙ‡ مدل ها همه واقعیت نیستند .
در این مورد بخصوص توصیه من اینه Ú©Ù‡ جز اونایی Ú©Ù‡ در این زمینه متخصصن بقیه به همون هوش بیولوژیکی خودشون Ø§Ú©ØªÙØ§ کنن .