دکترای پوست تخم‌مرغ Ùˆ مساله‌ی کمینه‌سازی تاسÙ‌ در انتخاب دوست‌دختر
نام‌اش را به خاطر ندارم. سال دوم راه‌نمایی بود. کلاس ØرÙÙ‡ Ùˆ ÙÙ†. معلم تازه‌ای Ú©Ù‡ به جای آقای موثق (Ú©Ù‡ این هم ماجراها برای خود دارد) آمده بود. یادم نیست Ú†Ù‡ کاره بود. شاید پزشک یا چیزی در آن Øدود. نام‌اش را نیز به خاطر نمی‌آورم. به نظرم جوان (یا میان‌سال) قد بلندی بود با اداهای خاص خودش. به نظرم آدم بدی نمی‌آمد. البته درست یادم نیست.
به هر Øال …
به خاطر می‌آورم روزی داشت برای‌مان صØبت می‌کرد Ú©Ù‡ علم چقدر تخصص‌ای است Ùˆ مردم روی مسایل خیلی جزیی‌ای کار می‌کنند Ùˆ از این ØرÙ‌ها. می‌گÙت یکی از دوستان‌اش (یا شاید هم یک بابایی به طور Ú©Ù„ÛŒ!) هست Ú©Ù‡ دکترای‌اش را روی پوست تخم مرغ گرÙته است! باور کنید، همین را Ú¯Ùت! Ùˆ باور نمی‌کنید Ú©Ù‡ ما چقدر خندیدیم. کلاس منÙجر شد. تاثیر این Øر٠(Ùˆ میزان تخصص!)‌ آن‌قدر زیاد بود Ú©Ù‡ الان بعد از n سال (Ùˆ Ù…Øض اطلاع، n به طرز قابل قبول‌ای بیش از Ûµ سال است) هنوز آن شرایط را به خاطر دارم. دکترای پوست تخم مرغ؟! هه!
شما هم خندیدید؟ به نظرتان مسخره است که آدم برود دکترای‌اش را درباره‌ی پوست تخم مرغ بگیرد؟!
متاسÙانه باید اعلام کنم Ú©Ù‡ اگر این روزها کس‌ای چنین چیزی به‌ام بگوید، ازش می‌پرسم راجع به Ú†Ù‡ چیز پوست تخم مرغ‌داری پژوهش می‌کنی. موضوع به آن کلی‌ای Ú©Ù‡ معنا ندارد!!!
دی‌شب در راه بازگشت به خانه داشتم Ùکر می‌کردم Ú©Ù‡ مساله‌ی زیر چقدر جالب است:
Ùرض کنید دو تا دوست‌دختر دارید! هر کدام اخلاق خاص خودشان را دارند Ùˆ [طبیعتا] اخلاق‌شان خیلی بگیر نگیر دارد. بعضی وقت‌ها Øال‌شان خوب است Ùˆ سر Ú©ÛŒÙ‌اند Ùˆ Øسابی شما را خوش‌Øال می‌کنند Ùˆ بعضی وقت‌ها Øال‌تان را می‌گیرند (خب، البته همه‌ی آدم‌ها این‌طوری نیستند. بعضی‌ها Øتما Ùˆ بدون تامل Øال‌تان را می‌گیرند. اندک موردی هم دیده شده است Ú©Ù‡ در بیش‌تر مواقع این‌کار را نمی‌کند. بگذریم …). شما دوست دارید بیش‌ترین لذت ممکن را از رابطه‌تان ببرید. در نتیجه به‌تر است با دختری دوست باشید Ú©Ù‡ به طور متوسط شما را بیش‌تر خوش‌Øال می‌کند.
اما مشکل این است Ú©Ù‡ شما نمی‌دانید کدام یک به‌تر است. بعضی وقت‌ها این به‌تر است، بعضی وقت‌ها آن. اما به هر Øال یکی‌شان به طور متوسط به‌تر است Ú©Ù‡ البته شما نمی‌دانید کدام. کاری Ú©Ù‡ می‌توانید بکنید این است Ú©Ù‡ مدتی با این دوست باشید Ùˆ بعد ببینید به طور متوسط چقدر خوش‌Øال شده‌اید، بعد بروید سراغ دیگری Ùˆ ببینید به طور متوسط چقدر خوش‌Øال بوده‌اید Ùˆ در نهایت این دو متوسط را مقایسه کنید Ùˆ بعد از آن بچسبید به آن‌ای Ú©Ù‡ متوسط بالاتری دارد.
این روش یک عیب دارد. شما خیلی راØت نمی‌توانید متوسط وضعیت شخص‌ای را خیلی راØت در بیاورید. با دو سه تجربه نمی‌تواند نظری در مورد شخص داد. بیست تجربه چطور است؟ بد نیست، اما باز هم کاÙÛŒ نیست. در واقع همیشه اØتمال خطا در قضاوت‌تان وجود دارد. پس نمی‌توان به صر٠چند تجربه‌ی به‌تر با یکی، دیگری را به Ú©Ù„ رد کرد چون ممکن است به طور اتÙاقی این چند نمونه تجربه با یکی به‌تر از دیگری در آمده باشد ولی واقعیت (متوسط واقعی!) برعکس باشد.
سوال این است: چطوری باید با دوست دخترهای‌تان قرار بگذارید تا در نهایت “اون به‌تره” را پیدا کنید؟ یا به عبارت دیگر، راه ØÙ„ با کم‌ترین تاس٠چیست؟ (regret minimization problem!)
البته این مساله کمینه در جوامع آکادمیک این‌قدر عملی Ù…Ø·Ø±Ø Ù†Ù…ÛŒâ€ŒØ´ÙˆØ¯. در واقع صورت اصلی‌ی این مساله به نام n-armed bandit معرو٠است Ùˆ هیچ ربطی به مسایل ناموسی ندارد. اما اساس هر دوی‌شان یکی است.
خب! همه‌ی این‌ها Ú©Ù‡ چه؟ آها! ملت سال‌ها است روی این مساله (Ùˆ تغییرات‌اش) کار کرده‌اند Ùˆ هنوز هم کار می‌کنند. در واقع Ùکر کنم بشود روی چنین مساله‌ای دکترا گرÙت (البته طبیعتا با یک سری تغییرات). تازه به نظر شخصی‌ام (من معمولا نظرات‌ام شخصی‌اند!)ØŒ این مساله‌ی جالب‌ای است Ùˆ درباره‌اش کار کردن بامزه.
پوست٠تخم مرغ دیگر، نه؟!
29 thoughts on “دکترای پوست تخم‌مرغ Ùˆ مساله‌ی کمینه‌سازی تاسÙ‌ در انتخاب دوست‌دختر”
من Ùکر نمی کنم آدم ها تا این اندازه شبیه دستمال کاغذی باشند Ú©Ù‡ بتوانیم هر کدام شان را خواستیم تجربه کنیم Ùˆ بعد دور بیاندازیم. اگر این گونه باشد Ú©Ù‡ وجدان Ùˆ تعهد در یک رابطه ÛŒ دوستی بی ارزش Ù…ÛŒ شوند.
دوست دختر هم جز مسایل ناموسی است؟
به ری‌را: تÙسیر این مثال به دستمال کاغذی Ùˆ دور انداختن Ùˆ غیره به نظرم زیادی شدید Ùˆ تند است Ùˆ نه من از آن استÙاده کرده‌ام Ùˆ نه قصدم آن بوده است. شاید عبارت “تلاش برای شناخت” دقیق‌تر باشد. برای شناختن آدم‌ها Ùˆ پیداکردن مناسب‌ترین Ùرد (شما Ú©Ù‡ منکر چنین لزومی نیستید؟) Ùˆ هم‌چنین ساختن رابطه‌ی دوستی نیاز به شناخت طر٠مقابل داریم. شناخت نیز با تجربه به دست می‌آید Ùˆ این تجربه خطاپذیر است. همه‌ی Øر٠آن مثال در این است Ú©Ù‡ این مساله راØت ØÙ„ نمی‌شود Ùˆ از نظر تئوری مساله‌ی دشواری است.
به آیدا: اممم … اگر ناموسی نباشد، شبه‌ناموسی Ú©Ù‡ هست!
Ùکر کنم داوطلبان کار Ùˆ تØقیق در این رشته زیاد باشند 🙂
ولی بدون شک پوست تخم مرغ نیست. اهمیت این موضوع را تعداد بیشتری درک میکنند.
پسران این مرز Ùˆ بوم این مقطع علمی رو به طور مادر زادی اØتمالا در دوران پر اÙتخار جنینی Ù…ÛŒ گذرانند :دی
آگاهان Ù…ÛŒ گویند برخی Øتی تبØر خاصی در گزینش یک دوست دختر از بین 4 یا بیشتر را هم دارند.!
به شانه بسر: نمی‌دانم، اما Ùکر نکنم خیلی هم زیاد باشد. به هر Øال این مساله پنجاه سال است درست Ùˆ Øسابی ØÙ„ نشده. شاید مشکل این است Ú©Ù‡ کس‌ای این‌طوری Ú©Ù‡ من تعری٠کردم مساله را باز نمی‌کند! (;
به آهو: Ùکر نکنم خیلی به‌تر از بقیه‌ی پسران عالم باشند. بگذریم Ú©Ù‡ به هر Øال دختران Ùˆ پسران با هم تکامل یاÙته‌اند Ùˆ Ú©Ù… Ùˆ بیش از ابزارهای قابل مقایسه‌ای (ولی نه یک‌سان) برخوردارند.
این مسئله‌ی n-armed bandit Ú©Ù‡ اØیاناً آن مسئله‌ی n-army معرو٠نیست؟ وقت‌داری یک‌کم درباره‌ی این مسئله بتوضیØی؟
اممم… به نظرم هم مسئله را باید بیش‌تر باز کرد، هم به راه‌Øل‌های دیگری Ú©Ù‡ متصور است Ùکر کرد. این تجربه تجربه‌ی خاصی است Ùˆ باید راه‌Øل‌های آن در موارد مختل٠تاØدودی شخصی‌سازی شود. 🙂
how abt if u set the proposal topic to “regret minimization problem for finding the most energizer Partner, regardless the sex of the buddy”?
?then..would there be any scholarship or grant
if so, i’m the Volunteer
D:
fek konam khoshhal nashid age har 2 dokhtar ham gheire shoma pesare morede azmayeshi dashte bashand?che niazi be in kar ast vaghti mitoonid ba yeki be ham bezanid va ba dygray bemanid gozinesh oghada ham sakht nis,dokhtarha ham faghat baraye sargarm kardane shoma nistan ke haletoono khob konan in ye rabeteye ensanie rabeteye 2 adam va ba in taryf nemishe ke tarafetoon khoobe age haletoono khob kone!in toosyf bacheganas .az shoma entezare bishtar az in miraft.agar ravabetetoono bar in bana mizaryd ke taraf haletoono khob kone!khob haminam pish miad ke motevaset va average begyryd…!va natoonid entekhanb konid .agar az mozee khodkhahitoon biayn pain va bar mabnaye avatef bana bezaryd onvaght hich vaght sedaghat va rastyo ke mabnaye har rabeteyie kenar nemizaryd
به Ù…Øسن مومنی: متاسÙانه مساله‌ی n-army را نمی‌شناسم. در نتیجه نمی‌دانم همین است یا نه. اما n-armed bandit مساله‌ی معروÙ‌ای است Ùˆ اØتمالا معروÙ‌ترین نام به کار رÙته برای این مساله.
این مساله این‌گونه تعری٠می‌شود:
قمارخانه‌ای را در نظر بگیرید Ú©Ù‡ در آن ماشین‌اش هست Ú©Ù‡ n دست‌گیره دارد. هر کدام از دست‌گیره‌ها را Ú©Ù‡ بکشید مقداری سود یا ضرر می‌کنید (یعنی یا Ú©Ù…ÛŒ پول به شما می‌دهد یا Ú©Ù…ÛŒ پول ازتان می‌خواهد). این مقدار تصادÙÛŒ است Ùˆ در طول زمان تغییر می‌کند. یعنی اگر یک دست‌گیره را دو بار بکشید، مقدار سود یا ضررتان یک‌سان نیست.
اینک Ùرض کنیم Ú©Ù‡ متوسط سود (یا ضرر – اگر منÙÛŒ باشد) هر دست‌گیره مقدار ثابت‌ای است Ú©Ù‡ البته بر شما دانسته نیست (اما متوسط سود دست‌گیره‌های متÙاوت یک‌سان نیستند). توجه کنید Ú©Ù‡ تنها متوسط ثابت است Ùˆ نه مقداری Ú©Ù‡ از هر بار کشیدن دست‌گیره به دست می‌آید.
Øال هد٠این است Ú©Ù‡ دست‌گیره‌ها را طوری بکشید Ú©Ù‡ در نهایت بیش‌ترین سود ممکن را ببرید.
از آن‌جا که شما نمی‌دانید متوسط سود هر دست‌گیره چقدر است، پس باید سعی کنید تخمین‌ای از آن سود به دست آورید. اما توجه کنید که اگر خیلی بخواهید تخمین‌تان دقیق باشد، ممکن است سود ناشی از کشیدن دست‌گیره‌ی دیگری را که متوسط به‌تری دارد از دست بدهید. برعکس، اگر بخواهید دست‌گیره‌های دیگر را زیاد آزمایش کنید، تخمین‌تان دقت‌اش کم می‌شود و ممکن است دست‌گیره‌ای را که واقعا به‌تر است از دست بدهید.
این صورت‌ای از مساله است. مساله Ùرم‌های دیگری هم دارد. مثلا متوسط سود هر دست‌گیره ثابت نیست اما توزیع تصادÙی‌ی هر دست‌گیره را می‌دانید (در واقع مشکل دیگر تخمین متوسط نیست، موضوع این است Ú©Ù‡ از کدام دست‌گیره باید استÙاده کنید). Ùˆ یا مثلا Øالت‌ای Ú©Ù‡ سود هر دست‌گیره به پارامترهای دیگری هم بستگی دارد (مثلا وضعیت آب Ùˆ هوا!). Ùˆ Øالت‌های دیگر …
به Rahil: شاید! به هر Øال می‌شود تغییرش داد Ùˆ شاید هم هم‌چنان پول‌ای برای پرداخت باقی بماند. (;
به رکسانا:
Û±) لطÙا پاسخ‌ام به کامنت ری‌را را بخوانید. اØتمالا روشن‌گر است.
Û²) من به کس‌ای توصیه نکرده‌ام Ú©Ù‡ این‌گونه دوستان‌اش را پیدا کند. لطÙا به آن “Ùرض کنید …” ابتدای پاراگرا٠مورد نظر دوباره توجه کنید. وقتی چنان چیزی ابتدای توصی٠چیزی می‌آید،‌ یک مساله با شرایط خاص٠خودش تعری٠می‌شود.
Û³) اگر به نوشته دقت کنید، من به کس‌ای توصیه نکرده‌ام این‌گونه زندگی کند، بلکه تنها یک شرایط خاص را -Ú©Ù‡ با عبارت “Ùرض کنید …” توصی٠می‌شود- تØلیل (Ùˆ البته تنها Ú©ÛŒÙÛŒ) کرده‌ام. تØلیل شرایط معادل توصیه‌ی اخلاقی نیست.
Û´) معیار شما برای انتخاب یک Ùرد چیست؟ چطوری به شناخت Ùرد مقابل می‌رسید؟ روابط انسانی بدون صر٠وقت معنادار است؟ آن وقت صرÙ‌شده برای Ú†Ù‡ صر٠می‌شود؟ لطÙا ØªÙˆØ¶ÛŒØ Ø¯Ù‡ÛŒØ¯.
Ûµ) این‌که شما به این نتیجه رسیده‌اید Ú©Ù‡ من از موضع خودخواهی به این نتایج رسیده‌ام اشتباه است. گویا متاسÙانه نتوانسته‌ام در این نوشته منظور خودم را به درستی برسانم (Ùˆ منظورم تنها چیزی Ú©Ù‡ نبود، توصیه‌ی اخلاقی برای روابط صØÛŒØ Ø§Ù†Ø³Ø§Ù†ÛŒ بود).
Û¶) لطÙا پنگلیش کامنت نگذارید. خواندن‌اش سخت است – مخصوصا وقتی راست‌چین نشان داده می‌شود.
Ú†Ù‡ بسیار جالب بود! سولو به نظرم برای اجتناب از تداوم دعواهای جنسیتی، بی خیال پیشرÙت علم شو Ùˆ بگذار ملت کارشان را بکنند Ùˆ Ù…Øققان هم با همان قمارخانه خودشان سرگرم باشند Ø›)
من یکی Ú©Ù‡ سرم گیج رÙت!!!
میگم انقدر تجزیه تØلیل کردن زیاد هم خوب نیست ها از من Ú¯Ùتن بود.
به Øمیدرضا: شاید برای همین است Ú©Ù‡ می‌گویند پژوهش در ایران نهادین نیست! از یک طر٠که بروی به قبای دین برمی‌خورد، از طر٠دیگر به قبای سنت، از طر٠دیگر نیز به روابط انسانی توهین می‌شود Ùˆ طر٠نهایی نیز اوستا-کار مکانیک یا برق‌کار به‌اش برمی‌خورد اگر بگویی دست‌گاه‌ای Ú©Ù‡ می‌سازی کج است. (البته این ØرÙ‌ام Ú©Ù…ÛŒ شوخی بود!).
به بی‌تا: من‌ام شنیده بودم چنین چیزی را. می‌گویند در مورد عشق Ùˆ این ØرÙ‌ها به‌تر است زیاد به معشوق Ùکر Ù†Ú©Ù†ÛŒ (البته دلیل‌اش را معمولا نمی‌گویند). به هر Øال چشم … ! (;
خوب امیر مسعود جان اون یکم Ùرآیندی Ú©Ù‡ با هم از دکتر نادر یاد گرÙتیم Ù…ÛŒ Ú¯Ùت اگر سیگنالت یقینی یا دترمینیستیک!! نباشه نمی تونی ممان هاشو ثابت Ùر ض Ú©Ù†ÛŒ.در مورد دخترها ( یا پسر ها!! بهشون بر نخوره) Ùˆ کلا انسان ها Ú©Ù‡ یکمی زیادی غیر یقینی هستن نمیشه میانگینشون (تازه رو Øساب کرد Ù…Ú¯Ù‡ اینکه مشاهداتت بی نهایت باشه Ú©Ù‡ اونم امکان پذیر نیست Ùکر کنم برای همینه Ú©Ù‡ از درس Ùرآیند ها تصادÙÛŒ هم سخت ترن.
به Ù…Øمد: لازمه‌اش یقینی‌بودن سیگنال نیست. سیگنال اگر غیرایستا (non-stationary) باشد نمی‌توان ممان‌های‌اش را ثابت Ùرض کرد، وگرنه Ùرض stationary بودن (یا wide-sense stationary) کاÙÛŒ است والبته Ùرض غیرمعمول‌ای هم نیست.
اما ØرÙ‌ات درست است. دنیای واقعی معمولا پیچیده‌تر از مدل‌هایی است Ú©Ù‡ علم با آن سر Ùˆ کار دارد. مدل‌ها ساده‌ترند Ùˆ در نتیجه دقت‌شان کم‌تر است. اما از طر٠دیگر ممکن است اگر شانس داشته باشیم قابل تØلیل باشند Ùˆ بتوانیم چیزهایی در موردشان بگوییم. آن وقت می‌توانیم با تقریب در مورد دنیای واقعی نیز Øر٠بزنیم.
به هر Øال کار دیگری نمی‌شود کرد. به‌ترین وسیله‌ای Ú©Ù‡ در اختیار داریم همین علم است – Ú©Ù‡ البته بعضی وقت‌ها هم بد جواب نمی‌دهد (مثلا Ùیزیک نیوتونی دقیق نیست، اما با آن می‌توانیم هواپیما بسازیم. یا مدل‌های مداری استاندارد، سیگنال را به صورت موج در نظر نمی‌گیرد اما باز هم می‌توان بسیاری از مدارات الکترونیک را با استÙاده از همان مدل‌ها تØلیل کرد Ùˆ برای بچه‌ها اسباب‌بازی ساخت!).
آها … تا یادم نرÙته بگویم برای این مساله‌ی banditØŒ اگر مدل اØتمالی را بدانیم (در واقع joint distribution) دیگر لازم نیست Ùرض‌ای مثل iid بودن بکنیم. یعنی با دانستن joint distribution هم مساله قابل ØÙ„ است.
از مدل‌های ما است. در واقع کاربرد مدل‌ها هم همین است Ú©Ù‡ دنیای واقعی را با تقریب توصی٠کنند. تقریب‌ای Ú©Ù‡ دقت را Ú©Ù… می‌کند اما در عوض مساله را تا Øدی ساده می‌کند Ú©Ù‡ بتوان در موردش چیزی Ú¯Ùت.
به سولوژن(!): Ùکر کنم معروÙ‌ترین اسم به کار رÙته‌ در مورد این مسئله multi-armed bandit باشه.
Ùˆ در ضمن دقت Ú©Ù† Ú©Ù‡ تمام ایده‌هایی‌ Ú©Ù‡ Øداقل من می‌شناسم در باره‌ی این مسئله، یه Ùرض اساسی در باره‌ی infinite horizon بودن دارند Ú©Ù‡ Ø®Ùب…خیلی با چند سال Ùرق داره، Øتی از دیدگاه مهندسی.
یعنی اصولا وقتی زمان explore کردن‌ت قابل صر٠نظر در برابر زمان exploit کردن‌ت نیست، Ùˆ تازه معمولا راه برگشتی هم -معمولا- وجود نداره، Ùکر کنم خیلی راه نامعقول‌تری نباشه سراغ مثلا اونی رÙتن Ú©Ù‡ از اسمش بیشتر خوشم می‌اد‌. وقتی Ú©Ù‡ این همه مقایسه‌شون سخت‌ه Ú©Ù‡ مجبوری با Ú©Ù„ÛŒ ارÙاق با multiarmed bandit مدل‌ش کنی، شاید بهتر باشه Ú©Ù‡ انتخاب Ú©Ù†ÛŒ.
اصولا زØمت برای بالا بردن دقت از یه جایی به طور ÙˆØشتناکی با شیب تندی می‌ره بالا (اگه اصولا از یه Øدی بتونه بالاتر بره).
Ùˆ Ø®Ùب…طبعا همه‌ی این ØرÙا در مورد یه مسئله‌ی انسانی‌ه، Ùˆ الا Ú©Ù‡ خود مسئله‌ی اصلی رو یه بار Ú©Ù‡ رÙتیم لاس‌وگاس(!!) با تمام پس‌اندازمون – اعم از ارز(â€!) Ùˆ دانش‌ (!!!) – به طور کاملا اکسپریمنتال ØÙ„ می‌کنیم :دی
مسائلی مثل k-armed bandit Ùˆ البته مسائلی مثل مساله یاÙتن دوست دختر بهینه تا زمانی جالب به نظر Ù…ÛŒ رسند Ú©Ù‡ خواص Ù…Øیطی Ú©Ù‡ پسر داستان ما در اون قرار داره (Ù…Øیط در اینجا Ùقط شامل دو دختر میشه) با گذشت زمان تغییر نکنه Ùˆ به Ø§ØµØ·Ù„Ø§Ø stationary باشه. اما اگر سایر agent های Ù…Øیط (دخترها) خاصیت یادگیری Ùˆ تطبیق داشته باشن اونوقت ما به روشهای یادگیری نیاز داریم Ú©Ù‡ هیچ وقت متوق٠نشن. یعنی یه جورایی همیشه باشد در Øال یادگیری باشیم. مثلا اگر بعد از n مرØله به این نتیجه رسیدیم Ú©Ù‡ دختر A دختر بهینه است، ممکن است رÙتار ما با دختر B باعث بشه Ú©Ù‡ بهد از گذشت مدت زمانی دختر B بهینه بشه! پس الگوریتم یادگیری هیچ وقت نباید متوق٠بشه. اما سوال اینجاست Ú©Ù‡ در این صورت مساله exploration vs. exploitation را در یک Ù…Øیط non-stationary Ú†Ù‡ جوری handle کنیم؟
you`ve forgotten very important point.Your mood.its just you, and what are you looking for ,in a moment
آره درست میگی ایستا بودن برای پیدا کردن ممان کاÙیه 🙂 ولی Ùکر نکنم آدما ایستا هم باشن :))
ضمنا اگر joint distribution رو داشتیم Ú©Ù‡ دیگه خیلی وضعمون خوب بود. کلا این نگاه خیلی خنده داره Ùˆ این مساله پیچیده تر از اونیه Ú©Ù‡ با این Ù…Øاسبات قابل ØÙ„ باشه. البته الگوریتم های هوشمند بیولوژیکی مثل اون چیزایی Ú©Ù‡ خودمون باهاش Ùکر Ù…ÛŒ کنیم از پسش بر میان ولی نه همیشه 😉
From UTS sessions: “never choose a contraversial example to exaplain something of non-controversial nature. People will miss the point!”
عجب بØØ« جالب توجهی بوده Ùˆ من غاÙÙ„ بودم. یه Ú©Ù… مثال ها رو عوض Ù…ÛŒ کردین هم به جایی بر نمی خورد . نه؟ مثلا یه تجدید نظر در جنس مثال ها خیال خیلی ها رو راØت Ù…ÛŒ کرد.
Ay Polygamist
this is actually an interesting variant of the multi-armed bandit problem, since there’s a cost associated to switching! let’s say, you’re allowed to get back to a girl at most k times; what’s the optimal algorithm in this case?
به آرش: بله! multi-armed bandit نام معروÙ‌تری است از n-armed Ùˆ … . در مورد نوع ساختار نتایج باید بگویم Ú©Ù‡ روش‌ای Ú©Ù‡ به طور ضمنی اشاره کردم، نتیجه‌اش asymptotical نیست، بلکه finite-sample است. در واقع کران‌ای برای regret می‌دهد Ú©Ù‡ خوش‌Ùرم است Ùˆ اگر اشتباه نکنم، Ùرم کران‌اش بهینه است (Ùˆ البته نه الزاما ثابت‌های‌اش). به طور مشخص‌تر منظورم الگوریتم UCB1 است Ùˆ مقاله‌ی Auer.
به آرش دیگر: بله! ØرÙ‌تان کاملا درست است. در این‌جا Ùرض شده است Ú©Ù‡ توزیع پاداش iid است. هدÙ‌ام از این مثال توصیه‌ی یک راه‌ØÙ„ برای یک مساله‌ی واقعی نبود، بلکه نشان‌دادن این‌که یک مساله‌ی ریز چقدر می‌تواند جزییات داشته باشد بود Ùˆ البته Ú©Ù…ÛŒ شوخی‌کردن. یک مساله‌ی دیگری Ú©Ù‡ این وسط اهمیت دارد (جدا از non-stationary بودن یا adversarial بودن طر٠مقابل (Ú©Ù‡ البته دومی به اØتمال زیاد اولی را نتیجه می‌دهد)ØŒ این است Ú©Ù‡ هیچ Ù…Ùهوم Øالت‌ای در نظر نگرÙته‌ام. انسان‌ها در شرایط مختل٠یک‌جور رÙتار نمی‌کنند.
به zita: بله! در نظر نگرÙته‌ام. به توضیØ‌ای Ú©Ù‡ به “آرش دیگر” داده‌ام مراجعه کنید.
به Ù…Øمد: Ùˆ البته باز هم مساله‌ی ساده‌ای نبود. اما یک سوال اساسی برای‌ام پیش می‌آید: منظورت از الگوریتم‌های هوش‌مند بیولوژیکی چیست Ùˆ چرا آن‌ها می‌توانند از پس این جور سوال‌ها (Øداقل بعضی وقت‌ها) بر بیاید؟ آیا آن‌ها از ریاضی‌ی دیگری استÙاده می‌کنند؟
به آزاد: آن توصیه بستگی دارد به هد٠شخص.
به “از زندگی”: سعی می‌کنم دÙعه‌ی بعد برعکس بنویسم Ú©Ù‡ عدالت در مجموع وبلاگ رعایت شده باشد.
به یکی از چهارنÙر: نه! نیستم!
به Ù…Øمد: جالب شد! دقیقا Ú†Ù‡ چیزهایی را می‌دانیم؟ می‌دانیم Ú©Ù‡ توزیع پاداش هر کدام iid است، ولی توزیع را نمی‌شناسیم. در ضمن هر بار تعویض انتخاب یک بازو باعث دریاÙت هزینه‌ی ثابت‌ای می‌شود. هد٠هم بیشینه‌کردن پاداش متوسط (با اÙÙ‚ بی‌نهایت) است. درست Ùهمیده‌ام؟ (چون بیشینه k بار استÙاده کردن هر بازو Ú©Ù…ÛŒ مساله را به نظرم عجیب می‌کند در Øالت اÙÙ‚ نامØدود Ùˆ پاداش متوسط. اگر پاداش discounted باشد یا اÙÙ‚ Ù…Øدود باشد (مثلا به M Øرکت) برای‌ام قابل Ùهم است.)
مرسي! از اين كه مراعات عدالت را مي كنيد سپاسگزارم
سلااااااااااااااااااااااااااااااااااااااااااااااااااااااااااااام
كسي با من رÙيق ميشه
همه مثال ها رو خوندم Ùˆ خیلی جالب بود ØŒ اما در آخر ØÙ‚ با اون دوستمونه Ú©Ù‡ Ú¯Ùته هوش بیولوژیکی خیلی بهتر Ùˆ سریعتر از پس این مسدله بخصوص ( کمینگی تاس٠در انتخاب دوست دختر / پسر ) بر میاد .
یکی از دلایلش اینه Ú©Ù‡ همونطور Ú©Ù‡ سولوين Ú¯Ùته مدل ها همه واقعیت نیستند .
در این مورد بخصوص توصیه من اینه Ú©Ù‡ جز اونایی Ú©Ù‡ در این زمینه متخصصن بقیه به همون هوش بیولوژیکی خودشون اکتÙا کنن .