Парадоксът на пликовете: случайност или...?

28 януари 2018 г., 23:00
9996

Shutterstock

Вече 80 години математици и статистици неуспешно се мъчат с една проста игра. В два плика са сложени различни суми пари. Играчът знае само, че едната сума е два пъти по-голяма от другата. Той има право да отвори единия плик и да реши дали да вземе него или другия.

Наскоро двама австралийски учени предложиха оригинално решение на задачата. Неочаквано то може да предложи интересни начини за вникване в куп теоретически и приложни проблеми – в термодинамиката и оптимизацията на технически системи, за подобряване на електронните схеми и дори за разработване на стратегия за сигурни печалби на фондовите борси.

Задачата е известна в различни варианти от 1930 г., но във версията с двата плика е описана едва в края на 80-те години.

Ето я играта. Предлагат ви два плика с пари. Естествено, нямате право да ги претегляте, опипвате и гледате срещу светлина. Знаете само, че в единия от тях има сума, двойно по-голяма, отколкото в другия, но в кой и какви са сумите -  нямате никаква представа. Може да отворите единия плик и да погледнете парите. И решавате – този, или другия. Но повече не може да надзъртате.

Въпросът е какво да се направи, за да спечелите

(т.е. да получите по-голямата сума)? На пръв поглед шансът е 50 на 50. Но се оказва, че не е така. И тук се намесва изчисляването на средната очаквана стойност на втория плик.

Да речем, че сте отворили единия плик и сте видели 10 долара. В другия би трябвало да има или 5, или 20 долара, като всяка от двете възможности има 50-процентна тежест. Теоретично средновероятната сума в затворения плик е: 0,5 х 5 + 0,5 х 20 = 12,5. Разбира се, вътре има или 20, или 5 долара. Но 12,5 е средната сума на печалбата ви, ако винаги сменяте пликовете – ако изиграете достатъчно дълга серия залагания.

Срещу този извод, разбира се, въстава интуицията, която просто врещи, че пликовете по принцип са равни. И с размяната им всичките тънки сметки, описани дотук, трябва да започнат отначало.

Много учени са се опитвали да решат парадокса, някои дори са смятали, че са успели. Но досега предлаганите решения не бяха приемани от математическата общност.

Последното наистина свежо решение

е предложено от Марк Макдонъл от Университета на Южна Австралия и Дерек Абът от Университета на Аделаида. Макар да не са построили изчерпателна теория за парадокса, те смятат, че са открили къде е принципната грешка на предшествениците им.

Абът признава, че първият намек за път към решението е получил от станфордския професор Томас Кавър, признат специалист по статистика и теория на информацията. През 2003 г. Абът работи в родната си Великобритания. И на един обяд с Кавър последният предлага оригинална стратегия за печалба, която била по-ефективна от правилото "винаги сменяй плика".

Новият метод действа така. Смяна трябва да се прави... или да не се прави. Решението за нея се взема на случаен принцип, но с помощта на вероятността, зависеща от видяното в отворения плик. Тоест,

колкото по-малка е сумата в плик А,

толкова по-добре е да смените пликовете, а някоя по-прилична сума трябва да ви кара да я запазите.

Тогава, преди седем години, Абът решил, че тази идея е смахната и изобщо се отказал да я обмисля. Но след време успял да види в "стратегията на Кавър" дълбок философски и дори физически смисъл.

Привидният парадокс възниква, защото не можем да се избавим от усещането, че отварянето на плика и наблюдението на 10 долара не дават никаква информация. Но Абът обяснява случая от гледна точка на нарушаването на симетрията. Преди отварянето на пликовете ситуацията е симетрична, затова няма значение дали после правите смяна или не. Но след отварянето на единия и ползването на стратегията на Кавър вие нарушавате симетрията, двата плика вече не са равноценни, а смяната на пликовете ви дава възможност за печалба в дългосрочен план.

Вече над 20 милиона компютърни симулации показват,

че стратегията на Кавър е решение на загадката. Друга печеливша стратегия е да си намислите сума, да я сравнявате с видяното в отворения плик и да вземате или сменяте на тази база. И това е точно толкова антиинтуитивно, колкото и задължителната смяна. Защото летвата я слага играчът, а не „банката”.

Общото обяснение на парадокса с пликовете помага за изясняването и на други математически загадки, като например Парадокса на Парондо.

Той се формулира по следния начин. Ако се вземат които и да са две игри на щастието, във всяка от които вероятността за загуба е по-голяма от тази за победа, може да се изгради печеливша стратегия, като игрите се играят поред.

Ха сега де? Да допуснем, че имате някакъв начален капитал. П

о-нататък постепенно към него се добавя или изважда 1 долар, в зависимост от нещо, равносилно на ези-тура. Монетата, с която я играете обаче, не е „честна”, т.е. вероятността за падане на всяка от страните не е 50%.

И така, в играта с капитала имате не една, а две игри — А и В. При което в играта А се използва монета 1 с вероятност да спечелим от 0,5-e, където „е” е малко повече от нула. Естествено, при голям брой хвърляния в играта тип А ние винаги сме губещи.

В играта B се ползват две (също несиметрични) монети (2 и 3), съществено различаващи се една от друга по вероятността да ни донесат печалба: например (1/10)-е и (3/4)-е. Освен това се вкарва замислено предварително случайно число М. И правилото е: ако текущият капитал е кратен (дели се) на М — в съответния рунд хвърляме монета 2, ако не е кратен — монета 3.

Дерек Абът успява да докаже, че играта В е губеща. Но парадоксът е, че редуването на игрите може да доведе до нарастване на капитала!

Това, разбира се, не става с еднообразно редуване. Само някои комбинации го постигат, например ABBABB и т.н.

Всъщност няма никакъв парадокс, а илюзия за такъв.

Учените са доказали, че става дума само за сложна поредица от вероятности. Важно е да се помни, че при комбинацията им двете игри стават взаимосвързани. И връзката помежду им е „случайното” число М. С неговото въвеждане ходът на игра А става зависим от този на игра В. Ако нямаше такава връзка, всяка комбинация от двете игри би била губеща.

И оттук се пролива лъч светлина върху задачата с пликовете.

Въвеждането на М и връзването на избора на монетата с капитала (който е единствен и се увеличава и намалява и в двете игри) влияе върху вероятността за разпределение на всички отделни „раздавания” до състояние, в което се появява положително очакване, възможност за печалба.

Време е през тази все още мътна призма да погледнем към третата аналогия, описваща пробива на Абът и Макдонъл – финансовите сделки. Напомпването на нестабилност (Volatility pumping) е опростен модел, насочващ към някои полезни стратегии за игра на борсата.

Ясно е, че ако играчът има информация за финансовите инструменти, с които играе (състояние на фирмата, съдебни дела срещу мениджърите й, сведения за съответната реколта или успех в търсенето на нефт), той може рационално и осъзнато да съставя портфейла си. Но ако няма никаква информация освен текущата цена (на акциите или стоките) и нейната посока? Ако не знае дали още ще пада? А дали тази цена не е максимална, минимална или пък идва грандиозен спад?

Прилича ли ви

на задачата с пликовете? Виждате една стойност – другата е или по-голяма, или по-малка. Помпането на нестабилност предполага хаотично закупуване и продажба на активи с неголям период между сделките (купувате евтино - бързо, продавате по-бързо), без да се тревожите дали сте постигнали максимална изгода или не. Което пък прилича на стратегията за задължителната смяна с известен фактор на зависимост от наблюдаваната сума (стратегията на Кавър).

Абът и Макдонъл се учудват на собствените си резултати – анализът им показва, че със стратегията на Кавър винаги може да се увеличи полученият капитал в игра с пликове, без значение дали знаете нещо за диапазона на сумите, залагани в пликовете.

Учените повтарят, че в случая единствената им заслуга е разплитането не на парадоксите, а разобличаването им като такива. Впрегнатият от тях математически апарат показва, че обективните методи могат да дадат резултати, абсолютно несъвместими с очакваните. Но затова пък ефективни – стига да внесете необходимата доза асиметрия на вероятностите.

От този род е поне едно странно явление

като стохастическия резонанс — парадоксалното на пръв поглед усилване на полезния (периодичен) сигнал в нелинейни системи при добавяне към същия на бял шум (хаотични смущения). И това интересно явление вече се ползва при електронните системи. Разбира се, обяснението му тук би отнело прекалено много място.

Може би стига да отбележим, че някои от вицовете за ремонта на коли от служители на Microsoft (с отваряне и затваряне на вратите) вероятно имат смисъл в такава ситуация. Достатъчно е да се натрупат условия, при които дори добавянето на двайсет капки зехтин повишава вероятността от полезен изход – просто защото влияете на системата (някои хазартни играчи го наричат “да шашнеш крупието”). А това почти се докосва до философски, че и богословски теми – като тази за свободната воля например.

И запомнете: няма никакъв парадокс.

Петър Кънев

Ключови думи:
Коментари