Ако агентите не използваха лазерните лъчи, теоретично те биха могли да завършат играта с равен брой ябълки, което е било стратегията, използвана от “по-малко интелигентните” версии на Дийп Майнд.

Едва когато Гугъл е тествал по-сложни форми на софтуера саботажът, алчността и агресията са влезли в играта.

Според учените, колкото по-интелигентен е агента, толкова по-способен е да се учи от средата си, което е позволило да приема да използва силно агресивна тактика за да излезе победител.

“Този модел показва, че някои аспекти от поведението на човека се формират като продукт на способността за учене и средата,” коментира един от учените в екипа, Джоел Лайбо. 

Източник: Science Alert