Изкуствен интелект се самообучава и създава алгоритми, които превъзхождат човешките
Машини, които се учат без човешка намеса.
И изкуственият интелект (AI), подобно на нас, се учи чрез опити и грешки. Досега обаче хората трябваше да задават началните правила и алгоритми, които управляват процеса на обучение. С напредъка на технологиите това започва да се променя – машините все по-често създават собствени методи за учене.
Пример за това е нова система с изкуствен интелект, разработена от изследователи, която сама е изобретила свой начин на обучение. Резултатът е алгоритъм, който превъзхожда човешките разработки при серия от сложни задачи.
Как AI създава собствени алгоритми за обучение
В продължение на десетилетия инженерите са проектирали алгоритмите, чрез които AI системите се учат – особено при обучението с подсилване (reinforcement learning, RL), където изкуственият интелект получава „награди“ за успешни действия.
Докато при хората и животните способността за учене е резултат от милиони години еволюция, при машините тя трябва да бъде внимателно програмирана – процес, който е бавен, трудоемък и ограничен от човешката интуиция.
Вдъхновено от еволюцията: дигитална популация от AI агенти
Следвайки принципа на еволюцията – процес на случайни опити и грешки – учените създали голяма дигитална популация от AI агенти. Тези агенти се опитвали да решат различни задачи в сложни среди, използвайки определено правило за учене.
Над тях се намирала „мета-мрежа“ – „родителски“ изкуствен интелект, който наблюдавал представянето на агентите, анализирал резултатите и актуализирал правилото за учене, за да направи следващото поколение по-ефективно.
Резултатът: новият алгоритъм DiscoRL (Disco57)
По този начин системата открила напълно ново правило за учене, наречено DiscoRL (или Disco57, тъй като е тествано на 57 игри Atari). Този алгоритъм се оказал по-добър от всички предишни, създадени от хората.
След това изследователите използвали Disco57, за да обучат нов AI агент, който бил сравнен с едни от най-добрите човешки алгоритми – PPO и MuZero. Обучението започнало върху класически Atari игри, а след това – върху нови, непознати предизвикателства като ProcGen, Crafter и NetHack.
AI, който надминава човека
Резултатите били впечатляващи. В тестовете от Atari Benchmark – стандартен набор от видеоигри за оценка на изкуствен интелект – DiscoRL надминал всички човешки проектирани алгоритми.
При новите, непознати задачи, системата също постигнала високо ниво на представяне, доказвайки, че е открила собствено правило за обучение.
Машинно проектирани алгоритми – бъдещето на AI
„Нашите резултати показват, че алгоритмите за обучение с подсилване, нужни за развитието на напреднал изкуствен интелект, може скоро да бъдат автоматично откривани от самите агенти, вместо да бъдат ръчно проектирани“, пишат изследователите в статията си, публикувана в Nature.
„Това е стъпка напред към машинно създадени алгоритми, които могат да се съревновават с – и дори да надминават – най-добрите човешки решения в предизвикателни среди.“
Източник: TechXplore













