Нов математически модел подобрява трансферното обучение в невронните мрежи

Учени от Института по невронауки „Дъндерс“ и два италиански института разработиха иновативен математически метод, който прогнозира ефективността на трансферното обучение в невронни мрежи — ключов пробив за изкуствения интелект при недостиг на данни.

Изследването, публикувано в престижното списание Physical Review Letters, е дело на д-р Алесандро Ингросо в сътрудничество с колеги от Италия. То предлага нов подход за трансферно обучение, което е от решаващо значение в области с ограничени налични данни, като медицинска диагностика.

Предизвикателството: малко обучителни данни

Изкуственият интелект обикновено изисква огромни набори от данни за обучение. Например за да разпознае кучета в изображения, една невронна мрежа трябва да бъде обучена с хиляди снимки. В някои сфери обаче — като ултразвукова диагностика на рак — такива обширни данни не са налични.

„При ограничени данни мрежата може да се пренастрои и да загуби способността си да обобщава. Това води до значителен риск от фалшиви положителни и отрицателни резултати“, обяснява Ингросо.

Решението: трансферно обучение и нова теория

Трансферното обучение решава този проблем, като прехвърля знания от предварително обучена мрежа (източник) към нова мрежа (цел), която разполага с ограничен обем данни. Ингросо и екипът му разработват математическа теория за трансферно обучение в мрежи с един скрит слой — базов, но широко използван архитектурен модел.

Научен пробив: комбиниране на два аналитични подхода

Новият метод съчетава:

Ядрена ренормализация – съвременен математически подход за анализ на невронни мрежи;
Формализма на Франц-Паризи – класически метод от физиката на спиновите стъкла.

„Комбинацията от тези инструменти ни позволява да правим точни прогнози за ефективността на трансферното обучение с реални набори от данни, а не само със статистически модели“, казва Ингросо.

Значение за изкуствения интелект и медицината

Разработеният модел е особено ценен в области с ограничени или чувствителни данни, като:

Медицинска диагностика (например рак, редки заболявания);
Биомедицински изследвания;
Промишлена автоматизация с ограничен достъп до примерни сценарии.

Това проучване прави важна крачка напред в разбирането и прилагането на ефективно трансферно обучение в невронни мрежи, като помага за по-бързото и надеждно внедряване на AI в критични реални приложения.

DOI: 10.1103/PhysRevLett.134.177301

Източник: TechXplore