Нов математически модел подобрява трансферното обучение в невронните мрежи
Учени от Института по невронауки „Дъндерс“ и два италиански института разработиха иновативен математически метод, който прогнозира ефективността на трансферното обучение в невронни мрежи — ключов пробив за изкуствения интелект при недостиг на данни.
Изследването, публикувано в престижното списание Physical Review Letters, е дело на д-р Алесандро Ингросо в сътрудничество с колеги от Италия. То предлага нов подход за трансферно обучение, което е от решаващо значение в области с ограничени налични данни, като медицинска диагностика.
Предизвикателството: малко обучителни данни
Изкуственият интелект обикновено изисква огромни набори от данни за обучение. Например за да разпознае кучета в изображения, една невронна мрежа трябва да бъде обучена с хиляди снимки. В някои сфери обаче — като ултразвукова диагностика на рак — такива обширни данни не са налични.
„При ограничени данни мрежата може да се пренастрои и да загуби способността си да обобщава. Това води до значителен риск от фалшиви положителни и отрицателни резултати“, обяснява Ингросо.
Решението: трансферно обучение и нова теория
Трансферното обучение решава този проблем, като прехвърля знания от предварително обучена мрежа (източник) към нова мрежа (цел), която разполага с ограничен обем данни. Ингросо и екипът му разработват математическа теория за трансферно обучение в мрежи с един скрит слой — базов, но широко използван архитектурен модел.
Научен пробив: комбиниране на два аналитични подхода
Новият метод съчетава:
-
Ядрена ренормализация – съвременен математически подход за анализ на невронни мрежи;
-
Формализма на Франц-Паризи – класически метод от физиката на спиновите стъкла.
„Комбинацията от тези инструменти ни позволява да правим точни прогнози за ефективността на трансферното обучение с реални набори от данни, а не само със статистически модели“, казва Ингросо.
Значение за изкуствения интелект и медицината
Разработеният модел е особено ценен в области с ограничени или чувствителни данни, като:
-
Медицинска диагностика (например рак, редки заболявания);
-
Биомедицински изследвания;
-
Промишлена автоматизация с ограничен достъп до примерни сценарии.
Това проучване прави важна крачка напред в разбирането и прилагането на ефективно трансферно обучение в невронни мрежи, като помага за по-бързото и надеждно внедряване на AI в критични реални приложения.
DOI: 10.1103/PhysRevLett.134.177301
Източник: TechXplore