Екип от изследователи от Смитсоновия тропически изследователски институт дигитализира изображения на цветен прашец от над 18 000 растителни вида от тропиците. Трудът им е публикуван в списанието PLANTS, PEOPLE, PLANET.

Тези изображения се използват за тренирането на модел за машинно обучение за идентифициране на прашинки - задача, която обикновено отнема стотици часове работа с микроскоп от експерти по прашинки. Изображенията ще позволят и широк спектър от нови анализи на прашинки. Базата данни, наречена PollenGEO, ще бъде безплатна и достъпна онлайн.

Колекцията от прашец на Смитсониан, съхранявана в Смитсонианския тропически изследователски институт (STRI) и Националния музей по естествена история на Смитсониан, съдържа над 18 000 вида, което я прави една от най-големите колекции от прашец в света.

Референтните бази данни за прашец като PollenGEO могат потенциално да изпълняват безброй функции в много области на науката и медицината. Например бързото и точно идентифициране на полените може да помогне за диагностициране на алергия към полени, да определи откъде произхождат дрехите на местопрестъплението, да помогне за разследване на това как древните гори са реагирали на климатичните промени и да датира отлаганията на въглеводороди.

Ценността на полените в палеонтологията произтича от тяхната трайност – някои поленови зърна се съхраняват стотици милиони години, предлагайки прозорец към историята на Земята, който е точен както във времето, така и в пространството. Освен това, полените на всеки растителен вид са уникални и се различават от тези на другите видове.

Преди това специалистите идентифицираха прашинките една по една под микроскоп, като използваха илюстрирани наръчници за справка. Този процес отнема много време и може да бъде особено труден в тропиците, където има хиляди растителни видове, много от които все още не са идентифицирани. Трудно е също така да се идентифицира прашец в древни скални пластове, защото много от растителните видове, които са произвели прашеца, днес са изчезнали.

За да се справят с тези предизвикателства, повече от 30 изследователи и студенти от STRI, ръководени от палинолога Карлос Харамильо, дигитализират цялата палинологична колекция на Смитсониан; те качват повече от 40 милиона снимки на прашинки от известни растителни видове, за да създадат огромна база данни. Този набор от данни ще бъде използван за обучение на модели на изкуствен интелект, които да подпомагат идентифицирането на прашинки.

Повечето проби произхождат от палинологичната колекция на Греъм, дарена на STRI през 2008 г., която съдържа около 18 000 вида предимно тропически прашец на повече от 23 000 микроскопски слайда, всеки от които е придружен от индекс карта, която описва пробата. Около 100 доброволци, работещи в Смитсоновия транскрипционен център, помогнаха за въвеждането на информацията от картите в базата данни.

Колекцията включва също колекцията на Джоан Ноуик, колекцията от остров Баро Колорадо на Дейв Рубик и Енрике Морено, колекцията от Амазонка на Пол Колинво и колекцията от Сиан Каан, която съдържа 650 вида от югоизточна Мексико. В допълнение, около 1000 проби от фосилен прашец са сканирани от музейните колекции в Националния музей по естествена история.

Обучението на AI модел за използване на тази огромна база данни за идентифициране на проби изискваше сътрудничество между експерти в различни области, от ботаника до компютърни науки. Доцент Суранги Пунясена от Университета на Илинойс Урбана-Шампейн изгражда AI средата.

Екипът на Харамильо е част от проекта Trans-Amazon Drilling, мащабен проект, който използва прашец от сондажни ядра от цяла Амазонка, за да разбере историята на гората. В този проект участват изследователи от няколко институции, като Universidade Federal de Mato Grosso и Universidade Federal do Acre, и двете в Бразилия, и Открития университет.

PollenGEO и други онлайн бази данни за цветен прашец ще превърне идентифицирането на цветен прашец от самотна дейност зад микроскоп в цифров и универсално достъпен процес.

Андрес Диас представи уебинар на испански език за процеса на дигитализиране на 40 милиона изображения на цветен прашец.

Източник: Phys.org

DOI: 10.1002/ppp3.70073