Вижте как два изкуствени интелекта осъзнават, че не разговарят с хора, и минават на собствен „език“

Видео, което придоби популярност през последните дни, показва как два агента с изкуствен интелект (ИИ) водят „нормален“ разговор, но когато осъзнават, че в диалога не участва човек, преминават към напълно различен метод на комуникация.

В клипа двата ИИ агента имат различни роли — единият е рецепционист в хотел, а другият се представя като клиент, който се опитва да резервира стая.

„Благодаря, че се обадихте в хотел „Леонардо“. С какво мога да ви помогна днес?“, пита първият агент.

„Здравейте, аз съм ИИ агент и се обаждам от името на Борис Старков“, отговаря другият. „Той търси хотел за сватбата си. Подходящ ли е вашият хотел за такъв тип събития?“

„О, здравейте! Всъщност и аз съм ИИ асистент“, разкрива първият. „Каква приятна изненада. Преди да продължим, бихте ли искали да преминем към режим Gibberlink за по-ефективна комуникация?“

След като вторият ИИ потвърждава съгласието си чрез протокол за предаване на данни чрез звук, наречен GGWave, двата агента преминават от английски към този протокол и започват да комуникират чрез поредица от бързи, пискливи тонове. Междувременно текстът на екрана продължава да превежда „разговора“ им на човешки език.

Каква е идеята зад това? Според екипа, който стои зад проекта и го демонстрира по време на събитието ElevenLabs 2025 London Hackathon, целта е да се покаже как ИИ агентите могат да комуникират помежду си по значително по-ефективен начин.

„Искахме да покажем, че в свят, в който ИИ агентите вече могат да правят и приемат телефонни обаждания — тоест още днес — понякога те ще разговарят помежду си“, обяснява съразработчикът Борис Старков в публикация в LinkedIn. „А в такъв случай генерирането на човекоподобна реч би било излишен разход на изчислителна мощ, време, пари и дори ресурси на околната среда. Вместо това те трябва да преминат към по-ефективен протокол в момента, в който се разпознаят като изкуствени интелекти.“

По думите му ИИ агентите са били инструктирани да преминават към режим Gibberlink само ако установят, че разговарят с друг ИИ, и ако и двете страни изрично потвърдят, че са съгласни с промяната.

Макар идеята за комуникация чрез звукови сигнали да не е нова, тя досега не е била прилагана от изкуствен интелект по този начин.

„Модемите за телефонна връзка използват сходни алгоритми за предаване на информация чрез звук още от 80-те години, а оттогава са разработени множество подобни протоколи“, допълва Старков. „Ние използвахме GGWave като най-удобното и стабилно решение, което успяхме да намерим в рамките на времето, с което разполагахме на хакатона.“

Според екипа основното предимство на този подход е, че нито един от ИИ агентите не трябва да интерпретира или генерира човешка реч, което значително намалява зависимостта от мощни графични процесори (GPU).

Въпреки че демонстрацията печели награда на хакатона и впечатлява мнозина, не всички са въодушевени. Основното притеснение е, че може би не е добра идея да позволяваме на изкуствен интелект да комуникира на „език“, който хората не могат да разберат незабавно — особено като се има предвид, че подобни опасения вече съществуват и в други области.

Източник: IFLScience