Cover image for Mis on AI agendid? Algajasõbralik ülevaade näidetega ärimaailmast

AI Concepts & Fundamentals

Mis on AI agendid? Algajasõbralik ülevaade näidetega ärimaailmast

Heigo Heigo
7 min

Lõpeta „tehisintellekti“ ostmine. Palka digikolleeg.

Enamik jutte „tehisintellektist“ äris on puhas müra. Need kubisevad udustest lubadustest ja tühjadest loosungitest, aga harva selgitab keegi, mida see masin tegelikult teeb. Mõistest on saanud prügikast kõigele, alates Exceli valemist kuni graafikakaarte täis tuubitud andmekeskuseni. See segadus läheb kalliks maksma.

Teeme pildi selgeks ühe lihtsa mõtteharjutusega. Ära mõtle „tehisintellekti“ ostmisele. Mõtle uut tüüpi töötaja palkamisele.

Tavaline chatbot on nagu administraator fuajees. Ta istub leti taga, vastab skripti alusel korduma kippuvatele küsimustele ja suunab inimesi õigesse kohta. Kasulik, aga piiratud. AI-agent on aga spetsialist. Sinu uus jurist-abi, personalitöötaja või tarneahela analüütik. Ta ei vasta ainult küsimustele, vaid viib ellu mitmest etapist koosnevaid ülesandeid, mis nõuavad arutlusvõimet, ligipääsu tööriistadele ja mälu.

Vahe pole akadeemiline, vaid rahas mõõdetav. Kui chatbot suudab kliendi suunata tagastuspoliitika lehele, siis AI-agent kontrollib kliendi ajalugu CRM-ist, logib sisse tellimuste haldussüsteemi, tuvastab ostu ja algatab makse-API kaudu tagasimakse. Kõik ühe vestluse käigus. See on vahe kliendi minema peletamise ja tema probleemi lahendamise vahel.


Su chatbot on administraator, agent aga spetsialist

Aastaid oli automatiseerimise püha graal etteennustatav, samm-sammuline töövoog. Kui protsess oli korratav ja ei vajanud otsustusvõimet, sai selle jaoks boti ehitada. Agendipõhiste raamistike, nagu LangChain, loojate sõnul on see endiselt õige lähenemine deterministlike ülesannete puhul. See on klassikaline vooskeem. Kui juhtub A, tee B. Administraatori töö.

Agent tegutseb teisiti. Talle ei anta skripti, vaid eesmärk. Näiteks „lahenda selle kliendi tarneküsimus“ või „kvalifitseeri see uus müügivihje“. Agent, mitte inimene, paneb ise paika parima tegevuskava eesmärgi saavutamiseks. See dünaamiline, mudelipõhine otsustusvõime eristabki spetsialisti administraatorist.

Ja see pole mingi laborieksperiment. Klienditeeninduse automatiseerija Jeeva.ai on dokumenteerinud, kuidas spetsialiseerunud agendid lahendavad rutiinsed probleemid 70% ulatuses iseseisvalt, hoides kliendirahulolu skoori üle 92%. Veelgi kõnekam on Klarna näide, kus AI-agent vähendas probleemide lahendamise aega 11 minutilt kahele. Küsimus pole küsimustele kiiremini vastamises, vaid terve protsessi ärategemises ilma inimsekkumiseta. Administraator ütleb sulle, kus asub raamatupidamine; spetsialist teeb su arve korda.


Digikolleegi anatoomia: aju, käed ja mälu

Mis siis võimaldab agendil neid keerulisi ülesandeid täita? See pole maagia, vaid inseneritöö. See on kolme eraldiseisva komponendi kombinatsioon, mis jäljendab inimspetsialisti. Kui sa „palkad“ digikolleegi, siis see on tema CV.

Esiteks, igal agendil on aju. See on suur keelemudel (LLM), näiteks GPT-4 või Claude 3. Selle ülesanne pole lobiseda, vaid arutleda. Teedrajavad uuringud, nagu Google’i ReAct (Reason+Act), näitasid, et LLM-id suudavad luua plaani, sõnastada oma „mõttekäigu“ ja otsustada järgmise sammu üle. Aju on mootor, mis jagab keerulise eesmärgi („Võta uus töötaja pardale“) loogilisteks alamülesanneteks („Loo Workdaysse konto“, „Saada tervitusmeil“, „Lisa palgalehele“).

Aga ajust purgis on vähe kasu. Plaani elluviimiseks vajab agent käsi. Digimaailmas on käteks API-d (rakendusliidesed). Need on tööriistad, mis lubavad agendil suhelda teiste tarkvarasüsteemidega. Akadeemiline töö Toolformeri kohta näitas, et mudelid suudavad endale ise selgeks õpetada väliste tööriistade, nagu kalkulaatori või otsingumootori, kasutamise. Ärikontekstis tähendab see agendile ligipääsu andmist sinu ettevõtte tööriistadele: Salesforce, Zendesk, Jira või isegi tavaline meiliserver.

Hea näide on UiPathi agendiehitaja demo, kus agent tegeleb uue töötaja sisseelamisega. Agent saab käsu, kasutab oma „käsi“, et kontrollida uue töötaja andmeid Workday API kaudu, loob profiili ja saadab seejärel meili-API abil kinnituse värbamisjuhile. Aju mõtleb plaani välja, käed viivad selle ellu. Tegevus ilma mõtlemiseta on loll skript. Mõtlemine ilma tegudeta on lihtsalt filosoofia. Agent vajab mõlemat.

Lõpuks vajab spetsialist mälu. Administraator ei pea mäletama sinu eelmist vestlust, aga jurist-abi peab teadma iga viimset kui detaili pooleliolevast kaasusest. AI-agendi mälu on vektorandmebaas. Tehnoloogiad nagu Pinecone ja Chroma toimivad pikaajalise mäluna, lubades agendil leida asjakohast infot varasematest vestlustest või tohututest dokumendiarhiividest. See mehhanism, mida tuntakse kui otsinguga täiendatud genereerimist (RAG), sunnib agenti põhjendama oma vastuseid ettevõtte faktidel, mitte ainult üldistel andmetel, millega teda treeniti. Ilma mäluta on agendi jaoks iga päev esimene tööpäev. Mäluga kogub ta teadmisi ja muutub ajas paremaks.


Palkamine õigele rollile: kolm peamist digikolleegi ametikohta

Kui agendi anatoomia on selge, võid hakata palkama konkreetsetele ametikohtadele. Kuigi variatsioone on lõputult, jagunevad enamik ärirakendusi kolme kategooriasse: otsing, töövoog ja arutlus.

1. Uurija (otsinguagent)

Kõige levinum ja kohest väärtust loov agent on uurija. Tema ülesanne on leida täpseid vastuseid tohutust hulgast sisedokumentidest. Mõtle temast kui jurist-abist, kes on läbi lugenud iga viimse kui dokumendi sinu firma ajaloos ja tsiteerib iga väite juures täpset allikat.

Õigusvaldkond oli siin esimene pääsuke. AI-platvorm Harvey toimib juriidilise uurimistöö agendina, väites, et suudab leida ~30% rohkem asjakohast sisu kui alternatiivsed meetodid. Nagu kirjutas WIRED, hakkasid suured advokaadibürood nagu Allen & Overy seda tehnoloogiat katsetama, et drastiliselt vähendada eeltööks ja pretsedentide otsimiseks kuluvat aega. Tasuvus on lihtne: vähem raisatud arveldatavaid tunde info otsimisele, rohkem aega kõrge väärtusega strateegiale. Sama muster kehtib igas teadmusmahukas valdkonnas, alates regulatsioonidest kuni farmaatsiauuringuteni.

2. Koordinaator (töövooagent)

Järgmine tase on koordinaator. See agent ei otsi ainult infot, vaid orkestreerib mitmeetapilisi protsesse üle erinevate süsteemide. See on sinu personaliosakonna spetsialist või ostuarvete töötleja.

Need agendid on robotiseeritud protsessiautomaatika (RPA) järeltulijad, aga neil on mõtlev aju. Nad saavad hakkama eranditega ja teevad otsuseid ilma jäiga, ettekirjutatud skriptita. Accelirate'i RPA-rakenduste analüüs näitas, et mõnedes kõnekeskuste automatiseerimistes langes keskmine käsitlemisaeg ligi 40%. Tõeline jõud avaldub aga mastaabis. Saksa energiahiiglane E.ON võttis koostöös Cognigyga kasutusele üle 30 vestlusagendi, mis automatiseerivad praeguseks ligi 70% teenindusvajadusest, töödeldes üle 2 miljoni vestluse aastas. Siin ei räägita enam minutite kokkuhoiust, vaid terve ärisuuna ümbermõtestamisest.

3. Analüütik (arutlusagent)

Kõige arenenum roll on analüütik. See agent kombineerib otsingu- ja töövoovõimekust, et teha keerulisi, andmepõhiseid otsuseid. Ta ei vii protsessi lihtsalt ellu, vaid optimeerib seda. Näideteks on dünaamiline hinnastamine, pettuste avastamine ja tarneahela optimeerimine.

Analüütikule, kelle ülesanne on dünaamiline hinnastamine, võidakse anda eesmärgiks kasumimarginaali maksimeerimine. Selleks kasutaks ta oma tööriistu, et hankida andmeid konkurentide hindade, laoseisu ja reaalajas nõudluse kohta. Seejärel arutleks ta nende andmete põhjal välja optimaalse hinna ja edastaks selle oma töövoovõimekusega e-poe platvormile. Selle taga olev teadus, nagu ReAct'i artikkel, tõestas, et just arutlus- ja tegutsemissammude põimimine viib keeruliste ülesannete puhul paremate tulemusteni. Kuigi neid agente on kõige raskem ehitada, pakuvad nad ka suurimat väärtust, tegeledes äristrateegia tuumaga.


Millal digikolleegi mitte palgata: kohustuslik hoiatus

Ükski hea värbamisjuht ei ignoreeri ohumärke. AI-agendid, hoolimata oma võimekusest, ei sobi igale ametikohale. Nende rakendamine vales kontekstis pole mitte lihtsalt ebaefektiivne, vaid potentsiaalselt katastroofiline.

Kõige kurikuulsam hoiatav näide on IBM-i Watson for Oncology. Turundatud kui revolutsiooniline tööriist kliiniliste otsuste tegemiseks, selgus hiljem IBM-i sisedokumentidest, et see andis „ohtlikke ja valesid“ ravisoovitusi. Süsteem oli must kast, mida oli treenitud käputäie hüpoteetiliste juhtumite peal ja mille arutluskäik oli läbipaistmatu. See oli kõrge riskiga arutlusagent, mis lasti käiku ilma piisavate kaitsemeetmete, läbipaistvuse ja valideerimiseta. Klassikaline näide, mis juhtub, kui tehnoloogia viiakse kõrge riskiga valdkonda enne, kui see on selleks valmis.

Hallutsinatsioonide risk – kus mudel enesekindlalt fakte välja mõtleb – on teine kriitiline piirang. Stanfordi Inimkeskse Tehisintellekti Instituudi (HAI) uuring näitas, et isegi õigusalasteks ülesanneteks peenhäälestatud mudelid mõtlesid märkimisväärses osas päringutest välja viiteid või esitasid seadust valesti. Otsinguagendi jaoks õigus- või meditsiinivaldkonnas on see vastuvõetamatu. See on põhjus, miks on vaja raudkindlaid RAG-süsteeme, mis sunnivad agenti oma allikatele viitama, ja inimjärelevalvet igas valdkonnas, kus faktitäpsus pole läbiräägitav.

Lõpuks on mängus ka regulatsioonid. Näiteks EL-i tehisintellekti määrus kehtestab ranged nõuded süsteemidele, mida peetakse „kõrge riskiga“, sealhulgas nõuded inimjärelevalvele, selgele dokumentatsioonile ja riskihaldusele. Digikolleegi palkamine reguleeritud ülesande jaoks tähendab, et võtad endale ka sellega kaasneva vastavuskoormuse.


Lõpeta prototüüpimine, alusta ametikoha defineerimisega

Küsimus pole ammu enam selles, kas me peaksime tehisintellekti kasutama. See on mõttetu küsimus. Päris küsimus on: „Kus on meil täna spetsialistid, kes upuvad automatiseeritavate, mitmest etapist koosnevate ülesannete alla?“

Sinu esmaspäeva hommiku väljakutse on see: ära algata järjekordset „AI-projekti“. See on retsept sihituks katsetamiseks ja raha põletamiseks. Selle asemel koosta digitaalsele kolleegile ametijuhend.

Leia üksainus, suure hõõrdumisega töövoog, kus inimene peab toimima liimina kahe või enama tarkvarasüsteemi vahel. On see müügiinimene, kes uuendab käsitsi Salesforce’i? Personalitöötaja, kes žongleerib kolme süsteemiga, et uus töötaja arvele saada? Finantsanalüütik, kes tõmbab andmeid kolmest allikast, et üks aruanne kokku panna?

Kaardista see protsess. Pane kirja süsteemid, mida nad kasutavad, otsused, mida nad teevad, ja eesmärk, mida nad saavutada üritavad.

See ongi sinu ametijuhend. Ja siis võib selguda, et sinu järgmine parim värbamine polegi inimene, vaid spetsialiseerunud digikolleeg, kes on valmis kohe tööle asuma.