A. Raudys: „DI revoliucijoje svarbiausia greitis ir kiekis“

DIRBTINIS INTELEKTAS

Agnė Piepaliūtė

AAI labs/Kristina Aleksynaitė

Aistis Raudys.

Taikomosios dirbtinio intelekto (DI) bendrovės „AAI Labs“ vadovas Aistis Raudys įsitikinęs, kad geriausia DI reguliuoti tada, kai susiduriame su konkrečiomis problemomis ir jos kartojasi: „Jeigu iš anksto bandysime numatyti problemas ir viską preventyviai drausti, tai stabdys progresą.“ Su ekspertu apie DI pažangą kalbėjosi IQ apžvalgininkė Agnė Piepaliūtė.

– Kaip „AAI Labs“ prisideda prie bendros DI mokslo ir technologijų pažangos?

– „AAI Labs“ yra taikomojo DI ir mašininio mokymosi bendrovė – kuriame DI paremtus sprendimus tiek privataus, tiek viešojo sektoriaus klientams, siekiantiems optimizuoti savo veiklos procesus. Dažniausiai tam jau parengtų sprendimų nebūna – DI modelius tenka apmokyti pagal specifinius duomenis, pritaikyti individualiems skirtingų įmonių poreikiams. Tenka sukurti ir visiškai naujų DI taikymo būdų. Pavyzdžiui, neseniai užbaigėme modelių išmaniesiems miškams projektą, jame sukūrėme sistemą, kuri pagal nuotraukas skaičiuoja rąstus ir lentas. Taip pat pagal palydovines nuotraukas numatėme miško dangos tipą, medžių skaičių ir pan. Kitas DI taikymo pavyzdys – besitęsiantis bendradarbiavimas su viešąjį transportą Vilniuje organizuojančia JUDU (SĮ „Susisiekimo paslaugos“) – ieškome būdų, kaip prognozuoti keleivių srautus kelioms valandoms į priekį, atitinkamai parenkant transporto priemonių tipą ir dydį. Tai tik keli bendradarbiavimo DI mokslo ir technologijų srityje pavyzdžiai.

– Praėjus daugiau nei pusmečiui nuo „ChatGPT“ pasirodymo, kaip galima vertinti jo ir kitų pokalbių robotų daromą įtaką darbo rinkai?

– Bendrai „ChatGPT“ prisijaukinimą darbo rinkoje galima skirstyti į keletą fazių – įmonėse pradžioje buvo tiesiog didelė nuostaba ir šiek tiek skepticizmo dėl technologijos plėtros. Pamačius eksponentinį vartotojų augimą pradėta apie GPT kalbėti daug plačiau. Tačiau tik po keleto mėnesių vadovai suvokė, kiek galimybių tokios technologijos taikymas turi realybėje. Ir nors šiandien apie GPT žino ir kalba visi, retas kuris turi aiškią viziją, kur šią technologiją galima taikyti konkrečiai.

Partneriams pristatome daug galimybių – nuo E-TAR įstatymų bazės analizės ir dokumentų atnaujinimo pasikeitus įstatymams iki darbuotojų pažangos vertinimo, teisinių ginčų sprendimo būdų ir pan. Nors jau dabar daugelis dokumentus rengia padedant „ChatGPT“, tai tik maža dalis galimybių, kurias galima atrakinti pritaikius kalbos modelį konkretiems vartotojo poreikiams, apmokius su papildomais reikalingais duomenimis.

Todėl galima teigti, kad „ChatGPT“ įtaka darbo rinkoje yra gana ribota – reta įmonė iki šiol sugebėjo pasinaudoti šio kalbos modelio sugebėjimais daugiau, nei tik prisijungti prie „OpenAI“ sukurtos interneto svetainės, nors galimybių yra be galo daug.

– Didėjant DI įrankių skaičiui, kurie specialistai ateityje bus paklausiausi, kurių poreikis sumažės ar visiškai išnyks?

– Yra dvi šio klausimo pusės. Pirmiausia, akivaizdu, kad žemesnės kvalifikacijos darbuotojai bus nebereikalingi. Pavyzdžiui, mašininio mokymosi srityje GPT jau dabar gali atlikti dalį jaunesniojo darbuotojo (angl. Junior) užduočių. Kitaip tariant, paprastus ir nuobodžius darbus, kuriuos anksčiau atlikdavo jaunesnieji darbuotojai, dabar galima atlikti daug greičiau ir geriau.

Kita vertus, pačioje darbo rinkoje paklausiausi bus tie, kurie mokės GPT ar kitus didžiuosius kalbos modelius išnaudoti efektyviausiai. Darbuotojai, kurie tinkamai gebės užsiimti užklausų inžinerija, jau netrukus bus graibstomi atsibundančių ir DI naudą pamažu besuvokiančių verslų.

„ChatGPT“ įtaka darbo rinkoje yra gana ribota.

– Viena kalbinta ekspertė sakė, kad DI galime laikyti pažengusiu tik tada, kai jis yra visuotinai prieinamas, t. y. kalba visiems suprantama kalba. Jūsų nuomone, kada išvysime DI sklandžiai kalbantį lietuviškai?

– DI jau kalba lietuviškai, ir sklandžiai. „AAI Labs“ viena pagrindinių veiklos krypčių – kalbos sintezė. Turime padarę apie 10 skirtingų (moterų, vyrų, vaikų) balsų, kurie sklandžiai kalba lietuvių kalba, taisyklingai kontekstualiai kirčiuoja. Tokiu balsu įrašytos garsinės knygos nebesiskiria nuo tų, kurias įrašo profesionalūs aktoriai. Šiuo metu sintezuojame garsines knygas įvairiems šalies leidėjams, bendradarbiaujame su Lietuvos audiosensorine biblioteka (buvusi aklųjų biblioteka), vykdome projektus, kurie leis DI sklandžiai prabilti ir kitomis žemų resursų kalbomis: kroatų, čekų, lenkų ir pan.

Lietuvių kalbą naudojame ir su didžiaisiais kalbų modeliais (LLMs), jie ją supranta taip pat puikiai kaip ir anglų kalbą, geba atlikti tuos pačius uždavinius.

AAI labs/Kristina Aleksynaitė

Aistis Raudys.

Iš esmės DI revoliucija nebereikalauja, kad mums kas nors išverstų, kaip būdavo iki šiol. Laukiame filmų, knygų vertimo, klijuojame lipdukus ant importuojamų prekių – natūralu, kad įsivaizduojame, jog ir DI sprendimai reikalaus vertimo. Tačiau tai ir yra viena pagrindinių DI revoliucijos greičio ir universalaus pritaikomumo priežasčių – šie sprendimai kalba įvairiomis kalbomis iš karto, o taikomojo DI komandos po to tik užtikrina, kad informacijos išvestys tiek žodžiu, tiek raštu nesiskirtų nuo to, kaip kalbame ir veikiame mes patys – žmonės.

– Dirbate su balso sinteze. Jūsų nuomone, ar pagrįstos baimės, kad ateityje bus fabrikuojami žmonių balsai ir naudojami nusikalstamoms veikoms? Kaip bus galima atskirti, ar tai tikras žmogaus balsas, ar padirbtas?

– Balsus sufabrikuoti galima ir dabar. Viešų asmenų balsus kopijuoti galima lengviausiai, nes yra daugybė duomenų – jų balso įrašų. Todėl nenuostabu, kad pirmieji deepfake’ai pasirodė kalbėdami, pavyzdžiui, buvusio JAV prezidento Baracko Obamos balsu – tam tiesiog buvo perteklinis kiekis duomenų: kalbos, interviu ir pan. Tai padaryti šiek tiek sunkiau privatiems asmenims, nes duomenų gali trūkti.

Bet kuriuo atveju teks diegti saugumo priemones, kurios galėtų atskirti tam tikrus balso signalo netikrumus arba anomalijas. Be to, vis dažniau kalbama apie balsą kaip biometrinės autentifikacijos priemonę. Kombinuojant jį su kitomis – veido atpažinimo, pirštų atspaudų nuskaitymo – priemonėmis galima sukurti gana stiprų apsauginį lauką, kuriuo būtų sumažinamas pavojus, susijęs su padirbto balso naudojimu nusikalstamoms veikoms.

Galiausiai, kilus įtarimui dėl netikro balso naudojimo (pavyzdžiui, skambučio metu), reikia paklausti specifinių detalių, kurias žinote tik jūs ir žmogus, su kuriuo tariamai kalbate.

– Gal galite paaiškinti, kas yra multimodalinė generacija? Kuo ji svarbi?

– Daugialypės generacijos yra mašininio mokymosi sritis, kuri gali generuoti skirtingų rūšių duomenis, pavyzdžiui, tekstą, vaizdus, garsą ir vaizdo įrašus. Ji dažnai naudojama kuriant naujus produktus ir paslaugas, pavyzdžiui, virtualius asistentus, pokalbių robotus ir žaidimus. Dabar generatyvaus DI sprendimus turime atskirai – tekstą susigeneruojame su „ChatGPT“, paveikslėlį – su „MidJourney“ ir pan. Akivaizdu, kad kiti žingsniai ir sėkmės istorijos DI progrese bus susiję su daugialype tokių paslaugų integracija ir suvienijimu.

– Kaip DI galėtų padėti efektyvinti duomenų analizę versle? Iki kokio lygio galima prognozuoti ir numatyti rodiklius pasitelkiant DI ir mašininį mokymąsi?

– DI neabejotinai gali padėti išspausti kelis papildomus efektyvumo procentus versle. Didelėms įmonėms tai reiškia didelius pinigus.

Prognozavimo lygis priklauso nuo probleminės srities. Jeigu tai labai atsitiktinumus mėgstanti sritis (pavyzdžiui, finansų rinka), prognozuoti sunku. Bet jeigu tai aiškiai fizikos ar kitiems dėsniams pavaldi sritis, prognozavimas gali būti gana tikslus.

DI taip pat gali puikiai atlikti pirmos grandies bazinę analitiką – peržiūrėti nesenas tendencijas: kas auga, krenta, kas atrodo kaip anomalija. Viską pateikti aiškiai apibendrinus, pasiūlant veiksmų planą ar tam tikras išvadas.

– DI produktai aktyviai kuriami, jų galutinės naudos ir pavojų išvestinės kol kas negalime numatyti. Sakoma, kad dėl tokios nežinomybės naujas technologijas labai sunku reguliuoti tradiciniais įstatymais ir kitais teisės aktais. Jūsų nuomone, ar reikia reguliuoti DI, kaip tai turėtų atrodyti?

– Geriausia DI reguliuoti tada, kai susiduriame su konkrečiomis problemomis ir jos kartojasi. Jeigu iš anksto bandysime numatyti problemas ir viską preventyviai drausti, tai stabdys progresą.

Didžiausios inovacijos buvo pasiektos tada, kai žmonės galėjo laisvai imti ir daryti viską, ką sugalvoja. Mūsų srityje vienas geresnių to pavyzdžių yra „Stable Diffusion“ modeliai, kurie generuoja paveikslėlius – kai visi programuotojai juos pradėjo naudoti viešai ir atvirojo kodo pagrindu, jie pradėjo tobulėti labai sparčiai.

Senesnis pavyzdys yra pats internetas – keletas organizacijų susitarė dėl bendrų protokolų ir nuo tada viskas pradėjo tobulėti ypač greitai, visiems prisidedant pagal savo galimybes ir plečiant interneto tinklą pamažu. Jeigu būtų reikėję iš karto gauti vyriausybių leidimus, niekas nieko nebūtų darę.

Iš esmės reguliavimai naudingi tik didelėms įmonėms (pvz., „Google“, „Metai“), kurios turi tiek žmogiškųjų, tiek finansinių išteklių ir geba tuo užsiimti. Tačiau tai mažina konkurenciją, mažieji verslai negali sau leisti rizikuoti, pažeidinėti įstatymų ir po to mokėti baudas. Į šią asimetriją labai svarbu atsižvelgti diskutuojant apie DI technologijų priežiūrą ir reguliavimą.

– Ar yra tikimybė, kad ES reguliacija stabdys Europos DI kūrėjų veiklą, jie taps mažiau konkurencingi už ES ribų?

– Na, tai priklauso nuo prioritetų. Ar mes tiesiog norime DI plėtros, ar norime, kad DI progresuotų atsakingai, nekeldamas grėsmės visuomenei? ES reguliacija savaime nėra blogis, nes sukuriamas vienodas žaidimo laukas visiems kūrėjams ir vartotojams, o tai – sąžininga, demokratiška ir saugu. Tačiau turbūt labiausiai neramintų pernelyg dideli paties duomenų rinkimo ir apdorojimo apribojimai, nes tai yra kertinis akmuo kuriant DI paremtus sprendimus.

ES nori būti pirmoji, kuri aiškiai apibrėžtų DI sprendimų kūrimo ir naudojimo gaires. Tačiau jei ši ambicija privers steigti atskirus etatus, kad užtikrintume, jog duomenų įvestys atitinka šimtus teisės aktuose nurodytų punktų, tai smarkiai sulėtins ir komplikuos modelių kūrimo ir apmokymo procesus. Bet kuris strateginis varžovas DI srityje, ar tai būtų Kinija, ar JAV, tuo neabejotinai pasinaudos, kurdamas savąsias DI žaidimo taisykles. DI revoliucijoje svarbiausia greitis ir kiekis. Rudenį ES institucijose vyksiančiose diskusijose dėl DI matysime, kiek šie du prioritetai bus apsaugoti nuo perdėto reguliavimo Europoje.

AAI labs/Kristina Aleksynaitė

Aistis Raudys.

A. Raudys

1997 m. Vilniaus universitete įgijo informatikos bakalauro, 1999 m. – informatikos magistro laipsnį Kauno technologijos universitete.
2002 m. suteiktas daktaro laipsnis DI srityje Vilniaus universitete.
2000–2002 m. dėstė Londono „South Bank“ universitete.
2004–2006 m. dirbo „Deutsche Bank Group“, 2006–2008 m. – „Société Générale Asset Management“, 2008–2009 m. – „BNP Paribas Corporate & Investment Banking“ įmonėse Londone.
2009–2022 m. valdė investicinį fondą „Algorithmic Trading Portfolio“.
Nuo 2010-ųjų dėsto Vilniaus universitete.
2018-aisiais su partneriu Tadu Šuboniu įkūrė taikomojo DI bendrovę „AAI Labs“, kuriai vadovauja iki šiol.

2023 08 16 06:45

Spausdinti

#DIRBTINIS INTELEKTAS

#CHATGPT

#AAI LABS

#KALBOS SINTEZĖ

#MULTIMODALINĖ GENERACIJA