Краят е близо

Наближава моментът на сингулярността, в който човешкият мозък няма да може да проумеее новите технологии

Тодор Колев е технологичен предприемач с над 25 години опит като софтуерен инженер и архитект, основател е на софтуерното студио Obecto и блокчейн кооперацията Comrade Cooperative.

Той ще бъде участник в панела, посветен на AI, във второто издание на Technovation 2023, организиран от Мениджър. Подробности за събитието може да научите тук - http://bitly.ws/CdpA

„Краят е близо“ – така се шегуваме с колегите програмисти от нашия екип, когато видим демонстрация на поредния революционен машинно обучен модел. По принцип не се впечатляваме лесно, при положение че самите ние разработваме такива модели и дори се стремим да напредваме в академична насока – последният ни труд в областта на диалоговите агенти с изкуствен интелект беше публикуван в научния журнал на Асоциацията за компютърна лингвистика.

ОЩЕ ОТ #иновации

Откъде идва обаче това с края? Разбира се, има много препратки – от Библията до семейство Симпсън, но в случая най-релевантната връзка е с книгата на Рей Курцвайл „Сингулярността е близо“. Той е известен футурист и изобретател, като от 2012 г. до сега е инженерен директор на Google и ръководи разработките им в областта на изкуствения интелект.

Курцвайл забелязва, че количеството изчислителна мощ, което може да се купи за 1000 долара, следва закономерна експоненциална крива от зората на компютрите до сега, без да се влияе нито от войни, нито от кризи. Изглежда, че развитието на технологията се държи като неспираема природна сила, която следва своя път независимо от делата на нейните създатели, превръщайки скъпото и сложно в евтино и лесно.

С помощта на тази крива Курцвайл прави серия от точни технологични прогнози като това кога компютър ще победи световния шампион по шах и кога ще се появят смартфоните или автономно управляващите се коли. Това, че кривата е експоненциална, обаче означава, че скоростта на развитие на технологиите се ускорява. Причината е, че те се натрупват и ние използваме цялата налична досега технология, за да развиваме все по-бързо новата.

Така, ако продължим тази крива в бъдещето, би трябвало през 2029 г. да имаме изкуствен интелект, който е неразличим от човешкия, а до 2045 г. да съществува машина, която да е по-интелигентна от всички хора, взети заедно. Именно това е сингулярността – точката, след която не знаем какво следва.

Аз всъщност отдавна чакам да дойде текущата 2023 г. – това е годината, в която от десетилетия Курцвайл предвижда, че ще се появи първият изкуствен интелект, сравним, но все още различим от човешкия. И колкото и да е невероятно, точно това се случи.

thumbnail_technovation_2023_manager2.jpg

Изображение, генерирано чрез dreamstudio.ai от текстовото задание „Високотехнологична маймуна сънува технологичната сингулярност, комиксово изкуство“. Източник: Shutterstock

Събуди се, това не е сън

Разработките в областта на изкуствения интелект бяха в затишие няколко десетилетия, докато преди малко повече от 10 години, през 2012 г., т.нар. deep learning и конволюционните мрежи предизвикаха огромен скок в производителността на моделите за разпознаване на изображения. Те за пръв път станаха на практика широко приложими. Това възстанови интереса към технологиите за изкуствен интелект точно когато всички вече бяха загубили вяра, че те могат да бъдат ефективни за нещо повече от прости статистически задачи върху таблични данни.

Последва бум и в моделите, обучени с утвърждение (Reinforcement Learning), които следват определени цели – да играят игри или да управляват коли и робо тела. Световният шампион по шах Гари Каспаров пада от компютъра IBM Deep Blue още през 1997 г., но шахът е игра със сравнително малко възможни ходове и една машина може да провери всички възможности, преди да избере най-добрата. Стана интересно обаче, когато през 2016 г. машина побеждава световния шампион на играта Го, която има повече възможни комбинации от атомите във Вселената. Единственият начин да се намери правилният ход в тази игра е с интуиция и изглежда, че моделът AlphaGo на Google успя да покаже по-добра интуиция от най-добрия играч на Го сред хората.

Целият този напредък на изкуствения интелект всъщност идва от възможността машинните модели да „разбират“ контекста и смисъла на визуалната информация, която получават. В основата на това умение са конволюционните мрежи, които позволяват на модела да обръща внимание само на смислената визуална информация и да прави връзки между отделните елементи.

Когато става въпрос за текст или звук обаче, изкуственият интелект показваше доста скромен напредък до съвсем скоро. Повратната точка дойде през 2017 г., когато така наречените „трансформатори“ и техните „слоеве за внимание“ (attention layers) позволиха на моделите за обработка на текст да разбират смисъла на думите в контекста на целия текст по същия начин, по който конволюционните мрежи позволяват на моделите за обработка на изображения да разбират смисъла на групите пиксели в контекста на цялото изображение.

Това доведе до поредния квантов скок на изкуствения интелект и появата на така наречените големи езикови модели. Последните няколко години тези модели впечатляваха със своята „схватливост“, но все още бяха експериментална играчка за изследователите и имаха сравнително ограничено приложение в практиката. Това започна да се обръща някъде през 2020 г., когато моделът GPT-3 на OpenAI показа, че може да генерира текст, който, ако премрежим малко поглед, може да определим като текст, написан от човек.

И така, в самия край на 2022 г. излезе ChatGPT – усъвършенствана версия на GPT-3, префасонирана да води чат разговор не просто да изпълнява единични задачи. Това събитие най-вероятно един ден ще се изучава в часовете по история.

Ако човек води разговор с ChatGPT, може да забрави, че говори с машина. Този модел може да отговаря на всякакви въпроси, да изпълнява роли, като служител в колцентър например, както и да пише статии, стихотворения и дори програмен код.

Трябва да се има предвид, че ChatGPT е едва първият изкуствен интелект, който се доближава до човешкия. Налице е и по-усъвършенстваната му версия, базирана на GPT-4, както и отговора на Google, наречен Bard. Освен това вече навлизат и така наречените мултимодални модели, които работят едновременно с текст, изображения и физически обекти. Още от миналата година бяха демонстрирани такива цялостни модели, които не само водят разговор, но разпознават и генерират изображения, постигат свръхчовешко ниво на хиляди компютърни игри и дори могат да управляват робо ръка за изпълнение на различни физически задачи.

Вече няколко компании, включително „Тесла“ на Илън Мъск, са обявили, че работят по хуманоидни роботи, които ще започнат да репликират както до когнитивните, така и до физическите умения на хората. Скоро имаше и една странна случка, при която един от инженерите на Google твърдеше, чe разработваният от компанията изкуствен интелект е вече съзнателен и държи да бъде зачитан като такъв и моли изследователите да искат разрешението му, преди да експериментират с него.

thumbnail_technovation_2023_manager3.jpg

Mоделите, обучени с утвърждение, следват определени цели – да играят игри или да управляват коли и робо тела. Източник: Shutterstock

Какво ще правиш, ако нищо не трябва да правиш?

В основата на теорията за технологичната сингулярност е ефектът на натрупването.

Така напредъкът, който преди се е случвал за десетилетие, сега става за година. Скоро ще започне да става за месец, седмица и така до момента на сингулярността, когато натуралният човешки интелект дори в най-блестящата си форма няма дори да може да проумее новите технологии. Технологичната сингулярност е точката, в която дори ако мозъците на цялото човечество работят заедно в пълен синхрон, то пак ще обработват по-малко информация от машина, струваща няколко хиляди долара.

Този момент все още е сравнително далеч – според Курцвайл има поне още 20 години до технологичната сингулярност. Ако неговите прогнози дотук обаче са се сбъднали, то защо да не допуснем, че и останалите му предвиждания, които продължават експоненциалната крива напред в бъдещето, също ще са верни?

Най-честата причина хората да отказват да приемат тези прогнози е, че според тях съвсем скоро няма да има задача, в която човекът да превъзхожда машините, производителността на които всяка година расте в пъти, а възможностите на хората не се са променили значително в последните триста хиляди години.

Разбира се, това не означава, че човечеството ще изчезне или че няма да използва всички налични технологии като инструменти за постигане на целите си. Тук обаче е разликата – в бъдещето, изглежда, ще има по-скоро място за хора, следващи своите цели, отколкото за такива, изпълняващи задачи. Просто няма да има много смисъл някой да бъде „нает“ да изпълнява задача, при положение че изкуствен интелект със или без тяло ще я изпълни много по-ефективно.

Тази промяна сама по себе си е достатъчна, за да смени изцяло режима на функциониране на обществото и цивилизацията ни. За да има начало, трябва да има и край. На хоризонта вече се вижда вълната на технологичното цунами, заливащо целия свят, a хаосът започва да надделява над съществуващия ред, за да направи място за нов. Динамичните събития през последните години може би са само загрявка за това, което предстои, и причината за тях не е лудостта на един или друг световен лидер, а тектоничната промяна, предизвикана от експоненциалния растеж на технологиите. Дошло е времето да погледнем бъдещето в очите и да планираме срещата си с него. Моят личен план за тази среща започва с въпроса, какво ще правя, ако нищо не трябва да правя? Краят е близо, какъв е твоят план?

Статията е част от мартенския брой на списание ,,Мениджър”.

Основни партньори на събитието са iuvo, tbi bank, Bosch Домакински уреди България и BAT Bulgaria.

Събитието се провежда и с подкрепата на Lirex.

Институционални партньори са BASSCOM, AIBEST и Българска стопанска камара.

Медийни партньори са bTV, БНТ, dir.bg и dev.bg.