Дурны як бот
Спецыяльнасць: натуральнае лінгвістычнае праграмаванне

Вучоныя даўно вучаць комп размаўляць і разумець мову чалавека. На дадзены момант пэўныя поспехі ў гэтай галіне ўжо ёсць. Існуюць кампутарныя праграмы, якія распазнаюць чалавечы голас. Па-другое, комп “навучылі” рабіць пэўную працу за людзей: напрыклад, правяраць граматычныя памылкі ў англійскіх, французскіх, нямецкіх і іспанскіх тэкстах. І гэта яшчэ фігня!..

Ідэя выкарыстання кампутараў у натуральным лінгвістычным праграмаванні (NLP) узнікла ў гады Другой сусветнай вайны. Былі ў той час “хакеры”, якія лічылі, напрыклад, што руская мова – гэта тая ж англійская, толькі з іншым кодам. І калі ўзламаць код мовы, то можна спакойна зразумець англійскую. Прыкол, але менавіта гэтае трызненне сівой кабылы дало старт даследаванням NLP.

Мэта NLP-спецыялістаў – дызайн і распрацоўка праграмнага забеспячэння, якое б аналізава, разумела і генеравала чалвечыя мовы так, каб любы сапіенс у хуткім часе мог звяртацца да свайго кампутара як да звычайнага суразмоўцы. Адзіная праблема: людзі не гавораць літаратурнай мовай, і недасказаны кантэкст можа складаць да 90% іх выказванняў. А кампы ж – што тыя валёнкі не сякуць шматзначнасці слоў і выразаў, ім патрэбны поўны кантэкст.

Нехта Дуг Ленат паспрабаваў некалі надзяліць кампутар “энцыклапедычнымі ведамі” і ўвесці ў яго дзесяткі фактаў, вядомых кожнаму дурню. На гэта яму спатрэбілася 12 гадоў і 35 мільёнаў долараў. Вынікі былі так сабе: ніводны комп не можа кіравацца аднолькавай з чалавекам логікай. Ды і зашмат фактаў стваралі пэўныя праблемы і патрабавалі часу на пошук адказу.

Што за BOT’VA?

Метад спробаў і памылак таксама дае вынікі. NLP-спецыялісты распрацавалі гэтак званыя чатботы – кампутарныя праграмы, якія могуць весці простую размову. Першага чатбота прыдумаў матэматык Масачусецкага тэхналагічнага інстытута Джозэф Вайзэнбаум. Ён распрацаваў праграму, якая магла б даваць простыя адказы простаму (у якога націск у слове “звонит» заўсёды на першым сладзе) чалавеку. І назваў яе ELIZA ў гонар гераіні “Пігмаліёна” Элізы Дулітл, якая таксама вучылася правільнай англійскай. Механізм працы Элізы даволі просты: у ёй запраграмаваны асноўныя словы і фразы, якія ініцыююць адпаведныя адказы. Але ELIZA дзесьці ў глыбіні свайго алгарытму бландзінка – часта адказвае не ў тэму. Хаця NLP дзякуючы ёй прасунулася добранька.

Зараз у свеце чатботаў наогул – вар’ятня. Штогод філантроп Х’ю Лойбнер збірае ў сваёй нью-йоркскай кватэры пару-тройку кампутарных спецыялістаў дзеля таго, каб выявіць, якая з апошніх распрацовак наблізілася да чалавечага ўмення весці гаворку. Ужо не першы год ALICE, ELIZA, Eugene і Tony спрабуюць пераканаць Лойбнера і кампанію, што менавіта яны лепшыя за ўсіх. Чатыры гады запар першае месца займала ALICE, а яе стваральнік Рычард Уолес атрымліваў фінансавую ўзнагароду. Але ў 2005 годзе галоўны прыз у 3000 долараў узяла новая распрацоўка – George.

Стваральнік праграмы-пераможцы, кампутаршчык Рола Карпінтэр так апісвае свайго героя: “George прыкольны, амаль што заўсёды балбатлівы і нават гумарны. Часам ён тармозіць з адказам, часам выказвае пэўную варожасць ці дрэнны настрой, часам даказвае, што ён Дэн Браўн і напісаў “Код Да Вінчы”, часам вітае фразай “Хай, я не Джордж Буш”. Ён паразмаўляе з вамі і пра палітыку і пра рэлігію, і пра музыку. Здараецца, забываеш, што трындзіш з кампутарная праграмай. Чувакі завісаюць з George па 7 гадзін!”.

Фішка George у тым, што ён мае здольнасць вучыцца. Астатнія праграмы толькі назапашваюць ключавыя фразы і словы, а George аналізуе ўсе размовы, вывучае прынцып адказаў. Патрындзець з хлопцам можна на www.jabberwacky.com .

Голы энтузіязм

Ясна, што “энэлпісты” займаюцца не толькі распрацоўкай ботаў. Увосень 1998 года каманда энтузіястаў вырашыла праверыць, ці можна кланаваць чалавека, але ў выглядзе кампутарнай галасавой праграмы. У групе сабраліся выключна фэны Джона Ленана – яго і вырашылі зрабіць паддоследным пацучком. У 2000 годзе скончылася першая частка праекта John Lennon Artificial Intelligence Project – і сайт www.triumphpc.com стаў меккай для бітламанаў. Хлопцы сабралі выказванні і лірыку Джона, апрацавалі яе і стварылі праграму, падобную да чатбота, якая імітавала гутарку з самім Ленанам.

Гэта яшчэ што... Апошняя навінка ў гэтай галіне – чат-нянька, якая высочвае ў нэце педафілаў. “Сhatnannies” – праграмнае забеспячэнне, якое мае алгарытм, пабудаваны на прынцыпе аналізу выразаў суразмоўцы ў чаце і генерацыі разумных паведамленняў. “Сhatnannies” адаптуе стыль сваіх рэплік пад дзіцячую гутарку, а калі выяўляе пэўную цікавасць з боку інтэрнэт-вычварэнца, то перадае інфу пра яго ў паліцыю нораваў. Як сцвярджае распрацоўшчык Джым Уайтмэн, тэхналагічны кансультант з Вольвэрхэмптана (Вялікабрытанія), “Сhatnannies” можа генераваць бяконцую колькасць віртуальных дзяцей з розным стылем зносінаў у чатах. Гэты бот ужо апрабаваны ў некалькіх чатах, і ён быў прыняты за рэальнага чэла.

І ўсё гэта робіцца не на голым энтузіязме. Памянёны філантроп Х’ю Лойбнер абяцае прыз у 100 тысяч баксаў генію, які зможа стварыць чатбот, пры размове з якім журы не здагадаецца, што гэта кампутарная праграма.

Палепшы свой інтэрфэйс

Спецыялізацыя NLP (часам можна сустрэць фармулёўку computational linguistics) у асноўным прадстаўлена магістарскімі праграмамі, яікя можна знайсці на факультэтах інфамацыйных тэхналогій, кампутарных навук і значна радзей – на факультэтах лінгвістыкі. Даследчыя групы па NLP ёсць пры ўсіх вядучых “кампутарных” універах свету: гэта і Стэнфардскі універсітэт (Stanford), Кембрыдж (Cambridge), універсітэт імя Джорджа Вашынгтона (George Washington) і Джона Хопкінса (John Hopkins).

Прыкладны спіс прадметаў: асновы лінгвістыкі, логіка і тэорыя значэнняў, кампутарная лінгвістыка, структура чалавечай мовы і кампутарныя мовы, тыпалогія, псіхалінгвістыка, лічбавы маўленчы працэс, штучны інтэлект, NLP, дызайн інтэрфэйсу, аналіз чалавечых паводзінаў, візуальнае перакананне, кампутарная візуалізацыя, інфармацыйная архітэктура, праграмаванне, вышэйшае праграмаванне, статыстыка, тэхналагічныя дасягненні, двухзначнасць мовы і яе пераадольванне кампутарам, мадэляванне кампутарнай размовы, моўны і кампутарны аналіз, сістэмы вядзення дыялогаў, машынны пераклад, рэзюмаванне тэкстаў.

У Карнэльскім універсітэце на факультэце кампутарных наук (Cornell University, Department of Computer Sciences) адукацыю па NLP можна атрымаць за 31 300 долараў у год (але тут даюць стыпендыі). Спецыяльная ўмова – наяўнасць дыплома бакалаўра ў галіне матэматычных ці кампутарных навук, TOEFL і GRE.

Універсітэт паўднёвай Каліфорніі (University of Southern California, Department of Linguistics) прапануе адукацыю ў галіне кампутарнай лінвістыкі за 32 тысячы долараў у год. Спецыфіка: дыплом бакалаўра ў галіне матэматычных навук ці лінгвістыкі TOEFL і GRE.

У Мічыганскім універсітэце (University of Michogan, School of Information) па спецыялізацыі NLP можна атрымаць магістарскую адукацыю за 14 250 долараў у год + стыпендыі.

У Канадзе, як заўсёды, навучанне таннейшае, але не менш якаснае. Ва Універсітэце Таронта (University of Toronto), на факультэце кампутарных навук кошт адукацыі складае 16 800 канадскіх долараў у год. Умовы – бакалаўрскі дыплом, TOEFL і GRE, а ва Універсітэце Атава (University of Ottawa, School of Information Technologies and Engineering) атрыманне ступені магістра пацягне на 8253 канадскіх долараў у год пры тых самых умовах паступлення.

WEB: ведай больш

http://www.clt.mq.edu.au/survey/index.html -- спасылкі да універсітэцкіх праграм па спецыялізацыі NLP.

http://www.aaai.org/ALTopics/html/natlang.html -- суперсайт з цікавым артыкуламі (“інтэлектуальны нэт”, “што здарылася з машынамі, якія могуць думаць”), больш мудрагелістымі матэрыяламі (“будучыня NLP”, «аналіз тэкстаў і кампутарная лінгвістыка”), карысныя спасылкі на арганізацыі NLP, гайд да ўсіх чатботаў!

http://knihi.net/index.php?productID=425.

  • Оцени статью:
  • Проголосовало: 1
  • Балл: 5