АХУгЫпаЭлХ ТлаРЦХЭШп: ФШРЫХЪвл Ш ТЮЧЬЮЦЭЮбвШ

ёвРЪ, Тл ЯЮЫгзШЫШ ЮСйХХ ЯаХФбвРТЫХЭШХ Ю аХУгЫпаЭле ТлаРЦХЭШпе Ш ФТге ЯаЮУаРЬЬРе, Т ЪЮвЮале ЮЭШ ЯЮФФХаЦШТРовбп (egrep Ш Perl). ѕФЭРЪЮ нвЮ ТЮТбХ ЭХ ЮЧЭРзРХв, звЮ Тл бЬЮЦХвХ гбЯХиЭЮ ЯЮЫмЧЮТРвмбп ШЬШ Т ЫоСЮЩ ФагУЮЩ ЯаЮУаРЬЬХ. ЅРФХобм, ЪаРвЪЮХ ЧЭРЪЮЬбвТЮ б Python Т ЪЮЭжХ ЯаХФлФгйХЩ УЫРТл ЭРУЫпФЭЮ ЯЮЪРЧРЫЮ, звЮ ТЭХиЭШЩ ТШФ, Р вРЪЦХ ЮбЮСХЭЭЮбвШ ЯаШЬХЭХЭШп аХУгЫпаЭле ТлаРЦХЭШЩ ЮзХЭм бШЫмЭЮ ШЧЬХЭповбп Юв ЯаЮУаРЬЬл Ъ ЯаЮУаРЬЬХ.

ІЯаЮзХЬ, ТбХ ЭХ вРЪ бваРиЭЮ, ЯЮбЪЮЫмЪг Тл СлбваЮ ЯаШТлЪЭХвХ Ъ зРбвЮ ШбЯЮЫмЧгХЬлЬ ЯаЮУаРЬЬРЬ, ЭЮ ЧЭРвм Ю бгйХбвТгойШе аРЧЫШзШпе ТбХ ЦХ ЭХЮСеЮФШЬЮ.

ґЫп зХУЮ ЭРЯШбРЭР нвР УЫРТР

їаХЦФХ ТбХУЮ бЪРЦг, звЮ нвР УЫРТР ЭХ пТЫпХвбп бЯаРТЮзЭШЪЮЬ ЯЮ ЯаШЬХЭХЭШо аХУгЫпаЭле ТлаРЦХЭШЩ. П ЭХ бЮСШаРобм ЮЯШблТРвм ЮбЮСХЭЭЮбвШ ШбЯЮЫмЧЮТРЭШп аХУгЫпаЭле ТлаРЦХЭШЩ Т аРЧЭле гвШЫШвРе Ш пЧлЪРе ЯаЮУаРЬЬШаЮТРЭШп, ТбваХзРойШебп Т ЯаШЬХаРе нвЮЩ УЫРТл. єаЮЬХ вЮУЮ, Тл ЭХ ЭРЩФХвХ Т ЭХЩ ЯЮЫЭЮУЮ бЯШбЪР ТбХе ЬХвРбШЬТЮЫЮТ, ШбЯЮЫмЧгХЬле Т ЭРиХ ТаХЬп.

І нвЮЩ УЫРТХ ЯаШТХФХЭ ЮСйШЩ ЮСЧЮа аХУгЫпаЭле ТлаРЦХЭШЩ Ш вХе ЯаЮУаРЬЬЭле баХФбвТ, Т ЪЮвЮале ЮЭШ аХРЫШЧЮТРЭл. µбЫШ Тл ЦШТХвХ Т ЯХйХаХ Ш аРСЮвРХвХ вЮЫмЪЮ б ЮФЭЮЩ ЯаЮУаРЬЬЮЩ, ТЮЧЬЮЦЭЮ, Тл бЬЮЦХвХ бзРбвЫШТЮ ЯаЮЦШвм, ЭХ ЧРФгЬлТРпбм Ю вЮЬ, звЮ ФагУШХ ЯаЮУаРЬЬл (ШЫШ ФагУШХ ТХабШШ вЮЩ ЦХ ЯаЮУаРЬЬл) аРСЮвРов ШЭРзХ. ЅЮ вРЪ ЭХ СлТРХв, ЯЮнвЮЬг ЧЭРЭШХ «аЮФЮбЫЮТЭЮЩ» ТРиХЩ ЫоСШЬЮЩ ЯаЮУаРЬЬл ЮСХбЯХзШв ТРб ШЭвХаХбЭлЬШ Ш жХЭЭлЬШ бТХФХЭШпЬШ.

ІЮЮСйХ ЯЮЫХЧЭЮ ЯЮбЬЮваХвм, ЪРЪ ЮФЭШ Ш вХ ЦХ ЯаЮСЫХЬл аХиРовбп Т аРЧЭле ЯаЮУаРЬЬРе. ѕФЭРЪЮ нвР УЫРТР ФРХв ЫШим ЮСйХХ ЯаХФбвРТЫХЭШХ Ю вХЬХ — ЮбЭЮТЭЮЩ ЬРвХаШРЫ ШЧЫРУРХвбп Т ЯЮбЫХФгойШе УЫРТРе. ѕаШХЭвШагпбм Т аРЧЭЮЮСаРЧЭле РбЯХЪвРе ЯаШЬХЭХЭШп аХУгЫпаЭле ТлаРЦХЭШЩ, Тл бЬЮЦХвХ СлбваХХ ЮбТЮШвм ЭЮТлХ ЯаЮУаРЬЬл, Р ЮСйРп нагФШжШп ЯЮЬЮЦХв ТлСаРвм ЭРШСЮЫХХ ЯЮФеЮФпйШЩ ШЭбвагЬХЭв ФЫп аХиХЭШп ЪЮЭЪаХвЭЮЩ ЧРФРзШ.

ґЮ вЮУЮ, ЪРЪ Тл ЯЮЫгзШЫШ ЮбЭЮТРвХЫмЭЮХ ЯаХФбвРТЫХЭШХ Ю аХУгЫпаЭле ТлаРЦХЭШпе, УЮТЮаШвм ЮС нвЮЬ СлЫЮ СХббЬлбЫХЭЭЮ. ЅЮ Ш ФРЫмиХ п ЮвЪЫРФлТРвм ЭХ еЮзг, ЯЮбЪЮЫмЪг нвШ ФЮЯЮЫЭШвХЫмЭлХ бТХФХЭШп ЯаШУЮФпвбп ЯаШ ЯЮФаЮСЭЮЬ ЮЯШбРЭШШ вХеЭШзХбЪЮЩ аХРЫШЧРжШШ аХУгЫпаЭле ТлаРЦХЭШЩ, ЭРзШЭРп б УЫРТл 4.

ёбвЮаШп аХУгЫпаЭле ТлаРЦХЭШЩ

БЭРзРЫР п еЮзг ЯЮТХФРвм ЪаРвЪго ШбвЮаШо нТЮЫожШШ ЭХЪЮвЮале ФШРЫХЪвЮТ аХУгЫпаЭле ТлаРЦХЭШЩ Ш бЮЮвТХвбвТгойШе ЯаЮУаРЬЬ. ±ХаШвХ УЮапзго ЪагЦЪг (ШЫШ еЮЫЮФЭлЩ СЮЪРЫ) бТЮХУЮ ЫоСШЬЮУЮ ЭРЯШвЪР Ш гбваРШТРЩвХбм ЯЮгФЮСЭХХ. Іл гЧЭРХвХ, ЪРЪ ЯЮпТШЫШбм вХ бРЬлХ аХУгЫпаЭлХ ТлаРЦХЭШп, б ЪЮвЮалЬШ Ьл аРСЮвРХЬ бХУЮФЭп. НвЮв ЮСЧЮа ФЮСРТШв ЭЮТле ЪаРбЮЪ Т ЮСйго ЪРавШЭг Ш ЯЮЬЮЦХв ТРЬ ЫгзиХ ЮбЮЧЭРвм, ЯЮзХЬг бШвгРжШп б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ ТлУЫпФШв ШЬХЭЭЮ вРЪ, Р ЭХ ШЭРзХ.

grep ЪРЪ ЬШаЮТЮЧЧаХЭШХ

ЅРиР ШбвЮаШп ЭРзШЭРХвбп б ЯаЮУаРЬЬл grep — ЯаХФЪР egrep Ш, ТХаЮпвЭЮ, бРЬЮЩ аРбЯаЮбваРЭХЭЭЮЩ ЯаЮУаРЬЬл б ЯЮФФХаЦЪЮЩ аХУгЫпаЭле ТлаРЦХЭШЩ. НвР ЯаЮУаРЬЬР ЯЮпТШЫРбм Т бХЬХЩбвТХ Unix Т бХаХФШЭХ 1970-е УЮФЮТ Ш б вХе ЯЮа СлЫР ЯХаХЭХбХЭР ЯаРЪвШзХбЪШ ЭР ТбХ бЮТаХЬХЭЭлХ бШбвХЬл. БгйХбвТгов ФХбпвЪШ аРЧЭле (ШЭЮУФР ЮзХЭм аРЧЭле) ТХабШЩ grep ФЫп DOS.

ІЮЧЬЮЦЭЮ, Тл ЯЮЫРУРХвХ, звЮ вРЪРп аРбЯаЮбваРЭХЭЭРп ЯаЮУаРЬЬР-ТХвХаРЭ гбвРЭЮТШЫР ЪРЪШХ-вЮ бвРЭФРавл Т ЮСЫРбвШ аХУгЫпаЭле ТлаРЦХЭШЩ? є бЮЦРЫХЭШо, ЭШзХУЮ ЯЮФЮСЭЮУЮ. їХаХЪЫозРЩвХбм Т аХЦШЬ «аРЧТЫХЪРвХЫмЭЮУЮ звХЭШп» — Ьл ТХаЭХЬбп Ъ ШбвЮЪРЬ Ш ЯаЮбЫХФШЬ ЧР аРЧТШвШХЬ бЮСлвШЩ б бРЬЮУЮ ЭРзРЫР.

јШа ФЮ ЯЮпТЫХЭШп grep

БХЬХЭР аХУгЫпаЭле ТлаРЦХЭШЩ СлЫШ ЯЮбРЦХЭл Т ЭРзРЫХ 1940-е УЮФЮТ. ґТЮХ ЭХЩаЮдШЧШЮЫЮУЮТ, ГЮааХЭ јРЪ-єРЫЫЮе (Warren McCulloch) Ш ГЮЫвХа їШввб (Walter Pitts), ЧРЭШЬРЫШбм ЬЮФХЫШаЮТРЭШХЬ аРСЮвл ЭХаТЭЮЩ бШбвХЬл ЭР ЭХЩаЮЭЭЮЬ<$M[R3-9]> гаЮТЭХ[1]. АХУгЫпаЭлХ ТлаРЦХЭШп ТЮЯЫЮвШЫШбм Т аХРЫмЭЮбвм зХаХЧ ЭХбЪЮЫмЪЮ ЫХв, ЪЮУФР ЬРвХЬРвШЪ БвШТХЭ єЫШЭ (Stephen Kleene) дЮаЬРЫмЭЮ ЮЯШбРЫ нвШ ЬЮФХЫШ ЯаШ ЯЮЬЮйШ РЫУХСал, ЪЮвЮаго ЮЭ ЭРЧТРЫ аХУгЫпаЭлЬШ ЬЭЮЦХбвТРЬШ (regular sets). ѕЭ аРЧаРСЮвРЫ ФЫп аХУгЫпаЭле ЬЭЮЦХбвТ ЯаЮбвго ЬРвХЬРвШзХбЪго ЧРЯШбм, ЪЮвЮаго Ш ЭРЧТРЫ аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ.

І 1950-е Ш 60-е УЮФРе аХУгЫпаЭлХ ТлаРЦХЭШп бвРЫШ ЯаХФЬХвЮЬ бХамХЧЭЮУЮ ШЧгзХЭШп Т ЪагУРе вХЮаХвШзХбЪЮЩ ЬРвХЬРвШЪШ. АЮСХав єЮЭбвХЩСЫ (Robert Constable) ЭРЯШбРЫ еЮаЮиго бвРвмо[2] ФЫп бЯХжШРЫШбвЮТ-ЬРвХЬРвШЪЮТ. ЕЮвп бгйХбвТгов бТШФХвХЫмбвТР Ю СЮЫХХ аРЭЭШе аРСЮвРе, ЯХаТЮЩ ЯгСЫШЪРжШХЩ, ЯЮбТпйХЭЭЮЩ ЯаШЬХЭХЭШо аХУгЫпаЭле ТлаРЦХЭШЩ Т ЮСЫРбвШ ЪЮЬЯмовХаЭле вХеЭЮЫЮУШЩ, ЪЮвЮаго ЬЭХ гФРЫЮбм ЮСЭРагЦШвм, СлЫР бвРвмп єХЭР ВЮЬЯбЮЭР «Regular Expression Search Algorithm» Юв 1968 УЮФР[3]. І нвЮЩ бвРвмХ ВЮЬЯбЮЭ ЮЯШблТРХв ЪЮЬЯШЫпвЮа аХУгЫпаЭле ТлаРЦХЭШЩ, УХЭХаШагойШЩ ЮСкХЪвЭлЩ ЪЮФ IBM 7094. НвЮ ЯЮФвЮЫЪЭгЫЮ ХУЮ Ъ аРСЮвХ ЭРФ qed — аХФРЪвЮаЮЬ, ЪЮвЮалЩ СлЫ ЯЮЫЮЦХЭ Т ЮбЭЮТг ШЧТХбвЭЮУЮ аХФРЪвЮаР Unix ed. АХУгЫпаЭлХ ТлаРЦХЭШп ed гбвгЯРЫШ ЯЮ бТЮШЬ ТЮЧЬЮЦЭЮбвпЬ ТлаРЦХЭШпЬ qed, ЭЮ ШЬХЭЭЮ ЮЭШ ТЯХаТлХ ЯЮЫгзШЫШ иШаЮЪЮХ аРбЯаЮбваРЭХЭШХ ЧР ЯаХФХЫРЬШ вХЮаХвШзХбЪШе ЪагУЮТ. ѕФЭР ШЧ ЪЮЬРЭФ ed ТлТЮФШЫР бваЮЪШ аХФРЪвШагХЬЮУЮ дРЩЫР, Т ЪЮвЮале ЭРеЮФШЫЮбм бЮТЯРФХЭШХ ФЫп ЧРФРЭЭЮУЮ аХУгЫпаЭЮУЮ ТлаРЦХЭШп. НвР ЪЮЬРЭФР, «g/аХУгЫпаЭЮХ ТлаРЦХЭШХ/p», зШвРЫРбм ЪРЪ «Global Regular Expression Print» («УЫЮСРЫмЭлЩ ТлТЮФ ЯЮ аХУгЫпаЭЮЬг ТлаРЦХЭШо»). ДгЭЪжШп ЮЪРЧРЫРбм ЭРбвЮЫмЪЮ ЯЮЫХЧЭЮЩ, звЮ СлЫР ЯаХЮСаРЧЮТРЭР Т ЮвФХЫмЭго гвШЫШвг. ВРЪ ЯЮпТШЫРбм ЯаЮУаРЬЬР grep.

јХвРбШЬТЮЫл grep

АХУгЫпаЭлХ ТлаРЦХЭШп, ЯЮФФХаЦШТРХЬлХ аРЭЭШЬШ ЯаЮУаРЬЬРЬШ, ЧРЬХвЭЮ гбвгЯРЫШ ЯЮ бТЮШЬ ТЮЧЬЮЦЭЮбвпЬ ТлаРЦХЭШпЬ egrep. јХвРбШЬТЮЫ * ЯЮФФХаЦШТРЫбп, ЭЮ + Ш ? ЭХ ЯЮФФХаЦШТРЫШбм (ЯаШзХЬ ЮвбгвбвТШХ ЯЮбЫХФЭХУЮ СлЫЮ ЮбЮСХЭЭЮ бШЫмЭлЬ ЭХФЮбвРвЪЮЬ). ґЫп УагЯЯШаЮТЪШ ЬХвРбШЬТЮЫЮТ Т grep ШбЯЮЫмЧЮТРЫРбм ЪЮЭбвагЪжШп $…$, Р ЭХнЪаРЭШаЮТРЭЭлХ ЪагУЫлХ бЪЮСЪШ пТЫпЫШбм ЫШвХаРЫРЬШ[4]. їаЮУаРЬЬР grep ЯЮФФХаЦШТРЫР ЯаШТпЧЪг Ъ ЯЮЧШжШпЬ бваЮЪШ, ЭЮ Т ЮУаРЭШзХЭЭЮЬ ТРаШРЭвХ. µбЫШ бШЬТЮЫ ^ ЭРеЮФШЫбп Т ЭРзРЫХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп, ЮЭ ЯаХФбвРТЫпЫ бЮСЮЩ ЬХвРбШЬТЮЫ, бЮТЯРФРойШЩ б ЭРзРЫЮЬ бваЮЪШ (ЪРЪ Т egrep Ш Perl). І ЯаЮвШТЭЮЬ бЫгзРХ ЮЭ ТЮЮСйХ ЭХ бзШвРЫбп ЬХвРбШЬТЮЫЮЬ Ш ЯаЮбвЮ ЮСЮЧЭРзРЫ бЮЮвТХвбвТгойШЩ ЫШвХаРЫ. °ЭРЫЮУШзЭЮ, бШЬТЮЫ $ бзШвРЫбп ЬХвРбШЬТЮЫЮЬ вЮЫмЪЮ Т ЪЮЭжХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп. І аХЧгЫмвРвХ вХапЫРбм ТЮЧЬЮЦЭЮбвм ШбЯЮЫмЧЮТРЭШп ТлаРЦХЭШЩ ТШФР [end$|^start]. ІЯаЮзХЬ, нвЮ ЭХбгйХбвТХЭЭЮ, ЯЮбЪЮЫмЪг ЪЮЭбвагЪжШп ТлСЮаР ТбХ аРТЭЮ ЭХ ЯЮФФХаЦШТРЫРбм.

ІЧРШЬЮФХЩбвТШХ ЬХвРбШЬТЮЫЮТ вРЪЦХ ЮвЫШзРЫЮбм ЭХЪЮвЮалЬШ ЮбЮСХЭЭЮбвпЬШ. ЅРЯаШЬХа, ЮФШЭ ШЧ УЫРТЭле ЭХФЮбвРвЪЮТ grep ЧРЪЫозРЫбп Т вЮЬ, звЮ ЪТРЭвШдШЪРвЮа * ЭХ ЬЮУ ЯаШЬХЭпвмбп Ъ ТлаРЦХЭШпЬ Т ЪагУЫле бЪЮСЪРе, Р вЮЫмЪЮ Ъ ЫШвХаРЫРЬ, бШЬТЮЫмЭлЬ ЪЫРббРЬ ШЫШ ЬХвРбШЬТЮЫг «вЮзЪР». БЫХФЮТРвХЫмЭЮ, Т grep бЪЮСЪШ ЯаХФЭРЧЭРзРЫШбм вЮЫмЪЮ ФЫп бЮеаРЭХЭШп бЮТЯРТиХУЮ вХЪбвР (ЪРЪ, ЭРЯаШЬХа, ЯаШ ЯЮШбЪХ ЯЮТвЮапойШебп бЫЮТ Т ТлаРЦХЭШШ [$[a-z]+$spc\1]), ЭЮ ЭХ ФЫп ЮСйХЩ УагЯЯШаЮТЪШ. ±ЮЫХХ вЮУЮ, Т ЭХЪЮвЮале аРЭЭШе ТХабШпе grep ЭХ ФЮЯгбЪРЫШбм ТЫЮЦХЭЭлХ ЪагУЫлХ бЪЮСЪШ.

ІбХ вХзХв, ТбХ ШЧЬХЭпХвбп

НТЮЫожШп grep

ЕЮвп grep бгйХбвТгХв ТЮ ЬЭЮУШе бШбвХЬРе Ш Т ЭРиШ ФЭШ, п Т ЮбЭЮТЭЮЬ УЮТЮаШЫ ЮС нвЮЩ ЯаЮУаРЬЬХ Т ЯаЮиХФиХЬ ТаХЬХЭШ, ЯЮбЪЮЫмЪг аХзм иЫР Ю ФШРЫХЪвХ аХУгЫпаЭле ТлаРЦХЭШЩ Т бвРале ТХабШпе 20-ЫХвЭХЩ ФРТЭЮбвШ. ѕФЭРЪЮ вХеЭЮЫЮУШп ЭХ бвЮШв ЭР ЬХбвХ, Ш бЮ ТаХЬХЭХЬ бвРалХ ЯаЮУаРЬЬл ФЮЯЮЫЭповбп ЭЮТлЬШ ТЮЧЬЮЦЭЮбвпЬШ. їаЮУаРЬЬР grep ЭХ пТЫпХвбп ШбЪЫозХЭШХЬ.

І AT&T Bell Labs grep ФЮЯЮЫЭШЫШ ЭЮТлЬШ ТЮЧЬЮЦЭЮбвпЬШ — ЭРЯаШЬХа, ШЭвХаТРЫмЭлЬ ЪТРЭвШдШЪРвЮаЮЬ \{ЬШЭ, ЬРЪб\} (бЬ. УЫРТг 1), ЯЮЧРШЬбвТЮТРЭЭлЬ ШЧ ЯаЮУаРЬЬл lex. ВРЪЦХ СлЫР ШбЯаРТЫХЭР ЮиШСЪР б ЪЫозЮЬ -y, ЪЮвЮалЩ ФЮЫЦХЭ СлЫ ЮСХбЯХзШТРвм ЯЮШбЪ СХЧ гзХвР аХУШбваР, ЭЮ аРСЮвРЫ ЭХЭРФХЦЭЮ. ѕФЭЮТаХЬХЭЭЮ Т ±ХаЪЫШ СлЫШ ФЮСРТЫХЭл ЬХвРбШЬТЮЫл ЭРзРЫР Ш ЪЮЭжР бЫЮТР, Р ЪЫоз -y СлЫ ЯХаХШЬХЭЮТРЭ Т -i. є бЮЦРЫХЭШо, * Ш ФагУШХ ЪТРЭвШдШЪРвЮал ТбХ ХйХ ЭХ ЬЮУЫШ ЯаШЬХЭпвмбп Ъ ТлаРЦХЭШпЬ Т ЪагУЫле бЪЮСЪРе.

НТЮЫожШп egrep

є нвЮЬг ТаХЬХЭШ °ЫмдаХФ °еЮ (Alfred Aho) ЭРЯШбРЫ ЯаЮУаРЬЬг egrep, ЪЮвЮаРп ЯЮФФХаЦШТРЫР СЮЫмиШЭбвТЮ ЬХвРбШЬТЮЫЮТ, ЮЯШбРЭЭле Т УЫРТХ 1. µйХ ТРЦЭХХ вЮ, звЮ ЯаЮУаРЬЬР СлЫР аХРЫШЧЮТРЭл бЮТХаиХЭЭЮ ШЭлЬ (Ш ЮСлзЭЮ СЮЫХХ нддХЪвШТЭлЬ) бЯЮбЮСЮЬ. ІРаШРЭвРЬ аХРЫШЧРжШШ Ш Ше ЧЭРзХЭШо ФЫп ЯЮЫмЧЮТРвХЫп ЯЮбТпйХЭл ФТХ бЫХФгойШХ УЫРТл. І egrep ЭХ вЮЫмЪЮ ЯЮпТШЫШбм ЭЮТлХ ЪТРЭвШдШЪРвЮал + Ш ?, ЭЮ Ш ЮЭШ ЭРапФг б ФагУШЬШ ЪТРЭвШдШЪРвЮаРЬШ бвРЫШ ЯаШЬХЭпвмбп Ъ ТлаРЦХЭШпЬ Т ЪагУЫле бЪЮСЪРе, звЮ ЧЭРзШвХЫмЭЮ аРбиШаШЫЮ ТЮЧЬЮЦЭЮбвШ аХУгЫпаЭле ТлаРЦХЭШЩ egrep.

ВРЪЦХ СлЫР ФЮСРТЫХЭР ЪЮЭбвагЪжШп ТлСЮаР, Р ЬХвРбШЬТЮЫл ЯаШТпЧЪШ ЯЮЫгзШЫШ «аРТЭЮЯаРТШХ», вЮ Хбвм ЬЮУЫШ ШбЯЮЫмЧЮТРвмбп ЯаРЪвШзХбЪШ Т ЫоСЮЬ ЬХбвХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп. єЮЭХзЭЮ, г egrep СлЫШ бТЮШ ЯаЮСЫХЬл — ШЭЮУФР ЯаЮУаРЬЬР ЭРеЮФШЫР бЮТЯРФХЭШХ, ЭЮ ЭХ ТЪЫозРЫР ХУЮ Т аХЧгЫмвРв, Р вРЪЦХ ЭХ ЯЮФФХаЦШТРЫР ЭХЪЮвЮалХ аРбЯаЮбваРЭХЭЭлХ ТЮЧЬЮЦЭЮбвШ. ё ТбХ ЦХ ЯЮЫмЧл ЮЭР ЯаШЭЮбШЫР ЭР ЯЮапФЮЪ СЮЫмиХ.

їЮпТЫХЭШХ ФагУШе ТШФЮТ

І нвЮ ТаХЬп ЯЮпТШЫШбм Ш ЭРзРЫШ аРЧТШТРвмбп ФагУШХ ЯаЮУаРЬЬл (вРЪШХ, ЪРЪ awk, sed Ш lex). АРЧаРСЮвзШЪ, ЪЮвЮаЮЬг ЭаРТШЫРбм ЪРЪРп-вЮ ТЮЧЬЮЦЭЮбвм ЮФЭЮЩ ЯаЮУаРЬЬл, зРбвЮ ЯлвРЫбп аХРЫШЧЮТРвм ХХ Т ФагУЮЩ ЯаЮУаРЬЬХ. ёЭЮУФР нвЮ ЯаШТЮФШЫЮ Ъ ЯХзРЫмЭлЬ ЯЮбЫХФбвТШпЬ. ЅРЯаШЬХа, ХбЫШ ТРЬ ТФагУ ЧРеЮвХЫЮбм ТЪЫозШвм Т grep ЯЮФФХаЦЪг ЪТРЭвШдШЪРвЮаР «ЯЫоб», ФЫп нвЮЩ жХЫШ ЭХЫмЧп СлЫЮ ШбЯЮЫмЧЮТРвм бШЬТЮЫ +, ЯЮбЪЮЫмЪг Т grep ЮЭ ваРФШжШЮЭЭЮ ЭХ пТЫпЫбп ЬХвРбШЬТЮЫЮЬ, Ш ЭХЮЦШФРЭЭЮХ ЯаХТаРйХЭШХ гФШТШЫЮ Сл ЯЮЫмЧЮТРвХЫХЩ. їЮбЪЮЫмЪг ЪЮЬСШЭРжШп \+ Т ЮСлзЭле гбЫЮТШпе ТбваХзРХвбп аХФЪЮ, ХХ ЬЮЦЭЮ бЬХЫЮ бТпЧРвм б ЬХвРбШЬТЮЫЮЬ «ЮФШЭ ШЫШ СЮЫмиХ».

ёЭЮУФР аХРЫШЧРжШп ЭЮТле ТЮЧЬЮЦЭЮбвХЩ бЮЯаЮТЮЦФРХвбп ЯЮпТЫХЭШХЬ ЭЮТле ЮиШСЮЪ. ±лТРХв Ш вРЪ, звЮ ФЮСРТЫХЭЭРп ТЮЧЬЮЦЭЮбвм ЯЮЧФЭХХ ШбЪЫозРХвбп. јЭЮУШХ ЭХЮзХТШФЭлХ РбЯХЪвл, бТпЧРЭЭлХ б ФШРЫХЪвЮЬ ЪЮЭЪаХвЭЮЩ ЯаЮУаРЬЬл, ФЮЪгЬХЭвШаговбп ЭХЯЮЫЭЮ ШЫШ ТЮЮСйХ ЭХ ФЮЪгЬХЭвШаговбп, ЯЮнвЮЬг ЭЮТлХ ЯаЮУаРЬЬл ЫШСЮ ШЧЮСаХвРов бЮСбвТХЭЭлЩ бвШЫм, ЫШСЮ ЯлвРовбп ШЬШвШаЮТРвм вЮ, звЮ «УФХ-вЮ аРСЮвРЫЮ».

ГЬЭЮЦмвХ нвЮ ЮСбвЮпвХЫмбвТЮ ЭР ЯаЮиХФиХХ ТаХЬп Ш ЪЮЫШзХбвТЮ ЯаЮУаРЬЬ, Ш Т аХЧгЫмвРвХ ЯЮЫгзШвбп бгйРп ЭХаРЧСХаШеР (ЮбЮСХЭЭЮ ЪЮУФР РТвЮа ЯаЮУаРЬЬл ЯлвРХвбп ЧРЭШЬРвмбп ЭХбЪЮЫмЪШЬШ ФХЫРЬШ баРЧг[5]). БШвгРжШп ЭХЬЭЮУЮ ЯаЮпбЭШЫРбм Т 1986 УЮФг, ЪЮУФР іХЭаШ БЯХЭбХа (Henry Spencer) ТлЯгбвШЫ ЯХаТлЩ ЯРЪХв ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ ЭР пЧлЪХ C. »оСЮЩ ЦХЫРойШЩ ЬЮУ СХбЯЫРвЭЮ ТЪЫозШвм нвЮв ЯРЪХв Т бТЮо ЯаЮУаРЬЬг. ІбХ ЯаЮУаРЬЬл, ШбЯЮЫмЧЮТРТиШХ нвЮв ЯРЪХв (Р вРЪШХ ЯаЮУаРЬЬл СлЫШ, Ш ЭХЬРЫЮ), ЯЮФФХаЦШТРЫШ ЮФШЭ Ш вЮв ЦХ бЮУЫРбЮТРЭЭлЩ ФШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ — ХбЫШ вЮЫмЪЮ РТвЮа ЭХ ТЭЮбШЫ Т ЭХУЮ бЮЧЭРвХЫмЭлХ ШЧЬХЭХЭШп.

Б ЯХаТЮУЮ ТЧУЫпФР

ґЮбвРвЮзЭЮ ТЧУЫпЭгвм ЫШим ЭР ЭХЪЮвЮалХ РбЯХЪвл аРбЯаЮбваРЭХЭЭле ЯаЮУаРЬЬ, звЮСл ЯЮЭпвм, ЪРЪ бШЫмЭЮ ЮЭШ ЮвЫШзРовбп ФагУ Юв ФагУР. І вРСЫ. 3.1 ЯаШТХФХЭР ЮзХЭм ЯЮТХаеЭЮбвЭРп бТЮФЪР ФШРЫХЪвЮТ ЭХЪЮвЮале ЯаЮУаРЬЬ (нвЮ бЮЪаРйХЭЭлЩ ТРаШРЭв вРСЫ. 6.1 ЭР б. <$R[P#,R6-1]>).<$M[R3-27]>

ВРСЫШжР 3.1. їЮТХаеЭЮбвЭлЩ ЮСЧЮа ФШРЫХЪвЮТ ЭХЪЮвЮале аРбЯаЮбваРЭХЭЭле ЯаЮУаРЬЬ

ВРЪШХ вРСЫШжл зРбвЮ ЯаШТЮФпвбп Т ЪЭШУРе ФЫп ЭРУЫпФЭЮЩ ФХЬЮЭбваРжШШ аРЧЫШзШЩ ЬХЦФг ФагУШЬШ ШЭбвагЬХЭвРЬШ. ЅЮ ЧФХбм вРСЫШжР Т ЫгзиХЬ бЫгзРХ ЮвЪалТРХв ТХаегиЪг РЩбСХаУР — г ЯХаХзШбЫХЭЭле ТЮЧЬЮЦЭЮбвХЩ бгйХбвТгов ФХбпвЪШ ТРЦЭле РбЯХЪвЮТ, Т вЮЬ зШбЫХ бЫХФгойШХ<$M[R3-17]>:

l јЮЦХв ЫШ * Ш ФагУШХ ЪТРЭвШдШЪРвЮал ЯаШЬХЭпвмбп Ъ ТлаРЦХЭШпЬ, ЧРЪЫозХЭЭлЬ Т ЪагУЫлХ бЪЮСЪШ?

l јЮЦХв ЫШ вЮзЪР бЮТЯРФРвм б бШЬТЮЫЮЬ ЭЮТЮЩ бваЮЪШ? ° ШЭТХавШаЮТРЭЭлХ бШЬТЮЫмЭлХ ЪЫРббл? ё ЪРЪ ЭРбзХв ЭгЫм-бШЬТЮЫР?

l є ЪРЪЮЩ бваЮЪХ ЯаШТпЧлТРовбп пЪЮаЭлХ ЬХвРбШЬТЮЫл — жХЫХТЮЩ ШЫШ ЫЮУШзХбЪЮЩ? є ЮСХШЬ? ЅШ Ъ ЮФЭЮЩ? ПТЫповбп ЫШ ЮЭШ ЯЮЫЭЮЯаРТЭлЬШ ЬХвРбШЬТЮЫРЬШ ШЫШ ФЮЯгбЪРовбп вЮЫмЪЮ Т ЮЯаХФХЫХЭЭле зРбвпе аХУгЫпаЭЮУЮ ТлаРЦХЭШп?

l АРбЯЮЧЭРовбп ЫШ нЪаРЭШаЮТРЭЭлХ бШЬТЮЫл Т бШЬТЮЫмЭле ЪЫРббРе? єРЪШХ ХйХ бШЬТЮЫл аРЧаХиРовбп ШЫШ ЧРЯаХйРовбп Т бШЬТЮЫмЭле ЪЫРббРе?

l АРЧаХиРХвбп ЫШ ТЫЮЦХЭШХ ЪагУЫле бЪЮСЮЪ? µбЫШ аРЧаХиРХвбп, вЮ ЭР бЪЮЫмЪЮ гаЮТЭХЩ (Ш ТЮЮСйХ бЪЮЫмЪЮ ЪагУЫле бЪЮСЮЪ ЬЮЦХв ЯаШбгвбвТЮТРвм Т ТлаРЦХЭШШ)?

l ґЮЯгбЪРХвбп ЫШ нЪаРЭШаЮТРЭШХ ТЮбмЬХаШзЭле ЪЮФЮТ бШЬТЮЫЮТ? µбЫШ ФЮЯгбЪРХвбп, вЮ ЪРЪ аРЧаХиРовбп ЪЮЭдЫШЪвл б ЮСаРвЭлЬШ бблЫЪРЬШ? ° ЪРЪ ЭРбзХв нЪаРЭШаЮТРЭШп иХбвЭРФжРвХаШзЭле ЪЮФЮТ? ё ЪвЮ Т ФХЩбвТШвХЫмЭЮбвШ ЯЮФФХаЦШТРХв ТЮбмЬХаШзЭлХ Ш иХбвЭРФжРвХаШзЭлХ ЪЮФл — ЬХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ ШЫШ ЪРЪРп-вЮ ФагУРп зРбвм ЯаЮУаРЬЬл?

l БЮТЯРФРХв ЫШ [\w] вЮЫмЪЮ б РЫдРТШвЭЮ-жШдаЮТлЬШ бШЬТЮЫРЬШ ШЫШ ФЮЯгбЪРовбп ХйХ ЪРЪШХ-вЮ ФагУШХ бШЬТЮЫл? (ІбХ ваШ ЯаЮУаРЬЬл б ЯЮФФХаЦЪЮЩ \w, ЯХаХзШбЫХЭЭлХ Т вРСЫ. 3.1, ШЭвХаЯаХвШагов нвЮв бШЬТЮЫ ЯЮ-аРЧЭЮЬг!)

l µбЫШ ЯаЮУаРЬЬР ЯЮФФХаЦШТРХв ЬХвРбШЬТЮЫ \n, вЮ звЮ ШЬХЭЭЮ нвЮ ЮЧЭРзРХв? їЮФФХаЦШТРовбп ЫШ ФагУШХ ТбЯЮЬЮУРвХЫмЭлХ ЬХвРбШЬТЮЫл?

ґРЦХ ЯаШ вРЪЮЬ ЯЮТХаеЭЮбвЭЮЬ ЮСЧЮаХ, ЪРЪ Т вРСЫ. 3.1, ЯаШеЮФШвбп гзШвлТРвм ЬЭЮЦХбвТЮ дРЪвЮаЮТ. µбЫШ Тл ЯЮЩЬХвХ, звЮ ЯЮФ УЫРФЪЮЩ ЯЮТХаеЭЮбвмо ЪаЮХвбп ЭХЬРЫЮ ЯЮФТЮФЭле ЪРЬЭХЩ, вЮ бЬЮЦХвХ СХЧ ЮбЮСЮУЮ вагФР ЮСЮЩвШ Ше. ВРЪЦХ бЫХФгХв ЯЮЬЭШвм, звЮ ЬЭЮУШХ ЯаЮУаРЬЬл ЮвЫШзРовбп Юв ЯЮбвРТйШЪР Ъ ЯЮбвРТйШЪг Ш Юв ТХабШШ Ъ ТХабШШ. їЮбЪЮЫмЪг Т вРСЫ. 3.1 ЯаШТХФХЭ ЫШим ЮзХЭм ЪаРвЪШЩ баРТЭШвХЫмЭлЩ ЮСЧЮа, п ЮУаРЭШзШЫбп бРЬлЬШ аРбЯаЮбваРЭХЭЭлЬШ ТЮЧЬЮЦЭЮбвпЬШ ЯЮбЫХФЭШе ТХабШЩ. ЅРЯаШЬХа, GNU-ТХабШШ ЬЭЮУШе аРбЯаЮбваРЭХЭЭле ЯаЮУаРЬЬ ЯЮзвШ ТбХУФР аРСЮвРов ЭРФХЦЭХХ Ш ЮСЫРФРов СЮЫмиШЬШ ТЮЧЬЮЦЭЮбвпЬШ, зХЬ ФагУШХ ТХабШШ.

АРЧЫШзШп Т бХЬРЭвШЪХ ЯЮШбЪР бЮТЯРФХЭШЩ (ШЫШ ЯЮ ЪаРЩЭХЩ ЬХаХ Т вЮЬ, ЪРЪ ЮЭР ТлУЫпФШв ШЧТЭХ) пТЫповбп ЮзХЭм ТРЦЭлЬ дРЪвЮаЮЬ, ЪЮвЮалЩ ЭХаХФЪЮ гЯгбЪРХвбп ШЧ ТШФг Т ФагУШе ЮСЧЮаРе. µбЫШ Тл ЧЭРХвХ, звЮ ТлаРЦХЭШХ, ЪЮвЮаЮХ ЭР awk ТлУЫпФШв ЪРЪ [(Jul|July)], Т GNU Emacs ФЮЫЦЭЮ ЧРЯШблТРвмбп Т ТШФХ [$Jul|July$], ЬЮЦЭЮ ЯЮФгЬРвм, звЮ ФРЫмиХ ТбХ ШФХв ЮФШЭРЪЮТЮ. НвЮ ЭХ ТбХУФР вРЪ — Т ЭХЪЮвЮале бШвгРжШпе ФЫп ТЭХиЭХ ЯЮеЮЦШе ТлаРЦХЭШЩ ШбЯЮЫмЧговбп аРЧЭлХ ЬХеРЭШЧЬл ЯЮШбЪР (ЪРЪ Т ЯаШТХФХЭЭЮЬ ЯаШЬХаХ). НвЮв ТРЦЭлЩ ТЮЯаЮб аРббЬРваШТРХвбп Т бЫХФгойХЩ УЫРТХ.

єЮЭХзЭЮ, вЮ, звЮ ЯаЮУаРЬЬР ЬЮЦХв бФХЫРвм б аХУгЫпаЭлЬ ТлаРЦХЭШХЬ, ЭХаХФЪЮ ШУаРХв СЮЫХХ ТРЦЭго аЮЫм, зХЬ ЯЮФФХаЦШТРХЬлЩ ХЩ ФШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ. ґРЦХ ХбЫШ Сл аХУгЫпаЭлХ ТлаРЦХЭШп Perl гбвгЯРЫШ egrep ЯЮ бТЮШЬ ТЮЧЬЮЦЭЮбвпЬ, СЫРУЮФРап УШСЪШЬ баХФбвТРЬ Ше ШбЯЮЫмЧЮТРЭШп Perl ТбХ аРТЭЮ ЯаШЭЮбШЫ Сл СЮЫмиХ ЯЮЫмЧл. їЮнвЮЬг, еЮвп вРСЫ. 3.1 ФРХв ЯаХФбвРТЫХЭШХ Ю ТЮЧЬЮЦЭЮбвпе ЭХЪЮвЮале ФШРЫХЪвЮТ, ЯЮ ЭХЩ ЭХ бвЮШв бгФШвм ЮС ЮСйХЩ ЯЮЫХЧЭЮбвШ вЮУЮ ШЫШ ШЭЮУЮ ШЭбвагЬХЭвР. јл ЯЮФаЮСЭХХ ЧРЩЬХЬбп вХЬЮЩ ШЧгзХЭШп аРЧЭле ФШРЫХЪвЮТ Т УЫРТХ 6.

POSIX

POSIX (бЮЪаРйХЭШХ Юв бЫЮТ portable operating system interface, вЮ Хбвм «ЯХаХЭЮбШЬлЩ ШЭвХадХЩб ЮЯХаРжШЮЭЭЮЩ бШбвХЬл»), ЯаХФбвРТЫпХв бЮСЮЩ бвРЭФРав, ЮСХбЯХзШТРойШЩ ЯХаХЭЮбШЬЮбвм ЯаЮУаРЬЬ ЬХЦФг ЮЯХаРжШЮЭЭлЬШ бШбвХЬРЬШ. І нвЮв УаРЭФШЮЧЭлЩ бвРЭФРав ТеЮФпв Ш бЯХжШдШЪРжШШ аХУгЫпаЭле ТлаРЦХЭШЩ Ш ЬЭЮУШе ваРФШжШЮЭЭле баХФбвТ, Т ЪЮвЮале ЮЭШ ШбЯЮЫмЧговбп.

І ЯЮЯлвЪХ гЯЮапФЮзШвм еРЮб, Ю ЪЮвЮаЮЬ ЭРУЫпФЭЮ бТШФХвХЫмбвТгХв вРСЫ. 3.1, POSIX ФХЫШв аРбЯаЮбваРЭХЭЭлХ ФШРЫХЪвл ЭР ФТХ ЪРвХУЮаШШ: BRE (basic regular expressions, вЮ Хбвм «СРЧЮТлХ аХУгЫпаЭлХ ТлаРЦХЭШп») Ш ERE (extended regular expressions, вЮ Хбвм «аРбиШаХЭЭлХ аХУгЫпаЭлХ ТлаРЦХЭШп»). їЮЫЭЮбвмо POSIX-бЮТЬХбвШЬлХ ШЭбвагЬХЭвл ШбЯЮЫмЧгов ЮФШЭ ШЧ ФШРЫХЪвЮТ, ТЮЧЬЮЦЭЮ б ЭХСЮЫмиШЬШ бЯХжШдШзХбЪШЬШ ФЮЯЮЫЭХЭШпЬШ. јХвРбШЬТЮЫл ФТге ЪРвХУЮаШЩ ЯХаХзШбЫХЭл Т вРСЫ. 3.2.<$M[R3-25]>

ВРСЫШжР 3.2. єРвХУЮаШШ ФШРЫХЪвЮТ аХУгЫпаЭле ТлаРЦХЭШЩ Т бвРЭФРавХ POSIX

ВРСЫ. 3.2, ЪРЪ Ш вРСЫ. 3.1, ТХбмЬР ЯЮТХаеЭЮбвЭР. ЅРЯаШЬХа, $ Т BRE пТЫпХвбп ЬХвРбШЬТЮЫЮЬ ЫШим Т ЪЮЭжХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп (Ш ТЮЧЬЮЦЭЮ, ЭР гбЬЮваХЭШХ ЪЮЭЪаХвЭЮЩ аХРЫШЧРжШШ — ЯХаХФ ЧРЪалТРойХЩ ЪагУЫЮЩ бЪЮСЪЮЩ). ѕФЭРЪЮ Т ERE $ пТЫпХвбп ЬХвРбШЬТЮЫЮЬ Т ЫоСЮЬ ЬХбвХ, ЪаЮЬХ бШЬТЮЫмЭЮУЮ ЪЫРббР. І нвЮЩ УЫРТХ ТбваХзРовбп Ш ФагУШХ ЯаШЬХал.

ґЮЫЦХЭ ЯаШЧЭРвм бТЮХ ЭХТХЦХбвТЮ ТЮ ЬЭЮУШе РбЯХЪвРе POSIX, ЯЮбЪЮЫмЪг п ХйХ ЭШЪЮУФР ЭХ ТбваХзРЫ ШЭбвагЬХЭвР, Т ЪЮвЮаЮЬ Сл ЮЭШ ЯЮЫЭЮжХЭЭЮ ЯЮФФХаЦШТРЫШбм. ѕФЭРЪЮ ЬЭЮУШХ аРбЯаЮбваРЭХЭЭлХ ЯаЮУаРЬЬл ШЧСШаРвХЫмЭЮ аХРЫШЧгов ЮвФХЫмЭлХ ваХСЮТРЭШп бвРЭФРавР POSIX, ЯЮнвЮЬг ФРЦХ ЭР ЯЫРвдЮаЬРе, ЭХ ЮвТХзРойШе бвРЭФРавг POSIX, Ю ЭШе ТбХ ЦХ бЫХФгХв ЧЭРвм. ЅРзЭХЬ б аРббЬЮваХЭШп ЫЮЪРЫмЭле ЪЮЭвХЪбвЮТ POSIX.

»ЮЪРЫмЭлЩ ЪЮЭвХЪбв POSIX

ѕФЭЮЩ ШЧ ЮбЮСХЭЭЮбвХЩ бвРЭФРавР POSIX пТЫпХвбп ЯЮЭпвШХ ЫЮЪРЫмЭЮУЮ ЪЮЭвХЪбвР<$M[R3-6]> (locale) — бЮТЮЪгЯЭЮбвШ ЯРаРЬХваЮТ, ЮЯШблТРойШе пЧлЪЮТлХ Ш ЪгЫмвгаЭлХ ЯаРТШЫР: дЮаЬРв ФРвл, ТаХЬХЭШ Ш ФХЭХЦЭЮЩ ТХЫШзШЭл, ШЭвХаЯаХвРжШп бШЬТЮЫЮТ РЪвШТЭЮЩ ЪЮФШаЮТЪШ Ш в. Ф. »ЮЪРЫмЭлХ ЪЮЭвХЪбвл гЯаЮйРов РФРЯвРжШо ЯаЮУаРЬЬ Т ФагУШе бваРЭРе. ѕЭШ ЭХ ЮвЭЮбпвбп Ъ бЯХжШдШЪХ аХУгЫпаЭле ТлаРЦХЭШЩ, ЮФЭРЪЮ ЬЮУгв ТЫШпвм<$M[R3-3]> ЭР Ше ЯаШЬХЭХЭШХ.

ЅРЯаШЬХа, ЯаШ аРСЮвХ Т ЫЮЪРЫмЭЮЬ ЪЮЭвХЪбвХ б ЪЮФШаЮТЪЮЩ Latin-1 (ISO-8859-1), Р Ш ° бзШвРовбп «СгЪТРЬШ» (еЮвп ТЮ ЬЭЮУШе ЯаЮУаРЬЬРе бШЬТЮЫл ЧР ЯаХФХЫРЬШ ЪЮФШаЮТЪШ ASCII ШЭвХаЯаХвШаговбп ЪРЪ ФТЮШзЭлХ ФРЭЭлХ). їаШ ЫоСЮЬ ЯаШЬХЭХЭШШ аХУгЫпаЭле ТлаРЦХЭШЩ, ЯаШ ЪЮвЮаЮЬ ШУЭЮаШагХвбп аХУШбва бШЬТЮЫЮТ, нвШ ФТР бШЬТЮЫР СгФгв бзШвРвмбп ШФХЭвШзЭлЬШ.

ґагУЮЩ ЯаШЬХа — ЬХвРбШЬТЮЫ [\w], ЮСлзЭЮ ЮСЮЧЭРзРойШЩ «бШЬТЮЫ бЫЮТР» (ЪРЪ ЯаРТШЫЮ, [[a-zA-Z0-9]]). POSIX ЭХ ваХСгХв, ЭЮ ФЮЯгбЪРХв ЯЮФФХаЦЪг нвЮУЮ ЬХвРбШЬТЮЫР. їаШ ЯЮФФХаЦЪХ [\w] Т ЯЮШбЪ ТЪЫозРовбп ТбХ СгЪТл Ш жШдал, ЮЯаХФХЫХЭЭлХ Т ЫЮЪРЫмЭЮЬ ЪЮЭвХЪбвХ, Р ЭХ вЮЫмЪЮ вХ, ЪЮвЮалХ ЮЯаХФХЫХЭл ФЫп РЭУЫШЩбЪЮУЮ РЫдРТШвР.

ѕСкХФШЭпойШХ ЯЮбЫХФЮТРвХЫмЭЮбвШ POSIX

І ЫЮЪРЫмЭЮЬ ЪЮЭвХЪбвХ ЬЮЦЭЮ ЮЯаХФХЫШвм ШЬХЭЮТРЭЭлХ ЮСкХФШЭпойШХ ЯЮбЫХФЮТРвХЫмЭЮбвШ<$M[R3-7]> (collating sequences), ЮЯШблТРойШХ ЮбЮСХЭЭЮбвШ ЮСаРСЮвЪШ ЭХЪЮвЮале бШЬТЮЫЮТ ШЫШ ЪЮЬСШЭРжШЩ бШЬТЮЫЮТ ЯаШ бЮавШаЮТЪХ Ш в. Ф. ЅРЯаШЬХа, Т ШбЯРЭбЪЮЬ пЧлЪХ ЪЮЬСШЭРжШп ll (ЪРЪ Т бЫЮТХ tortilla) ваРФШжШЮЭЭЮ бЮавШагХвбп ЪРЪ ЮФШЭ ЫЮУШзХбЪШЩ бШЬТЮЫ, аРбЯЮЫЮЦХЭЭлЩ ЬХЦФг l Ш m, Р Т ЭХЬХжЪЮЬ пЧлЪХ П бзШвРХвбп бШЬТЮЫЮЬ, аРбЯЮЫЮЦХЭЭлЬ ЬХЦФг s Ш t, ЭЮ бЮавШагХЬлЬ ЪРЪ ФТР s, бвЮпйШе ЯЮФапФ. НвШ ЯаРТШЫР ЬЮУгв Слвм аХРЫШЧЮТРЭл Т ЮСкХФШЭпойШе ЯЮбЫХФЮТРвХЫмЭЮбвпе — ЭРЯаШЬХа, б ШЬХЭРЬШ span-ll Ш eszet.

ѕСкХФШЭпойРп ЯЮбЫХФЮТРвХЫмЭЮбвм (ЪРЪ Т бЫгзРХ б span-ll) ЬЮЦХв ЯаХФбвРТЫпвм бЮСЮЩ ЭРСЮа<$M[R3-14]> ШЧ ЭХбЪЮЫмЪШе бШЬТЮЫЮТ, ШЭвХаЯаХвШагХЬле ЪРЪ ЮФШЭ бШЬТЮЫ б ЯЮЧШжШЩ бШЬТЮЫмЭле ЪЫРббЮТ (ЭРЧлТРХЬле Т POSIX «УагЯЯЮТлЬШ ТлаРЦХЭШпЬШ»; бЬ. б. <$R[P#,R3-5]>) НвЮ ЮЧЭРзРХв, звЮ ЪЫРбб [torti[a-z]a] бЮТЯРФХв б ФТгеСгЪТХЭЭлЬ «бШЬТЮЫЮЬ» Т бЫЮТХ tortilla. ° ЯЮбЪЮЫмЪг П ЮЯаХФХЫпХвбп ЪРЪ бШЬТЮЫ, ЭРеЮФпйШЩбп ЬХЦФг s Ш t, ЮЭ ТеЮФШв Т бШЬТЮЫмЭлЩ ЪЫРбб [[a-z]].

єЮбТХЭЭРп ЯЮФФХаЦЪР ЫЮЪРЫмЭле ЪЮЭвХЪбвЮТ

<$M[R3-29]>»ЮЪРЫмЭлХ ЪЮЭвХЪбвл ЬЮУгв ТЫШпвм ЭР аРСЮвг ЬЭЮУШе ЯаЮУаРЬЬ, ЭХ ЯаХвХЭФгойШе ЭР бЮЮвТХвбвТШХ бвРЭФРавг POSIX — ЯаШзХЬ ШЭЮУФР СХЧ Ше ТХФЮЬР! јЭЮУШХ гвШЫШвл ЯШигвбп ЭР C ШЫШ C++ Ш зРбвЮ ШбЯЮЫмЧгов бвРЭФРавЭлХ СШСЫШЮвХзЭлХ дгЭЪжШШ C ФЫп ЮЯаХФХЫХЭШп вЮУЮ, ЪРЪШХ СРЩвл пТЫповбп СгЪТРЬШ, жШдаРЬШ Ш в. Ф. µбЫШ вРЪРп гвШЫШвР ЪЮЬЯШЫШагХвбп Т бШбвХЬХ б СШСЫШЮвХЪЮЩ C, бЮЮвТХвбвТгойХЩ бвРЭФРавг POSIX, нвЮ ЬЮЦХв ЮСХбЯХзШвм ЮЯаХФХЫХЭЭлЩ гаЮТХЭм бЮЮвТХвбвТШп, еЮвп ХХ вЮзЭго бвХЯХЭм ЯаХФбЪРЧРвм вагФЭЮ. ЅРЯаШЬХа, РТвЮа ЯаЮУаРЬЬл ЬЮЦХв ШбЯЮЫмЧЮТРвм СШСЫШЮвХзЭлХ дгЭЪжШШ C ФЫп аХиХЭШп ЯаЮСЫХЬ б аХУШбваЮЬ бШЬТЮЫЮТ, ЭЮ ЭХ ФЫп ЯЮФФХаЦЪШ \w[6]<$M[R3-31]>.

ЅХЪЮвЮалХ ЯаЮУаРЬЬл ЯлвРовбп аХРЫШЧЮТРвм зРбвШзЭго ЯЮФФХаЦЪг ЫЮЪРЫмЭле ЪЮЭвХЪбвЮТ Т бТЮШе аХУгЫпаЭле ТлаРЦХЭШпе. їаШЬХаРЬШ пТЫповбп Perl, Tcl Ш GNU Emacs. їаШ ШбЯЮЫмЧЮТРЭШШ ЬХвРбШЬТЮЫР Perl \w Ш ЯЮШбЪХ б ШУЭЮаШаЮТРЭШХЬ аХУШбваР бШЬТЮЫЮТ ЫЮЪРЫмЭлЩ ЪЮЭвХЪбв гзШвлТРХвбп, ЪРЪ УЮТЮаШЫЮбм ТлиХ, Р ЯаШ ШбЯЮЫмЧЮТРЭШШ ЬХвРбШЬТЮЫР «вЮзЪР» Ш ШЭвХаТРЫЮТ Т бШЬТЮЫмЭле ЪЫРббРе — ЭХв. ґагУШХ ЯаШЬХал СгФгв ЯаШТХФХЭл ЯаШ ЮЯШбРЭШШ ЬХвРбШЬТЮЫЮТ Т аРЧФХЫХ «БвРЭФРавЭлХ ЬХвРбШЬТЮЫл» (бЬ. б. <$R[P#,R3-11]>).

ѕбЭЮТЭлХ ЮЯХаРжШШ б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ

Б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ вХбЭЮ бТпЧРЭР бШЭвРЪбШзХбЪРп «ЮСХавЪР», ЪЮвЮаРп бЮЮСйРХв ЯаШЫЮЦХЭШо: «ТЮв аХУгЫпаЭЮХ ТлаРЦХЭШХ, Р ТЮв — вЮ, звЮ б ЭШЬ ЭгЦЭЮ бФХЫРвм». їаЮУаРЬЬР egrep пТЫпХвбп ТлаЮЦФХЭЭлЬ ЯаШЬХаЮЬ, ЯЮбЪЮЫмЪг аХУгЫпаЭЮХ ТлаРЦХЭШХ ЯХаХФРХвбп Т ТШФХ РаУгЬХЭвР Т ЪЮЬРЭФЭЮЩ бваЮЪХ. µбЫШ ЯЮваХСгХвбп звЮ-ЭШСгФм ХйХ (ЭРЯаШЬХа, РЯЮбваЮдл, ШбЯЮЫмЧЮТРЭЭлХ Т ЯХаТЮЩ УЫРТХ), вЮ нвЮ бТпЧРЭЮ б ваХСЮТРЭШпЬШ ЪЮЬРЭФЭЮУЮ ШЭвХаЯаХвРвЮаР, Р ЭХ egrep. І СЮЫХХ бЫЮЦЭле бШбвХЬРе б аРЧЭЮЮСаРЧЭлЬШ ЯаШЬХЭХЭШпЬШ аХУгЫпаЭле ТлаРЦХЭШЩ ЭХЮСеЮФШЬл СЮЫХХ бЫЮЦЭлХ бШЭвРЪбШзХбЪШХ ЪЮЭбвагЪжШШ, ЪЮвЮалХ бЮЮСйРов бШбвХЬХ, звЮ ШЬХЭЭЮ бЫХФгХв бзШвРвм аХУгЫпаЭлЬ ТлаРЦХЭШХЬ Ш ЪРЪ ЮЭЮ ФЮЫЦЭЮ ШбЯЮЫмЧЮТРвмбп.

І нвЮЬ аРЧФХЫХ Ьл ЮзХЭм ЪаРвЪЮ ЯЮЧЭРЪЮЬШЬбп б ЭХЪЮвЮалЬШ ЮЯХаРжШпЬШ, ТлЯЮЫЭпХЬлЬШ Т ЯаЮУаРЬЬРе б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ. ѕЯШбРЭШХ бЭЮТР ЭРзЭХвбп б Perl, ЭЮ СгФгв гЯЮЬпЭгвл Ш ФагУШХ ЯаЮУаРЬЬл. П ЭХ СгФг ТФРТРвмбп Т ЯЮФаЮСЭЮбвШ, Р ЫШим ЯаХФбвРТЫо апФ ЪЫозХТле ЪЮЭжХЯжШЩ, ФРойШе ЯаХФбвРТЫХЭШХ Ю аРЧЫШзЭле ЯЮФеЮФРе Ъ аХиХЭШо нвШе ЧРФРз.

ёФХЭвШдШЪРжШп аХУгЫпаЭле ТлаРЦХЭШЩ

І ЯаХФлФгйХЩ УЫРТХ Ьл ЯЮЧЭРЪЮЬШЫШбм б Perl — ЯЮЫЭЮжХЭЭлЬ пЧлЪЮЬ ЯаЮУаРЬЬШаЮТРЭШп, аРСЮвРойШЬ б ЬЭЮУШЬШ вШЯРЬШ аХУгЫпаЭле ТлаРЦХЭШЩ. їаШ ЫоСЮЬ вШЯХ ТлаРЦХЭШп ЭХЮСеЮФШЬЮ бЮЮСйШвм Perl, звЮ ШЬХЭЭЮ Тл еЮвШвХ бФХЫРвм б аХУгЫпаЭлЬ ТлаРЦХЭШХЬ. єЮЭбвагЪжШп m/…/, Т ЪЮвЮаго ЧРЪЫозРХвбп аХУгЫпаЭЮХ ТлаРЦХЭШХ, ЮЧЭРзРХв ЮЯХаРжШо ЯЮШбЪР, Р ЮЯХаРвЮа =~ бТпЧлТРХв ТлаРЦХЭШХ б вХЪбвЮЬ, Т ЪЮвЮаЮЬ ЯаЮШЧТЮФШвбп ЯЮШбЪ (ТЮЮСйХ УЮТЮап, ЯаШ ЦХЫРЭШШ m ЬЮЦЭЮ ЮЯгбвШвм Ш ФРЦХ ШбЯЮЫмЧЮТРвм ТЬХбвЮ / ФагУШХ бШЬТЮЫл). ·РЯЮЬЭШвХ: бШЬТЮЫл / ЭХ ТеЮФпв Т бРЬЮ аХУгЫпаЭЮХ ТлаРЦХЭШХ. НвЮ ТбХУЮ ЫШим ЮУаРЭШзШвХЫШ, ЮЯаХФХЫпойШХ УаРЭШжл ТлаРЦХЭШп Т бжХЭРаШШ — вР бРЬРп бШЭвРЪбШзХбЪРп ЮСХавЪР, Ю ЪЮвЮаЮЩ п гЯЮЬШЭРЫ.

ѕЯХаРжШШ б бЮТЯРТиШЬ вХЪбвЮЬ

єЮЭХзЭЮ, ТЮЧЬЮЦЭЮбвШ аХУгЫпаЭле ТлаРЦХЭШЩ ЭХ ЮУаРЭШзШТРовбп ЯаЮбвлЬ ЯЮШбЪЮЬ вХЪбвР. ЕЮаЮиШЬ ЯаШЬХаЮЬ пТЫпХвбп ЪЮЬРЭФР ЯЮФбвРЭЮТЪШ $var =~ s/аХУгЫпаЭЮХ ТлаРЦХЭШХ/ЧРЬХЭР/, аРббЬЮваХЭЭРп Т УЫРТХ 2. ѕЭР ШйХв Т вХЪбвХ, еаРЭпйХЬбп Т ЯХаХЬХЭЭЮЩ, ЯЮФбваЮЪг, бЮТЯРФРойго б ЧРФРЭЭлЬ аХУгЫпаЭлЬ ТлаРЦХЭШХЬ, Ш ЧРЬХЭпХв ХХ бваЮЪЮЩ ЧРЬХЭл. јЮФШдШЪРвЮа /g ЮСХбЯХзШТРХв «УЫЮСРЫмЭго» ЧРЬХЭг Т бваЮЪХ. НвЮ ЮЧЭРзРХв, звЮ ЯЮбЫХ ЯХаТЮЩ ЧРЬХЭл ЯЮШбЪ ТЮЧЬЮЦЭле бЮТЯРФХЭШЩ ЯаЮФЮЫЦРХвбп Т ЮбвРТиХЩбп зРбвШ бваЮЪШ.

БваЮЪР ЧРЬХЭл, ТеЮФпйРп Т ЪЮЬРЭФг ЯЮФбвРЭЮТЪШ, ЭХ пТЫпХвбп аХУгЫпаЭлЬ ТлаРЦХЭШХЬ. ІЯаЮзХЬ, ЮЭР, ЪРЪ Ш ЬЭЮУШХ ЪЮЭбвагЪжШШ, ЮСЫРФРХв бЮСбвТХЭЭлЬШ ЬХвРбШЬТЮЫРЬШ. АРббЬЮваШЬ ЪЮЬРЭФг:

НвР ЪЮЬРЭФР ЧРЪЫозРХв ЪРЦФЮХ зШбЫЮ, ЭРеЮФпйХХбп Т вХЪбвХ $var, Т ЯРаг вХУЮТ <CODE>…</CODE>. БваЮЪР ЧРЬХЭл ШЬХХв ТШФ <CODE>$&<\/CODE>. БШЬТЮЫ \ нЪаРЭШагХв бШЬТЮЫ ЪЮбЮЩ зХавл, ТлЯЮЫЭпойШЩ дгЭЪжШШ ЮУаРЭШзШвХЫп, звЮСл нвЮв бШЬТЮЫ ЬЮУ ЯаШбгвбвТЮТРвм Т бваЮЪХ ЧРЬХЭл. їХаХЬХЭЭРп Perl $& бЮФХаЦШв вХЪбв, бЮТЯРТиШЩ ЯаШ ЯЮбЫХФЭХЬ ЯаШЬХЭХЭШШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп ([[0-9]+] Т ЯХаТЮЩ зРбвШ ЪЮЬРЭФл).

ґЮЯгбЪРХвбп ШбЯЮЫмЧЮТРЭШХ ФагУШе бШЬТЮЫЮТ-ЮУаРЭШзШвХЫХЩ. µбЫШ ТЬХбвЮ бвРЭФРавЭЮУЮ бШЬТЮЫР / ШбЯЮЫмЧЮТРвм ТЮбЪЫШжРвХЫмЭлЩ ЧЭРЪ, ЯЮбЫХФЭШЩ ЯаШЬХа ЯаШЭШЬРХв бЫХФгойШЩ ТШФ:

ѕСаРвШвХ ТЭШЬРЭШХ — бШЬТЮЫ / Т бваЮЪХ ЧРЬХЭл нЪаРЭШаЮТРвм ЭХ ЭгЦЭЮ, ЯЮбЪЮЫмЪг ЮЭ гЦХ ЭХ пТЫпХвбп ЮУаРЭШзШвХЫХЬ Ш ЭХ ТлЯЮЫЭпХв ФагУШе дгЭЪжШЩ.

ЅХЮСеЮФШЬЮ ЯЮЭШЬРвм, звЮ Т бЫХФгойШе ЪЮЬРЭФРе:

ШбЯЮЫмЧгХвбп ЮФЭЮ Ш вЮ ЦХ аХУгЫпаЭЮХ ТлаРЦХЭШХ. АРЧЫШзРовбп вЮЫмЪЮ ЮЯХаРжШШ, ТлЯЮЫЭпХЬлХ б нвШЬ ТлаРЦХЭШХЬ ЯаЮУаРЬЬЮЩ (Т ФРЭЭЮЬ бЫгзРХ Perl).

ґагУШХ ЯаШЬХал

єЮЭХзЭЮ, ЭХ ТбХ ЯаЮУаРЬЬл ЮСЫРФРов ЮФШЭРЪЮТлЬШ ТЮЧЬЮЦЭЮбвпЬШ ШЫШ ШбЯЮЫмЧгов ЮФШЭРЪЮТго ЧРЯШбм ФЫп ТлаРЦХЭШп ЮФЭШе Ш вХе ЦХ ЪЮЭжХЯжШЩ. АРббЬЮваШЬ ЭХбЪЮЫмЪЮ ФагУШе ЯаШЬХаЮТ (ЬЭЮУШХ ШЧ нвШе ЯаЮУаРЬЬ СЮЫХХ ЯЮФаЮСЭЮ ЮЯШбРЭл Т УЫРТХ 6).

Awk

І пЧлЪХ awk ЪЮЭбвагЪжШп /аХУгЫпаЭЮХ_ТлаРЦХЭШХ/ ШйХв бЮТЯРФХЭШп Т вХЪгйХЩ ТеЮФЭЮЩ бваЮЪХ, Р ЪЮЭбвагЪжШп var ~ … ТлЯЮЫЭпХв ЯЮШбЪ Т ФагУШе ФРЭЭле. ёЬХЭЭЮ awk ЯЮТЫШпЫ ЭР бШЭвРЪбШб ЮЯХаРжШЩ б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ пЧлЪР Perl (ТЯаЮзХЬ, ЯаШ ТлСЮаХ ЮЯХаРвЮаР ЯЮФбвРЭЮТЪШ Perl ЧР ЮСаРЧХж СлЫР ТЧпвР ЯаЮУаРЬЬР sed).

І аРЭЭШе ТХабШпе awk ЮЯХаРжШп ЯЮФбвРЭЮТЪШ ЭХ ЯЮФФХаЦШТРЫРбм, ЭЮ Т бЮТаХЬХЭЭле ТХабШпе ЯЮпТШЫРбм дгЭЪжШп sub(…). єЮЬРЭФР ТШФР sub(/mizpel/, "misspell") ЯаШЬХЭпХв аХУгЫпаЭЮХ ТлаРЦХЭШХ [mizpel] Ъ вХЪгйХЩ бваЮЪХ, ЧРЬХЭпп ЯХаТлЩ ЭРЩФХЭЭлЩ нЪЧХЬЯЫпа бваЮЪЮЩ «misspell». БаРТЭШвХ б ЪЮЬРЭФЮЩ Perl s/mizpel/misspell/.

ґЫп ЧРЬХЭл ТбХе нЪЧХЬЯЫпаЮТ Т бваЮЪХ ТЬХбвЮ РЭРЫЮУР ЬЮФШдШЪРвЮаР /g Т awk ШбЯЮЫмЧгХвбп ФагУРп дгЭЪжШп: gsub(/mizpel/, "misspell").

Tcl

І Tcl ШбЯЮЫмЧгХвбп ЭХбЪЮЫмЪЮ ФагУЮЩ бШЭвРЪбШб, ЪЮвЮалЩ ЭР ЯХаТлЩ ТЧУЫпФ ТлУЫпФШв ФЮТЮЫмЭЮ бваРЭЭЮ (ТЯаЮзХЬ, нвЮ ЭХ бваРиЭЮ, ЯЮбЪЮЫмЪг нвШ ЯаШЬХал ТбХУЮ ЫШим ФРов ЯаХФбвРТЫХЭШХ Ю ФагУШе бЯЮбЮСРе аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ). їаШТХФХЭЭлЩ ТлиХ ЯаШЬХа ЭР Tcl ЬЮЦХв ТлУЫпФХвм вРЪ:

єЮЬРЭФР ЯаЮТХапХв бЮФХаЦШЬЮХ ЯХаХЬХЭЭЮЩ var, ЧРЬХЭпХв ЯХаТлЩ нЪЧХЬЯЫпа [mizpel] бваЮЪЮЩ «misspell» Ш ЯаШбТРШТРХв ЯЮЫгзХЭЭлЩ вХЪбв ЯХаХЬХЭЭЮЩ newvar. ЅШ аХУгЫпаЭЮХ ТлаРЦХЭШХ, ЭШ бваЮЪР ЧРЬХЭл ЭХ ваХСгов бЯХжШРЫмЭле ЮУаРЭШзШвХЫХЩ, ЪаЮЬХ ЮСлзЭле ЯаЮСХЫЮТ. ЅР ЯХаТЮЬ ЬХбвХ ЯХаХФРХвбп аХУгЫпаЭЮХ ТлаРЦХЭШХ, ЭР ТвЮаЮЬ — жХЫХТРп бваЮЪР, ЭР ваХвмХЬ — бваЮЪР ЧРЬХЭл, Ш ЭР зХвТХавЮЬ — ШЬп жХЫХТЮЩ ЯХаХЬХЭЭЮЩ (ХбЫШ аХУгЫпаЭЮХ ТлаРЦХЭШХ ШЫШ бваЮЪР ЧРЬХЭл бЮФХаЦРв ЯаЮСХЫл ШЫШ ФагУШХ РЭРЫЮУШзЭлХ бШЬТЮЫл, ЮЭШ, ЪРЪ Ш ТбХ ЮбвРЫмЭлХ РаУгЬХЭвл Т Tcl, ЧРЪЫозРовбп Т РЯЮбваЮдл). Tcl вРЪЦХ ЯЮЧТЮЫпХв ЯХаХФРТРвм ЯаШ ТлЧЮТХ regsub ФЮЯЮЫЭШвХЫмЭлХ ЯРаРЬХвал. ЅРЯаШЬХа, ЪЫоз -all ЮСХбЯХзШТРХв УЫЮСРЫмЭго ЧРЬХЭг ТбХе ЭРЩФХЭЭле нЪЧХЬЯЫпаЮТ (ЭХ вЮЫмЪЮ ЯХаТЮУЮ):

єЫоз -nocase ЧРбвРТЫпХв ЬХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ ШУЭЮаШаЮТРвм аХУШбва бШЬТЮЫЮТ (ЯЮ РЭРЫЮУШШ б дЫРУЮЬ egrep -i ШЫШ ЬЮФШдШЪРвЮаЮЬ Perl /i).

GNU Emacs

І ЭХТХаЮпвЭЮ ЬЮйЭЮЬ вХЪбвЮТЮЬ аХФРЪвЮаХ GNU Emacs (Т ФРЫмЭХЩиХЬ ЯаЮбвЮ «Emacs») ЯЮФФХаЦШТРХвбп ТбваЮХЭЭлЩ пЧлЪ ЯаЮУаРЬЬШаЮТРЭШп elisp (Emacs lisp) Ш ЬЭЮУЮзШбЫХЭЭлХ дгЭЪжШШ ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ. ѕФЭР ШЧ ТРЦЭХЩиШе дгЭЪжШЩ, re-search-forward, ЯЮЫгзРХв Т ЪРзХбвТХ РаУгЬХЭвР ЮСлзЭго бваЮЪг Ш ШЭвХаЯаХвШагХв ХХ ЪРЪ аХУгЫпаЭЮХ ТлаРЦХЭШХ, ЯЮбЫХ зХУЮ ШйХв вХЪбв Юв вХЪгйХЩ ЯЮЧШжШШ ФЮ ЯХаТЮУЮ бЮТЯРФХЭШп ШЫШ ЮвЬХЭпХв ЯЮШбЪ, ХбЫШ бЮТЯРФХЭШХ ЮвбгвбвТгХв. ёЬХЭЭЮ нвР дгЭЪжШп ТлЧлТРХвбп ЯаШ ТлЯЮЫЭХЭШШ ЪЮЬРЭФл ЯЮШбЪР Т аХФРЪвЮаХ. ЅРЯаШЬХа, ЪЮЬРЭФР (re-search-forward "main") ШйХв вХЪбв [main], ЭРзШЭРп б вХЪгйХЩ ЯЮЧШжШШ аХФРЪвШагХЬЮУЮ вХЪбвР.

єРЪ ТШФЭЮ ШЧ вРСЫ. 3.1, ФЫп ФШРЫХЪвР аХУгЫпаЭле ТлаРЦХЭШЩ Emacs еРаРЪвХаЭЮ ЭРЫШзШХ ЬЭЮУЮзШбЫХЭЭле бШЬТЮЫЮТ<$M[R3-2]> \. ЅРЯаШЬХа, аХУгЫпаЭЮХ ТлаРЦХЭШХ [\<([a-z]+\)$[\nspc\t]\|<[^>]+>$+\1\>] ЭРеЮФШв Т вХЪбвХ ЯЮТвЮапойШХбп бЫЮТР (бЬ. УЫРТг 1). ЅХЯЮбаХФбвТХЭЭЮ ШбЯЮЫмЧЮТРвм нвЮ ТлаРЦХЭШХ ЭХЫмЧп, ЯЮбЪЮЫмЪг ЬХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ Emacs ЭХ ЯЮЭШЬРХв бШЬТЮЫЮТ \n Ш \t. Б ФагУЮЩ бвЮаЮЭл, нвШ бШЬТЮЫл ЯЮФФХаЦШТРовбп ФЫп бваЮЪ Emacs<$M[R3-1]>, ЧРЪЫозХЭЭле Т ЪРТлзЪШ. І ЮвЫШзШХ Юв Perl Ш awk (ЭЮ ЯЮ РЭРЫЮУШШ б Tcl Ш Python), аХУгЫпаЭлХ ТлаРЦХЭШп Т бжХЭРаШпе elisp ЮСлзЭЮ ЯХаХФРовбп ЬХеРЭШЧЬг ЮСаРСЮвЪШ Т ТШФХ бваЮЪЮТле ЫШвХаРЫЮТ, ЯЮнвЮЬг Ьл ЬЮЦХЬ бТЮСЮФЭЮ ШбЯЮЫмЧЮТРвм \t Ш ФагУШХ бШЬТЮЫл. Б ФагУЮЩ бвЮаЮЭл, нвЮ ТлЧлТРХв ЭХЪЮвЮалХ ЯаЮСЫХЬл, ЯЮбЪЮЫмЪг бШЬТЮЫ \ ШЬХХв ЮбЮСлЩ бЬлбЫ Т бваЮЪРе elisp.

І egrep аХУгЫпаЭлХ ТлаРЦХЭШп ЮСлзЭЮ ЧРЪЫозРовбп Т РЯЮбваЮдл, звЮ ЯЮЧТЮЫпХв ШбЯЮЫмЧЮТРвм Т ЭШе бШЬТЮЫл *, \ Ш в. Ф., пТЫпойШХбп ЬХвРбШЬТЮЫРЬШ ЪЮЬРЭФЭЮУЮ ШЭвХаЯаХвРвЮаР. І ЪЮЬРЭФРе Perl m/аХУгЫпаЭЮХ ТлаРЦХЭШХ/ Ш s/аХУгЫпаЭЮХ ТлаРЦХЭШХ/ЧРЬХЭР/ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЯХаХФРХвбп ЭХЯЮбаХФбвТХЭЭЮ, звЮ ЯаХФЮвТаРйРХв ТЮЧЬЮЦЭлХ ЪЮЭдЫШЪвл ЬХвРбШЬТЮЫЮТ (ЪЮЭХзЭЮ, ЪаЮЬХ бШЬТЮЫР-ЮУаРЭШзШвХЫп — ЮСлзЭЮ /). І elisp вРЪЮУЮ ЯаЮбвЮУЮ аХиХЭШп ЭХ бгйХбвТгХв. їЮбЪЮЫмЪг ЮСаРвЭРп ЪЮбРп зХавР пТЫпХвбп бваЮЪЮТлЬ ЬХвРбШЬТЮЫЮЬ, ХХ ЯаШеЮФШвбп нЪаРЭШаЮТРвм, вЮ Хбвм ЧРЬХЭпвм ЪРЦФлЩ бШЬТЮЫ \, ЭХЯЮбаХФбвТХЭЭЮ ТЪЫозРХЬлЩ Т аХУгЫпаЭЮХ ТлаРЦХЭШХ, ЯЮбЫХФЮТРвХЫмЭЮбвмо \\. ґЮСРТмвХ Ъ нвЮЬг зРбвЮХ ШбЯЮЫмЧЮТРЭШХ нвЮУЮ бШЬТЮЫР Т elisp — Ш аХЧгЫмвРв ЭРзШЭРХв ТлУЫпФХвм вРЪ, бЫЮТЭЮ ЪвЮ-вЮ аРбблЯРЫ гЯРЪЮТЪг ЧгСЮзШбвЮЪ. ЅШЦХ ЯаШТХФХЭР ЭХСЮЫмиРп дгЭЪжШп ФЫп ЯЮШбЪР бЫХФгойХУЮ ЯЮТвЮаХЭШп бЫЮТР:

µбЫШ ЮСкХФШЭШвм нвг дгЭЪжШо б ЪЮЬРЭФЮЩ (define-key global-map "\C-x\C-d" 'FindNextDbl), Тл бЬЮЦХвХ ШбЯЮЫмЧЮТРвм ЯЮбЫХФЮТРвХЫмЭЮбвм «Ctrl+x Ctrl+d» ФЫп СлбваЮУЮ ЯЮШбЪР ЯЮТвЮапойШебп бЫЮТ.

Python

Python — ЮСкХЪвЭЮ-ЮаШХЭвШаЮТРЭЭлЩ бжХЭРаЭлЩ пЧлЪ, ЭХ ЯЮеЮЦШЩ ЭШ ЭР ЮФШЭ ШЧ ваРФШжШЮЭЭле пЧлЪЮТ. µУЮ ФШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ ФЮТЮЫмЭЮ СЫШЧЮЪ Ъ ФШРЫХЪвг Emacs… ТЮ ТбпЪЮЬ бЫгзРХ, ХУЮ бвРЭФРавЭРп аРЧЭЮТШФЭЮбвм — Т Python ЭХЪЮвЮалХ ЮбЮСХЭЭЮбвШ ФШРЫХЪвР аХУгЫпаЭле ТлаРЦХЭШЩ ЬЮУгв ШЧЬХЭпвмбп ТЮ ТаХЬп аРСЮвл ЯаЮУаРЬЬл! ІРЬ ЭРФЮХЫЮ ШЧЮСШЫШХ ЮСаРвЭле ЪЮбле зХав, еРаРЪвХаЭЮХ ФЫп Emacs? їаЮСЫХЬг ЬЮЦЭЮ ЫХУЪЮ аХиШвм:

ґТР дЫРУР гЪРЧлТРов, звЮ ФЫп УагЯЯШаЮТЪШ Т ТлаРЦХЭШпе ФЮЫЦЭл ШбЯЮЫмЧЮТРвмбп ЭХнЪаРЭШаЮТРЭЭлХ бЪЮСЪШ, Р Т ЪЮЭбвагЪжШШ ТлСЮаР — ЭХнЪаРЭШаЮТРЭЭРп ТХавШЪРЫмЭРп зХавР. ЅХвагФЭЮ ФЮУРФРвмбп, ЯЮзХЬг п ТлСШаРо ШЬХЭЭЮ нвЮв ТРаШРЭв!

Python пТЫпХвбп ЮСкХЪвЭЮ-ЮаШХЭвШаЮТРЭЭлЬ пЧлЪЮЬ, ЯаШзХЬ нвЮ ЮвЭЮбШвбп Ш Ъ аХУгЫпаЭлЬ ТлаРЦХЭШпЬ. Іл ЬЮЦХвХ бЮЧФРвм «ЮСкХЪв аХУгЫпаЭЮУЮ ТлаРЦХЭШп»<$M[R3-16]> Ш ЯЮЧФЭХХ ЯаШЬХЭШвм ХУЮ Ъ бваЮЪХ ФЫп ТлЯЮЫЭХЭШп ЯЮШбЪР ШЫШ ЯЮФбвРЭЮТЪШ. І бЫХФгойХЬ даРУЬХЭвХ Т ШЬХЭРе ЯХаХЬХЭЭле ШбЯЮЫмЧговбп бШЬТЮЫл ЮСЮШе аХУШбваЮТ. НвЮ бФХЫРЭЮ ФЫп вЮУЮ, звЮСл ЯХаХЬХЭЭлХ СлЫЮ ЯаЮйХ ЮвЫШзРвм Юв СШСЫШЮвХзЭле ЪЮЬЯЮЭХЭвЮТ.

єРЪ ЭХвагФЭЮ ФЮУРФРвмбп, бваЮЪР б вХУРЬШ <CODE> ЯаХФбвРТЫпХв бЮСЮЩ вХЪбв ЧРЬХЭл. їаШ ЮСаРвЭле бблЫЪРе ТЭгваШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп Т Python, Perl, Tcl Ш Emacs ШбЯЮЫмЧгХвбп ЮСЮЧЭРзХЭШХ [\1], ЭЮ Т ЮвЫШзШХ Юв Perl б ХУЮ ЯХаХЬХЭЭЮЩ $1, ЮСЮЧЭРзХЭШХ \1 ЧФХбм ШбЯЮЫмЧгХвбп Ш Т вХЪбвХ ЧРЬХЭл.

јЮЦХв ТЮЧЭШЪЭгвм ТЮЯаЮб — ЪРЪ ЮСаРвШвмбп Ъ вХЪбвг бЮТЯРФХЭШп Т ФагУЮЩ вЮзЪХ ЯаЮУаРЬЬл, ЯЮбЫХ ЧРТХаиХЭШп ЯЮФбвРЭЮТЪШ? (І Perl ЯХаХЬХЭЭРп $1 ЯЮзвШ ЭШзХЬ ЭХ ЮвЫШзРХвбп Юв ЮСлзЭле ЯХаХЬХЭЭле, Ш ХХ ЬЮЦЭЮ ШбЯЮЫмЧЮТРвм вРЬ, УФХ ЯЮваХСгХвбп). І ЮСкХЪвЭЮ-ЮаШХЭвШаЮТРЭЭЮЬ Python ШЭдЮаЬРжШп Ю ЯЮбЫХФЭХЬ бЮТЯРФХЭШШ еаРЭШвбп Т ЮСкХЪвХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп (MyRegex Т ЯаШТХФХЭЭЮЬ ЯаШЬХаХ). °ЭРЫЮУЮЬ ЯХаХЬХЭЭЮЩ Perl $1 пТЫпХвбп ЪЮЭбвагЪжШп MyRegex.group(1) (ЪбвРвШ, Т Tcl Ш Emacs нвР ЯаЮСЫХЬР аХиРХвбп ШЭРзХ; бЬ. б. <$R[P#,R6-2]> Ш <$R[P#,R6-3]>).

Б Python ЭШЪЮУФР ЭХ СлТРХв бЪгзЭЮ. І нвЮЬ пЧлЪХ аХРЫШЧЮТРЭ ШЭвХаХбЭлЩ ЯЮФеЮФ Ъ ЯЮШбЪг СХЧ гзХвР аХУШбваР бШЬТЮЫЮТ: Тл ЬЮЦХвХ ЯаХФЮбвРТШвм бЮСбвТХЭЭЮХ ЮЯШбРЭШХ вЮУЮ, ЪРЪ ЪРЦФлЩ СРЩв (вЮ Хбвм бШЬТЮЫ) ФЮЫЦХЭ ШЭвХаЯаХвШаЮТРвмбп ЯаШ баРТЭХЭШШ. µбЫШ Т ЮЯШбРЭШШ гЪРЧРЭЮ, звЮ ТХабШШ ЭХЪЮвЮаЮУЮ бШЬТЮЫР Т ТХаеЭХЬ Ш ЭШЦЭХЬ аХУШбваХ бЫХФгХв бзШвРвм ЮФШЭРЪЮТлЬШ, нвЮ ЮСХбЯХзШв ваРФШжШЮЭЭлЩ ЯЮШбЪ СХЧ гзХвР аХУШбваР, ЭЮ Т ФХЩбвТШвХЫмЭЮбвШ ЯХаХФ ТРЬШ ЮвЪалТРовбп СЮЫХХ иШаЮЪШХ ТЮЧЬЮЦЭЮбвШ. ЅРЯаШЬХа, ЯаШ аРСЮвХ Т ЪЮФШаЮТЪХ Latin-1, аРбЯаЮбваРЭХЭЭЮЩ Т Web (нвР ЪЮФШаЮТЪР бЮФХаЦШв ЬРббг бШЬТЮЫЮТ б ТбХТЮЧЬЮЦЭлЬШ ФШРЪаШвШзХбЪШЬШ ЧЭРЪРЬШ), ЬЮЦЭЮ ЮаУРЭШЧЮТРвм ЯЮШбЪ, ЯаШ ЪЮвЮаЮЬ ШУЭЮаШагХвбп ЭРЫШзШХ ФШРЪаШвШзХбЪШе ЧЭРЪЮТ. єаЮЬХ вЮУЮ, ЯаШ ЦХЫРЭШШ ЬЮЦЭЮ бФХЫРвм вРЪ, звЮСл бШЬТЮЫ ч бЮТЯРФРЫ б ТЮЯаЮбШвХЫмЭлЬ ЧЭРЪЮЬ, бШЬТЮЫ ® — б ТЮбЪЫШжРвХЫмЭлЬ ЧЭРЪЮЬ, Р ЮСЮЧЭРзХЭШп ТРЫов ю, ¤, Ё Ш бЮТЯРФРЫШ б $. І бгйЭЮбвШ, Тл ЬЮЦХвХ ЮЯаХФХЫпвм бШЬТЮЫмЭлХ ЪЫРббл, ЯаШЬХЭпХЬлХ ЭР аРЧЭле гаЮТЭпе бЮТЯРФХЭШп. ДРЭвРбвШЪР!

ёвЮУШ

єРЪ ТШФШвХ, аРЧЭлХ ЯаЮУаРЬЬл ЮСЫРФРов аРЧЭлЬШ дгЭЪжШЮЭРЫмЭлЬШ ТЮЧЬЮЦЭЮбвпЬШ Ш баХФбвТРЬШ ФЫп Ше аХРЫШЧРжШШ. µбЫШ Тл вЮЫмЪЮ ЭРзШЭРХвХ аРСЮвРвм ЭР нвШе пЧлЪРе, ТХаЮпвЭЮ, г ТРб СгФХв ЭХЬРЫЮ ЧРвагФЭХЭШЩ. ЅХ СЮЩвХбм! ЗвЮСл ЮбТЮШвм ЮФШЭ ЪЮЭЪаХвЭлЩ ШЭбвагЬХЭв, ФЮбвРвЮзЭЮ ЯаЮбвЮ ШЧгзШвм ЬХеРЭШЪг ХУЮ аРСЮвл.

їаШ ТлСЮаХ ФРЫмЭХЩиШе ЯаШЬХаЮТ п бвЮЫЪЭгЫбп б ЮФЭЮЩ вагФЭЮбвмо. АХУгЫпаЭлХ ТлаРЦХЭШп ШбЯЮЫмЧговбп ЭХ ЭР ЯгбвЮЬ ЬХбвХ, Р Т ЪЮЭвХЪбвХ ЪЮЭЪаХвЭЮЩ ЯаЮУаРЬЬл, Ш ЯЮнвЮЬг зРбвЮ бТпЧлТРовбп б дгЭЪжШЮЭРЫмЭлЬШ ТЮЧЬЮЦЭЮбвпЬШ ЯаЮУаРЬЬл-ЭЮбШвХЫп, ЭХ ЮвЭЮбпйШЬбп Ъ аХУгЫпаЭлЬ ТлаРЦХЭШпЬ. ЗвЮСл ЬРвХаШРЫ ЭЮбШЫ ЯЮ ТЮЧЬЮЦЭЮбвШ ЮСйШЩ еРаРЪвХа, ЬЭХ ЯаШиЫЮбм ТлСаРвм ЮФШЭ ШЧ бвШЫХЩ ЮдЮаЬЫХЭШп аХУгЫпаЭле ТлаРЦХЭШЩ. ѕСлзЭЮ п ЯаШФХаЦШТРобм бвШЫп egrep/awk/Perl, ЭХ ЮвпУЮйХЭЭлЩ ЫШиЭШЬШ бШЬТЮЫРЬШ \ — ЯаШ ЦХЫРЭШШ Тл ЬЮЦХвХ ЫХУЪЮ ЯХаХЩвШ ЭР бТЮЩ ШЧЫоСЫХЭЭлЩ бвШЫм.

јХеРЭШЧЬл Ш ТЭХиЭпп ЮвФХЫЪР

ІЭХиЭШЩ ТШФ РТвЮЬЮСШЫп (ШЫШ Т ЬЮХЬ бЫгзРХ — ЬЮвЮжШЪЫР) ЭШзХУЮ ЭХ УЮТЮаШв Ю ХУЮ ТЭгваХЭЭХЬ гбваЮЩбвТХ. БЮбХФШ еТРЫпв СЫХбЪ Ш ТЭХиЭоо ЮвФХЫЪг, ЭЮ ЬХеРЭШЪШ Ш ФагУШХ бЯХжШРЫШбвл Т ЯХаТго ЮзХаХФм СгФгв ЮСбгЦФРвм ФТШУРвХЫм. ЗвЮ нвЮ — апФЭРп зХвТХаЪР? V8? ґШЧХЫм? єРЪ ЭРбзХв ЯЮТлиХЭЭЮЩ бвХЯХЭШ бЦРвШп? ° ЮбЮСЮЩ дЮаЬл ТеЮФЭЮУЮ ЪЮЫЫХЪвЮаР? ° ЬЮЦХв, ТРи РТвЮЬЮСШЫм ЯаШТЮФШвбп Т ФТШЦХЭШХ ЮСлзЭлЬШ ЯХФРЫпЬШ? ЅР УЮЭЮзЭЮЬ ваХЪХ ТЮФШвХЫм гзШвлТРХв ТбХ нвШ дРЪвЮал Т ЪРЦФЮЬ аХиХЭШШ, ЪЮвЮаЮХ ЮЭ ЯаШЭШЬРХв. ІЮЧЬЮЦЭЮ, ФЫп ЪЮаЮвЪШе ЯЮХЧФЮЪ Т ЬРУРЧШЭ нвЮ ЭХбгйХбвТХЭЭЮ — ЭЮ ЪЮУФР-ЭШСгФм ТРЬ ТбХ аРТЭЮ ЯаШФХвбп ЧРЯаРТЫпвм ЬРиШЭг Ш ТлСШаРвм бЮав СХЭЧШЭР. БЯаЮбШвХ ТЮФШвХЫп, ЧРбвапТиХУЮ Т ЯгбвлЭХ ШЧ-ЧР вЮУЮ, звЮ г ЭХУЮ бЫЮЬРЫРбм ЪРЪРп-ЭШСгФм ивгЪЮТШЭР — вРЪ ЫШ ТРЦЭл УЫпЭХж Ш еаЮЬ? ѕвТХв ЯаХФЯЮЫЮЦШвм ЭХвагФЭЮ. ё ХйХ ЮФЭЮ ЧРЬХзРЭШХ: ХбЫШ Тл ЭРЧлТРХвХ бЫЮЬРЭЭго ФХвРЫм «ЪРЪЮЩ-вЮ ивгЪЮТШЭЮЩ», ТапФ ЫШ ТРЬ гФРбвбп бРЬЮбвЮпвХЫмЭЮ ЯЮзШЭШвм ХХ.

ґШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ бЮбвЮШв ШЧ ФТге ЪЮЬЯЮЭХЭвЮТ. їХаТлЩ ЪЮЬЯЮЭХЭв ЮСбгЦФРХвбп Т ЮбвРТиХЩбп зРбвШ нвЮЩ УЫРТл, Р ТвЮаЮЬг ЯЮбТпйРХвбп бЫХФгойРп УЫРТР.

ѕвФХЫЪР Ш ТЭХиЭШЩ ТШФ

ЅРШСЮЫХХ ЮзХТШФЭЮХ ЮвЫШзШХ ЬХЦФг аРЧЭлЬШ ФШРЫХЪвРЬШ аХУгЫпаЭле ТлаРЦХЭШЩ ТлаРЦРХвбп Т ЭРСЮаХ ЯЮФФХаЦШТРХЬле ЬХвРбШЬТЮЫЮТ. єРЪ СлЫЮ ЯЮЪРЧРЭЮ ТлиХ, Т Perl ЯЮФФХаЦШТРовбп ЭХЪЮвЮалХ ЬХвРбШЬТЮЫл, ЮвбгвбвТгойШХ Т egrep. ѕСХ ЯаЮУаРЬЬл ЯЮЧТЮЫпов ШбЪРвм УаРЭШжл бЫЮТ, ЭЮ ЯаШ нвЮЬ ШбЯЮЫмЧгов аРЧЭлХ ЬХвРбШЬТЮЫл Ш аРЧЭлХ ЯЮФеЮФл. ЗвЮ ХйХ ШЭвХаХбЭХХ, Ше ЯаХФбвРТЫХЭШп Ю вЮЬ, звЮ пТЫпХвбп УаРЭШжХЩ бЫЮТР, вРЪЦХ аРЧЫШзРовбп. єРЪ ТШФЭЮ ШЧ нвЮЩ УЫРТл, ЯЮФЮСЭлХ вЮЭЪШХ аРЧЫШзШп ТЮ «ТЭХиЭХЩ ЮвФХЫЪХ» ТбваХзРовбп ЮзХЭм зРбвЮ.

ґТШУРвХЫШ Ш ЬХеРЭШЪР

ВЮзЭРп ШЭвХаЯаХвРжШп ЬХвРбШЬТЮЫЮТ Ш бХЬРЭвШЪР Ше ЮСкХФШЭХЭШп ЯаШ ЯЮбваЮХЭШШ СЮЫмиШе ТлаРЦХЭШЩ ШУаРов ШбЪЫозШвХЫмЭЮ ТРЦЭго аЮЫм, еЮвп нвШ аРЧЫШзШп Ш ЭХ бвЮЫм ЮзХТШФЭл, ЪРЪ аРЧЭлХ ЭРСЮал ЬХвРбШЬТЮЫЮТ. АРЧЫШзШп Т аХРЫШЧРжШШ ЬХеРЭШЧЬР аХУгЫпаЭле ТлаРЦХЭШЩ зРбвЮ ЮваРЦРовбп Т бЫХФгойШе РбЯХЪвРе:

l ШЭдЮаЬРжШп, ЪЮвЮаРп бвРЭЮТШвбп ФЮбвгЯЭЮЩ ЯЮбЫХ гбЯХиЭЮУЮ бЮТЯРФХЭШп (ЭРЯаШЬХа, ЯХаХЬХЭЭРп $1 Ш ХХ бХЬХЩбвТЮ Т пЧлЪХ Perl).

µбЫШ Тл еЮвШвХ УаРЬЮвЭЮ ЯЮЫмЧЮТРвмбп аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ, ТлеЮФпйШЬШ ЧР аРЬЪШ ваШТШРЫмЭле, ЮзХЭм ТРЦЭЮ ЯЮЭШЬРвм нвШ ЮСбвЮпвХЫмбвТР Ш Ше ЯаШзШЭл. НвЮЩ вХЬХ ЯЮбТпйХЭР бЫХФгойРп УЫРТР.

БвРЭФРавЭлХ ЬХвРбШЬТЮЫл

<$M[R3-11]>І ЭРбвЮпйШЩ ЮСЧЮа ЬХвРбШЬТЮЫЮТ бЮТаХЬХЭЭле аХУгЫпаЭле ТлаРЦХЭШЩ СлЫШ ТЪЫозХЭл ЭРШСЮЫХХ аРбЯаЮбваРЭХЭЭлХ ЯЮЭпвШп Ш ЪЮЭжХЯжШШ. АРЧгЬХХвбп, ЧФХбм ЭХ РЭРЫШЧШаговбп ТбХ бгйХбвТгойШХ ЬХвРбШЬТЮЫл, Ш ЭШ ЮФЭР ЯаЮУаРЬЬР ЭХ ЯЮФФХаЦШТРХв ТбХУЮ, звЮ ЧФХбм ЯХаХзШбЫХЭЮ. І ЮЯаХФХЫХЭЭЮЬ бЬлбЫХ нвЮ бТЮФЪР вЮУЮ, звЮ Тл ТШФХЫШ Т ФТге ЭРзРЫмЭле УЫРТРе, ЭЮ Т бТХвХ СЮЫХХ иШаЮЪЮУЮ, СЮЫХХ бЫЮЦЭЮУЮ ЬШаЮТЮЧЧаХЭШп, ЯаХФбвРТЫХЭЭЮУЮ Т ЭРзРЫХ нвЮЩ УЫРТл. µбЫШ Тл ТЯХаТлХ СХаХвХбм ЧР нвЮв аРЧФХЫ, ЬЮЦХвХ ЭР бЪЮаго агЪг ЯаЮбЬЮваХвм ХУЮ Ш ЯХаХЩвШ Ъ бЫХФгойШЬ УЫРТРЬ. Іл бЬЮЦХвХ ТХаЭгвмбп Ъ ЭХЬг ЧР ЯЮФаЮСЭЮбвпЬШ, ЪЮУФР ЮЭШ ТРЬ ЯЮЭРФЮСпвбп.

ѕФЭШ ЯаЮУаРЬЬл (Т ЯХаТго ЮзХаХФм Perl) ЮСЮУРйРовбп ЭЮТлЬШ, ЯЮЫХЧЭлЬШ ТЮЧЬЮЦЭЮбвпЬШ, ФагУШХ ЯЮ бТЮХЩ ЯаШеЮвШ ШЧЬХЭпов бвРЭФРавЭлХ ЯаРТШЫР (ЯаРЪвШзХбЪШ ЫоСЮЩ ЯаЮФгЪв Юв Microsoft). ВаХвмШ ЯлвРовбп бЮСЫоФРвм бвРЭФРавл, ЭЮ ЮбвРТЫпов «зХаЭлХ еЮФл» ФЫп бТЮШе жХЫХЩ. ЕЮвп п ШЭЮУФР СгФг гЯЮЬШЭРвм ЪЮЭЪаХвЭлХ гвШЫШвл, нвР УЫРТР Т ЮбЭЮТЭЮЬ ЯЮбТпйХЭР ЮСйШЬ РбЯХЪвРЬ аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ(awk, Emacs Ш Tcl ЯЮФаЮСЭЮ аРббЬРваШТРовбп Т УЫРТХ 6, Р Perl — Т УЫРТХ 7). І нвЮЬ аРЧФХЫХ п ТбХУЮ ЫШим ЯлвРобм ЮЯШбРвм ЭХЪЮвЮалХ аРбЯаЮбваРЭХЭЭлХ ЬХвРбШЬТЮЫл Ш ЮСЫРбвм Ше ЯаШЬХЭХЭШп, Р вРЪЦХ ЭХЪЮвЮалХ ЯаЮСЫХЬл, ЪЮвЮалХ ЯаШ нвЮЬ ФЮЫЦЭл гзШвлТРвмбп. ІЮ ТаХЬп звХЭШп аХЪЮЬХЭФго ФХаЦРвм ЯЮФ агЪЮЩ агЪЮТЮФбвТЮ ЯЮ вЮЩ ЯаЮУаРЬЬХ, б ЪЮвЮаЮЩ Тл зРбвЮ аРСЮвРХвХ.

БЮЪаРйХЭЭлХ ЮСЮЧЭРзХЭШп бШЬТЮЫЮТ

ІЮ ЬЭЮУШе ЯаЮУаРЬЬРе бгйХбвТгов ЬХвРбШЬТЮЫл ФЫп ЯаХФбвРТЫХЭШп ЬРиШЭЭЮ-ЧРТШбШЬле гЯаРТЫпойШе бШЬТЮЫЮТ, ЪЮвЮалХ вагФЭЮ ТТЮФШвм б ЪЫРТШРвгал ШЫШ ТлТЮФШвм ЭР нЪаРЭ:

І вРСЫ. 3.3 ЯХаХзШбЫХЭл ЭХЪЮвЮалХ бвРЭФРавЭлХ ЯаЮУаРЬЬл Ш ЯЮФФХаЦШТРХЬлХ ШЬШ бЮЪаРйХЭЭлХ ЮСЮЧЭРзХЭШп гЯаРТЫпойШе бШЬТЮЫЮТ, Р вРЪЦХ апФ ФагУШе ЪЮЭбвагЪжШЩ, ЪЮвЮалХ ТбваХвпвбп ЭРЬ Т нвЮЩ УЫРТХ.<$M[R3-22]>

ВРСЫШжР 3.3. БЮЪаРйХЭЭлХ ЮСЮЧЭРзХЭШп, ЯЮФФХаЦШТРХЬлХ ЭХЪЮвЮалЬШ ЯаЮУаРЬЬРЬШ

·РТШбШЬЮбвм Юв ЮЯХаРжШЮЭЭЮЩ бШбвХЬл

<$M[R3-28]>ІЮ ЬЭЮУШе ЯаЮУаРЬЬРе бЮЪаРйХЭЭлХ ЮСЮЧЭРзХЭШп гЯаРТЫпойШе бШЬТЮЫЮТ пТЫповбп ЯЫРвдЮаЬХЭЭЮ-ЧРТШбШЬлЬШ, Р вЮзЭХХ — ЧРТШбпйШЬШ Юв ЪЮЬЯШЫпвЮаР. ІбХ ЯаЮУаРЬЬл, гЯЮЬШЭРХЬлХ Т нвЮЩ ЪЭШУХ (ШбеЮФЭлХ вХЪбвл ЪЮвЮале п ТШФХЫ), СлЫШ ЭРЯШбРЭл ЭР C ШЫШ C++.

єРЪ ЯаРТШЫЮ, ЪЮУФР Тл ЧРЯаРиШТРХвХ ЮФШЭ ШЧ нвШе гЯаРТЫпойШе бШЬТЮЫЮТ Т аХУгЫпаЭЮЬ ТлаРЦХЭШШ ШЫШ Т бваЮЪХ, Тл ЯЮЫгзРХвХ СРЩв, ЪЮвЮалЩ РббЮжШШагХвбп г ЪЮЬЯШЫпвЮаР C б ЧРФРЭЭЮЩ ЯЮбЫХФЮТРвХЫмЭЮбвмо, ЭРзШЭРойХЩбп б ЯаХдШЪбР \. БвРЭФРавл C ЮбвРТЫпов ТлСЮа дРЪвШзХбЪШе ЧЭРзХЭШЩ ЭР гбЬЮваХЭШХ аРЧаРСЮвзШЪР ЪЮЬЯШЫпвЮаР[8].

ЅР ЯаРЪвШЪХ ЪЮЬЯШЫпвЮал ФЫп ТбХе ЯЫРвдЮаЬ Т нвЮЬ ТЮЯаЮбХ ЯЮФзШЭповбп ЮЯаХФХЫХЭЭлЬ бвРЭФРавРЬ, ЯЮнвЮЬг нвШ ЧЭРзХЭШп ЬЮЦЭЮ аРббЬРваШТРвм ЪРЪ<$M[R3-26]> ЧРТШбШЬлХ Юв ЮЯХаРжШЮЭЭЮЩ бШбвХЬл. єаЮЬХ вЮУЮ, ЭР ЯаРЪвШЪХ ТбХ бШЬТЮЫл, ЪаЮЬХ \n Ш \r, бвРЭФРавШЧШаговбп ЬХЦФг ЯЫРвдЮаЬРЬШ; Тл ЬЮЦХвХ аРббзШвлТРвм ЭР вЮ, звЮ ЮСЮЧЭРзХЭШХ \t бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг вРСгЫпжШШ ЯаРЪвШзХбЪШ ТХЧФХ, УФХ ЯЮФФХаЦШТРХвбп ЪЮФШаЮТЪР ASCII ШЫШ ХХ ЭРФЬЭЮЦХбвТЮ (ШбЪЫозХЭШЩ п ХйХ ЭХ ТШФХЫ).

є бЮЦРЫХЭШо, ЪРЪ ТШФЭЮ ШЧ ЯаШТХФХЭЭЮУЮ ЭР ЯаХФлФгйХЩ бваРЭШжХ бЯШбЪР, бШЬТЮЫл \n Ш \r бвРЭФРавШЧШаЮТРЭл ЭХ ЯЮЫЭЮбвмо. ЅР ТбХе ЯЫРвдЮаЬРе бвРЭФРавЭЮЩ ЯЮбвРТЪШ GNU C (Ъ зШбЫг ЪЮвЮале ЭХ ЯаШЭРФЫХЦШв MacOS) бШЬТЮЫл \n Ш \r ЮвЮСаРЦРовбп ЭР ASCII-бШЬТЮЫл ЯХаХТЮФР бваЮЪШ Ш ТЮЧТаРвР ЪгабЮаР бЮЮвТХвбвТХЭЭЮ. ёбЪЫозХЭШХЬ пТЫпХвбп вЮЫмЪЮ бШбвХЬР IBM 370, ШбЯЮЫмЧгойРп EBCDIC.

µбЫШ Тл еЮвШвХ, ЭРЯаШЬХа, звЮСл бШЬТЮЫ ЮСЮЧЭРзРЫ «ЭЮТго бваЮЪг» ТЮ ТбХе бШбвХЬРе, УФХ СгФХв аРСЮвРвм ТРи бжХЭРаШЩ, ТЮбЯЮЫмЧгЩвХбм ЮСЮЧЭРзХЭШХЬ \n. µбЫШ Тл еЮвШвХ аРСЮвРвм б ЪЮЭЪаХвЭлЬ ЧЭРзХЭШХЬ СРЩвР (ЭРЯаШЬХа, ЯаШ ЯаЮУаРЬЬШаЮТРЭШШ ФЫп бвРЭФРавЭле ЯаЮвЮЪЮЫЮТ вШЯР HTTP[9]), ТЮбЯЮЫмЧгЩвХбм ЧРЯШбмо \012 ШЫШ ФагУШЬ ЧЭРзХЭШХЬ, бЮЮвТХвбвТгойШЬ ТРиХЬг бвРЭФРавг.

ІЮбмЬХаШзЭлХ ЪЮФл — \зШбЫЮ

І ЭХЪЮвЮале аХРЫШЧРжШпе СРЩв б ЪЮЭЪаХвЭлЬ ЧЭРзХЭШХЬ ЬЮЦХв ЮСЮЧЭРзРвмбп ТЮбмЬХаШзЭлЬ ЪЮФЮЬ, бЮбвЮпйШЬ ШЧ ваХе жШда. ЅРЯаШЬХа, [\015\012] бЮЮвТХвбвТгХв ЯЮбЫХФЮТРвХЫмЭЮбвШ ASCII-бШЬТЮЫЮТ CR/LF. ІЮбмЬХаШзЭлХ ЪЮФл ЯЮЧТЮЫпов ЫХУЪЮ ТбвРТЫпвм Т ТлаРЦХЭШп бШЬТЮЫл, ЪЮвЮалХ вагФЭЮ ТбвРТШвм ФагУШЬ бЯЮбЮСЮЬ. ЅРЯаШЬХа, Т Perl ЬЮЦЭЮ ШбЯЮЫмЧЮТРвм ФЫп ASCII-бШЬТЮЫР Escape ЮСЮЧЭРзХЭШХ [\e], ЭЮ Т awk вРЪРп ТЮЧЬЮЦЭЮбвм ЮвбгвбвТгХв. їЮбЪЮЫмЪг Т awk ЯЮФФХаЦШТРовбп ТЮбмЬХаШзЭлХ ЪЮФл, бШЬТЮЫ Escape ЬЮЦЭЮ ТбвРТШвм ЭХЯЮбаХФбвТХЭЭЮ Т ТШФХ ASCII-ЪЮФР: [\033].

ІЮбмЬХаШзЭРп жШдаР 9 Ш ФагУШХ бваРЭЭЮбвШ

ЅХвЮзЭЮбвШ Т аХРЫШЧРжШпе ЯЮаЮЩ ЯаШТЮФпв Ъ ЧРЬХзРвХЫмЭлЬ ЯЮбЫХФбвТШпЬ. ІХЧФХ, ЪаЮЬХ ЮзХЭм бвРале ТХабШЩ lex, ЯаРТШЫмЭРп ШЭвХаЯаХвРжШп \0079 ЭХ ТлЧлТРЫР ЯаЮСЫХЬ. ґЫШЭР ТЮбмЬХаШзЭЮУЮ ЪЮФР ЭХ ЬЮЦХв ЯаХТлиРвм ваШ жШдал, ЯЮнвЮЬг \0079 бЮЮвТХвбвТгХв ФТгЬ бШЬТЮЫРЬ: СРЩвг б ТЮбмЬХаШзЭлЬ ЪЮФЮЬ 7, ЧР ЪЮвЮалЬ бЫХФгХв ЫШвХаРЫ «9». ° звЮ Тл бЪРЦХвХ Ю \079? јЭЮУШХ аХРЫШЧРжШШ ЯЮЭШЬРов, звЮ 9 ЭХ пТЫпХвбп ТЮбмЬХаШзЭЮЩ жШдаЮЩ, Ш ШЭвХаЯаХвШагов ЪРЪ ТЮбмЬХаШзЭлЩ ЪЮФ вЮЫмЪЮ \07; аХЧгЫмвРв ЯЮЫгзРХвбп вРЪЮЩ ЦХ, ЪРЪ Ш ФЫп \0079 Ш \79. ѕФЭРЪЮ flex, AT&T-ТХабШШ awk Ш Tcl<$M[R3-23]> ШЭвХаЯаХвШагов 9 ЪРЪ ТЮбмЬХаШзЭго жШдаг (ЧЭРзХЭШХ ЪЮвЮаЮЩ бЮТЯРФРХв б \11!) ґЫп ЯгйХУЮ аРЧЭЮЮСаРЧШп GNU awk ШЭЮУФР ТлФРХв дРвРЫмЭго ЮиШСЪг[10].

ІЮЧЭШЪРХв ТЮЯаЮб: Р ЪРЪ ШЭвХаЯаХвШаговбп ЪЮФл, ТлеЮФпйШХ ЧР ЯаХФХЫл ФЮЯгбвШЬЮУЮ ШЭвХаТРЫР — бЪРЦХЬ, \565 (8-аРЧапФЭлХ ТЮбмЬХаШзЭлХ ТХЫШзШЭл ЯаШЭШЬРов ЧЭРзХЭШп Юв \000 ФЮ \377)? ѕЪРЧлТРХвбп, ЯЮЫЮТШЭР аХРЫШЧРжШЩ ЮбвРТЫпХв Ше Т ТШФХ ТХЫШзШЭл, ТлеЮФпйХЩ ЧР УаРЭШжл СРЩвР (ЪЮвЮаРп ЭШЪЮУФР ЭШ б зХЬ ЭХ бЮТЯРФХв), Р ФагУРп ЯЮЫЮТШЭР гбХЪРХв ФЮ СРЩвР (Т ЯаШТХФХЭЭЮЬ ЯаШЬХаХ ЧЭРзХЭШХ ЮСлзЭЮ гбХЪРХвбп ФЮ \165, ASCII-бШЬТЮЫР u).

ИХбвЭРФжРвХаШзЭлХ ЪЮФл — \x зШбЫЮ

їЮ РЭРЫЮУШШ б ТЮбмЬХаШзЭлЬШ ЪЮФРЬШ, ТЮ ЬЭЮУШе гвШЫШвРе бгйХбвТгХв ТЮЧЬЮЦЭЮбвм ТТЮФР ЪЮФЮТ Т иХбвЭРФжРвХаШзЭЮЩ бШбвХЬХ бзШбЫХЭШп (б ЮбЭЮТРЭШХЬ 16) ЯаШ ЯЮЬЮйШ ЯаХдШЪбР \x. їЮбЫХФЮТРвХЫмЭЮбвм [\x0D\x0A] бЮЮвТХвбвТгХв ЯЮбЫХФЮТРвХЫмЭЮбвШ ASCII-бШЬТЮЫЮТ CR/LF. їаЮСЫХЬл, ЮЯШбРЭЭлХ Т ЯаХФлФгйХЬ аРЧФХЫХ, ФЫп иХбвЭРФжРвХаШзЭле ЪЮФЮТ ХйХ СЮЫХХ гбЫЮЦЭповбп. ѕФЭШ аХРЫШЧРжШШ аРЧаХиРов ШбЯЮЫмЧЮТРвм иХбвЭРФжРвХаШзЭлХ ЪЮФл, бЮбвЮпйШХ вЮЫмЪЮ ШЧ ФТге жШда, ФагУШХ вРЪЦХ аРЧаХиРов иХбвЭРФжРвХаШзЭлХ ЪЮФл б ЮФЭЮЩ жШдаЮЩ. І ваХвмШе ЪЮЫШзХбвТЮ жШда ЬЮЦХв Слвм ЫоСлЬ. НвЮ ЯаШТЮФШв Ъ ТбХТЮЧЬЮЦЭлЬ боаЯаШЧРЬ<$M[R3-19]> — ЭРЯаШЬХа, ХбЫШ Тл ТЪЫозРХвХ Т ТлаРЦХЭШХ [ora\x2Ecom] иХбвЭРФжРвХаШзЭлЩ ЪЮФ \x2E, Р аХРЫШЧРжШп ТЮбЯаШЭШЬРХв ХУЮ ЪРЪ \x2EC.

јЮЦХв ЯЮЪРЧРвмбп, звЮ ХбЫШ Тл ЯаШТлЪЫШ Ъ ЮбЮСХЭЭЮбвпЬ бТЮХЩ ЯаЮУаРЬЬл, вРЪШХ ЮиШСЪШ ЭХ ТЮЧЭШЪРов. є бЮЦРЫХЭШо, ЪЮУФР аРЧЭлХ аХРЫШЧРжШШ ЮФЭЮЩ ЯаЮУаРЬЬл ЭРзШЭРов ТХбвШ бХСп ЯЮ-аРЧЭЮЬг, ТЮЧЭШЪРов ЯаЮСЫХЬл ЯХаХЭЮбШЬЮбвШ Ш ЮСЭЮТЫХЭШп. ЅРЯаШЬХа, ЮФЭШ ШЧТХбвЭлХ ЬЭХ ТХабШШ awk (GNU awk Ш MKS awk) зШвРов ЫоСЮХ ЪЮЫШзХбвТЮ иХбвЭРФжРвХаШзЭле жШда, Р ФагУШХ (вРЪШХ, ЪРЪ mawk) зШвРов вЮЫмЪЮ ФТХ жШдал. AT&T awk вЮЦХ ЮУаРЭШзШТРХвбп ФТгЬп жШдаРЬШ.

ЗШбЫЮТлХ ЪЮФл Ш ЫШвХаРЫл

µбЫШ ФШРЫХЪв ТРиХЩ ЯаЮУаРЬЬл ЯЮФФХаЦШТРХв ТбвРТЪг зШбЫЮТле ЪЮФЮТ бШЬТЮЫЮТ, ЬЮЦЭЮ ЯаХФЯЮЫЮЦШвм, звЮ ТлаРЦХЭШХ [[+\055*/]] ЯаХФбвРТЫпХв бЮСЮЩ бШЬТЮЫмЭлЩ ЪЫРбб, бЮТЯРФРойШЩ б ЯЫобЮЬ, ЬШЭгбЮЬ (055 — ASCII-ЪЮФ бШЬТЮЫР «-»), ЧТХЧФЮзЪЮЩ ШЫШ ЪЮбЮЩ зХавЮЩ. І Perl Ш ЬЭЮУШе ФагУШе ЯаЮУаРЬЬРе нвЮ ФХЩбвТШвХЫмЭЮ вРЪ — ЯаХФЯЮЫРУРХвбп, звЮ ХбЫШ Тл аХиШЫШбм ЭР еЫЮЯЮвл<$M[R3-18]> б ТТЮФЮЬ ТЮбмЬХаШзЭЮУЮ ЪЮФР, вЮ нвЮв ЪЮФ ЭХ бЫХФгХв ШЭвХаЯаХвШаЮТРвм ЪРЪ ЮСлзЭлЩ ЬХвРбШЬТЮЫ. ѕФЭРЪЮ ЭХЪЮвЮалХ аХРЫШЧРжШШ[11] ЯаХЮСаРЧгов ТбвРТЫХЭЭлХ ЪЮФл ХйХ ФЮ ЯаЮбЬЮваР ТлаРЦХЭШп ЮбЭЮТЭлЬ ЬХеРЭШЧЬЮЬ, ЯЮнвЮЬг б вЮзЪШ ЧаХЭШп ЯЮбЫХФЭХУЮ ТлаРЦХЭШХ бЮФХаЦШв бШЬТЮЫ «-», ЪЮвЮалЩ ФЮЫЦХЭ СлЫ ЧРЬРбЪШаЮТРЭ ЯЮбаХФбвТЮЬ ТбвРТЪШ ЪЮФР. І аХЧгЫмвРвХ +-* аРббЬРваШТРХвбп ЪРЪ ШЭвХаТРЫ. НвЮ ЯаШТЮФШв Ъ ЭХЮЦШФРЭЭлЬ ЯЮбЫХФбвТШпЬ, ЯЮнвЮЬг Т вРСЫ. 3.3 вРЪШХ аХРЫШЧРжШШ ЯЮЬХзХЭл ЧЭРЪЮЬ ▲.

ёЧ ТбХе ЯаЮвХбвШаЮТРЭЭле ЬЭЮЩ ЯаЮУаРЬЬ ЯЮФЮСЭРп «ФТгеЯаЮеЮФЭРп» ЮСаРСЮвЪР ТлЯЮЫЭпЫРбм вЮЫмЪЮ Т GNU Ш MKS awk. П УЮТЮао нвЮ, ЧЭРп Ю вЮЬ, звЮ Т РЭРЫЮУШзЭЮЩ бШвгРжШШ Tcl, Emacs Ш Python вЮЦХ аРббЬРваШТРов \055 ЪРЪ ШЭвХаТРЫмЭлЩ ЬХвРбШЬТЮЫ, ЭЮ нвШ ЯаЮУаРЬЬл ЭХ СлЫШ ЯЮЬХзХЭл ЧЭРЪЮЬ ▲. І зХЬ ЦХ ФХЫЮ?

БваЮЪШ ЪРЪ аХУгЫпаЭлХ ТлаРЦХЭШп

<$M[R3-21]>єРЪ ТШФЭЮ ШЧ вРСЫ. 3.3, Т аХУгЫпаЭле ТлаРЦХЭШпе Emacs, Tcl Ш Python[12] ЯЮФФХаЦШТРХвбп СЮЫмиШЭбвТЮ ШЧ ЯХаХзШбЫХЭЭле ЮСЮЧЭРзХЭШЩ. ЅЮ ЯЮзХЬг ЮЭШ ЯЮЬХзХЭл ЧЭРЪЮЬ ###СХЫРп УРЫЮзЪР### ? їЮвЮЬг звЮ ЭР бРЬЮЬ ФХЫХ нвР ЧРЯШбм, ФРЦХ ТЮбмЬХаШзЭлХ ЪЮФл, ЭХ ЯЮФФХаЦШТРовбп ЬХеРЭШЧЬЮЬ аХУгЫпаЭле ТлаРЦХЭШЩ. І нвШе ЯаЮУаРЬЬРе ЮЯХаРЭФл, ЪЮвЮалХ ЯаХФбвРТЫпов бЮСЮЩ аХУгЫпаЭлХ ТлаРЦХЭШп, ЮСлзЭЮ ЯХаХФРовбп Т бваЮЪЮТЮЬ ТШФХ. НвЮ ЮЧЭРзРХв, звЮ ФЮ вЮУЮ, ЪРЪ ТлаРЦХЭШХ СгФХв ЯХаХФРЭЮ ЬХеРЭШЧЬг аХУгЫпаЭле ТлаРЦХЭШЩ, ЮЭЮ ЯаЮеЮФШв бвРЭФРавЭго бваЮЪЮТго ЮСаРСЮвЪг Т бЮЮвТХвбвТШШ б ЯаРТШЫРЬШ пЧлЪР. ёЬХЭЭЮ бваЮЪЮТлХ баХФбвТР, Р ЭХ ЬХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ, ЮСХбЯХзШТРов ЯЮФФХаЦЪг бШЭвРЪбШзХбЪШе нЫХЬХЭвЮТ, ЯЮЬХзХЭЭле ЧЭРЪЮЬ ###СХЫРп УРЫЮзЪР### (ЯЮФЮСЭлЩ ЯаШЬХа гЦХ ТбваХзРЫбп ЯаШ ЮЯШбРЭШШ Emacs ЭР б. <$R[P#,R3-1]>).

НвЮ ЮЧЭРзРХв, звЮ ФРЭЭлХ ЮСЮЧЭРзХЭШп ЬЮУгв ШбЯЮЫмЧЮТРвмбп Т аХУгЫпаЭле ТлаРЦХЭШпе<$M[R3-4]> Т СЮЫмиШЭбвТХ ЯаРЪвШзХбЪШе бШвгРжШЩ, ЯЮнвЮЬг п ТЪЫозШЫ Ше Т вРСЫ. 3.3. ѕФЭРЪЮ бЫХФгХв ЯЮЬЭШвм, звЮ бваЮЪЮТРп ЮСаРСЮвЪР, ЮСХбЯХзШТРойРп нвг ТЮЧЬЮЦЭЮбвм, ТлЯЮЫЭпХвбп ЫШим Т вЮЬ бЫгзРХ, ЪЮУФР ЮЯХаРЭФл аХУгЫпаЭле ТлаРЦХЭШЩ ФХЩбвТШвХЫмЭЮ пТЫповбп бваЮЪРЬШ. µбЫШ ТлаРЦХЭШХ ЯХаХФРХвбп Т ЪЮЬРЭФЭЮЩ бваЮЪХ ШЫШ зШвРХвбп ШЧ дРЩЫР Т ФагУЮЩ, ЭХ бваЮЪЮТЮЩ дЮаЬХ, вЮ ФРЭЭлХ ЯХаХФРовбп ЬХеРЭШЧЬг аХУгЫпаЭле ТлаРЦХЭШЩ Т «блаЮЬ», ЭХЮСаРСЮвРЭЭЮЬ ТШФХ, Ш вЮУФР нвШ ЮСЮЧЭРзХЭШп бвРЭЮТпвбп ЭХФЮбвгЯЭлЬШ. ІЮв ЯЮзХЬг, ЭРЯаШЬХа, ЮЭШ ЭХ ЬЮУгв ШбЯЮЫмЧЮТРвмбп Т аХУгЫпаЭле ТлаРЦХЭШпе Emacs, ТТЮФШЬле ЯЮЫмЧЮТРвХЫХЬ ЭХЯЮбаХФбвТХЭЭЮ ТЮ ТаХЬп бХРЭбР аХФРЪвШаЮТРЭШп.

ЗвЮ нвЮ ЮЧЭРзРХв ЫШзЭЮ ФЫп ТРб? єРЪ ЬШЭШЬгЬ вЮ, звЮ нвШ ЮСЮЧЭРзХЭШп ЬЮУгв ЯаХТаРйРвмбп Т ЬХвРбШЬТЮЫл (ЪРЪ ЯЮЬХзХЭЭлХ ЧЭРЪЮЬ ▲ Т вРСЫ. 3.3), Ш ЯаШ ТЮЧЭШЪЭЮТХЭШШ ЪЮЭдЫШЪвЮТ ЬХЦФг ЬХвРбШЬТЮЫРЬШ бваЮЪ Ш аХУгЫпаЭле ТлаРЦХЭШЩ ЯаШЮаШвХв ЮвФРХвбп ЬХвРбШЬТЮЫРЬ бваЮЪ. ґЫп ЯаХФЮвТаРйХЭШп ЭХТХаЭЮЩ ШЭвХаЯаХвРжШШ ЪЮЭдЫШЪвЭлХ ЬХвРбШЬТЮЫл аХУгЫпаЭле ТлаРЦХЭШЩ ЭХЮСеЮФШЬЮ нЪаРЭШаЮТРвм.

[\b] ЪРЪ ЧРСЮЩ, [\b] ЪРЪ УаРЭШжР бЫЮТР

ІХаЮпвЭЮ, Тл ЧРЬХвШЫШ, звЮ Т Python Ш Emacs бШЬТЮЫ \b ШЬХХв ФТЮЩЭго ШЭвХаЯаХвРжШо. ·ЭРЪ ###СХЫРп УРЫЮзЪР### гЪРЧлТРХв ЭР ШЭвХаЯаХвРжШо \b бваЮЪЮТлЬ ЬХеРЭШЧЬЮЬ, Т аХЧгЫмвРвХ ЪЮвЮаЮЩ ЮЭ ЯаХТаРйРХвбп Т ЧРСЮЩ. ·ЭРЪ √ ЮвЭЮбШвбп Ъ ШЭвХаЯаХвРжШШ \b ЬХеРЭШЧЬЮЬ аХУгЫпаЭле ТлаРЦХЭШЩ, Т аХЧгЫмвРвХ зХУЮ ЮЭ ЯаХЮСаРЧгХвбп Т ЬХвРбШЬТЮЫ УаРЭШжл бЫЮТР[13]. ІвЮаРп ШЭвХаЯаХвРжШп ЮСХбЯХзШТРХвбп ТЪЫозХЭШХЬ Т бваЮЪг ЯЮбЫХФЮТРвХЫмЭЮбвШ \\b — Т ЯаЮжХббХ ЮСаРСЮвЪШ бваЮЪШ \\ ЯаХЮСаРЧгХвбп Т ЮФШЭ бШЬТЮЫ \, ЮбвРТЫпп ЬХеРЭШЧЬг аХУгЫпаЭле ТлаРЦХЭШЩ \b. єРЪ ЭШ бЬХиЭЮ, ЭЮ аХУгЫпаЭЮХ ЯЮФТлаРЦХЭШХ, ЮЧЭРзРойХХ ЮФШЭ ЫШвХаРЫ «ЮСаРвЭРп ЪЮбРп зХавР», бЮбвЮШв ШЧ зХвлаХе бШЬТЮЫЮТ \. АХУгЫпаЭЮХ ТлаРЦХЭШХ ФЮЫЦЭЮ бЮФХаЦРвм ЯЮбЫХФЮТРвХЫмЭЮбвм [\\], Р ЪРЦФлЩ бШЬТЮЫ \, ЯаШбгвбвТгойШЩ Т аХУгЫпаЭЮЬ ТлаРЦХЭШШ, ФЮЫЦХЭ Слвм гФТЮХЭ Т ШбеЮФЭЮЩ бваЮЪХ. І аХЧгЫмвРвХ ЯЮЫгзРХвбп \\\\.

ЕЮвп Т аРббЬРваШТРХЬле ФЮ ЭРбвЮпйХУЮ ЬЮЬХЭвР бШвгРжШпе Python Ш Emacs ТХЫШ бХСп ЯЮеЮЦШЬ ЮСаРЧЮЬ, ЮЭШ ЯЮ-аРЧЭЮЬг ШЭвХаЯаХвШагов нЪаРЭШаЮТРЭЭлХ ЯЮбЫХФЮТРвХЫмЭЮбвШ, ЭХ ЮЯЮЧЭРЭЭлХ Т ЯаЮжХббХ ЮСаРСЮвЪШ бваЮЪ.

ѕСаРСЮвЪР Т бвШЫХ Emacs: гФРЫХЭШХ бШЬТЮЫР \

<$M[R3-24]>І бваЮЪРе Emacs, ЪРЪ Ш Т СЮЫмиШЭбвТХ ЯРЪХвЮТ Ш пЧлЪЮТ б ЯЮФФХаЦЪЮЩ аХУгЫпаЭле ТлаРЦХЭШЩ, ЭХЮЯЮЧЭРЭЭлХ бШЬТЮЫл \ гФРЫповбп, Р Т бваЮЪг ТЪЫозРХвбп бЫХФгойШЩ бШЬТЮЫ. БЫХФЮТРвХЫмЭЮ, ЪРЦФлЩ бШЬТЮЫ \, ЪЮвЮалЩ ФЮЫЦХЭ ТЮЩвШ Т аХУгЫпаЭЮХ ТлаРЦХЭШХ, ФЮЫЦХЭ нЪаРЭШаЮТРвмбп ФЮЯЮЫЭШвХЫмЭлЬ ЯаХдШЪбЮЬ \. їаШЬХа СлЫ ЯаШТХФХЭ ЭР б. <$R[P#,R3-2]>; ЯаШТХФг ФагУЮХ ТлаРЦХЭШХ:

Ѕг ЪРЪ? ГФРбвбп ЫШ ТРЬ беЮФг аРЧЮСаРвмбп Т нвЮЬ ТлаРЦХЭШШ? їаШЬХа ТЧпв ШЧ аХРЫмЭЮЩ ЯаЮУаРЬЬл[14], ЭЮ г ЬХЭп Юв ЭХУЮ УЮЫЮТР ШФХв ЪагУЮЬ. їЮбЪЮЫмЪг ТлаРЦХЭШХ ЯХаХФРХвбп Т ТШФХ бваЮЪШ, ЬХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ ЯЮЫгзРХв ХУЮ ЫШим ЯЮбЫХ вЮУЮ, ЪРЪ ЮЭЮ ЯаЮЩФХв бвРЭФРавЭго бваЮЪЮТго ЮСаРСЮвЪг. јХеРЭШЧЬг аХУгЫпаЭле ТлаРЦХЭШЩ Т ФХЩбвТШвХЫмЭЮбвШ СгФХв ЯХаХФРЭЮ ТлаРЦХЭШХ:

АРЧЮСаРвмбп Т вРЪЮЬ ТлаРЦХЭШШ ЯаЮйХ, ЭЮ ФЫп баРТЭХЭШп п ЯаШТХФг ЧРЯШбм, еРаРЪвХаЭго ФЫп ФШРЫХЪвР egrep:

НвЮ аХУгЫпаЭЮХ ТлаРЦХЭШХ ФЫп ЯЮШбЪР бваЮЪШ, ЧРЪЫозХЭЭЮЩ Т ЪРТлзЪШ. ѕФЭЮ ЧРЬХзРЭШХ: Т бШЬТЮЫмЭле ЪЫРббРе Emacs бШЬТЮЫ \ ЭХ пТЫпХвбп ЬХвРбШЬТЮЫЮЬ. І нвЮЬ ЮвЭЮиХЭШШ Emacs ЯЮеЮЦ, ЭРЯаШЬХа, ЭР egrep, ЭЮ ЮвЫШзРХвбп Юв Perl, lex Ш awk. І вХе ЯаЮУаРЬЬРе, УФХ ЮСаРвЭРп ЪЮбРп зХавР ШЬХХв ЮбЮСго ШЭвХаЯаХвРжШо Т бШЬТЮЫмЭле ЪЫРббРе, [^\"] бЫХФгХв ЧРЯШблТРвм Т ТШФХ [^\\"]. єРЦХвбп, п ЧРСХУРо ТЯХаХФ, ЯЮвЮЬг звЮ нвЮ аХУгЫпаЭЮХ ТлаРЦХЭШХ ТбваХвШвбп ЭРЬ Т УЫРТРе 4 Ш 5, ЭЮ ФЫп баРТЭХЭШп ЧРЬХзг, звЮ ЭР Perl ЯаШТХФХЭЭлЩ ЯаШЬХа ЧРЯШблТРХвбп Т ТШФХ

ѕСаРСЮвЪР Т бвШЫХ Python: ЯХаХФРзР бШЬТЮЫР \

І бваЮЪРе Python ЯЮ ЮвЭЮиХЭШо Ъ ЭХЮЯЮЧЭРЭЭлЬ бШЬТЮЫРЬ \ ШбЯЮЫмЧгХвбп ЯаЮвШТЮЯЮЫЮЦЭлЩ ЯЮФеЮФ: ЮЭШ ЯХаХФРовбп СХЧ ШЧЬХЭХЭШЩ. І аХУгЫпаЭле ТлаРЦХЭШпе Python ЯХаТлХ ФХТпвм ЮСаРвЭле бблЫЮЪ ЮСЮЧЭРзРовбп ЬХвРбШЬТЮЫРЬШ Юв [\1] ФЮ [\9], Р ФЫп ЯЮбЫХФгойШе ЮСаРЧЭле бблЫЮЪ ШбЯЮЫмЧговбп ЮСЮЧЭРзХЭШп Юв [\v10] ФЮ [\v99]. ѕФЭРЪЮ Т бваЮЪРе Python \v ЮЯЮЧЭРХвбп ЪРЪ бШЬТЮЫ ТХавШЪРЫмЭЮЩ вРСгЫпжШШ, ЯЮнвЮЬг ФЫп вЮУЮ, звЮСл бЮбЫРвмбп ЭР ФТХЭРФжРвго УагЯЯг ЪагУЫле бЪЮСЮЪ, ЭХЮСеЮФШЬЮ ТЪЫозШвм Т бваЮЪг \\v12. ІаЮФХ Сл ЯЮЪР ТбХ ШФХв, ЪРЪ Т Emacs.

І аХУгЫпаЭле ТлаРЦХЭШпе Python [\w] ШЭвХаЯаХвШагХвбп ЪРЪ бШЬТЮЫ бЫЮТР (бЬ. бЫХФгойШЩ аРЧФХЫ). їЮбЪЮЫмЪг [\w] ЭХ ШЬХХв бЮСбвТХЭЭЮЩ ШЭвХаЯаХвРжШШ Т бваЮЪРе Python, Р ЭХЮЯЮЧЭРЭЭлХ бШЬТЮЫл \ ЯХаХФРовбп СХЧ ШЧЬХЭХЭШЩ, Тл ЬЮЦХвХ бЬХЫЮ ТЪЫозШвм Т бваЮЪг ЭХнЪаРЭШаЮТРЭЭлЩ ЬХвРбШЬТЮЫ \w. НвЮ гЬХЭмиРХв ЯаЮпТЫХЭШп «бШЭФаЮЬР ЮСаРвЭЮЩ ЪЮбЮЩ», Юв ЪЮвЮаЮУЮ бваРФРХв Emacs, ЭЮ ЮУаРЭШзШТРХв ЯЮвХЭжШРЫмЭлХ ТЮЧЬЮЦЭЮбвШ аРбиШаХЭШп бваЮЪ Python Т СгФгйХЬ (ТЯаЮзХЬ, ХбЫШ Тл жХЭШвХ ЫЮУШзХбЪго бЮУЫРбЮТРЭЭЮбвм ЯаХТлиХ ТбХУЮ ЯаЮзХУЮ, нвЮ ЬЮЦЭЮ бзШвРвм ЯЮЫЮЦШвХЫмЭлЬ бТЮЩбвТЮЬ).

БЮЪаРйХЭЭлХ ЮСЮЧЭРзХЭШп ЪЫРббЮТ, бШЬТЮЫ «вЮзЪР» Ш бШЬТЮЫмЭлХ ЪЫРббл

І ЭХЪЮвЮале ЯаЮУаРЬЬРе ЯаХФгбЬЮваХЭл гФЮСЭлХ бЮЪаРйХЭШп ФЫп ЪЮЭбвагЪжШЩ, ЪЮвЮалХ ЮСлзЭЮ ЮдЮаЬЫповбп Т ТШФХ ЪЫРббР:

НвШ ЮСЮЧЭРзХЭШп вРЪЦХ ЯаШТХФХЭл Т вРСЫ. 3.3. єРЪ УЮТЮаШЫЮбм ЭР б. <$R[P#,R3-3]>, ЫЮЪРЫмЭлЩ ЪЮЭвХЪбв POSIX ЬЮЦХв ТЫШпвм ЭР ШЭвХаЯаХвРжШо ЭХЪЮвЮале ЮСЮЧЭРзХЭШЩ. П вТХаФЮ ЧЭРо, звЮ нвЮ вРЪ Т Tcl, Emacs Ш Perl, Ш гТХаХЭ, звЮ Т ЮбвРЫмЭле ЯаЮУаРЬЬРе ФХЫЮ ЮСбвЮШв вРЪЦХ. ·Р вЮзЭЮЩ ШЭдЮаЬРжШХЩ бЫХФгХв ЮСаРвШвмбп Ъ ФЮЪгЬХЭвРжШШ (ФРЦХ ХбЫШ Тл ЭХ ЯЮЫмЧгХвХбм ЫЮЪРЫмЭлЬШ ЪЮЭвХЪбвРЬШ, Ше ЭХЮСеЮФШЬЮ гзШвлТРвм еЮвп Сл ШЧ бЮЮСаРЦХЭШЩ ЯХаХЭЮбШЬЮбвШ).

БШЭвРЪбШзХбЪШХ ЪЫРббл Emacs

ѕФЭРЪЮ ТЮЧЬЮЦЭл бЮТХаиХЭЭЮ ШЭлХ ШЭвХаЯаХвРжШШ. І GNU Emacs Ш ХУЮ бХЬХЩбвТХ [\s] ЮЧЭРзРХв бЯХжШРЫмЭлЩ «бШЭвРЪбШзХбЪШЩ ЪЫРбб». ЅШЦХ ЯаШТХФХЭл ФТР ЯаШЬХаР:

ЅРЯаШЬХа, [\sw] ЮЧЭРзРХв «бШЬТЮЫ, ТеЮФпйШЩ Т бЫЮТЮ» (ШФХЭвШзЭЮ [\w]), Р [\s-] ЮЧЭРзРХв «бШЬТЮЫ-ЯаЮЯгбЪ». їЮбЪЮЫмЪг ЯЮбЫХФЭпп ЪЮЭбвагЪжШп ЮзХЭм ЯЮеЮЦР ЭР ЬХвРбШЬТЮЫ Perl [\s], Т вРСЫ. 3.3 ЮЭР ЯЮЬХзХЭР ЧЭРЪЮЬ ###ЯЫоб б ФлаЪЮЩ###.

ѕбЮСХЭЭЮбвм бШЭвРЪбШзХбЪШе ЪЫРббЮТ ЧРЪЫозРХвбп Т вЮЬ, звЮ вЮзЭлЩ бЮбвРТ ТеЮФпйШе Т ЭШе бШЬТЮЫЮТ ЬЮЦХв ШЧЬХЭпвмбп ТЮ ТаХЬп аРСЮвл ЯаЮУаРЬЬл. ЅРЯаШЬХа, ЪЮЭжХЯжШп бШЬТЮЫЮТ, ЮСаРЧгойШе бЫЮТР<$M[R3-8]>, ЬЮЦХв ШЧЬХЭпвмбп Т ЧРТШбШЬЮбвШ Юв вШЯР аХФРЪвШагХЬЮУЮ дРЩЫР (ЧР ЯЮФаЮСЭЮбвпЬШ ЮСаРйРЩвХбм Ъ УЫРТХ 6, ЭРзШЭРп бЮ б. <$R[P#,R6-4]>)

ВЮзЪР — (ЯЮзвШ) ЫоСЮЩ бШЬТЮЫ

І ЮФЭШе ЯаЮУаРЬЬРе вЮзЪР пТЫпХвбп бЮЪаРйХЭЭлЬ ЮСЮЧЭРзХЭШХЬ бШЬТЮЫмЭЮУЮ ЪЫРббР, бЮТЯРФРойХУЮ б ЫоСлЬ ТЮЧЬЮЦЭлЬ бШЬТЮЫЮЬ, Р Т ФагУШе — б ЫоСлЬ бШЬТЮЫЮЬ, ЪаЮЬХ бШЬТЮЫР ЭЮТЮЩ бваЮЪШ. НвЮ вЮЭЪЮХ аРЧЫШзШХ ШУаРХв ТРЦЭго аЮЫм Т ЯаЮУаРЬЬРе, ФЮЯгбЪРойШе ЭРЫШзШХ ЭХбЪЮЫмЪШе ЫЮУШзХбЪШе бваЮЪ Т жХЫХТЮЬ вХЪбвХ.

ёбеЮФЭлХ ШЭбвагЬХЭвл Unix аРСЮвРЫШ Т ЯЮбваЮзЭЮЬ аХЦШЬХ, ЯЮнвЮЬг ФЮ ЯЮпТЫХЭШп sed Ш lex бРЬР ЯаЮСЫХЬР бЮТЯРФХЭШп б бШЬТЮЫЮЬ ЭЮТЮЩ бваЮЪШ СлЫР ЭХРЪвгРЫмЭЮЩ. є ЬЮЬХЭвг ЯЮпТЫХЭШп нвШе ЯаЮУаРЬЬ ЧРЯШбм [.*] бвРЫР аРбЯаЮбваРЭХЭЭЮЩ ШФШЮЬЮЩ «бЮТЯРФХЭШп ФЮ ЪЮЭжР бваЮЪШ», ЯЮнвЮЬг ЧРЯаХв ТлеЮФР ЧР УаРЭШжг бваЮЪШ ЯаХФЮвТаРвШЫ «заХЧЬХаЭЮХ аРЧаРбвРЭШХ»[15] бЮТЯРТиХУЮ вХЪбвР.

ёвРЪ, СлЫЮ аХиХЭЮ, звЮ вЮзЪР СгФХв бЮТЯРФРвм б ЫоСлЬ бШЬТЮЫЮЬ, ЪаЮЬХ бШЬТЮЫР ЭЮТЮЩ бваЮЪШ. ±ЮЫмиШЭбвТЮ бЮТаХЬХЭЭле ЯаЮУаРЬЬ ЯЮФФХаЦШТРХв аРСЮвг б ЬЭЮУЮбваЮзЭлЬ вХЪбвЮЬ, Ш нвШ ФТР ТРаШРЭвР аХРЫШЧРжШШ ТлСШаРовбп ЯаШЬХаЭЮ б ЮФШЭРЪЮТЮЩ зРбвЮвЮЩ (ЯаШТпЧЪР Ъ УаРЭШжРЬ ЫЮУШзХбЪШе Ш ЮСлзЭле бваЮЪ РЭРЫШЧШагХвбп Т аРЧФХЫХ «ПЪЮаЭлХ ЬХвРбШЬТЮЫл» ЭР б. <$R[P#,R3-12]>, Р вРЪЦХ Т аРЧФХЫХ «ВЮзЪР Ш ШЭТХавШаЮТРЭЭлХ бШЬТЮЫмЭлХ ЪЫРббл»). БгйХбвТгХв Ш ФагУЮХ ЮСбвЮпвХЫмбвТЮ, ЭХ бвЮЫм ТРЦЭЮХ ЯаШ аРСЮвХ б ЮСлзЭлЬ вХЪбвЮЬ — бвРЭФРав POSIX ваХСгХв, звЮСл вЮзЪР ЭХ бЮТЯРФРЫР б ЭгЫм-бШЬТЮЫЮЬ (СРЩвЮЬ, ЧЭРзХЭШХ ЪЮвЮаЮУЮ аРТЭЮ 0).

БШЬТЮЫмЭлХ ЪЫРббл — […] Ш [^…]

±РЧЮТРп ЪЮЭжХЯжШп бШЬТЮЫмЭЮУЮ ЪЫРббР гЦХ аРббЬРваШТРЫРбм ТлиХ, ЭЮ ЯЮЧТЮЫмвХ ЬЭХ бЭЮТР ЯЮФзХаЪЭгвм, звЮ ЯаРТШЫР ШЭвХаЯаХвРжШШ ЬХвРбШЬТЮЫЮТ ШЧЬХЭповбп Т ЧРТШбШЬЮбвШ Юв вЮУЮ, ЯаШЭРФЫХЦРв ЮЭШ бШЬТЮЫмЭЮЬг ЪЫРббг ШЫШ ЭХв. ЅРЯаШЬХа, Т вРСЫ. 3.3 Т ЪЫРббРе ЬЮУгв ШбЯЮЫмЧЮТРвмбп вЮЫмЪЮ вХ ЬХвРбШЬТЮЫл, ЪЮвЮалХ ЯЮЬХзХЭл ЧЭРЪЮЬ ###УРЫЮзЪР б СгЪТЮЩ C### (Т ФХЩбвТШвХЫмЭЮбвШ ЬЮУгв ШбЯЮЫмЧЮТРвмбп Ш ЬХвРбШЬТЮЫл бЮ ЧЭРЪЮЬ ###СХЫРп УРЫЮзЪР###; ЯаШзШЭл Ш ЮУаРЭШзХЭШп ЮЯШбРЭл ЭР б. <$R[P#,R3-4]>).

ІЮ ЬЭЮУШе ЯаЮУаРЬЬРе Т бШЬТЮЫмЭле ЪЫРббРе аРбЯЮЧЭРовбп вЮЫмЪЮ бЫХФгойШХ бШЬТЮЫл:

l бШЬТЮЫ ^ Т ЭРзРЫХ ЪЫРббР (ЯаШЧЭРЪ ШЭТХавШаЮТРЭЭЮУЮ ЪЫРббР);

l ЧРТХаиРойРп ЪТРФаРвЭРп бЪЮСЪР (ЧРТХаиХЭШХ ЪЫРббР);

l ФХдШб, ТлЯЮЫЭпойШЩ дгЭЪжШШ ШЭвХаТРЫмЭЮУЮ ЮЯХаРвЮаР (ЯЮЧТЮЫпХв ШбЯЮЫмЧЮТРвм 0-9 ЪРЪ гФЮСЭЮХ бЮЪаРйХЭШХ ФЫп 0123456789).

І аХРЫШЧРжШпе ЪЫРббЮТ б ЮУаРЭШзХЭЭлЬ ЭРСЮаЮЬ ЬХвРбШЬТЮЫЮТ ФагУШХ ЬХвРбШЬТЮЫл (ТЪЫозРп ФРЦХ \) ЭХ аРбЯЮЧЭРовбп. БЮЮвТХвбвТХЭЭЮ, Тл ЭХ бЬЮЦХвХ ШбЯЮЫмЧЮТРвм \- ШЫШ \] ФЫп вЮУЮ, звЮСл ТбвРТШвм Т ЪЫРбб бШЬТЮЫ «ФХдШб» ШЫШ ЧРЪалТРойго ЪТРФаРвЭго бЪЮСЪг. єЮЭЪаХвЭлХ ЯаРТШЫР аРЧЫШзРовбп, ЭЮ ЮСлзЭЮ аРЧЬХйХЭШХ бШЬТЮЫР Т бРЬЮЬ ЭРзРЫХ ЪЫРббР, УФХ ЮЭ ЭХ ЬЮЦХв ШЭвХаЯаХвШаЮТРвмбп ЪРЪ ЬХвРбШЬТЮЫ, ЮСХбЯХзШТРХв ХУЮ ШЭвХаЯаХвРжШо ЪРЪ ЫШвХаРЫР.

І ЮСйХЬ бЫгзРХ ЯЮапФЮЪ ЯХаХзШбЫХЭШп бШЬТЮЫЮТ Т ЪЫРббХ ЭХбгйХбвТХЭХЭ, Р ШбЯЮЫмЧЮТРЭШХ ШЭвХаТРЫЮТ ТЬХбвЮ бЯШбЪР ЭХ ТЫШпХв ЭР бЪЮаЮбвм ЮСаРСЮвЪШ (вЮ Хбвм [0-9] ЭШзХЬ ЭХ ЮвЫШзРХвбп Юв [9081726354]).

БШЬТЮЫмЭлЩ ЪЫРбб ТбХУФР ЮЯаХФХЫпХв ЯЮЧШвШТЭЮХ гбЫЮТШХ. ґагУШЬШ бЫЮТРЬШ, звЮСл бЮТЯРФХЭШХ СлЫЮ гбЯХиЭлЬ, бШЬТЮЫ Т вХЪбвХ ФЮЫЦХЭ бЮТЯРбвм б ЮФЭШЬ ШЧ ЯХаХзШбЫХЭЭле бШЬТЮЫЮТ. ґЫп ШЭТХавШаЮТРЭЭле бШЬТЮЫмЭле ЪЫРббЮТ бЮТЯРТиШЩ бШЬТЮЫ ФЮЫЦХЭ Слвм ЮФЭШЬ ШЧ бШЬТЮЫЮТ, ЭХ ТеЮФпйШе Т ЪЫРбб. ёЭТХавШаЮТРЭЭлЩ бШЬТЮЫмЭлЩ ЪЫРбб гФЮСЭЮ аРббЬРваШТРвм ЪРЪ «бШЬТЮЫмЭлЩ ЪЫРбб б ШЭТХавШаЮТРЭЭлЬ бЯШбЪЮЬ».

їаШ ШбЯЮЫмЧЮТРЭШШ ШЭвХаТРЫЮТ бвРаРЩвХбм ЮбвРТРвмбп Т УаРЭШжРе [0-9], [a-z] ШЫШ [a-Z]. ґРЦХ ХбЫШ Тл ЧЭРХвХ ЪЮФШаЮТЪг бШЬТЮЫЮТ Ш гТХаХЭл Т вЮЬ, звЮ ТРиР ЧРФРзР аХиРХвбп ЪЮЭбвагЪжШХЩ ТШФР [.-m], ТбХ ЦХ аХЪЮЬХЭФгХвбп ЯХаХзШбЫШвм ЪЮЭЪаХвЭлХ бШЬТЮЫл, звЮСл ТлаРЦХЭШХ СлЫЮ ЯаЮйХ ЯЮЭпвм. єЮЭХзЭЮ, ЯаШ аРСЮвХ б ФТЮШзЭлЬШ ФРЭЭлЬШ ШбЯЮЫмЧЮТРЭШХ ШЭвХаТРЫЮТ ТШФР [\x80-\xff] ТЯЮЫЭХ ЮЯаРТФРЭЮ.

ВЮзЪР Ш ШЭТХавШаЮТРЭЭлХ бШЬТЮЫмЭлХ ЪЫРббл

їаШ аРСЮвХ б ЯаЮУаРЬЬРЬШ, ФЮЯгбЪРойШЬШ ЯЮШбЪ Т ЬЭЮУЮбваЮзЭЮЬ вХЪбвХ, бЫХФгХв ЯЮЬЭШвм, звЮ вЮзЪР ЮСлзЭЮ ЭХ бЮТЯРФРХв<$M[R3-10]> б бШЬТЮЫЮЬ ЭЮТЮЩ бваЮЪШ, ЭЮ ШЭТХавШаЮТРЭЭлХ ЪЫРббл вШЯР [[^"]] ЮСлзЭЮ б нвШЬ бШЬТЮЫЮЬ бЮТЯРФРов. ВРЪШЬ ЮСаРЧЮЬ, ЯХаХеЮФ Юв [".*] Ъ [[^"]*] ЬЮЦХв ЯаХЯЮФЭХбвШ боаЯаШЧ. ІЮЯаЮб, бЮТЯРФРХв ЫШ ШЭТХавШаЮТРЭЭлЩ ЪЫРбб б бШЬТЮЫЮЬ ЭЮТЮЩ бваЮЪШ, ЫгзиХ ТбХУЮ ТлпбЭШвм ФЫп ЪРЦФЮЩ ЪЮЭЪаХвЭЮЩ ЯаЮУаРЬЬл — бТХФХЭШп Ю ЭХбЪЮЫмЪШе аРбЯаЮбваРЭХЭЭле ЯаЮУаРЬЬРе ЯаШТХФХЭл Т вРСЫ. 3.4 ЭР б. <$R[P#,R3-13]>.

іагЯЯЮТлХ ТлаРЦХЭШп Т бвРЭФРавХ POSIX

<$M[R3-5]>ВЮ, звЮ Ьл ЮСлзЭЮ ЭРЧлТРЫШ бШЬТЮЫмЭлЬ ЪЫРббЮЬ, Т бвРЭФРавХ POSIX СлЫЮ аХиХЭЮ ЭРЧТРвм УагЯЯЮТлЬ ТлаРЦХЭШХЬ (bracket expression). І POSIX вХаЬШЭ «бШЬТЮЫмЭлЩ ЪЫРбб» ЮвЭЮбШвбп Ъ бЯХжШРЫмЭЮЩ ЪЮЭбвагЪжШШ, ШбЯЮЫмЧгХЬЮЩ ТЭгваШ УагЯЯЮТЮУЮ ТлаРЦХЭШп[16].

«БШЬТЮЫмЭлХ ЪЫРббл» Т УагЯЯЮТле ТлаРЦХЭШпе POSIX

БШЬТЮЫмЭлЩ ЪЫРбб POSIX ЯаХФбвРТЫпХв бЮСЮЩ ЮФЭг ШЧ ЭХбЪЮЫмЪШе бЯХжШРЫмЭле ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвХЩ, ШбЯЮЫмЧгХЬле ТЭгваШ УагЯЯЮТле ТлаРЦХЭШЩ Т бвРЭФРавХ POSIX. їаШЬХаЮЬ пТЫпХвбп ЪЮЭбвагЪжШп [:lower:], бЮЮвТХвбвТгойРп ЫоСЮЩ СгЪТХ ЭШЦЭХУЮ аХУШбваР Т вХЪгйХЬ ЫЮЪРЫмЭЮЬ ЪЮЭвХЪбвХ (бЬ. б. <$R[P#,R3-6]>). ґЫп ЭЮаЬРЫмЭЮУЮ РЭУЫШЩбЪЮУЮ вХЪбвР ЪЮЭбвагЪжШп [:lower:] ЮЧЭРзРХв ШЭвХаТРЫ a-z.

їЮбЪЮЫмЪг Тбп ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвм ФХЩбвТШвХЫмЭР вЮЫмЪЮ ТЭгваШ УагЯЯЮТЮУЮ ТлаРЦХЭШп, ЪЫРбб, нЪТШТРЫХЭвЭлЩ [[a-z]], ШЬХХв ТШФ [[[:lower:]]]. ґР, нвЮ ТлУЫпФШв гаЮФЫШТЮ, ЭЮ ЯаХФЮбвРТЫпХв ФЮЯЮЫЭШвХЫмЭго ТЮЧЬЮЦЭЮбвм ТЪЫозХЭШп ФагУШе бШЬТЮЫЮТ — ж, б Ш в. Ф. (ХбЫШ Т ЫЮЪРЫмЭЮЬ ЪЮЭвХЪбвХ ЮЭШ ФХЩбвТШвХЫмЭЮ пТЫповбп бШЬТЮЫРЬШ ЭШЦЭХУЮ аХУШбваР).

ВЮзЭлЩ бЯШбЮЪ бШЬТЮЫмЭле ЪЫРббЮТ POSIX ЧРТШбШв Юв ЫЮЪРЫмЭЮУЮ ЪЮЭвХЪбвР, ЭЮ ЯЮ ЪаРЩЭХЩ ЬХаХ бЫХФгойШХ ЪЫРббл ЮСлзЭЮ ЯЮФФХаЦШТРовбп (ФЮЫЦЭл ЯЮФФХаЦШТРвмбп ФЫп ЯЮЫЭЮУЮ бЮЮвТХвбвТШп бвРЭФРавг POSIX):<$M[R3-30]>

їаЮУаРЬЬл, ЭХ бЮЮвТХвбвТгойШХ бвРЭФРавг POSIX, вЮЦХ зРбвЮ ЯлвРовбп ЯЮФФХаЦШТРвм нвШ ЪЮЭбвагЪжШШ. ІЮ ТбпЪЮЬ бЫгзРХ, нвЮ ЮвЭЮбШвбп Ъ flex Ш GNU awk, grep Ш sed (ЭЮ, ЪРЪ ЭШ бваРЭЭЮ, Т GNU egrep ЮЭШ ЭХ ЯЮФФХаЦШТРовбп).

«БШЬТЮЫмЭлХ нЪТШТРЫХЭвл» Т УагЯЯЮТле ТлаРЦХЭШпе POSIX

І ЭХЪЮвЮале ЫЮЪРЫмЭле ЪЮЭвХЪбвРе ЮЯаХФХЫповбп бШЬТЮЫмЭлХ нЪТШТРЫХЭвл (character equivalents), гЪРЧлТРойШХ, звЮ ЪРЪШХ-вЮ ШЧ бШЬТЮЫЮТ ФЮЫЦЭл бзШвРвмбп ШФХЭвШзЭлЬШ ЯаШ ТлЯЮЫЭХЭШШ бЮавШаЮТЪШ Ш ФагУШе РЭРЫЮУШзЭле ЮЯХаРжШЩ. ЅРЯаШЬХа, ЫЮЪРЫмЭлЩ ЪЮЭвХЪбв ЬЮЦХв ЮЯаХФХЫШвм ЪЫРбб-нЪТШТРЫХЭв «n», бЮФХаЦРйШЩ бШЬТЮЫл n Ш б, ШЫШ ЪЫРбб «a», бЮФХаЦРйШЩ бШЬТЮЫл a, Р Ш С. ёбЯЮЫмЧгп ЧРЯШбм, РЭРЫЮУШзЭго ЯаШТХФХЭЭЮЩ ТлиХ ЪЮЭбвагЪжШШ [:…:], Ш ЧРЬХЭШТ ФТЮХвЮзШп ЧЭРЪРЬШ аРТХЭбвТР, ЬЮЦЭЮ бблЫРвмбп ЭР ЪЫРббл-нЪТШТРЫХЭвл Т УагЯЯЮТле ТлаРЦХЭШпе; ЭРЯаШЬХа, [[[=n=][=a=]]] бЮТЯРФРХв б ЫоСлЬ ШЧ ЯХаХзШбЫХЭЭле бШЬТЮЫЮТ.

µбЫШ бШЬТЮЫмЭлЩ нЪТШТРЫХЭв б ЮФЭЮСгЪТХЭЭлЬ ШЬХЭХЬ ШбЯЮЫмЧгХвбп, ЭЮ ЭХ ЮЯаХФХЫпХвбп Т ЫЮЪРЫмЭЮЬ ЪЮЭвХЪбвХ, ЮЭ ЯЮ гЬЮЫзРЭШо бЮТЯРФРХв б ЮСкХФШЭпойХЩ ЯЮбЫХФЮТРвХЫмЭЮбвмо б вХЬ ЦХ ШЬХЭХЬ. »ЮЪРЫмЭлХ ЪЮЭвХЪбвл ЮСлзЭЮ бЮФХаЦРв ЮСкХФШЭпойШХ ЯЮбЫХФЮТРвХЫмЭЮбвШ ФЫп ТбХе ЮСлзЭле бШЬТЮЫЮТ ([.a.], [.b.], [.c.] Ш в. Ф.), ЯЮнвЮЬг ЯаШ ЮвбгвбвТШШ бЯХжШРЫмЭле нЪТШТРЫХЭвЮТ ЪЮЭбвагЪжШп [[[=n=][=a=]]] ЯЮ гЬЮЫзРЭШо бзШвРХвбп ШФХЭвШзЭЮЩ [[na]].

«ѕСкХФШЭпойШХ ЯЮбЫХФЮТРвХЫмЭЮбвШ» Т УагЯЯЮТле ТлаРЦХЭШпе POSIX

єРЪ гЯЮЬШЭРЫЮбм ЭР б. <$R[P#,R3-7]>, Т ЫЮЪРЫмЭЮЬ ЪЮЭвХЪбвХ ЬЮУгв ЮЯаХФХЫпвмбп ЮСкХФШЭпойШХ ЯЮбЫХФЮТРвХЫмЭЮбвШ, ЮЯШблТРойШХ ШЭвХаЯаХвРжШо ЭХЪЮвЮале бШЬТЮЫЮТ ШЫШ бЮТЮЪгЯЭЮбвХЩ бШЬТЮЫЮТ ЯаШ бЮавШаЮТЪХ Ш ФагУШе ЮЯХаРжШпе. ѕСкХФШЭпойРп ЯЮбЫХФЮТРвХЫмЭЮбвм ЮвЮСаРЦРХв ЭХбЪЮЫмЪЮ дШЧШзХбЪШе бШЬТЮЫЮТ ЭР ЮФШЭ ЫЮУШзХбЪШЩ бШЬТЮЫ — ЭРЯаШЬХа, span-ll аРббЬРваШТРХвбп ЪРЪ «ЮФШЭ бШЬТЮЫ» Т ЬХеРЭШЧЬХ аХУгЫпаЭле ТлаРЦХЭШЩ, Т ЯЮЫЭЮЩ ЬХаХ бЮЮвТХвбвТгойХЬ бвРЭФРавг POSIX. НвЮ ЮЧЭРзРХв, звЮ ТлаРЦХЭШХ вШЯР [[^123]] бЮТЯРФХв б ЯЮбЫХФЮТРвХЫмЭЮбвмо ll.

ґЫп ТЪЫозХЭШп нЫХЬХЭвЮТ ЮСкХФШЭпойШе ЯЮбЫХФЮТРвХЫмЭЮбвХЩ Т УагЯЯЮТлХ ТлаРЦХЭШп ШбЯЮЫмЧгХвбп ЮСЮЧЭРзХЭШХ [.….]: ТлаРЦХЭШХ [torti[[.span-ll.]]a] бЮТЯРФРХв б tortilla. ѕСкХФШЭпойРп ЯЮбЫХФЮТРвХЫмЭЮбвм ЯЮЧТЮЫпХв ЮбгйХбвТЫпвм баРТЭХЭШХ бШЬТЮЫЮТ, ЪЮвЮалХ ЯаХФбвРТЫпов бЮСЮЩ ЪЮЬСШЭРжШШ ФагУШе бШЬТЮЫЮТ. єаЮЬХ вЮУЮ, бвРЭЮТпвбп ТЮЧЬЮЦЭлЬШ бШвгРжШШ, ЯаШ ЪЮвЮале УагЯЯЮТЮХ ТлаРЦХЭШХ бЮТЯРФРХв б ЯЮбЫХФЮТРвХЫмЭЮбвмо ШЧ ЭХбЪЮЫмЪШе дШЧШзХбЪШе бШЬТЮЫЮТ!

ґагУЮЩ ЯаШЬХа, eszet, ТбХУЮ ЫШим ЮСХбЯХзШТРХв ЯаРТШЫмЭЮХ гЯЮапФЮзХЭШХ П — ЭЮТлЩ ЫЮУШзХбЪШЩ бШЬТЮЫ ЯаШ нвЮЬ ЭХ бЮЧФРХвбп, ЯЮнвЮЬг Т УагЯЯЮТЮЬ ТлаРЦХЭШШ [.eszet.] ЯаХФбвРТЫпХв бЮСЮЩ ЯаЮбвЮ нЪЧЮвШзХбЪШЩ бЯЮбЮС ЧРЯШбШ бШЬТЮЫР П (ЪЮвЮалЩ ТлУЫпФШв Ш СХЧ вЮУЮ бваРЭЭЮ, ХбЫШ Тл ЭХ ТЫРФХХвХ ЭХЬХжЪШЬ пЧлЪЮЬ).

ЅРЫШзШХ ЮСкХФШЭпойШе ЯЮбЫХФЮТРвХЫмЭЮбвХЩ вРЪЦХ ТЫШпХв ЭР ШЭвХаТРЫл. їЮбЪЮЫмЪг span-ll бЮЧФРХв ЫЮУШзХбЪШЩ бШЬТЮЫ, аРбЯЮЫЮЦХЭЭлЩ ЬХЦФг l Ш m, ШЭвХаТРЫ a-z СгФХв ТЪЫозРвм Ш ЯЮбЫХФЮТРвХЫмЭЮбвм «ll».

ПЪЮаЭлХ ЬХвРбШЬТЮЫл

<$M[R3-12]>ПЪЮаЭлХ ЬХвРбШЬТЮЫл бЮТЯРФРов ЭХ б аХРЫмЭлЬШ бШЬТЮЫРЬШ, Р б ЯЮЧШжШпЬШ Т вХЪбвХ. БгйХбвТгХв ЭХбЪЮЫмЪЮ аРбЯаЮбваРЭХЭЭле аРЧЭЮТШФЭЮбвХЩ пЪЮаЭле ЬХвРбШЬТЮЫЮТ.

ЅРзРЫЮ бваЮЪШ Ш ЭРзРЫЮ даРУЬХЭвР — бШЬТЮЫ ^

їХаТЮЭРзРЫмЭЮ бШЬТЮЫ ^ ШбЯЮЫмЧЮТРЫбп ФЫп ЯаШТпЧЪШ ТлаРЦХЭШп Ъ ЭРзРЫг бваЮЪШ. І вРЪШе ЯаШЫЮЦХЭШпе, ЪРЪ ed Ш grep, УФХ ЯаЮТХапХЬлЩ аХУгЫпаЭлЬ ТлаРЦХЭШХЬ вХЪбв ТбХУФР ФХЫШЫбп ЭР бваЮЪШ, ЯЮЭпвШп «ЫЮУШзХбЪРп бваЮЪР» Ш «ЯаЮТХапХЬлЩ вХЪбв» ТбХУФР бЮТЯРФРЫШ. ѕФЭРЪЮ ФагУШХ ЯаЮУаРЬЬл ЯЮЧТЮЫпЫШ ТлЯЮЫЭпвм ЯЮШбЪ Т ЯаЮШЧТЮЫмЭЮЬ вХЪбвХ. µбЫШ вХЪбв бЮФХаЦШв ТЭгваХЭЭШХ<$M[R3-15]> бШЬТЮЫл ЭЮТЮЩ бваЮЪШ, ЬЮЦЭЮ бзШвРвм, звЮ ЮЭ бЮбвЮШв ШЧ ЭХбЪЮЫмЪШе ЫЮУШзХбЪШе бваЮЪ. іФХ Т нвЮЬ бЫгзРХ ФЮЫЦХЭ бЮТЯРФРвм бШЬТЮЫ ^ — Т ЭРзРЫХ ЪРЦФЮЩ ЫЮУШзХбЪЮЩ бваЮЪШ ШЫШ вЮЫмЪЮ Т ЭРзРЫХ ТбХУЮ жХЫХТЮУЮ вХЪбвР (Т ФРЫмЭХЩиХЬ СгФХв ШбЯЮЫмЧЮТРвмбп вХаЬШЭ «даРУЬХЭв»)?

їаРТШЫмЭлЩ ЮвТХв — «ЧРТШбШв Юв ЯаЮУаРЬЬл». І вХЪбвЮТЮЬ аХФРЪвЮаХ ЭРзРЫЮ вХЪбвР дРЪвШзХбЪШ ЮЧЭРзРХв ЭРзРЫЮ дРЩЫР, Ш бЮТЯРФХЭШХ ^ вЮЫмЪЮ Т ЭРзРЫХ дРЩЫР ТлУЫпФХЫЮ Сл ФЮТЮЫмЭЮ УЫгЯЮ. Б ФагУЮЩ бвЮаЮЭл, Т sed, awk Ш Tcl бШЬТЮЫ ^ бЮТЯРФРХв вЮЫмЪЮ Т ЭРзРЫХ ТбХУЮ даРУЬХЭвР. ДаРУЬХЭв ЬЮЦХв ЯаХФбвРТЫпвм бЮСЮЩ ЮвФХЫмЭго бваЮЪг, ТХбм дРЩЫ ШЫШ звЮ-ЭШСгФм ХйХ — бЯЮбЮС ЯЮЫгзХЭШп ЯаЮТХапХЬле ФРЭЭле ЭХ ШЬХХв ЮвЭЮиХЭШп Ъ Ше ЮСаРСЮвЪХ. І Perl ЬЮЦЭЮ ЮаУРЭШЧЮТРвм бЮТЯРФХЭШХ ЪРЪ Т ЭРзРЫХ бваЮЪШ, вРЪ Ш Т ЭРзРЫХ даРУЬХЭвР, ЭЮ ЯЮ гЬЮЫзРЭШо ^ бЮТЯРФРХв вЮЫмЪЮ Т ЭРзРЫХ даРУЬХЭвР. І вРСЫ. 3.4 ЯаШТХФХЭР ШЭдЮаЬРжШп ЮС ШбЯЮЫмЧЮТРЭШШ бШЬТЮЫЮТ ^ Ш $ Т ЭХбЪЮЫмЪШе аРбЯаЮбваРЭХЭЭле ЯаЮУаРЬЬРе.<$M[R3-13]>

ВРСЫШжР 3.4. їаШТпЧЪР Ъ бваЮЪХ/даРУЬХЭвг Ш ФагУШХ РбЯХЪвл, бТпЧРЭЭлХ б бШЬТЮЫРЬШ ЭЮТЮЩ бваЮЪШ

їаРЪвШзХбЪШ ТбХ ЯХаХзШбЫХЭЭлХ ЯаЮУаРЬЬл ЯЮФФХаЦШТРов ЯЮбваЮзЭго ЮСаРСЮвЪг дРЩЫЮТ, ЯЮнвЮЬг аРЧЫШзШп ЬХЦФг бваЮЪРЬШ Ш даРУЬХЭвРЬШ зРбвЮ ЭХбгйХбвТХЭЭл. ЅЮ ХбЫШ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЮвЭЮбШвбп Ъ ЬЭЮУЮбваЮзЭлЬ даРУЬХЭвРЬ (ЪРЪШЬ Сл бЯЮбЮСЮЬ ЮЭШ ЭШ СлЫШ ЯЮЫгзХЭл), нвг ЯаЮСЫХЬг ЯаШеЮФШвбп гзШвлТРвм.

іФХ Т аХУгЫпаЭЮЬ ТлаРЦХЭШШ ^ ШЭвХаЯаХвШагХвбп ЪРЪ ЬХвРбШЬТЮЫ?

І бШЬТЮЫмЭле ЪЫРббРе ФХЩбвТгов ЮбЮСлХ ЯаРТШЫР, Ш Т СЮЫмиШЭбвТХ ЯаЮУаРЬЬ ЮЭШ бЮСЫоФРовбп, ЭЮ ЧР ЯаХФХЫРЬШ бШЬТЮЫмЭЮУЮ ЪЫРббР ^ ШЭЮУФР ШЭвХаЯаХвШагХвбп ЪРЪ пЪЮаЭлЩ ЬХвРбШЬТЮЫ, Р ШЭЮУФР — ЪРЪ ЫШвХаРЫ «ЪалиЪР». ІЮ ЬЭЮУШе ЯаЮУаРЬЬРе ЮЭ ШЭвХаЯаХвШагХвбп ЪРЪ ЬХвРбШЬТЮЫ вРЬ, УФХ нвЮ «ШЬХХв бЬлбЫ» (ЭРЯаШЬХа, ЯЮбЫХ [(] ШЫШ [|]), ЭЮ Т ФагУШе ЯаЮУаРЬЬРе ЮЭ бзШвРХвбп ЬХвРбШЬТЮЫЮЬ ЫШим Т ЭРзРЫХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп.

єЮЭХж бваЮЪШ Ш ЪЮЭХж даРУЬХЭвР — бШЬТЮЫ $

БШЬТЮЫ $ ЮСаРЧгХв ЯРаг б ^ — ЮЭ бЮТЯРФРХв Т ЪЮЭжХ бваЮЪШ/даРУЬХЭвР. ѕСлзЭЮ ЯаЮСЫХЬР ТЭгваХЭЭШе ЫЮУШзХбЪШе бваЮЪ аХиРХвбп ФЫп ЭХУЮ вРЪ ЦХ, ЪРЪ Ш ФЫп ^, ЭЮ ЪРЪ ЯЮЪРЧлТРХв вРСЫ. 3.4, ЯаШ нвЮЬ ТЮЧЭШЪРов ФЮЯЮЫЭШвХЫмЭлХ ЯаЮСЫХЬл. І ЮФЭШе аХРЫШЧРжШпе $ бЮТЯРФРХв ЯХаХФ ЫоСЮЩ ЭЮТЮЩ бваЮЪЮЩ, Т ФагУШе — вЮЫмЪЮ Т ЪЮЭжХ ТбХУЮ даРУЬХЭвР. єаЮЬХ вЮУЮ, бЮТЯРФХЭШХ ЬЮЦХв ЯаЮШбеЮФШвм Т ЪЮЭжХ даРУЬХЭвР ШЫШ ЯХаХФ бШЬТЮЫЮЬ ЭЮТЮЩ бваЮЪШ, ЧРТХаиРойШЬ даРУЬХЭв (Т Perl ЯЮ гЬЮЫзРЭШо ШбЯЮЫмЧгХвбп ЯЮбЫХФЭШЩ ТРаШРЭв, ЮФЭРЪЮ Т ЯаЮУаРЬЬХ ЬЮЦЭЮ ЯХаХЪЫозШвмбп Т аХЦШЬ, ЯаШ ЪЮвЮаЮЬ бЮТЯРФХЭШХ ЯаЮШбеЮФШв ЯХаХФ ЫоСЮЩ ЭЮТЮЩ бваЮЪЮЩ). І ваХвмШе ЯаЮУаРЬЬРе (ЮбЮСХЭЭЮ lex) бЮТЯРФХЭШХ ЯаЮШбеЮФШв вЮЫмЪЮ ЯХаХФ бШЬТЮЫЮЬ ЭЮТЮЩ бваЮЪШ, ЭЮ ЭХ Т ЫоСЮЩ ЯЮЧШжШШ — Т зРбвЭЮбвШ, ЭХ Т ЪЮЭжХ жХЫХТЮУЮ вХЪбвР.

іаРЭШжл бЫЮТ — \<…\>, \b Ш \B

НвШ ЬХвРбШЬТЮЫл, ЪРЪ Ш ^ б $, бЮТЯРФРов ЭХ б бШЬТЮЫЮЬ, Р б ЮЯаХФХЫХЭЭЮЩ ЯЮЧШжШХЩ бваЮЪШ. БгйХбвТгов ФТР аРЧЭле ЯЮФеЮФР. І ЮФЭЮЬ ЯЮЧШжШп ЭРзРЫР Ш ЪЮЭжР бЫЮТР ЮСЮЧЭРзРХвбп аРЧЭлЬШ ЬХвРбШЬТЮЫРЬШ [\<] Ш [\>]. І ФагУЮЬ ЬХвРбШЬТЮЫ [\b] бЮТЯРФРХв б ЫоСЮЩ УаРЭШжХЩ бЫЮТР (ЭРзРЫЮЬ ШЫШ ЪЮЭжЮЬ), Р [\B] — б ЫоСЮЩ ЯЮЧШжШХЩ, ЭХ пТЫпойХЩбп УаРЭШжХЩ бЫЮТР. єбвРвШ, ЯЮбЫХФЭШЩ ЬХвРбШЬТЮЫ ШЭЮУФР ЮЪРЧлТРХвбп ЭР гФШТЫХЭШХ ЯЮЫХЧЭлЬ.

Г ЪРЦФЮЩ ЯаЮУаРЬЬл ШЬХовбп бТЮШ ЯаХФбвРТЫХЭШп Ю вЮЬ, звЮ бЫХФгХв бзШвРвм «бШЬТЮЫЮЬ бЫЮТР», Р г ЯаЮУаРЬЬ б ЯЮФФХаЦЪЮЩ ЫЮЪРЫмЭле ЪЮЭвХЪбвЮТ POSIX (бЬ. б. <$R[P#,R3-6]>) нвШ ЯаХФбвРТЫХЭШп ЧРТШбпв Юв ЫЮЪРЫмЭЮУЮ ЪЮЭвХЪбвР. єРЪ СлЫЮ бЪРЧРЭЮ ЭР б. <$R[P#,R3-8]>, Т Emacs ЮЭШ вЮЦХ ЬЮУгв ШЧЬХЭпвмбп, ЭЮ ЯЮ ФагУШЬ ЯаШзШЭРЬ. І ЫоСЮЬ бЫгзРХ ЯаЮТХаЪР УаРЭШжл бЫЮТР ТбХУФР бТЮФШвбп Ъ ЯаЮбвЮЩ ЯаЮТХаЪХ бЮбХФЭШе бШЬТЮЫЮТ. ЅШ ЮФШЭ ЬХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ ЭХ ЯаШЭШЬРХв аХиХЭШЩ ЭР ЮбЭЮТХ ЫХЪбШзХбЪЮУЮ РЭРЫШЧР — бваЮЪР «NE14AD8» ТХЧФХ бзШвРХвбп бЫЮТЮЬ, Р «M.I.T.» Ъ бЫЮТРЬ ЭХ ЮвЭЮбШвбп.

іагЯЯШаЮТЪР Ш бЮеаРЭХЭШХ вХЪбвР

(…) ШЫШ $…$; \1, \2, \3 Ш в. Ф.

ґЮ ЭРбвЮпйХУЮ ЬЮЬХЭвР п гФХЫпЫ ЮвЭЮбШвХЫмЭЮ ЬРЫЮ ТЭШЬРЭШп ЮСаРвЭлЬ бблЫЪРЬ. µбЫШ ЯаЮУаРЬЬР ЯЮФФХаЦШТРХв ЮСаРвЭлХ бблЫЪШ, вЮ ЪЮЭбвагЪжШп [\жШдаР] ЮСЮЧЭРзРХв вХЪбв, бЮТЯРТиШЩ б ЯЮФТлаРЦХЭШХЬ Т ЪагУЫле бЪЮСЪРе б ЧРФРЭЭлЬ ЯЮапФЪЮТлЬ ЭЮЬХаЮЬ (УагЯЯл ЭгЬХаговбп бЫХТР ЭРЯаРТЮ Т бЮЮвТХвбвТШШ б ЭЮЬХаЮЬ ЮвЪалТРойХЩ ЪагУЫЮЩ бЪЮСЪШ). ѕСлзЭЮ аРЧаХиРовбп ЮСаРвЭлХ бблЫЪШ б ЭЮЬХаРЬШ ФЮ [\9], еЮвп Т ЭХЪЮвЮале ЯаЮУаРЬЬРе ЯЮФФХаЦШТРХвбп ЯаЮШЧТЮЫмЭЮХ ЪЮЫШзХбвТЮ ЮСаРвЭле бблЫЮЪ.

єРЪ гЯЮЬШЭРЫЮбм ТлиХ, Т ЭХЪЮвЮале ЯаЮУаРЬЬРе ЪЮЭбвагЪжШШ [\1], [\2] Ш в. Ф. ЯЮЧТЮЫпов аРСЮвРвм б бЮТЯРТиШЬ вХЪбвЮЬ ЧР ЯаХФХЫРЬШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп. І ФагУШе ЯаЮУаРЬЬРе ФЮбвгЯ Ъ бЮТЯРТиХЬг вХЪбвг ЯаХФЮбвРТЫпХвбп ЫШим Т бваЮЪХ ЧРЬХЭл (ЮСлзЭЮ ЯаШ ЯЮЬЮйШ вХе ЦХ ЪЮЭбвагЪжШЩ [\1], [\2] Ш в. Ф., ЭЮ Т ФРЭЭЮЬ бЫгзРХ ЮЭШ пТЫповбп ЬХвРбШЬТЮЫРЬШ бваЮЪШ ЧРЬХЭл, Р ЭХ ЬХвРбШЬТЮЫРЬШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп). І ЭХЪЮвЮале ЯаЮУаРЬЬРе бЮТЯРТиШЩ вХЪбв ФЮбвгЯХЭ Т ЫоСЮЩ вЮзЪХ ЯаЮУаРЬЬл — ЭРЯаШЬХа, Т Perl ФЫп нвЮУЮ ШбЯЮЫмЧгХвбп ЯХаХЬХЭЭРп $1, Р Т Python — ЪЮЭбвагЪжШп MyRegex.group(1). ЅХЪЮвЮалХ ЯаЮУаРЬЬл ЭХ вЮЫмЪЮ ЯаХФЮбвРТЫпов ФЮбвгЯ Ъ вХЪбвг бЮТЯРТиХУЮ ЯЮФТлаРЦХЭШп, ЭЮ Ш ТлФРов ШЭдЮаЬРжШо Ю вЮзЭЮЩ ЯЮЧШжШШ нвЮУЮ вХЪбвР Т бваЮЪХ. НвШ бТХФХЭШп зРбвЮ ЮЪРЧлТРовбп ЯЮЫХЧЭлЬШ ЯаШ аХиХЭШШ ЭХваШТШРЫмЭле ЧРФРз ЯЮ ЮСаРСЮвЪХ вХЪбвР. І ЪРзХбвТХ ЯаШЬХаЮТ ЬЮЦЭЮ ЯаШТХбвШ GNU Emacs, Tcl Ш Python (ФРЭЭРп ТЮЧЬЮЦЭЮбвм ЯЮзХЬг-вЮ ЮвбгвбвТгХв Т Perl).

єТРЭвШдШЪРвЮал

єТРЭвШдШЪРвЮал (*, +, ? Ш ШЭвХаТРЫмЭРп ЪЮЭбвагЪжШп — ЬХвРбШЬТЮЫл, ЮЯаХФХЫпойШХ ЪЮЫШзХбвТЮ нЪЧХЬЯЫпаЮТ ЯЮТвЮапойХУЮбп нЫХЬХЭвР) аРббЬРваШТРЫШбм Т ЮФЭЮЩ ШЧ ЯаХФиХбвТгойШе УЫРТ. ѕФЭРЪЮ ЮСаРвШвХ ТЭШЬРЭШХ, звЮ Т ЭХЪЮвЮале ЯаЮУаРЬЬРе ТЬХбвЮ [+] Ш [?] ШбЯЮЫмЧговбп [\+] Ш [\?]. єаЮЬХ вЮУЮ, Т ЮвФХЫмЭле ЯаЮУаРЬЬРе ЪТРЭвШдШЪРвЮал ЭХ ЬЮУгв ЯаШЬХЭпвмбп Ъ ЮСаРвЭлЬ бблЫЪРЬ ШЫШ ТлаРЦХЭШпЬ, ЧРЪЫозХЭЭлЬ Т бЪЮСЪШ.

їаШЬХа бЮТХаиХЭЭЮ ШЭЮУЮ ЯЮФеЮФР ЯаХФбвРТЫХЭ Т Perl. ЅХбЪЫРФЭлХ ЪЮЭбвагЪжШШ *?, +?, ?? Ш {ЬШЭ, ЬРЪб}? Т ФагУШе ФШРЫХЪвРе ЮСлзЭЮ ЭХ ЯЮФФХаЦШТРовбп. ѕЭШ ЯаХФбвРТЫпов бЮСЮЩ ЬШЭШЬРЫмЭлХ[17] ТХабШШ ЪТРЭвШдШЪРвЮаЮТ. ѕСлзЭлХ ЪТРЭвШдШЪРвЮал агЪЮТЮФбвТговбп ЪаШвХаШХЬ ЬРЪбШЬРЫмЭЮУЮ бЮТЯРФХЭШп Ш ЯлвРовбп ЭРЩвШ бЮТЯРФХЭШХ ЪРЪ ЬЮЦЭЮ СЮЫмиХЩ ФЫШЭл. БвРЭФРавЭлХ ЪТРЭвШдШЪРвЮал Perl пТЫповбп ЬРЪбШЬРЫмЭлЬШ, ЭЮ бгйХбвТгов Ш ФагУШХ, ЬШЭШЬРЫмЭлХ ТХабШШ, ЪЮвЮалХ Шйгв бЮТЯРФХЭШХ ЭРШЬХЭмиХЩ ФЫШЭл. їЮФаЮСЭЮбвШ ЯаШТХФХЭл Т бЫХФгойХЩ УЫРТХ.

ёЭвХаТРЫл — {ЬШЭ, ЬРЪб} Ш \{ЬШЭ, ЬРЪб\}

ёЭвХаТРЫмЭлЩ ЪТРЭвШдШЪРвЮа «ТХФХв бзХв» ЭРЩФХЭЭле нЪЧХЬЯЫпаЮТ бЮТЯРФХЭШп. ѕЭ ЮЯаХФХЫпХв ЭРШЬХЭмиХХ ЪЮЫШзХбвТЮ ЮСпЧРвХЫмЭле Ш ЭРШСЮЫмиХХ ЪЮЫШзХбвТЮ ФЮЯгбвШЬле нЪЧХЬЯЫпаЮТ. µбЫШ гЪРЧлТРХвбп вЮЫмЪЮ ЮФЭЮ зШбЫЮ ([[a-z]{3}] ШЫШ [[a-z]\{3\}] Т ЧРТШбШЬЮбвШ Юв ФШРЫХЪвР) Ш нвЮв бШЭвРЪбШб ЯЮФФХаЦШТРХвбп ЯаЮУаРЬЬЮЩ, бЮТЯРФРХв Т вЮзЭЮбвШ ЧРФРЭЭЮХ ЪЮЫШзХбвТЮ нЪЧХЬЯЫпаЮТ. їаШТХФХЭЭлЩ ЯаШЬХа нЪТШТРЫХЭвХЭ [[a-z][a-z][a-z]], еЮвп Т ЭХЪЮвЮале вШЯРе ЬХеРЭШЧЬЮТ ЯЮбЫХФЭШЩ ТРаШРЭв СЮЫХХ нддХЪвШТХЭ (бЬ. б. <$R[P#,R5-2]>).

їаХФгЯаХЦФРо: ЭХ бвЮШв ЯЮЫРУРвм, звЮ ЪЮЭбвагЪжШп ТШФР [X{0,0}] ЮЧЭРзРХв «ЧФХбм ЭХ ФЮЫЦЭЮ Слвм X». ІлаРЦХЭШХ [X{0,0}] СХббЬлбЫХЭЭЮ, ЯЮбЪЮЫмЪг ЮЭЮ ЮЧЭРзРХв «ЭШ ЮФШЭ нЪЧХЬЯЫпа X ЭХ ЮСпЧРвХЫХЭ, вРЪ звЮ ЬЮЦЭЮ ФРЦХ ЭХ ЯлвРвмбп Ше ШбЪРвм». НвЮ аРТЭЮбШЫмЭЮ вЮЬг, звЮ ЪЮЭбвагЪжШп [X{0,0}] ТЮЮСйХ ЮвбгвбвТгХв — ХбЫШ ФРЦХ нЫХЬХЭв X Ш Хбвм, ЮЭ ЬЮЦХв бЮТЯРбвм б ЮФЭЮЩ ШЧ бЫХФгойШе зРбвХЩ ТлаРЦХЭШп, ЯЮнвЮЬг ШбеЮФЭлЩ бЬлбЫ нвЮЩ ЪЮЭбвагЪжШШ ЯЮЫЭЮбвмо гваРзШТРХвбп[18].

їЮбЪЮЫмЪг ЭХЦХЫРвХЫмЭлЬ нЫХЬХЭвЮЬ Т ФРЭЭЮЬ ЯаШЬХаХ пТЫпХвбп ЮФШЭ бШЬТЮЫ X, Тл ЬЮЦХвХ ТЮбЯЮЫмЧЮТРвмбп ЪЮЭбвагЪжШХЩ [[^X]], ЮЧЭРзРойХЩ, звЮ Т нвЮЩ ЯЮЧШжШШ ЭРеЮФШвбп ЫоСЮЩ бШЬТЮЫ, ЪаЮЬХ X. ёЭЮУФР вРЪЮХ аХиХЭШХ ЯЮФеЮФШв, ЭЮ нвР дЮаЬгЫШаЮТЪР ТбХ ЦХ ЭХ нЪТШТРЫХЭвЭР дЮаЬгЫШаЮТЪХ «гСХФШвмбп Т вЮЬ, звЮ Т нвЮЩ ЯЮЧШжШШ ЭХв X», ЯЮбЪЮЫмЪг ФЫп бЮТЯРФХЭШп [[^X]] ЭХЮСеЮФШЬЮ ЯаШбгвбвТШХ бШЬТЮЫР, Р ЪЮЭжХЯжШп «ЮвбгвбвТШп X» ЭШЪРЪШе бШЬТЮЫЮТ ЭХ ваХСгХв. ёЧ ТбХе аРбЯаЮбваРЭХЭЭле ФШРЫХЪвЮТ аХУгЫпаЭле ТлаРЦХЭШЩ нвР ТЮЧЬЮЦЭЮбвм аХРЫШЧЮТРЭР вЮЫмЪЮ Т Perl (бЬ. б. <$R[P#,R7-1]>).

єЮЭбвагЪжШп ТлСЮаР

єЮЭбвагЪжШп ТлСЮаР ФЮЯгбЪРХв бЮТЯРФХЭШХ ЮФЭЮУЮ ШЧ ЭХбЪЮЫмЪШе ЯЮФТлаРЦХЭШЩ. єРЦФЮХ ЯЮФТлаРЦХЭШХ ЭРЧлТРХвбп РЫмвХаЭРвШТЮЩ (alternative). ІЬХбвЮ бШЬТЮЫР [|] Т ЭХЪЮвЮале ФШРЫХЪвРе ШбЯЮЫмЧгХвбп [\|].

єЮЭбвагЪжШп ТлСЮаР ТбХУФР пТЫпХвбп ТлбЮЪЮгаЮТЭХТЮЩ (вЮ Хбвм ЮСЫРФРойХЩ ЮзХЭм ЭШЧЪШЬ ЯаШЮаШвХвЮЬ). НвЮ ЮЧЭРзРХв, звЮ ТлаРЦХЭШХ [this and|or that] нЪТШТРЫХЭвЭЮ [(this and)|(or that)], Р ЭХ ЯЮвХЭжШРЫмЭЮ СЮЫХХ ЯЮЫХЧЭЮЬг [this (and|or) that]. ѕФЭЮ ШЧ ШбЪЫозХЭШЩ бЮбвЮШв Т вЮЬ, звЮ пЪЮап бваЮЪ Т lex ЭХ пТЫповбп аРТЭЮЯаРТЭлЬШ ЬХвРбШЬТЮЫРЬШ — ЮЭШ ФХЩбвТШвХЫмЭл вЮЫмЪЮ ЭР ЪЮЭжРе аХУгЫпаЭЮУЮ ТлаРЦХЭШп Ш ЮСЫРФРов ХйХ ЬХЭмиШЬ ЯаШЮаШвХвЮЬ, зХЬ ЪЮЭбвагЪжШп ТлСЮаР. НвЮ ЮЧЭРзРХв, звЮ Т lex ТлаРЦХЭШХ [^this|that$] нЪТШТРЫХЭвЭЮ [^(this|that)$], Р ЭХ [(^this)|(that$)], ЪРЪ Т СЮЫмиШЭбвТХ ФагУШе бЫгзРХТ.

ЕЮвп бвРЭФРав POSIX, lex Ш СЮЫмиШЭбвТЮ ТХабШЩ awk ЧРЯаХйРов ТлСЮа б ЯгбвЮЩ<$M[R3-20]> РЫмвХаЭРвШТЮЩ ([(this|that|)], п ЯЮЫРУРо, звЮ вРЪРп ЪЮЭбвагЪжШп ТлУЫпФШв ТЯЮЫЭХ ХбвХбвТХЭЭЮ. їгбвЮХ ЯЮФТлаРЦХЭШХ ЮЧЭРзРХв, звЮ бЮТЯРФХЭШХ ЯаЮШбеЮФШв ТбХУФР, ЯЮнвЮЬг ФРЭЭлЩ ЯаШЬХа ЫЮУШзХбЪШ нЪТШТРЫХЭвХЭ [(this|that)?]. ІЯаЮзХЬ, нвЮ вЮЫмЪЮ вХЮаШп; ЭР ЯаРЪвШЪХ ТЮ ЬЭЮУШе ЯаЮУаРЬЬРе нвЮ ФРЫХЪЮ ЭХ вРЪ. І зШбЫХ ЭХЬЭЮУШе ЯаЮУаРЬЬ, Т ЪЮвЮале нвШ ФТР ТлаРЦХЭШп ФХЩбвТШвХЫмЭЮ нЪТШТРЫХЭвЭл — awk, lex Ш egrep (бЬ. УЫРТг 4). ЅЮ ФРЦХ ХбЫШ нвШ ТлаРЦХЭШп ЯЮЫЭЮбвмо ШФХЭвШзЭл, вРЪРп ЧРЯШбм ЯЮЫХЧЭР еЮвп Сл ШЧ бЮЮСаРЦХЭШЩ гФЮСбвТР Ш ЭРУЫпФЭЮбвШ. єРЪ ЬЭХ ЮФЭРЦФл ЮСкпбЭШЫ »РааШ ГЮЫЫ, ЮЭР «ТлЯЮЫЭпХв вХ ЦХ дгЭЪжШШ, ЪРЪ ЭЮЫм Т бШбвХЬХ бзШбЫХЭШп».

їгвХТЮФШвХЫм ЯЮ бХамХЧЭлЬ УЫРТРЬ

їЮбЫХ ЧЭРЪЮЬбвТР б ЬХвРбШЬТЮЫРЬШ, ФШРЫХЪвРЬШ, бШЭвРЪбШзХбЪЮЩ ЮСХавЪЮЩ Ш в. Ф. ЭРбвРЫЮ ТаХЬп ЯХаХЩвШ Ъ вХеЭШзХбЪШЬ ЯЮФаЮСЭЮбвпЬ, ФХЩбвТШвХЫмЭЮ бХамХЧЭЮЬг ЬРвХаШРЫг, ЯЮФЫШЭЭЮЩ бгвШ — ЭРЧлТРЩвХ, ЪРЪ еЮвШвХ. АРббЬЮваХЭШХ нвЮЩ вХЬл ЭРзШЭРХвбп б УЫРТл 4, «јХеРЭШЪР ЮСаРСЮвЪШ ТлаРЦХЭШЩ». БгйХбвТгов аРЧЭлХ ТРаШРЭвл аХРЫШЧРжШШ ЬХеРЭШЧЬР, ЮСХбЯХзШТРойХУЮ ЯЮШбЪ бЮТЯРФХЭШЩ, Ш Юв ТлСЮаР вЮУЮ ШЫШ ШЭЮУЮ ТРаШРЭвР ЧРТШбШв, СгФХв ЭРЩФХЭЮ бЮТЯРФХЭШХ ШЫШ ЭХв, ЪРЪЮЩ вХЪбв Т бваЮЪХ бЮТЯРФХв Ш бЪЮЫмЪЮ ТаХЬХЭШ ЧРЩЬХв ЯЮШбЪ. јл аРббЬЮваШЬ ТбХ ЯЮФаЮСЭЮбвШ. ·РЮФЭЮ нвЮв ЬРвХаШРЫ ЯЮЬЮЦХв ТРЬ СЮЫХХ гТХаХЭЭЮ бваЮШвм бЫЮЦЭлХ ТлаРЦХЭШп.

јл ХбвХбвТХЭЭЮ ЯХаХеЮФШЬ Ъ вХЬХ УЫРТл 5, «їЮбваЮХЭШХ бЫЮЦЭле ТлаРЦХЭШЩ». АРЧЮСаРТиШбм Т ЮбЭЮТРе аРСЮвл ЬХеРЭШЧЬР, Ьл аРббЬЮваШЬ ЯаШХЬл, ЯЮЧТЮЫпойШХ ШЧТЫХзм ЬРЪбШЬгЬ ЯЮЫмЧл ШЧ нвШе ЧЭРЭШЩ — Ш нвЮУЮ ЬХеРЭШЧЬР. І УЫРТХ 5 ЮЯШбРЭл ЭХФЮзХвл ЭХЪЮвЮале аРбЯаЮбваРЭХЭЭле ФШРЫХЪвЮТ аХУгЫпаЭле ТлаРЦХЭШЩ (ЭХаХФЪЮ ЯаШТЮФпйШХ Ъ ЭХЯаШпвЭлЬ боаЯаШЧРЬ) Ш аРббЪРЧРЭЮ, ЪРЪ ЮСаРвШвм Ше бХСХ ЭР ЯЮЫмЧг.

іЫРТл 4 Ш 5 пТЫповбп жХЭваРЫмЭлЬ бвХаЦЭХЬ нвЮЩ ЪЭШУШ, ХХ ШбвШЭЭЮЩ ЪТШЭвнббХЭжШХЩ. їХаТлХ ваШ УЫРТл ТбХУЮ ЫШим ЯЮФТЮФШЫШ ЭРб Ъ нвЮЩ вХЬХ, Р ЯЮбЫХФгойХХ ЮЯШбРЭШХ ЪЮЭЪаХвЭле ЯаЮУаРЬЬ ЮбЭЮТРЭЮ ЭР нвШе УЫРТРе. ёЧЫЮЦХЭЭлЩ ЬРвХаШРЫ ЭШЪРЪ ЭХ ЭРЧЮТХим «ЫХУЪШЬ звШТЮЬ», ЭЮ п ЯЮбвРаРЫбп ФХаЦРвмбп ЯЮФРЫмиХ Юв РЫУХСал, ЬРвХЬРвШЪШ Ш ТбХУЮ вЮУЮ, звЮ ФЫп СЮЫмиШЭбвТР ШЧ ЭРб ТлУЫпФШв ЪШвРЩбЪЮЩ УаРЬЮвЮЩ. ІХаЮпвЭЮ, ЪРЪ ЮСлзЭЮ СлТРХв ЯаШ ЯЮЫгзХЭШШ СЮЫмиЮУЮ ЮСкХЬР ШЭдЮаЬРжШШ, ЭЮТлХ ЧЭРЭШп СгФгв гбТЮХЭл ЭХ баРЧг.

ёЭдЮаЬРжШп Ю ЪЮЭЪаХвЭле ЯаЮУаРЬЬРе

єЮЭжХЯжШШ Ш ЯаШЭжШЯл, аРббЬЮваХЭЭлХ Т УЫРТРе 4 Ш 5, ТлеЮФпв ЧР аРЬЪШ ЪЮЭЪаХвЭле ЯаЮУаРЬЬ. ІЮЧЬЮЦЭЮ, ЭХЪЮвЮалХ ЯаШЬХал ЯаШФХвбп бЫХУЪР ЯЮФЯаРТШвм, звЮСл ЮЭШ бЮЮвТХвбвТЮТРЫШ ЪЮЭЪаХвЭЮЬг ФШРЫХЪвг, ЭЮ ТРЦЭл ЭХ ЪЮЭЪаХвЭлХ ЯаШЬХал, Р ТлЭХбХЭЭлХ ШЧ ЭШе гаЮЪШ.

ВРЪШХ пЧлЪШ, ЪРЪ awk, Tcl, Python, sed Ш Emacs ЮСЫРФРов ЯЮбЫХФЮТРвХЫмЭлЬ ШЭвХадХЩбЮЬ ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ. µбЫШ Тл аРЧЮСаРЫШбм Т аРСЮвХ Ше ЬХеРЭШЧЬР аХУгЫпаЭле ТлаРЦХЭШЩ (УЫРТл 4 Ш 5), ЮбвРХвбп ЭХ вРЪ гЦ ЬЭЮУЮ ШЭдЮаЬРжШШ, ЮвЭЮбпйХЩбп Ъ ЪЮЭЪаХвЭЮЩ ЯаЮУаРЬЬХ — аРЧТХ звЮ ЭХбЪЮЫмЪЮ ЧРЬХзРЭШЩ, ЪРбРойШебп «еаЮЬР Ш ТЭХиЭХЩ ЮвФХЫЪШ». јл аРббЬЮваШЬ нвг вХЬг Т УЫРТХ 6.

Б ФагУЮЩ бвЮаЮЭл, Perl Ш «їгвм Perl» бТпЧРЭл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ ЭР ЬЭЮУШе гаЮТЭпе. ±ЮУРвлХ Ш ТлаРЧШвХЫмЭлХ баХФбвТР Perl ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ бЮФХаЦРв ЭХЬРЫЮ ЭХпбЭЮбвХЩ Ш вХЬЭле ЬХбв, ЭР ЪЮвЮалХ бЫХФгХв ЮСаРвШвм ЮбЮСЮХ ТЭШЬРЭШХ. ѕФЭШ аРббЬРваШТРов Perl ЪРЪ ТбХЯЮСХЦФРойго бШЫг Т ЬШаХ бжХЭРаЭле пЧлЪЮТ, ФагУШХ бзШвРов ХУЮ ЧРСРТЭлЬ гаЮФжХЬ. ВХ ТЮЧЬЮЦЭЮбвШ, ЪЮвЮалХ ЯЮЧТЮЫпов ЬРбвХаг аХиШвм вХЮаХЬг ДХаЬР[19] Т ЮФЭЮбваЮзЭЮЩ ЯаЮУаРЬЬХ, Т агЪРе ЭХЯЮбТпйХЭЭЮУЮ ЯаХТаРйРовбп Т РФбЪго ЬРиШЭг. їЮ нвЮЩ ЯаШзШЭХ Т УЫРТХ 7 Ьл ФЮ ЬХЫмзРЩиШе ЯЮФаЮСЭЮбвХЩ аРббЬЮваШЬ аХУгЫпаЭлХ ТлаРЦХЭШп Ш ЮЯХаРвЮал Perl. їЮЯгвЭЮ ЯаШТЮФШвбп ЭХЬРЫЮ ЮСйШе бТХФХЭШЩ Ю ЯаЮУаРЬЬШаЮТРЭШШ ЭР Perl, ЭЮ ЮбЭЮТЭЮЩ вХЬЮЩ нвЮЩ УЫРТл пТЫпХвбп ЯЮЭШЬРЭШХ Ш ШбЯЮЫмЧЮТРЭШХ баХФбвТ Perl, бТпЧРЭЭле б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ.

[1] БвРвмп «A logical calculus of the ideas immanent in nervous activity» СлЫР ТЯХаТлХ ЮЯгСЫШЪЮТРЭР Т СоЫЫХвХЭХ «Bulletin of Math.Biophysics» (ЭЮЬХа 5, 1943 У.) Ш ЯЮЧФЭХХ ЯХаХЯХзРвРЭР Т «Embodiments of Mind» (MIT Press, 1965 У.) БвРвмп ЭРзШЭРХвбп б ШЭвХаХбЭЮУЮ ЮСЧЮаР ЯЮТХФХЭШп ЭХЩаЮЭЮТ (ЮЪРЧлТРХвбп, бЪЮаЮбвм ТЭгваШЭХЩаЮЭЭле ШЬЯгЫмбЮТ ЬХЭпХвбп Юв 1 ФЮ 150 ЬХваЮТ Т бХЪгЭФг!), ЯЮбЫХ зХУЮ ЯЮУагЦРХвбп Т СХЧФЭг дЮаЬгЫ, Т ЪЮвЮале п вРЪ Ш ЭХ аРЧЮСаРЫбп.

[2] Rebert L.Constable, «The Role of Finite Automata in the Development of Modern Computing Theory», ЬРвХаШРЫл «The Kleene Symposium», аХФРЪвЮал Barwise, Keisler Ш Kunen (North-Holland Publishing Company, 1980), б. 61–83.

[3] «Communications of the ACM», Vol. 11, No. 6, June 1968.

[4] ёбвЮаШзХбЪРп ШЭдЮаЬРжШп: ed (Ш grep) ШбЯЮЫмЧЮТРЫШ Т ЪРзХбвТХ ЮУаРЭШзШвХЫХЩ нЪаРЭШаЮТРЭЭлХ бЪЮСЪШ ТЬХбвЮ ЯаЮбвле, ЯЮвЮЬг звЮ єХЭ ВЮЬЯбЮЭ аХиШЫ, звЮ аХУгЫпаЭЮХ ТлаРЦХЭШп СгФгв Т ЮбЭЮТЭЮЬ ШбЯЮЫмЧЮТРвмбп ФЫп аРСЮвл б ЯаЮУаРЬЬЭлЬ ЪЮФЮЬ C, Ш ЯЮШбЪ бЪЮСЮЪ-ЫШвХаРЫЮТ СгФХв ЯаЮШбеЮФШвм зРйХ, зХЬ ЯаШЬХЭХЭШХ ЮСаРвЭле бблЫЮЪ.

[5] єРЪ ЯаШ ЭРЯШбРЭШШ ЪЭШУШ ЯЮ аХУгЫпаЭлЬ ТлаРЦХЭШпЬ — ЯЮТХамвХ, п ЧЭРо, Ю зХЬ УЮТЮао!

[6] ЅРЯаШЬХа, Т ЪЮФШаЮТйШЪХ URL ЭР б. <$R[P#,R7-103]> ТЬХбвЮ [[^a-zA-Z0-9]] Т ЯаХФлФгйШе ШЧФРЭШпе нвЮЩ ЪЭШУШ ШбЯЮЫмЧЮТРЫбп ЬХвРбШЬТЮЫ [\W]. ЅЮ ЮФШЭ ЬЮЩ ФагУ бвЮЫЪЭгЫбп б ЯаЮСЫХЬРЬШ ЯаШ ШЭвХаЯаХвРжШШ ЭХЪЮвЮале СРЩвЮТ, ЭХ ТеЮФпйШе Т ЭРСЮа ASCII-бШЬТЮЫЮТ (???, ??? Ш в. Ф.) ѕЭ ЮЦШФРЫ, звЮ нвШ СРЩвл СгФгв ЮвЭХбХЭл Ъ [\W], ЭЮ ХУЮ ТХабШп Perl ЮвЭХбЫР Ше Ъ [\w], звЮ ЯаШТЮФШЫЮ Ъ ЭХЮЦШФРЭЭлЬ аХЧгЫмвРвРЬ.

[7] ЅРбЪЮЫмЪЮ ЬЭХ ШЧТХбвЭЮ, ASCII-бШЬТЮЫ ТХавШЪРЫмЭЮЩ вРСгЫпжШШ ЯХаХбвРЫ ШбЯЮЫмЧЮТРвмбп ТЬХбвХ б вХЫХвРЩЯРЬШ.

[8] БЯРбШСЮ ЕнЫг ІРЩЭг (Hal Wine) ЧР аРЧкпбЭХЭШп ЯЮ нвЮЬг ТЮЯаЮбг.

[9] П ЭРЯШбРЫ ЭР Perl ЯаЮУаРЬЬг ТлСЮаЪШ URL webget (ШЬХХвбп ЭР ЬЮХЩ ФЮЬРиЭХЩ бваРЭШжХ, бЬ. ЯаШЫЮЦХЭШХ °). П ЯЮЫгзРЫ ЬЭЮЦХбвТЮ бЮЮСйХЭШЩ Ю вЮЬ, звЮ ЯаЮУаРЬЬР ЭХ аРСЮвРХв б ЭХЪЮвЮалЬШ еЮбвРЬШ. їаШиЫЮбм бФХЫРвм ХХ СЮЫХХ «вгЯЮЩ» Ш ЭХ ЭРбвРШТРвм ЭР ЯаРТШЫмЭЮЬ дЮаЬРвШаЮТРЭШШ ЮвТХвЮТ HTTP. ѕЪРЧРЫЮбм, ЯаШ ЯЮбваЮХЭШШ ЮвТХвЮТ ЭХЪЮвЮалХ Web-бХаТХал ЮиШСЮзЭЮ ШбЯЮЫмЧЮТРЫШ \n ТЬХбвЮ \015\012.

[10] ДРвРЫмЭРп ЮиШСЪР ТлФРТРЫРбм Т GNU awk 3.0.0, ЯЮбЫХФЭХЩ ТХабШШ ЭР ЬЮЬХЭв ЯЮФУЮвЮТЪШ ЪЭШУШ. јЭХ бЮЮСйШЫШ, звЮ нвР ЮиШСЪР (ЪРЪ Ш ЬЭЮУШХ ФагУШХ, гЯЮЬШЭРХЬлХ Т ЪЭШУХ) СгФХв ШбЯаРТЫХЭР Т бЫХФгойХЩ ТХабШШ.

[11] ґЫп вХе, ЪвЮ еЮзХв бЮСЫоФРвм бвРЭФРав POSIX, аРЧЮСаРвмбп Т ЯаЮШбеЮФпйХЬ СгФХв ЭХЫХУЪЮ. їЮЫ БвХЩЭСРе (Paul Steinbach), ТХФгйШЩ ШЭЦХЭХа ШЧ Mortice Kern Systems, гСХФШЫ ЬХЭп Т вЮЬ, звЮ ШЬХЭЭЮ ТвЮаРп ШЭвХаЯаХвРжШп ЯаШ ТбХЩ бТЮХЩ ЭХЫХЯЮбвШ бЮЮвТХвбвТгХв бвРЭФРавг POSIX.

[12] є Perl ФРЭЭлЩ аРЧФХЫ ЭХ ЮвЭЮбШвбп. ГЭШЪРЫмЭлХ бТЮЩбвТР Perl Т нвЮЬ ЮвЭЮиХЭШШ ЯЮФаЮСЭЮ аРббЬРваШТРХвбп Т УЫРТХ 7 (б. ???)

[13] ІЮЮСйХ УЮТЮап, Т Perl ЯЮФФХаЦШТРовбп ЮСР ТРаШРЭвР, ЭЮ ЯЮ бЮТХаиХЭЭЮ ШЭлЬ ЯаШзШЭРЬ. І бШЬТЮЫмЭле ЪЫРббРе ЯаШТпЧЪР Ъ УаРЭШжХ бЫЮТР ЭХ ШЬХХв бЬлбЫР, ЯЮнвЮЬг ТЭгваШ ЪЫРббР \b ЮЧЭРзРХв ЧРСЮЩ.

[14] БвРЭФРавЭРп СШСЫШЮвХЪР Emacs elisp СШвЪЮЬ ЭРСШвР аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ. їаШТХФХЭЭлЩ ЯаШЬХа ТЧпв ШЧ дРЩЫР hilit19.el.

[15] їЮ бЫЮТРЬ єХЭР ВЮЬЯбЮЭР, РТвЮаР ed.

[16] ѕСлзЭЮ Т нвЮЩ ЪЭШУХ вХаЬШЭл «бШЬТЮЫмЭлЩ ЪЫРбб» Ш «ТлаРЦХЭШХ POSIX Т ЪТРФаРвЭле бЪЮСЪРе» ШбЯЮЫмЧговбп ЪРЪ бШЭЮЭШЬл, ЮЯШблТРойго ЪЮЭбвагЪжШо Т жХЫЮЬ, Р вХаЬШЭ «бШЬТЮЫмЭлЩ ЪЫРбб POSIX» ЮвЭЮбШвбп Ъ ЮбЮСЮЩ ЯбХТФЮ-ШЭвХаТРЫмЭЮЩ ЪЮЭбвагЪжШШ, ЮЯШбРЭЭЮЩ Т нвЮЬ аРЧФХЫХ.

[17] ВРЪЦХ ЭРЧлТРХЬлХ «ЫХЭШТлЬШ» (lazy) ШЫШ «йХФалЬШ» (non-greedy) — бЬ. б. ???.

[18] ВХЮаХвШзХбЪШ ТбХ бЪРЧРЭЭЮХ Ю {0,0} ТХаЭЮ. ЅР ЯаРЪвШЪХ ФХЫЮ ЮСбвЮШв ХйХ егЦХ — ЯЮбЫХФбвТШп ЯЮзвШ ЭХЯаХФбЪРЧгХЬл! І ЭХЪЮвЮале ЯаЮУаРЬЬРе (ТЪЫозРп GNU awk, GNU grep Ш бвРалХ ТХабШШ Perl) ЪЮЭбвагЪжШп {0,0} нЪТШТРЫХЭвЭР *, Р ТЮ ЬЭЮУШе ФагУШе (ТЪЫозРп СЮЫмиШЭбвТЮ ТШФХЭЭле ЬЭЮЩ ТХабШЩ sed Ш ЭХЪЮвЮалХ ТХабШШ grep) ЮЭР нЪТШТРЫХЭвЭР ?. ±ХЧгЬШХ!

[19] єЮЭХзЭЮ, п ЯаХгТХЫШзШТРо, ЭЮ ХбЫШ еЮвШвХ ЯЮЯаЮСЮТРвм — ЯЮШйШвХ бЫЮТЮ Fermat ЭР Yahoo (http://www.yahoo.com).

ІЮЧЬЮЦЭЮбвм	БЮТаХЬХЭЭлХ ТХабШШ grep	БЮТаХЬХЭЭлХ ТХабШШ egrep	awk	GNU Emacs ТХабШп 19	Perl	Tcl	vi
*, ^, $, […]	Ж	Ж	Ж	Ж	Ж	Ж	Ж
? + \|	\? \+ \\|	? + \|	? + \|	? + \\|	? + \|	? + \|	\? \+ spc
УагЯЯШаЮТЪР	\(…\)	(…)	(…)	\(…\)	(…)	(…)	\(…\)
УаРЭШжл бЫЮТ	spc	\< \>	spc	\< \> \b \B	\b \B	spc	\< \>
\w, \W	spc	Ж	spc	Ж	Ж	spc	spc
ЮСаРвЭлХ бблЫЪШ	Ж	spc	spc	Ж	Ж	spc	Ж

јХвРбШЬТЮЫл	BRE	ERE
вЮзЪР, ^, $, […], [^…]	Ж	Ж
*, +, ?, {ЬШЭ, ЬРЪб}	*, spc, spc, \{ЬШЭ, ЬРЪб\}	*, +, ?, \{ЬШЭ, ЬРЪб\}
УагЯЯШаЮТЪР	\(…\)	(…)
ЯаШЬХЭХЭШХ ЪТРЭвШдШЪРвЮаЮТ Ъ бЪЮСЪРЬ	Ж	Ж
ЮСаРвЭлХ бблЫЪШ	\1…\9	spc
ЪЮЭбвагЪжШп ТлСЮаР	spc	Ж

\a	БШУЭРЫ (ЯаШ «ТлТЮФХ» аРЧФРХвбп ЧТгЪЮТЮЩ бШУЭРЫ). ѕСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <BEL>, ЪЮФ 007 (Т ТЮбмЬХаШзЭЮЩ бШбвХЬХ).
\b	·РСЮЩ. ѕСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <BS>, ЪЮФ 010 (Т ТЮбмЬХаШзЭЮЩ бШбвХЬХ). ѕСаРвШвХ ТЭШЬРЭШХ: \b зРбвЮ ШЭвХаЯаХвШагХвбп ЪРЪ ЬХвРбШЬТЮЫ УаРЭШжл бЫЮТР (бЬ. ЭШЦХ).
\e	БШЬТЮЫ Escape. ѕСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <ESC>, ЪЮФ 033 (Т ТЮбмЬХаШзЭЮЩ бШбвХЬХ).
\f	їЮФРзР ЫШбвР. ѕСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <FF>, ЪЮФ 014 (Т ТЮбмЬХаШзЭЮЩ бШбвХЬХ).
\n	ЅЮТРп бваЮЪР. ЅР СЮЫмиШЭбвТХ ЯЫРвдЮаЬ (ТЪЫозРп Unix Ш DOS/Windows) ЮСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <LF>, ЪЮФ 012 (Т ТЮбмЬХаШзЭЮЩ бШбвХЬХ). І бШбвХЬХ MacOS ЮСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <CR>, ЪЮФ 015 (Т ТЮбмЬХаШзЭЮЩ бШбвХЬХ).
\r	ІЮЧТаРв ЪгабЮаР. ѕСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <CR>. І бШбвХЬХ MacOS ЮСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <LF>.
\t	ѕСлзЭРп (УЮаШЧЮЭвРЫмЭРп) вРСгЫпжШп. ѕСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <HT>, ЪЮФ 011 (Т ТЮбмЬХаШзЭЮЩ бШбвХЬХ).
\v	ІХавШЪРЫмЭРп вРСгЫпжШп^[7]. ѕСлзЭЮ бЮЮвТХвбвТгХв ASCII-бШЬТЮЫг <VT>, ЪЮФ 013 (Т ТЮбмЬХаШзЭЮЩ бШбвХЬХ).

\d	ЖШдаР. ѕСлзЭЮ нЪТШТРЫХЭвЭЮ [[0-9]].
\D	ЅХ-жШдаР. ѕСлзЭЮ нЪТШТРЫХЭвЭЮ [[^0-9]].
\w	БШЬТЮЫ, ТеЮФпйШЩ Т бЫЮТЮ. ЗРбвЮ нЪТШТРЫХЭвЭЮ [[a-zA-Z0-9]]. І ЭХЪЮвЮале ЯаЮУаРЬЬРе (ЮбЮСХЭЭЮ Perl, GNU awk Ш GNU sed) Т нвг ЪРвХУЮаШо вРЪЦХ ТЪЫозРХвбп бШЬТЮЫ ЯЮФзХаЪШТРЭШп. І GNU Emacs ШЭвХаЯаХвРжШп \w ЬЮЦХв ШЧЬХЭпвмбп ТЮ ТаХЬп аРСЮвл ЯаЮУаРЬЬл — бЬ. аРЧФХЫ «БШЭвРЪбШзХбЪШХ ЪЫРббл».
\W	БШЬТЮЫ, ЭХ ТеЮФпйШЩ Т бЫЮТЮ. ѕСлзЭЮ нЪТШТРЫХЭвЭЮ ЮваШжРЭШо \w (вЮ Хбвм [[^…]]).
\s	їаЮЯгбЪ. ЗРбвЮ нЪТШТРЫХЭвЭЮ [[spc\f\n\r\t\v]].
\S	ЅХ-ЯаЮЯгбЪ. ѕСлзЭЮ нЪТШТРЫХЭвЭЮ ЮваШжРЭШо \s (вЮ Хбвм [[^…]]).

\sбШЬТЮЫ	бЮТЯРФРХв б бШЬТЮЫРЬШ, ЯаШЭРФЫХЦРйШЬШ бШЭвРЪбШзХбЪЮЬг ЪЫРббг Emacs, ЮЯаХФХЫпХЬЮЬг ЧРФРЭЭлЬ бШЬТЮЫЮЬ.
\SбШЬТЮЫ	бЮТЯРФРХв б бШЬТЮЫРЬШ, ЭХ ЯаШЭРФЫХЦРйШЬШ бШЭвРЪбШзХбЪЮЬг ЪЫРббг Emacs.

[:alnum:]	РЫдРТШвЭлХ бШЬТЮЫл Ш жШдаЮТлХ бШЬТЮЫл
[:alpha:]	РЫдРТШвЭлХ бШЬТЮЫл
[:blank:]	ЯаЮСХЫ Ш вРСгЫпжШп
[:cntrl:]	гЯаРТЫпойШХ бШЬТЮЫл
[:digit:]	жШдал
[:graph:]	ЮвЮСаРЦРХЬлХ бШЬТЮЫл (ЭХ ЯаЮСХЫл, ЭХ гЯаРТЫпойШХ бШЬТЮЫл Ш в. Ф.)
[:lower:]	РЫдРТШвЭлХ бШЬТЮЫл ЭШЦЭХУЮ аХУШбваР
[:print:]	РЭРЫЮУ [:graph:], ЭЮ ТЪЫозРХв ЯаЮСХЫ
[:punct:]	ЧЭРЪШ ЯаХЯШЭРЭШп
[:space:]	ТбХ ЯаЮЯгбЪШ ([:blank:], бШЬТЮЫ ЭЮТЮЩ бваЮЪШ, ТЮЧТаРв ЪгабЮаР Ш в. Ф.)
[:upper:]	РЫдРТШвЭлХ бШЬТЮЫл ТХаеЭХУЮ аХУШбваР
[:xdigit:]	жШдал, ФЮЯгбвШЬлХ Т иХбвЭРФжРвХаШзЭле зШбЫРе (вЮ Хбвм 0-9a-fA-F).