АХУгЫпаЭлХ ТлаРЦХЭШп Т ЪЮЭЪаХвЭле ЯаЮУаРЬЬРе

АРЧСШаРвмбп Т аХУгЫпаЭле ТлаРЦХЭШпе ТЮЮСйХ — нвЮ ЫШим ЯЮЫЮТШЭР ФХЫР. ґЫп ЯЮЫЭЮвл ЪРавШЭл ЭХЮСеЮФШЬЮ ЧЭРвм ЪЮЭЪаХвЭлЩ ФШРЫХЪв, ХУЮ ЮУаРЭШзХЭШп Ш ЯЮвХЭжШРЫмЭлХ ТЮЧЬЮЦЭЮбвШ.

єРЪ СлЫЮ ЯЮЪРЧРЭЮ Т УЫРТХ 3, ЭШЪРЪЮУЮ ХФШЭбвТР Т нвЮЩ ЮСЫРбвШ ЭХв. ёЧ вРСЫ. 3.4 (б. <$R[P#,R3-13]>) ТШФЭЮ, звЮ ФРЦХ Т вРЪЮЩ ЯаЮбвЮЩ ЮСЫРбвШ, ЪРЪ пЪЮаЭлХ ЬХвРбШЬТЮЫл, ТЮЧЭШЪРХв ЭХЬРЫЮ ЧРвагФЭХЭШЩ. їаШТХФг ХйХ ЮФШЭ ЯаШЬХа. І вРСЫ. 6.1 ЯХаХзШбЫХЭл еРаРЪвХаШбвШЪШ ЭХЪЮвЮале ФШРЫХЪвЮТ аХУгЫпаЭле ТлаРЦХЭШЩ ФЫп ЯаЮУаРЬЬ, бгйХбвТгойШе ЭР аРЧЭле ЯЫРвдЮаЬРе. ІЮЧЬЮЦЭЮ, Тл гЦХ ТбваХзРЫШбм б ЭХЯЮЫЭлЬ ТРаШРЭвЮЬ вРСЫ. 6.1 (еЮвп Сл Т вРСЫ. 3.1 нвЮЩ ЦХ ЪЭШУШ), ЭЮ Ягбвм аРЧЬХа вРСЫШжл 6.1 ТРб ЭХ ЮСЬРЭлТРХв — ЮЭР вЮЦХ ЭХ пТЫпХвбп ЯЮЫЭЮЩ. їЮзвШ Ъ ЪРЦФЮЩ пзХЩЪХ вРСЫШжл ЭХЮСеЮФШЬЮ ЯаШТХбвШ ЯЮпбЭШвХЫмЭго бЭЮбЪг.

ІЮЯаЮбл, ЪЮвЮалХ Тл ФЮЫЦЭл ЧРФРвм

їаШ ЯХаТЮЬ ЧЭРЪЮЬбвТХ б ЭЮТлЬ ФШРЫХЪвЮЬ аХУгЫпаЭле ТлаРЦХЭШЩ Т УЮЫЮТг ЯаШеЮФШв ЬЭЮЦХбвТЮ ТЮЯаЮбЮТ. ЅХЪЮвЮалХ ШЧ ЭШе ЯХаХзШбЫХЭл Т УЫРТХ 3 (б. <$R[P#,R3-17]>). їгбвм ЭХ ТбХ ТЮЯаЮбл пТЫповбп ЯХаТЮЮзХаХФЭлЬШ Ш РСбЮЫовЭЮ ЭХЮСеЮФШЬлЬШ, ТРЬ ТбХ ЦХ бЫХФгХв ЯЮЧЭРЪЮЬШвмбп б ЭШЬШ. ѕФЭЮ ШЧ ЯаХЯпвбвТШЩ ЧРЪЫозРХвбп Т вЮЬ, звЮ ЬХЦФг аРЧЭлЬШ ТХабШпЬШ ЮФЭЮЩ ЯаЮУаРЬЬл ШЭЮУФР бгйХбвТгов ЧРЬХвЭлХ аРЧЫШзШп. ЅРЯаШЬХа, GNU-ТХабШШ ЯаЮУаРЬЬ ЮСлзЭЮ ЮСЫРФРов аРбиШаХЭЭлЬШ ТЮЧЬЮЦЭЮбвпЬШ. І вРСЫ. 6.1 ЭХ ЮваРЦХЭ ЭШ нвЮв дРЪв, ЭШ жХЫЮХ ЯЮЪЮЫХЭШХ ЭЮТле ТХабШЩ, бЮЮвТХвбвТгойШе бвРЭФРавг POSIX. ±ЮЫХХ вЮУЮ, ФРЦХ ХбЫШ ЭЮЬХа ТХабШШ ТРиХЩ ЯаЮУаРЬЬл вЮзЭЮ бЮТЯРФРХв б ЯаШТХФХЭЭлЬ Т вРСЫ. 6.1, нвЮ ХйХ ЭШ Ю зХЬ ЭХ УЮТЮаШв. ґРЦХ вРЪРп ЯаЮбвРп ЯаЮУаРЬЬР, ЪРЪ grep, бгйХбвТгХв Т ЭХбЪЮЫмЪШе аРЧЭле ТРаШРЭвРе.

ґРЦХ вРЪШХ ЯаЮбвлХ ЯаЮУаРЬЬл, ЪРЪ grep…

ґР, ФРЦХ вРЪРп ЯаЮбвРп ЯаЮУаРЬЬл, ЪРЪ grep, бгйХбвТгХв Т ЭХбЪЮЫмЪШе аРЧЭле ТРаШРЭвРе. І вРСЫ. 6.2 ЯХаХзШбЫХЭл ЭХЪЮвЮалХ ЮвЫШзШп ЬХЦФг ЭХЪЮвЮалЬШ ШЧ бгйХбвТгойШе ТХабШЩ. ВРСЫШжг 6.2 вЮЦХ ЭХ ЬХиРЫЮ Сл бЮЯаЮТЮФШвм ШЧапФЭлЬ ЪЮЫШзХбвТЮЬ бЭЮбЮЪ. І GNU grep ТХабШШ 2.0 ^ Ш $ бзШвРовбп ЬХвРбШЬТЮЫРЬШ «вРЬ, УФХ нвЮ ШЬХХв бЬлбЫ» — ЭРЯаШЬХа, Т ЪЮЭбвагЪжШпе […|^…] Ш [(…$)]. І СЮЫмиШЭбвТХ ФагУШе ТХабШЩ ЮЭШ ФЮЯгбЪРовбп ЫШим Т ЭРзРЫХ Ш ЪЮЭжХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп бЮЮвТХвбвТХЭЭЮ. Б ФагУЮЩ бвЮаЮЭл, Т GNU grep ТХабШШ 2.0 ЮвбгвбвТгХв ЪЫРбб POSIX [:blank:], Р Т ТХабШШ SCO — ЪЫРбб [:xdigit:].<$M[R6-1]>

ВРСЫШжР 6.1. їЮТХаеЭЮбвЭлЩ ЮСЧЮа ФШРЫХЪвЮТ ЭХЪЮвЮале аРбЯаЮбваРЭХЭЭле ЯаЮУаРЬЬ

їЮеЮЦХ, ЪЫоз ЪЮЬРЭФЭЮЩ бваЮЪШ -i пТЫпХвбп ЮбЮСХЭЭЮ СЫРУЮФРвЭЮЩ ЯЮзТЮЩ ФЫп ТбХТЮЧЬЮЦЭле аРбеЮЦФХЭШЩ. І grep ТХабШШ v7 jn 1979 У. ФХЩбвТШХ ЪЫозР -i аРбЯаЮбваРЭпЫЮбм вЮЫмЪЮ ЭР вХ бШЬТЮЫл аХУгЫпаЭЮУЮ ТлаРЦХЭШп, ЪЮвЮалХ СлЫШ ЧРЯШбРЭл Т ЭШЦЭХЬ аХУШбваХ. І ТХабШШ r2v2, ТлиХФиХЩ ЭХбЪЮЫмЪЮ ЫХв бЯгбвп, нвЮ ЭХгФЮСбвТЮ СлЫЮ гбваРЭХЭЮ, ЭЮ Т ЭХЩ ЪЫоз -i ЭХ ФХЩбвТЮТРЫ ЭР бШЬТЮЫл, ЮЯаХФХЫпХЬлХ бШЬТЮЫмЭлЬ ЪЫРббЮЬ. ґРЦХ Т бЮТаХЬХЭЭЮЩ ТХабШШ GNU grep 2.0 ЪЫоз -i ЭХ ФХЩбвТгХв ЯаШ ШбЯЮЫмЧЮТРЭШШ ЮСаРвЭле бблЫЮЪ. І SCO ЮЭ ШУЭЮаШагХвбп ФЫп ЪЫРббР POSIX [:upper:], ЭЮ ФХЩбвТгХв ФЫп ЪЫРббР [:lower:]. їЮзХЬг? БЯаЮбШвХ звЮ-ЭШСгФм ЯЮЯаЮйХ.

ЅРФХобм, Тл гЫЮТШЫШ УЫРТЭЮХ: аРЧЫШзШЩ еТРвРХв.

І нвЮЩ УЫРТХ

ЅХТЮЧЬЮЦЭЮ гбЫХФШвм ЧР ТбХЬШ ЭоРЭбРЬШ ТбХе ТХабШЩ ТЮ ТбХе аХРЫШЧРжШпе ТбХе бгйХбвТгойШе ЯаЮУаРЬЬ. јЭХ нвР ЧРФРзР вЮЦХ ЭХ ЯЮ бШЫРЬ, ЯЮнвЮЬг ФЫп СЮЫмиШЭбвТР ЯХаХзШбЫХЭЭле ЯаЮУаРЬЬ п ЮУаРЭШзгбм бТХФХЭШпЬШ, ЯаШТХФХЭЭлЬШ Т вРСЫ. 6.1. ЕЮаЮиЮ гбТЮШТ ЬРвХаШРЫ УЫРТ 4 Ш 5, Тл бЬЮЦХвХ бРЬЮбвЮпвХЫмЭЮ ТлФХЫШвм ТРЦЭХЩиШХ РбЯХЪвл, Р ТРиР ЪТРЫШдШЪРжШп ЯЮЧТЮЫШв бРЬЮбвЮпвХЫмЭЮ ЯаЮРЭРЫШЧШаЮТРвм ТЮЧЭШЪРойШХ ЯаЮСЫХЬл Ш аРЧЮСаРвмбп Т ЭШе. Ібо ЮбвРЫмЭго ШЭдЮаЬРжШо, ЭХЮСеЮФШЬго ФЫп аРСЮвл б ЪЮЭЪаХвЭЮЩ ЯаЮУаРЬЬЮЩ, ЮСлзЭЮ ЬЮЦЭЮ ЯЮзХаЯЭгвм ШЧ агЪЮТЮФбвТР. Perl — ЮбЮСлЩ бЫгзРЩ, ЪЮвЮаЮЬг СгФХв ЯЮбТпйХЭР Тбп бЫХФгойРп УЫРТР.

ВРСЫШжР 6.2. БаРТЭШвХЫмЭлЩ РЭРЫШЧ ЭХбЪЮЫмЪШе ТХабШЩ grep

І ЪРзХбвТХ ЯаШЬХаР Т нвЮЩ УЫРТХ аРббЬРваШТРовбп ЭХЪЮвЮалХ бЯХжШдШзХбЪШХ ЮбЮСХЭЭЮбвШ awk, Tcl Ш GNU Emacs elisp ШЧ ЮСЫРбвШ аХУгЫпаЭле ТлаРЦХЭШЩ. їаХФЯЮЫРУРХвбп, звЮ Тл гЦХ Т ЮСйШе зХавРе ЧЭРЪЮЬл б нвШЬШ пЧлЪРЬШ, Ш ТРб ШЭвХаХбгХв зХвЪЮХ ЮЯШбРЭШХ ФШРЫХЪвР аХУгЫпаЭле ТлаРЦХЭШЩ, Р вРЪЦХ ЭХЪЮвЮалХ ЯЮЫХЧЭлХ бЮТХвл Ш аХЪЮЬХЭФРжШШ. П ЯЮбвРаРЫбп ШЧЫРУРвм ЬРвХаШРЫ ЯЮ ТЮЧЬЮЦЭЮбвШ ЪаРвЪЮ, ЯЮнвЮЬг Т нвЮЩ УЫРТХ зРбвЮ ТбваХзРовбп бблЫЪШ ЭР УЫРТг 3.

І ЯХаТЮЬ аРЧФХЫХ, «Awk», ЮбЭЮТЭЮХ ТЭШЬРЭШХ гФХЫпХвбп ЮвЫШзШпЬ ЬХЦФг ЯЮЯгЫпаЭлЬШ аХРЫШЧРжШпЬШ awk Т ЮСЫРбвШ аХУгЫпаЭле ТлаРЦХЭШЩ. јЭЮУШХ аРЧаРСЮвзШЪШ ТлЯгбвШЫШ бЮСбвТХЭЭлХ ТХабШШ awk, Ш г ЪРЦФЮУЮ ШЧ ЭШе, ЯЮеЮЦХ, Хбвм бЮСбвТХЭЭлХ ЯаХФбвРТЫХЭШп Ю вЮЬ, ЪРЪШЬ ФЮЫЦХЭ Слвм ФШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ Т нвЮЩ ЯаЮУаРЬЬХ. ѕЦШТЫХЭЭлХ ФШбЪгббШШ ЯЮ ЯЮТЮФг ЯХаХЭЮбШЬЮбвШ бЯЮбЮСЭл ТлЧТРвм Ш бЬХе, Ш бЫХЧл — Т ЧРТШбШЬЮбвШ Юв вЮУЮ, ЪРЪ ЭР ЭШе ТЧУЫпЭгвм.

Б ФагУЮЩ бвЮаЮЭл, Ш Tcl, Ш GNU Emacs ЯаЮШбеЮФпв ШЧ ЮФЭЮУЮ ШбвЮзЭШЪР, ЯЮнвЮЬг бЪЮаХХ ТбХУЮ, ТРиР ТХабШп СгФХв аРСЮвРвм вРЪ ЦХ (ШЫШ ЯЮзвШ вРЪ ЦХ), ЪРЪ Ш ТХабШШ ЮбвРЫмЭле ЯЮЫмЧЮТРвХЫХЩ. ёЭЮУФР ЯаШеЮФШвбп гзШвлТРвм дгЭЪжШЮЭРЫмЭлХ аРЧЫШзШп ЬХЦФг ТХабШпЬШ, ЭЮ ЮСлзЭЮ СЮЫмиШЩ ШЭвХаХб ЯаХФбвРТЫпХв Ше ЯЮФеЮФ Ъ ЮСаРСЮвЪХ аХУгЫпаЭле ТлаРЦХЭШЩ, вШЯ ЬХеРЭШЧЬР Ѕє° Ш ХУЮ нддХЪвШТЭЮбвм.

Awk

їаЮУаРЬЬР awk СлЫР бЮЧФРЭР Т 1977 УЮФг ЧР ЮФЭг ЭХФХЫо ШЭвХЭбШТЭЮУЮ ЯаЮУаРЬЬШаЮТРЭШп. ѕЭР бвРЫР ЯХаТлЬ ЬЮйЭлЬ ШЭбвагЬХЭвЮЬ Unix, ЯаХФЭРЧЭРзХЭЭлЬ ФЫп ЮСаРСЮвЪШ вХЪбвЮТ. іЮаРЧФЮ СЮЫХХ гЭШТХабРЫмЭРп Ш ТлаРЧШвХЫмЭРп, зХЬ sed, ЮЭР ЯЮаЮФШЫР ЭЮТго ЪгЫмвгаг, ЪЮвЮаРп аРбЯаЮбваРЭШЫРбм ЭР жХЫЮХ ЯЮЪЮЫХЭШХ ЯаЮУаРЬЬЭле баХФбвТ. °ТвЮаРЬ awk гФРЫЮбм ЮСкХФШЭШвм Т ЮФЭЮЩ ЯаЮУаРЬЬХ бЮТХаиХЭЭЮ аРЧЭлХ ШЭвХаХбл. °ЫмдаХФ °еЮ, вЮЫмЪЮ звЮ ЭРЯШбРТиШЩ egrep Ш гзРбвТЮТРТиШЩ Т аРСЮвХ ЭРФ lex, ТЭХб ЯЮФФХаЦЪг аХУгЫпаЭле ТлаРЦХЭШЩ. їШвХа ІРЩЭСХаУХа ЮаШХЭвШаЮТРЫбп ЭР СРЧл ФРЭЭле, Р ±аРЩРЭ єХаЭШУРЭ ШЭвХаХбЮТРЫбп ЯаЮУаРЬЬШагХЬлЬШ аХФРЪвЮаРЬШ. ЅХЬРЫЮХ ТЫШпЭШХ ЭР awk ЮЪРЧРЫР ЯаЮУаРЬЬР јРаЪР АЮиЪШЭФР (Marc Rochkind), ЯаХЮСаРЧгойРп ЯРал «аХУгЫпаЭЮХ ТлаРЦХЭШХ/бваЮЪР» Т ЯаЮУаРЬЬг ЭР пЧлЪХ C, ЪЮвЮаРп бЪРЭШаЮТРЫР дРЩЫ Ш ТлТЮФШЫР гЪРЧРЭЭго бваЮЪг ЯаШ бЮТЯРФХЭШШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп. І awk нвР ШФХп СлЫР гбЮТХаиХЭбвТЮТРЭР, ЮФЭРЪЮ ЮСйШХ ЪЮЭжХЯжШШ ЯЮбваЮзЭЮЩ ЮСаРСЮвЪШ ТеЮФЭле ФРЭЭле Ш аХУгЫпаЭле ТлаРЦХЭШЩ ЮбвРЫШбм вХЬШ ЦХ.

ґШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ awk ШЬХХв б ФШРЫХЪвЮЬ egrep СЮЫмиХ ЮСйХУЮ, зХЬ ФШРЫХЪв ЫоСЮЩ ФагУЮЩ ЯаЮУаРЬЬл, ЭЮ нвШ ФШРЫХЪвл ЭХ бЮТЯРФРов. є бЮЦРЫХЭШо, Т нЫХЪваЮЭЭЮЩ ФЮЪгЬХЭвРжШШ гвТХаЦФРХвбп ЮСаРвЭЮХ, Ш нвЮв ЬШд ЯаЮФЮЫЦРХв бгйХбвТЮТРвм Ш Т ЭРиШ ФЭШ (ФРЦХ Т ЪЭШУРе ШЧФРвХЫмбвТР O’Reilly!) АРЧЫШзШп ЬХЦФг ФШРЫХЪвРЬШ бвРЭЮТпвбп ШбвЮзЭШЪЮЬ ЭХФЮаРЧгЬХЭШЩ. ЅХЪЮвЮалХ ШЧ ЭШе ЮзХТШФЭл — ЭРЯаШЬХа, Т awk ЯЮФФХаЦШТРовбп ЬХвРбШЬТЮЫл [\t] Ш [\n], Р Т egrep ЮЭШ ЮвбгвбвТгов (еЮвп Ю ЯЮФФХаЦЪХ нвШе бШЬТЮЫЮТ Т awk Т ШбеЮФЭЮЬ ТРаШРЭвХ ФЮЪгЬХЭвРжШШ ТЮЮСйХ ЭХ гЯЮЬШЭРЫЮбм!) БгйХбвТгов Ш ФагУШХ, ЬХЭХХ ЮзХТШФЭлХ аРЧЫШзШп. ГвТХаЦФХЭШп ЮС ШФХЭвШзЭЮбвШ ФТге ФШРЫХЪвЮТ бЪалТРЫШ ЭХЪЮвЮалХ ТРЦЭлХ ЮбЮСХЭЭЮбвШ awk Ш бСШТРЫШ б вЮЫЪг ЯЮЫмЧЮТРвХЫХЩ.

АРЧЫШзШп ЬХЦФг ФШРЫХЪвРЬШ аХУгЫпаЭле ТлаРЦХЭШЩ awk

ґТРФжРвм ЫХв ЭРЧРФ бгйХбвТЮТРЫР ХФШЭбвТХЭЭРп ТХабШп awk Юв Bell Labs. І ЭРиШ ФЭШ Ше ЯЮпТШЫЮбм ТХЫШЪЮХ ЬЭЮЦХбвТЮ. І нвЮЬ аРЧФХЫХ п ЯЮФаЮСЭЮ ЮЯШбРЫ аРЧЫШзШп ЬХЦФг ЭХЪЮвЮалЬШ ШЧСаРЭЭлЬШ аХРЫШЧРжШпЬШ. П ФХЫРо нвЮ ЭХ ФЫп вЮУЮ, звЮСл бЭРСФШвм ТРб ШбзХаЯлТРойШЬШ бТХФХЭШпЬШ Ю ЪЮЭЪаХвЭле аХРЫШЧРжШпе Ш аРЧЫШзШпе, Р бЪЮаХХ ФЫп вЮУЮ, звЮСл ЭРУЫпФЭЮ ЯаЮФХЬЮЭбваШаЮТРвм — ТЭХиЭХХ беЮФбвТЮ СлТРХв ЮСЬРЭзШТлЬ. їЮЬШЬЮ ЯХаХзШбЫХЭЭле аХРЫШЧРжШЩ (Ш аРЧЫШзШЩ), бгйХбвТгХв ЬЭЮЦХбвТЮ ФагУШе, ЯаШзХЬ ЬЭЮУШХ ШЧ нвШе аРЧЫШзШЩ ЬЮУгв ШбзХЧЭгвм Т СгФгйШе ТХабШпе.

І зРбвЭЮбвШ, ЪЮУФР аРСЮвР ЭРФ ЪЭШУЮЩ СЫШЧШЫРбм Ъ ЧРТХаиХЭШо, °аЭЮЫмФ АЮССШЭб (Arnold Robbins), ЮвТХвбвТХЭЭлЩ ЧР GNU awk, аРСЮвРЫ б СЮЫХХ аРЭЭШЬ ТРаШРЭвЮЬ ЪЭШУШ Ш ШбЯаРТЫпЫ ЮиШСЪШ ТХабШШ 3.0.0, гЯЮЬШЭРТиШХбп Т вХЪбвХ. БЮЮвТХвбвТХЭЭЮ, Т ЯЮбЫХФгойШе ТХабШпе GNU awk зРбвм ЮиШСЮЪ СлЫР ШбЯаРТЫХЭР (ШЭдЮаЬРжШо Ю ЭХЪЮвЮале ШЧ ЭШе ЬЭХ гФРЫЮбм ТЪЫозШвм Т нвЮ ШЧФРЭШХ).

ВРСЫШжР 6.3. їЮТХаеЭЮбвЭЮХ баРТЭХЭШХ ЭХЪЮвЮале ТХабШЩ awk

ЅРШСЮЫХХ ЧРЬХвЭлХ ЮвЫШзШп ЬХЦФг аРЧЭлЬШ ТХабШпЬШ awk ЯХаХзШбЫХЭл Т вРСЫ. 6.3, УФХ ШбеЮФЭРп ТХабШп awk баРТЭШТРХвбп б ЭХЪЮвЮалЬШ ТХабШпЬШ, аРбЯаЮбваРЭХЭЭлЬШ Т ЭРиШ ФЭШ:

l oawk — ШбеЮФЭлЩ ТРаШРЭв awk, аРбЯаЮбваРЭпХЬлЩ AT&T Т ЯЮбвРТЪХ Unix ТХабШШ 7, ЯЮ бЮбвЮпЭШо ЭР 16 ЬРп 1979 УЮФР.

l nawk — new awk, аРбЯаЮбваРЭпХЬлЩ Т ЯЮбвРТЪХ SCO Unix Sys V 3.2v4.2.

l awk — One True Awk, ЯЮФФХаЦШТРХЬлЩ Ш аРбЯаЮбваРЭпХЬлЩ ±аРЩРЭЮЬ єХаЭШУРЭЮЬ. їаЮвХбвШаЮТРЭЭРп ТХабШп: 29 ШоЭп 1996 У.

l mawk — Mike’s awk (РТвЮа — јРЩЪЫ ±аХЭЭРЭ). їаЮвХбвШаЮТРЭЭРп ТХабШп: 1.3b.

¶ШаЭлЩ иаШдв ЮвЭЮбШвбп Ъ ЪЮЭЪаХвЭлЬ ЯаЮУаРЬЬРЬ ШЧ нвЮУЮ бЯШбЪР. ВРЪШЬ ЮСаРЧЮЬ, ЭРЧТРЭШХ awk ЮвЭЮбШвбп Ъ ЯаЮУаРЬЬХ ТЮЮСйХ, Р awk — Ъ «One True Awk» ±аРЩРЭР єХаЭШУРЭР.

ЅРЯЮЬЭо: ЭХ бЫХФгХв ЯЮЫРУРвм, звЮ Т вРСЫ. 6.3 ЯаШТХФХЭР Тбп ШЭдЮаЬРжШп, ЭХЮСеЮФШЬРп ФЫп ЭРЯШбРЭШп ЯХаХЭЮбШЬле бжХЭРаШХТ awk. БгйХбвТгХв ЬЭЮУЮ ФагУШе РбЯХЪвЮТ. ІЯаЮзХЬ, ЭХЪЮвЮалХ ШЧ ЭШе ШУаРов ТвЮаЮбвХЯХЭЭго аЮЫм — ЭРЯаШЬХа, вЮЫмЪЮ Т oawk, nawk Ш awk ЭХЮСеЮФШЬЮ нЪаРЭШаЮТРвм ЧЭРЪ аРТХЭбвТР, б ЪЮвЮаЮУЮ ЭРзШЭРХвбп аХУгЫпаЭЮХ ТлаРЦХЭШХ (бваРЭЭЮ, ЭХ ЯаРТФР ЫШ?) ЅХЪЮвЮалХ аРЧЫШзШп ЮвЭЮбпвбп Ъ бЯХжШдШЪХ ЪЮЭЪаХвЭЮЩ ЯаЮУаРЬЬл (ЭРЯаШЬХа, Т gawk ЪТРЭвШдШЪРвЮа {ЬШЭ,ЬРЪб} ЬЮЦХв ШбЯЮЫмЧЮТРвмбп ЫШим ЯаШ гЪРЧРЭШШ ЪЫозХЩ ЪЮЬРЭФЭЮЩ бваЮЪШ --posix ШЫШ --re-interval). ІЯаЮзХЬ, ЭХЪЮвЮалХ ТРЦЭлХ, ЭЮ ЯЮаЮЩ ЭХЮзХТШФЭлХ аРЧЫШзШп ТбваХзРовбп ТЮ ЬЭЮУШе аХРЫШЧРжШпе. І ЭХбЪЮЫмЪШе СЫШЦРЩиШе ЯЮФаРЧФХЫРе СгФгв ЮЯШбРЭл ЮбЭЮТЭлХ ШЧ нвШе аРЧЫШзШЩ.

ПТЫповбп ЫШ ТЮбмЬШ- Ш иХбвЭРФжРвХаШзЭлХ ЪЮФл ЫШвХаРЫРЬШ?

І ТХабШпе awk, ЯЮФФХаЦШТРойШе иХбвЭРФжРвХаШзЭлХ ЪЮФл бШЬТЮЫЮТ Т аХУгЫпаЭле ТлаРЦХЭШпе, СлЫЮ Сл ЫЮУШзЭЮ ЯаХФЯЮЫЮЦШвм, звЮ [ora\x2Ecom] СгФХв бЮТЯРФРвм вРЪ ЦХ, ЪРЪ Ш [ora\.com] (2E — ASCII-ЪЮФ вЮзЪШ). єРЪ гЯЮЬШЭРЫЮбм Т УЫРТХ 3 (б. <$R[P#,R3-18]>), ЯаШзШЭР ЧРЪЫозРХвбп Т вЮЬ, звЮ ХбЫШ Тл аХиШЫШбм ЭР еЫЮЯЮвл б ТТЮФЮЬ иХбвЭРФжРвХаШзЭЮУЮ ШЫШ ТЮбмЬХаШзЭЮУЮ ЪЮФР, вЮ ТапФ ЫШ ЧРеЮвШвХ ШЭвХаЯаХвШаЮТРвм аХЧгЫмвРв ЪРЪ ЬХвРбШЬТЮЫ. І бРЬЮЬ ФХЫХ, awk Ш mawk аРСЮвРов ШЬХЭЭЮ вРЪ, ЭЮ gawk Ш MKS Т бЮЮвТХвбвТШШ б ваХСЮТРЭШпЬШ бвРЭФРавР POSIX, ФХЩбвТШвХЫмЭЮ ШЭвХаЯаХвШагов [\x2E] ЪРЪ ЬХвРбШЬТЮЫ «вЮзЪР» (еЮвп Т gawk ЯаЮШЧЮЩФХв вЮ ЦХ бРЬЮХ, ХбЫШ Тл ЭХ гЪРЦХвХ ЪЫоз ЪЮЬРЭФЭЮЩ бваЮЪШ --traditional).

ѕУаРЭШзШТРХвбп ЫШ ЧРеТРв бШЬТЮЫЮТ Т ТЮбмЬШ- Ш иХбвЭРФжРвХаШзЭле ЪЮФРе?

јЮЦЭЮ ЯаХФЯЮЫЮЦШвм, звЮ иХбвЭРФжРвХаШзЭлЩ ЪЮФ Т [ora\x2Ecom] бЮбвЮШв ШЧ бШЬТЮЫЮТ \x2E, ЭЮ ЭХЪЮвЮалХ аХРЫШЧРжШШ «ЧРеТРвлТРов» ТбХ иХбвЭРФжРвХаШзЭлХ жШдал, бЫХФгойШХ ЯЮбЫХ \x. І нвЮЬ бЫгзРХ иХбвЭРФжРвХаШзЭлЬ ЪЮФЮЬ СгФХв бзШвРвмбп \x2Ec (бЬ. б. <$R[P#,R3-19]>). НвЮ ЯаЮШбеЮФШв Т аХРЫШЧРжШпе gawk Ш MKS, гЯЮЬШЭРТиШебп Т ЯаХФлФгйХЬ аРЧФХЫХ (еЮвп Т gawk иХбвЭРФжРвХаШзЭлХ ЪЮФл ШЧ ЮФЭЮЩ жШдал ЭХ ФЮЯгбЪРЫШбм ФЮ ЯЮпТЫХЭШп ТХабШШ 3.0.1).

Б ТЮбмЬХаШзЭлЬШ ЪЮФРЬШ ФХЫЮ ЮСбвЮШв ХйХ егЦХ. ІЮ ТбХе ТХабШпе аРЧаХиХЭл ТЮбмЬХаШзЭлХ ЪЮФл, бЮбвЮпйШХ ШЧ ЮФЭЮЩ, ФТге Ш ваХе жШда (ЪаЮЬХ MKS, УФХ ЪЮФл ШЧ ЮФЭЮЩ жШдал ЧРаХЧХаТШаЮТРЭл ФЫп ЮСаРвЭле бблЫЮЪ — Т ФЮЪгЬХЭвРжШШ ЮС нвЮЬ ЭХ бЪРЧРЭЮ), ЭЮ ЭР нвЮЬ беЮФбвТЮ Ш ЪЮЭзРХвбп. awk, MKS Ш mawk ЧРЪЮЭЮЬХаЭЮ ШУЭЮаШагов 8 ШЫШ 9 ЯЮбЫХ ЪЮФР, бЮбвЮпйХУЮ ШЧ ЮФЭЮЩ ШЫШ ФТге жШда. nawk бзШвРХв 8 Ш 9 ТЮбмЬХаШзЭлЬШ (!) жШдаРЬШ. gawk ЯаРТШЫмЭЮ ЮСаРСРвлТРХв 8 Ш 9, ЭЮ ТлФРХв дРвРЫмЭго ЮиШСЪг ФЫп \8 Ш \9 (ЮФЭР ШЧ ЮиШСЮЪ, ШбЯаРТЫХЭЭле Т ЯЮбЫХФЭХЩ ТХабШШ).

їгбвлХ аХУгЫпаЭлХ ТлаРЦХЭШп ШЫШ ЯЮФТлаРЦХЭШп Т awk

єЮЭХзЭЮ, ЪЮЭбвагЪжШп вШЯР [(this|that|)] ТЯЮЫЭХ ЫЮУШзЭР — ЯгбвЮХ ЯЮФТлаРЦХЭШХ ЮЧЭРзРХв, звЮ бЮТЯРФХЭШХ ФЮЫЦЭЮ ЭРеЮФШвмбп ТбХУФР (б. <$R[P#,R3-20]>). І ґє° ЮЭР Т вЮзЭЮбвШ нЪТШТРЫХЭвЭР [(this|that)?], ЭЮ ШЭЮУФР ФЫп гФЮСбвТР ШЫШ ЭРУЫпФЭЮбвШ ЯаХФЯЮзШвРов ШбЯЮЫмЧЮТРвм ЪЮЭбвагЪжШо б ЯгбвлЬ ЯЮФТлаРЦХЭШХЬ. є бЮЦРЫХЭШо, ЭХ ТбХ аХРЫШЧРжШШ ФЮЯгбЪРов вРЪго ЧРЯШбм: Т awk, mawk Ш nawk ЮЭР бзШвРХвбп дРвРЫмЭЮЩ ЮиШСЪЮЩ.

їгбвЮХ аХУгЫпаЭЮХ ТлаРЦХЭШХ — ФагУЮХ ФХЫЮ. І awk Ш nawk ЯгбвЮХ аХУгЫпаЭЮХ ТлаРЦХЭШХ вРЪЦХ бзШвРХвбп дРвРЫмЭЮЩ ЮиШСЪЮЩ, Р Т mawk, gawk Ш MKS ЮЭЮ бЮТЯРФРХв б ЫоСЮЩ ЭХЯгбвЮЩ бваЮЪЮЩ.

БЯХжШдШЪР бШЬТЮЫмЭле ЪЫРббЮТ

ІХаЮпвЭЮ, СЮЫмиХ ТбХУЮ ЯаЮСЫХЬ ТлЧлТРХв ТЮЧЬЮЦЭЮбвм (ТХаЭХХ, ЭХТЮЧЬЮЦЭЮбвм) нЪаРЭШаЮТРЭШп бШЬТЮЫЮТ Т бШЬТЮЫмЭле ЪЫРббРе, Р вРЪЦХ ШЭвХаЯаХвРжШп Т ЭШе «]» Ш «-». НЪаРЭШаЮТРЭШХ гЯЮЬШЭРХвбп Т вРСЫ. 6.3[1], ЭЮ ЯаХФбвРТмвХ бХСХ ЪЫРбб, ЭРзШЭРойШЩбп б бШЬТЮЫР ]. І awk, gawk Ш MKS ТбХ ЯаЮЩФХв ЭЮаЬРЫмЭЮ; Т mawk ЯаЮШЧЮЩФХв дРвРЫмЭРп ЮиШСЪР, Р Т nawk нвЮв ЪЫРбб СгФХв ЯЮЯаЮбвг ЯаЮШУЭЮаШаЮТРЭ (ЪРЪ нвЮ СлЫЮ Т oawk).

° звЮ ЯаЮШЧЮЩФХв, ХбЫШ ЯЮ ЮиШСЪХ гЪРЧРвм «ЯХаХТХаЭгвлЩ» ШЭвХаТРЫ [[z-a]]? јЮЦЭЮ ЯаШТХбвШ Ш СЮЫХХ аХРЫШбвШзЭлЩ ЯаШЬХа — [[\-abc]]; ЯаХФЯЮЫРУРЫЮбм, звЮ \- ЮЧЭРзРХв ЫШвХаРЫмЭлЩ ФХдШб, Р ЭХ ШЭвХаТРЫ Юв \ ФЮ a (вРЪЮЩ ШЭвХаТРЫ СХбЯЮЫХЧХЭ, ЯЮбЪЮЫмЪг ЮСаРвЭРп ЪЮбРп зХавР Т ЪЮФШаЮТЪХ ASCII бЫХФгХв ЯЮбЫХ a). І gawk Ш MKS нвЮ ЯаШТХФХв Ъ дРвРЫмЭЮЩ ЮиШСЪХ; awk РТвЮЬРвШзХбЪШ ШЭТХавШагХв ШЭвХаТРЫ; mawk ШЭвХаЯаХвШагХв Тбо ЪЮЭбвагЪжШо ЪРЪ ЭХ-ШЭвХаТРЫмЭго (вЮ Хбвм ФТР ЫШвХаРЫмЭле бШЬТЮЫР — ФХдШб Ш a). µбЫШ нвЮУЮ ЭХФЮбвРвЮзЭЮ, nawk ЦРЫЮТРвмбп ЭХ СгФХв, ЭЮ ТЪЫозШв Т ЪЫРбб вЮЫмЪЮ ЭРзРЫмЭлЩ бШЬТЮЫ (Т ФРЭЭЮЬ бЫгзРХ — ЮСаРвЭго ЪЮбго зХавг).

ВШЯл ФРЭЭле, ЮСаРСРвлТРХЬле Т awk

І ЭХЪЮвЮале аХРЫШЧРжШпе бгйХбвТгов ЮУаРЭШзХЭШп ФЫп вШЯЮТ ЮСаРСРвлТРХЬле ФРЭЭле. nawk Ш awk ЭХ ФЮЯгбЪРов ЭШзХУЮ, ЪаЮЬХ 7-аРЧапФЭле ФРЭЭле ASCII (ФагУШЬШ бЫЮТРЬШ, СРЩвл б гбвРЭЮТЫХЭЭлЬ бвРаиШЬ СШвЮЬ ЭШЪЮУФР ЭХ бЮТЯРФРов), Р ЮСаРСЮвЪР ЭгЫм-бШЬТЮЫЮТ ЯЮФФХаЦШТРХвбп вЮЫмЪЮ Т gawk (MKS бзШвРХв ЭгЫм-СРЩв дРвРЫмЭЮЩ ЮиШСЪЮЩ, Р ФагУШХ аХРЫШЧРжШШ ЯаЮбвЮ ШЭвХаЯаХвШагов ХУЮ ЪРЪ ЯаШЧЭРЪ ЪЮЭжР бваЮЪШ ШЫШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп, Т ЧРТШбШЬЮбвШ Юв бШвгРжШШ).

ДгЭЪжШШ Ш ЮЯХаРжШШ awk ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ

І бЮТаХЬХЭЭле ТХабШпе awk (ШЧ зШбЫР аРббЬРваШТРХЬле — ТЮ ТбХе, ЪаЮЬХ oawk) бгйХбвТгХв ЪРЪ ЬШЭШЬгЬ ваШ ТРаШРЭвР ШбЯЮЫмЧЮТРЭШп аХУгЫпаЭле ТлаРЦХЭШЩ: аРЧСШХЭШХ ТеЮФЭле ФРЭЭле, ЮЯХаРвЮал ~ Ш !~, Р вРЪЦХ дгЭЪжШШ match, sub, gsub Ш split (Т gawk СлЫР ФЮСРТЫХЭР дгЭЪжШп gensub). ІбХ нвШ баХФбвТР ФЮбвРвЮзЭЮ ЯаЮбвл, Ъ вЮЬг ЦХ ЮЭШ еЮаЮиЮ ЮЯШбРЭл Т ЫоСЮЩ ФЮЪгЬХЭвРжШШ awk, ЯЮнвЮЬг п ЭХ СгФг Ше ЯХаХбЪРЧлТРвм. І бЫХФгойШе аРЧФХЫРе аРббЬРваШТРовбп ЭХЪЮвЮалХ ЮСбвЮпвХЫмбвТР, ЧРбЫгЦШТРойШХ ЮбЮСЮУЮ ТЭШЬРЭШп.

ѕЯХаРЭФл awk: /…/ Ш "…"

І СЮЫмиШЭбвТХ аХРЫШЧРжШЩ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЬЮЦХв ЯХаХФРТРвмбп ЪРЪ Т бваЮЪЮТЮЬ дЮаЬРвХ ("…"), вРЪ Ш Т дЮаЬРвХ «блаЮУЮ» аХУгЫпаЭЮУЮ ТлаРЦХЭШп (/…/). ЅРЯаШЬХа, ЪЮЬРЭФл string ~ /regex/ Ш string ~ "regex" ФХЫРов ЯЮзвШ ЮФЭЮ Ш вЮ ЦХ. ѕФЭЮ ТРЦЭЮХ ЮвЫШзШХ ЧРЪЫозРХвбп Т вЮЬ, звЮ Т ЯХаТЮЬ бЫгзРХ вХЪбв бЭРзРЫР ШЭвХаЯаХвШагХвбп ЪРЪ бваЮЪР, ЧРЪЫозХЭЭРп Т ЪРТлзЪШ, Р ЧРвХЬ — ЪРЪ аХУгЫпаЭЮХ ТлаРЦХЭШХ. І зРбвЭЮбвШ, нвЮ ЮЧЭРзРХв, звЮ бваЮЪШ "\t" Ш "\\t" ЯаШТХФгв Ъ ЮФЭЮЬг аХУгЫпаЭЮЬг ТлаРЦХЭШо, бЮТЯРФРойХЬг б ЮФЭШЬ бШЬТЮЫЮЬ вРСгЫпжШШ. їаШ ЯХаХФРзХ "\t" Т аХЧгЫмвРвХ ЮСаРСЮвЪШ бваЮЪШ, ЧРЪЫозХЭЭЮЩ Т ЪРТлзЪШ, ЬХеРЭШЧЬг аХУгЫпаЭле ТлаРЦХЭШЩ ЯХаХФРХвбп бШЬТЮЫ вРСгЫпжШШ tab (ЪЮвЮалЩ ЭХ пТЫпХвбп ЬХвРбШЬТЮЫЮЬ Ш ЯаЮбвЮ бЮТЯРФРХв «бРЬ б бЮСЮЩ»). їаШ ЯХаХФРзХ "\\t" ЬХеРЭШЧЬг аХУгЫпаЭле ТлаРЦХЭШЩ ФЮбвРХвбп ЯЮбЫХФЮТРвХЫмЭЮбвм [\t], ЪЮвЮаРп ШЭвХаЯаХвШагХвбп ЪРЪ ЬХвРбШЬТЮЫ, бЮТЯРФРойШЩ б бШЬТЮЫЮЬ вРСгЫпжШШ. °ЭРЫЮУШзЭЮ, аХУгЫпаЭЮХ ТлаРЦХЭШХ /\\t/ Ш бваЮЪР "\\\\t" бЮТЯРФРов б ЫШвХаРЫмЭлЬ вХЪбвЮЬ \t.

ѕФЭР ШЧ ЯаЮТХаХЭЭле ЬЭЮЩ аХРЫШЧРжШЩ, MKS, ШЭвХаЯаХвШагХв нвШ ФТХ ТХабШШ (/…/ Ш "…") РСбЮЫовЭЮ ЮФШЭРЪЮТЮ. ґРЦХ ЭХбЬЮвап ЭР вЮ, звЮ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЧРФРХвбп Т бваЮЪЮТЮЬ ТШФХ, ЮЭЮ, ЯЮеЮЦХ, ЮСеЮФШв ЬХеРЭШЧЬ ШЭвХаЯаХвРжШШ бваЮЪ Ш ЯХаХФРХвбп ЭХЯЮбаХФбвТХЭЭЮ ЬХеРЭШЧЬг аХУгЫпаЭле ТлаРЦХЭШЩ.

АХУгЫпаЭлХ ТлаРЦХЭШп awk, ЪЮвЮалХ ЬЮУгв бЮТЯРФРвм б «ЭШзХЬ»

їаРЪвШзХбЪШ ТбХ ЯаЮТХаХЭЭлХ ЬЭЮЩ аХРЫШЧРжШШ бЮУЫРиРовбп б вХЬ, звЮ ФЫп аРЧСШХЭШп бваЮЪШ дгЭЪжШХЩ split аХУгЫпаЭЮХ ТлаРЦХЭШХ ФЮЫЦЭЮ бЮТЯРбвм б ЪРЪШЬ-вЮ вХЪбвЮЬ жХЫХТЮЩ бваЮЪШ (ХФШЭбвТХЭЭЮХ ШбЪЫозХЭШХ, ЯаШ ЪЮвЮаЮЬ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЮвбгвбвТгХв, СгФХв аРббЬЮваХЭЮ ЭШЦХ). І зРбвЭЮбвШ, нвЮ ЮЧЭРзРХв, звЮ ЯаШ ШбЯЮЫмЧЮТРЭШШ б дгЭЪжШХЩ split ТлаРЦХЭШХ [,*] нЪТШТРЫХЭвЭЮ [,+].

ѕФЭРЪЮ Ъ дгЭЪжШпЬ sub Ш gsub нвЮ ЭХ ЮвЭЮбШвбп. І СЮЫмиШЭбвТХ ТХабШЩ ЯаШ ТлЯЮЫЭХЭШШ бЫХФгойХУЮ даРУЬХЭвР:

ЯХаХЬХЭЭЮЩ string ЯаШбТРШТРХвбп бваЮЪР «_a_w_k_». Б ФагУЮЩ бвЮаЮЭл, Т gawk ЯХаХЬХЭЭЮЩ СгФХв ЯаШбТЮХЭР бваЮЪР «_a_w_k». ·РЬХвШЫШ ЯаЮЯРТиШЩ бШЬТЮЫ ЯЮФзХаЪШТРЭШп Т ЪЮЭжХ бваЮЪШ? ґЮ ТлеЮФР gawk ТХабШШ 3.0.1 ЯЮФЮСЭлХ аХУгЫпаЭлХ ТлаРЦХЭШп gsub ЭХ бЮТЯРФРЫШ Т ЪЮЭжХ бваЮЪШ ЯаШ ЮвбгвбвТШШ ЬХвРбШЬТЮЫР [$].

ґагУРп ЯаЮСЫХЬР ТЮЧЭШЪРХв Т бЫХФгойХЬ даРУЬХЭвХ:

±ЮЫмиШЭбвТЮ аХРЫШЧРжШЩ ТЮЧТаРйРХв «s_e_d_a_n_d_a_w_k_», ЭЮ gawk (ФЮ ТХабШШ 3.0.1) Ш MKS ТЮЧТаРйРов «s_e_d__a_n_d__a_w_k_». І нвШе аХРЫШЧРжШпе ФРЦХ ЯЮбЫХ ЧРЬХЭл бШЬТЮЫР ЯЮФзХаЪШТРЭШп ЬХеРЭШЧЬ бЭЮТР ЯаШЬХЭпХв аХУгЫпаЭЮХ ТлаРЦХЭШХ Т вЮЩ ЦХ ЯЮЧШжШШ, Т аХЧгЫмвРвХ зХУЮ ТлаРЦХЭШХ [_*], ЪЮвЮаЮХ ЬЮЦХв бЮТЯРбвм б «ЭШзХЬ», бЮТЯРФРХв ЯХаХФ ЪРЦФлЬ a (ЮСлзЭЮ бЮТЯРФХЭШХ б «ЭШзХЬ» ЭХ ФЮЯгбЪРХвбп Т ЬХбвХ ЧРТХаиХЭШп ЯаХФлФгйХУЮ бЮТЯРФХЭШп).

їаЮЯгбЪШ ЯаШ ШбЯЮЫмЧЮТРЭШШ дгЭЪжШШ awk split()

µбЫШ Т ваХвмХЬ РаУгЬХЭвХ дгЭЪжШШ split() ЯХаХФРХвбп бваЮЪР "spc", дгЭЪжШп ЯХаХеЮФШв Т аХЦШЬ «аРЧСШХЭШп ЯЮ ЯаЮЯгбЪРЬ». І СЮЫмиШЭбвТХ аХРЫШЧРжШЩ ЯаЮЯгбЪ (whitespace) ЮЧЭРзРХв ЯаЮШЧТЮЫмЭго ЪЮЬСШЭРжШо ЯаЮСХЫЮТ, вРСгЫпжШЩ Ш бШЬТЮЫЮТ ЭЮТЮЩ бваЮЪШ. ВХЬ ЭХ ЬХЭХХ, gawk аРЧФХЫпХв бваЮЪШ вЮЫмЪЮ ЯЮ ЯаЮСХЫРЬ Ш вРСгЫпжШпЬ (Т ТХабШШ 3.0.2 gawk ТЪЫозРХв Т аРЧСШХЭШХ Ш бШЬТЮЫл ЭЮТЮЩ бваЮЪШ, ХбЫШ вЮЫмЪЮ ЯаШ ЧРЯгбЪХ ЭХ СлЫ гЪРЧРЭ ЪЫоз ЪЮЬРЭФЭЮЩ бваЮЪШ --posix).

° ЪРЪ ЭРбзХв ЯХаХФРзШ /spc/ Т ЮЯХаРЭФХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп — ЯаШТХФХв ЫШ нвЮ Ъ бЯХжШРЫмЭЮЩ ЮСаРСЮвЪХ ЯаЮЯгбЪЮТ? НвЮ ЯаЮШбеЮФШЫЮ Т gawk (аРЭмиХ ТХабШШ 3.0.2), ЭХ ЯаЮШбеЮФШЫЮ Т awk Ш mawk (Ш Т gawk, ЭРзШЭРп б ТХабШШ 3.0.2), Ш ТлЧлТРЫЮ дРвРЫмЭго ЮиШСЪг Т nawk.

їгбвлХ ЮЯХаРЭФл аХУгЫпаЭле ТлаРЦХЭШЩ Т awk

ЗвЮ ЮЧЭРзРХв ЯХаХФРзР ЯгбвЮУЮ ЮЯХаРЭФР аХУгЫпаЭЮУЮ ТлаРЦХЭШп (ЭРЯаШЬХа, sub("",…) ШЫШ sub(//,…))? І awk ЯгбвЮХ аХУгЫпаЭЮХ ТлаРЦХЭШХ // РСбЮЫовЭЮ ЭХФЮЯгбвШЬЮ, ЭЮ ШЭЮУФР аРЧаХиРХвбп ЯгбвРп бваЮЪР "". І gsub ЯгбвЮХ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЬЮЦХв бЮТЯРбвм б зХЬ гУЮФЭЮ (ЭХ бзШвРп awk, УФХ ЯгбвЮХ аХУгЫпаЭЮХ ТлаРЦХЭШХ Т gsub ТлЧлТРХв дРвРЫмЭго ЮиШСЪг). Б ФагУЮЩ бвЮаЮЭл, б дгЭЪжШХЩ split ЭРСЫоФРХвбп СЮЫмиХХ аРЧЭЮЮСаРЧШХ: Т nawk Ш MKS аРЧСШХЭШХ ТЮЮСйХ ЭХ ЯаЮШбеЮФШв, Р ФагУШХ аХРЫШЧРжШШ аРЧСШТРов бваЮЪг ЭР ЪРЦФЮЬ бШЬТЮЫХ.

Tcl

Tcl[2] ШбЯЮЫмЧгХв ЯРЪХв аХУгЫпаЭле ТлаРЦХЭШЩ Ѕє° (РТвЮа — іХЭаШ БЯХЭбХа) б ТлеЮФР ХУЮ ЯХаТЮЩ ТХабШШ Ш ЮСХбЯХзШТРХв ЯаЮбвЮЩ, ЯЮбЫХФЮТРвХЫмЭлЩ ШЭвХадХЩб ФЫп аРСЮвл б дгЭЪжШпЬШ нвЮУЮ ЯРЪХвР. ґШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ ЯапЬЮЫШЭХХЭ Ш ЭХ ЯХаХУагЦХЭ ШЧЫШиХбвТРЬШ, Р ФТХ дгЭЪжШШ ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ ФЮбвРвЮзЭЮ ЯЮЫХЧЭл Ш ЭХ ЯаХЯЮФЭЮбпв ЮбЮСле боаЯаШЧЮТ. јХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ Tcl — ЪЫРббШзХбЪШЩ ЯаШЬХа ваРФШжШЮЭЭЮУЮ ЬХеРЭШЧЬР Ѕє°, ЮЯШбРЭЭЮУЮ Т УЫРТХ 4.

їХаХФРзР аХУгЫпаЭле ТлаРЦХЭШЩ Т ЮЯХаРЭФРе Tcl

їЮЧТЮЫмвХ ЭРзРвм ЯапЬЮ б гвТХаЦФХЭШп, ЪЮвЮаЮХ ТлЧЮТХв ЭХЬРЫЮХ гФШТЫХЭШХ г вХе, ЪвЮ ЭХ зШвРЫ УЫРТг 3: Т аХУгЫпаЭле ТлаРЦХЭШпе Tcl ЭХ ЯЮФФХаЦШТРХвбп [\n] Ш ФагУШХ ЬХвРбШЬТЮЫл ШЧ нвЮУЮ бХЬХЩбвТР. І зХЬ ЦХ ФХЫЮ?

БЫЮТР Tcl ЪРЪ аХУгЫпаЭлХ ТлаРЦХЭШп

ѕЯХаРЭФл, Т ЪЮвЮале ЯХаХФРовбп аХУгЫпаЭлХ ТлаРЦХЭШп, ЯаХФбвРТЫпов бЮСЮЩ ЮСлзЭлХ бваЮЪШ (Т вХаЬШЭЮЫЮУШШ Tcl — бЫЮТР), ШЭвХаЯаХвШагХЬлХ ЪРЪ аХУгЫпаЭлХ ТлаРЦХЭШп ЯаШ ЯХаХФРзХ Ше дгЭЪжШпЬ regexp ШЫШ regsub. І нвЮЬ ЮвЭЮиХЭШШ Tcl ЭРЯЮЬШЭРХв GNU Emacs Ш Python. ѕСйШХ бТХФХЭШп ЭР нвг вХЬг ЯаШТХФХЭл Т аРЧФХЫХ «БваЮЪШ ЪРЪ аХУгЫпаЭлХ ТлаРЦХЭШп» УЫРТл 3 (б. <$R[P#,R3-21]>). ѕФЭЮ ТРЦЭЮХ бЫХФбвТШХ ЧРЪЫозРХвбп Т вЮЬ, звЮ ХбЫШ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЭХ ЯХаХФРХвбп ЪРЪ бваЮЪР, Р, бЪРЦХЬ, зШвРХвбп ШЧ ЪЮЭдШУгаРжШЮЭЭЮУЮ дРЩЫР ШЫШ ТЪЫозРХвбп Т бваЮЪг ЧРЯаЮбР CGI, ЮЭЮ ЭХ ЯЮФТХаУРХвбп ЮСлзЭЮЩ бваЮЪЮТЮЩ ЮСаРСЮвЪХ, Ш Тл ЬЮЦХвХ ШбЯЮЫмЧЮТРвм вЮЫмЪЮ вХ ТЮЧЬЮЦЭЮбвШ, ЪЮвЮалХ ЯХаХзШбЫХЭл Т вРСЫ. 6.4.

ВРСЫШжР 6.4. ґШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ Т Tcl

јХеРЭШЧЬ ЫХЪбШзХбЪЮУЮ РЭРЫШЧР бжХЭРаШп Т Tcl пТЫпХвбп ЮФЭШЬ ШЧ ТРЦЭХЩиШе бТЮЩбвТ пЧлЪР, ЪЮвЮаЮХ ЪРЦФлЩ ЯЮЫмЧЮТРвХЫм ФЮЫЦХЭ гбТЮШвм ФЮ ЬХЫмзРЩиШе ЯЮФаЮСЭЮбвХЩ. І агЪЮТЮФбвТХ Tcl ЯаШТХФХЭР ФЮбвРвЮзЭЮ ЯЮФаЮСЭРп ШЭдЮаЬРжШп, Ш п ЭХ СгФг ЯЮТвЮапвм ХХ ЧФХбм. ѕбЮСлЩ ШЭвХаХб ФЫп ЭРб ЯаХФбвРТЫпХв ЧРЬХЭР ЮСаРвЭле ЪЮбле зХав Т бваЮЪРе, ЭХ ЧРЪЫозХЭЭле Т {…}. їаШ ЧРЬХЭХ ЮСаРвЭле ЪЮбле зХав аРбЯЮЧЭРовбп ЬЭЮУШХ бвРЭФРавЭлХ гбЫЮТЭлХ ЮСЮЧЭРзХЭШп (вРСЫ. 3.3, б. <$R[P#,R3-22]>)[3], Р ТбХ нЪаРЭШаЮТРЭЭлХ бШЬТЮЫл ЭЮТЮЩ бваЮЪШ (б ЯЮбЫХФгойШЬШ ЯаЮСХЫРЬШ Ш вРСгЫпжШпЬШ) ЧРЬХЭповбп ЮФЭШЬ ЯаЮСХЫЮЬ. НвЮ ЯаЮШбеЮФШв ЭР аРЭЭХЩ бвРФШШ ЮСаРСЮвЪШ бжХЭРаШп. ѕбвРЫмЭлХ бШЬТЮЫл \ ТЮбЯаШЭШЬРовбп ЫШСЮ ЪРЪ нЪаРЭШаЮТРЭЭлХ ЮУаРЭШзШвХЫШ (Т ЧРТШбШЬЮбвШ Юв вШЯР бваЮЪШ), ЫШСЮ ЪРЪ ЭХЮЯЮЧЭРЭЭлХ нЪаРЭШаЮТРЭЭлХ бШЬТЮЫл. І ЯЮбЫХФЭХЬ бЫгзРХ ЮСаРвЭРп ЪЮбРп зХавР ЯЮЯаЮбвг гФРЫпХвбп.

Б ТЮбмЬШ- Ш иХбвЭРФжРвХаШзЭлЬШ ЪЮФРЬШ ФХЫЮ вЮЦХ ЮСбвЮШв ЭХЯаЮбвЮ. ЅРЯаШЬХа, Т Tcl 8 Ш 9 бзШвРовбп ТЮбмЬХаШзЭлЬШ жШдаРЬШ (б. <$R[P#,R3-23]>). ИХбвЭРФжРвХаШзЭлХ ЪЮФл Tcl ЬЮУгв бЮФХаЦРвм ЯаЮШЧТЮЫмЭЮХ ЪЮЫШзХбвТЮ жШда. єаЮЬХ вЮУЮ (ТЮЧЬЮЦЭЮ, ЭХЯаХФЭРЬХаХЭЭЮ) ЯЮФФХаЦШТРХвбп ЮбЮСРп ЯЮбЫХФЮТРвХЫмЭЮбвм \x0xdddd. ІЯаЮзХЬ, ЮбЮСХЭЭЮ гФШТЫпвмбп нвЮЬг ЭХ ЯаШеЮФШвбп, ЯЮбЪЮЫмЪг \x0 (ЮСЮЧЭРзХЭШХ ЭгЫм-бШЬТЮЫР) ТапФ ЫШ СгФХв ШбЯЮЫмЧЮТРвмбп Т бжХЭРаШпе — Tcl ЭХФЮЫоСЫШТРХв ЭгЫм-бШЬТЮЫл Т бваЮЪРе.

ёбЯЮЫмЧЮТРЭШХ аХУгЫпаЭле ТлаРЦХЭШЩ Т Tcl

І Tcl бгйХбвТгов ФТХ дгЭЪжШШ ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ. ДгЭЪжШп regexp ЯаХФЭРЧЭРзХЭР ФЫп ЯЮШбЪР, Р дгЭЪжШп regsub —ФЫп ЯЮШбЪР б ЧРЬХЭЮЩ Т ЪЮЯШШ бваЮЪШ. ІапФ ЫШ п бЬЮУг бЪРЧРвм ЮС нвШе дгЭЪжШпе звЮ-вЮ вРЪЮХ, зХУЮ ЭХв Т агЪЮТЮФбвТХ, ЯЮнвЮЬг п СгФг ЪаРвЮЪ.

ДгЭЪжШп Tcl regexp

ѕСЮСйХЭЭлЩ ТлЧЮТ дгЭЪжШШ regexp ТлУЫпФШв бЫХФгойШЬ ЮСаРЧЮЬ:

regexp [ЪЫозШ] аХУгЫпаЭЮХ_ТлаРЦХЭШХ бваЮЪР [ШЬп_ЯаШХЬЭШЪР…]

µбЫШ ЧРФРЭЭЮХ аХУгЫпаЭЮХ ТлаРЦХЭШХ бЮТЯРФРХв Т ЧРФРЭЭЮЩ бваЮЪХ, дгЭЪжШп ТЮЧТаРйРХв 1; Т ЯаЮвШТЭЮЬ бЫгзРХ ТЮЧТаРйРХвбп 0. µбЫШ ЧРФРЭЮ ШЬп_ЯаШХЬЭШЪР, ЪЮЯШп дРЪвШзХбЪШ бЮТЯРТиХУЮ вХЪбвР ЯаШбТРШТРХвбп ЯХаХЬХЭЭЮЩ б гЪРЧРЭЭлЬ ШЬХЭХЬ. µбЫШ гЪРЧРЭл Ш ФагУШХ ШЬХЭР ЯХаХЬХЭЭле, ШЬ ЯаШбТРШТРХвбп вХЪбв, бЮТЯРТиШЩ б бЮЮвТХвбвТгойШЬ ЯЮФТлаРЦХЭШХЬ Т ЪагУЫле бЪЮСЪРе (ШЫШ ЯгбвРп бваЮЪР, ХбЫШ бЮЮвТХвбвТгойРп ЯРаР бЪЮСЮЪ ЭХ бгйХбвТгХв ШЫШ ЭХ пТЫпХвбп зРбвмо бЮТЯРФХЭШп). µбЫШ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЭХ бЮТЯРФРХв, ЯХаХЬХЭЭлХ б гЪРЧРЭЭлЬШ ШЬХЭРЬШ ЮбвРовбп СХЧ ШЧЬХЭХЭШЩ.

єЫоз -nocase ЮЧЭРзРХв, звЮ ЯЮШбЪ бЮТЯРФХЭШп ФЮЫЦХЭ ЮбгйХбвТЫпвмбп СХЧ гзХвР аХУШбваР. АХУгЫпаЭЮХ ТлаРЦХЭШХ [^(this|that|other)="([^"]*)"] баРТЭШТРХвбп б вХЪбвЮЬ, еаРЭпйШЬбп Т ЯХаХЬХЭЭЮЩ $string. ІЬХбвЮ ЯРал дШУгаЭле бЪЮСЮЪ ЯЮбЫХ жХЫХТЮУЮ вХЪбвР ЮСлзЭЮ ЭРеЮФШвбп ШЬп ЯХаХЬХЭЭЮЩ, ЪЮвЮаЮЩ ФЮЫЦХЭ Слвм ЯаШбТЮХЭ ТХбм бЮТЯРТиШЩ вХЪбв. І ФРЭЭЮЬ ЯаШЬХаХ бЮеаРЭпвм ЮСйХХ бЮТЯРФХЭШХ ЭХ ваХСгХвбп, ЯЮнвЮЬг п ШбЯЮЫмЧго {}. ґТгЬ бЫХФгойШЬ ЯХаХЬХЭЭлЬ ЯаШбТРШТРХвбп вХЪбв, бЮТЯРТиШЩ б ФТгЬп ЯЮФТлаРЦХЭШпЬШ Т бЪЮСЪРе — $1 Ш $2 Т вХаЬШЭЮЫЮУШШ Perl, ТбваХзРТиХЩбп Т нвЮЩ ЪЭШУХ. µбЫШ ЯХаХЬХЭЭРп $string бЮФХаЦШв вХЪбв «That="123"spc#spcsample», ЯХаХЬХЭЭЮЩ $key СгФХв ЯаШбТЮХЭР бваЮЪР That, Р ЯХаХЬХЭЭЮЩ value — бваЮЪР 123 (ХбЫШ Сл ТЬХбвЮ {} СлЫЮ гЪРЧРЭЮ ШЬп ЯХаХЬХЭЭЮЩ, вЮ нвЮЩ ЯХаХЬХЭЭЮЩ СлЫ Сл ЯаШбТЮХЭ вХЪбв ТбХУЮ бЮТЯРФХЭШп That="123").

ДгЭЪжШп Tcl regsub

ѕСЮСйХЭЭлЩ ТлЧЮТ дгЭЪжШШ regsub ТлУЫпФШв бЫХФгойШЬ ЮСаРЧЮЬ:

regsub [ЪЫозШ] аХУгЫпаЭЮХ_ТлаРЦХЭШХ бваЮЪР ЧРЬХЭР ЯаШХЬЭШЪ

їХаХЬХЭЭЮЩ ЯаШХЬЭШЪ ЯаШбТРШТРХвбп ЪЮЯШп ЧРФРЭЭЮЩ бваЮЪШ, Т ЪЮвЮаЮЩ ТЬХбвЮ ЯХаТЮУЮ бЮТЯРФХЭШп (ШЫШ ТЬХбвЮ ТбХе бЮТЯРФХЭШЩ, ХбЫШ гЪРЧРЭ ЪЫоз -all) аХУгЫпаЭЮУЮ ТлаРЦХЭШп ЯЮФбвРТЫпХвбп ЧРЬХЭР. ДгЭЪжШп ТЮЧТаРйРХв ЪЮЫШзХбвТЮ ЯЮФбвРЭЮТЮЪ. µбЫШ ЭШ ЮФЭР ЯЮФбвРЭЮТЪР ЭХ СлЫР ТлЯЮЫЭХЭР, ЯХаХЬХЭЭРп ЯаШХЬЭШЪ ЮбвРХвбп СХЧ ШЧЬХЭХЭШЩ.

І бваЮЪХ ЧРЬХЭР ЮСЮЧЭРзХЭШп<$M[R6-2]> & Ш \0 ЮвЭЮбпвбп ЪЮ ТбХЬг бЮТЯРТиХЬг вХЪбвг, Р \1–\9 — Ъ вХЪбвг, бЮТЯРТиХЬг б бЮЮвТХвбвТгойШЬ ЯЮФТлаРЦХЭШХЬ Т ЪагУЫле бЪЮСЪРе. ѕФЭРЪЮ бЫХФгХв ЯЮЬЭШвм Ю вЮЬ, звЮ дгЭЪжШп regsub ФЮЫЦЭР «гТШФХвм» нвШ нЪаРЭШаЮТРЭЭлХ ЯЮбЫХФЮТРвХЫмЭЮбвШ, ЯЮнвЮЬг ФЫп Ше ЯаЮеЮЦФХЭШп зХаХЧ УЫРТЭлЩ ШЭвХаЯаХвРвЮа Tcl ЮСлзЭЮ ЭХЮСеЮФШЬл ФЮЯЮЫЭШвХЫмЭлХ бШЬТЮЫл \ ШЫШ {…}.

µбЫШ Тл еЮвШвХ ЮУаРЭШзШвмбп ЯаЮбвлЬ ЯЮФбзХвЮЬ бЮТЯРФХЭШЩ, ЯаЮбвЮ гЪРЦШвХ {} ТЬХбвЮ ЯРаРЬХваЮТ ЧРЬХЭР Ш ЯаШХЬЭШЪ. їаШ ШбЯЮЫмЧЮТРЭШШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп, бЮТЯРФРойХУЮ б ЫоСлЬ вХЪбвЮЬ (ЭРЯаШЬХа, ЯгбвЮУЮ аХУгЫпаЭЮУЮ ТлаРЦХЭШп {}) ЧРЬХЭР ЮбгйХбвТЫпХвбп ЯХаХФ ЪРЦФлЬ бШЬТЮЫЮЬ. ЅРЯаШЬХа, Т ФТге бЫХФгойШе ЯаШЬХаРе бваЮЪР ЯЮФзХаЪШТРХвбп б ШбЯЮЫмЧЮТРЭШХЬ ЪЮЬСШЭРжШШ «бШЬТЮЫ ЯЮФзХаЪШТРЭШп-ЧРСЮЩ»:

єЫозШ дгЭЪжШЩ regexp Ш regsub

ґЮ ЭРбвЮпйХУЮ ЬЮЬХЭвР гЯЮЬШЭРЫШбм ФТР ЪЫозР ЪЮЬРЭФЭЮЩ бваЮЪШ, -nocase Ш -all, ЭЮ бгйХбвТгов Ш ФагУШХ. ДгЭЪжШп regexp ЯЮФФХаЦШТРХв ЪЫозШ -indices, -- Ш -nocase, Р дгЭЪжШп regsub — ЪЫозШ -all, -- Ш -nocase.

єЫоз -indices ЮЧЭРзРХв, звЮ ТЬХбвЮ ЪЮЯШШ бЮТЯРТиХУЮ вХЪбвР Т ЯХаХЬХЭЭЮЩ(-ле) б ЧРФРЭЭлЬШ ШЬХЭРЬШ бЮеаРЭпХвбп бваЮЪР, бЮбвЮпйРп ШЧ ФТге зШбХЫ: ЭРзРЫмЭлЩ Ш ЪЮЭХзЭлЩ ШЭФХЪб бЮТЯРТиХЩ зРбвШ Т бваЮЪХ (ШЭФХЪбРжШп ЭРзШЭРХвбп б ЭгЫп). їаШ ЮвбгвбвТШШ бЮТЯРФХЭШп бЮеаРЭпХвбп бваЮЪР -1 -1. І ЯаШЬХаХ this|that|other ЯХаХЬХЭЭЮЩ $key СгФХв ЯаШбТЮХЭР бваЮЪР «0 3», Р ЯХаХЬХЭЭЮЩ $value — бваЮЪР «6 8».

ЅХбЬЮвап ЭР вЮ, звЮ Т ФЮЪгЬХЭвРжШШ гвТХаЦФРХвбп ЮСаРвЭЮХ, ЪЫоз -nocase аРСЮвРХв ШЬХЭЭЮ вРЪ, ЪРЪ ЬЮЦЭЮ ЮЦШФРвм, СХЧ ТбпЪШе боаЯаШЧЮТ. µбЫШ ТХаШвм ФЮЪгЬХЭвРжШШ, [US] ЭХ бЮТЯРФХв б [us], ФРЦХ ЯаШ ШбЯЮЫмЧЮТРЭШШ ЪЫозР -nocase.

ѕСлзЭЮ ТбХ РаУгЬХЭвл, ЭРзШЭРойШХбп б ФХдШбР, ШЭвХаЯаХвШаговбп ЪРЪ ЪЫозШ (ЭХЮЯЮЧЭРЭЭлЩ ЪЫоз бзШвРХвбп ЮиШСЪЮЩ). їЮФ нвЮ ЯаРТШЫЮ ЯЮЯРФРов Ш бШвгРжШШ, ЪЮУФР аХУгЫпаЭЮХ ТлаРЦХЭШХ СХаХвбп ШЧ ЯХаХЬХЭЭЮЩ, бЮФХаЦШЬЮХ ЪЮвЮаЮЩ ЭРзШЭРХвбп б ФХдШбР. їЮЬЭШвХ: дгЭЪжШп Tcl ТШФШв бТЮШ РаУгЬХЭвл вЮЫмЪЮ ЯЮбЫХ ТлЯЮЫЭХЭШп ШЭвХаЯЮЫпжШШ Ш ЯаЮзШе ТбЯЮЬЮУРвХЫмЭле ЮЯХаРжШЩ. БЯХжШРЫмЭлЩ ЪЫоз -- ЮЧЭРзРХв, звЮ ЯХаХзШбЫХЭШХ ЪЫозХЩ ЧРЪЮЭзХЭЮ, Ш бЫХФгойШЩ РаУгЬХЭв пТЫпХвбп аХУгЫпаЭлЬ ТлаРЦХЭШХЬ.

ѕЯвШЬШЧРжШп аХУгЫпаЭле ТлаРЦХЭШЩ Tcl

Tcl ТЧТРЫШТРХв СаХЬп нддХЪвШТЭЮУЮ ЯЮШбЪР ЭР ЯЫХзШ ЯаЮУаРЬЬШбвР, ЯаРЪвШзХбЪШ ЭХ ЯлвРпбм ЮЯвШЬШЧШаЮТРвм ШбЯЮЫмЧЮТРЭШХ аХУгЫпаЭле ТлаРЦХЭШЩ. єРЦФЮХ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЧРЭЮТЮ ЪЮЬЯШЫШагХвбп ЯаШ ЮзХаХФЭЮЬ ШбЯЮЫмЧЮТРЭШШ, еЮвп ЯаШ нвЮЬ Т ЪниХ бЮеаРЭповбп ЮвЪЮЬЯШЫШаЮТРЭЭлХ ТХабШШ ЯпвШ ЯЮбЫХФЭШе ШбЯЮЫмЧЮТРЭЭле аХУгЫпаЭле ТлаРЦХЭШЩ (б. <$R[P#,R5-16]>).

јХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ аРСЮвРХв Т вЮзЭЮбвШ вРЪ, ЪРЪ ХУЮ аХРЫШЧЮТРЫ іХЭаШ БЯХЭбХа Т 1986 УЮФг. ёЧ ЮЯвШЬШЧРжШЩ, гЯЮЬШЭРХЬле Т УЫРТХ 5 (б. <$R[P#,R5-17]>), Tcl ЯлвРХвбп ТлЯЮЫЭпвм ШбЪЫозХЭШХ ЯЮ ЯХаТЮЬг бШЬТЮЫг, ЯаЮТХаЪг дШЪбШаЮТРЭЭле бваЮЪ (ЭЮ вЮЫмЪЮ ХбЫШ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЭРзШЭРХвбп б нЫХЬХЭвР, Ъ ЪЮвЮаЮЬг ЯаШЬХЭпХвбп ЪТРЭвШдШЪРвЮа * ШЫШ ?), ЯаЮбвЮХ ЯЮТвЮаХЭШХ, Р вРЪЦХ ЯЮЬЭШв Ю вЮЬ, звЮ ^ Т ЭРзРЫХ ТлаРЦХЭШп ЬЮЦХв бЮТЯРФРвм вЮЫмЪЮ Т ЭРзРЫХ бваЮЪШ. µФШЭбвТХЭЭРп ТРЦЭРп ЮЯвШЬШЧРжШп, ЪЮвЮаРп Т Tcl ЭХ ТлЯЮЫЭпХвбп — нвЮ ЪЮбТХЭЭЮХ ФЮСРТЫХЭШХ пЪЮаЭЮУЮ ЬХвРбШЬТЮЫР Т вЮЬ бЫгзРХ, ХбЫШ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЭРзШЭРХвбп б [.*].

GNU Emacs

АХУгЫпаЭлХ ТлаРЦХЭШп ЯаХФЭРЧЭРзХЭл ФЫп ЮСаРСЮвЪШ вХЪбвР, ЯЮнвЮЬг ЮЭШ ТЯЮЫЭХ ХбвХбвТХЭЭЮ ШУаРов ТХФгйго аЮЫм Т ЮФЭЮЩ ШЧ бРЬле ЬЮйЭле баХФ ЮСаРСЮвЪШ вХЪбвР, бгйХбвТгойШе Т ЭРиШ ФЭШ — GNU Emacs[4] (Т ФРЫмЭХЩиХЬ ЯаЮбвЮ Emacs). Emacs — ЭХ ЯаЮбвЮ аХФРЪвЮа б ЯаШбЮХФШЭХЭЭлЬ бжХЭРаЭлЬ пЧлЪЮЬ. Emacs — нвЮ ЯЮЫЭЮжХЭЭРп баХФР ЯаЮУаРЬЬШаЮТРЭШп elisp б ЯаШбЮХФШЭХЭЭЮЩ бШбвХЬЮЩ ТлТЮФР ЭР нЪаРЭ. їЮЫмЧЮТРвХЫм аХФРЪвЮаР ЬЮЦХв ЭХЯЮбаХФбвТХЭЭЮ ТлЯЮЫЭпвм ЬЭЮУШХ дгЭЪжШШ elisp, ЯЮнвЮЬг нвШ дгЭЪжШШ вЮЦХ ЬЮЦЭЮ бзШвРвм ЪЮЬРЭФРЬШ.

Emacs elisp (Т аРЧУЮТЮаЭЮЬ пЧлЪХ — ЯаЮбвЮ Lisp) бЮФХаЦШв ЯЮзвШ влбпзг ТбваЮХЭЭле ЯаШЬШвШТЭле дгЭЪжШЩ (вЮ Хбвм ЭРЯШбРЭЭле ЭР C Ш ЮвЪЮЬЯШЫШаЮТРЭЭле ТЬХбвХ б ЮбЭЮТЭЮЩ бШбвХЬЮЩ Emacs). БвРЭФРавЭлХ СШСЫШЮвХЪШ Lisp бЮФХаЦШв ХйХ ЮЪЮЫЮ 1200 дгЭЪжШЩ, аХРЫШЧгойШе ТбХ, звЮ гУЮФЭЮ, Юв ЯаЮбвле ЪЮЬРЭФ аХФРЪвШаЮТРЭШп (вШЯР «ЯХаХЬХбвШвм ЪгабЮа ТЫХТЮ») ФЮ жХЫле ЯРЪХвЮТ — ЯаЮУаРЬЬ звХЭШп нЫХЪваЮЭЭле ЭЮТЮбвХЩ, ЯЮзвЮТле РУХЭвЮТ Ш Web-СаЮгЧХаЮТ.

І Emacs ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ ваРФШжШЮЭЭЮ ШбЯЮЫмЧЮТРЫбп ваРФШжШЮЭЭлЩ ЬХеРЭШЧЬ Ѕє°, ЭЮ б ТлеЮФЮЬ ТХабШШ 19.29 (ШоЭм 1995 УЮФР) вРЪЦХ ЯЮФФХаЦШТРХвбп ЯЮШбЪ бвРЭФРавР POSIX (бРЬЮХ ФЫШЭЭЮХ бЮТЯРФХЭШХ, СЫШЦЭХХ Ъ ЫХТЮЬг ЪаРо). ёЧ влбпзШ ТбваЮХЭЭле дгЭЪжШЩ ТлФХЫповбп зХвлаХ ЯРал, ЯаХФЭРЧЭРзХЭЭле ФЫп аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ. ѕЭШ ЯХаХзШбЫХЭл Т вРСЫ. 6.5 ТЬХбвХ б ФагУШЬШ ЯаШЬШвШТРЬШ, ЮвЭЮбпйШЬШбп Ъ аХУгЫпаЭлЬ ТлаРЦХЭШпЬ. їЮЯгЫпаЭлХ баХФбвТР ЯЮШбЪР (Т зРбвЭЮбвШ, ЪЮЬРЭФл ЯЮбЫХФЮТРвХЫмЭЮУЮ ЯЮШбЪР isearch-forward Ш isearch-forward-regexp) ЯаХФбвРТЫпов бЮСЮЩ дгЭЪжШШ Lisp, Т ЪЮЭХзЭЮЬ бзХвХ ШбЯЮЫмЧгойШХ ЯаШЬШвШТл. ІЯаЮзХЬ, ЮЭШ ЬЮУгв ЮСЫРФРвм ЭХЪЮвЮалЬШ ФЮЯЮЫЭШвХЫмЭлЬШ ТЮЧЬЮЦЭЮбвпЬШ — ЭРЯаШЬХа, isearch-forward ЯаХЮСаРЧгХв ЮФШЭЮзЭлЩ ЯаЮСХЫ ТЮ ТТХФХЭЭЮЬ аХУгЫпаЭЮЬ ТлаРЦХЭШШ Т ЪЮЭбвагЪжШо [\s-+], ШбЯЮЫмЧгойго бШЭвРЪбШзХбЪШЩ ЪЫРбб Emacs (бЬ. ЭШЦХ) ФЫп ЯЮШбЪР ЫоСле ЯаЮЯгбЪЮТ.

ЗвЮСл нвЮв аРЧФХЫ СлЫ ЪЮаЮвЪШЬ Ш бЮФХаЦРвХЫмЭлЬ, п ЭХ бвРЭг ЮЯШблТРвм ТлбЮЪЮгаЮТЭХТлХ дгЭЪжШШ Lisp ШЫШ бЯХжШдШЪг ШбЯЮЫмЧЮТРЭШп ЪРЦФЮУЮ ЯаШЬШвШТР. ґЫп ЯЮЫгзХЭШп нвЮЩ ШЭдЮаЬРжШШ ФЮбвРвЮзЭЮ ЭРЦРвм ЪЫРТШиШ C-h f (ЪЮЬРЭФР describe-function).

БваЮЪШ Emacs ЪРЪ аХУгЫпаЭлХ ТлаРЦХЭШп

АХУгЫпаЭлХ ТлаРЦХЭШп Emacs, ЪРЪ Ш Т Tcl Ш Python, ЯаХФбвРТЫпов бЮСЮЩ ЮСлзЭлХ бваЮЪШ, ЪЮвЮалХ ЯХаХФРовбп дгЭЪжШпЬШ ЬХеРЭШЧЬг аХУгЫпаЭле ТлаРЦХЭШЩ. јХеРЭШЧЬ аХиРХв, звЮ бЮФХаЦШЬЮХ нвШе бваЮЪ бЫХФгХв ШЭвХаЯаХвШаЮТРвм ЪРЪ аХУгЫпаЭЮХ ТлаРЦХЭШХ. ІРЦЭлХ бЫХФбвТШп ЮЯШбРЭл Т УЫРТХ 3 (б. <$R[P#,R3-21]>). І вРСЫ. 6.6 ЯХаХзШбЫХЭл ЭХЪЮвЮалХ ЮбЮСХЭЭЮбвШ бваЮЪ Emacs.

ґШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ Emacs

І вРСЫ. 6.7 ЯаШТХФХЭ бЯШбЮЪ ЬХвРбШЬТЮЫЮТ, ЮЯЮЧЭРТРХЬле ЬХеРЭШЧЬЮЬ аХУгЫпаЭле ТлаРЦХЭШЩ Emacs. їХаХФ ТРЬШ ЯаШзгФЫШТРп бЬХбм нЪаРЭШаЮТРЭЭле Ш ЯаЮбвле ЬХвРбШЬТЮЫЮТ. ° ХбЫШ гзХбвм, звЮ нЪаРЭШаЮТРЭЭлХ бШЬТЮЫл аХУгЫпаЭле ТлаРЦХЭШЩ Ш бРЬШ ФЮЫЦЭл нЪаРЭШаЮТРвмбп Т бваЮЪРе, аХЧгЫмвРв зРбвЮ ЭРЯЮЬШЭРХв аРбблЯРЭЭго ЪЮаЮСЪг ЧгСЮзШбвЮЪ — ЭРЯаШЬХа, ТлаРЦХЭШХ ["\$\\\[\\||\\|\\\]\$"] ТЧпвЮ ШЧ аХРЫмЭЮУЮ ЪЮФР бвРЭФРавЭЮЩ СШСЫШЮвХЪШ Lisp. ґагУШХ ЯаШЬХал ЯаШТХФХЭл ЭР б. <$R[P#,R3-24]>.

ВРСЫШжР 6.5. їаШЬШвШТл GNU Emacs, ЮвЭЮбпйШХбп Ъ ЯЮШбЪг

ВРСЫШжР 6.7. ґШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ Ѕє° Т Emacs

БЫЮТР Ш бШЭвРЪбШзХбЪШХ ЪЫРббл Emacs

<$M[R6-4]>ЅХЮвкХЬЫХЬЮЩ зРбвмо ФШРЫХЪвР аХУгЫпаЭле ТлаРЦХЭШЩ Emacs пТЫповбп баХФбвТР ЮЯаХФХЫХЭШп бШЭвРЪбШбР. І Emacs ЯЮЫмЧЮТРвХЫм ШЫШ бжХЭРаШЩ elisp ЬЮЦХв ЮЯаХФХЫШвм, ЪРЪШХ бШЬТЮЫл бЫХФгХв бзШвРвм ЪЮЬЬХЭвРаШпЬШ, ЯаЮЯгбЪРЬШ, бШЬТЮЫРЬШ бЫЮТ Ш в. Ф. БЯШбЮЪ бШЭвРЪбШзХбЪШе ЪЫРббЮТ ЯаШТХФХЭ Т вРСЫ. 6.8 — ЯЮФаЮСЭго ШЭдЮаЬРжШо ЬЮЦЭЮ ЯЮЫгзШвм ЪЮЬРЭФЮЩ describe-syntax, ЯЮ гЬЮЫзРЭШо бТпЧРЭЭЮЩ б ЪЫРТШиРЬШ C-h s.

ґШЭРЬШзХбЪЮХ ЮЯаХФХЫХЭШХ бШЭвРЪбШбР ЮСХбЯХзШТРХв ШЭвХЫЫХЪвгРЫмЭго аРСЮвг Emacs Т аРЧЫШзЭле аХЦШЬРе (text-mode, cperl-mode, c-mode Ш в. Ф.) ЅРЯаШЬХа, Т аХЦШЬХ аХФРЪвШаЮТРЭШп ЯаЮУаРЬЬ C++ ЪЮЭбвагЪжШШ /*…*/ Ш //…new ЮЯаХФХЫповбп ЪРЪ ЪЮЬЬХЭвРаШШ, Р Т аХЦШЬХ elisp ЪЮЬЬХЭвРаШХЬ бзШвРХвбп вЮЫмЪЮ ;…new.

БШЭвРЪбШб ЮЪРЧлТРХв аРЧЭЮЮСаРЧЭЮХ ТЫШпЭШХ ЭР ФШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ. јХвРбШЬТЮЫл бШЭвРЪбШзХбЪШе ЪЫРббЮТ, Т ЪЮвЮале ЪЮЭбвагЪжШШ [\s…] Ш [\S…] ЮСкХФШЭповбп б ЪЮФРЬШ ШЧ вРСЫ. 6.8, ЮвЪалТРов ЯапЬЮЩ ФЮбвгЯ Ъ бШЭвРЪбШзХбЪШЬ ЮЯаХФХЫХЭШпЬШ. ЅРЯаШЬХа, ЬХвРбШЬТЮЫ [\sw] ЮЧЭРзРХв «бШЬТЮЫ бЫЮТР», Р ХУЮ дРЪвШзХбЪРп ШЭвХаЯаХвРжШп ЧРТШбШв Юв вХЪгйХУЮ аХЦШЬР. °ЫдРТШвЭЮ-жШдаЮТлХ бШЬТЮЫл бзШвРовбп бШЬТЮЫРЬШ бЫЮТ ТЮ ТбХе аХЦШЬРе, ЭЮ Т ФЮЯЮЫЭХЭШХ Ъ ЭШЬ, ЭРЯаШЬХа, Т аХЦШЬХ text-mode Ъ бШЬТЮЫРЬ бЫЮТ ЮвЭЮбпвбп РЯЮбваЮдл, Р Т аХЦШЬХ cperl-mode — бШЬТЮЫл ЯЮФзХаЪШТРЭШп.

БШЭвРЪбШзХбЪЮХ ЮЯаХФХЫХЭШХ бШЬТЮЫЮТ бЫЮТР вРЪЦХ аРбЯаЮбваРЭпХвбп ЭР ЬХвРбШЬТЮЫл \w Ш \W (ЯаЮбвлХ бЮЪаРйХЭШп ФЫп \sw Ш \Sw), Р вРЪЦХ ЭР УаРЭШжл бЫЮТ \< Ш \>.

їбХТФЮ-POSIX Т Emacs

єРЪ гЯЮЬШЭРЫЮбм ТлиХ (бЬ. вРСЫ. 6.5), Т Emacs аХРЫШЧЮТРЭл вРЪ ЭРЧлТРХЬлХ POSIX-ТХабШШ ЯЮШбЪЮТле ЯаШЬШвШТЮТ. ёбЯЮЫмЧЮТРЭШХ нвШе ТХабШЩ ЭХ ТЫШпХв ЭШ ЭР вШЯ аХУгЫпаЭле ТлаРЦХЭШЩ (вЮ Хбвм ФШРЫХЪв аХУгЫпаЭле ТлаРЦХЭШЩ ЭХ ЯаХТаРйРХвбп Т вЮв, звЮ ЮЯШбРЭ Т вРСЫ. 3.2 (б. <$R[P#,R3-25]>)), ЭШ ЭР ЮСйШЩ аХЧгЫмвРв ЯЮШбЪР (ЮСйХХ бЮТЯРФХЭШХ ШЫШ ЭХбЮТЯРФХЭШХ). ѕв ТлСаРЭЭЮЩ ТХабШШ ЧРТШбШв ЫШим вЮ, ЪРЪЮЩ вХЪбв бЮТЯРФХв, Ш ЪРЪ СлбваЮ нвЮ ЯаЮШЧЮЩФХв.

ґХЩбвТШвХЫмЭЮ, ЭР гаЮТЭХ ЮСйХУЮ бЮТЯРФХЭШп POSIX-ЯЮФЮСЭлХ ТХабШШ ЭРеЮФпв бРЬЮХ ФЫШЭЭЮХ бЮТЯРФХЭШХ, ЭРзШЭРойХХбп СЫШЦХ ТбХУЮ Ъ ЫХТЮЬг ЪаРо, ЪРЪ Сл нвЮ бФХЫРЫ ЭРбвЮпйШЩ ЬХеРЭШЧЬ POSIX. ѕФЭРЪЮ ЯЮФТлаРЦХЭШп Т ЪагУЫле бЪЮСЪРе ЭХ ЧРЯЮЫЭповбп ЬРЪбШЬРЫмЭлЬШ бЮТЯРФХЭШпЬШ бЫХТР ЭРЯаРТЮ, ЪРЪ нвЮ ЮЯШбРЭЮ Т УЫРТХ 4 (б. <$R[P#,R4-39]>) јХеРЭШЧЬ Ѕє° Т Emacs ШйХв бЮТЯРФХЭШХ вРЪ, ЪРЪ нвЮ ФХЫРХв ЮСлзЭлЩ ваРФШжШЮЭЭлЩ ЬХеРЭШЧЬ Ѕє°, ЭЮ Ш ЯЮбЫХ ЭРЩФХЭЭЮУЮ бЮТЯРФХЭШп ЮЭ ЯаЮФЮЫЦРХв ЯХаХСШаРвм ЮбвРЫмЭлХ ЪЮЬСШЭРжШШ. їЮеЮЦХ, Т ЪагУЫле бЪЮСЪРе ЧРЯЮЬШЭРХвбп бРЬЮХ ЯХаТЮХ бЮТЯРФХЭШХ Т вЮЬ вХЪбвХ, ЪЮвЮалЩ Т ШвЮУХ ЮСХбЯХзШЫ бЮТЯРФХЭШХ ЬРЪбШЬРЫмЭЮЩ ФЫШЭл.

ЅРЯаШЬХа, б ЯаШЬХЭХЭШХЬ ТлаРЦХЭШп [$12\|1\|123$.*] Ъ бваЮЪХ 1234 Т бвРЭФРавХ POSIX ФЫп ЯЮФТлаРЦХЭШп Т ЪагУЫле бЪЮСЪРе бЮеаРЭпХвбп вХЪбв 123, ЯЮбЪЮЫмЪг нвЮ бРЬЮХ ФЫШЭЭЮХ бЮТЯРФХЭШХ Т аРЬЪРе бРЬЮУЮ ФЫШЭЭЮУЮ ЮСйХУЮ бЮТЯРФХЭШп. ѕФЭРЪЮ Т бЫгзРХ ЯаШЬХЭХЭШп posix-ЪЮЬРЭФ Emacs СгФХв ЯЮЫгзХЭ аХЧгЫмвРв 12 — вХЪбв ЯХаТЮУЮ бЮТЯРТиХУЮ ЯЮФТлаРЦХЭШп, ЪЮвЮаЮХ ЯаШТХЫЮ Ъ бРЬЮЬг ФЫШЭЭЮЬг ЮСйХЬг бЮТЯРФХЭШо.

POSIX-ЯЮФЮСЭлЩ ЯЮШбЪ Т Ѕє° ваХСгХв ФЮЯЮЫЭШвХЫмЭле ЧРваРв, ЯЮнвЮЬг п ЭХ аХЪЮЬХЭФго ШбЯЮЫмЧЮТРвм нвШ ЪЮЬРЭФл, ХбЫШ вЮЫмЪЮ ТРЬ ЭХ ЭгЦЭл ШЬХЭЭЮ ЮЭШ.

АХЧгЫмвРвл ЯЮШбЪР Т Emacs

ІбХ дгЭЪжШШ, ЯХаХзШбЫХЭЭлХ Т ТХаеЭХЩ зРбвШ вРСЫШжл 6.5, ЧРЯЮЫЭпов ФРЭЭлХ match-data. І бТЮо ЮзХаХФм, нвШ ФРЭЭлХ ТЫШпов ЭР ЧЭРзХЭШп, ТЮЧТаРйРХЬлХ match-beginning Ш match-end, Ш ЭР ФРЭЭлХ, ШбЯЮЫмЧгХЬлХ match-string Ш replace-match.

ёЭдЮаЬРжШп Ю бЮТЯРФХЭШШ

<$M[R6-3]>ДгЭЪжШШ (match-beginning зШбЫЮ) Ш (match-end зШбЫЮ) ТЮЧТаРйРов ЯЮЧШжШШ жХЫХТЮУЮ вХЪбвР, Т ЪЮвЮале бЮЮвТХвбвТХЭЭЮ ЭРзШЭРХвбп Ш ЧРЪРЭзШТРХвбп гбЯХиЭЮХ бЮТЯРФХЭШХ ТбХУЮ ТлаРЦХЭШп ШЫШ ЯЮФТлаРЦХЭШп. µбЫШ зШбЫЮ аРТЭЮ ЭгЫо, ТЮЧТаРйРовбп ЯЮЧШжШШ ТбХУЮ бЮТЯРФХЭШп; Т ЯаЮвШТЭЮЬ бЫгзРХ ТЮЧТаРйРовбп ЯЮЧШжШШ ФЫп ЯЮФТлаРЦХЭШп $…$ б ЧРФРЭЭлЬ ЭЮЬХаЮЬ. єЮЭЪаХвЭлЩ дЮаЬРв ТЮЧТаРйХЭШп ЯЮЧШжШЩ ЧРТШбШв Юв вЮУЮ, ЪРЪРп дгЭЪжШп ШбЯЮЫмЧЮТРЫРбм ЯаШ ЯХаТЮЭРзРЫмЭЮЬ ЯЮШбЪХ. ЅРЯаШЬХа, ФЫп string-match ТЮЧТаРйРовбп жХЫлХ зШбЫР (ШЭФХЪбл Т бваЮЪХ, ЭгЬХагХЬлХ б ЭгЫп), ЭЮ ФЫп looking-at ТЮЧТаРйРовбп ЬРаЪХал Т СгдХаХ. ґЫп ЯРа бЪЮСЮЪ, ЪЮвЮалХ ЭХ бгйХбвТгов ШЫШ ЭХ ТеЮФпв Т бЮТЯРФХЭШХ, ТбХУФР ТЮЧТаРйРХвбп nil.

ДгЭЪжШШ match-beginning Ш match-end ТбХУЮ ЫШим ЮСХбЯХзШТРов гФЮСЭлЩ ШЭвХадХЩб Ъ дгЭЪжШШ match-data<$M[R6-6]>, ЪЮвЮаРп ТЮЧТаРйРХв ШЭдЮаЬРжШо Ю ЯЮЧШжШШ бЮТЯРФХЭШп ЮСйХУЮ ТлаРЦХЭШп Ш ТбХе ЯЮФТлаРЦХЭШЩ. ёЭдЮаЬРжШп ТЮЧТаРйРХвбп Т ТШФХ бЯШбЪР:

µбЫШ ЯаШЬХЭШвм ТлаРЦХЭШХ [a$b?$$c$] Ъ бваЮЪХ ac дгЭЪжШХЩ string-match, дгЭЪжШп match-data ТЮЧТаРвШв бЯШбЮЪ (0 2 1 1 1 2). БаХФЭпп ЯРаР 1 1 ЮЧЭРзРХв, звЮ ЯХаТРп ЯРаР ЪагУЫле бЪЮСЮЪ (б [b?]) гбЯХиЭЮ бЮТЯРЫР б «ЭШзХЬ» Т ЯЮЧШжШШ 1 (ЯЮбЪЮЫмЪг ЭРзРЫмЭРп ЯЮЧШжШп бЮТЯРФРХв б ЪЮЭХзЭЮЩ).

ВХЬ ЭХ ЬХЭХХ, ХбЫШ Сл нвЮ ТлаРЦХЭШХ ШЬХЫЮ ТШФ [a$b$?$c$] (ЮСаРвШвХ ТЭШЬРЭШХ ЭР ЯХаХЬХйХЭШХ ТЮЯаЮбШвХЫмЭЮУЮ ЧЭРЪР), match-data ТЮЧТаРйРХв (0 2 nil nil 1 2). їРаР nil nil УЮТЮаШв Ю вЮЬ, звЮ ЯХаТРп ЯРаР ЪагУЫле бЪЮСЮЪ ЭХ гзРбвТгХв Т бЮТЯРФХЭШШ (ТЮЯаЮбШвХЫмЭлЩ ЧЭРЪ бЮТЯРЫ гбЯХиЭЮ, ЭЮ ЪагУЫлХ бЪЮСЪШ, Ъ ЪЮвЮалЬ ЮЭ ЮвЭЮбШвбп — ЭХв).

ДгЭЪжШШ match-string Ш replace-match ШбЯЮЫмЧгов ШЭдЮаЬРжШо match-data ФЫп звХЭШп Ш ЬЮФШдШЪРжШШ бЮТЯРТиХУЮ вХЪбвР (Ш ЭХ вЮЫмЪЮ, ЪРЪ Тл гЧЭРХвХ ШЧ бЫХФгойХУЮ РСЧРжР). ДЮаЬР (match-string зШбЫЮ) ТЮЧТаРйРХв вХЪбв ШЧ вХЪгйХУЮ СгдХаР Юв (match-beginning зШбЫЮ) ФЮ (match-end зШбЫЮ). І дЮаЬХ (match-string зШбЫЮ бваЮЪР) ТЮЧТаРйРХвбп ЯЮФбваЮЪР ЧРФРЭЭЮЩ бваЮЪШ.

ѕвТХвбвТХЭЭЮбвм ЧР ШбЯЮЫмЧЮТРЭШХ match-string Ш replace-match б вХЬ ЦХ жХЫХТлЬ вХЪбвЮЬ, ЪРЪ Ш ФЫп дгЭЪжШШ, ШбЯЮЫмЧЮТРТиХЩбп ФЫп ЧРЯЮЫЭХЭШп бЯШбЪР match-data, ТЮЧЫРУРХвбп ЭР ТРб. ЅШзвЮ ЭХ ЯЮЬХиРХв ТРЬ ЬЮФШдШжШаЮТРвм жХЫХТЮЩ вХЪбв ЬХЦФг ЯЮШбЪЮЬ Ш ТлЧЮТЮЬ match-string, ЯХаХЪЫозШвмбп ЭР ФагУЮЩ СгдХа ШЫШ ЯХаХФРвм ФагУго бваЮЪг. ІХаЮпвЭЮ, ЯЮФЮСЭлЬ ТлеЮФЪРЬ вЮЦХ ЬЮЦЭЮ ЭРЩвШ ЪРЪЮХ-ЭШСгФм ШЭвХаХбЭЮХ ЯаШЬХЭХЭШХ, ЭЮ СЮЫмиХЩ зРбвмо ЮЭШ ЫШим бЮЧФРов ЯаЮСЫХЬл, Ш ЯЮнвЮЬг Ше бЫХФгХв ШЧСХУРвм.

ЕаЮЭЮЬХваРЦ Т Emacs

Emacs пТЫпХвбп ЯЮЫЭЮжХЭЭлЬ аХФРЪвЮаЮЬ, звЮ ЭХбЪЮЫмЪЮ ЧРвагФЭпХв ЯаЮТХФХЭШХ еаЮЭЮЬХваРЦР — ЭЮ ЪЮЭХзЭЮ, нвР ЧРФРзР ТЯЮЫЭХ аХиРХЬРп. І бЫХФгойХЬ ЫШбвШЭУХ ЯаШТХФХЭР ЮФЭР ШЧ ЯаЮУаРЬЬ, ЪЮвЮаРп ШбЯЮЫмЧЮТРЫРбм ФЫп вХбвШаЮТРЭШп ЯаШЬХаР, ЯаШТХФХЭЭЮУЮ Т ЪЮЭжХ УЫРТл 5 (б. <$R[P#,R5-18]>). П ЭХ ЯаШЭРФЫХЦг Ъ ЪЮаШдХпЬ ЯаЮУаРЬЬШаЮТРЭШп ЭР elisp, ЯЮнвЮЬг Ъ нвЮЩ ЯаЮУаРЬЬХ бЫХФгХв ЮвЭЮбШвмбп б ФЮЫХЩ бЪХЯбШбР. ІЯаЮзХЬ, дгЭЪжШп time-now ТРЬ ЭРТХаЭпЪР ЯаШУЮФШвбп.

(setq count 0) ;; їЮЪР ЭХ ЭРЩФХЭЮ ЭШ ЮФЭЮУЮ бЮТЯРФХЭШп

(message "testing...") ;; БЮЮСйШвм ЯЮЫмЧЮТРвХЫо Ю вХбвШаЮТРЭШШ

(setq start (time-now)) ;; ·РдШЪбШаЮТРвм ЭРзРЫмЭЮХ ТаХЬп

(setq beg (point)) ;; ·РЯЮЬЭШвм ЭРзРЫЮ вХЪгйХЩ бваЮЪШ

(setq end (point)) ;; ·РЯЮЬЭШвм ЭРзРЫЮ бЫХФгойХЩ бваЮЪШ

(goto-char beg) ;; ІХаЭгвмбп Т ЭРзРЫЮ вХЪгйХЩ бваЮЪШ

;; їЮбЫХФЮТРвХЫмЭЮ ЯаЮТХаШвм ТбХ бЮТЯРФХЭШп

(setq count (+ count 1)) ;; ·РЯЮЬЭШвм, звЮ ЭРЩФХЭР ХйХ ЮФЭР бваЮЪР

;; ЖШЪЫ ЧРЪЮЭзХЭ - ТлзШбЫШвм Ш ТлТХбвШ ЧРваРзХЭЭЮХ ТаХЬп

ѕЯвШЬШЧРжШп аХУгЫпаЭле ТлаРЦХЭШЩ Т Emacs

ЅХбЬЮвап ЭР зРбвЮХ ЯаШЬХЭХЭШХ аХУгЫпаЭле ТлаРЦХЭШЩ, ЬХеРЭШЧЬ аХУгЫпаЭле ТлаРЦХЭШЩ Emacs пТЫпХвбп ЭРШЬХЭХХ ЮЯвШЬШЧШаЮТРЭЭлЬ ШЧ ТбХе ЭХваШТШРЫмЭле ЯаЮУаРЬЬ ЭР СРЧХ Ѕє°, гЯЮЬШЭРТиШебп Т ЪЭШУХ. ёЧ ТбХе ЯаШХЬЮТ ЮЯвШЬШЧРжШШ, ЯХаХзШбЫХЭЭле Т УЫРТХ 5 (б. <$R[P#,R5-17]>), Т Emacs ТлЯЮЫЭпХвбп вЮЫмЪЮ ШбЪЫозХЭШХ ЯЮ ЯХаТЮЬг бШЬТЮЫг, ЯаЮбвЮХ ЯЮТвЮаХЭШХ Ш ЦРЫЪЮХ ЯЮФЮСШХ гзХвР ФЫШЭл (ЬХеРЭШЧЬ ЧРЬХзРХв, звЮ ХбЫШ ТлаРЦХЭШХ ЭХ ЬЮЦХв бЮТЯРбвм б ЯгбвЮЩ бваЮЪЮЩ, вЮ ШбЪРвм ХУЮ Т ЪЮЭжХ жХЫХТЮУЮ вХЪбвР СХббЬлбЫХЭЭЮ).

Б ФагУЮЩ бвЮаЮЭл, ШбЪЫозХЭШХ ЯЮ ЯХаТЮЬг бШЬТЮЫг<$M[R6-5]> аХРЫШЧЮТРЭЮ ЫгзиХ, зХЬ Т ЫоСЮЩ ФагУЮЩ ЯаЮУаРЬЬХ б ЬХеРЭШЧЬЮЬ Ѕє°. µбЫШ ФагУШХ ЯаЮУаРЬЬл ЯРбгов ФРЦХ ЯХаХФ вРЪШЬШ ЯаЮбвлЬШ ЪЮЭбвагЪжШпЬШ, ЪРЪ [a|b], вЮ ЮЯвШЬШЧРжШп Emacs аРЧСШаРХвбп ФРЦХ Т бЫЮЦЭле ТлаРЦХЭШпе. ЅРЯаШЬХа, ЯаШ РЭРЫШЧХ ТлаРЦХЭШп [^[spctab*$with\|pragma\|use$] Emacs ЯаРТШЫмЭЮ ЯЮЩЬХв, звЮ бЮТЯРФХЭШХ ФЮЫЦЭЮ ЭРзШЭРвмбп б [[tabspc*puw]]. ёЬХЭЭЮ нвЮв дРЪвЮа Т ЧЭРзШвХЫмЭЮЩ бвХЯХЭШ аХиРХв ЯаЮСЫХЬг нддХЪвШТЭЮбвШ аХУгЫпаЭле ТлаРЦХЭШЩ Emacs Ш ЯЮЧТЮЫпХв ШбЯЮЫмЧЮТРвм Ше Т вЮЩ бвХЯХЭШ, Т ЪЮвЮаЮЩ ЮЭШ ШбЯЮЫмЧговбп бХУЮФЭп (бЬ. б. <$R[P#,R5-19]>).

єРЪ ЮСкпбЭпЫЮбм Т аРЧФХЫХ «єниШаЮТРЭШХ ЯаШ ЪЮЬЯШЫпжШШ» (б. <$R[P#,R5-6]>), аХУгЫпаЭлХ ТлаРЦХЭШп ЮСлзЭЮ ЪЮЬЯШЫШаговбп ЭХЯЮбаХФбвТХЭЭЮ ЯХаХФ ШбЯЮЫмЧЮТРЭШХЬ, ЭЮ Emacs ЯЮФФХаЦШТРХв Ъни ЯЮбЫХФЭШе ЮвЪЮЬЯШЫШаЮТРЭЭле ТлаРЦХЭШЩ. І ТХабШШ 19.33 Т ЪниХ еаРЭШЫЮбм Япвм аХУгЫпаЭле ТлаРЦХЭШЩ, ЭЮ Т СгФгйХЩ ТХабШШ СгФХв еаРЭШвмбп 20[5]. ГТХЫШзХЭШХ аРЧЬХаР ЪниР Т ТлбиХЩ бвХЯХЭШ ЯЮЫЮЦШвХЫмЭЮ ЮваРЧШЫЮбм ЭР аРСЮвХ ЯаШЬХаР ШЧ УЫРТл 5 (б. <$R[P#,R5-18]>), ЭЮ нвЮв вХбв Т ЮЯаХФХЫХЭЭЮЩ бвХЯХЭШ ФХЬЮЭбваШагХв егФиго бШвгРжШо. П ЯаЮТХЫ ЭХЪЮвЮалХ ЯаЮбвлХ, аХРЫмЭлХ ЯаЮТХаЪШ б РТвЮЬРвШзХбЪЮЩ аРббвРЭЮТЪЮЩ ЮвбвгЯЮТ Ш ТлСЮаЮЬ иаШдвЮТ (ЯаШ ЪЮвЮале ШЭвХЭбШТЭЮ ШбЯЮЫмЧговбп аХУгЫпаЭлХ ТлаРЦХЭШп) Ш ЮСЭРагЦШЫ, звЮ гТХЫШзХЭШХ ЮСкХЬР ЪниР ЮСХбЯХзШТРХв ЯаШЬХаЭЮ 20-ЯаЮжХЭвЭлЩ ТлШУали Т бЪЮаЮбвШ. ІЯаЮзХЬ, 20 ЯаЮжХЭвЮТ — ЭХ вРЪ гЦ ЬРЫЮ.

µбЫШ Тл бРЬЮбвЮпвХЫмЭЮ ЪЮЬЯШЫШагХвХ бТЮо ЪЮЯШо Emacs, Тл ЬЮЦХвХ ЧРФРвм ЫоСЮЩ ЭгЦЭлЩ аРЧЬХа ЪниР. ґЫп нвЮУЮ ФЮбвРвЮзЭЮ ЯаШбТЮШвм ЧЭРзХЭШХ ЯХаХЬХЭЭЮЩ REGEXP_CACHE_SIZE Т ЭРзРЫХ дРЩЫР src/search.c.

[1] І вРСЫШжХ 6.3 ЭШзХУЮ ЭХ бЪРЧРЭЮ ЮС нЪаРЭШаЮТРЭШШ Т бШЬТЮЫмЭле ЪЫРббРе ЪЮбЮЩ зХавл — ЮУаРЭШзШвХЫп аХУгЫпаЭле ТлаРЦХЭШЩ. І ШбеЮФЭЮЬ awk нвЮ СлЫЮ ЬЮЦЭЮ ФХЫРвм (еЮвп Ш ЭХ ЮСпЧРвХЫмЭЮ). І gawk нЪаРЭШаЮТРЭШХ / ЧРЯаХйХЭЮ, Р Т ФагУШе аХРЫШЧРжШпе ЮЭЮ пТЫпХвбп ЮСпЧРвХЫмЭлЬ ваХСЮТРЭШХЬ.

[2] НвЮв аРЧФХЫ ЭРЯШбРЭ ФЫп ТХабШШ Tcl7.5p. ѕдШжШРЫмЭлЩ бРЩв Tcl Т World Wide Web аРбЯЮЫЮЦХЭ ЯЮ РФаХбг: http://www.sunlabs/com/research/tcl.

[3] ЅХбЬЮвап ЭР вЮ, звЮ Т ЯЮбЫХФЭХЩ ФЮЪгЬХЭвРжШШ Tcl (ЭР ЬЮЬХЭв ЭРЯШбРЭШп — tcl7.5) гвТХаЦФРХвбп ЮСаРвЭЮХ, ЬХвРбШЬТЮЫ \n Т бваЮЪРе Tcl ЭХ ЮСпЧРвХЫмЭЮ бЮЮвТХвбвТгХв бШЬТЮЫг б иХбвЭРФжРвХаШзЭлЬ ЪЮФЮЬ 0A. ·ЭРзХЭШХ, ЪЮвЮаЮЬг ЮЭ бЮЮвТХвбвТгХв, ЧРТШбШв Юв бШбвХЬл (б. <$R[P#,R3-26]>). ВХЬ ЭХ ЬХЭХХ, ЪЮУФР нвР ЪЭШУР гЦХ ЭРЯаРТЫпЫРбм Т ЯХзРвм, ґЦЮЭ ГбвХаеРгв бЮЮСйШЫ ЬЭХ, звЮ ЮЭ ЭРЬХаХЭ ЦХбвЪЮ ЧРЪЮФШаЮТРвм 0A Т ЯаЮУаРЬЬХ. І СгФгйХЬ нвЮ ЬЮЦХв ЯаХЯЮФЭХбвШ боаЯаШЧл ФЫп ЯЮЫмЧЮТРвХЫХЩ MacOS.

[4] І ЮаШУШЭРЫХ нвЮв аРЧФХЫ СлЫ ЭРЯШбРЭ Т GNU Emacs ТХабШШ 19.33.

[5] ·Р ЭХбЪЮЫмЪЮ ФЭХЩ ФЮ ЧРТХаиХЭШп ЯаРТЪШ ЪЭШУШ п бЮЮСйШЫ АШзРаФг БвЮЫЫЬХЭг Ю аХЧгЫмвРвРе вХбвЮТ Т УЫРТХ 5. ѕЭ аХиШЫ гТХЫШзШвм аРЧЬХа ЪниР ФЮ 20, Р вРЪЦХ ЭХбЪЮЫмЪЮ ЯЮТлбШвм нддХЪвШТЭЮбвм ЯЮШбЪР Т ЪниХ. НвШ ШЧЬХЭХЭШп ФЮЫЦЭл ЯЮпТШвмбп Т бЫХФгойХЩ ТХабШШ Emacs

јХвРбШЬТЮЫл, ФХЩбвТШвХЫмЭлХ ТЭХ бШЬТЮЫмЭле ЪЫРббЮТ
.	ЫоСЮЩ СРЩв, ЪаЮЬХ ЭгЫм-бШЬТЮЫР (ТЪЫозРп бШЬТЮЫл ЭЮТЮЩ бваЮЪШ)
(…)	УагЯЯШаЮТЪР Ш бЮеаРЭХЭШХ (ЬРЪбШЬгЬ 20 ЯРа)
*, +, ?	бвРЭФРавЭлХ ЪТРЭвШдШЪРвЮал (ЬЮУгв ЯаШЬХЭпвмбп Ъ (…))
\|	ЪЮЭбвагЪжШп ТлСЮаР
^, $	ЭРзРЫЮ Ш ЪЮЭХж бваЮЪШ
\бШЬТЮЫ	ЫШвХаРЫ бШЬТЮЫ
[…], [^…]	бШЬТЮЫмЭлХ ЪЫРббл (ЮСлзЭлЩ Ш ШЭТХавШаЮТРЭЭлЩ)
јХвРбШЬТЮЫл, ФХЩбвТШвХЫмЭлХ ТЭгваШ бШЬТЮЫмЭле ЪЫРббЮТ
]	ЪЮЭХж ЪЫРббР (звЮСл ТЪЫозШвм Т ЪЫРбб ЫШвХаРЫ ], ЯЮбвРТмвХ ХУЮ ЭР ЯХаТЮХ ЬХбвЮ ЯЮбЫХ [ ШЫШ [^)
c1-б2	ШЭвХаТРЫ (звЮСл ТЪЫозШвм Т ЪЫРбб ЫШвХаРЫ «ФХдШб», ЯЮбвРТмвХ ХУЮ ЭР ЯХаТЮХ ШЫШ ЯЮбЫХФЭХХ ЬХбвЮ).
їаШЬХзРЭШХ: Т ЪЫРббРе бШЬТЮЫ \ ЭХ ШЬХХв бЯХжШРЫмЭЮЩ ШЭвХаЯаХвРжШШ.

јХвРбШЬТЮЫ	ѕЯШбРЭШХ
\a	·ТгЪЮТЮЩ бШУЭРЫ (ASCII)
\b	·РСЮЩ (ASCII)
\d	ГФРЫХЭШХ (ASCII)
\e	Escape (ASCII)
\f	їЮФРзР ЫШбвР (ASCII)
\C-бШЬТЮЫ	Бontrol-бШЬТЮЫ (Emacs)
\^бШЬТЮЫ	Бontrol-бШЬТЮЫ (Emacs)
\S-бШЬТЮЫ	Shift-бШЬТЮЫ (Emacs)
\s-бШЬТЮЫ	Super-бШЬТЮЫ (Emacs)
\n	ЅЮТРп бваЮЪР (ЧРТШбШв Юв бШбвХЬл)
\r	ІЮЧТаРв ЪгабЮаР (ASCII)
\t	ВРСгЫпжШп (ASCII)
\v	ІХавШЪРЫмЭРп вРСгЫпжШп (ASCII)
\A-бШЬТЮЫ	Alt-бШЬТЮЫ (Emacs)
\H-бШЬТЮЫ	Hyper-бШЬТЮЫ (Emacs)
\M-бШЬТЮЫ	Meta-бШЬТЮЫ (Emacs)
\ТЮбмЬ	СРЩв б ЧРФРЭЭлЬ ТЮбмЬХаШзЭлЬ ЪЮФЮЬ (Юв 1 ФЮ 3 жШда)
\xиХбвЭ	СРЩв б ЧРФРЭЭлЬ иХбвЭРФжРвХаШзЭлЬ ЪЮФЮЬ (0 Ш СЮЫХХ жШда)
ґагУШХ ЪЮЬСШЭРжШШ ТШФР \бШЬТЮЫ, ТЪЫозРп \\, ТбвРТЫпов Т бваЮЪг бШЬТЮЫ.

јХвРбШЬТЮЫл, ФХЩбвТШвХЫмЭлХ ТЭХ бШЬТЮЫмЭле ЪЫРббЮТ
јХвРбШЬТЮЫ		ѕЯШбРЭШХ
.	ЫоСЮЩ СРЩв, ЪаЮЬХ ЭгЫм-бШЬТЮЫР
\(…\)	УагЯЯШаЮТЪР Ш бЮеаРЭХЭШХ
*, +, ?	бвРЭФРавЭлХ ЪТРЭвШдШЪРвЮал (ЬЮУгв ЯаШЬХЭпвмбп Ъ \(…\))
\\|	ЪЮЭбвагЪжШп ТлСЮаР
^	ЭРзРЫЮ бваЮЪШ (ХбЫШ ЭРеЮФШвбп Т ЭРзРЫХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп, Р вРЪЦХ ЯЮбЫХ \\| ШЫШ \(). БЮТЯРФРХв Т ЭРзРЫХ жХЫХТЮУЮ вХЪбвР ШЫШ ЯЮбЫХ ТЭгваХЭЭШе бШЬТЮЫЮТ ЭЮТЮЩ бваЮЪШ.
$	ЪЮЭХж бваЮЪШ (ХбЫШ ЭРеЮФШвбп Т ЪЮЭжХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп, ЯХаХФ \\| ШЫШ апФЮЬ б \)). БЮТЯРФРХв Т ЪЮЭжХ жХЫХТЮУЮ вХЪбвР ШЫШ ЯХаХФ ТЭгваХЭЭШЬШ бШЬТЮЫРЬШ ЭЮТЮЩ бваЮЪШ.
\w, \W	бШЬТЮЫ бЫЮТР (ЭХ пТЫпХвбп бШЬТЮЫЮЬ бЫЮТР) (бЬ. вРСЫ. 6.8)
\<, \>, \b	ЭРзРЫЮ бЫЮТР, ЪЮЭХж бЫЮТР, ЫоСРп УаРЭШжР бЫЮТР (бЬ. вРСЫ. 6.8)
\sЪЮФ, \SЪЮФ	бШЬТЮЫ, ЯаШЭРФЫХЦРйШЩ (ЭХ ЯаШЭРФЫХЦРйШЩ) бШЭвРЪбШзХбЪЮЬг ЪЫРббг Emacs (бЬ. вРСЫ. 6.8)
\жШдаР	ЮСаРвЭРп бблЫЪР (вЮЫмЪЮ б ЮФЭЮЩ жШдаЮЩ)
ЯаЮзШХ ЪЮЬСШЭРжШШ \бШЬТЮЫ	ЫШвХаРЫ бШЬТЮЫ
[…], [^…]	бШЬТЮЫмЭлХ ЪЫРббл (ЮСлзЭлЩ Ш ШЭТХавШаЮТРЭЭлЩ)
јХвРбШЬТЮЫл, ФХЩбвТШвХЫмЭлХ ТЭгваШ бШЬТЮЫмЭле ЪЫРббЮТ
]	ЪЮЭХж ЪЫРббР (звЮСл ТЪЫозШвм Т ЪЫРбб ЫШвХаРЫ ], ЯЮбвРТмвХ ХУЮ ЭР ЯХаТЮХ ЬХбвЮ ЯЮбЫХ [ ШЫШ [^)
c1-б2	ШЭвХаТРЫ (звЮСл ТЪЫозШвм Т ЪЫРбб ЫШвХаРЫ «ФХдШб», ЯЮбвРТмвХ ХУЮ ЭР ЯХаТЮХ ШЫШ ЯЮбЫХФЭХХ ЬХбвЮ).
їаШЬХзРЭШХ: Т ЪЫРббРе бШЬТЮЫ \ ЭХ ШЬХХв бЯХжШРЫмЭЮЩ ШЭвХаЯаХвРжШШ.

ЅРЧТРЭШХ	єЮФ(-л)	БЮТЯРФХЭШХ
charquote	/	бШЬТЮЫмЭлЩ ЯаХдШЪб
close	)	ЪЮЭХзЭлЩ ЮУаРЭШзШвХЫм
comment	<	ЭРзРЫЮ ЪЮЬЬХЭвРаШп
endcomment	>	ЪЮЭХж ЪЮЬЬХЭвРаШп
escape	\	нЪаРЭШагойШЩ ЯаХдШЪб Т бвШЫХ C
math	$	ФЫп ЮУаРЭШзШвХЫХЩ вШЯР $ Т Tex
open	(	ЭРзРЫмЭлЩ ЮУаРЭШзШвХЫм
punct	.	ЧЭРЪ ЯаХЯШЭРЭШп
quote	'	ЯаХдШЪб (ЪРЪ ' Т Lisp)
string	"	УагЯЯШагойШЩ бШЬТЮЫ бваЮЪШ (ЪРЪ "…")
symbol	_	ЧЭРЪ, ЭХ пТЫпойШЩбп бШЬТЮЫЮЬ бЫЮТР
whitespace	- ШЫШ spc	ЯаЮЯгбЪ
word	w ШЫШ W	бШЬТЮЫ бЫЮТР