їаХФбвРТмвХ бШвгРжШо: ТРиХЬг ЭРзРЫмЭШЪг ШЧ ЮвФХЫР ФЮЪгЬХЭвРжШШ ЯЮЭРФЮСШЫЮбм баХФбвТЮ ФЫп ЯЮШбЪР ЯЮТвЮапойШебп бЫЮТ Т вХЪбвХ (ЭРЯаШЬХа, «this this»). НвР ЯаЮСЫХЬР ФЮТЮЫмЭЮ зРбвЮ ТЮЧЭШЪРХв Т ФЮЪгЬХЭвРе, ЯЮФТХаУРойШебп ЯЮбвЮпЭЭЮЬг аХФРЪвШаЮТРЭШо. ІРиХ аХиХЭШХ ФЮЫЦЭЮ:

l ѕСХбЯХзШТРвм ЯаЮТХаЪг ЯаЮШЧТЮЫмЭЮУЮ ЪЮЫШзХбвТР дРЩЫЮТ; бЮЮСйРвм Ю ЪРЦФЮЩ бваЮЪХ ЪРЦФЮУЮ дРЩЫР, бЮФХаЦРйХЩ ЯЮТвЮапойШХбп бЫЮТР; ТлФХЫпвм (ЯаШ ЯЮЬЮйШ бвРЭФРавЭле Escape-ЯЮбЫХФЮТРвХЫмЭЮбвХЩ ANSI) ЪРЦФЮХ ЯЮТвЮапойХХбп бЫЮТЮ Ш ТлТЮФШвм ШЬп ШбеЮФЭЮУЮ дРЩЫР Т ЪРЦФЮЩ бваЮЪХ ЮвзХвР.

l ГзШвлТРвм ТЮЧЬЮЦЭлХ аРЧалТл бваЮЪ Ш ФРЦХ ЮСЭРагЦШТРвм бШвгРжШШ, ЪЮУФР бЫЮТЮ, ЭРеЮФпйХХбп Т ЪЮЭжХ ЮФЭЮЩ бваЮЪШ, ЯЮТвЮапХвбп Т ЭРзРЫХ бЫХФгойХЩ.

l ЅРеЮФШвм ЯЮТвЮапойШХбп бЫЮТР, ЭХбЬЮвап ЭР аРЧЫШзШп Т аХУШбваХ бШЬТЮЫЮТ (ЭРЯаШЬХа, The the…) Ш Т ЪЮЫШзХбвТХ ЯаЮЯгбЪЮТ (ЯаЮСХЫЮТ, вРСгЫпжШЩ, ЯХаХТЮФЮТ бваЮЪШ Ш в. Я.) ЬХЦФг бЫЮТРЬШ.

l ЅРеЮФШвм ЯЮТвЮапойШХбп бЫЮТР, аРЧФХЫХЭЭлХ вХУРЬШ HTML (Ш, аРЧгЬХХвбп, ЫоСлЬ ЪЮЫШзХбвТЮЬ ЯаЮЯгбЪЮТ). ВХУШ HTML ЯаШЬХЭповбп ЯаШ аРЧЬХвЪХ вХЪбвР Т бваРЭШжРе World Wide Web — ЭРЯаШЬХа, ФЫп ТлФХЫХЭШп бЫЮТ ЦШаЭлЬ иаШдвЮЬ: «it is <B>very</B> very important…».

ЅШзХУЮ бХСХ! ѕФЭРЪЮ ФЫп аХРЫмЭле ЧРФРз ЭгЦЭл аХРЫмЭлХ аХиХЭШп, Р ЮЯШбРЭЭРп ЧРФРзР ТЯЮЫЭХ аХРЫмЭР. П ТЮбЯЮЫмЧЮТРЫбп ЯЮФЮСЭлЬ ШЭбвагЬХЭвЮЬ ЯаШ ЯЮФУЮвЮТЪХ вХЪбвР нвЮЩ ЪЭШУШ Ш СлЫ ЯаЮбвЮ ЯЮаРЦХЭ ЪЮЫШзХбвТЮЬ ЮСЭРагЦХЭЭле ЯЮТвЮаХЭШЩ. БгйХбвТгХв ЭХЬРЫЮ пЧлЪЮТ ЯаЮУаРЬЬШаЮТРЭШп, ЯЮЧТЮЫпойШе аХиШвм нвг ЧРФРзг, ЭЮ ЯЮФФХаЦЪР аХУгЫпаЭле ТлаРЦХЭШЩ Т ЫоСЮЬ пЧлЪХ бгйХбвТХЭЭЮ гЯаЮбвШв ТРиг аРСЮвг.

АХУгЫпаЭлХ ТлаРЦХЭШп — ЬЮйЭЮХ, УШСЪЮХ Ш нддХЪвШТЭЮХ баХФбвТЮ ЮСаРСЮвЪШ вХЪбвЮТ. ГЭШТХабРЫмЭлХ иРСЫЮЭл аХУгЫпаЭле ТлаРЦХЭШЩ бРЬШ ЯЮ бХСХ ЭРЯЮЬШЭРов ЬШЭШРвоаЭлЩ пЧлЪ ЯаЮУаРЬЬШаЮТРЭШп, ЯаХФЭРЧЭРзХЭЭлЩ ФЫп ЮЯШбРЭШп Ш РЭРЫШЧР вХЪбвР. їаШ ФЮЯЮЫЭШвХЫмЭЮЩ ЯЮФФХаЦЪХ бЮ бвЮаЮЭл ЪЮЭЪаХвЭЮЩ гвШЫШвл ШЫШ пЧлЪР ЯаЮУаРЬЬШаЮТРЭШп аХУгЫпаЭлХ ТлаРЦХЭШп бЯЮбЮСЭл ТбвРТЫпвм, гФРЫпвм, ТлФХЫпвм Ш ТлЯЮЫЭпвм бРЬлХ ЭХТХаЮпвЭлХ ЮЯХаРжШШ б вХЪбвЮТлЬШ ФРЭЭлЬШ ЫоСЮУЮ ТШФР. ѕЭШ СлТРов ЮзХЭм ЯаЮбвлЬШ, ТаЮФХ ЪЮЬРЭФл ЯЮШбЪР Т вХЪбвЮТЮЬ аХФРЪвЮаХ, ШЫШ ЮзХЭм бЫЮЦЭлЬШ, ЪРЪ бЯХжШРЫШЧШаЮТРЭЭлХ пЧлЪШ ЮСаРСЮвЪШ вХЪбвЮТ. ёЧ нвЮЩ ЪЭШУШ Тл гЧЭРХвХ, ЪРЪ ЯЮТлбШвм нддХЪвШТЭЮбвм бТЮХЩ аРСЮвл ЯаШ ЯЮЬЮйШ аХУгЫпаЭле ТлаРЦХЭШЩ. Іл ЭРгзШвХбм ЬлбЫШвм аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ, Ш нвЮ ЯЮЧТЮЫШв ТРЬ Т ЯЮЫЭЮЩ ЬХаХ ШбЯЮЫмЧЮТРвм Ше ТлФРойШХбп ТЮЧЬЮЦЭЮбвШ.

єРЪ Тл гСХФШвХбм Т бЫХФгойХЩ УЫРТХ, ЯаЮУаРЬЬР ЯЮШбЪР ЯЮТвЮапойШебп бЫЮТ ЧРЭШЬРХв ТбХУЮ ЭХбЪЮЫмЪЮ бваЮЪ ЭР Perl ШЫШ Python — бжХЭРаЭле пЧлЪРе б ЯЮФФХаЦЪЮЩ аХУгЫпаЭле ТлаРЦХЭШЩ. ІбХУЮ ЮФЭР ЪЮЬРЭФР ЯЮШбЪР/ЧРЬХЭл ЭРеЮФШв Ш ТлФХЫпХв ЯЮТвЮапойШХбп бЫЮТР ТЮ ТбХЬ ФЮЪгЬХЭвХ. ґагУРп ЪЮЬРЭФР гФРЫпХв ТбХ бваЮЪШ, ЭХ бЮФХаЦРйШХ ЯЮТвЮапойШебп бЫЮТ (Ш ЮбвРТЫпХв вЮЫмЪЮ вХ бваЮЪШ, ЪЮвЮалХ ТЪЫозРовбп Т ЮвзХв). ЅРЪЮЭХж, ваХвмп ЪЮЬРЭФР ТлТЮФШв Т ЭРзРЫХ ЪРЦФЮЩ бваЮЪШ ШЬп дРЩЫР, Ъ ЪЮвЮаЮЬг ЮвЭЮбШвбп нвР бваЮЪР.

ПЧлЪ (Perl, Python Ш в. Ф.) ЮСХбЯХзШТРХв ЯХаШдХаШЩЭго ЯЮФФХаЦЪг, ЭЮ ЯЮФЫШЭЭРп бШЫР ШбеЮФШв Юв аХУгЫпаЭле ТлаРЦХЭШЩ. ГЪаЮвШТ нвг бШЫг ФЫп бТЮШе жХЫХЩ, Тл ЭРгзШвХбм ЯШбРвм аХУгЫпаЭлХ ТлаРЦХЭШп, ЪЮвЮалХ ЮвлбЪШТРов ЭгЦЭлЩ вХЪбв Ш ЮСеЮФпв вЮ, звЮ ТРб ЭХ ШЭвХаХбгХв. їЮбЫХ нвЮУЮ ЮбвРХвбп ЮСкХФШЭШвм УЮвЮТлХ ТлаРЦХЭШп б ТбЯЮЬЮУРвХЫмЭлЬШ ЪЮЭбвагЪжШпЬШ пЧлЪР, звЮСл ТлЯЮЫЭШвм б вХЪбвЮЬ ЭгЦЭго ЮЯХаРжШо (ФЮСРТШвм ЪЮФл ТлФХЫХЭШп, гФРЫШвм вХЪбв, ШЧЬХЭШвм ХУЮ Ш в. Ф.)

АХиХЭШХ аХРЫмЭле ЧРФРз

АХУгЫпаЭлХ ТлаРЦХЭШп ЮвЪаЮов ЯХаХФ ТРЬШ ТЮЧЬЮЦЭЮбвШ, Ю ЪЮвЮале Тл, ТЮЧЬЮЦЭЮ, ФРЦХ ЭХ ЯЮФЮЧаХТРЫШ. µЦХФЭХТЭЮ п ЭХЮФЭЮЪаРвЭЮ ШбЯЮЫмЧго Ше ФЫп аХиХЭШп ТбХТЮЧЬЮЦЭле ЧРФРз — Ш ЯаЮбвле, Ш бЫЮЦЭле (Ш ХбЫШ Сл ЭХ аХУгЫпаЭлХ ТлаРЦХЭШп, ЬЭЮУШХ ЯаЮбвлХ ЧРФРзШ ЮЪРЧРЫШбм Сл ФЮТЮЫмЭЮ бЫЮЦЭлЬШ). єЮЭХзЭЮ, нддХЪвЭлХ ЯаШЬХал, ЮвЪалТРойШХ Ягвм Ъ аХиХЭШо бХамХЧЭле ЯаЮСЫХЬ, ЭРУЫпФЭЮ ФХЬЮЭбваШагов ФЮбвЮШЭбвТР аХУгЫпаЭле ТлаРЦХЭШЩ. јХЭХХ ЮзХТШФХЭ вЮв дРЪв, звЮ аХУгЫпаЭлХ ТлаРЦХЭШп ШбЯЮЫмЧговбп Т ЯЮТбХФЭХТЭЮЩ аРСЮвХ ФЫп аХиХЭШп «ЭХШЭвХаХбЭле» ЧРФРз — «ЭХШЭвХаХбЭле» Т вЮЬ бЬлбЫХ, звЮ ЯаЮУаРЬЬШбвл ТапФ ЫШ бвРЭгв ЮСбгЦФРвм Ше б ЪЮЫЫХУРЬШ Т ЪгаШЫЪХ, ЭЮ СХЧ аХиХЭШп ЪЮвЮале Тл ЭХ бЬЮЦХвХ ЭЮаЬРЫмЭЮ аРСЮвРвм. »ШзЭЮ ЬЭХ ТЮЧЬЮЦЭЮбвм ШЧСРТШвмбп Юв зРбР-ФагУЮУЮ ЭгФЭЮЩ Ш гвЮЬШвХЫмЭЮЩ аРСЮвл ЪРЦХвбп ТХбмЬР ЯаШТЫХЪРвХЫмЭЮЩ.

їаШТХФг ЯаЮбвЮЩ ЯаШЬХа<$M[R1-4]>. ѕФЭРЦФл ЬЭХ ЯЮваХСЮТРЫЮбм ЯаЮТХаШвм ЬЭЮЦХбвТЮ дРЩЫЮТ (вЮзЭХХ, 70 б ЫШиЭШЬ дРЩЫЮТ б вХЪбвЮЬ нвЮЩ ЪЭШУШ) Ш гСХФШвмбп Т вЮЬ, звЮ Т ЪРЦФЮЬ дРЩЫХ бваЮЪР SetSize ТбваХзРХвбп аЮТЭЮ бвЮЫмЪЮ ЦХ аРЧ, ЪРЪ Ш бваЮЪР ResetSize. ·РФРзР гбЫЮЦЭпЫРбм вХЬ, звЮ аХУШбва бШЬТЮЫЮТ ЯаШ ЯЮФбзХвХ ЭХ гзШвлТРЫбп (вЮ Хбвм бваЮЪШ setSIZE Ш SetSize бзШвРовбп нЪТШТРЫХЭвЭлЬШ). ѕв ЮФЭЮЩ ЬлбЫШ Ю агзЭЮЬ ЯаЮбЬЮваХ 32 000 бваЮЪ вХЪбвР п ЭХаТЭЮ ТЧФаРУШТРо. ґРЦХ ШбЯЮЫмЧЮТРЭШХ бвРЭФРавЭле ЪЮЬРЭФ ЯЮШбЪР Т аХФРЪвЮаХ ЯЮваХСгХв ТЮШбвШЭг вШвРЭШзХбЪШе гбШЫШЩ, гзШвлТРп ЪЮЫШзХбвТЮ дРЩЫЮТ Ш ТЮЧЬЮЦЭлХ аРЧЫШзШп Т аХУШбваХ бШЬТЮЫЮТ.

ЅР ЯЮЬЮйм ЯаШеЮФпв аХУгЫпаЭлХ ТлаРЦХЭШп! П ТТЮЦг ТбХУЮ ЮФЭг ЪЮаЮвЪго ЪЮЬРЭФг, ЪЮвЮаРп ЯаЮТХапХв ТбХ дРЩЫл Ш ТлФРХв Тбо ЭХЮСеЮФШЬго ШЭдЮаЬРжШо. ѕСйШХ ЧРваРвл ТаХЬХЭШ — бХЪгЭФ 15 ЭР ТТЮФ ЪЮЬРЭФл Ш ХйХ 2 бХЪгЭФл ЭР ЯаЮТХаЪг ФРЭЭле. їЮвапбРойХ! (µбЫШ ТРЬ ШЭвХаХбЭЮ, ЪРЪ ТлУЫпФШв нвР ЪЮЬРЭФР, ЧРУЫпЭШвХ ЭР б. <$R[P#,2-7]>).

ґагУЮЩ ЯаШЬХа: ЮФЭРЦФл п ЯЮЬЮУРЫ бТЮХЬг ФагУг ґЦХЪг аХиШвм ЯаЮСЫХЬл б нЫХЪваЮЭЭЮЩ ЯЮзвЮЩ ЭР гФРЫХЭЭЮЬ ЪЮЬЯмовХаХ, Ш ЮЭ ЧРеЮвХЫ, звЮСл п ЮвЯаРТШЫ ХЬг бЯШбЮЪ ТбХе бЮЮСйХЭШЩ Т дРЩЫХ ЯЮзвЮТЮУЮ пйШЪР. І ЯаШЭжШЯХ ЬЮЦЭЮ СлЫЮ ЧРУагЧШвм ЪЮЯШо ТбХУЮ дРЩЫР Т вХЪбвЮТлЩ аХФРЪвЮа Ш ТагзЭго гФРЫШвм Т ЪРЦФЮЬ бЮЮСйХЭШШ ТбХ бваЮЪШ, ЪаЮЬХ ЧРУЮЫЮТЪР. ЅЮ ФРЦХ ХбЫШ Сл дРЩЫ ЭХ СлЫ вРЪШЬ СЮЫмиШЬ Ш ХбЫШ Сл п ЭХ ШбЯЮЫмЧЮТРЫ ЬХФЫХЭЭЮХ ЯЮФЪЫозХЭШХ ЯЮ вХЫХдЮЭЭЮЩ ЫШЭШШ, нвР аРСЮвР СлЫР Сл ФЮЫУЮЩ Ш ЬЮЭЮвЮЭЭЮЩ. ЅРЪЮЭХж, зШвРвм згЦго ЯЮзвг ЯЮЯаЮбвг ЭХнвШзЭЮ.

ё бЭЮТР ЬХЭп ТлагзШЫШ аХУгЫпаЭлХ ТлаРЦХЭШп! П ТТХЫ ЯаЮбвго ЪЮЬРЭФг (ШбЯЮЫмЧгп бвРЭФРавЭго гвШЫШвг ЯЮШбЪР egrep, ЮЯШбРЭЭго ЭШЦХ Т нвЮЩ УЫРТХ) ФЫп ТлТЮФР бваЮЪ From: Ш Subject: ЪРЦФЮУЮ бЮЮСйХЭШп. ЗвЮСл вЮзЭЮ гЪРЧРвм egrep, ЪРЪШХ бваЮЪШ ФЮЫЦЭл (ШЫШ ЭХ ФЮЫЦЭл) ЯаШбгвбвТЮТРвм Т ТлеЮФЭле ФРЭЭле, п ТЮбЯЮЫмЧЮТРЫбп аХУгЫпаЭлЬ ТлаРЦХЭШХЬ [^(From|Subject):spc]. їЮЫгзШТ бЯШбЮЪ, ґЦХЪ ЯЮЯаЮбШЫ ЬХЭп ЮвЯаРТШвм ЮФЭЮ ЪЮЭЪаХвЭЮХ бЮЮСйХЭШХ — бЮбвЮпйХХ ШЧ 5 000 бваЮЪ! ё бЭЮТР ЭР ШЧТЫХзХЭШХ ЮФЭЮУЮ бЮЮСйХЭШп Т вХЪбвЮТЮЬ аХФРЪвЮаХ ЯЮваХСЮТРЫЮбм Сл бЫШиЪЮЬ ЬЭЮУЮ ТаХЬХЭШ. ІЬХбвЮ нвЮУЮ п ТЮбЯЮЫмЧЮТРЫбп ФагУЮЩ гвШЫШвЮЩ (sed) Ш ЯаШ ЯЮЬЮйШ аХУгЫпаЭле ТлаРЦХЭШЩ вЮзЭЮ ЮЯШбРЫ, ЪРЪРп зРбвм вХЪбвР Т дРЩЫХ ЬХЭп ШЭвХаХбгХв. НвЮ ЯЮЧТЮЫШЫЮ ЫХУЪЮ Ш СлбваЮ ШЧТЫХзм Ш ЮвЯаРТШвм ЭгЦЭЮХ бЮЮСйХЭШХ.

їаШЬХЭХЭШХ аХУгЫпаЭле ТлаРЦХЭШЩ бнЪЮЭЮЬШЫЮ ЭРЬ ЮСЮШЬ ЬЭЮУЮ ТаХЬХЭШ Ш бШЫ. їгбвм ЮЭЮ ЭХ СлЫЮ ЮбЮСХЭЭЮ «ШЭвХаХбЭлЬ» — Т ЫоСЮЬ бЫгзРХ нвЮ ШЭвХаХбЭХХ, зХЬ зРбРЬШ ЯаЮбШЦШТРвм ЧР вХЪбвЮТлЬ аХФРЪвЮаЮЬ. µбЫШ Сл п ЭХ ЧЭРЫ Ю бгйХбвТЮТРЭШШ аХУгЫпаЭле ТлаРЦХЭШЩ, ЬЭХ Сл Ш Т УЮЫЮТг ЭХ ЯаШиЫЮ, звЮ бгйХбвТгХв ФагУЮЩ ТлеЮФ. НвР еРаРЪвХаЭРп ШбвЮаШп ЯЮЪРЧлТРХв, звЮ ЯаШ ЯЮЬЮйШ аХУгЫпаЭле ТлаРЦХЭШЩ Ш вХе гвШЫШв, Т ЪЮвЮале ЮЭШ ЯЮФФХаЦШТРовбп, ЬЮЦЭЮ ФХЫРвм бЮТХаиХЭЭЮ ЭХЮЦШФРЭЭлХ ТХйШ. ЅРгзШТиШбм ЯЮЫмЧЮТРвмбп аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ, Тл СгФХвХ гФШТЫпвмбп, ЪРЪ ЦХ Тл аРЭмиХ ЮСеЮФШЫШбм СХЧ ЭШе.

ГЬХЭШХ аРСЮвРвм б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ — ТЮШбвШЭг СХбжХЭЭлЩ ЭРТлЪ. ёЭдЮаЬРжШп, ЯаШТХФХЭЭРп Т нвЮЩ ЪЭШУХ, ЯЮЬЮЦХв ТРЬ ЮТЫРФХвм нвШЬ ЭРТлЪЮЬ. ЅРФХобм, ЬЭХ вРЪЦХ гФРбвбп гСХФШвм ТРб Т вЮЬ, звЮ ЯЮваРзХЭЭлХ гбШЫШп ЭХ ЯаЮЯРФгв Чап.

АХУгЫпаЭлХ ТлаРЦХЭШп ЪРЪ пЧлЪ

ВХЬ, ЪЮЬг ХйХ ЭХ ЯаШеЮФШЫЮбм аРСЮвРвм б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ, бваЮЪР [^(From|Subject):spc] ШЧ ЯаХФлФгйХУЮ ЯаШЬХаР ЯЮЪРЦХвбп ЭХЯЮЭпвЭЮЩ. ЅР бРЬЮЬ ФХЫХ ЭШЪРЪЮУЮ ТЮЫиХСбвТР ЧФХбм ЭХв — ЪРЪ ЭХв ХУЮ Ш Т ТлбвгЯЫХЭШпе жШаЪЮТЮУЮ дЮЪгбЭШЪР. їаЮбвЮ дЮЪгбЭШЪ ЧЭРХв звЮ-вЮ ЯаЮбвЮХ, звЮ ЭХ ЪРЦХвбп ЯаЮбвлЬ ШЫШ ХбвХбвТХЭЭлЬ ХУЮ ЭХШбЪгиХЭЭлЬ ЧаШвХЫпЬ. БвЮШв ЭРгзШвмбп ФХаЦРвм ЪРавг вРЪ, звЮСл агЪР ЪРЧРЫРбм ЯгбвЮЩ, Ш ЭХЬЭЮУЮ ЯЮваХЭШаЮТРвмбп — Ш Тл вЮЦХ бЬЮЦХвХ «ЯЮЪРЧлТРвм дЮЪгбл». АХУгЫпаЭлХ ТлаРЦХЭШп вРЪЦХ ЬЮЦЭЮ баРТЭШвм б ШЭЮбваРЭЭлЬ пЧлЪЮЬ — ЪЮУФР Тл ЭРзШЭРХвХ ШЧгзРвм пЧлЪ, ЮЭ ЯХаХбвРХв ЪРЧРвмбп СХЫШСХаФЮЩ.

°ЭРЫЮУШп б дРЩЫЮТлЬШ иРСЫЮЭРЬШ

їЮбЪЮЫмЪг Тл ТЧпЫШбм ЧР нвг ЪЭШУг, ТХаЮпвЭЮ, Тл еЮвп Сл ЮвзРбвШ ЯаХФбвРТЫпХвХ бХСХ, звЮ вРЪЮХ «аХУгЫпаЭЮХ ТлаРЦХЭШХ». ЅЮ ФРЦХ ХбЫШ Ш ЭХ ЯаХФбвРТЫпХвХ, ЮСйШЩ ЯаШЭжШЯ Ше аРСЮвл ТРЬ ЭРТХаЭпЪР ЧЭРЪЮЬ.

єРЪ ШЧТХбвЭЮ, ЪРЦФЮЬг дРЩЫг ЯаШбТРШТРХвбп ЪЮЭЪаХвЭЮХ ШЬп (ЭРЯаШЬХа, report.txt). ѕФЭРЪЮ ЫоСЮЬг ЯЮЫмЧЮТРвХЫо Unix ШЫШ DOS/Windows ШЧТХбвЭЮ, звЮ ФЫп ТлСЮаЪШ ЭХбЪЮЫмЪШе дРЩЫЮТ ЬЮЦЭЮ ТЮбЯЮЫмЧЮТРвмбп иРСЫЮЭЮЬ ТШФР «*.txt». І ЯЮФЮСЭле иРСЫЮЭРе (ЭРЧлТРХЬле дРЩЫЮТлЬШ УЫЮСРЬШ) ШбЯЮЫмЧговбп бШЬТЮЫл[1], ШЬХойШХ ЮбЮСлЩ бЬлбЫ. ·ТХЧФЮзЪР (*) ЮЧЭРзРХв «ЫоСРп ЯЮбЫХФЮТРвХЫмЭЮбвм бШЬТЮЫЮТ», Р ТЮЯаЮбШвХЫмЭлЩ ЧЭРЪ (?) — «ЮФШЭ ЯаЮШЧТЮЫмЭлЩ бШЬТЮЫ». ёвРЪ, иРСЫЮЭ «*.txt» ЭРзШЭРХвбп б [*] Ш ЧРЪРЭзШТРХвбп бваЮЪЮТлЬ ЫШвХаРЫЮЬ [.txt]. їЮЫгзХЭЭлЩ Т аХЧгЫмвРвХ иРСЫЮЭ ЮЧЭРзРХв «ІлСаРвм ТбХ дРЩЫл, ШЬХЭР ЪЮвЮале ЭРзШЭРовбп б ЫоСЮЩ ЯЮбЫХФЮТРвХЫмЭЮбвШ бШЬТЮЫЮТ Ш ЧРЪРЭзШТРовбп бШЬТЮЫРЬШ .txt».

ІЮ ЬЭЮУШе бШбвХЬРе бгйХбвТгов ФЮЯЮЫЭШвХЫмЭлХ бЯХжШРЫмЭлХ бШЬТЮЫл, ЭЮ Т ЮСйХЬ бЫгзРХ ТлаРЧШвХЫмЭлХ ТЮЧЬЮЦЭЮбвШ дРЩЫЮТле иРСЫЮЭЮТ ЮУаРЭШзХЭл. ІЯаЮзХЬ, нвЮ ТапФ ЫШ ЬЮЦЭЮ бзШвРвм ЭХФЮбвРвЪЮЬ, ЯЮбЪЮЫмЪг дРЩЫЮТлХ иРСЫЮЭл ЯаШЬХЭповбп Т ЮвЭЮбШвХЫмЭЮ гЧЪЮЩ бдХаХ — вЮЫмЪЮ ЯаШ аРСЮвХ б ШЬХЭРЬШ дРЩЫЮТ.

Б ФагУЮЩ бвЮаЮЭл, ЯаШ аРСЮвХ б вХЪбвЮЬ ТЮЮСйХ ТЮЧЭШЪРХв УЮаРЧФЮ СЮЫмиХ ЯаЮСЫХЬ. їаЮЧР Ш ЯЮнЧШп, ЫШбвШЭУШ ЯаЮУаРЬЬ, ЮвзХвл, вХЪбвл ЯХбХЭ, HTML, бвРвмШ, вРСЫШжл, ЪЭШУШ (ТаЮФХ нвЮЩ), бЯШбЪШ бЫЮТ… ЯаШ ЦХЫРЭШШ ЯаЮФЮЫЦРЩвХ бРЬШ. єЮЭХзЭЮ, ФЫп гЧЪЮбЯХжШРЫШЧШаЮТРЭЭЮЩ ЧРФРзШ (ЭРЯаШЬХа, «ТлСЮа дРЩЫЮТ») ЬЮЦЭЮ аРЧаРСЮвРвм бЯХжШРЫШЧШаЮТРЭЭго беХЬг ШЫШ ШЭбвагЬХЭв. ЅЮ ЧР ФЮЫУШХ УЮФл СлЫ ТлаРСЮвРЭ ЮСЮСйХЭЭлЩ пЧлЪ вХЪбвЮТле иРСЫЮЭЮТ, ЮСЫРФРойШЩ ФЮбвРвЮзЭЮЩ ЬЮймо Ш ТлаРЧШвХЫмЭЮбвмо ФЫп ЯаШЬХЭХЭШп Т аРЧЭле ЮСЫРбвпе. єРЦФРп ЯаЮУаРЬЬР ЯЮ-бТЮХЬг аХРЫШЧгХв Ш ШбЯЮЫмЧгХв нвШ иРСЫЮЭл, ЭЮ ЮСлзЭЮ нвЮв ЬЮйЭлЩ пЧлЪ Ш бРЬШ иРСЫЮЭл ЭРЧлТРовбп «аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ».

°ЭРЫЮУШп б пЧлЪРЬШ

АХУгЫпаЭЮХ ТлаРЦХЭШХ бЮбвЮШв ШЧ ФТге вШЯЮТ бШЬТЮЫЮТ. БЯХжШРЫмЭлХ бШЬТЮЫл (ТаЮФХ * Т дРЩЫЮТле иРСЫЮЭРе) ЭРЧлТРовбп ЬХвРбШЬТЮЫРЬШ. ІбХ ЮбвРЫмЭлХ бШЬТЮЫл, вЮ Хбвм ЮСлзЭлЩ вХЪбв, ЭРЧлТРовбп ЫШвХаРЫРЬШ. АХУгЫпаЭлХ ТлаРЦХЭШп ЮвЫШзРовбп Юв дРЩЫЮТле иРСЫЮЭЮТ Т ЯХаТго ЮзХаХФм ЯЮ ТЮЧЬЮЦЭЮбвпЬ бТЮШе ЬХвРбШЬТЮЫЮТ. І дРЩЫЮТле иРСЫЮЭРе ШбЯЮЫмЧгХвбп ЬРЫЮХ ЪЮЫШзХбвТЮ ЬХвРбШЬТЮЫЮТ, ЯаХФЭРЧЭРзХЭЭле ФЫп ЮУаРЭШзХЭЭле жХЫХЩ, ЭЮ «пЧлЪ» аХУгЫпаЭле ТлаРЦХЭШЩ бЮФХаЦШв СЮУРвлЩ Ш ТЯХзРвЫпойШЩ ЭРСЮа ЬХвРбШЬТЮЫЮТ ФЫп ЮЯлвЭле ЯЮЫмЧЮТРвХЫХЩ.

АХУгЫпаЭлХ ТлаРЦХЭШп ЬЮЦЭЮ аРббЬРваШТРвм ЪРЪ бРЬЮбвЮпвХЫмЭлЩ пЧлЪ, Т ЪЮвЮаЮЬ ЫШвХаРЫл ТлЯЮЫЭпов дгЭЪжШШ бЫЮТ, Р ЬХвРбШЬТЮЫл — дгЭЪжШШ УаРЬЬРвШзХбЪШе нЫХЬХЭвЮТ. БЫЮТР ЯЮ ЮЯаХФХЫХЭЭлЬ ЯаРТШЫРЬ ЮСкХФШЭповбп б УаРЬЬРвШзХбЪШЬШ нЫХЬХЭвРЬШ Ш бЮЧФРов ЪЮЭбвагЪжШШ, ТлаРЦРойШХ ЭХЪЮвЮаго ЬлбЫм. БЪРЦХЬ, Т ЯаШЬХаХ б нЫХЪваЮЭЭЮЩ ЯЮзвЮЩ п ТЮбЯЮЫмЧЮТРЫбп аХУгЫпаЭлЬ ТлаРЦХЭШХЬ [^(From|Subject):spc] ФЫп ЯЮШбЪР бваЮЪ, ЭРзШЭРойШебп б «From:spc» ШЫШ «Subject:spc». јХвРбШЬТЮЫл Т нвЮЬ ТлаРЦХЭШШ ЯЮФзХаЪЭгвл, Р Ше бЬлбЫ СгФХв аРббЬЮваХЭ ЭШЦХ.

ЅР ЯХаТлЩ ТЧУЫпФ аХУгЫпаЭлХ ТлаРЦХЭШп (ЪРЪ Ш ЫоСЮЩ ФагУЮЩ ЭХЧЭРЪЮЬлЩ пЧлЪ) ЯаЮШЧТЮФпв гбваРиРойХХ ТЯХзРвЫХЭШХ. ѕЭШ ТлУЫпФпв ЪРЪ ЬРУШзХбЪШХ ЧРЪЫШЭРЭШп, ЯЮЭпвЭлХ ЫШим ФЫп ЭХЬЭЮУШе ШЧСаРЭЭле Ш РСбЮЫовЭЮ ЭХФЮбвгЯЭлХ ФЫп ЯаЮбвле бЬХавЭле. ЅЮ ЯЮФЮСЭЮ вЮЬг, ЪРЪ бваЮЪР ###5-1###[2]<$M[R1-2]> ТбЪЮаХ бвРЭЮТШвбп ЯЮЭпвЭЮЩ ФЫп ШЧгзРойХУЮ пЯЮЭбЪШЩ пЧлЪ, аХУгЫпаЭЮХ ТлаРЦХЭШХ Т ЪЮЬРЭФХ

їаШТХФХЭЭлЩ ЯаШЬХа ТЧпв ШЧ бжХЭРаШп Perl, ШбЯЮЫмЧЮТРЭЭЮУЮ ЬЮШЬ аХФРЪвЮаЮЬ ЯаШ ЯаРТЪХ РТвЮабЪЮУЮ ТРаШРЭвР агЪЮЯШбШ. °ТвЮа ЮиШСЮзЭЮ ШбЯЮЫмЧЮТРЫ вХУШ <emphasis> ФЫп ЯЮЬХвЪШ IP-РФаХбЮТ (ЪЮвЮалХ ТлУЫпФпв ЪРЪ ЭРСЮа зШбХЫ, аРЧФХЫХЭЭле вЮзЪРЬШ — ЭРЯаШЬХа, 198.112.208.25). І нвЮЩ ЪЮЬРЭФХ Perl, ЯаХФЭРЧЭРзХЭЭЮЩ ФЫп ЯЮШбЪР/ЧРЬХЭл вХЪбвР, аХУгЫпаЭЮХ ТлаРЦХЭШХ<$M[R1-5]>

ЧРЬХЭпХв Ше вХУРЬШ <inet>, ЮбвРТЫпп ЯаЮзШХ вХУШ <emphasis> СХЧ ШЧЬХЭХЭШп. І бЫХФгойШе УЫРТРе Тл гЧЭРХвХ, ЪРЪ ЪЮЭбвагШаговбп ЯЮФЮСЭлХ ТлаРЦХЭШп, Ш бЬЮЦХвХ ШбЯЮЫмЧЮТРвм Ше Т бТЮШе жХЫпе.

ЖХЫм нвЮЩ ЪЭШУШ

ІапФ ЫШ ЫШзЭЮ ТРЬ ЪЮУФР-ЭШСгФм ЯаШФХвбп ЧРЬХЭпвм вХУШ <emphasis> вХУРЬШ <inet>, ЭЮ ЯЮеЮЦШХ ЧРФРзШ вШЯР «ЭРЩвШ вЮ-вЮ Ш ЧРЬХЭШвм вХЬ-вЮ» ТЮЧЭШЪРов ФЮТЮЫмЭЮ зРбвЮ. НвР ЪЭШУР ЭРЯШбРЭР ЭХ ФЫп вЮУЮ, звЮСл бЭРСФШвм ТРб УЮвЮТлЬШ аХиХЭШпЬШ ЪЮЭЪаХвЭле ЯаЮСЫХЬ. ѕЭР ЭРгзШв ТРб ЬлбЫШвм ЪРвХУЮаШпЬШ аХУгЫпаЭле ТлаРЦХЭШЩ, звЮСл Тл ЬЮУЫШ гбЯХиЭЮ бЯаРТШвмбп б ЫоСЮЩ ЧРФРзХЩ вРЪЮУЮ вШЯР.

АХУгЫпаЭлХ ТлаРЦХЭШп ЪРЪ ЮбЮСлЩ бЪЫРФ гЬР

єРЪ Тл ТбЪЮаХ гЧЭРХвХ, СЮЫмиШХ аХУгЫпаЭлХ ТлаРЦХЭШп бваЮпвбп ШЧ ЬРЫХЭмЪШе «ЪШаЯШзХЩ». БРЬШ ЯЮ бХСХ нвШ «ЪШаЯШзШ» ЯаЮбвл, ЭЮ Т бЮзХвРЭШШ ФагУ б ФагУЮЬ ЮЭШ ЮСаРЧгов СХбЪЮЭХзЭЮХ ЬЭЮЦХбвТЮ ЪЮЬСШЭРжШЩ. ЗвЮСл ЭРгзШвмбп ЯаРТШЫмЭЮ ЮСкХФШЭпвм Ше ФЫп ФЮбвШЦХЭШп ЦХЫРХЬЮЩ жХЫШ, ТРЬ ЯЮваХСгХвбп ЭХЪЮвЮалЩ ЮЯлв.

їЮЩЬШвХ ЬХЭп ЯаРТШЫмЭЮ — ШЧгзШвм аХУгЫпаЭлХ ТлаРЦХЭШп Ш ЭРгзШвмбп ЯЮЫмЧЮТРвмбп ШЬШ ЭХ гЦ бЫЮЦЭЮ. ±ЮЫХХ вЮУЮ, Ъ ЪЮЭжг нвЮЩ УЫРТл Тл ЮбТЮШвХ ЭХЪЮвЮалХ ТЮЧЬЮЦЭЮбвШ аХУгЫпаЭле ТлаРЦХЭШЩ, ФРЦХ ХбЫШ Тл бвЮЫЪЭгЫШбм б ЭШЬШ ТЯХаТлХ.

ЅЮ ЧФХбм, ЪРЪ Ш Т ЫоСЮЬ ФХЫХ, ЭШзвЮ ЭХ ЧРЬХЭШв ЯаРЪвШзХбЪЮУЮ ЮЯлвР. ѕЯлв дЮаЬШагХв ЮбЮСлЩ бЪЫРФ гЬР Ш гЯЮапФЮзШТРХв ЭРЯаРТЫХЭШХ ЬлбЫХЩ. НвЮ вагФЭЮ ЮЯШбРвм бЫЮТРЬШ, ЭЮ ЫХУЪЮ ЯаЮФХЬЮЭбваШаЮТРвм ЭР ЯаШЬХаРе, ЯЮнвЮЬг Т нвЮЩ УЫРТХ п еЮзг Т ЮСйШе зХавРе ЯаХФбвРТШвм ТРЬ ЭХЪЮвЮалХ ЪЮЭжХЯжШШ аХУгЫпаЭле ТлаРЦХЭШЩ. ЅХ гУЫгСЫппбм Т ЯЮФаЮСЭЮбвШ, нвЮв ЮСЧЮа ЧРЪЫРФлТРХв ЮбЭЮТг ФЫп ТбХУЮ ЬРвХаШРЫР ЪЭШУШ Ш УЮвЮТШв ЯЮзТг ФЫп ТРЦЭле ТЮЯаЮбЮТ, ЪЮвЮалХ ЫгзиХ ЮСбгФШвм ФЮ вЮУЮ, ЪРЪ Ьл ЧРЩЬХЬбп бРЬШЬШ аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ.

ЕЮвп ЭХЪЮвЮалХ ЯаШЬХал ТлУЫпФпв УЫгЯлЬШ (ЯЮвЮЬг звЮ ЮЭШ ФХЩбвТШвХЫмЭЮ УЫгЯлХ), ЮЭШ еЮаЮиЮ бЮЮвТХвбвТгов вХЬ ЧРФРзРЬ, ЪЮвЮалХ ТРЬ ЯаХФбвЮШв аХиРвм — Ягбвм Тл ФРЦХ нвЮУЮ ХйХ ЭХ ЯЮЭШЬРХвХ. µбЫШ звЮ-вЮ ШЧ бЪРЧРЭЭЮУЮ ЯЮЪРЦХвбп ЭХЯЮЭпвЭлЬ, ЭХ ЮУЮазРЩвХбм. їЮбвРаРЩвХбм гЫЮТШвм ЮСйШЩ бЬлбЫ. ёЬХЭЭЮ б нвЮЩ жХЫмо ЭРЯШбРЭР ФРЭЭРп УЫРТР.

ЗШвРвХЫШ, ЧЭРЪЮЬлХ б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ, ТапФ ЫШ гЧЭРов ШЧ нвЮУЮ ЮСЧЮаР звЮ-ЭШСгФм ЯаШЭжШЯШРЫмЭЮ ЭЮТЮХ — ЭЮ, ЯЮЦРЫгЩбвР, еЮвп Сл ЯаЮбЬЮваШвХ ХУЮ. ґРЦХ ХбЫШ Тл ЧЭРХвХ бЬлбЫ ЭХЪЮвЮале ЬХвРбШЬТЮЫЮТ, ЬЮЦХв Слвм, ЪРЪШХ-вЮ ЮбЮСХЭЭЮбвШ ШЫШ РбЯХЪвл ЯаШЬХЭХЭШп аХУгЫпаЭле ТлаРЦХЭШЩ ЮЪРЦгвбп ЭЮТлЬШ ФЫп ТРб.

їЮФЮСЭЮ аРЧЫШзШпЬ ЬХЦФг еЮаЮиШЬ ШбЯЮЫЭХЭШХЬ ЬгЧлЪРЫмЭЮУЮ ЯаЮШЧТХФХЭШп Ш бЮвТЮаХЭШХЬ ЬгЧлЪШ, бгйХбвТгов аРЧЫШзШп ЬХЦФг ЯЮЭШЬРЭШХЬ аХУгЫпаЭле ТлаРЦХЭШЩ Ш Ше ЭРбвЮпйШЬ ЯЮЭШЬРЭШХЬ. ІЮЧЬЮЦЭЮ, ШЭдЮаЬРжШп, ЯаХФбвРТЫХЭЭРп Т ЭХЪЮвЮале гаЮЪРе, ЮЪРЦХвбп ЧЭРЪЮЬЮЩ, ЭЮ СгФХв ЯаХФбвРТЫХЭР ЯЮФ ЭЮТлЬ гУЫЮЬ ЧаХЭШп, Ш нвЮ ЮЪРЦХвбп ЯХаТлЬ иРУЮЬ ЭР ЯгвШ Ъ ЭРбвЮпйХЬг ЯЮЭШЬРЭШо.

їЮШбЪ Т вХЪбвЮТле дРЩЫРе: egrep

ѕФЭШЬ ШЧ ЯаЮбвХЩиШе ЯаШЬХЭХЭШЩ аХУгЫпаЭле ТлаРЦХЭШЩ пТЫпХвбп ЯЮШбЪ вХЪбвР — ТЮ ЬЭЮУШе вХЪбвЮТле аХФРЪвЮаРе бгйХбвТгХв ТЮЧЬЮЦЭЮбвм ЯЮШбЪР ЯЮ иРСЫЮЭРЬ аХУгЫпаЭле ТлаРЦХЭШЩ. µйХ СЮЫХХ ЯаЮбвлЬ ЯаШЬХаЮЬ пТЫпХвбп гвШЫШвР egrep[3]. їаШ ЧРЯгбЪХ ЯаЮУаРЬЬХ egrep ЯХаХФРХвбп аХУгЫпаЭЮХ ТлаРЦХЭШХ Ш бЯШбЮЪ ЯаЮбЬРваШТРХЬле дРЩЫЮТ. ѕЭР бЮЯЮбвРТЫпХв аХУгЫпаЭЮХ ТлаРЦХЭШХ б ЪРЦФЮЩ бваЮЪЮЩ дРЩЫР Ш ТлТЮФШв вЮЫмЪЮ вХ бваЮЪШ, Т ЪЮвЮале СлЫЮ ЭРЩФХЭЮ бЮТЯРФХЭШХ.

ІХаЭХЬбп Ъ ЯаШЬХаг б нЫХЪваЮЭЭЮЩ ЯЮзвЮЩ. ёбЯЮЫмЧЮТРЭЭРп ЬЭЮЩ ЪЮЬРЭФР ЯЮЪРЧРЭР ЭР аШб. 1.1. egrep ШЭвХаЯаХвШагХв ЯХаТлЩ РаУгЬХЭв ЪЮЬРЭФЭЮЩ бваЮЪШ ЪРЪ аХУгЫпаЭЮХ ТлаРЦХЭШХ, Р ЮбвРЫмЭлХ РаУгЬХЭвл — ЪРЪ ШЬХЭР ЯаЮбЬРваШТРХЬле дРЩЫЮТ. ѕСаРвШвХ ТЭШЬРЭШХ: РЯЮбваЮдл, ЯаШбгвбвТгойШХ ЭР аШб. 1.1, ЭХ ТеЮФпв Т аХУгЫпаЭЮХ ТлаРЦХЭШХ, ЭЮ Ше ЯаШбгвбвТШп ваХСгХв ЬЮЩ ЪЮЬРЭФЭлЩ ШЭвХаЯаХвРвЮа[4]. їаШ ШбЯЮЫмЧЮТРЭШШ egrep п ЯЮзвШ ТбХУФР ЧРЪЫозРо аХУгЫпаЭлХ ТлаРЦХЭШп Т РЯЮбваЮдл.

µбЫШ Т ТРиХЬ аХУгЫпаЭЮЬ ТлаРЦХЭШШ ЭХ ШбЯЮЫмЧгХвбп ЭШ ЮФШЭ ШЧ ФХбпвЪР б ЫШиЭШЬ ЬХвРбШЬТЮЫЮТ, ЯЮФФХаЦШТРХЬле egrep, ЮЭЮ дРЪвШзХбЪШ ЯаХТаРйРХвбп Т баХФбвТЮ «ЯаЮбвЮУЮ ЯЮШбЪР вХЪбвР». ЅРЯаШЬХа, ЯаШ ЯЮШбЪХ ТлаРЦХЭШп [cat] СгФгв ЭРЩФХЭл Ш ТлТХФХЭл ТбХ бваЮЪШ дРЩЫР, бЮФХаЦРйШХ ваШ бвЮпйШе ЯЮФапФ СгЪТл cdotadott. БаХФШ ЭШе СгФгв ТлТХФХЭл бваЮЪШ, Т ЪЮвЮале ТбваХзРХвбп бЫЮТЮ vacation.

ґРЦХ ХбЫШ Т бваЮЪХ ЭХв ЮвФХЫмЭЮУЮ бЫЮТР cat, ЯЮбЫХФЮТРвХЫмЭЮбвм cdotadott Т бЫЮТХ vacation ТбХ аРТЭЮ бзШвРХвбп гбЯХиЭЮ ЭРЩФХЭЭЮЩ. ЅХЮСеЮФШЬЮ вЮЫмЪЮ ЭРЫШзШХ гЪРЧРЭЭле бШЬТЮЫЮТ, Ш ЯЮбЪЮЫмЪг бШЬТЮЫл ЯаШбгвбвТгов — egrep ТлТЮФШв Тбо бваЮЪг. єЫозХТлЬ ЬЮЬХЭвЮЬ ЧФХбм пТЫпХвбп вЮ, звЮ ЯЮШбЪ ЮбгйХбвТЫпХвбп ЭХ ЭР гаЮТЭХ «бЫЮТ» — egrep аРЧЫШзРХв СРЩвл Ш бваЮЪШ дРЩЫР, ЭЮ ЮСлзЭЮ ЭХ ШЬХХв ЭШ ЬРЫХЩиХУЮ ЯаХФбвРТЫХЭШп Ю пЧлЪРе, ЯаХФЫЮЦХЭШпе, РСЧРжРе ШЫШ ФагУШе ЪЮЭжХЯжШпе ТлбЮЪЮУЮ гаЮТЭп[5].

јХвРбШЬТЮЫл egrep

ЅРзЭХЬ б аРббЬЮваХЭШп ЭХЪЮвЮале ЬХвРбШЬТЮЫЮТ, ШбЯЮЫмЧгХЬле egrep ЯаШ аРСЮвХ б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ. БгйХбвТгХв ЭХбЪЮЫмЪЮ вШЯЮТ ЬХвРбШЬТЮЫЮТ, ТлЯЮЫЭпойШе аРЧЭлХ дгЭЪжШШ. јл Т ЮСйШе зХавРе ЯЮЧЭРЪЮЬШЬбп б ЭШЬШ Т ЭХбЪЮЫмЪШе ЯаШЬХаРе, Р ЯЮФаЮСЭлХ ЮЯШбРЭШп Ш ЬЭЮУЮзШбЫХЭЭлХ ЯаШЬХал СгФгв ЯаШТХФХЭл Т ЯЮбЫХФгойШе УЫРТРе.

їаХЦФХ зХЬ зШвРвм ФРЫмиХ, ЯЮЦРЫгЩбвР, ЯаЮбЬЮваШвХ бЯШбЮЪ гбЫЮТЭле ЮСЮЧЭРзХЭШЩ Т ЯаХФШбЫЮТШШ (б. <$R[P#,R0-1]>). І ЪЭШУХ ШбЯЮЫмЧговбп ЭХЪЮвЮалХ ЭХбвРЭФРавЭлХ ЮСЮЧЭРзХЭШп, Ш бЬлбЫ ЪРЪШе-ЫШСЮ ШЧ ЭШе ЬЮЦХв ЮЪРЧРвмбп ЭХЮзХТШФЭлЬ.

ЅРзРЫЮ Ш ЪЮЭХж бваЮЪШ

ІХаЮпвЭЮ, ЯаЮбвХЩиШЬШ ЬХвРбШЬТЮЫРЬШ пТЫповбп [^] (ЪалиЪР, жШаЪгЬдЫХЪб) Ш [$] (ФЮЫЫРа), ЯаХФбвРТЫпойШХ бЮЮвТХвбвТХЭЭЮ ЭРзРЫЮ Ш ЪЮЭХж ЯаЮТХапХЬЮЩ бваЮЪШ. єРЪ УЮТЮаШЫЮбм ТлиХ, аХУгЫпаЭЮХ ТлаРЦХЭШХ [cat] ЭРеЮФШв ЯЮбЫХФЮТРвХЫмЭЮбвм бШЬТЮЫЮТ cdotadott Т ЫоСЮЬ ЬХбвХ бваЮЪШ, ЭЮ ФЫп ТлаРЦХЭШп [^cat] бЮТЯРФХЭШХ ЯаЮШбеЮФШв ЫШим Т вЮЬ бЫгзРХ, ХбЫШ бШЬТЮЫл cdotadott ЭРеЮФпвбп Т ЭРзРЫХ бваЮЪШ — [^] дРЪвШзХбЪШ ЯаШТпЧлТРХв бЮТЯРФХЭШХ (ЮбвРЫмЭЮЩ зРбвШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп) Ъ ЭРзРЫг бваЮЪШ. °ЭРЫЮУШзЭЮ, ТлаРЦХЭШХ [cat$] ЭРеЮФШв бШЬТЮЫл cdotadott вЮЫмЪЮ Т вЮЬ бЫгзРХ, ХбЫШ ЮЭШ ЭРеЮФпвбп Т ЪЮЭжХ бваЮЪШ — ЭРЯаШЬХа, ХбЫШ бваЮЪР ЧРТХаиРХвбп бЫЮТЮЬ scat.

АРЧТШТРЩвХ Т бХСХ ЯаШТлзЪг СгЪТРЫмЭЮ ШЭвХаЯаХвШаЮТРвм аХУгЫпаЭлХ ТлаРЦХЭШп. ЅРЯаШЬХа, ЭХ ФгЬРЩвХ:

«[^cat] бЮТЯРФРХв, ХбЫШ бваЮЪР ЭРзШЭРХвбп б cat»

«[^cat] бЮТЯРФРХв, ХбЫШ Ьл ЭРеЮФШЬбп Т ЭРзРЫХ бваЮЪШ, ЯЮбЫХ ЪЮвЮаЮУЮ баРЧг ЦХ бЫХФгХв бШЬТЮЫ c, ЯЮвЮЬ ЭХЬХФЫХЭЭЮ бЫХФгХв бШЬТЮЫ a, Ш ЯЮвЮЬ ЭХЬХФЫХЭЭЮ бЫХФгХв бШЬТЮЫ c».

ДРЪвШзХбЪШ нвЮ ЮСЮЧЭРзРХв ЮФЭЮ Ш вЮ ЦХ, ЭЮ СгЪТРЫмЭРп ШЭвХаЯаХвРжШп ЯЮЧТЮЫШв ТРЬ ЫгзиХ ЯЮЭпвм бгвм ЭЮТЮУЮ ТлаРЦХЭШп, ЪЮУФР ЮЭЮ ТРЬ ТбваХвШвбп. <$M[R1-7]>єРЪ Сл Тл ЯаЮзШвРЫШ ТлаРЦХЭШХ [^cat$] ШЫШ ФРЦХ ЯаЮбвХЩиХХ [^]? refїХаХТХаЭШвХ бваРЭШжг, звЮСл ЯаЮТХаШвм бТЮо ШЭвХаЯаХвРжШо.

БЯХжШдШЪР бШЬТЮЫЮТ ^ Ш $ ЧРЪЫозРХвбп Т вЮЬ, звЮ ЮЭШ бЮТЯРФРов б ЮЯаХФХЫХЭЭЮЩ ЯЮЧШжШХЩ бваЮЪШ, Р ЭХ б бШЬТЮЫРЬШ вХЪбвР. єЮЭХзЭЮ, СЮЫмиРп зРбвм ЬХвРбШЬТЮЫЮТ ЯаХФЭРЧЭРзХЭР ФЫп ЯЮШбЪР ШЬХЭЭЮ вХЪбвР. їЮЬШЬЮ бШЬТЮЫЮТ-ЫШвХаРЫЮТ, Т аХУгЫпаЭле ТлаРЦХЭШпе вРЪЦХ ЬЮЦЭЮ ШбЯЮЫмЧЮТРвм ЬХвРбШЬТЮЫл, ЮЯШбРЭЭлХ Т ЭХбЪЮЫмЪШе бЫХФгойШе аРЧФХЫРе.

БШЬТЮЫмЭлХ ЪЫРббл

БЮТЯРФХЭШХ б ЮФЭШЬ бШЬТЮЫЮЬ ШЧ ЭХбЪЮЫмЪШе ТЮЧЬЮЦЭле

ґЮЯгбвШЬ, Тл еЮвШвХ ЭРЩвШ бваЮЪг «grey», ЪЮвЮаРп вРЪЦХ ЬЮЦХв Слвм ЧРЯШбРЭР Ш Т ТШФХ «gray». їаШ ЯЮЬЮйШ ЪЮЭбвагЪжШШ [[…]], ЭРЧлТРХЬЮЩ бШЬТЮЫмЭлЬ ЪЫРббЮЬ (character class), ЬЮЦЭЮ ЯХаХзШбЫШвм бШЬТЮЫл, ЪЮвЮалХ ЬЮУгв ЭРеЮФШвмбп Т ФРЭЭЮЩ ЯЮЧШжШШ вХЪбвР: [gr[ea]y]. НвЮ ТлаРЦХЭШХ ЮЧЭРзРХв: «ЅРЩвШ бШЬТЮЫ g, ЧР ЪЮвЮалЬ бЫХФгХв r, ЧР ЪЮвЮалЬ бЫХФгХв e ШЫШ a, Ш ТбХ нвЮ ЧРТХаиРХвбп бШЬТЮЫЮЬ y». І ЮадЮУаРдШШ п ЭХ бШЫХЭ Ш ЯЮнвЮЬг ТбХУФР ШбЯЮЫмЧго вРЪШХ аХУгЫпаЭлХ ТлаРЦХЭШп ФЫп ЯЮШбЪР ЯаРТШЫмЭле ТРаШРЭвЮТ ЭРЯШбРЭШп Т бЯШбЪРе бЫЮТ. І зРбвЭЮбвШ, п ЭХаХФЪЮ ШбЯЮЫмЧго ТлаРЦХЭШХ [sep[ea]r[ea]te], ЯЮвЮЬг звЮ ЭШЪРЪ ЭХ ЬЮУг ЧРЯЮЬЭШвм, ЪРЪ ЦХ ЯаРТШЫмЭЮ ЯШиХвбп нвЮ бЫЮТЮ — «seperate», «separate», «separete» ШЫШ ЪРЪ-ЭШСгФм ХйХ.

µйХ ЮФШЭ ЯаШЬХа — ТЮЧЬЮЦЭРп бЬХЭР аХУШбваР Т ЯХаТЮЩ СгЪТХ бЫЮТР: [[Ss]mith]. їЮЬЭШвХ: нвЮ ТлаРЦХЭШХ ЯЮ-ЯаХЦЭХЬг бЮТЯРФРХв бЮ бваЮЪРЬШ, г ЪЮвЮале ЯЮбЫХФЮТРвХЫмЭЮбвм smith (ШЫШ Smith) ЭРеЮФШвбп ТЭгваШ ФагУЮУЮ бЫЮТР — ЭРЯаШЬХа, blacksmith. П ЭХ еЮзг бЭЮТР Ш бЭЮТР ЭРЯЮЬШЭРвм ЮС нвЮЬ, ЭЮ г ЭЮТШзЪЮТ ЭХаХФЪЮ ТЮЧЭШЪРов ЯаЮСЫХЬл. ЅХЪЮвЮалХ аХиХЭШп ЯаЮСЫХЬл «ТбваЮХЭЭле» бЫЮТ СгФгв аРббЬЮваХЭл ЭШЦХ, ЯЮбЫХ вЮУЮ, ЪРЪ Ьл аРббЬЮваШЬ ХйХ ЭХбЪЮЫмЪЮ ЬХвРбШЬТЮЫЮТ.

єЮЫШзХбвТЮ бШЬТЮЫЮТ Т ЪЫРббХ ЬЮЦХв Слвм ЫоСлЬ. ЅРЯаШЬХа, ЪЫРбб [[123456]] бЮТЯРФРХв б ЫоСЮЩ ШЧ ЯХаХзШбЫХЭЭле жШда. НвЮв ЪЫРбб ЬЮЦХв ШбЯЮЫмЧЮТРвмбп ЪРЪ зРбвм ТлаРЦХЭШп [<H[123456]>], бЮТЯРФРойХУЮ б вХУРЬШ ЧРУЮЫЮТЪЮТ HTML <H1>, <H2>, <H3> Ш в. Ф.

І ЪЮЭвХЪбвХ бШЬТЮЫмЭЮУЮ ЪЫРббР ЬХвРбШЬТЮЫ бШЬТЮЫмЭЮУЮ ЪЫРббР - (ФХдШб) ЮСЮЧЭРзРХв ШЭвХаТРЫ бШЬТЮЫЮТ; вРЪ, ТлаРЦХЭШХ [<H[1-6]>] нЪТШТРЫХЭвЭЮ ЯаХФлФгйХЬг ЯаШЬХаг. єЫРббл [[0-9]] Ш [[a-z]] ЮСлзЭЮ ШбЯЮЫмЧговбп бЮЮвТХвбвТХЭЭЮ ФЫп ЯЮШбЪР жШда Ш бШЬТЮЫЮТ ЭШЦЭХУЮ аХУШбваР. БШЬТЮЫмЭлЩ ЪЫРбб ЬЮЦХв бЮФХаЦРвм ЭХбЪЮЫмЪЮ ШЭвХаТРЫЮТ, ЯЮнвЮЬг ЪЫРбб [[0123456789abcdefABCDEF]] ЧРЯШблТРХвбп Т ТШФХ [[0-9a-fA-F]]. ВРЪЮХ ТлаРЦХЭШХ ЯаШУЮФШвбп ЯаШ ЮСаРСЮвЪХ иХбвЭРФжРвХаШзЭле зШбХЫ. ёЭвХаТРЫл ФРЦХ ЬЮЦЭЮ ЮСкХФШЭпвм б ЫШвХаРЫРЬШ: ТлаРЦХЭШХ [[0-9A-Z_!.?]] бЮТЯРФРХв б жШдаЮЩ, бШЬТЮЫЮЬ ТХаеЭХУЮ аХУШбваР, бШЬТЮЫЮЬ ЯЮФзХаЪШТРЭШп, ТЮбЪЫШжРвХЫмЭлЬ ЧЭРЪЮЬ, вЮзЪЮЩ ШЫШ ТЮЯаЮбШвХЫмЭлЬ ЧЭРЪЮЬ.

ѕСаРвШвХ ТЭШЬРЭШХ: ФХдШб ТлЯЮЫЭпХв дгЭЪжШШ ЬХвРбШЬТЮЫР вЮЫмЪЮ ТЭгваШ бШЬТЮЫмЭЮУЮ ЪЫРббР — Т ЮбвРЫмЭле бЫгзРпе ЮЭ бЮТЯРФРХв б ЮСлзЭлЬ ФХдШбЮЬ. ±ЮЫХХ вЮУЮ, ФРЦХ Т бШЬТЮЫмЭле ЪЫРббРе ФХдШб ЭХ ТбХУФР ШЭвХаЯаХвШагХвбп ЪРЪ ЬХвРбШЬТЮЫ. µбЫШ ФХдШб пТЫпХвбп ЯХаТлЬ бШЬТЮЫЮЬ, гЪРЧРЭЭлЬ Т ЪЫРббХ, ЮЭ ЧРТХФЮЬЮ ЭХ ЬЮЦХв ЮЯаХФХЫпвм ШЭвХаТРЫ Ш ЯЮнвЮЬг ШЭвХаЯаХвШагХвбп ЪРЪ ЫШвХаРЫ.

l БШЬТЮЫмЭлХ ЪЫРббл ЬЮЦЭЮ аРббЬРваШТРвм ЪРЪ бТЮХЮСаРЧЭлЩ ЬШЭШ-пЧлЪ. їаРТШЫР, ЮЯаХФХЫпойШХ бЮбвРТ ЯЮФФХаЦШТРХЬле ЬХвРбШЬТЮЫЮТ (Ш Ше дгЭЪжШШ) ТЭгваШ ЪЫРббР Ш ЧР ХУЮ ЯаХФХЫРЬШ, ЯЮЫЭЮбвмо ЮвЫШзРовбп.

±гЪТРЫмЭЮ: бЮТЯРФРХв, ХбЫШ г бваЮЪШ Хбвм ЭРзРЫЮ (ЪЮЭХзЭЮ, ЮЭЮ Хбвм г ЫоСЮЩ бваЮЪШ), ЧР ЪЮвЮалЬ баРЧг ЦХ бЫХФгов бШЬТЮЫл cdotadott, ЯЮбЫХ зХУЮ ЭХЬХФЫХЭЭЮ бЫХФгХв ЪЮЭХж бваЮЪШ.

ДРЪвШзХбЪШ: бваЮЪР бЮбвЮШв вЮЫмЪЮ ШЧ бЫЮТР cat — ЭШЪРЪШе ФЮЯЮЫЭШвХЫмЭле бЫЮТ, ЯаЮСХЫЮТ, ЧЭРЪЮТ ЯаХЯШЭРЭШп… ЪЮаЮзХ, ЭШзХУЮ ЫШиЭХУЮ.

±гЪТРЫмЭЮ: бЮТЯРФРХв, ХбЫШ г бваЮЪШ Хбвм ЭРзРЫЮ, ЯЮбЫХ ЪЮвЮаЮУЮ ЭХЬХФЫХЭЭЮ бЫХФгХв ЪЮЭХж бваЮЪШ.

ДРЪвШзХбЪШ: ЯгбвРп бваЮЪР (ЭХ бЮФХаЦРйРп ЭШЪРЪШе бШЬТЮЫЮТ, ФРЦХ ЯаЮСХЫЮТ).

±гЪТРЫмЭЮ: бЮТЯРФРХв, ХбЫШ г бваЮЪШ Хбвм ЭРзРЫЮ.

ДРЪвШзХбЪШ: СХббЬлбЫХЭЭЮ! ЅРзРЫЮ Хбвм г ЫоСЮЩ бваЮЪШ, ЯЮнвЮЬг бЮТЯРФРов ТбХ бваЮЪШ — ФРЦХ ЯгбвлХ!

ёЭТХавШаЮТРЭЭлХ бШЬТЮЫмЭлХ ЪЫРббл

µбЫШ ТЬХбвЮ [[…]] ШбЯЮЫмЧгХвбп ЧРЯШбм [[^…]], ЪЫРбб бЮТЯРФРХв б ЫоСлЬШ бШЬТЮЫРЬШ, ЭХ ТеЮФпйШЬШ Т ЯаШТХФХЭЭлЩ бЯШбЮЪ. ЅРЯаШЬХа, [[^1-6]] бЮТЯРФРХв б бШЬТЮЫЮЬ, ЭХ ЯаШЭРФЫХЦРйШЬ ШЭвХаТРЫг Юв 1 ФЮ 6. їаХдШЪб ^ Т ЪРЪЮЬ-вЮ бЬлбЫХ «ШЭТХавШагХв» бЯШбЮЪ — ТЬХбвЮ вЮУЮ, звЮСл ЯХаХзШбЫпвм бШЬТЮЫл, ЯаШЭРФЫХЦРйШХ ЪЫРббг, Тл ЯХаХзШбЫпХвХ бШЬТЮЫл, ЭХ ТеЮФпйШХ Т ЭХУЮ.

ІЮЧЬЮЦЭЮ, Тл ЧРЬХвШЫШ, звЮ ФЫп ШЭТХавШаЮТРЭШп ЪЫРббЮТ ШбЯЮЫмЧгХвбп вЮв ЦХ бШЬТЮЫ ^, ЪЮвЮалЩ ЮвЬХзРХв ЭРзРЫЮ бваЮЪШ. БШЬТЮЫ ФХЩбвТШвХЫмЭЮ вЮв ЦХ, ЭЮ бЬлбЫ г ЭХУЮ бЮТбХЬ ФагУЮЩ. ЅРЯаШЬХа, бЫЮТЮ «ЪалиР» Т ЧРТШбШЬЮбвШ Юв ЪЮЭвХЪбвР ЬЮЦХв ШЬХвм бЮТХаиХЭЭЮ аРЧЭлЩ бЬлбЫ; вЮ ЦХ бРЬЮХ ЬЮЦЭЮ бЪРЧРвм Ш Ю ЬХвРбШЬТЮЫРе. јл гЦХ ТбваХзРЫШбм б ЮФЭШЬ ЯаШЬХаЮЬ ЬЭЮЦХбвТХЭЭЮЩ ШЭвХаЯаХвРжШШ — ФХдШбЮЬ. ґХдШб ШЭвХаЯаХвШагХвбп ЪРЪ ЮЯаХФХЫШвХЫм ШЭвХаТРЫЮТ вЮЫмЪЮ Т бШЬТЮЫмЭЮЬ ЪЫРббХ (Ш вЮ ХбЫШ ЮЭ ЭХ ЭРеЮФШвбп Т ЯХаТЮЩ ЯЮЧШжШШ). ·Р ЯаХФХЫРЬШ бШЬТЮЫмЭЮУЮ ЪЫРббР ФХдШб ТлЯЮЫЭпХв ЯаШТпЧЪг Ъ ЭРзРЫг бваЮЪШ, ТЭгваШ ЪЫРббР ЮЭ пТЫпХвбп ЬХвРбШЬТЮЫЮЬ ЪЫРббР — ЭЮ ЫШим Т вЮЬ бЫгзРХ, ХбЫШ ЭХ бЫХФгХв баРЧг ЦХ ЯЮбЫХ ЮвЪалТРойХЩ бЪЮСЪШ (Т ЯаЮвШТЭЮЬ бЫгзРХ ЮЭ ШЭвХаЯаХвШагХвбп ЪРЪ ЮСлзЭлЩ бШЬТЮЫ).

єРЪ ШЧТХбвЭЮ, Т РЭУЫШЩбЪЮЬ пЧлЪХ ЧР СгЪТЮЩ q ЯаРЪвШзХбЪШ ТбХУФР бЫХФгХв u. ґРТРЩвХ ЯЮШйХЬ нЪЧЮвШзХбЪШХ бЫЮТР, Т ЪЮвЮале ЧР СгЪТЮЩ q бЫХФгХв ЪРЪЮЩ-ЭШСгФм ФагУЮЩ бШЬТЮЫ — Т ЯХаХТЮФХ ЭР пЧлЪ аХУгЫпаЭле ТлаРЦХЭШЩ нвЮ ТлУЫпФШв ЪРЪ [q[^u]]. П ЯаШЬХЭШЫ нвЮ ТлаРЦХЭШХ Ъ бТЮХЬг бЯШбЪг бЫЮТ. єРЪ Ш бЫХФЮТРЫЮ ЮЦШФРвм, вРЪШе бЫЮТ ЮЪРЧРЫЮбм ЭХЬЭЮУЮ! ±ЮЫХХ вЮУЮ, Ю бгйХбвТЮТРЭШШ ЭХЪЮвЮале ШЧ ЭРЩФХЭЭле бЫЮТ п ТЮЮСйХ ЭХ ЯЮФЮЧаХТРЫ.

І бЯШбЪХ ЭХв бЫЮТ Qantas (РТбваРЫШЩбЪРп РТШРЪЮЬЯРЭШп) Ш Iraq. ЕЮвп ЮСР бЫЮТР ЯаШбгвбвТгов Т ЬЮХЬ бЯШбЪХ бЫЮТ, ЭШ ЮФЭЮ ШЧ ЭШе ЭХ ЯЮЯРЫЮ Т аХЧгЫмвРвл ЯЮШбЪР. їЮзХЬг<$M[R1-8]>? refїЮФгЬРЩвХ, Р ЧРвХЬ ЯХаХТХаЭШвХ бваРЭШжг Ш ЯаЮТХамвХ бТЮШ ЯаХФЯЮЫЮЦХЭШп.

їЮЬЭШвХ: ШЭТХавШаЮТРЭЭлЩ бШЬТЮЫмЭлЩ ЪЫРбб ЮЧЭРзРХв «бЮТЯРФХЭШХ б бШЬТЮЫРЬШ, ЭХ ТеЮФпйШЬШ Т бЯШбЮЪ», Р ЭХ «ЭХбЮТЯРФХЭШХ б бШЬТЮЫРЬШ, ТеЮФпйШЬШ Т бЯШбЮЪ». ЅР ЯХаТлЩ ТЧУЫпФ ЪРЦХвбп, звЮ нвЮ ЮФЭЮ Ш вЮ ЦХ, ЮФЭРЪЮ ЯаШЬХа бЮ бЫЮТЮЬ Iraq ФХЬЮЭбваШагХв ЮвЫШзШп ЬХЦФг нвШЬШ ФТгЬп ваРЪвЮТЪРЬШ. ёЭТХавШаЮТРЭЭлЩ ЪЫРбб гФЮСЭЮ аРббЬРваШТРвм ЪРЪ бЮЪаРйХЭЭго дЮаЬг ЧРЯШбШ ФЫп ЮСлзЭЮУЮ ЪЫРббР, ТЪЫозРойХУЮ ТбХ ТЮЧЬЮЦЭлХ бШЬТЮЫл, ЪаЮЬХ ЯХаХзШбЫХЭЭле.

ѕФШЭ ЯаЮШЧТЮЫмЭлЩ бШЬТЮЫ

јХвРбШЬТЮЫ [.] (вЮзЪР) ЯаХФбвРТЫпХв бЮСЮЩ бЮЪаРйХЭЭго дЮаЬг ЧРЯШбШ ФЫп бШЬТЮЫмЭЮУЮ ЪЫРббР, бЮФХаЦРйХУЮ ТбХ бШЬТЮЫл. їаШЬХЭпХвбп Т вХе бЫгзРпе, ЪЮУФР Т ЭХЪЮвЮале ЯЮЧШжШпе аХУгЫпаЭЮУЮ ТлаРЦХЭШп ЬЮУгв ЭРеЮФШвмбп ЯаЮШЧТЮЫмЭлХ бШЬТЮЫл. ґЮЯгбвШЬ, Тл еЮвШвХ ЭРЩвШ ФРвг, ЪЮвЮаРп ЬЮЦХв Слвм ЧРЯШблТРвмбп Т дЮаЬРвХ 07/04/76, 07-04-76 Ш ФРЦХ 07.04.76. єЮЭХзЭЮ, ЬЮЦЭЮ бЪЮЭбвагШаЮТРвм аХУгЫпаЭЮХ ТлаРЦХЭШХ, Т ЪЮвЮаЮЬ ЬХЦФг зШбЫРЬШ гЪРЧлТРовбп ТбХ ФЮЯгбвШЬлХ бШЬТЮЫл-аРЧФХЫШвХЫШ («/», «-» Ш «.») — ЭРЯаШЬХа, [07[-./]04[-./]76]. ІЮЧЬЮЦХЭ Ш ФагУЮЩ ТРаШРЭв — ЯаЮбвЮ ТТХбвШ ТлаРЦХЭШХ [07.04.76].

І нвЮЬ ЯаШЬХаХ ШЬХХвбп апФ ЭХЮзХТШФЭле РбЯХЪвЮТ. І ТлаРЦХЭШШ [07[-./]04[-./]76] вЮзЪШ ЭХ пТЫповбп ЬХвРбШЬТЮЫРЬШ, ЯЮбЪЮЫмЪг ЮЭШ ЭРеЮФпвбп ТЭгваШ бШЬТЮЫмЭЮУЮ ЪЫРббР (ЭХ ЧРСлТРЩвХ: бЮбвРТ Ш ШЭвХаЯаХвРжШп ЬХвРбШЬТЮЫЮТ ТЭгваШ ЪЫРббР Ш ЧР ХУЮ ЯаХФХЫРЬШ аРЧЫШзЭл). ґХдШбл Т ФРЭЭЮЬ бЫгзРХ вЮЦХ ШЭвХаЯаХвШаговбп ЪРЪ ЫШвХаРЫл, еЮвп Т УаРЭШжРе бШЬТЮЫмЭЮУЮ ЪЫРббР ЮЭШ ЮСлзЭЮ пТЫповбп ЬХвРбШЬТЮЫРЬШ. єРЪ гЯЮЬШЭРЫЮбм ТлиХ, ФХдШб ЭХ ШЭвХаЯаХвШагХвбп ЪРЪ ЬХвРбШЬТЮЫ, ХбЫШ ЮЭ ЭРеЮФШвбп ЭР ЯХаТЮЩ ЯЮЧШжШШ ЪЫРббР.

І ТлаРЦХЭШШ [07.04.76] вЮзЪШ пТЫповбп ЬХвРбШЬТЮЫРЬШ, бЮТЯРФРойШЬШ б ЫоСлЬ бШЬТЮЫЮЬ, Т вЮЬ зШбЫХ Ш б ЮЦШФРХЬлЬШ ЭРЬШ «/», «-» Ш «.». ВХЬ ЭХ ЬХЭХХ, ЭХЮСеЮФШЬЮ гзШвлТРвм, звЮ ЪРЦФРп вЮзЪР ЬЮЦХв бЮТЯРФРвм б РСбЮЫовЭЮ ЫоСлЬ бШЬТЮЫЮЬ, ЯЮнвЮЬг бЮТЯРФХЭШХ ЮСЭРагЦШТРХвбп, ЭРЯаШЬХа, Т бваЮЪХ «lottery numbers: 19 207304 7639».

ІлаРЦХЭШХ [07[-./]04[-./]76] ЮСХбЯХзШТРХв СЮЫХХ вЮзЭЮХ бЮТЯРФХЭШХ, ЮФЭРЪЮ ХУЮ вагФЭХХ зШвРвм Ш ЧРЯШблТРвм. ІлаРЦХЭШХ [07.04.76] ЫХУЪЮ ЯЮЭпвм, ЭЮ ЮЭЮ ФРХв ЭХЮФЭЮЧЭРзЭлЩ аХЧгЫмвРв. єРЪЮЩ ТРаШРЭв ШбЯЮЫмЧЮТРвм? ІбХ ЧРТШбШв Юв вЮУЮ, звЮ ТРЬ ШЧТХбвЭЮ ЮС ШбЪЮЬле ФРЭЭле Ш ЭРбЪЮЫмЪЮ вЮзЭлЬ ФЮЫЦХЭ Слвм ЯЮШбЪ. їаШ ЯЮбваЮХЭШШ аХУгЫпаЭле ТлаРЦХЭШЩ зРбвЮ ЯаШеЮФШвбп ШФвШ ЭР ЪЮЬЯаЮЬШбб б вЮзЭЮбвмо ЧР бзХв ЧЭРЭШп вХЪбвР. ЅРЯаШЬХа, ХбЫШ Тл гТХаХЭл, звЮ Т ТРиХЬ вХЪбвХ ТлаРЦХЭШХ [07.04.76] ЭРТХаЭпЪР ЭХ ТлЧЮТХв ЭХЦХЫРвХЫмЭле бЮТЯРФХЭШЩ, СгФХв ТЯЮЫЭХ ЫЮУШзЭЮ ТЮбЯЮЫмЧЮТРвмбп ШЬХЭЭЮ нвШЬ ТРаШРЭвЮЬ. ·ЭРЭШХ жХЫХТЮУЮ вХЪбвР — ТРЦЭлЩ дРЪвЮа, ЮСХбЯХзШТРойШЩ нддХЪвШТЭЮХ ШбЯЮЫмЧЮТРЭШХ аХУгЫпаЭле ТлаРЦХЭШЩ.

їЮзХЬг [q[^u]] ЭХ бЮТЯРФРХв бЮ бЫЮТРЬШ «Qantas» ШЫШ «Iraq»?

Qantas ЭХ бЮТЯРФРХв, ЯЮбЪЮЫмЪг Т аХУгЫпаЭЮЬ ТлаРЦХЭШШ гЪРЧРЭ бШЬТЮЫ q Т ЭШЦЭХЬ аХУШбваХ, Р Т бЫЮТХ «Qantas» ЮЭ ЮвЭЮбШвбп Ъ ТХаеЭХЬг аХУШбваг. µбЫШ ШбЯЮЫмЧЮТРвм ТлаРЦХЭШХ [Q[^u]], СлЫЮ Сл ЭРЩФХЭЮ нвЮ бЫЮТЮ, ЭЮ ЧРвЮ ЯаЮЯгйХЭл ТбХ ЮбвРЫмЭлХ. ІлаРЦХЭШХ [[Qq][^u]] ЮСЭРагЦШЫЮ Сл ТбХ бЫЮТР.

І ЯаШЬХаХ бЮ бЫЮТЮЬ Iraq ЪаЮХвбп ЯЮФТЮе. І аХУгЫпаЭЮЬ ТлаРЦХЭШШ гЪРЧРЭ бШЬТЮЫ q, ЧР ЪЮвЮалЬ бЫХФгХв бШЬТЮЫ, ЮвЫШзЭлЩ Юв u. ЅЮ ЯЮбЪЮЫмЪг ЯХаХФ ЯаЮТХаЪЮЩ аХУгЫпаЭЮУЮ ТлаРЦХЭШп egrep ЮвФХЫпХв Юв ЭХУЮ бШЬТЮЫ(л) ЯХаХТЮФР бваЮЪШ (Ре ЯаЮбвШвХ, п бЮТбХЬ ЧРСлЫ гЯЮЬпЭгвм ЮС нвЮЬ!), ЯЮбЫХ q ЭХв ТЮЮСйХ ЭШЪРЪШе ФРЭЭле. ґР, бШЬТЮЫР u вРЬ ЭХв — ЭЮ ЪРЪЮУЮ-ЭШСгФм ФагУЮУЮ бШЬТЮЫР ЭХв вЮЦХ!

ЅХ ЮУЮазРЩвХбм, ХбЫШ ТЮЯаЮб ЮЪРЧРЫбп бЫЮЦЭлЬ. ГТХапо ТРб: ХбЫШ Сл ЯаЮУаРЬЬР egrep ЭХ гФРЫпЫР бШЬТЮЫл ЯХаХТЮФР бваЮЪ (ЪРЪ нвЮ ФХЫРов ЭХЪЮвЮалХ ФагУШХ ЯаЮУаРЬЬл) ШЫШ ХбЫШ Сл ЧР бЫЮТЮЬ Iraq бЫХФЮТРЫШ ЯаЮСХЫл, ФагУШХ бЫЮТР ШЫШ ХйХ звЮ-ЭШСгФм, бваЮЪР СлЫР Сл гбЯХиЭЮ ЮСЭРагЦХЭР. ЅХЮСеЮФШЬЮ еЮаЮиЮ аРЧСШаРвмбп Т вЮЭЪЮбвпе аРСЮвл ЪРЦФЮЩ ЯаЮУаРЬЬл, ЭЮ ЯЮЪР ШЧ нвЮУЮ ЯаШЬХаР ЭХЮСеЮФШЬЮ ТлЭХбвШ ЮФЭЮ: бШЬТЮЫмЭЮЬг ЪЫРббг, ФРЦХ ШЭТХавШаЮТРЭЭЮЬг, Т вХЪбвХ ЮСпЧРвХЫмЭЮ ФЮЫЦХЭ бЮЮвТХвбвТЮТРвм ЪРЪЮЩ-ЭШСгФм бШЬТЮЫ.

ІлСЮа

ѕФЭЮ ШЧ ЭХбЪЮЫмЪШе ЯЮФТлаРЦХЭШЩ

ѕзХЭм гФЮСЭлЩ ЬХвРбШЬТЮЫ [|] ЮЧЭРзРХв «ШЫШ». ѕЭ ЯЮЧТЮЫпХв ЮСкХФШЭШвм ЭХбЪЮЫмЪЮ аХУгЫпаЭле ТлаРЦХЭШЩ Т ЮФЭЮ, бЮТЯРФРойХХ б ЫоСлЬ ШЧ ТлаРЦХЭШЩ-ЪЮЬЯЮЭХЭвЮТ. ЅРЯаШЬХа, [Bob] Ш [Robert] — ФТР аРЧЭле ТлаРЦХЭШп, Р [Bob|Robert] — ЮФЭЮ ТлаРЦХЭШХ, бЮТЯРФРойХХ б ЫоСЮЩ ШЧ нвШе бваЮЪ. їЮФТлаРЦХЭШп, ЮСкХФШЭХЭЭлХ нвШЬ бЯЮбЮСЮЬ, ЭРЧлТРовбп РЫмвХаЭРвШТРЬШ (alternatives).

ІХаЭХЬбп Ъ ЯаШЬХаг [gr[ea]y]. ѕСаРвШвХ ТЭШЬРЭШХ: ТлаРЦХЭШХ вРЪЦХ ЬЮЦЭЮ ЧРЯШбРвм Т ТШФХ [grey|gray] Ш ФРЦХ [gr(a|e)y]. І ЯЮбЫХФЭХЬ ТРаШРЭвХ ЪагУЫлХ бЪЮСЪШ ЮвФХЫпов ЪЮЭбвагЪжШо ТлСЮаР Юв ЮбвРЫмЭЮУЮ ТлаРЦХЭШп (Ш, ЪбвРвШ УЮТЮап, вЮЦХ пТЫповбп ЬХвРбШЬТЮЫРЬШ). ±ХЧ бЪЮСЮЪ [gra|ey] СгФХв ЮЧЭРзРвм «[gra] ШЫШ [ey]» — бЮТбХЬ ЭХ вЮ, звЮ ЭРЬ ЭгЦЭЮ. єЮЭбвагЪжШп ТлСЮаР ФХЩбвТгХв вЮЫмЪЮ ТЭгваШ ЪагУЫле бЪЮСЮЪ.

АРббЬЮваШЬ ФагУЮЩ ЯаШЬХа: [(First|1st)spc[Ss]treet]. ІЮЮСйХ УЮТЮап, ЯЮбЪЮЫмЪг [First] Ш [1st] ЧРЪРЭзШТРовбп ЭР [st], ТлаРЦХЭШХ ЬЮЦЭЮ бЮЪаРвШвм ФЮ [(Fir|1)stspc[Ss]treet], ЭЮ зШвРвм ХУЮ СгФХв бЫЮЦЭХХ. ѕСпЧРвХЫмЭЮ ЯаЮРЭРЫШЧШагЩвХ ЮСР ТлаРЦХЭШп Ш гСХФШвХбм Т Ше нЪТШТРЫХЭвЭЮбвШ.

ІЯаЮзХЬ, баРТЭХЭШХ [gr[ea]y] c [gr(a|e)y] бЫХУЪР ЮвТЫХЪЫЮ ЭРб Юв ЮбЭЮТЭЮЩ вХЬл. ±гФмвХ ТЭШЬРвХЫмЭл Ш ЭХ ЯгвРЩвХ ЪЮЭжХЯжШШ ТлСЮаР Ш бШЬТЮЫмЭЮУЮ ЪЫРббР. БШЬТЮЫмЭлЩ ЪЫРбб ЯаХФбвРТЫпХв ЮФШЭ бШЬТЮЫ жХЫХТЮУЮ вХЪбвР. І ЪЮЭбвагЪжШпе ТлСЮаР ЪРЦФРп РЫмвХаЭРвШТР ЬЮЦХв пТЫпвмбп ЯЮЫЭЮжХЭЭлЬ аХУгЫпаЭлЬ ТлаРЦХЭШХЬ. БШЬТЮЫмЭлХ ЪЫРббл ЯЮзвШ звЮ ЮСЫРФРов бЮСбвТХЭЭлЬ ЬШЭШ-пЧлЪЮЬ (Ш Т зРбвЭЮбвШ, бЮСбвТХЭЭлЬШ ЯаХФбвРТЫХЭШпЬШ Ю ЬХвРбШЬТЮЫРе), вЮУФР ЪРЪ ЪЮЭбвагЪжШп ТлСЮаР пТЫпХвбп зРбвмо «ЮбЭЮТЭЮУЮ» пЧлЪР аХУгЫпаЭле ТлаРЦХЭШЩ. ѕСХ ЪЮЭбвагЪжШШ Т ТлбиХЩ бвХЯХЭШ ЯЮЫХЧЭл.

єаЮЬХ вЮУЮ, СгФмвХ ТЭШЬРвХЫмЭл ЯаШ ШбЯЮЫмЧЮТРЭШШ ЧЭРЪЮТ ^ Ш $ Т ТлаРЦХЭШпе б ЪЮЭбвагЪжШпЬШ ТлСЮаР. БаРТЭШвХ ФТР ТлаРЦХЭШп: [^From|Subject|Date:spc] Ш [^(From|Subject|Date):spc]. ѕЭШ ЭРЯЮЬШЭРов аРббЬЮваХЭЭлЩ ТлиХ ЯаШЬХа б нЫХЪваЮЭЭЮЩ ЯЮзвЮЩ, ЭЮ ШЬХов аРЧЭлЩ бЬлбЫ (Р ЧЭРзШв, Ш аРЧЭго бвХЯХЭм ЯЮЫХЧЭЮбвШ). їХаТЮХ ТлаРЦХЭШХ бЮбвЮШв ШЧ ваХе ЯаЮбвле РЫмвХаЭРвШТ; ЮЭЮ ЮЧЭРзРХв «[^From] ШЫШ [Subject] ШЫШ [Date:spc]» Ш ЯЮвЮЬг ЮбЮСЮЩ ЯЮЫмЧл ЭХ ЯаШЭЮбШв. ЅРЬ ЭгЦЭЮ, звЮСл ЯаХдШЪб ^ Ш бгддШЪб [:spc] ЮвЭЮбШЫШбм Ъ ЪРЦФЮЩ ШЧ РЫмвХаЭРвШТ. ґЫп нвЮУЮ ЪЮЭбвагЪжШп ТлСЮаР «ЮУаРЭШзШТРХвбп» ЪагУЫлЬШ бЪЮСЪРЬШ:

НвЮ ТлаРЦХЭШХ бЮТЯРФРХв Т бЫХФгойШе ваХе бЫгзРпе:

1. ЅРзРЫЮ бваЮЪШ, бШЬТЮЫл Fdotrdotodotm, Р ЧРвХЬ «:spc»

2. ЅРзРЫЮ бваЮЪШ, бШЬТЮЫл Sdotudotbdotjdotedotcdott, Р ЧРвХЬ «:spc»

3. ЅРзРЫЮ бваЮЪШ, бШЬТЮЫл Ddotadottdote, Р ЧРвХЬ «:spc»

єРЪ ТШФШвХ, ТлСЮа ЯаЮШбеЮФШв ТЭгваШ ЪагУЫле бЪЮСЮЪ, ТбЫХФбвТШХ зХУЮ «ТЭХиЭпп ЮСЮЫЮзЪР» [^…:spc] ЯаШЬХЭпХвбп Ъ ЪРЦФЮЩ РЫмвХаЭРвШТХ. їЮнвЮЬг ТлаРЦХЭШХ бЮ бЪЮСЪРЬШ ЮЧЭРзРХв «[^From:spc] ШЫШ [^Subject:spc] ШЫШ [^Date:spc]».

їаЮйХ УЮТЮап, бЮТЯРФХЭШХ ЯаЮШбеЮФШв Т ЪРЦФЮЩ бваЮЪХ, ЪЮвЮаРп ЭРзШЭРХвбп ЫШСЮ б [^From:spc], ЫШСЮ б [^Subject:spc], ЫШСЮ б [^Date:spc] — ШЬХЭЭЮ вЮ, звЮ ЭРЬ ЭгЦЭЮ ФЫп ЯЮЫгзХЭШп бЯШбЪР бЮЮСйХЭШЩ ШЧ дРЩЫР нЫХЪваЮЭЭЮЩ ЯЮзвл.

іаРЭШжл бЫЮТ

ѕФЭР ШЧ аРбЯаЮбваРЭХЭЭле ЯаЮСЫХЬ ЧРЪЫозРХвбп Т вЮЬ, звЮ ШбЪЮЬЮХ бЫЮТЮ ТбваХзРХвбп ТЭгваШ ФагУШе бЫЮТ. П гЦХ гЯЮЬШЭРЫ ЮС нвЮЬ Т ЯаШЬХаРе б cat, gray Ш smith. ЕЮвп п вРЪЦХ УЮТЮаШЫ Ю вЮЬ, звЮ egrep ЮСлзЭЮ ЭХ ТЮбЯаШЭШЬРХв ЪЮЭжХЯжШШ бЫЮТ, Т ЭХЪЮвЮале ТХабШпе egrep аХРЫШЧЮТРЭР Ше ЮУаРЭШзХЭЭРп ЯЮФФХаЦЪР — Р ШЬХЭЭЮ, ТЮЧЬЮЦЭЮбвм ЯаШТпЧЪШ Ъ УаРЭШжХ бЫЮТР (ЭРзРЫг ШЫШ ЪЮЭжг).

Іл ЬЮЦХвХ ШбЯЮЫмЧЮТРвм бваРЭЭЮТРвлХ ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвШ [\<] Ш [\<], ХбЫШ ЮЭШ ЯЮФФХаЦШТРовбп ТРиХЩ ТХабШХЩ egrep. ѕЭШ ЯаХФбвРТЫпов бЮСЮЩ нЪТШТРЫХЭвл [^] Ш [$] ЭР гаЮТЭХ бЫЮТ Ш ЮСЮЧЭРзРов бЮЮвТХвбвТХЭЭЮ ЭРзРЫЮ Ш ЪЮЭХж бЫЮТР. єРЪ Ш пЪЮап ^ Ш $, нвШ ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвШ ЭХ бЮЮвТХвбвТгов ЪЮЭЪаХвЭлЬ бШЬТЮЫРЬ вХЪбвР. АХУгЫпаЭЮХ ТлаРЦХЭШХ [\<cat\>] СгЪТРЫмЭЮ ЮЧЭРзРХв «ЭРзРЫЮ бЫЮТР, ЧР ЪЮвЮалЬ ЭХЬХФЫХЭЭЮ бЫХФгов бШЬТЮЫл cdotadott, Р ЧРвХЬ ШФХв ЪЮЭХж бЫЮТР». їаЮйХ УЮТЮап, нвЮ ЮЧЭРзРХв «ЭРЩвШ ЮвФХЫмЭЮХ бЫЮТЮ cat». їаШ ЦХЫРЭШШ ЬЮЦЭЮ ТЮбЯЮЫмЧЮТРвмбп ТлаРЦХЭШпЬШ [\<cat] ШЫШ [cat\>] ФЫп ЯЮШбЪР бЫЮТ, ЭРзШЭРойШебп Ш ЧРЪРЭзШТРойШебп бШЬТЮЫРЬШ cat.

ѕСаРвШвХ ТЭШЬРЭШХ: бРЬШ ЯЮ бХСХ [<] Ш [>] ЬХвРбШЬТЮЫРЬШ ЭХ пТЫповбп — вЮЫмЪЮ Т бЮзХвРЭШШ б ЮСаРвЭЮЩ ЪЮбЮЩ зХавЮЩ ЮЭШ ЯаШЮСаХвРов ЮбЮСлЩ бЬлбЫ. ёЬХЭЭЮ ЯЮнвЮЬг п Ш ЭРЧТРЫ Ше «ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвпЬШ». їаШзХЬ ЧФХбм ТРЦЭР Ше ЮбЮСРп ШЭвХаЯаХвРжШп, Р ЭХ ЪЮЫШзХбвТЮ бШЬТЮЫЮТ, ЯЮнвЮЬг Т СЮЫмиХЩ зРбвШ ЪЭШУШ п СгФг бзШвРвм нвШ ФТР «ЬХвР»-вХаЬШЭР бШЭЮЭШЬРЬШ.

їЮЬЭШвХ Ю вЮЬ, звЮ ЭХ ТбХ ТХабШШ egrep ЯЮФФХаЦШТРов ЬХвРбШЬТЮЫл УаРЭШж бЫЮТ, ЭЮ ФРЦХ Т бЫгзРХ ЯЮФФХаЦЪШ ЮЭШ ЭХ ЭРзШЭРов ТЮЫиХСЭлЬ ЮСаРЧЮЬ ЯЮЭШЬРвм РЭУЫШЩбЪШЩ пЧлЪ. «ЅРзРЫЮЬ бЫЮТР» ЯаЮбвЮ ЭРЧлТРХвбп вР ЯЮЧШжШп, б ЪЮвЮаЮЩ ЭРзШЭРХвбп ЯЮбЫХФЮТРвХЫмЭЮбвм РЫдРТШвЭЮ-жШдаЮТле бШЬТЮЫЮТ; «ЪЮЭжЮЬ бЫЮТР» ЭРЧлТРХвбп ЯЮЧШжШп, Т ЪЮвЮаЮЩ нвР ЯЮбЫХФЮТРвХЫмЭЮбвм ЧРТХаиРХвбп. ЅР аШб. 1.2 ЯаШТХФХЭ ЯаШЬХа бваЮЪШ б аРЧЬХвЪЮЩ нвШе ЯЮЧШжШЩ.

ЅРзРЫР бЫЮТ (ЪРЪ Ше ЮЯЮЧЭРХв egrep) ЮвЬХзХЭл бваХЫЪРЬШ, ЭРЯаРТЫХЭЭлЬШ ТТХае; ЪЮЭжл бЫЮТ ЮвЬХзХЭл бваХЫЪРЬШ, ЭРЯаРТЫХЭЭлЬШ ТЭШЧ. єРЪ ТШФШвХ, «ЭРзРЫЮ Ш ЪЮЭХж бЫЮТР» ЯаРТШЫмЭХХ СлЫЮ Сл ЭРЧлТРвм «ЭРзРЫЮЬ Ш ЪЮЭжЮЬ РЫдРТШвЭЮ-жШдаЮТЮЩ ЯЮбЫХФЮТРвХЫмЭЮбвШ», ЭЮ нвЮ ЯЮЫгзРХвбп бЫШиЪЮЬ ФЫШЭЭЮ.

І ФТге бЫЮТРе

ВРСЫШжР 1.1. БТЮФЪР гЯЮЬШЭРТиШебп ЬХвРбШЬТЮЫЮТ

І вРСЫ. 1.1 ЯХаХзШбЫХЭл ЬХвРбШЬТЮЫл, гЯЮЬШЭРТиШХбп ФЮ ЭРбвЮпйХУЮ ЬЮЬХЭвР. ВРЪЦХ бЫХФгХв ЧРЯЮЬЭШвм ЭХбЪЮЫмЪЮ ТРЦЭле дРЪвЮТ:

l І бШЬТЮЫмЭле ЪЫРббРе бгйХбвТгов ЮбЮСлХ ЯаРТШЫР, ЮЯаХФХЫпойШХ, ЪРЪШХ бШЬТЮЫл пТЫповбп ШЫШ ЭХ пТЫповбп ЬХвРбШЬТЮЫРЬШ (Р вРЪЦХ Ше вЮзЭго ШЭвХаЯаХвРжШо). ЅРЯаШЬХа, вЮзЪР бзШвРХвбп ЬХвРбШЬТЮЫЮЬ ЧР ЯаХФХЫРЬШ ЪЫРббР, ЭЮ ЭХ ТЭгваШ ЭХУЮ. ё ЭРЮСЮаЮв — ФХдШб пТЫпХвбп ЬХвРбШЬТЮЫЮЬ ТЭгваШ ЪЫРббР, ЭЮ ЭХ ЧР ХУЮ ЯаХФХЫРЬШ. ° бШЬТЮЫ ^ ШЬХХв ЮФШЭ бЬлбЫ ЧР ЯаХФХЫРЬШ ЪЫРббР, ФагУЮЩ бЬлбЫ — ТЭгваШ ЪЫРббР баРЧг ЦХ ЯЮбЫХ ЮвЪалТРойХЩ бЪЮСЪШ [, Ш ваХвШЩ — Т ЫоСЮЩ ФагУЮЩ ЯЮЧШжШШ ЪЫРббР.

l ЅХ ЯгвРЩвХ ЪЮЭбвагЪжШо ТлСЮаР б бШЬТЮЫмЭлЬ ЪЫРббЮЬ. єЫРбб [[abc]] Ш ЪЮЭбвагЪжШп ТлСЮаР [(a|b|c)] дРЪвШзХбЪШ ЮЧЭРзРов ЮФЭЮ Ш вЮ ЦХ, ЭЮ нвЮв ЯаШЬХа ЭХ аРбЯаЮбваРЭпХвбп ЭР ЮСйШЩ бЫгзРЩ. БШЬТЮЫмЭлЩ ЪЫРбб бЮТЯРФРХв аЮТЭЮ б ЮФЭШЬ бШЬТЮЫЮЬ, ЪРЪШЬ Сл ФЫШЭЭлЬ ШЫШ ЪЮаЮвЪШЬ ЭХ СлЫ бЯШбЮЪ ФЮЯгбвШЬле бШЬТЮЫЮТ. Б ФагУЮЩ бвЮаЮЭл, ЪЮЭбвагЪжШп ТлСЮаР ЬЮЦХв бЮФХаЦРвм РЫмвХаЭРвШТл ЯаЮШЧТЮЫмЭЮЩ ФЫШЭл, бЮТХаиХЭЭЮ ЭХ бТпЧРЭЭлХ ФагУ б ФагУЮЬ ФЫШЭЮЩ вХЪбвР: [\<(1,000,000|million|thousandspcthousand)\>]. І ЮвЫШзШХ Юв бШЬТЮЫмЭле ЪЫРббЮТ, ЪЮЭбвагЪжШШ ТлСЮаР ЭХ ЬЮУгв ШЭТХавШаЮТРвмбп.

l ёЭТХавШаЮТРЭЭлЩ бШЬТЮЫмЭлЩ ЪЫРбб ЯаХФбвРТЫпХв бЮСЮЩ бЮЪаРйХЭЭЮХ ЮСЮЧЭРзХЭШХ ЮСлзЭЮУЮ бШЬТЮЫмЭЮУЮ ЪЫРббР, ЮСЮЧЭРзРойХУЮ ТбХ бШЬТЮЫл, ЪаЮЬХ ЯХаХзШбЫХЭЭле. БЫХФЮТРвХЫмЭЮ, ТлаРЦХЭШХ [[^x]] ЮЧЭРзРХв ЭХ «ТбХ звЮ гУЮФЭЮ, ЪаЮЬХ x», Р «ЫоСЮЩ бШЬТЮЫ, ЮвЫШзЭлЩ Юв x». АРЧЫШзШХ вЮЭЪЮХ, ЭЮ ТРЦЭЮХ. ЅРЯаШЬХа, Т ЯХаТЮЩ ШЭвХаЯаХвРжШШ бЮТЯРФХЭШХ СгФХв ЭРЩФХЭЮ Т ЯгбвЮЩ бваЮЪХ, зХУЮ Слвм ЭХ ФЮЫЦЭЮ.

ґРЦХ вХ ЬХвРбШЬТЮЫл, ЪЮвЮалХ Ьл аРббЬЮваХЫШ, бЯЮбЮСЭл ЯаШЭХбвШ ЭХбЮЬЭХЭЭго ЯЮЫмЧг, ЭЮ ЭРбвЮпйШХ ТЮЧЬЮЦЭЮбвШ аХУгЫпаЭле ТлаРЦХЭШЩ ЭРзШЭРовбп б ЯаШЬХЭХЭШп ЪТРЭвШдШЪРвЮаЮТ.

ЅХЮСпЧРвХЫмЭлХ нЫХЬХЭвл

ґЮЯгбвШЬ, ТРЬ ЯЮЭРФЮСШЫЮбм ЭРЩвШ бЫЮТЮ color ШЫШ colour. НвШ ФТР бЫЮТР ЯЮзвШ ЮФШЭРЪЮТл, вЮЫмЪЮ Т ЮФЭЮЬ Хбвм СгЪТР u, Р Т ФагУЮЬ ХХ ЭХв. АХУгЫпаЭЮХ ТлаРЦХЭШХ [colou?r] ЯЮЧТЮЫпХв ЭРЩвШ ЫоСЮЩ ШЧ нвШе ТРаШРЭвЮТ. јХвРбШЬТЮЫ [?] (ТЮЯаЮбШвХЫмЭлЩ ЧЭРЪ) ЮЧЭРзРХв «ЭХЮСпЧРвХЫмЭлЩ бШЬТЮЫ». ѕЭ бвРТШвбп ЯЮбЫХ бШЬТЮЫР, ЪЮвЮалЩ ЬЮЦХв ЭРеЮФШвмбп Т ФРЭЭЮЩ ЯЮЧШжШШ вХЪбвР, ЭЮ ЭРЫШзШХ ЪЮвЮаЮУЮ ЭХ ваХСгХвбп ФЫп гбЯХиЭЮУЮ бЮТЯРФХЭШп.

І ЮвЫШзШХ Юв ФагУШе гЯЮЬШЭРТиШебп ЬХвРбШЬТЮЫЮТ, ТЮЯаЮбШвХЫмЭлЩ ЧЭРЪ ЮвЭЮбШвбп вЮЫмЪЮ Ъ бШЬТЮЫг, аРбЯЮЫЮЦХЭЭЮЬг ЭХЯЮбаХФбвТХЭЭЮ ЯХаХФ ЭШЬ. ІлаРЦХЭШХ [colou?r] ШЭвХаЯаХвШагХвбп ЪРЪ «[c], ЧРвХЬ [o], ЧРвХЬ [l], ЧРвХЬ [o], ЧРвХЬ [u?], ЧРвХЬ[r]».

БЮЯЮбвРТЫХЭШХ [u?] б вХЪбвЮЬ ТбХУФР ЮЪРЧлТРХвбп гбЯХиЭлЬ: ШЭЮУФР ХЬг бЮЮвТХвбвТгХв бШЬТЮЫ u Т вХЪбвХ, ШЭЮУФР ЭХ бЮЮвТХвбвТгХв. БЮСбвТХЭЭЮ, УЫРТЭРп ЮбЮСХЭЭЮбвм ЭХЮСпЧРвХЫмЭЮУЮ нЫХЬХЭвР ? бЮбвЮШв Т вЮЬ, звЮ бЮТЯРФХЭШХ ФЫп ЭХУЮ ЭРеЮФШвбп ТбХУФР. НвЮ ТЮТбХ ЭХ ЮЧЭРзРХв, звЮ бЮТЯРФХЭШХ СгФХв ЭРЩФХЭЮ ФЫп ЫоСЮУЮ аХУгЫпаЭЮУЮ ТлаРЦХЭШп, бЮФХаЦРйХУЮ ЬХвРбШЬТЮЫ ?. ЅРЯаШЬХа, ЯаШ ЯЮШбЪХ Т бваЮЪХ semicolon СгФгв ЭРЩФХЭл бЮТЯРФХЭШп ФЫп [colo] Ш [u?] (бЮЮвТХвбвТХЭЭЮ colo Ш ЭШзХУЮ). ВХЬ ЭХ ЬХЭХХ, ЧРТХаиРойХХ [r] ЭХ ЭРеЮФШвбп, ШЧ-ЧР зХУЮ [colou?r] Т ЪЮЭХзЭЮЬ бзХвХ Ш ЭХ бЮТЯРФРХв Т бваЮЪХ semicolon.

АРббЬЮваШЬ ФагУЮЩ ЯаШЬХа. їаХФбвРТмвХ, звЮ ТРЬ ваХСгХвбп ЭРЩвШ ФРвг — зХвТХавЮХ ШоЫп, Т ЪЮвЮаЮЩ ЬХбпж ЮСЮЧЭРзРХвбп July ШЫШ Jul, Р зШбЫЮ — fourth, 4th ШЫШ ЯаЮбвЮ жШдаР 4. єЮЭХзЭЮ, ЬЮЦЭЮ ЯаЮбвЮ ТЮбЯЮЫмЧЮТРвмбп ТлаРЦХЭШХЬ [(July|Jul)spc(fourth|4th|4)], ЭЮ ФРТРЩвХ аРббЬЮваШЬ ФагУШХ ТРаШРЭвл ТлаРЦХЭШп вЮЩ ЦХ ШФХШ.

ІЮ-ЯХаТле, [(July|Jul)] бЮЪаРйРХвбп ФЮ [(July?)]. Іл ТШФШвХ, звЮ нвЮ ЮФЭЮ Ш вЮ ЦХ? їаШ гФРЫХЭШШ [|] ЪагУЫлХ бЪЮСЪШ ЯХаХбвРов Слвм ЭгЦЭлЬШ. ІаХФР Юв бЪЮСЮЪ ЭХ СгФХв, ЭЮ СХЧ ЭШе ТлаРЦХЭШХ [July?] бвРЭЮТШвбп згвм СЮЫХХ ЯЮЭпвЭлЬ. їЮЫгзРХвбп [July?spc(fourth|4th|4)].

їХаХеЮФШЬ ЪЮ ТвЮаЮЩ ЯЮЫЮТШЭХ ТлаРЦХЭШХ. [4th|4] ЬЮЦЭЮ бЮЪаРвШвм ФЮ [4(th)?]. єРЪ ТШФШвХ, [?] ЬЮЦХв ЯаШбЮХФШЭпвмбп Ш Ъ ТлаРЦХЭШпЬ Т ЪагУЫле бЪЮСЪРе. ІлаРЦХЭШХ ТЭгваШ бЪЮСЮЪ ЬЮЦХв Слвм бЪЮЫм гУЮФЭЮ бЫЮЦЭлЬ, ЭЮ «бЭРагЦШ» ЮЭЮ ТЮбЯаШЭШЬРХвбп ЪРЪ ХФШЭЮХ жХЫЮХ. іагЯЯШаЮТЪР ФЫп [?] (Ш ФагУШе РЭРЫЮУШзЭле ЬХвРбШЬТЮЫЮТ, аРббЬРваШТРХЬле ЭШЦХ) пТЫпХвбп ЮФЭШЬ ШЧ УЫРТЭле ЯаШЬХЭХЭШЩ ЪагУЫле бЪЮСЮЪ.

ёвРЪ, ЭРиХ ТлаРЦХЭШХ ЯаШЭШЬРХв ТШФ [July?spc(fourth|4(th)?)]. ЕЮвп ЮЭЮ бЮФХаЦШв ФЮТЮЫмЭЮ ЬЭЮУЮ ЬХвРбШЬТЮЫЮТ Ш ФРЦХ ТЫЮЦХЭЭлХ бЪЮСЪШ, аРбиШдаЮТРвм Ш ЯЮЭпвм ХУЮ ЭХ вРЪ гЦ вагФЭЮ. јл ФЮТЮЫмЭЮ ФЮЫУЮ ЮСбгЦФРЫШ ФТР ЯаЮбвле ЯаШЬХаР, ЭЮ ЯаШ нвЮЬ ЧРваЮЭгЫШ ЬЭЮУШХ ЯЮСЮзЭлХ ТЮЯаЮбл, бТпЧРЭЭлХ б ЯЮЭШЬРЭШХЬ аХУгЫпаЭле ТлаРЦХЭШЩ. їаЮйХ баРЧг ЯаШЮСаХбвШ еЮаЮиШХ ЯаШТлзЪШ, зХЬ ЯЮвЮЬ ШЧСРТЫпвмбп Юв ЯЫЮеШе.

ґагУШХ ЪТРЭвШдШЪРвЮал: ЯЮТвЮаХЭШХ

Г ТЮЯаЮбШвХЫмЭЮУЮ ЧЭРЪР ШЬХовбп аЮФбвТХЭЭШЪШ — [+] (ЯЫоб) Ш [*] (ЧТХЧФЮзЪР). јХвРбШЬТЮЫ [+] ЮСЮЧЭРзРХв «ЮФШЭ ШЫШ ЭХбЪЮЫмЪЮ нЪЧХЬЯЫпаЮТ ЭХЯЮбаХФбвТХЭЭЮ ЯаХФиХбвТгойХУЮ нЫХЬХЭвР», Р [*] — «ЫоСЮХ ЪЮЫШзХбвТЮ нЪЧХЬЯЫпаЮТ нЫХЬХЭвР (Т вЮЬ зШбЫХ Ш ЭгЫХТЮХ)». ёЭРзХ УЮТЮап, […*] ЮЧЭРзРХв «ЭРЩвШ бвЮЫмЪЮ нЪЧХЬЯЫпаЮТ, бЪЮЫмЪЮ нвЮ ТЮЧЬЮЦЭЮ, ЭЮ ЯаШ ЭХЮСеЮФШЬЮбвШ ЮСЮЩвШбм Ш СХЧ ЭШе». єЮЭбвагЪжШп […+] ШЬХХв ЯЮеЮЦШЩ бЬлбЫ (ЮЭР вРЪЦХ ЯлвРХвбп ЭРЩвШ ЪРЪ ЬЮЦЭЮ СЮЫмиХХ зШбЫЮ нЪЧХЬЯЫпаЮТ гЪРЧРЭЭЮУЮ нЫХЬХЭвР), ЭЮ ЯаШ ЮвбгвбвТШШ еЮвп Сл ЮФЭЮУЮ нЪЧХЬЯЫпаР бЮЯЮбвРТЫХЭШХ ЧРТХаиРХвбп ЭХгФРзХЩ. НвШ ваШ ЬХвРбШЬТЮЫР, [?], [+] Ш [*], ЭРЧлТРовбп ЪТРЭвШдШЪРвЮаРЬШ (ЯЮбЪЮЫмЪг ЪЮЫШзХбвТЮ нЪЧХЬЯЫпаЮТ бЮТЯРФХЭШп ЬЮЦХв Слвм ЯХаХЬХЭЭлЬ).

єРЪ Ш […?], ЯЮШбЪ зРбвШ […*] Т аХУгЫпаЭле ТлаРЦХЭШпе ТбХУФР ЮЪРЧлТРХвбп гбЯХиЭлЬ. ІЮЯаЮб ЫШим Т вЮЬ, ЪРЪЮЩ вХЪбв СгФХв (Ш СгФХв ЫШ ТЮЮСйХ) бЮФХаЦРвмбп Т бЮТЯРФХЭШШ. БаРТЭШвХ б ЪЮЭбвагЪжШХЩ […+], ваХСгойХЩ ЭРЫШзШп еЮвп Сл ЮФЭЮУЮ нЪЧХЬЯЫпаР ШбЪЮЬЮУЮ вХЪбвР.

їаЮбвлЬ ЯаШЬХаЮЬ пТЫпХвбп ТлаРЦХЭШХ [spc*], ЮСЮЧЭРзРойХХ ЯаЮШЧТЮЫмЭЮХ зШбЫЮ ЭХЮСпЧРвХЫмЭле ЯаЮСХЫЮТ ([spc?] ФЮЯгбЪРХв ЭХ СЮЫХХ ЮФЭЮУЮ ЭХЮСпЧРвХЫмЭЮУЮ ЯаЮСХЫР, вЮУФР ЪРЪ [spc*] ФЮЯгбЪРХв ЫоСЮХ Ше ЪЮЫШзХбвТЮ). Б ХУЮ ЯЮЬЮймо ЬЮЦЭЮ бФХЫРвм ЭРи ЯаШЬХа <H[1-6]> СЮЫХХ УШСЪШЬ. І бЯХжШдШЪРжШШ HTML[8] УЮТЮаШвбп, звЮ ЭХЯЮбаХФбвТХЭЭЮ ЯХаХФ ЧРЪалТРойХЩ гУЫЮТЮЩ бЪЮСЪЮЩ > ФЮЯгбЪРовбп ЯаЮСХЫл — ЭРЯаШЬХа, <H3spc> ШЫШ <H4spcspcspc>. ІбвРТЫпп […+] Т вг ЯЮЧШжШо аХУгЫпаЭЮУЮ ТлаРЦХЭШп, УФХ ЬЮУгв ЭРеЮФШвмбп (Р ЬЮУгв Ш ЮвбгвбвТЮТРвм) ЯаЮСХЫл, Ьл ЯЮЫгзРХЬ [<H[1-6]spc*]. ІлаРЦХЭШХ ЯЮ-ЯаХЦЭХЬг бЮТЯРФРХв б <H1>, ЯЮбЪЮЫмЪг ЭРЫШзШХ ЯаЮСХЫЮТ ЭХЮСпЧРвХЫмЭЮ, ЭЮ ЯаШ нвЮЬ вРЪЦХ ЯЮФеЮФШв Ш ФЫп ФагУШе ТРаШРЭвЮТ.

БФХЫРХЬ иРУ ТЯХаХФ Ш ЯЮЯаЮСгХЬ ЮаУРЭШЧЮТРвм ЯЮШбЪ ЪЮЭЪаХвЭЮУЮ вХУР HTML, ЯЮФФХаЦШТРХЬЮУЮ Web-СаЮгЧХаЮЬ Netscape Navigator. ВХУ <HRspcSIZE=14> ЮЧЭРзРХв, звЮ ЭР нЪаРЭХ аШбгХвбп УЮаШЧЮЭвРЫмЭРп ЫШЭШп вЮЫйШЭЮЩ 14 ЯШЪбХЫЮТ. єРЪ Ш Т ЯаШЬХаХ <H3>, ЯХаХФ ЧРЪалТРойХЩ гУЫЮТЮЩ бЪЮСЪЮЩ ЬЮУгв бвЮпвм ЭХЮСпЧРвХЫмЭлХ ЯаЮСХЫл. єаЮЬХ вЮУЮ, ЯаЮСХЫл ЬЮУгв ЭРеЮФШвмбп Ш ЯЮ ЮСХ бвЮаЮЭл ЧЭРЪР =. ЅРЪЮЭХж, ЬШЭШЬгЬ ЮФШЭ ЯаЮСХЫ ФЮЫЦХЭ аРЧФХЫпвм HR Ш SIZE, еЮвп Ше ЬЮЦХв Слвм Ш СЮЫмиХ. І ЯЮбЫХФЭХЬ бЫгзРХ ЬЮЦЭЮ ЯаШЬХЭШвм ТлаРЦХЭШХ [spcspc*], ЭЮ Ьл ТЮбЯЮЫмЧгХЬбп [spc+]. їЫоб аРЧаХиРХв ФЮЯЮЫЭШвХЫмЭлХ ЯаЮСХЫл, ЭЮ ваХСгХв ЮСпЧРвХЫмЭЮУЮ ЯаШбгвбвТШп еЮвп Сл ЮФЭЮУЮ ЯаЮСХЫР. Іл ЯЮЭШЬРХвХ, ЯЮзХЬг нвЮ ТлаРЦХЭШХ нЪТШТРЫХЭвЭЮ [spcspc*]? їЮЫгзРХвбп [<HRspc+SIZEspc*=spc*14spc*>].

їаШ ТбХЩ УШСЪЮбвШ ЯЮ ЮвЭЮиХЭШо Ъ ЯаЮСХЫРЬ ЭРиХ ТлаРЦХЭШХ ЯЮ-ЯаХЦЭХЬг ЦХбвЪЮ дШЪбШагХв аРЧЬХа, гЪРЧРЭЭлЩ Т вХУХ. ІЬХбвЮ ЯЮШбЪР вХУЮТ б ЪЮЭЪаХвЭлЬ аРЧЬХаЮЬ (ЭРЯаШЬХа, 14) Ьл еЮвШЬ ЭРЩвШ ТбХ ТРаШРЭвл. ґЫп нвЮУЮ [14] ЧРЬХЭпХвбп ТлаРЦХЭШХЬ ФЫп ЯЮШбЪР ЮСЮСйХЭЭЮУЮ зШбЫР ШЧ ЮФЭЮЩ ШЫШ ЭХбЪЮЫмЪШе жШда. ЖШдаР ЮЯаХФХЫпХвбп ТлаРЦХЭШХЬ [[0-9]], Р «ЮФЭЮЩ ШЫШ ЭХбЪЮЫмЪШе» ЯаХЮСаРЧгХвбп Т +, ЯЮнвЮЬг Т аХЧгЫмвРвХ [14] ЧРЬХЭпХвбп [[0-9]+]. єРЪ ТШФШвХ, бШЬТЮЫмЭлЩ ЪЫРбб пТЫпХвбп ЮвФХЫмЭлЬ нЫХЬХЭвЮЬ, ЯаШЬХЭХЭШХ Ъ ЪЮвЮаЮЬг ЬХвРбШЬТЮЫЮТ +, ? Ш в. Ф. ЭХ ваХСгХв ЪагУЫле бЪЮСЮЪ.

їЮЫгзХЭЭЮХ ТлаРЦХЭШХ [<HRspc+SIZEspc*=spc*[0-9]+spc*>] ТлУЫпФШв ТХбмЬР бваРЭЭЮ, ЯЮбЪЮЫмЪг СЮЫмиШЭбвТЮ ЧТХЧФЮзХЪ Ш ЯЫобЮТ ЮвЭЮбШвбп Ъ ЯаЮСХЫРЬ, Р ЭРи УЫРЧ ЯаШТлЪ ЮбЮСЮ ТлФХЫпвм Т бваЮЪХ ЯаЮСХЫл. їаШ звХЭШШ аХУгЫпаЭле ТлаРЦХЭШЩ ТРЬ ЯаШФХвбп СЮаЮвмбп б нвЮЩ ЯаШТлзЪЮЩ, ЯЮбЪЮЫмЪг ЯаЮСХЫ пТЫпХвбп вРЪШЬ ЦХ ЮСлзЭлЬ бШЬТЮЫЮЬ, ЪРЪ, ЭРЯаШЬХа, j ШЫШ 4.

ґРТРЩвХ ЯаЮФЮЫЦШЬ бЮТХаиХЭбвТЮТРЭШХ еЮаЮиХУЮ ЯаШЬХаР Ш ТЭХбХЬ Т ЭХУЮ ХйХ ЮФЭЮ ШЧЬХЭХЭШХ. І Navigator ЬЮЦЭЮ ШбЯЮЫмЧЮТРвм ЭХ вЮЫмЪЮ вХУШ HR б пТЭЮ ЧРФРЭЭлЬ аРЧЬХаЮЬ, ЭЮ Ш бвРЭФРавЭго «СХЧаРЧЬХаЭго» ТХабШо <HR> (ЪРЪ Ш ЯаХЦФХ, ЯХаХФ > ЬЮУгв ЭРеЮФШвмбп ФЮЯЮЫЭШвХЫмЭлХ ЯаЮСХЫл). єРЪ<$M[R1-9]> ЬЮФШдШжШаЮТРвм ЭРиХ аХУгЫпаЭЮХ ТлаРЦХЭШХ вРЪ, звЮСл ЮЭЮ бЮТЯРФРЫЮ б ЫоСлЬ ШЧ нвШе вШЯЮТ? іЫРТЭЮХ — ЯЮЭпвм, звЮ ХУЮ зРбвм б аРЧЬХаЮЬ пТЫпХвбп ЭХЮСпЧРвХЫмЭЮЩ (нвЮ ЯЮФбЪРЧЪР).refїХаХТХаЭШвХ бваРЭШжг, звЮСл ЯаЮТХаШвм бТЮЩ ЮвТХв.

ІЭШЬРвХЫмЭЮ ЯаЮРЭРЫШЧШагЩвХ ЮЪЮЭзРвХЫмЭЮХ ТлаРЦХЭШХ (ЭР ТаХЧЪХ б ЮвТХвЮЬ), звЮСл ЯЮЭпвм, зХЬ аРЧЫШзРовбп ЬХвРбШЬТЮЫл ?, * Ш +, Ш звЮ ЮЭШ ЮЧЭРзРов ЭР ЯаРЪвШЪХ. БЬлбЫ нвШе ЬХвРбШЬТЮЫЮТ ЯХаХзШбЫпХвбп Т вРСЫ. 1.2. ѕСаРвШвХ ТЭШЬРЭШХ: г ЪРЦФЮУЮ ЪТРЭвШдШЪРвЮаР бгйХбвТгХв ЬШЭШЬРЫмЭЮХ ЪЮЫШзХбвТЮ нЪЧХЬЯЫпаЮТ вХЪбвР, ЪЮвЮалХ ЮЭ ЮСпЧРвХЫмЭЮ ФЮЫЦХЭ ЭРЩвШ. І ЭХЪЮвЮале бЫгзРпе ЬШЭШЬРЫмЭЮХ ЪЮЫШзХбвТЮ аРТЭЮ ЭгЫо.

ѕЯаХФХЫХЭШХ ШЭвХаТРЫЮТ ЪЮЫШзХбвТР нЪЧХЬЯЫпаЮТ

І ЭХЪЮвЮале ТХабШпе egrep ЯЮФФХаЦШТРХвбп ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвм ФЫп ЮЯаХФХЫХЭШп ЬШЭШЬРЫмЭЮУЮ Ш ЬРЪбШЬРЫмЭЮУЮ ЪЮЫШзХбвТР бЮТЯРФХЭШЩ: […{ЬШЭ, ЬРЪб}]. НвР ЪЮЭбвагЪжШп ЭРЧлТРХвбп ШЭвХаТРЫмЭлЬ<$M[R1-1]> ЪТРЭвШдШЪРвЮаЮЬ. ЅРЯаШЬХа, ТлаРЦХЭШХ […{3,12}] бЮТЯРФРХв ФЮ 12 аРЧ, ХбЫШ нвЮ ТЮЧЬЮЦЭЮ, ЭЮ ЬЮЦХв ЮУаРЭШзШвмбп Ш ТбХУЮ 3 бЮТЯРФХЭШпЬШ. ·РЯШбм {0,1} нЪТШТРЫХЭвЭР ЬХвРбШЬТЮЫг ?.

ёЭвХаТРЫмЭлЩ ЪТРЭвШдШЪРвЮа ЯЮФФХаЦШТРХвбп ХйХ ЭХ ТбХЬШ ТХабШпЬШ egrep. ·РвЮ ЮЭ ЯЮФФХаЦШТРХвбп ЬЭЮЦХбвТЮЬ ФагУШе ШЭбвагЬХЭвЮТ, Ю ЪЮвЮале аХзм ЯЮЩФХв Т УЫРТХ 3 ЯаШ аРббЬЮваХЭШШ иШаЮЪЮУЮ бЯХЪваР ЬХвРбШЬТЮЫЮТ, ШбЯЮЫмЧгХЬле Т ЭРиХ ТаХЬп.

ёУЭЮаШаЮТРЭШХ аРЧЫШзШЩ Т аХУШбваХ бШЬТЮЫЮТ

І вХУРе HTML ЬЮУгв ШбЯЮЫмЧЮТРвмбп бШЬТЮЫл ЮСЮШе аХУШбваЮТ, ЯЮнвЮЬг вХУШ <h3> Ш <HrspcSize=26> ТЯЮЫЭХ ФЮЯгбвШЬл. јЮФШдШЪРжШп ТлаРЦХЭШп [H<[1-6]spc*] бТЮФШвбп Ъ ЯаЮбвЮЩ ЧРЬХЭХ [H] ТлаРЦХЭШХЬ [[Hh]], ЭЮ Т СЮЫХХ ФЫШЭЭле бЫЮТРе [HR] Ш [SIZE] ШЧ ФагУЮУЮ ЯаШЬХаР ТЮЧЭШЪРов ЧРвагФЭХЭШп. єЮЭХзЭЮ, ЬЮЦЭЮ ШбЯЮЫмЧЮТРвм УаЮЬЮЧФЪШХ ЪЮЭбвагЪжШШ [[Hh][Rr]] Ш [[Ss][Ii][Zz][Ee]], ЭЮ ЯаЮйХ ЯаШЪРЧРвм egrep ШУЭЮаШаЮТРвм аХУШбва бШЬТЮЫЮТ ЯаШ баРТЭХЭШШ.

АХзм ШФХв ЭХ Ю зРбвШ пЧлЪР аХУгЫпаЭле ТлаРЦХЭШЩ, Р Ю ЯЮЫХЧЭЮЩ ТЮЧЬЮЦЭЮбвШ, ЯаХФЮбвРТЫпХЬЮЩ ЬЭЮУШЬШ ЯаЮУаРЬЬЭлЬШ баХФбвТРЬШ. ЗвЮСл ЯаШ баРТЭХЭШпе ЭХ гзШвлТРЫбп аХУШбва бШЬТЮЫЮТ, Т ЪЮЬРЭФЭЮЩ бваЮЪХ egrep ЯХаХФ аХУгЫпаЭлЬ ТлаРЦХЭШХЬ ЯХаХФРХвбп ЪЫоз -i:

І бЫХФгойШе УЫРТРе Ьл аРббЬЮваШЬ Ш ФагУШХ ТбЯЮЬЮУРвХЫмЭлХ ТЮЧЬЮЦЭЮбвШ вРЪЮУЮ аЮФР.

єагУЫлХ бЪЮСЪШ Ш ЮСаРвЭлХ бблЫЪШ

ґЮ ЭРбвЮпйХУЮ ЬЮЬХЭвР Ьл ТбваХзРЫШбм б ФТгЬп ЯаШЬХЭХЭШпЬШ ЪагУЫле бЪЮСЮЪ: ЮУаРЭШзХЭШХ ЮСЫРбвШ ФХЩбвТШп | Ш УагЯЯШаЮТЪР бШЬТЮЫЮТ ФЫп ЯаШЬХЭХЭШп ЪТРЭвШдШЪРвЮаЮТ (ЭРЯаШЬХа, ? Ш *). П Сл еЮвХЫ гЯЮЬпЭгвм ХйХ ЮФЭЮ бЯХжШРЫШЧШаЮТРЭЭЮХ ЯаШЬХЭХЭШХ ЪагУЫле бЪЮСЮЪ, ЪЮвЮаЮХ ЯЮФФХаЦШТРХвбп ЫШим ЭХЪЮвЮалЬШ ТХабШпЬШ egrep (Т вЮЬ зШбЫХ Ш ЯЮЯгЫпаЭЮЩ GNU-ТХабШХЩ), ЭЮ ТбваХзРХвбп ТЮ ЬЭЮУШе ФагУШе ЯаЮУаРЬЬЭле баХФбвТРе.

єагУЫлХ бЪЮСЪШ ЬЮУгв «ЧРЯЮЬШЭРвм» вХЪбв, ЪЮвЮалЩ бЮТЯРЫ б ЭРеЮФпйШЬбп Т ЭШе ЯЮФТлаРЦХЭШХЬ. НвР ТЮЧЬЮЦЭЮбвм СгФХв ШбЯЮЫмЧЮТРЭР Т зРбвШзЭЮЬ аХиХЭШШ ЯаЮСЫХЬл ЯЮТвЮапойШебп бЫЮТ, ЮЯШбРЭЭЮЩ Т ЭРзРЫХ УЫРТл. µбЫШ ТРЬ ШЧТХбвЭЮ ЪЮЭЪаХвЭЮХ ЯЮТвЮапойХХбп бЫЮТЮ, ХУЮ ЬЮЦЭЮ ТЪЫозШвм Т аХУгЫпаЭЮХ ТлаРЦХЭШХ — ЭРЯаШЬХа, [thespcthe]. їаРТФР, Т нвЮЬ бЫгзРХ вРЪЦХ СгФгв ЭРЩФХЭл бваЮЪШ вШЯР thespctheory, ЭЮ ЯаЮСЫХЬР ЫХУЪЮ аХиРХвбп, ХбЫШ ТРиР ТХабШп egrep ЯЮФФХаЦШТРХв ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвШ ФЫп ЮСЮЧЭРзХЭШп УаРЭШж бЫЮТ: [\<thespcthe\>]. ІЬХбвЮ ЮФЭЮУЮ ЯаЮСХЫР ФРЦХ ЬЮЦЭЮ ШбЯЮЫмЧЮТРвм [spc+], звЮСл ТлаРЦХЭШХ бвРЫЮ СЮЫХХ УШСЪШЬ.

ВХЬ ЭХ ЬХЭХХ, ЯаЮТХаШвм ТбХ ТЮЧЬЮЦЭлХ ЯРал бЫЮТ ЯЮЯаЮбвг ЭХТЮЧЬЮЦЭЮ. ЕЮвХЫЮбм Сл ЭРЩвШ ЮФЭЮ «ЮСЮСйХЭЭЮХ» бЫЮТЮ, Р ЯЮвЮЬ бЪРЧРвм «Р вХЯХам ЯЮШйШ вЮ ЦХ бРЬЮХ». µбЫШ ТРиР ТХабШп egrep ЯЮФФХаЦШТРХв ЬХеРЭШЧЬ ЮСаРвЭле бблЫЮЪ (backreferencing), вРЪРп ТЮЧЬЮЦЭЮбвм бгйХбвТгХв. ѕСаРвЭлХ бблЫЪШ ЯЮЧТЮЫпов ШбЪРвм ЭЮТлЩ вХЪбв, ЪЮвЮалЩ бЮТЯРФРХв б ФагУШЬ вХЪбвЮЬ, бЮТЯРТиШЬ б ЯаХФиХбвТгойХЩ зРбвмо ТлаРЦХЭШп, ЯаШзХЬ ЭР ЬЮЬХЭв ЭРЯШбРЭШп ТлаРЦХЭШп нвЮв вХЪбв ЭХШЧТХбвХЭ.

ЅРзЭХЬ б ТлаРЦХЭШп [\<thespc+the\>] Ш ЧРЬХЭШЬ [the] аХУгЫпаЭлЬ ТлаРЦХЭШХЬ ФЫп ЮСЮЧЭРзХЭШп ЮСЮСйХЭЭЮУЮ бЫЮТР — [[A-Za-z]+]. ·РвХЬ ЯЮ бЮЮСаРЦХЭШпЬ, ЪЮвЮалХ бвРЭгв пбЭл ШЧ бЫХФгойХУЮ РСЧРжР, нвЮ ТлаРЦХЭШХ ЧРЪЫозРХвбп Т ЪагУЫлХ бЪЮСЪШ. ЅРЪЮЭХж, ТвЮаЮХ «the» ЧРЬХЭпХвбп бЯХжШРЫмЭлЬ ЬХвРбШЬТЮЫЮЬ [\1]. їЮЫгзРХвбп [\<([A-Za-z]+)spc+\1\>].

І ЯаЮУаРЬЬРе б ЯЮФФХаЦЪЮЩ ЮСаРвЭле бблЫЮЪ ЪагУЫлХ бЪЮСЪШ «ЧРЯЮЬШЭРов» вХЪбв, бЮТЯРТиШЩ б ЭРеЮФпйШЬбп Т ЭШе ЯЮФТлаРЦХЭШХЬ, Р бЯХжШРЫмЭлЩ ЬХвРбШЬТЮЫ [\1] ЯаХФбвРТЫпХв нвЮв вХЪбв (ЪРЪШЬ Сл ЮЭ ЭШ СлЫ) Т ЮбвРТиХЩбп зРбвШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп.

єЮЭХзЭЮ, Т ТлаРЦХЭШХ ЬЮЦЭЮ ТЪЫозШвм ЭХбЪЮЫмЪЮ ЯРа ЪагУЫле бЪЮСЮЪ Ш бблЫРвмбп ЭР бЮТЯРТиШЩ вХЪбв ЯаШ ЯЮЬЮйШ бШЬТЮЫЮТ [\1], [\2], [\3] Ш в. Ф. їРал бЪЮСЮЪ ЭгЬХаговбп Т бЮЮвТХвбвТШШ б ЯЮапФЪЮТлЬ ЭЮЬХаЮЬ ЮвЪалТРойХЩ бЪЮСЪШ бЫХТР ЭРЯаРТЮ.

І ФРЭЭЮЬ бЫгзРХ «ЭХЮСпЧРвХЫмЭлЩ» ЮЧЭРзРХв, звЮ зРбвм вХУР ЬЮЦХв ТбваХзРвмбп ЮФШЭ аРЧ, ЭЮ ХХ ЯаШбгвбвТШХ ЭХ ваХСгХвбп. БЫХФЮТРвХЫмЭЮ, Ьл ЬЮЦХЬ ТЮбЯЮЫмЧЮТРвмбп ЬХвРбШЬТЮЫЮЬ [?]. їЮбЪЮЫмЪг аРЧЬХа ЭХЮСпЧРвХЫмЭЮУЮ нЫХЬХЭвР ЯаХТлиРХв ЮФШЭ бШЬТЮЫ, ЭХЮСеЮФШЬЮ ШбЯЮЫмЧЮТРвм ЪагУЫлХ бЪЮСЪШ: [(…)?] . їЮбЫХ ТбвРТЪШ нвЮЩ ЪЮЭбвагЪжШШ ЭРиХ ТлаРЦХЭШХ ЯаШЭШЬРХв ТШФ:

ѕСаРвШвХ ТЭШЬРЭШХ: нЫХЬХЭв [spc*] ТлЭХбХЭ ЧР ЪагУЫлХ бЪЮСЪШ. НвЮ бФХЫРЭЮ ФЫп вЮУЮ, звЮСл ТлаРЦХЭШХ гбЯХиЭЮ ЭРеЮФШЫЮ вХУШ ТШФР <HRspc>. µбЫШ Сл нвЮв нЫХЬХЭв ЭРеЮФШЫбп Т бЪЮСЪРе, вЮ ЧРТХаиРойШХ ЯаЮСХЫл ФЮЯгбЪРЫШбм Сл вЮЫмЪЮ ЯаШ гЪРЧРЭШШ Т вХУХ РваШСгвР SIZE.

І ЭРиХЬ ЯаШЬХаХ «thespcthe» ЯЮФТлаРЦХЭШХ [[A-Za-z]+] бЮТЯРФРХв б ЯХаТлЬ the. ѕЭЮ ЭРеЮФШвбп Т ЯХаТЮЩ ЯРаХ ЪагУЫле бЪЮСЮЪ, ЯЮнвЮЬг ЭР бЮТЯРТиХХ «the» ЬЮЦЭЮ бблЫРвмбп ЯаШ ЯЮЬЮйШ ЬХвРбШЬТЮЫР [\1] — ХбЫШ [spc+] бЮТЯРФРХв, вЮ ЭР ЬХбвХ [\1] ФЮЫЦЭЮ ЭРеЮФШвмбп бЫЮТЮ «the». µбЫШ Ш нвЮ гбЫЮТШХ ТлЯЮЫЭпХвбп, [\>] ЯаЮТХапХв, звЮ Ьл ЭРеЮФШЬбп ЭР УаРЭШжХ бЫЮТР (вХЬ бРЬлЬ ШбЪЫозРовбп бЫгзРЩЭлХ бЮТЯРФХЭШп Т бваЮЪРе вШЯР thespctheft). ГбЯХиЭЮХ бЮТЯРФХЭШХ ТбХУЮ ТлаРЦХЭШп ЮЧЭРзРХв, звЮ Ьл ЭРиЫШ ЯЮТвЮапойХХбп бЫЮТЮ. ІЯаЮзХЬ, нвЮ ЭХ ТбХУФР пТЫпХвбп ЮиШСЪЮЩ (ЭРЯаШЬХа, Т РЭУЫШЩбЪЮЬ пЧлЪХ ФЮЯгбЪРовбп ФТР бЫЮТР «that» ЯЮФапФ), ЭЮ ЭРЩФХЭЭлХ ЯЮФЮЧаШвХЫмЭлХ бваЮЪШ ЬЮЦЭЮ ЯаЮбЬЮваХвм Ш бРЬЮбвЮпвХЫмЭЮ ЯаШЭпвм аХиХЭШХ.

АХиШТ ТЪЫозШвм Т ЪЭШУг нвЮв ЯаШЬХа, п ЮЯаЮСЮТРЫ ХУЮ ЭР ЯЮФУЮвЮТЫХЭЭЮЬ вХЪбвХ (ЬЮп ТХабШп egrep ЯЮФФХаЦШТРХв [\<…\>] Ш ЮСаРвЭлХ бблЫЪШ). ЗвЮСл ЪЮЬРЭФР ЯаШЭЮбШЫР СЮЫмиХ ЯЮЫмЧл Ш ЭРеЮФШЫР ЯЮТвЮаХЭШп ТШФР «Thespcthe», п ТЪЫозШЫ Т ЪЮЬРЭФЭго бваЮЪг ЪЫоз -i, гЯЮЬШЭРТиШЩбп ТлиХ:

єРЪ ЭШ бвлФЭЮ ЯаШЧЭРТРвмбп, п ЮСЭРагЦШЫ зХвлаЭРФжРвм ЯРа ЮиШСЮзЭЮ ЯЮТвЮапойШебп бЫЮТ!

їаШ ТбХЩ ЯЮЫХЧЭЮбвШ нвЮУЮ аХУгЫпаЭЮУЮ ТлаРЦХЭШп ЭХЮСеЮФШЬЮ еЮаЮиЮ ЯЮЭШЬРвм ХУЮ ЯаШЭжШЯШРЫмЭлХ ЮУаРЭШзХЭШп. їЮбЪЮЫмЪг egrep ЯаЮбЬРваШТРХв ЪРЦФго бваЮЪг ЯЮ ЮвФХЫмЭЮбвШ, Тл ЭХ бЬЮЦХвХ ЮСЭРагЦШвм вХ бШвгРжШШ, ЪЮУФР бЫЮТЮ Т ЪЮЭжХ бваЮЪШ ЯЮТвЮапХвбп Т ЭРзРЫХ бЫХФгойХЩ бваЮЪШ. ґЫп нвЮУЮ ЭгЦЭл СЮЫХХ бЮТХаиХЭЭлХ ШЭбвагЬХЭвл, Ш ЭХЪЮвЮалХ ЯаШЬХал СгФгв аРббЬЮваХЭл Т бЫХФгойХЩ УЫРТХ.

НЪаРЭШаЮТРЭШХ

П ХйХ ЭХ гЯЮЬШЭРЫ ЮС ЮФЭЮЬ ТРЦЭЮЬ ЮСбвЮпвХЫмбвТХ — ЪРЪ ТЪЫозШвм Т аХУгЫпаЭЮХ ТлаРЦХЭШХ бШЬТЮЫ, ЪЮвЮалЩ ЮСлзЭЮ ШЭвХаЯаХвШагХвбп ЪРЪ ЬХвРбШЬТЮЫ. ЅРЯаШЬХа, ЯаШ ЯЮЯлвЪХ ШбЯЮЫмЧЮТРвм аХУгЫпаЭЮХ ТлаРЦХЭШХ [ega.att.com] ФЫп ЯЮШбЪР ШЬХЭШ ЪЮЬЯмовХаР Т ёЭвХаЭХвХ ega.att.com Т аХЧгЫмвРв ТЪЫозРовбп бваЮЪШ вШЯР megawattspccomputing. єРЪ п гЦХ УЮТЮаШЫ, ЬХвРбШЬТЮЫ [.] бЮТЯРФРХв б ЫоСлЬ бШЬТЮЫЮЬ.

јХвЯЮбЫХФЮТРвХЫмЭЮбвм, бЮТЯРФРойРп б ЫШвХаРЫмЭЮЩ вЮзЪЮЩ, бЮбвЮШв ШЧ ЮСлзЭЮЩ вЮзЪШ Ш нЪаРЭШагойХУЮ ЯаХдШЪбР \ — [ega\.att\.com]. їЮбЫХФЮТРвХЫмЭЮбвм [\.] ЭРЧлТРХвбп «нЪаРЭШаЮТРЭЭЮЩ» (escaped) вЮзЪЮЩ. НЪаРЭШаЮТРЭШХ ЬЮЦХв ТлЯЮЫЭпвмбп бЮ ТбХЬШ бвРЭФРавЭлЬШ ЬХвРбШЬТЮЫРЬШ, ЪаЮЬХ ЬХвРбШЬТЮЫЮТ бШЬТЮЫмЭле ЪЫРббЮТ. НЪаРЭШаЮТРЭЭлЩ ЬХвРбШЬТЮЫ вХапХв бТЮЩ ЮбЮСлЩ бЬлбЫ Ш бвРЭЮТШвбп ЮСлзЭлЬ ЫШвХаРЫЮЬ. їаШ ЦХЫРЭШШ ЯЮбЫХФЮТРвХЫмЭЮбвм «нЪаРЭШагойШЩ ЯаХдШЪб+бШЬТЮЫ» ЬЮЦЭЮ ШЭвХаЯаХвШаЮТРвм ЪРЪ бЯХжШРЫмЭго ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвм, бЮТЯРФРойго б гЪРЧРЭЭлЬ ЫШвХаРЫЮЬ.

ґагУЮЩ ЯаШЬХа: ФЫп ЯЮШбЪР бЫЮТ Т ЪагУЫле бЪЮСЪРе (ЭРЯаШЬХа, «(very)») ЬЮЦЭЮ ТЮбЯЮЫмЧЮТРвмбп аХУгЫпаЭлЬ ТлаРЦХЭШХЬ [$[a-zA-Z]+$]. БШЬТЮЫ \ Т ЯЮбЫХФЮТРвХЫмЭЮбвпе [$] Ш [$] ЮвЬХЭпХв ЮбЮСго ШЭвХаЯаХвРжШо бШЬТЮЫЮТ ( ) Ш ЯаХТаРйРХв Ше Т ЫШвХаРЫл, ЯаХФЭРЧЭРзХЭЭлХ ФЫп ЯЮШбЪР ЪагУЫле бЪЮСЮЪ Т вХЪбвХ.

µбЫШ бШЬТЮЫ \ ЭРеЮФШвбп ЯХаХФ ФагУШЬ бШЬТЮЫЮЬ, ЭХ пТЫпойШЬбп ЬХвРбШЬТЮЫЮЬ, ЮЭ ЬЮЦХв ШЬХвм аРЧЫШзЭлЩ бЬлбЫ Т ЧРТШбШЬЮбвШ Юв ТХабШШ ЯаЮУаРЬЬл. ЅРЯаШЬХа, Ьл гЦХ ТШФХЫШ, звЮ Т ЭХЪЮвЮале ТХабШпе egrep [\<], [\>], [\1] Ш в. Ф. ШЭвХаЯаХвШаговбп ЪРЪ ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвШ. І нвЮЩ УЫРТХ СгФгв ЯаШТХФХЭл Ш ФагУШХ ЯаШЬХал.

ЅЮТлХ УЮаШЧЮЭвл

ЅРФХобм, ТбХ нвШ ЯаШЬХал Ш ЮСкпбЭХЭШп ЧРЫЮЦШЫШ ЮбЭЮТг ФЫп УЫгСЮЪЮУЮ ЯЮЭШЬРЭШп аХУгЫпаЭле ТлаРЦХЭШЩ. ЅЮ ЯЮЦРЫгЩбвР, гзвШвХ, звЮ ЬРвХаШРЫ СлЫ ЯЮФРЭ ТХбмЬР ЯЮТХаеЭЮбвЭЮ, Ш ТРЬ ЯаХФбвЮШв ХйХ ЬЭЮУЮХ гЧЭРвм.

ПЧлЪЮТРп ФШТХабШдШЪРжШп

П гЯЮЬШЭРЫ Ю ЭХЪЮвЮале ТЮЧЬЮЦЭЮбвпе аХУгЫпаЭле ТлаРЦХЭШЩ, ЯЮФФХаЦШТРХЬле ЬЭЮУШЬШ ТХабШпЬШ egrep. БгйХбвТгов Ш ФагУШХ ТЮЧЬЮЦЭЮбвШ, ЪЮвЮалХ ЯаШбгвбвТгов ЫШим Т ЭХСЮЫмиЮЬ зШбЫХ ТХабШЩ. ѕЭШ СгФгв аРббЬЮваХЭл Т ЯЮбЫХФгойШе УЫРТРе.

є бЮЦРЫХЭШо, г пЧлЪР аХУгЫпаЭле ТлаРЦХЭШЩ, ЪРЪ Ш г ХбвХбвТХЭЭле пЧлЪЮТ, бгйХбвТгов аРЧЫШзЭлХ ФШРЫХЪвл Ш ЮвТХвТЫХЭШп. їЮзвШ ЪРЦФРп ЭЮТРп ЯаЮУаРЬЬР б ЯЮФФХаЦЪЮЩ аХУгЫпаЭле ТлаРЦХЭШЩ ШЧЮСаХвРХв ЪРЪЮХ-ЭШСгФм ЭЮТЮХ «гЫгзиХЭШХ». І аХЧгЫмвРвХ аХУгЫпаЭлХ ТлаРЦХЭШп ЯЮбвЮпЭЭЮ аРЧТШТРовбп, Ш Т аХЧгЫмвРвХ ЧР ЬЭЮУШХ УЮФл ЯЮпТШЫШбм ЬЭЮУЮзШбЫХЭЭлХ ФШРЫХЪвл (flavors) аХУгЫпаЭле ТлаРЦХЭШЩ. їаШЬХал СгФгв аРббЬЮваХЭл Т бЫХФгойШе УЫРТРе.

БЬлбЫ аХУгЫпаЭЮУЮ ТлаРЦХЭШп

І бРЬЮЬ ЮСйХЬ бЬлбЫХ аХУгЫпаЭЮХ ТлаРЦХЭШХ ЫШСЮ бЮТЯРФРХв ТЭгваШ ЭХЪЮвЮаЮУЮ даРУЬХЭвР вХЪбвР (ЯаШ ШбЯЮЫмЧЮТРЭШШ egrep — Т бваЮЪХ), ЫШСЮ ЭХ бЮТЯРФРХв. їаШ ЯЮбваЮХЭШШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп ЯаШеЮФШвбп ЯЮбвЮпЭЭЮ бЫХФШвм ЧР вХЬ, звЮСл аХУгЫпаЭЮХ ТлаРЦХЭШХ:

єаЮЬХ вЮУЮ, egrep ЭХ бЫХФШв ЧР вХЬ, УФХ ШЬХЭЭЮ Т бваЮЪХ ЯаЮШЧЮиЫЮ бЮТЯРФХЭШХ, ЮФЭРЪЮ Т ЭХЪЮвЮале бЫгзРпе нвЮв ТЮЯаЮб ЬЮЦХв ЮЪРЧРвмбп ТРЦЭлЬ. їаХФЯЮЫЮЦШЬ, Тл аРСЮвРХвХ б вХЪбвЮЬ, Т ЪЮвЮаЮЬ ТбваХзРХвбп бваЮЪР:

µбЫШ Тл ЯаЮбвЮ ШйХвХ бваЮЪг ЯЮ иРСЫЮЭг [[0-9]+], ТРб ЭХ ШЭвХаХбгХв, Т ЪРЪЮЬ ШЧ зШбХЫ ЯаЮШЧЮиЫЮ бЮТЯРФХЭШХ. ЅЮ ХбЫШ Тл бЮСШаРХвХбм звЮ-вЮ бФХЫРвм б ЭРЩФХЭЭлЬ зШбЫЮЬ (бЮеаРЭШвм Т дРЩЫХ, гТХЫШзШвм, ЧРЬХЭШвм Ш в. Ф. — ЯаШЬХал ЯЮФЮСЭле ЮЯХаРжШЩ ЯаШТЮФпвбп Т бЫХФгойХЩ УЫРТХ), ТЮЯаЮб Ю вЮЬ, ЪРЪЮХ ШЬХЭЭЮ зШбЫЮ СлЫЮ ЭРЩФХЭЮ, бвРЭЮТШвбп ЮзХЭм бгйХбвТХЭЭлЬ.

ґЮЯЮЫЭШвХЫмЭлХ ЯаШЬХал

їаШ аРСЮвХ б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ, ЪРЪ Ш б ЫоСлЬ пЧлЪЮЬ, заХЧТлзРЩЭЮ ЯЮЫХЧХЭ ЯаРЪвШзХбЪШЩ ЮЯлв, ЯЮнвЮЬг п ЯаШТЮЦг ХйХ ЭХбЪЮЫмЪЮ аРбЯаЮбваРЭХЭЭле ЯаШЬХаЮТ аХУгЫпаЭле ТлаРЦХЭШЩ.

їЮЫЮТШЭР еЫЮЯЮв ЯаШ ЭРЯШбРЭШШ аХУгЫпаЭЮУЮ ТлаРЦХЭШп бТпЧРЭР б вХЬ, звЮСл ЮЭЮ бЮТЯРФРЫЮ Т ЭгЦЭле ЬХбвРе. ґагУРп ЯЮЫЮТШЭР — б вХЬ, звЮСл аХУгЫпаЭЮХ ТлаРЦХЭШХ ЭХ бЮТЯРФРЫЮ Т ЭХЭгЦЭле ЬХбвРе. ЅР ЯаРЪвШЪХ ТРЦЭл ЮСР РбЯХЪвР, ЭЮ ЯЮЪР ЮбЭЮТЭЮХ ТЭШЬРЭШХ СгФХв гФХЫпвмбп ЯХаТЮЬг, вЮ Хбвм ЯЮЫгзХЭШо гбЯХиЭЮУЮ бЮТЯРФХЭШп. ЕЮвп ЯаШЬХал РЭРЫШЧШаговбп ЭХ ТЮ ТбХЩ ЯЮЫЭЮвХ, вРЪ СЮЫХХ ЭРУЫпФЭЮ ЯаЮбЫХЦШТРовбп ЮбЭЮТЭлХ ЯаШЭжШЯл аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ.

ёЬХЭР ЯХаХЬХЭЭле

І ЬЭЮУШе пЧлЪРе ЯаЮУаРЬЬШаЮТРЭШп бгйХбвТгов ШФХЭвШдШЪРвЮал (ШЬХЭР ЯХаХЬХЭЭле Ш в. Я.), ЪЮвЮалХ бЮФХаЦРв вЮЫмЪЮ РЫдРТШвЭЮ-жШдаЮТлХ бШЬТЮЫл Ш ЧЭРЪШ ЯЮФзХаЪШТРЭШп, ЭЮ ЭХ ЬЮУгв ЭРзШЭРвмбп б жШдал — вЮ Хбвм [[a-zA-Z_][a-zA-Z_0-9*]. їХаТлЩ ЪЫРбб ЮЯаХФХЫпХв ТЮЧЬЮЦЭлХ ЧЭРзХЭШп ЯХаТЮУЮ бШЬТЮЫР ШФХЭвШдШЪРвЮаР, ТвЮаЮЩ (ТЬХбвХ б бгддШЪбЮЬ *) ЮЯаХФХЫпХв ЮбвРТигобп зРбвм ШФХЭвШдШЪРвЮаР. µбЫШ ФЫШЭР ШФХЭвШдШЪРвЮаР ЮУаРЭШзШТРХвбп, ФЮЯгбвШЬ, 32 бШЬТЮЫРЬШ, ЧТХЧФЮзЪг ЬЮЦЭЮ ЧРЬХЭШвм ТлаРЦХЭШХЬ [{0,31}], ХбЫШ нвР ЪЮЭбвагЪжШп ЯЮФФХаЦШТРХвбп ТРиШЬ ЯаЮУаРЬЬЭлЬ баХФбвТЮЬ (ШЭвХаТРЫмЭлЩ ЪТРЭвШдШЪРвЮа ЪаРвЪЮ гЯЮЬШЭРХвбп ЭР б. <$R[P#,R1-1]>).

їЮбЫХФЮТРвХЫмЭЮбвШ бШЬТЮЫЮТ, ЧРЪЫозХЭЭлХ Т ЪРТлзЪШ

єРТлзЪШ, ЮУаРЭШзШТРойШХ аХУгЫпаЭЮХ ТлаРЦХЭШХ, бЮТЯРФРов б ЮвЪалТРойШЬШ Ш ЧРЪалТРойШЬШ ЪРТлзЪРЬШ бваЮЪШ. јХЦФг ЭШЬШ ЬЮЦХв ЭРеЮФШвмбп ТбХ, звЮ гУЮФЭЮ… ЪаЮЬХ ФагУШе ЪРТлзХЪ! ІлаРЦХЭШХ [[^"]] бЮТЯРФРХв б ЫоСлЬ бШЬТЮЫЮЬ, ЪаЮЬХ ", Р ЧТХЧФЮзЪР УЮТЮаШв Ю вЮЬ, звЮ ЪЮЫШзХбвТЮ вРЪШе бШЬТЮЫЮТ ЬЮЦХв Слвм ЫоСлЬ.

±ЮЫХХ ЯЮЫХЧЭЮХ (еЮвп Ш СЮЫХХ бЫЮЦЭЮХ) ЮЯаХФХЫХЭШХ бваЮЪШ Т ЪРТлзЪРе ЯЮЧТЮЫпХв ТЪЫозРвм Т бваЮЪг ТЭгваХЭЭШХ бШЬТЮЫл ", ХбЫШ ЯХаХФ ЭШЬШ бвЮШв нЪаРЭШагойШЩ ЯаХдШЪб \ — ЭРЯаШЬХа, "nailspcthespc2\"x4\"spcplank". јл ТХаЭХЬбп Ъ нвЮЬг ЯаШЬХаг Т УЫРТРе 4 Ш 5, ЪЮУФР СгФХЬ ЯЮФаЮСЭЮ аРббЬРваШТРвм, ЪРЪ ЦХ ЭР бРЬЮЬ ФХЫХ ЯаЮШбеЮФШв ЯЮШбЪ бЮТЯРФХЭШЩ.

ґХЭХЦЭлХ бгЬЬл Т ФЮЫЫРаРе (б ЭХЮСпЧРвХЫмЭлЬ гЪРЧРЭШХЬ жХЭвЮТ)

ЅР ТХаеЭХЬ гаЮТЭХ нвЮ ЯаЮбвЮХ аХУгЫпаЭЮХ ТлаРЦХЭШХ аРЧСШТРХвбп ЭР ваШ зРбвШ: [\$], […+] Ш [(…)?]. µУЮ ЬЮЦЭЮ ТЮЫмЭЮ бдЮаЬгЫШаЮТРвм ЪРЪ «ЫШвХаРЫ-ЧЭРЪ ФЮЫЫРаР, ЧР ЪЮвЮалЬ бЫХФгХв ЯЮбЫХФЮТРвХЫмЭЮбвм зХУЮ-вЮ вРЪЮУЮ, Р Т ЪЮЭжХ ХйХ ЬЮЦХв ЭРеЮФШвмбп звЮ-вЮ нвРЪЮХ». І ФРЭЭЮЬ бЫгзРХ «звЮ-вЮ вРЪЮХ» — нвЮ жШдаР (ЯЮбЫХФЮТРвХЫмЭЮбвм жШда ЮСаРЧгХв зШбЫЮ), Р «звЮ-вЮ нвРЪЮХ» — нвЮ ФХбпвШзЭРп вЮзЪР, ЧР ЪЮвЮаЮЩ бЫХФгов ФТХ жШдал.

НвЮв ЯаШЬХа ЭРШТХЭ ЯЮ ЭХбЪЮЫмЪШЬ ЯаШзШЭРЬ. ЅРЯаШЬХа, Т egrep ТРЦЭЮ ЫШим вЮ, Хбвм бЮТЯРФХЭШХ ШЫШ ЭХв, Р ФЫШЭР бЮТЯРФХЭШп ЭХбгйХбвТХЭЭР, ЯЮнвЮЬг ТЮЧШвмбп б ЭХЮСпЧРвХЫмЭлЬШ жХЭвРЬШ ЭХаРЧгЬЭЮ (бЮбвРТ бЮТЯРФРойШе Ш ЭХбЮТЯРФРойШе бваЮЪ Юв нвЮУЮ ТбХ аРТЭЮ ЭХ ШЧЬХЭШвбп). Б ФагУЮЩ бвЮаЮЭл, ХбЫШ ТРЬ ЯЮваХСгХвбп ЮвлбЪРвм бваЮЪШ, бЮФХаЦРйШХ вЮЫмЪЮ ФХЭХЦЭго бгЬЬг Ш ЭШзХУЮ ФагУЮУЮ, ТлаРЦХЭШХ ЬЮЦЭЮ «ЧРТХаЭгвм» Т ЪЮЭбвагЪжШо [^…$]. І нвЮЬ бЫгзРХ ЭХЮСпЧРвХЫмЭРп ФаЮСЭРп зРбвм ТРЦЭР, ЯЮбЪЮЫмЪг ЮЭР ЬЮЦХв ЭРеЮФШвмбп (ШЫШ ЭХ ЭРеЮФШвмбп) ЬХЦФг ЮбЭЮТЭЮЩ бгЬЬЮЩ Ш ЪЮЭжЮЬ бваЮЪШ.

єаЮЬХ вЮУЮ, ЯаШТХФХЭЭЮХ ТлаРЦХЭШХ ЭХ ЭРеЮФШв бгЬЬл ТШФР $.49. ІЮЧЭШЪРХв ШбЪгиХЭШХ ЧРЬХЭШвм + ЭР *, ЭЮ вРЪЮХ аХиХЭШХ ЭХ УЮФШвбп. їЮзХЬг? НвЮв ТЮЯаЮб ЮбвРЭХвбп ЮвЪалвлЬ ФЮ ТЮЧТаРйХЭШп Ъ нвЮЬг ЯаШЬХаг Т УЫРТХ 4 (бЬ. б. <$M[R4-31]>).

ІаХЬп Т дЮаЬРвХ «9:17 am» ШЫШ «12:30 pm»

їЮШбЪ ТаХЬХЭШ вЮЦХ ЬЮЦХв ЮбгйХбвТЫпвмбп б аРЧЭЮЩ бвХЯХЭмо вЮзЭЮбвШ. ЅРЯаШЬХа, ТлаРЦХЭШХ

гбЯХиЭЮ ЭРеЮФШв 9:17spcam Ш 12:30spcpm, ЭЮ б вРЪЮЩ ЦХ ЫХУЪЮбвмо ЮСЭРагЦШТРХв ТаХЬп 99:99spcpm.

ЅХвагФЭЮ ЯЮЭпвм, звЮ ХбЫШ зРб бЮбвЮШв ШЧ ФТге жШда, вЮ ЯХаТРп жШдаР ЬЮЦХв Слвм вЮЫмЪЮ ХФШЭШжХЩ[9]. ЅЮ ЪЮЭбвагЪжШп [1?[0-9]] вРЪЦХ ФЮЯгбЪРХв 19 зРбЮТ (Ш 0 зРбЮТ), ЯЮнвЮЬг ЬЮЦЭЮ аРббЬЮваХвм ФТР ЮвФХЫмЭле бЫгзРп: [1[012]] ФЫп зРбЮТ ШЧ ФТге жШда Ш [[1-9]] ФЫп зРбЮТ ШЧ ЮФЭЮЩ жШдал. І аХЧгЫмвРвХ ЯЮЫгзРХвбп [(1[012]|[1-9])].

Б ЬШЭгвРЬШ ФХЫЮ ЮСбвЮШв ЯаЮйХ. їХаТРп жШдаР ЮЯаХФХЫпХвбп ТлаРЦХЭШХЬ [[0-5]], Р ФЫп ТвЮаЮЩ жШдал ЬЮЦЭЮ ЮбвРТШвм [[0-9]]. ѕСкХФШЭпп ТбХ ЪЮЬЯЮЭХЭвл, Ьл ЯЮЫгзРХЬ [(1[012]|[1-9]):[0-5][0-9]spc(am|pm)].

їЮЯаЮСгЩвХ ТЮбЯЮЫмЧЮТРвмбп РЭРЫЮУШзЭлЬШ аРббгЦФХЭШпЬШ Ш ЯЮбваЮШвм аХУгЫпаЭЮХ ТлаРЦХЭШХ ФЫп ЯЮШбЪР ТаХЬХЭШ Т 24-зРбЮТЮЬ дЮаЬРвХ, б ЭгЬХаРжШХЩ зРбЮТ Юв 0 ФЮ 23. ЗвЮСл ЧРФРЭШХ СлЫЮ ЯЮбЫЮЦЭХХ, аРЧаХиШвХ ШбЯЮЫмЧЮТРЭШХ ЭРзРЫмЭЮУЮ ЭгЫп — ЯЮ ЪаРЩЭХЩ ЬХаХ ФЮ 09:59. ref<$M[R1-10]>їЮЯаЮСгЩвХ ЯЮбваЮШвм бЮСбвТХЭЭЮХ аХиХЭШХ, ЧРвХЬ ЯХаХТХаЭШвХ бваРЭШжг Ш бТХамвХбм б ЬЮШЬ ТРаШРЭвЮЬ.

БгйХбвТгов аРЧЭлХ аХиХЭШп, ЭЮ Ьл ТЮбЯЮЫмЧгХЬбп гЦХ ЮЯШбРЭЭЮЩ ЫЮУШЪЮЩ. П аРЧСШЫ ЧРФРзг ЭР ваШ УагЯЯл: гваЮ (c 00 ФЮ 09 зРбЮТ, ТЮЧЬЮЦХЭ ЭРзРЫмЭлЩ ЭЮЫм), ФХЭм (c 10 ФЮ 19 зРбЮТ) Ш ТХзХа (c 20 ФЮ 23 зРбЮТ). БРЬЮХ ЯапЬЮЫШЭХЩЭЮХ аХиХЭШХ ТлУЫпФШв вРЪ: [0?[0-9]|1[0-9]|2[0-3]]<$M[R1-6]>.

ІЮЮСйХ УЮТЮап, ЯХаТлХ ФТР ТРаШРЭвР ЬЮЦЭЮ ЮСкХФШЭШвм, Ш вЮУФР ЧРЯШбм ЯЮЫгзШвбп СЮЫХХ ЪЮаЮвЪЮЩ: [[01]?[0-9]|2[0-3]]. ЅР ЯХаТлЩ ТЧУЫпФ нЪТШТРЫХЭвЭЮбвм нвШе ФТге ЧРЯШбХЩ ЭХ ЮзХТШФЭР, ЭЮ ЭР бРЬЮЬ ФХЫХ нвЮ вРЪ. ІЮЧЬЮЦЭЮ, ТРЬ ЯЮЬЮЦХв ЯаШТХФХЭЭлЩ ЭШЦХ аШбгЭЮЪ, ЭР ЪЮвЮаЮЬ ЧРвХЭХЭЭлХ УагЯЯл ЮСЮЧЭРзРов зШбЫР, бЮЮвТХвбвТгойШХ аРЧЭлЬ РЫмвХаЭРвШТРЬ.

<f24-01>ВХаЬШЭЮЫЮУШп аХУгЫпаЭле ТлаРЦХЭШЩ

«јХвРбШЬТЮЫ»

єЮЭжХЯжШп ЬХвРбШЬТЮЫР (ШЫШ «ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвШ» — п ШбЯЮЫмЧго нвШ бЫЮТР ЪРЪ бШЭЮЭШЬл) ЧРТШбШв Юв вЮУЮ, УФХ ШЬХЭЭЮ Т аХУгЫпаЭЮЬ ТлаРЦХЭШШ ЮЭ ШбЯЮЫмЧгХвбп. ЅРЯаШЬХа, [*] пТЫпХвбп ЬХвРбШЬТЮЫЮЬ, ЭЮ вЮЫмЪЮ ЭХ ТЭгваШ бШЬТЮЫмЭЮУЮ ЪЫРббР Ш вЮЫмЪЮ ХбЫШ ЮЭ ЭХ ШЭвХаЯаХвШагХвбп ЪРЪ ЫШвХаРЫ, вЮ Хбвм ЪЮУФР ЯХаХФ ЭШЬ ЭХ бвЮШв нЪаРЭШагойШЩ ЯаХдШЪб \… ІЯаЮзХЬ, Ш нвЮ ЭХ ТбХУФР вРЪ. ЅРЯаШЬХа, ЧТХЧФЮзЪР ШЭвХаЯаХвШагХвбп ЪРЪ ЫШвХаРЫ Т ТлаРЦХЭШШ [\*], ЭЮ ЭХ Т [\\*] (ЪЮУФР ЯХаТлЩ бШЬТЮЫ \ ЮСХбЯХзШТРХв ЮбЮСго ШЭвХаЯаХвРжШо ТвЮаЮУЮ бШЬТЮЫР), еЮвп Т ЮСЮШе бЫгзРпе «ЯХаХФ ЧТХЧФЮзЪЮЩ бвЮШв бШЬТЮЫ \».

І аРЧЭле ФШРЫХЪвРе аХУгЫпаЭле ТлаРЦХЭШЩ вРЪЦХ ЯЮФФХаЦШТРовбп аРЧЭлХ ЬХвРбШЬТЮЫл. І УЫРТХ 3 нвР вХЬР аРббЬРваШТРХвбп СЮЫХХ ЯЮФаЮСЭЮ.

«ґШРЫХЪв»

єРЪ п гЦХ УЮТЮаШЫ, Т аРЧЭле ЯаЮУаРЬЬРе аХУгЫпаЭлХ ТлаРЦХЭШп ТлЯЮЫЭпов аРЧЭлХ дгЭЪжШШ, ЯЮнвЮЬг ЭРСЮал ЬХвРбШЬТЮЫЮТ Ш ФагУШХ ТЮЧЬЮЦЭЮбвШ, ЯЮФФХаЦШТРХЬлХ ЯаЮУаРЬЬРЬШ, вРЪЦХ аРЧЫШзРовбп. І ЮФЭШе ЯаЮУаРЬЬРе ЭХ ЯЮФФХаЦШТРовбп ЪРЪШХ-ЫШСЮ ЬХвРбШЬТЮЫл, Т ФагУШе ФЮСРТЫповбп вХ ШЫШ ШЭлХ ФЮЯЮЫЭШвХЫмЭлХ ТЮЧЬЮЦЭЮбвШ. ІХаЭХЬбп Ъ ЯаШЬХаг б УаРЭШжРЬШ бЫЮТ. ЅХЪЮвЮалХ ТХабШШ egrep ЯЮФФХаЦШТРов ЮСЮЧЭРзХЭШп \<…\>. І ФагУШе ТХабШпе ЭХв ЮвФХЫмЭле ЬХвРбШЬТЮЫЮТ ФЫп ЭРзРЫР Ш ЪЮЭжР бЫЮТР, Р Хбвм ЮФШЭ гЭШТХабРЫмЭлЩ ЬХвРбШЬТЮЫ<$M[R1-3]> [\b]. І ваХвмШе ТХабШпе ЯЮФФХаЦШТРовбп ТбХ ЯХаХзШбЫХЭЭлХ ЬХвРбШЬТЮЫл. ЅРЪЮЭХж, бгйХбвТгов ТХабШШ, ЪЮвЮалХ ЭХ ЯЮФФХаЦШТРов ЭШ ЮФШЭ ШЧ нвШе ЬХвРбШЬТЮЫЮТ.

БЮТЮЪгЯЭЮбвм нвШе ТвЮаЮбвХЯХЭЭле аРЧЫШзШЩ Т аХРЫШЧРжШШ п ЮСЮЧЭРзРо вХаЬШЭЮЬ «ФШРЫХЪв». ѕФЭРЪЮ ФШРЫХЪв ЭХ бТЮФШвбп Ъ ЭРСЮаг ЯЮФФХаЦШТРХЬле Ш ЭХЯЮФФХаЦШТРХЬле ЬХвРбШЬТЮЫЮТ — ЧР нвШЬ ЯЮЭпвШХЬ ЪаЮХвбп ЭХзвЮ СЮЫмиХХ. ґРЦХ ХбЫШ ФТХ ЯаЮУаРЬЬл ЯЮФФХаЦШТРов [\<…\>], ЮЭШ ЬЮУгв аРбеЮФШвмбп ТЮ ЬЭХЭШпе ЮвЭЮбШвХЫмЭЮ вЮУЮ, звЮ ШЬХЭЭЮ бЫХФгХв бзШвРвм бЫЮТЮЬ. µбЫШ Тл еЮвШвХ ЭР бРЬЮЬ ФХЫХ ШЧТЫХЪРвм ЯЮЫмЧг ШЧ ЯаЮУаРЬЬл, нвЮ ФХЩбвТШвХЫмЭЮ ТРЦЭЮ. їЮФЮСЭлЬ «ЧРЪгЫШбЭлЬ» аРЧЫШзШпЬ ЯЮбТпйХЭР УЫРТР 4.

ЅХ ЯгвРЩвХ «ФШРЫХЪв» б ЪЮЭЪаХвЭЮЩ ЯаЮУаРЬЬЮЩ. їЮФЮСЭЮ вЮЬг, ЪРЪ ФТЮХ ЫоФХЩ ЬЮУгв УЮТЮаШвм ЭР ЮФЭЮЬ Ш вЮЬ ЦХ ФШРЫХЪвХ, ФТХ РСбЮЫовЭЮ аРЧЭлХ ЯаЮУаРЬЬл ЬЮУгв ЯЮФФХаЦШТРвм ЮФШЭРЪЮТлХ ФШРЫХЪвл аХУгЫпаЭле ТлаРЦХЭШЩ. єаЮЬХ вЮУЮ, ФТХ ЮФЭЮШЬХЭЭлХ ЯаЮУаРЬЬл (Ш ЯаХФЭРЧЭРзХЭЭлХ ФЫп аХиХЭШп ЮСйХЩ ЧРФРзШ) ЭХаХФЪЮ ЮСЫРФРов бШЫмЭЮ аРЧЫШзРойШЬШбп ФШРЫХЪвРЬШ.

«їЮФТлаРЦХЭШХ»

ВХаЬШЭ «ЯЮФТлаРЦХЭШХ» (subexpression) ЭР бРЬЮЬ ФХЫХ ЮЧЭРзРХв ЫоСго зРбвм СЮЫмиХУЮ ТлаРЦХЭШп, ЭЮ ЮСлзЭЮ ЮЭ ЮвЭЮбШвбп Ъ зРбвШ, ЧРЪЫозХЭЭЮЩ Т ЪагУЫлХ бЪЮСЪШ, ШЫШ Ъ ЮФЭЮЩ ШЧ РЫмвХаЭРвШТ ЪЮЭбвагЪжШШ ТлСЮаР. ЅРЯаШЬХа, Т ТлаРЦХЭШШ [^(Subject|Date):spc] зРбвм [Subject|Date] ЮСлзЭЮ ШЬХЭгХвбп ЯЮФТлаРЦХЭШХЬ. ІЭгваШ ЭХХ РЫмвХаЭРвШТл [Subject] Ш [Date] вЮЦХ ЭРЧлТРовбп ЯЮФТлаРЦХЭШпЬШ.

єЮЭбвагЪжШп вШЯР [1-6] ЭХ бзШвРХвбп ЯЮФТлаРЦХЭШХЬ [H[1-6]spc*], ЯЮбЪЮЫмЪг ЮЭР пТЫпХвбп зРбвмо ЭХаРЧалТЭЮУЮ «нЫХЬХЭвР» — бШЬТЮЫмЭЮУЮ ЪЫРббР. Б ФагУЮЩ бвЮаЮЭл, [H], [1-6] Ш [spc*] пТЫповбп ЯЮФТлаРЦХЭШпЬШ ШбеЮФЭЮУЮ ТлаРЦХЭШп.

І ЮвЫШзШХ Юв ЪЮЭбвагЪжШШ ТлСЮаР, ЪТРЭвШдШЪРвЮал (*, + Ш ?) ТбХУФР ЯаШЬХЭповбп Ъ ЭРШЬХЭмиХЬг ЭХЯЮбаХФбвТХЭЭЮ ЯаХФиХбвТгойХЬг ЯЮФТлаРЦХЭШо. ІЮв ЯЮзХЬг Т ТлаРЦХЭШШ [mis+pell] ЯЫоб ЮвЭЮбШвбп вЮЫмЪЮ Ъ [s], Р ЭХ Ъ [mis] ШЫШ [is]. єЮЭХзЭЮ, ЪЮУФР ЪТРЭвШдШЪРвЮаг ЭХЯЮбаХФбвТХЭЭЮ ЯаХФиХбвТгХв ЯЮФТлаРЦХЭШХ Т ЪагУЫле бЪЮСЪРе, ТбХ ЯЮФТлаРЦХЭШХ (бЪЮЫм Сл бЫЮЦЭлЬ ЮЭЮ ЭШ СлЫЮ) ТЮбЯаШЭШЬРХвбп ЪРЪ ХФШЭЮХ жХЫЮХ.

«БШЬТЮЫ»

<$M[R1-12]>єРЪ гЯЮЬШЭРЫЮбм Т ЮФЭЮЩ ШЧ ЯаХФлФгйШе бЭЮбЮЪ, вХаЬШЭ «бШЬТЮЫ» Т ШЭдЮаЬРвШЪХ ШЬХХв ЬЭЮУЮ ЧЭРзХЭШЩ. БШЬТЮЫ, ЯаХФбвРТЫХЭЭлЩ ЭХЪЮвЮалЬ СРЩвЮЬ — ТбХУЮ ЫШим ТЮЯаЮб ШЭвХаЯаХвРжШШ. ·ЭРзХЭШХ СРЩвР ЮбвРХвбп ЭХШЧЬХЭЭлЬ Т ЫоСЮЬ ЪЮЭвХЪбвХ, ЮФЭРЪЮ бЮЮвТХвбвТгойШЩ ХЬг бШЬТЮЫ ЧРТШбШв Юв ЪЮФШаЮТЪШ<$M[R1-11]>. ЅРЯаШЬХа, ФТР СРЩвР б ФХбпвШзЭлЬШ ЧЭРзХЭШпЬШ 64 Ш 53 ЯаХФбвРТЫпов бШЬТЮЫл «@» Ш «5» Т ЪЮФШаЮТЪХ ASCII, ЭЮ б ФагУЮЩ бвЮаЮЭл, Т ЪЮФШаЮТЪХ EBCDIC ЮЭШ бЮЮвТХвбвТгов бЮТХаиХЭЭЮ ФагУШЬ бШЬТЮЫРЬ (ЯаЮСХЫ Ш бШЬТЮЫ <TRN>, звЮ Сл нвЮ ЭШ ЮЧЭРзРЫЮ).

І ЪЮФШаЮТЪХ JIS (ISO-2022-JP) нвШ ФТР СРЩвР бЮТЬХбвЭЮ ЯаХФбвРТЫпов ШХаЮУЫШд ###26-1### (ТЮЧЬЮЦЭЮ, Тл гЧЭРЫШ ХУЮ ЯЮ ЭРзРЫг даРЧл, ЯаШТХФХЭЭЮЩ Т аРЧФХЫХ «°ЭРЫЮУШп б пЧлЪРЬШ» ЭР б. <$R[P#,R1-2]>). ЅЮ Т ЪЮФШаЮТЪХ EUC-JP нвЮв ЦХ ШХаЮУЫШд ЯаХФбвРТЫпХвбп ФТгЬп бЮТХаиХЭЭЮ ФагУШЬШ СРЩвРЬШ. єбвРвШ УЮТЮап, Т ЪЮФШаЮТЪХ Latin-1 (ISO-8859-1) нвШ ФТР СРЩвР ЯаХФбвРТЫпов ФТР бШЬТЮЫР «°µ», Р Т ЪЮФШаЮТЪХ Unicode (ЭЮ вЮЫмЪЮ ЭРзШЭРп б ТХабШШ 2.0[10]) — ЮФШЭ ЪЮаХЩбЪШЩ ШХаЮУЫШд ###26-2###.

Іл ЯЮЭШЬРХвХ, звЮ п ШЬХо Т ТШФг. їаЮУаРЬЬл, аРСЮвРойШХ б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ, ЮСлзЭЮ ШЭвХаЯаХвШагов бТЮШ ФРЭЭлХ ЪРЪ бЮТЮЪгЯЭЮбвм СРЩвЮТ, ЭХ гзШвлТРп ЯаХФЯЮЫРУРХЬЮЩ ЪЮФШаЮТЪШ. їаШ ЯЮШбЪХ [°µ] ЬЭЮУШХ ЯаЮУаРЬЬл ЭРЩФгв ###26-1### Т ФРЭЭле EUC-JP ШЫШ ###26-2### Т ФРЭЭле Unicode.

Б нвШЬШ (Ш ХйХ СЮЫХХ бЫЮЦЭлЬШ) ЯаЮСЫХЬРЬШ ЯЮбвЮпЭЭЮ бвРЫЪШТРовбп вХ, ЪвЮ аРСЮвРХв б ФРЭЭлЬШ Unicode ШЫШ ФагУШе ЬЭЮУЮСРЩвЮТле ЪЮФШаЮТЮЪ. ІЯаЮзХЬ, ФЫп СЮЫмиШЭбвТР зШвРвХЫХЩ ЮЭШ ЭХбгйХбвТХЭЭл, ЯЮнвЮЬг п СгФг бзШвРвм вХаЬШЭл «СРЩв» Ш «бШЬТЮЫ» бШЭЮЭШЬРЬШ.

їгвШ Ъ бЮТХаиХЭбвТЮТРЭШо

ЗХбвЭЮ УЮТЮап, ШЧгзШвм аХУгЫпаЭлХ ТлаРЦХЭШп ЭХ вРЪ гЦ бЫЮЦЭЮ. ЅЮ ХбЫШ ЯЮУЮТЮаШвм бЮ баХФЭШЬ ЯЮЫмЧЮТРвХЫХЬ ЯаЮУаРЬЬл ШЫШ пЧлЪР б ЯЮФФХаЦЪЮЩ аХУгЫпаЭле ТлаРЦХЭШЩ, бЪЮаХХ ТбХУЮ ТлпбЭШвбп, звЮ ТРи бЮСХбХФЭШЪ «ЭХЬЭЮЦЪЮ аРЧСШаРХвбп» Т ЭШе, ЭЮ ЭХ згТбвТгХв ФЮбвРвЮзЭЮЩ гТХаХЭЭЮбвШ ФЫп аХиХЭШп ФХЩбвТШвХЫмЭЮ ЭХваШТШРЫмЭле ЧРФРз ШЫШ ЮУаРЭШзШТРХвбп вЮЫмЪЮ вХЬШ ЯаЮУаРЬЬРЬШ, ЪЮвЮалЬШ ЮЭ зРбвЮ ЯЮЫмЧгХвбп.

ѕСлзЭЮ ФЮЪгЬХЭвРжШп ЯЮ аХУгЫпаЭлЬ ТлаРЦХЭШпЬ ЮУаРЭШзШТРХвбп ЪЮаЮвЪШЬ Ш ЭХЯЮЫЭлЬ ЮЯШбРЭШХЬ ЮФЭЮУЮ-ФТге ЬХвРбШЬТЮЫЮТ, ЧР ЪЮвЮалЬ бЫХФгХв вРСЫШжР б ЯХаХзШбЫХЭШХЬ ТбХУЮ ЮбвРЫмЭЮУЮ. І ЯаШЬХаРе зРбвЮ ШбЯЮЫмЧговбп СХббЬлбЫХЭЭлХ аХУгЫпаЭлХ ТлаРЦХЭШп вШЯР [a*((ab)*|b*] Ш ЯЮвапбРойШХ вХЪбвл ТаЮФХ «aspcxxxspccespcxxxxxxspccispcxxxspcd». єаЮЬХ вЮУЮ, Т ФЮЪгЬХЭвРжШШ ЯЮЫЭЮбвмо ШУЭЮаШаговбп ЭХЮзХТШФЭлХ, ЭЮ ТРЦЭлХ ЬЮЬХЭвл, Ш зРбвЮ гвТХаЦФРХвбп, звЮ ЯЮФФХаЦШТРХЬлЩ ФШРЫХЪв ЯЮЫЭЮбвмо бЮТЬХбвШЬ б ФШРЫХЪвЮЬ ФагУЮЩ, еЮаЮиЮ ШЧТХбвЭЮЩ ЯаЮУаРЬЬл. їаШ нвЮЬ РТвЮал ТбХУФР ЧРСлТРов гЯЮЬпЭгвм Ю ЭХШЧСХЦЭле ШбЪЫозХЭШпе. І ЮСйХЬ, бЮбвЮпЭШХ ФХЫ б ФЮЪгЬХЭвРжШХЩ ЯЮ аХУгЫпаЭлЬ ТлаРЦХЭШпЬ пТЭЮ ЭгЦФРХвбп Т гЫгзиХЭШШ.

П ТЮТбХ ЭХ гвТХаЦФРо, звЮ нвР УЫРТР аХиШв ТбХ ЯаЮСЫХЬл. БЪЮаХХ ЮЭР ЧРЫЮЦШв дгЭФРЬХЭв, ЭР ЪЮвЮаЮЬ СгФХв ЯЮбваЮХЭР Тбп ЮбвРТиРпбп зРбвм ЪЭШУШ. ·ТгзШв РЬСШжШЮЧЭЮ, ЭЮ п ЭРФХобм, звЮ нвР ЪЭШУР ФХЩбвТШвХЫмЭЮ аХиШв ЬЭЮУШХ ЯаЮСЫХЬл. јЮЦХв Слвм, ШЧ-ЧР ваРФШжШЮЭЭле ЭХФЮбвРвЪЮТ ФЮЪгЬХЭвРжШШ п ЯЮбвРаРЫбп ЯаШЫЮЦШвм ФЮЯЮЫЭШвХЫмЭлХ гбШЫШп Ш ШЧЫЮЦШвм ЬРвХаШРЫ ФХЩбвТШвХЫмЭЮ ЯЮЭпвЭЮ. ґЫп ЯЮЫЭЮжХЭЭЮУЮ ШбЯЮЫмЧЮТРЭШп аХУгЫпаЭле ТлаРЦХЭШЩ Тл ФЮЫЦЭл ФХЩбвТШвХЫмЭЮ ЯЮЭпвм Ше.

ЕЮаЮиЮ — ЯЮвЮЬг звЮ Тл ЭРгзШвХбм ЬлбЫШвм аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ. Іл гЧЭРХвХ, ЭР ЪРЪШХ аРЧЫШзШп Ш ЮбЮСХЭЭЮбвШ бЫХФгХв Т ЯХаТго ЮзХаХФм ЮСаРйРвм ТЭШЬРЭШХ ЯаШ ЧЭРЪЮЬбвТХ б ЭЮТЮЩ ЯаЮУаРЬЬЮЩ, ЮСЫРФРойХЩ бЮСбвТХЭЭлЬ ФШРЫХЪвЮЬ. Іл ЭРгзШвХбм ТлаРЦРвм бТЮШ ЬлбЫШ ФРЦХ ЭР бЫРСЮЬ, гбХзХЭЭЮЬ ФШРЫХЪвХ аХУгЫпаЭле ТлаРЦХЭШЩ. БвЮЫЪЭгТиШбм б ЮбЮСХЭЭЮ бЫЮЦЭлЬ ТлаРЦХЭШХЬ, Тл СгФХвХ вЮзЭЮ ЧЭРвм, ЪРЪ ЮЭЮ СгФХв ЮСаРСЮвРЭЮ ЯаЮУаРЬЬЮЩ. єЮаЮзХ УЮТЮап, ЯЮвХЭжШРЫ аХУгЫпаЭле ТлаРЦХЭШЩ Т ЯЮЫЭЮЩ ЬХаХ аРбЪаЮХвбп ЯХаХФ ТРЬШ.

ЅЮ ЯаШ нвЮЬ ТРЬ ЯаШФХвбп ЮбЭЮТРвХЫмЭЮ ЯЮвагФШвмбп:

l ѕСйШХ ЯаШЭжШЯл ШбЯЮЫмЧЮТРЭШп аХУгЫпаЭле ТлаРЦХЭШЩ — Т СЮЫмиШЭбвТХ ЯаЮУаРЬЬ бгйХбвТгов СЮЫХХ бЮТХаиХЭЭлХ баХФбвТР аРСЮвл б аХУгЫпаЭлЬШ ТлаРЦХЭШпЬШ, зХЬ Т гвШЫШвХ egrep. їаХЦФХ зХЬ ЯЮФаЮСЭЮ аРббЬРваШТРвм ЯаЮжХбб ЭРЯШбРЭШп ФХЩбвТШвХЫмЭЮ ЯЮЫХЧЭле аХУгЫпаЭле ТлаРЦХЭШЩ, ЭХЮСеЮФШЬЮ аРЧЮСаРвмбп б ЮСйШЬШ ЯаШЭжШЯРЬШ Ше ШбЯЮЫмЧЮТРЭШп. јл ЧРЩЬХЬбп нвЮЩ вХЬЮЩ бЮ бЫХФгойХЩ УЫРТл.

l ІЮЧЬЮЦЭЮбвШ аХУгЫпаЭле ТлаРЦХЭШЩ — ЯаРТШЫмЭлЩ ТлСЮа ШЭбвагЬХЭвР ФЫп аХиХЭШп ЪЮЭЪаХвЭЮЩ ЯаЮСЫХЬл ЭРЯЮЫЮТШЭг аХиРХв ЧРФРзг, ЯЮнвЮЬг п ЭХ еЮзг ЮУаРЭШзШТРвмбп ЮФЭЮЩ гвШЫШвЮЩ ТЮ ТбХЩ ЪЭШУХ. АРЧЭлХ ЯаЮУаРЬЬл (Р ШЭЮУФР ФРЦХ аРЧЭлХ ТХабШШ ЮФЭЮЩ ЯаЮУаРЬЬл) ЮСЫРФРов аРЧЭлЬШ ТЮЧЬЮЦЭЮбвпЬШ Ш ЯЮФФХаЦШТРов аРЧЭлХ ЬХвРбШЬТЮЫл. їаХЦФХ зХЬ ЯХаХеЮФШвм Ъ ЯЮФаЮСЭЮбвпЬ ШбЯЮЫмЧЮТРЭШп, Ьл ЯЮФаЮСЭЮ ШЧгзШЬ ЮСбвРЭЮТЪг. НвЮЩ вХЬХ ЯЮбТпйХЭР УЫРТР 3.

l јХеРЭШЧЬ ЮСаРСЮвЪШ аХУгЫпаЭле ТлаРЦХЭШЩ — звЮСл Ьл ЬЮУЫШ ШЧгзРвм ЯЮЫХЧЭлХ (ЭЮ ЭХаХФЪЮ бЫЮЦЭлХ) ЯаШЬХал, ЭХЮСеЮФШЬЮ ТлпбЭШвм, ЪРЪ ЦХ ЯаЮШбеЮФШв ЯЮШбЪ аХУгЫпаЭле ТлаРЦХЭШЩ. єРЪ Тл гСХФШвХбм, ЯЮапФЮЪ ЯаЮТХаЪШ ЭХЪЮвЮале ЬХвРбШЬТЮЫЮТ ЬЮЦХв ШУаРвм ЮзХЭм ТРЦЭго аЮЫм. ±ЮЫХХ вЮУЮ, ЮСаРСЮвЪР аХУгЫпаЭле ТлаРЦХЭШЩ ЬЮЦХв Слвм аХРЫШЧЮТРЭР аРЧЫШзЭлЬШ бЯЮбЮСРЬШ, ЯЮнвЮЬг аРЧЭлХ ЯаЮУаРЬЬл зРбвЮ ТлЯЮЫЭпов б ЮФЭШЬ ТлаРЦХЭШХЬ аРЧЭлХ ФХЩбвТШп. НвР ЮСиШаЭРп вХЬР аРббЬРваШТРХвбп Т УЫРТРе 4 Ш 5.

їЮбЫХФЭШЩ ЯгЭЪв — бРЬлЩ ТРЦЭлЩ Ш ЮФЭЮТаХЬХЭЭЮ бРЬлЩ бЫЮЦЭлЩ Т ШЧЫЮЦХЭШШ. ВХЮаХвШзХбЪШХ аРббгЦФХЭШп ЯЮЪРЦгвбп бЪгзЭЮТРвлЬШ ЭХвХаЯХЫШТЮЬг зШвРвХЫо, бваХЬпйХЬгбп ЯЮбЪЮаХХ ФЮСаРвмбп ФЮ бРЬЮУЮ ШЭвХаХбЭЮУЮ — ФЮ аХРЫмЭле ЧРФРз. ВХЬ ЭХ ЬХЭХХ, ЬХеРЭШЧЬ ЮСаРСЮвЪШ аХУгЫпаЭле ТлаРЦХЭШЩ пТЫпХвбп ЪЫозЮЬ Ъ Ше ЯЮФЫШЭЭЮЬг ЯЮЭШЬРЭШо.

ІЮЧЬЮЦЭЮ, ЪвЮ-вЮ ТЮЧаРЧШв — звЮСл ЭРгзШвмбп ТЮФШвм ЬРиШЭг, ЭХЮСпЧРвХЫмЭЮ ЧЭРвм, ЪРЪ ЮЭР гбваЮХЭР. ЅЮ РЭРЫЮУШп б ТЮЦФХЭШХЬ ЬРиШЭл Т ФРЭЭЮЬ бЫгзРХ ЭХгЬХбвЭР. П еЮзг, звЮСл Тл ЭРгзШЫШбм аХиРвм ЧРФРзШ б ШбЯЮЫмЧЮТРЭШХЬ аХУгЫпаЭле ТлаРЦХЭШЩ, Р ФЫп нвЮУЮ ТРЬ ЯаШФХвбп бРЬЮбвЮпвХЫмЭЮ бваЮШвм аХУгЫпаЭлХ ТлаРЦХЭШп. ВРЪ звЮ ЫгзиХ ЯаЮТХбвШ РЭРЫЮУШо ЭХ б ТЮЦФХЭШХЬ РТвЮЬЮСШЫп, Р б ХУЮ бРЬЮбвЮпвХЫмЭЮЩ бСЮаЪЮЩ. ЗвЮСл ЯЮбваЮШвм бТЮЩ РТвЮЬЮСШЫм, ЭХЮСеЮФШЬЮ ЧЭРвм, ЪРЪ ЮЭ гбваЮХЭ.

І УЫРТХ 2 Тл ЯЮЫгзШвХ ФЮЯЮЫЭШвХЫмЭлЩ ЮЯлв ЯаРЪвШзХбЪЮУЮ ТЮЦФХЭШп. І УЫРТХ 3 аРббЬРваШТРХвбп бваЮХЭШХ ЪгЧЮТР (ФШРЫХЪвЮТ аХУгЫпаЭле ТлаРЦХЭШЩ), Р Т УЫРТХ 4 Тл ЯЮЧЭРЪЮЬШвХбм бЮ бваЮХЭШХЬ ФТШУРвХЫп. іЫРТР 3 вРЪЦХ бЮФХаЦШв ЪаРвЪШЩ ЮСЧЮа РТвЮЬЮСШЫХбваЮХЭШп Ш ЯаЮЫШТРХв бТХв ЭР бХУЮФЭпиЭоо бШвгРжШо. іЫРТР 5 ЯЮЪРЧлТРХв, ЪРЪ ЭРбваРШТРвм аРЧЫШзЭлХ ФТШУРвХЫШ, Р Т ЯЮбЫХФгойШе УЫРТРе аРббЬРваШТРовбп ЪЮЭЪаХвЭлХ ЬЮФХЫШ. ЅРЬ ЯаХФбвЮШв ЯаЮТХбвШ ЬЭЮУЮ ТаХЬХЭШ, ЪЮЯРпбм ЯЮФ ЪРЯЮвЮЬ (ЮбЮСХЭЭЮ Т УЫРТРе 4 Ш 5), ЯЮнвЮЬг ЭХ ЧРСгФмвХ ЭРФХвм аРСЮзШЩ ЪЮЬСШЭХЧЮЭ Ш ЧРЯРбШвХбм вапЯЪРЬШ.

ёвЮУШ

І вРСЫ. 1.3 ЯаШТХФХЭР бТЮФЪР ЬХвРбШЬТЮЫЮТ egrep, аРббЬЮваХЭЭле Т нвЮЩ УЫРТХ. Іл ФЮЫЦЭл зХвЪЮ ЯЮЭШЬРвм бЫХФгойШХ ЯЮЫЮЦХЭШп:

l ЅХ ТбХ ЯаЮУаРЬЬл egrep ЮФШЭРЪЮТл. ѕЭШ зРбвЮ аРЧЫШзРовбп ЯЮ ЭРСЮаг ЯЮФФХаЦШТРХЬле ЬХвРбШЬТЮЫЮТ Ш Ше ШЭвХаЯаХвРжШШ — ЧР ЯЮФаЮСЭЮбвпЬШ ЮСаРйРЩвХбм Ъ ФЮЪгЬХЭвРжШШ.

l єагУЫлХ бЪЮСЪШ ЯаШЬХЭповбп ФЫп УагЯЯШаЮТЪШ, бЮеаРЭХЭШп бЮТЯРТиХУЮ вХЪбвР Ш ЮУаРЭШзХЭШп ЪЮЭбвагЪжШЩ ТлСЮаР.

l БШЬТЮЫмЭлХ ЪЫРббл ЧРЭШЬРов ЮбЮСЮХ ЬХбвЮ — Т ЭШе ФХЩбвТгов бЮТХаиХЭЭЮ ШЭлХ ЯаРТШЫР ШбЯЮЫмЧЮТРЭШп ЬХвРбШЬТЮЫЮТ.

l єЮЭбвагЪжШШ ТлСЮаР Ш бШЬТЮЫмЭлХ ЪЫРббл ЯаШЭжШЯШРЫмЭЮ ЮвЫШзРовбп ФагУ Юв ФагУР. ѕЭШ аХиРов аРЧЭлХ ЧРФРзШ, ЪЮвЮалХ ЫШим Т ЮФЭЮЩ бЯХжШРЫШЧШаЮТРЭЭЮЩ бШвгРжШШ ТлУЫпФпв ЯЮеЮЦШЬШ.

l ёЭТХавШаЮТРЭЭлЩ бШЬТЮЫмЭлЩ ЪЫРбб «ЯЮЧШвШТХЭ» — ЮЭ ЯаХФЯЮЫРУРХв ЭРЫШзШХ бШЬТЮЫР, Р ЭХ ХУЮ ЮвбгвбвТШХ. їЮбЪЮЫмЪг бЯШбЮЪ бШЬТЮЫЮТ ШЭТХавШагХвбп, бЮТЯРФРойШЩ бШЬТЮЫ ФЮЫЦХЭ Слвм ЮФЭШЬ ШЧ вХе, ЪЮвЮалХ ЭХ ЯХаХзШбЫХЭл Т ЪЫРббХ.

l їЮЫХЧЭлЩ ЪЫоз -i ЮвЬХЭпХв гзХв аХУШбваР бШЬТЮЫЮТ ЯаШ баРТЭХЭШШ.

l БгйХбвТгХв ваШ аРЧЫШзЭле ТРаШРЭвР нЪаРЭШаЮТРЭШп:

1. [\] + ЬХвРбШЬТЮЫ — ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвм, ЮСЮЧЭРзРойРп бЮЮвТХвбвТгойШЩ ЫШвХаРЫ (ЭРЯаШЬХа, [\*] ЮСЮЧЭРзРХв ЫШвХаРЫ-ЧТХЧФЮзЪг).

2. [\] + ЭХЪЮвЮалХ ЬХвРбШЬТЮЫл — ЬХвРЯЮбЫХФЮТРвХЫмЭЮбвм, бЬлбЫ ЪЮвЮаЮЩ ЧРТШбШв Юв ЪЮЭЪаХвЭЮЩ аХРЫШЧРжШШ (ЭРЯаШЬХа, [\<] зРбвЮ ЮЧЭРзРХв «ЭРзРЫЮ бЫЮТР»).

3. [\] + ЫоСЮЩ ФагУЮЩ бШЬТЮЫ — ЯаЮбвЮ гЪРЧРЭЭлЩ бШЬТЮЫ (ШЭРзХ УЮТЮап, бШЬТЮЫ \ ШУЭЮаШагХвбп).

їЮЬЭШвХ Ю вЮЬ, звЮ Т бШЬТЮЫмЭле ЪЫРббРе бШЬТЮЫ \ ЭХ ШЬХХв ЮбЮСЮЩ ШЭвХаЯаХвРжШШ.

l НЫХЬХЭвл, Ъ ЪЮвЮалЬ ЯаШЬХЭповбп ЬХвРбШЬТЮЫл ? Ш *, ЭХ ЮСпЧРЭл ФХЩбвТШвХЫмЭЮ бЮТЯРФРвм б ЪРЪЮЩ-вЮ зРбвмо бваЮЪШ ФЫп ЯЮЫгзХЭШп «гбЯХиЭЮУЮ бЮТЯРФХЭШп». ѕЭШ бЮТЯРФРов ТбХУФР, ФРЦХ ХбЫШ ЮЭШ бЮТЯРФРов б «ЭШзХЬ».

»ШзЭлХ ЧРЬХвЪШ

·РФРзР б ЯЮТвЮапойШЬШбп бЫЮТРЬШ, ЮЯШбРЭЭРп Т ЭРзРЫХ УЫРТл, ТлУЫпФШв ФЮТЮЫмЭЮ бЫЮЦЭЮЩ, ЮФЭРЪЮ ТлФРойШХбп ТЮЧЬЮЦЭЮбвШ аХУгЫпаЭле ТлаРЦХЭШЩ ЯЮЧТЮЫШЫШ ЭРЬ ЯаРЪвШзХбЪШ ЯЮЫЭЮбвмо аХиШвм ХХ ЯаШ ЯЮЬЮйШ вРЪЮУЮ ЮУаРЭШзХЭЭЮУЮ ШЭбвагЬХЭвР, ЪРЪ egrep, Ш ЯаШвЮЬ Т ЯХаТЮЩ УЫРТХ ЪЭШУШ. П еЮвХЫ ЯаШТХбвШ Ш СЮЫХХ нддХЪвЭлХ ЯаШЬХал, ЭЮ ЯЮвЮЬ аХиШЫ, звЮ СгФХв ЫгзиХ ЭРЯаРТШвм бТЮШ гбШЫШп ЭР гЪаХЯЫХЭШХ ЭРФХЦЭЮУЮ дгЭФРЬХЭвР ФЫп ЯЮбЫХФгойШе УЫРТ. П ШбЯгУРЫбп, звЮ ЪРЪЮЩ-ЭШСгФм ЭЮТШзЮЪ ЯаЮзШвРХв нвг УЫРТг, ЧРЯЮЫЭХЭЭго ТбХТЮЧЬЮЦЭлЬШ ЯаРТШЫРЬШ, ШбЪЫозХЭШпЬШ ШЧ ЯаРТШЫ, ЯаХФгЯаХЦФХЭШпЬШ Ш в. Ф., Ш ЯЮФгЬРХв: «° бвЮШв ЫШ б нвШЬ бТпЧлТРвмбп?»

ЅХФРТЭЮ ЬЮШ СаРвмп ЮСгзРЫШ бТЮШе ФагЧХЩ ШУаРвм Т «иРдЪЮЯд» — ЪРавЮзЭго ШУаг, Т ЪЮвЮаго ШУаРХв гЦХ ЭХбЪЮЫмЪЮ ЯЮЪЮЫХЭШЩ ЬЮХЩ бХЬмШ. ѕЭР ЧЭРзШвХЫмЭЮ ШЭвХаХбЭХХ, зХЬ ЪРЦХвбп ЭР ЯХаТлЩ ТЧУЫпФ, ЭЮ ЭРзШЭРойШЬ ЯаШеЮФШвбп ЭХЫХУЪЮ. їЮбЫХ ЯЮЫгзРбЮТле ЬгзХЭШЩ ЬЮп ФТЮоаЮФЭРп бХбваР »ШЧ, ЮСаРЧХж вХаЯХЭШп, ЮЪЮЭзРвХЫмЭЮ ЧРЯгвРЫРбм Т бЫЮЦЭле ЯаРТШЫРе Ш бЪРЧРЫР: «јЮЦХв, ЫгзиХ блУаРХЬ Т аРЬЬШ?» ЅЮ Т ЪЮЭжХ ЪЮЭжЮТ ЮЭШ ЧРбШФХЫШбм ЧР ШУаЮЩ ФЮ ЯЮЧФЭХЩ ЭЮзШ. БвЮШЫЮ ЯаХЮФЮЫХвм ЯХаТго «УЮаг» ЭР ЯгвШ ЮСгзХЭШп, ЪРЪ ЯаЮбвЮЩ РЧРав гЦХ ЭХ ЮвЯгбвШЫ Ше. јЮШ СаРвмп ЧЭРЫШ, звЮ вРЪ Ш ЯаЮШЧЮЩФХв, ЭЮ ШЬ ЯаШиЫЮбм ЧРваРвШвм ТаХЬп Ш гбШЫШп ЭР вЮ, звЮСл »ШЧ Ш ФагУШХ ЭЮТШзЪШ ЮжХЭШЫШ ЭЮТго ШУаг.

ІЮЧЬЮЦЭЮ, ЪЮЬг-вЮ ШЧ зШвРвХЫХЩ ЯЮЭРФЮСШвбп ЭХЪЮвЮаЮХ ТаХЬп ЭР вЮ, звЮСл ЯаШТлЪЭгвм Ъ аХУгЫпаЭлЬ ТлаРЦХЭШпЬ. ґЮ вХе ЯЮа, ЯЮЪР Тл ЭХ ЯЮзгТбвТгХвХ ЭРбвЮпйХУЮ гФЮТЮЫмбвТШп Юв аХиХЭШп ТРиШе бЮСбвТХЭЭле ЧРФРз, аХУгЫпаЭлХ ТлаРЦХЭШп ЬЮУгв ЯЮЪРЧРвмбп ЭХбЪЮЫмЪЮ РСбваРЪвЭЮЩ вХЮаШХЩ. ЅРФХобм, Тл гФХаЦШвХбм Юв ЦХЫРЭШп «блУаРвм Т аРЬЬШ». єЮУФР Тл ЯЮЩЬХвХ, ЪРЪШХ ТЮЧЬЮЦЭЮбвШ ЮвЪалТРов ЯХаХФ ТРЬШ аХУгЫпаЭлХ ТлаРЦХЭШп, ЭХСЮЫмиШХ гбШЫШп ЯЮ Ше ШЧгзХЭШо ЯЮЪРЦгвбп ТРЬ бгйШЬ ЯгбвпЪЮЬ.

[1] І ШЭдЮаЬРвШЪХ вХаЬШЭ «бШЬТЮЫ» ШЬХХв ЬЭЮУЮ ЧЭРзХЭШЩ, ЭЮ п ШбЯЮЫмЧго ХУЮ ЫШим ЪРЪ СЮЫХХ гФЮСЭлЩ нЪТШТРЫХЭв ФЫп вХаЬШЭР «СРЩв». ·Р ФЮЯЮЫЭШвХЫмЭлЬШ бТХФХЭШпЬШ ЮСаРйРЩвХбм Ъ аРЧФХЫг «ВХаЬШЭЮЫЮУШп аХУгЫпаЭле ТлаРЦХЭШЩ» нвЮЩ УЫРТл.

[2] «АХУгЫпаЭлХ ТлаРЦХЭШп — нвЮ ЯаЮбвЮ!» ЅХбХамХЧЭлЩ ЪЮЬЬХЭвРаШЩ: ЪРЪ Тл гЧЭРХвХ ШЧ УЫРТл 3, вХаЬШЭ «аХУгЫпаЭлХ ТлаРЦХЭШп» ЯЮЧРШЬбвТЮТРЭ ШЧ дЮаЬРЫмЭЮЩ РЫУХСал. єЮУФР ЬХЭп бЯаРиШТРов, Ю зХЬ нвР ЪЭШУР, ЮвТХв ЮСлзЭЮ ТлЧлТРХв ЭХФЮгЬХЭЭЮХ ТлаРЦХЭШХ, ХбЫШ ЬЮЩ бЮСХбХФЭШЪ ЭШЪЮУФР ЭХ бЫлиРЫ ЮС ШбЯЮЫмЧЮТРЭШШ аХУгЫпаЭле ТлаРЦХЭШЩ Т ЪЮЬЯмовХаЭле вХеЭЮЫЮУШпе. ПЯЮЭбЪЮХ ЮСЮЧЭРзХЭШХ аХУгЫпаЭле ТлаРЦХЭШЩ, ###5-2###, вРЪЦХ ЭХЧЭРЪЮЬЮ баХФЭХЬг пЯЮЭжг, ЮФЭРЪЮ ЮвТХв ЭР пЯЮЭбЪЮЬ пЧлЪХ ТлЧЮТХв ЭХзвЮ СЮЫмиХХ, зХЬ ЯаЮбвЮХ ЭХФЮгЬХЭШХ. ґХЫЮ Т вЮЬ, звЮ Т ЯХаХТЮФХ ЭР пЯЮЭбЪШЩ вХаЬШЭ «аХУгЫпаЭлЩ» ЮзХЭм ЭРЯЮЬШЭРХв ФагУЮХ, СЮЫХХ аРбЯаЮбваРЭХЭЭЮХ бЫЮТЮ — ЬХФШжШЭбЪЮХ ЮСЮЧЭРзХЭШХ УХЭШвРЫШЩ. ВЮЫмЪЮ ЯаХФбвРТмвХ бХСХ, Ю зХЬ ФгЬРХв ЬЮЩ бЮСХбХФЭШЪ, ЯЮЪР п ЭХ ЮСкпбЭо ЯЮФаЮСЭХХ!

[3] ГвШЫШвР egrep бгйХбвТгХв ТЮ ЬЭЮУШе бШбвХЬРе, ТЪЫозРп DOS, MacOS, Windows, Unix Ш в. Ф. (ЧР ШЭдЮаЬРжШХЩ Ю вЮЬ, УФХ ЭРЩвШ ТХабШо egrep ФЫп ТРиХЩ бШбвХЬл, ЮСаРйРЩвХбм Ъ ЯаШЫЮЦХЭШо A). ІЮЧЬЮЦЭЮ, ЭХЪЮвЮалЬ ЯЮЫмЧЮТРвХЫпЬ ЧЭРЪЮЬР ЯаЮУаРЬЬР grep, ТЮ ЬЭЮУШе ЮвЭЮиХЭШпе РЭРЫЮУШзЭРп egrep. ёЧ ЮСйХУЮ ЮСЧЮаР, ЯаШТХФХЭЭЮУЮ Т УЫРТХ 3, бвРЭХв пбЭЮ, ЯЮзХЬг п ЭРзРЫ ШЬХЭЭЮ б egrep.

[4] єЮЬРЭФЭлЬ ШЭвХаЯаХвРвЮаЮЬ ЭРЧлТРХвбп зРбвм ЮЯХаРжШЮЭЭЮЩ бШбвХЬл, ЪЮвЮаРп ЮСаРСРвлТРХв ТТХФХЭЭлХ ЪЮЬРЭФл Ш ЧРЯгбЪРХв гЪРЧРЭЭлХ Т ЭШе ЯаЮУаРЬЬл. І вЮЬ ШЭвХаЯаХвРвЮаХ, ЪЮвЮалЬ п ЯЮЫмЧгобм, РЯЮбваЮдл ЯаХФЭРЧЭРзРовбп ФЫп УагЯЯШаЮТЪШ РаУгЬХЭвЮТ. ѕЭШ УЮТЮапв Ю вЮЬ, звЮ ЪЮЬРЭФЭлЩ ШЭвХаЯаХвРвЮа ЭХ ФЮЫЦХЭ ЮСаРйРвм ТЭШЬРЭШп ЭР ЧРЪЫозХЭЭлХ Т ЭШе бШЬТЮЫл (ЭРЯаШЬХа, ЮЭ ЭХ ФЮЫЦХЭ ШЭвХаЯаХвШаЮТРвм *.txt ЪРЪ дРЩЫЮТлЩ иРСЫЮЭ — гвШЫШвР egrep бРЬР ШЭвХаЯаХвШагХв нвг бваЮЪг вРЪ, ЪРЪ бЮзвХв ЭгЦЭлЬ, Т ЪЮЭвХЪбвХ аХУгЫпаЭЮУЮ ТлаРЦХЭШп). їЮЫмЧЮТРвХЫШ ШЭвХаЯаХвРвЮаР COMMAND.COM бШбвХЬл DOS ТЬХбвЮ РЯЮбваЮдЮТ ШбЯЮЫмЧгов ЪРТлзЪШ.

[5] egrep ЯаЮбвЮ аРЧСШТРХв ТеЮФЭЮЩ дРЩЫ ЭР ЮвФХЫмЭлХ бваЮЪШ Ш ЧРвХЬ ЯаЮТХапХв Ше ЯЮ иРСЫЮЭг аХУгЫпаЭЮУЮ ТлаРЦХЭШп. ЅШ ЭР ЮФЭЮЩ ШЧ нвШе бвРФШШ гвШЫШвР ЭХ ЯлвРХвбп аРбЯЮЧЭРТРвм вРЪШХ «зХЫЮТХзХбЪШХ» ЪЮЭбвагЪжШШ, ЪРЪ ЯаХФЫЮЦХЭШп Ш бЫЮТР. П ЬгзШвХЫмЭЮ ШбЪРЫ ЯаРТШЫмЭЮХ ТлаРЦХЭШХ, ЭЮ ЯЮвЮЬ ТбваХвШЫ ТлаРЦХЭШХ «ЪЮЭжХЯжШШ ТлбЮЪЮУЮ гаЮТЭп» Т ЪЭШУХ ґХЩЫР ґЮУХавШ (Dale Dougherty) «sed & awk» Ш ЯЮзгТбвТЮТРЫ, звЮ ЮЭЮ ШФХРЫмЭЮ ЯЮФеЮФШв.

[6] ЅХ ЯЮФФХаЦШТРХвбп ЭХЪЮвЮалЬШ ТХабШпЬШ egrep.

[7] ЅХ ЯЮФФХаЦШТРХвбп ЭХЪЮвЮалЬШ ТХабШпЬШ egrep.

[8] µбЫШ Тл ЭХ ЧЭРХвХ пЧлЪР HTML, ЭХ ЮУЮазРЩвХбм. П ШбЯЮЫмЧго ХУЮ, звЮСл ЯаШЬХал ТлУЫпФХЫШ СЮЫХХ аХРЫмЭЮ, ЭЮ ЯаШ нвЮЬ ЯаШТЮЦг Тбо ЭХЮСеЮФШЬго ШЭдЮаЬРжШо. ЗШвРвХЫШ, ЧЭРЪЮЬлХ б ЧРФРзХЩ РЭРЫШЧР вХУЮТ HTML, ЭРТХаЭпЪР гТШФпв ЭХЪЮвЮалХ ТРЦЭлХ ЮСбвЮпвХЫмбвТР, ЪЮвЮалХ ЯЮЪР ЭХ гЯЮЬШЭРовбп Т ЪЭШУХ.

[9] АРЧгЬХХвбп, аХзм ШФХв Ю ТаХЬХЭШ Т дЮаЬРвХ AM/PM — їаШЬХз. ЯХаХТ.

[10] ЅРШСЮЫХХ РТвЮаШвХвЭлЬ агЪЮТЮФбвТЮЬ ЯЮ ЬЭЮУЮСРЩвЮТлЬ ЪЮФШаЮТЪРЬ пТЫпХвбп ЪЭШУР єХЭР »гЭФХ (Ken Lunde) «Understanding Japanese Information Processing». єЮУФР п ЮвФРТРЫ ЪЭШУг Т ЯХзРвм, єХЭ аРСЮвРЫ ЭРФ ТвЮалЬ ШЧФРЭШХЬ бТЮХЩ ЪЭШУШ б ЧРТЫХЪРвХЫмЭлЬ ЭРЧТРЭШХЬ «Understanding CJKV Information Processing». БЮЪаРйХЭШХ CJKV ЮЧЭРзРХв «ЪШвРЩбЪШЩ, пЯЮЭбЪШЩ, ЪЮаХЩбЪШЩ Ш ТмХвЭРЬбЪШЩ» — ТбХ пЧлЪШ, Т ЪЮвЮале ШбЯЮЫмЧгХвбп ЬЭЮУЮСРЩвЮТРп ЪЮФШаЮТЪР.

[11] ЅХ ЯЮФФХаЦШТРХвбп ЭХЪЮвЮалЬШ ТХабШпЬШ egrep.

[12] ЅХ ЯЮФФХаЦШТРХвбп ЭХЪЮвЮалЬШ ТХабШпЬШ egrep.

[13] ЅХ ЯЮФФХаЦШТРХвбп ЭХЪЮвЮалЬШ ТХабШпЬШ egrep.

[14] ЅХ ЯЮФФХаЦШТРХвбп ЭХЪЮвЮалЬШ ТХабШпЬШ egrep.

єТРЭвШдШЪРвЮа	ЅХЮСеЮФШЬлЩ ЬШЭШЬгЬ	јРЪбШЬРЫмЭЮХ ЪЮЫШзХбвТЮ	БЬлбЫ
?	ЭХв	1	ФЮЯгбЪРХвбп ЮФШЭ нЪЧХЬЯЫпа; ЭХ ваХСгХвбп ЭШ ЮФШЭ («ЮФШЭ ЭХЮСпЧРвХЫмЭЮ»)
*	ЭХв	ЭХ ЮУаРЭШзХЭЮ	ФЮЯгбЪРХвбп ЭХЮУаРЭШзХЭЭЮХ ЪЮЫШзХбвТЮ; ЭХ ваХСгХвбп ЭШ ЮФШЭ («ЫоСЮХ ЪЮЫШзХбвТЮ ЭХЮСпЧРвХЫмЭЮ»)
+	1	ЭХ ЮУаРЭШзХЭЮ	ваХСгХвбп ЮФШЭ нЪЧХЬЯЫпа; ФЮЯгбЪРХвбп ЭХЮУаРЭШзХЭЭЮХ ЪЮЫШзХбвТЮ («еЮвп Сл ЮФШЭ Ш СЮЫХХ»)

јХвРбШЬТЮЫ	ЅРЧТРЭШХ	ёЭвХаЯаХвРжШп
.	вЮзЪР	ѕФШЭ ЫоСЮЩ бШЬТЮЫ
[…]	бШЬТЮЫмЭлЩ ЪЫРбб	»оСЮЩ ШЧ ЯХаХзШбЫХЭЭле бШЬТЮЫЮТ
[^…]	ШЭТХавШаЮТРЭЭлЩ бШЬТЮЫмЭлЩ ЪЫРбб	»оСЮЩ бШЬТЮЫ, ЭХ ЯХаХзШбЫХЭЭлЩ Т ЪЫРббХ
\бШЬТЮЫ	нЪаРЭШаЮТРЭШХ	µбЫШ ЯХаХФ ЬХвРбШЬТЮЫЮЬ бвРТШвбп нЪаРЭШагойШЩ ЯаХдШЪб \, вЮ ЯЮбЫХФЭШЩ ШЭвХаЯаХвШагХвбп ЪРЪ бЮЮвТХвбвТгойШЩ ЫШвХаРЫ.

?	ТЮЯаЮбШвХЫмЭлЩ ЧЭРЪ	ґЮЯгбЪРХвбп ЮФШЭ нЪЧХЬЯЫпа (ЭШ ЮФШЭ ЭХ ваХСгХвбп).
*	ЧТХЧФЮзЪР	ґЮЯгбЪРХвбп ЫоСЮХ ЪЮЫШзХбвТЮ нЪЧХЬЯЫпаЮТ (ЭШ ЮФШЭ ЭХ ваХСгХвбп).
+	ЯЫоб	ВаХСгХвбп ЮФШЭ нЪЧХЬЯЫпа, ФЮЯгбЪРХвбп ЫоСЮХ ЪЮЫШзХбвТЮ нЪЧХЬЯЫпаЮТ.
{ЬШЭ, ЬРЪб}	ШЭвХаТРЫмЭлЩ ЪТРЭвШдШЪРвЮа[11]	ВаХСгХвбп «ЬШЭ» нЪЧХЬЯЫпаЮТ, ФЮЯгбЪРХвбп «ЬРЪб» нЪЧХЬЯЫпаЮТ.

^	ЪалиЪР, жШаЪгЬдЫХЪб	їЮЧШжШп Т ЭРзРЫХ бваЮЪШ
$	ФЮЫЫРа	їЮЧШжШп Т ЪЮЭжХ бваЮЪШ
\<	УаРЭШжР бЫЮТР[12]	їЮЧШжШп Т ЭРзРЫХ бЫЮТР
\>	УаРЭШжР бЫЮТР[13]	їЮЧШжШп Т ЪЮЭжХ бЫЮТР

\|	ЪЮЭбвагЪжШп ТлСЮаР	ЫоСЮХ ШЧ ЯХаХзШбЫХЭЭле ТлаРЦХЭШЩ
(…)	ЪагУЫлХ бЪЮСЪШ	ЮУаРЭШзХЭШХ ЪЮЭбвагЪжШШ ТлСЮаР, УагЯЯШаЮТЪР ФЫп ЯаШЬХЭХЭШп ЪТРЭвШдШЪРвЮаЮТ Ш «бЮеаРЭХЭШХ» вХЪбвР ФЫп ЮСаРвЭле бблЫЮЪ.
\1, \2, …	ЮСаРвЭРп бблЫЪР[14]	ВХЪбв, аРЭХХ бЮТЯРТиШЩ б ЯХаТЮЩ, ТвЮаЮЩ Ш в. Ф. ЯРаРЬШ ЪагУЫле бЪЮСЮЪ