Regex и квасной патриотизм

Submitted by igorla on Mon, 03/06/2017 - 11:03

Америка, как государство, не вызывает и тысячной доли эмоционального отклика по сравнению с Израилем. Хотя бы по причине "да что с ней сделается?". Однако, когда речь идет о конкретном месте проживания - картина обратная. Хотя мы в Нью Провиденс живем всего год, я к этой деревне чувствую больше привязанности, чем к Кирьят-Оно, или даже к Гиват Шмуэлю. И, кстати, похожие чувства я питаю и к Милбурну, хотя мы уже не там. Трудно сказать в чем причина - возможно в большей автономности и прозрачности местного самоуправления. А может жизнь на земле способствует - до этого мы жили в многоэтажных муравейниках.
К чему я это пишу. Сегодня мой деревенский патриотизм получил подпитку. В местной библиотеке была лекция для старшеклассников про Regular Expressions. Йонька, к сожалению, пойти не смог - он до этого подписался проводить занятия с младшими пионэрами в Цофим. А вел лекцию Alfred Aho. Он не просто профессор Колумбийского универа, а один из трех авторов программы awk - собственно он есть первая буква в имени программы ;) А кроме этого он написал еще одну не менее популярную программу egrep. Я думаю не будет преувеличением сказать, что процентов 80% программистов по всему миру хотя бы раз воспользовались этими программами. Кстати, egrep, по его словам, он написал для более эффективного решения словесных задачек в New York Times. Поистине, лень у программеров - главный двигатель прогресса... Так вот, эти популярные программы, как и часть операционной системы Unix, была написана в отделении Bell Labs в нашей деревне! Про кампус Bell Labs, я конечно знал, но сегодня там только физики и электронщики, так что богатое героическое программерское прошлое для меня явилось сюрпризом.
И я уже не в первый раз отмечаю, что в зале две трети школьников были азиаты..


Вот несколько интересных моментов из лекции:
1) Слово из английского словаря в котором есть 9 букв 'u' - Humuhumunukunukuapua’a - это рыбка в кораллах Гавайских островов. На русском ее название также доставляет - "Углохвостый спинорог" (имя взяли из "Дня Радио"?;) А здесь учат детей как правильно произносить это имечко..


2) Сегодня эта забава почти сошла на нет, но лет 15 назад и ранее были популярны определенные числа. Например, что примечательного в 55378008?

Если набрать его на калькуляторе, а затем перевернуть вверх ногами, то получим:
(BOOBLESS).
Так как на русском подобные штуки не слишком возможны, то этот юмор третьего класса школы прошел мимо меня. А вот у американцев эта шутка звучала примерно так:
A woman's boobs weighed 69 pounds, 
which she though was 2, 2, 2 much. 
So she went down 51st street 
to see DR. X 
he gave her 8 pills.....which left her.... 

6922251x8= BOOBLESS


Ну и другие слова, которые можно составить из набора букв, соответствующим перевернутым цифрам - O, I, Z, E, h, S, P, L, B, G



3) В английском можно найти несколько слов которые содержат в себе 'ough'. Такая подборка замечательно иллюстрирует беспредел в английском произношении ;)

 Some words containing ough and their pronunciations:

  cough [kawf]  hiccough [hik-uhp]

  lough [lok,lokh]  plough [plou]

  rough [ruhf]  slough [slou,sloo,sluhf]

  thorough  [thur-oh]  though [thoh]

  thought [thawt]  through [throo]

Вот как правильно произнести следующую фразу?

“The wind was rough along the lough as the ploughman fought through the slough and snow, and though he hiccoughed and he coughed, he thought only of his work, determined to be thorough.”




Интересная лекция была. Слайды есть, так что Йоньке я ее и сам расскажу ;)

Comments

Aho - это не только awk и egrep, но ещё и ценный мех Aho Ullman. Белл - это круто!

Сейчас кто-то ещё пользуется awk? Я им пользуюсь, но чувствую себя динозавром. Многие ли знают вообще, что это такое?

Не на постоянной основе, но практически в каждом проекте я пользуюсь, да. Да и большинство моих коллег тоже.