Vocabulary

Sep. 14th, 2009 07:36 pm
link0ff: Juri (juri)
[personal profile] link0ff

Словарь Эллочки-людоедки составляет 30 слов, негра из племени "Мумбо-Юмбо" - 300 слов, базовый английский - 850 слов, а по данным сборников малоизвестных фактов средний словарный запас составляет 5000 слов. Интересно было проверить, и вот что получилось:

cat sent-mail
 | grepmail -B
 | egrep -v "^From:|^Date:|^Subject:|^>"
 | perl -lne 'print unless (/^Content/../^-- /)'
 | tr -cs '[:alnum:]' '[\n*]'
 | tr '[:upper:]' '[:lower:]'
 | sort
 | uniq -c
 | sort -nr
 | cut -c 9-
 | grep -v [0-9]
 | sort
 | comm -12 - /usr/share/dict/american-english
 | wc -l

5129
Для сравнения: словарный запас Бэкона составляет 8000 слов, а Шекспира 20000 слов.

Date: 2009-10-04 06:41 pm (UTC)
From: [identity profile] alogic.livejournal.com
А что означает
/^Content/../^-- /
?

Date: 2009-10-04 07:29 pm (UTC)
From: [identity profile] link0ff.livejournal.com
Диапазон строк между этими регулярными выражениями, т.е. не печатаются MIME-вложения, который начинаются с "Content" и до подписи "-- ". Вот за такую краткость мне Перл и нравится.

December 2020

S M T W T F S
  12345
6789101112
13141516171819
2021222324 2526
2728293031  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 13th, 2026 05:31 am
Powered by Dreamwidth Studios