Оперативное обновление списка слов с буквой Ё
Вопрос возвращения этой буквы в тексты оказался не таким простым. Список слов требует проверки в деле, и мы благодарны все, кто взял на себя этот труд. Возможно, общими усилиями со временем сформируется безупречный список всех форм слов в русском языке с буквой Ё. Возможно, будут отдельно словарь для обычных слов и словарь имен и фамилий. Вы понимаете, что с именами и фамилиями не всё так однозначно, кто-то хочет, чтобы было именно так, как в паспорте, кто-то, как наш известный шахматист, и при произнесении, и при написании фамилии не любил, чтобы там звучала или была написана буква Ё. Да что фамилии, вот переписка с пользователями, и частная, и на формуме, показывает, что есть в некотором плане просто спорные слова с буквой Ё. Взять хотя бы «лёт» и «тёрнами». Слово «лёт» употребимо в контексте «весенний лёт птиц/насекомых и пр.», но как редко бывают статьи с таким текстом! Интересен пример в комментариях со словом «тёрнами», и в то же время «и прежний сняв венок, они венец терновый…» В общем, всем интересующимся этим вопросом предлагаем подписаться на рассылку «Буква Ё в программе InDesign». Инструмент рассылки позволяет оперативнее извещать интересующихся сделанными обновлениями, нежели сайт. Можно получить последнюю версию скрипта и/или обновленный список слов, не заходя на adobeindesign.ru.
Черт возьми, ниужели нет более важных проблем, чем буква «ё»?
А мне буква «ё» помогает. Я живу на Украине, из-за известных проблем с украинизацией русский у граждан несколько подпортился. А «ё» заставляет строже относиться к текстам и даже дисциплинирует. Поначалу я тоже возмущалась — это ж сколько работы прибавилось — но теперь привыкла и даже считаю букву эту полезной. Вот со скриптом, может, и работа быстрее и приятнее пойдёт.
Есть — проблема грамотности 🙂
Каким образом убогое создание может дисциплинировать? Это все равно, что взяли бы в роту специально хромого солдата с целью обучить всех строевому шагу. Или в цеху на видном месте сидел бы чувак, ничего не понимающий в производстве, никак к нему не относящийся, но в яркой гавайской рубахе. И все бы искренне считали его Полезным. Буква, которая а) не обозначает фонему, а мягкость согласного перед ней, то есть НЕ участвует в смыслоразличении в подавляющем большинстве случаев, б) имеет надстрочные символы (которые, кроме нее, имеет только буква, обозначающая мягкий согласный (а у нас язык консонантный — нам согласные важнее гласных, соотношение первых ко вторым больше, чем 11:1), это заимствование извне.
Поэтому язык и носители языка букву эту не приемлют, хоть тыщу законов напиши и миллион скриптов придумай — толку будет ноль.
> Буква, которая а) не обозначает фонему, а мягкость согласного перед ней, то есть НЕ участвует в смыслоразличении в подавляющем большинстве случаев.
То же самое можно сказать про буквы мягкий и твердый знак. Если найдётся агрессивный троечник, кто затеет кампанию по изъятию одной из них, Вы его поддержите?
Мне кажется, надо стараться беречь в языке то, что создано раньше.
Это сугубо моё личное мнение, реализуемое в данном случае в этом скрипте.
Виталий, я был бы Вам благодарен, если бы Вы развёрнуто объяснили Вашу мысль «И из XML не быстрее читать? Xpath, вроде, никто не отменил.»
(Это из Вашего отклика в соседней ветке).
«Все выпили» и «всё выпили», почувствуй разницу.
«Ё» нужная буква, после отмены ятей, она приняла на себя часть их обязанностей. В деле смыслоразличения в том числе.
Михаил, твердый и мягкий знаки указывают на мягкость или твердость предыдущего согласного. А для современного русского языка характерен консонантизм — то есть ситуация, когда согласные играют бóльшую смыслоразличительную роль, чем гласные (обратная ситуация зовется «вокализм»). В русском языке, в отличии от большинства европейских, согласные делятся на мягкие и твердые, глухие и звонкие, при этом в большинстве случаев составляя пары по этим параметрам. Например, глухость/звонкость: «п»-«б», «т»-«д». Для обозначения мягкости согласного, а мягкий согласный в СРЯ — это отдельная фонема (звук, участвующий в смыслоразличении), так вот для обозначения мягкого согласного используется либо буква («е», «и»), либо мягкий знак. Если за твердым согласным идет «смягчающая» буква, между ними ставится твердый знак. Буквы «ё», «я», «ю» — являются по сути сочетанием мягкого согласного «j» и гласных «о», «а», «у», соответственно. Есть еще буквы «ы» (некоторые ее обозначают как отдельную фонему, хотя я лично не согласен) и «э», которые являются графическим изображением «и» и «е», стоящих после твердого согласного.
Следуя Вашей логике, сохранять нужно всё. Ну, давайте, писать глаголицей, благо она была первой азбукой. Или «чертами и резами». Сохранять надо сам язык, надо говорить на нем, пропагандировать его, читать и приучать читать своих детей. А цеплять за старые нормы — глупость. Как глупость, по-моему, пытаться во что бы то ни стало сохранить убогое творение германофильской мысли.
По поводу XML. Хранить базу в XML файле и выбирать из нее с помощью XPath. Хотя все равно будет достаточно медленно из-за подгрузки большого файла каждый раз, когда скрипт запускается.
Виталий, спасибо за информативное объяснение влияния гласных и согласных на смыслоразличительность. Хоть я это и знал раньше, но изложено толково, мне понравилось.
И я полностью согласен с Вами, что надо охранять сам язык.
Наш великий и могучий, как его называл Тургенев, ну или СРЯ, как его назвали Вы.
Только и стараться писать без ошибок тоже. «в отличии» — это неверно, должно быть «в отличие».
Непонятно, из чего Вы делаете вывод, что я предлагаю сохранять всё (тут, кстати, Вы не обошлись без буквы ё, это радует).
Вовсе нет. Я просто хочу, чтобы имеющаяся в нашем устном языке возможность сочетать мягкий согласный «j» и гласный «о», позволяющая на слух различать слова «передохнем» и передохнём», «все» и «всё», «берет» и «берёт», и пр. не терялась и в тексте. В чём Вы видите тут цепляние за старые нормы? И что это за нормы такие?
Если честно, то я жалею, что из языка исчезли буквы i и ѣ (ять)
двѣсти и двѣнадцать), всѣ, обѣ, здѣсь, солнце сѣло за село.
Если интересно, то см. http://www.opoccuu.com/yat.htm
Но это моё личное восприятие русского языка. Есть много интереснейших книг в той орфографии. Мне читать хватит. Хотя бы книги А.Н.Пыпина, недавно нашёл их сканы в сети.
А что касается многострадальной буквы Ё, то меня радует, что число подписавшихся на обновления скрипта неспешно растёт.
И обновления будут. Уже готов перечень географических названий, в которых есть эта буква.
Михаил, нет ли в планах включить в проект (этот или DoTextOK, или новый)»ятификацию», чтобы иметь возможность приводить текст к нормам старой орфографии. Вряд ли функция будет широко востребована, но, на неискушенный взгляд, и задача проще, чем с «ё».
И, пользуясь случаем, спасибо за скрипты!
Нет, ятификацией я заниматься точно не буду.
Вы можете тут быть первым.
Если, конечно, сможете алгоритмизировать выбор правильного слова для ‘мир’ — миръ или мiръ, ‘солнце село за село’ — село или сѣело, ‘он мёл мел’— мел или мѣл. Ну и так далее. Так что насчёт простоты перехода на старую орфографию не всё так просто.
Да и нужна ли она, если ещё А.С. Пушкин сетовал:
«Шпионы подобны буквђ Ъ: нужны они только въ нђкоторых случаяхъ, но и тутъ можно безъ нихъ обойтиться, а они привыкли всюду соваться».
Вот другая задача — перевод дореволюционной орфографии в современную — более актуальна. Но и её с помощью примерно 20 grep-запросов и программы DoQueryList решать можно.
Вот эта последовательность:
Удалить “ъ” в конце слов
Замена v – у
Замена i – и
Отметить ii красным — со словами, в которых есть ii, надо разбираться отдельно. Возможны варианты
Удалить перенос внутри слова
Замена — — на —
Замена онѣ, однѣ – они, одни
Замена ея, нея – ее, нее
Замена окончание ыя – ые
Замена ѣ – е
Замена без – бес
Замена изс – исс
Замена возс – восс
Замена разс – расс
Замена аго – его
Замена как-бы – как бы
Замена знаете-ли – знаете ли
Замена что-же – что же
Замена так-же – также
Замена то-есть – то есть
Так чта…
Всем уже подписавшимся и тем, кто присоединится, доступен обновленный файл слов с буквой Ё.
Версия 18/03/2012.
Всем подписчикам доступен скрипт, позволяющий вернуть букву Ё в географические названия.
Извините за то, что не совсем в тему, но не могу удержаться.
jа (‘а) = я
jу (‘у) = ю
jэ (‘э) = е
jо (‘о) = ё
Почему предлагается не обозначать отдельной буквой только одно сочетание фонем? Давайте откажемся от всех четырёх! Ну, или объединим попарно. Что там осталось — я объединить с ю? Будем писать «Я тебя лябля», подразумевая при этом, что читать всё же нужно «Я тебя люблю». Это ж сколько жизненных ресурсов сэкономим!
Дорогие коллеги! И подписался, и авторизовался, а ссылку на закачку скрипта не вижу. Помогите, пожалуйста, найти и скачать.
С почтениемъ — Анатолий.
Простите, поторопился!
В рассылке на почту все необходимые материалы пришли.
Спасибо Михаилу Иванюшину и Борису Кащееву!