Избранное »

22.09.2014 – 07:27 | 2 комментария | 8 237 views

Здравствуйте все, кто работает в Индизайне!
Извещаем вас о том, что на youtube.com начал работу канал «InDesign Мастерская вёрстки». Там уже размещены более 60 видео с полным описанием как работать с программой DoTextOK. Другие интересные темы, касающиеся работы …

Читать полностью »
Работа в InDesign

Хитрости и секреты, приемы работы, уроки

Новая версия!

Особенности новой версии Индизайна

Плагины

Описание плагинов, информация о плагинах для работы с Adobe InDesign

Скрипты

Готовые к использованию скрипты для Adobe InDesign

Скриптинг

Описание языка, приёмов и методов программирования для Adobe InDesign

Home » Скрипты

Оперативное обновление списка слов с буквой Ё

Добавлено на 15.02.2012 – 09:3515 комментариев | 1 755 views

Вопрос возвращения этой буквы в тексты оказался не таким простым. Список слов требует проверки в деле, и мы благодарны все, кто взял на себя этот труд. Возможно, общими усилиями со временем сформируется безупречный список всех форм слов в русском языке с буквой Ё. Возможно, будут отдельно словарь для обычных слов и словарь имен и фамилий. Вы понимаете, что с именами и фамилиями не всё так однозначно, кто-то хочет, чтобы было именно так, как в паспорте, кто-то, как наш известный шахматист, и при произнесении, и при написании фамилии не любил, чтобы там звучала или была написана буква Ё. Да что фамилии, вот переписка с пользователями, и частная, и на формуме, показывает, что есть в некотором плане просто спорные слова с буквой Ё. Взять хотя бы «лёт» и «тёрнами». Слово «лёт» употребимо в контексте «весенний лёт птиц/насекомых и пр.», но как редко бывают статьи с таким текстом! Интересен пример в комментариях со словом «тёрнами», и в то же время «и прежний сняв венок, они венец терновый…» В общем, всем интересующимся этим вопросом предлагаем подписаться на рассылку «Буква Ё в программе InDesign». Инструмент рассылки позволяет оперативнее извещать интересующихся сделанными обновлениями, нежели сайт. Можно получить последнюю версию скрипта и/или обновленный список слов, не заходя на adobeindesign.ru.

Ваше имя: *
Ваш e-mail: *

Внимание!

Использовавшийся ранее ресурс SygarSync отказался от практики предоставления бесплатного пространства.

И архив с файлами теперь на облаке Яндекс Диск. Всё остальное пока без изменений.

http://yadi.sk/d/n4Cezop7HYQxZ

Для тех, кто впервые знакомится с эти скриптом: о проблемах использования буквы Ё в русском языке и попытке их решения при вёрстке в программе InDesign читайте тут:

http://adobeindesign.ru/2011/10/02/tochki-nad-yo/

Cкрипт работает как с одной статьей, в которой курсор, так и со всеми статьями документа. Есть возможность вернуть букву Ё в географические названия.  Их  оказалось немало, Татьяна Прокофьева подготовила словарь этих названий, все они в именительном падеже. Этот массив называется YO&GEO-words.jsx. Но по размышлении я решил не смешивать обычные слова и географические названия. Поэтому сделан еще один скрипт YO-in-GEO.jsx, он работает с файлом YO&GEO-words.jsx. Обнаруживаются только названия в именительном падеже. Находятся не только одиночные слова, позволяющие не потерять Бингёль, Гётеборг, но и разделенные дефисом или дефисами названия, такие как Готска-Сандён, Дён-сюр-Мёз, Сен-Кёр-де-Мари. Начнем пока с географических названий в именительном падеже. Время покажет, в каком направлении двигаться. Возможно, этого уже достаточно.

Пробуйте, не стесняйтесь комментировать и предлагать, как улучшить работу с буквой Ё в русских текстах.

Михаил Иванюшин

15 комментариев »

  • Черт возьми, ниужели нет более важных проблем, чем буква «ё»?

  • Olga:

    А мне буква «ё» помогает. Я живу на Украине, из-за известных проблем с украинизацией русский у граждан несколько подпортился. А «ё» заставляет строже относиться к текстам и даже дисциплинирует. Поначалу я тоже возмущалась — это ж сколько работы прибавилось — но теперь привыкла и даже считаю букву эту полезной. Вот со скриптом, может, и работа быстрее и приятнее пойдёт.

  • alexey:

    Есть — проблема грамотности 🙂

  • Каким образом убогое создание может дисциплинировать? Это все равно, что взяли бы в роту специально хромого солдата с целью обучить всех строевому шагу. Или в цеху на видном месте сидел бы чувак, ничего не понимающий в производстве, никак к нему не относящийся, но в яркой гавайской рубахе. И все бы искренне считали его Полезным. Буква, которая а) не обозначает фонему, а мягкость согласного перед ней, то есть НЕ участвует в смыслоразличении в подавляющем большинстве случаев, б) имеет надстрочные символы (которые, кроме нее, имеет только буква, обозначающая мягкий согласный (а у нас язык консонантный — нам согласные важнее гласных, соотношение первых ко вторым больше, чем 11:1), это заимствование извне.
    Поэтому язык и носители языка букву эту не приемлют, хоть тыщу законов напиши и миллион скриптов придумай — толку будет ноль.

  • iv-mi:

    > Буква, которая а) не обозначает фонему, а мягкость согласного перед ней, то есть НЕ участвует в смыслоразличении в подавляющем большинстве случаев.
    То же самое можно сказать про буквы мягкий и твердый знак. Если найдётся агрессивный троечник, кто затеет кампанию по изъятию одной из них, Вы его поддержите?
    Мне кажется, надо стараться беречь в языке то, что создано раньше.
    Это сугубо моё личное мнение, реализуемое в данном случае в этом скрипте.

    Виталий, я был бы Вам благодарен, если бы Вы развёрнуто объяснили Вашу мысль «И из XML не быстрее читать? Xpath, вроде, никто не отменил.»
    (Это из Вашего отклика в соседней ветке).

    • Александр:

      «Все выпили» и «всё выпили», почувствуй разницу.
      «Ё» нужная буква, после отмены ятей, она приняла на себя часть их обязанностей. В деле смыслоразличения в том числе.

  • Михаил, твердый и мягкий знаки указывают на мягкость или твердость предыдущего согласного. А для современного русского языка характерен консонантизм — то есть ситуация, когда согласные играют бóльшую смыслоразличительную роль, чем гласные (обратная ситуация зовется «вокализм»). В русском языке, в отличии от большинства европейских, согласные делятся на мягкие и твердые, глухие и звонкие, при этом в большинстве случаев составляя пары по этим параметрам. Например, глухость/звонкость: «п»-«б», «т»-«д». Для обозначения мягкости согласного, а мягкий согласный в СРЯ — это отдельная фонема (звук, участвующий в смыслоразличении), так вот для обозначения мягкого согласного используется либо буква («е», «и»), либо мягкий знак. Если за твердым согласным идет «смягчающая» буква, между ними ставится твердый знак. Буквы «ё», «я», «ю» — являются по сути сочетанием мягкого согласного «j» и гласных «о», «а», «у», соответственно. Есть еще буквы «ы» (некоторые ее обозначают как отдельную фонему, хотя я лично не согласен) и «э», которые являются графическим изображением «и» и «е», стоящих после твердого согласного.
    Следуя Вашей логике, сохранять нужно всё. Ну, давайте, писать глаголицей, благо она была первой азбукой. Или «чертами и резами». Сохранять надо сам язык, надо говорить на нем, пропагандировать его, читать и приучать читать своих детей. А цеплять за старые нормы — глупость. Как глупость, по-моему, пытаться во что бы то ни стало сохранить убогое творение германофильской мысли.

    По поводу XML. Хранить базу в XML файле и выбирать из нее с помощью XPath. Хотя все равно будет достаточно медленно из-за подгрузки большого файла каждый раз, когда скрипт запускается.

  • iv-mi:

    Виталий, спасибо за информативное объяснение влияния гласных и согласных на смыслоразличительность. Хоть я это и знал раньше, но изложено толково, мне понравилось.
    И я полностью согласен с Вами, что надо охранять сам язык.
    Наш великий и могучий, как его называл Тургенев, ну или СРЯ, как его назвали Вы.
    Только и стараться писать без ошибок тоже. «в отличии» — это неверно, должно быть «в отличие».
    Непонятно, из чего Вы делаете вывод, что я предлагаю сохранять всё (тут, кстати, Вы не обошлись без буквы ё, это радует).
    Вовсе нет. Я просто хочу, чтобы имеющаяся в нашем устном языке возможность сочетать мягкий согласный «j» и гласный «о», позволяющая на слух различать слова «передохнем» и передохнём», «все» и «всё», «берет» и «берёт», и пр. не терялась и в тексте. В чём Вы видите тут цепляние за старые нормы? И что это за нормы такие?

    Если честно, то я жалею, что из языка исчезли буквы i и ѣ (ять)
    двѣсти и двѣнадцать), всѣ, обѣ, здѣсь, солнце сѣло за село.
    Если интересно, то см. http://www.opoccuu.com/yat.htm
    Но это моё личное восприятие русского языка. Есть много интереснейших книг в той орфографии. Мне читать хватит. Хотя бы книги А.Н.Пыпина, недавно нашёл их сканы в сети.

    А что касается многострадальной буквы Ё, то меня радует, что число подписавшихся на обновления скрипта неспешно растёт.
    И обновления будут. Уже готов перечень географических названий, в которых есть эта буква.

    • Oberon:

      Михаил, нет ли в планах включить в проект (этот или DoTextOK, или новый)»ятификацию», чтобы иметь возможность приводить текст к нормам старой орфографии. Вряд ли функция будет широко востребована, но, на неискушенный взгляд, и задача проще, чем с «ё».
      И, пользуясь случаем, спасибо за скрипты!

      • iv-mi:

        Нет, ятификацией я заниматься точно не буду.
        Вы можете тут быть первым.

        Если, конечно, сможете алгоритмизировать выбор правильного слова для ‘мир’ — миръ или мiръ, ‘солнце село за село’ — село или сѣело, ‘он мёл мел’— мел или мѣл. Ну и так далее. Так что насчёт простоты перехода на старую орфографию не всё так просто.

        Да и нужна ли она, если ещё А.С. Пушкин сетовал:
        «Шпионы подобны буквђ Ъ: нужны они только въ нђкоторых случаяхъ, но и тутъ можно безъ нихъ обойтиться, а они привыкли всюду соваться».

        Вот другая задача — перевод дореволюционной орфографии в современную — более актуальна. Но и её с помощью примерно 20 grep-запросов и программы DoQueryList решать можно.
        Вот эта последовательность:

        Удалить “ъ” в конце слов
        Замена v – у
        Замена i – и
        Отметить ii красным — со словами, в которых есть ii, надо разбираться отдельно. Возможны варианты
        Удалить перенос внутри слова
        Замена — — на —
        Замена онѣ, однѣ – они, одни
        Замена ея, нея – ее, нее
        Замена окончание ыя – ые
        Замена ѣ – е
        Замена без – бес
        Замена изс – исс
        Замена возс – восс
        Замена разс – расс
        Замена аго – его
        Замена как-бы – как бы
        Замена знаете-ли – знаете ли
        Замена что-же – что же
        Замена так-же – также
        Замена то-есть – то есть

        Так чта…

  • iv-mi:

    Всем уже подписавшимся и тем, кто присоединится, доступен обновленный файл слов с буквой Ё.
    Версия 18/03/2012.

  • iv-mi:

    Всем подписчикам доступен скрипт, позволяющий вернуть букву Ё в географические названия.

  • surock65:

    Извините за то, что не совсем в тему, но не могу удержаться.
    jа (‘а) = я
    jу (‘у) = ю
    jэ (‘э) = е
    jо (‘о) = ё
    Почему предлагается не обозначать отдельной буквой только одно сочетание фонем? Давайте откажемся от всех четырёх! Ну, или объединим попарно. Что там осталось — я объединить с ю? Будем писать «Я тебя лябля», подразумевая при этом, что читать всё же нужно «Я тебя люблю». Это ж сколько жизненных ресурсов сэкономим!

  • Анатолий:

    Дорогие коллеги! И подписался, и авторизовался, а ссылку на закачку скрипта не вижу. Помогите, пожалуйста, найти и скачать.
    С почтениемъ — Анатолий.

Оставить комментарий!

Вы должны быть в системе чтобы оставить комментарий.