Православный взгляд на ИТ

Компьютерный словарь Церковно-Славянского
Михаил Дмитриевич Углов, Православный Христианин - 19:36 10.09.2002
Уважаемый Модератор!
Прошу Вашего совета. Я хочу перевести в компьютерный вид (формат LINGVO) церковнославянско-русский словарь. В случае Вашего одобрения этот словарь будет выставлен для бесплатного копирования/пользования на сайт http://www.lingvo.ru. (Там же все технические подробности).
В качестве справки. Компьютерные словари серии LINGVO на сегодня являются одними из лучших в мире словарей подобного рода. Это по отзывам многочисленных пользователей как в России, так и по всему миру. Число пользователей этих словарей растет неуклонно.
Наличие такого словаря для бесплатного пользования позволит обратить взгляды большего числа людей (в особенности молодежи), ныне далеких от Церкви, к Православию, лучше понимать Литургию. Ведь церковно-славянский ныне понимают очень немногие (до революции хотя бы азы знали практически все).
В этой связи мои вопросы. 1) Считате ли Вы эту работу нужной и полезной? Если да, то: 2) Если эту (или подобную) работу уже делают люди более знающие, конкретно мои труды будут бесполезны. 3) Если мои труды пойдут на пользу, прошу присоветовать наиболее авторитетный словарь подобного рода для перевода в компьютерный вид. Сам я держал в руках только один такой словарь (к сожалению, в тот момент не имел с собой нужной суммы, чтобы приобрести его). Это было репринтное переиздание дореволюционного словаря, подготовленного высокоученым богословом, имени которого я, к сожалению, не запомнил.
Дабы дать Вам представление о том, насколько качественно я мог бы справиться с этой работой, скажу следующее. Первый опыт составления словарей был предпринят мной в 1988-89 гг. Словарь был узкоспециальный, весьма небольшой. Он был принят к изданию. Затем, с 1994 г. по настоящее время я пытаюсь составить большой словарь английских сокращений (с русским переводом). На сегодня это более 75000 словарных статей. Пробу пера по переводу словаря в формат LINGVO я уже предпринимал. Многому научился. Так что с техническими аспектами этой работы я должен справиться. Во многих лексикологических вопросах также разобрался. Обязуюсь делать эту работу со всем доступным мне тщанием. Безусловно, пускать эту работу в свет я должен только после проверки авторитетными специалистами нашей Церкви и с её благословения.

Прошу ответа и совета.

раб Божий Михаил

                


Re: Компьютерный словарь Церковно-Славянского
MNT, - 10:08 11.09.2002
Михаил Дмитриевич Углов, Вы писали:

> 1) Считате ли Вы эту работу нужной и полезной?

Работа нужная.

> 2) Если эту (или подобную) работу уже делают люди более знающие, конкретно мои труды будут бесполезны.

> 3) Если мои труды пойдут на пользу, прошу присоветовать наиболее авторитетный словарь подобного рода для перевода в компьютерный вид.

Будем ждать информацию об этом на другом форуме в теме http://www.kuraev.ru/forum/view.php?subj=15074

От себя могу сказать, что против формата Lingvo ничего не имею. К какой версии программы Lingvo можно будет подключить этот словарь?

> Безусловно, пускать эту работу в свет я должен только после проверки авторитетными специалистами нашей Церкви и с её благословения.

Можете написать письмо по е-мэйл на все адреса информационных служб Русской Православной Церкви, особенно издательских служб (редакций) и информационных агенств. Я думаю, они помогут с поиском необходимого первоисточника.

Бог в помощь!

                


Re: Компьютерный словарь Церковно-Славянского
MNT, - 14:24 09.11.2002
> Будем ждать информацию об этом на другом форуме в теме http://www.kuraev.ru/forum/view.php?subj=15074

Вот что пишут в той теме :

"Очень хорошая, давно назревшая идея!
Мы (группа православных филологов) тоже задумывались над этой
проблемой.

>Какое конкретно издание (дореволюционное?), как наиболее
>авторитетное, нужно взять за основу электронной версии
>церковнославянско-русского словаря?

Важный вопрос, оставленный участниками обсуждения без должного
внимания.

Дело в том, что словарь Дьяченко, действительно наиболее полный на данный момент, не соответствует современному лексикографическому
уровню:
- с одной стороны, он избыточен (содержит старославянскую и
древнерусскую лексику),
- с другой стороны, собственно церковнославянская лексика
(отраженная в современных церковнославянских библейских и
богослужебных текстах) представлена в нем недостаточно полно;
- нет единства в оформлении лексической статьи;
- есть ошибки в употреблении надстрочных знаков (в частности,
ударения).

Назрела необходимость создания нового церковносл.- русского словаря.
Мы готовы приступить к этому большому делу, но у нас нет
технической базы и людей, которые бы разбирались в вопросах создания информационных систем, баз данных и т.п.
Мы представляем себе эту работу приблизительно так:
1-й этап - создание базы данных для лексического анализа основного
корпуса цсл. текстов.
2-й этап - создание словника.
3-й этап - создание собствено лексикографических описаний.
4-й этап - преобразование базы данных в электронную версию словаря;
создание обратного словаря.
Если Вас это заинтересовало, давайте сотрудничать!
Есть реальная возможность получить грант на реализацию этого
проекта.

                


Re: Компьютерный словарь Церковно-Славянского
Углов Михаил Дмитриевич, - 11:30 10.11.2002
Уважаемый (или уважаемые) MNT (группа православных филологов)!

"Назрела необходимость создания нового церковносл.- русского словаря.
Мы готовы приступить к этому большому делу, но у нас нет
технической базы и людей, которые бы разбирались в вопросах создания информационных систем, баз данных и т.п."

Благодарю за лестное предложение сотрудничать с Вами. Буду рад принять участие. Правда, я не особо уверен в моей большой полезности для задуманного Вами столь серьёзного проекта. Хотя... Чтобы Вам стало понятно, в чем мог бы выразиться мой вклад в это общее дело, немного расскажу о том, что знаю и умею. Я имею техническое образование (Московский институт нефтехмической и газовой промышленности им. Губкина – ныне Российский государственный университет нефти и газа, геофизик). Плюс курсы переводчиков английского языка. В течение более 20 лет работаю (достаточно профессионально) английским техническим переводчиком, устным и письменным. Что касается филологии и лексикографии – то считаю себя любителем. Как переводчик, являюсь весьма активным пользователем словарей. Начиная с 1994 г. работаю над англо-русским словарем сокращений (в свободное от основной работы время). В процессе работы над этим словарем уразумел некоторые азбучные истины лексикографии, не по учебникам, а на практике, исходя из практических потребностей и на основе анализа имеющихся словарей. То есть, в значительной мере понимаю, что такое хорошо и что такое плохо для словаря. Собирание словника словаря сокращений организовал по-простому, по-рабоче-крестьянски. Для начала собрал воедино все попавшиеся в мое поле зрения сокращения из различных словарей (англо-русских) и "Тетрадей новых терминов", издававшихся ВЦП (Всесоюзным центром переводов). Это получилось около 30 источников. Ныне словник включает около 80 тыс. словарных статей. Из них тысяча с лишним собрана мной самостоятельно из оригинальной технической литературы. Сейчас дополняю его, переводя сокращения из различных англо-английских словарей (бумажных, из Интернета и пр.). Имею некоторый начальный опыт преобразования словаря в формат DSL (для словаря LINGVO). В качестве пробы пера (для внутреннего употребления) сделал однажды такую работу: произвёл слияние двух (бумажных) узкоспециальных словарей. Один был англо-русский, второй русско-английский, оба сделаны по гнездовому принципу. То есть для этого мне пришлось несколько раз рассыпать гнёзда в чистый алфавит, разбивать варианты переводов на пары, обращать получившиеся парные соответствия, собирать / группировать новые вараинты переводов, группировать переводы в новые гнёзда и т.д. Словом, кое-что понял и прочувствовал в технологии создания обратного словаря. В итоге получились два словаря: русско-английски и англо-русский, причём оба имели объединённый словник.

В вопросах создания информационных систем, баз данных и пр. — считаю себя более-менее толковым пользователем, не более того. Ни в коей мере не разработчиком. Работаю в основном в Microsoft WORD. В этом же софте делаю и свой "словарь". Чтобы хотя бы чуть приблизиться к базе данных, делаю его в виде WORD'овской таблицы. Это позволяет легче сортировать, преобразовывать форматы (это мне пришлось делать несколько раз, поскольку работаю методом проб и ошибок), затем это же в некоторой мере поможет и в преобразовании в DSL.

Что касается самого Церковно-Славянского, то я его никогда не изучал систематически. Просто имея родными языками русский и украинский, я достаточно легко понимаю некоторые цсл. тексты (читал я их немного). В студенческие годы просто из любопытства пытался выучить по самоучителю современный болгарский (он унаследовал от церковно-славянского достаточно много, как я понимаю). Немного понимаю по-польски и по-чешски. Но не более того.

Таким образом, если человек с таким багажом может оказаться полезным в задуманной Вами работе, я готов с радостью принять посильное участие. Задуманное мной преобразование словаря Дьяченко в компьютерный вид я предполагал делать полностью бесплатно. И для выставления его в качестве бесплатного LINGVO-словаря на сайте ABBYY.

С уважением,
р.Б. Михаил

P.S.
Прошу извинить за слабое (пока) понимание технологии работы в Форуме. Это же сообщение я вчера послал как новую тему. А сегодня уразумел, наконец, что это на самом деле ответ.

В продолжение к теме о гранте (платная/бесплатная работа над словарём). Как мирянин, считаю себя не в праве получать какие-либо деньги за свои труды на благо нашей Церкви. Эти труды суть моё приношение. Что же касается аппаратного/программного обеспечения, то компания, в которой я работаю, обеспечивает меня (исходя из понимаемых мной на сегодня потребностей) вполне адекватно. Мой компьютер дома, конечно, слабее того, что на работе. Но вполне достаточен для большинства рутинной работы.

В продолжение к теме о моём возможном вкладе в задуманное Вами общее дело. Полагаю, что словарь Дьяченко, несмотря на все его недостатки, тем не менее необходимо перевести в машиночитаемый вид. Я также полагаю, что в работе над будущим, более полным и более верным, словарём словарь Дьяченко в любом случае можно и нужно использовать как начальную версию — для будущего дополнения и исправления. В качестве начального моего вклада в будущую работу предлагаю отсканировать / распознать / перевести в WORD словарь Дьяченко, как он есть. Для этого потребуется как следует разобраться в проблеме фонтов и провести распознавание (FINEREADER) с обучением. Думаю, что с этим я смогу справиться (с помощью / консультацией людей более знающих).

Бог в помощь!

р.Б. Михаил