Re: Компьютерный словарь Церковно-Славянского
Углов Михаил Дмитриевич, - 11:30 10.11.2002
|
Уважаемый (или уважаемые) MNT (группа православных филологов)!
"Назрела необходимость создания нового церковносл.- русского словаря.
Мы готовы приступить к этому большому делу, но у нас нет
технической базы и людей, которые бы разбирались в вопросах создания информационных систем, баз данных и т.п."
Благодарю за лестное предложение сотрудничать с Вами. Буду рад принять участие. Правда, я не особо уверен в моей большой полезности для задуманного Вами столь серьёзного проекта. Хотя... Чтобы Вам стало понятно, в чем мог бы выразиться мой вклад в это общее дело, немного расскажу о том, что знаю и умею. Я имею техническое образование (Московский институт нефтехмической и газовой промышленности им. Губкина – ныне Российский государственный университет нефти и газа, геофизик). Плюс курсы переводчиков английского языка. В течение более 20 лет работаю (достаточно профессионально) английским техническим переводчиком, устным и письменным. Что касается филологии и лексикографии – то считаю себя любителем. Как переводчик, являюсь весьма активным пользователем словарей. Начиная с 1994 г. работаю над англо-русским словарем сокращений (в свободное от основной работы время). В процессе работы над этим словарем уразумел некоторые азбучные истины лексикографии, не по учебникам, а на практике, исходя из практических потребностей и на основе анализа имеющихся словарей. То есть, в значительной мере понимаю, что такое хорошо и что такое плохо для словаря. Собирание словника словаря сокращений организовал по-простому, по-рабоче-крестьянски. Для начала собрал воедино все попавшиеся в мое поле зрения сокращения из различных словарей (англо-русских) и "Тетрадей новых терминов", издававшихся ВЦП (Всесоюзным центром переводов). Это получилось около 30 источников. Ныне словник включает около 80 тыс. словарных статей. Из них тысяча с лишним собрана мной самостоятельно из оригинальной технической литературы. Сейчас дополняю его, переводя сокращения из различных англо-английских словарей (бумажных, из Интернета и пр.). Имею некоторый начальный опыт преобразования словаря в формат DSL (для словаря LINGVO). В качестве пробы пера (для внутреннего употребления) сделал однажды такую работу: произвёл слияние двух (бумажных) узкоспециальных словарей. Один был англо-русский, второй русско-английский, оба сделаны по гнездовому принципу. То есть для этого мне пришлось несколько раз рассыпать гнёзда в чистый алфавит, разбивать варианты переводов на пары, обращать получившиеся парные соответствия, собирать / группировать новые вараинты переводов, группировать переводы в новые гнёзда и т.д. Словом, кое-что понял и прочувствовал в технологии создания обратного словаря. В итоге получились два словаря: русско-английски и англо-русский, причём оба имели объединённый словник.
В вопросах создания информационных систем, баз данных и пр. — считаю себя более-менее толковым пользователем, не более того. Ни в коей мере не разработчиком. Работаю в основном в Microsoft WORD. В этом же софте делаю и свой "словарь". Чтобы хотя бы чуть приблизиться к базе данных, делаю его в виде WORD'овской таблицы. Это позволяет легче сортировать, преобразовывать форматы (это мне пришлось делать несколько раз, поскольку работаю методом проб и ошибок), затем это же в некоторой мере поможет и в преобразовании в DSL.
Что касается самого Церковно-Славянского, то я его никогда не изучал систематически. Просто имея родными языками русский и украинский, я достаточно легко понимаю некоторые цсл. тексты (читал я их немного). В студенческие годы просто из любопытства пытался выучить по самоучителю современный болгарский (он унаследовал от церковно-славянского достаточно много, как я понимаю). Немного понимаю по-польски и по-чешски. Но не более того.
Таким образом, если человек с таким багажом может оказаться полезным в задуманной Вами работе, я готов с радостью принять посильное участие. Задуманное мной преобразование словаря Дьяченко в компьютерный вид я предполагал делать полностью бесплатно. И для выставления его в качестве бесплатного LINGVO-словаря на сайте ABBYY.
С уважением,
р.Б. Михаил
P.S.
Прошу извинить за слабое (пока) понимание технологии работы в Форуме. Это же сообщение я вчера послал как новую тему. А сегодня уразумел, наконец, что это на самом деле ответ.
В продолжение к теме о гранте (платная/бесплатная работа над словарём). Как мирянин, считаю себя не в праве получать какие-либо деньги за свои труды на благо нашей Церкви. Эти труды суть моё приношение. Что же касается аппаратного/программного обеспечения, то компания, в которой я работаю, обеспечивает меня (исходя из понимаемых мной на сегодня потребностей) вполне адекватно. Мой компьютер дома, конечно, слабее того, что на работе. Но вполне достаточен для большинства рутинной работы.
В продолжение к теме о моём возможном вкладе в задуманное Вами общее дело. Полагаю, что словарь Дьяченко, несмотря на все его недостатки, тем не менее необходимо перевести в машиночитаемый вид. Я также полагаю, что в работе над будущим, более полным и более верным, словарём словарь Дьяченко в любом случае можно и нужно использовать как начальную версию — для будущего дополнения и исправления. В качестве начального моего вклада в будущую работу предлагаю отсканировать / распознать / перевести в WORD словарь Дьяченко, как он есть. Для этого потребуется как следует разобраться в проблеме фонтов и провести распознавание (FINEREADER) с обучением. Думаю, что с этим я смогу справиться (с помощью / консультацией людей более знающих).
Бог в помощь!
р.Б. Михаил
|
|