Алгоритм обратной транслитерации #425901


#0 by дущ
Никто нигде не видел алгоритм обратной транслитерации, т.е. что бы IVANKOV YURIY стал Иванков Юрий? С прямой алгоритмов много, а вот в связи с тем что в латинице букв меньше, с обратной возникают проблемы.
#1 by Megas
какие ?? Подольше перебор да и всё ... правила те же...  просто при каждой букве проверяй следущую букву ... (там ведь максимум из 2 символов сочетания sh = ш)
#2 by дущ
Ага, только "YO" - это обычно "ё", а вот в слове йод "YO" - это уже "йо".
#3 by Rie
Значит, у тебя неоднозначная прямая транслитерация. Посмотри - у телеграфистов есть таблицы, там вроде бы неоднозначностей не возникает.
#4 by Megas
На крайняк словарь =)
#5 by RayCon
Думаю, что даже таблица RUR-6 не даст корректного результата, т.к. всё-таки русские фамилии в русском языке - первоисточник, а в английском - производное. А задача восстановления первоначальной информации из производной, которая, к тому же, часто искажена, как минимум, неоднозначна. +1 Даже про "е" можно то же самое сказать (Фёдоров почти всегда Fedorov, и крайне редко Fiodorov), что уж про "ё" говорить. Телеграфисты либо не переводят на русский международные тексты вообще, либо переводят их не машинным способом, а с помощью работника-переводчика.
#6 by Rie
Речь не о переводе, а о транслитерации. Таблица транслитерации по ГОСТ - здесь:
#7 by дущ
А в загранпаспортах какая таблица транслитерации используется?
#8 by RayCon
французская
#9 by Megas
Ага, только "YO" - это обычно "ё", а вот в слове йод "YO" - это уже "йо".
#10 by RayCon
всё дело в том, что кроме русских, никто в мире ГОСТом не пользуется. Аннглоязычные используют свои собственные транслитерационные таблицы, часто даже отличные от RUR-6 => без перевода (или, если угодно, корректорской правки) уже "оттранслитерированного" текста не обойтись.
#11 by Фокусник
есть и 4: Щ - SHCH при том что Ш - SH, Ч - CH Т.е. если "в лоб", то SHCH - ШЧ :) ИМХО, нужно СтрЗаменить применять, в первую очередь несколько буквенные сочетания, а потом однобуквенные. От бОльшего - к малому.
#13 by Rie
Судя по , топикстартеру нужны загранпаспорта. У ОВИР явно есть какой-то документ, который определяет систему транслитерации. Я этого документа не видел, но, IMHO, его можно найти.
#15 by Megas
СтрЗаменить ? .... по символьно как учили по ТРТП в с или паскале =) Нашёл "s" смотриш "h" далее "ch" ... вроде всё понятно и просто.... Причём я думаю это не очень критичное место... Я вот думаю..... А не судьба заводить сразу и Англ и Рус имена в рег сведений ?
#16 by Megas
Или опять же базу имён найти ... их что так много что в регистр не влезут ?
#17 by Rie
Не поверишь - но нет такой базы. Имена у людей бывают ой какие забавные.
#18 by дущ
Спасибо. Только алгоритм там такой, что там даже прямую транслитерацию написать алгоритм надо страниц на 20. А обратная совсем не осуществима :( Поэтому для потомков публикую что у меня получилось: Всем спасибо. Тема закрыта
#19 by VladZ
можно еще проще.
#20 by Torquader
При оформлении загран-паспорта фамилию и имя пишут во французском звучании (это не совсем транслитерация), например, Алексей -> Alexey, Александр -> Alexander и т.д. Замечу сразу, что "Х" в транслитерации не встречается, а запись (Kutuzoff) переводится в русский вариант по обратному звучанию. Поэтому, если нужно переводить - то проще поискать таблицы фамилий (по крайней мере вы будете уверены, что часть фамилий переведётся правильно). Перевод транслитерации обратно возможен только с использованием словаря слов (примерно, как Т9 в телефоне). Даже в таблице ГОСТ сочетания с буквой Ё, а также ЫА и ЫУ могут переводиться некорректно (хотя, Ё мало кто использует и везде будет Е, а фамилии малых народов севера встречаются достаточно редко).
#21 by v_rtex
транслитерация a 6 B r g e }I{ 3 u K JI M H o n p c T y qp X II, 4 III III, 'b bI b -) IO 9
#22 by Rie
Сейчас ситуация хуже: используются как французский, так и анлийский языки (. Так что нужны два алгоритма транслитерации + способ определить, какая транслитерация используется.
#23 by Torquader
Я ещё раз говорю, что применяется не транслитерация, а транскрипция - то есть передача звучания на другом языке, а не перевод символов. P.S. меня всегда удивляло, почему вместо "х" пишут "h", что читается как "аш" и должно обозначать "ш" (а для "х" русского есть латинский аналог по начертанию "x").
Тэги:
Ответить:
Комментарии доступны только авторизированным пользователям

В этой группе 1С