Поменять кодировку текста #424011


#0 by vpetrov
Привет всем. Суть следующая - есть текст в кодировке (может быть различной). Определить кодировку могу сторонними средствами. Нужно его прочитать и загрузить в 1С 8.1 в читабельном виде (т.е. win-кодировке). Как можно у текста в файле (txt or doc) поменять кодировку? Желательно командной строкой, ну в любом случае программно.
#2 by vpetrov
это что было?
#3 by skunk
что УстановитьТипФайла (SetFileType) уже отменили?
#4 by genosse
Если до 1С то можешь использовать функцию VBS    For i=1 To Len(s)        ElseIf k = 240 Then            k=168        ElseIf k = 241 Then
#5 by vpetrov
Всем спасибо, скунку - язык
#6 by vpetrov
С помощью DetectEncoding.dll получилось, что этот текст в кодировке UTF-16 с кодовой страницей 1200. Привожу текст: ????"???????????????????    0,38    5    ???????? ?????????????????? ?? ??????????    ??????????, ??? ?????????????? ??????????????        ??????????, ??????????????????? ???????, 78, ??1, 27    ???????????? ??????????????? ??????????????????????89169537757                                                1    ????????????????????? Обработать с помощью 1С не получилось.
#7 by vpetrov
))) Мда. В общем, если установлена поддержка языков Юго-Восточной Азии - то он отображается нормально (в своей кодировке) в Word, однако не переводится в другие кодировки в читабельном виде. Как быть? Текст могу прислать, если нужно.
#8 by vpetrov
Еще одна кодировка вылезла - ISO-2022-JP. Даже при условии, что она есть в 1С - не получается преобразовать текст в Win или Ansi кодировку. По идее, в тексте русские буквы зашифрованы в японской кодировке, а прочитать не получается. Чешу голову ))) Кто может начесал уже чего?
#9 by Живой Ископаемый
Можно попробовать воспользоваться объектом ИзвлечниеТекста... только расширение не должно быть TXT ИзвлечениеТекста.ПолучитьТекст (TextExtraction.GetText) ПолучитьТекст (GetText) Синтаксис: ПолучитьТекст Возвращаемое значение: Тип: Строка. Текст, извлеченный из файла, или пустая строка в случае ошибки. Описание: Извлекает текст из файла. Тип файла определяется по расширению файла (т.е. текст из файла с расширением .tmp извлечен не будет). Для извлечения текста из файлов используется интерфейс IFilter. Он является расширяемым. Можно установить дополнительные модули, чтобы появилась возможность извлекать текст из еще одного типа файлов. По умолчанию текст извлекается из файлов следующих типов (имеющих расширение): ASCX, ASP, ASPX, CSS, HHC, HTA, HTM, HTML, HHT, HTW, HTX, ODC, STM, DOC, DOT, POT, PPS, PPT, XLB, XLC, XLS, XLT, TXT, EML. Подразумевается, что файлы с расширением TXT - это текстовые файлы в кодировке ANSI или UNICODE (UTF-16). Примечание: Следует использовать только в среде Windows NT 4.0, 2000, XP. Чтобы узнать, какие расширения для IFilter уже установлены на вашем компьютере, можно скачать и установить программу IFilter Explorer (. Пример: ==== И потом уже полученный текст записать в выбранной кодироке
Тэги:
Ответить:
Комментарии доступны только авторизированным пользователям

В этой группе 1С