Вопрос Преобразование файлов в UTF-8 без спецификации


У меня есть файл на иврите, который теперь отображается как Gibberish. В окнах, что я делал в прошлом, я просто преобразовал файл с помощью Notepad ++> Encoding> Convert to UTF-8 без спецификации, а затем отобразился иврит.

В Ubuntu, если я использую Notepad ++ (работает в Wine), когда я его конвертирую, он по-прежнему отображается как Gibberish (но успех конвертирует его в UTF-8 без спецификации).

Интересно, есть ли программное обеспечение, которое преобразует файл в UTF-8 без спецификации так же, как и Notepad ++ (Convert -> Hebrew display> save).

Я не знаю, почему он все еще отображает GIbberish в Notepad + Wine, когда я его конвертирую. Вино поддерживает иврит, как я знаю (я могу написать свой иврит и сохранить его без проблем).


2
2018-05-31 21:52


происхождения


Какую кодировку вы конвертируете ИЗ? Текстовые редакторы иногда пытаются автоопределить кодировку, которую имеет данный входной файл, но так или иначе, автоопределили или вручную указали, конвертируя К что-то имеет смысл только тогда, когда ИЗ что-то другое. Таким образом, похоже, что ваш редактор может неправильно определять кодировку входного файла. Самая простая вещь, которую вы, вероятно, можете сделать, это использовать iconv для преобразования файла, потому что по крайней мере всегда ясно, что делает iconv: iconv -f source-encoding -t target-encoding <infile >outfile, - Celada
Интересный вопрос. Я знаком с проблемой Windows, но в Linux у меня никогда не было нежелательных побочных решений, поэтому не было необходимости выяснять, как избавиться от них. Ну, вы всегда можете использовать sed или даже dd чтобы избавиться от знака порядка байтов (dd if=filewithbom of=filewithoutbom bs=1 skip=3). - frostschutz
@Celada, это то же самое действие, как я конвертирую его в UTF-8 из gedit. он все еще Gibberish (даже если документ теперь UTF-8). - Luis
@frostschutz, можете ли вы объяснить себя лучше? Я немного смущен, потому что я действительно новичок в Ubuntu / любой Linux. - Luis
@Luis, я думаю, что Celada означает, какой формат является файлом, прежде чем вы его конвертируете? Это только UTF-8 с BOM? UTF-16? Некоторая специфическая кодировка на иврите? И т. Д. Это поможет прояснить возникшую проблему и определить точку отказа, потому что прямо сейчас ваш текст вопроса говорит «успех конвертировать его в UTF-8 без спецификации», что подразумевает, что вы уже решили проблему в этом вопросе заглавие. - Paul


ответы:


Попробуй Кейт.

Кейт - редактор нескольких документов. Выберите его для просмотра HTML-источников,   редактирование файлов конфигурации, запись новых приложений или любых других   редактирование текста. Вам все еще нужен только один экземпляр Кейт.

В редакторе с несколькими видами, например Кейт, вы получаете много преимуществ. Вы   может просматривать несколько экземпляров одного и того же документа, и все экземпляры   синхронизированы. Или вы можете просматривать больше файлов одновременно   справочное или одновременное редактирование.1

Чтобы установить kate, просто нажмите Ctrl+Alt+T на клавиатуре, чтобы открыть терминал. Когда он откроется, запустите следующие команды:

sudo apt-get install kate

1Источник:Катя


1
2018-06-01 06:12



в kate, при сохранении файла, мы можем выбрать кодировку. но мы не можем выбрать исходную кодировку, и есть только UTF-8, нет «UTF8 с спецификацией» и «UTF-8 без спецификации». - hoijui