Jonmey
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Boris Smirnov Мне без разницы, что вы используете. Выше сказано, что возможных причин кривизны вашего файла две: - программа, из которой произведена копипаста, или программа, в которую произведена копипаста, или обе программы; - криворучие того, кто осуществил копипасту. Выбирайте на вкус одну из них или обе. Цитата: Возможно дело в каких-то стандартах на descript.ion, корни которого идут от разработчиков стандартов 4dos, кажется. | Чистые фантазии ибо текстовые файлы по определению не предусматиривают наличие управляющих (бинарных) символов в своем составе (типа 04h и др). Это постулат, не подлежащий обсуждению для любых текстовых файлов, поскольку отступление от него автоматически превращает их из текстовых в бинарные. Цитата: Если Вы пользуетесь Total Commander (а кто им сейчас не пользуется?) - может Вы обсудите с автором Total Commander этот вопрос? | Не вижу предмета обсуждения. Цитата: Почему descript.ion - файлы Total Commander при сравнении по содержимому всегда интерпретирует как бинарные. | Впервые слышу о таком, а сам вообще никогда с таким не сталкивался. Ваш кривой файл не является достаточной причиной, чтобы беспокоиться по этому поводу, подобно тому, как чье-либо неумение - не является поводом, чтобы что-то менять для всех. Более того, в контексте ТС, в его дистрибутив входит одноименный файл DESCRIPT.ION, который нужно и должно рассматривать (применительно к TC), как референсный (образец, созданный по стандартным правилам, которым рекомендуется следовать). Поскольку файл содержит только основную латиницу, то его кодировка в равной степени может быть интерпретирована любой из довольно длинного ряда кодировок. включая, но не ограничиваясь, следующими ANSI (то есть любая из линейки cp125x - напр., cp1250, cp1251, cp1252 и т.д.), cp866 (и остальные DOS кодировки), mac - кодировки, UTF-8, iso-9989-x, koi8 (и др), многие национальные двухбайтовые кодировки (типа китайских, японских, корейских и др.). Однако, среди этого списка нет Unicode (UTF16, UTF32). То есть, сам автор TC не рассматривает Unicode, в качестве стандарта для файлов DESCRIPT.ION. То есть, налицо преемственность с изначальным форматом указанных файлов, пришедших из DOS. Это легко объясняется тем фактом, что Unicode - применительно к текстовым файлам по сути экстренная мера, призванная главным образом для случаев, когда в одном и том же текстовом файле используется (безальтернативно) более одного национального набора (не считая латиницы) - то есть, как минимум символы из трех наборов (или более) - латиница и два национальных (например, английский-русский-греческий и т.п.). Абсолютному большинству юзеров это не надо от слова совсем. Тем паче, имеется UTF8 являющаяся стандартом де-факто многих текстовых форматов. включая html, xml и т.д. Более того, некорректное использование utf16 нередко превращает файлы в необратимо-нечитаемую кашу, которую нельзя восстановить. В случае utf8 для латиницы такое вообще невозможно, что делает ее безопасной, как минимум, для английских текстов. Учитывая озвученное вами ранее предпочтение именно англоязычного (оригинального) текстового контента, становится вообще непонятной ваша слепая тяга и стремление преобразовать файлы DESCRIPT.ION в utf16. Лично же мое мнение - эта затея в корне вредоносная и порочная, особенно если учитывать, что любая инфа в DESCRIPT.ION носит краткий, схематичный характер, и призвана дать первичное представление о контенте, к которому приложен файл, а потому главной особенностью этих файлов является максимальная совместимость (то есть, в идеале, любая программа, способная открыть текстовые файлы должна быть способна корректно отобразить его содержимое). UTF16 (32) этому критерию соответствует в наименьшей степени из всех общих колировок. В общем, как и сказал ранее, все ваши проблемы носят исключительно надуманный, искусственный характер и не заслуживают времени, потраченного на их обсуждение. | Всего записей: 1377 | Зарегистр. 17-01-2011 | Отправлено: 23:02 20-03-2020 | Исправлено: Jonmey, 23:04 20-03-2020 |
|