TelecomUral
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата: Да почему. Нет. Но я не согласен с подходом, который потенциально умножает ошибки. Это, в общем-то, философский вопрос. Масштабность. Вы предлагаете такую автоматику, которая а) не автоматика в сути своей и б) реально может вносить новые трудноисправляемые ошибки, потворствует их появлению. Я высказался против подхода, и указываю на неочевидные недостатки метода, реализующего сам подход. А что по идее чего-то там можно распознать тессерактом - да ради бога, я "за". Просто общесистемно это ни к чему не ведёт. Масса ручной мозговитой работы как была так и остаётся. Тут было бы приемлемо натравить вначале на страницу опознавание языка, разделение потока текста на одноязычные блоки, а уж потом применение конкретных глифов (шрифта). Возможно, подключить тексты из интернета. Ведь вполне возможно кто-то где-то уже данный текст (кусок) использовал и он доступен, цитирован, например. В сносках - литература, допустим. Библиозапись стандартна в пределах страны и периода. Вот это да, системно. Мы бы покрыли текст понятием "язык", или "культурная единица". А частные подправки-костылики - нее. Надо понимать их плюсы и минусы. Быстро, но иногда плохо. |