bolega
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору NME Цитата: а ежели позиционирование не предполагается, | СК не поддерживает позиционирование на определенную часть страницы. Это бывает нужно ну очень редко. В большинстве случаев достаточно просто прыжка на страницу. Для pdf без позиционирования ссылку вообще не опишешь, поэтому СК позиционирует на верхний левый угол страницы. Возможно, когда-нибудь добавлю такую возможность как опцию. Цитата: если в просмотрщике выбрать "вид->режим->черно-белый", то видно какие лишние элементы вошли в маску.. | Я уже как-то объяснял, что для малоцветных зон белый - это тоже цвет, белый не есть синоним прозрачного. Зона - это то, что плавает над страницей, и вполне допустимо, что область зоны (включая белый фон) задумана закрывать собой то, что под ней на странице. Поэтому белый и кодируется маской. Можно ли сделать, чтобы белый не учитывался? Можно, для этого достаточно в малоцветной зоне включить опцию transparent, и белый цвет не будет кодироваться (при желании можно игнорить и другие цвета, близкие к белому, если порог transparent threshold задать >0). Другое дело, что в случае, когда малоцветкой кодируется не зона, а сам скан, т.е. то, что попало на step1, белый цвет, если есть, не требует кодирования. Это я учту в следующей версии. Добавлено: sergiokapone нужно смотреть что такое произошло с ocr-слоем этой страницы в основном задании. Чем сделан OCR (tesseract или FR c утилитой NME), в какой версии СК, редактировался ли он. Странно то, что блоки ocr в djvu начиная с какой-то страницы идут не последовательно, а хаотично (т.е. выделяются не последовательно, а кусками сверху, потом снизу, потом с середины). Я такое первый раз встречаю, такое ощущение, что блоки переставлялись местами. СК сам блоки вообще не тасует, а берет в том порядке, в котором они описаны в парсере от NME. Интересно, что этот хаос блоков присутствует на всех страницах где есть формулы. | Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 21:29 09-08-2024 | Исправлено: bolega, 21:51 09-08-2024 |
|