niccolo
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата: А происходит это потому, что вы очень смутно представляете что там происходит "под капотом". Вот, к примеру, возьмём эту ситуацию с fuzzy-search. GD никогда, нет НИКОГДА не будет работать так же в этом плане, как Lingvo. Просто потому, что ABBYY использует свои собственные алгоритмы, написанные их собственными программистами. И даже нет возможности посмотреть на этот код, так как он закрыт. При этом, повторюсь, ABBYY - коммерческая компания, представленная на рынке уже в течение десятилетий. У них огромнейший опыт разработки лингвистических продуктов и за эти годы программные алгоритмы были вылизаны и максимально оптимизированы. Это же касается и морфологии. Представляете объём корпуса, с которым они работают по истечении всех этих лет? При том не сваленный в кучу, а систематизированный и разложенный по полочкам. Алгоритмы шлифуются годами с использованием этой базы. Конечно, hunspell для них - это детский сад штаны на лямках. А откуда у разработчиков GD такая база, такое кол-во человеко-часов, чтоб разработать свой собственный механизм? Поймите, написать годный модуль fuzzy-поиска - это титанический труд для одного человека. Если это вообще возможно. А если ещё и бесплатно, то точно невозможно. Поэтому, выбор сводится к уже имеющимся открытым решениям для конкретного ЯП и даже конкретного фреймворка. Понятное дело, что выбор не велик, если вообще есть. Всё то, что я сказал - это лишь верхушка айсберга, так как я сам не программирую на C++ и , тем более, под Qt. Уверен, разработчики многое могли бы рассказать на эту тему, но оно им как бы того.. не особо надо. Просто не надо думать, что если "никто не указал до меня", то достаточно будет указать и разработчик, стукнув себя по лбу, с криком "Эврика" побежит реализовывать мои хотелки. GD далеко не идеальный продукт, просто потому, что идеального ничего нет. Если он вам не подходит по каким-то критическим для вас параметрам, то, наверное, стоит пользоваться теми решениями, где необходимый вам функционал реализован в полной мере. | 1. В данном случае о каком Fuzzy search вы говорите, когда речь идёт о простом ТОЧНОМ АЛФАВИТНОМ ПОИСКЕ ДО ПЕРВОГО НЕСОВПАДЕНИЯ? Лингво просто выводит участок древа заголовков ВСЕХ СЛОВАРЕЙ НАПРАВЛЕНИЯ с позиции первого расхождения, чего не делает GD. Проблема в том, что, видимо по соображениям скорости индексирования, создатели GD отказались от построения общего индекса словарей по направлениям. Плюсы от этого - быстрота перестроения индекса при правке словаря..... Многие ли этим плюсом кроме меня и еще десятка-двух конвертеров словарей пользуются? Кстати с этой точки зрения - «открыть папку словаря» тоже какая-то странная функция - более логичной была бы функция ОТКРЫТЬ СЛОВАРЬ В ТЕКСТОВОМ РЕДАКТОРЕ, например даже настроенном для формата DSL в Windows. 2. Я не лезу под капот, и не прошу что-то делать. По моим 30-летней давности познаниям программирования в Паскале, сделать кнопки отключения/включения чего-то (онлайн-морфологии) не представляло труда..... Про доделки я задал вопрос - занимается ли кто сейчас еще разработкой - ответа не было, что в какой-то мере ожидаемо, учитывая текущее состояние рынка труда в данной сфере. 3. Я пишу эти замечания сюда, чтобы если кто-то сам по каким-то соображениям решит свой форк делать - то он хотя бы видел и понимал, какие недостатки, требующие исправления, есть. | Всего записей: 3761 | Зарегистр. 17-09-2001 | Отправлено: 19:54 12-10-2021 | Исправлено: niccolo, 19:55 12-10-2021 |
|