Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » dtSearch

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12

Открыть новую тему     Написать ответ в эту тему

MrPerfect



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Варезник » dtSearch
 
dtSearch
www.dtsearch.com
 
 

dtSearch Engine — надежный и эффективный поисковый движок с поддержкой баз данных, предназначенный для встраивания в состав веб-сайтов и приложений. Поддерживает программное управление встроенным текстовым парсером с функциями подсветки искомых фрагментов, а также встроенными файловыми конверторами, которые обеспечивают преобразование в формат HTML документов, созданных в OpenOffice, MS Office и целом ряде других популярных приложений. Программа содержит эталонный код и поддержку для ADO, SQL, C++, C++.NET, Java, VB, VB.NET, C#, Delphi, ASP и ASP.NET. Обеспечивает более двух дюжин опций индексированного и неиндексированного текстового поиска для всех популярных типов файлов. Поддерживает полнотекстовый поиск во всех типах поддерживаемых файлов. Имеется также поиск с многократным ранжированием и другие опции сортировки при поиске.
 
dtSearch Desktop — программа, позволяющая искать гигабайты текста за считанные секунды на локальном компьютере, путем создания индекса, хранящего расположение слов в ваших файлах. Программа предлагает функции подсветки искомых фрагментов в найденных документах и поддерживает обширный перечень баз данных почтовых сообщений и файловых форматов. Штатные возможности программы включают более двух десятков функций индексированного, неиндексированного, полнотекстового и структурированного поиска, включая настраиваемый нечеткий поиск, поиск с использованием синонимов, терминов и словарей, логические операторы, ранжирование по релевантности, ранжирование по местоположению, поиск фраз и созвучий, поиск по маске, поиск с учетом порядка следования и взаимного расположения искомых единиц, морфологический поиск, поиск в заданном диапазоне числовых значений, настраиваемые веса искомых единиц. Кроме того, благодаря поддержке Юникода, программа обеспечивает поиск информации на самых разных национальных языках.
 
Возможности программы:
• Прокрутка списка слов для мгновенного отклика после введения поискового запроса
• Функции индексированного, неиндексированного, полнотекстового и структурированного поиска
• Обзор и настройка параметров тезауруса
• Показ всех проиндексированных полей документа с помощью специальной кнопки
• Отображение истории поиска
• Поиск сообщений, показывая хиты в полученных документах
• Опции буфера обмена, запуск файлов и другие инструменты для работы с извлечением данных
• Экспорт результата поиска в различные форматы данных
 
Особенности программы:
• Поиск с использованием морфологии
• Поиск с использованием синонимов
• Нечеткий поиск
• Фонетический поиск
• Поиск в базах данных (через ODBC)
• Поддержка сообщений Outlook
• Поддержка различных кодировок
• Работа в локальной сети
• Индексация веб страниц на заданную глубину

Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 06:09 09-02-2003 | Исправлено: Komandor, 15:29 16-11-2022
evoroz



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MrPerfect

Цитата:
dtSearch Publish - Publish a searchable database to CD, DVD, etc. Здесь я не знаю, что это точно означает. Поиск на CD, DVD, ... ?  
Эту штуку я не знаю, где загрузить. В Варезнике упоминается, что она встроена в dtSearch Engine.

 
После инсталяции Engine в меню появился dtSearch CD Wizard. Означает возможность создания собственного CD-ROM. Работает так: указывается откуда брать тексты  и куда записать тексты и индекс (+ загрузчик главной старницы). Эту директорию и можно записать. Русский текст конвертируется в юникод.

Всего записей: 3487 | Зарегистр. 30-03-2002 | Отправлено: 10:06 10-02-2003
MrPerfect



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Забыл сказать - поиск в только в файлах с нужными расширениями можно производить, используя маски, вводя, например, в поле Filename filters:
hello?.doc - в данном случае будет производиться индекс и поиск только в файлах DOC, имя которых начинается на hello, а вместо ? может присутствовать любой одиночный знак.
Если так: hello??.doc - два любых одиночных знака;
hello???.doc - три любых одиночных знака;
???.doc - три любых одиночных знака;
???hello.doc- три любых одиночных знака; и т.д.
Если ввести:
hello*.doc
Здесь аналогично, только на месте * может быть любое количество любых символов.
В общем, все потребности удовлетворяются.
 
evoroz
Спасибо за информацию. То есть dtSearch CD Wizard = dtSearch Publish. А как с этим быть:
dtSearch Engine $ 999  
dtSearch Publish $2,500  
Это - заявленная стоимость программ.

Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 14:46 10-02-2003
evoroz



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MrPerfect

Цитата:
А как с этим быть:  
dtSearch Engine $ 999  
dtSearch Publish $2,500  

 
Точно не знаю. Но, например, если ты задумал делать КОММЕРЧЕСКИЕ cd-rom платишь 2500 и делай что хочешь. Подобная практика лицензирования совершенно точно есть у других производителей аналогичных программ. [Обычно предлагаются 2 варианта: % от тиража или сумма за все].
 
P.S. Тоже забыл: поиск на cd-rom осуществляется  в эксплорере и в юникоде. А для этого докально запускается сервер Apache ! (или альтернативно другой сервер).

Всего записей: 3487 | Зарегистр. 30-03-2002 | Отправлено: 09:26 11-02-2003
Autoset

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, пожалуйста, почему в окне indexed word list не отображается статистика слов. Спасибо.

Всего записей: 26 | Зарегистр. 16-04-2002 | Отправлено: 00:00 17-03-2003
evoroz



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Autoset

Цитата:
Подскажите, пожалуйста, почему в окне indexed word list не отображается статистика слов.  

Как у себя не крутил, все время отображается!
Может быть что-то сбилось в настройках или у тебя косит бета-версия.

Всего записей: 3487 | Зарегистр. 30-03-2002 | Отправлено: 13:07 18-03-2003
Autoset

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Причина найдена. Создавая индекс надо имя писать латиницей (у меня были русские имена). А потом можно поменять на русские, будет работать. Спасибо за участие.

Всего записей: 26 | Зарегистр. 16-04-2002 | Отправлено: 09:14 19-03-2003
trik

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
как уменшить размер индекса создаваемого почемуто у меня всегда получается индекс  такой же или больший чем исходный текст  

Всего записей: 17 | Зарегистр. 24-04-2002 | Отправлено: 21:30 28-03-2003
MrPerfect



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
trik
У меня на малом объёме документов - индекс почти такого же объёма, на большом количестве документов - индекс занимает малый размер.
 
В справке к программе, в поиске набираем compress. Получаем ответ:
 
When you reindex a document that you had previously indexed, dtSearch marks the information about the old version of the document as "obsolete" but does not remove it from the index. Compressing an index removes this obsolete information and also optimizes the index for faster searching.
To compress an index, check the Compress index after adding documents box in the Update Index <Indexing_Documents.htm> dialog box.
 
If you have updated the index several times, you may want to check Compress index after adding documents.  Compressing an index removes obsolete document information from an index.  It can take a while (dtSearch completely reconstructs the index) but it makes the index smaller and makes searches faster.
 
В менеджере индексов при обновлении индекса есть галка:
Compress index after adding documents

Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 08:30 29-03-2003
trik

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ето все я исследовал уже  мало помогает вот посмотрел индекс блин да она все слова оличающиеся только окончаниями запихала  но я почитал вроде можно добавить поддержку морфологии у кого нибудь есть ето  
 база у меня 1.2 гига примерно  индекс тоже около етого  компрессированный

Всего записей: 17 | Зарегистр. 24-04-2002 | Отправлено: 03:38 14-04-2003
MrPerfect



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
trik
Пробуй альтернативу
http://forum.ru-board.com/topic.cgi?forum=35&topic=5824

Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 08:20 14-04-2003
LevT



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

 
Кто разбирался с dtSearch Engine (или вдруг является ее лиценизионнным пользователем)?
 
Почему объявленный в справке файл vw_rot13.cpp  - пример использования File Parser API - в инсталляции отстутсвует? Как бы им разжиться?
 
 
 

Всего записей: 17734 | Зарегистр. 14-10-2001 | Отправлено: 11:11 19-04-2003
ppch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dtSearch штука хорошая. Но вот не хватает русской морфологии. Загоняет он в свой индекс кучу всякого шума.
Проблемку можно решить отредактровав файлик dtsearch.noi, который содержит список неиндексируемых слов - предлоги, местоимения, междометия и т.д. .  
 
Но где взять эти самые русские "шумные" слова? Может кто сталкивался - помогите плиз.

Всего записей: 102 | Зарегистр. 18-04-2003 | Отправлено: 19:35 13-05-2003
evoroz



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ppch

Цитата:
dtSearch штука хорошая. Но вот не хватает русской морфологии. Загоняет он в свой индекс кучу всякого шума.  
Проблемку можно решить отредактровав файлик dtsearch.noi, который содержит список неиндексируемых слов - предлоги, местоимения, междометия и т.д. .  
 
Но где взять эти самые русские "шумные" слова?  

 
Как я понимаю, морфология - это изменение слов по падежам и пр. Решаться эта проблема должна с помощью внешнего словаря.
Список неиндексируемых - стоп - слов можно и самому сочинить. Или перевести с английского в том же файле.

Всего записей: 3487 | Зарегистр. 30-03-2002 | Отправлено: 09:29 14-05-2003
ppch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
evoroz
 
Решить проблему с русской морфологией совсем не просто, внешнего словаря тут далеко не достаточно. А вот приуменьшить эту проблему можно, подсунув dtSearch список русских стоп-слов.  
Сочинять их самому бесполезно, все такие слова "великого и могучего" все равно не вспомнишь.  
Так что надо искать. Нужны просто полные списки русских местомений, междометий, предлогов, союзов ну и т.д.
 
 

Всего записей: 102 | Зарегистр. 18-04-2003 | Отправлено: 21:03 14-05-2003
evoroz



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробовал dtSearch с Windows 2003 Server. Для того, чтобы все работало пришлось добавить в IIS Manager -Web Service Extensions строку типа -
Web Service Extension: dtSearch (название)
Required Files: c:\inetpub\dtsearch\dtisapi6.dll (DLL отвечающая за поиск).

Всего записей: 3487 | Зарегистр. 30-03-2002 | Отправлено: 09:58 19-06-2003
ppch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если кому нужен словарь русских стоп-слов для dtSearch, сообщите - вышлю по мылу. В стоп-словаре примерно 500 слов.

Всего записей: 102 | Зарегистр. 18-04-2003 | Отправлено: 11:35 19-06-2003
atp

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ppch

Цитата:
Если кому нужен словарь русских стоп-слов для dtSearch, сообщите - вышлю по мылу. В стоп-словаре примерно 500 слов.

 
Прошу выслать Noise, стоп-словаре

Всего записей: 16 | Зарегистр. 29-10-2003 | Отправлено: 13:27 29-10-2003
ppch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
atp
Ну и куда я тебе его вышлю?
Хоть бы мыло свое написал

Всего записей: 102 | Зарегистр. 18-04-2003 | Отправлено: 10:49 06-11-2003
NSentinel



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Никто не пытался прикрутить к dtSearch поддержку форматов CHM и RAR ? А то книги лежат... И если RAR не так актуально, в конце концов, можно или ZIP сделать, или вообще распаковать, то CHM очень даже хотелось бы.

Всего записей: 138 | Зарегистр. 27-08-2002 | Отправлено: 16:27 11-11-2003
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12

Компьютерный форум Ru.Board » Компьютеры » Программы » dtSearch


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru