#0
by Волшебник
1. Разбить сообщение на слова, 2. Выбросить из них стоп-слова (предлоги, союзы и другие часто употребляемые в русском языке), 3. Привести оставшиеся к исходной форме (возможно задействовать обычный стемминг - отбрасывание окончаний) и к одному регистру, 4. Отсортировать их по чатоте употребления по убыванию. 5. Взять из СЕРЕДИНЫ этого массива N слов. 6. Найти по этим словам статьи или ветки В результате мы получим ссылки, в которых с большой вероятностью будет ответ на поставленный вопрос. Кто-нибудь покритикует этот алгоритм или, что лучше, предложит свой?
#2
by Волшебник
Книга знаний в виде хелп-файла? Первый раз слышу о такой задаче, но мысль интересная. Предлагаю не портить эту ветку, а завести новую. Здесь я бы хотел поговорить про бота. Кстати, поиск статей он будет осуществлять именно по Книге знаний.
#4
by Волшебник
Но иногда они вообще не отвечают. Или опускают новичка ниже плинтуса. Или просто отправляют его в поиск.
#6
by Волшебник
Я думаю, такой ответ недостоин бота. Он машина и с людьми должен быть вежлив и деликатен.
#17
by Волшебник
Имена объектов, методов и свойств являются в высшей степени ключевыми. По ним легко можно найти фрагменты программ с решением проблемы. Так что ты прав. Общая по форуму. Методом научного тыка.
#24
by Песец
N можно сначала сделать параметром запроса, по умолчанию подставлять наиболее часто употребимое число.
#27
by Андрюха
Использовать в Боте поисковые маски, т.е. "Таблиц*" - это может быть и Таблица, и Таблицу, и Таблице и т.д.
#28
by Волшебник
Зачем? Бот может заранее составить эту статистику и периодически ее обновлять, а при основной работе просто ее использовать. См. пункт 3 - стемминг.
#30
by Песец
(24+) N указывать в %. Дать возможность оценки (по желанию автора вопроса) резутьтата работы бота. Пригодится для улучшении алгоритма, особенно если один и тот же вопрос задается немного по-разному, меняется N например.
#34
by skunk
"Таблица" "Таблица Значений" "Значение" - все это не связанные между собой понятия... но твой бот будет давать линки на все три... если они попадут в число N
#35
by Мистадонт
Имхо, взлетит. А потом, по результатам, уже можно будет оптимизировать. ЗЫ наконец-то энтузиазм Волшебника имхо получил достойную пищу и цель :) Долой войну форумов, да здравствует честная конкуренция ботов ! ! !
#36
by Демогоргон
Не всегда самое встречающееся слово самое гланое и ключевое это раз. 2 - иногда словосочетание тоже важно ...
#37
by Песец
Из N можно, используя статистику, составлять цепи слов (типа цепей Маркова). Ага, по пятницам будем делать ставки на битве роботов... "В левом углу ринга миста-терминатор, в правом кубань-потрошитель".
#38
by Волшебник
Стемминг уже написан. Почему бы не написать бота на 1С? Это уже дело техники. Да, надо с чего-то начать. Именно по этому слова берутся из середины LOL!
#39
by Песец
(37+) Ok,Ok. Не на ринге. По типу "Что Где Когда". Во фраках и при бабочках. Зрители задают вопросы и делают ставки.
#40
by Демогоргон
Регист и получение остатков. Для получения остатков воспользуется объектом регОстатки = СоздатьОбъект("Регистр. ...");
#41
by Демогоргон
Автомат это хорошо но не круто. Это статистика. Я хочу точности. Поэтому база данных, пополняемая вручную где указанна ссылка и что здесь нужно и на какие слова нужно отвечать ..
#44
by Демогоргон
Мля, у меня даже дома времени нет. А то хоть счас бы уже алгоритмы стал писать бы ... Разговор не в счет - ну мона хоть чуть отдохнуть ..
#45
by evGenius
Как красиво придумал: "Бот, отвечающий на вопросы по 1С". Так бы и сказал, что хочешь переделать поиск по базе знаний. Нормальный такой алгоритм для нового поискового движка, оптимизированного под 1С, правда доработки требует и столкновения с реальностями жизни.
#46
by skunk
поживем увидим... я сказал свое мнение по поводу описанного тобой алгоритма... он ведь еще очень далек от реализации... как реализуешь увидим...
#47
by Токс
Первый шаг к кнопке "Сделать всё!" сделан! Поздравляю! ЗЫ Как весело было читать переводы первых компьютерных переводчиков...
#48
by evGenius
Надо еще плагин для OpenConf к 1С сделать, который в зависимости от ситуации будет кидать страницу из БЗ автоматически. :)))
#49
by Волшебник
Поиск - это лишь средство. Цель - сделать автономного бота (функционирующего без человека), который будет использовать поиск и еще бог знает что для ответов на вопросы.
#52
by Антошка WAREZNIC
Выходит что... Выходит, что всё это затеяно, чтобы устранить Антошку от мисты? (рыдаю кислотными слезами)
#53
by skunk
следующим ботом на мисте появится бот... определяющий степень дятлонизма у вопращающего... желательно, что бы он само совершенствовался...
Тэги: Наука
Ответить:
Комментарии доступны только авторизированным пользователям
В этой группе 1С
- Надо записать данные в документ из обработки
- Бухгалтерия 4,5 проводки по счету 58,3 и 76,5
- Классификатор банков
- Как текущую ячейку табличного поля ввести в режим редактирования?
- Как сделать активной произвольную ячейку в табличном поле?
- А где в УПП классификатор ОКАТО?
- Почему при печати одной страницы -вторая выходит просто пустая?!?!
- Печать чеков на приходные кассовые ордера - ШТРИХ-М
- Как найти отличия двух печатных форм
- Как у счета 91.2 изменить тип субконто?
- ОФФ:Продление лицензий сервера терминалов
- Как отказаться от ввода на основании в ОбработкаЗаполнения()
- Что значит Левое Соединение .... ПО Истина
- как определить, к какому справочнику принадлежит выбранное субконто
- как программно установить отбор в табличном поле
- нумерация строк в SQL запросе
- ОФФ: какой инет лучше? по протоколу PPPoE или PPTP?
- Как сделать выбор документа только с определенной датой?
- Индекс и НомерСтроки
- Доступность сортировки в табличном поле формы