Тестирование шахматной программы. #224294


#0 by NS
Игорь Коршунов, автор сильнейших в мире шашечных программ (в различные виды шашек), и автор второй по силе шахматной программы в бывшем СССР - в связи с выпуском новой версии шахматной программы обявляет набор тестеров.  Это интересно?
#1 by Волшебник
Он про мисту знает? Готов здесь присутствовать и отвечать на вопросы?
#2 by NS
Да, конечно.
#3 by skunk
так шахмотной или шашечной... и в чем тестирование... на бяки... или как играет
#4 by NS
Тестирование шахматной программы. Необходимо тестирование на силу. В первую очередь интересует результат против тестовой группы движков, а сами партии уже во вторую очередь, но замечания о слабых ходах и ошибках программы - конечно не помешают :)
#5 by skunk
ну на ошибки могу погонять, а как шахматист я первоклассник... в смысле только алфавит выучил
#6 by NS
Только надо подготовить методику тестирования, и собрать необходимые архивы. // Главное - результат партий. Итоговый счет. Программа, кстати, играет в силу сильнейших гроссмейстеров :)
#7 by Волшебник
NS, а ты как-то говорил, что проблем с тестированием шахматных движков нет. Или я что-то не так понимаю?
#8 by NS
Зависит в каком смысле... Если нужно протестировать без выкладывания, или нужно наиграть несколько тысяч тестовых партий разных версий - то есть. Тестовые группы обычно тестируют только одну, последнюю версию. И если нужно сравнить две версии - то возникают проблемы.
#9 by NS
То есть в моем случае, когда прибавки идут по 50 пунктов ЭЛО - особо мощное тестирование не нужно. А у Игоря, когда сила программы очень высока, и прибавки идут всего по 10 пунктов - уже нужно достаточно мощное тестирование.
#10 by Wasya
Так объясни подробно, что конкретно делать? Какие требования к тестерам и их железным коням? Сроки, минимальный объем?
#11 by NS
К коням наверно сосбых требований нет. Тесты нужны вот такого вида - Как только Игорь появится на форуме - он подробней сам всё распишет.
#12 by Композитор
Я буду тестировать шашечную програму. С детства помню как тремя дамками завалить две.
#13 by NS
Ему важнее сейчас шахматная :) Шашечная и так сильнейшая в мире :) // Скачать его шашечные программы можно тут // По поводу тестирования. Сейчас соберем все тестовые движки, напишем инструкцию - и можно будет начинать.
#14 by NS
Вот тут можно скачать версию в Бразильские шашки (игра на 64 клеточной доске по правилам международных, Стоклеточных шашек)
#15 by Композитор
а как все это устанавливать-то?
#16 by NS
Качаешь, распаковываешь, читаешь инструкцию и запускаешь :)
#17 by Композитор
Это выше моего понимания...
#18 by Igor Korshunov
С шашечной программой не сложно разобраться, если знаешь английский. Если нет, то это проблема. Постараюсь объяснить что мне нужно. Есть движок, играющий очень прилично. Хочется сделать его еще сильнее. Проблема в том, что любое изменение алгоритма, каким бы хорошим не выглядело, может ослабить. Чтобы отлавливать это, нужно очень много тестовых игр, желательно не меньше тысячи, а лучше несколько тысяч. Мне одному уже становится довольно затруднительно проводить полноценное тестирование. Хотелось бы найти добрых людей, которые могут предоставить машинное время. Хотя бы часов 40 в неделю. И желательно чтобы сотрудничество продолжалось хотя бы несколько месяцев. В данном случае меня интересуют только результаты партий. Ошибки в партиях выискивать не надо, т.к. это может сделать только квалифицированный шахматист. А часто еще бывает так, что хорошо для шахматиста-человека портит игру программе. Так что любые очевидно улучшающие игру советы должны проходить проверку парочкой тысяч партий :) Если есть люди, которым больше интересно тестировать шашечную программу, то тоже буду рад. Но там тестовые партии разные версии будут играть исключительно между собой. Т.к. пока нет программ такого же уровня с поддержкой открытого протокола. Кто готов помочь пишите на мыло. Его можно узнать на сайте:
#19 by NS
Качаешь Распаковываешь, из папки KallistoGUI запускаешь KallistoGUI.exe Выбираешь пункт меню Game/Engines... И выбираешь нужные движки (Сильнейший Kallisto_2) Потом выбираешь пункт меню Options/Time control... Ставишь движку нужное время на партию (в минутах), и бонус на ход (в секундах) Теперь пункт меню Game/New game... И играешь партию.
#20 by NS
Чтоб ветка не закрылась, подниму её наверх. Пока тестирование не начать - подбирается тестовая группа соперников, и решается вопрос с оболочкой, под которую будет происходить тестирование.
#21 by Стрелок
блин.... бои между программами надоели... ему я так понимаю главное чтобы его программа против людей нормально играла....
#22 by NS
Это одно и тоже. Программа которая играет сильнее против других программ - будет играть сильнее и против человека... (не считая специфических методов перекоса оценки, чтоб поднять результат именно против человека) Во всем мире сила (рейтинги) программ считаются именно в матчах и турнирах с другими программами.
#23 by Стрелок
напоминает тупые американские фильмы про войны роботов..... ;)))))) я лучше с кем нибудь в живые шахматы поиграю..... люблю ловить тестя на одном и том же приёме.....
#24 by NS
Иначе не оценить силу программы, и не сравнить разницу в силе двух версий. Единственный способ...
#25 by LarsVVS
А Анечка заброшена?
#26 by NS
Нет, я надеюсь что всё-таки в январе состоится очный чемпионат среди шашечных программ, и готовлюсь к нему. После Чемпионата уже возмусь за Анечку. По предварительным прикидкам в достаточно быстрые сроки смогу прибавить 150-200 пунктов Эло к силе (на оценке и на переписывании критичных по скорости процедур - на данный момент при существующей оценке скорость перебора можно увеличить раза в три, что само по себе может дать прибавку до 100 пунктов ЭЛО) Если всё получится, то версия 0.09 уже сможет побороться по силе за второе место в России. Вот текущие рейтинги с длинным контролем (пока не слишком достоверные) Ближайшая цель - побороться с Ufim-ом за второе место в России.
Тэги: Математика и алгоритмы
Ответить:
Комментарии доступны только авторизированным пользователям

В этой группе 1С