Найти все двойники в справочнике Номенклатура #792970


#0 by ac13
УТ 10.3. В справочнике номенклатуры куча задвоенных товаров. Названия могут быть не идентичны. Например Велосипед STELS Navigator 600 V 26 Велосипед  Navigator 600V 26 Stels Какие у кого есть идеи, как найти такие товары?
#0 by ac13
УТ 10.3. В справочнике номенклатуры куча задвоенных товаров. Названия могут быть не идентичны. Например Велосипед STELS Navigator 600 V 26 Велосипед  Navigator 600V 26 Stels Какие у кого есть идеи, как найти такие товары?
#1 by Одинесю
Ручками.
#2 by Fish
"Названия могут быть не идентичны" - тогда только глазами.
#3 by МимохожийОднако
В конфигурации есть штатная обработка по поиску дублей в справочниках
#4 by ac13
Неужели больше никак? Там около 40000 наименований
#5 by Jonny_Khomich
"Названия могут быть не идентичны. Например Велосипед STELS Navigator 600 V 26 Велосипед  Navigator 600V 26 Stels" вряд ли такое она найдёт.
#6 by 1dvd
есть ещё вариант. Написать ИИ
#7 by Jonny_Khomich
я полагаю, что надо наименование разбить на слова и уже слова сравнивать. Если есть схожесть 90% слов, то это одна и та же номенклатура.
#8 by k1noshkin
В обработке "ПоискИЗаменаДублирующихсяЭлементов" есть ползунок "Настройка уровня сходства слов", можно с ним поэкспериментировать.
#9 by Одинесю
Это извечная проблема, для аптек вообще крутяк.
#10 by shuhard
можно нанять программиста (с)
#11 by ac13
А может быть еще такое: Ноутбук HP (английские буквы "h" и "p") Ноутбук НР (НР - русские буквы "н" и "р") И даже Ноутбук НP, где h английская, а р - русская
#12 by Fish
А сам как думаешь? Твой пример ещё куда ни шло (там все буквы совпадают). Но если будет такой: "Велосипед STELS Navigator 600 V 26 Велосипед  Navigator 600V 26 СТЕЛС"  или вообще "СТЭЛС" - то никакой ИИ не поможет :))
#13 by disk-2008
Это можно сначала своей обработкой сделать замену.
#14 by RomanYS
в примере совпадение только 80% и это без учета и прочего
#15 by Fish
Посадить за справочник пару-тройку бабороботов, пусть разгребают. Всяко быстрее будет, чем ИИ написать.
#16 by ac13
серьезно? всегда самый лучший ответ
#17 by ac13
а может правда программиста нанять? и он сделает, а то тут все непрограммисты никто не знает как
#18 by Злопчинский
Нечёткое сравнение строк разиуливает это с высокой эффективностьюЯ таких поисков дублей и загрузок новых прайсов по написал столько, что уже тошнит.
#19 by Jonny_Khomich
а тут форумчане-тролли.
#20 by МимохожийОднако
Универсальные таблетки я только в армии у прапорщика видел.
#21 by elCust
Программист тут не поможет. Тут много тупой однообразной работы. Тут нужен грамотный управленец, способный правильно организовать людей.
#22 by ac13
это в ответ на
#23 by ac13
ок
#24 by Злопчинский
Без оператора не обойтись , но его работа буде очень сильно облегчена. Два человека за два дня с таким инструментом выявят все дубли
#25 by Я_в_каске
срезать остатки на начало года и удалить нах.. все лишнюю наменклатуру.
#26 by Lama12
В приведенных примерах не дубли. Если их так заводили, значит так нужно. И как программа узнает что является дублем, а что нет? Кроме как разбора вручную, ничего не сделаешь. Можно немного оператору упростить жизнь сгруппированы похожие, но это все равно не автоматически. И да. Оператор должен знать весь товар.
#27 by elCust
Может проще сразу все удалить и начать поновой?
#28 by Lama12
Тогда уж инвентаризацию сначала сделать, а то скорее всего в остатках такой же бардак как в номенклатуре.
#29 by 1dvd
хорошо облегчит задачу структурирование номенклатуры. Если всё распихать по правильным папкам
#30 by assasu
есть готовая обработка. ищет "похожие" строки. твои две карточки найдет точно. есть один нюанс - работает медленно.
#31 by povar
+
#32 by ac13
+++
#33 by МимохожийОднако
Можно попытаться нормализовать наименование перед поиском дублей. Разделить на слова, отсортировать внутри списка по этим словам и сформировать некий индексированный реквизит.
#34 by МимохожийОднако
Можно товар, который не имеет остаток переименовать нахрен. Это также уменьшит список
#35 by Timon1405
>> Разделить на слова В примере ТС      600 V - два слова, а в другой строке 600V - одно слово
#36 by Aleksey
Масло Лукойл Люкс 10w40 1л Масло Лукойл Люкс 10w40 4л Схожесть более 95% - Это одно и тоже Ароматизатор на веревочки банан оран. Ароматизатор на веревочки банан крас. Схожеть явно более 90% Можно свернуть? Красовки мужские разм. 42 Красовки мужские разм. 35
#37 by ac13
в общем я понял, что надо сначала найти все схожие, а дальше только глазами смотреть
#38 by ac13
Спасибо всем!)
#39 by RomanYS
Заблокировать всю номенклатуру (выделить префиксом) и назначить ответственных на разблокирование и ввод новых.
#40 by Fish
Ну и наплодят они ещё больше дублей таким образом :))
#41 by RomanYS
при правильной мотивации не наплодят) По-другому вообще никто ничего делать не будут, только плакаться и проклинать "программиста" ).
#42 by Fedor-1971
можешь вычислить типа "веса строки", например, сумма всех кодов символов (можешь и более хитрый алгоритм применить типа среднеквадратичного отклонения), а дальше собираешь в группы всё что близко, например, 70%. Показываешь оператору и оный принимает решение что есть дубль, а что нет
#43 by Fedor-1971
42+ идея именно в получении некой цифры, а дальше, хочешь кластерный анализ, хочешь просто статистические методы
#44 by Bigbro
неправильно ты понял. начинать надо с причины - почему появилось столько дублей. если не решить настоящую проблему то даже после того как разгребешь бардак он появится снова. надо выявить откуда появляются новые элементы, организовать процесс таким образом чтобы исключить дубли, назначить ответственного. а дальше уже устранять бардак в полуавтоматическом режиме. обработок которые ищут похожие наименования море, а дальше ответственный определяет какие дубли а какие реально разная номенклатура.
#45 by Aleksey
Потому что у каждого поставщика своя номенклатура.
#46 by Одинесю
Необходим общероссийский справочник номенклатуры!
#47 by Лефмихалыч
то, что уже есть в справочнике - ручками. Причем, продуктивнее (хотя и дороже), если ручки будут из программиста расти, при этом предметного специалиста рядом посадить на короткий поводок, чтобы быстро консультации давал, что одно и то же, а что - нет. Дальше - забрать у кого попало права, чтобы новые элементы создавали только хорошие, правильно заряженные позитивом сотрудники, которые понимаю, что и как и зачем надо делать, чтобы дублей не было. У правильно заряженных сотрудников должна быть ответственность за эту деятельность.
#48 by ac13
в этой теме как раз-таки и есть следующий этап после описанных тобой. кто, когда и почему создавал дубли выявлено и меры предприняты. теперь надо найти дубли, которые есть
#49 by Bigbro
для этого еще 15 лет назад в 77 существовали прайсы поставщиков. примерно в те времена мы и решали схожую проблему с наведением порядка в 45к контрагентов и 80к материалов. ничего, навели, система работала как часы.
#50 by ac13
это уже сделано)
#51 by Bigbro
тогда пишите обработки или ищите которые будут выводить кладовщику похожие названия с возможностью ему в один клик решить одно это или разное. автоматические замены - чреваты. МОЛы потом накатят на вас такую телегу когда вы им остатки перекосите...
#52 by Лефмихалыч
сделано то, на сколько я понимаю, что у меня описано в "далее". Теперь делай то, что перед этим написано. Бери, то есть, notepad++, эксель, молоток, зубило и того, кто за номенклатуру отвечает и - вперёд на баррикады. За день, я думаю, управитесь.
#53 by catena
Заходите на какой-нибудь ресурс с обработками. Ищете "нечеткий поиск по наименованию". Находится миллион алгоритмов, от простейших, реализуемых средствами 1С, до готовых библиотек.
#54 by Aleksey
Ты не понял о чём я. Я не говорю что каждый раз заводят позиции. Я пока что просто о разных прайсах. Пришел новый поставщик со своим наименованием, девочка тупо завела новую позицию. И тут твой прайс поставщика никак не поможет
#55 by Лефмихалыч
у тупой девочки не должно быть прав на это. Права надо давать только умным девочкам. Ну, или - не удивляться потом
#56 by Aleksey
Ну у меняпозиции заводит сам менеджер, но когда приходит старый товар от другого поставщика ему лень искать старую позицию и он тупо заводит новую
#57 by inkvizitr
есть обработка как под обычные формы так и под управляемые где можно регулировать чувствительность поиска и под различные реквизиты, куда тебе их скинуть?
#58 by lubitelxml
вот же он и пока бесплатен )
#59 by Serg_1960
"Какие у кого есть идеи, как найти такие товары?" - неявный поиск с StrMatch.dll
#60 by PR
Чукча не читатель
#61 by PR
Сначала разделить все на гарантированно непересекающиеся группы типа "Велосипеды", "Телевизоры", "Штанги", а уже потом только руками, потому что может быть и и и и и еще куча всякой хрени
#62 by Serg_1960
Не, не читатель. Это я так проголосовал за "Если хочешь что-то сделать хорошо - сделай это сам!"(цы) :)
#63 by polOwnik
"Тупой девочке" предъявили сертификат товара, откуда она ввела его наименование в справочник. Ее то в чем вина? А то, что в справочнике куча подобных позиций.... А инвентаризацию как проводить по справочнику или по документам?
#64 by Serg_1960
(уже уходя) Поддержу а насчет тупых и умных девочек. Если проанализировать "источники" формирования новых позиций номенклатуры, то всегда их можно ограничить до разумного числа. Например: менеджер, заведующая складом, конструктор, технолог. Если неприемлемо ограничение по каким либо причинам, то дарю идею: Сформировать триумвират ответственных по номенклатуре и рег.заданием им сообщать обо всех новых наименованиях - пусть оперативно контролируют и решают вопрос с наименованием (да и нужна ли новая позиция номенклатуры как таковая).
#65 by Fedor-1971
инвентаризацию проводить по складским карточкам учёта. Для предотвращения "Предъявили - ввела" - садится человек, который точно знает что и где находится (в смысле в утверждённой структуре - велосипеды с велосипедами, бумага с бумагой и т.д.) по сути ему вменяется в обязанность соотнести новая финтиплюшка - соответствует у нас вот этой записи справочника. Проблему "не знаю чему соответствует" в своё время решал в виде 2-х полей "запись из справочника" и "текст как в накладной" - "тупая девочка" в бивала всё что находила, чего не знала, то просто писала как называется и инженер проставлял "что сие есть" (работало для завода)
#66 by Maniac
у меня есть готовые инструменты могу помочь. но стоит денег. Могу даже видео снять. Но тут главный вопрос - а что дальше?
#67 by polOwnik
Жаль, что вы уходите. Жизнь показала, что для зав.склада главное-принять товар, а как он пропишется в проге-не его дело. Триумверат по номенклатуре не реально. Склад работает круглосуточно.
#68 by HardBall
А приходные накладные из воздуха появились, без счета-фактуры, заказа поставщику и т.п.
#69 by polOwnik
Даже на отпущенные дабл позиции разными накладными? А что в случае возврата будете делать, если дубли в справочнике уже удалены?
#70 by Garykom
Бюджет какой? Можно тестовую выборку для эксперимента?
#71 by Garykom
А дальше простая доработка УТ чтобы "ПередЗаписью" предлагал уже имеющиеся варианты и все...
#72 by Серый Пес
Если орг методами не ликвидировать возможности у "тупых девочек" и "завскладами" снова запомоить номенклатурный справочник, то выполняемая ТС работа будет полностью подобна сизифовой. Т.е. такое нужно решать только сверху, оргметодами, прямыми запретами (как программными, так и административными) на ввод позиций-дублей. И только после этого заниматься разгребанием существующей помойки. Руками.
#73 by polOwnik
Приходная от поставщика обязана быть. А представь, организация должна предоставить мат.помощь по этой накладной кому-то. Какие счет-фактуры? Вообще торговля это не купи-продай, а намного шире.
#74 by Cyberhawk
"как найти такие товары?" // Зачем?
#75 by polOwnik
Смешно, со своими понятиями в чужой огород. Пример хоть приведите "перевоспитания"
#76 by romix
Чтобы списывалось по тому же названию, что и приходуется, нужно оклеивать товары кодами или штрихкодами. Сами дубли (например, когда одну партию назвали так, другую - этак) не играют особой роли, если будет выяснено, что товары в точности одинаковые, то их можно схлопнуть обработкой.
#77 by HardBall
Вот вот. Поэтому добавь еще сопроводительные документы. + сертификаты качества Входной контроль. Слыхал, нет.
#78 by Лефмихалыч
надо забрать у этого лентяя права и продать с аукциона. Лень ему, блеать... Лень дома на диване может быть, а не на работе. вина - ни в чем. Про вину ни кто не говорит.
#79 by Вафель
сейчас модно для таких задач использовать нейронные сети с глубоким обучением
#80 by Злопчинский
Удобная Обработка для сабжа пишется за день на основе стрматч, никаких предварительных делений по группам не надо.У меня такая есть подобная, писал для практически такойже задачи по сведению дублей в базе дисков фильмов, примерно столько же номенклатур
#81 by Garykom
При перестановке слов и разнице между разной номенклатурой тока в циферках этот стрматч идет лесом-полем ))
#82 by Garykom
+ Как минимум лучше метод Nграмм, еще лучше (но сложнее) разделение на параметры-признаки и сравнение по ним - кластеризация/классификация.
#83 by Garykom
вот готовое хз только пашет ли
#84 by polOwnik
Как вы не поймете, если была отгрузка по этим дублям, нельзя их удалять, поскольку возврат может быть на этот дубль. А вот на будущее, да, всех проинструктировать, а непонятливым настучать по одному месту с привлечением руководства.
#85 by Злопчинский
идите лесом самиПерестановка слов отрабатывается на ураОтличие номенклатуры только ф циыерках труднее, но тожеив целом нормально отрабатывается, тем более стрматч позволяет увеличить вес цифрПолностью автомат делать рискованно - да и не видел я полностью таких автоматов - а супермена помогал кв работает на ураПоверь, я этот стрматч не на одно проекте гонял, представляю о чем говорю
#86 by Злопчинский
Я не отрицают что проблемы могут быть и скорее всего будут, но они несмертельные
#87 by polOwnik
Аспирин таблетки Для примера.
#88 by Maniac
артикулы есть в базе? если есть - то ваще легко найти все наименования разные с один артикулом
#89 by Garykom
Третий случай с "аналогом" только кластеризация/классификация - это самый дорогой вариант. Нужны спецы по т.н. DataMining, в принципе ничего особо сложного там нету но знания и опыт нужны.
#90 by Maniac
Если артикулов нет в базе - ЛЕГКО взять какие то ключевые слова из наименований и впихнуть в артикул. Далее сделать запрос по артикулам и покажутся все двойники. Я легко такое обработаю своей загрузкой и дополнительно марафетом номенклатуры. Вот сегодня задача как раз стояла в базе определить артикулы из товара, потому что чел не могу прайсы загружать. Это однотипная задача. Одной обработкой сначала обрабатываем ключевые слова. Далее можем свой справочник выгрузить в эксель - просто сохранить тупо список. Загрузив - сказать обработке - найти всех двойников. По каждой строке отобразятся. Вот как я сегодня красиво задачку обработал по поиску номенклатуры.
#91 by Maniac
Марафет номенклатуры бесплатно можно у меня скачать - там 7 обработок разных по обработке номенклатуры. в том числе с применением алгоритмов
#92 by Maniac
В приципе даже вашу задачу могу дописать легко в марафет сразу. Выкатывается список товаров. раскладываем на ключевые слова - можно применить любые алгоритмы - выдать список двойников. наверное так и сделаю - напишу на днях такую доработку.
#93 by Злопчинский
У тс не те заморочки чтобы датамайнинг прикручивать
#94 by Злопчинский
Резюме: на клюшках эту задачу я решу без особого напряга. Далее 1 человек за неделю 40 к номенклатуры отчекрыжит нормально.Надо будет - пусть автор стучитсяТем более и на ИС есть хорошая обработка для восьмерки на основе стрматч
#95 by polOwnik
К сожалению, программера на складе все хотят скушать, поэтому приходится до всего доходить самому.
#96 by Garykom
Просто не в курсе всех возможностей "добычи данных", сча это уже перешло и переходит далее в разряд обычных вещей. По сути вместо кучи (реально десятки и сотни) обезьянок-операторов берем одного прога и он выдает на гора за смешное время 80-99% решение. Далее нескольким обезьянкам выдается оставшееся 1-20% на ручную обработку и все.
#97 by Maniac
а я сразу) Думаю за полчаса. Сохраню справочник в эксель. Загружу обработокой У меня уже готовая форма по поиску есть, которая разложит все слова и найдет всех двойников с этими же словами в любом порядке. Для точности применю алгоритмы для установки артикулов из ключевых слов которые гарантируют и ускорят еще также поиск. Ну и по каждой строке программа выдаст количество совпадений в базе - это тоже уже есть.
#98 by Злопчинский
маня, давай не забывать как я тебе показывал не структурированный Прайс и какой был результат. А частное решение на стрматч на раз у меня такие прайсы жрало
Тэги: 1С 8
Ответить:
Комментарии доступны только авторизированным пользователям

В этой группе 1С