- Регистрация
- 19.06.2013
- Сообщения
- 734
- Благодарностей
- 249
- Баллы
- 43
Всем привет.
Не могу придумать способ определять "похожесть".
есть списки 10000 штук в каждом списке по 100 значений id(пример 270358475, 280300221, 260302911 и.т.д.)
других привязок нет.
где-то список может отличатся на 1id где-то на 50id где то на 99id
начало списка, может быть прям один в один похоже, 10-15-20 значений к концу списка может сильно начать различаться.
Хочу как-то эти списки разделить на группы. по похожести.
Может кто-то делал уже такое. Заранее благодарю на наводку или решение.
Не могу придумать способ определять "похожесть".
есть списки 10000 штук в каждом списке по 100 значений id(пример 270358475, 280300221, 260302911 и.т.д.)
других привязок нет.
где-то список может отличатся на 1id где-то на 50id где то на 99id
начало списка, может быть прям один в один похоже, 10-15-20 значений к концу списка может сильно начать различаться.
Хочу как-то эти списки разделить на группы. по похожести.
Может кто-то делал уже такое. Заранее благодарю на наводку или решение.