Удалить длинные повторы

smartwisard · 03.10.2021

Регуляркой нужно убирать aaaaaaaaaaaaaaaa, затем удалять в списке ссылок дубли.

Могу сделать.
Мне для этого нужен список из ~10 настоящих ссылок.
По одной буковке убери, чтобы ссылки никуда не вели, но дай настоящие ссылки.

smartwisard · 03.10.2021

Как я вижу, чтобы искать дубли, поначалу определять длину ссылку придётся.
Вот так я определяю длину переменной content, кладу в переменную length
return project.Variables["content"].Value.Length;

smartwisard · 03.10.2021

Ну вот шаблончик это делает. Сделан без кода, но работу выполнит.
Для доменов не только com надо во второй части заменить Regex.

Alexmd · 04.10.2021

C#:

List<string> list = new List<string>(){//список с тестовыми данными
    "https://facebook.com/ssssss",
    "https://www.facebook.com/ssss",
    "http://tik-tok.com/dfjs",
    "http://mail.ru/sdflsdfjsdvlj",
    "http://mail.ru/sdlksldfc"
};
list.OrderByDescending(x=>x.Replace(string.Join("/", x.Split('/').Range("0-2")),"").Length)
    .GroupBy(x=>x.Split('/')[2].Replace("www.",""), x=>x)
    .Where(x=>x.Count() > 1)
    .ToList()
    .ForEach(x=>list.Remove(x.First()));
return string.Join("\n", list);//смотрим, что осталось в списке

Sergodjan · 04.10.2021

@Alexmd если такой массив подставить:

C#:

List<string> list = new List<string>(){//список с тестовыми данными
    "https://facebook.com/ssssss",
    "https://www.facebook.com/ssss",
    "https://www.facebook.com/ssssxxxx",
    "http://www.facebook.com/ssssxxxxzzzz",
    "https://www.facebook.com/ssssxxxxzzzzssdfgfg",
    "http://tik-tok.com/dfjs",
    "http://mail.ru/sdflsdfjsdvlj",
    "http://mail.ru/sdlksldfc",
    "https://mail.ru/sdlksldfcerertr"
};

То выдаст такой результат:

Alexmd · 04.10.2021

Совершенно верно, соответственно задаче. Не так ли? Я что-то не понимаю? Сниппет должен удалить ссылку с самым длинным хвостом.

Sergodjan · 04.10.2021

Alexmd сказал(а):
Совершенно верно, соответственно задаче. Не так ли? Я что-то не понимаю? Сниппет должен удалить ссылку с самым длинным хвостом.

Да, точно. я не проснулся еще. :-)

Alexmd · 04.10.2021

sergodjan66 сказал(а):
Да, точно. я не проснулся еще.

Я тоже сперва собрал сниппет, который будет чистить от этих длиннющих ссылок, а потом перед публикацией перечитал и переделал)))
Разминка для извилин с утра-пораньше)

Sergodjan · 04.10.2021

@Alexmd Я так понял, что из всех ссылок должна остаться самая короткая, в одном экземпляре.
То есть должны остаться:

C#:

https://facebook.com/ssssss (или https://www.facebook.com/ssss если без учета www)
http://tik-tok.com/dfjs
http://mail.ru/sdlksldfc

Alexmd · 04.10.2021

@sergodjan66

dihard сказал(а):
Надо найти повторяющиеся домены , в данном случае 2х facebook. И удалить самый длинный из них

Формулировка вопросов у некоторых пользователей хромает, но я всегда стараюсь разобраться в написанном, нежели додумывать свое.

https://zennolab.com/discussion/threads/aktualno-vsegda.96467/

Пожалуйста.

smartwisard · 04.10.2021

А я так понял, что должны оставаться ссылки без повторов.
У меня шаблон на кубиках из двух одинаковых ссылок удаляет более длинные.

Надо взять мой шаблон и перевести в код, если он выполняет правильную задачу.

Alexmd · 05.10.2021

dihard сказал(а):
Спасибо за решение, а как сделать, чтобы он не учитывал http или https , или сайт с www или без.

По-моему, у меня именно так и сделано. Не важно, какой протокол и не важно с www или без, но протокол должен быть обязательно, так как все завязано на рассплитовке по слэшам.

dihard сказал(а):
Тоесть должен остаться один самый короткий домен facebook или один домен mail.ru

А это как раз уже другое условие, которое противоречит изначальному

dihard сказал(а):
Логика такая - поиск на дубли домена и сравнить на длину. Саму длинную - удалить

Если надо наоборот, то надо и вопрос задавать по-другому. Оставить самую короткую ссылку для каждого домена.

C#:

List<string> list = new List<string>(){//список с тестовыми данными
    "https://facebook.com/ssssss",
    "https://www.facebook.com/ssss",
    "https://www.facebook.com/ssssxxxx",
    "http://www.facebook.com/ssssxxxxzzzz",
    "https://www.facebook.com/ssssxxxxzzzzssdfgfg",
    "http://tik-tok.com/dfjs",
    "http://mail.ru/sdflsdfjsdvlj",
    "http://mail.ru/sdlksldfc",
    "https://mail.ru/sdlksldfcerertr"
};
List<string> list1 = new List<string>();
list.OrderBy(x=>x.Replace(string.Join("/", x.Split('/').Range("0-2")),"").Length)
    .GroupBy(x=>x.Split('/')[2].Replace("www.",""), x=>x)
    .ToList()
    .ForEach(x=>list1.Add(x.First()));
list.Clear();
list.AddRange(list1);
return string.Join("\n", list);//смотрим, что осталось в списке

Ну и если возникнут трудности при подключении к живому списку проекта, то вот сразу готовый для вставки сниппет. Только имя укажите своего списка.

C#:

var list = project.Lists["Список 1"];
List<string> list1 = new List<string>();
list.OrderBy(x=>x.Replace(string.Join("/", x.Split('/').Range("0-2")),"").Length)
    .GroupBy(x=>x.Split('/')[2].Replace("www.",""), x=>x)
    .ToList()
    .ForEach(x=>list1.Add(x.First()));
list.Clear();
list.AddRange(list1);

Поиск

Удалить длинные повторы

dihard

Client

smartwisard

Client

dihard

Client

smartwisard

Client

smartwisard

Client

Вложения

dihard

Client

Alexmd

Client

Sergodjan

Administrator

Alexmd

Client

Sergodjan

Administrator

Alexmd

Client

Sergodjan

Administrator

Alexmd

Client

smartwisard

Client

dihard

Client

dihard

Client

Alexmd

Client

dihard

Client

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)