使用linq </t>从List <t>中删除连续重复项

时间:2013-08-01 07:40:31

标签: c# linq

我正在寻找一种方法来防止重复列表中的项目,但仍保留订单。 例如

1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4 

应该成为

1, 2, 3, 4, 1, 2, 3, 4

我使用for循环非常优雅地完成了它,检查下一项如下

    public static List<T> RemoveSequencialRepeats<T>(List<T> input) 
    {
        var result = new List<T>();

        for (int index = 0; index < input.Count; index++)
        {
            if (index == input.Count - 1)
            {
                result.Add(input[index]);
            }
            else if (!input[index].Equals(input[index + 1]))
            {
                result.Add(input[index]);
            }
        }

        return result;
    }

有没有更优雅的方法来实现这一点,最好使用LINQ?

9 个答案:

答案 0 :(得分:10)

您可以创建扩展方法:

public static IEnumerable<T> RemoveSequentialRepeats<T>(
      this IEnumerable<T> source)
{
    using (var iterator = source.GetEnumerator())
    {
        var comparer = EqualityComparer<T>.Default;

        if (!iterator.MoveNext())
            yield break;

        var current = iterator.Current;
        yield return current;

        while (iterator.MoveNext())
        {
            if (comparer.Equals(iterator.Current, current))
                continue;

            current = iterator.Current;
            yield return current;
        }
    }        
}

用法:

var result = items.RemoveSequentialRepeats().ToList();

答案 1 :(得分:5)

您还可以使用纯LINQ

List<int> list = new List<int>{1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4};
var result = list.Where((x, i) => i == 0 || x != list[i - 1]);

答案 2 :(得分:4)

你可以写简单的LINQ:

var l = new int[] { 1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4 };
var k = new Nullable<int>();
var nl = l.Where(x => { var res = x != k; k = x; return res; }).ToArray();

int[8] { 1, 2, 3, 4, 1, 2, 3, 4 }

或pythonic(好吧,我最好的尝试)方式:

l.Zip(l.Skip(1), (x, y) => new[] { x, y })
   .Where(z => z[0] != z[1]).Select(a => a[0])
   .Concat(new[] { l[l.Length - 1] }).ToArray()

int[8] { 1, 2, 3, 4, 1, 2, 3, 4 }

最简单的一个(编辑:还没有看到它已经由King King建议)

l.Where((x, i) => i == l.Length - 1 || x != l[i + 1]).ToArray()
int[8] { 1, 2, 3, 4, 1, 2, 3, 4 }

答案 3 :(得分:3)

如果你想要LINQ语句不依赖于调用中结果的捕获值,你需要一些带有聚合的构造,因为它是唯一带有值和操作的方法。即基于Zaheer Ahmed的代码:

array.Aggregate(new List<string>(), 
     (items, element) => 
     {
        if (items.Count == 0 || items.Last() != element)
        {
            items.Add(element);
        }
        return items;
     });

或者您甚至可以尝试在没有if的情况下构建列表:

 array.Aggregate(Enumerable.Empty<string>(), 
    (items, element) => items.Concat(
       Enumerable.Repeat(element, 
           items.Count() == 0 || items.Last() != element ? 1:0 ))
    );

注意使用Aggregate获得上述样本的合理性能,您还需要携带最后一个值(Last必须在每个步骤上迭代整个序列),但是带有3个值的代码{ {IsEmpty, LastValue, Sequence} Tuple看起来非常奇怪。这些样品仅供娱乐之用。

另一个选择是Zip数组本身移位1并返回不相等的元素...

更实用的选择是构建过滤值的迭代器:

IEnumerable<string> NonRepeated(IEnumerable<string> values)
{
    string last = null;
    bool lastSet = false;

    foreach(var element in values)
    {
       if (!lastSet || last != element)
       {
          yield return element;
       }
       last = element;
       lastSet = true;
    }
 }

答案 4 :(得分:3)

如果你真的很讨厌这个世界,纯粹的LINQ:

var nmbs = new int[] { 1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4, 5 };
var res = nmbs
              .Take(1)
              .Concat(
                      nmbs.Skip(1)
                          .Zip(nmbs, (p, q) => new { prev = q, curr = p })
                          .Where(p => p.prev != p.curr)
                          .Select(p => p.curr));

但请注意,您需要(至少部分地)枚举可枚举的3次(TakeZip的“左”部分,Zip的第一个参数)。 此方法比构建yield方法或直接执行慢。

说明:

  • 您取第一个数字(.Take(1)
  • 您从第二个(.Skip(1))获取所有数字,并将其与所有数字(.Zip(nmbs)配对。我们会将curr来自第一个“集合”的数字和prev来自第二个“集合”((p, q) => new { prev = q, curr = p }))的数字称为.Where(p => p.prev != p.curr)。然后,您只使用与上一个数字(curr)不同的数字,然后从中获取prev值并丢弃.Select(p => p.curr)值(.Concat(
  • 您将这两个集合({{1}})
  • 联合起来

答案 5 :(得分:2)

检查新列表和当前项目的最后一个是否相同然后添加到新列表:

List<string> results = new List<string>();
results.Add(array.First());
foreach (var element in array)
{
    if(results[results.Length - 1] != element)
        results.Add(element);
}

或使用LINQ:

List<int> arr=new List<int>(){1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4 };
List<int> result = new List<int>() { arr.First() };
arr.Select(x =>
               {
                if (result[result.Length - 1] != x) result.Add(x);
                    return x;
               }).ToList();

对null对象进行适当的验证。

答案 6 :(得分:1)

试试这个:

class Program
{
    static void Main(string[] args)
    {
        var input = "1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4 ";
        var list = input.Split(',').Select(i => i.Trim());

        var result = list
            .Select((s, i) => 
                (s != list.Skip(i + 1).FirstOrDefault()) ? s : null)
            .Where(s => s != null)
            .ToList();
    }
}

答案 7 :(得分:1)

这里是您需要的代码:

public static List<int> RemoveSequencialRepeats(List<int> input)
{
     var result = new List<int>();

     result.Add(input.First());
     result.AddRange(input.Where(p_element => result.Last() != p_element);
     return result;
 }

LINQ魔术是:

 result.Add(input.First());
 result.AddRange(input.Where(p_element => result.Last() != p_element);

或者你可以像这样创建扩展方法:

public static class Program
{

    static void Main(string[] args)
    {       
        List<int> numList=new List<int>(){1,2,2,2,4,5,3,2};

        numList = numList.RemoveSequentialRepeats();
    }

    public static List<T> RemoveSequentialRepeats<T>(this List<T> p_input)
    {
        var result = new List<T> { p_input.First() };

        result.AddRange(p_input.Where(p_element => !result.Last().Equals(p_element)));

        return result;
    }
}

答案 8 :(得分:0)

如果您想引用F#项目,可以编写

let rec dedupe = function
  | x::y::rest when x = y -> x::dedupe rest
  | x::rest -> x::dedupe rest
  | _ -> []