C#Linq .ToDictionary()密钥已经存在

时间:2012-05-16 20:05:00

标签: c# regex linq dictionary ini

最终编辑:我能够找到ini文件中的重复字段。感谢大家的帮助!

我正在使用正则表达式来解析ini文件,使用LINQ将其存储在Dictionary中:

  

样本数据:
  [WindowSettings]
  窗口X Pos ='0'
  窗口Y Pos ='0'
  Window Maximized ='false'
  窗口名称='Jabberwocky'
  
  [记录]
  目录='C:\ Rosetta Stone \ Logs'

编辑:以下是实际导致问题的文件:http://pastebin.com/mQSrkrcP

EDIT2:我把它缩小到由文件的最后一部分引起:[list_first_nonprintable]

由于某种原因,我正在解析的一个文件是抛出此异常:

  

System.ArgumentException:已添加具有相同键的项目。

有没有办法让我找出导致问题的键(这样我可以修复文件),或者只是跳过导致这个问题的键并继续解析?

以下是代码:

try
{
    // Read content of ini file.
    string data = System.IO.File.ReadAllText(project);

    // Create regular expression to parse ini file.
    string pattern = @"^((?:\[)(?<Section>[^\]]*)(?:\])(?:[\r\n]{0,}|\Z))((?!\[)(?<Key>[^=]*?)(?:=)(?<Value>[^\r\n]*)(?:[\r\n]{0,4}))*";
    //pattern = @"
    //^                           # Beginning of the line
    //((?:\[)                     # Section Start
    //     (?<Section>[^\]]*)     # Actual Section text into Section Group
    // (?:\])                     # Section End then EOL/EOB
    // (?:[\r\n]{0,}|\Z))         # Match but don't capture the CRLF or EOB
    // (                          # Begin capture groups (Key Value Pairs)
    //  (?!\[)                    # Stop capture groups if a [ is found; new section
    //  (?<Key>[^=]*?)            # Any text before the =, matched few as possible
    //  (?:=)                     # Get the = now
    //  (?<Value>[^\r\n]*)        # Get everything that is not an Line Changes
    //  (?:[\r\n]{0,4})           # MBDC \r\n
    //  )*                        # End Capture groups";

    // Parse each file into a Dictionary.
    Dictionary<string, Dictionary<string, string>> iniFile
                    = (from Match m in Regex.Matches(data, pattern, RegexOptions.IgnorePatternWhitespace | RegexOptions.Multiline)
                       select new
                       {
                           Section = m.Groups["Section"].Value,

                           kvps = (from cpKey in m.Groups["Key"].Captures.Cast<Capture>().Select((a, i) => new { a.Value, i })
                                   join cpValue in m.Groups["Value"].Captures.Cast<Capture>().Select((b, i) => new { b.Value, i }) on cpKey.i equals cpValue.i
                                   select new KeyValuePair<string, string>(cpKey.Value, cpValue.Value)).ToDictionary(kvp => kvp.Key, kvp => kvp.Value)

                       }).ToDictionary(itm => itm.Section, itm => itm.kvps);

    return iniFile;
}
catch (ArgumentException ex)
{
    System.Diagnostics.Debug.Write(ex.ToString());
    return new Dictionary<string, Dictionary<string, string>>();
}

提前致谢。

3 个答案:

答案 0 :(得分:10)

这只是意味着当您转换为词典时 -

.ToDictionary(itm => itm.Section, itm => itm.kvps);

- 有多个键(itm.Section)。您可以使用ToLookup,这有点像字典,但允许多个键。

修改

有几种方法可以调用 ToLookup 。最简单的是指定键选择器:

var lookup = 
   // ...
.ToLookup(itm => itm.Section);

这应该提供一个查找,其中键的类型为。获取查找值应返回IEnumerable,其中T是匿名类型:

Group g = null;
// TODO get group
var lookupvalues = lookup[g];

如果.NET编译器不喜欢这样(有时它似乎很难弄清楚各种类型应该是什么),你也可以指定一个元素选择器,例如:

ILookup<string, KeyValuePair<string,string>> lookup = 
    // ...
.ToLookup(
    itm => itm.Section.Value,    // key selector
    itm => itm.kvps              // element selector
);

答案 1 :(得分:4)

您可以编写自己的ToDictionary方法,该方法不会轻易破坏重复键。

public static Dictionary<K,V> ToDictionary<TSource, K, V>(
    this IEnumerable<TSource> source, 
    Func<TSource, K> keySelector, 
    Funct<TSource, V> valueSelector)
{
  //TODO validate inputs for null arguments.

  Dictionary<K,V> output = new Dictionary<K,V>();
  foreach(TSource item in source)
  {
    //overwrites previous values
    output[keySelector(item)] = valueSelector(item); 

    //ignores future duplicates, comment above and 
    //uncomment below to change behavior
    //K key = keySelector(item);
    //if(!output.ContainsKey(key))
    //{
      //output.Add(key, valueSelector(item));
    //}
  }

  return output;
}

我假设你可以弄清楚如何实现额外的重载(没有值选择器)。

答案 2 :(得分:0)

您可以使用Tuple传递多个密钥。检查下面的示例代码:

.ToDictionary(k => new Tuple<string,string>(k.key1,k.key2), v => v.value)