Question

我有一个简单的HTML文件，只包含一个没有CSS或任何其他属性的表。该文件的结构永远不会改变，但其内容总是不同的。

我尝试匹配特定单元格（td）的内容，这将给出名称 首次出现的联系，其中类型'杂项'即可。

在我的例子中，我尝试匹配“Michael Jackson”这个名字：

这是我到目前为止所得到的：

(<td>\s*Contact:\s*<\/td>((?!<br>).)*<td>\s*Misc\s*<\/td>)

但这只选择包含“Misc”类型的两个接触块。我不知道如何从这一点开始......

这里再次是我的正则表达式和我正在使用的HTML字符串：

感谢您提供任何帮助或建议！