将字符串拆分为HTML实体

时间:2012-06-07 00:08:02

标签: php json hyperlink split

我正在尝试使用PHP来创建一段文本的JSON表示,保留有关链接/格式等的信息。

基本上,我想转换这个字符串:

"Hello <a href='www.google.com'>World!</a>.  How are <b>you</b> today?"

进入这7个JSON对象:

"1": {
    "_id": "1",
    "_type": "TEXT",
    "value": "Hello "
},
"2": {
    "_id": "2",
    "_type": "TEXT",
    "value": "World!",
    "_attributes": {
        "3": {
            "_id": "3",
            "_type": "LINK",
            "src": "www.google.com"
        }
    }
},
"4": {
    "_id": "4",
    "_type": "TEXT",
    "value": " How are "
},
"5": {
    "_id": "5",
    "_type": "TEXT",
    "value": "you",
    "_attributes": {
        "6": {
            "_id": "6",
            "_type": "FORMATTING",
            "bold": true,
        }
    }
},
"7": {
    "_id": "7",
    "_type": "TEXT",
    "value": " today?"
}

我一直在寻找互联网/谷歌并发现了很多关于拆分HTML的内容,但似乎无法描述我想要的内容。我需要将纯文本与链接/格式分开,并为每个创建单个实体。

“FORMATTING”属性只是在适当的位置添加“粗体”/“下划线”/“下标”等字段。

嵌套标签只会为其文本实体创建多个属性。

我还不知道如何处理一个带有一个粗体字的双字超链接...也许它必须有2个超链接属性。

任何帮助很多人赞赏!!

1 个答案:

答案 0 :(得分:0)

DOMDocument就是您所需要的。如果你的名字略有不同,那么你几乎不需要做任何工作。

相关问题