下载后卷曲utf-8特殊字符

时间:2017-01-02 20:42:03

标签: curl utf-8

当我使用this link的curl查找当前的艺术家和标题时:

curl -H 'Cache-Control: no-cache' -t utf-8 \
    -s http://www.radiopilatus.ch/livecenter?action=webradio \
   | grep "Jetzt Läuft" -A3 | tail -n 1

输出既是艺术家又是标题 - 例如:

STEFANIE HEINZMANN在DIGT'的DIGGIN

它应该只是标题 - 例如:

DIGGIN' IN THE DIRT

如何归还标题(没有艺术家)?

编辑:

是的,这是正确的,<br>不是我的问题。 我没有看到这里是自动改变:

enter image description here

- 如何改变输出?

1 个答案:

答案 0 :(得分:1)

grep的调用/管道似乎找到包含艺术家和标题的行,并在两者之间带有中断标记(即<br>)。

enter image description here

为了仅显示标题,您可能需要使用字符串函数(例如sed)来删除break标记之前的内容。

curl -H 'Cache-Control: no-cache' -t utf-8 -s http://www.radiopilatus.ch/livecenter?action=webradio | grep "Jetzt Läuft" -A3 | tail -n 1 |sed -e 's/.*<br>//'

您可以在Teh (PHP) Playground上看到这一点。