如何从文件中提取数据

时间:2011-01-18 18:49:01

标签: xml

嘿大家,我有一个包含如下信息的文件。我想从记录中提取数字。如果可能,有人会给我一个awk或sed oneliner吗?也许放到文件中?这真的会帮助我。我在ubuntu上,所以我有linux实用程序。

非常感谢。

<product_id>101747</product_id>
<product_id>2847549</product_id>
<product_id>149833</product_id>
<product_id>123380</product_id>
<product_id>66334</product_id>
<product_id>66475</product_id>
<product_id>123387</product_id>
<product_id>6266040</product_id>
<product_id>3480755</product_id>
<product_id>6529572</product_id>
<product_id>22852</product_id>

1 个答案:

答案 0 :(得分:2)

Python oneliner:

python -c "import re;print('\n'.join(re.findall('([0-9]+)',open('infile.txt').read())))" > outfile.txt

更改infile.txt和outfile.txt。

示例输出:

101747
2847549
149833
123380
66334
66475
123387
6266040
3480755
6529572
22852