如何将非结构化文本文件转换为结构化文本?

时间:2017-05-03 07:57:09

标签: java file

我只需要知道如何或一种方法来启动它,如果我使用JAVA,我应该在JAVA中知道哪些模块或api?

我有一个像这样的文本文件

REC_CODE ORDER_ID    CUSTOMER_ID   ORDER_DATE
ORD  1     1 01-01-2001
LIN 1   1    1 1
LIN    1 2 2   3
LIN   1 3  1   2
ORD 2 3    02-01-2001
LIN      2 1 1 1
LIN 2    2 2 3
LIN 2   3 1   2

如果您仔细查看此数据,ORD对应于订单级别详细信息,其中LIN对应于订单的行详细信息,问题是文件未分隔或具有固定宽度,这会因为您看到有单个空格而变化文件中有多个空格。

我想将此转换为分隔类型,你能建议一些方法吗,我可以使用任何工具或语言,但最好是JAVA,请告诉我如何在JAVA中完成,所以我会知道我应该从哪里开始和限制。在此先感谢。

1 个答案:

答案 0 :(得分:0)

您可以使用Java Pattern。使用多个空格分隔符编写正确的模式并解析您的行。 这里有更多关于patterns的信息。 还有一些tutorials