阅读与阅读写文件 - Java空格

时间:2013-01-15 09:40:04

标签: java string file-io filewriter replaceall

我想从文件中读取并写入文件。输入文件如下

<ORLANDO>   <0%>
    As I remember, Adam, it was upon this fashion bequeathed me by will but poor a thousand crowns, and, as thou sayest,
<ORLANDO>

"A s   I   r e m e m b e r    A d a m    i t   w a s   u p o n   t h i s   f a s h i o n   b e q u e a t h e d   m e   b y   w i l l   b u t   p o o r   a   t h o u s a n d   c r o w n s    a n d    a s   t h o u   s a y e s t    c h a r g e d   m y   b r o t h e r   o n  ..."

我编写了一个java程序来删除带有标签的行,并用空格替换任何标点符号。但是写出来的每个字母之间都有一个空格,而且在两行之间还有很多空白行。如何删除它们? 。请帮忙。

String line=null;
    try {
        BufferedReader br=new BufferedReader( new FileReader("filename"));
        PrintWriter writer = new PrintWriter(new FileWriter("filename"));
    try {
            while((line=br.readLine())!=null)
            {

                if(!line.contains("<"))
                {
                    line=(line.replaceAll("\\p{Punct}",""));

                    writer.println(line);
                    writer.flush();


                 }
            }
}

2 个答案:

答案 0 :(得分:5)

默认情况下,当您使用PrintWriter打开文件时,它会截断该文件。您可以将其设置为附加,但无论哪种方式,您都无法以这种方式重写正在阅读的文件。

相反,你应该创建一个新文件并写入。完成后,您可以删除原件并重命名副本(如果副本完全相同,则删除副本)

  

但是写出来的每个字母之间都有一个空格,而且在两行之间还有很多空行。

如果你写了UTF-16但是把它读成ASCII或UTF-8就会发生这种情况。避免这种情况的方法是不使用UTF-16,这不是默认值。

try (BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("filename"), StandardCharsets.UTF_8));
     PrintWriter pw = new PrintWriter(new OutputStreamWriter(new FileOutputStream("filename.tmp"), StandardCharsets.UTF_8))) {
    for(String line; (line = br.readLine())!=null;) {
        pw.println(line.replaceAll("<[^>]+>", ""));
    }
}

答案 1 :(得分:0)

您是否使用正确的编码打开书面文件。看起来您编写UTF-8并使用ASCII或任何ISO-8859编码打开它。

相关问题