是否有用于解析gettext PO文件的Java库?

时间:2011-01-08 19:33:46

标签: java api scala gettext po

有没有人知道可以让我解析.PO文件的Java库?我只想创建一个ID和值的Map,这样我就可以将它们加载到数据库中。

6 个答案:

答案 0 :(得分:11)

根据Java gettext utilities Manual,您可以使用msgfmt --java2程序将PO文件转换为ResourceBundle类,并使用java.util.ResourceBundle或gnu.gettext.GettextResource读取它 - 我认为它是最有效的办法。 Gettext-commons完全相同,包括调用msgfmt创建中间进程,因为它的位置如下:

  

Gettext Commons是使用的GNU gettext实用程序的Java库。

如果您仍然想要一个完整的Java库,那么我看到的唯一方法就是编写自己的库来解析这种格式,即将msgfmt源代码从C语言重写为Java语言。但我不确定它会比创建进程+运行C程序更快。

答案 1 :(得分:11)

我搜索了互联网,也找不到现有的图书馆。如果你使用Scala,由于它的解析器组合器功能,你自己编写解析器非常容易。

致电PoParser.parsePo("po file content")。结果是Translation

的列表

我已将此代码编入库中(当然,任何JVM语言都可以使用,包括Java!): https://github.com/ngocdaothanh/scaposer

import scala.util.parsing.combinator.JavaTokenParsers

trait Translation

case class SingularTranslation(
  msgctxto: Option[String],
  msgid:    String,
  msgstr:   String) extends Translation

case class PluralTranslation(
  msgctxto:    Option[String],
  msgid:       String,
  msgidPlural: String,
  msgstrNs:    Map[Int, String]) extends Translation

// http://www.gnu.org/software/hello/manual/gettext/PO-Files.html
object PoParser extends JavaTokenParsers {
  // Removes the first and last quote (") character of strings
  // and concats them.
  private def unquoted(quoteds: List[String]): String =
    quoteds.foldLeft("") { (acc, quoted) =>
      acc + quoted.substring(1, quoted.length - 1)
    }

  // Scala regex is single line by default
  private def comment = rep(regex("^#.*".r))

  private def msgctxt = "msgctxt" ~ rep(stringLiteral) ^^ {
    case _ ~ quoteds => unquoted(quoteds)
  }

  private def msgid = "msgid" ~ rep(stringLiteral) ^^ {
    case _ ~ quoteds => unquoted(quoteds)
  }

  private def msgidPlural = "msgid_plural" ~ rep(stringLiteral) ^^ {
    case _ ~ quoteds => unquoted(quoteds)
  }

  private def msgstr = "msgstr" ~ rep(stringLiteral) ^^ {
    case _ ~ quoteds => unquoted(quoteds)
  }

  private def msgstrN = "msgstr[" ~ wholeNumber ~ "]" ~ rep(stringLiteral) ^^ {
    case _ ~ number ~ _ ~ quoteds => (number.toInt, unquoted(quoteds))
  }

  private def singular =
    (opt(comment) ~ opt(msgctxt) ~
     opt(comment) ~ msgid ~
     opt(comment) ~ msgstr ~ opt(comment)) ^^ {
    case _ ~ ctxto ~ _ ~ id ~ _ ~ s ~ _ =>
      SingularTranslation(ctxto, id, s)
  }

  private def plural =
    (opt(comment) ~ opt(msgctxt) ~
     opt(comment) ~ msgid ~
     opt(comment) ~ msgidPlural ~
     opt(comment) ~ rep(msgstrN) ~ opt(comment)) ^^ {
    case _ ~ ctxto ~ _ ~ id ~ _ ~ idp ~ _ ~ tuple2s ~ _ =>
      PluralTranslation(ctxto, id, idp, tuple2s.toMap)
  }

  private def exp = rep(singular | plural)

  def parsePo(po: String): List[Translation] = {
    val parseRet = parseAll(exp, po)
    if (parseRet.successful) parseRet.get else Nil
  }
}

答案 2 :(得分:5)

gettext-commons是我在一段时间做研究时发现的唯一一个。

答案 3 :(得分:2)

tennera project on github包含一个基于ANTLR的GNU Gettext PO / POT解析器。我认为它被Redhat用于基于网络的翻译软件。

答案 4 :(得分:2)

.MO解析器(不是Java,而是Scala),解析为Map:http://scalamagic.blogspot.com/2013/03/simple-gettext-parser.html,来源:http://pastebin.com/csWx5Sbb

答案 5 :(得分:0)

我找到了一些java类来读写po文件:https://launchpad.net/po-parser