处理Oracle外部表中的UTF-8字符

时间:2011-02-09 12:21:27

标签: utf-8 oracle11g

我有一个从固定长度文件读取的外部表。该文件应包含特殊字符。在我的例子中,包含特殊字符的单词是“Göteborg”。因为“ö”是一个特殊字符,看起来Oracle正在将其视为2个字节。这导致了麻烦。文件中的后续字段移位1个字节,从而弄乱了数据。有没有人遇到过这个问题。到目前为止,我们尝试了以下解决方案:

将NLS_LANG的值更改为AMERICAN_AMERICA.WE8ISO8859P1
尝试将数据库字符集设置为UTF-8
尝试使用ALTER SYSTEM将NLS_LENGTH_SYMMANTIC更改为CHAR而不是BYTE 尝试将外部表字符集更改为:AL32UTF8
尝试将外部表字符集更改为:UTF-8

没有任何作用。 其他细节包括:

  • 文件是UTF-8编码
  • 操作系统:RHEL
  • 数据库:Oracle 11g

我可能遗失的任何其他事情?任何帮助将不胜感激。谢谢!

1 个答案:

答案 0 :(得分:10)

nls_length_semantics仅适用于创建新表。

以下是我为解决这个问题所做的工作。

  records delimited by newline
  CHARACTERSET AL32UTF8
  STRING SIZES ARE IN CHARACTERS 

ALTER SESSION SET nls_length_semantics = CHAR
/
CREATE TABLE TDW_OWNER.SDP_TST_EXT
(
    COST_CENTER_CODE VARCHAR2(10)     NULL,
    COST_CENTER_DESC VARCHAR2(40)     NULL,
    SOURCE_CLIENT    VARCHAR2(3)      NULL,
    NAME1            VARCHAR2(35)     NULL
)
ORGANIZATION EXTERNAL
 ( TYPE ORACLE_LOADER
   DEFAULT DIRECTORY DBA_DATA_DIR
   ACCESS PARAMETERS
    ( records delimited by newline
      CHARACTERSET AL32UTF8
      STRING SIZES ARE IN CHARACTERS 
        logfile DBA_DATA_DIR:'sdp_tst_ext_%p.log'
        badfile DBA_DATA_DIR:'sdp_tst_ext_%p.bad'
        discardfile DBA_DATA_DIR:'sdp_tst_ext_%p.dsc'
        fields
    notrim
       (
             COST_CENTER_CODE CHAR(10)
            ,COST_CENTER_DESC  CHAR(40)
            ,SOURCE_CLIENT  CHAR(3)
            ,NAME1  CHAR(35)
           )
    )
   LOCATION (DBA_DATA_DIR:'sdp_tst.dat')
 )
REJECT LIMIT UNLIMITED
NOPARALLEL
NOROWDEPENDENCIES
/