imap_mail_move()无法使用特殊字符(äüö...)

时间:2019-04-28 08:40:52

标签: php character-encoding special-characters imap non-ascii-characters

我正在使用imap_mail_move()将电子邮件从一个文件夹移动到另一个文件夹。这很好用,但如果文件夹名称中包含特殊字符,则不能。我确定我需要对名称进行编码,但是所有测试都无法成功进行。

有人有个好主意吗?预先感谢。

class EmailReader {
    [...]

    function doMoveEmail($uid, $targetFolder) {
        $targetFolder = imap_utf8_to_mutf7($targetFolder);
        $return = imap_mail_move($this->conn, $uid, $targetFolder, CP_UID);
        if (!$return) {

            $this->printValue(imap_errors());
           die("stop");
        }
        return $return;
    }

    [...]
}

在脚本中调用函数

[...]
$uid = 1234;

$folderTarget1 = "INBOX.00_Korrespondenz";
$this->doMoveEmail($uid, $folderTarget1);

$folderTarget2 = "INBOX.01_Anmeldevorgang.011_Bestätigungslink";
$this->doMoveEmail($uid, $folderTarget2);
[...]

第一个调用(folderTarget1)的执行效果很好。

执行第二次调用(folderTarget2)会产生错误:

[TRYCREATE] Mailbox doesn't exist: INBOX.01_Anmeldevorgang.011_Bestätigungslink (0.001 + 0.000 secs).

备注1

如果我调用imap_list(),则文件夹名称显示为

"INBOX.01_Anmeldevorgang.011_Besta&Awg-tigungslink" (=$val)

using: 
$new = mb_convert_encoding($val,'UTF-8','UTF7-IMAP')
echo $new; // gives --> "INBOX.01_Anmeldevorgang.011_Bestätigungslink"

but:
$new2 = mb_convert_encoding($new,'UTF7-IMAP', 'UTF-8')
echo $new2; // gives --> "INBOX.01_Anmeldevorgang.011_Best&AOQ-tigungslink"

备注2

我使用以下脚本检查了每种可能的编码,但没有一个与imap_list()返回的值匹配。

// looking for "INBOX.01_Anmeldevorgang.011_Besta&Awg-tigungslink" given by imap_list().

$targetFolder = "INBOX.01_Anmeldevorgang.011_Bestätigungslink";

foreach(mb_list_encodings() as $chr){
  echo mb_convert_encoding($targetFolder, $chr, 'UTF-8')." : ".$chr."<br>";
}

2 个答案:

答案 0 :(得分:0)

您的文件夹名称(如服务器上的Besta&Awg-tigungslink未被规范编码:

&Awg-解码为组合音调字符。使用一些方便的python进行查找:

import base64
import unicode data
x = base64.b64decode('Awg=').decode('utf-16be'); # equals added to satisfy base64 padding requirements
unicodedata.name(x)
# Returns 'COMBINING DIAERESIS'

这与前面的a结合显示ä。

您的编码器返回的是更常见的预设形式:

x = base64.b64decode('AOQ=').decode('utf-16be')
unicodedata.name(x)
# Returns: 'LATIN SMALL LETTER A WITH DIAERESIS'

这是ä的直接表示。

通常,当您使用IMAP文件夹时,会绕过原始名称,并且仅转换该文件夹名称以进行显示。如您所见,从字形到unicode中的编码不一定存在单向映射。

令我感到惊讶的是,PHP在编码时似乎确实在进行规范化步骤。我希望往返处理相同的数据会返回相同的结果。

答案 1 :(得分:0)

我创建了一种解决方法,可帮助我使用UTF8值并将其转换为原始(原始)IMAP文件夹名称。

    function getFolderList() {
        $folders = imap_list($this->conn, "{".$this->server."}", "*");
        if (is_array($folders)) {

            // Remove Server details of each element of array
            $folders = array_map(function($val) { return str_replace("{".$this->server."}","",$val); }, $folders);

            // Sort array
            asort($folders);

            // Renumber the list
            $folders = array_values($folders);

            // add UTF-8 encoded value to array
            // this is needed as the original value is so wiered, that it is not possible to encode it
            // with a function on the fly. This additional utf-8 value is needed to map the utf-8 value
            // to the original value. The original value is still needed to do some operations like e.g.:
            //  - imap_mail_move()
            //  - imap_reopen()
            // ==> the trick is to use normalizer_normalize()
            $return = array();
            foreach ($folders as $key => $folder) {
                $return[$key]['original'] = $folder;
                $return[$key]['utf8']     = normalizer_normalize(mb_convert_encoding($folder,'UTF-8','UTF7-IMAP'));
            }


            return $return;
        } else {
            die("IMAP_Folder-List failed: " . imap_last_error() . "\n");
        }
    }