在python中比较两个字符串时会发生什么

时间:2017-04-18 07:25:11

标签: python comparison equality python-internals

比较python中的字符串,例如

如果"您好" =="你好":     #execute某些代码

我很好奇比较字符串的代码是什么。因此,如果我在c中比较这些,我会比较每个角色并在一个角色不匹配时中断。我真的想知道比较两个这样的字符串的过程是什么,即什么时候它会中断,如果这个比较和上面说的方法之间有什么区别,除了代码行的冗余

1 个答案:

答案 0 :(得分:6)

我将假设您在这里使用CPython,这是标准的Python.org实现。在引擎盖下,Python字符串类型是用C实现的,所以是的,测试两个字符串是否完全相同,就像你在C中一样。

它的作用是使用memcmp() function来测试两个str对象是否包含相同的数据,请参阅unicode_compare_eq function defined in unicodeobject.c

static int
unicode_compare_eq(PyObject *str1, PyObject *str2)
{
    int kind;
    void *data1, *data2;
    Py_ssize_t len;
    int cmp;

    len = PyUnicode_GET_LENGTH(str1);
    if (PyUnicode_GET_LENGTH(str2) != len)
        return 0;
    kind = PyUnicode_KIND(str1);
    if (PyUnicode_KIND(str2) != kind)
        return 0;
    data1 = PyUnicode_DATA(str1);
    data2 = PyUnicode_DATA(str2);

    cmp = memcmp(data1, data2, len * kind);
    return (cmp == 0);
}

仅当str1str2不是同一个对象(这是一个简单而便宜的测试对象)时,才会调用此函数。它首先检查两个对象是否长度相同并存储相同类型的数据(字符串对象使用flexible storage implementation来节省内存;不同的存储意味着字符串不能相等。)

还有其他Python实现,比如Jython或IronPython,它们可能使用不同的技术,但它基本上会归结为相同的东西。