如何改进这个number2words脚本

时间:2008-11-14 10:40:21

标签: python

import sys

words = {
    1 : 'one',
    2 : 'two',
    3 : 'three',
    4 : 'four',
    5 : 'five',
    6 : 'six',
    7 : 'seven',
    8 : 'eight',
    9 : 'nine',
    10 : 'ten',
    11 : 'eleven',
    12 : 'twelve',
    13 : 'thirteen',
    14 : 'fourteen',
    15 : 'fifteen',
    16 : 'sixteen',
    17 : 'seventeen',
    18 : 'eighteen',
    19 : 'nineteen'
}

tens = [
    '',
    'twenty',
    'thirty',
    'forty',
    'fifty',
    'sixty',
    'seventy',
    'eighty',
    'ninety',
]

placeholders = [
    '',
    'thousand',
    'million',
    'billion',
    'trillion',
    'quadrillion'
]

# segMag = segment magnitude (starting at 1)
def convertTrio(number):
    return ' '.join([words[int(number[0])],  'hundred',  convertDuo(number[1:3])]) # convertDuo(number[1:3])


def convertDuo(number):
    #if teens or less
    if int(number[0]) == 1:
        return words[int(number)]
    #twenty-five
    else:
        return tens[int(number[0]) - 1] + '-' + words[int(number[1])]


if __name__ == "__main__":

    string = []
    numeralSegments = []
    numeral = sys.argv[1]

    if int(numeral) < 100:
        print convertDuo(numeral)
    else:

        # split number into lists, grouped in threes
        for i in range (0, len(numeral), 3):
            numeralSegments.append(numeral[i:i+3])

        numeralSegments.reverse()

        # for every segment, convert to trio word and append thousand, million, etc depending on magnitude
        for i in range (len(numeralSegments)):
            string.append(convertTrio(numeralSegments[i]) + ' ' + placeholders[i])

        # reverse the list of strings before concatenating to commas
        string.reverse()        
        print ', '.join(string)

警告:我是一个蟒蛇新手。我知道可能有很多次更有效的做事方式。我很感激他们的任何指示。

修改:该代码目前仅适用于数字位数为3的倍数的数字。我很欣赏一个优雅的方法来解决这个问题。感谢。

6 个答案:

答案 0 :(得分:3)

我想到了两个改进:

  • 40拼写为“四十”,而非“四十”
  • 您的计划需要单元测试

查看Python doctestunittest模块。

答案 1 :(得分:2)

您无法将数字分组为从左到右的“细分”。 range(0,len(),3)不会很好。您必须编写相同的算法来插入数字分隔符。你从右边开始,摘掉数字段。

剩下的是什么(在左边,得到它?)将是1,2或3位数。你有convertTrio和convertDuo,它们分别处理3位和2位数。在某处有一个转换一位数的功能(看不到它)。

如果不是作业,那么,这是一个正确的数字聚类算法

def segment( n ):
   segList= []
   while len(n) > 3:
       segList.insert( 0, n[-3:] )
       n= n[:-3]
   segList.insert( 0, n )
   return segList

修改

要更加Pythonic,请将其打包为一个整洁,可重复使用的模块。 if __name__ == "__main__"中的内容做了两件事,应该分开。

您的命令行解析(与sys.argv有关的任何事情都是一回事。实际的“转换数字”功能完全不同。您希望看起来更像这样。

if __name__ == "__main__":
    import sys
    for number in sys.argv[1:]:
        print number2string( number )

然后,您的number2string函数将成为此模块中一个易于重用的部分。

答案 2 :(得分:2)

不使用切片数字,而是使用模运算来分离单位。此函数将使用给定的数据结构转换小于100的数字。

def convert(n):
    q, r = divmod(n, 10)
    if q < 2:
        return words[n]
    result = tens[q-1] # offset because tens is missing first null value
    if r:
        result += '-' + words[r]
    return result

然后递归地使用convert来支持更大的数字,例如,以divmod(n,100)开头,依此类推。

答案 3 :(得分:1)

也许Numbers and plural words as spoken English会有所帮助。虽然有点过时了 - 2005年5月4日。

答案 4 :(得分:0)

查看Number::Spell Perl模块的来源。它很短,可以很容易地移植到Python(如果还没有完成)。

答案 5 :(得分:0)

如果有人在阅读此内容时正在寻找数字到单词的脚本,请查看inflect.py

import inflect
p = inflect.engine()
p.numwords(123456789)

给出

'one hundred and twenty-three million, four hundred and fifty-six thousand, seven hundred and eighty-nine'