计算字符串中字符的出现次数

时间:2009-07-20 20:00:36

标签: python string count

计算字符串中字符出现次数的最简单方法是什么?

e.g。计算'a'

'Mary had a little lamb'出现的次数

23 个答案:

答案 0 :(得分:1202)

  

str.count(sub[, start[, end]])

     

返回范围sub中子字符串[start, end]的非重叠出现次数。可选参数startend被解释为切片表示法。

>>> sentence = 'Mary had a little lamb'
>>> sentence.count('a')
4

答案 1 :(得分:132)

您可以使用count()

>>> 'Mary had a little lamb'.count('a')
4

答案 2 :(得分:96)

正如其他答案所说,使用字符串方法count()可能是最简单的,但如果你经常这样做,请查看collections.Counter

from collections import Counter
my_str = "Mary had a little lamb"
counter = Counter(my_str)
print counter['a']

答案 3 :(得分:48)

正则表达式可能吗?

import re
my_string = "Mary had a little lamb"
len(re.findall("a", my_string))

答案 4 :(得分:24)

myString.count('a');

更多信息here

答案 5 :(得分:15)

"aabc".count("a")

答案 6 :(得分:12)

str.count(a)是计算字符串中单个字符的最佳解决方案。但是如果你需要计算更多的字符,你必须读取整个字符串的次数,而不是你想要计算的字符数。

这项工作的更好方法是:

from collections import defaultdict

text = 'Mary had a little lamb'
chars = defaultdict(int)

for char in text:
    chars[char] += 1

所以你有一个dict,它会返回字符串中每个字母的出现次数,如果它不存在则会0

>>>chars['a']
4
>>>chars['x']
0

对于不区分大小写的计数器,您可以通过继承defaultdict(基类'只读)来覆盖mutator和accessor方法:

class CICounter(defaultdict):
    def __getitem__(self, k):
        return super().__getitem__(k.lower())

    def __setitem__(self, k, v):
        super().__setitem__(k.lower(), v)


chars = CICounter(int)

for char in text:
    chars[char] += 1

>>>chars['a']
4
>>>chars['M']
2
>>>chars['x']
0

答案 7 :(得分:9)

如果你想要不区分大小写(当然还有正则表达式的所有功能),正则表达式非常有用。

my_string = "Mary had a little lamb"
# simplest solution, using count, is case-sensitive
my_string.count("m")   # yields 1
import re
# case-sensitive with regex
len(re.findall("m", my_string))
# three ways to get case insensitivity - all yield 2
len(re.findall("(?i)m", my_string))
len(re.findall("m|M", my_string))
len(re.findall(re.compile("m",re.IGNORECASE), my_string))

请注意,正则表达式版本的运行时间大约为十倍,这可能仅在my_string非常长或者代码在深循环内时才会出现问题。

答案 8 :(得分:8)

这种简单直接的功能可能有所帮助:

def check_freq(str):
    freq = {}
    for c in str:
       freq[c] = str.count(c)
    return freq

check_freq("abbabcbdbabdbdbabababcbcbab")
{'a': 7, 'b': 14, 'c': 3, 'd': 3}

答案 9 :(得分:5)

a = 'have a nice day'
symbol = 'abcdefghijklmnopqrstuvwxyz'
for key in symbol:
    print key, a.count(key)

答案 10 :(得分:2)

str = "count a character occurance"

List = list(str)
print (List)
Uniq = set(List)
print (Uniq)

for key in Uniq:
    print (key, str.count(key))

答案 11 :(得分:2)

count 绝对是计算字符串中字符出现次数最简洁有效的方法,但我尝试使用 {{1}来提出解决方案} ,像这样:

lambda

这将导致:

sentence = 'Mary had a little lamb'
sum(map(lambda x : 1 if 'a' in x else 0, sentence))

此外,还有一个优点是,如果句子是包含与上述相同字符的子字符串列表,那么由于4 的使用,这也给出了正确的结果。看看:

in

这也导致:

sentence = ['M', 'ar', 'y', 'had', 'a', 'little', 'l', 'am', 'b']
sum(map(lambda x : 1 if 'a' in x else 0, sentence))

但当然,只有在这种特殊情况下检查4 这样的单个字符的出现时才会起作用。

答案 12 :(得分:1)

“不使用count来查找字符串中的字符”。

import re

def count(s, ch):

   pass

def main():

   s = raw_input ("Enter strings what you like, for example, 'welcome': ")  

   ch = raw_input ("Enter you want count characters, but best result to find one character: " )

   print ( len (re.findall ( ch, s ) ) )

main()

答案 13 :(得分:0)

只有这个恕我直言 - 你可以添加上层或下层方法

def count_letter_in_str(string,letter):
    return string.count(letter)

答案 14 :(得分:0)

spam = 'have a nice day'
var = 'd'


def count(spam, var):
    found = 0
    for key in spam:
        if key == var:
            found += 1
    return found
count(spam, var)
print 'count %s is: %s ' %(var, count(spam, var))

答案 15 :(得分:0)

使用计数:

string = "count the number of counts in string to count from."
x = string.count("count")

x = 3。

答案 16 :(得分:0)

无需使用Counter()count和正则表达式即可获得所有字符计数的另一种方法

counts_dict = {}
for c in list(sentence):
  if c not in counts_dict:
    counts_dict[c] = 0
  counts_dict[c] += 1

for key, value in counts_dict.items():
    print(key, value)

答案 17 :(得分:0)

我是pandas库的爱好者,尤其是value_counts()方法。您可以使用它来计算字符串中每个字符的出现次数:

>>> import pandas as pd
>>> phrase = "I love the pandas library and its `value_counts()` method"
>>> pd.Series(list(phrase)).value_counts()
     8
a    5
e    4
t    4
o    3
n    3
s    3
d    3
l    3
u    2
i    2
r    2
v    2
`    2
h    2
p    1
b    1
I    1
m    1
(    1
y    1
_    1
)    1
c    1
dtype: int64

答案 18 :(得分:0)

我不知道“最简单”,但简单的理解就可以:

>>> my_string = "Mary had a little lamb"
>>> sum(char == 'a' for char in my_string)
4

利用内置总和,生成器理解以及bool是整数的子类的事实:字符与'a'的倍数如何。

答案 19 :(得分:0)

a = "I walked today,"
c=['d','e','f']
count=0
for i in a:
    if str(i) in c:
        count+=1

print(count)

答案 20 :(得分:0)

我知道这个问题是计算一个特定的字母。我在这里写的是通用代码,没有使用任何方法。

sentence1 =" Mary had a little lamb"
count = {}
for i in sentence1:
    if i in count:
        count[i.lower()] = count[i.lower()] + 1
    else:
        count[i.lower()] = 1
print(count)

输出

{' ': 5, 'm': 2, 'a': 4, 'r': 1, 'y': 1, 'h': 1, 'd': 1, 'l': 3, 'i': 1, 't': 2, 'e': 1, 'b': 1}

现在如果你想要任何特定的字母频率,你可以像下面这样打印。

print(count['m'])
2

答案 21 :(得分:-1)

  

Python 3

有两种方法可以实现此目的:

1)具有内置功能count()

sentence = 'Mary had a little lamb'
print(sentence.count('a'))`

2)不使用功能

sentence = 'Mary had a little lamb'    
count = 0

for i in sentence:
    if i == "a":
        count = count + 1

print(count)

答案 22 :(得分:-3)

这将为您提供字符串中每个字符的出现。 O / P也是字符串格式:

def count_char(string1):
string2=""
lst=[]
lst1=[]
for i in string1:
    count=0
    if i not in lst:
        for j in string1:
            if i==j:
                count+=1
        lst1.append(i)
        lst1.append(count)
    lst.append(i)

string2=''.join(str(x) for x in lst1)
return string2 

print count_char("aabbacddaabbdsrchhdsdg")