计算字符串中字符的频率(Java,Performance)

时间:2019-03-17 03:25:29

标签: java arrays string performance char

问题

我写了这个程序来检查每个字母出现在用户输入的字符串中的次数。它可以正常工作,但是相对于每个字符重复一个26个元素长的数组,是否有比该任务更有效或替代的解决方案呢?

代码

import java.util.Scanner;
public class Letters {
    public static void main(String[] args) {
        @SuppressWarnings("resource")
        Scanner sc = new Scanner(System.in);
        char[] c = {'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z'};
        int[] f = {0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0};
        System.out.println("Enter a string.");
        String k = sc.nextLine();
        String s = k.toUpperCase();
        s = s.trim();
        int l = s.length();
        System.out.println("Checking string = " + s);
        char ch;
        for (int i = 0; i < l; i++) {
            ch = s.charAt(i);
            for (int j = 0; j < c.length; j++) {
                if (ch == c[j]) {
                    f[j]++;
                }
            }
        }
        System.out.println("Char\tFreq");
        for (int i = 0; i < c.length; i++) {
            if (f[i] != 0) {
                System.out.println(c[i] + "\t" + f[i]);
            }
        }
    }
}

5 个答案:

答案 0 :(得分:2)

您不需要在频率数组中显式初始化26个条目(默认值为零);您也不需要保留字符表(知道偏移量就足够了)。也就是说,您的代码可以完全消除c并计算出每个字母;喜欢,

Scanner sc = new Scanner(System.in);
int[] f = new int[26];
System.out.println("Enter a string.");
String orig = sc.nextLine();
String k = orig.trim().toUpperCase();
System.out.println("Checking string = " + orig);
for (char ch : k.toCharArray()) {
    f[ch - 'A']++;
}
System.out.println("Char\tFreq");
for (int i = 0; i < f.length; i++) {
    if (f[i] != 0) {
        System.out.println((char) ('A' + i) + "\t" + f[i]);
    }
}

答案 1 :(得分:0)

通过使用字母A-Z以ASCII连续出现的事实,可以避免内部循环。因此,您不必在数组c中搜索字符,只需计算索引即可。参见下面的代码:

for (int i = 0; i < l; i++) {
    char ch = s.charAt(i);
    if (ch >= 'A' && ch <= 'Z') {
        int j = (int)(ch - 'A'); // j will be in the range [0, 26)
        f[j]++;
    } 
}

我们同样可以删除数组c

for (int i = 0; i < 26; i++) {
    if (f[i] != 0) {
        System.out.println((char)('A' + i) + "\t" + f[i]);
    }
}

答案 2 :(得分:0)

您可以通过编写

来找到字符串中字符的频率
String.length() - String.replaceAll("character", "").length();

答案 3 :(得分:0)

如果我们有诸如“ romeo@alphacharlie.com”之类的字符串,则具有freqArr [c-'A'] ++的示例将不起作用。您可以尝试使用它。

private static int[] decodeFrequency(char[] array) {
    int[] freqArr = new int[127];
    for ( char c : array ) {
        freqArr[(int)c]++;
    }
    return freqArr;
}

答案 4 :(得分:0)

有很多方法可以解决问题,我鼓励您遵循一种容易理解的方法。我下面的解决方案基本上初始化一个26的数组,以计算所有字符的频率。

重要部分:

每个字母都有一个ASCII值,因此,通过类型转换最终得到整数值,然后减去65 (对于大写字母),您将获得数组的索引来存储频率各自的角色。

  

您修改后的Java代码

import java.util.Scanner;
public class Letters{
    public static void main(String[] args) {
        @SuppressWarnings("resource")
        Scanner sc = new Scanner(System.in);
        int[] f = new int[26];
        System.out.println("Enter a string.");
        String k = sc.nextLine();
        String s = k.toUpperCase();
        s = s.trim();
        int l = s.length();
        System.out.println("Checking string = " + s);
        char ch;
        for (int i = 0; i < l; i++) {
            ch = s.charAt(i);

            //This will give the ASCII value of the character i.e. ch
            int temp=(int)ch;
            if(temp>=65 && temp<=90){
              //subtract 65 to get index 
              //add 1 to increase frequency 
              f[temp - 65]+=1;
            }

        }
        System.out.println("Char\tFreq");
        for (int i = 0; i < 26; i++) {
            if (f[i] != 0) {
                //Add 65 to get respective character
                System.out.println((char)(i+65) + "\t" + f[i]);
            }
        }
    }
}

例如:

f [0]代表'A'

f [1]代表“ B”

....

f [25]表示“ Z”

(记住索引从0开始)

通过这种方式,您可以消除内部for循环并使用单个整数数组获取频率。