bash-找到排队的平均数

时间:2015-10-03 01:08:45

标签: arrays bash expr

我正在尝试逐行读取文件,并找到每行中数字的平均值。我收到错误:expr: non-numeric argument

我已将问题缩小到sum = expr $sum + $i,但我不确定代码为什么不起作用。

while read -a rows
do
    for i in "${rows[@]}"
    do
        sum=`expr $sum + $i`
        total=`expr $total + 1`
    done
    average=`expr $sum / $total`
done < $fileName

文件看起来像这样(数字用标签分隔):

1       1       1       1       1
9       3       4       5       5
6       7       8       9       7
3       6       8       9       1
3       4       2       1       4
6       4       4       7       7

4 个答案:

答案 0 :(得分:3)

通过一些小的修正,您的代码运行良好:

while read -a rows
do
    total=0
    sum=0
    for i in "${rows[@]}"
    do
        sum=`expr $sum + $i`
        total=`expr $total + 1`
    done
    average=`expr $sum / $total`
    echo $average
done <filename

使用示例输入文件,生成的输出为:

1
5
7
5
2
5

请注意,答案就是它们,因为expr只进行整数运算。

使用sed预处理expr

上述代码可以改写为:

$ while read row; do expr '(' $(sed 's/  */ + /g' <<<"$row") ')' / $(wc -w<<<$row); done < filename
1
5
7
5
2
5

使用bash的内置算术功能

expr陈旧。在现代狂欢中:

while read -a rows
do
    total=0
    sum=0
    for i in "${rows[@]}"
    do
        ((sum += $i))
        ((total++))
    done
    echo $((sum/total))
done <filename

使用awk进行浮点数学

因为awk进行浮点数学运算,所以它可以提供更准确的结果:

$ awk '{s=0; for (i=1;i<=NF;i++)s+=$i; print s/NF;}' filename
1
5.2
7.4
5.4
2.8
5.6

答案 1 :(得分:1)

使用IFS变量的相同技巧的一些变化。

#!/bin/bash

while read line; do
    set -- $line
    echo $(( ( $(IFS=+; echo "$*") ) / $# ))
done < rows

echo

while read -a line; do
    echo $(( ( $(IFS=+; echo "${line[*]}") ) / ${#line[*]} ))
done < rows

echo

saved_ifs="$IFS"
while read -a line; do
    IFS=+
    echo $(( ( ${line[*]} ) / ${#line[*]} ))
    IFS="$saved_ifs"
done < rows

答案 2 :(得分:1)

其他人已经指出expr只是整数,建议用awk而不是shell编写脚本。

您的系统上可能有许多支持任意精度数学或浮点数的工具。 shell中的两个常见计算器是bc,它遵循标准的“操作顺序”,dc使用“反向抛光记法”。

可以轻松地为这些数据中的任何一个提供数据,从而可以生成每行平均值。例如,使用bc:

#!/bin/sh

while read line; do
  set - ${line}
  c=$#
  string=""
  for n in $*; do
    string+="${string:++}$1"
    shift
  done
  average=$(printf 'scale=4\n(%s) / %d\n' $string $c | bc)
  printf "%s // avg=%s\n" "$line" "$average"
done

当然,唯一的bc - 具体部分是表示法的格式,而bc本身在第三行的格式。使用dc的基本内容可能如下所示:

#!/bin/sh

while read line; do
  set - ${line}
  c=$#
  string="0"
  for n in $*; do
    string+=" $1 + "
    shift
  done
  average=$(dc -e "4k $string $c / p")
  printf "%s // %s\n" "$line" "$average"
done

请注意,我的shell支持附加+=的字符串。如果没有,您可以根据需要进行调整。

在这两个例子中,我们将输出打印到四个小数位 - bc为scale=4,dc为4k。我们正在处理标准输入,因此如果您将这些脚本命名为“calc”,则可以使用以下命令行运行它们:

$ ./calc < inputfile.txt

循环开始时的set命令将$line变量转换为位置参数,如$1$2等。然后我们处理每个位置参数for循环,将所有内容追加到一个字符串中,该字符串稍后将被输入计算器。

另外,你可以伪造它。

也就是说,虽然bash不支持浮点数,但它支持乘法和字符串操作。以下使用NO外部工具,但出现以显示输入的小数平均值。

#!/bin/bash

declare -i total

while read line; do

  set - ${line}
  c=$#
  total=0
  for n in $*; do
    total+="$1"
    shift
  done

  # Move the decimal point over prior to our division...
  average=$(($total * 1000 / $c))
  # Re-insert the decimal point via string manipulation
  average="${average:0:$((${#average} - 3))}.${average:$((${#average} - 3))}"
  printf "%s // %0.3f\n" "$line" "$average"

done

这里的重点是: * declare告诉bash将添加添加到$total +=,而不是将其作为字符串附加, *两个average=分配,第一个分配$total乘以1000,第二个分配结果在千列, * printf,其格式在其输出中强制执行三位小数。

当然,输入仍然需要是整数。

YMMV。我不是说这是应该解决这个问题的方式,只是它是一个选项。 :)

答案 3 :(得分:0)

这是一篇很老的文章,但是在我的Google搜索中排在首位,所以我想分享一下我的想法:

while read line; do
    # Convert each line to an array
    ARR=( $line )

    # Append each value in the array with a '+' and calculate the sum
    #   (this causes the last value to have a trailing '+', so it is added to '0')
    ARR_SUM=$( echo "${ARR[@]/%/+} 0" | bc -l)

    # Divide the sum by the total number of elements in the array
    echo "$(( ${ARR_SUM} / ${#ARR[@]} ))"
done < "$filename"