在python中创建一个连续的发行版

时间:2013-07-16 12:36:11

标签: python statistics distribution continuous

我在python中创建连续发行版时遇到了麻烦,它真的开始让我恼火。我已阅读并重新阅读this python guide (scipy guide),但这对我的问题没有帮助。

我的代码是:

import sys
import scipy.stats
import numpy 


def CDF_Random(N,NE,E,SE,S,SW,W,NW,Iterations):
    WindDir = [0,45,90,135,180,225,270,315]
    Freq = N,NE,E,SE,S,SW,W,NW

    mydist = scipy.stats.rv_continuous(#My problem is what to write here)  

    cdf_rand=mydist.rvs(size=Iterations)    
    return (cdf_rand)

if __name__ == '__main__':
    N = float(sys.argv[1])
    NE = float(sys.argv[2])
    E = float(sys.argv[3])
    SE = float(sys.argv[4])
    S = float(sys.argv[5])
    SW = float(sys.argv[6])
    W = float(sys.argv[7])
    NW = float(sys.argv[8])
    Iterations = float(sys.argv[9])
    numpy.set_printoptions(threshold=Iterations)
    sys.stdout.write(str(CDF_Random(N,NE,E,SE,S,SW,W,NW,Iterations)))

正如您所看到的,如果您阅读代码,我的问题是知道要在括号中放置什么来创建连续分布。 scipy.stats.rv_continuous(#what to put here)

我尝试了很多不同的东西,主要是this document(scipy guide)中建议的内容,比如设置我的上下范围值a=,b=,将其设置为pdf或{{1} }。我已经尝试ppf使用在命令行中输入的那些或者只是我在代码本身中写入的那些。

从命令行运行此命令 [arrays] 每次我得到; python C:\Users\...\CDF.py 0.01 0.01 0.01 0.01 0.01 0.93 0.01 0.01 10 我已经尝试将递归深度重置为不同的值,但这不起作用或崩溃python。 RuntimeError:maximum recursion depth exceeded

基本上应该在sys.setrecursionlimit(10000)后的括号中输入什么来为给定分布scipy.stats.rv_continuous()创建名为[array]的{​​{1}}的连续分布? 我老老实实地通过谷歌和stackoverflow网站看了一下,使用关键字搜索,单独使用标签和标签的关键字,找不到解决方案。

编辑1-期望的结果 我希望输出为WindDirfreq

之间的实数

1 个答案:

答案 0 :(得分:1)

好吧,为了使用rv_continuous,您需要提供某种概率密度函数。在下面的示例中,我为给定的风向间隔[0,360]实施累积密度函数。我通过在输入中指定的最近的两个风向之间插值概率密度函数来做到这一点。请注意a基类构造函数中指定的参数brv_continuous ...这些参数指定了考虑的间隔的最小值和最大值。尝试使用代码,如果您有任何疑问,请询问,我会尽力帮助澄清。

编辑我修改了python 3的代码,并更新了cdf以更准确地在基数方向给出的频率之间进行插值。

import scipy.stats

class rvc(scipy.stats.rv_continuous):
    def __init__(self, freqs):
        super().__init__(a=0,b=359.9999)
        self.WindDir = [0.,45.,90.,135.,180.,225.,270.,315.,360.]
        self.Freqs = freqs

    def _cdf(self, x):
        return [self.do_cdf(i) for i in x]

    def do_cdf(self, x):
        if x < 0: return 0.0
        if x >= 360: return 1.0
        v = 0.0
        for i in range(9):
            if x >= self.WindDir[i]:
                v += self.Freqs[i]
            else:
                v += (self.Freqs[i]-self.Freqs[i-1])*(x-self.WindDir[i-1])/45.
                break
        return v

rv = rvc([0.01,0.01, 0.01, 0.01, 0.01, 0.01, 0.92, 0.01, 0.01])
print(rv.rvs(size=100))

运行它会生成类似

的输出
[ 305.76400244  271.49390379  285.5514374   280.4422151   302.52158889
  273.85068415  278.8377575   287.05260894  270.66219523  301.97131911
  277.77725392  293.29633122  273.60832876  278.90703722  271.12590324
  288.38285244  299.89362412  276.68015144  278.46429959  304.33532312
  313.42248626  272.10226608  311.00385667  284.48822492  298.134523
  300.08266465  272.17850056  270.07995773  359.9999      289.13032076
  206.58066169  308.95821915  288.998036    280.93451276  294.33703562
  278.02828894  307.96335447  292.50172701  313.67335738  291.99562061
  275.98551449  307.72620259  283.11307243  309.6052904   283.65619152
  305.80365684  303.43088801  314.74811251  302.8390404   288.16580807
  299.84487396  302.34636138  291.09465231  310.74393544  279.23446355
  309.83353391  292.62761642  273.22324646  291.16193395  298.51520679
  299.87754111  280.29779055  276.76741796  285.5186257   301.7074023
  274.9771402   280.6619726   276.53202603  289.50757382  313.61213159
   98.86469637  298.41091812   83.62474126  290.42538277  306.70218844
  270.81939255  290.25089647  305.3277742   278.03965968  280.5979916
  307.9492377   284.30184233  307.14788891  283.33779011  270.86398644
  297.70610336  277.48672772  300.35147777  271.07308885  304.41450287
  312.5640489   273.54296504  311.62527023  298.95246144  275.199183
  302.6063864   359.9999      311.25861396  306.83491033  313.52858514]