SQL Server相当于Excel的TINV功能

时间:2015-01-14 11:33:17

标签: sql sql-server distribution probability

我试图找到X的t分布的双尾逆。它可以在Excel中使用TINV函数找到,但我需要在SQL Sever中实现它。请建议我的想法。

TINV函数语法具有以下参数:

概率:与双尾学生的t分布相关的概率。

Deg_freedom :表征分布的自由度数。

前:

select tinv( 0.054645, 60);
-- -----------------
--  1.9599994129833
--  (1 row returned)

3 个答案:

答案 0 :(得分:5)

SQL-Server没有包含很多统计功能。
SQL Server中不存在tinv

添加tinv功能的唯一方法是使用CLR-Function。
因此,问题本身减少为“如何使用SQL-Server中允许的C#子集来计算tinv?”。

如果您使用的是.NET 4.0,则可以使用System.Web.DataVisualization.dll

中的图表类

e.g。

var someChart = new System.Web.UI.DataVisualization.Charting.Chart();
double res = someChart.DataManipulator.Statistics.InverseTDistribution(.05, 15);

//2.131449546

但是,您可能不希望这种开销。 所以你必须从Math.NET的SourceCode(MIT / X11许可证)中删除它。

StudentT dist = new StudentT(0.0,1.0,7.0);          
double prob = dist.CumulativeDistribution(1.8946);

哪个应该导致0.95

由于你需要逆,你需要

StudentT.InvCDF(double location, double scale, double freedom, double p)

位置:分布的位置(μ)。
scale:分布的比例(σ)。范围:σ> 0.
自由:分配的自由度(ν)。范围:ν> 0
p:计算反向累积密度的位置。

[Microsoft.SqlServer.Server.SqlFunction]
public static System.Data.SqlTypes.SqlDouble TInv(double probability, int degFreedom)
{  
    double result = 0.00; 
    try
    {
        result = fnInverseTDistribution(degFreedom, probability);
    }
    catch
    {
        // throw; // Optionally throw/log/ignore/whatever
    }
    return result;
}

使用DataVisualization,如下所示:

[Microsoft.SqlServer.Server.SqlFunction]
public static System.Data.SqlTypes.SqlDouble TInv(double probability, int degFreedom)
{  
    double result = 0.00; 
    try
    {

        var someChart = new System.Web.UI.DataVisualization.Charting.Chart();
        result  = someChart.DataManipulator.Statistics.InverseTDistribution( probability, degFreedom);
    }
    catch
    {
        // throw; // Optionally throw/log/ignore/whatever
    }
    return result;
}

然而,DataVisualization技巧不适用于SQL-Server,因为您需要添加对System.Web的引用,而这在SQL-Server中是无法做到的。

另外,excel有很多类似的功能,tinv,t.inv,T.INV.2S等,所以一定要选择合适的功能。

编辑:

找到更多信息: http://numerics.mathdotnet.com/api/MathNet.Numerics/ExcelFunctions.htm#TIn

Math.NET中有一个名为ExcelFunctions的特殊类,您可以实际使用它:

MathNet.Numerics.ExcelFunctions.TInv (1.1, 55);

您可以在OpenOffice.org上找到有关TINVTDIST的更多信息,以及by category

下的功能列表

所以问题的解决方案是

[Microsoft.SqlServer.Server.SqlFunction]
public static System.Data.SqlTypes.SqlDouble TInv(double probability, int degFreedom)
{  
    double result = 0.00; 
    try
    {
        result  = MathNet.Numerics.ExcelFunctions.TInv (probability, degFreedom);
    }
    catch
    {
        // throw; // Optionally throw/log/ignore/whatever
    }
    return result;
}

实际上与

相同
[Microsoft.SqlServer.Server.SqlFunction]
public static System.Data.SqlTypes.SqlDouble TInv(double probability, int degFreedom)
{  
    double result = 0.00; 
    try
    {
        result  = -StudentT.InvCDF(0d, 1d, degFreedom, probability/2);
    }
    catch
    {
        // throw; // Optionally throw/log/ignore/whatever
    }
    return result;
}

所以现在你从中获取Math.Net的源代码 https://github.com/mathnet/mathnet-numerics 然后使用CRL-Function将mathnet-numerics / src / Numerics /(或其中所需的部分)的内容拖放到项目中,并完成。

当你拥有你的CLR dll时,你会进入SSMS并执行:

EXEC dbo.sp_configure 'clr enabled',1 RECONFIGURE WITH

CREATE ASSEMBLY SQLServerStatistics from 'C:\SQLServerStatistics.dll' WITH PERMISSION_SET = SAFE

在成功之后,您仍然需要使用SQL-Server注册该函数。

CREATE FUNCTION [dbo].[tinv](@prob float, @degFreedom int)
    RETURNS float WITH EXECUTE AS CALLER
AS
EXTERNAL NAME [SQLServerStatistics].[Functions].[TInv]

有关详细信息,请参阅this文章。

如果要将Dll带到高效的服务器上,则需要从字节数组字符串创建程序集,如下所示:

CREATE ASSEMBLY [MyFunctions]
AUTHORIZATION [dbo]
FROM 0x4D5A90000[very long string here...];

您可以从字节数组中创建十六进制字符串,如下所示:

byte[] bytes = System.IO.File.ReadAllBytes(@"C:\SQLServerStatistics.dll");
"0x" + BitConverter.ToString(bytes).Replace("-", "")

我已经在github上传了整个解决方案here

然后你可以运行这样的功能:

SELECT dbo.tinv(0.54645, 60) 

==> 0.606531559343638

Script-Generator工具会自动为您构建安装脚本。 看起来像这样:

> sp_configure 'show advanced options', 1; GO RECONFIGURE; GO
> sp_configure 'clr enabled', 1; GO RECONFIGURE; GO
> 
> 
> DECLARE @sql nvarchar(MAX)  SET @sql = 'ALTER DATABASE ' +
> QUOTENAME(DB_NAME()) + ' SET TRUSTWORTHY ON;' 
> -- PRINT @sql; EXECUTE(@sql); GO
> 
> 
> -- Restore sid when db restored from backup... DECLARE @Command NVARCHAR(MAX) = N'ALTER AUTHORIZATION ON DATABASE::<<DatabaseName>> TO
> [<<LoginName>>]'  SELECT @Command = REPLACE (     REPLACE(@Command,
> N'<<DatabaseName>>', SD.Name)     , N'<<LoginName>>'  , SL.Name ) FROM
> master..sysdatabases AS SD  JOIN master..syslogins AS SL      ON  SD.SID
> = SL.SID 
> 
> WHERE SD.Name = DB_NAME()
> 
> -- PRINT @command  EXECUTE(@command)  GO
> 
>           IF  EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[TDist]') AND type in (N'FN', N'IF', N'TF', N'FS',
> N'FT')) DROP FUNCTION [dbo].[TDist] GO
>     
>           IF  EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[TInv]') AND type in (N'FN', N'IF', N'TF', N'FS',
> N'FT')) DROP FUNCTION [dbo].[TInv] GO
>     
> 
> 
> IF  EXISTS (SELECT * FROM sys.assemblies asms WHERE asms.name =
> N'SQLServerStatistics' and is_user_defined = 1) DROP ASSEMBLY
> [SQLServerStatistics] GO
> 
> 
> CREATE ASSEMBLY SQLServerStatistics AUTHORIZATION [dbo] 
>     FROM 'c:\users\administrator\documents\visual studio 2013\Projects\SqlServerStatistics\ClrCreationScriptGenerator\bin\Debug\SqlServerStatistics.dll'
> WITH PERMISSION_SET = UNSAFE GO
> 
> 
> CREATE FUNCTION [dbo].[TDist](@x AS float, @degFreedom AS int, @tails
> AS int)
>     RETURNS float WITH EXECUTE AS CALLER AS EXTERNAL NAME [SQLServerStatistics].[SqlServerStatistics.ExcelFunctions].[TDist] GO
> 
> 
> 
> CREATE FUNCTION [dbo].[TInv](@probability AS float, @degFreedom AS
> int)
>     RETURNS float WITH EXECUTE AS CALLER AS EXTERNAL NAME [SQLServerStatistics].[SqlServerStatistics.ExcelFunctions].[TInv] GO

答案 1 :(得分:2)

您可以将自己的实现编写为SQL函数,也可以使用CLR并在C#中编写。

我的建议是使用CLR并包含Accord库(我推荐这个,因为它们仍然具有SQL 3.5 CLR所需的.NET 3.5版本)来实现统计功能。我过去做过其他的统计计算,它就像魅力一样。

答案 2 :(得分:0)

您可以在R中使用qt函数。这是一个代码片段:

angular.module