Question

我想在SQL中使用R语言来获取与特定字段分组的基本统计信息，类似于如下的sql代码：

SQL：

select job, max(job_runtime_hour), avg(job_runtime_hour),VAR(JOB_RUNTIME_HOUR) from V_RUNTIME_ANALYSIS
group by JOB

我目前在SQL中使用R的进度：

SET NOCOUNT ON;
DECLARE @query nvarchar(max) = 
N'SELECT project, WORKFLOW_NAME, JOB, job_runtime_hour FROM [V_RUNTIME_ANALYSIS];'
EXEC sp_execute_external_script @language = N'R',
                @script = N'            
        range <-(max(InputDataSet$job_runtime_hour)-min(InputDataSet$job_runtime_hour))
    InterquartileRange <-IQR(InputDataSet$job_runtime_hour)

    variance <-var(InputDataSet$job_runtime_hour)

    stdeviation <-sd(InputDataSet$job_runtime_hour)

     OutputDataSet<-data.frame(Workflow=InputDataSet$WORKFLOW_NAME,JOB=InputDataSet$JOB,Runtime=InputDataSet$job_runtime_hour,Range=range,InterquartileRange=InterquartileRange,Variance =variance,stdeviate=stdeviation);'
,@input_data_1 = @query
WITH RESULT SETS (([Workflow] NVARCHAR(500) NOT NULL,[Job] NVARCHAR(500) NOT NULL,[Runtime] CHAR(20) NOT NULL,[Range] CHAR(20) NOT NULL,[InterquartileRange] CHAR(20) NOT NULL,[Variance] CHAR(20) NOT NULL,[stdeviate] CHAR(20) NOT NULL));
end

任何人都可以推荐使用r将sql中的基本统计信息分组的任何方法吗？

SQL中的R：如何按组获取基本统计信息？

0 个答案: