我想在SQL中使用R语言来获取与特定字段分组的基本统计信息,类似于如下的sql代码:
SQL:
select job, max(job_runtime_hour), avg(job_runtime_hour),VAR(JOB_RUNTIME_HOUR) from V_RUNTIME_ANALYSIS
group by JOB
我目前在SQL中使用R的进度:
SET NOCOUNT ON;
DECLARE @query nvarchar(max) =
N'SELECT project, WORKFLOW_NAME, JOB, job_runtime_hour FROM [V_RUNTIME_ANALYSIS];'
EXEC sp_execute_external_script @language = N'R',
@script = N'
range <-(max(InputDataSet$job_runtime_hour)-min(InputDataSet$job_runtime_hour))
InterquartileRange <-IQR(InputDataSet$job_runtime_hour)
variance <-var(InputDataSet$job_runtime_hour)
stdeviation <-sd(InputDataSet$job_runtime_hour)
OutputDataSet<-data.frame(Workflow=InputDataSet$WORKFLOW_NAME,JOB=InputDataSet$JOB,Runtime=InputDataSet$job_runtime_hour,Range=range,InterquartileRange=InterquartileRange,Variance =variance,stdeviate=stdeviation);'
,@input_data_1 = @query
WITH RESULT SETS (([Workflow] NVARCHAR(500) NOT NULL,[Job] NVARCHAR(500) NOT NULL,[Runtime] CHAR(20) NOT NULL,[Range] CHAR(20) NOT NULL,[InterquartileRange] CHAR(20) NOT NULL,[Variance] CHAR(20) NOT NULL,[stdeviate] CHAR(20) NOT NULL));
end
任何人都可以推荐使用r将sql中的基本统计信息分组的任何方法吗?