在哪里找到具有已用dbpedia属性概念注释的文字数据的数据集(其范围在float或int范围内)?

时间:2019-05-15 11:42:58

标签: dataset ontology dbpedia

我正在一个项目中尝试将char* military_time = "12345678"; 概念映射到表数据列。具体来说,我想映射文字(数字值; float,int ..)。因此,我需要足够数量的数据来构建背景知识库。在本说明的结尾,我从DBpedia中提取了一些数据作为给定格式。实际上,我应该将它们用作测试的基准,并且它只包含整个表中少于20列的内容。谁能帮我找到这样的字面值和T2D-golden-dataset带注释的数据集?

文学价值的dbpedia范围;

dbpedia

具有这些范围的某些属性;

"http://www.w3.org/2001/XMLSchema#float"
"http://www.w3.org/2001/XMLSchema#integer"
"http://www.w3.org/2001/XMLSchema#positiveInteger"
"http://www.w3.org/2001/XMLSchema#integer"

我需要找到或以某种方式生成的示例示例是一个与上述概念相对应的数组。举个例子;

"http://dbpedia.org/ontology/speaker",
"http://dbpedia.org/ontology/ranking",
"http://dbpedia.org/ontology/humanDevelopmentIndex",
"http://dbpedia.org/ontology/numberOfPlatformLevels",
"http://dbpedia.org/ontology/enginePower",
"http://dbpedia.org/ontology/graySubject",
"http://dbpedia.org/ontology/shareOfAudience",
"http://dbpedia.org/ontology/percentageLiteracyWomen",.........

我不需要那种确切的格式。如果我能找到足够数量的 "http://dbpedia.org/ontology/enginePower" : ["220", "125", "1300",....], "http://dbpedia.org/ontology/humanDevelopmentIndex" : ["0.34", "0.78", "0.98", ...] 的数据表作为T2D golden dataset给出,那就太好了。

1 个答案:

答案 0 :(得分:0)

This query使您踏上了第一步,因为它为<http://dbpedia.org/ontology/populationTotal>带来了100 typed literal values,它们都被键入为<http://www.w3.org/2001/XMLSchema#nonNegativeInteger>-

PREFIX  dbo:  <http://dbpedia.org/ontology/>

SELECT DISTINCT ?value
WHERE 
  { ?subject dbo:populationTotal ?value } 
LIMIT 100

This rather more complex (and expensive) query使您something like the end result I think you want -但是您将需要多次运行它,一次只有几个谓词,才能从公共端点获得所需的一切。如果需要,您可以spin up your own DBpedia mirror instance in the AWS cloud,并调整Virtuoso的超时时间和其他限制,以构建并运行一个查询来提供一个庞大的结果集。

PREFIX  xsd:  <http://www.w3.org/2001/XMLSchema#>
PREFIX  dbo:  <http://dbpedia.org/ontology/>

SELECT # DISTINCT ?predicate ?value ?value_type ?value_str
                  ?predicate ?value_type ( GROUP_CONCAT ( DISTINCT ?value_str ; separator=", " ) AS ?values )
WHERE 
  { ?subject  ?predicate  ?value 
    VALUES ( ?predicate ) { ( dbo:numberOfPlatformLevels )
                            ( dbo:shareOfAudience )
                            ( dbo:populationTotal ) 
                          }
      BIND ( DATATYPE ( ?value ) AS ?value_type )
      BIND (      STR ( ?value ) AS ?value_str )
  } 
GROUP BY ?predicate ?value_type
ORDER BY ?predicate ?value_type
LIMIT 1000
相关问题