根据业务实体(法定名称,业务类别,DNS域,公司类型)规范化数据

时间:2011-01-29 05:22:14

标签: web-services normalization wolframalpha

我正在尝试根据合法的商业实体名称规范化数据和链接记录。

我在哪里可以确定合法的商家名称以及该公司的一般信息?我将至少拥有以下其中一项:股票代码,DBA(短名称),DNS名称或完整的法定名称。

到目前为止,我已经发现了

  • 依赖whois给我私密或过时的信息
  • Wolfram Alpha API为我提供了public companies所需的大部分内容,但对像LEGO这样的private公司没什么帮助
  • 解析(c)符号的网页可能有助于解决过程,但名称与权威列表不匹配。

由于所有股票代码都被分类;那很容易。

如何为可能位于海外的非公开或非盈利业务转换,规范化和验证DBA(简称),DNS名称或完整法定名称?

(例如MET博物馆作为DBA,或metmuseum.org作为网站,或“大都会艺术博物馆”法律名称)

2 个答案:

答案 0 :(得分:1)

我不确定这是提出问题的最佳地点。也许你当地的图书馆员可以提供帮助。无论如何,我正在回答,因为我过去在这些方面做了很多工作,因为我发现程序员和数据库设计人员经常知道在哪里可以找到数据 - 尤其是权威和标准数据。

在地方一级(在美国),我们接受了当地商会给我们的任何东西。在国家层面,我们从InfoUSA购买了清单。商会数据可能相当不稳定; InfoUSA数据非常干净。

Dun & Bradstreet是我所知道的一站式全球商业登记处。它们并不便宜。

RBA,英国的一家公司,似乎有一个非常有用的介绍,具有全球视角。见Official Company Registers。大部分数据都是免费的。

答案 1 :(得分:1)

我一直在这方面做一些研究,并发现了一篇最近的论文,该论文讨论了一种提取,发现(通过聚类)和规范化(通过增强的编辑距离计算)组织名称的方法。 NEMO

相关问题