如何在Perl中索引一堆文件?

时间:2009-10-20 17:45:21

标签: perl search indexing

我正在尝试通过首先查找未引用的对象来清理数据库。我已将所有数据库对象解压缩到一个列表中,并将所有ddl代码解压缩到文件中,我还拥有该项目的所有Java源代码。

基本上我想要做的事情(最好是在Perl中,因为它是我最熟悉的脚本语言)是以某种方式索引所有提取的数据库ddl和Java文件的内容(以加快搜索速度),步骤通过数据库对象列表,然后搜索所有文件(使用索引),查看是否在任何地方引用这些对象并创建报告。

如果你能指出我正确的方向找到能够以我可以搜索它们的方式索引所有这些文件的东西(最好是在Perl中),我将非常感激。 这里的关键是能够以编程方式执行此操作,而不是手动执行(使用Google桌面搜索等方式)。

2 个答案:

答案 0 :(得分:2)

将任务分解为步骤并从头开始。首先,记录是什么样的,以及它中的哪些信息将它连接到另一条记录?解析该记录,存储其唯一标识符及其引用的内容列表。

获得该列表后,将其反转。对于每个引用,创建引用的对象列表。按标识符计算它们。你应该能够获得计数为零的那些。

这是一个非常普遍的答案,但你提出了一个非常笼统的问题。如果您遇到问题,请将其分解为其中一个步骤并提出更具体的问题,提供样本数据和您迄今为止尝试过的代码。

祝你好运,

答案 1 :(得分:0)

你可能用来做你想要的一个有趣的模块是KinoSearch,它为你提供了你所要求的那种索引。然后,您可以浏览对象标识符并检查是否有对它的引用。