在数据库中优化字符串聚合

时间:2014-07-10 07:51:06

标签: database sqlite database-design

我正在进行一些日志文件解析,目的是通过Web应用程序访问结果。我想在我的数据库中创建一个速度优化(用于Select查询)数据结构,但也不会太大(文件大小;我使用SQLite)。

输入

日志的简化示例:

timedate,           num1,   num2,   text_value
2014-05-06 18:00,   2,      1,      alpha
2014-05-07 06:00,   2,      0,      alpha, gamma
2014-05-07 12:00,   2,      5,      gamma
2014-05-07 18:00,   2,      4,      beta

注意:我没有& t&无法了解text_value的所有可能值!

注意2:尽管不太可能,但在初始运行后,可能必须解析/添加任何给定日期的新日志行。

输出

我可以很好地处理数值数据 - 我将其聚合起来,所以我在数据库中最终得到这样的表:

date,       num1,   num2    text_value (type = array (I know there's no such type))
2014-05-06, 2,      1       [alpha*1]
2014-05-07, 6,      9       [alpha*1], [gamma*2], [beta*1]

但我如何处理字符串?我不能算数,因为我不知道所有可能的价值。

修改

显然,上述输出在text_value的数据库中不起作用。我需要存储text_value中每次出现的字符串的数量,那么我该如何存储呢?

任何人都可以建议我应该使用哪种表格结构用于非求和数据。我有什么选择?

由于

0 个答案:

没有答案