搜索效率 - 比较10个字节或一个30字节字符串哪个更快?

时间:2015-10-08 16:50:33

标签: database string performance hash numbers

我打算做一个情绪分析项目,网站前端使用它。它旨在分析​​Twitter帖子。分析的文件将被放入数据库中。

我要按照数据库中的搜索字词对检索到的帖子进行分组。

为了使数据库操作更快,我不想比较字符串中的搜索词,想法是将搜索词转换为数字并使用它们来查找数据库中的条目。

我想到的用数字转换字符串的函数如下:

  • a = 067
  • b = 068
  • ...
  • ab = 067068
  • abc = 067068069
  • abcd => i1 = 067068069,i2 = 070

这样,对于30长度的字符串,我需要10个整数。

所以2个问题: 1-如果没有任何碰撞,是否有更好的功能将30长度的字符串转换为数字?

2-如果没有这种情况,在拥有一百万个搜索字词的数据库中,每个项目比较10个整数或者每个项目比较30个长度字符串会更好吗?  像

这样的东西
Select from terms where i1 == search.i1 and i2 = search.i2 and ... i10 == search.i10

OR

Select from terms where term like search.term

感谢您的关注。

0 个答案:

没有答案
相关问题