存储PI值的最佳数据库服务器是什么?

时间:2014-11-15 22:02:32

标签: database rdbms pi nosql

说1亿个数字,一个字符串。 目的是查询DB以查找搜索字符串的重复发生。 虽然我知道MySQL中的LONGTEXT类型允许存储字符串,但我不确定查询子字符串实际上是否会产生可接受的性能。 NoSQL键值模型会表现得更好吗? 任何建议,经验(不一定是PI ..)。

1 个答案:

答案 0 :(得分:2)

这可能会让你走错方向但是......

使用MySQL似乎是一种解决在文件中查找字符串的特定问题的高开销方法。

100M位,每个8字节,仅为100MB。在Python中,您可以将文件写为字节序列,每个字节代表一个ascii数字。或者,您可以将它们打包成半字节(4位将覆盖数字0-9)。

在Python中,您可以使用以下方式读取文件:

fInput = open(<yourfilenamehere>, "rb")
fInput.seek(number_of_digit_you_want)
fInput.read(1)  # to get a single byte

由此可以轻松构建搜索解决方案以寻找特定的字符串。

同样,mySQL可能是要走的路,但是对于你的应用程序,一个非高开销的方法可能就是这个。