Question

我有一个问题，对你们中的许多人来说可能大部分都很简单。

在我的ruby on rails应用程序中，我会经常将20k +行数据导入数据库。发生这种情况的应用程序的组件是获取一个变量，该变量包含列表中的数据，循环遍历该变量，并在每一行上执行新的Model.create（数据）。

我注意到大约17k行数据需要1.5分钟左右。

基本上，它看起来与此类似：

@items = []
import_file = File.open('file')
data = import_file.read.split("\n")
data.each do |item|
   name = item.scan(/<name>(.*?)<\/name>)[0][0]
   address = item... etc
   @items << {
        :name => name,
        :address => address,
        etc
   }
end

@items.each do |row|
   Model.create(row)
end

在rails服务器控制台中进行监控时，我显然可以看到所有17k插入，并且在控制台中监控时也需要更长的时间来删除。

我确定这是非常低效的，所以我来看看是否有人有任何建议，或者这对于导入的数据量是否正常。

Answer 1

这种大量/大量插入的好方法似乎是activerecord-import。有人也提出了benchmark。

根据the introductory example你可以这样做：

@items = []
import_file = File.open('file')
data = import_file.read.split("\n")
data.each do |item|
   name = item.scan(/<name>(.*?)<\/name>)[0][0]
   address = item... etc
   @items << Model.new(
        :name => name,
        :address => address,
        etc
   )
end

Model.import(@items)

手动，单插入方式：

@items = []
import_file = File.open('file')
data = import_file.read.split("\n")
data.each do |item|
   name = item.scan(/<name>(.*?)<\/name>)[0][0]
   address = item... etc
   @items << "(#{name}, #{address},...)"
end

sql = "INSERT INTO models (`name`, `address`, ...) VALUES #{@items.join(", ")}"
ActiveRecord::Base.connection.execute(sql)

Ruby on Rails - 插入数据库时的效率

1 个答案:

Ruby on Rails - 插入数据库时​​的效率

1 个答案:

Ruby on Rails - 插入数据库时的效率