Ruby 1.9 - 无效的多字节字符(US-ASCII)

时间:2010-09-09 15:44:18

标签: ruby ruby-on-rails-3 ascii

我试图让我的rails应用程序(2.3.5)在Ruby 1.9上运行,我有这个函数对字符串进行一些转换:

def replace_special_chars(downcase = true)
if downcase 
  string = self.downcase
else
  string = self
end
string.gsub! /á|ã|à|ä|â/, 'a'
string.gsub! /é|è|ë|ê/, 'e'
string.gsub! /í|ì|ï|î/, 'i'
string.gsub! /ó|õ|ò|ô|ö/, 'o'
string.gsub! /ú|ù|ü|û/, 'u'
string.gsub! /ç/, 'c'
string.gsub! /&/, 'e'
string.gsub! /\s/, '-'
string.gsub! /[^a-zA-Z_0-9-]/, ''
string.gsub! /-(-)+/, '-'
string
end

但是当我尝试启动服务器时,我收到了这个错误:

<internal:lib/rubygems/custom_require>:29:in `require':   
/Users/.../lib/nzn_string.rb:11: invalid multibyte char (US-ASCII) (SyntaxError)
/Users/.../lib/nzn_string.rb:11: invalid multibyte char (US-ASCII) 
/Users/.../lib/nzn_string.rb:11: syntax error, unexpected $end, expecting keyword_end
string.gsub! /á|ã|à|ä|â/, 'a'
                ^

来自:29:在'require'

在ruby 1.9上执行此操作的正确方法是什么? 我不知道我在这里失踪了什么

3 个答案:

答案 0 :(得分:122)

在该文件的顶部写下# encoding: utf-8。这会更改该文件utf-8中所有字符串/ regexp文字的默认编码。所有文字的默认编码为US-ASCII,不能代表á

答案 1 :(得分:3)

要在项目范围内进行,请尝试:magic_encoding gem。

答案 2 :(得分:0)

我认为你也可以将regexp从语法/ re /更改为语法(Regexp.new're',nil,'n')

例如,您提到的说明:

string.gsub! /á|ã|à|ä|â/,'a'

将成为:

string.gsub! (Regexp.new'á|ã|à|ä|â€,nil,'n'),'a'

此处有更多详情:

http://www.ruby-forum.com/topic/183413