批量插入后如何从临时表中删除字符

时间:2016-09-28 20:32:27

标签: sql-server

我正在尝试从.csv文件中删除一些非常烦人的内联字符。我需要剥离! CR LF,因为这些是我的导入。我有一个试图摆脱垃圾的过程,但它似乎没有工作。这是代码:

    CREATE TABLE #Cleanup
(
    SimpleData nvarchar(MAX)
)
BULK INSERT #Cleanup from '**********************\myimport.csv' 
SELECT * FROM #Cleanup

DECLARE @ReplVar nvarchar(MAX)
SET @ReplVar = CONCAT(char(33),char(10),char(13),char(32))
UPDATE #Cleanup SET SimpleData = replace([SimpleData], @ReplVar,'') from #Cleanup

SELECT * FROM #Cleanup

我的计划是如果愚蠢的换行符被删除,第二个选择不应该在那里。文字看起来像

js5t,1599,This is this and that is t!
hat,asdf,15426

该行应该读

js5t,1599,This is this and that is that,asdf,15426

看到我的困惑?删除连续字符 !crlfsp 后,我将获取该临时表并将其输入到工作表中。

编辑以显示varbinary数据:

`0x

`0x

1 个答案:

答案 0 :(得分:1)

@seagulledge在对该问题的评论中说明CHAR(10)CHAR(13)出了问题是正确的,或者至少是部分正确的。回车(CR)为CHAR(13),换行(LF)为CHAR(10)

但是,阻止此工作的主要因素不是这两个字符的顺序:新行是一个简单的事实 - 无论是\r\n还是{\n 1}} - 位于传入CSV文件中,因此BULK INSERT命令假定换行符分隔输入行(这对它有意义)。可以看到问题中的VARBINARY输出。有两行输出,都以0x开头。

此问题只能通过在调用BULK INSERT之前修复传入的CSV文件来解决。这样,将删除错误嵌入的换行符,以便每行作为单行导入临时表。