将PATSTAT csv导入SAS

时间:2018-03-12 17:35:30

标签: csv sas

当我将TLS201_APPLN.csv表格PATSTAT数据库导入SAS 9.4(Unicode支持)时,很多类似的代码如下所示。我该怎么做才能解决它?

NOTE: Invalid data for appln_nr_original in line 5286 53-65.
RULE:     ----+----1----+----2----+----3----+----4----+----5----+----6----+----7----+----8----+---
5286      6697,AT,2007000486,W ,2007-10-17,2007,WO2007AT00486,AT2007/000486,PI,0,Y,N,N,2006-12-22,
      89  2006,1110640,2008-07-03,2008,6698,0,38109624,4532,10,2,2,1 146
appln_id=6697 appln_auth=AT appln_nr=2007000486 appln_kind=W appln_filing_date=2007-10-17
appln_filing_year=2007 appln_nr_epodoc=WO2007AT00486 appln_nr_original=. ipr_type=PI
internat_appln_id=0 int_phase=Y reg_phase=N nat_phase=N earliest_filing_date=2006-12-22
earliest_filing_year=2006 earliest_filing_id=1110640 earliest_publn_date=2008-07-03
earliest_publn_year=2008 earliest_pat_publn_id=6698 granted=0 docdb_family_id=38109624
inpadoc_family_id=4532 docdb_family_size=10 nb_citing_docdb_fam=2 nb_applicants=2 nb_inventors=1
_ERROR_=1 _N_=5285

提前致谢。

1 个答案:

答案 0 :(得分:1)

apln_nr_original

中将导入修复为正确就绪

请注意下面的粗体部分。

所以我计算了变量的数量,我认为它是第8个变量,看起来应该是,记录中的AT2007 / 000486。但是,当它实际上是一个字符变量时,SAS将它视为。,这意味着它认为它应该是数字。所以你需要修改你的代码来解决这个问题。我建议怎么做,但你没有包含任何代码。

注意:第5286行53-65中 appln_nr_original 的数据无效。 规则:---- + ---- 1 ---- + ---- 2 ---- + ---- 3 ---- + ---- 4 ---- + --- -5 ---- ---- + ---- 6 + ---- ---- 7 ---- + 8 ---- + --- 5286 6697,AT,2007000486,W,2007-10-17,2007,WO2007AT00486, AT2007 / 000486 ,PI,0,Y,N,N,2006-12-22,       89 2006,1110640,2008-07-03,2008,6698,0,38109624,4532,10,2,2,1 146

appln_id = 6697 appln_auth = AT appln_nr = 2007000486 appln_kind = W appln_filing_date = 2007-10-17 appln_filing_year = 2007 appln_nr_epodoc = WO2007AT00486 的 appln_nr_original = ipr_type = PI