根据spark数据框中的键值进行过滤

时间:2017-01-23 10:21:36

标签: apache-spark apache-spark-sql spark-dataframe

我的数据库/数据框中有一个列,它是一个键值对。我想根据特定值过滤数据。 只说密钥'ddd'的值为'DDD'的行。 怎么能在spark / spark sql中实现呢?

"{'aaa': 'AAA', 'bbb': 'BBB', 'ccc': 'CCC', 'ddd': 'DDD', 'eee': 'EEE', 'fff': 'FFF', 'ggg': 'GGG'}"
 "{'aaa': 'AAA1', 'bbb': 'BBB1', 'ccc': 'CCC1', 'ddd': 'DDD1', 'eee': 'EEE1', 'fff': 'FFF1', 'ggg': 'GGG1'}"

1 个答案:

答案 0 :(得分:2)

我们可以像下面这样使用过滤功能

     DataFrame inputDf= //read from database

     DataFrame filteredDf=inputDf.filter("ddd='DDD'");
相关问题