【问题标题】:Hive query equivalent of sqlHive 查询等价于 sql
【发布时间】:2014-07-02 10:22:01
【问题描述】:

您好,我有一个表学生如下:

student_id course_id
1111       100
2222       101
3333       101
4444       102
5555       103

还有一个课程表如下:

course_id course_desc
100       Electronics
101       Computer
102       Mechanical

如果我想加入上述 2 个表,我有来自学生表的 course_id,它没有在课程表中列出。因此,每次我加入时,我都应该将 course_id 与课程表进行比较,并知道学生表中有一个新的 course_id。

我相信我们可以使用 Sql,例如:

select DISTINCT course_id from students WHERE course_id NOT IN ( select course_id FROM courses);

如何在 Hive 中完成此操作,非常感谢任何帮助或建议。

【问题讨论】:

    标签: sql hadoop hive hql hdfs


    【解决方案1】:

    这应该可行:

    select students.course_id from students students LEFT OUTER JOIN courses courses  ON (students.course_id = courses.course_id) where courses.course_id is null;
    

    我认为不支持 NOT IN,因此可以解决此问题。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-08-04
      • 2021-11-11
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多