大数据入门之Presto/Trino

在这里插入图片描述

Presto是由Facebook开发的分布式sql查询引擎，用来进行高速、实时的数据查询
Presto的产生是为了解决Hive的MapReduce模型太慢且不能通过BI等工具展现HDFS的问题
Presto是一个计算引擎，它不存储数据，通过丰富的connector获取第三方服务的数据，并支持扩展。可以通过连接Hive，来实现快速query hive table
可以跨数据源进行联合查询

查询例子:

# 联合查询hive的表和mysql的表
select * from hive.testdb.tableA a join mysql.testdb.tableB b
where a.id = b.id

show catalogs
show schemas

Presto 数据模型:

2020年12月PrestoSQL 更名为 Trino，所以Trino实际上是Prestode rebrand，至于为什么？参考

说到底是Presto在Facebook的几个核心创始人员和公司闹掰了，然后出去后创立了新的公司为了Presto/Trino的发展。但是Facebook已经注册了Presto的商标权，所以不得已只能改名字了。

在这里插入图片描述

标签：大数据 hadoop trino

本文转载自: https://blog.csdn.net/u011563903/article/details/127173194
版权归原作者 Frank范 所有，如有侵权，请联系我们删除。