热门文章 - 第1738页 - 比格导航

当前位置：网站首页 > 热门文章

大数据Hadoop之——Apache Hudi 与 Presto/Trino集成: 一、概述ApacheHudi是一个快速增长的数据湖存储系统，可帮助组织构建和管理PB级数据湖。Hudi通过引入诸如升序、删除和增量查询之类的原语，将流式处理引入到批处理式大数据中。这些功能有助于在统...

2021版大数据知识点之Presto: 1.什么是prestopresto是一个开源的分布式的查询引擎，基于内存，它本身不接入数据，可以连接多种数据源，例如Hive,Mysql,Kafka,MongeDB等，一条Presto查询可以将多...

Hive架构及搭建方式: Hive架构及搭建方式[TOC]前言本文档基于hive3.1.2编写hive的基础知识基本架构整个hive由hiveserver2和hive客户端组成hive客户端有三种，beeline、使用j...

数据导入——通过外部表同步数据: Doris可以创建外部表。创建完成后，可以通过SELECT语句直接查询外部表的数据，也可以通过INSERTINTOSELECT的方式导入外部表的数据。Doris外部表目前支持的数据...

0318-如何为Presto集成Kerberos环境下的Hive: 温馨提示：如果使用电脑查看图片不清晰，可以使用手机打开文章单击文中的图片放大查看高清原图。Fayson的github：https://github.com/fayson/cdhproject提示：代码...

Flink CDC connect DB To Hive: 1.FlinkCDC是什么？做数仓的伙伴们都知道第一步就是考虑如何"入仓"或者"入湖".同步方式细分下来有四种，全量、增量、新增及变化、缓慢变化。实际生产中大部分...

「大数据系列」:Apache Hive 分布式数据仓库项目介绍: ApacheHive?数据仓库软件有助于读取，编写和管理驻留在分布式存储中的大型数据集并进行查询使用SQL语法。Hive特性Hive构建于ApacheHadoop?之上，提供以下功能：通过SQL...

京东:Flink SQL 优化实战: 本文作者为京东算法服务部的张颖和段学浩，并由ApacheHivePMC，阿里巴巴技术专家李锐帮忙校对。主要内容为：1.背景2.FlinkSQL的优化3.总结一、背景目前，京东搜索推荐的数据处...

Flink源码分析之深度解读流式数据写入hive: 前言数据流处理详解StreamingFileWriter简述StreamingFileSink分区信息提交总结前言前段时间我们讲解了flink1.11中如何将流式数据写入文件系统和hive[flin...

Flink1.11+Hive批流一体数仓: 导读：Flink从1.9.0开始提供与Hive集成的功能，随着几个版本的迭代，在最新的Flink1.11中，与Hive集成的功能进一步深化，并且开始尝试将流计算场景与Hive进行整合。本文主要分享在...

‹‹ ‹ 1734 1735 1736 1737 1738 1739 1740 1741 1742 1743 › ››

一周热门

控制面板: 您好，欢迎到访网站！
登录后台查看权限

网站分类

热门文章

最新留言

首页
收录
顶部