Hadoop - overfit.cn

基于Hadoop的XXXX数据分析与可视化【毕设答辩常见问题汇总】

使用Pandas进行数据处理是由于它在数据科学社区中广泛的应用和支持，它可以让我快速地进行数据清洗、转换和分析，而且能够轻松处理内存中的大型数据集。我的系统采取了多层次的安全措施，包括网络层的加密、应用层的安全令牌和数据层的访问控制列表（ACLs）。为了解决这个问题，我实施了基于时间戳的数据版本控制

overfit同步小助手 2024-06-09 00:03:31 0 收藏

Hive的常规操作

overfit同步小助手 2024-06-08 22:03:27 0 收藏

【亲测】Hadoop 高可用集群搭建与开发环境部署

核心竞争力，怎么才能提高呢？成年人想要改变生活，逆转状态？那就开始学习吧~万事开头难，但是程序员这一条路坚持几年后发展空间还是非常大的，一切重在坚持。为了帮助大家更好更高效的准备面试，特别整理了《前端工程师面试手册》电子稿文件。

overfit同步小助手 2024-06-08 18:04:02 0 收藏

大数据之Hadoop图解概述

1）NameNode（nn）：存储文件的。

overfit同步小助手 2024-06-08 15:03:47 0 收藏

hive--字符串截取函数substr(),substring()

语法:返回值:string说明：返回字符串Ahiveselectsubstr'abcde'3cdehiveselectsubstring'abcde'3cdehiveselectsubstr'abcde'-1e语法:返回值:string说明：返回字符串A举例：hiveselectsub

overfit同步小助手 2024-06-08 12:03:37 0 收藏

Hadoop分布式计算框架（MapReduce）——案例实践：气象大数据离线分析

数据格式由Year(年)、Month(月)、Day(日)、Hour(时)、Temperature(气温)、Dew(湿度)、Pressure(气压)、Wind dir.(风向)、Wind speed(风速)、Sky Cond.(天气状况)、Rain 1h(每小时降雨量)、Rain 6h(每6小时降雨量

overfit同步小助手 2024-06-08 04:03:44 0 收藏

大数据技术之HBase（超级详细）

HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase的目标是存储并处理大型的数据，更具体来说是仅需使用普通的硬件配置，就能够处理由成千上万的行和列所组成的大型数据。本文主要介绍了关于HBase的原理概念

overfit同步小助手 2024-06-07 18:03:36 0 收藏

从零开始在openEuler上构建Hadoop

申请环境可以从PCL上申请，申请流程如下：申请完环境后就可以通过terminal登录辣~(xshell, mobaXterm, putty, 选一个你喜欢的)配置yum源。

overfit同步小助手 2024-06-07 17:03:57 0 收藏

Hive常见的面试题（十二道）

UDF（普通函数，⼀进⼀出，可以⽤于字符串处理、⽇期处理）第一种是比较简单的形式，继承 UDF 类通过 evaluate 方法实现，目前已过时。第二种是继承 GenericUDF 重写 initialize 方法、evaluate 方法、getDisplayString 方法实现。

overfit同步小助手 2024-06-07 17:03:48 0 收藏

使用Hadoop MapReduce计算成绩平均值

Hadoop MapReduce是一个分布式计算框架，常用于处理大规模数据集。本篇博客将介绍如何使用Hadoop MapReduce计算学生科目成绩的平均值。我们将通过编写Map和Reduce两个类来实现这个功能。通过以上步骤，我们成功编写了一个使用Hadoop MapReduce计算各科目成绩平均

overfit同步小助手 2024-06-07 11:03:12 0 收藏

hadoop的安装与配置

主机：master（192.168.10.3）从机：slave0（192.168.10.4）从机：slave1（192.168.10.5）

overfit同步小助手 2024-06-07 02:03:18 0 收藏

Hive SQL的各种join总结

join时的最后一个表会通过reducer流式传输，并在其中缓冲之前的其他表，因此，将大表放置在最后有助于减少reducer阶段缓存数据所需要的内存。包含左、右两个表的全部行，不管另外一边的表中是否存在与它们匹配的行在功能上，它等价于对这两个数据集合分别进行左外连接和右外连接，然后再使用。左表数据

overfit同步小助手 2024-06-06 23:03:42 0 收藏

大数据之Hive:regexp_extract函数案例

符号含义实列做为转意，即通常在"/"后面的字符不按原来意义解释如" * “匹配它前面元字符0次或多次，/a*/将匹配a,aa,aaa，加了”/"后，/a/* /将只匹配"a* "匹配任何一个字符匹配一个输入或一行的开头/^a/匹配"an A"，而不匹配"An a"匹配一个输入或一行的结尾/a$/匹配

overfit同步小助手 2024-06-06 21:03:38 0 收藏

一篇文章教会你如何搭建hive数据库

（此图为Apache Hive官网的截图，具体网址为Hive是基于Hadoop的数据仓库工具，可以用来对HDFS中存储的数据进行查询和分析。Hive能够将HDFS上结构化的数据文件映射为数据库表，并提供SQL查询功能，将SQL语句转变成MapReduce任务来执行。Hive通过简单的SQL语句实现快

overfit同步小助手 2024-06-06 20:03:43 0 收藏

Hadoop平台安装及运行————详细版搭建流程

如果已经存在/output 目录，就要先删除/output目录，再执行上述命令。另外，只要运行过 HDFS，Hadoop 的工作目录（本书设置为/usr/local/src/hadoop/tmp）就会有数据，如果需要重新格式化，则在格式化之前一定要先删除工作目录下的数据，否则格式化时会出问题。

overfit同步小助手 2024-06-06 09:03:40 0 收藏

Hive 基本操作命令与介绍

Hive是一个基于Hadoop的数据仓库工具，它提供了类似于SQL的查询语言HiveQL来对存储在Hadoop集群中的数据进行查询和分析。

overfit同步小助手 2024-06-06 07:03:50 0 收藏

Educoder中Hive综合应用案例——用户学历查询

Hive综合应用案例——用户学历查询

overfit同步小助手 2024-06-06 02:03:34 0 收藏

DBeaver连接含有Kerberos认证的集群的Hive表

以DBeaver为例，连接含有Kerberos认证的集群的Hive表。

overfit同步小助手 2024-06-06 01:03:43 0 收藏

计算机毕业设计Python+Spark知识图谱高考志愿推荐系统高考数据分析高考可视化高考大数据大数据毕业设计

overfit同步小助手 2024-06-05 23:03:45 0 收藏

hive中struct相关函数总结

2、named_struct(name1, value1, name2, value2, …)：创建一个 Named Struct 对象，由多个名称和对应的值组成。1、struct(field1, field2, …)：创建一个 Struct 对象，由多个字段组成。如何将上述struct类型的数据转

overfit同步小助手 2024-06-05 10:03:14 0 收藏