Hadoop - overfit.cn

Hadoop单词统计实践：结果分析全流程详尽指南

Hadoop的单词统计（Word Count）是一个经典的MapReduce示例，用于计算输入文本文件中每个单词出现的次数。本指南旨在帮助读者在搭建完Hadoop集群后运行单词统计程序，并最终分析输出结果，全程详细解析，帮助读者深入理解大数据处理的核心流程。通过虚拟机实现Hadoop单词统计是一个很

overfit同步小助手 2024-06-16 19:03:48 0 收藏

hive图形化客户端工具

并且重启hive服务时，要以root用户登录，使用命令 hive --service hiveserver2 启动hive服务。hive部署完成后，路径$HIVE_HOME/jdbc/hive-jdbc-3.1.3-standalone.jar有有完整的hive的jdbc驱动，直接使用即可。dbea

overfit同步小助手 2024-06-15 20:03:44 0 收藏

【Hadoop大数据技术】——Hive数据仓库（学习笔记）

Hive起源于Facebook，Facebook公司有着大量的日志数据，而Hadoop是实现了MapReduce模式开源的分布式并行计算的框架，可轻松处理大规模数据。然而MapReduce程序对熟悉Java语言的工程师来说容易开发，但对于其他语言使用者则难度较大。因此Facebook开发团队想设计一

overfit同步小助手 2024-06-15 19:03:35 0 收藏

Hadoop搭建

Hadoop是一个开源的、可运行与Linux集群上的分布式计算平台，用户可借助Hadoop存有基础环境的配置（虚拟机安装、Linux安装等），Hadoop集群搭建，配置和测试。

overfit同步小助手 2024-06-15 17:03:50 0 收藏

HDFS分布文件系统（Hadoop Distributed File System）

HDFS作为Hadoop生态中的核心组件之一，提供了可靠、高效、可扩展的数据存储服务。通过深入了解HDFS的原理、架构、特性和实战应用，我们可以更好地利用HDFS来处理和分析大数据，为企业创造更大的价值。同时，随着大数据技术的不断发展，HDFS也在不断地演进和完善，相信未来HDFS将在大数据领域发挥

overfit同步小助手 2024-06-15 12:03:38 0 收藏

Hadoop 华为P30手机评论画像的分析 --爬虫与java部分代码

这爬的是京东商城的数据，在京东搜一下华为p30找到商品点进去右键检查找到网络刷新一下页面在下面可以发现一个?appid开头的请求点进去发现评论的响应数据的json串，很好这样在处理数据的时候可以使用json函数对数据进行处理。点开标题找到这个请求的url 这个就是在python里爬虫所需的url

overfit同步小助手 2024-06-15 11:02:20 0 收藏

HBase完全分布式配置（下）hbase篇保姆级教程（近乎零基础跟着配也能配对）

配置前也是要确保前面都配置正确，把多余的jdk都删掉（不会删看笔者第一篇文章）

overfit同步小助手 2024-06-15 01:03:19 0 收藏

Hadoop 2.0：主流开源云架构（三）

本文讲解Hadoop2.0主流开源云架构，介绍Hadoop2.0的体系架构，包括公共组件Common、HDFS、Yarn和安全机制。

overfit同步小助手 2024-06-14 23:03:25 0 收藏

Hive的安装与配置

Hive的安装与配置第1关：Hive的安装与配置第2关：Hive Shell入门基础命令

overfit同步小助手 2024-06-14 22:03:49 0 收藏

hive_hql开发规范（SQL优化）

hive_hql开发规范（sql优化）

overfit同步小助手 2024-06-14 20:03:46 0 收藏

Hive实验报告

(Press y|Y for Yes, any other key for No) 表示是否拒绝 root 用户远程登录，在键盘输入 n 和回车，表示允许 root 用户远程登录。((Press y|Y for Yes, any other key for No)表示是否更改 root 用户密码，在

overfit同步小助手 2024-06-14 19:04:21 0 收藏

hive-批量导出表结构，导入表结构

将all_create_table.txt打开，批量将create table 替换成；create table ，如果建的是外部表，就需要将create external table 替换成;（因为导出的每个表后面并没有加分号，导入的数据，每个表的建表语句要以分号结尾）使用use 数据库名，进入某

overfit同步小助手 2024-06-14 15:03:25 0 收藏

【Hadoop伪集群安装——生产实习Day1】

（12）修改 start-yarn.sh文件（在hadoop-3.2.0/sbin目录下），在文件前面增加如下内容。（13）修改stop-yarn.sh 文件（在hadoop-3.2.0/sbin目录下），在文件前面增加如下内容。（10）修改start-dfs.sh文件（在hadoop-3.2.0/

overfit同步小助手 2024-06-14 11:03:39 0 收藏

大数据：淘宝用户行为分析完整报告（图片拿完整文件）

比如在运用MR处理数据的时候，由于自身机器的原因，本地开发的时候发生了出现了很多bug，但最终在小组成员的相互合作的情况下还有老师的帮助下，终于解决了bug。所以今后学习的时候，遇到报错不要慌，认真看报错的源头，善于发现错误，才会进步，在学习中要多做思维导图来有效的巩固知识点，把学过的东西有效的串联

overfit同步小助手 2024-06-14 05:03:54 0 收藏

【大数据】Hadoop集群搭建（8249字）

overfit同步小助手 2024-06-14 04:03:44 0 收藏

Hadoop 2.0：主流开源云架构（二）

本文讲解Hadoop2.0主流开源云架构，介绍Hadoop2.0简述和Hadoop2.0部署。

overfit同步小助手 2024-06-14 01:03:30 0 收藏

hive sql -- 看完就会了！

hive sql 学习

overfit同步小助手 2024-06-13 22:03:52 0 收藏

Hadoop+Spark大数据技术实验8 Spark SQL结构化

示例: gradedf.selectExpr("name", "name as names" ,"upper(Name)","Scala * 10").show(3)- 示例: gradedf.select("Name", "Class","Scala").show(3,false)修改名称：gra

overfit同步小助手 2024-06-13 20:03:37 0 收藏

hadoop的基础操作

hadoop是一个由基金会所开发的。hadoop的框架最核心的设计就是HDFS和MapReduce，HDFS为海量的数据提供了存储，MapReduce则为海量的数据提供了计算。hadoop具有高容错性，常部署在低廉的硬件上，而且它拥有高吞吐量，可以更好地访问应用程序中的数据，适合有着大数据集的应用程

overfit同步小助手 2024-06-13 17:03:51 0 收藏

Hive中left join 中的where 和 on的区别

overfit同步小助手 2024-06-13 12:03:31 0 收藏