大数据 - overfit.cn

【大数据原理与技术】期末习题总结大全，建议收藏

📢📢题目来源于B站，慕课网，百度，适用于期末复习，内容仅供参考，祝大家考试顺利！MapReduce体系结构主要由四个部分组成，分别是：Client、JobTracker、TaskTracker以及Task。

overfit同步小助手 2023-06-28 16:04:31 0 收藏

vue大屏可视化自适应完美方案

其实我们常见的1920*1080（1080P）、2k、4k...都是16：9的比例，在做项目之前我们需要搞清楚客户的数据可视化平台需要在什么屏幕下展示，确定了实际屏幕比例，按照实际屏幕比例选择一个设计稿尺寸进行设计，设计稿出来后前端严格按照设计稿px进行开发页面即可（前提是按照下列适应方案进行开发）

overfit同步小助手 2023-06-28 16:03:36 0 收藏

Hadoop和Hive的关系

overfit同步小助手 2023-06-28 15:04:32 0 收藏

Java连接ES的多种方式

本篇文章主要介绍，使用Basic、Transport、Kerberos三种方式连接ES，脚本为Java

overfit同步小助手 2023-06-28 15:04:05 0 收藏

【ES】search_phase_execution_exception 出现这个异常的可能情况

search_phase_execution_exception

overfit同步小助手 2023-06-28 13:04:34 0 收藏

2022 大一大二基础hive考试题

10. HDFS是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是__________一次写入，多次读写。1.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤中进行的？2.为数据的总体分布建模，把多维空间划分成组属于数

overfit同步小助手 2023-06-28 11:04:55 0 收藏

《大数据技术原理与应用》期末复习

桂林电子科技大学三院大数据课程复习笔记考试范围：教材:《大数据技术原理与应用》第三版林子雨第1章：大数据概述 ????第2章：大数据处理架构Hadoop ????第3章：分布式文件系统HDFS ????第4章：分布式数据库HBase第5章：NoSQL数据库第6章：云数据库第7章：MapRed

overfit同步小助手 2023-06-28 11:04:46 0 收藏

Spark 下载、安装与配置

Apache Spark 是一个快速的通用集群计算系统。它提供了Java， Scala， Python ，R 四种编程语言的 API 编程接口和基于 DAG 图执行的优化引擎。它还支持一系列丰富的高级工具：处理结构化数据的 Spark SQL，用于机器学习的 MLlib，控制图、并行图操作和计算的一

overfit同步小助手 2023-06-28 11:04:37 0 收藏

elasticsearch中的聚合分组查询

分组聚合及嵌套查询聚合查询可以理解为SQL中的求和、求最大值、最小值以及求均值的需求嵌套可以理解为es存值的某一个字段为对象属性的值做处理.Elasticsearch Java API分组与聚合结合需要对多个字段分组需要将分组结果的其他字段再进行统计的sum、min、max、avg聚合只聚合不分组简

overfit同步小助手 2023-06-28 11:04:21 0 收藏

python hdfs远程连接以及上传文件，读取文件内容，删除文件

python hdfs远程连接以及上传，读取，删除文件

overfit同步小助手 2023-06-28 09:04:27 0 收藏

Mysql表数据创建3种触发器更新数据

3个触发器的功能都是一样的，数据新增、更新、删除重新统计数据更新到另一张表。

overfit同步小助手 2023-06-28 09:04:12 0 收藏

AI自动写文章平台推荐，免费在线原创文章生成器

AI自动写文章平台推荐，免费在线原创文章生成器。这些平台能通过强大的自然语言模型来一键生成各种内容，不仅在营销服务领域有很强的竞争力，同时也为个人和企业提供了一站式的内容创作需求。

overfit同步小助手 2023-06-28 08:04:48 0 收藏

Flink CDC整库同步（多表异构同步）

flinkcdc整库（多表异构）同步方案

overfit同步小助手 2023-06-28 08:04:05 0 收藏

大数据相关概念了解

Apache Hadoop软件库是一个框架，允许使用简单的编程模型在计算机集群之间对大型数据集进行分布式处理。它旨在从单个服务器扩展到数千台计算机，每台计算机都提供本地计算和存储。库本身不是依靠硬件来提供高可用性，而是旨在检测和处理应用程序层的故障，因此在计算机群集（每台计算机都可能容易出现故障）之

overfit同步小助手 2023-06-28 06:03:41 0 收藏

ES常见问题(1)-解决ElasticSearch每次只能返回10条数据

overfit同步小助手 2023-06-28 03:03:50 0 收藏

大数据大作业（课程设计）

本课题为信息爬取字数及可视化，首先使用Python编程爬取了凤凰网门户网站新闻栏目22/7/26—7/28三天内的新闻信息，其次，将爬取的新闻整合为一个文件，然后使用Python编程对文件进行分词处理并且可以获取词云，接下来将该文件上传至hadoop平台，利用MapReduce框架编程完成了字数统计

overfit同步小助手 2023-06-28 02:04:22 0 收藏

Hive（番外）：Hive可视化工具IntelliJ IDEA

Sublime、Emacs 、EditPlus、UltraEdit、Visual Studio Code等有些不支持作为客户端连接Hive服务，但是支持SQL语法环境，那就再编辑器中开发SQL,复制到Hive CLI执行；IntelliJ IDEA、DataGrip、Dbeaver、SQuirre

overfit同步小助手 2023-06-28 00:04:25 0 收藏

【2023 AI 写作工具大盘点】国内外 45 款免费 AI 写作神器汇总，轻松成为创作高手！

未来百科旨在帮助用户发现全球最好的AI工具，同时为研发AI垂直应用的创业公司提供展示窗口，迎接未来的AI时代。未来百科，每天带你了解好玩儿的AI工具。欢迎探索更多写作工具。

overfit同步小助手 2023-06-27 22:02:01 0 收藏

Hadoop的shuffle过程及调优

今天这章，我们详细介绍了 Shuffle 过程，关注 Shuffle 过程的性能对整个 MR 作业的性能调优至关重要。经过这章的介绍，我们能够掌握 Shuffle 过程的关键技术点，虽然还不算深入。同时，我们介绍了常见的参数以及调优方法，希望能够在实际应用中不断的尝试、总结，写出性能最佳的任务。

overfit同步小助手 2023-06-27 16:04:42 0 收藏

大数据项目之电商数据仓库系统

overfit同步小助手 2023-06-27 13:04:35 0 收藏