大数据 - overfit.cn

Hadoop HDFS的特点与优缺点

overfit同步小助手 2023-05-13 04:03:47 0 收藏

大数据技术(入门篇) --- 使用 Spring Boot 操作 CDH6.2.0 Hadoop

本人是web后端研发，习惯使用spring boot 相关框架，因此技术选型直接使用的是spring boot，目前并未使用 spring-data-hadoop 依赖，因为这个依赖已经在 2019 年终止了，可以点击查看，所以我这里使用的是自己找的依赖，Hadoop是一个由Apache基金会所开

overfit同步小助手 2023-05-13 03:03:49 0 收藏

毕业设计-基于大数据的房地产数据分析与预测-python

毕业设计-基于大数据的房地产数据分析与预测-python:房地产业作为对国民经济和城市经济发展具有重大影响的产业部门，在发展中面临诸多问题，需要政府及有关部门在对房地产市场发展进行正确预判的基础上科学决策、积极引导，促进房地产业的健康发展。房地产市场拥有着海量的数据积累，房地产市场分析都将

overfit同步小助手 2023-05-13 02:03:58 0 收藏

绿色的工厂认证条件

（6）可作为绿色准入条件的通行证：如：获得绿色工厂或绿色产品的企业可以优先获得在京东、国美、居然之家、能效标识平台、水效标识平台等平台进行宣传推广的机会，并提供给政府有关部门作为《绿色发展指标体系》中绿色产品市场占有率指标的统计参考。5、环境排放情况，大气、水体污染物、固体废弃物、噪声、温室气体的排

overfit同步小助手 2023-05-13 02:03:53 0 收藏

flume入门案例

overfit同步小助手 2023-05-13 02:03:40 0 收藏

基于SSM框架的智能物流管理系统设计与实现

摘要近些年，互联网行业的发展带给了很多人在生活上的便利，互联网能够改变人们的生活和工作的模式。很多企业都在将普通的工作模式结合了互联网，利用互联网的优势提高管理员的工作效率。目前不少智能物流管理系统存在着许多问题，因此根据物流行业的特点，可以设计一个智能物流管理系统提高管理员的工作效率。本系统所

overfit同步小助手 2023-05-13 00:04:07 0 收藏

Flink中遇到的问题

解决遇到的一些问题

overfit同步小助手 2023-05-13 00:03:53 0 收藏

doris安装部署-通过docker部署doris集群

通过docker配置Doris集群：一个FE+三个BE，使用doris版本1.1.5。

overfit同步小助手 2023-05-12 23:03:58 0 收藏

《Spark编程基础Scala版》第一章习题答案

在物理上HBase其实是按CF存储的，只是按照Row-key将相关CF中的列关联起来Hbase对数据的存储方式和数据结构进行的修改和规整（K-V形式），使其更加善于去处理大数据的场景，此在Hadoop MapReduce运行计算时能够提供更好的底层支持。因此，在许多企业实际应用中，Hadoop和Sp

overfit同步小助手 2023-05-12 22:03:48 0 收藏

数据库同步有哪些方式？【怎么保障目标和源数据一致性】

数据库同步有3大难题：1是如何保障目标和源数据一致性；2是异构数据库如何做数据类型转换，导致数据同步失败的原因常常是因为数据类型不一样；3是在数据越实时越有价值的背景下，同步过程中能否做到实时同步。

overfit同步小助手 2023-05-12 21:03:47 0 收藏

2017年MathorCup数学建模B题共享单车解题全过程文档及程序

overfit同步小助手 2023-05-12 20:04:09 0 收藏

Hudi的核心概念 —— 索引（Index）

事实上，有范围裁剪功能的布隆索引是最佳的解决方案。从 index 的维护成本和写入性能的角度考虑，维护一个 global index 的难度更大，对写入性能的影响也更大，所以需要 non-global index。上图为例，白色是基本文件，黄色是更新数据，有了索引机制，可以做到：避免读取不需要的文件

overfit同步小助手 2023-05-12 20:04:00 0 收藏

什么是web3？未来趋势？怎么学？

1. 块链基础知识和技术。6. 加密货币和加密经济。3. 分布式Web开发。

overfit同步小助手 2023-05-12 20:03:53 0 收藏

Hive安装与配置及常见问题解决

对Hadoop系统的hive组件的安装与配置

overfit同步小助手 2023-05-12 17:03:46 0 收藏

大数据平台之数据存储

大数据之数据存储技术

overfit同步小助手 2023-05-12 16:03:50 0 收藏

Alluxio安装部署

Alluxio 是世界上第一个虚拟的分布式存储系统，以内存速度统一了数据访问。它为计算框架和存储系统构建了桥梁，使应用程序能够通过一个公共接口连接到许多存储系统。Alluxio以内存为中心的架构使得数据的访问速度能比现有方案快几个数量级。简单来说，Alluxio是一个分布式文件系统，是数据驱动框架或

overfit同步小助手 2023-05-12 16:03:47 0 收藏

Hadoop集群安装和搭建（从零开始超级超级详细的过程）（上）

overfit同步小助手 2023-05-12 15:04:08 0 收藏

万亿数据秒级响应，Apache Doris 在360 数科实时数仓中的应用

从 2022 年3月份开始进行对实时数仓沟通进行调研，7月份正式上线生产，集群数据规模快速增长。目前，生产环境共有 2 个集群，数百张表，几十 TB 数据，每日有数百个同步工作流在运行，几十亿规模的数据新增/更新。在此规模下，Doris 对业务支持良好，稳定运行。Doris 集群架构清晰简单，不依赖

overfit同步小助手 2023-05-12 13:04:09 0 收藏

git 拉取远程代码（小白教程）以及一些小问题

首先用 [ git clone (url) ] 克隆项目拉取修改后项目文件用 [ git pull ]修改文件后 [ git add ] 并提交和注释 [ git commit -m ]最后将文件推送到项目 [ git push ]

overfit同步小助手 2023-05-12 11:04:37 0 收藏

2023年最新交通航线（飞机、高铁）信息数据合集（含经纬度匹配）

overfit同步小助手 2023-05-12 11:04:03 0 收藏