大数据 - overfit.cn

Hadoop全分布式搭建

ctrl+alt切换定位到物理机/虚拟机可以用物理机截图# 检查内存 free -h# 检查磁盘空间 df -h# 检查 Java 版本 java -version需要传输jdk文件，就需要共享文件夹：挂载操作，然后，查看（注意：挂载后必须要再次进入/mnt/hgfs才能查看到共享的文件夹）验证安

overfit同步小助手 2024-01-07 02:03:41 0 收藏

SpringBoot基于大数据的智能家居销量数据分析系统（附源码）

随着智能家居销量的不断增加，如何对这些数据进行有效的分析和利用也成为了当前亟待解决的问题。因此，本文提出了一种基于大数据的智能家居销量数据分析系统的设计与实现。该系统主要分为前台和后台两个部分，用户可以通过前台进行注册登录、查看冰箱信息、获取智能家居资讯等操作，管理员则可以通过后台进行用户管理、家电

overfit同步小助手 2024-01-06 22:03:46 0 收藏

【项目实战】基于Hadoop大数据电商平台用户行为分析与可视化系统Hive、Spark计算机程序开发

overfit同步小助手 2024-01-06 20:03:28 0 收藏

Hadoop3教程（十四）：MapReduce中的排序

介绍了shuffle过程中的排序，关于排序是什么，有什么作用，在哪儿生效，以及有哪些分类，并对这些不同的排序分别贴了代码实现，也介绍了如何实现自定义排序

overfit同步小助手 2024-01-06 17:03:40 0 收藏

大数据机器学习TF-IDF 算法+SnowNLP智慧旅游数据分析可视化推荐系统

基于机器学习TF-IDF 算法SnowNLP大数据的智慧旅游数据分析可视化推荐系统通过数据采集、数据清洗、数据分析、数据可视化的技术，对景区数据进行爬取和收集。以旅游景点数据为基础分析景区热度，挖掘客流量、景区评价等信息，并对分析的结果进行统计。智慧旅游数据分析系统拟实现景区热度、景区展示、游客统计

overfit同步小助手 2024-01-06 16:03:48 0 收藏

Linux实战——Hadoop安装部署

1）Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2）主要解决，海量数据的存储和海量数据的分析计算问题。三类组件Hadoop HDFS：提供分布式海量数据存储能力Hadoop YARN：提供分布式集群资源管理能力Hadoop MapReduce：提供分布式海量数据计算能力。

overfit同步小助手 2024-01-06 16:03:37 0 收藏

HBase的增删改查

一种分布式、可扩展、支持海量数据存储的Nosql数据库。

overfit同步小助手 2024-01-06 15:03:52 0 收藏

基于地震数据的Spark数据处理与分析

5.根据经纬度获取地名针对全球重大地震数据进行分析，采用Python为编程语言，采用Hadoop存储数据，采用Spark对数据进行处理分析，并对结果进行数据可视化。

overfit同步小助手 2024-01-06 13:03:38 0 收藏

【完整思路】2023 年中国高校大数据挑战赛赛题 B DNA 存储中的序列聚类与比对

完整的思路分析可视化，免费获取～

overfit同步小助手 2024-01-06 13:03:26 0 收藏

ElasticStack日志分析平台－ES 集群、Kibana与Kafka

overfit同步小助手 2024-01-06 12:03:44 0 收藏

Spark大数据分析与实战笔记（第二章 Spark基础-04）

这句来自现代作家安妮宝贝的经典句子，它表达了对他人的赞美与崇拜。按回车键提交Spark作业后，观察Spark集群管理界面，其中“Running Applications”列表表示当前Spark集群正在计算的作业，执行几秒后，刷新界面，在Completed Applications表单下，可以看到当前

overfit同步小助手 2024-01-06 09:03:38 0 收藏

Flink Connector 开发

Flink里预定义了一部分source和sink。在这里分了几类。

overfit同步小助手 2024-01-06 08:03:17 0 收藏

Flink任务实战优化

一个好产品，功能应该尽量包装在服务内部；对于Flink而言，无疑是做到了这一点。但是用户在使用Flink的时候，依然可以从版本的选择、代码逻辑、资源参数、业务的数据情况等方面做任务级的定制化优化；用最合理的资源使用，保障实时性、稳定性和最佳Tps的处理能力

overfit同步小助手 2024-01-06 08:03:13 0 收藏

eBay自养号测评：提升销量与排名的安全可控之道

通过合理的拍卖设置，卖家可以吸引更多的潜在买家，提高商品的曝光率和销售量。这些活动包括限时折扣、关联营销、满减优惠、优惠券活动等，通过这些活动，卖家可以增加店铺的流量，提高商品的曝光率，并最终提升交易达成率。为了获得更多的流量倾斜，卖家需要持续保持商品的刊登和上新，同时保持卖家中心的活跃度。通过合理

overfit同步小助手 2024-01-06 06:06:42 0 收藏

Hive04_DDL操作

因此，使用内部表时，Hive会自动管理表的数据和元数据，而使用外部表时，则需要人工管理表的数据文件，但是可以让多个 Hive 实例共享同一个数据文件。通常情况下，如果数据只会被 Hive 使用，建议使用内部表，而如果数据需要被其他程序或服务使用，建议使用外部表。

overfit同步小助手 2024-01-06 03:03:17 0 收藏

「大数据-0」虚拟机VMware安装、配置、使用、创建大数据集群教程

文章包含的内容有：虚拟机VMware安装、配置、使用；创建大数据集群；设置三台Linux虚拟机的主机名和固定IP；在Linux系统以及本机系统中配置主机名映射；配置服务器之间root用户的SSH免密互通；安装配置JDK环境；关闭防火墙和SELinux；更新时区和同步了时间，拍摄快照保存状态。

overfit同步小助手 2024-01-05 23:03:31 0 收藏

Flink去重计数统计用户数

使用flink回撤流去重统计支付用户数

overfit同步小助手 2024-01-05 22:03:35 0 收藏

【EI会议征稿】2024年第四届人工智能、自动化与高性能计算国际会议（AIAHPC 2024）

本次会议主要围绕“人工智能、自动化与高性能计算”的最新研究展开，旨在荟聚世界各地该领域的专家、学者、研究人员及相关从业人员，分享研究成果，探索热点问题，交流新的经验和技术。我们热烈欢迎相关领域专家学者向AIAHPC 2024提交他们的新研究或技术贡献，与来自世界各地的科学家和学者分享宝贵的经验！本会

overfit同步小助手 2024-01-05 21:01:38 0 收藏

python-大数据分析-基于大数据的QQ音乐数据分析系统设计与实现

【python-大数据分析-毕业设计】基于大数据的QQ音乐数据分析系统设计与实现讲解+源码+论文+ppt 详细咨询V：chen177396或yyhh1234nn

overfit同步小助手 2024-01-05 20:03:53 0 收藏

金融大数据入门：走进数字化金融的未来

随着信息时代的来临，金融行业迎来了一个全新的时代——数字化金融时代。在这个时代中，金融大数据成为了驱动创新、优化决策的核心引擎。本文将深入探讨金融大数据的核心概念、关键技术、应用场景，并为初探者提供了一条逻辑清晰的学习路径。金融大数据不仅仅是庞大的数据集合，更是一种新型的资产，是从金融业务中产生的多

overfit同步小助手 2024-01-05 17:03:48 0 收藏