大数据 - overfit.cn

数据分析毕业设计二手房数据爬取与分析可视化系统 -python

# 1 前言🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩 基于大数据招聘岗位数据分析

overfit同步小助手 2023-05-15 11:03:43 0 收藏

北大林亦波：探索AI+EDA新路径 | 青源专栏

导读：EDA（Electronic Design Automation，即电子设计自动化）工具可以让芯片设计从几十年前图纸上画线的体力活，变成软件里“素材排列组合+敲敲代码”的脑力活。EDA软件作为关键的芯片设计工具，是集成电路产业的一大基石，而这一领域长期由美国三巨头Synopsys、Cadenc

overfit同步小助手 2023-05-15 10:03:55 0 收藏

万字总结Zookeeper客户端Curator操作Api

curator是Netflix公司开源的⼀套Zookeeper客户端框架，和ZKClient⼀样，Curator解决了很多 Zookeeper客户端⾮常底层的细节开发工作，包括连接重连，反复注册Watcher和 NodeExistsException异常等，是最流⾏的Zookeeper客户端之⼀。从

overfit同步小助手 2023-05-15 10:03:50 0 收藏

大数据Doris（二）：Apache Doris 部署介绍

在部署Apache Doris时，从1.2.0版本往后，需要在部署BE的节点上调大单个JVM进程的虚拟机内存区域数量值以支撑更多的线程，BE 启动脚本会通过/proc/sys/vm/max_map_count 检查数值是否大于200W，否则启动失败。这里说的"文件"并非我们通常理解的文件，在Linu

overfit同步小助手 2023-05-15 10:03:41 0 收藏

2022数学建模“五一杯”B题题解+论文

同时，将系统一和系统二的温度，四个原矿参数作为输入，四个产品指标作为输出，利用bp神经网络训练它，用训练好的。第二小问在问题三输入输出数据中随机选取5组数据，用问题三中建立的bp神经网络模型来预测这5组数据中两个系统的温度与实际温度对比，来分析他们的准确性，得出结果较准确。第一小问经过数据处理后，我

overfit同步小助手 2023-05-15 09:03:51 0 收藏

Azkaban的安装部署

介绍：Azkaban 是个简单的批处理调度器，用来构建和运行Hadoop作业或其他脱机过程。整体包括三部分webserver、dbserver、executorserver。 Azkaban是由Linkedin开源的一个Java项目，批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组

overfit同步小助手 2023-05-15 08:03:59 0 收藏

数据库性能基准测试——TPCC、TPCH及TPCDS的区别

针对数据库不同的使用场景TPC组织发布了多项测试标准。其中被业界广泛接受和使用的有TPC-C 、TPC-H和TPC-DS。 TPC-C 、TPC-H和TPC-DS三者的最大的一个区别是，TPCC是针对OLTP数据库进行性能测试，而TPC-H和TPC-DS是针对OLAP数据库进行测试的。数据库处

overfit同步小助手 2023-05-15 07:03:55 0 收藏

开源可视化bi工具有哪些，干货推荐

主打自助分析，主要针对业务人员使用，让业务人员直接进行可视化分析克服现阶段各行各业在使用数据进行查询分析基本都是通过前端业务人员需要与信息部IT人员沟通导致的沟通成本大，灵活性差，不能及时响应的弊端。支持复杂的权限管理，一键实现数据共享与管控，细致精准的数据权限管控，数据和报告可在全公司内分享，分享

overfit同步小助手 2023-05-15 05:03:53 0 收藏

一百零六、Hive312的计算引擎由MapReduce(默认)改为Spark（亲测有效）

Hive312的计算引擎由MapReduce(默认)改为Spark

overfit同步小助手 2023-05-15 03:03:52 0 收藏

Flink的安装与配置（集群版）（保姆级教程）

Flink简述：Flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算。Flink安装前准备工作：1、使用xftp将Flink安装包上传到虚拟机中flink-1.10.0-bin-scala_2.11.tgz可以去国内镜像下载，也可以去apache flink官网下载Flink安

overfit同步小助手 2023-05-15 03:03:49 0 收藏

服务提供者 Eureka + 服务消费者（Rest + Ribbon）实战

现在的很多RPC框架，向Duobbo、JSF都是采用类似思想进行实现的。目前主流的负载均衡方案可分成两类。一种是集中式LB, 即在服务的消费方和提供方之间使用独立的LB设施(可以是硬件，如F5, 也可以是软件，如nginx, 由该设施负责把访问请求通过某种策略转发至服务的提供方。另一种是进程内LB

overfit同步小助手 2023-05-14 23:03:59 0 收藏

HBase常用Shell命令

在使用具体的Shell命令操作HBase数据之前，需要首先启动Hadoop，然后再启动HBase，并且启动HBase Shell，进入Shell命令提示符状态，具体命令如下：cd /usr/local/hadoop./sbin/start-dfs.shcd /usr/local/hbase./bin

overfit同步小助手 2023-05-14 23:03:40 0 收藏

kafka如何保证数据不丢失?

1或者all:生产者生产数据,既要保证leader保存成功,也要保证follower同步成功,继续发送下一批数据.同步模式：生产者生产一条数据，就保存一条数据，保存成功后，再生产下一条数据，能够保证数据不丢失，但是效率太低了。1:生产者生产数据,只保证leader保存成功,不管follower是否同

overfit同步小助手 2023-05-14 21:03:46 0 收藏

Hive本地开发/学习环境配置

这样就启动了metastore服务，可以通过jps命令查看，是否存在RunJar的进程，存在则说明启动成功，再通过hive客户端连接即可。该服务依赖于metastore服务，所以，在启动hiveserver2之前，一定确保已经启动了metastore服务，这时，可以通过。，启动后，通过jps命令查看

overfit同步小助手 2023-05-14 21:03:43 0 收藏

DolphinScheduler 3.1.0 海豚集群运维使用问题记录

dolphinscheduler 3.1.0 运维使用问题记录

overfit同步小助手 2023-05-14 20:03:40 0 收藏

用chatGPT写文章-用chatGPT写文章会重复吗

如果您想要提高数字营销的速度、效率和效果，请不要犹豫，尝试使用ChatGPT批量生成内容软件，为企业的数字营销战略注入更智能、更高效的能量。更广泛的推广渠道：ChatGPT批量生成内容软件可以适配各种不同的平台和应用程序，并生成针对不同平台的格式和内容，这有助于将数字营销扩展到更广泛的受众和目标客户

overfit同步小助手 2023-05-14 19:03:53 0 收藏

Kafka：Topic概念与API介绍

Topic事件被组织并持久地存储在Topic中，Topic类似于文件系统中的文件夹，事件就是该文件夹中的文件。Kafka中的Topic始终是多生产者和多订阅者：一个Topic可以有零个、一个或多个生产者向其写入事件，也可以有零个、一个或多个消费者订阅这些事件。Topic中的事件可以根据需要随时读取，

overfit同步小助手 2023-05-14 19:03:44 0 收藏

SQL日期函数汇总

**SQL日期函数汇总**1、 to date：日期时间转日期函数 select to date(‘2015-04-02 13:34:12’);输出: 2015-04-022、from unixtime：转化unix时间戳到当前时区的时间格式 select from_unixtime(1323308

overfit同步小助手 2023-05-14 18:04:03 0 收藏

实验SparkSQL编程初级实践

实验SparkSQL编程初级实践-Spark SQL 基本操作-将RDD转换为DataFrame-利用DataFrame读写MySQL的数据

overfit同步小助手 2023-05-14 17:04:04 0 收藏

高校数据可视化（智慧校园）

教育数据可视化大屏能够展示和分析很多数据，比如：在校生数据分析、招生数据分析、就业数据分析、教职工数据分析，科研数据分析等综合数据分析。

overfit同步小助手 2023-05-14 17:03:55 0 收藏