大数据 - overfit.cn

您是否因为写作枯竭、文章档次不高，而感到烦恼？现在，我们有一个免费的文章创作工具，帮助您无需付出太多的努力就能高效地创造原创文章。一键生成：这款文章生成器与其他的自动化文本生产工具不同，它针对的是需求文本的原创性和独特性，从而让文章放入深度的学习框架，逐渐有赋能于原创实现，格外突出代利好的前瞻性特性

overfit同步小助手 2023-05-10 07:04:00 0 收藏

hive: 优化配置

mapper数量与输入文件的split数息息相关，在Hadoop源码org.apache.hadoop.mapreduce.lib.input.FileInputFormat类中可以看到split划分的具体逻辑。如果想增大mapper数，除了降低mapred.min.split.size之外，也可以

overfit同步小助手 2023-05-10 07:03:56 0 收藏

HADOOP 伪分布式集群搭建

HDFS 会以128M为单位将上传的文件进行切分为若干个block 存储在不同的datanode中，由于为了在不可靠的机器上进行提供可靠的服务，所以采用多副本机制进行存储。由于Hadoop 依赖于JDK运行环境，笔者这里采用的是hadoop3.3.4版本，支持JDK11，所以笔者安装的也是JDK11

overfit同步小助手 2023-05-10 07:03:49 0 收藏

FLink多表关联实时同步

Oracle->Debezium->Kafka->Flink->PostgreSQLFlink消费Kafka中客户、产品、订单（ID）三张表的数据合并为一张订单（NAME）表。

overfit同步小助手 2023-05-10 05:04:00 0 收藏

oracle 12c 容器数据库公共用户去访问pdb数据库

oracle 多用户，cbd用户访问pdb数据库，pdb数据库创建用户和表

overfit同步小助手 2023-05-10 02:03:52 0 收藏

hadoop单机模式搭建

搭建hadoop单机模式

overfit同步小助手 2023-05-10 01:03:53 0 收藏

Docker安装Elasticsearch及相关插件详细步骤，全程亲测避坑

docker部署Elasticsearch、kibana、analysis-ik、elasticsearch-head、ingest-attachment解决elasticsearch安装报错：default discovery settings are unsuitablefor producti

overfit同步小助手 2023-05-09 21:03:45 0 收藏

Hive任务实施（航空公司客户价值数据）

注意命令的使用与输入文件路径的引用建表字段的顺序。

overfit同步小助手 2023-05-09 18:03:49 0 收藏

VMware Horizon 8 2303 - 虚拟桌面基础架构 (VDI) 和应用软件

overfit同步小助手 2023-05-09 18:03:43 0 收藏

常见的8种大数据分析模型，你了解吗

全行为途径剖析模型是互联网产品特有的一类数据剖析办法，它主要依据每位用户在APP或网站中的行为事情，剖析用户在APP或网站中各个模块的流通规律与特点，发掘用户的拜访或浏览形式，从而完结一些特定的事务用途，如对提升APP中心模块的抵达率、提取出特定用户团体的干流途径与刻画用户浏览特征，优化与提升APP

overfit同步小助手 2023-05-09 14:03:35 0 收藏

【kafka】三、kafka命令行操作

kafka命令行操作kafka的相关操作命令脚本文件在bin目录下。

overfit同步小助手 2023-05-09 13:03:42 0 收藏

读取hive表中的数据进行数据可视化

1，目的将数据导入到hive中，通过数据分析后将结果存到新的表中，然后读取hive中的数据进行数据可视化。2，hive中的操作首先将数据上传到HDFS，然后启动hive，如果因为namenode处于安全模式而无法启动hive可参考我的另一篇博文：“Name node is in safe mode”

overfit同步小助手 2023-05-09 10:03:46 0 收藏

CXO是什么？医药板块龙头都有哪些？

CXO医药外包行业主要分为CRO、CMO/CDMO、CSO三个环节，分别服务于医药行业的研发、生产、销售三大环节，可简单理解为研发外包、生产外包、销售外包。CXO板块是指开展医药研发和制造外包业务的上市公司，CXO企业为医药企业提供的从新药研发到生产的各类外包服务，起降本增效的作用。通过药融云投融资

overfit同步小助手 2023-05-09 09:03:35 0 收藏

大数据 | HBase基本工作原理

TikTok 是什么以及怎么分析运营数据

Spark - AUC、Accuracy、Precision、Recall、F1-Score 理论与实战

idea2021.3.3 创建maven-scala项目并解决遇到的问题

springboot+rabbitmq搭建mqtt协议实现订阅发布（亲测9w消息并发）

基于GIS的生态安全网络格局构建（附练习数据下载）

Springboot集成rabbitmq——实现延迟队列

免费一键生成原创文章-原创文章批量生成