大数据 | HBase基本工作原理
HBase 是一种分布式、可扩展、支持海量数据存储的 NoSQL(not only SQL) 数据库。
TikTok 是什么以及怎么分析运营数据
制作有创意的短视频内容:TikTok 是一个以短视频为主要形式的社交媒体应用,因此制作出有趣、有创意的短视频内容是吸引用户关注的关键。用户留存分析:分析用户的留存率,了解用户在不同时间段内的流失情况,以及用户留存的影响因素,例如产品体验、营销策略等。
Spark - AUC、Accuracy、Precision、Recall、F1-Score 理论与实战
Spark AUC、Accuracy、Precision、Recall、F1-Score 理论与实战。
idea2021.3.3 创建maven-scala项目并解决遇到的问题
idea2021.3.3 创建maven-scala项目并解决遇到的问题
springboot+rabbitmq搭建mqtt协议实现订阅发布(亲测9w消息并发)
mqtt,rabbitmq+mqtt,springboot整合rabbitmq搭建mqtt协议
基于GIS的生态安全网络格局构建(附练习数据下载)
基于GIS的生态安全网络格局构建(附练习数据下载)
Springboot集成rabbitmq——实现延迟队列
springboot集成rabbitmq,并通过死信队列和延迟交换机两种形式,实现延时队列。
免费一键生成原创文章-原创文章批量生成
您是否因为写作枯竭、文章档次不高,而感到烦恼?现在,我们有一个免费的文章创作工具,帮助您无需付出太多的努力就能高效地创造原创文章。一键生成:这款文章生成器与其他的自动化文本生产工具不同,它针对的是需求文本的原创性和独特性,从而让文章放入深度的学习框架,逐渐有赋能于原创实现,格外突出代利好的前瞻性特性
hive: 优化配置
mapper数量与输入文件的split数息息相关,在Hadoop源码org.apache.hadoop.mapreduce.lib.input.FileInputFormat类中可以看到split划分的具体逻辑。如果想增大mapper数,除了降低mapred.min.split.size之外,也可以
HADOOP 伪分布式集群搭建
HDFS 会以128M为单位将上传的文件进行切分为若干个block 存储在不同的datanode中,由于为了在不可靠的机器上进行提供可靠的服务,所以采用多副本机制进行存储。由于Hadoop 依赖于JDK运行环境,笔者这里采用的是hadoop3.3.4版本,支持JDK11,所以笔者安装的也是JDK11
FLink多表关联实时同步
Oracle->Debezium->Kafka->Flink->PostgreSQLFlink消费Kafka中客户、产品、订单(ID)三张表的数据合并为一张订单(NAME)表。
oracle 12c 容器数据库公共用户去访问pdb数据库
oracle 多用户,cbd用户访问pdb数据库,pdb数据库创建用户和表
hadoop单机模式搭建
搭建hadoop单机模式
Docker安装Elasticsearch及相关插件详细步骤,全程亲测避坑
docker部署Elasticsearch、kibana、analysis-ik、elasticsearch-head、ingest-attachment解决elasticsearch安装报错:default discovery settings are unsuitablefor producti
Hive任务实施(航空公司客户价值数据)
注意命令的使用与输入文件路径的引用建表字段的顺序。
VMware Horizon 8 2303 - 虚拟桌面基础架构 (VDI) 和应用软件
VMware Horizon 8 2303 - 虚拟桌面基础架构 (VDI) 和应用软件
常见的8种大数据分析模型,你了解吗
全行为途径剖析模型是互联网产品特有的一类数据剖析办法,它主要依据每位用户在APP或网站中的行为事情,剖析用户在APP或网站中各个模块的流通规律与特点,发掘用户的拜访或浏览形式,从而完结一些特定的事务用途,如对提升APP中心模块的抵达率、提取出特定用户团体的干流途径与刻画用户浏览特征,优化与提升APP
【kafka】三、kafka命令行操作
kafka命令行操作kafka的相关操作命令脚本文件在bin目录下。
读取hive表中的数据进行数据可视化
1,目的将数据导入到hive中,通过数据分析后将结果存到新的表中,然后读取hive中的数据进行数据可视化。2,hive中的操作首先将数据上传到HDFS,然后启动hive,如果因为namenode处于安全模式而无法启动hive可参考我的另一篇博文:“Name node is in safe mode”
CXO是什么?医药板块龙头都有哪些?
CXO医药外包行业主要分为CRO、CMO/CDMO、CSO三个环节,分别服务于医药行业的研发、生产、销售三大环节,可简单理解为研发外包、生产外包、销售外包。CXO板块是指开展医药研发和制造外包业务的上市公司,CXO企业为医药企业提供的从新药研发到生产的各类外包服务,起降本增效的作用。通过药融云投融资