大数据 - overfit.cn

Impala是Cloudera公司主导开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义，但由于Hive底层执行使用的是MapReduce引擎，仍然是一个批处理过程，难以满足查询的交互性。相比之下，Impal

overfit同步小助手 2023-07-14 09:03:59 0 收藏

AI的暴论

AI模型的暴论

overfit同步小助手 2023-07-14 07:02:01 0 收藏

FMCS厂务管理系统

FMCS厂务管理系统以工业网络安全为基础，通过健全的数字化建设，消除各子系统之间的信息孤岛。对主生产设备以外的公辅设备进行监控管理，全面覆盖的厂务监控管理，打开工厂运营的黑匣，对厂务设备以全生命周期的管理提高设备运行效率，依托标准化的能源管理模式，为企业的节能减碳提供支撑，以多元化全方位的沉浸式体验

overfit同步小助手 2023-07-14 05:01:34 0 收藏

【全年汇总】2023年CCF人工智能会议截稿时间汇总（持续更新）

【Call for papers】2023年CCF人工智能会议信息汇总（持续更新）

overfit同步小助手 2023-07-14 03:03:53 0 收藏

数据治理之关键环节元数据管理开源项目datahub探索

元数据管理在数据治理中非常关键的部分，本篇分享一个现代化元数据管理开源项目datahub，了解其核心功能和概念，进一步理解器其架构和组件，然后从0到1的搭建和使用官方的数据样例演示，最后通过摄取MySQL和ClickHouse的示例打开其探索之门。

overfit同步小助手 2023-07-14 02:04:05 0 收藏

为什么很多企业依然再用jdk8而不是使用最新版本jdk17？

兼容性问题：JDK 8 是一个经过长期使用和测试的稳定版本，与许多企业应用程序和库已经兼容，而升级到新版本可能会导致兼容性问题。如果企业依赖于过时的库或框架，则升级到 JDK 17 可能会增加安全风险，因为这些库可能不支持最新版本的 JDK，从而使企业的系统容易受到攻击。如果企业在 JDK 8 上运

overfit同步小助手 2023-07-14 01:04:45 0 收藏

Flink本地运行WebUI日志问题

Flink程序运行后，在WebUI页面无法查看jobManager日志或者taskManager日志，归根结底是日志配置的问题，引入或修改相关日志文件配置项即可解决。

overfit同步小助手 2023-07-14 01:04:32 0 收藏

【2022国赛官方评审要点发布】2022高教社杯全国大学生数学建模竞赛官方评阅要点

本要点仅供参考，各赛区评阅组应根据对题目的理解及学生的解答，自主地进行评阅。

overfit同步小助手 2023-07-14 00:04:31 0 收藏

hadoop集群slave节点jps后没有datanode解决方案

3.切换到slave节点，将/usr/local/hadoop/tmp/dfs/data/current里的VERSION文件中的clusterID替换成与master的VERSION文件中clusterID一致。2.找到安装hadoop的文件夹，我的是(/usr/local/hadoop)再找到里

overfit同步小助手 2023-07-14 00:03:51 0 收藏

【大数据基础】基于信用卡逾期数据的Spark数据处理与分析

本次实验采用pandas库对数据进行预处理。在实验中，不对信用卡和个人信贷额度的总余额、负债比率、未偿还贷款数量、逾期90天以上的次数这4个属性进行处理分析。（2）查看数据是否具有重复值，去除重复值。（3）查看各字段缺失率，缺失值以均值填充。（4）选取要研究的属性，删除不研究的属性。（5）保存文件到

overfit同步小助手 2023-07-13 22:04:42 0 收藏

【Elasticsearch教程8】Mapping字段类型之keyword

Flink CDC 2.4 正式发布，新增 Vitess 数据源，更多连接器支持增量快照，升级 Debezium 版本

大数据存储系统HDFS和对象存储(OOS/S3)的比较

HDFS集群部署成功但网页无法打开如何解决（显示配置通过浏览器访问hdfs的端口）

RocketMQ的消费模式和消息流控

SQL使用技巧(3.2)递归层次查询Hive、Orcale和TDH

Spark Local环境搭建及测试

物流怎么批量查询教你一键批量查询全部物流信息

【Flink系列】查看Flink版本的命令，常用命令

如何使用UE5新功能 “打包型关卡Actor” 实现场景的性能优化

【大数据入门核心技术-Impala】（一）Impala简介