大数据 - overfit.cn

内存大数据

1.经过多年的发展，Hadoop生态系统不断完善和成熟，目前已经包含多个子项目，其中YARN的主要功能是？A.负责集群资源调度管理的组件B.分布式并行编程模型C.分布式海量日志采集、聚合和传输系统D.数据仓库工具正确答案：A2.[单选题]大数据时代,数据使用的关键是?A.数据收集B.数据存储C.数据

overfit同步小助手 2023-06-22 07:04:08 0 收藏

elasticSearch 设置用户名密码 && 查询

添加角色接口为：POST /_xpack/security/role/{}]}'{}}pretty'{"all"],{"*"],"all"]}],"elastic"],}}}添加用户接口为：POST/_xpack/security/user/pretty'注：这里要注意的是用户密码最好不要有"$"

overfit同步小助手 2023-06-22 06:04:04 0 收藏

HBase单机版安装详细步骤

overfit同步小助手 2023-06-22 02:04:12 0 收藏

Hadoop伪分布搭建完整步骤

hadoop伪分布搭建保姆级教程

overfit同步小助手 2023-06-21 23:04:16 0 收藏

【软考高项笔记】第2章信息技术发展2.2 新一代信息技术及应用（★）

2.2 新一代信息技术及应用（★）

overfit同步小助手 2023-06-21 22:04:20 0 收藏

数学建模——时间序列预测（股价预测）

我们将数据划分为每15天为一个时间序列，对数据进行标准化，通过构建LSTM模型，激活函数使用selu并使用he_normal初始化，正则化使用l2正则化，训练网络，然后再测试集进行评估并评估模型的稳健性，模型比较稳定。然后，我们对数据进行归一化，分别使用线性模型和随机森林训练模型，在测试集进行评估，

overfit同步小助手 2023-06-21 21:04:36 0 收藏

芜湖，Tailscale 开源版本让你的 WireGuard 直接起飞~

原文链接???? https://fuckcloudnative.io/posts/how-to-set-up-or-migrate-headscale/目前国家工信部在大力推动三大运营商发展 IPv6，对家用宽带而言，可以使用的 IPv4 公网 IP 会越来越少。有部分地区即使拿到了公网 IPv4

overfit同步小助手 2023-06-21 21:04:27 0 收藏

Hive（3）

hive3

overfit同步小助手 2023-06-21 21:04:03 0 收藏

使用sqoop从Hive导出数据到MySQL

2、启动mysql：support-files/mysql.server start。8、数据可视化（前端）需求：Tom选修了哪些课程，对应的每门课程有多少学分。（课程信息：课程号kch，学号xh，课程名称kcmc，学分xf）kcxx。其次：使用sqoop从hdfs上将分析好的数据导出到mysql中

overfit同步小助手 2023-06-21 19:04:28 0 收藏

大数据Doris（三十七）：Spark Load导入HDFS数据

也可以在FE 节点“/software/doris-1.2.1/apache-doris-fe/log/spark_launcher_log”中查看执行日志，FE节点不一定在node1-node3哪台节点执行Spark ETL任务，执行任务的节点上才有以上日志路径，该日志默认保存3天。当Yarn中任

overfit同步小助手 2023-06-21 19:04:11 0 收藏

大数据：云平台，阿里云VPC创建，创建安全组，云服务器ECS，

overfit同步小助手 2023-06-21 18:03:51 0 收藏

【Elasticsearch】结合Postman/ApiPost 快速入门

相比于MySQL那种关系型数据库，是采用正排索引，也就是根据主键去找其对应的行数据。而Elasticsearch这个NoSQL，是采用倒排索引，根据输入的某值返回其它整行的数据。而Elaticsearch是采用风格的数据库访问，以下就是测试案例。

overfit同步小助手 2023-06-21 15:07:12 0 收藏

配置hadoop集群常见报错汇总

从如上日志可以看出，本身data节点启动并无问题，但在与主节点通信时报“Problem connecting to server: hadoop0/192.168.2.130:49000”，之后持续重试。鉴于每次执行都要导入，建议直接在对应的/XXX/hadoop-xxx/etc/hadoop/ha

overfit同步小助手 2023-06-21 15:05:03 0 收藏

【毕业设计】大数据睡眠数据分析与可视化 - python

🔥 Hi，大家好，这里是丹成学长的毕设系列文章！🔥 对毕设有任何疑问都可以问学长哦!这两年开始，各个学校对毕设的要求越来越高，难度也越来越大… 毕业设计耗费时间，耗费精力，甚至有些题目即使是专业的老师或者硕士生也需要很长时间，所以一旦发现问题，一定要提前准备，避免到后面措手不及，草草了事。为了

overfit同步小助手 2023-06-21 15:04:12 0 收藏

AIGC：关于人工智能的那些事

论 AIGC 为创作者（伪创作者）带来的效率：以下内容均由创作助手生成，图片花10秒在网上复制的，创作文章时间1分钟😄。

overfit同步小助手 2023-06-21 12:01:34 0 收藏

HDFS编程实践

介绍HDFS编程实战

overfit同步小助手 2023-06-21 09:04:33 0 收藏

ES搜索框架--设置IK分词器

ES的默认中文分词效果太差了，稍微长一点的词句就完全匹配不到，于是选择使用安装IK中文分词器来实现索引的分词。参考：https://blog.csdn.net/w1014074794/article/details/119762827https://www.bbsmax.com/A/6pdDqDaX

overfit同步小助手 2023-06-21 08:04:24 0 收藏

智慧物流管理系统

智慧物流运用物联网、大数据、云计算、人工智能等技术优化物流决策过程。

overfit同步小助手 2023-06-21 06:03:43 0 收藏

hive 分桶文件的大小多大最合适

另一方面，如果某个列包含许多唯一值，例如包含顾客 ID 的列，这可能不是一个好的分桶字段，因为这可能会导致分桶数量过多，从而降低查询效率。在 Hive 中，选择分桶字段时，考虑到分桶字段的值将被用于对数据进行分区，因此选择较少离散值的列作为分桶字段可以提高查询效率。同时，指定适当的分桶数也很重要，应

overfit同步小助手 2023-06-21 03:04:16 0 收藏

hadoop之kerberos权限配置（ranger基础上）（三）

kerberos+ranger+kerberos权限控制

overfit同步小助手 2023-06-21 02:03:48 0 收藏