大数据 - overfit.cn

【大数据学习篇13】在linux上安装jupyter

1.2 进入自己的安装目录，安装anaconda一直按回去车然后按yes就好了。

overfit同步小助手 2023-06-15 23:06:09 0 收藏

数据中台与传统大数据平台有什么区别？_光点科技

数据中台是聚合和治理跨域数据，将数据抽象封装成服务，提供给前台以业务价值的逻辑概念。数据中台是在平台概念上的升级，不再单纯的将功能进行大杂烩。理念上，中台有几个特点。

overfit同步小助手 2023-06-15 22:04:39 0 收藏

大模型与大数据之间的关系

大模型和大数据之间是相辅相成、相互促进的关系。大数据指的是规模庞大、类型复杂、处理速度快的数据集合，通常包括结构化数据和非结构化数据。大数据具有广泛的应用场景，例如推荐系统、广告投放、客户关系管理等。在大数据的背景下，大模型可以通过对数据进行深度学习训练，从中提取出复杂的特征和规律，实现各种任务，例

overfit同步小助手 2023-06-15 21:04:42 0 收藏

简单说说ES

ES

overfit同步小助手 2023-06-15 17:04:30 0 收藏

2023最新大数据毕业设计项目推荐

Hi，大家好，大四的同学马上要开始毕业设计啦，大家做好准备了没！学长给大家详细整理了最新的大数据专业相关选题，对选题有任何疑问，都可以问学长哦~学长限时开放开题指导，对开题有任何不明白的，对某项技术或算法不理解的，不知道怎么下手毕设的，都可以问学长，学长会根据你的情况提供帮助，希望能帮助到你。

overfit同步小助手 2023-06-15 17:04:04 0 收藏

Spark——JDBC操作MySQL

在实际的企业级开发环境中，如果数据规模特S别大，此时采用传统的SQL语句去处理的话一般需要分成很多批次处理，而且很容易造成数据库服务宕机，且实际的处理过程可能会非常复杂，通过传统的Java EE等技术可能很难或者不方便实现处理算法，此时采用SparkSQL进行分布式分析处理就可以非常好的解决该问题，

overfit同步小助手 2023-06-15 16:04:21 0 收藏

hive之Map Join使用方法

介绍MAPJION会把小表全部加载到内存中，在map阶段直接拿另外一个表的数据和内存中表数据做匹配，由于在map端是进行了join操作，省去了reduce运行的时间，算是hive中的一种优化。如上图中的流程，首先Task A在客户端本地执行，负责扫描小表b的数据，将其转换成一个HashTable的数

overfit同步小助手 2023-06-15 16:04:00 0 收藏

《人工智能算法案例大全：基于Python》——实践AI算法，驭智创新之路

人工智能算法案例大全：基于Python》是一本具有实践性和指导性的重要著作。通过丰富的案例实践和理论解析，读者可以深入了解AI算法的应用领域和方法。这本书适用于各个层次的读者，无论是初学者还是从业者，都能够从中获得丰富的知识和实践经验。在人工智能的浪潮中，让我们一起跟随《人工智能算法案例大全：基于P

overfit同步小助手 2023-06-15 16:02:17 0 收藏

数学建模算法与应用：预测模型（3）案例： SARS 疫情对经济指标影响

2003年的 SARS 疫情对中国部分行业的经济发展产生了一定的影响，特别是对部分疫情较严重的省市的相关行业所造成的影响是明显的，经济影响主要分为直接经济影响和间接影响．直接经济影响涉及到商品零售业、旅游业、综合服务等行业．很多方面难以进行定量地评估，现仅就 SARS 疫情较重的某市商品零售业、旅游

overfit同步小助手 2023-06-15 15:04:52 0 收藏

Windows11安装hadoop-3.3.0

解压到C:\hadoop-3.3.0目录，形成C:\hadoop-3.3.0\bin这种目录层次。将其中bin目录替换到C:\hadoop-3.3.0\下的bin目录。\hadoop-3.3.0\etc\hadoop目录下有4个配置文件。2. 下载winutils替换hadoop-3.3.0\bin

overfit同步小助手 2023-06-15 15:04:25 0 收藏

如何使用 SeaTunnel 同步 MySQL 数据到 Hive

连接器文档可以参考这里👉https://seatunnel.apache.org/docs/2.3.0-beta/connector-v2/source/Jdbc、https://seatunnel.apache.org/docs/2.3.0-beta/connector-v2/sink/Hive

overfit同步小助手 2023-06-15 15:04:16 0 收藏

数据中台建设方案-基于大数据平台

通过对客户大数据应用平台服务需求的理解，根据建设目标、设计原则的多方面考虑，建议采用星环科技Transwarp Data Hub（TDH）大数据基础平台的架构方案，基于Transwarp Operating System（简称TOS）云平台方式部署构建。通过建立大数据集成平台、大数据计算平台

overfit同步小助手 2023-06-15 14:04:19 0 收藏

物联网IIoT平台技术框架

该层服务覆盖南向接入功能，支持多种型号的网关（包括硬件网关和软网关）、直连设备、边缘子系统，边缘计算平台的数据采集，支持多种数据协议解析、转换等一系列服务，并实现多种连接方式的情况下，将数据轻松发送到云端，同时支持在边缘侧执行关键的业务流程，支持MQTT、HTTP行业主流接入协议，并且提供VPN、M

overfit同步小助手 2023-06-15 13:04:02 0 收藏

【大数据学习篇14】centos6安装Mysql

2 | 李四 | 88.5 | 68 | 96 | NULL || 2 | 李四 | 88.5 | 68 | 96 | NULL || 2 | 李四 | 88.5 | 68 | 96 | NULL

overfit同步小助手 2023-06-15 13:03:08 0 收藏

大数据技术习题整理

大数据技术的习题

overfit同步小助手 2023-06-15 12:04:14 0 收藏

Iceberg实战踩坑指南

本文demo基于 0.11.1 版本较老，iceberg官网已经没有该版本样例了，同时改版本也不支持一些iceberg的新特性，比如：upsert功能，动态schema变更以及索引和小文件合并等问题。但是不影响对主要API和功能的学习和理解

overfit同步小助手 2023-06-15 10:04:22 0 收藏

组织创新丨高效组织的十个发展准则

我们处在一个不确定的时代，组织创新也随着商业模式变化在发生变革，很多组织擅长发现具体的问题，且有为解决问题设计的各种方案，但鲜有需遵守以保证组织创新和成长能力的发展准则。

overfit同步小助手 2023-06-15 08:04:17 0 收藏

Ambari+Bigtop大数据平台安装部署指南(Centos7)一

安装部署分为以下五个大步骤1.资源准备2.操作系统配置3.数据库配置4.ambari配置5.bigtop组件安装。

overfit同步小助手 2023-06-15 07:04:05 0 收藏

Milvus实践第一章：简介与部署

业内最好的向量数据库及向量检索工具

overfit同步小助手 2023-06-15 06:04:20 0 收藏

夜莺(Flashcat)V6监控(五)：夜莺监控k8s组件(上)

是一个bool类型的参数，如果为true，表示跳过对服务器端证书的验证。不过指标数据实在没必要做这么强的安全管控，整的挺麻烦，实际上，ETCD 也确实提供了另一个端口来获取指标数据，无需走这套证书认证机制。目录下，为 curl 命令指定相关证书，是可以访问的通的。跟上面的操作一样，在configma

overfit同步小助手 2023-06-15 06:04:14 0 收藏