大数据 - overfit.cn

随着计算机技术和算法的不断发展，人工智能已经开始应用于各个领域，如医疗、金融、制造等。无论是人工智能、生物科技、新能源还是虚拟现实，它们的发展都需要政府、企业和投资者的共同努力。我们期待这些行业的蓬勃发展，同时也期待更多的新兴产业不断涌现，为人类社会的进步和发展作出更大贡献。随着基因编辑技术的出现和

overfit同步小助手 2023-07-16 16:04:10 0 收藏

判断hadoop伪分布式安装模式是否成功启动

overfit同步小助手 2023-07-16 13:04:33 0 收藏

Hudi（16）：Hudi集成Flink之读取方式

如果将全量数据(百亿数量级) 和增量先同步到 kafka，再通过 flink 流式消费的方式将库表数据直接导成 hoodie 表，因为直接消费全量部分数据：量大（吞吐高）、乱序严重（写入的 partition 随机），会导致写入性能退化，出现吞吐毛刺，这时候可以开启限速参数，保证流量平稳写入。通过参

overfit同步小助手 2023-07-16 13:03:51 0 收藏

Python获取全部股票数据

使用Python获取股票数据

overfit同步小助手 2023-07-16 12:04:14 0 收藏

Google Earth Engine（GEE）计算热度（LST）

今天来分享一下如何在GEE中计算热度，用地表温度来反演LST

overfit同步小助手 2023-07-16 11:03:57 0 收藏

解决Dolphinscheduler跨任务流依赖

overfit同步小助手 2023-07-16 10:03:52 0 收藏

2022年国家社会/自然科学基金立项名单

2022年国家社会科学+自然科学基金立项名单

overfit同步小助手 2023-07-16 07:04:16 0 收藏

数据血缘Atlas Rest-API使用

Type即元数据类型定义，这里可以是数据库、表、列等，还可以细分spark表(spark_table)，hive表(hive_table)等，atlas自带了很多类型，如DataSet，Process等，一般情况下，数据相关的类型在定义类型的时候都会继承DataSet，而流程相关的类型则会继承Pro

overfit同步小助手 2023-07-15 21:04:10 0 收藏

大数据ETL工具对比（Sqoop, DataX, Kettle）

DataX和Kettle都是通用的数据集成工具，支持多种数据源和目标，提供了强大的数据转换和清洗功能。DataX和Kettle的区别在于开发者和用户群体，DataX在阿里巴巴内部得到广泛应用，而Kettle则是一个独立的开源项目。Sqoop主要用于Hadoop和关系型数据库之间的数据传输，适用于大规

overfit同步小助手 2023-07-15 19:04:13 0 收藏

hive、pg库，建表语句及查询表结构语句

overfit同步小助手 2023-07-15 16:04:29 0 收藏

Kafka消息延迟处理技巧，降低错误率

Flink动态ClickhouseSink+自动建表

什么是主数据？浅谈主数据的管理与应用

hadoop集群全部都启动了，但是还是访问不了网页的解决方法

Kafka详解

大数据开源框架环境搭建(七)——Spark完全分布式集群的安装部署

最新版Flink CDC MySQL同步MySQL（一）

虚拟机扩容Ubuntu20.04教程

Kafka中产生数据积压的原因以及解决方案

hive-sql保留n位小数

下一个风口会是什么行业？