数据挖掘 - overfit.cn

差异基因富集分析（R语言——GO&KEGG&GSEA）

通路富集分析气泡图

overfit同步小助手 2024-07-23 21:02:09 0 收藏

分子性质AI预测挑战赛｜Datawahle AI夏令营｜代码分享

在当今科技日新月异的时代，人工智能（AI）技术正以前所未有的深度和广度渗透到科研领域，特别是在化学及药物研发中展现出了巨大潜力。精准预测分子性质有助于高效筛选出具有优异性能的候选药物。以PROTACs为例，它是一种三元复合物由目标蛋白配体、linker、E3连接酶配体组成，靶向降解目标蛋白质。本次大

overfit同步小助手 2024-07-22 22:01:27 0 收藏

数据挖掘的安全与隐私保护：实际应对策略

1.背景介绍数据挖掘是一种利用统计学、机器学习和操作研究等方法从大量数据中发现隐藏的模式、关系和知识的过程。随着数据的增长和数据挖掘技术的发展，数据挖掘在各个领域得到了广泛应用。然而，数据挖掘同时也带来了一系列安全和隐私问题。这篇文章将讨论数据挖掘的安全与隐私保护问题，并提出一些实际应对策略。2.核

overfit同步小助手 2024-07-21 13:06:56 0 收藏

人工智能及深度学习在病理组学中的应用概述｜系列推文·24-07-11

首先，小罗会带大家回顾计算机和编程的起源，解释从最初的电子计算器到现代计算机的发展历程，以及高级编程语言如何简化计算机指令的编写。其次，本期推文会深入探讨机器学习的不同类型，包括深度学习、神经网络和其他学习算法，以及它们如何被应用于解决实际问题，特别是在病理学领域。最后，小罗会列举一些AI技术当前面

overfit同步小助手 2024-07-21 12:01:29 0 收藏

华为面试题及答案——大数据

在 hadoop-env.sh 文件中，可以增加 JVM 分配给 NameNode 的内存。通常是在 HADOOP_NAMENODE_OPTS 中增加 -Xmx 参数来增加最大堆内存。export HADOOP_NAMENODE_OPTS="-Xmx8g -Xms4g ${HADOOP_NAMENO

overfit同步小助手 2024-07-18 11:03:22 0 收藏

一文了解和区分数据中台、数据平台、数据湖、数据仓库

在当今数字化时代，数据已经成为推动科技发展和商业创新的关键要素之一。数据中台、数据平台、数据湖和数据仓库是构建现代数据架构的重要组成部分。然而，这些概念之间往往容易混淆。本文将深入介绍并区分这些概念，通过生动的例子帮助读者更好地理解它们之间的关系和区别。

overfit同步小助手 2024-07-17 13:03:37 0 收藏

Jupyter + Pyspark + Yarn 交互式大数据分析

jupyter+pyspark+Yarn 交互式大数据分析, pyspark交互式环境配置，spark在线交互式数据分析

overfit同步小助手 2024-07-16 10:03:46 0 收藏

医疗大数据：数据分析与预测

1.背景介绍医疗大数据是指在医疗领域中涉及的大规模数据，包括患者病历数据、医疗图像数据、医疗设备数据、医学研究数据等。随着医疗领域的发展，医疗大数据的规模和复杂性不断增加，为医疗领域提供了巨大的机遇和挑战。医疗大数据的应用主要体现在以下几个方面：1.1 个性化医疗：通过分析患者的基因、生活习惯和生理

overfit同步小助手 2024-07-13 15:03:40 0 收藏

基于优衣库（Uniqlo）业务场景的数据仓库与数据挖掘课程设计

我国的 IT（Internet Technology，互联网技术）技术发展程度基本上已经保持在国际水平，现阶段国内的BI 产品也一直紧跟国际的标准技术要求，甚至在整个互联网领域中，我国的 IT技术处于较为领先的发展地位。分析技术有效运用在商业决策上，能够帮助企业的管理层对数据展开更加深入的分析和处

overfit同步小助手 2024-07-06 16:03:57 0 收藏

大数据相关招聘岗位可视化分析-毕业设计

本次数据集来源于xx招聘网共计4223条招聘信息，每条招聘信息字段包括岗位名称、公司名称、工作经验要求、学历要求、工作地点、薪酬、公司规模、发布时间、公司福利共9条字段信息。。

overfit同步小助手 2024-07-06 07:03:48 0 收藏

AI论文速读 | 【综述】（LLM4TS）大语言模型用于时间序列

大型语言模型 (LLM) 在自然语言处理和计算机视觉等领域得到了广泛应用。除了文本、图像和图形之外，LLM还具有分析时间序列数据的巨大潜力，使气候、物联网、医疗保健、交通、音频和金融等领域受益。这篇综述论文对利用LLM进行时间序列分析的各种方法进行了深入的探索和详细的分类。强调了法学硕士原始文本数据

overfit同步小助手 2024-07-05 04:01:39 0 收藏

《数据仓库与数据挖掘》总复习

overfit同步小助手 2024-07-04 13:03:41 0 收藏

【数据挖掘】期末复习笔记(重点知识)

数据挖掘期末复习笔记，囊括重点知识，简洁明了。祝大家都能取得好成绩

overfit同步小助手 2024-07-02 11:01:09 0 收藏

【大数据】—二手车用户数据可视化分析案例

Sales_ID(销售ID)name(二手车名称)year(购车年份)selling_price(二手车当前销售价格)km_driven(总行驶公里数)Region(使用地区)State or Province(使用的州或省)City(使用城市)fuel(燃料类型)seller_type(谁在出售汽

overfit同步小助手 2024-06-30 17:03:42 0 收藏

数据挖掘技术的未来趋势：智能化与大数据

1.背景介绍数据挖掘(Data Mining)是一种利用统计学、机器学习、数据库、人工智能等多学科知识和方法来从大量数据中发现新的、有价值的信息和知识的科学。数据挖掘技术的发展与大数据时代的兴起是相互关联的。随着互联网、人工智能、物联网等技术的不断发展，数据量不断增加，数据挖掘技术也不断发展和进步。

overfit同步小助手 2024-06-26 16:03:12 0 收藏

特征工程与数据预处理全解析：基础技术和代码示例

我们将深入研究处理异常值、缺失值、编码、特征缩放和特征提取的各种技术。

Deephub 2024-06-24 10:40:36 0 收藏

数据挖掘案例-航空公司客户价值分析

overfit同步小助手 2024-06-23 05:03:49 0 收藏

【爬虫】实战1-爬取Boss直聘信息数据

由于网址（域名+参数），域名不会变，参数可能会随着页面的变化而变化。可以看到当重新翻到第一页的时候网址发生了变化，第一页用这个网址即可。我们可以切换不同的页码并将网址赋值粘贴下来（一般3-4个即可）可以看到只有page参数有变化，显然page参数对应的是页码数。我们直接用浏览器网网址输入框中的网址即

overfit同步小助手 2024-06-22 23:02:16 0 收藏

【人工智能Ⅱ】实验2：VGG图像分类

第一个卷积块的每个卷积层共有64个输出通道，第二个卷积块的每个卷积层共有128个输出通道，第三个卷积块的每个卷积层共有256个输出通道，第四个卷积块的每个卷积层共有512个输出通道，第五个卷积块的每个卷积层共有512个输出通道。与baseline相比，batch_size为【128】时的分类损失值和

overfit同步小助手 2024-06-19 20:01:14 0 收藏

大数据-11-案例演习-淘宝双11数据分析与预测（期末问题）

Hadoop 是一个开源的分布式计算框架，设计用于在大规模数据集上实现高效、可靠和可扩展的数据处理。HDFS是 Hadoop 项目的一个核心组件，它是一个针对大数据处理而设计的分布式文件系统。YARN 是一个通用的、可伸缩的资源管理平台，它允许在同一个集群上运行多种不同类型的应用程序。都是帮助处理和

overfit同步小助手 2024-06-14 20:03:21 0 收藏