0


大数据团队必备的最佳提效工具推荐

📫作者简介:小明java问道之路

专注于研究 Java/Liunx内核/C++及汇编/计算机底层原理源码,擅长交易领域的高安全/可用/并发/性能的架构设计与演进,系统优化与稳定性建设。

🏆CSDN专家博主/后端领域优质创作者/CSDN内容合伙人、InfoQ签约作者、阿里云专家/签约博主、51CTO专家,博客阅读量超32万🏆

🔥热衷分享,喜欢原创如果此文还不错的话,还请👍关注 、点赞 、收藏三连支持👍一下博主

本文目录

前言

互联网寒冬下,人人都在喊口号“企业降本增效”,但是降本增效究竟是什么?为了什么呢?降本增效不是一味地节约成本,而是要计算投入和产出比,砍掉不能带来价值的成本或者不能带来价值的人力,同时又不能对有价值的业务产生影响。这里笔者总结了主要两点,第一就是降低项目的成本,第二提高团队的工作效率。

本文为大数据、运维研发相关团队以及中小企业,推荐几款必备的提效工具,希望本文可以起到点拨之用,建议收藏!

一、腾讯云TDSQL-C(腾讯云云原生数据库)

首先推荐的这款工具 也是我个人最喜欢的一款,TDSQL-C 是腾讯云的云原生关系型数据库。

接下来我们通过生产工作中实际的痛点问题,到最终采取的解决方案来全面了解这个工具。

1、生产工作中实际的痛点问题

在公司业务高速发展过程中,数据库的访问压力剧增,多团队合作也带来更多不便,同时发生了单站点的MySQL机房发送故障导致停机。

虽然早期时商业数据库的分布式能力可以满足大部分用户的场景,但是随之而来的成本剧增肯定是不划算的,对业务场景弹性伸缩支持也不够。

如下图所示:

2、最终采取的解决方案——TDSQL-C

这时候发现了腾讯推出的一款兼容MySOL的自主可控、高一致性分布式数据库产品 TDSOL,完美的解决了我司几乎所有的痛点问题。

**TDSQL-C MySQL版 **是基于云原生存储和计算分离架构,100%兼容 MySQL,提供多项企业级能力、运维功能、灵活的计费方式以及丰富的产品系列,涵盖各类行业场景的需求,助力企业数字化转型。

下面是系统使用TDSQL-C的架构图:

可以看到不但提升了负载均衡的能力,采用共享分布式存储的设计,彻底解决了主从异步复制所带来的备库数据非强一致性的问题,解决了传统主备架构弹性能力差,业务压力大时的同步效率低,主备切换时间不可控等问题,在提供高性能同时保证了系统的高可用性和业务的连续性。

同时原有业务应用几乎不用更改即可接入TDSQL-C,极大的减轻了运营、开发和运维人员的工作量。

如下图所示采用了TDSQL-C后提升了系统整体能力:

3、使用TDSQL-C的优势

1、高可用、高可靠、保证业务连续,全面兼容开源数据库 MySQL不用考虑迁移的难度,较低成本

2、解决了多可用区容灾、高安全性的问题,在多个可用区内都有数据备份,为数据库提供容灾和备份。采用共享分布式存储的设计,彻底解决了主从异步复制所带来的备库数据非强一致性的问题。

3、轻松应对业务洪峰,主节点和读节点之间采用物理复制的方式,读节点与主节点延迟大大降低,满足活动场景中数据一致性读取需求。

4、灵活弹性扩展高、稳定性,敏捷灵活的弹性扩展,可根据业务需要快速升降级,快速扩容,轻松应对业务峰值,以及秒级的快照备份和快速回档能力。解决了传统主备架构弹性能力差,业务压力大时的同步效率低,主备切换时间不可控等问题。

4、TDSQL-C的应用场景

TDSQL-C MySQL 版的应用场景涵盖了各个领域

互联网移动 App,自带高可用架构,自动维护数据多副本,自动进行数据的校验和修复,减少人工干预,数据可靠性达99.9999999%

游戏应用,自动扩容,免去合区合服的繁琐操作,实现资源和成本的最优配置,在多副本的基础上对用户的数据进行连续保护,是互联网和游戏行业的最佳选择。

电商直播教育行业,支持秒级的升配,最多可扩展至15个节点,快速弹升 QPS 的能力,轻松应对业务峰值。

金融保险企业,为数据库提供容灾和备份,对数据库数据访问、存储、管理等各个环节提供安全保障,解决主从异步复制所带来非强一致性的问题。

最后放一个性能与快速弹性扩展的对比图供大家参考:

二、Istio(服务治理平台)

1、什么是Istio

Istio是基于ServiceMesh形态的用于服务治理的开放平台,可以将异构的服务串联起来 Istio为这样应用场景提供了服务治理的功能,Istio提供的流量治理、策略、遥测、访问安全等功能。

用于服务治理的开放平台。这里的服务 “治理”不仅限于“微服务”,可以推广到任何服务。只要存在服务或者应用,在它们之间存在访问,也存在对服务与应用的管理,都可以使用到 Istio。

2、Istio提供的能力

集群管理(Traffic management),Istio 简化了断路器、超时和重试等服务级别属性的配置,并可以轻松设置重要任务,例如 A/B 测试、金丝雀部署和基于百分比的流量拆分的分阶段部署。

可观察性(Security capabilities),Istio 的遥测包括详细的指标、分布式跟踪和完整的访问日志使,可以获得全面的服务网格可观察性。

安全能力(Security capabilities),Istio 的安全模型基于默认安全,旨在提供深度防御,让您即使跨不受信任的网络也能部署注重安全的应用程序。

三、Sigstore(加密工具)

1、什么是sigstore

供应链安全加密工具,sigstore是一款制品签名、验证的自动化工具,其优势在于对组件的自动化签名和验证实现场景,公开可审计日志服务的构建,和开源生态的支持。

2、sigstore 的与众不同

sigstore已经自动化了您对组件进行数字签名和检查的方式,以获得更安全的监管链追踪软件回溯源头。我们希望消除这通常带来的工作量、时间和错误风险。对于任何软件依赖开源的人来说,未来的集成可以更容易地检查真实性,无论它来自哪里。

密钥管理,sigstore 使用 Cosign 生成签名和验证工件所需的密钥对,并尽可能自动化,因此没有丢失或泄漏它们的风险。

透明账本技术,透明日志意味着任何人都可以找到并验证签名,并检查是否有人更改了源代码、构建平台或工件存储库。

由 sigstore 的社区推动,参与 sigstore 的每个人都相信开源软件的开放、透明和负责任的未来。我们所做的一切都来自于共同的愿景。

四、Arthas(程序监控工具)

1、Arthas是什么

Arthas 是一款开源的Java线上诊断工具,可以方便定位和诊断线上程序运行问题,同时在线反编译类并且不用加日志在线调试跟踪问题代码。

通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。

2、Arthas能为你做什么

Arthas 支持 JDK 6+,支持 Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。

1、可以通过命令拿到指定类的加载路径和异常信息(jar包加载、报错的异常类)。

2、可以通过反编译拿到类的代码信息。

3、可以通过jdk 1.5的 instrument来进行代码的动态替换(遇到问题在线上debug)。

4、dashboard命令查看jvm的详细信息(有一个全局视角来查看系统的运行状况)。

5、快速定位应用的热点,生成火焰图,直接从JVM内查找某个类的实例。

五、EFK(日志收集)

EFK是一个实时日志收集系统,由开源软件组合而成,ELasticsearch+FileBeat+Kibana。

ELasticsearch是一个开源的分布式可扩展的搜索擎负责日志分析和存储,通常与 Kibana 一起部署,一般建立在全文搜索引擎 Apache Lucene(TM) 基础上。可以完成分布式实时文件存储,并将每一个字段都编入索引,使其可以被搜索。实时分析的分布式搜索引擎。可以扩展到上百台服务器,处理PB级别的结构化或非结构化数据。

FileBeat负责日志收集,将 Beats 和您的容器一起置于服务器上,或者将 Beats 作为函数加以部署,然后便可在 Elastisearch 中集中处理数据。如果需要更加强大的处理性能,Beats 还能将数据输送到 Logstash 进行转换和解析。

Kibana是一个 开源的Web UI,为Elasticsearch提供了一个友好的使用界面负责界面展示。高效的满足了很多场合的应用,是目前主流的一种日志分析系统解决方案,核心产品搭载了一批经典功能:柱状图、线状图、饼图、旭日图,等等。不仅如此,您还可以使用 Vega 语法来设计独属于您自己的可视化图形。

六、Google Cloud Run(谷歌云托管服务)

Google Cloud Run是一个新的基于容器运行 Serverless 应用的解决方案。Cloud Run 基于开源的 Knative 项目,是 Knative 的 Google Cloud 托管版本,也是业界第一个基于 Knative + Kubernetes 的 Serverless 托管服务。

Cloud Run能够运行可通过 HTTP 请求调用的无状态容器。通过抽象出所有基础架构管理,它是serverless 的。主要用于部署和管理服务的命令行和用户界面,集成的日志记录和监视,包括stackdriver监视,日志记录和错误报告等等场景的解决。​​​​​​​

七、HummerRisk(安全和合规工具)

1、HummerRisk及其功能架构

HummerRisk 是开源的云原生安全平台,以非侵入的方式解决云原生环境的安全和治理问题。核心能力包括混合云的安全治理和容器云安全检测。

2、HummerRisk 能做什么

云安全治理

对主流的公(私)有云资源进行安全合规检测,包括腾讯云、火山引擎、、UCloud、Amazon Web Services、Microsoft Azure、Google Cloud等等,开箱即用内置大量规则,并可按需自定义规则。

快速查看混合云的各种资源态势与云资源拓扑图,基于漏洞规则库,通过扫描等手段对指定的网络设备及应用服务的安全脆弱性进行检测,容易上手只需绑定云账号,就可以一键执行检测。

云安全检测

可以关联多个支持多种 K8s 集群,统一查看各个关联环境的资源态势;根据安全基线进行检测,发现存在的配置错误、安全漏洞、危险动作等内容,且无侵入式检测;

八、ZipKin(数据追踪)

Zipkin 是一个分布式追踪系统,通过聚集来自各个异构系统的实时监控数据。它可以收集解决服务架构中的延迟问题所需的时间数据。功能包括收集和查找此数据。

Zipkin 可以根据服务、操作名称、标签和持续时间等属性进行查询,同时会为你总结一些有趣的数据,比如在服务中花费的时间百分比,以及操作是否失败。

Zipkin UI 还提供了一个依赖关系图,显示有多少跟踪请求通过了每个应用程序。

九、Nomad(集群编排工具)

1、Nomad的定位

Nomad是一个简单而灵活的调度程序和编排器,用于在本地和云中大规模部署和管理容器和非容器化应用程序,对Kubernetes的替代品和补充。

可扩展性不复杂的小型编排工具,易于安装和操作,只专注于集群管理,支持多数据中心可数据中心调度,分布式高可用,支持多种驱动程序和多操作系统。

Nomad 作为单一二进制文件运行,资源占用少,支持容器以外的各种工作负载,包括 Windows、Java、VM、Docker 等。

2、Nomad 的常见用例

1、简单的容器编排,在生产环境中轻松部署、管理和扩展容器。

2、非容器化应用编排,无需重构或重写即可部署和管理遗留应用程序。

3、边缘工作负载管理,使用简单的单集群拓扑在全球范围内扩展边缘部署。

4、批处理工作负载,以最小的操作开销本地运行批处理工作负载。

十、OpenTelemetry(分布式系统跟踪工具)

OpenTelemetry 提供工具、API 和 SDK ,使用它来检测、生成、收集和导出遥测数据(指标、日志和跟踪),以帮助您分析软件的性能和行为。OpenTelemetry可跨C++、Java、Go、JavaScript、Python等等多语言使用。

面向观测数据的生成和管理。分布式中存在可用性和性能问题,这就需要遥测数据来支持可观测性产品,Ope nTelemetry项目通过开放标准语义约定,以确保与供应商无关的数据收集的方案来解决这些问题。

提供跟踪、指标、日志,可以从服务和软件创建和收集遥测数据,然后将它们转发到各种分析工具。

提供嵌入式开发,OpenTelemetry 与流行的库和框架集成,例如 Spring、 ASP.NET Core、 Express、Quarkus等。

总结

以上就是要分享的内容,本文仅简单介绍了一些笔者认为十分有效地,并且在企业、大数据以及相关的运维开发团队可以降本增效的工具,也是建议大家去学习的一些加分的工具,诸如TDSQL-C腾讯云分布式数据库等等工具可以多深入了解一下,欢迎大家进一步的来学习。


本文转载自: https://blog.csdn.net/FMC_WBL/article/details/127333271
版权归原作者 小明java问道之路 所有, 如有侵权,请联系我们删除。

“大数据团队必备的最佳提效工具推荐”的评论:

还没有评论