加入收藏 | 设为首页 | 会员中心 | 我要投稿 南通站长网 (https://www.0513zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

滴滴程序员这次玩得有点高级

发布时间:2021-02-07 11:03:20 所属栏目:动态 来源:互联网
导读:您应该尽早设计管道编排,以避免在部署阶段出现问题。 编排应像其他可交付成果一样对待; 所有利益相关者都应该对其进行计划,实施,测试和审查。 编排框架通常被忽略,许多公司最终为其管道实施定制解决方案。 这不仅成本高昂,而且效率低下,因为自定义业务

您应该尽早设计管道编排,以避免在部署阶段出现问题。 编排应像其他可交付成果一样对待; 所有利益相关者都应该对其进行计划,实施,测试和审查。

编排框架通常被忽略,许多公司最终为其管道实施定制解决方案。 这不仅成本高昂,而且效率低下,因为自定义业务流程解决方案往往会面临现成框架已经解决的相同问题。 造成漫长的反复试验。

在本文中,我将介绍一些最常见的开源业务流程框架。

管道编排

数据管道编排是一个交叉过程,可管理管道任务之间的依赖关系,调度作业等。 如果使用流处理,则需要编排每个流应用程序的依赖关系,而对于批处理,则需要安排和编排作业。

请记住,任务和应用程序可能会失败,因此您需要一种以统一的方式调度,重新调度,重放,监视,重试和调试整个数据管道的方法。
 

除了devspace dev,devspace deploy命令可以用于打包和部署应用程序,而不需要热重载、端口转发或日志流。DevSpace提供了许多自定义功能,以根据你的用例和设置调整其行为,包括:

  • 依赖项,可以让你开发和部署依赖于其他项目的项目
  • Profiles,可以在一个devspace.yaml中进行多种配置
  • 允许指定动态配置值的变量
  • 允许为项目配置自定义命令的命令
  • 可以在特定的DevSpace事件上执行某些功能的Hooks
  • 自动为devspace命令添加标志(flag)的环境变量
  • 扩展DevSpace和其命令的插件

DevSpace标准化和简化了开发人员与Kubernetes的交互方式的同时,Rancher在服务器端管理着开发者如何在Kubernetes内部工作。Rancher可以让你启动开发集群并将它们分到不同的项目中,在这些项目中开发团队可以一起工作和测试。

Resource Quotas项目除了常见的Kubernetes隔离资源外,还可以在资源方面约束团队,让团队在共享Kubernetes集群中得到公平的使用。共享Kubernetes集群可以减少基础设施的开销并且可以直接在Kubernetes内部进行有效开发。

再为快速开发添砖加瓦:loft

loft是另一个很有用的工具,它可以在开发过程中添加一些比较方便的功能,包括:

  • 虚拟集群,比“真实的”集群成本更低,并且可以在数秒内创建并再次清理,而且功能比简单的命名空间更强大
  • 在共享集群中为开发人员提供命名空间的自助服务(self-service)
  • 睡眠模式,在一定时间不活动后,将命名空间置于睡眠状态,以节省计算成本

从我开始学习数据科学的第一天到如今,我经常体会到负担综合症,但我知道那是完全正常的。为什么对数据科学家来说,负担综合症很常见也很正常?

  • “数据科学”是一个非常模糊的术语,它是一个跨学科的领域,包括统计学、程序设计、数学、商业理解、数据工程等。除此之外,数据科学家还有很多同义词(数据分析员、数据工程师、研究科学家、应用科学家)。你永远无法成为数据科学所涵盖所有领域的专家,你也不应该觉得自己必须做到这一点。
  • 与编程和技术领域的其他学科一样,数据科学也在不断发展。20年前,Pandas还没有被创造出来。5年前,Tensorflow才发布。总会不断有需要你学习的新技术出现。
  • 你不可能在所有领域成为专家,这意味着总会有人在你花更少时间的事情上做得更好,这没有什么关系。

作为一名数据科学家,你时常会感觉到负担综合症,放轻松,专注于自己的事


(编辑:南通站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!