Opsani:持续优化
2019年05月16日 由 浮生 发表
51779
0
Opsani最近在Kubecon发布了Optune,如果你构建了在云中运行的软件,你应该注意这个。
在Zetta,我们投资于早期阶段,即人工智能第一家采用B2B商业模式的初创企业。我们花了很多时间思考与人工智能相关的潜在风险。虽然人工智能是否会破坏工作或仅仅提高人类生产力的争论引起了很大的关注,但我们对将人工智能应用于解决人类最初难以解决的问题感到更加兴奋。想想个性化医疗、气候变化、城市转型等问题……也许更平淡无奇,但仍然深刻:应用程序性能调整。
性能调整对于人类而言过于复杂
性能调整是一个人类做得太复杂的问题。无处不在的云和移动应用程序,让我们高兴,消费我们,并支持我们的每一个工作小时数百万甚至数十亿用户的应用程序
部分原因是没有人具备所有的专业知识。选择正确的基础设施配置是两种知识的交叉点。
基础设施知识可能需要一辈子才能掌握:计算、内存、缓存、存储、网络(带宽和延迟)、线程管理、作业放置、数据库配置、应用程序运行时、Java垃圾收集器、列表继续进行。即使是以管理基础设施为职业生涯的DevOps专家,也不会在应用基础设施、数据基础设施和云基础设施堆栈的所有层都拥有专业知识。
另一种知识是应用程序工作负载本身,因为没有“一个真正的基础结构”能够为所有应用程序提供最佳的性能。编写代码的开发人员有最好的机会分析其性能、调试和消除代码本身的瓶颈。但很少有软件工程师是基础设施方面的专家,他们通常会在DevOps指定的固定基础设施环境中优化代码。顶尖的科技公司都有性能工程师,他们将这两种知识联系起来,但他们的知识从来就不够广泛。
风险规避是另一个障碍。大多数科技公司通常将可靠性优先于性能和成本。通过过度消费和过度供给,我们获得了心灵的平静。但事实是,如果只可能发现公式,那么根据工作负载定制的经过良好优化的基础设施可以以更高的性能以更低的成本提供相同或更好的可靠性。
最后一个问题是变化的速度。现代应用程序工作负载不断变化:每天或每周发布新代码、持续的用户增长、行为模式的季节性或不可预测的变化,以及我们最喜欢的云提供商提供的基础设施选项的新可用性。如果您花费数周或数月的时间来精确地调整基础结构,那么一旦完成,它就会过时。
持续优化
Opsani提供了解决方案:使用Optune进行连续优化。Optune是一个基于深度强化学习技术的引擎,它持续检查数百万种配置组合,以确定资源和参数设置的最佳组合。其结果是基础架构精确地调整到应用程序的工作负载和目标,无论是成本、性能还是两者之间的最佳位置,都精确地针对您思考业务度量的方式。
如果您已经相信持续集成和持续交付,那么下一步自然就是持续优化:CI/CD/Co.Optune与您的应用程序共存,持续监控工作负载、性能和基础结构选项,调整和优化以获得最高的价格/性能。
为什么泽塔对优化如此兴奋?在某种程度上,因为如果科技公司能够更有效地利用我们的支出,我们就可以作为一个行业共同实现更多目标,更好地为我们的客户和用户服务。但我们实际上认为,提高绩效远比提高支出效率重要。性能上的微小差异会在应用程序的易用性和难用性上产生巨大差异。更快的应用程序更令人愉快,更方便,更吸引人。我们所服务的客户和用户在即时、直观地响应的应用程序中发现了更多的价值。绩效是提升所有业务指标并推动公司核心使命实现的一股潮流。
作为一个行业,我们在为客户实现最佳性能方面遇到了障碍,因为性能调整对人类来说太难了。是时候给人工智能一个机会为我们解决这个问题了!