Tribune Media 从头开始重建IT并且实践着它们的梦想

Tribune Media 从头开始重建IT并且实践着它们的梦想

Tribune Media CIO David Giambruno在2014年论坛公司被一分为二之后,从零开始为一家价值20亿美元的公司建立IT。这次拆分创造了Tribune Publishing 和Tribune Media,后者是拥有42家电视台,一个电影制片厂和涉及从体育元数据到房地产的所有领域的部门的最大的独立广播公司。Giambruno住在北卡罗来纳州的罗利市,并在罗利、纽约和芝加哥设有办事处。John Dix的网络世界编辑最近和Giambruno谈起了当您拿到一张白纸的时候可能会发生什么。答案可能并不令人惊讶,它类似于虚构的软件定义数据中心。

Tribune Media 从头开始重建IT并且实践着它们的梦想
Tribune Media 从头开始重建IT并且实践着它们的梦想

当您要拆分一家公司时,您必须保持它能继续运行,所以公司决定保留所有遗留的(设备),而我们在这期间将会有一个过渡服务协议的支持。然后我开始建造绿地。我必须将来自54个数据中心的所有“材料”合并成新的东西。在您的职业生涯中,您几乎没有什么障碍,所以我环顾四周,说:“我们能做什么?”

我们知道我们必须构建传统的后端来支持IT的服务端,所以DNS、电子邮件,所有这些都是没有人看到过的。后端系统没有宇宙的乐趣。每个人都希望他们能像电一样工作。我用一个烤奶酪三明治的比喻形象地描述了拆分公司的工作:它看起来既漂亮又整洁,但是当您把它切开并拆开时,您就会得到全是粘糊糊的、脏兮兮的东西。在过去的30年里,每一个角落的切割,都是一场权宜之计。这个比喻唯一的缺点就是在幻灯片上画了一幅图。我和我8岁的女儿不得不做5个烤奶酪三明治才能拍到好的照片,我不得不把它们全吃了。

但有趣的是想出我们要如何建造下一代平台。我们应该如何控制成本,如何使其自动化,并避免自己被束缚?从技术上讲,这意味着要用云、容器、XaaS以及硅谷未来几年抛出的任何东西,来构建一个能够适应、使用、缩放、弹出和执行的平台。在财政上,这意味着要切断能力和成本。如果我想加五件我不想付五块钱的东西,我想付两块钱。

因为我们只有五个月的时间来划分所有的东西,所以我们决定建立一个私有云,。第一个目标是让虚拟化从60%提升到90%,这样我们就可以移动所有的东西。我们做的第一件事是VMware和OpenStack之间的竞赛。我们有26个人在做OpenStack(因为它很酷),四个人在VMware上工作,我们的目标是在一个月内运行1000台服务器。在第一周结束的时候,VMware团队完成了工作并处理了杂务。到了月底,Openstac的人们仍然一无所有。做出选择。

所以我们开始了应用VMware和迁移应用程序的过程。我们基本上是在赶两匹马。一个是基础设施及其所有服务,第二个是移动所有的应用程序。构建整个基础设施后端的团队只有9个人。就是这样。我为他们感到无比自豪。

我推测您是正在迁移到x86硬件环境吧?

所有的x86型号的大型机,AS400s等等。我拥有Wintel平台,只有5个不运行虚拟化的物理服务器。否则,我们将在79个物理主机上运行大约1200个服务器。

当我们为网络做准备的时候,一个供应商给我报了150万美元作为核心。我们最终使用的是VMware的NSX和核心价值为70000美元的Juniper,因为在NSX中,我可以使用更便宜的可堆叠硬件,因为大部分逻辑冗余的智能都在软件中。Juniper也有最好的XML解析器。

如果我没弄错的话,您能合并这么多计算资源的原因之一就是您把一些工作负载转移到了云中?

对的。我不再有PeopleSoft Financials或PeopleSoft HR。这些都是800磅的应用,我们用Workday Financials和Workday HR(即SaaS服务)以及预算和财务规划与分析(FP&A)计划(Anaplan)取代了它们。因此占据了一大块数据中心的马力的巨大erg已经不再出现了。在原始数据中,我们大约80%的应用程序仍然处于预存状态,20%的应用程序处于云端,但在计算的意义上来说,我们占的大约是50%/50%。

从字面上来说,这就像是一个20亿美元的创业公司,或者一个重新创业的公司。我们在五个月的时间里做了所有的事情。管理层给我的任务是建立一个“无摩擦的企业”,这是一个非常简洁和明确的目标。这个愿景的力量是它使我能够给予我的团队的关注。

人们会说,“哇哦。这都是你干的?”但它就像柯克船长和《星际旅行》的Kobayashi Maru测试。我说,“是的,但我作弊了。”这就是现在的可能。我没有来自一个传统企业的包袱,我有明确的使命目标。结果就像从Flintstones到Jetsons一样。

我们建立了环境,在2014年5月底之前让一切准备就绪。我们在8月4日上线,用9个帮助台呼叫将所有的应用程序移动到7个机架上,并把54个数据中心折叠到7个机架上。这是其中一个有趣的视觉效果,因为我们是一个相当大的公司。您走进我的数据中心,希望看到一排排的东西;实际上有七个机架。我得带大家进去,给他们看,说,“真的,就是这个……我的数据中心被烘干机给卡住了。”

对我来说,内部云的神奇之处在于我所有的数据都在一个地方。拥有了我称之为不加区分的计算,所有其他的好处都比不上把我所有的数据放在一个地方,让我可以随心所欲地复制。所以,当我们放入API层时,我们可以很容易地将信息移入和移出,从而控制这些信息。我们仍在经历整个微分段过程,但将数据包装成一个共同的安全配置文件并从外部推送出去的能力改变了操作隐喻。

我使用了“不加区别的计算”这个术语,但它实际上是计算、存储和网络—— 能够在业务需要的任何地方移动和扩展它,同时知道它在哪里,它在做什么,谁能访问它,所以它仍然能经得起审计。

如果我想把我的内部服务器转到AWS,Azure或者其他的提供商,我们就可以做到这一点。我们已经将一些东西推到AWS,并让它作为测试。我们现在不需要公共云,因为我们有容量,也因为公共云的延迟问题。虽然它很快就消失了,但它仍然存在。我总是开玩笑说,带宽很便宜,但是延迟是无价的。

回到NSX,您有没有在NSX不能做的事情上发现什么?

最开始最困难的部分不是技术,而是生态系统。它相当年轻,最困难的部分是让其他供应商提供他们物理硬件的虚拟实例。每个人都在谈论虚拟设备,但这是一个巨大的转变。“我一直在创建物理盒子,现在您只想让我给您一个软件?”“这是供应商及其业务和收入模式的一个总体参考转移框架。

我们甚至在SKUs上遇到了问题。所以您真的需要在生态系统上下功夫。这真的是唯一的挫折。这项技术本身起了作用。但我们必须走进这个问题。我们没有点亮5万个节点。我们慢慢地点燃了东西,我们学会了,我们做得更好。我强烈推荐爬、走、跑的方法……但是这是非常可行的。您确实需要合适的人。我有幸拥有一支热爱挑战的优秀团队,他们拥有一个关键品质:好奇心。好奇心必须得到培养,而这取决于您的领导能力和对团队的支持。

我们的东西都是很简单的。我称它为计算机的西南部。西南航空公司使用一种类型的飞机,所以他们有一套机械和一套零件。所以我争取的是,真正精通一套技术,拥有它,运用它,尽可能地运用它。对于掌握技术。我不担心供应商的锁定,因为我的威胁是二进制的。我的意思是,如果您让我们真的非常生气,我们就把所有的东西都拿出来,换掉它。我们非常努力地和我们的供应商建立良好的关系。但如果事情变糟了,那就变成离婚法庭了。您失去的不是我10%的生意而是全部。

这就是我对待它的方式,因为我认为,从长远来看,简单就是胜利。工作日与此相似,因为每个人都运行在同一个版本上。这就像一个公寓楼,在那里您得到了同样的楼层平面图。您可以改变您的油漆和水槽,但几乎所有的东西都是一样的。我们刚刚经历了一个工作日25的升级,我已经习惯了SAP和Oracle的升级,它需要花费数月的准备、大量的资金和大量的顾问。这是一个8人、2周、4小时升级的团队,您完成了。您去吧。“哇哦。这很简单。”

同样的比喻现在也适用于基础设施。我们仍然受应用程序的约束,但它真正涉及的是您如何运用这些技术。它是如何断开成本,变得可伸缩,并运行那些需要在后台运行的东西,在每次成本或错误更改时不会让人感到休克的震撼。我从管理团队那里得到的最好的赞美就是他们不必为我着想。

给我们一些关于您如何在这个新世界中获益的观点。

在我们将公司分成两半之前,我们有585名IT人员,所以您会认为我最终会有200到300人。我和43个人运行着所有的东西,基础设施,应用程序,支持和开发。更好的是,我没有必要解雇任何人。只有25人从合并后的公司转型为论坛媒体。

但我看的最多的是业务整合,我把它看的很简单:您用更少的资源做更多的事情的能力。我不是在创造收入,但这并不意味着我们不能创新和参与。我的团队使用科技来给企业带来竞争优势:速度。我越关注我的团队交付项目,业务就越好。

我仍然需要“夜间的颠簸,最坏的情况下团队”,但范例的转变不断减少操作风险,使我的团队能够从事业务项目。这在我们交付的项目数量中得到了量化。新的能力使我们能够解决基础设施问题,这样我们就可以做更多的工作。2014年,我相信我们完成了140多个项目。到目前为止,我们已经用了超过245个。这些是庞大的工程。我们已经为一家公司建立了一个完整的后端。我们为大数据构建了共享服务,我们构建了所有这些东西。我们已经把基础设施问题解决了,一切都变得更加容易了。一个最好的例子是我们部署Workday Financials的速度。对于我们这样规模的公司,我们的生活是最快的。

您所看到的是人们做得更快并且这改变了人们关于什么可以做以及需要多长时间的参考框架。我们团队的口号之一是,“每件事都以IP地址开始和结束。”这与我的团队的自动化养老金结合在一起。

我们的云工程师之一Mike Cannella与InfoBlox和VMware合作创建了一个令人敬畏的集成。现在只需点击一下按钮,从安装到删除便可以自动化VM配置

。点击,然后VM就会得到一个DNS中输入的IP地址(取决于它的命名标准,所以,生产、开发、测试),它获得了一个生存期,并且它有一个所有者。”如果它是一个测试箱,那么它的主人就会在75天开始唠叨,看他们是否还需要它,如果他们得不到不回复,它就会在90天被删除。这就是软件定义数据中心的操作隐喻的亮点。

您是如何处理存储的?

存储是主要的流量。一个在存储方面非常棒的云工程师Ben Gent,他给了我这个幻灯片,标题是“我该怎么做?”这显然需要一定程度的勇气,但也反映了存储领域的新操作的可能性。

他说。“这是我想做的。我想用VSAN完成虚拟化堆栈,并设置一个存储三明治。纯粹的存储(flash)可以满足高性能的需求,VSAN可以在中间的廉价服务器上支持我们的大部分需求,而VSAN则可以在底层提供备份、复制、重复数据删除和恢复,然后我们可以将整个过程自动化,这样帮助服务台就可以在未来三年内提供存储空间,并给您节省数百万。”

对此,我真的无法争辩。我问他需要多长时间,结果证明他已经在实验室里运行过了。因此,我们正在转向这样一种模式,即25-30%的容量运行在闪存上,70%的容量在VSAN上运行,而不久即将上线的Cohesity会执行重复数据删除和灾难恢复。

该团队已经设置了自动分层来移动应用程序,以获得它们需要的存储性能。VSan运行在商品服务器上,JBOD负责管理所有的软件,我们得到了2-2.4 MS延迟,Cohesity在35x数据减少的情况下做备份。

结果是,我们将在影响长期运营成本的同时增加能力。另一个例子:我们正在使用这个软件定义数据中心架构来移动数据中心。仔细想想,我的团队正在和四个人一起做这件时,只有一个是外部的。所以,关键是运用技术,改变人们可以做什么和如何使用这个词的参考框架。“为什么我不能?”和“我不能。”

您是如何组织这个团队的?

您必须有一个组织结构,但没有人生活在一个筒仓里。最困难的部分是采取大部分的垂直结构,使他们水平。我想说的是,我运行的是一个开发环境类型的世界。如果我们需要运行一个项目,项目团队将与工程、工程谈判和运营、运营谈判进行协作以支持。这只是一个持续的循环。工程师是第三等级的支持者。所以,如果他们建立了一些没价值的东西,他们会在深夜处理这些问题。这种情况只发生过几次。

价值并不是每天都能创造东西的。我的工程师们不关心建筑,他们关心的是如何运用技术。更重要的是我们如何利用这种能力,以及我们能用它来做什么?因为它只是计算、存储和联网。

您提到过使用NSX来进行微分割,您能详细说明一下吗?

必须在所有东西之间放置不可伸缩的物理防火墙。我有1200个虚拟服务器。如果这些是物理的,我还需要另外7个机架用于防火墙。现在我不需要了。有了NSX,我就可以使用安全策略来包装服务器、应用程序、数据,无论我定义什么,这都是非常强大的。我们还在使用NSX APIs来集成Cyphort,所以我们让他们在我的东西之间寻找高级的持久威胁。我以前从未想过要这么做。

回到不加区分的计算理念,从一个私有云移动到一个公共云的能力,如果您有NSX的能力,您就可以确保安全性的移动,因为所有的东西现在都是一个文件,您可以在安全状态下“包装”这个文件。

您的物理服务器是否位于一个位置并支持您在所有的不同位置上运行它?

是的,但是很明显我有一个DR站点,我复制了所有的东西。我们使用河床的花岗岩,让我们可以设计一个LUN。我们把我们的应用程序推向边缘,让用户感觉他们在现场,只有变化才会回来,如果我们失去了连接,它还会继续运行。所以我们尽可能多地做数据一致性的工作。我们让用户删除了所有东西,完全轰炸了一个应用程序,我们在五分钟内重新加载了这个东西。它就像一个冠军。

除了我关于不加区别计算的想法之外,我还有另一个想法:我不想让数据离开我的数据中心。我想对我的数据进行投影。我想让您,根据您的权限,与之交互,但我不希望数据在设备上浮动。这确实减少了我们的安全面积。

您没有提到容器技术,它似乎是一种越来越流行的技术。您有集装箱计划吗?

VM是一个应用程序的一个操作系统,而容器是许多应用程序的一个操作系统,因此您可以通过硬件实现更大的密度。我们已经做了一些测试,你可以达到80-100,但当然这取决于工作负载。我认为有一个这样的地方,但我们需要一点等待。VMware正在开发中。我们仍然处在重建一个价值20亿美元的企业的战术曲线中。

我们已经推出了一切。我们已经开始使用我们的应用程序组合了。我们正在将所有这些操作化,现在我们将对其进行优化。在2016年年中,我们将退一步,重新审视一下我们的路线图上的技术和容器。

从零开始与推动保留一些遗留基础设施有什么遗憾吗?

我的团队必须进入一个新的领域,这是艰难的一步。去年是我工作过的最辛苦的一年。但我们推出了新一代的运营平台(基础设施和应用程序),这样业务就可以面向未来并且考虑增加股东价值。

从IT的角度来看,团队倾向于向上或向下螺旋。我的团队正处于这种螺旋上升模式。例如,vSphere6.2才刚刚发布,我的团队对他们能如何运用该技术感到兴奋。其他一些商店可能会说,“天哪,我们必须升级”,然后螺旋式下降。

有这样一个技术团队,因通过自己所做的事情能帮助企业而感到兴奋。我们已经跟踪了几个工程师,看看他们能做多少,与你能看这项技术给人们多大的权利。这里的差别是很大的,,因为历史上服务器端是服务器端,网络是网络,等等。我没有服务器,网络或存储人员。我有云工程师。因为所有这些都是一个系统。人们仍然有他们的自然亲和力,他们更擅长什么,对他们来说只是很少的一部分。观察他们如何一起工作,如何交流,以及他们能完成多少工作是很有趣的,因为不再有那些人工筒仓了。

听起来你们好像玩得很开心?

我向我的团队保证:第一,您永远不会觉得无聊;第二,您永远会有很多乐趣,因为我不会为了技术而做技术,它必须有一个结果;第三,我们将发展一个世界级的团队,让我们的员工变得更好,让他们每天都想来工作。

我们生活在这一基本理念之上的五个运营原则中:我们的工作是创建一个无摩擦的企业:

使业务能够转身面向前方

让系统为人们工作,而不是人们为系统工作。

掌握技术,为企业提供竞争优势。

为管理团队提供可操作的信息以做出正确的决策。

上述内容是由dreamhost中文指南(http://dreamhost.cn/)为大家提供的,如果您想了解更多信息,请继续关注dreamhost中文指南,如果您想转载此内容,请注明出处。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注