我第一次开始管理数据转换服务团队是在2001年。这之前曾经在分析服务(Analysis Service)团队工作。我在DTS方面没有多少背景,但是对此产品却非常狂热,而且愿意学习新的知识并充满热情地迎接新的工作。那时我面临的问题是,什么方式能够使我在短时期内迅速熟悉此产品呢?
在我四处寻求此问题的答案时,我的那些新同事们几乎都推荐了“红皮书”,这本书就是Brian Knight和Mark Charrin所编著的Professional DTS一书。诚如其言,该书内容广泛、详细,并提供了介绍清晰、易于理解的例子。我认为该书对于任何希望从头开始学习DTS的人都是无价之宝。
自那时起,一些年过去了,而且DTS也发展成了SQL Server 集成服务(SSIS)。这两种产品的哲学基础以及以客户为中心的理念是一致的,当然它们的出身也都是出自Microsoft名门。但是SSIS是一个完全不同的产品,它是在一个完全不同于DTS的领域扮演自己的角色。实际上,DTS是SQL Server的一个很流行的功能,几乎所有需要移动数据和表格的用户都会使用到它。实际上,根据一些调查的结果,超过70%的SQL Server用户都使用DTS。由于DTS是如此流行,因此可能有人会问为什么还要重新编写该产品来创建SSIS呢?
这个问题的答案几乎也就是SSIS/DTS团队的定义:倾听客户的意见。我们多次听到很多客户说虽然他们喜欢DTS,但他们感觉到还需要购买一套作为补充的ETL产品,尤其是在高端的企业中。此外,我们还听到有关DTS在性能、可伸缩性、复杂性以及可扩展性方面的意见。客户希望从DTS获得更多。同时,本书的作者也给我们提供了很多反馈意见。同时我个人也从Mark Chaffin获得了很多从DTS发展到SSIS的反馈。伴随针对DTS产品的功能、性能和可伸缩性等方面的改进需求,以及为了适应在开始业界崭露头角的.NET和托管代码体系结构。所有这些导致了一个确定的逻辑结论,也就是需要从头开始创建一个新的产品,而不是在旧有的体系结构上对DTS进行调整。在我们发布了SQL 2000之后,便逐渐开始了将DTS提升到更高层次的工作。
幸运的是,对于新的产品究竟应该是怎样的,我们获得了一些很重要的构想和方向。Euan Garden(曾经担任DTS项目经理)、Gert Drapers(曾经是DTS的架构师/经理)、Jag Bhalla(曾经任职于一家被Microsoft所收购的公司)以及Bill Baker(负责指导SQL Server所有业务智能工作的总经理)提供了最初的产品开发方向并提出了SSIS的发展路线图。DTS团队仍然是Management Tools团队的一部分,而且直到2001年它才成为一个单独的团队。这个团队规模很小,但是它具有一个明确而且非常重要的使命:通过开发一个业界领先的ETL/数据集成平台来完成SQL BI“功能栈”。
我在2001年夏季开始管理这个担负巨大使命的团队,那时我的工作目标只有一个:一定要完成这个使命!最初的团队规模很小,但是成员都非常有才能。这些人包括Mark Blaszczak,我曾经见过的最多产的开发人员;Jag Bhalla,一位精通业务的数据仓库业界老手;James Howey,一位十分精通数据管线的资深技术产品经理;Krik Haselden,一位天生的领导者而且是要求严格的开发人员;Ted Lee,一位开发过SQL Server以前两个版本、经验丰富老练的开发人员(他是唯一一位真正懂得旧DTS代码库的人员!)。我们通过外部雇佣和内部调配创建了开发团队,而且很快补充了大多数的职缺。这里特别要提到的是加入我们团队的新成员,包括Donald Farmer,一位极有才干而且面向客户的总经理,现在他在很大程度上成为了SSIS的等义词;Ashvini Sharma,UI开发组长,从不气馁而且善于从客户角度考虑问题;还有Jeff Bernhard,开发经理,他所开发的“宠物计划(pet project)”曾经让我们焦虑一时,但最终显著改进了产品的功能。
在我们接手此产品时,已经发布了Beta 1版本。在Beta 1之后,我们便着手开发现在所称的SSIS。从开发过程中的某个阶段开始,我们能感觉到自己所创建的产品已经不再是DTS,它在各个方面已经超越了DTS。在经过多次内部辩论之后,我们决定对产品改名。但是叫它什么呢?当时有各种建议的名称(例如,METL),我们对所有候选名称都进行了一番评估。最后,我们选择了一个在命名过程中很早就被建议,简单但却含义丰富的名称:Integration Service(前面使用SQL Server作为前缀来表明它是针对SQL Server数据的)。
该DTS是更大的SQL BI组的一部分,而且SSIS的设计在很多层面上反映了这一血统。我最早与DTS打交道是在Yukon(SQL 2005)的最初规划期间,当时我是一个小团队的一员,负责为DTS设计人员提供有关用户产品体验方面的改进意见。DTS允许与OLAP以及数据挖掘技术深入集成的巨大潜能从一开始就吸引了我(而且这种“超越ETL”吸引力一直在继续——可以访问www.byyondetl.com)。在本书的第6章和第4章(该章很好地介绍了新的Data Flow任务以及它的组件)对这种集成进行了讨论。SSIS另外一个相关的关键部分是无论在脚本编程还是创建自定义组件(任务和转换)等方面都具有很好的可扩展性。由Darren和Allen(他还开办了SQLIS.com网站,而且是我们的MVP)所编写的本书第14章对此有非常到位的介绍。
我还要补充的是当我以第一人称写此前言而且试图为SSIS的开发提供一些建议时,我在团队中的角色只是一个支持人员,而且此产品无疑是团队集体智慧的结晶:辛勤工作、专注、着眼于客户以及谦逊是我们这个团队的特点,实际上,其中的许多成员(Runying Mao、James Howey、Ashvini Sharma、Bob Bojanic、Ted Lee和Grant Dickinson)都帮助审校了本书以保证技术上的准确性。在长达五年忙碌紧张的开发过程期间,他们在百忙之中抽出时间来审校了本书!
我猜想在你阅读到本书时我们已经开发完成了SQL 2005,发布这个我个人认为具有很多优秀特性的伟大产品,是一个漫长但却有价值的旅程。SSIS是SQL Server 2005的一个重要附加部分。而且本书将帮助你熟练掌握它。SSIS很容易入门,但它是一个非常深入而且功能丰富的产品,具有一定的复杂性。本书将尽可能地为你展现SSIS所提供的广泛价值。我真诚地希望你能够愉快地阅读本书,尽兴地使用SSIS。
Kamal Hathi
SSIS产品单元经理

1044

被折叠的 条评论
为什么被折叠?



