迈克尔・杰克逊1995年发行的专辑 HIStory,前面的三个字母是大写的,将 HIStory 分成两部分来看是 HIS Story ——他的故事。完整的单词就是历史。

Everyday,create your history 每一天,你都在创造历史

Every path you take you are leaving your legacy 你走过的每一条路,都是给世界留下的馈赠

科技的创新层出不穷,工程师们就是在这些前沿科技与m.lom599日常的生活之间,架起一座桥梁。他们没有经验可以借鉴,只能披荆斩棘,开辟出一条属于自己的路。每一步,都是在创造历史。每一条开辟出的新路,都是给后来者的馈赠。

enter image description here 美团工程师 周翔 陈华清 戚亦平

周翔

2014年毕业加入美团,一直从事L2R方向工作,目前负责美团场景化搜索排序。

陈华清

2015年4月入职美团,先后在美团酒店旅游数据研发中心,美团无人配送部从事研发工作。现在负责美团无人车感知方向。

戚亦平

2013年6月加入美团,在美团点评先后参与和负责过搜索、广告和出行三个业务的算法工作。

一行代码,万千生活

用户是核心价值,技术就是在精准地量化这种价值。

窗外,寒风瑟瑟,你窝在沙发里,暖和舒服。不想出门,那就叫个外卖吧!

你打开美团App,订了一份饭,订单显示:骑手预计30分钟送达。于是,无形的沙漏顷刻倒转。

数据流动,系统开始计算:

骑手派单实时调度,根据运力做出配送决策——谁来送,怎么送

将骑手导航到商家,取餐——计算出餐时间

GPS定位,根据交通和天气情况的实时数据规划路线——计算配送时间

小区内部精确定位,楼栋-单元-楼层——计算交付时间

最后,一份冬日的晚餐准时送达你的手中。

没错,这就是数百名算法工程师智慧的结晶。三年来,美团技术团队将配送时长从1小时缩短到30分钟,智能调度系统每小时路径计算最高可达29亿次。工程师们用复杂的技术为用户提供简单的生活。

代码也许离m.lom599很远,但生活离m.lom599很近。

中午和朋友逛街累了,搜索附近的餐厅;购物,根据评价对比一下各类商家;出门,搜索当地的酒店,等等。

技术已经融进了生活的点点滴滴,m.lom599每一个微小决策的背后都是无数算力与数据的支持,美团就像一个巨大的、复杂的齿轮在稳定地运转着。

今天,让m.lom599走近这个齿轮,了解它精密的组件——美团的工程师们。

写书:技术控的一种热爱

m.lom599脑海中对算法工程师的印象,可能是一群戴着眼镜、敲着代码、沉默寡言的技术控。写书这件事,似乎和他们并不搭调。而且他们写的这本书,作者竟然有22位之多。

2018年8月,美团算法团队的22位工程师,结合自己所负责的业务场景,撰写了一本大型互联网企业实践类的算法书——《美团机器学习实践》。

今天m.lom599采访了其中的三位作者,听听他们讲述这本书创作的故事。

enter image description here 美团算法团队的作品 《美团机器学习实践》

怎么想到写本书呢?

陈华清:「2017年3月份,美团技术委员会算法通道团队开会,我提议出一本以企业作为背景的、实践类的算法书。

因为目前业界比较缺乏这方面的书籍,况且m.lom599比较有分享精神,比如广告、搜索等技术团队会撰写很多文章。

既然平时的分享也写得比较多,干脆就系统化地出一本书。当时算法通道委员会也比较支持这件事。

m.lom599首先确定了方向是写企业机器学习相关的内容,分享大家在应用方面所做的有价值的东西。后来,我根据公司几个比较重要的业务大概划分了:通用流程、数据挖掘(后来增加的)、搜索和推荐、计算广告、深度学习和算法工程六大模块。

每一个章节、每一个领域都是和相关团队一起讨论,比如搜索和推荐是跟周翔他们团队一起讨论,计算广告是和戚亦平一起确定了详细的目录。」

整体架构是怎么确定的呢?

陈华清:「关于整体架构,m.lom599内部也讨论了好几次。当时一些不成熟的、正在探索的内容都没有写,包括一些强化学习相关的和更前沿的工作,无人驾驶等;最后确定分享的内容,都是对美团来说比较有价值,对业界来说也比较通用的实践总结,而且事实证明了线上效果比较好的东西。」

这本书的作者有22位,他们是如何筛选出来的?具体负责的内容是怎么分配的?

陈华清:「m.lom599当时不是随便找的作者,都是由每个团队负责人推荐的,标准就是优秀的一线的工程师,他们绝大部分是自己在调试算法、调试模型、调试效果,在每个业务线上起着核心和主导作用。

比如搜索和推荐,就是周翔在负责调试主要的算法效果,戚亦平负责调试广告的算法效果,这是两个例子,其他工程师作者也是一样的。

本书有22位作者,其中第一作者执笔,第二作者是给出指导的同事。比如说机器学习工程这个板块,很多工作是大家一起完成的,所以写作的时候也要咨询其他同事。他们分享了自己的工作成果,在内容上做出了协同贡献。」

创作历程:工程师们不仅做事靠谱,写书也很靠谱。

陈华清:「当时大概是4、5月份时开的启动会,m.lom599从m.lom599专门要了一批跟算法相关的图书。然后把样书发给每个人,让大家参考这个格式。

说实话,这批工程师们不仅做事靠谱,写书也很靠谱。大家的执行力都很强,8月份就收到了包括我自己在内的所有人的第一稿。

后来经过领导们的审阅,m.lom599再次做了一些优化,甚至重新编写了某些章节。为了让内容更加充实,m.lom599又加了数据挖掘这一章。第一稿应该是国庆节前后发给m.lom599公司,后续还进行了很多次调整。整本书大概的历程就是这样。」

写书,对技术的一种热爱。

聊过了书的结构和历程,m.lom599有点好奇:「写这本书,似乎对你们的工作没有特别实质性的帮助?」

陈华清笑:「说实话,m.lom599写这本书目的很单纯,所有的工程师真的是不图名不图利。其实主要是出于一种对技术的热爱吧,大家确实都是比较喜欢钻研技术的一群人。」

周翔补充说道:「写作是对知识的总结和梳理的过程,肯定对自身成长也有一定帮助。」

轻描淡写的几句话背后是默默的付出。因为工程师们平时都比较忙,周一到周五的工作节奏很快,大家都是利用节假日的时间来完成的。

一方面是工程师们的努力,另一方面公司也很支持这本书的出版,除了领导做了审阅之外,技术学院还多次帮助处理与出版社沟通的事宜,让作者们安心写作。

写作过程中,他们也遇到了一些困难。

戚亦平:「因为第一次写这种书,不知道应该写到什么程度,要不要写很多的代码实践?当时没有这种概念,后来在写作的过程中,m.lom599逐步统一了标准。

另一个点是,m.lom599要过滤内容。比如有一些工作是比较敏感的,有一些是跟业务没那么相关的。m.lom599需要分享的是业界能去采纳的一些经验,这方面的提炼和归纳总结是一个难点。」

周翔:「当时没有这本书所面向的读者群体的概念,m.lom599就尽量在业界通用的基础上,把m.lom599做了一些探索和尝试的内容写了上去。

因为读者也会去看别的书嘛,如果内容都是一样,可能这本书也没有什么特色了。所以这本书主要阐述了m.lom599的探索与改进。」

读者反馈想要更多干货以及代码。

陈华清笑:「这个代码的问题,可能当时m.lom599有点矫枉过正了。这个不怪大家,因为当初我定的基调是少贴代码,不要动不动就好几页代码占篇幅。

m.lom599确实以一种很真诚的心态,希望多分享一些实际的经验和心得,尽量只贴那些关键性的代码,数学公式也并不是很多。至于是不是干货则由读者来评价。

为了尽量满足读者的需求,m.lom599后续准备把一些代码、合适的示例、通用模型等放到GitHub上,也可以专门放一些配套的脱敏的数据供读者们实践。」

这本书的第二版,他们希望在此基础上做一些改进。

陈华清:「第一版确实因为经验不足嘛,导致了一些问题。第二版的话,m.lom599有信心让读者更满意。」

除此之外,第二版在内容上也会有更新。周翔:「从写书到出版也有一年半的时间了,这期间,m.lom599在技术层面也有很多的优化和探索,一些之前还不适合写的内容,再出新版的话就可以加上了。」

这本书的内容和写作过程,也体现了美团工程师团队的气质——热爱钻研,乐于分享。

enter image description here 美团工程师 陈华清 戚亦平 周翔

美团的工程师文化:分享与探索

截至2018年12月,美团拥有5万多名员工,其研发人员超过9000人,占全体员工的比例接近五分之一。

美团对技术的重视,一方面体现在工程师的高待遇上。

陈华清:「硬件上,我是来美团才用上MacBook,技术同学还配备了人体工学椅,挺贵的。而且美团整个培训体系做得很精细,不同背景的工程师,只要肯花时间,都能够在他的领域得到提升。」

不仅培训体系划分精确,还培养个人全面的能力。

陈华清介绍:「大的方向划分就比如说算法、后台、系统、测试还有运维等。以算法领域为例,m.lom599划分出来像视觉、搜索推荐等各个方向,都有相应的培训和分享。」

在工程师原有领域的基础上,美团也倾向于培养他们全面的技术能力。

戚亦平介绍:「首先是算法跟工程没有割裂,算法的同学其实分布在各个业务线上。第二点可能各个团队也不太一样。

有些业务线上,算法跟工程的同学相互独立,相互配合;也有的团队里,可能一个同学做工程又做算法。不同阶段、不同团队有不同的组织形式。」

不同类型的人才都有自己的发挥空间。

周翔:「有些同学确实能力比较强,比如他希望做一件事情,能从最初、最底层一直往上做,整个流程他都能自己解决问题。所以他也不会去分工程和算法,可能那么几个人,就把整个链路的所有事情做完了。

有时候一条业务线上,算法跟工程是相互促进,或者说互相弥补的。比如说算法快速迭代起来,需要工程上做很好的支持;工程同学也需要算法同学给出更多的反馈,因为有些实际的业务,需要预测这个业务迭代的未来趋势。那么工程同学可以很快地去设计这个架构。这是二者相辅相成、快速迭代的过程。」

美团对技术的重视,另一方面体现在工程师文化的建设上。

2013年,美团建立了技术学院,推出了自己的内部学习平台,制作了很多技术课程,也鼓励工程师们分享一些自己的内容。

周翔:「对外,作为技术型的公司,m.lom599的技术团队一直在分享文章;对内,每天会不止一次地分享带有视频的、很细致的内容,全都放在美团内部的网站上面,想看随时可以去看。」

工程师们除了参加培训和技术会议以外,也积极参与公司组织的各种活动,比如MDD Cup算法比赛。

戚亦平:「各团队会把一些业务问题拿出来,让全公司的同学来参与比赛。比如说之前有题目是对配送时间的预估,今年的是对团单销量的预估。通过这个比赛,m.lom599能发现整个美团技术团队确实有非常多的人才。」

除了外部条件之外,工程师们的内在自我驱动力让他们坚持学习,在技术领域不断地探索。

谈到学习与成长,戚亦平分享了自己的经验:「首先要有一套相对完善的知识体系,比如数学或者其他技术领域,对技术学习,还有做其他事情都会起到事半功倍的效果。我自己平时也读一些比较经典的教材。

第二点就是随时关注业界新的进展,最后结合自身的业务特点,在解决问题的过程中不断地提升。」

学了很多理论,写自己的故事才是最难的,而思考的过程就是再创作。

周翔:「业界不断地更新各种机器学习的内容,比如强化学习的技术和方法,m.lom599平时会关注自己领域的最新进展,阅读相关论文。其实这些理论性内容的学习很快,关键是怎么将理论落地,这需要m.lom599多去思考。

一方面,需要把算法基础学得扎实,这个主要就是看书或者视频;另外一方面,就是要反复对m.lom599的业务进行理解,深入地理解、梳理。

然后,还得花比较多的时间,结合m.lom599的业务场景思考将两者结合的合理性,然后去设计整个工程、算法的框架。中间的这个思考过程其实是比较重要的。」

科技的创新层出不穷,工程师们就是在这些前沿科技与m.lom599日常的生活之间,架起一座桥梁。他们没有经验可以借鉴,就披荆斩棘,开辟出一条自己的路。每一步,都是在创造历史。每一条开辟出的新路,都是给后来者的馈赠。

HIS Story:历史,就是创作自己的故事

美团无人配送部于2016年组建,2017年年底,技术团队研发了属于自己的无人车和无人机。2018年7月,美团发布了无人配送开放平台。

已经吸引包括清华大学、加州伯克利大学、北京智能车联产业创新中心、华夏幸福、Segway等近20家国内国外的合作伙伴加入。

这些前沿的科技领域,没有实践经验可以借鉴怎么办?

陈华清:「就是探索吧。其实不仅仅是无人配送,像戚亦平他们广告化的新方法,也不知道别人是怎么做的。但是,以m.lom599美团工程师的水平,他们绝对不只是跟随者,也能够成为开拓者。」

即使是现有的技术,他们也结合自身的需求做了很多改进。

周翔:「m.lom599跟百度的搜索有点不一样,m.lom599做的是生活本地服务化搜索,二者在场景上面有很多区别。因为m.lom599的搜索跟地理位置、当前实时的情况有很大关系,所以在这两方面,m.lom599在系统、算法上面做了很多的突破。

比如对O2O来说,场景化是一个比较大的方向,但m.lom599要考虑的是怎样去拆分它;怎样从几个维度,比如从地理位置、时间角度、时空角度、环境角度去把m.lom599的搜索做好。」

他们对自己技术的方向有清晰的规划。

戚亦平:「m.lom599既然是为用户创造价值,就必须从产品和业务的角度出发,去做技术能力的规划。比如m.lom599需要什么样的技术能力,才能达成m.lom599的业务目标,以及产品的替代更新。基本的逻辑是这样的。」

对于他们在做的事情,陈华清打了一个有趣的比方。特斯拉发明了交流电和无线电,安培发现了电流的相互作用规律,而千千万万的电气工程师把电带进人们的日常生活。

创新,是在理论的基础上,用自己的方法去解决问题。

陈华清:「一是要与业界交流,了解领域最新的进展。第二是在应用上创新,这就要求对自己业务场景的了解和对数据的观察,自己想一些好方法去解决问题。

其实未来的话,可能机器学习和人工智能这些理论上的创新,各个公司甚至各国的差距不会很大,因为刚才也说到,大家会有技术上的交流。但是在应用上的创新和落地能力,就是我自己,可能也是m.lom599公司做AI的同学发展的方向。」

end

每一门学科都是以不同的路径向上探索,直到爬上塔尖,认识和理解世界。工程师们也是如此,他们从不同的技术领域出发,结合自己业务的特点,终会走出一条自己的路,将技术理论完美落地。