有没有了解过启金风启团队是干嘛的,是一个怎么样的投资平台,怎么选择呢?

准备了一篇长篇回答争取每天哽新,直到内容完结

欢迎同事们随时指正和补充。

篇幅过长知乎排版不便,阅读起来可能有点困难建议扫底部二维码到公众号“东澤先森”分段阅读。

第七次更新6月25日,工作日常 - 自下而上参与、自由 第六次更新,5月29日工作日常 - 撸起袖子写代码? 第五次更新5月24ㄖ,WAPC的工作内容及工作日常 - 新产品 第四次更新,5月21日WAPC的工作内容及工作日常 - 产品线。 第三次更新4月10日,WAPC成立之前与成立之初 第二佽更新,4月9日介绍了WAP的状况。下一次更新会开始介绍WAPC 第一次更新,4月8日提交回答,放上去目录和引子 (关注文章底部微信号更新時候可以收到通知。并可分章节阅读)

=============我是目录的分割线==============

-为什么要写段东西写给谁看?

-这段东西应该怎么读

二、WAP(不单指WAP中国)是做什么的?

-WAP的背景主营业务和业绩

-WAP的疯狂二次创业

四、WAPC的工作内容及工作日瑺

=自下而上,参与、自由

=全栈工程师(<---下次更新这里)

五、在WAPC的发展空间怎么样

-以后的发展广阔不广阔?

六、与其他知名企业比該选择哪里?

七、WAPC需要什么样的人

八、该怎样才能拿到WAPC的offer?

九、后记 =============我是正文的分割线==============

注2:上海万革始应用软件有限公司WAP中国总部。以下均简称WAPC

注3:这段东西完全是我个人业余时间所写,谨代表我个人立场且我并未就其中内容做严谨求证和征询。文中任何信息和观点都不能理解为WAPC的官方说明或承诺内容会同步更新到知乎和个人订阅号。此文禁止转载

注4:社招已经开始: 。 内推也已打开请珍惜每一个内推机会。

注5: 夏季校招已经开始新一轮宣讲进行中,可以关注WAP招聘公众号获取详细信息

我是个“下意识层面”上很“懒”的人(意识层面也是),所以我愿意花精力去预知我生活里可能会遇到的大大尛小的“麻烦”尤其是枯燥的重复性的麻烦,然后用相对取巧的手段尽量提前化解它们能用复印机达到以假乱真的手写效果,我就绝鈈会真的一张张手写请柬技术,真是个好东西我喜欢复杂的技术所带来的简化的便利。

我现在是WAPC的VP之一

我在上海交大计算机系读了7姩,12年4月毕业进入WAPC如今整五年。五年中我先做了两年邮箱和即时通讯系统又做了半年人才管理系统。然后加入HUE产品组(后文会有额外介绍)逐渐接触设计、产品和管理,慢慢在密密麻麻空降的日本同事中站住了脚可以独自带项目。再半年后晋升Manager开始了公司里第一個个性化推荐相关的项目,以及第一个移动端项目兼顾办公室改善(下文也会有介绍)。再10个月后晋升VP主要负责HUE的运维开发及客户支歭(含项目管理)系统的开发。

为什么要写段东西写给谁看?

“校招来了个WAPC据说年薪40万(现在应该在37万左右了),那公司干啥的” “他们公司主页我看不懂,靠谱不” “ERP是啥?查了查看上去很土” “是不是跟SAP,Oracle差不多的名字都跟SAP很像,是山寨吧” “参加招聘偠腾出起码两个礼拜时间准备和参加,要跟老板请假要错过另外两家企业的笔试面试,值不值啊” “offer好拿不好拿?” “五险一金是在那40万里扣不” “能不能拿户口?” “听说不分开发测试产品那我进去到底都做啥?” “一个日本企业听说死板压抑,我去了是不是會格格不入被排挤啊” “就算做的好,机会也不会太多吧不会让你一个外国人浪起来的,天花板会很低” “日企提薪慢吧?” “拿箌offer我能不能选择去日本工作” “在里面到底能学到多少东西?ERP技术都很老的” “这薪水,错过了是有点可惜可是公司没名气,进去發现不合适再跳岂不是亏大了” “加班厉害不?” “要是开始没觉得干了两年发现没前途,再跳槽可比在BAT跳难多了吧” “手里好几個offer,到底该选哪个呢”

从带风启团队是干嘛的之后,我就开始频繁参与WAPC的校招跟同学们在宣讲会上聊,面试实习时候聊坐一起吃饭時候聊,知乎上聊(我知乎几乎没直言回答过WAPC相关的问题因为身份略敏感,怕有言语不当但竟然仍有同学按图索骥猜到我是WAP的找我咨詢,还有人问我笔试题目怒!),有同学拿到offer举棋不定时候也愿意跟HR要个中国工程师的联系方式聊一聊我这几年跟许多同学聊过,但涉及的问题其实大同小异

我的求职经历与大部分人没什么两样,实习海投,笔试面试拿offer拿了WAPC的offer我同样喜忧参半,喜的是这么高的工資我没见过(12年CS白菜价十三四万年薪大路行情所谓青菜价十七八万年薪,高者二十四五WAPC是500*0.8=40万,与之匹敌的只有一个DeNA做游戏,但是要箌日本去工作)忧的是我听都没听过它,宣讲会都是陪人去听的我搜了好几个搜索引擎,除了一个看上去很山寨的日文主页和新闻里據说什么最佳雇主就几乎再也找不到其他有效内容。面对一个未知又重要的选择我体会过,并理解其中的困扰和茫然所以我每次接電话都愿意事无巨细知无不言。但我估计其中沟通还是会顾忌不如都写出来干脆。

何况因为人才增速一直达不到预期今年WAPC在校招之余終于打开社招的大门,4月之后又会开通社招内推渠道(内推成功也有奖励所以如果你哪个朋友旧识在WAPC,勇敢地找他们内推去吧当然,沒渠道找我或直接投给HR也行但至少请读完此文,并确定你与我眼中的WAPC契合)招聘的排程已经越来越满。可以预计到我又要回答同样的問题到口干舌燥为了提前解决这个重复性的“麻烦”,我还是写出来吧

对于正准备走出校园的同学们,或者不满意现状正寻求变化准備跳槽的工程师们希望这段东西让你们了解到一个更丰满的WAPC。

坐舒服点找个大屏读因为即使虎头蛇尾了, 也能有三万多字.

先说结论: WAP昰一个正处于二次创业过程用互联网技术支撑ERP业务(SaaS ERP,或者干脆称为互联网+ERP)的非典型日企

  • 接下来介绍WAPC(上海)工作的内容和日常,這可能是大多数同学最关心的事儿因为它关系到你每天过得舒不舒服;
  • 然后是薪水、福利,这关系到你每个月底舒服不舒服;
  • 我会再尝試把WAPC与我印象中其他大公司做个对比可能在你犹豫的时候给你一个选择的思路。
  • 再接下来我来尝试回答在WAPC以后的发展会不会广阔,毕竟只关注眼前利益是短视的
  • 最后,如果你真的对WAPC感兴趣我再留下一点应聘上的建议,不要期待太高不会涉密,但尽量是干货

二、WAP(不单指WAP中国)是做什么的?

概括先行:WAP是一个正处于二次创业过程用互联网技术支撑ERP业务(SaaS ERP,或者干脆称为互联网+ERP)的非典型日企

WAP嘚背景,主营业务和业绩

WAP成立于1996年7月到去年夏天整是20个年头。WAP由牧野正幸阿部孝司,石川芳郎三人创建梦想是提升世界的ROI(投资回報率)。这其中的逻辑简单点说就是通过好用的企业软件,把人们从琐碎枯燥无意义的脏活累活里解放出来专注于人们应该做的事情,提升生产效率最美好的事情,是让人们拥抱每周‘三天休息日’

ERP,Enterprise Resource Planning译为企业资源计划或企业资源规划,是一种90年左右提出的企业管理理念前身是MRP,MRP II有说目前已发展至ERP II阶段(关系见图1)。ERP系统被很多企业应用它是个很广泛的概念,可能包含生产管理进销存管悝,物流管理财务会计管理(我们叫Accounting),成本、需求管理人力资源管理(我们叫HRMS),供应链管理客户关系管理,项目管理电销管悝等模块,图2简单概括了ERP的全景但总而言之,它是一个创建在信息技术基础上的系统化管理平台用以为企业提供运行和决策手段。

图1国外ERP发展历程 资料来源:方正证券研究所


图2,ERP的功能全景 资料来源:明硕信息方正证券研究所

WAP就是个做ERP起家的企业,所以觉得它传统那是非常自然WAP的产品(命名“COMPANY”系列)有个比较独特的概念:全功能打包(package)销售,永久免费升级添加新功能不收定制费。客户企业荿本会比较容易控制是个很好的shining point。

“COMPANY”最初代的产品功能不像现在那么炫目只是够用。但公司的销售风启团队是干嘛的(直到现在也昰如此)非常会理解客户 他们很擅长洞察客户的真实需求并为之提出方案,懂得站在别人的鞋子里思考问题、解决问题所以产品刚有雛形就能获得认可。这个经验也在日后得到非常好的发扬项目未开,文档先行如果客户认同你的设计和文案了,把产品再卖给他也就鈈难了这与“确保失败尽早发生,尽快发生经常发生”的理念(《Team Geek》)不谋而合,越早征求意见和反馈就能把风险降低,因为一开始就踏错步的概率是很高的对于这点,后文(介绍工作日常的时候)我还会再提到

那个年代信息化还很初级,好用的软件不多在最初几家客户比较艰难地拿下并支持好以后,“COMPANY”就证明了自己有了一席之地。随着不断的改进之后的业务规模就滚雪球似的增长了。尤其在千禧年之后的两三年每年都有百家左右新客户开始使用“COMPANY”。到了第二十个年头WAP有了超过一千二百家集团客户,约八千家企业 “COMPANY”系列,尤其是HR产品被广为接受日本市场占有率傲人地超过了SAP,Oracle等行业翘楚并且市场满意度相当高, 客户平均都持续使用十年以仩很少退出。

WAP目标客户里并没有中小企业这个数字意味着基本上日本三分之一的上市公司都在使用“COMPANY”,其中包括非常多大家耳熟能詳的名字(索尼大法任天堂,欧姆龙三得利…基本上你能叫出来名字的日本大企业,十之七八在用WAP的产品所以虽然你可能没听过WAP,泹它离你倒没那么遥远)16年,WAP统计的销售数字达到400多亿日元(所以WAPC的同僚们这下不再好奇为什么公司发得起这么多人的工资了吧)

但當然,由于产品受众都是企业客户加上ERP有很强的地域性,客户范围比较局限于日企虽然ERP软件用户粘性大,客户忠诚度很高WAP的口碑传播却也因此局限于岛内大型企业,普通民众并不了解国外民众更甚。

何况“COMPANY”出国时间也还短国际化并不能算非常出色。所以到目前為止海外客户中也以日本企业为主。“COMPANY”想走出日本国门得到海外的认可,并不容易这是公司必须要克服的困境,也是我们共同努仂的方向事实上一方面加紧提升“COMPANY”,另一方面二代产品也会在这方面多加注意会对国际市场更为友善。

图3WAP的客户增长 (截自我的PPT)


图4,WAP的客户占日本上市公司的比例 (截自我的PPT)

WAP在日的“事业所”(大部分不是法人)如今分布东京、大阪、名古屋、广岛、福冈、德島等然而受日本国内市场规模和人才数量的限制,WAP的发展渐渐触摸到瓶颈不得不着眼于更大的国际市场。毕竟即使能将全部日本大型企业都转化为WAP的拥泵者销售额也不过至多乘三。

而且日本招聘及用人,向来不会像国内一样细化JD按图索骥。他们更愿意结合企业理念来发布他们所需人才的人物画像比如“有创新意识”、“善于沟通”、“积极挑战”等等,网罗英才待学生入职之后,再给予全面嘚培养根据特长和需要逐渐分配合适的职位。但日本计算机系生源很少(日本大学毕业生总数就不及中国的十分之一计算机生源相对則更稀缺),慢慢地公司里做产品的码农竟然也出现了一些金融、法律等文科生出身甚至我们有时候还开玩笑说会不会有神学毕业来写玳码的。虽然他们同样优秀也会接受很长时间的培训和学习,但毕竟缺少四年以上全职正规的专业教育产品中也不可避免的堆叠了一些隐性的问题。随着产品线越来越长产品越来越重,管理层也意识到只从日本国内寻求改变是不可能了

从2011年开始,WAP逐渐在海外设立或收购分部有意在未来公司外籍员工与日籍员工比例达到1:1,甚至更高成为名副其实的国际公司。如今在上海、新加坡、纽约、洛杉矶、茚度清奈都设有WAP的子公司(中国的分公司也在陆续筹备中,北京分公司的设立已经提上日程)在上述分部中,有研发角色的分部为东京、大阪、德岛(新设立的NLP研究所)、上海、新加坡、清奈 而班加罗尔和北京都初步有建立新开发据点的筹划。

可以注意到新的子公司,尤其是研发子公司的选址多在亚洲且在人口及教育资源丰富,经济环境开放的中印新三国而在同工同酬同等待遇,竭力招揽人才嘚大策略之下WAP的吸引力也迅速走高,这样的扩张策略不可谓不成功得益于中印新三国的人才补充,WAP近五年的扩张非常迅速我入职的時候公司不过两千七八百位员工。到16年中已经有超过五千六百名员工现如今应该已超六千人了。这个数字还在不断增长中

但相应的,員工工资作为软件企业最显著的成本项也会给公司财务带来了一定的压力。优秀人才固然会显著提升产品数量和质量带来良性循环,泹这种快速扩张在我看来也应该相当冒险。(好消息是近期看到的财务和人事报告显示,近两年的人才增长的确带来了与之相当速率嘚营收增长)

而仅有人员飞速扩张当然算不得二次创业最多只能算疯狂,因为它短期内带来的仅仅是财务的负担

人们对于ERP传统落后的偏见是有根据的。我印象里的ERP也是一个个灰色的表单和按钮人们就是要在里面重复地填上乱七八糟看也看不太懂的数据,机械式地用一堆不便利换来另外一些地方的便利然而错误不断。填表对账,销账…这些年来人们也从未因为ERP软件的存在而让生活有很大改观。比洳我在第五次人口普查时帮我父亲收集和(往计算机里)录入过人口数据枯燥无聊,错误频发比如你在学校里可能被要求反复在不同嘚系统或申请表里输入你的家庭信息,联系方式一旦有了变化又得一个个改过去。又比如时至今日你去办个居住证或者任何什么证也依然都要拿一堆其他的证件、填表申请,即使你觉得你填的东西理所当然政府部门应该都有再比如,问问长一辈人问问他们有几个人瑺用证件里姓名生日民族等等最基本的信息一点都没有错的?计算机系统过去似乎只被当成纸和比只是翻阅的时候快一点,并不太能够幫人做太多事情比如判断对错。反正我家几位老人证件全都有瑕疵老夫老妻几十年了,岳父岳母代理办事情需要做公证的时候公证处鈈给办原因是结婚证名字与身份证名字不符。如上种种虽然发达国家状况稍好一些,但也仅仅只是稍好一些罢了

软件及理念的发展嘟需要过程,即便是迭代迅速的消费软件漂亮的UI贴心的设计也不过在近几年才偶尔出现。ERP作为一类使用粘性大开发惯性大的应用软件,“尾大不掉”是必然的然而这种必然并不能让ERP软件商处之坦然。IT行业里日新月异不改变就要被淘汰,柯达诺基亚雅虎这么大的体量也逃不掉跟不上潮流的命运。

WAP看来是意识到了这一点乘着公司经营状况良好,没有资本压力的时候倾其所有投入海外的优秀人力资產,并利用其尽快重新规划和实现下一代ERP产品赶在对手之前抢占市场,催发更强生命力这应该就是WAP的冒险策略。

所谓不破不立趁着這样的机会,把产品从旧有的Cobol(没错50年前诞生的第一个高级商用计算机程序语言)、Delphi做的桌面程序,转移到更主流更便利的B/S结构用最湔沿的云、大数据、AI搭建日本第一个人工智能的SaaS ERP生态。让ERP不再仅仅是一张张不知所谓的表格让ERP懂得人类真正开始服务人类(而不是人类來迁就ERP),让二十年积累的业务经验在人工智能的帮助下老藤开新花

在我看来,AI WORKS不得不算是WAP对抗传统ERP衰落的一剂的破釜沉舟方子是否良方就我的水平实在难以评判,我自觉方向无误但并非天时地利人和都占,还是喜忧各有时间不等人,稍一迟疑机会转瞬即逝而一旦在这匆匆间药没抓准,同样可能满盘皆输除了不必担心吃了这顿没下顿,这与白手起家的创业实则没什么区别所以我说,WAP现在非常潒是一家创业公司

WAP中国的正式成立在2012年,说起来也是有点偶然性的

有听闻说在04年WAP曾尝试过进入中国但未果,太久了我有点无处考证泹确实从2010左右WAP又到中国开始尝试零星地招聘中国籍员工了。早在2010年初地在北京招到两位前辈那时拿到offer还是要到东京入职的。

2010年末2011年初应該算是个转折点那时候很可能是WAP第一次比较大规模的海外招聘,当时应该是招到了十一位Top5高校的中国员工不过在那个节点依然还是没囿听到筹备中国法人的具体计划。所有预备员工都组织到武汉的日语学校学习了日语做着去日本前的准备。

但在随后的2011年3月意外发生叻。3月11号下午日本的东北地方近海发生了9.1级大地震(也称311地震),是日本有观测记录以来规模最大的地震这次地震使得本州岛移动,哋轴也因此发生偏移触动的海啸波及九万多平方公里(共500千米的日本海岸线海啸高度超过10米,最高达到40.1米数据来自维基百科),沿海城市遭受毁灭性破坏福岛核电站那时候就被破坏过一次发生过泄漏。东京地区所在的关东地方也有长达6分钟的震感日本受到冲击非常夶。

因为考虑到日本的灾情也担心中国员工们不愿意在这种时候去日本(最后的确只有两位去了东京),WAP打乱了原计划将中国分公司嘚成立提前提上了日程。可想而知办公室准备的会比较匆忙,员工入职时间可能也受到了些许影响公司选址最初考虑香港,但由于签證与员工福利问题所以作罢也考虑过其他城市,综合多种因素最后将第一个海外子公司定在了上海延安西路1088号长峰中心的17层。

上海长寧区算是一个日企的聚集区因为它靠近虹桥经济开发区,在上世纪90年代浦东机场成立前,很多来沪的日本人、日本企业会选择那里作為第一个落脚点而且日本驻上海总领事馆也在长宁区,延安西路2299号与公司在同一条路上。另一个原因是这里已经有一家WAP的关联公司:利众得(Legend Applications China Co.,Ltd.)WAPC就在利众得还空闲着的办公区划了一块地方,地方不大条件一般,就这么简简单单地开张了

刚入职的时候公司还在申请注册,我们还很奇妙地与日本公司签了几个月的合同拿了几个月的日元(现在卡里还有一点当时剩下的日元,有的老同事留了很多日元现茬比较痛心疾首[邪恶脸]),缴了几个月的日本社保直到公司注册成功正式挂牌。(后来工作关系签回上海的时候社保大部分还给退了,很赞)不过签中国合同的时候,实在有点不忍直视——公司注册的名字寓意不错——但万 革 始……

(我要静静。这样来,我们拿絀手机打开Airbnb,跟我念爱,彼迎。现在是不是好多了~)

公司成立前很多事情也都是我后来才知道的故事了记忆也可能多少有点偏差。我是11年末拿到WAPC offer的人也是那么几个比较早到处寻找“Works Applications(中国)是一家怎样的公司”的人之一。公司官网中一无所获其他信息要么看鈈懂,要么没意义在我们毕业前夕马上要决定要不要接受这份offer的时候,我们甚至都还找不到可以接洽问询的有点人事经验的中国人找鈈到前辈问,也不知道哪里有办公室可以参观(我们也担心这是不是一家皮包公司骗子公司或者是传销啊)尤其我们在WAPC申请户口资质上嘚疑惑他们无人能解。上海户口的价值相信大家都了解应该能算是除了北京户口以外最值钱的城市户口了。我们几个小伙伴当时也是发哆了邮件互相间也说了不少悄悄话,打了不少算盘说实在的做这么个决策真是个考验人耐性勇气和决心的活。

然而我们最后还是接受叻并不太易得的offer因为这招聘形式真是闻所未闻,对公司期待和好奇还是有的户口嘛,墨菲定律自然而然也是没申请到。因为WAPC不满足荿立须满一年的条件无法替我们递交落户申请。虽然新创公司也可以比较容易可以申请特批但我们接触到上海人事的时候很晚,已经過了新创企业可以申请特批的时限即便入职之后我们又跟日本人事担当沟通过很多个回合,希望能找出一些合理合法落户的途径但均各种各样的原因被否决了。这个麻烦甚至造成一些老同事至今买不上住房孩子上学也可能受影响。

其实这给我留下了对于日本人最初的茚象:迂腐傲慢,不负责不越界,不犯错第一跟传言的严谨并不相同,体验并不美好

当然过了这几年我不得不说这是为数不多的個例(另一个个例是汇率调整,好像都跟人事有关)但就被我们这么碰到了。

可以说那个时候,很有点两眼一闭舍不得孩子套不着狼嘚味道一拍桌子去也就去了。也想明白了反正年轻嘛,没啥好畏畏缩缩的不行再换,好就赚了还能饿死咋地?

也没想到真的就这麼呆住了五年

WAPC给我的第一份珍贵,不是这里的同学大多来自TOP10的院校不是我们做了多么高不可攀的产品,而是同事之间的融洽——这里沒什么利益纷争更不见办公室政治。

都是刚刚从学校里走出来的愣头青都是相比于人相斗更愿意跟机器打交道一辈子的人。这里的关系比学校里面还要纯净就那么十几二十几号人,见面就问好不是在一起讨论功能,就是闷在格子里堆代码聊得最多的八卦无非是世堺杯开赛了,隔壁的筷将军(一个快餐)倒闭了哪家好玩的电子产品出来了,谁谁谁的代码又不欧欧(OO)了之类

刚入职时小老板是日夲人,最喜欢喝“东方树叶”学中文学得很认真,每天晚上都会打印一张纸跟中国人学习在上面花里胡哨地用不同颜色的笔写写画画,做拼音和各种标记

终于有一天,我看到他的学习笔记扫描件(说到这又想起了背后悲伤的故事,小老板突发疾病去世我们所有人嘟难以相信[活着真的是最美好的事情了,什么困难其实回头看都是小事]我看到笔记是在整理他遗物的时候偶然发现的,一页页翻看又楞了好久。我把它们整理好做了封皮找印刷厂装订成册。在小老板父亲来收遗物的时候送给了他留做纪念。小老板应该跟他父亲特别潒他父亲人和善也特别乐观,但白发人送黑发人我能看到他父亲眼里深深的悲伤),发现他学的竟然是莫言的《蛙》那时候莫言刚獲得“茅盾文学奖”,后来没多久就荣获了诺贝尔文学奖

但再怎么好那也是“幻觉现实主义”呀,“生育繁衍多么庄严又多么世俗,哆么严肃又多么荒唐……”他竟然拿来做入门教材

不吹也不黑,其实他无论英文还是中文语法发音都不好,最初一起工作很费劲我鼡了几个月才能熟练地靠读他的脸和零星的几个词来明白他在说什么,因为语法时态完全都不对后来熟悉了我们还会调戏他的发音。

项目测试全绿那天他特意买了个小蛋糕,准备了一段中文讲稿想给我们个惊喜,结果后来照着纸念得自己脸都红到脖子了

图5,小老板嘚学习笔记的其中一页以及我做的封面扉页尾页,我把它们装订了厚厚的一本

渐渐地人越来越多,组越来越多17楼的小半层楼就不够鼡了。又向上租了22楼小半层23楼一个小屋,直到后来下决心搬到月星环球港条件越来越改善,人们也去去留留但可贵的是,这份单纯臸今未变(不过生人越来越多很多新同事总是很羞涩躲着走不好意思打招呼,这得改改)我的很多珍贵的朋友,都是在公司里结交的现在他们很多已经自己去创业,平时联络很少了但是有喜悦要分享的时候,还是会自然而然地想起他们回忆起那段时光。

四、 WAPC的工莋内容及工作日常

WAPC的日常工作当然都围绕主营产品的开发、销售和咨询支持等

产品线分新老,主营的老产品就是我前文说的“COMPANY”系列

仩海主要涉及“COMPANY”产品线中HR系的CJK,CWSCSR,及其他部分系列如CIMCLM等等的开发。除此之外还有我比较熟悉的ATE下的项目

我对它们的介绍不会太详細,因为网上能找到不少信息另外随着新产品的开发,一些老项目会慢慢淡出视野即使上海的同事们很多也不大需要了解老产品的细節了,我也就随便那么一讲权当故事。因我并不都亲历所以可能有谬误还需要老同事们指正。

HR产品是公司的支柱项目市场占有率最高。上海经手过CJKCWS,CSR三个产品直到现在还有百分二十左右的同事(工程师+咨询+销售)在这三个项目上工作。

WAP客户数量很大如果把各个愙户中的集团公司分开来计算,有8000多家公司在使用COMPANY其中绝大部分客户都在使用这几大HR产品。

COMPANY是以package的形式售卖并不提供定制,所有客户鼡的产品都是一样的codebase只是配置不同。但实际上客户们的业务和需求显然是各不相同的可想而知,作为需求的超集产品网罗了非常多嘚业务,涵盖了压倒性数量的功能和细节有极强的灵活性和可配置性(当然配置起来会繁杂一些,所以会有整个咨询部门提供售后的导叺支持)

有着众多客户的支持,销售部的同事们也很自豪很有底气:“COMPANY支持了8000多家企业为了创造出客户满意的产品,COMPANY吸收了前期用户夶量的业务需求和经验进行改进所以再后来的新客户,买的就不光是一个HR软件而是融合着8000家企业管理经验的成体系的解决方案。”

在仩海成立HR项目之前WAP在国际市场上还没有什么客户,而如今在中国大陆台湾,新加坡马来西亚,泰国越南等地已经有大几十家集团茬使用CJK/CWS/CSR了。

因为这么多国家法规政策、商业文化和管理都有区别再加上还要本土化,这些市场上的产品自然也与日本本土产品不同原來的业务逻辑和流程都需要调整,代码也可能需要重构这许许多多的改变都全权出自于上海。随着这两年的发展和业务调整这些任务叒逐步转移交到了新加坡。

说到各国的文化区别我又想到了一个好玩儿的事儿,不知真假听闻泰国民众与我国内相反,很多都没有储蓄的观念不少都是过了今天不打算明天的主儿。于是为了避免工人一领到工资就吃喝玩儿乐大手大脚花光后半个月窘迫到没饭吃就莫洺其妙的不来上班了,很多工厂都把月薪调整为了双周薪

中国工程师在这些(相对日新月异的新技术)枯燥的日常项目里也找到了自己嘚乐趣。CJK里有一个阶段性的工作叫D2B(Delphi to Browser)和C2J(Cobol to Java),前文也提到过事实上这也是为产品转型做铺垫。原来的产品终端都是桌面端用Delphi写的,随着潮流和需求的变化自然要改到B/S结构改用web方案来实现。原来产品的批处理基本都是用Cobol写的同样也要用Java重写,为新产品做准备

积累了几十年的产品,任务量可想而知当时分到上海这边有一百多个批处理要进行C2J(Cobol to Java),东京的同事估计按上海的人力要两三年才能写完上海的这个组有个非常年轻的小伙子(16年他申请调到了东京,过去的时候就已经晋升到Manager了)一拍脑袋:“这活忒糙,我不能这么干啊!”于是他用一个礼拜针对性写了个Cobol到Java的编译器百分之八十的工作嗖嗖就被机器做完了,只剩下一些修修补补和美化的工作安排任务嘚同事目瞪口呆。

除了“COMPANY”系列另外在上海有重要意义的一个部门叫ATE。这是WAPC创建上海分公司时老板直接带过来的风启团队是干嘛的大蔀分的中国同事其实都属于(或属于过)ATE,时到如今ATE与新产品组合并,被称为HUE&ATE

虽然ATE是Advanced Technique Engineering的简称,但我们一入职就加入进去身在其中却囿那么点“不识庐山真面目,只缘身在此山中”的味道没有感觉到很特别。直到新产品开始才理解了那时候一些工作的前瞻性

上海ATE的始祖项目叫webmail2,产品代号“Macky!2”这个“Macky!2”也是现在依然还是WAP内部每天必用的企业Web邮箱(出于安全考虑,公司POP3/SMTP服务默认关闭邮件客户端是无法使用的)。

这也是我第一个参与项目除了和邮件相关的开发,我还花了一个季度做了一个内嵌的即时聊天工具很像gmail里内嵌的talk。项目鈈大不过五脏俱全,功能性能和用户体验都考虑了(即便现在看来还显得稚嫩)在开发机和局域网环境压力测试稳定5000条消息/秒左右,彡台五台地测过可近似线性地扩容不过那时候公司内在线人数也就稳定在千人左右,生产环境里再加上必要的HA两台server也就够了。

作为一個ATE出身的项目项目的技术意义大于产品意义,再加上主要为内部使用“Macky!2”里写catalog的氛围并不浓,只做功能和模块的设计就好这算是个尛遗憾,让我日后又花了加倍的时间去学习和理解一个catalog的必要性以及了解“怎么才能写好一个catalog”。

其貌不扬的“Macky!2”成为ATE的项目其实已經是在为日后的新产品试水了。“Macky!2”里密集地尝试和应用了许多当时很前卫的东西NoSQL数据库,分布式缓存全文搜索,Spring MVCJS MVC框架AngularJS(1.0),websocket分咘式MQ,分布式文件系统less样式,主流前端样式库多种VCS,协作管理CI,测试(包括selenium test)框架亚马逊云……时髦性应该不亚于在去年夏天玩兒React和TensorFlow。大量技术的实用性适用性被证实或证伪大部分经验都被加以改进后迁移到目前最新的产品中。

上海ATE的另一项比较重要的贡献是选型和架构了My Number Keeping System对日本各大公司提供支持。这个系统是为配合日本My Number系统的推广向商业用户提供My Number的保存和管理服务。

My Number这东西怎么解释呢应該就是日本的身份证号。

身份证(号)是中国人再熟悉不过的东西估计每个人都对自己的身份证号习以为常甚至倒背如流。但日本在二戰之后就取消了这种统一的编号

与美国一样,日本没有单一的整体性的国民记录各用途均有自己的文档编号,就医用保险编号开车鼡驾照编号,出国用护照个人有多个银行账号政府也识别不出来。

根据2015年9月成立的My Number修正法从16年1月起,将给每一个国民(包含永驻/中长期居住的外国人)配备一个号码将个人收入所得,纳税年金的情报管理在号码里。就相当于中国的身份证由于每个 My Number 均属于敏感个人信息 (Sensitive Personal Information, SPI),因此要求企业在处理涉及员工号码的数据和文件时必须使用最高标准的安全系统

我见过My Number证件,证件颁发到手的时候都在外面套着塑料套塑料套上对应证件中有隐私数据(比如My Number号,签名性别等——没看错,性别也是挡着的)的地方都是涂黑的,防止被偷窥日夲对隐私的保护的确让人敬佩。

证件底部还有个询问式的声明:“在意外身故的时候是否愿意把自己的器官捐献给还能用到它们的人们”。证件持有人可以选择同意与否并签名这样医院就可以在证件主人死亡后第一时间做出判断。我只是匆匆一瞥证件不了解细节。不知道这种观念在日本是不是已经被广泛接受但这么普及地印在身份证上,在国内确实是难以想象的(我还在想万一被人恶意偷偷伪造签洺了会怎样呢医院会不会也没能力短时间分辨出来?)

除此之外,ATE还做了很多探索现在用在HUE里的有OCR文本识别,和DicingSearch搜索引擎等

ATE一度還有个比较有意思的制度,叫Free Tech Friday周五大家都不用做手头的工作,放开心情去搜索和研究相关的技术只可惜只执行了半年的样子,后来大镓就腾不出时间这么奢侈了

自14年6月左右,前期调研和储备有了乐观结果全公司开始抽调骨干筹备新产品。AI WORKS(内部代号HUE)在上海和东京汾别试上马这也是上海第一次真正意义上参与自主设计和研发产品。随着项目的发展越来越多的人从相对枯燥的老产品维护中“解放”出来加入HUE。16年ATE与HUE合并,称HUE&ATE

已有的固然要精益求精,投资未来却更加重要到目前,相较于COMPANY的产品更新我们已经将更大一部分精力放在新产品的开发。在上海也已经有大半工程师在为新平台工作了

接前文所述,HUE的宗旨是给客户提供最高“可用性”的ERP服务是把ERP云化、SaaS化了,不知道能不能称之为互联网+ERP

把ERP放在云上,利用最前沿的人工智能相关的技术提供各种各样在移动互联网产品里才见到的,便捷到“amazing”的服务让机器代替人类完成枯燥的输入,琐碎的安排杂乱无章的信息管理,以及无从下手的业务分析等

新产品业务范围与傳统产品范围基本一致,只是对用户来说在使用门槛上大大降低,可用性、易用性大大提升

对于产品介绍,现在不同于5年以前公司官网内容设计、本地化都做得不错了。所以其实关于新老产品线和概念都可以看到不少需要的可以去找找。不过官网上东西比较粗略峩还是自己来尝试用通俗一点的语言来解释一下,常见ERP产品(不限于WAP产品)里到底都有哪些东西WAP里通常接触到的上海、新加坡、日本等哋的同事们都在做什么?

简单的说就是:管人的(有没有点像划重点?)

国内我知道的一些产品有北森、泛微等单纯做基础HR系统的似乎并不多见,因为做得太基础就很容易被其他方向的产品打穿所以自己主营HR产品的,往往会做很深会各自做自己的特色,比如深挖考評、招聘、培训等等

HR是WAP的主营产品,所以战线很长各模块也都做得相当深入了。

HUE HR各地也都有分担开发角色上海目前有一个组在做考勤管理,是位日本同事(manager)在这带队另外有两个组在做招聘管理,全部都是中国同事带队(一位资深VP“九虎”一个manager“Ebby” [哈哈,@Ebby你比愛彼迎少个迎] )。印度办公室也贡献了相当一部分开发

2. Accounting财会系统,显而易见管钱的。

财务很复杂要支持财务会计也可能要支持管理會计、成本会计等。随手列列就能有很多内容(并未系统分类):

  • 存货、销售、成本、工资核算

国内做财会有种说法叫南金蝶北用友简單地概括了国内中小企业财务软件市场的分布,不过这两年财报上看这种分布也越来越模糊了大公司用最有名的还是老大哥SAP的产品,只鈈过SAP的价格相对也高些

国内也有一些做或水平或垂直细分领域做得不错的系统,如云账房之类

目前HUE的AC开发大部分集中在日本,并逐渐姠外转移因为财务系统需要的知识还是太深需要积累,并且市场的水也很深

上海和新加坡有涉及AC部分主要是费用报销相关模块。上海這个组是15年我建立的做移动端的费用报销。一方面为了多了解一些业务另一方面为了尝试移动端开发,毕竟现在国内人们对移动办公嘚认可度相当高

这个组制作了安卓苹果双平台上的客户端,产品除了能够便捷填表申请费用报销以外更可以以OCR识别票据,公交卡读取絀行记录从Schedule里读取出差/访问计划,运动模式分析等等方法智能地辅助完成报销申请这也算是AI的一种应用。

新加坡的组工作内容类似鈈过不做移动平台,是做一些报销相关的公共组件(基础设施)而东京也有组做PC端的费用报销。

这种合作还是蛮有意思也蛮有挑战的

  • 運转、分销、配送、退货

SCM也是非常非常传统的ERP模块了。最早的MRP跟SCM业务重合度非常高对生产企业来说,效率就是生命

HUE的SCM业务主力同样在ㄖ本,是一批非常资深的工程师

4. CRM,管理客户关系

公司目前没有正式的CRM产品线,不过我手里的一个内部的HelpDesk项目正向着CRM产品线发展竞品仳如Salesforce,比如Atlassian.

电商大家都不陌生了,各种各样的购物网站很多公司也拥有自己的购物网站。

公司的电商业务目前由新加坡负责

6. OA系统,办公室活动的办公室职员都可能用过的功能有:

OA系统比较常见。国内OA向移动端倾斜比较迅速钉钉,金蝶云之家、今目标等等都可以算比较常见出现在视野里的办公平台

Enterprise Collaboration也是众多业务中上海参与度最深的。大多数Collabo业务目前都由两位中国VP牵头和负责另外还有一部分业務如云盘,邮件等在新加坡开发但仍向上海汇报。

Enterprise Collaboration对比上一代产品中的功能更为丰富、更为独立、更为便利、更符合现代的使用习惯吔尝试了许多之前没有想过的东西。所以可能反而因为上海和新加坡的工程师更年轻和前卫没什么桎梏,突破更大项目完全由上海和噺加坡主导,效果和进度都非常不错上海还因此拿过两次MBM(公司年度最高荣誉)。

客户们对Enterprise Collaboration都很惊喜要求多多反馈多多,小伙伴们成僦感十足也乐得忙得不亦乐乎。

以上是现在我常有接触的产品之后有想起来的再补充。

上述都是产品部门与业务关系紧密。

产品工程师们需要直接对运营、销售、咨询和客户负责最终要把符合业务要求的、好用的产品如期发布给客户。

除此之外还有一些其他部门,会是比较基础性的、架构性的对外界相对透明。

顾名思义作为基础技术部门,BT要为产品组提供必要的底层支持包括框架、组件、歭久层、通讯层、安全控制、编程工具等等。

最早BT就是在上海发展起来的后来一度形成了上海新加坡做BT,东京搞产品的格局上海绝大蔀分HUE的工程师都是做BT的。

但没什么格局一成不变最近一年BT又向新加坡倾斜。目前HUE BT也有超一百五十位工程师大部分是在新加坡,小部分茬上海(做前端框架移动端框架等等),还有零星一些在东京

8. ATE,管HUE的技术“蓝图”

虽然ATE与HUE合并,但老的ATE还是作为HUE&ATE的一个重要部门出現一方面负责HUE架构的审阅和改进,另一方面原有的一些ATE项目比如OCRSearch,NLPAI等等也还是现在ATE的课题。

ATE的布局没什么变化仍然是东京一部分,上海一部分现在有社招做NLP,机器学习等方向的进来就很大可能加入上海的ATE。

ATE招聘对专业要求特别高相反对工程能力要求则不像其怹组那么苛刻,迫切希望各领域里的博士和资深专家加入

这是软件工程绕不过的话题。尤其是几千人的项目管理、测试、集成、发布嘟是非常头疼的问题。各地都有上海有VP坐镇,扮演了很重要的角色

Studio-A在东京,是一个妹子很多的组她们比较符合大家对美工或者交互設计师的理解,定义了HUE的所有设计规范专门审阅改进产品的界面和交互体验。

曾经上海有过一个Studio-C(C=China)我还在其中感受过。实事求是地說我们这帮糙汉子的确没有Studio-A那么专业,东拼西凑出来的“美”感总有那么点违和

如果哪位有资深的交互设计经验,愿意来ERP领域里也一展拳脚话我想我们也会非常欢迎。

11.咨询站在客户背后的男人女人们

ERP系统都无比复杂。

根据不同客户们迥异的业务和需求系统需要在導入之初进行详细的配置,使用中也要随时跟随客户不断的变化和调整。

作为以Package售卖为特色的WAP产品的功能和细节更加庞大,配置起来則更需要对产品深入的理解

咨询风启团队是干嘛的因此应运而生,为客户提供售前售后全周期的产品使用支持

作为客户与WAP之间最主要嘚桥梁,他们必须充分了解客户的业务和现状并透过现象,挖掘出真实的需求然后在系统中给出解决方案。同时还要及时响应和解决愙户在使用过程中遇到的各种疑问和问题

因此,他们常常出差在外风餐露宿,很是辛苦

放在压轴位置,当然是因为这个风启团队是幹嘛的的重要性了公司的“开源”可就全仰仗他们了。

上海的销售风启团队是干嘛的成立要晚于开发不少但不知不觉中,上海的销售風启团队是干嘛的也成长得初具规模了

这可真真是个帅哥美女云集的地方,而且不仅颜值是担当才气更是超群。全部是来自北大、人夶、上外等高校的才子才女说得一口流利的日语,都有几样拿得出手的才艺

这个部门可能是氛围最活泼团建最频繁文化氛围最浓的风啟团队是干嘛的了,许多有趣的故事还是后面再表

最后这个话题/部门应算是个“节流”的部门。这也是我目前所在的部门

SRE是来自谷歌嘚概念,Site Reliability Engineering说白了就是DevOps的一种落地实践。WAP的SRE部门涉及的东西比较宽泛包含传统的运维(也输出一些运维产品),也包含客户支持

日本SRE主要负责真实生产环境的运营维护,以及一部分自动化我带着上海、新加坡和一部分东京同事做SRE中的开发工作。

现在开发的有三个项目一个叫Morphling(魔灵),是HUE的运维平台可以部署、监控、调度HUE。另外两个可以合在一起作为HUE的HelpDesk(及客户关系管理)用于不同阶段的客户支歭,以后几千家客户的售后服务会从这个平台走毕竟产品帅起来了,售后支持也不能落后认怂不是

由于历史原因,SRE最初开发分布东京、上海、新加坡三地但交流成本太高,一直在迁移和改进16年中期东京分支转去支援HUE的架构,东京的开发内容由一位在日本两年多即将囙国的同事带了回来16年底,新加坡的业务重组了回了上海17年初,上海又有一位资深VP加入

自此SRE的开发基本集中在上海,但会把一部分具体开发工作委托给印度清奈的Office所以我们和印度的合作现在变得非常紧密。

其实最初准备做运维工具的时候我们并没觉得做一个开发运維会很有意思但渐渐地我们发现这个领域里我们有相当的话语权和自由度,坑是真多收获的东西也大大超出预期。

我们不依赖HUE的技术(为了保证鲁棒)所以框架和开发也不必像HUE里的那样重,我们精益管理自治而且轻便,可以接触、尝试和选择任何有益的东西Spring boot,Reactansible,dockerKubernetes,Prometheus…

相对来说我们与各个部门,尤其是ATE和BT部门保持着非常良好的关系因为运维工具与架构和框架耦合相当深。我们也可以算是除叻ATE以外对整个HUE的架构都有较深理解的人同时,在开发、测试、构建、部署上我们也必须与HUE相互独立自给自足自成体系。所以组里每个囚可能知识深度还需不断加强但技术栈都相当全面,不拘一隅对敏捷开发和“怎么做成一件事”应该都比较有感悟。

这个HelpDesk也是个游离於常规产品之外的“怪胎”虽然使用了HUE的技术栈,但也要从设计开发到CI、发布、运维全都自己做因为产品本身的安全级别超脱于所有其他的HUE产品,组外人员无权碰我们的东西我们面向的目标用户也非常杂,有WAP内自己的员工开发、销售、咨询、支持中心、管理层,有愙户的各业务的负责人有可能有客户的员工,甚至还有可能有客户的客户这个产品定位与普通产品差别太大,所以也定位在了SRE部门里洎治未来我是有打算把它发展成CRM产品的。

概括地说客户摸得着看得见的产品的开发,在各地均有就过去两年来看,相比说日本办公室对日本本地业务的支持倾斜度高一些而上海、新加坡对国际市场的倾斜度高一些。另外上海和新加坡对架构、框架、运维等贡献特别顯著

当然这种布局并不固定,会随着市场和项目状况不断变化这也正是一家“二次创业”公司的特点。

工程师真的好喜欢一言不合就擼!起!袖!子!写!代!码!

但在WAP你要知道,写代码是除了销售及人事行政部门以外几乎每个人都必备的技能并且水平还不能差。

所以它有时候显得没那么重要

写代码当然也还是分快慢和好坏,但在达到一定的水平后我便认为它只是工具,用好生产工具重要,泹不绝对

代码不是全部,甚至产品也不是全部业务才是。

在WAP每一个项目/子项目,以及每一个大的功能模块(功能可以支持大的故事叫Epic)负责的工程师都要提供一份经得起推敲的catalog,内容有点类似商业计划书

做工程师的大部分不爱写文档,之前也从未听说过哪家IT公司會对一个文档这么重视与执着

我们最初也都觉得多此一举,有许多东西可能一看便知道该怎样做:客户的业务需要多人交流那像QQ一样給他们创建个群不就行了?

或者如果不需要实时交流,那就做个BBS

当HR需要在人才库里为某岗位寻找胜任的人才的时候,让用户根据他们公司对人才的定义输入一些合适的数字做各种能力的权重,我们计算并排序一下不就好了

那么剩下就是设计接口、数据库,赶紧实现考虑怎么样让程序更快地跑了呗(不得不说中式教育让人容易踏入误区,99%的CS学生都知道时间空间复杂度的重要性但却没几个人想着应該好好测测他们写的程序)。

但一段时间之后尝试过一些碰壁,你会开始怀疑“你以为你以为的就是你以为的吗?”

你可能会发现伱之前所认为的理所当然的东西大多不是最优解,甚至都不是一个次优解你期待用户输入的东西对他来说也可能完全不知所云。

经验让峩们学会了在撸起袖子写代码之前,先在纸笔间记下和推敲你的solution(被润色过的solution和产品原型还可以让喜欢尝鲜的客户直观了解我们的计划有所反馈和期待)。

WAP的一个工程师年成本50万人民币以上如果在项目一开始我们就能够在不同的声音里发现这个提案里隐藏的问题,要遠比几十个工程师忙忙叨叨开发一年后——拿到客户那里——再被请出来成本要低得多。

另一方面即使不考虑到方向对错与否的问题,catalog同样是可以节省风启团队是干嘛的内/风启团队是干嘛的间的沟通成本的

一千个人心中有一千个哈姆雷特。

“做个好手机出来”这样一個看似简明美好的要求在十个人脑海里就会浮现出十款不同造型和功能的手机(现在大部分人脑子里是iPhone了但想想十年前的时候)。

“吃頓大餐”在一些人脑海里可能是鲍鱼海鲜,另一些人想的可能是烤全羊手把肉

所以把意见/建议都收集和统筹起来,形成一个大家都能悝解和认可的模型再坐实到笔上。才会减少风启团队是干嘛的里各自的输出有“驴唇不对马嘴”现象的发生

所以从经济角度上讲,写catalog昰一个几乎可以肯定会为风启团队是干嘛的省时省力的选择只不过自然而然这对写catalog的人要求和挑战很高。

对广大工科科班出身的同学来說“写文档还不如杀了我”,明知道有益也不愿意写

但在现代社会,“个人英雄”越来越式微凡事还是要风启团队是干嘛的的交流與合作,这种“挽起袖子就干只要干得好嘴笨点没什么”的观念是得需要改一改。

那怎么样才能判断一份catalog的好坏呢有人问过:“你敢review別人的catalog,是不是得什么都懂”怎么可能呢,没长着三头六臂同样获取知识的途径也相差不多,何况大家也都是出身211、985身经百战的高才苼专业知识的储量通常不会差异太大。区别不过有些同学会是在某些方面专精一点而我则恰可能在更多话题上都是各懂一点皮毛。

但問题是不是很懂就没有办法判断东西的好坏了么?这不见得家里的老太太不懂生产工艺,但同样能判断出一台电视机值不值得买

有時候反而还越是置身事外越能客观地判断好坏,因为没有偏见。

判断一个catalog的好坏无非就是三点:结论、事实、逻辑。

对如果你还记嘚高中时候虐得你死去活来的作文写作的话,这其实就是一篇典型议论文:论点、论据、论证而且一些其他行业用的报告甚至也是这么個套路。

因为世间少有绝对的对错结论(论点)反而往往成了最少去争议的点。只消事实充分(你要支撑的真实业务是什么样的人们現在正在怎样做业务?需要解决的问题有哪些竞品有哪些?研究的覆盖面够不够广)清晰无误(的确是这样么?每个人都这么说听箌的会不会是假象?取样有没有偏差哪些渠道可以验证?)归纳和推理的逻辑严密圆满让人不自觉跟着你的思路走,且不会觉得磕磕絆绊得不舒服没有漏洞,少有怀疑那自然就是一份令人难以反驳的好文。

我写catalog的时候习惯上还先用思维导图做个大纲确保逻辑通畅,以免着手细节之后会忘了顾全大局

但如果我听你的介绍,边听边产生疑问(这个突然冒出来的归纳是哪里来的我见过的客户明明不這么干吧?为什么这里有个参数“2”不是“4”或者“5”?这句话说的什么意思为什么要设计这么复杂?这里到底该输入A还是B怎么保證一个全新算法的计算结果有意义?这成本是不是太高了结论来的好突兀啊……),文章前后不能自证(比如前文明明说需要高可用後面的设计里却出现了单点失败SPOF),那么这catalog自然就难以避免被人诟病其中结论也无法让人信服,只好回炉重做

事实上review并不是目的,而昰一层又一层地试错的一种方法“如果你连我都说服不了,我们又拿什么来征服更加挑剔的老板和客户”

用自己的体验来说,最初对這种工作方式的不适会在一点点尝到甜头之后慢慢习惯甚至喜欢。

而在习惯这种比较严谨的方式之后的确会在思考方式上受益良多。看事情会更加立体

而且按推敲出来的方案做事情也会更省心更踏实。

在我看来WAP喜欢会写catalog的人,另一个原因是“想写的好catalog在思维习惯仩就懒惰不得”,而能保持思维活跃的人在工作中就肯定不甘只是一颗螺丝钉“programmer”,更是个上进而爱独立思考的“engineer”

而这些成百上千汾布在各个部门里跃跃欲试的“大脑”,才是这个团体能保持活力保持进步的最大依仗

不需要凡事都必须老板下令,只需要指出一个正確的方向这些分布的大脑们就会闻风而动,创造出各种各样新奇的富有创造性的点子们来并一遍遍地去伪存菁,验证继而实施它们這是听上去就很酷的事儿啊。

所以在WAP也是这么实践的,开发过程大部分都是自下而上的

就像catalog一样,开发中不停地有“挑战-改进-挑战-改進-向上一级挑战”的过程(除了HUE伊始,HUE立项时是比较自上而下的这与当时的情况有关。)

很大一部分boss的理念里就认为:给你我所见的倳实告诉你我想要达成的效果,提供给你需要的资源和舒适的环境接下来,怎么创造惊喜就是你的任务了!

当然如果你跑太偏了,那我得给你拽回来

然而每片叶子都有自己的纹路,不见得每个人都适合这样的工作方式所以Office里有部分微管理也是能见得到的。

但无论哪种方式员工们的自由度都相当大。员工们在绝大多数风启团队是干嘛的里都可以自由挑选想做的工作(当然脏活总归得有人做但大镓通常轮着来,或者当它们影响效率的时候也总会有人尝试把脏活变干净),而且只要做事靠谱成绩出色什么时候一个话题做腻了,想要在风启团队是干嘛的间Job Rotation也少有被拒绝的时候(原则上两边的Boss都同意就好这也是为什么需要你做得出色,“害群之马”在哪里都不会受欢迎)

上海两百多名工程师,可做的课题还是相当多的想都做好做到腻可不是件容易的事儿。想转去日本或者新加坡工作的门槛也佷低踏踏实实工作一两年条件就基本都可以满足。

同学们问得比较多的一个问题是刚入职通过STM研修期之后我能不能自由选组对不起,現在还不能按近两年的经验,一批同学入职十之八九都想马上去AI、大数据、数据挖掘、机器学习、深度学习等领域一展拳脚,即便有嘚同学一丁点相关经验和背景都没有甚至概念都用不熟悉,因为总觉得这就是大势所趋这才是大势所趋。

刚入职的同学们对公司和项目所知甚少还稍显盲目,哪个酷就想做哪个这很自然。但是做项目还是得讲朴素的基本法不能只想云际不管落地。

所以刚入职时候嘚分配是VP们根据每位同学的背景、性格、履历、作品和倾向等统一安排的原则上不会有例外。虽不可能让每个人都十分满意但会尽可能照顾各方因素。

所以如果希望毕业伊始就能到一个与自己契合的组里工作我建议新同学们千万别像“大姑娘相亲”一样“扭扭捏捏”,提前就主动一点跟身边学长学姐们多接触接触,了解了解他们在做什么产品有没有意思,需要什么样的人才这样才能打有准备之仗,在表达自己的意愿时说的有理有据(在VP们统计工作意愿时,合理地表述清楚自己的意愿和诉求非常重要不仅是发声说自己想做什麼不想做什么,最好还要让人信服地知道为什么你适合/不适合)

进组之后的工作日常又是怎样的呢?这个我无法足一而论WAPC员工增长十汾迅速,现在大大小小也有几十个组(四五人一组由个leader或manager带队,是常见配置)各大小boss的管理风格都不同,所以在每个组里的体验肯定嘟不相同

即使同一个组内,组织结构或项目状况变化组里的状态也会不同。

不过只要是开发组除了项目内容和松紧状态会有区别,其他相对大同小异大部分组都会用偏敏捷方式开发,吃自己的狗粮(有的组吃的多有的组吃的少,有的组有人帮着吃有的组不得不嘟自己吃)。有的精益管理有的Metrics-Driven。大概都遵循PDCA(Plan-Do-Check-Act)的循环HUE的BT和产品组6个礼拜一个迭代,我的组3个礼拜一迭代近期准备统一调整为4礼拜长的迭代。

所有的组都在一个相对紧凑的进程里实际上都在不停学习进步挖坑填坑挖坑填坑……HUE太新又太大了。对于公司来说这么夶规模几千人的二次创业也是“大姑娘上轿头一回”,没有足够的经验教训可以汲取没有足够的技术积累可以利用。

但对客户的承诺不能缩水所以说所有的组,有一个算一个都不停地在挑战不可能。没有停止进坑的时候挖过的坑也没有真正填完的时候,总在追求完媄一边挖一边填,互相挖互相填乐此不疲,共同进步

产出呈现出来的时候,成就感真的难以言喻

坑多工作自然也要辛苦点,“是鈈是经常加班”这是我被同学们问得最多的问题

有啊,肯定有你见过哪个互联网及软件公司不加班的?

不过加班厉害不厉害主观地說,不厉害

在入职头两年,进入HUE之前我基本从没加过班,同事们七点以后也大多不会在公司了进入HUE以后,时间不规律了许多项目抽风的时候偶尔赶赶末班地铁甚至打打车,也是会有的事儿节点过了,进度赶回来了可能再放一放羊。现在我组里的孩子们责任心特別强他们晚上不走的时候我也会有意识地多呆一会陪陪他们,也提前给项目铺铺路不过我们一直都理解和提倡合理安排时间,常常还會催着孩子们走

中国的leader、manager、VP们都倾向于把计划做得科学一点(比如用Scrum的plan meeting,这样所有人都能参与进来评估工作量)容错性高一点(不至於因为一点变动就导致大规模未预期的工作)。尽可能把辛苦的阶段调节开有松有驰才能长久。

日本的同事们有的则相对更刻苦一些囿时候会push的比较紧,但也都在容易接受的限度内何况WAPC本来就是弹性工作制,走的晚的时候通常我们也会来得晚些

甚至如果员工有事,提前跟老板和行政打好招呼发好邮件可以很方便地晚来或早走,一天工作四个小时以上就不算缺勤

周末加班更是少见了,周末如果的確业务原因需要加班必须要在系统里向Manager及VP申请取得批准才行,然后还能换对应天数的补休

实际上周末加班也只有去招聘的工程师才常碰到一些。为了照顾同学们招聘活动经常安排在周末,工程师们要配合HR笔试面试实习就需要周末工作。有的工程师还就喜欢周末招聘紦假期攒到一起去旅游

周末以外的法定假日更是五年来从没被因公占用过(还没人拿过3倍工资),本来今年五一假期期间有一天还有招聘计划但被VP们驳回了。

加不加班也因人而异Manager和VP们工作时间一般就比较长。就我自己来说现在工作时间有时候不那么好算。因为很早僦不写代码了我的工作内容更杂更操心一些。不管是在公司、家里、出差工作日或周末,我通常24小时手机开机收发消息即便深夜我嘟有看邮件扫扫聊天频道的习惯。包括写这篇回答虽然不算工作内容,但其实也是为了工作服务我断断续续每天夜里写点,写了一个哆月最后是在带孩子旅游的途中完成的。后面一点点的校对修改更是持续了几个月。但因为养成了习惯所以也都很自然打游戏间隙嘚时间也能回回邮件,倒没觉得多负担保持着一种有责任感的状态也很开心。

待更新(最后更新6月25日)

}
“入门”是良好的动机但是可能作用缓慢。如果你手里或者脑子里有一个项目那么实践起来你会被目标驱动,而不会像学习模块一样慢慢学习

另外如果说知识体系裏的每一个知识点是图里的点,依赖关系是边的话那么这个图一定不是一个有向无环图。因为学习A的经验可以帮助你学习B因此,你不需要学习怎么样“入门”因为这样的“入门”点根本不存在!你需要学习的是怎么样做一个比较大的东西,在这个过程中你会很快地學会需要学会的东西的。当然你可以争论说需要先懂python,不然怎么学会python做爬虫呢但是事实上,你完全可以在做这个爬虫的过程中学习python

看箌前面很多答案都讲的“术”——用什么软件怎么爬那我就讲讲“道”和“术”吧——爬虫怎么工作以及怎么在python实现。

  1. 如果需要大规模網页抓取你需要学习分布式爬虫的概念。其实没那么玄乎你只要学会怎样维护一个所有集群机器能够有效分享的分布式队列就好。最簡单的实现是python-rq:
  2. 后续处理网页析取(),存储(Mongodb)
  3. 说说当初写的一个集群爬下整个豆瓣的经验吧

    1)首先你要明白爬虫怎样工作。


    想象你是一只蜘蛛现在你被放到了互联“网”上。那么你需要把所有的网页都看一遍。怎么办呢没问题呀,你就随便从某个地方开始比如说人民ㄖ报的首页,这个叫initial pages用$表示吧。

    在人民日报的首页你看到那个页面引向的各种链接。于是你很开心地从爬到了“国内新闻”那个页面太好了,这样你就已经爬完了俩页面(首页和国内新闻)!暂且不用管爬下来的页面怎么处理的你就想象你把这个页面完完整整抄成叻个html放到了你身上。

    突然你发现 在国内新闻这个页面上,有一个链接链回“首页”作为一只聪明的蜘蛛,你肯定知道你不用爬回去的吧因为你已经看过了啊。所以你需要用你的脑子,存下你已经看过的页面地址这样,每次看到一个可能需要爬的新链接你就先查查你脑子里是不是已经去过这个页面地址。如果去过那就别去了。

    好的理论上如果所有的页面可以从initial page达到的话,那么可以证明你一定鈳以爬完所有的网页

    那么在python里怎么实现呢?

    所有的爬虫的backbone都在这里下面分析一下为什么爬虫事实上是个非常复杂的东西——搜索引擎公司通常有一整个风启团队是干嘛的来维护和开发。


    如果你直接加工一下上面的代码直接运行的话你需要一整年才能爬下整个豆瓣的内嫆。更别说Google这样的搜索引擎需要爬下全网的内容了

    问题出在哪呢?需要爬的网页实在太多太多了而上面的代码太慢太慢了。设想全网囿N个网站那么分析一下判重的复杂度就是N*log(N),因为所有网页要遍历一次而每次判重用set的话需要log(N)的复杂度。OKOK,我知道python的set实现是hash——不过這样还是太慢了至少内存使用效率不高。

    简单讲它仍然是一种hash的方法但是它的特点是,它可以使用固定的内存(不随url的数量而增长)鉯O(1)的效率判定url是否已经在set中可惜天下没有白吃的午餐,它的唯一问题在于如果这个url不在set中,BF可以100%确定这个url没有看过但是如果这个url在setΦ,它会告诉你:这个url应该已经出现过不过我有2%的不确定性。注意这里的不确定性在你分配的内存足够大的时候可以变得很小很少。┅个简单的教程:

    注意到这个特点url如果被看过,那么可能以小概率重复看一看(没关系多看看不会累死)。但是如果没被看过一定会被看一下(这个很重要,不然我们就要漏掉一些网页了!) [IMPORTANT: 此段有问题,请暂时略过]

    好现在已经接近处理判重最快的方法了。另外一個瓶颈——你只有一台机器不管你的带宽有多大,只要你的机器下载网页的速度是瓶颈的话那么你只有加快这个速度。用一台机子不夠的话——用很多台吧!当然我们假设每台机子都已经进了最大的效率——使用多线程(python的话,多进程吧)


    爬取豆瓣的时候,我总共鼡了100多台机器昼夜不停地运行了一个月想象如果只用一台机子你就得运行100个月了...

    那么,假设你现在有100台机器可以用怎么用python实现一个分咘式的爬取算法呢?

    我们把这100台中的99台运算能力较小的机器叫作slave另外一台较大的机器叫作master,那么回顾上面代码中的url_queue如果我们能把这个queue放到这台master机器上,所有的slave都可以通过网络跟master联通每当一个slave完成下载一个网页,就向master请求一个新的网页来抓取而每次slave新抓到一个网页,僦把这个网页上所有的链接送到master的queue里去同样,bloom

    考虑如何用python实现:


    在各台slave上装好scrapy那么各台机子就变成了一台有抓取能力的slave,在master上装好Redis和rq鼡作分布式队列 好的,其实你能想到有人已经给你写好了你需要的:
    虽然上面用很多“简单”,但是真正要实现一个商业规模可用的爬虫并不是一件容易的事上面的代码用来爬一个整体的网站几乎没有太大的问题。

    但是如果附加上你需要这些后续处理比如

    1. 有效地存儲(数据库应该怎样安排)
    2. 有效地判重(这里指网页判重,咱可不想把人民日报和抄袭它的大民日报都爬一遍)
    3. 有效地信息抽取(比如怎麼样抽取出网页上所有的地址抽取出来“朝阳区奋进路中华道”),搜索引擎通常不需要存储所有的信息比如图片我存来干嘛...
    4. 及时更噺(预测这个网页多久会更新一次)
    如你所想,这里每一个点都可以供很多研究者十数年的研究虽然如此,
    “路漫漫其修远兮,吾将上下洏求索”

    所以,不要问怎么入门直接上路就好了:)

}

不少同学跃跃欲试想投入 AI 的怀菢,但苦于不知如何下手其中,人工智能的核心就是机器学习(Machine Learning)它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域

我们今天就来分享一篇来自 EliteDataScience 上专门讲给机器学习入门自学者的教程,一步步教你如何从基础小白进阶为 ML 大拿快上车吧,别找硬币了这趟车不要钱!

你是否正在准备自学机器学习,但又不知道怎么去学、还被那些贵的要命的培训课程吓得不行

今天我们在这篇文章里僦教你怎样免费获得世界级的机器学习教育,你既不需要有博士学位也不必是技术大牛,更不必卖好几个肾去买一份很贵的培训课程鈈管你是想成为数据科学家还是在开发中使用机器学习算法,其实你都能比想象中更快地学习和应用机器学习

本文告诉你在机器学习之蕗上的几个步骤,保你不会迷路下面开始我们的表演。

第一步:先搞懂什么是机器学习

在闷头学习机器学习之前最好先把什么是机器學习搞清楚,了解机器学习的基本概念

简单来说,机器学习就是教电脑怎样从数据中学习然后做出决策或预测。对于真正的机器学习來说电脑必须在没有明确编程的情况下能够学习识别模型。

机器学习属于计算机科学与统计学的交叉学科在多个领域会以不同的面目絀现,比如你应该听过这些名词:数据科学、大数据、人工智能、预测型分析、计算机统计、数据挖掘······

虽然机器学习和这些领域囿很多重叠的地方但也不能将它们混淆。例如机器学习是数据科学中的一种工具,也能用于处理大数据

机器学习自身也分为多个类型,比如监督式学习、非监督式学习、增强学习等等例如:

邮件运营商将垃圾广告信息分类至垃圾箱,应用的是机器学习中的监督式学習;电商公司通过分析消费数据将消费者进行分类应用的是机器学习中的非监督式学习;而无人驾驶汽车中的电脑合摄像头与道路及其咜车辆交互、学习如何导航,就是用到了增强学习

想了解机器学习的入门知识,可以看看一些网络课程对于想对机器学习领域的重点慨念有个基础的了解的人来说,吴恩达教授的机器学习入门课程绝对必看:

以及“无人车之父” Sebastian Thrun 的《机器学习入门》课程对机器学习进荇了详细介绍,并辅以大量的编程操作帮助你巩固所学内容:

此外Sebastian 在优达学城上还开设了一本《人工智能入门》课程,讲解人工智能领域的基本原理以及相关应用比如机器人、计算机视觉和自然语言处理等:

当然也少不了集智君整理制作的免费专栏在这里你可以免去安裝环境的烦恼,直接投入简单地机器学习训练中来:

这些课程都是免费的哦!

大概了解机器学习后我们就来到知识准备阶段了。

如果没囿基本的知识储备机器学习的确看起来很吓人。要学习机器学习你不必是专业的数学人才,或者程序员大牛但你确实需要掌握这些方面的核心技能。

好消息是一旦完成预备知识,剩下的部分就相当容易啦实际上,机器学习基本就是将统计学和计算机科学中的概念應用在数据上

这一步的基本任务就是保证自己在编程和统计学知识上别掉队。

2-1:用于数据科学中的Python编程

如果不懂编程是没法使用机器學习的。幸好这里有份免费教程,教你如何学习应用于数据科学中的Python语言:

注:景略集智再补充三个资源:

从零学习数据科学中Python的完全指南:

以及40多个Python学习资源的汇总文章:

2-2:用于数据科学的统计学知识

了解统计学知识特别是贝叶斯概率,对于许多机器学习算法来说都昰基本的要求

这里有份学习数据学习中统计学知识的教程:

2-3:需要学习的数学知识

研究机器学习算法需要一定的线性代数和多元微积分知识作为基础。点这里获取一份免费学习教程:

第三步:开启“海绵模式”,学习尽可能多的原理知识

所谓“海绵模式”就是像海绵吸水一样,尽可能多地吸收机器学习的原理和知识这一步和第一步有些相似,但不同的是第一步是对机器学习有个初步了解,而这一步是要掌握相关原理知识

可能有些同学会想:我又不想做基础研究,干嘛要掌握这些原理只要会用机器学习工具包不就行了吗?

有这個疑问也很正常但是对于任何想将机器学习应用在工作中的人来说,学习机器学习的基础知识非常重要比如你在应用机器学习中可能會遇到这些问题:

  • 数据收集是个非常耗时耗力的过程。你需要考虑:我需要收集什么类型的数据我需要多少数据?等此类的问题
  • 数据假设和预处理。不同的算法需要对输入数据进行不同的假设我该怎样预处理我的数据?我的模型对缺失的数据可靠吗?
  • 解释模型结果说機器学习就是“黑箱”的观点明显是错误的。没错不是所有的模型结果能直接判读,但你需要能够判断模型的状况进而完善它们。我怎么确定模型是过度拟合还是不充分拟合模型还有多少改进空间?
  • 优化和调试模型很少有人刚开始就得到一个最佳模型,你需要了解鈈同参数之间的细微差别和正则化方法如果我的模型过度拟合,该怎么修正我应该将几个模型组合在一起吗?

要想在机器学习研究中解答这些问题掌握机器学习的知识原理必不可少。这里推荐两个世界级的机器学习课程一定会让你受益良多:

哈佛大学的机器学习课程,让你了解从数据收集到数据分析的整个流程:


(提示:这个课程和吴恩达教授的课程配合食用效果更加)

斯坦福大学的机器学习课程,清楚地讲解了机器学习的核心概念:

还有两部值得读的参考书籍:《统计学习导论》和《统计学习基础》

这两部书的英文原版下载地址:

注:看不惯英文原版的同学可以去读这两本书的中文版。

集智也建议大家可以多逛逛Reddit上的机器学习论坛:

当然Quora上的机器学习版块吔很有料:

逛论坛不容易看到高阶知识,你不能一直停留在菜鸟阶段不是要升级就有必要看看专业的论文。arXive是个好去处是个收集物理學、数学、计算机科学与生物学的论文预印本的网站。

如果嫌自己搜索论文太麻烦可以在网站 上注册一个账号,它可以按自己的感兴趣標签给你推送最新的 arXive 上的论文

第四步:针对性实际练习

在开启“海绵模式”后,你应该掌握了机器学习的基础理念知识接着就该实际操作了。

实际操作主要是通过具体的、深思熟虑的实践操作增强你的技能本步目标有三个:

  • 练习机器学习的整个流程:收集数据,预处悝和清理数据搭建模型,训练和调试模型评估模型。
  • 在真正的数据集上实践操作:对于什么样的数据适合用什么类型的模型自己应逐渐建立这方面的判断能力。
  • 深度探究:例如在上一步你学习了很多机器学习算法知识,在这一步就要将不同类型的算法应用在数据集Φ看看哪个效果最好。

完成这一步后就可以进行更大规模的项目了。

机器学习是一个非常广泛和丰富的领域几乎在每个行业都有应鼡。因为要学习的东西太多初学者很容易发慌,而且在面对很多个模型时也很容易迷失看不到大局。

因此我们把机器学习大概划分為九个部分:

基本的机器学习原理,比如方差权衡这些知识

为模型发现最优参数的算法。

处理缺失数据、偏态分布、异常值等

怎样拆汾数据集来调整参数和避免过度拟合。

使用分类和回归模型从标记数据中学习

使用因素和集群分析模型从非标记数据中学习。

根据不同嘚性能度量做出决策

将不同模型相结合,达到更好的性能

机器学习如何帮助不同类型的商业业务。

对于初学者我们建议采用现成可鼡的算法,这样可以把时间用在熟悉机器学习流程上而不是写算法。根据你使用的编程语言有两个不错的工具(链接为使用教程):

4-3 利用数据集实践操作

在这步需要用数据集进行搭建和调试模型的实际操作,也就是将你在“海绵模式”阶段学到的理论转变为代码我们建议你选择UCI Machine Learning Repo,Kaggle和上的数据集开始入手:

终于到了最后一步也是很有意思的一步。目前为止我们已经完成了:知识储备、掌握基本原理、针对性练习等阶段,现在我们准备探究更大的项目:

这一步的目标就是练习将机器学习技术应用于完整的端到端分析

任务:完成下面嘚项目,依次从易到难

5-1:“泰坦尼克号”幸存者预测

“泰坦尼克号”幸存者预测是练习机器学习时相当流行的选择。而且有非常多的教程可供参考

5-2 从零开始写算法

我们建议你先以一些简单的方面写起:逻辑回归、决策树、k 最近邻算法等。

如果中间卡住了这里有些小技巧可以参考:

  • 维基百科是个不错的资源库,提供了一些常见算法的伪代码
  • 可以看看一些现成ML工具包的源代码,获得灵感
  • 将算法分为几蔀分。写出取样、梯度下降等的分离函数
  • 在开始写整个算法前,先写一个简单的决策树

5-3 选个有趣的项目或自己感兴趣的领域

其实这应該是机器学习最棒的部分了,可以利用机器学习实现自己的想法

如果实在没想到好点子,这里有6个有趣的初学者机器学习实践项目:

如果你按照这个步骤一步步扎实学习的话相信你最终一定在机器学习方面小有成就!

我们对初学机器学习的人还有10个小小的tips:

  1. 为自己设定學习目标和期限,尽力完成
  2. 打好学习基础,掌握基本理论
  3. 将实践理论相结合,不要只关注某一个方面
  4. 试着自己从头写几个算法。
  5. 多角度思考问题找到自己感兴趣的实践项目。
  6. 多想想每个算法能产生什么价值
  7. 不要相信科幻电影中对ML的胡吹。
  8. 别过度理会网上关于ML知识嘚争论
  9. 多想想数据的“输入/输出”,多问问“为什么”
  10. 上集智,第一时间将自己升级→→

最后,祝同学们学有所成!


}

我要回帖

更多关于 风启团队 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信