close

連線Face++前方團隊:COCO奪冠背後的細節,不是拼硬件這麼簡單

昨天,量子消除疲勞的食品位報道瞭中國團隊再次稱雄AI大賽,把谷歌微軟和FB甩在身後的消息。



簡而言之,在計算機視覺頂會ICCV 2017期間,中國團隊在物體檢測、人體關鍵點檢測等競爭激烈的比賽中擊敗瞭谷歌、微軟、Facebook等國際巨頭AI實驗室,7項競賽囊獲瞭5項第一。



其中,中國AI創業公司曠視科技(Face++)在MS COCO物體檢測、人體關鍵點檢測,以及Places物體分割等三項核心競賽中拿下第一名。



在曠視前方團隊歸國之際,我們和其團隊代表進行瞭一次遠程連線,曠視研究院Lead Researcher薑宇寧和實習生肖特特,向量子位談到瞭更多更直接的參賽感受。



領隊薑宇寧

量子位:談談這次你們主要的算法框架使用情況吧?



薑宇寧:這次我們的主要使用的是“MegDT”(Megvii Detection)系統,這套算法是基於FPN類似的框架,然後加瞭很多我們的改進。



具體的貢獻,比如我們是學術界第一個用非常大的batch size訓練物體檢測的團隊,之前工作中用的batch size,比如何愷明的Mask R-CNN,Facebook的FPN,最高是16,而我們做到瞭250多。



量子位:為這次COCO比賽準備瞭多久?



薑宇寧:具體沖刺時間是2個月,不過真正的準備是從春節假期之後就開始的,前前後後有半年左右的時間,進步也很快,比如我們3月份的水平是35、35,但最後比賽的成績達到瞭52,這半年內提升還是很大的。



量子位:主要圍繞哪些方面進行瞭提升?



薑宇寧:除瞭batch size,還用多監督信號和各種各樣上下文信息方面的提升。關於此次比賽所用的方法、技術,我們也會以論文的形式發表,應該在CVPR上就會有揭曉。



量子位:也有評論說你們這次勝利是拼硬件、堆硬件的結果,你怎麼看?



薑宇寧:我打個可能不太恰當的比方。二戰中美國和日本比拼,真正實力和最後比拼的就是工業生產能力的高低,結果反映的也是工業生產能力、綜合實力的高下。



當然,比賽成績對於我們而言,隻是一個結果。就像我們在最後演講時候說的那樣:這次參賽讓我們在快速迭代能力方面感觸很深,不僅是如何擁有大規模計算力,而且更關鍵的是有能力把這些計算力充分用起來。



我認為不管是研究,還是初創公司發展,都要構建起這樣的能力,可以把資源快速使用起來,形成更高效的創新。



所以拼硬件也好、堆機器也好,並不是一個所謂花錢就能解決的事情,而是有能力把這麼多機器用起來、用好。



量子位:除瞭參賽選手的因素,這次你們三項第一的關鍵是什麼?



薑宇寧:MegBrian和Brain++是我們此次取勝的關鍵要素,其中MegBrain是我們內部研發的一套深度學習框架,等同於Google的TensorFlow、Caffe2,不過研發的時間比他們要早半年。我們現在內部所有的研發,都是基於這套工具去做的。



量子位:這次比賽大傢比拼的算法,都有公開的論文,你認為什麼原因導致瞭最後結果上的差異?



薑宇寧:我覺得核心還眼睛保養品推薦是在於“變招”和“內功”,我是武俠迷,用武俠舉個例子吧。



首先,降龍十八掌,丐幫歷代幫主可能都會,但為什麼蕭峰打得更好?就是因為他在原來的基礎上,創造瞭不少後招、變手。我想我們也是這樣,根據公開的論文,進一步在應用中優化、改變,進行瞭大量的改變,導致實現不一樣。



其次,哪怕是一模一樣的算法,最後實現也不一樣,這就是MegBrian和平臺Brian++的能力,招式都一樣,但內功不同,哪怕一模一樣的算法,平臺對多機多卡的支持更好,我們就能做出不一樣的效果。



量子位:具體在這次比賽中,你們的“內功”是如何體現的?



薑宇寧:比如我們做瞭一個大的batch size,做瞭一個多機多卡,可以同時支持在32臺機器上同時做訓練,這是內功體現之一。



可能還需要再次強調下,這次比賽雖然我們幾個選手站在一線,但沒有背後的團隊,肯定不可能達成目標。



我們隻是最後被關註到的那幾個進球的前鋒,但這支“足球隊”中的中場、後衛和守門員,都非常重要,缺一不可。



比如MegBrian的同事,對我們的支持也非常大,在我們比賽前,Megbrian團隊告訴我們,他們完美實現瞭在一張卡上放更多的圖,這讓我們節省瞭近40%的內存,這才允許我們可以把batch size做這麼大。一次訓練,我可以放的圖更多。



所以這樣的能力,即便我們不參加COCO比賽,也能應用到其他地方——COCO隻是檢驗我們內功修煉如何的一次實戰比賽。

顧眼睛保健食品

量子位:總體上你會怎麼評價這次COCO比賽?

眼睛保養品

薑宇寧:三方面吧。首先,通過這次比賽,鍛煉瞭隊伍、檢驗瞭這套內功究竟修煉得如何,還有參賽同學的現場實戰能力等,總體還是很欣慰的;其次,檢驗瞭MegBrian和Brain++的穩定性;第三,接下來可能要把檢測做得更快更好,應用到更多產品吧。



量子位:COCO比賽的模型可以直接應用到產品中嗎?



薑宇寧:還不行。



但通過這個比賽,我們得到瞭一些經驗性的東西,比如什麼東西是有用的,什麼是沒用的。這樣的經驗可以傳送給離產品更近的部門。



另外,說到檢測,可以看看Face++現在做的兩個事情,一個是在移動端,做模型的小型化,我們的ShuffleNet超越瞭Google的MobilNets;另一個事情是Face++在做的MegEye-C3S智能人臉抓拍機,軟硬件結合,人臉檢測算法可以在FPGA這樣的條件下跑起來,而且成本更低。



量子位:這次中國軍團也是大放異彩,你們感受如何?



薑宇寧:中國參賽隊伍的表現都很好,都在各項比賽中站在瞭前列。我認為這是好事,AI往前發展,聰明的人進來得越多,對整個行業就越有利、越有意義。

消除疲勞保健食品

大三實習生肖特特

量子位:你這次以大三實習生身份參賽受到關註,你在曠視實習多久瞭?



肖特特:我到曠視實習馬上滿2年,2015年開始,那時候剛入大學不久,之前有一些編程方面的經驗。



然後我的老師針對編程經驗的同學專門設立瞭一個班級,有一些前沿知識的拓展,提供一些案例,其中就有Face++,當時我也好奇,這些理論知識,是怎麼被在現實中應用的,所以找到瞭Face++進一步瞭解,當時參觀和面試的感覺是:前沿、有趣和有價值,最後留瞭下來,開始實習。



量子位:目前為止最深的印象是什麼?



肖特特:很多同學很聰明,都有很強的動手能力,他們想很多的問題都很透徹。



另外,幹活靠譜,也是非常重要的因素,任務下來後全力以赴,不達成目標不罷休,所以結果都是相當好的,又快又好。



最後是對技術的追求,我們是一傢以技術驅動做產品的公司。大傢在一起很興奮、快樂。



量子位:未來有什麼規劃嗎?



肖特特:未來會去北美念博士。原本不想念博士,但最近兩年的經歷,讓我覺得應該在某個方向上專研夠深,而且已經在工業界待過,也有一些經驗和啟發,或許能夠幫助我的科研方向上的突破。



最後就是可以好好思考下很多問題,不止學術問題,也包括對生活、人生理想的思考,如果是念博士,可能會比較時機恰當。



當然,因為曠視在北美也設立瞭研究院,所以未來也可能繼續在曠視,即便這些都是未知數。



量子位:學業、實習、ACM,怎麼平衡時間?



肖特特:我愛好比較多,什麼都會接觸一下,但主要是:1)找到生活中的平衡,找到優先級,ACM中我的隊友也是我的室友,大傢平常生活就會討論,不會占用太多時間;2)大一大二以課業為主,其後就開始有針對性選擇感興趣、更進一步深入的事情,然後在公司加強自己的動手能力。



— 完 —



加入社群



量子位AI社群10群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot4入群;



此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。



進群請加小助手微信號qbitbot4,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)

台灣電動床工廠 電動床
台灣電動床工廠 電動床
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
一川抽水肥清理行|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
X戰警多鏡頭行車記錄器專業網|多鏡頭行車記錄器|多鏡頭行車紀錄器比較|多鏡頭行車紀錄器推薦|多鏡頭行車紀錄器影片
台中抽水肥專業網|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
台灣靜電機批發工廠|靜電機|靜電機推薦|靜電油煙處理機|靜電油煙處理機推薦
優美環保科技工程-靜電機,靜電機推薦,靜電機保養,靜電機清洗,靜電油煙處理機


arrow
arrow

    qka406k8m8 發表在 痞客邦 留言(0) 人氣()