今天,又介紹一位新同事!

微信號:騰訊

微信號:tencent

繼「新同事」張潼博士加入騰訊任職騰訊 AI Lab 主任之後,今天,又一枚 AI 大牛加入騰訊。

5月2日,騰訊正式宣布任命語音識別領域頂級專家俞棟博士為 AI Lab(人工智能實驗室)副主任。

同時,騰訊成立美國西雅圖 AI 實驗室。俞棟博士將負責西雅圖 AI 實驗室的經營及管理,推動騰訊在語音識別及自然語言理解等 AI 領域的基礎研究。

俞棟博士

在國際語音識別研究界,俞棟是一個無法忽視的名字:

關於俞棟

加入騰訊前,俞棟擔任美國微軟研究院語音和對話組(Speech and Dialog Group)首席研究員,並兼任浙江大學兼職教授、中科大客座教授及上海交通大學客座研究員。

俞棟博士與 George Dahl 博士、鄧力博士等共同研發的上下文相關深層神經網路-隱馬爾科夫模型(CD-DNN-HMM)是深度學習技術在大詞匯量語音識別任務上的首次成功應用,他的突破性工作,曾在 2013年和2016年兩次獲得IEEE信號處理協會(IEEE SPS)最佳論文獎,引起了大詞匯量語音識別研究方向的轉變,極大地推動了語音識別技術的發展。

騰訊 AI Lab 於2016年4月成立,總部位於深圳。作為騰訊公司級 AI 實驗室,AI Lab 專注於基礎研究和應用探索的結合,致力於提升 AI 決策、理解及創造能力,並為騰訊各個產品及業務提供 AI 技術支持。

騰訊 AI Lab 由機器學習和大數據領域專家張潼博士主管,現有50多位世界知名院校的 AI 科學家(90%為博士)與200多位應用工程師。

在騰訊 AI Lab 的研究體系中,美國西雅圖 AI 實驗室將承擔一些語音識別和自然語言處理(NLP)的基礎和前沿研究工作,並試圖解決這些領域更困難的問題。

於俞棟博士的加盟,騰訊 AI Lab 主任張潼博士表示:

「俞棟博士是語音識別與深度學習領域的專家。我們很高興能邀請到俞博士加入騰訊 AI Lab,相信他的到來將極大提升騰訊AI的技術實力。

我們希望騰訊 AI Lab 不僅是一個實驗室,還是一個連接器,通過將全球的優秀人才連接在一起,不斷推動 AI 的基礎研究及在更多場景的應用落地,讓 AI 無處不在。」

為語音識別技術方向的頂級專家,俞棟的加入意味著騰訊 AI Lab 在人工智能上的布局將進一步向基礎研究方向延伸。

下面,我們就一些你們一定會關心(八卦)的問題問了俞棟博士:

Q:為什麼選擇加入騰訊?

A:我主要的研究方向是語音識別,而語音識別的研究需要滿足幾點要求;

1、足夠大的數據來源;

2、足夠強的運算能力;

3、必須有應用場景去落地,形成反饋機制,持續優化。

這些騰訊都能很好地滿足。

另外,我個人偏好於學術研究,去攻克一些比較難的問題。這一點騰訊很支持。

Q:騰訊的優勢主要是社交應用場景上的優勢?

A:語音識別可以做的有很多,我們可以在很多方面進行探索。在騰訊,社交網路當然是比較成熟的應用場景,另外,瀏覽器、搜尋等很多產品都是很好的出口。

Q:AI Lab 西雅圖團隊的工作內容是怎樣的?

A:西雅圖團隊主要偏向做基礎研究,解決一些研究難題。定位更類似實驗室性質。在真實的應用場景裡,提升語音的識別和語意理解的能力。

Q:為什麼會把實驗室設在西雅圖?

A:國際上有眾多知名公司都在西雅圖有研究中心,比如微軟總部在西雅圖,已經在人工智能領域投入研究幾十年了。後來有亞馬遜和 Facebook 在西雅圖設立研究中心,形成了一種很好的研究生態。

此外,相比於矽谷,西雅圖經營成本更低,但人才、科技範圍都在快速發展。目前西雅圖的流入人口是非常大的。

Q:國外的大公司像微軟、Google 一般都有比較成熟的研究院,但國內的大公司似乎研究院發展都不太順利。你怎麼看這個事兒?

A:國外大公司有做研究院的傳統,歷史也比較長,有學術研究的氛圍,也比較有耐心,這些大公司傾向於大力招攬不管學術界還是工業界比較有研究能力的大牛,給他們足夠的資源和自由度,根據他們的想法來做一些事情。

總體來講,如果要在技術研究上取得突破,確實需要有一定的耐心和相對長期穩定的投入。西雅圖實驗室這邊基本上秉持這樣的理念,我們希望這個實驗室從長遠看能夠攻克一些關鍵的技術難題。

Q:國內的AI技術水平跟美國差距有多大?如何彌補這個差距?

A:如果從原創性研究來講,差距還是蠻大的,最近幾年 AI 的進展,原創的成果很少是國內產生的,基本上是國外產生的。

需要中國的科技公司意識到基礎研究的重要性,及公司拿出足夠耐心來支持這樣的基礎研究,而且是長期性的研究,差距才會慢慢地縮小。

Q:為什麼人工智能突然這麼受關注?

A:80年代末就有一陣關於神經網路研究的熱潮,其實在學術界關於人工智能的研究一直都在進行。最近幾年的熱潮主要是工業界推動的,但當中的算法主要還是80年代末90年代初提出的。

不同的是,現在的計算資源和數據量比當年要豐富得多。計算力強就能訓練足夠大的網路;數據多則能夠提高網路訓練效果。

這次浪潮是由工業界的成果引導的,我們在語音識別上的成功很快被 IBM 研究院和 Google 所驗證,並推動了工業界對深度學習技術的更多研究。工業界發現這些研究成果確實對他們的產品有幫助,所以就花了很多的資源促使學術界加入。學術界才又有了很多新的想法和模型出來的。

Q:平時會愛什麼方面的書?

A:最近看得較多的是管理方面的書,早期比較喜歡看武俠小說。

Q:最喜歡的武俠小說作家是?

A:金庸。

長按識別二維碼關注

熱門文章