重塑技術與商業模態,「智慧城市·視覺智能」專場回顧|ccf-gair 2019
發表時間:2019-10-07 19:03:12 作者:雕刻機

重塑技術與商業模態,「智慧城市·視覺智能」專場回顧|ccf-gair 2019

編者按:7月12日-7月14日,2019第四屆全球人工智能與機器人峰會(ccf-gair 2019)于深圳正式召開。峰會由中國計算機學會(ccf)主辦,雷鋒網、香港中文大學(深圳)承辦,深圳市人工智能與機器人研究院協辦,得到了深圳市政府的大力指導,是國內人工智能和機器人學術界、工業界及投資界三大領域的頂級交流博覽盛會,旨在打造國內人工智能領域極具實力的跨界交流合作平臺。

7月14日,「智慧城市·視覺智能」專場正式拉開帷幕。本專場全面圍繞“未來城市級視覺ai的發展方向”這一主題展開。

北京pk10开奖记录其中,騰訊賈佳亞、曠視孫劍、商湯王曉剛、云從溫浩、澎思申省梅、加州大學洛杉磯分校demetri terzopoulos、千視通胡大鵬,從產學交叉的視角,提出了新的視覺智能技術研究方向與產品化方法論。

以下是本次大會的精彩回顧:

騰訊賈佳亞:《人工智能的多模態發展》

重塑技術與商業模態,「智慧城市·視覺智能」專場回顧|ccf-gair 2019

北京pk10开奖记录騰訊優圖實驗室聯合負責人賈佳亞教授

人工智能的終極應用離我們還有多久?

賈佳亞在演講中提出了這個問題,他給出的答案是可能還需要50-100年的發展路徑。

北京pk10开奖记录而人工智能學科發展與人類智能差距之一就是“多模態信息的智能化理解”。

人造信息量帶來了更大多樣性,視覺、聲音、符號語言、嗅覺和觸覺等信息,具有無限多樣性。

北京pk10开奖记录而多模態人工智能還存在不少基礎難點:第一是數據模態多種多樣,包括2d圖像、3d模型、結構化信息、文本、聲音及更多無法量化的數據;第二是多模態數據的不對應,如從圖像到文字,從文字到圖像,都是“一對多”的過程,會有多種的描述和呈現;第三是多模態數據的融合,一個軟件或算法的進步較為容易,但多個算法一起,難度將幾何級上升,如“告訴機器人拿桌子左邊的瓶子”,會經過語言模型、三維建模、自動尋路、圖像分析這些步驟;第四是多模態監督,“如何告訴機器人拿錯了”“哪一步驟拿錯了”也是目前的難點。

北京pk10开奖记录而要解決這些多模態信息的難題,賈佳亞提出要更好研究嗅覺、味覺、觸覺、心理學等難以量化的信號問題,通過多模態數據使得計算成為可能,進行協同學習、用一個資源豐富的模態信息輔助另一個資源貧瘠的模態。

北京pk10开奖记录多模態人工智能問題的解決,就會是人工智能更多落地的未來。

商湯王曉剛:《從學術到產業化的人工智能》

重塑技術與商業模態,「智慧城市·視覺智能」專場回顧|ccf-gair 2019

商湯科技聯合創始人、研究院院長王曉剛

王曉剛則回顧了人臉識別從學術到工業界逐步的進步,以及人臉識別在智慧城市、智慧通行、手機、ar、游戲等具體場景的應用。

北京pk10开奖记录王曉剛提出計算機視覺的研究有幾個重要的層次:

一是基礎層,包括芯片、ai超算平臺、深度學習平臺、ai平臺等基礎方面的研究,目前西方尤其是美國領先;二是應用層,其中中國有很多豐富的場景,能給予反饋,是我國擅長的領域;三是工具鏈層,未來需要面臨的課題是如何讓普通的開發者、公測人員根據工具鏈迅速開發出人工智能的解決方案,使其生產力釋放出來。

而商湯以往、現在以及未來持續會做的就是,在算法精度不斷提升的前提下,拓展智慧城市從1到n的業務邊界、促進2d的感知到3d世界的落地,以及現實到虛擬現實的融合。

2014年商湯團隊發表deepid系列人臉識別算法,使其全球首次超過人眼識別率,人臉識別超越肉眼突破工業應用紅線,之后隨著技術的持續進步,業務也不斷突破邊界,從相對簡單的1:1識別,向1:n進發。

王曉剛列舉了數據,在門禁、閘機等通行場景中,一棟大樓或公司有1、2萬人的數據庫,智慧城市的數據庫可能達到幾十萬的量級。商湯所做的就是從幾萬到幾十萬人中識別和分析所需要找的人與物。隨著場景不斷的拓展,王曉剛認為人臉會逐漸成為人的身份標志。

另外,在3d的應用上,商湯的3d人臉識別方案也已經在很多手機上得到應用。王曉剛現場展示了手機上通過3d攝像頭拍攝的人臉、物體以及人體圖像進行3d重建,未來2d的相冊還能拓展到3d相冊。人體的跟蹤上也從2d延伸到3d,目前商湯已將其應用于體感游戲。

云從溫浩:《泛在智能城市下的人機協同平臺》

重塑技術與商業模態,「智慧城市·視覺智能」專場回顧|ccf-gair 2019

云從科技聯合創始人溫浩

人工智能如何落地?

溫浩提出一定要構建“感知、認知、決策”的智能經濟的ai閉環。創業公司必須感知、認知、決策環節都涉及。

北京pk10开奖记录而場景上,可分為邊緣場景和云端場景,但邊緣場景和云端要根據場景進行智能的分配。