近幾年,中國人工智能快速發展。無人超級市場、無人物流、無人加油站、無人駕駛、無人賓館…以及各種功能完善的機器人!當我們沒有意識到這一點時,人工智能正日夜不停地不斷迭代進化,影響到我們生活的各個方面。這一令人驚奇而又振奮人心的事件背后,離不開計算機視覺、自然語言處理、生物特征識別與圖譜等人工智能關鍵技術。下面就由小編為您介紹一下人工智能三大核心技術。
人工智能三大核心技術
根據實際解決的問題, 計算機視覺技術可分為 人臉識別、圖像檢測、圖像檢索、目標跟蹤、風格遷移 等幾大板塊。 其中,人臉識別、圖像分類等功能計算機視覺技術已經比人類視覺更精準、更迅速。在醫院,一般早期食管癌檢出率低于 10% ,而騰訊覓影通過掃描上消化道內鏡圖片篩查食管癌,檢出率高達 90% ,且用時不到 4 秒。商湯科技宣稱,利用其計算機視覺技術,視頻內容審核能夠節省 99% 的人工。
然而,雖然在解決識別、檢測、聚類等問題上,計算機視覺已經可以超越人類,但其發展仍面臨挑戰。
首先, 缺乏可用于人工智能模型訓練的大規模數據集。缺乏標注數據是幾乎所有應用場景普遍存在的挑戰。當前的應用場景多以項目制形式落地,數據仍然在項目建設方,數據不能共享也無法形成閉環,也就導致技術的進步分散在各個企業的各個項目中,難以帶來行業整體跨越。
其次, 缺乏從技術到產品到規模化應用的工程化經驗。計算機視覺技術的應用已不再是單一的軟件應用,涉及到新型基礎架構,涉及到新的數據分析流程,還涉及到智能硬件如攝像頭的安裝等等。每一個環節都可能會影響識別效果。將這一技術從實驗室擴展到工業化應用的過程本身就是很大的挑戰。
一個完整的自然語言處理系統包含 語音識別、語義識別、語音合成 三部分。 其中,國內企業在語音識別和語音合成已處世界領先地位。
語音識別 是指讓計算機“聽到”人的語音,目前已經比較成熟,尤其漢語的語音識別領先英語。根據2017年IBM、谷歌和微軟發布的詞錯率進展數據,他們的識別率均在94%-95%之間,而在此之前,國內語音識別企業,如百度、搜狗、科大訊飛,識別率均已達到97%左右。
語音合成 是指計算機將準備“回復”給人類的語句,通過合成音頻的形式,利用揚聲器外放。百度地圖的語音導航、蘋果手機的Siri助手背后都利用了語音合成技術,這項技術已日臻成熟。當前,科大訊飛的語音合成技術代表了世界領先水平。2018年科大訊飛打敗卡內基梅隆等眾多高校、科研機構和企業,連續13年贏得Blizzard Challenge(國際語音合成大賽)冠軍。
區別于語音識別“ 聽到” 人類語言,語義識別更加強調“ 聽懂” 。 當用戶對智能系統說出一個飯店的名字,系統對用戶語音進行識別,搜索飯店,這是“語音識別”;當用戶對智能系統說“自助餐”、“海鮮”、“連鎖店”等模糊語句,智能系統根據用戶的性別、愛好、飲食傾向等特征進行智能分析,并精準推薦,則是“語義分析”。可見,語義識別比語音識別技術難度高好幾個層次。
語義識別 是當前自然語言處理發展的瓶頸,仍處于初級研究階段。由于目前的人工智能技術只能把音變成字,字變成音,不能理解其中含義,很難實現基于場景的生動會話,商業落地的場景十分有限。
知識圖譜 最初是由Google 公司在 2012 年提出來的一個新的概念。從學術的角度,我們可以對知識圖譜給一個這樣的定義:“知識圖譜本質上是語義網絡( Semantic Network )的知識庫”。但這有點抽象,所以換個角度,從實際應用的角度出發其實可以簡單地把知識圖譜理解成多關系圖( Multi-relational Graph )。如果說以往的智能分析專注在每一個個體,知識圖譜則專注于這些個體之間的 “ 關系 ” 。知識圖譜用 “ 圖 ” 的表達形式,最有效、最直觀地表達出實體間的關系,是最接近真實世界、符合人類思維模式的數據組織結構。
相較于傳統的智能分析, 知識圖譜是基于圖的數據結構,即知識圖譜需要從海量信息中抽去多個維度的特征信息, 并在這些特征信息素材的基礎上,通過智能推理實現從數據到可視化圖像深加工,從而能夠直觀易懂的展現給用戶,并與用戶交互。
目前, 知識圖譜主要應用于面向 互聯網的搜索、推薦、問答 等業務場景,成為以 商業搜索引擎公司 為首的互聯網公司重兵布局的人工智能技術之一。 同時,也開始在金融、醫療、電商及公共安全保障等領域得到廣泛的探索。當我們使用搜索軟件時,搜索結果右側的聯想,就來自于知識圖譜技術。在反洗錢或電信詐騙場景,知識圖譜可精準追蹤卡與卡間的交易路徑,追本溯源識別洗錢/套現路徑和可疑人員,并通過他們的交易軌跡,層層關聯,分析得到更多可疑人員、賬戶、商戶或卡號等實體。
然而, 目前知識圖譜尚處于發展初期,受制于抽取數據的樣本量限制、深加工準確率和效率較低、數據噪聲大等因素限制,應用場景非常有限 。相信未來,隨著研究的深入,會有越來越多的應用場景被發掘出來,對于知識圖譜所能發揮的價值可期。
雖然人工智能在圖像識別、語音識別、文本處理、游戲博弈等方面全面趕超人類,取得了突破性進展,但總體來說還處于嬰幼兒期,遠未達到人們預期的智能水平,也遠未成熟。我相信,在未來,隨著時代的進步,技術瓶頸將不斷突破,人工智能的發展將更加多樣化,更多的黑技術將使我們的生活更加智能化。以上就是小編為您介紹的人工智能三大核心技術。
[免責聲明]
文章標題: 人工智能三大核心技術
文章內容為網站編輯整理發布,僅供學習與參考,不代表本網站贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時溝通。發送郵件至36dianping@36kr.com,我們會在3個工作日內處理。