數據标注的應用場(chǎng)景

發布時(shí)間(jiān):2022-02-11 14:25:56 閱讀次數:495

  數據标注的應用場(chǎng)景

  智能(néng)安防

  智能(néng)安防是人(rén)工智能(néng)與信息技術結合的關(guān)鍵領域,對于城市(shì)與民(mín)生(shēng)發展有重要的意義。通過生(shēng)物識别、行為(wèi)監測等技術手段,廣泛地應用于城市(shì)道路(lù)監控、車輛人(rén)流監測、公共安全防範等領域。

  人(rén)臉标注在智能(néng)安防中主要應用于人(rén)臉識别與身(shēn)份識别。

  人(rén)臉識别也(yě)稱人(rén)像識别、面部識别,是基于人(rén)的臉部特征信息進行多年齡段、多角度、多表情、多光線的人(rén)臉圖像采集,從而完成身(shēn)份識别的一(yī)種生(shēng)物識别技術。人(rén)臉識别涉及的技術主要包括計算(suàn)機視(shì)覺、圖像處理(lǐ)等。

  人(rén)臉識别(視(shì)覺識别技術的一(yī)種應用)在國内的應用大緻經曆從公共安全領域擴展到商(shāng)業領域的過程。最初,機場(chǎng)、高鐵站(zhàn)以及酒店(diàn)等場(chǎng)景使用這(zhè)項技術對個(gè)人(rén)身(shēn)份進行驗證,随後商(shāng)業銀行也(yě)開始采用人(rén)臉識别實現(xiàn)遠(yuǎn)程開戶。再之後,刷臉支付、刷臉門禁也(yě)相繼出現(xiàn),人(rén)臉識别逐漸從少數有限場(chǎng)景滲透到人(rén)們的日常生(shēng)活之中,目前,人(rén)臉識别技術已廣泛應用于多個(gè)領域,除了(le)智能(néng)安防之外,還應用于金(jīn)融、司法、公安、邊檢、航天、電力、教育、醫(yī)療等衆多領域。

  此外,物品标注在智能(néng)安防應用中,物品标注需要和行為(wèi)标注結合。

  智能(néng)交通

  近年來(lái),随着人(rén)工智能(néng)浪潮的興起,無人(rén)駕駛、智能(néng)交通安全系統一(yī)度走進我們的生(shēng)活,國内許多公司紛紛投入到自動駕駛和無人(rén)駕駛的研究,例如(rú)百度啓動的“百度無人(rén)駕駛汽車”計劃,其自主研發的無人(rén)駕駛汽車Apollo還曾亮相2018年央視(shì)春晚。

  在汽車自動駕駛的過程中,想要讓汽車本身(shēn)的算(suàn)法做到處理(lǐ)更多、更複雜的場(chǎng)景,背後就(jiù)需要有海量的真實道路(lù)數據做支撐。而這(zhè)就(jiù)需要依靠數據标注。

  此外還有智慧停車,這(zhè)些(xiē)也(yě)都要依賴于人(rén)工智能(néng)數據标注的介入,對于行車視(shì)頻進行采集,路(lù)況進行提取,停車點進行标注,包括D點雲障礙物、紅(hóng)綠(lǜ)燈、車道燈及高精地圖。為(wèi)行人(rén)識别、車輛識别、紅(hóng)綠(lǜ)燈識别、車道線識别等技術提供精确訓練數據,為(wèi)智能(néng)交通保駕護航。

  智能(néng)醫(yī)療

  智能(néng)醫(yī)療是通過打造健康檔案區域醫(yī)療信息平台,利用最先進的物聯網技術,實現(xiàn)患者與醫(yī)務(wù)人(rén)員(yuán)、醫(yī)療機構、醫(yī)療設備之間(jiān)的互動,逐步達到信息化(huà)。AI與醫(yī)療行業的結合将有望迎來(lái)跨越式發展。

  醫(yī)療影像标注是對醫(yī)療影像進行區域标注及分(fēn)類标注,多應用于輔助臨床診斷。人(rén)工智能(néng)通過學習大量的醫(yī)療影像标注數據集,将會很好(hǎo)的輔助醫(yī)生(shēng)進行臨床診斷以及提出治療方案。

  得數據者,得人(rén)工智能(néng)

  人(rén)工智能(néng)主要算(suàn)法應用領域集中在計算(suàn)機視(shì)覺、語音(yīn)識别/語音(yīn)合成,以及自然語言處理(lǐ)三個(gè)方面。

  圖像方面:一(yī)個(gè)新(xīn)研發的計算(suàn)機視(shì)覺算(suàn)法需要上(shàng)萬張到數十萬張不等的标注圖片訓練,新(xīn)功能(néng)的開發需要近萬張圖片訓練,而定期優化(huà)算(suàn)法也(yě)有上(shàng)千張圖片的需求,一(yī)個(gè)用于智慧城市(shì)的算(suàn)法應用,每年都有數十萬張圖片的穩定需求。

  語音(yīn)方面:頭部公司累計應用的标注數據集已達百萬小時(shí)以上(shàng),每年需求仍以20%-30%的增速上(shàng)升,要求數據服務(wù)商(shāng)不僅要掌握專業的聲學知識、數據标注經驗,還要擁有語音(yīn)合成的算(suàn)法能(néng)力。

  自然語言處理(lǐ)方面:随着工業、醫(yī)療、教育的AI應用産品進一(yī)步爆發,将會有更多交互方式出現(xiàn),自然語義數據處理(lǐ)的需求将會持續增長,有望成為(wèi)繼圖像、語音(yīn)之後的第三大增量市(shì)場(chǎng)。

  有多少智能(néng),就(jiù)有多少人(rén)工

  這(zhè)些(xiē)海量的數據幾乎全部依賴數據标注師手工進行标注,數據标注行業的缺口十分(fēn)可觀,并且數據标注已經在各行業産生(shēng)了(le)極廣的應用,行業也(yě)開始逐漸升級,走向産業化(huà)。

  在數據标注行業流行着一(yī)句話(huà),“有多少智能(néng),就(jiù)有多少人(rén)工”。

  近日,來(lái)自普林斯頓大學、康奈爾大學、蒙特利爾大學以及美國國家統計科學研究院共同發表的最新(xīn)論文指出,這(zhè)部分(fēn)手動标記工作(zuò)大多在美國及其他西(xī)方國家之外完成,并對全球各地的工人(rén)施以殘酷剝削。

  以 Sama(原 Samasource)、Mighty AI 以及 Scale AI 等數據标記公司為(wèi)例,他們主要使用來(lái)自撒哈拉以南(nán)非洲以及東南(nán)亞地區的勞動力,每天支付給員(yuán)工的薪酬僅為(wèi) 8 美元(折合成人(rén)民(mín)币為(wèi) 51.6 元)。但(dàn)與此同時(shí),這(zhè)些(xiē)企業每年卻能(néng)賺取數千萬美元的巨額收益。

  現(xiàn)代人(rén)工智能(néng)依賴各種算(suàn)法處理(lǐ)規模達數百萬的示例、圖像或文本素材。但(dàn)在此之前,首先需要由工作(zuò)人(rén)員(yuán)在圖片數據集中手動标記出對象,再将标記完成的大量圖像交付給算(suàn)法以學習模式,掌握如(rú)何準确識别對象。這(zhè)類工作(zuò)量極大、過程極其枯燥且耗時(shí)的手動數據标記過程,已經成為(wèi) AI 經濟體(tǐ)系中的重要組成部分(fēn)。

  未來(lái),随着AI應用場(chǎng)景逐漸多領域化(huà),在數據标注行業内部,從業者也(yě)必将随着AI行業而一(yī)同進入細分(fēn)市(shì)場(chǎng)追逐階段,可謂機遇與挑戰并行。


在線客服 聯系方式 二維碼

電話(huà)

17791672784

掃一(yī)掃,關(guān)注我們