什(shén)麽是數據标注?(案例說(shuō)明)

發布時(shí)間(jiān):2021-02-11 14:24:58 閱讀次數:534

  1.下(xià)面演示一(yī)個(gè)實際案例,幫您更好(hǎo)的了(le)解這(zhè)類崗位。

  理(lǐ)解數據标注之前先來(lái)理(lǐ)解一(yī)下(xià)機器(qì)學習,簡單來(lái)講,機器(qì)學習就(jiù)是讓計算(suàn)機也(yě)可以‘聽(tīng)音(yīn)識曲’、認識‘花鳥魚蟲’。而數據标注就(jiù)可以理(lǐ)解為(wèi)手把手教機器(qì)‘讀書寫字’的老師,那麽,教授過程中所使用的‘教材’和‘教學方法’分(fēn)别是什(shén)麽呢(ne)?比如(rú),本節課的内容是教授計算(suàn)機識别圖片中的貓,則所用的‘教材’就(jiù)是大量的貓的圖片,‘教學方法’就(jiù)是數據标注員(yuán)将各圖片中的貓标注出來(lái),并告訴計算(suàn)機‘這(zhè)是一(yī)隻貓’,目的是通過這(zhè)樣大量的、反複不斷的練習,使計算(suàn)機掌握貓的特征,當再次拿到新(xīn)的關(guān)于貓的圖片後,計算(suàn)機可以将其自動識别,也(yě)就(jiù)是說(shuō)數據标注的核心是标出想讓計算(suàn)機學習的内容,通過反複訓練讓其掌握學習内容的特點并達到自動識别的效果。

  2.如(rú)何進行數據标注

  仍以教授計算(suàn)機識别貓為(wèi)例,過程如(rú)下(xià):

什(shén)麽是數據标注?通過一(yī)個(gè)案例了(le)解下(xià)

  1) 收集大量的關(guān)于貓的圖片,并進行數據清洗,包括去除無效數據、整理(lǐ)格式等,具體(tǐ)要求需要與算(suàn)法人(rén)員(yuán)确認。

  2) 将各圖片中的貓進行标注,标注完成後将圖片劃分(fēn)為(wèi)訓練集和測試集,使用訓練集作(zuò)為(wèi)計算(suàn)機學習貓特征的‘教材’,将測試集用來(lái)檢測計算(suàn)機的學習效果,得到本次學習的準确率。

  3) 基于計算(suàn)機的學習效果,不斷優化(huà)标注過程,使得内容對應的特征更加準确、明了(le),從而使計算(suàn)機擁有對貓更加準确的識别能(néng)力。

  總的來(lái)講,數據标注就(jiù)是對收集的數據,包括文本、圖片、語音(yīn)等等,進行整理(lǐ)與标注的過程。以上(shàng)就(jiù)是數據标注類崗位日常工作(zuò)中的一(yī)個(gè)案例。

什(shén)麽是數據标注?通過一(yī)個(gè)案例了(le)解下(xià)


在線客服 聯系方式 二維碼

電話(huà)

17791672784

掃一(yī)掃,關(guān)注我們