Bydd y prosiect yn cyflawni'r amcanion canlynol (a ddisgrifir fel cwestiynau ymchwil):
Beth yw'r lleiafswm o ddata wedi'i labelu sydd ei angen er mwyn cyflawni model cywir, geo-cyffredinoledig?
Mae faint o samplau sy'n ofynnol ar gyfer dysgu peirianyddol yn gwestiwn ymchwil gweithredol ac agored ar hyn o bryd. Mae canlyniadau diweddar wedi archwilio cymhlethdod y sampl damcaniaethol ond yn y prosiect hwn, dibynadwyedd labeli’r data hyfforddi sydd dan sylw .
Sut y gall Rhyngwynebau Defnyddwyr hwyluso labelu setiau data mawr?
Mae ein harbenigedd blaenorol ym maes rhyngwynebau defnyddwyr effeithiol ar gyfer labelu setiau data cyfres amser mawr. Byddwn yn ymestyn ein hymchwil i'r maes cymhwyso hwn ac yn integreiddio offer pellach i ddatrys y problemau isod.
Sut y gellir mesur amrywiad yn y dehongliad o ddelweddau gan labelwyr, a pha raddau o hyder ddylai fod gennym mewn set ddata wedi'i labelu?
Gallai labelwyr anarbenigol gynhyrchu labeli digonol gyda llai o adnoddau o gymharu ag arbenigwyr, ond cwestiwn ymchwil yw faint y gallem ddibynnu ar y labeli hynny, ac a allem olrhain unrhyw ansicrwydd trwy'r hyfforddiant i'r model. Mae'r dulliau cyfredol yn archwilio labelu consensws neu sŵn label o wahanol onglau, ond mae hwn yn dal i fod yn faes ymchwil agored.
Pa effaith mae nodweddion corpws label yn ei chael ar gywirdeb model?
Ar ôl hyfforddi model cychwynnol, gellir defnyddio metrigau amrywiol i ddisgrifio cywirdeb a llwyddiant y model. Mae angen i ni ddadansoddi perfformiad ym mhresenoldeb sŵn label a thuedd label. Mae sŵn label, cam-labelu neu duedd yn cael effaith ar fodelau ac mae rhai ffactorau lliniaru yn hysbys. Mae angen i ni ddarganfod pa gyfran o berfformiad y model sy'n ganlyniad i anghywirdeb, ansicrwydd neu duedd yn y data wedi'i labelu a sut y gellir mesur a lledaenu tuedd, cywirdeb ac ansicrwydd yn ffurfiol trwy wahanol gamau yn natblygiad model. Yn ddelfrydol, mae hyfforddi, profi a mireinio model yn broses aflinol, yn lle hynny mae hyfforddi model yn ailadroddol gan fod pob cam o greu modelau yn llywio'r nesaf (a chamau blaenorol mewn dolen). Mae technegau fel ail-labelu, ail-samplu a ffug-labelu ar gael i ddiweddaru set ddata wedi'i labelu. Yn seiliedig ar asesiadau o berfformiad model cychwynnol.