Zero shot learning

Čo je zero shot learning?

Zero shot learning je technika strojového učenia, pri ktorej model dokáže klasifikovať alebo rozpoznať objekty a koncepty, pre ktoré nemá žiadne označené tréningové príklady, ale má k dispozícii ich sémantický popis (napríklad atribúty alebo textové opisy). Na rozdiel od tradičných prístupov, kde model potrebuje označené príklady každej triedy, využíva zero shot learning sémantické informácie a vzťahy medzi triedami na generalizáciu znalostí na nové, počas trénovania nevidené kategórie.

Princípy zero shot learning

Základom zero shot learningu je prepojenie vizuálnych alebo textových reprezentácií so sémantickými popismi tried prostredníctvom zdieľaného sémantického priestoru. Model sa učí mapovať vstupy do tohto priestoru, kde sú triedy reprezentované pomocou atribútov, slovných popisov alebo vektorových embeddingov, ktoré slúžia ako náhrada za chýbajúce označené príklady.

Kľúčovú úlohu zohráva transfer learning. Model prenáša znalosti získané z tréningových tried na nové, nevidené triedy. Tento prenos je možný vďaka tomu, že model neučí priamo rozpoznávať konkrétne triedy, ale učí sa chápať vzťahy medzi vlastnosťami objektov a ich popismi.

V kontexte veľkých jazykových modelov sa pojem „zero‑shot“ často používa v trochu inom zmysle: označuje situáciu, keď model vykonáva úlohu len na základe textovej inštrukcie v prompte, bez ukážkových príkladov (zero‑shot prompting). Aj v tomto prípade model využíva znalosti nadobudnuté počas predtrénovania na rozsiahly korpus textov, ale nejde o klasické zero shot learning nastavenie so sémantickými popismi „seen“ a „unseen“ tried, ako sa používa v literatúre o zero shot learningu.

Typy zero shot learning

Rozlišujeme niekoľko variantov tejto techniky podľa miery dostupných informácií:

  • Čisté zero shot learning – model nemá žiadne príklady cieľových tried, iba ich sémantické popisy.
  • Generalizované zero shot learning – model klasifikuje súčasne tréningové (seen) aj nové (unseen) triedy, pričom často trpí biasom v prospech tréningových tried.
  • Transduktívne zero shot learning – model má počas trénovania prístup k neoznačeným dátam z cieľových tried a môže ich využiť na lepšie prispôsobenie sémantického priestoru.

Každý variant má svoje špecifické využitie; čisté zero shot learning je najnáročnejšie, ale praktické v scenároch, kde nové triedy vznikajú dynamicky a nie je možné pripraviť označené dáta vopred.

Vieš, že
Vieš, že…

…v kontexte strojového učenia slovo „shot“ označuje počet príkladov z danej triedy? Zero‑shot teda znamená, že model nemá žiadne príklady cieľovej triedy, zatiaľ čo few‑shot znamená niekoľko príkladov.

Príklady použitia zero shot learning

V počítačovom videní sa zero shot learning využíva na rozpoznávanie objektov z kategórií, ktoré neboli súčasťou trénovacích dát. Napríklad model natrénovaný na rozpoznávanie bežných zvierat dokáže identifikovať vzácne druhy len na základe ich textového popisu.

V spracovaní prirodzeného jazyka túto techniku využívajú veľké jazykové modely na klasifikáciu textov do kategórií definovaných používateľom. Model dokáže určiť sentiment, tému alebo zámer textu bez špecifického trénovania na danú úlohu.

Medicínska diagnostika predstavuje ďalšiu oblasť využitia. Modely môžu identifikovať zriedkavé ochorenia na základe popisu symptómov, aj keď tréningové dáta obsahovali len bežné diagnózy.

Obmedzenia zero shot learning

Hlavnou výzvou zostáva takzvaný domain shift – rozdiel medzi distribúciou tréningových a cieľových tried; ak sú nové triedy príliš odlišné od tréningových, kvalita predikcií výrazne klesá.

Generalizácia je silno závislá od kvality a úplnosti sémantických popisov tried a v generalizovanom zero shot nastavení má mnoho metód tendenciu zvýhodňovať tréningové triedy oproti novým triedam.

Ďalším obmedzením je nižšia presnosť v porovnaní s klasickým učením s učiteľom, kde má model k dispozícii označené príklady všetkých tried, takže zero shot learning nie je vhodný pre úlohy vyžadujúce veľmi vysokú spoľahlivosť v kritických aplikáciách.

Zdroje a odkazy

Použité zdroje:

  • Xian et al. (2017) – Zero-Shot Learning – A Comprehensive Evaluation of the Good, the Bad and the Ugly: https://arxiv.org/abs/1707.00600

Odporúčané zdroje:

  • Papers With Code – Zero-Shot Learning: https://paperswithcode.com

Uvedené informácie sú orientačné a môžu sa líšiť v závislosti od verzie, implementácie a prostredia.