Sainmhíniú
Is éard atá i gceist le mionchoigeartú maoirseachta (SFT) ná próiseas chun samhail réamh-oiliúna a oiliúint ar shonraí lipéadaithe le haghaidh tasc ar leith, agus a pharaiméadair go léir nó cuid díobh a choigeartú.
Cuspóir
Is é an cuspóir samhlacha ilchuspóireacha a oiriúnú do thascanna speisialaithe le cruinneas feabhsaithe.
Tábhacht
- Teicníc lárnach i NLP agus tascanna fís.
- Éilíonn sé sonraí lipéadaithe ardchaighdeáin.
- Rioscaí ann ró-fheistiú le tacair sonraí beaga.
- Is minic gur réamhtheachtaí é do RLHF.
Conas a Oibríonn sé
- Roghnaigh samhail réamh-oiliúna.
- Bailigh sonraí lipéadaithe don tasc sprice.
- Traenáil an tsamhail le foghlaim mhaoirseachta.
- Bailíochtú ar shraith tástála atá curtha ar fionraí.
- Imscaradh agus monatóireacht a dhéanamh ar fheidhmíocht.
Samplaí (Saol Réadach)
- Rinne GPT mionchoigeartú ar chomhráite seirbhíse do chustaiméirí.
- BERT feabhsaithe le haghaidh aitheantas eintitis ainmnithe.
- Claochladáin radhairc mínchoigeartaithe ar aicmiú íomhánna leighis.
Tagairtí / Tuilleadh Léitheoireachta
- Devlin et al. “BERT: Réamh-oiliúint Claochladáin Dhomhanda Déthreocha.” NAACL 2019.
- Doiciméadú ar Hugging Face Claochladáin.
- Stanford CS224N: NLP le Foghlaim Dhomhain.
- Cad is SFT ann? Cén fáth a bhfuil sé tábhachtach?