Múnlaí Móra Teanga (LLM): Treoir Críochnaithe in 2023

Gach rud a theastaíonn uait a bheith ar an eolas faoi LLM

Réamhrá

Ar scríob tú do cheann riamh, iontas ort faoin gcaoi ar chosúil go bhfuair Google nó Alexa tú? Nó an bhfuil tú ag léamh aiste ríomhghinte a bhfuil cuma an duine uaigneach? Níl tú i d’aonar. Tá sé in am an imbhalla a tharraingt siar agus an rún a nochtadh: Múnlaí Móra Teanga, nó LLManna.

Cad iad seo, a fhiafraíonn tú? Smaoinigh ar LLManna mar wizards ceilte. Cuireann siad cumhacht ar ár gcomhráite digiteacha, tuigeann siad ár bhfrásaí míshásta, agus fiú scríobhann siad cosúil linne. Tá ár saol á athrú acu, rud a fhágann go bhfuil ficsean eolaíochta ina réaltacht.

Tá an treoir seo ar gach rud LLM. Fiosróimid cad is féidir leo a dhéanamh, cad nach féidir leo a dhéanamh, agus cá háit a n-úsáidtear iad. Scrúdóimid an tionchar a bhíonn acu orainn go léir i dteanga shimplí shimplí.

Mar sin, cuirimis tús lenár dturas spreagúil isteach LLManna.

Cé dó a bhfuil an Treoir seo?

Tá an treoir fhairsing seo le haghaidh:

  • Is fiontraithe agus solopreneurs tú go léir a bhíonn ag brú méid ollmhór sonraí go rialta
  • AI agus foghlaim meaisín nó gairmithe atá ag tosú le teicnící optamaithe próisis
  • Bainisteoirí tionscadail a bhfuil sé ar intinn acu margadh níos gasta a chur i bhfeidhm dá modúil AI nó dá dtáirgí faoi thiomáint AI
  • Agus díograiseoirí ardteicneolaíochta ar mhaith leo sonraí na sraitheanna a bhfuil baint acu le próisis AI a fháil.
Samhlacha móra teanga llm

Cad is Múnlaí Móra Teanga ann?

Is córais ard-intleachta saorga (AI) iad Múnlaí Móra Teanga (LLManna) atá deartha chun téacs ar nós an duine a phróiseáil, a thuiscint agus a ghiniúint. Tá siad bunaithe ar theicnící domhainfhoghlama agus tá siad oilte ar thacair sonraí ollmhóra, ina mbíonn na billiúin focal ó fhoinsí éagsúla cosúil le láithreáin ghréasáin, leabhair agus ailt de ghnáth. Cuireann an oiliúint fhairsing seo ar chumas LLM na nuances teanga, gramadaí, comhthéacs, agus fiú roinnt gnéithe den eolas ginearálta a thuiscint.

Úsáideann roinnt LLManna móréilimh, cosúil le GPT-3 OpenAI, cineál néarlíonra ar a dtugtar claochladán, a ligeann dóibh tascanna teanga casta a láimhseáil le hinniúlacht shuntasach. Is féidir leis na samhlacha seo raon leathan tascanna a dhéanamh, mar shampla:

  • Ceisteanna a fhreagairt
  • Téacs achoimriú
  • Teangacha a aistriú
  • Ábhar a ghiniúint
  • Fiú dul i mbun comhráite idirghníomhacha le húsáideoirí

De réir mar a leanann LLManna ag forbairt, tá acmhainneacht mhór acu chun feidhmchláir éagsúla ar fud na dtionscal a fheabhsú agus a uathoibriú, ó sheirbhís do chustaiméirí agus cruthú ábhair go hoideachas agus taighde. Mar sin féin, ardaíonn siad ábhair imní eiticiúla agus shochaíocha, amhail iompar claonta nó mí-úsáid, ar gá aghaidh a thabhairt orthu de réir mar a théann an teicneolaíocht chun cinn.

Cad iad samhlacha móra teanga

Fachtóirí Riachtanacha i dTógáil Corpas Sonraí LLM

Ní mór duit corpas sonraí cuimsitheach a thógáil chun samhlacha teanga a oiliúint go rathúil. Is éard atá i gceist leis an bpróiseas seo ná sonraí ollmhóra a bhailiú agus ardcháilíocht agus ábharthacht a chinntiú. Breathnaímid ar na príomhghnéithe a mbíonn tionchar suntasach acu ar fhorbairt leabharlann sonraí éifeachtach d’oiliúint samhaltán teanga.

  1. Tosaíocht a thabhairt do Cháilíocht Sonraí Chomh maith le Cainníocht

    Tá tacar sonraí mór bunúsach chun samhlacha teanga a oiliúint. Mar sin féin, tá go leor tábhachta ag baint le cáilíocht sonraí. D’fhéadfadh torthaí míchruinne a bheith mar thoradh ar mhúnlaí a gcuirtear oiliúint orthu ar shonraí fairsinge ach nach bhfuil struchtúr orthu.

    Os a choinne sin, is minic go n-eascraíonn feidhmíocht níos fearr as tacair shonraí níos lú agus atá coimeádta go cúramach. Léiríonn an réaltacht seo an tábhacht a bhaineann le cur chuige cothrom i leith bailiú sonraí. Tá gá le sonraí atá ionadaíoch, éagsúil agus ábhartha do raon feidhme beartaithe na samhla a roghnú, a ghlanadh agus a eagrú go díograiseach.

  2. Roghnaigh Foinsí Sonraí Cuí

    Ba cheart go mbeadh rogha na bhfoinsí sonraí ar aon dul le sainspriocanna feidhme na samhla.

    • Bhainfeadh múnlaí a ghineann idirphlé tairbhe as foinsí mar chomhráite agus agallaimh thar a bheith luachmhar.
    • Bainfidh samhlacha a dhíríonn ar ghiniúint cód leas as stórtha cód dea-dhoiciméadaithe.
    • Cuireann saothair liteartha agus scripteanna saibhreas ábhar oiliúna ar fáil dóibh siúd a dhíríonn ar an scríbhneoireacht chruthaitheach.

    Ní mór duit sonraí a chuimsíonn na teangacha agus na topaicí atá beartaithe a chur san áireamh. Cabhraíonn sé leat an tsamhail a chur in oiriúint chun feidhmiú go héifeachtach laistigh dá fhearann ​​ainmnithe.

  3. Úsáid Giniúint Sonraí Sintéiseach

    Is féidir bearnaí a líonadh agus a raon a leathnú trí do thacar sonraí a fheabhsú le sonraí sintéiseacha. Is féidir leat méadú sonraí, samhlacha giniúna téacs, agus giniúint bunaithe ar rialacha a úsáid chun sonraí saorga a chruthú a léiríonn patrúin an fhíorshaoil. Leathnaíonn an straitéis seo éagsúlacht na sraithe oiliúna chun athléimneacht na samhla a fheabhsú agus chun laofachtaí a laghdú.

    Bí cinnte go bhfíoraíonn tú cáilíocht na sonraí sintéiseacha ionas go gcuirfidh sé go dearfach le cumas an mhúnla teanga a thuiscint agus a ghiniúint laistigh dá spriocfhearann.

  4. Bailiú Sonraí Uathoibrithe a chur i bhfeidhm

    Éascaíonn uathoibriú don phróiseas bailithe sonraí comhtháthú comhsheasmhach sonraí úra, ábhartha. Déanann an cur chuige seo éadáil sonraí a chuíchóiriú, treisíonn sé inscálaitheacht, agus cuireann sé in-atáirgtheacht chun cinn.

    Is féidir leat tacair shonraí éagsúla a bhailiú go héifeachtach trí úsáid a bhaint as uirlisí scrapála gréasáin, APIanna, agus creataí ionghabhála sonraí. Is féidir leat na huirlisí seo a mhionchoigeartú chun díriú ar shonraí ábhartha ardchaighdeáin. Optamaíonn siad an t-ábhar oiliúna don mhúnla. Ní mór duit monatóireacht leanúnach a dhéanamh ar na córais uathoibrithe seo chun a gcruinneas agus a n-ionracas eiticiúil a choinneáil.

Samplaí Coitianta de Mhúnlaí Móra Teanga

Seo roinnt samplaí feiceálach de LLManna a úsáidtear go forleathan i ingearacha éagsúla tionscail:

Llm shampla

Íomhá Foinse: I dtreo Eolaíocht Sonraí

Na Bloic Thógála do Mhúnlaí Móra Teanga a Thuiscint (LLManna)

Chun inniúlachtaí agus feidhmiú LLManna a thuiscint go hiomlán, tá sé tábhachtach eolas a chur orainn féin ar roinnt príomhchoincheapa. Ina measc seo tá:

Leabú Focal

Tagraíonn sé seo don chleachtas focail a aistriú go formáid uimhriúil ar féidir le samhlacha AI a léirmhíniú. Go bunúsach, is é neadú focal teanga an AI. Léirítear gach focal mar veicteoir ardtoiseach a chuimsíonn a bhrí shéimeantach bunaithe ar a chomhthéacs sna sonraí oiliúna. Ligeann na veicteoirí seo don AI caidrimh agus cosúlachtaí idir focail a thuiscint, ag cur le tuiscint agus feidhmíocht an mhúnla.

Meicníochtaí Aird

Cuidíonn na comhpháirteanna sofaisticiúla seo leis an tsamhail AI tosaíocht a thabhairt d’eilimintí áirithe laistigh den téacs ionchuir thar cinn eile agus aschur á ghiniúint. Mar shampla, in abairt atá lán de dhearcthaí éagsúla, d’fhéadfadh meicníocht aird níos mó a thabhairt do na focail a bhfuil mothúcháin acu. Cuireann an straitéis seo ar chumas an AI freagairtí níos cruinne agus níos nuance a chruthú.

Claochladáin

Léiríonn claochladáin ardchineál ailtireachta líonra néaraigh a úsáidtear go forleathan i dtaighde LLM. Is é an rud a chuireann claochladáin óna chéile ná a meicníocht féin-aire. Ligeann an mheicníocht seo don mhúnla gach cuid de na sonraí ionchuir a mheá agus a mheas go comhuaineach, seachas in ord seicheamhach. Is é an toradh atá air ná feabhas ar láimhseáil spleáchais fadraoin sa téacs, dúshlán coitianta i dtascanna próiseála teanga nádúrtha.

Tiúnadh Mín

Ní mór fiú na LLManna is airde chun cinn a oiriúnú chun barr feabhais a chur ar thascanna nó réimsí sonracha. Seo an áit a dtagann mionchoigeartú isteach. Tar éis do mhúnla a bheith oilte i dtosach ar thacar sonraí mór, is féidir é a scagadh tuilleadh, nó ‘mionchoigeartú’ a dhéanamh ar thacar sonraí níos lú agus níos sainiúla. Ligeann an próiseas seo don mhúnla a chumais ghinearálta tuisceana teanga a chur in oiriúint do thasc nó do chomhthéacs níos speisialaithe.

Innealtóireacht Pras

Feidhmíonn leideanna ionchuir mar phointe tosaigh do LLManna chun aschuir a ghiniúint. Má dhéantar na leideanna seo go héifeachtach, cleachtas ar a dtugtar innealtóireacht phras, is féidir tionchar mór a imirt ar cháilíocht fhreagraí an mhúnla. Is meascán d’ealaín agus den eolaíocht é a éilíonn tuiscint ghéar ar an gcaoi a léirmhíníonn an tsamhail leideanna agus a ghineann freagraí.

Laofacht

De réir mar a fhoghlaimíonn LLManna ó na sonraí a bhfuil siad oilte orthu, féadfaidh aon chlaonadh sna sonraí seo iompar an mhúnla a shreabhadh. D’fhéadfadh sé seo a léiriú mar chlaonadh idirdhealaitheach nó éagórach in aschuir na samhla. Is dúshlán suntasach i réimse an AI é aghaidh a thabhairt ar na laofachtaí sin agus iad a mhaolú agus is gné ríthábhachtach é d’fhorbairt LLManna atá slán go heiticiúil.

Léirmhíniú

Mar gheall ar chastacht LLManna, is féidir a bheith dúshlánach a thuiscint cén fáth a ndéanann siad cinntí áirithe nó go ngineann siad aschuir shonracha. Is príomhréimse taighde leanúnach é an tréith seo, ar a dtugtar inléirmhíniú. Ní hamháin go gcabhraíonn feabhsú inléirmhínithe le fabhtcheartú agus le mionchoigeartú samhlacha, ach treisíonn sé muinín agus trédhearcacht i gcórais AI freisin.

Conas a chuirtear oiliúint ar mhúnlaí LLM?

Is éacht iontach é múnlaí móra teanga (LLManna) a oiliúint a bhfuil roinnt céimeanna ríthábhachtacha i gceist leis. Seo achoimre céim ar chéim simplithe ar an bpróiseas:

Conas a chuirtear oiliúint ar mhúnlaí llm?

  1. Sonraí Téacs a Bhailiú: Tosaíonn oiliúint LLM le bailiú méid ollmhór sonraí téacs. Is féidir leis na sonraí seo teacht ó leabhair, láithreáin ghréasáin, ailt, nó ardáin meáin shóisialta. Is é an aidhm atá ann ná éagsúlacht shaibhir teanga an duine a ghabháil.
  2. Ag Glanadh na Sonraí: Déantar na sonraí téacs amh a ghlanadh ansin i bpróiseas ar a dtugtar réamhphróiseáil. Áiríonn sé seo tascanna mar charachtair nach dteastaíonn a bhaint, an téacs a bhriseadh síos ina chodanna níos lú ar a dtugtar comharthaí, agus é a chur i bhformáid ar féidir leis an tsamhail oibriú léi.
  3. Scoilteadh na Sonraí: Ansin, roinntear na sonraí glan ina dhá shraith. Bainfear úsáid as tacar amháin, na sonraí oiliúna, chun an tsamhail a oiliúint. Úsáidfear an tacar eile, na sonraí bailíochtaithe, níos déanaí chun feidhmíocht an mhúnla a thástáil.
  4. Socrú an tSamhail: Sainmhínítear ansin struchtúr an LLM, ar a dtugtar an ailtireacht. Is éard atá i gceist leis seo an cineál líonra néarúil a roghnú agus cinneadh a dhéanamh ar pharaiméadair éagsúla, mar shampla líon na sraitheanna agus na n-aonad i bhfolach laistigh den líonra.
  5. Traenáil an tSamhail: Tosaíonn an oiliúint iarbhír anois. Foghlaimíonn an tsamhail LLM trí bhreathnú ar na sonraí oiliúna, tuar a dhéanamh bunaithe ar an méid a d'fhoghlaim sé go dtí seo, agus ansin a paraiméadair inmheánacha a choigeartú chun an difríocht idir a thuar agus na sonraí iarbhír a laghdú.
  6. Seiceáil an tSamhail: Déantar foghlaim na samhla LLM a sheiceáil ag baint úsáide as na sonraí bailíochtaithe. Cuidíonn sé seo le feiceáil cé chomh maith agus atá an tsamhail ag feidhmiú agus chun socruithe an mhúnla a athrú le haghaidh feidhmíochta níos fearr.
  7. Ag baint úsáide as an Múnla: Tar éis oiliúna agus meastóireachta, tá an tsamhail LLM réidh le húsáid. Is féidir é a chomhtháthú anois le feidhmchláir nó córais áit a nginfidh sé téacs bunaithe ar ionchuir nua a thugtar dó.
  8. An Múnla a Fheabhsú: Ar deireadh, tá deis ann i gcónaí feabhas a chur ar. Is féidir an tsamhail LLM a bheachtú tuilleadh le himeacht ama, trí úsáid a bhaint as sonraí nuashonraithe nó trí shocruithe a choigeartú bunaithe ar aiseolas agus ar úsáid an fhíorshaoil.

Cuimhnigh, éilíonn an próiseas seo acmhainní ríomhaireachta suntasacha, mar aonaid phróiseála chumhachtacha agus stóráil mhór, chomh maith le heolas speisialaithe i bhfoghlaim meaisín. Sin an fáth a ndéanann eagraíochtaí taighde tiomnaithe nó cuideachtaí a bhfuil rochtain acu ar an mbonneagar agus an saineolas riachtanach é de ghnáth.

An Bhraith an LLM ar Fhoghlaim faoi Mhaoirseacht nó ar Fhoghlaim gan Mhaoirseacht?

Is gnách go gcuirtear oiliúint ar mhúnlaí móra teanga ag baint úsáide as modh ar a dtugtar foghlaim faoi mhaoirseacht. I dtéarmaí simplí, ciallaíonn sé seo go bhfoghlaimíonn siad ó shamplaí a thaispeánann na freagraí cearta dóibh.

An mbraitheann LLM ar fhoghlaim faoi mhaoirseacht nó ar fhoghlaim gan mhaoirseacht? Samhlaigh go bhfuil tú ag múineadh focail do pháiste trí phictiúir a thaispeáint dóibh. Taispeánann tú pictiúr de chait dóibh agus "cat," a rá agus foghlaimíonn siad conas an pictiúr sin a nascadh leis an bhfocal. Sin mar a oibríonn foghlaim faoi mhaoirseacht. Tugtar go leor téacs don mhúnla (na “pictiúir”) agus na haschuir chomhfhreagracha (na “focail”), agus foghlaimíonn sé iad a mheaitseáil.

Mar sin, má chothaíonn tú abairt LLM, déanann sé iarracht an chéad fhocal nó frása eile a thuar bunaithe ar a bhfuil foghlamtha aige ó na samplaí. Ar an mbealach seo, foghlaimíonn sé conas téacs a ghiniúint a bhfuil ciall leis agus a oireann don chomhthéacs.

É sin ráite, uaireanta úsáideann LLM beagán foghlama gan mhaoirseacht. Tá sé seo cosúil le ligean don leanbh seomra lán de bhréagáin éagsúla a iniúchadh agus foghlaim mar gheall orthu ina n-aonar. Féachann an tsamhail ar shonraí neamhlipéadaithe, patrúin foghlama, agus struchtúir gan na freagraí “ceart” a insint.

Úsáideann foghlaim faoi mhaoirseacht sonraí atá lipéadaithe le hionchuir agus aschuir, i gcodarsnacht le foghlaim gan mhaoirseacht, nach n-úsáideann sonraí aschuir lipéadaithe.

Go hachomair, cuirtear oiliúint ar LLManna go príomha trí úsáid a bhaint as foghlaim faoi mhaoirseacht, ach is féidir leo foghlaim gan mhaoirseacht a úsáid freisin chun a gcumas a fheabhsú, mar anailís taiscéalaíoch agus laghdú toise.

Cad é an Toirt Sonraí (In GB) Riachtanach Chun Mórshamhail Teanga a Thraenáil?

Tá saol na bhféidearthachtaí maidir le haithint sonraí cainte agus feidhmchláir ghutha ollmhór, agus tá siad á n-úsáid i dtionscail éagsúla le haghaidh raidhse feidhmchlár.

Ní próiseas amháin a oireann do chách é samhail mhór teanga a oiliúint, go háirithe nuair a bhaineann sé leis na sonraí a theastaíonn. Braitheann sé ar a lán rudaí:

  • An dearadh múnla.
  • Cén post a chaithfidh sé a dhéanamh?
  • An cineál sonraí atá in úsáid agat.
  • Cé chomh maith agus atá tú ag iarraidh go bhfeidhmeoidh sé?

É sin ráite, teastaíonn méid ollmhór sonraí téacs de ghnáth chun LLManna a oiliúint. Ach cé chomh ollmhór atáimid ag caint faoi? Bhuel, smaoinigh níos faide ná ghigibheart (GB). De ghnáth táimid ag féachaint ar terabytes (TB) nó fiú petabytes (PB) sonraí.

Smaoinigh ar GPT-3, ceann de na LLManna is mó timpeall. Tá sé oilte ar 570 GB de shonraí téacs. D'fhéadfadh go mbeadh níos lú ag teastáil ó LLManna níos lú - b'fhéidir 10-20 GB nó fiú 1 GB de ghigibheart - ach tá sé fós go leor.

Foinse

Ach nach bhfuil sé ach faoi mhéid na sonraí. Baineann cáilíocht freisin. Caithfidh na sonraí a bheith glan agus éagsúil le cuidiú leis an tsamhail foghlaim go héifeachtach. Agus ní féidir leat dearmad a dhéanamh ar phríomhphíosaí eile den bhfreagra, cosúil leis an gcumhacht ríomhaireachta atá uait, na halgartaim a úsáideann tú le haghaidh oiliúna, agus an socrú crua-earraí atá agat. Tá ról mór ag na fachtóirí seo go léir in oiliúint LLM.

Méadú ar Mhúnlaí Móra Teanga: An Fáth a bhfuil Tábhacht leo

Ní coincheap nó turgnamh amháin atá i LLManna a thuilleadh. Tá ról ríthábhachtach acu ag éirí níos tábhachtaí inár dtírdhreach digiteach. Ach cén fáth go bhfuil sé seo ag tarlú? Cad a dhéanann na LLManna seo chomh tábhachtach sin? Déanaimis iniúchadh ar roinnt príomhfhachtóirí.

Ardú llm: cén fáth a bhfuil tábhacht leo?

  1. Máistreacht i dtéacs an Duine a aithris

    Tá an chaoi a láimhseáilimid tascanna teanga-bhunaithe athraithe ó bhonn ag LLManna. Tógtha ag baint úsáide as halgartaim meaisínfhoghlama láidre, tá na samhlacha seo feistithe leis an gcumas chun nuances na teanga daonna a thuiscint, lena n-áirítear comhthéacs, mothúcháin, agus fiú searbhas, go pointe áirithe. Ní rud nua é an cumas seo chun aithris a dhéanamh ar theanga dhaonna, tá impleachtaí suntasacha aige.

    Is féidir le hardchumas giniúna téacs LLM gach rud a fheabhsú ó chruthú ábhair go hidirghníomhaíochtaí seirbhíse custaiméara.

    Samhlaigh go mbeifeá in ann ceist chasta a chur ar chúntóir digiteach agus freagra a fháil ní hamháin a bhfuil ciall leis, ach atá comhleanúnach, ábhartha agus seachadta i dton comhrá. Sin a bhfuil LLManna á gcumasú. Tá siad ag cothú idirghníomhaíocht níos iomasach agus níos tarraingtí idir an duine agus an meaisín, ag saibhriú eispéiris úsáideoirí, agus ag daonlathas rochtain ar fhaisnéis.

  2. Cumhacht Ríomhaireachta Inacmhainne

    Ní bheadh ​​méadú ar LLManna indéanta gan forbairtí comhthreomhara i réimse na ríomhaireachta. Go sonrach, bhí ról suntasach ag daonlathú na n-acmhainní ríomhaireachtúla in éabhlóid agus i nglacadh LLManna.

    Tá ardáin scamall-bhunaithe ag tairiscint rochtain gan fasach ar acmhainní ríomhaireachta ardfheidhmíochta. Ar an mbealach seo, is féidir le fiú eagraíochtaí ar scála beag agus taighdeoirí neamhspleácha samhlacha sofaisticiúla foghlama meaisín a oiliúint.

    Ina theannta sin, de bharr feabhsuithe ar aonaid phróiseála (cosúil le GPUanna agus TPUanna), in éineacht leis an méadú ar ríomhaireacht dáilte, tá sé indéanta samhlacha a oiliúint a bhfuil na billiúin paraiméadair acu. Tá an inrochtaineacht mhéadaithe seo ar chumhacht ríomhaireachta ag cumasú fás agus rathúlacht LLManna, rud a fhágann go bhfuil níos mó nuálaíochta agus feidhmiúcháin sa réimse.

  3. Roghanna Tomhaltóra a Aistriú

    Ní hamháin go dteastaíonn freagraí ó thomhaltóirí inniu; teastaíonn idirghníomhaíochtaí tarraingteacha inghaolmhara uathu. De réir mar a fhásann níos mó daoine aníos ag baint úsáide as teicneolaíocht dhigiteach, is léir go bhfuil méadú ag teacht ar an ngá atá le teicneolaíocht a mhothaíonn níos nádúrtha agus níos cosúla le daoine. Tugann LLM deis nach bhfuil aon mhacasamhail ann freastal ar na hionchais seo. Trí théacs atá cosúil le duine a ghiniúint, féadann na samhlacha seo eispéiris dhigiteacha tarraingteacha agus dhinimiciúla a chruthú, rud a d’fhéadfadh sásamh agus dílseacht úsáideoirí a mhéadú. Cibé an bhfuil sé ina chatbots AI a sholáthraíonn seirbhís do chustaiméirí nó cúntóirí gutha a sholáthraíonn nuashonruithe nuachta, tá LLManna ag tabhairt isteach ré AI a thuigeann muid níos fearr.

  4. An Mianach Óir Sonraí Neamhstruchtúrtha

    Is stór léargais iad sonraí neamhstruchtúrtha, amhail ríomhphoist, postálacha meán sóisialta, agus léirmheasanna custaiméirí. Meastar go bhfuil deireadh leis 80% sonraí fiontair neamhstruchtúrtha agus ag fás ag ráta de 55% in aghaidh na bliana. Is mianach óir iad na sonraí seo do ghnólachtaí má dhéantar iad a ghiaráil i gceart.

    Tagann LLManna isteach anseo, agus iad in ann sonraí den sórt sin a phróiseáil agus ciall a bhaint as ar scála. Is féidir leo tascanna cosúil le hanailís sentiment, aicmiú téacs, eastóscadh faisnéise, agus go leor eile a láimhseáil, rud a thugann léargas luachmhar.

    Cibé an bhfuil sé ag aithint treochtaí ó phoist ar na meáin shóisialta nó ag tomhas meon na gcustaiméirí ó athbhreithnithe, tá LLManna ag cabhrú le gnólachtaí an méid mór sonraí neamhstruchtúrtha a threorú agus cinntí a dhéanamh atá bunaithe ar shonraí.

  5. An Margadh NLP atá ag méadú

    Léirítear acmhainn LLManna sa mhargadh atá ag fás go tapa do phróiseáil teanga nádúrtha (NLP). Tionscadal anailísithe an margadh NLP a leathnú ó $11 billiún in 2020 go dtí os cionn $35 billiún faoi 2026. Ach ní hé méid an mhargaidh amháin atá ag méadú. Tá na samhlacha féin ag fás freisin, i méid fisiceach agus i líon na bparaiméadar a láimhseálann siad. Léiríonn éabhlóid LLManna thar na blianta, mar atá le feiceáil san fhigiúr thíos (foinse íomhá: nasc), a gcastacht agus a n-acmhainn mhéadaitheach.

Cásanna Úsáide Coitianta de Mhúnlaí Móra Teanga

Seo cuid de na cásanna úsáide is airde agus is forleithne de LLM:

Cásanna úsáide coitianta de mhúnlaí móra teanga

  1. Téacs Teanga Nádúrtha a Ghiniúint: Comhcheanglaíonn Múnlaí Móra Teanga (LLManna) cumhacht na hintleachta saorga agus na ríomhtheangeolaíochta chun téacsanna a tháirgeadh go neamhspleách i dteanga nádúrtha. Is féidir leo freastal ar riachtanais éagsúla úsáideoirí ar nós alt a scríobh, amhráin a chumadh, nó dul i mbun comhráite le húsáideoirí.
  2. Aistriúchán trí Mheaisíní: Is féidir LLManna a úsáid go héifeachtach chun téacs a aistriú idir péire teangacha ar bith. Baineann na samhlacha seo leas as algartaim dhomhainfhoghlama amhail líonraí néaracha athfhillteacha chun struchtúr teangeolaíoch na dteangacha foinse agus na sprioctheanga araon a thuiscint, rud a éascaíonn aistriú an bhuntéacs go dtí an teanga inmhianaithe.
  3. Ábhar Bunaidh a Chruthú: Tá bealaí oscailte ag LLManna do mheaisíní chun ábhar comhtháite agus loighciúil a ghiniúint. Is féidir an t-ábhar seo a úsáid chun postálacha blag, ailt agus cineálacha eile ábhair a chruthú. Baineann na samhlacha leas as a n-eispéireas domhain foghlama chun an t-ábhar a fhormáidiú agus a struchtúrú ar bhealach úrnua agus so-úsáidte.
  4. Mothúcháin a Anailísiú: Feidhm shuimiúil amháin a bhaineann le Múnlaí Móra Teanga is ea anailís dhearcadh. Sa mhéid seo, tá an tsamhail oilte chun staideanna mothúchánacha agus mothúcháin atá sa téacs anótáilte a aithint agus a chatagóiriú. Is féidir leis na bogearraí mothúcháin cosúil le dearfacht, diúltacht, neodracht, agus mothúcháin chasta eile a aithint. Is féidir leis seo léargais luachmhara a sholáthar ar aiseolas ó chustaiméirí agus ar thuairimí ar tháirgí agus ar sheirbhísí éagsúla.
  5. Téacs a Thuiscint, a Achoimriú agus a Rangú: Bunaíonn LLManna struchtúr inmharthana do bhogearraí AI chun an téacs agus a chomhthéacs a léirmhíniú. Trí threoir a thabhairt don mhúnla méideanna ollmhóra sonraí a thuiscint agus a scrúdú, cuireann LLM ar chumas samhlacha AI téacs a thuiscint, a achoimriú agus fiú a chatagóiriú i bhfoirmeacha agus patrúin éagsúla.
  6. Ag Freagairt Ceisteanna: Cuireann Múnlaí Móra Teanga ar chumas na gcóras Freagra Ceist (QA) fiosrúchán teanga nádúrtha úsáideora a bhrath go cruinn agus freagairt dó. I measc na samplaí coitianta den chás úsáide seo tá ChatGPT agus BERT, a scrúdaíonn comhthéacs fiosrúcháin agus a scagadh trí bhailiúchán mór téacsanna chun freagraí ábhartha a sholáthar ar cheisteanna úsáideoirí.

Slándáil agus Comhlíonadh a Chomhtháthú i Straitéisí Sonraí LLM

Má dhéantar bearta láidre slándála agus comhlíonta a neadú laistigh de chreataí bailithe agus próiseála sonraí LLM, is féidir leat úsáid thrédhearcach, shábháilte agus eiticiúil na sonraí a chinntiú. Cuimsíonn an cur chuige seo roinnt príomhghníomhartha:

  • Criptiú Láidir a chur i bhfeidhm: Sonraí a chosaint ar scíthe agus ar bhealach faoi bhealach trí úsáid a bhaint as modhanna láidre criptithe. Cosnaíonn an chéim seo faisnéis ó rochtain neamhúdaraithe agus sáruithe.
  • Rialuithe Rochtana agus Fíordheimhniú a bhunú: Córais a chur ar bun chun féiniúlachtaí úsáideoirí a fhíorú agus rochtain ar shonraí a shrianadh. Cinnteoidh sé nach féidir ach le pearsanra údaraithe idirghníomhú le faisnéis íogair.
  • Comhtháthaigh Córais Logála agus Monatóireachta: Córais a imscaradh chun úsáid sonraí a rianú agus chun bagairtí slándála féideartha a aithint. Cuidíonn an mhonatóireacht réamhghníomhach seo le sláine agus sábháilteacht an éiceachórais sonraí a chothabháil.
  • Cloí le Caighdeáin Chomhlíonta: Lean rialacháin ábhartha mar GDPR, HIPAA, agus PCI DSS, a rialaíonn slándáil sonraí agus príobháideacht. Fíoraíonn iniúchtaí agus seiceálacha rialta comhlíonadh, ag cinntiú go gcomhlíonann cleachtais caighdeáin dhlíthiúla agus eiticiúla a bhaineann go sonrach leis an tionscal.
  • Socraigh Treoirlínte um Úsáid Sonraí Eiticiúla: Beartais a fhorbairt agus a fhorfheidhmiú a ordaíonn úsáid chothrom, thrédhearcach agus chuntasach sonraí. Cuidíonn na treoirlínte seo le muinín na bpáirtithe leasmhara a choinneáil agus tacú le timpeallacht shlán oiliúna do LLManna.

Neartaíonn na gníomhartha seo le chéile na cleachtais bhainistíochta sonraí d’oiliúint LLM. Tógann sé dúshraith muiníne agus slándála a théann chun sochair na bpáirtithe leasmhara uile.

Mionchoigeartú ar Shamhail Mhór Theanga

Tá próiseas mionchruinn anótála i gceist le mionchoigeartú a dhéanamh ar mhúnla mór teanga. Is féidir le Shaip, lena shaineolas sa réimse seo, cuidiú go mór leis an iarracht seo. Seo roinnt modhanna nótaí a úsáidtear chun samhlacha ar nós ChatGPT a thraenáil:

Clibeáil chuid cainte (pos).

Clibeáil Pháirt-de-Urlabhra (POS).

Déantar focail in abairtí a chlibeáil lena bhfeidhm ghramadaí, ar nós briathra, ainmfhocail, aidiachtaí, srl. Cabhraíonn an próiseas seo leis an múnla an ghramadach agus na naisc idir focail a thuiscint.

Aitheantas aonáin ainmnithe (ner)

Aitheantas Aonáin Ainmnithe (NER)

Déantar aonáin ainmnithe mar eagraíochtaí, láithreacha, agus daoine laistigh de phianbhreith a mharcáil. Cabhraíonn an ceacht seo leis an múnla brí shéimeantach focail agus frásaí a léirmhíniú agus soláthraíonn sé freagraí níos beaichte.

Anailís sentiment

Anailís ar Thuairimí

Sanntar lipéid mhothúcháin ar shonraí téacs amhail dearfach, neodrach nó diúltach, rud a chuidíonn leis an tsamhail tuiscint a fháil ar bhuntuiscint mhothúchánach na n-abairtí. Tá sé an-úsáideach chun ceisteanna a fhreagairt a bhaineann le mothúcháin agus tuairimí.

Taifeach croíchomhdhála

Taifeach na Croítheachta

Cásanna ina ndéantar tagairt don eintiteas céanna i gcodanna éagsúla de théacs a shainaithint agus a réiteach. Cuidíonn an chéim seo leis an tsamhail comhthéacs na habairte a thuiscint, rud a thugann freagraí comhleanúnacha.

Aicmiú téacs

Aicmiú Téacs

Déantar sonraí téacs a chatagóiriú i ngrúpaí réamhshainithe amhail léirmheasanna ar tháirgí nó ailt nuachta. Cabhraíonn sé seo leis an múnla seánra nó topaic an téacs a aithint, ag cruthú freagraí níos ábhartha.

Cruth in ann sonraí oiliúna a bhailiú trí shreabhadh gréasáin ó earnálacha éagsúla cosúil le baincéireacht, árachas, miondíol agus teileachumarsáid. Is féidir linn nóta téacs a sholáthar (NER, anailís sentiment, etc.), LLM ilteangach (aistriúchán) a éascú, agus cabhrú le cruthú tacsanomaíochta, asbhaint/innealtóireacht phras.

Tá stór fairsing de thacair shonraí lasmuigh den tseilf ag Shaip. Bródúil as ár gcatalóg sonraí leighis bailiúchán leathan de shonraí dí-aitheanta, slán, agus ar ardchaighdeán atá oiriúnach do thionscnaimh AI, samhlacha meaisínfhoghlama, agus próiseáil teanga nádúrtha.

Mar an gcéanna, is stór sonraí ardcháilíochta é ár gcatalóg sonraí cainte atá foirfe do tháirgí aitheantais gutha, rud a chumasaíonn oiliúint éifeachtach ar shamhlacha AI/ML. Tá catalóg sonraí fís ríomhaireachta mórthaibhseach againn freisin le raon leathan sonraí íomhá agus físe le haghaidh feidhmeanna éagsúla.

Cuirimid fiú tacair shonraí oscailte ar fáil i bhfoirm inathraithe agus áisiúil, saor in aisce, le húsáid i do thionscadail AI agus ML. Cuireann an leabharlann ollmhór sonraí AI seo ar do chumas do mhúnlaí AI agus ML a fhorbairt ar bhealach níos éifeachtaí agus níos cruinne.

Próiseas Bailiú Sonraí agus Anótála Shaip

Nuair a bhaineann sé le bailiú sonraí agus anótáil, Cruth leanann sreabhadh oibre sruthlínithe. Seo an chuma atá ar an bpróiseas bailithe sonraí:

Suímh Ghréasáin Foinse a Aithint

Ar dtús, déantar suíomhanna gréasáin a shainaithint ag baint úsáide as foinsí roghnaithe agus eochairfhocail a bhaineann leis na sonraí a theastaíonn.

Scrapáil Gréasáin

Nuair a shainaithnítear na láithreáin ghréasáin ábhartha, úsáideann Shaip a uirlis dílseánaigh chun sonraí a scrapeadh ó na suíomhanna seo.

Réamhphróiseáil Téacs

Déantar próiseáil tosaigh ar na sonraí a bhailítear, lena n-áirítear scoilteadh agus parsáil abairtí, rud a fhágann go bhfuil siad oiriúnach do chéimeanna breise.

Anótáil

Tá na sonraí réamhphróiseáilte anótáilte le haghaidh Eastóscadh Aonán Ainmnithe. Baineann an próiseas seo le gnéithe tábhachtacha den téacs a aithint agus a lipéadú, amhail ainmneacha daoine, eagraíochtaí, láithreacha, etc.

Sliocht Gaol

Sa chéim dheiridh, déantar na cineálacha caidrimh idir na heintitis aitheanta a chinneadh agus a anótáil dá réir. Cuidíonn sé seo le tuiscint a fháil ar na naisc shéimeantacha idir comhpháirteanna éagsúla an téacs.

Tairiscint Shaip

Cruth cuireann sé raon leathan seirbhísí ar fáil chun cabhrú le heagraíochtaí a gcuid sonraí a bhainistiú, a anailísiú agus an leas is fearr a bhaint as.

Scríobadh Gréasáin Sonraí

Príomhsheirbhís amháin a thairgeann Shaip ná scrapáil sonraí. Is éard atá i gceist leis seo ná sonraí a bhaint as URLanna a bhaineann go sonrach le fearann. Trí úsáid a bhaint as uirlisí agus teicnící uathoibrithe, is féidir le Shaip méideanna móra sonraí a scríobadh go tapa agus go héifeachtach ó láithreáin ghréasáin éagsúla, Lámhleabhair Táirge, Doiciméadúchán Teicniúil, fóraim ar líne, Léirmheasanna Ar Líne, Sonraí Seirbhíse do Chustaiméirí, Doiciméid Rialála Tionscail srl. Is féidir leis an bpróiseas seo a bheith thar a bheith luachmhar do ghnólachtaí nuair a sonraí ábhartha agus sonracha a bhailiú ó iliomad foinsí.

Scríobadh gréasáin sonraí

Aistriúchán Meaisín

Samhlacha a fhorbairt ag baint úsáide as tacair sonraí fairsinge ilteangacha péireáilte le tras-scríbhinní comhfhreagracha chun téacs a aistriú thar theangacha éagsúla. Cuidíonn an próiseas seo le constaicí teanga a bhaint de agus cuireann sé inrochtaineacht faisnéise chun cinn.

Aistriúchán meaisín

Eastóscadh & Cruthú Tacsanomaíochta

Is féidir le Shaip cuidiú le heastóscadh agus cruthú tacsanomaíochta. Is éard atá i gceist leis seo ná sonraí a rangú agus a chatagóiriú i bhformáid struchtúrtha a léiríonn na gaolmhaireachtaí idir pointí sonraí éagsúla. D’fhéadfadh sé seo a bheith úsáideach go háirithe do ghnólachtaí agus a gcuid sonraí á n-eagrú, é a dhéanamh níos inrochtana agus níos éasca anailís a dhéanamh orthu. Mar shampla, i ngnó ríomhthráchtála, d’fhéadfaí sonraí táirge a chatagóiriú bunaithe ar chineál an táirge, ar bhranda, ar phraghas, etc., rud a d’fhágfadh go mbeadh sé níos éasca do chustaiméirí an chatalóg táirgí a nascleanúint.

Eastóscadh & cruthú tacsanomaíochta

Bailiú Sonraí

Soláthraíonn ár seirbhísí bailithe sonraí sonraí fíorthábhachtacha nó sintéiseacha atá riachtanach chun halgartaim ghiniúna AI a oiliúint agus chun cruinneas agus éifeachtacht do mhúnlaí a fheabhsú. Tá na sonraí neamhchlaonta, foinsithe go heiticiúil agus go freagrach agus príobháideacht agus slándáil sonraí á gcur san áireamh.

Sonraí a bhailiú

Ceist & Freagra

Is fo-réimse de phróiseáil teanga nádúrtha é Freagairt Ceisteanna (QA) atá dírithe ar cheisteanna a fhreagairt go huathoibríoch i dteanga dhaonna. Cuirtear oiliúint ar chórais QA ar théacs fairsing agus ar chód, rud a chuireann ar a gcumas cineálacha éagsúla ceisteanna a láimhseáil, lena n-áirítear ceisteanna fíorasacha, sainmhínithe agus bunaithe ar thuairimí. Tá eolas fearainn ríthábhachtach chun samhlacha QA a fhorbairt atá oiriúnaithe do réimsí sonracha mar thacaíocht do chustaiméirí, cúram sláinte, nó slabhra soláthair. Mar sin féin, cuireann cineálacha cur chuige giniúna QA ar chumas samhlacha téacs a ghiniúint gan eolas fearainn, ag brath ar chomhthéacs amháin.

Is féidir lenár bhfoireann speisialtóirí staidéar a dhéanamh go cúramach ar dhoiciméid nó lámhleabhair chuimsitheacha chun péirí Ceist-Freagra a ghiniúint, ag éascú cruthú AI Gineadach do ghnólachtaí. Is féidir leis an gcur chuige seo dul i ngleic go héifeachtach le fiosrúcháin úsáideoirí trí fhaisnéis ábhartha a fháil ó chorpas fairsing. Cinntíonn ár saineolaithe deimhnithe go dtáirgtear péirí ceisteanna agus freagraí den scoth a chuimsíonn ábhair agus réimsí éagsúla.

Ceist agus freagairt

Achoimre Téacs

Tá ár speisialtóirí in ann comhráite cuimsitheacha nó idirphlé fada a dhriogadh, ag seachadadh achoimrí gonta agus léargasacha ó shonraí téacs fairsinge.

Achoimriú téacs

Giniúint Téacs

Traenáil múnlaí ag baint úsáide as tacar sonraí leathan téacs i stíleanna éagsúla, amhail ailt nuachta, ficsean agus filíocht. Is féidir leis na samhlacha sin cineálacha éagsúla ábhair a ghiniúint ansin, lena n-áirítear píosaí nuachta, iontrálacha blag, nó poist ar na meáin shóisialta, ag tairiscint réiteach cost-éifeachtach agus am-shábháil ar chruthú ábhar.

Giniúint téacs

Aitheantas Urlabhra

Múnlaí a fhorbairt a bheidh in ann an teanga labhartha a thuiscint d’fheidhmchláir éagsúla. Áirítear leis seo cúntóirí guthghníomhaithe, bogearraí deachtú, agus uirlisí aistriúcháin fíor-ama. Baineann an próiseas úsáid as tacar sonraí cuimsitheach comhdhéanta de thaifeadtaí fuaime den teanga labhartha, in éineacht lena n-athscríbhinní comhfhreagracha.

Aitheantas cainte

Moltaí Táirgí

Samhlacha a fhorbairt ag baint úsáide as tacair shonraí fairsinge de stair cheannaigh na gcustaiméirí, lena n-áirítear lipéid a léiríonn na táirgí a bhfuil fonn ar chustaiméirí iad a cheannach. Is é an sprioc ná moltaí beachta a sholáthar do chustaiméirí, ar an gcaoi sin díolacháin a mhéadú agus sásamh na gcustaiméirí a fheabhsú.

Moltaí táirge

Fotheidealú Íomhá

Déan do phróiseas léirmhínithe íomhá a réabhlóidiú lenár seirbhís ceannteidil íomhá den scoth, faoi stiúir AI. Infuse muid beogacht isteach i bpictiúir trí chur síos cruinn agus brí comhthéacsúla a tháirgeadh. Réitíonn sé seo an bealach le haghaidh rannpháirtíocht nuálaíoch agus féidearthachtaí idirghníomhaíochta le d’inneachar amhairc do do lucht féachana.

Teidealú íomhánna

Seirbhísí Oiliúna Téacs-go-Caint

Soláthraímid tacar sonraí fairsing comhdhéanta de thaifeadtaí fuaime cainte daonna, atá oiriúnach chun samhlacha AI a oiliúint. Tá na samhlacha seo in ann guthanna nádúrtha agus tarraingteach a ghiniúint do d’fheidhmchláir, rud a chuireann eispéireas sainiúil agus tumtha ar fáil do d’úsáideoirí.

Seirbhísí téacs-go-hurlabhra a oiliúint

Tá ár gcatalóg sonraí ilghnéitheach deartha chun freastal ar go leor Cásanna Úsáide Giniteacha AI

Catalóg & Ceadúnú Sonraí Leighis Lasmuigh den Scairbh:

  • Taifid 5M + agus comhaid fuaime lia i 31 speisialtacht
  • 2M + Íomhánna míochaine i raideolaíocht & speisialtachtaí eile (MRIanna, CTanna, USGanna, XRanna)
  • Docaí téacs cliniciúil 30k + le haonáin breisluacha agus anótáil caidrimh
Catalóg & ceadúnú sonraí leighis lasmuigh den tseilf

Catalóg & Ceadúnú Sonraí Urlabhra Lasmuigh den Scairbh:

  • 40k+ uair an chloig de shonraí cainte (50+ teanga/100+ canúint)
  • Clúdaíodh 55+ ábhar
  • Ráta samplála - 8/16/44/48 kHz
  • Cineál fuaime - Focail spontáineacha, scripte, monologue, múscail
  • Tacar sonraí fuaime trascríobh go hiomlán i dteangacha éagsúla le haghaidh comhrá daonna-daonna, daonna-bot, comhrá lárionad glaonna daonna-ghníomhaire, monologues, óráidí, podchraoltaí, etc.
Catalóg & ceadúnú sonraí cainte lasmuigh den tseilf

Catalóg Íomhá agus Físeáin & Ceadúnú:

  • Bailiúchán Íomhánna Bia/ Doiciméad
  • Bailiúchán Físeáin Slándála Baile
  • Cnuasach Íomhá/Físeán Aghaidhe
  • Sonraisc, PO, Bailiú Doiciméad Admhálacha le haghaidh OCR
  • Bailiúchán Íomhánna chun Damáiste Feithicle a Bhrath 
  • Bailiúchán Íomhánna Pláta Ceadúnais Feithicle
  • Bailiúchán Íomhánna Gluaisteán
  • Bailiúchán Íomhánna le Tiománaí Gluaisteán i bhFócas
  • Bailiúchán Íomhánna a bhaineann le faisean
Catalóg agus ceadúnú sonraí íomhánna agus físeáin

Labhraímis

  • Trí chlárú, aontaím le Shaip Beartas Príobháideachais agus Tearmaí Seirbhís agus mo thoiliú a thabhairt chun cumarsáid margaíochta B2B a fháil ó Shaip.

Ceisteanna Coitianta (Ceisteanna Coitianta)

Is fo-réimse de ML é DL a úsáideann líonraí néaracha saorga le sraitheanna iolracha chun patrúin casta i sonraí a fhoghlaim. Is fothacar de AI é ML a dhíríonn ar halgartaim agus samhlacha a chuireann ar chumas meaisíní foghlaim ó shonraí. Is fothacar d’fhoghlaim dhomhain iad múnlaí móra teanga (LLManna) agus roinneann siad talamh comónta le AI giniúna, toisc gur comhpháirteanna iad araon de réimse níos leithne na domhainfhoghlama.

Samhlacha teanga fairsinge agus ilúsáide is ea múnlaí móra teanga, nó LLManna, a réamhthraenáiltear ar dtús ar shonraí téacs fairsinge chun bunghnéithe teanga a thuiscint. Déantar iad a mhionchoigeartú ansin d’fheidhmchláir nó do thascanna sonracha, rud a fhágann gur féidir iad a oiriúnú agus a bharrfheabhsú chun críocha áirithe.

Ar an gcéad dul síos, tá an cumas ag samhlacha móra teanga raon leathan tascanna a láimhseáil mar gheall ar a n-oiliúint fhairsing le méideanna ollmhóra sonraí agus na billiúin paraiméadair.

Ar an dara dul síos, léiríonn na samhlacha seo inoiriúnaitheacht toisc gur féidir iad a mhionchoigeartú le sonraí oiliúna allamuigh sonracha íosta.

Ar deireadh, léirítear feabhas leanúnach ar fheidhmíocht LLManna nuair a ionchorpraítear sonraí agus paraiméadair bhreise, rud a chuireann lena n-éifeachtacht le himeacht ama.

Is éard atá i gceist le dearadh leid ná leid a chruthú atá in oiriúint don tasc sonrach, mar shampla an teanga aschuir inmhianaithe a shonrú i dtasc aistriúcháin. Díríonn innealtóireacht phras, ar an láimh eile, ar fheidhmíocht a bharrfheabhsú trí eolas fearainn a ionchorprú, samplaí aschuir a sholáthar, nó úsáid a bhaint as eochairfhocail éifeachtacha. Is coincheap ginearálta é dearadh pras, agus is cur chuige speisialaithe é innealtóireacht phras. Cé go bhfuil dearadh pras riachtanach do gach córas, bíonn innealtóireacht phras ríthábhachtach do chórais a dteastaíonn ardchruinneas nó ardfheidhmíocht uathu.

Tá trí chineál samhlacha móra teanga ann. Éilíonn gach cineál cur chuige difriúil maidir le cur chun cinn.

  • Déanann samhlacha cineálacha teanga an chéad fhocal eile a thuar bunaithe ar an teanga sna sonraí oiliúna.
  • Cuirtear oiliúint ar mhúnlaí tiúnta le treoracha chun freagairt do na treoracha a thugtar san ionchur a thuar.
  • Cuirtear oiliúint ar mhúnlaí tiúnta le comhphlé chun comhrá cosúil le comhphlé a bheith acu tríd an gcéad fhreagra eile a ghiniúint.