Bailiú Sonraí Do AI Comhrá

Conas Cur Chuige a Bhailiú Sonraí le haghaidh AI Comhrá

Sa lá atá inniu ann, tá roinnt robots cainte againn mar chatbots, cúntóirí fíorúla, agus níos mó inár dtithe, córais ghluaisteáin, gairis iniompartha, réitigh uathoibrithe tí, srl. Éisteann na gairis seo go beacht leis an méid a deirimid agus mar a deirimid agus a bhfaighimid torthaí nó a dhéanann tascanna ar leith .

And if you’ve been using an assistant like Siri or Alexa, you would also realize that they are becoming quirkier by the day. Their responses are witty, they talk back, they snub, give back compliments and behave more human-like than some of the colleagues you may know. We’re not joking. De réir PwC, Ní raibh a fhios ag 27% de na húsáideoirí a rinne idirghníomhú lena gcomhlach seirbhíse do chustaiméirí le déanaí an raibh siad ag caint le duine nó le chatbot.

Tá sé an-chasta agus scanrúil na córais agus na feistí comhrá casta sin a fhorbairt. Is cluiche liathróide difriúil é ar fad le cineálacha cur chuige forbartha ar leith. Sin an fáth gur cheapamar gur cheart dúinn é a bhriseadh síos duitse chun go mbeadh tuiscint níos éasca air. Mar sin, má tá tú ag iarraidh inneall comhrá AI nó cúntóir fíorúil a fhorbairt, cuideoidh an treoir seo leat soiléireacht a fháil.

Suntasacht AI Comhrá

De réir mar a éiríonn an teicneolaíocht ina gné níos iomláine dár saol i bhfoirm gairis agus córais níos nuaí, tá gá le bacainní a bhrú, coinbhinsiúin a bhriseadh agus teacht ar bhealaí nua chun idirghníomhú leo. Ó úsáid a bhaint as forimeallach ceangailte cosúil le luch agus méarchlár, chuamar go dtí ceapa luiche a thug níos mó áisiúlachta. Ansin d’aistríomar go scáileáin tadhaill a thug áisiúlacht bhreise maidir le hionchuir a bheathú agus tascanna a dhéanamh.

Agus gléasanna ag síneadh linn féin, táimid ag díghlasáil meán nua ceannais trí ghuth. Ní gá dúinn fiú a bheith in aice le feiste chun í a oibriú. Níl le déanamh againn ach ár guth a úsáid chun é a dhíghlasáil agus ár n-ionchur a ordú. Ó sheomra in aice láimhe, agus é ag tiomáint, agus feiste eile á úsáid ag an am céanna, déanann AI comhrá na cúraimí atá beartaithe againn gan uaim. Mar sin cá dtosóimid - tosaíonn sé ar fad le sonraí cainte ar ardchaighdeán chun samhlacha ML a oiliúint.

Na Buneilimintí a Bhaineann le Sonraí Oiliúna Urlabhra a Bhailiú

Collecting and annotating AI training data for conversational AI is very different. There are tons of intricacies involved in human commands and diverse measures have to be implemented to ensure every aspect is accommodated for impactful results. Let’s look at what some of the fundamentals of speech data are.

Tuiscint Teanga Nádúrtha (NLU)

Le go mbeidh chatbots agus cúntóirí fíorúla in ann an méid a théacsóimid nó a ordaímid a thuiscint agus freagairt dó, próiseas ar a dtugtar NLU is implemented. It stands for Tuiscint Teanga Nádúrtha and involves three tech concepts to interpret and process diverse input types.

  • Intinn

    Tosaíonn sé ar fad le hintinn. Cad atá úsáideoir áirithe ag iarraidh a chur in iúl, cumarsáid a dhéanamh nó a bhaint amach trí ordú? An bhfuil an t-úsáideoir ag lorg faisnéise? An bhfuil siad ag fanacht le nuashonruithe ar chaingean? An bhfuil treoir á ordú acu don chóras a fhorghníomhú? Conas atá siad i gceannas air? An trí cheist nó trí iarraidh é? Cuidíonn na gnéithe seo go léir le meaisíní rún agus cuspóirí a thuiscint agus a rangú chun teacht ar fhreagairtí aerdhíonacha faoi seach.

  • Bailiúchán Utterance

    Tá difríocht idir an t-ordú, "Cá bhfuil an BAT is gaire?" agus an t-ordú, "Faigh BAT in aice láimhe dom." Anois admhódh daoine go gciallaíonn an dá rud an rud céanna ach caithfear meaisíní a mhíniú leis an difríocht seo. Tá siad mar an gcéanna ó thaobh intinne de ach tá an chaoi ar cumadh an rún go hiomlán difriúil.

    Is éard atá i gceist le bailiú fóntais ná sainráite agus frásaí éagsúla a shainiú agus a mhapáil i dtreo spriocanna ar leith chun tascanna agus freagraí a chur i gcrích go beacht. Go teicniúil, oibríonn speisialtóirí anótála sonraí ar shonraí cainte nó sonraí téacs chun cabhrú le meaisíní idirdhealú a dhéanamh air seo.

  • Eastóscadh Aonáin

    Tá focail nó frásaí ar leith i ngach abairt a bhfuil béim ualaithe orthu agus is í an bhéim seo as a dtagann léirmhíniú ar chomhthéacs agus ar chuspóir. Ní mór meaisíní, cosúil leis na córais dochta atá iontu, a thabhairt do aonáin den sórt sin le spúnóg. Mar shampla, "Cá bhfaighidh mé teaghráin ó mo ghiotár in aice le 6th Avenue?"

    Má dhéanann tú an abairt a bheachtú, má aimsítear gur eintiteas a haon í, is teaghráin dhá, is é an giotár trí agus is é an 6ú ascaill 4. Déanann meaisíní na haonáin seo a chur le chéile chun torthaí oiriúnacha a aisghabháil agus chun go dtarlóidh sé seo, oibríonn saineolaithe ag an deireadh seachtaine.

Infographic: The State of Conversational AI.

Agallamh a Dhearadh Do AI Comhrá

Den chuid is mó ba é aidhm AI iompar an duine a mhacasamhlú trí ghothaí, ghníomhartha agus fhreagairtí. Tá an cumas dúchasach ag intinn chomhfhiosach an duine comhthéacs, rún, ton, mothúcháin agus fachtóirí eile a thuiscint agus freagairt dá réir. Ach conas is féidir le meaisíní na gnéithe seo a dhifreáil? 

Agallaimh a dhearadh do comhrá AI an-chasta agus níos tábhachtaí fós, dodhéanta go leor samhail uilíoch a rolladh amach. Tá bealach difriúil ag gach duine smaoineamh, labhairt agus freagairt. Fiú amháin i bhfreagraí, cuirimid uile ár gcuid smaointe in iúl go uathúil. Mar sin, caithfidh meaisíní éisteacht agus freagairt dá réir. 

However, this is not smooth as well. When humans talk, factors like accents, pronunciation, ethnicity, language, and more come in and it is not easy for machines to misunderstand and misinterpret words and respond back. A particular word can be understood by machines in a myriad of ways when dictated by an Indian, a British, an American, and a Mexican. There are tons of language barriers that come into play and the most practical way to come up with a response system is through visual programming that is flowchart-based. 

Through dedicated blocks for gestures, responses, and triggers, authors and experts can help machines develop a character. This is more like an algorithm machine can use to come up with the right responses. When an input is fed, the information flows through corresponding factors, leading to the right response for machines to deliver. 

Diailigh D don Éagsúlacht

Mar a luadh muid, tá idirghníomhaíochtaí daonna an-uathúil. Tagann daoine ar fud an domhain ó réimsí éagsúla den saol, cúlraí, náisiúntachtaí, déimeagrafaic, eitneachas, haicinn, fuaimniú, fuaimniú agus go leor eile. 

Le go mbeidh bot comhrá nó córas inoibrithe go huilíoch, caithfear é a oiliúint le sonraí oiliúna chomh héagsúil agus is féidir. Mar shampla, mura ndearnadh oiliúint ar mhúnla ach le sonraí cainte teanga nó eitneachais áirithe, chuirfeadh accent nua mearbhall ar an gcóras agus chuirfeadh sé iallach air torthaí míchearta a sholáthar. Ní cúis náire é seo d’úinéirí gnó ach maslach d’úsáideoirí freisin. 

Sin an fáth gur cheart go mbeadh sonraí oiliúna AI ó líon saibhir tacar sonraí éagsúil comhdhéanta de dhaoine ó gach cúlra féideartha i gceist le céim na forbartha. Dá mhéad accent agus eitneachas a thuigeann do chóras, is amhlaidh is uilíoch a bheadh ​​sé. Thairis sin, is é an rud a chuirfeadh as d’úsáideoirí níos mó ná aisghabháil faisnéise go mícheart ach mainneachtain a n-ionchur a thuiscint ar an gcéad dul síos. 

Ba cheart go mbeadh sé mar phríomhthosaíocht claontacht a dhíchur agus bealach amháin a bhféadfadh cuideachtaí é seo a dhéanamh ná sonraí sluafhoinsithe a roghnú. Nuair a dhéanann tú do chuid sonraí cainte nó sonraí téacs a sluafhoinsiú, tugann tú deis do dhaoine ó gach cearn den domhan cur le do chuid riachtanas, rud a fhágann nach bhfuil do chomhthiomsú sonraí ach folláin (Léigh ár blog tuiscint a fháil ar na buntáistí agus na deacrachtaí a bhaineann le foinsiú allamuigh sonraí d’oibrithe crowdsource). Anois, tuigfidh do mhúnla variant agus fuaimniú éagsúil agus freagróidh sé dá réir. 

An Bealach Chun Cinn

Developing conversational AI is as difficult as raising an infant. The only difference is that the infant would eventually grow to understand things and get better at communicating autonomously. It’s the machines that need to be consistently pushed. There are several challenges in this space currently and we should acknowledge the fact that we have some of the most revolutionary conversational AI systems stemming out despite these challenges. Let’s wait and see what the future holds for our friendly neighborhood chatbots and virtual assistants. Meanwhile, if you intend to get conversational AI like Google Home developed for your business, reach out to us for your AI training data and annotation needs.

Comhroinn Shóisialta

Comhroinn ar facebook
Comhroinn ar twitter
Comhroinn ar Nasctha
Comhroinn ar ríomhphost
Comhroinn ar whatsapp