Fís Ríomhaireachta

31 Tacar Sonraí Íomhá Saor in Aisce le haghaidh Fís Ríomhaireachta chun Feabhas a Chur ar Do Thionscadal [Nuashonraithe 2025]

Níl algartam AI ach chomh maith leis na sonraí a chothaíonn tú é.

Ní ráiteas trom ná neamhchoinbhinsiúin é. D’fhéadfadh go mbeadh an chuma ar AI cúpla scór bliain ó shin, ach tá Intleacht Shaorga agus Foghlaim Meaisín tar éis teacht i bhfad ó shin i leith.

Cuidíonn fís ríomhaireachta le ríomhairí lipéid agus íomhánna a thuiscint agus a léirmhíniú. Nuair a dhéanann tú do ríomhaire a oiliúint ag baint úsáide as na cineálacha cearta tacair sonraí íomhánna, is féidir leis an gcumas a fháil gnéithe éagsúla aghaidhe a bhrath, a thuiscint agus a aithint, galair a bhrath, feithiclí uathrialacha a thiomáint, agus beatha a shábháil freisin trí scanadh orgán iltoiseach a úsáid.

Táthar ag tuar go sroichfidh an Margadh Fís Ríomhaireachta $ 144.46 Billiún faoi 2028 ó measartha $ 7.04 billiún i 2020, ag fás ag a CAGR de 45.64% idir 2021 agus 2028.

Tá an tacar sonraí íomhánna atá á bheathú agat agus á oiliúint agat i do thascanna Foghlama Meaisín agus fís ríomhaireachta ríthábhachtach do rath do thionscadail AI. Tá sé deacair tacar sonraí ardchaighdeáin a fháil. Tá sé riachtanach bailiúchán éagsúil íomhánna a úsáid chun oiliúint láidir samhail a chinntiú agus chun castacht an tsaoil réadaigh a léiriú níos fearr.

Ag brath ar chastacht do thionscadail, d’fhéadfadh sé go dtógfadh sé idir cúpla lá agus cúpla seachtain tacair sonraí iontaofa agus ábhartha a fháil chun críocha fís ríomhaireachta. Tá raon éagsúil tacair sonraí riachtanach chun tascanna éagsúla fís ríomhaireachta agus cásanna fíorshaoil ​​a chlúdach. Is minic a lorgaíonn taighdeoirí tacar sonraí substaintiúil chun críocha taighde chun meastóireacht chuimsitheach ar mhúnla a chinntiú agus chun tacú le raon leathan feidhmchlár.

Anseo, cuirimid ar fáil duit raon (catagóirí do do éascaíocht) de thacair sonraí foinse oscailte is féidir leat a úsáid láithreach.

Tascanna Tacar Sonraí Íomhá: Aicmiú, Deighilt, Brath, agus Tuilleadh

Tacar sonraí íomhánna is iad cnámh droma na fís ríomhaireachta nua-aimseartha, ag cumhachtú réimse leathan tascanna a chuireann ar chumas meaisíní faisnéis amhairc a léirmhíniú agus a thuiscint. Cibé an bhfuil tú ag tógáil samhail do fheithiclí uathrialacha, ag forbairt teicneolaíochta aitheantais aghaidhe, nó ag obair ar anailís íomhá leighis, is uirlis riachtanach é an tacar sonraí íomhá ceart le go n-éireoidh leat.

Aicmiú íomhá ceann de na tascanna fís ríomhaireachta is bunúsaí. Sa phróiseas seo, foghlaimíonn samhail lipéad a shannadh d’íomhá iomlán bunaithe ar a hábhar. Mar shampla, d’fhéadfadh tacar sonraí aicmithe íomhá cabhrú le samhail idirdhealú a dhéanamh idir íomhánna de chait agus de mhadraí, nó cineálacha éagsúla plandaí a aithint. Tá an tasc seo ríthábhachtach d’fheidhmchláir cosúil le clibeáil grianghraf uathoibrithe, diagnóis galair ó íomhánna leighis, agus tagarmharcanna catagóirithe radharc.

Brath oibiachtúil Tugann sé seo céim eile chun cinn ní hamháin trí láithreacht réad laistigh d’íomhá a aithint ach freisin trí shuíomhanna na réad a aithint go beacht trí bhoscaí teorann a úsáid. Tá tacair sonraí le haghaidh braite réad, amhail iad siúd ina bhfuil íomhánna anótáilte le boscaí teorann, ríthábhachtach d’fheidhmchláir cosúil le braite coisithe i bhfeithiclí uathrialacha, faireachas slándála, agus anailísíocht mhiondíola. Is cuid lárnach í braite réad freisin i bhforbairt halgartaim fís ríomhaireachta láidre do chásanna fíorshaoil.

Deighilt shéimeantach Baineann sé le gach picteilín in íomhá a aicmiú i gcatagóir shonrach, rud a thugann tuiscint mhionsonraithe ar an radharc. Tá an deighilt trimap seo ar leibhéal picteilín thar a bheith tábhachtach i dtascanna cosúil le híomháú leighis, áit a bhfuil gá le himlíneadh beacht orgán nó meall, agus i dtimpeallachtaí uirbeacha le haghaidh tiomána uathrialach, áit a bhfuil sé ríthábhachtach idirdhealú a dhéanamh idir bóithre, cosáin agus feithiclí.

Thar na príomhchúraimí seo, tacaíonn tacair sonraí íomhánna le deighilt samplaí (idirdhealú a dhéanamh idir réada aonair den rang céanna), fotheidealú íomhánna (téacs tuairisciúil a ghiniúint d’íomhánna), agus aitheantas aghaidhe (aghaidheanna daonna a aithint nó a fhíorú in íomhánna). Braitheann gach ceann de na tascanna fís ríomhaireachta seo ar íomhánna ardchaighdeáin, anótáilte chun samhlacha foghlama meaisín a oiliúint agus a bhailíochtú.

Trí leas a bhaint as tacair sonraí íomhá éagsúla agus dea-anótáilte, is féidir le heolaithe sonraí agus cleachtóirí foghlama meaisín dul i ngleic le réimse dúshlán fís ríomhaireachta, ó thascanna aitheantais agus aicmithe íomhá go fadhbanna casta deighilte agus braite. Ní hamháin go luasghéaraíonn an tacar sonraí ceart taighde agus forbairt ach cinntíonn sé freisin go bhfeidhmíonn córais fís ríomhaireachta go cruinn in iarratais sa saol réadúil.

Liosta Cuimsitheach de Thacair Sonraí Íomhánna chun do Shamhail Físe Ríomhaireachta a Thraenáil

Ginearálta:

  1. IMAGEnet

    Is tacar sonraí a úsáidtear go forleathan é ImageNet, agus tagann sé le 1.2 milliún íomhá iontach atá catagóirithe i 1000 catagóir. Eagraítear an tacar sonraí seo de réir ordlathas WorldNet agus déantar é a chatagóiriú i dtrí chuid – na sonraí oiliúna, lipéid íomhá, agus sonraí bailíochtaithe.

  2. Cinéitic 700

    Is tacar sonraí ollmhór ardchaighdeáin é Cinéitic 700 le níos mó ná 650,000 gearrthóg de 700 rang gníomhaíochta daonna éagsúla. Tá thart ar 700 gearrthóg físe i ngach ceann de na gníomhartha ranga. Tá idirghníomhaíochtaí daonna-réad agus daonna-daonna ag na gearrthóga sa tacar sonraí, rud a bhíonn cabhrach go leor agus gníomhartha daonna á n-aithint i bhfíseáin.

  3. CIFAR-10

    Tá CIFAR 10 ar cheann de na tacair sonraí fís ríomhaire is mó ina bhfuil 60000 íomhá daite 32 x 32 a léiríonn deich rang éagsúla. Tá thart ar 6000 íomhá ag gach rang a úsáidtear chun halgartaim fís ríomhaire agus foghlaim meaisín a oiliúint.

  4. Tacar Sonraí Íomhánna Peataí Oxford-IIIT

    Cuimsíonn tacar sonraí na n-íomhánna peataí 37 catagóir le 200 íomhá in aghaidh an ranga. Athraíonn na híomhánna seo ó thaobh scála, staidiúir agus soilsithe de, agus tá nótaí ag gabháil leo maidir le pórú, ceann ROI, agus deighilt trimap leibhéal picteilín.

  5. Íomhánna Oscailte Google

    Le líon mórthaibhseach 9 milliún URL, tá sé seo ar cheann de na tacair sonraí íomhá is mó ar an liosta, ina bhfuil na milliúin íomhánna lipéadaithe thar 6,000 catagóir.

  6. Íomhánna Plandaí

    Áiríonn an tiomsú seo tacair sonraí ilíomhánna ina bhfuil 1 mhilliún íomhá plandaí mórthaibhseach, a chlúdaíonn thart ar 11 speiceas.

  7. LSUN

    Is tacar sonraí íomhá ar scála mór é LSUN ina bhfuil na milliúin íomhánna lipéadaithe i gcatagóirí éagsúla radhairc agus réad. Cuimsíonn an tacar sonraí tacar tástála tiomnaithe le haghaidh meastóireachta samhail.

Aitheantas Aghaidhe:

aitheantas facial

  1. Aghaidheanna Lipéadaithe san Fhiáin

    Is tacar sonraí ollmhór é Labeled Faced in the Wild ina bhfuil níos mó ná 13,230 íomhá de bheagnach 5,750 duine a braitheadh ​​ón idirlíon. Tá an tacar sonraí aghaidheanna seo deartha le go mbeidh sé níos éasca staidéar a dhéanamh ar bhrath aghaidheanna gan srian.

  2. Aghaidh Gréasáin CASIA

    Is tacar sonraí dea-dheartha é CASIA Webface a chuidíonn le foghlaim meaisín agus le taighde eolaíoch ar aithint aghaidhe gan srian. Le níos mó ná 494,000 íomhá de bheagnach 10,000 fíorfhéiniúlacht, tá sé iontach do thascanna aitheantais agus fíoraithe aghaidhe.

  3. Tacar Sonraí UMD Faces

    Tá tacar sonraí dea-anótáilte os comhair UMD ina bhfuil dhá chuid – íomhánna fós agus frámaí físeáin. Tá níos mó ná 367,800 nóta aghaidhe sa tacar sonraí agus 3.7 milliún fráma físeáin anótáilte d’ábhair.

  4. Brath Masc Aghaidh

    Áiríonn an tacar sonraí seo 853 íomhá atá catagóirithe i dtrí rang: “le masc,” “gan masc,” agus “masc caite go mícheart,” mar aon lena mboscaí teorann i bhformáid PASCAL VOC.

  5. FERET

    Is tacar sonraí cuimsitheach íomhá é FERET (Bunachar Sonraí Teicneolaíochta Aitheantais Aghaidhe) ina bhfuil os cionn 14,000 íomhá anótáilte d’aghaidheanna daonna.

Aitheantas Lámhscríbhneoireachta:

  1. Bunachar Sonraí MNIST

    Is bunachar sonraí é MNIST ina bhfuil samplaí d’uimhreacha lámhscríofa ó 0 go 9, agus tá 60,000 agus 10,000 íomhá oiliúna agus tástála ann. Arna eisiúint i 1999, déanann MNIST córais phróiseála íomhánna a thástáil i Deep Learning.

  2. Tacar Sonraí Carachtair Saorga

    Carachtair Saorga Sonraí is ea Tacar Sonraí, mar a thugann an t-ainm le fios, a ghintear go saorga a chuireann síos ar struchtúr an Bhéarla i ndeich gceannlitreacha. Tagann sé le níos mó ná 6000 íomhánna.

Brath Réada:

  1. MS COCO

    Is tacar sonraí braite agus fotheidealaithe oibiachta é MS COCO nó Common Objects in Context.

    Tá níos mó ná 328,000 íomhá ann le braite eochairphointí, braite il-réada, fotheidealú, agus nótaí maisc deighilte. Tagann sé le 80 catagóir réad agus cúig fhotheideal in aghaidh an íomhá.

  2. LSUN

    Tá níos mó ná milliún íomhá lipéadaithe ag LSUN, gearr do Thuiscint Radharc ar Mhórscála, i 20 catagóir réad agus 10 gcinn de radharcanna. Tá gar do 300,000 íomhá i gcatagóirí áirithe, le 300 íomhá go sonrach le haghaidh bailíochtaithe agus 1000 íomhá le haghaidh sonraí tástála.

  3. Réada Baile

    Cuimsíonn tacar sonraí Home Objects íomhánna anótáilte de rudaí randamacha timpeall an tí – an chistin, an seomra suí agus an seomra folctha. Tá cúpla físeán anótáilte agus 398 grianghraf gan nótaí deartha le haghaidh tástála sa tacar sonraí seo freisin.

  4. Géanóma Amhairc

    Is bunachar eolais amhairc cuimsitheach é Visual Genome ina bhfuil breis is 108,000 íomhá le fotheidil. Soláthraíonn sé nótaí fairsinge do réada, tréithe agus caidrimh, rud a fhágann go bhfuil sé luachmhar le haghaidh aitheantas réad, fotheidil íomhá agus tascanna foghlama ilmhódacha.

Feithicleach:

  1. Tacar sonraí cathairdhreacha

    Is é Cityscape an tacar sonraí le dul chuige agus seichimh éagsúla físeáin á lorg a thaifeadtar ó radharcanna sráide roinnt lua. Gabhadh na híomhánna seo ar feadh i bhfad agus i ndálaí éagsúla aimsire agus solais. Tá na nótaí le haghaidh 30 rang íomhánna roinnte in ocht gcatagóir éagsúla.

  2. Tiomáint dhomhain Barkley

    Tá Barkley DeepDrive deartha go sonrach le haghaidh oiliúna feithicle uathrialaitheach, agus tá níos mó ná 100 míle seicheamh físeáin anótáilte aige. Tá sé ar cheann de na sonraí oiliúna is cabhrach d’fheithiclí uathrialacha de bharr na gcoinníollacha bóthair agus tiomána atá ag athrú.

  3. Mapilary

    Tá os cionn 750 milliún radharc sráide agus comharthaí tráchta ag Mapillary ar fud an domhain, rud atá an-úsáideach chun samhlacha braistintí amhairc a oiliúint in halgartaim meaisín-fhoghlaim agus AI. Ligeann sé duit feithiclí uathrialacha a fhorbairt a fhreastalaíonn ar soilsiú agus coinníollacha aimsire agus radharcanna éagsúla.

Íomháú Leighis:

  1. Tacar Sonraí Taighde Oscailte Covid-19

    Tá thart ar 6500 deighleog scamhóg picteilín-pholagánach faoi x-ghathanna cliabhraigh AP/PA sa bhunthacar sonraí seo. Ina theannta sin, tá 517 íomhá de x-ghathanna othar Covid-19 ar a bhfuil clibeanna ar a bhfuil an t-ainm, an suíomh, sonraí iontrála, toradh agus go leor eile ar fáil.

  2. Bunachar Sonraí NIH de 100,000 X-ghathanna cliabhraigh

    Tá bunachar sonraí NIH ar cheann de na tacair sonraí is fairsinge atá ar fáil go poiblí ina bhfuil 100,000 íomhá x-ghathanna cliabhraigh agus sonraí gaolmhara atá úsáideach don phobal eolaíoch agus taighde. Tá sé fiú íomhánna na n-othar a bhfuil coinníollacha scamhóg chun cinn.

  3. Atlas na Paiteolaíochta Digiteach

    Cuireann Atlas of Digital Pathology roinnt íomhánna paiste histeapaiteolaíochta ar fáil, níos mó ná 17,000 san iomlán, ó gar do 100 sleamhnán anótáilte d’orgáin éagsúla. Tá an tacar sonraí seo úsáideach chun bogearraí ríomhaireachta fís agus aithint patrún a fhorbairt.

Aitheantas Radharc:

Aitheantas radhairc

  1. Aitheantas Radharc faoi Dhíon

    Is tacar sonraí ardchatagóirithe é Aithint Radharc Laistigh ina bhfuil beagnach 15620 íomhá de réada agus radharcra laistigh le húsáid i meaisínfhoghlaim agus oiliúint sonraí. Tagann sé le níos mó ná 65 catagóir, agus tá ar a laghad 100 íomhá ag gach catagóir.

  2. xAmharc

    Mar cheann de na tacair shonraí is cáiliúla atá ar fáil go poiblí, tá tonna d’íomhánna lastuas anótáilte ó radhairc chasta agus mhóra éagsúla in xView. Agus thart ar 60 rang agus níos mó ná milliún cás oibiachta ann, is é cuspóir an tacair sonraí seo faoiseamh tubaiste níos fearr a sholáthar ag baint úsáide as íomháineachas satailíte.

  3. Áiteanna

    Tá os cionn 1.8 milliún íomhá ó 365 chatagóir radharc éagsúil ag Places, tacar sonraí a chuir MIT leis. Tá thart ar 50 íomhá i ngach ceann de na catagóirí seo le haghaidh bailíochtaithe agus 900 íomhá le tástáil. Is féidir gnéithe domhain radhairc a fhoghlaim chun aithint radharc nó tascanna aitheantais amhairc a bhunú.

  4. Bunachar Sonraí SUN

    Is tagarmharc cuimsitheach catagóirithe radharcanna é bunachar sonraí SUN a úsáidtear go forleathan i bhfís ríomhaireachta. Tá na mílte íomhá ann a chlúdaíonn raon leathan timpeallachtaí laistigh agus lasmuigh, le hanótálacha mionsonraithe do gach radharc. Aithnítear bunachar sonraí SUN as a chlúdach ar radhairc éagsúla agus feidhmíonn sé mar thagairt chaighdeánach chun halgartaim tuisceana radharcanna a mheas.

Siamsaíocht:

  1. Tacar Sonraí IMDB WIKI

    IMDB - Tá Wiki ar cheann de na bunachair shonraí poiblí is mó éileamh d’aghaidheanna atá lipéadaithe go cuí le haois, inscne agus ainmneacha. Tá thart ar 20 míle aghaidh daoine cáiliúla aige freisin agus 62 míle ó Vicipéid.

  2. Aghaidheanna Celeb

    Is bunachar sonraí mórscála é Celeb Faces ina bhfuil 200,000 íomhá anótáilte de dhaoine cáiliúla. Tagann na híomhánna le torann cúlra agus cruthaíonn siad éagsúlachtaí, rud a fhágann go bhfuil siad luachmhar le haghaidh tacair tástála oiliúna i dtascanna fís ríomhaire. Tá sé an-tairbheach cruinneas níos airde a bhaint amach in aithint aghaidhe, eagarthóireacht, logánú páirteanna aghaidhe, agus go leor eile.

  3. Tacar Sonraí YouTube-8M

    Is tacar sonraí físe lipéadaithe ar scála mór é YouTube-8M ina bhfuil na milliúin aitheantóirí físe YouTube le hanótálacha meaisín-ghinte ardchaighdeáin d’eintitis amhairc. Úsáidtear an tacar sonraí seo go forleathan chun halgartaim físe a thuiscint agus a oiliúint ar scála mór, toisc go nascann sé ábhar físe le meiteashonraí trí aitheantóirí físe YouTube, rud a chuireann ar chumas bailiú agus anótáil inscálaithe sonraí físe.

Anois go bhfuil liosta ollmhór tacair sonraí íomhá foinse oscailte agat chun breosla a chur ar d’innealra intleachta saorga. Braitheann toradh do mhúnlaí AI agus foghlama meaisín go príomha ar cháilíocht na dtacar sonraí a bheathaíonn tú agus a thraenálann tú iad orthu. Más mian leat go dtáirgfidh do mhúnla AI tuartha cruinne, teastaíonn tacair sonraí ardchaighdeáin uaidh atá comhiomlánaithe, clibeáilte agus lipéadaithe go foirfe. Is bealach iontach é oibriú leis na tacair sonraí seo chun do scileanna foghlama meaisín a fhorbairt agus a fheabhsú trí thionscadail phraiticiúla, fíorshaoil. Chun rath do chórais fís ríomhaireachta a mhéadú, ní mór duit bunachair sonraí íomhá ardchaighdeáin a úsáid a bhaineann le fís do thionscadail.

Ar bhain tú taitneamh as an alt seo? Lean Shaip ar LinkedIn le haghaidh tuilleadh nuashonruithe.

Comhroinn Shóisialta