Fís Ríomhaireachta

22+ Thacar Sonraí Foinse Oscailte is Mó Iarrtha le haghaidh Fís Ríomhaireachta

Níl algartam AI ach chomh maith leis na sonraí a chothaíonn tú é.

Ní ráiteas trom ná neamhchoinbhinsiúin é. D’fhéadfadh go mbeadh an chuma ar AI cúpla scór bliain ó shin, ach tá Intleacht Shaorga agus Foghlaim Meaisín tar éis teacht i bhfad ó shin i leith.

Fís ríomhaireachta cabhraíonn sé le ríomhairí lipéid agus íomhánna a thuiscint agus a léirmhíniú. Nuair a chuireann tú oiliúint ar do ríomhaire ag baint úsáide as an gcineál ceart íomhánna, féadann sé an cumas a fháil chun gnéithe éagsúla aghaidhe a bhrath, a thuiscint agus a aithint, galair a bhrath, feithiclí uathrialaitheacha a thiomáint, agus beathaí a shábháil ag baint úsáide as scanadh orgán iltoiseach.

Táthar ag tuar go sroichfidh an Margadh Fís Ríomhaireachta $ Billiún $ 144.46 faoi ​​2028 ó $7.04 billiún measartha in 2020, ag fás ag CAGR de 45.64% idir 2021 agus 2028.

Seo cuid de na cásanna úsáide a bhaineann le fís ríomhaire:

  • Íomháú leighis
  • Feithicil uathrialach
  • Aitheantas aghaidhe agus oibiachta
  • Sainaithint lochta
  • Brath radhairc

An tacar sonraí íomhá tá tú ag beathú agus ag traenáil do chuid foghlama Meaisín agus tá tascanna fís ríomhaireachta ríthábhachtach chun go n-éireoidh le do thionscadal AI. Is deacair tacar sonraí cáilíochta a fháil. Ag brath ar chastacht do thionscadal, d’fhéadfadh sé idir cúpla lá agus cúpla seachtain a ghlacadh chun tacair shonraí iontaofa agus ábhartha a fháil chun críocha fís ríomhaire.

Anseo, cuirimid raon de thacair shonraí foinse oscailte ar fáil duit (arna chatagóiriú ar mhaithe leat) is féidir leat a úsáid láithreach.

Liosta Cuimsitheach de Thacair Sonraí Físe Ríomhaireachta

Ginearálta:

  1. IMAGEnet (Nasc)

    Is tacar sonraí a úsáidtear go forleathan é ImageNet, agus tagann sé le 1.2 milliún íomhá iontach atá catagóirithe i 1000 catagóir. Eagraítear an tacar sonraí seo de réir ordlathas WorldNet agus déantar é a chatagóiriú i dtrí chuid – na sonraí oiliúna, lipéid íomhá, agus sonraí bailíochtaithe.

  2. Cinéitic 700 (Nasc)

    Is tacar sonraí ollmhór ardchaighdeáin é Cinéitic 700 le níos mó ná 650,000 gearrthóg de 700 rang gníomhaíochta daonna éagsúla. Tá thart ar 700 gearrthóg físe i ngach ceann de na gníomhartha ranga. Tá idirghníomhaíochtaí daonna-réad agus daonna-daonna ag na gearrthóga sa tacar sonraí, rud a bhíonn cabhrach go leor agus gníomhartha daonna á n-aithint i bhfíseáin.

  3. CIFAR-10 (Nasc)

    Tá CIFAR 10 ar cheann de na tacair sonraí fís ríomhaire is mó ina bhfuil 60000 íomhá daite 32 x 32 a léiríonn deich rang éagsúla. Tá thart ar 6000 íomhá ag gach rang a úsáidtear chun halgartaim fís ríomhaire agus foghlaim meaisín a oiliúint.

Aitheantas Aghaidhe:

Aitheantas facial

  1. Aghaidheanna Lipéadaithe san Fhiáin (Nasc)

    Is tacar sonraí ollmhór é Labeled Faced in the Wild ina bhfuil níos mó ná 13,230 íomhá de bheagnach 5,750 duine a braitheadh ​​ón idirlíon. Tá an tacar sonraí aghaidheanna seo deartha le go mbeidh sé níos éasca staidéar a dhéanamh ar bhrath aghaidheanna gan srian.

  2. Aghaidh Gréasáin CASIA (Nasc)

    Is tacar sonraí dea-dheartha é CASIA Webface a chuidíonn le foghlaim meaisín agus le taighde eolaíoch ar aithint aghaidhe gan srian. Le níos mó ná 494,000 íomhá de bheagnach 10,000 fíorfhéiniúlacht, tá sé iontach do thascanna aitheantais agus fíoraithe aghaidhe.

  3. Tacar Sonraí UMD Faces (Nasc)

    Tá tacar sonraí dea-anótáilte os comhair UMD ina bhfuil dhá chuid – íomhánna fós agus frámaí físeáin. Tá níos mó ná 367,800 nóta aghaidhe sa tacar sonraí agus 3.7 milliún fráma físeáin anótáilte d’ábhair.

Aitheantas Lámhscríbhneoireachta:

  1. Bunachar Sonraí MNIST (Nasc)

    Is bunachar sonraí é MNIST ina bhfuil samplaí d’uimhreacha lámhscríofa ó 0 go 9, agus tá 60,000 agus 10,000 íomhá oiliúna agus tástála ann. Arna eisiúint i 1999, déanann MNIST córais phróiseála íomhánna a thástáil i Deep Learning.

  2. Tacar Sonraí Carachtair Saorga (Nasc)

    Carachtair Saorga Sonraí is ea Tacar Sonraí, mar a thugann an t-ainm le fios, a ghintear go saorga a chuireann síos ar struchtúr an Bhéarla i ndeich gceannlitreacha. Tagann sé le níos mó ná 6000 íomhánna.

Déanaimis plé ar do riachtanas Sonraí Oiliúna AI inniu.

Brath Réada:

  1. MS COCO (Nasc)

    Is tacar sonraí braite agus fotheidealaithe oibiachta é MS COCO nó Common Objects in Context.

    Tá níos mó ná 328,000 íomhá ann le braite eochairphointí, braite il-réada, fotheidealú, agus nótaí maisc deighilte. Tagann sé le 80 catagóir réad agus cúig fhotheideal in aghaidh an íomhá.

  2. LSUN(Nasc)

    Tá níos mó ná milliún íomhá lipéadaithe ag LSUN, gearr do Thuiscint Radharc ar Mhórscála, i 20 catagóir réad agus 10 gcinn de radharcanna. Tá gar do 300,000 íomhá i gcatagóirí áirithe, le 300 íomhá go sonrach le haghaidh bailíochtaithe agus 1000 íomhá le haghaidh sonraí tástála.

  3. Réada Baile(Nasc)

    Cuimsíonn tacar sonraí Home Objects íomhánna anótáilte de rudaí randamacha timpeall an tí – an chistin, an seomra suí agus an seomra folctha. Tá cúpla físeán anótáilte agus 398 grianghraf gan nótaí deartha le haghaidh tástála sa tacar sonraí seo freisin.

Feithicleach:

  1. Tacar sonraí cathairdhreacha (Nasc)

    Is é Cityscape an tacar sonraí le dul chuige agus seichimh éagsúla físeáin á lorg a thaifeadtar ó radharcanna sráide roinnt lua. Gabhadh na híomhánna seo ar feadh i bhfad agus i ndálaí éagsúla aimsire agus solais. Tá na nótaí le haghaidh 30 rang íomhánna roinnte in ocht gcatagóir éagsúla.

  2. Tiomáint dhomhain Barkley (Nasc)

    Tá Barkley DeepDrive deartha go sonrach le haghaidh oiliúna feithicle uathrialaitheach, agus tá níos mó ná 100 míle seicheamh físeáin anótáilte aige. Tá sé ar cheann de na sonraí oiliúna is cabhrach d’fheithiclí uathrialacha de bharr na gcoinníollacha bóthair agus tiomána atá ag athrú.

  3. Mapilary (Nasc)

    Tá os cionn 750 milliún radharc sráide agus comharthaí tráchta ag Mapillary ar fud an domhain, rud atá an-úsáideach chun samhlacha braistintí amhairc a oiliúint in halgartaim meaisín-fhoghlaim agus AI. Ligeann sé duit feithiclí uathrialacha a fhorbairt a fhreastalaíonn ar soilsiú agus coinníollacha aimsire agus radharcanna éagsúla.

Íomháú Leighis:

  1. Tacar Sonraí Taighde Oscailte Covid-19 (Nasc)

    Tá thart ar 6500 deighleog scamhóg picteilín-pholagánach faoi x-ghathanna cliabhraigh AP/PA sa bhunthacar sonraí seo. Ina theannta sin, tá 517 íomhá de x-ghathanna othar Covid-19 ar a bhfuil clibeanna ar a bhfuil an t-ainm, an suíomh, sonraí iontrála, toradh agus go leor eile ar fáil.

  2. Bunachar Sonraí NIH de 100,000 X-ghathanna cliabhraigh (Nasc)

    Tá bunachar sonraí NIH ar cheann de na tacair sonraí is fairsinge atá ar fáil go poiblí ina bhfuil 100,000 íomhá x-ghathanna cliabhraigh agus sonraí gaolmhara atá úsáideach don phobal eolaíoch agus taighde. Tá sé fiú íomhánna na n-othar a bhfuil coinníollacha scamhóg chun cinn.

  3. Atlas na Paiteolaíochta Digiteach (Nasc)

    Cuireann Atlas of Digital Pathology roinnt íomhánna paiste histeapaiteolaíochta ar fáil, níos mó ná 17,000 san iomlán, ó gar do 100 sleamhnán anótáilte d’orgáin éagsúla. Tá an tacar sonraí seo úsáideach chun bogearraí ríomhaireachta fís agus aithint patrún a fhorbairt.

Aitheantas Radharc:

Aitheantas Radharc

  1. Aitheantas Radharc faoi Dhíon (Nasc)

    Is tacar sonraí ardchatagóirithe é Aithint Radharc Laistigh ina bhfuil beagnach 15620 íomhá de réada agus radharcra laistigh le húsáid i meaisínfhoghlaim agus oiliúint sonraí. Tagann sé le níos mó ná 65 catagóir, agus tá ar a laghad 100 íomhá ag gach catagóir.

  2. xAmharc (Nasc)

    Mar cheann de na tacair shonraí is cáiliúla atá ar fáil go poiblí, tá tonna d’íomhánna lastuas anótáilte ó radhairc chasta agus mhóra éagsúla in xView. Agus thart ar 60 rang agus níos mó ná milliún cás oibiachta ann, is é cuspóir an tacair sonraí seo faoiseamh tubaiste níos fearr a sholáthar ag baint úsáide as íomháineachas satailíte.

  3. Áiteanna (Nasc)

    Tá os cionn 1.8 milliún íomhá ó 365 chatagóir radharc éagsúil ag Places, tacar sonraí a chuir MIT leis. Tá thart ar 50 íomhá i ngach ceann de na catagóirí seo le haghaidh bailíochtaithe agus 900 íomhá le tástáil. Is féidir gnéithe domhain radhairc a fhoghlaim chun aithint radharc nó tascanna aitheantais amhairc a bhunú.

Siamsaíocht:

  1. Tacar Sonraí IMDB WIKI (Nasc)

    IMDB - Tá Wiki ar cheann de na bunachair shonraí poiblí is mó éileamh d’aghaidheanna atá lipéadaithe go cuí le haois, inscne agus ainmneacha. Tá thart ar 20 míle aghaidh daoine cáiliúla aige freisin agus 62 míle ó Vicipéid.

  2. Aghaidheanna Celeb (Nasc)

    Is bunachar sonraí mórscála é Celeb Faces ina bhfuil 200,000 íomhá anótáilte de dhaoine cáiliúla. Tagann na híomhánna le torann cúlra agus cruthaíonn siad éagsúlachtaí, rud a fhágann go bhfuil siad luachmhar le haghaidh tacair tástála oiliúna i dtascanna fís ríomhaire. Tá sé an-tairbheach cruinneas níos airde a bhaint amach in aithint aghaidhe, eagarthóireacht, logánú páirteanna aghaidhe, agus go leor eile.

Anois go bhfuil liosta ollmhór de thacair shonraí foinse oscailte agat chun d’innealra hintleachta saorga a spreagadh. Braitheann toradh do mhúnlaí AI agus meaisínfhoghlama go príomha ar cháilíocht na dtacar sonraí a mbíonn tú ag beathú agus ag cur oiliúna orthu. Más mian leat do mhúnla AI chun tuartha cruinne a chaitheamh, beidh tacair shonraí ardchaighdeáin de dhíth air atá comhiomlánaithe, clibáilte agus lipéadaithe chun foirfeachta. Chun rath an chórais fís ríomhaire a mhéadú, ní mór duit bunachair shonraí ardchaighdeáin íomhá a úsáid a bhaineann le fís do thionscadail. Má tá tuilleadh tacair shonraí dá leithéid á lorg agat Cliceáil anseo

Comhroinn Shóisialta

Bealtaine tú like Chomh maith leis sin