Data – mae’n fwy na dim ond tablau diflas

Mae Louisa Nolan o’r Campws Gwyddorau Data @DataSciCampus wedi ysgrifennu blog i ni cyn ein gweminar ddata ag enghreifftiau o’r posibiliadau cyffrous sydd ar gael o fathau newydd o ddata ac adnoddau dadansoddi newydd. Ymunwch â ni ar yr 16eg er mwyn dysgu mwy am Pam bod defnyddio data’n effeithiol yn ein galluogi i wneud penderfyniadau gwell.

Mae data’n gyffrous, ac erbyn hyn, gallwn gael gwybodaeth ddiddorol, nid yn unig o dablau o ganlyniadau arolygon neu wybodaeth reoli (er bod y rhain yn dal yn bwysig wrth gwrs) ond hefyd o nifer fawr o ddogfennau, neu o ddelweddau, neu ddarlleniadau synhwyraidd. Mae gwyddor data yn rhoi’r adnoddau i ni ddadansoddi’r mathau hyn o ddata’n gyflym, mewn ffyrdd na fyddai wedi bod yn bosibl ond ychydig flynyddoedd yn ôl. Y cyfuniad hwn o gyfleoedd: mathau newydd o ddata + adnoddau newydd i’w dadansoddi, sydd mor gyffrous, gan ei fod yn rhoi cipolwg newydd sbon i ni!

Fel gwyddonydd data arweiniol yng NGhampws Gwyddorau Data y Swyddfa Ystadegau Gwladol rwy’n cael meddwl am ddata bob dydd (mae hyn yn Beth Da!). Rydym yn datblygu a chyflwyno prosiectau gwyddorau data sy’n mynd i’r afael â chwestiynau anodd i’n cwsmeriaid yn y sector cyhoeddus, rydym yn cynnig cyngor a hyfforddiant ar wyddor data, ac rydym yn cynnal gwaith manwl, hacathonau a gweithdai gyda thimau amlddisgyblaethol er mwyn dod o hyd i ddatrysiadau ar gyfer heriau data.

Yn y blog hwn, hoffwn rannu rhai enghreifftiau o’r ffordd rydym wedi bod yn defnyddio mathau newydd o ddata a’r ffordd rydym wedi bod yn rhoi technegau gwyddorau data ar waith er mwyn mynd i’r afael â heriau na chânt eu bodloni drwy ddulliau gweithredu mwy traddodiadol. Ddewis yn unig yw’r rhain, felly ewch i’n gwefan, dilynwch ni ar Twitter, neu cysylltwch â ni os hoffech drafod sut y gallem eich cefnogi i fabwysiadu neu addasu’r prosiectau hyn, neu os hoffech drafod eich heriau gwyddor data eich hun.

wales on twitter

Am beth y mae pobl yn siarad pan fyddant yn sôn am Gymru ar Twitter? Gofynnwyd y cwestiwn hwn i ni gan Gynulliad Cenedlaethol Cymru, a oedd am ddeall yr hyn a oedd o ddiddordeb i bobl wrth iddynt siarad am Gymru. Gwnaeth ein gwyddonwyr data adeiladu adnodd ar gyfer dadansoddi pynciau o destunau trydariadau sy’n cynnwys #Wales. Mae dadansoddi pynciau yn dechneg sy’n rhoi testunau – yn yr achos hwn Trydariadau – mewn grwpiau o bynciau cysylltiedig. Ar gyfer y cyfnod a ddadansoddwyd gennym, daethom o hyd i bynciau ar dwristiaeth, chwaraeon – gan gynnwys rygbi, wrth gwrs, arddangosfa busnes yng Nghaerdydd, ac, yn annisgwyl i ryw raddau, pwnc ar blant ar y strydoedd yn India! Roedd y pwnc hwn yn ymwneud â’r llyfr ‘A Hundred Hands’, a gyhoeddwyd yr wythnos honno gan Diane Noble, sy’n awdures o Gymru. Gellir addasu’r adnodd yn hawdd er mwyn dadansoddi hashnodau eraill sydd o ddiddordeb.

urban forest

Mapio’r goedwig drefol ar lefel strydoedd Gan ddefnyddio delweddau a samplwyd o Google StreetView, mae’r tîm wedi datblygu dull arbrofol i fapio dwysedd coed a’r llystyfiant bob 10 metr mewn trefi a dinasoedd yng Nghymru a Lloegr – mapio hyper-leol yw hyn! Mae’r tîm wedi creu dull o brosesu a dadansoddi’r delweddau, a allai gael eu defnyddio o bosibl ar gyfer mathau eraill o ddadansoddi delweddau StreetView.

emerging technologies

Dadansoddi’r testun o raglenni patent er mwyn deall technolegau arloesol. Yn y prosiect hwn, cafodd nifer fawr o raglenni patent yr UDA eu dadansoddi, er mwyn ystyried a all technoleg arloesol (h.y. ‘y Peth Poblogaidd Nesaf!’) gael ei nodi o’r testun. Mae hon yn ffordd wych o ddangos sut y gall pŵer gwyddor data ddatgloi data. Bum mlynedd yn ôl hyd yn oed, byddai’n debygol y byddai dogfennau testun fel y rhaglenni patent hyn wedi gorfod cael eu dadansoddi’n llafurus â llaw. Erbyn hyn, gallwn ddadansoddi symiau mawr o destunau yn gyflym er mwyn cael gwybodaeth ddefnyddiol i lywio penderfyniadau.

hierarchical groups

Troi rhestrau di-destun yn grwpiau hierarchaidd.  Weithiau, mae gennym ddisgrifiadau neu restrau di-destun byr – efallai rhestr o gynhyrchion a brynir neu dosberthir. Er mwyn eu defnyddio, mae angen i ni rywsut eu grwpio i mewn i gynhyrchion tebyg, cyfrif am wallau sillafu, gwallau teipio a thalfyriadau gwahanol. Mae hyn yn bosibl â llaw, mewn egwyddor, ond mae fel arfer yn rhy lafurddwys. Mae’r prosiect hwn yn awtomeiddio’r dosbarthiad hierarchaidd. Gan fod y dull yn gystrawennol (sut y caiff y gair ei sillafu) a semantig (yr hyn y mae’r gair yn ei olygu), gallwn grwpio, er enghraifft, wisgi a fodca gyda’i gilydd, a phennu cynhyrchion dur yn gywir, pwt dur, a chynnyrch dur yn yr un categori. Gallai’r adnodd hwn gael ei addasu ar gyfer setiau data amrywiol o ymatebion di-destun.

Gobeithio bod hynny wedi rhoi rhagflas i chi o rai o’r pethau rydym yn gweithio arnynt yn y Campws, ac efallai rhai syniadau o’r hyn y gallwch ei wneud efallai gyda’ch data eich hun. A gobeithio fy mod hefyd wedi eich argyhoeddi nad oes rhaid i ddata fod yn ddiflas!

Leave a Reply