Peintio yn ôl Rhifau: sut i ddeall a defnyddio data yn effeithiol

Gan ganolbwyntio ar ein digwyddiad craffu a llywodraethu sydd i ddod, rydym yn deall bod y broses graffu yn golygu delio â llawer o ddata. Gwnaeth ein sgwrs gyda Suzanne Draper o Uned Data Cymru amlygu cwestiwn allweddol – sut y gallwn gael data i weithio i chi? Yn y blog hwn mae Suzanne yn rhoi rhai awgrymiadau ar sut i ddeall a defnyddio data yn effeithiol.

“Lies, damned lies and statistics”

Mae dyfyniad enwog Benjamin Disraeli yn awgrymu bod amheuon ynghylch pob ystadegyn a data. Ac mae hynny’n wir – y cyfan sydd angen i chi ei wneud yw gwneud yn siŵr eich bod yn gofyn y cwestiynau cywir.

Dyma’n deg 10 prif gwestiwn i’ch helpu i ddeall a defnyddio data yn well:

A yw’r data’n berthnasol?

A yw’r data’n ddibynadwy?

A yw’r diffiniad yn glir?

A yw’r unedau’n glir?

Pa mor gyfredol yw’r data?

Pa mor gadarn yw’r data?

A yw’r cymariaethau’n ddilys?

A yw’r graffigau’n glir?

A yw’r darlun llawn gennych?

A oes unrhyw ffactorau eraill y dylid eu hystyried?

A yw’r data’n berthnasol?

Mae data ym mhob man. Rydym yn cael ein boddi gan ffeithiau a ffigurau yn feunyddiol. Gallant ein llethu, hyd yn oed ein drysu. Sut rydych yn gwybod beth sy’n bwysig?

Y tric yw canolbwyntio ar yr hyn rydych yn ceisio ei gyflawni a gofyn i chi eich hun: a yw’r data hyn yn fy helpu i ddeall mwy am y pwnc? A fydda i’n gallu gwneud penderfyniadau gwell, mwy hyddysg o ganlyniad?

Os na, symudwch ymlaen.

A yw’r data’n ddibynadwy?

Yn yr un modd, gall fod yn anodd gwybod pwy neu beth i’w gredu – a fydd yr eli wyneb yna wir yn lleihau fy rhychau mewn 7 diwrnod yn unig?

Pan fyddwch yn defnyddio data, mae angen i chi allu ymddiried ynddynt. Er mwyn gallu gwneud hyn, mae angen i chi ddeall o ble daw’r data a’r ffordd y cafodd eu llunio.

Mae nifer o sefydliadau credadwy sy’n llunio a chyhoeddi data o ansawdd da, gan gynnwys Uned Data Cymru! Bydd gan bob un o’r sefydliadau hyn ddulliau cadarn o gasglu, dilysu a chyhoeddi data i wneud yn siŵr eu bod mor gywir a dibynadwy â phosibl.

A yw’r diffiniad yn glir?

Yn aml caiff diffiniadau eu symleiddio i wneud y data’n fwy hygyrch. Fodd bynnag, gall hyn fod yn gamarweiniol. Cymerwch, er enghraifft, bennawd a ymddangosodd mewn papur newydd ym Mhrydain yn 2013:

“1,200 killed by mental patients”

Fodd bynnag, os edrychwch yn agosach ar y data sylfaenol, fe welwch fod gan tua hanner y rhai a gyflawnodd y llofruddiaethau a gofnodwyd symptomau salwch meddwl ar adeg y llofruddiaeth, ond nad oeddynt, mewn gwirionedd, yn ‘gleifion iechyd meddwl’. At hynny, nododd yr astudiaeth ei bod yn aneglur p’un ai’r symptomau hyn a arweiniodd at y llofruddiaethau.

Er bod ystumio’r ffeithiau fel arfer yn anfwriadol, gall gael effaith fawr ar y ffordd rydych yn amgyffred y data a’r hyn rydych yn ei wneud â’r data.

A yw’r unedau’n glir?

Cyflwynir data mewn amrywiaeth o fformatau, pob un â’i ddiben ei hun.

Mae niferoedd neu gyfrifiadau yn eich helpu i ddeall swm neu faint rhywbeth e.e. anfonwyd 151,000 tunnell o wastraff i safleoedd tirlenwi yn 2016–17.

Wn i ddim amdanoch chi, ond fyddwn i ddim yn gwybod a yw hyn yn swm mawr neu fach. Felly, defnyddir canrannau a chyfraddau i wneud y data yn fwy ystyrlon a hygyrch:

e.e. anfonwyd 10% o wastraff i safleoedd tirlenwi yn 2016–17
e.e. anfonwyd 0.05 tunnell o wastraff y pen i safleoedd tirlenwi yn 2016–17

Wrth ddefnyddio canrannau, mae’n bwysig deall y data sylfaenol. Er enghraifft, petai dau awdurdod cynllunio lleol yn penderfynu ar 50% o’u ceisiadau cynllunio o fewn 8 wythnos, byddech yn dweud eu bod yn perfformio ar yr un lefel. Fodd bynnag, petaech yn gwybod bod Awdurdod A wedi penderfynu ar 100 o geisiadau (50 o fewn 8 wythnos) a bod Awdurdod B ond wedi penderfynu ar bedwar cais (dau mewn 8 wythnos) a fyddech chi’n dal i ddweud eu bod yn perfformio ar yr un lefel?

Pa mor gyfredol yw’r data?

Mae’n bwysig bod yn glir ynghylch pa gyfnod y mae’r data yn ymwneud ag ef – y mis hwn, y mis diwethaf, eleni, y llynedd?

Mae’r rhan fwyaf o ddata o ansawdd da yn cymryd peth amser i’w llunio. Fel arfer, bydd data blynyddol yn cymryd rhwng 6 a 12 mis i gael eu cyhoeddi, ond gall rhai setiau data mwy gymryd mwy o amser.

Ni ddylid diystyru data am eu bod yn ‘hen’ – mae yna lawer o resymau dilys pam y gallem ddefnyddio data o’r fath. Er enghraifft, efallai na chânt eu casglu’n aml (fel data’r Cyfrifiad) neu efallai mai dyma’r amcangyfrif gorau sydd ar gael.

Pa mor gadarn yw’r data?

Mae gan y rhan fwyaf o ddata elfen o wallau – mae bron yn amhosibl gwarantu bod darn o ddata yn hollol gywir. Fodd bynnag, mae rhai mathau o ddata yn fwy tebygol o fod yn gadarn na mathau eraill, oherwydd y ffordd y cawsant eu casglu. Mae cyfrifiadau ac amcangyfrifon yn debygol o fod yn gadarn iawn. Gall data arolygon fod yn llai cadarn oherwydd maint y samplau a goddrychedd y data.

A yw’r cymariaethau’n ddilys?

Mae cymariaethau’n ddefnyddiol iawn wrth roi data mewn persbectif, ond dim ond os yw’r data’n gymaradwy. Efallai bod hyn yn ymddangos yn amlwg, ond mae’n hawdd iawn gwneud camgymeriad. Mae dau beth allweddol i’w hystyried wrth gymharu data:

A gynhyrchwyd y data gan ddilyn yr un diffiniad? Er enghraifft, a ydych wedi cynnwys ac eithrio’r un pethau, a yw’n cwmpasu’r un cyfnod, ac ati.

A yw’r data wedi cael eu safoni er mwyn ystyried ffactorau eraill a allai ddylanwadu ar wahaniaethau yn y data? Er enghraifft, os oeddech yn cymharu proffiliau oedran staff ar draws sefydliadau byddech yn disgwyl i sefydliad mwy fod â mwy o staff ym mhob dosbarthiad oedran. Ni fyddai cymharu rhifau cyfan felly’n dweud unrhyw beth wrthych nad oeddech yn ei wybod eisoes. Fodd bynnag, os byddech yn cymharu’r canrannau staff ymhob dosbarthiad oedran (ac felly’n cael gwared ag effaith maint y sefydliad) byddech yn fuan iawn yn gweld sut mae eich proffiliau oedran yn cymharu.

Felly, os ydych yn ateb ‘naddo’ neu ‘nac ydynt’, mae’n debygol nad yw’r cymariaethau’n ddilys.

A yw’r graffigau’n glir?

Yn ogystal â’r ystyriaethau uchod, pan fyddwch yn edrych ar y data yn y siartiau neu’r graffiau, mae cwpl o bethau eraill y dylech edrych allan amdanynt:

  • Gwiriwch fod yr echelin yn gywir bob amser – os nad yw’r data’n dechrau o sero, efallai bod hyn yn amharu ar eich safbwynt;
  • Byddwch yn wyliadwrus o siartiau 3D – nid ydynt yn rhoi cynrychiolaeth gywir o’r data;

Dylai graffiglyn fod ag un neges glir. Os na allwch ddod o hyd iddi’n gyflym, peidiwch â gwastraffu’ch amser a dewch o hyd i ffordd arall o edrych ar y data.

A yw’r darlun llawn gennych?

Yn aml, yn enwedig yn y cyfryngau, cewch un ffigur yn unig er mwyn llunio barn.

Ni fyddem yn disgwyl i hyn ddigwydd mewn unrhyw agwedd arall ar ein bywydau. Er enghraifft, fydden ni ddim yn disgwyl i feddyg wneud diagnosis yn seiliedig ar ddarlleniad ein pwysau gwaed yn unig.

Ac yn yr un modd, dylai’r data rydych yn eu defnyddio roi darlun cytbwys i chi – dylent eich galluogi i ateb ‘beth?’ a ‘pham?’.

A oes unrhyw ffactorau eraill y dylid eu hystyried?

Mae’n bwysig gwneud yn siŵr bod gennych yr holl wybodaeth i’ch helpu i ddeall y data. Er enghraifft, a yw’r data wedi’u talgrynnu? A yw peth o’r data wedi’i ‘guddio’ er mwyn gwarchod unigolion? A oes yna unrhyw ddeddfwriaeth genedlaethol (neu leol) yn cael dylanwad uniongyrchol ar y data a’r defnydd ohonynt?

Mae’r rhan fwyaf o sefydliadau’n rhyddhau metadata ochr yn ochr â’u data. Metadata yw “data am ddata” ac fe’u llunir i roi’r holl wybodaeth angenrheidiol i chi am y data rydych yn edrych arnynt, gan gynnwys unrhyw ‘gyfarwyddiadau arbennig’.

Felly, i grynhoi, er mwyn defnyddio data’n effeithiol mae angen i chi ddeall yr hyn rydych yn edrych arno. Os nad ydych yn siŵr, gofynnwch!!

Dewch draw i’n seminar Cyfnewidfa Arfer Da ym mis Ionawr ar rôl craffu mewn perthynas â chenedlaethau’r dyfodol.

Ymateb

Rhowch eich manylion isod neu cliciwch ar eicon i fewngofnodi:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Newid )

Google+ photo

You are commenting using your Google+ account. Log Out /  Newid )

Twitter picture

You are commenting using your Twitter account. Log Out /  Newid )

Facebook photo

You are commenting using your Facebook account. Log Out /  Newid )

Connecting to %s