Rhagfarn ac annhegwch mewn algorithmau

Mae Joy Buolamwini yn ‘fardd cod’ sydd wedi ymchwilio rhagfarn ac annhegwch mewn algorithmau.

Meddalwedd sydd fod adnabod gwynebau ar gamera ond yn methu adnabod gwynebau croenddu yw’r enghraifft cyntaf yn ei araith yma.

Engrheifftiau eraill mewn lluniau: fe drwsiwyd FaceApp er mwyn cael gwared â phroblem o ‘algorithm hiliol’. Roedd angen i Google ymddiheuro am fod eu system wedi tagio dau berson groenddu fel gorilas.

Yn ôl Buolamwini, ‘y person sy’n cael creu’r system yn cael mewnosod ei barn/farn‘.

Dw i’n dychmygu y bydd y problemau yn cynyddu tra bod rhagor o systemau dysgu peirianyddol yn cael eu defnyddio, yn enwedig os mae’r systemau wedi cael ei hyfforddi gyda setiau cyfyngedig o ddata.

Mae’n debyg y byddan ni’n gweld achosion o bobl yn methu cael yswiriant, swyddi a chyfleoedd eraill oherwydd penderfyniadau gan beiriannau. Wrth gwrs fydd hi ddim wastad yn amlwg i’r person sydd yn dioddef. Er enghraifft byddai rhywun yn clywed bod e/hi heb lwyddo i ennill cyfweliad am swydd ond fydd hi ddim yn amlwg bod system wedi dehongi ei CV neu ddata bersonol mewn ffordd ragfarnllyd.

Mae Buolamwini wedi cael sawl profiad personol o ragfarn mewn algorithmau ers blynyddoedd ac wedi ysgrifennu eithaf tipyn o erthyglau am hyn. Yn ogystal mae hi’n cyfeirio at lyfr o’r enw Weapons of Math Destruction gan Cathy O’Neil.

Mae’r gwaith wedi arwain at fudiad o’r enw Algorithmic Justice League a sefydlwyd gan Buolamwini eleni er mwyn casglu rhagor o achosion ac ymgyrchu dros degwch mewn algorithmau.

Dw i wrthi’n ceisio deall yr union ddiffiniad o ‘ragfarn mewn algorithmau’.

Fe ges i gyfarfod gyda swyddogion Google yn Llundain sbêl yn ôl i drafod eu polisïau nhw o ran y Gymraeg, nid yn unig mewn rhyngwynebau ond diffygion sy’n gallu cael eu hystyried fel rhai algorithmig megis statws y Gymraeg ar ganlyniadau chwilio ac o bosib y broses o adeiladu’r mynegai.

Ydy hyn yn berthnasol i’r sgwrs am ragfarn mewn algorithmau? Mae Rhodri ap Dyfrig wedi sôn am hyn.

Yn y bôn ‘dydy cefnogi’r Gymraeg yn iawn ddim yn werth chweil yn fasnachol i ni’ oedd ymateb Google. Mae hi’n bwysig nad ydyn ni’n ildio i’r syniad bod angen i ni greu rhagor o gynnwys Cymraeg er mwyn cyrraedd radar Google a chwmnïau eraill. Er enghraifft mae creu rhagor o erthyglau Wicipedia ac ati yn Gymraeg yn beth da yn ei hun. Mae Google wedi gwneud digon o arian yng Nghymru eisoes ac wedi mwynhau ffafr llywodraeth San Steffan ac awdurdodau eraill mewn sawl ffordd. Dylen ni hefyd cydnabod bod unrhyw ‘feini prawf’ o’r fath megis nifer o erthyglau Wicipedia neu beth bynnag yn hollol, hollol fympwyol.

Beth am feddalwedd yr iPhone (a systemau eraill) sy’n mynnu ‘cywiro’ eich geiriau oherwydd diffyg geiriaduron Cymraeg? Mae sôn hefyd am yr ‘exclusion overhead’, yr ymdrech mae’n rhaid i ddefnyddwyr wneud er mwyn cael meddalwedd i weithio’n iawn tra bod ‘na diffygion dal yn y system.

Pa wers y mae plant yn dysgu bob tro mae bysellfwrdd neu brosesydd geiriau yn newid y gair ‘i’ ac yn mewnosod ‘I’ yn lle yn awtomatig, er enghraifft?

Beth am fformiwla ffrwd Facebook? Pa mor effeithiol ydy systemau fel hyn gyda chynnwys Cymraeg, geiriau Cymraeg, treigladau? Mae hi’n anodd dadansoddi hyn.

Efallai bod yr Echo ac Alexa yn berthnasol yma er bod cwmni Amazon wedi dweud yn blwmp ac yn blaen bod y peiriant ond yn deall dwy iaith, Almaeneg a Saesneg!

Fyddwn i ddim yn synnu pa tasai pobl yn canfod sawl achos o ragfarn ieithyddol mewn algorithmau o fewn sawl gwasanaeth, ‘rhagfarn’ sy’n gweithio yn erbyn ieithoedd lleiafrifedig o gwmpas y byd.

Gadewch wybod yn y sylwadau os ydych chi’n ymwybodol o unrhyw rai.

Pwy sy’n rheoli’r cyfryngau yn y 21ain ganrif?

Yn ôl y sôn mae ymgyrchwyr yn Iran yn siomi gyda newidiadau i Google Reader (ac mae Techcrunch wedi cyhoeddi stori amdano fe). Mae gwasanaethau meddalwedd ar-lein yn bwysig iawn.

Gwasanaethau ar-lein yw’n amgylchedd cyfryngau nawr. Rydyn ni’n trafod Twitter, Facebook ac ati fel yr oedden ni’n trafod y teledu. Ac dylen ni meddwl am bobol fel Mark Zuckerberg, Jeff Bezos ac Apple fel y Rupert Murdochs o’r 21ain ganrif!

Ar draws y byd mae defnyddwyr wedi bod yn defnyddio’r tag #occupygooglereader. Dw i’n gwybod bod y tag yn doniol ond mae angen rhyw fath o ‘mudiad’ poblogaidd sydd yn bwysleisio’r we agored. Mae Google Reader jyst yn enghraifft o wers gyffredinol.

Mae gwahaniaeth rhwng Google Reader (pori’r we agored trwy RSS) a Google+ (seilo). O’n i’n ffan o Google Reader, dw i ddim yn licio’r newidiadau ond dw i ddim yn synnu. Mae’n cyffroes mewn ffordd pa mor clueless mae cwmnïau mawr fel Google gallu bod. Fydd gwendidau Google yn hwb i bobol i ddatblygu gwasanaethau eraill? Gobeithio, efallai maen nhw yn gallu cynnig gwasanaeth heb cloddio’n data. (Unrhyw awgrymiadau? Nôl i feddalwedd lleol?) Dw i ddim yn ystyried deiseb i Google fel yr ateb go iawn yn y tymor hir.

Mae lot o drafodaeth ynglŷn â thechnoleg mor arwynebol, gan gynnwys cyfryngau Cymraeg. Ac rydyn ni i gyd yn rhan o’r cyfryngau.

Mae lot o enghreifftiau.

Mae un enghraifft amlwg: trafod yr iPhone/iPad fel dyfais caledwedd a chyfraniad Jobs fel cyfres o ddyfeisiau – yn hytrach na pheryg yr App Store ac iTunes fel systemau.

Gweler achos Slideshare i ddarllen mwy am manteision y we agored a HTML5. Beth sy’n well i ni yng Nghymru gyda’n prinder o adnoddau: sgwennu unwaith, rhedeg unrhyw le? Neu sgwennu tro ar ôl tro ar gyfer iPhone, Android, Windows ac ati? Gobeithio fydd systemau a fformatau agored yn ennill yn y pen draw ond mae angen hyrwyddo manteision aps ar y we heddiw.

Mae enghraifft amlwg arall ar hyn o bryd. Pam ydyn ni’n crio am ddiffyg cefnogaeth i’r iaith Gymraeg gan Amazon?!?!!!? Mae cyfle i hyrwyddo dyfeisiau sy’n gweithio gyda fformatau agored fel ePub yn hytrach na Kindle, bricsen DRM sy’n rhan o ymgais monopoli Amazon!! Mae’r dyfais Sony yn darllen ePub, er enghraifft. O ran rhyddid mae’n well na Kindle ond beth sy’n mynd ar dy rhestr Nadolig yn mater i ti. Mae’n digon hawdd i ddechrau siop ePub, pobol. (Hefyd… dylai rhywun gwneud cytundeb i fewnforio dyfais Barnes & Noble sydd hefyd yn gweithio gydag ePub.)

Mae’r gair ysgrifenedig yn bwysig. Roedd y wasg Gutenberg yn hwb i’r Diwygiad.

Pa fath o Ddiwygiad fydd yn bosib gyda’n cyfryngau nawr?

Mae Amazon yn colli arian gyda phob dyfais Kindle Fire. Dylai’r ffaith hon dweud rhywbeth wrthym ni. Mae’r dyfais yn rhan o’r plan. Diwygiad Jeff Bezos fydd siopa am gynnyrch di-angen trwy’r dydd. Ac mae’n annoying i weld cyhoeddusrwydd Cymraeg am ddim yn Golwg360 achos maen nhw yn dylanwadol ac yn dilyn termau Amazon heb cwestiynu opsiynau eraill.

Mae’r marchnad e-lyfrau yn Gymraeg yn ifanc iawn ac mae LOT o bosibiliadau. (I’r bobol sy’n meddwl bod llwyddiant rheolaeth Amazon yn yr iaith Gymraeg yn anochel… Beth yw’r ddiod feddal fwyaf poblogaidd yn Yr Alban? Yn aml iawn nid Coca Cola, y cawr byd-eang, ond Irn Bru, y ffefryn lleol, sy’n dod i rhif un yn y siart gwerthiannau. Mae cyfle nawr i ffeindio ein Irn Bru, at ein dant ni.)

Pwynt arall. O ran termau dw i’n casau ‘Gwgl’, ‘Trydar’ ayyb fel enwau. Plis paid â defnyddio cyfieithiadau Cymraeg o enwau cwmniau Americanaidd fel Facebook, Twitter, Google ac Apple. Mae rhaid atgoffa ein hunan pwy sy’n rheoli dosbarthiad o’n hiaith. Rydyn ni’n gallu cyfieithu wici, blogio, ffrwd, y we ac yn blaen achos maen nhw yn agored i dy gwmni di, dy sefydliad di, dy grwp di neu ti fel unigolyn.

Cymru (digidol) rydd!

FrancoDyma cofnod diddorol gan Rhodri ap Dyfrig: pam dyw siaradwyr Cymraeg ddim yn manteisio ar Foursquare?

Mae mwy na Foursquare yna. Mae fe hefyd yn sôn am bolisi gwrth-ieithoedd Quora. Wel, fel y dwedais ar y pryd sa’ i’n trysto unrhyw platfform gyda’r un polisi ieithyddol a Generalísimo Franco.

Ond mae mwy o heriau i’r platfformau nag ieithoedd a mwy na rhyngwyneb yn dy hoff iaith. Pam fod gyda ni polisi? Ydyn nhw wedi ystyried dy bolisi a fy mholisi?

Dw i’n dechrau colli diddordeb mewn platfformau dan gwmniau ‘trwm’ er enghraifft. Mae lot yn teimlo fel rheolaeth top-i-lawr. Os oes na gormod o reolau mympwyol, dw i’n gadael. Er bod rhai o bobol Cymraeg ddim yn mynegi’r problemau gyda’r un geiriau, maen nhw yn sensitif i’r wendidau fel y mae Rhodri yn dweud am enwau llefydd ayyb. Ac dw i’n cymryd bod y stori yn debyg yn ieithoedd eraill.

Dw i’n eitha hapus i dalu platfform gyda fy data ac hyd yn oed ‘gweithio am ddim’ iddyn nhw os dw i’n cael gwerth yn ôl. Os oes gyda ti cyfrif Facebook neu unrhyw gwasanaeth am ddim rwyt ti’n cytuno. Rwyt ti’n hapus i weld lluniau dy ffrindiau a’r clonc diweddaraf mewn cyfnewidfa, ti’n cynnig dy data.

Mae rhyddid yn bwysig i fi. Nid jyst rhyddid ieithyddol.

Rhyddid i bostio am bob math o bwnc. (Os oes gyda ti ddiddordeb yn democratiaeth ac ymgyrchu gweler y stori Facebook am ymgyrchwyr eleni.)

Mae rhyddid i adael. Wyt ti’n gallu allforio dy gynnwys Quora neu Foursquare i wasanaeth arall, dy flog neu ffeil lleol? Sa’ i’n meddwl. ‘Corporate blogging silos‘ fel y mae Dave Winer yn dweud.

Ar blatfformau fel YouTube neu Twitter mae tipyn o reoliaeth ysgafn (tu fas i broblemau hawlfraint) ond mae’n teimlo fel bod ychydig mwy o ryddid. Rydyn ni’n gallu anghofio presennoldeb y cwmni i roi ffocws ar y sgwrs/cynnwys. WordPress.com a rhai o’r wasanaethau Google yn dda o ran allforio dy stwff. Gweler Google Data Liberation Front.

TimWrth gwrs mae lot fawr o stwff yn dod dan y categori cyfryngau digidol, nid jyst Facebook, Twitter nid hyd yn oed YouTube, Flickr ac ati… Un dyfodol delfrydol: mwy o reolaeth yn y gymuned Cymraeg, sef mwy o bethau fel adolygiad.com (ar steroids), blogiau annibynnol, platfformau annibynnol, prosiectau fel Diaspora sydd ddim yn cynnig rhwydwaith gymdeithasol o gwbl ond gwe gymdeithasol. Does dim rhaid i ti fod yn codydd i elwa o ryddid.

(Llun gan Paul Clarke)

Mewn gwirionedd mae’r byd wedi colli rhai o’r egwyddorion Tim Berners-Lee.

Cyn hir bydd gwasanaeth neu mwy nag un dewis o wasanaethau Diaspora yng Nghymru. Neu rywbeth tebyg. Mae cyfathrebu dynol yn rhy bwysig i fod ar blatfform cwmni enfawr.

Nôl i’r we yn hytrach na gweoedd o gwmpas y lle.

Datganoliad digidol!

Blogio fel prosiect vs. Taflu dy waith mewn twll Google+

Sylw da iawn gan Anil Dash am ‘flogio’ ar Google+, Facebook ac ati:

The broken comparison here is forgetting that many of us write (and own) our blogs because we’re making a *work*. It’s like saying “instead of writing a book, just scribble some notes in the back of someone else’s book!”

Based on the past dozen years that I’ve been writing it, I expect that my blog will in some ways be one of the most significant things I create in my life. It exists neither as a sort of filter for opportunity (as you describe Fred [Wilson]’s use) nor a platform for broadcast (as in Kevin Rose’s case). It’s a work I create for myself, that I choose to share with the world, because this is the medium I’m good at.

In that context the idea of letting some company own it is absurd.

Ystyriaeth am Google+ Circles

Dw i ddim eisiau system ‘opsiynau breifatrwydd’ gymhleth arall. Dw i eisiau cadw’r mwyafrif neu popeth o fy nghofnodion ar y we agored ar gyfer chwilio a dolenni.

Ond byddwn i groesawi rywbeth i dagio ac i helpu pobol i ffiltro pethau mas o’u ffrydiau, yn enwedig o ran iaith.

Mae gwahaniaeth rhwng preifatrwydd a ffiltro.

Rhwydwaith hysbysebu cyntaf i wneud llwyddiant go iawn o Gymraeg? Facebook

Facebook hysbysebu ieithoedd Cymraeg

Dylen ni meddwl am Facebook fel ffurlen gais am hysbysebu.

Mae’r platfform wedi bod yn llwyddiannus iawn o hyd gyda gwybodaeth am dy ffrindiau, diddordebau, teulu, crefydd, gwleidyddiaeth, dewisiadau rhywiol, ayyb.

Ond maen nhw wedi bod yn colli un darn pwysig o wybodaeth: ieithoedd.

Mae’r targedu wedi bod yn anodd am dy ieithoedd heblaw dy ddewisiad iaith am y rhyngwyneb.

Nawr maen nhw yn gofyn.

Fel ymchwil dw i wedi dewis pob math o Gymraeg i weld yr hysbysebion: “Welsh”, “Old Welsh”, “Middle Welsh”, “Welsh-Romani”. Dw i’n newid fy niddordebau o bryd i’w gilydd, fel ymchwil hefyd.

Facebook fydd y rhwydwaith hysbysebu cyntaf i wneud llwyddiant go iawn o Gymraeg?

Faint ydy Google AdWords yn cymryd o hysbysebion Cymraeg ar hyn o bryd? Dim llawer. Er bod gyda nhw mwy o gynnwys Cymraeg nag unrhyw un arall trwy’r we agored. Mae Facebook yn dod yn ail gyda’u platfform caeedig.

Wrth gwrs baswn i licio sefyllfa lle mae’r arian hysbysebu yn aros yng Nghymru. Bydd mwy o siawns gyda’r we agored. Roedd Tim Berners-Lee yn hollol gywir.

Yr unig obaith am unrhyw rwydwaith hysbysebu yng Nghymru? Mae’r we agored yn trosgynnu ffasiwn. Dyw Facebook ddim.

YCHWANEGOL 6/12/10: Mae un neu dau person yn cwyno am “Welsh” ayyb eisioes. Ond o leia maen nhw yn atgoffa ni o’r sefyllfa – cwmni yn California sy’n cyfrannu i’r brain drain ar y we agored Cymraeg. Efallai well i ni peidio cwyno amdano fe.

Chwilio Google, sillafu ac awgrymiadau awtomatig yn y Gymraeg (cyfle?)

Siomedig eto!

Ro’n i eisiau darllen rhywbeth am Wenhwyseg.

Wnes i trio “gwenhwysig” (dim ond 3 canlyniad Google). Hmm…

Ar ôl ychydig o waith, wnes i ffeindio’r sillafiad cywir “gwenhwyseg” (775 canlyniad Google).

Y “Wenhwyseg” hefyd. (3240 canlyniad Google)

Mae awgrymiadau awtomatig yn ddefnyddiol iawn yn Saesneg. Ond os ti’n chwilio am “Estury English” (sic), mae fe’n gallu deall dy air a trwsio dy gamsillafiad.

Dw i ddim yn sôn am yr eiriau yma yn enwedig. Dw i’n trio dychmygu’r we gorau am y Gymraeg. Dyn ni ddim wedi cyrraedd eto.

Mae Cysill yn gallu trwsio’r camsillafiadau. Ond faint o bobol/plant/dysgwyr fasai’n defnyddio fe cyn chwilio?

Dyw Google ddim yn adnabod geiriau Cymraeg. Dyw e ddim yn deall camsillafiadau. Dyw e ddim yn deall treigladau. Dyma pham dw i’n siomedig achos dw i eisiau teclynnau gwell.

Felly mae gyda fi awgrymiad agored am broject nesaf i’r dynion a benywod Cysill (neu unrhyw un)!

Does dim peiriant chwilio sy’n “deall” Cymraeg ar gael. Felly dw i’n eisiau Google + Cysill (neu rhywbeth debyg). Dw i eisiau defnyddio cragen Cymraeg ar Google. Mae’n bosib gyda Google Search API.

Does dim ots gyda fi os mae Google yn cynnig rhyngwyneb Cymraeg. OK da iawn mae rhyngwynebau yn neis ond mae lot mwy yn bosib na rhyngwynebau .

Dychmyga’r cyfle: cynulleidfa mawr am hysbysebion ayyb. Efallai dyn ni’n siarad am y brif wefan Cymraeg.

(Gyda llaw, eisiau gwrando ar enghraifft o Wenhwyseg? 0 canlyniad YouTube o gwbl.)