Dyma eitem Heno am Cof y Cwmwd, gwefan wici amlgyfranog newydd am ardal Uwchgwyrfai.
Pwrpas y wefan ydy casglu a rhannu gwybodaeth hanesyddol am yr ardal, ei sefydliadau a’i phobl.
Fel datblygydd gwe dw i wedi bod yn cydweithio â Chanolfan Hanes Uwchgwyrfai ar y wefan hon. Dw i eisoes wedi blogio am fy ngwaith ar wefannau wici Cymraeg.
Mae hyn wedi cynyddu heddiw yn ystod y Golygathon cyntaf ar y wici, digwyddiad cymunedol i sbarduno cyfraniadau i’r wici. Arweinydd y Golygathon gan Jason Evans o Lyfrgell Genedlaethol Cymru, dyn sy’n arddel y teitl Wicipediwr Preswyl ac sy’n gwybod llawer am dyfu wicis!
Fe fydd hi’n ddiddorol dros ben gweld sut mae prosiectau fel Wicipedia a’r wefan newydd Cof y Cwmwd yn rhannu cynnwys yn y dyfodol hefyd.
Yng Nghymru rydyn ni wedi dod i arfer gyda’r model o wefan gwbl ddwyieithog ond mae modelau ac arferion eraill o gwmpas y byd (megis Wicipedia sydd yn cynnal sawl iaith yn annibynnol gyda rhyw faint o addasu a chyfieithu rhwng yr ieithoedd).
Dw i wedi bod yn creu gwefannnau dwyieithog ac amlieithog ers tro. Fy record byd personol fel petai yw gwefan bedairieithog i brosiect theatr Ewropeiaidd yn Llundain a ddatblygais ar y cyd ychydig blynyddoedd yn ôl.
Mae cyfieithu yn cael ei ystyried fel ffordd o ddarparu’r ieithoedd ac mae’r defnydd o gof cyfieithu yn cynyddu. Ond nid cyfieithu yw’r unig ffordd neu’r ffordd orau o wneud hyn wrth gwrs.
Nid oes esgus i beidio darparu gwefan amlieithog o’r radd flaenaf erbyn hyn. Mae hi’n gallu bod yn brofiad poenus cael ceisio defnyddio gwefan sy’n isradd o ran hyn ac rydyn ni i gyd yn gwybod pa iaith sydd fel arfer yn dioddef o ddiffyg cariad. Dylai iaith fod yn graidd i drafodaeth am brofiad y defnyddiwr. Mae’r meddalwedd yn bodoli ac mae’r arbenigedd yn bodoli. Mae sawl enghraifft o arfer da ac mae help i gael!!
Tu fas i sefyllfa y sefyliadau dyma fi, person llawrydd sydd wedi ychwanegu adran gwaith i fy ngwefan i, morris.cymru.
Fe ddechreuodd y wefan hon o dan enw arall yn 2008 ar gyfer meddyliau a chofnodion am ddiddordebau amryw. Dros amser fe ysgrifennais ragor o stwff fel hyn yn Gymraeg a llai yn Saesneg, ac yn gynyddol mae angen rhannu mwy o stwff gwaith a phrosiectau llawrydd. O’n i hefyd yn awyddus i fanteisio ar enwau parth .cymru, symud o quixoticquisling.com, ac ailgyfeirio’r holl gyfeiriadau i’r enw parth newydd morris.cymru.
Dw i wedi cadw’r naw mlynedd o archifau cofnodion blog, ac wedi ychwanegu cod a gosodiadau er mwyn dangos neges os nad yw cofnod blog hanesyddol ar gael mewn iaith a dewiswyd gan y defnyddiwr.
O hyn ymlaen mae’r wedd a threfn newydd yn fy ngalluogi i bostio rhywbeth am brosiect gwaith neu gofnod blog am unrhyw fater dan haul. Byddwn i’n croesawu adborth wrth i’r wefan esblygu i’r ail ddegawd yn 2018.
Dyma’r cefndir technegol. Dw i’n defnyddio WordPress.org ac nid oes ots pa ategyn a ddefnyddir mae angen ffeiliau iaith .mo ar gyfer craidd WordPress core, y thema, ategion yn ogystal â thestun ar gyfer teclynnau, dewislenni, categorïau, a mwy. QTranslate X sydd orau ar hyn o bryd yn fy marn i (heblaw am faneri i ddinodi ieithoedd) ac mae’r ategyn yn awtomeiddio chwilio am ffeiliau iaith. Nodwch fod angen gwneud eithaf tipyn o osod ac addasu ar yr ategyn hwn.
Cysylltwch am sgwrs os ydych chi eisiau help ar hyn!
Mae hi’n braf cael gweithio ar brosiect wici i glient sef Canolfan Hanes Uwchgwyrfai. Maen nhw fel mudiad am gydweithio ar gyfres o erthyglau amlgyfrwng am hanes yr ardal o drafnidiaeth i chwareli i ysgolion i gapeli ac eglwysi. Fe fydd canlyniadau ein gwaith ar wici Uwchgwyrfai i’w gweld cyn hir.
O safbwynt y datblygwr mae sawl opsiwn ar gyfer meddalwedd wici. MediaWiki yw’r un sy’n cael ei defnyddio mwyaf. Dyna sy’n rhedeg Wicipedia a sawl prosiect perthnasol arall. Dyma fy nghyfrif ar y Wicipedia Cymraeg. Gweler hefyd: fy nghwaith ar gyfrif Twitter @wicipedia.
Nid yw poblogrwydd MediaWiki fel y cyfryw yn digon o reswm i’w dewis. Mae’n ddarn o feddalwedd eithaf mawr ac mae lot fawr o opsiynau. Mae anfanteision eraill hefyd, yn dibynnol ar gyd-destun y prosiect. Ond mae hi’n wych ar gyfer rhywbeth amlgyfrwng ac mae’r rhyngwyneb ar gael yn Gymraeg, diolch i gyfieithwyr gwirfoddol.
Yn 2009 roeddwn i am ddechrau gwefan wici o’r enw Hedyn er mwyn rhannu adnoddau ymhlith datblygwyr a chyhoeddwyr sydd am ddefnyddio’r Rhyngrwyd a’r we yn Gymraeg. Dokuwiki oedd fy newis ar y dechrau ond fe benderfynais newid i MediaWiki wedyn oherwydd y niferoedd o bobl a oedd yn brofiadol ar y system. Mae MediaWiki yn parhau hyd heddiw fel sail y wefan.
Nid yw’r cyfle i greu wici newydd sbon yn ymddangos yn aml. Mae angen eithaf tipyn o ymdrech, amser, a chriw o bobl cefnogol er mwyn cynnal wici llwyddiannus. Does dim llawer o enghreifftiau o lwyddiant ar wicis yn y Gymraeg, efallai oherwydd yr angen i recriwtio llawer o gyfranwyr brwd ac i fuddsoddi lot fawr o amser i greu rhywbeth o werth.
Mae Joy Buolamwini yn ‘fardd cod’ sydd wedi ymchwilio rhagfarn ac annhegwch mewn algorithmau.
Meddalwedd sydd fod adnabod gwynebau ar gamera ond yn methu adnabod gwynebau croenddu yw’r enghraifft cyntaf yn ei araith yma.
Engrheifftiau eraill mewn lluniau: fe drwsiwyd FaceApp er mwyn cael gwared â phroblem o ‘algorithm hiliol’. Roedd angen i Google ymddiheuro am fod eu system wedi tagio dau berson groenddu fel gorilas.
Dw i’n dychmygu y bydd y problemau yn cynyddu tra bod rhagor o systemau dysgu peirianyddol yn cael eu defnyddio, yn enwedig os mae’r systemau wedi cael ei hyfforddi gyda setiau cyfyngedig o ddata.
Mae’n debyg y byddan ni’n gweld achosion o bobl yn methu cael yswiriant, swyddi a chyfleoedd eraill oherwydd penderfyniadau gan beiriannau. Wrth gwrs fydd hi ddim wastad yn amlwg i’r person sydd yn dioddef. Er enghraifft byddai rhywun yn clywed bod e/hi heb lwyddo i ennill cyfweliad am swydd ond fydd hi ddim yn amlwg bod system wedi dehongi ei CV neu ddata bersonol mewn ffordd ragfarnllyd.
Mae Buolamwini wedi cael sawl profiad personol o ragfarn mewn algorithmau ers blynyddoedd ac wedi ysgrifennu eithaf tipyn o erthyglau am hyn. Yn ogystal mae hi’n cyfeirio at lyfr o’r enw Weapons of Math Destruction gan Cathy O’Neil.
Mae’r gwaith wedi arwain at fudiad o’r enw Algorithmic Justice League a sefydlwyd gan Buolamwini eleni er mwyn casglu rhagor o achosion ac ymgyrchu dros degwch mewn algorithmau.
Dw i wrthi’n ceisio deall yr union ddiffiniad o ‘ragfarn mewn algorithmau’.
Fe ges i gyfarfod gyda swyddogion Google yn Llundain sbêl yn ôl i drafod eu polisïau nhw o ran y Gymraeg, nid yn unig mewn rhyngwynebau ond diffygion sy’n gallu cael eu hystyried fel rhai algorithmig megis statws y Gymraeg ar ganlyniadau chwilio ac o bosib y broses o adeiladu’r mynegai.
Yn y bôn ‘dydy cefnogi’r Gymraeg yn iawn ddim yn werth chweil yn fasnachol i ni’ oedd ymateb Google. Mae hi’n bwysig nad ydyn ni’n ildio i’r syniad bod angen i ni greu rhagor o gynnwys Cymraeg er mwyn cyrraedd radar Google a chwmnïau eraill. Er enghraifft mae creu rhagor o erthyglau Wicipedia ac ati yn Gymraeg yn beth da yn ei hun. Mae Google wedi gwneud digon o arian yng Nghymru eisoes ac wedi mwynhau ffafr llywodraeth San Steffan ac awdurdodau eraill mewn sawl ffordd. Dylen ni hefyd cydnabod bod unrhyw ‘feini prawf’ o’r fath megis nifer o erthyglau Wicipedia neu beth bynnag yn hollol, hollol fympwyol.
Beth am feddalwedd yr iPhone (a systemau eraill) sy’n mynnu ‘cywiro’ eich geiriau oherwydd diffyg geiriaduron Cymraeg? Mae sôn hefyd am yr ‘exclusion overhead’, yr ymdrech mae’n rhaid i ddefnyddwyr wneud er mwyn cael meddalwedd i weithio’n iawn tra bod ’na diffygion dal yn y system.
Pa wers y mae plant yn dysgu bob tro mae bysellfwrdd neu brosesydd geiriau yn newid y gair ‘i’ ac yn mewnosod ‘I’ yn lle yn awtomatig, er enghraifft?
Beth am fformiwla ffrwd Facebook? Pa mor effeithiol ydy systemau fel hyn gyda chynnwys Cymraeg, geiriau Cymraeg, treigladau? Mae hi’n anodd dadansoddi hyn.
Efallai bod yr Echo ac Alexa yn berthnasol yma er bod cwmni Amazon wedi dweud yn blwmp ac yn blaen bod y peiriant ond yn deall dwy iaith, Almaeneg a Saesneg!
Fyddwn i ddim yn synnu pa tasai pobl yn canfod sawl achos o ragfarn ieithyddol mewn algorithmau o fewn sawl gwasanaeth, ‘rhagfarn’ sy’n gweithio yn erbyn ieithoedd lleiafrifedig o gwmpas y byd.
Gadewch wybod yn y sylwadau os ydych chi’n ymwybodol o unrhyw rai.
Dw i wedi bod yn chwarae gyda Jekyll yn ddiweddar, system sy’n cynhyrchu gwefan statig.
Fel system rheoli cynnwys mae WordPress dal yn ffefryn i mi ond mae hi’n bwysig ceisio a phrofi ffyrdd eraill o weithio. Dwy fantais o greu gwefan statig trwy Jekyll ydy’r cyflymder ac y ffordd mae’n symleiddio gwarchodaeth achos does ’na ddim o reidrwydd sgript sy’n rhedeg ar y gweinydd tra bod pobl yn ymweld â’ch gwefan.
Un peth a oedd yn fy nrysu ar y dechrau oedd y ffaith bod thema yn fforc o’r system craidd. Hynny yw, roedd rhaid i mi glonio’r system a thema yn eu cyfanrwydd yn hytrach na rhoi thema mewn cyfeiriadur/ffolder yn y hen ffordd WordPressaidd o fyw. Dw i’n cymryd bod angen rheoli fersiynau trwy Git er mwyn diweddaru’r system craidd wedyn. Tybed beth yw’r manteision o weithio fel hyn?
Oes gwefannau Cymraeg sydd wedi eu creu ar Jekyll, ac os oes unrhyw themâu Cymraeg ar gael? Does dim byd perthnasol i weld ar Github. Efallai dylwn i gyfieithu un syml er mwyn ehangu byd Jekyll ychydig. 🙂
Wyddoch chi fod rhywun o’r enw Dafyddt newydd greu erthygl am Eirwyn Pontshân o’r diwedd y mis hwn? Dyma uchafbwyntiau o erthyglau Wicipedia Cymraeg newydd sbon a grëwyd gan wirfoddolwyr, arwyr y we Gymraeg!
Mae prosiect ar y Wicipedia Saesneg o’r enw Women In Red i sbarduno pobl i greu rhagor o erthyglau am fenywod.
Fel arfer mae llai o erthyglau am fenywod adnabyddus ar brosiectau Wicipedia mewn ieithoedd gwahanol. Ar yr un pryd mae llwythi o ddolenni coch – sef cyfeiriadau at erthyglau sydd ddim yn bodoli eto- at enwau menywod.
Dyma fy ffordd i o ddechrau prosiect tebyg yn y Gymraeg o’r enw MenywodMewnCoch a gwella cynrychiolaeth menywod.
Os ydych chi’n gweld trydariad fel yr isod, ewch amdani i greu erthygl.
Tybed os fydd pobl Cymru yn gallu rhoi rhagor o wybodaeth i ni am hen adeiladau a phobl yn y delweddau sydd ddim wedi cael eu henwi eto. Gawn ni weld yn fuan!
Dw i wedi gosod bots mewn PHP i bostio’r cyfan yn awtomatig bob dydd. Byddan nhw yn ddiddorol i bobl gobeithio ac wedyn yn sbarduno rhagor o ymweliadau i Wicipedia, rhagor o ddysgu, a rhagor o gyfraniadau i’r wefan mwyaf brysur yn y Gymraeg.
Gadewch i mi wybod os ydych chi eisiau trafod prosiectau eraill fel apiau gwe, bots, prosesu data, ac ati.
Diolch i Robin Owain am rai o’r syniadau ac am eu cefnogaeth brwd a diolch iddo fe a WikimediaUK am gomisiynu’r prosiect hwn.
Prin yw’r siaradwraig neu siaradwr Cymraeg sydd ddim yn ymddiddori mewn ieithoedd gwahanol dw i’n credu.
DIWEDDARIAD 9 Rhagfyr: newydd ychwanegu rheol sy’n atal erthyglau llai na 1000 nod er mwyn ceisio canfod mwy o’r ‘gorau’ o bob iaith. Fe oedd ’na ambell i erthygl rhy fach. Gawn ni weld pa gynnwys a ddaw. Fel o’n i’n dweud yn y blogiad mae ’na rheolau eraill hoffwn i ychwanegu.
Mae anturiaethau Wicipedia yn parhau gyda chyfrif arbrofol newydd @Wikidelta.
Dilynwch y cyfrif am ddolenni achlysurol at erthyglau Wicipedia unigryw mewn sawl iaith. Mae ‘unigryw’ yn golygu erthyglau sydd heb gael eu cysylltu/cyfieithu/addasu o/i unrhyw erthygl Wicipedia mewn unrhyw iaith eraill.
Mae’r cyfrif wrthi’n mynd drwy gyfanswm o 284 iaith wahanol! Heddiw roedd e’n rhannu dolenni at erthyglau mewn Gaeleg yr Alban.
Os ydych chi wedi gweld @UnigrywUnigryw mae’n weddol debyg heblaw am y ffaith bod Wikidelta yn dewis iaith wahanol bob hyn a hyn.
Gawn ni weld faint o erthyglau ar Wikidelta sydd wir yn unigryw a faint sydd angen eu cysylltu (er enghraifft roedd rhaid i mi ymweld â Wicipedia er mwyn cysylltu erthygl i ieithoedd eraill heddiw).
Dw i am flogio ar Medium cyn hir er mwyn rhannu’r cyfrif gyda phobl sy’n siarad ieithoedd eraill.
Hefyd hoffwn i ddechrau fersiwn Cymraeg o gyfrif Wikidelta. Mae gwneud popeth yn Gymraeg yn bwysig i mi. Yr unig elfennau sydd yn Saesneg yw enw y cyfrif, bywgraffiad a’r trydariadau am newid iaith. Felly bydd angen rhestr Gymraeg o enwau’r ieithoedd i gyd. Dwedwch os ydych chi am helpu gyda job cyfieithu bach iawn.
Diolch i Ffrancon am gyfrannu at syniad Wikidelta ac i Illtud am yr enw.
Mae cymunedau ieithyddol yn cynnal sawl Wicipedia ac mae pob un yn wahanol. Mae rhywfaint o gyfieithu ac addasu ac mae rhywfaint o erthyglau sy’n unigryw i’r fersiwn Cymraeg, y fersiwn Catalaneg, y fersiwn Arabeg, ac ati.
Dechreuais i’r cyfrif Twitter awtomatig UnigrywUnigryw i rannu’r erthyglau sydd ond ar y Wicipedia Cymraeg.
Pa ganran o erthyglau unigryw sydd ar y Wicipedia Cymraeg?
Beth am BOB iaith Wicipedia?
Fel mae’n digwydd mae hi’n eithaf rhwydd addasu’r sgript feddalwedd PHP wreiddiol i edrych at ieithoedd gwahanol. Dw i wedi ymestyn y sgript tu ôl i @UnigrywUnigryw er mwyn dadansoddi POB iaith ar Wicipedia yn awtomatig.
Mae cyfanswm o 283 iaith o dan fy ystyriaeth. Mae rhai o ieithoedd yna sydd ddim yn gyfarwydd i mi o gwbl tan nawr, e.e. Wicipedia yn yr iaith অসমীয়া.
Allbwn y broses fydd fath o dabl o ieithoedd gwahanol. Ble mae’r Gymraeg ar y siart?! Ydy’r drefn ar y siart yn adlewyrchu’r nifer o erthyglau yn yr ieithoedd? Neu fuddsoddiad yn yr ieithoedd?
Beth am ieithoedd sy’n gysylltiedig drwy nifer helaeth o siaradwyr amlieithog, megis Sbaeneg-Catalaneg, Sbaeneg-Basgeg, Saesneg-Cymraeg, Wrdw-Arabeg, Iseldireg-Almaeneg, ayyb.?
Dw i’n gallu ceisio ymateb i’r cwestiynau uchod cyn hir…
Yr unig broblem gyda’r sgript feddalwedd dw i wedi ysgrifennu yw’r amser mae’n cymryd.
Mae fy sgript yn wneud ceisiadau i API Wicipedia, sydd yn cynnig pecyn o 20 erthygl ar hap i’w dadansoddi ar y tro. Mae angen cael lot fawr o becynnau er mwyn cael data dibynadwy.
Gwnes i ddechrau tua 12:40yp heddiw cyn mynd am dro i dre am ginio a dw i newydd gyfrif faint o ieithoedd mae’r peth wedi dadansoddi ers hynny. Bydd hi’n mynd trwy ieithoedd yn gyflymach yn y pen draw achos fydd ddim angen gymaint o sampl ar gyfer yr ieithoedd bychain bychain.
Ta waeth, ar y gyfradd yma bydd hi’n cymryd rhyw bedwar diwrnod i orffen!
Mae’n rhedeg ar weinydd pell dw i’n talu £5 y mis amdano fe, y math o letya mae rhywun yn rhoi gwefan fach arno fe. Mae’r un weinydd yn rhedeg UnigrywUnigryw felly mae hi’n ddefnydd da o arian.
Efallai dylwn i edrych at redeg algorithm cyfochrog ar rywbeth swish fel AWS.
Fel arall, oes ’na unrhyw un sydd am fenthyg amser ar uwchgyfrifiadur anferth i mi pls? 🙂
DIWEDDARIAD 19 Gorffennaf 2016: Mae dwy iaith uwchben y Saesneg ar y siart o ieithoedd ‘mwyaf unigryw’ ar Wicipedia – hyd yn hyn! Mae’r system wrthi’n dadansoddi Hindi.
Mae sut gymaint o newyddion pwysig wedi torri yn y pythefnos diwethaf.
Ac mae fe bron i gyd drwy gyfrwng y Saesneg ac ieithoedd eraill.
Mae newyddion yn arafach yn Gymraeg. Ffaith.
Cywirwch fi os mae hyn yn anghywir ond dw i ddim yn credu bod ’na graffeg yn Gymraeg fel y cerdyn uchod.
Ydy llai o bethau sydd o ddiddordeb i wylwyr/ddarllenwyr Cymraeg fel ni yn digwydd yn y byd? Nac ydy.
Ydy’r newyddion yn gyffredinol yn effeithio arnom ni i raddfa lai? Nac ydy.
Oes ’na diffyg awydd ar ran penaethiaid ein sefydliadau a chwmnïau cyfryngol i fentro ac ymdrechu i adrodd newyddion ‘poeth’ yn Gymraeg tra bod e’n digwydd? Oes.
Oes ’na llai o gystadleuaeth ymhlith mentrau newyddion Cymraeg, llai o gystadlu am sylw drwy geisio adrodd yn gyflym? Oes.
Ydy hi’n symptom o diffyg adnoddau a diffyg buddsoddiad? Ydy, yn sicr.
Mae newyddion yn ddrud. Yn y Saesneg mae’r Guardian wedi dechrau adrodd rhagor o newyddion o’r UDA achos dyna le mae mwy o lygaid a mwy o farchnad hysbysebion. Mae hyn yn her fach i newyddion am wledydd Prydain, heb sôn am y Gymraeg.
Wrth gwrs mae amddiffyn y gwaith da sy’n digwydd eisoes yn Gymraeg yn digon o her drwy’r amser.
Er nad ydynt yn defnyddio’r union dermau mae plant weddol ifanc yn sylweddoli bod newyddion yn Gymraeg yn arafach.
Mae plant yn gweld pethau fel hyn mewn byd yr oedolion fel y niferoedd cymharol isel o gemau fideo, ffilmiau, cylchgronau, bwydlenni, crysau-t, hysbysebion, ac ati yn Gymraeg. Gweler hefyd: os nad yw Prif Weinidog Cymru yn defnyddio’r Gymraeg maen nhw yn sylwi.
Fydda i ddim yn hapus nes bod newyddion yn Gymraeg cystal â newyddion Saesneg – cyflym, rhyngwladol, amrywiol, amlgyfrwng, dwfn, cyfoethog. Fydda i ddim yn hapus nes bod y cyfryngau yn holliach yn Gymraeg a chystal ag unrhyw iaith arall. Dw i’n gwybod bod hyn i gyd yn hollol afrealistig ond dyna ni.
Tra ein bod ni’n ceisio meddwl am ffyrdd o ddatblygu’r maes yma (sori, dim datrysiadau heddiw!) dylen ni ystyried cefnogi cyfrifon fel @elliwsan, @owen_garry, @sianeaber sy’n ceisio torri newyddion yn Gymraeg. Oes ’na rhai eraill?
Pob bendith i’r bobl eraill yma sy’n ceisio ein cyffroi drwy ddefnydd o’r geiriad ‘newyddion yn torri‘ ar Twitter!
Down ni â rhagor ar hyn tra bod y sefyllfa yn datblygu.