Gwefan ddwyieithog neu amlieithog mewn WordPress

System cyfieithu WordPress yn rhestru sawl iaith

Yng Nghymru rydyn ni wedi dod i arfer gyda’r model o wefan gwbl ddwyieithog ond mae modelau ac arferion eraill o gwmpas y byd (megis Wicipedia sydd yn cynnal sawl iaith yn annibynnol gyda rhyw faint o addasu a chyfieithu rhwng yr ieithoedd).

Dw i wedi bod yn creu gwefannnau dwyieithog ac amlieithog ers tro. Fy record byd personol fel petai yw gwefan bedairieithog i brosiect theatr Ewropeiaidd yn Llundain a ddatblygais ar y cyd ychydig blynyddoedd yn ôl.

Mae cyfieithu yn cael ei ystyried fel ffordd o ddarparu’r ieithoedd ac mae’r defnydd o gof cyfieithu yn cynyddu. Ond nid cyfieithu yw’r unig ffordd neu’r ffordd orau o wneud hyn wrth gwrs.

Nid oes esgus i beidio darparu gwefan amlieithog o’r radd flaenaf erbyn hyn. Mae hi’n gallu bod yn brofiad poenus cael ceisio defnyddio gwefan sy’n isradd o ran hyn ac rydyn ni i gyd yn gwybod pa iaith sydd fel arfer yn dioddef o ddiffyg cariad. Dylai iaith fod yn graidd i drafodaeth am brofiad y defnyddiwr. Mae’r meddalwedd yn bodoli ac mae’r arbenigedd yn bodoli. Mae sawl enghraifft o arfer da ac mae help i gael!!

Tu fas i sefyllfa y sefyliadau dyma fi, person llawrydd sydd wedi ychwanegu adran gwaith i fy ngwefan i, morris.cymru.

Fe ddechreuodd y wefan hon o dan enw arall yn 2008 ar gyfer meddyliau a chofnodion am ddiddordebau amryw. Dros amser fe ysgrifennais ragor o stwff fel hyn yn Gymraeg a llai yn Saesneg, ac yn gynyddol mae angen rhannu mwy o stwff gwaith a phrosiectau llawrydd. O’n i hefyd yn awyddus i fanteisio ar enwau parth .cymru, symud o quixoticquisling.com, ac ailgyfeirio’r holl gyfeiriadau i’r enw parth newydd morris.cymru.

Dw i wedi cadw’r naw mlynedd o archifau cofnodion blog, ac wedi ychwanegu cod a gosodiadau er mwyn dangos neges os nad yw cofnod blog hanesyddol ar gael mewn iaith a dewiswyd gan y defnyddiwr.

O hyn ymlaen mae’r wedd a threfn newydd yn fy ngalluogi i bostio rhywbeth am brosiect gwaith neu gofnod blog am unrhyw fater dan haul. Byddwn i’n croesawu adborth wrth i’r wefan esblygu i’r ail ddegawd yn 2018.

Dyma’r cefndir technegol. Dw i’n defnyddio WordPress.org ac nid oes ots pa ategyn a ddefnyddir mae angen ffeiliau iaith .mo ar gyfer craidd WordPress core, y thema, ategion yn ogystal â thestun ar gyfer teclynnau, dewislenni, categorïau, a mwy. QTranslate X sydd orau ar hyn o bryd yn fy marn i (heblaw am faneri i ddinodi ieithoedd) ac mae’r ategyn yn awtomeiddio chwilio am ffeiliau iaith. Nodwch fod angen gwneud eithaf tipyn o osod ac addasu ar yr ategyn hwn.

Cysylltwch am sgwrs os ydych chi eisiau help ar hyn!

Dadansoddi 283 iaith Wicipedia (yn ara deg)

Mae cymunedau ieithyddol yn cynnal sawl Wicipedia ac mae pob un yn wahanol. Mae rhywfaint o gyfieithu ac addasu ac mae rhywfaint o erthyglau sy’n unigryw i’r fersiwn Cymraeg, y fersiwn Catalaneg, y fersiwn Arabeg, ac ati.

Dechreuais i’r cyfrif Twitter awtomatig UnigrywUnigryw i rannu’r erthyglau sydd ond ar y Wicipedia Cymraeg.

Pa ganran o erthyglau unigryw sydd ar y Wicipedia Cymraeg?

Beth am BOB iaith Wicipedia?

Fel mae’n digwydd mae hi’n eithaf rhwydd addasu’r sgript feddalwedd PHP wreiddiol i edrych at ieithoedd gwahanol. Dw i wedi ymestyn y sgript tu ôl i @UnigrywUnigryw er mwyn dadansoddi POB iaith ar Wicipedia yn awtomatig.

Mae cyfanswm o 283 iaith o dan fy ystyriaeth. Mae rhai o ieithoedd yna sydd ddim yn gyfarwydd i mi o gwbl tan nawr, e.e. Wicipedia yn yr iaith অসমীয়া.

Allbwn y broses fydd fath o dabl o ieithoedd gwahanol. Ble mae’r Gymraeg ar y siart?! Ydy’r drefn ar y siart yn adlewyrchu’r nifer o erthyglau yn yr ieithoedd? Neu fuddsoddiad yn yr ieithoedd?

Beth am ieithoedd sy’n gysylltiedig drwy nifer helaeth o siaradwyr amlieithog, megis Sbaeneg-Catalaneg, Sbaeneg-Basgeg, Saesneg-Cymraeg, Wrdw-Arabeg, Iseldireg-Almaeneg, ayyb.?

Dw i’n gallu ceisio ymateb i’r cwestiynau uchod cyn hir…

Yr unig broblem gyda’r sgript feddalwedd dw i wedi ysgrifennu yw’r amser mae’n cymryd.

Mae fy sgript yn wneud ceisiadau i API Wicipedia, sydd yn cynnig pecyn o 20 erthygl ar hap i’w dadansoddi ar y tro. Mae angen cael lot fawr o becynnau er mwyn cael data dibynadwy.

Gwnes i ddechrau tua 12:40yp heddiw cyn mynd am dro i dre am ginio a dw i newydd gyfrif faint o ieithoedd mae’r peth wedi dadansoddi ers hynny. Bydd hi’n mynd trwy ieithoedd yn gyflymach yn y pen draw achos fydd ddim angen gymaint o sampl ar gyfer yr ieithoedd bychain bychain.

Ta waeth, ar y gyfradd yma bydd hi’n cymryd rhyw bedwar diwrnod i orffen!

Mae’n rhedeg ar weinydd pell dw i’n talu £5 y mis amdano fe, y math o letya mae rhywun yn rhoi gwefan fach arno fe. Mae’r un weinydd yn rhedeg UnigrywUnigryw felly mae hi’n ddefnydd da o arian.

Efallai dylwn i edrych at redeg algorithm cyfochrog ar rywbeth swish fel AWS.

Fel arall, oes ‘na unrhyw un sydd am fenthyg amser ar uwchgyfrifiadur anferth i mi pls? 🙂

Delweddau: map y byd / Kraftwerk

DIWEDDARIAD 19 Gorffennaf 2016: Mae dwy iaith uwchben y Saesneg ar y siart o ieithoedd ‘mwyaf unigryw’ ar Wicipedia – hyd yn hyn! Mae’r system wrthi’n dadansoddi Hindi.

Rhestrau Twitter, amlieithrwydd a fy ymgyrch anweledig

Hwn yw ateb i Sion Jobbins, dw i wedi ei bostio yn agored yn hytrach nag ebost preifat.

Postiodd Sion:

Cer i’r wefan Blog Golwg360 i weld e (ar enw parth gwahanol i’r prif wefan Golwg360 am ryw reswm). Wnes i ddarganfod fod nhw yn defnyddio fy rhestr Twitter o’r enw Cymraeg.

Cer i’r cod HTML a ti’n gallu gweld fy enw yna… Dw i’n rheoli’r rhestr. Mewn theori dw i’n gallu hysbysebu ar Golwg360 am ddim os dw i eisiau(!) Efallai dylen nhw greu rhestr eu hun. Neu (gwell) ffeindio ffordd wahanol, e.e. defnyddio ffrwd o ffefrynnau i reoli’r cynnwys.

Problem yw, mae fy mwriadau yn wahanol i fwriadau Golwg360.

Y newyddion da yw, roedd rhaid i mi greu ail restr o’r enw Cymraeg2 ac mae hon wedi bwrw’r terfyn o 500 aelod. Felly y cyfanswm siaradwyr Cymraeg ar Twitter (gyda chyfrifon agored) wedi pasio 1000 yn ddiweddar.

Beth yw’r diffiniad “siaradwyr Cymraeg”? Cwestiwn anghywir. Beth yw FY niffiniad gan greu rhestrau? Gan greu’r rhestr o’n i eisiau “hyrwyddo” defydd o Gymraeg ar Twitter. Felly dw i wedi bod yn ychwanegu defnyddwyr dwyieithog, dysgwyr, mabwysiadwyr, pobol sy’n uniaith Saesneg ar Twitter ond yn gallu siarad Cymraeg. Sef, y spectrum llawn achos medr != defnydd. Yn aml iawn, Cymraeg neu Cymraeg2 yw’r rhestr gyntaf i “groesawi” defnyddwyr Twitter hollol newydd sbon. (Dw i’n defnyddio chwilio a dw i’n ffeindio tweets gyda chyfeiriadau i bobol newydd, e.e. “croeso fy ffrind @gwalchmai!” neu beth bynnag.)

Y negeseuon i aelodau newydd yw: ti’n rhan o’r clwb, croeso i ti defnyddio Cymraeg ar Twitter, gyda llaw dyma bobol eraill. Mae gen ti ddewis!

Casglu oedd fy thema pan wnes i ddechrau’r rhestr Cymraeg. Weithiau does dim digon o gyfleoedd, hyder, neu cysylltiadau gyda’r “cymuned” gyda phobol. Dw i’n methu siarad o ran pobol tu ôl rhestrau eraill o siaradwyr Cymraeg.

Dyw’r rhestrau ddim yn ddigon unieithog am unrhywbeth fel y defydd cyhoeddus gan Golwg360.

Bydd platfformau cynnwys yn adlewyrchi dwyieithogrwydd o unigolion, e.e. fy nefnydd ar fy nghyfrif personol.

Ond ar yr un pryd dw i’n meddwl bod cyfrifon uniaith Cymraeg yn bwysig. Enghreifftiau: @haciaith, @ytwll, @shwmae. Mae’n golygu ymdrech, gofal gyda retweets ayyb.

Hoffwn i archwilio’r shifft ieithyddol, diglossia ac effeithiau ieithyddol eraill ar gyfryngau cymdeithasol mwy. Paid ag anghofio gwasanaethau fel Quora gyda pholisïau yn erbyn amlieithrwydd hefyd.