Cathod bach yn y rhyfel sbam MediaWiki

Mae ein gwefan Hedyn, sydd yn rhedeg ar y feddalwedd rydd MediaWiki, wedi dioddef o sbam yn ddiweddar.

Pam fasai rhywun eisiau sbamio Hedyn? Yn hytrach na sbam trwy e-bost mae pobol yn rhedeg sgriptau awtomatig er mwyn creu cyfrifon a thudalennau gyda thestun a dolenni i wefannau sydd yn werthu bob math o gynnyrch dodji. Y prif bwriad yw cynyddu’r sgorau ar Google trwy adeiladu dolenni o gwmpas y we.

Does dim byd peryglus hyd yn hyn o ran gwarchodaeth, dim pysgota drwg yn ôl pob golwg. Ond mae’r sbam yn cymryd lle ar y cronfa ddata ac yn ymyrru gyda’r profiad defnyddiwr. (Mae’r wefan yn wici sydd yn cynnwys adnoddau Cymraeg, dolenni defnyddiol a’r Rhestr, chyfeirlyfr enfawr o (bron) pob blog yn Gymraeg.)

Pan wnes i Gyfrifiadureg gwnes i ddysgu am y cyfaddawd rhwng gwarchodaeth a hygyrchedd ar unrhyw system cyfrifiadur. Y ffordd gorau i sicrhau’r gwarchodaeth gorau ar Hedyn fydd cyfrifiadur caeëdig ar wely’r môr. A’r ffordd gorau i sicrhau hygyrchedd fydd cyfrifiadur agored ar Heol Santes Fair yng Nghaerdydd! Rydyn ni eisiau cydbwysedd rhwng y dau, rhywbeth sydd yn digon hawdd i fod yn defnyddiol ond yn digon saff i warchod rhag sbam.

Captcha

Gwraidd y broblem yw’r cyfrifon awtomatig. Ond o’n i’n meddwl bod Captcha a ReCAPTCHA yn codi gormod o stwr ac yn passé (er bod yr agenda i ddigido llyfrau ar ReCAPTCHA yn wych).

Felly dw i wedi gosod ategyn newydd o’r enw KittenAuth bellach. Pob tro mae rhywun yn gofrestru mae pump llun gwahanol yn ymddangos. Ac mae’n rhaid ffeindio’r llun o gath bach er mwyn creu cyfrif. Mae modd gweld y delweddau yma (ond plis paid â chreu cyfrifon di-angen!). Mae’r job yn hawdd i berson ond yn anodd i feddalwedd.

Mae’r cyfieithiad Cymraeg o KittenAuth ar gael yma.

(Gyda llaw sut mae Wicipedia yn delio gyda sbam?)

Wrth gwrs mae’r sbamwyr yn gallu sgwennu datrysiad i’r ategyn KittenAuth sydd yn seiliedig ar enwau ffeiliau achos dyw’r ategyn ddim yn cuddio’r enwau fel 19.png eto. Neu mae’r sbamwyr yn gallu cyflogi rhywun hyd yn oed i ffeindio’r gath bach. Fydd y Gymraeg ddim yn drysu pobol achos mae’r dolenni a nodweddion i gyd yn gyson trwy MediaWiki ym mhob iaith.

Captcha Cath!

Ond rydyn ni’n ennill y rhyfel am y tro, diolch i’r cathod bach.

Santes Dwynwen 404!

Yn anffodus roedd rhaid i rywun dileu dau dolen ar Wikipedia i erthyglau S4C am Santes Dwynwen achos mae’r sianel wedi torri’r dolenni (Dudley a Dechrau Canu). Ydyn ni wedi colli’r erthyglau am byth?

Dydd Santes Dwynwen 404 anhapus!

Dyw e ddim yn broblem S4C, mae’n broblem i’r diwydiant darlledu yn gyffredinol. (Gweler hefyd: cofnod gan Tom Morris am Channel 4 a BBC.)

Pryd fydd darlledwyr yn gwerthfawrogi cynnwys o safon ar y we fel mwy na jyst cyhoeddusrwydd dros dro? Pryd fyddan nhw yn caru‘r we fel cyfrwng?!

Rydyn ni’n bwriadu dathlu Santes Dwynwen am byth, dylen nhw hefyd. Rydyn ni eisiau gweld twf yn y maint o gynnwys da yn Gymraeg ar y we. Ond ar hyn o bryd rydyn ni’n ail-adeiladu’r we Gymraeg bob 10 mlynedd. Mae’n wastraff o arian ac amser. Dw i’n deall tipyn o golled cynnwys ar fentrau gan wirfoddolwyr – ond cwmnïau cyfryngau proffesiynol?

Wrth gwrs mae modd ailgyfeirio cyfeiriadau i’r erthyglau os mae’r system cyfeiriadau wedi newid.

Dydd Santes Dwynwen Hapus i chi i gyd beth bynnag.

Wicipedia a’r “manteision diglossia”

Mae Rhodri yn cyflwyno syniad diddorol iawn:

O bosib, gellid tynnu o hyn bod rhyw fantais yn dod i’r amlwg i ieithoedd sydd â diglossia gyda Saesneg yn achos Wikipedia. Am eu bod yn rhannu iaith gyda’r iaith fwyaf ar Wikipedia yn gyffredinol (a’r iaith weinyddol ar lefel uchaf Wikipedia), mae ychydig o’r bywiogrwydd hynny yn tollti drosodd i’r ieithoedd hynny. Bosib bod y gymuned Wikipedia ym Mhrydain, Iwerddon a’r UDA yn gryfach o ganlyniad i’r ffaith bod y Saesneg dal yn dominyddu’r wefan. Wn i ddim os yw hyn yn cyfri fel effaith bositif i diglossia gyda Saesneg am unwaith! Mae’n dibynnu os taw ‘gwerth’ neu ‘nifer’ yw eich meini prawf chi wrth gwrs. O bosib bod mwy o angen (efallai oherwydd diffyg adnoddau eraill) am nifer mwy o erthyglau mewn un iaith na’r llall hefyd.

Efallai hefyd bod y tebygolrwydd o gael erthygl gyfatebol, well a mwy trwyadl, yn Saesneg yn golygu bod llai o gynhyrchu erthgylau stwbyn, a rhoi mwy o gig ar erthyglau. Mi allai wrth gwrs, fod o ganlyniad i dîm golygyddol mwy bywiog hefyd (mae Wikipedia Cymraeg yn ail o ran niferoedd Admins, i’r Gatalaneg), ond mae’r enghraifft Wyddelig yn awgrymu nad yw hyn yn wir.

Dyna rai sylwadau sydyn, off the cuff. Faswn i’n hapus i glywed unrhyw sylwadau pellach, yn arbennig o ran y math o lefel cyfranogiad mae rhywun am ei gael mewn gwahanol ieithoedd neu sefyllfaoedd diglossaidd.

O ran y “manteision diglossia” mae Cymraeg wedi elwa i ryw raddau trwy gryfder y project Wikipedia yn Saesneg. Rydyn ni’n gallu ailgylchu’r erthyglau fel y mae Rhodri yn dweud uchod. Hefyd mae gyda Wicipedia Cymraeg mwy o bresenoldeb trwy Wikipedia Saesneg. Ydy’r twf y fersiwn Cymraeg yn dilyn y fersiwn Saesneg (dw i ddim wedi astudio’r data yn fanwl iawn)?

Rydyn ni wastad eisiau fersiwn Cymraeg bach o rywbeth sy’n llwyddiannus yn Saesneg. Rydyn angen idiom fel “keeping up with the Joneses” gyda chyfenw gwahanol.

Paid ag anghofio’r meddalwedd chwaith, roedd e ar gael am Hedyn a phrojectau eraill. (Heblaw PenTalarPedia dw i’n methu meddwl am fwy o wicis Cymraeg cyhoeddus ac agored i bawb, tu fas o brojectau Wikimedia – unrhyw un?)

Wrth gwrs, yn gyffredinol rydyn ni’n gallu darllen yr ymchwil newyddaf yn Saesneg ac hefyd mynd i gynadleddau rhyngwladol, gan gynnwys  cynadleddau o bobol sy’n siarad ieithoedd lleiafrifol eraill, i ddefnyddio’r lingua franca, Saesneg.

Hmm, ond bydd e’n neis i weld mwy o brojectau ar-lein a chynnwys sy’n unigryw i’n iaith.

Mae llawer o ddadansoddiadau eraill yn bosib gyda sgriptio a chrafu data. (Mae Rhys Wynne wedi bod yn casglu ystadegau Wikipedia.)

Hoffwn i weld canlyniadau o ymchwil dwfn ar Wicipedia Cymraeg.

Mae rhai o’r erthyglau ar Wicipedia Cymraeg yn bodoli yna yn unig – maen nhw yn unigryw i Wicipedia Cymraeg fel, er enghraifft, Llandeilo Abercywyn, Geraint Jarman, Angharad ferch Owain. Mae rhai o erthyglau yn well ar Wicipedia Cymraeg hefyd, e.e. Recordiau Sain.

4 categori o wefannau a blogiau yn Gymraeg

Mae lot o bobol yn gyffrous am y real-time web ar hyn o bryd.

Digon iawn. Ond hefyd mae gyda fi diddordeb yn y we BARHAUS. Yn enwedig y we Gymraeg.

Dw i wedi bod yn darllen trwy Maes-E, Morfablog, Gwenu Dan Fysiau, Daflog ac archifau o flogiau a gwefannau clasur eraill. Gwnaf i fwrw’r gwaelod cyn bo hir.

Dw i wedi ffeindio pedwar categori o wefannau ar fy siwrnai ar y ffordd. Sgen i’m bwriad bod yn sarhaus. Eisiau trafod y we barhaus.

1. “Dyma’r Ffordd i Fyw”
Blogiau a gwefannau sydd dal yn joio cofnodion newydd a diweddariadau. Dw i’n darllen nhw mewn Google Reader neu ddilyn dolenni ar Twitter. Mae’n hawsa i ffeindio nhw na gwefannau yn y categorïau isod. Dw i’n rhedeg gwefannau yn y categori hwn (Hacio’r Iaith, Y Twll, PenTalarPedia a Hedyn). Fel teclyn mae Blogiadur dal yn eitha da am ffeindio cofnodion dw i wedi colli ar y tro cyntaf.

2. “Sdim Eisiau Esgus”
Mae hwn yn grŵp mawr iawn. Dal yn fyw ar y we ond dyn nhw ddim yn cael eu diweddaru. Blog Gareth Potter yw enghraifft. Maen nhw yn “cysgu” mewn ffordd i’w blogwyr. Ond dyn ni’n gallu anghofio’r fantais o’r gwefannau yma – maen nhw yn fyw i’r darllenwyr. Felly dyn ni ddim eisiau esgus, mae’n iawn, ond paid colli dy hen blog! Dw i’n gallu gweld cyfleoedd i greu ffilteri e.e. teclynnau chwilio sy’n gynnwys y categori hwn (Google Custom Search a mwy). Dyna pam dw i eisiau casglu nhw ar Hedyn. Beth yw’r gwersi? Ystadegau hefyd. Pa fath o dyfiant ydyn ni wedi gweld? Faint o flogwyr sy wedi gadael blogiau nhw i gysgu? Syniadau am projectau ymchwil.

3. “Byw Ar Y Briwsion”
Weithiau dyw pobol ddim yn adnewyddu eu enwau parth neu gwesteia. Felly dyn ni’n colli eu gwefannau. Pwy sy’n cofio Dim Cwsg, fforwm cymuned am godi plant? Dw i ddim angen y wybodaeth nawr – ond beth am y dyfodol? Beth ddigwyddodd gyda’r wefan Adam Price eleni? Dw i’n siomedig iawn os dw i’n ffeindio sôn am rywbeth ac wedyn dyw e ddim yn bodoli. Diolch byth am Archive.org – ond dyw e ddim yn gallu cadw popeth, jyst briwsion weithiau. Mae’r Llyfrgell Genedlaethol yn cadw archif eu hun yn ôl pob sôn – chwarae teg – ond ble mae e? (Mae unrhyw un yn gallu copïo fy mlog am unrhyw archif. Os oes gyda ti diddordeb, dw i wedi rhoi caniatâd i bawb dan Creative Commons.)

4. “Hwyl Fawr Heulwen”
Y categori olaf yw blogiau sy ddim ar y we, ddim ar Archif, ddim yn unlle, jyst yn dev/null. Mae ddoe yn ddoe – yn anffodus. Mae pobol yn colli eu blogiau a gwefannau weithiau am lot o resymau. Neu trwy ddamwain, diffyg gofal, dileu, colli enwau parth, colli gwesteia, gwasanaethau drwg a theclynnau drwg maen nhw yn colli eu blogiau a gwefannau. Ond nid jyst nhw, dw i’n colli nhw, ti’n colli nhw a mae pawb sy’n chwilio am bethau Cymraeg yn colli nhw. Mae pob iaith yn colli blogiau. Baswn i ddim yn colli lot o gwsg am blogiau Saesneg achos mae’r iaith yn iawn. Ond yn Gymraeg mae’r sefyllfa yn ddifrifol. Wrth gwrs mae gyda unrhyw un yr hawl i ddileu ei blog hefyd. Ond mae fe dal yn siomedig.

Yr ail degawd

Mae’r cofnod yma gan Nic Dafis, Ebrill 2001 yn gategori 2 (mae fe’n blogio ar Morfablog nawr).

Dyn ni’n symud i’r ail ddegawd o flogiau Cymraeg ac eisiau datblygu “cymunedau arlein” a thrafodaeth ar y we. Sa’ i’n eisiau ailadrodd beth sy wedi digwydd yn barod. Dw i eisiau datblygu’r drafodaeth mewn ffordd gyda’r gwersi’r degawd cyntaf.

Wrth gwrs dyn ni eisiau ailymweld sgyrsiau ac erthyglau Cymraeg am wleidyddiaeth, cerddoriaeth, hanes, diwinyddiaeth, gwyddoniaeth a phob pwnc dan yr haul.

Er enghraifft, pan oedd Nic yn blogio am Maes-E mae fe wedi rhannu gwersi gyda ni yn y dyfodol am gymunedau a sgyrsiau ar y we.

(Gyda llaw, beth ddigwyddodd gyda’r archif Maes-E? Er enghraifft, dyw’r erthygl Tips ar neud Ffansin gan Mihangel Macintosh ddim ar gael trwy’r wefan – roedd rhaid i mi fynd i archive.org.) YCHWANEGOL: Ateb yn y sylwadau isod

Wrth gwrs dyw Facebook ddim yn helpu o gwbl gyda’r broblem cynnwys sy’n agored a pharhaus. Dyma pam dw i ddim yn licio Facebook llawer yn y cyd-destun hwn. Mae’n ddefnyddiol am lot o resymau wrth gwrs ond mae’n rhy breifat a rhy anodd i chwilio am bethau. Fel arfer mae’n well i blogio ar WordPress.com a rhannu dolenni ar Facebook neu gopïo’r testun i Facebook.

Mae Facebook yn cyflymu symudiad ieithyddol hefyd. Cofnod arall.

Bygythiadau

Bygythiad yw teclynnau sy’n byrhau URLs. Dw i ddim yn hoffi nhw o gwbl achos dw i eisiau URLs sy’n gweithio am flynyddoedd. Weithiau ar Twitter rhaid i mi defnyddio rhywbeth yn anffodus felly dw i’n dewis bit.ly achos mae’n poblogaidd o leia. Safety in numbers – gobeithio.

Ond mae pob gwasanaeth am ddim yn beryglus mewn ffordd, e.e. Geocities. Bydd lot o wasanaethau am ddim yn gorffen neu yn anfon ein gwaith i gategori 4. Bydd yn ofalus gyda dy waith caled.