Hacio’r Iaith 2017 ym Mangor – cofrestrwch nawr

Rydym wedi rhannu rhagor o fanylion am Hacio’r Iaith 2017 ac mae ambell i syniad am sesiynau yn barod.

Cofrestrwch nawr drwy tocyn.cymru!

Dylech chi ystyried dilyn @haciaith ar Twitter am ddiweddariadau. (Dw i newydd ailosod ffrydiau awtomatig o’r blogiadau a sylwadau i’r cyfrif Twitter drwy dlvr.it – oherwydd diwedd y gwasanaeth Twitterfeed.)

Wicidelta/Wikidelta ar flog swyddogol Wikimedia UK

wicidelta-aromaneg

Dw i wedi dechrau fersiwn Gymraeg o gyfrif Twitter Wicidelta.

Mae gen ti ddewis!

O ran yr enwau yr unig wahaniaeth yw’r ‘c’ neu ‘k’ – Wicidelta neu Wikidelta.

Hefyd mae Wikimedia UK wedi fy ngwahodd i ymhelaethu am Wicidelta ac mae dwy fersiwn o’r blogiad newydd fynd yn fyw:

Diolch i Llywelyn2000 am ein cyflwyno.

Prin yw’r siaradwraig neu siaradwr Cymraeg sydd ddim yn ymddiddori mewn ieithoedd gwahanol dw i’n credu.

DIWEDDARIAD 9 Rhagfyr: newydd ychwanegu rheol sy’n atal erthyglau llai na 1000 nod er mwyn ceisio canfod mwy o’r ‘gorau’ o bob iaith. Fe oedd ‘na ambell i erthygl rhy fach. Gawn ni weld pa gynnwys a ddaw. Fel o’n i’n dweud yn y blogiad mae ‘na rheolau eraill hoffwn i ychwanegu.

Wikidelta: erthyglau Wicipedia unigryw mewn 284 iaith

Mae anturiaethau Wicipedia yn parhau gyda chyfrif arbrofol newydd @Wikidelta.

Dilynwch y cyfrif am ddolenni achlysurol at erthyglau Wicipedia unigryw mewn sawl iaith. Mae ‘unigryw’ yn golygu erthyglau sydd heb gael eu cysylltu/cyfieithu/addasu o/i unrhyw erthygl Wicipedia mewn unrhyw iaith eraill.

Mae’r cyfrif wrthi’n mynd drwy gyfanswm o 284 iaith wahanol! Heddiw roedd e’n rhannu dolenni at erthyglau mewn Gaeleg yr Alban.

Os ydych chi wedi gweld @UnigrywUnigryw mae’n weddol debyg heblaw am y ffaith bod Wikidelta yn dewis iaith wahanol bob hyn a hyn.

Gawn ni weld faint o erthyglau ar Wikidelta sydd wir yn unigryw a faint sydd angen eu cysylltu (er enghraifft roedd rhaid i mi ymweld â Wicipedia er mwyn cysylltu erthygl i ieithoedd eraill heddiw).

Dw i am flogio ar Medium cyn hir er mwyn rhannu’r cyfrif gyda phobl sy’n siarad ieithoedd eraill.

Hefyd hoffwn i ddechrau fersiwn Cymraeg o gyfrif Wikidelta. Mae gwneud popeth yn Gymraeg yn bwysig i mi. Yr unig elfennau sydd yn Saesneg yw enw y cyfrif, bywgraffiad a’r trydariadau am newid iaith. Felly bydd angen rhestr Gymraeg o enwau’r ieithoedd i gyd. Dwedwch os ydych chi am helpu gyda job cyfieithu bach iawn.

Diolch i Ffrancon am gyfrannu at syniad Wikidelta ac i Illtud am yr enw.

Dadansoddi 283 iaith Wicipedia (yn ara deg) – rhan 2

Gorffennais ddadansoddiad o bob un iaith sydd ar gael ar Wicipedia sbel yn ôl, sef cyfanswm o 283 iaith. Darllenwch y cofnod blog diwethaf am ragor o fanylion.

Dw i wedi bod yn hynod frysur yn ddiweddar ac heb gael siawns i dacluso neu ddehongli’r data yn iawn.

Felly gad i mi wybod yn y sylwadau os ydych chi eisiau cael cipolwg ar y canlyniadau.

Y cyd-destun hollbwysig

Dadansoddi 283 iaith Wicipedia (yn ara deg)

Mae cymunedau ieithyddol yn cynnal sawl Wicipedia ac mae pob un yn wahanol. Mae rhywfaint o gyfieithu ac addasu ac mae rhywfaint o erthyglau sy’n unigryw i’r fersiwn Cymraeg, y fersiwn Catalaneg, y fersiwn Arabeg, ac ati.

Dechreuais i’r cyfrif Twitter awtomatig UnigrywUnigryw i rannu’r erthyglau sydd ond ar y Wicipedia Cymraeg.

Pa ganran o erthyglau unigryw sydd ar y Wicipedia Cymraeg?

Beth am BOB iaith Wicipedia?

Fel mae’n digwydd mae hi’n eithaf rhwydd addasu’r sgript feddalwedd PHP wreiddiol i edrych at ieithoedd gwahanol. Dw i wedi ymestyn y sgript tu ôl i @UnigrywUnigryw er mwyn dadansoddi POB iaith ar Wicipedia yn awtomatig.

Mae cyfanswm o 283 iaith o dan fy ystyriaeth. Mae rhai o ieithoedd yna sydd ddim yn gyfarwydd i mi o gwbl tan nawr, e.e. Wicipedia yn yr iaith অসমীয়া.

Allbwn y broses fydd fath o dabl o ieithoedd gwahanol. Ble mae’r Gymraeg ar y siart?! Ydy’r drefn ar y siart yn adlewyrchu’r nifer o erthyglau yn yr ieithoedd? Neu fuddsoddiad yn yr ieithoedd?

Beth am ieithoedd sy’n gysylltiedig drwy nifer helaeth o siaradwyr amlieithog, megis Sbaeneg-Catalaneg, Sbaeneg-Basgeg, Saesneg-Cymraeg, Wrdw-Arabeg, Iseldireg-Almaeneg, ayyb.?

Dw i’n gallu ceisio ymateb i’r cwestiynau uchod cyn hir…

Yr unig broblem gyda’r sgript feddalwedd dw i wedi ysgrifennu yw’r amser mae’n cymryd.

Mae fy sgript yn wneud ceisiadau i API Wicipedia, sydd yn cynnig pecyn o 20 erthygl ar hap i’w dadansoddi ar y tro. Mae angen cael lot fawr o becynnau er mwyn cael data dibynadwy.

Gwnes i ddechrau tua 12:40yp heddiw cyn mynd am dro i dre am ginio a dw i newydd gyfrif faint o ieithoedd mae’r peth wedi dadansoddi ers hynny. Bydd hi’n mynd trwy ieithoedd yn gyflymach yn y pen draw achos fydd ddim angen gymaint o sampl ar gyfer yr ieithoedd bychain bychain.

Ta waeth, ar y gyfradd yma bydd hi’n cymryd rhyw bedwar diwrnod i orffen!

Mae’n rhedeg ar weinydd pell dw i’n talu £5 y mis amdano fe, y math o letya mae rhywun yn rhoi gwefan fach arno fe. Mae’r un weinydd yn rhedeg UnigrywUnigryw felly mae hi’n ddefnydd da o arian.

Efallai dylwn i edrych at redeg algorithm cyfochrog ar rywbeth swish fel AWS.

Fel arall, oes ‘na unrhyw un sydd am fenthyg amser ar uwchgyfrifiadur anferth i mi pls? 🙂

Delweddau: map y byd / Kraftwerk

DIWEDDARIAD 19 Gorffennaf 2016: Mae dwy iaith uwchben y Saesneg ar y siart o ieithoedd ‘mwyaf unigryw’ ar Wicipedia – hyd yn hyn! Mae’r system wrthi’n dadansoddi Hindi.

Mae arafwch newyddion Cymraeg yn gymaint o siom.

Mae sut gymaint o newyddion pwysig wedi torri yn y pythefnos diwethaf.

Ac mae fe bron i gyd drwy gyfrwng y Saesneg ac ieithoedd eraill.

Mae newyddion yn arafach yn Gymraeg. Ffaith.

Cywirwch fi os mae hyn yn anghywir ond dw i ddim yn credu bod ‘na graffeg yn Gymraeg fel y cerdyn uchod.

Ydy llai o bethau sydd o ddiddordeb i wylwyr/ddarllenwyr Cymraeg fel ni yn digwydd yn y byd? Nac ydy.

Ydy’r newyddion yn gyffredinol yn effeithio arnom ni i raddfa lai? Nac ydy.

Oes ‘na diffyg awydd ar ran penaethiaid ein sefydliadau a chwmnïau cyfryngol i fentro ac ymdrechu i adrodd newyddion ‘poeth’ yn Gymraeg tra bod e’n digwydd? Oes.

Oes ‘na llai o gystadleuaeth ymhlith mentrau newyddion Cymraeg, llai o gystadlu am sylw drwy geisio adrodd yn gyflym? Oes.

Ydy hi’n symptom o diffyg adnoddau a diffyg buddsoddiad? Ydy, yn sicr.

Mae newyddion yn ddrud. Yn y Saesneg mae’r Guardian wedi dechrau adrodd rhagor o newyddion o’r UDA achos dyna le mae mwy o lygaid a mwy o farchnad hysbysebion. Mae hyn yn her fach i newyddion am wledydd Prydain, heb sôn am y Gymraeg.

Wrth gwrs mae amddiffyn y gwaith da sy’n digwydd eisoes yn Gymraeg yn digon o her drwy’r amser.

Er nad ydynt yn defnyddio’r union dermau mae plant weddol ifanc yn sylweddoli bod newyddion yn Gymraeg yn arafach.

Mae plant yn gweld pethau fel hyn mewn byd yr oedolion fel y niferoedd cymharol isel o gemau fideo, ffilmiau, cylchgronau, bwydlenni, crysau-t, hysbysebion, ac ati yn Gymraeg. Gweler hefyd: os nad yw Prif Weinidog Cymru yn defnyddio’r Gymraeg maen nhw yn sylwi.

Fydda i ddim yn hapus nes bod newyddion yn Gymraeg cystal â newyddion Saesneg – cyflym, rhyngwladol, amrywiol, amlgyfrwng, dwfn, cyfoethog. Fydda i ddim yn hapus nes bod y cyfryngau yn holliach yn Gymraeg a chystal ag unrhyw iaith arall. Dw i’n gwybod bod hyn i gyd yn hollol afrealistig ond dyna ni.

Tra ein bod ni’n ceisio meddwl am ffyrdd o ddatblygu’r maes yma (sori, dim datrysiadau heddiw!) dylen ni ystyried cefnogi cyfrifon fel @elliwsan, @owen_garry, @sianeaber sy’n ceisio torri newyddion yn Gymraeg. Oes ‘na rhai eraill?

Pob bendith i’r bobl eraill yma sy’n ceisio ein cyffroi drwy ddefnydd o’r geiriad ‘newyddion yn torri‘ ar Twitter!

Down ni â rhagor ar hyn tra bod y sefyllfa yn datblygu.

Gwerthuso prosiect Y Bydysawd a sylwadau agored

Dyma nodyn bach sydyn i ddatgan bod fy mhrosiect Y Bydysawd wedi dod i ben. Dw i heb wneud unrhyw beth arno fe ers sbel a dweud y gwir. Ond mae eisiau gwerthuso’r peth.

Beth oedd gwefan Y Bydysawd? Ymdrech i sbarduno a chynnal trafodaeth am faterion cyhoeddus, gwleidyddiaeth, chwaraeon, a phob math o bwnc – ar y we agored drwy gyfrwng y Gymraeg oedd hi.

Yn anffodus dw i ddim gyda’r adnoddau i gynnal yr hen wefan fel archif fy hun ond mae cipddarlun yma, diolch i archive.org. (Dyw’r sylwadau ddim yna ond gofynnwch i mi os ydych chi eisiau copi o’r data.)

y-bydysawd-llunDrwy’r dydd, drwy’r wythnos, roedd y wefan yn tynnu crynodebau o erthyglau newydd yn Gymraeg o ffynhonellau yn awtomatig (yn bennaf drwy RSS) fel Newyddion BBC Cymru yn yr oes cyn Cymru Fyw, Golwg360, ambell i beth arbennig (drwy Delicious), rhaglennu S4C Clic, ac ati.

Wedyn roedd pobl yn gadael sylwadau (drwy Disqus) a chynnal trafodaethau am yr eitemau. Bob tro roedd angen clicio’r eitem i weld yr erthygl/cynnwys/rhaglen ar y wefan wreiddiol.

Roedd Y Bydysawd yn gyfrifol am roi rhagor o draffig i wefannau Cymraeg ac mae eisiau meddwl sut rydyn ni’n gwneud hynny yn well heddiw.

Cyfeiriad neu efallai teyrnged i fenter newyddion aflwyddiannus Y Byd oedd yr enw!

Fel is-brawf o dan yr enw Skdadl lanlwythais i’r destun o erthygl barn i gylchgrawn Golwg gan Angharad Mair, roedd hynny yn hwyl ac yn weddol ddiddorol fel sgwrs.

Dyma holl brofion a gwersi y prosiect ar fy mlog.

Ar un adeg roedd Y Bydysawd yn cynnig sylwadau fel nodwedd i lenwi’r gwagle pan doedd dim modd gwneud hynny ar wefannau eraill megis Newyddion BBC Cymru a Golwg360.

Ces i e-bost cwrtais maes o law wrth olygydd Golwg360 (Owain Schiavone) i ofyn i mi dynnu’r ffrwd i’w wefan. O’n i’n hapus i wneud hynny ac o’n i’n hapusach pan wnaethon nhw ychwanegu sylwadau ac wedyn Disqus i’w wefan – iei! Dw i’n meddwl bod y sylwadau ar Golwg360 wedi gwella ers ychwanegu Disqus – oherwydd y proffilau a ‘pherchnogaeth’ dros sylwadau. Cyn hynny roedd modd gadael sylwadau wrth ‘yrru heibio’. Dw i ddim yn honni fy mod i wedi cael unrhyw effaith ar strategaeth Golwg360 – ond dyna oedd yr hanes.

Does dim modd gadael sylwadau ar eitemau BBC Cymru Fyw o hyd.

Ond i fod yn deg, er bod cynnig sylwadau yn Gymraeg ar y we agored yn digon hawdd mae llwyddo i gynnal unrhyw drafodaeth yn dipyn o gelfyddyd ddyrys. Does bron neb o’r cyhoeddwyr, sefydliadol neu wirfoddol, wedi llwyddo i gynnal trafodaethau da er bod rhai wedi ceisio. Meddwl ydw i am Fideo Wyth, blogwyr Hacio’r Iaith, blogwyr gwleidyddol yn Gymraeg, ac ati.

Dyma ffactorau posibl:

  • Diffyg cyrraeddiad yr erthyglau gwreiddiol, diffyg pobl, diffyg amser – bydd y nifer o bobl sy’n gadael sylwadau wastad yn is na’r nifer o ddarllenwyr/wylwyr. Mae hynny yn wir am bethau Saesneg ond mae’r niferoedd yna.
  • Diffyg hyder wrth ysgrifennu’n Gymraeg – o bosib?
  • Pryder am fynegi barn yn gyhoeddus neu wrthdaro buddiannau
  • Pryder am sarhad ar y sgwrs gan bobl eraill – o bosib?
  • Efallai dydy pobl ddim am ddysgu systemau newydd achos maen nhw yn licio Facebook, Instagram, Twitter, ac ati, ac yn hoffi postio eu barnau ar eu proffilau eu hunain
  • Gyda llaw dw i hefyd yn methu meddwl am unrhyw wefan yn Gymraeg sy’n defnyddio system sylwadau Facebook ac mae prinder sy’n defnyddio Disqus. Felly efallai bod cyfrifoldeb ar gyhoeddwyr am beidio mentro neu arloesi yn y maes yma.

Mae cwestiwn i’w ofyn o ran faint o gyhoeddusrwydd i’r Bydysawd y gwnes i. Roedd fy ffrindiau yn gwybod am Y Bydysawd, dim ond ychydig dwsinau o bobl wrth edrych yn ôl. Roedd hi’n fenter arbrofol un person gyda chyfyngiad ar adnoddau i wneud gwaith marchnata. Dysgais i lawer o bethau yn sicr, ar yr ochr dechnegol yn bennaf.

Beth am adael sylw yn sydyn ar un o’ch hoff wefannau neu flogiau? Ystyriwch adael sylw o dan yr eitem ei hun yn hytrach nag ymateb drwy Twitter/Facebook. Byddai’r blogiau a sefydlwyd yn 2016 neu 2015 yn le da i ddechrau!

Cymryd rheolaeth: ffactor arall

Ceisio dysgu beth aeth o’i le yn y refferendwm ydw i, ac wedi bod yn meddwl am ffactor arall sydd ddim wedi cael sylw – hyd y gwelaf i.

Rydyn ni’n cymryd bod pobl yng Nghymru wedi pleidleisio dros adael am sawl rheswm.

Oes ffactor arall, sef diffyg cyrraeddiad mudiadau ymgyrchu – yn yr ardaloedd difreintiedig yn enwedig? Dw i’n sôn am fudiadau ymgyrchu dros gymunedau, gwrth-lymder, ac ati.

Mae mudiadau ymgyrchu yn gallu cynnig arweinyddiaeth, rhesymeg/dihongliad, a gweithred – tri pheth sydd ddim efallai ar gael i bobl yn aml iawn.

Cynigiodd ymgyrch gadael y tri pheth yma yn y gwacter. Rydyn ni’n gwybod am yr arweinyddiaeth. Nhw oedd yn cynnig rhesymeg/dihongliad, i bobl heb unrhyw gyd-destun ehangach oherwydd diffyg cyrraeddiad cyfryngau Cymreig. Rhoi x mewn blwch oedd y weithred wrth gwrs.

Roedd yr adroddiant o ‘gymryd rheolaeth’ yn apelio at bobl heb grym yn eu cymunedau.

Os mae pobl yn gweld bod ‘na annhegwch ac eisiau gweld newid ydy hi’n gymaint o syndod eu bod nhw wedi dewis defnyddio’r unig ddull o brotestio sydd wrth law?

Amserlennu trydariadau o flaen llaw – fy ffordd i

Dw i wedi creu system fy hun sy’n trydar yr hyn sydd ar daenlen fesul diwrnod.

Enw y cyfrif Twitter yw @fideobobdydd, ffordd o ddosbarthu fideos o safon yn Gymraeg er mwyn denu mwy o sylw.

Ar hyn o bryd mae e dim ond yn trydar unwaith bob dydd am 9:05yh. Prawf cysyniadol yw’r prosiect bach hwn ac byddai modd ehangu ac addasu fe.

Pam greu system? Dw i wedi ceisio defnyddio Hootsuite, Buffer a systemau tebyg ond maen nhw ar y cyfan yn rhy letchwith i mi. Ar y daenlen mae modd gweld hanner fis a symud pethau o gwmpas yn gyflym. Mae cyd-weithio gyda phobl eraill yn hawdd achos mae’r daenlen ar Google Drive.

Dw i ddim yn meddwl bod Hootsuite yn colli cwsg dros y peth ond dw i’n mwynhau defnyddio’r system yma.

Byddai modd ychwanegu ffynonellau eraill achos mae ffeindio fideo ar gyfer bob dydd yn dipyn o dasg. Os oes gwagle ar y dyddiad fydd ddim trydariad, ar hyn o bryd. Gallwn i greu rhestr hirfaeth o fideos i’w postio ar hap yn ogystal â’r rhai sydd ar yr amserlen, neu dynnu fideos o rhestr o hoffterau cyfrif YouTube, rhestr chwarae ac ati. Wrth gwrs mae platfformau eraill megis Facebook yn bosibl hefyd.

Dyma rai o’r manylion technegol. Mae’n defnyddio rhai o’r un dulliau ag UnigrywUnigryw, megis sgript PHP sy’n siarad ag API Twitter. Y gwahaniaeth pwysig yw’r ffynhonnell o ddata. Mae’r sgript yn cael gafael ar y ddata mewn fformat CSV.

Diolch i Nwdls am y (cy)syniad gwreiddiol o Fideo Bob Dydd.

Ychwanegu ‘rhestr ddu’ i gyfrif @UnigrywUnigryw

Dw i wedi bod yn joio canlyniadau fy mhrosiect arbrofol @UnigrywUnigryw, cyfrif Twitter sy’n postio erthyglau sydd ond ar gael ar y fersiwn Cymraeg o Wicipedia.

Dyma rai o’r trydariadau diddorol hyd yn hyn: Hywel Hughes Bogotá, Toni CarollEilian, Edrych am Jiwlia, Gwawdodyn byr.

Mae’r detholiad yn hollol randym (‘ffug-hap’ yw’r term) – heb unrhyw dueddiadau. Hyd yn hyn…

Yn fy marn i mae ‘na ychydig bach gormod o gyfeiriadau at lyfrau Saesneg.

Felly o’n i’n meddwl y byddai hi’n hwyl a diddorol i hidlo’r canlyniadau gyda ‘rhestr ddu’:

  • Categori:Llyfrau hanes yn y Saesneg
  • Categori:Nofelau Saesneg
  • Categori:Teithlyfrau Saesneg
  • Categori:Atgofion a hunangofiannau Saesneg
  • Categori:Llyfrau hanes yn y Saesneg
  • Categori:Hanes Crefydd yn Saesneg
  • Categori:Bywgraffiadau Saesneg
  • Categori:Llyfrau Saesneg ar hamdden
  • Categori:Nofelau Saesneg i bobl ifanc
  • Categori:Barddoniaeth Gymreig yn yr iaith Saesneg
  • Categori:Llenyddiaeth plant Saesneg
  • Categori:Bywgraffiadau Saesneg
  • Categori:Llyfrau Saesneg

O hyn ymlaen mae’r ap fach sy’n rhedeg yn y cefndir yn osgoi unrhyw erthyglau yn y categoriau uchod yn llwyr.

Mae hi’n digon hawdd ffeindio tudalennau o dan y categoriau yma os ydych chi’n chwilio Wicipedia am enwau’r categoriau. Does dim byd wedi digwydd i’r categoriau na’r tudalennau ar Wicipedia ei hun, a dw i’n falch bod nhw yn bodoli (diolch i Wicibrosiect Llyfrau Gwales).

Ond dw i wedi penderfynu fy mod i eisiau rhoi mwy o bwyslais ar bethau eraill drwy’r cyfrif ar hyn o bryd.

Mae cwmnïau meddalwedd fel Google a Facebook yn gwneud y math yma o newidiad bob dydd yn ôl eu mympwy. I ba raddau? Does neb tu fas i’r cwmnïau yn hollol sicr. Fyddai’r cwmnïau ddim mor agored â fi yn hynny o beth.

Er ei bod hi’n fach iawn dyma achos prin, dw i’n credu, o algorithm hollol awtomatig ar unrhyw gyfrwng cymdeithasol ar y we sy’n ffafrio pethau yn Gymraeg ar draul pethau Saesneg (neu iaith arall)! Hynny yw, mae’r cod yn osgoi pethau Saesneg o dan gategoriau penodol ‘yn fwriadol’. Byddwn i’n croesawu enghreifftiau eraill o hyn yn y sylwadau.